Sei sulla pagina 1di 415

CAMPI ELETTROMAGNETICI

Kurt Lechner
Prefazione

Le conoscenze sperimentali e teoriche acquisite finora sul comportamento della materia


a livello microscopico, portano a concludere che l’interezza dei fenomeni fisici microscopici
può essere interpretata assumendo che tutta la materia sia costituita da particelle elemen-
tari puntiformi, soggette a solo quattro tipi di interazioni fondamentali: gravitazionale,
elettromagnetica, debole e forte. Tra queste l’interazione gravitazionale è quella nota da
più tempo, mentre quella elettromagnetica è la più studiata avendo trovato una sua solida
formulazione teorica nell’Elettrodinamica Quantistica, a metà del secolo scorso. La quasi
totalità dei fenomeni fisici quotidiani – dalla stabilità della materia alla propagazione della
luce – è infatti riconducibile a questa teoria. Le interazioni deboli e forti, che a differenza
di quelle elettromagnetica e gravitazionale si manifestano solo a distanze microscopiche,
hanno trovato una formulazione analoga nell’ambito del Modello Standard delle particelle
elementari – che include la stessa Elettrodinamica Quantistica – mentre l’interazione gra-
vitazionale risulta tuttora in conflitto con le leggi della Meccanica Quantistica, nonostante
i progressi maturati nell’ambito della Teoria delle Superstringhe.
Nonostante il comune ruolo di mediatrici dell’azione reciproca tra i costituenti ele-
mentari della natura, ciascuna delle quattro interazioni fondamentali è contrassegnata da
proprietà esclusive tali da comportare fenomeni fisici peculiari. Cosı̀ le interazioni forti
sono le sole a dar luogo al fenomeno del confinamento, che confina i quark e i gluoni
all’interno dei nucleoni, mentre le interazioni deboli sono le uniche ad essere mediate da
particelle massive, le W ± e la Z 0 . Analogamente l’interazione elettromagnetica è l’unica
a essere mediata da particelle – i fotoni – le quali, non essendo dotate di carica elettrica
non sono soggette a loro volta a un’interazione elettromagnetica reciproca. E infine, l’in-
terazione gravitazionale è l’unica che si esercita tra tutte le particelle elementari, compresi
i mediatori delle interazioni stesse.
Di fronte a queste distinzioni importanti appare alquanto sorprendente come le quattro
interazioni fondamentali siano rette da un’impalcatura teorica comune, che ne determina
fortemente la struttura generale; impalcatura elegante nella sua forma e matematicamen-
te solida, le cui profonde origini fisiche sono in parte ancora da scoprire. Tra i pilastri
principali di questa impalcatura unificante ricordiamo i seguenti: tutte le interazioni fon-
damentali soddisfano il principio di relatività einsteiniana e ammettono una formulazione
covariante a vista, con conseguente conservazione del quadrimomento e del momento an-
golare quadridimensionale. Ciascunca delle interazioni è mediata da una o più particelle
bosoniche, rappresentate a livello classico da un insieme di campi vettoriali {Aµ }, la cui
dinamica è controllata da un’invarianza di gauge locale. Il teorema di Noether associa
poi a ciascun bosone vettore una grandezza conservata. Infine, il pilastro forse più miste-
rioso ma non per questo meno fondante è rappresentato dal fatto che l’intera dinamica
riguardante l’insieme delle interazioni fondamentali può essere dedotta da un principio
variazionale.
Il presente testo costituisce un trattato sull’Elettrodinamica classica di particelle pun-
tiformi, ed è stato costruito attorno agli argomenti svolti nel corso “Campi Elettroma-
gnetici” che ho tenuto negli anni accademici 2004/05–2008/09 per la Laurea Magistrale
in Fisica presso l’Università di Padova. Nella sua stesura mi sono fatto guidare in prima
linea dall’intento di enucleare gli aspetti che accomunano l’Elettrodinamica alle altre inte-
razioni fondamentali – vale a dire i pilastri sopra nominati – mettendo anche in evidenza,
ove possibile, analogie e differenze. La rinuncia più pesante che questa impostazione ha
comportato consiste nell’aver trascurato quasi completamente l’argomento importante dei
campi elettromagnetici nei materiali.
Le altre linee guida che ho seguito si riassumono come segue. Ho cercato di formulare
l’Elettrodinamica classica come una teoria basata su un sistema di postulati – essenzial-
mente il principio di relatività einsteininana e le equazioni di Maxwell e di Lorentz – da
cui l’intera e ricca fenomenologia delle interazioni elettromagnetiche tra particelle cariche
può essere dedotta in modo stringente. Per poter impostare queste equazioni in modo
matematicamente rigoroso è indispensabile ambientarle nello spazio delle distribuzioni.
Particolare attenzione è poi stata dedicata alle proprietà di consistenza interna e fisica
dell’Elettrodinamica. In questo contesto viene svolta un’analisi accurata delle divergenze
ultraviolette che accompagnano la reazione di radiazione, e che rendono l’Elettrodinami-
ca classica – in ultima analisi – una teoria internamente inconsistente. Ogni argomento
teorico è illustrato con una serie di esempi fisicamente rilevanti che vengono svolti in
dettaglio, cosı̀ come l’introduzione di ogni nuovo strumento matematico viene motivata
e accompagnata da esemplificazioni pratiche. Infine, la soluzione dei problemi proposti a
conclusione dei capitoli comporta una migliore comprensione di alcuni argomenti trattati
nel testo, pur non condizionando la comprensione dei capitoli successivi.
Organizzazione del materiale. A grandi linee gli argomenti del testo sono suddivisi in
tre parti. La prima parte (capitoli 1–4) espone le basi concettuali e matematiche su cui si
fonda la costruzione dell’Elettrodinamica di un sistema di particelle cariche puntiformi.
Questa parte iniziale presenta in particolare gli strumenti matematici necessari per una
formulazione precisa della teoria, vale a dire il formalismo covariante come sede naturale
di una qualsiasi teoria relativistica, e la teoria delle distribuzioni, strumento indispensa-
bile per una trattazione corretta delle singolarità implicate dalla natura puntiforme delle
particelle cariche. Dopo l’introduzione delle equazioni fondamentali dell’Elettrodinamica
– le equazioni di Maxwell e di Lorentz – e una loro analisi strutturale preliminare, si ana-
lizzano le leggi di conservazione da esse implicate. Conclude la prima parte l’introduzione
del metodo variazionale. Questo metodo viene presentato come approccio alternativo per
la formulazione di una generica teoria di campo che ne codifica la dinamica in modo con-
ciso ed elegante, e come ingrediente fondamentale per la validità del teorema di Noether.
Lo stretto nesso esistente in generale tra questo teorema e il principio variazionale viene
poi esemplificato in dettaglio nel caso dell’Elettrodinamica di particelle puntiformi.
La seconda parte (capitoli 5–11) – la più estesa – verte maggiormente sulle applica-
zioni dell’Elettrodinamica e comprende in particolare una trattazione sistematica della
generazione di campi elettromagnetici da parte di particelle cariche in moto arbitrario,
e un’analisi approfondita del fenomeno dell’irraggiamento, sia nel limite non relativistico
che in quello ultrarelativistico. Cosı̀ si svolge un’analisi sistematica delle distribuzioni an-
golare e spettrale della radiazione emessa in diverse situazioni fisicamente rilevanti, come
ad esempio quelle riguardanti le antenne, gli acceleratori ultrarelativistici, le collisioni tra
particelle cariche e la diffusione della radiazione da parte di particelle cariche. In questa
parte vengono inoltre trattati in dettaglio alcuni argomenti che nei libri di testo raramente
vengono presentati in modo sistematico. Cosı̀ si risolve, ad esempio, il problema del cam-
po elettromagnetico creato da una particella carica priva di massa, si esegue un confronto
dettagliato tra la radiazione elettromagnetica e quella gravitazionale, e si presenta una
trattazione teorica sistematica dell’effetto Cerenkov.
La terza parte (capitoli 12–13) verte su argomenti più speculativi, e delicati, che nei
testi spesso vengono trattati con superficialità. Il capitolo 12 è dedicato alla reazione
di radiazione e affronta con cura il problema delle divergenze ultraviolette da cui essa
è inevitabilmente affetta. Lo scopo di questo capitolo è doppio: da un lato si vogliono
enucleare le motivazioni teoriche che ci costringono a sostituire l’equazione di Lorentz
(divergente) – un dogma dell’Elettrodinamica classica – con l’equazione di Lorentz–Dirac.
Dall’altro si vuole illustrare come l’Elettrodinamica che emerge da questa sostituzione è
affetta da un’inconsistenza interna incurabile, che muta solo di aspetto a seconda del
punto di vista pragmatico che si assume. La seconda parte di questo capitolo è dedicata
all’altro “problema antico” dell’Elettrodinamica, rappresentato dall’energia infinita del
campo elettromagnetico creato da una particella puntiforme, che mina la stessa legge
di conservazione dell’energia. Sorprendentemente, questo problema ha trovato una sua
soluzione solo una trentina di anni fa, e noi ne presenteremo una versione alternativa in
una veste più moderna, nell’ambito della teoria delle distribuzioni. Infine, il capitolo 13 è
dedicato ai monopoli magnetici e ha lo scopo di illustrare come l’Elettrodinamica – pur
essendo basata su un sistema di postulati molto rigidi – è perfettamente compatibile con
l’esistenza in natura di questo nuovo tipo di particelle cariche.
Prerequisiti. Si suppone che il lettore di questo testo possegga conoscenze di base
di Elettromagnetismo classico e abbia familiarità con le equazioni di Maxwell e Lorentz
scritte in forma covariante a vista, e in generale con l’uso dei tensori quadridimensionali.
L’origine fisica e gli elementi fondamentali del calcolo tensoriale vengono comunque richia-
mati con un certo grado di completezza e rigore logico nel capitolo 1. È anche richiesto un
minimo di familiarità con la teoria delle distribuzioni, in particolare con la distribuzione
δ di Dirac. Tuttavia, gli elementi essenziali riguardanti le distribuzioni e necessari per la
comprensione del testo sono presentati in modo succinto nel capitolo 2. Infine è utile, ma
non indispensabile, conoscere il metodo variazionale relativo a un sistema lagrangiano con
un numero finito di gradi di libertà.

Padova, dicembre 2008 Kurt Lechner


Indice

1 I fondamenti della Relatività Ristretta 1


1.1 I postulati della Relatività . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Trasformazioni di Lorentz e di Poincaré . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Linearità delle trasformazioni . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Invarianza dell’intervallo . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Leggi fisiche covarianti a vista . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.1 Calcolo tensoriale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Struttura del gruppo di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4.1 Trasformazioni infinitesime e trasformazioni finite . . . . . . . . . . 12
1.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Le equazioni dell’Elettrodinamica 16
2.1 Cinematica di una particella relativistica . . . . . . . . . . . . . . . . . . . 16
2.2 L’Elettrodinamica di particelle puntiformi . . . . . . . . . . . . . . . . . . 19
2.2.1 Equazione di Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.2 Identità di Bianchi . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.2.3 Equazione di Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3 La natura distribuzionale del campo elettromagnetico . . . . . . . . . . . . 30
2.3.1 Lo spazio delle distribuzioni . . . . . . . . . . . . . . . . . . . . . . 31
2.3.2 Operazioni sulle distribuzioni . . . . . . . . . . . . . . . . . . . . . 33
2.3.3 Identità di Bianchi e forme differenziali . . . . . . . . . . . . . . . . 37
2.3.4 Il campo elettromagnetico della particella statica . . . . . . . . . . 40
2.4 Le costanti del moto dell’Elettrodinamica . . . . . . . . . . . . . . . . . . . 44
2.4.1 Conservazione e invarianza della carica elettrica . . . . . . . . . . . 44
2.4.2 Tensore energia–impulso e conservazione del quadrimomento . . . . 47
2.4.3 Il tensore energia–impulso dell’Elettrodinamica . . . . . . . . . . . 49
2.4.4 Conservazione del momento angolare . . . . . . . . . . . . . . . . . 55
2.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58

3 Metodi variazionali in teoria di campo 64


3.1 Principio di minima azione in meccanica classica . . . . . . . . . . . . . . . 67
3.2 Principio di minima azione in teoria di campo . . . . . . . . . . . . . . . . 69
3.2.1 Ipersuperfici nello spazio di Minkowski . . . . . . . . . . . . . . . . 72
3.2.2 Invarianza relativistica . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2.3 La lagrangiana per l’equazione di Maxwell . . . . . . . . . . . . . . 79
3.3 Il Teorema di Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.3.1 Trasformazioni di Poincaré infinitesime . . . . . . . . . . . . . . . . 85
3.3.2 Teorema di Noether per il gruppo di Poincaré . . . . . . . . . . . . 87
3.3.3 Tensore energia–impulso canonico per il campo di Maxwell . . . . . 92
3.4 Costruzione di un tensore energia–impulso simmetrico . . . . . . . . . . . . 93
3.4.1 Tensore energia–impulso simmetrico per il campo di Maxwell . . . . 96
3.5 Densità di momento angolare “standard” . . . . . . . . . . . . . . . . . . . 97
3.6 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98

4 Il metodo variazionale per l’Elettrodinamica di particelle puntiformi 101


4.1 Principio variazionale per una particella libera . . . . . . . . . . . . . . . . 101
4.2 L’azione per l’Elettrodinamica . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.3 Il teorema di Noether in Elettrodinamica . . . . . . . . . . . . . . . . . . . 107
4.4 Invarianza di gauge e conservazione della carica elettrica . . . . . . . . . . 112
4.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114

5 Onde elettromagnetiche 115


5.1 I gradi di libertà del campo elettromagnetico . . . . . . . . . . . . . . . . . 116
5.1.1 I gradi di libertà in meccanica newtoniana . . . . . . . . . . . . . . 116
5.1.2 I gradi di libertà in teoria di campo . . . . . . . . . . . . . . . . . . 117
5.1.3 Il problema di Cauchy per l’equazione di Maxwell . . . . . . . . . . 118
5.2 L’equazione delle onde . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
5.2.1 Il problema alle condizioni iniziali . . . . . . . . . . . . . . . . . . . 129
5.3 Soluzioni dell’equazione di Maxwell nel vuoto . . . . . . . . . . . . . . . . 131
5.3.1 Proprietà delle onde elettromagnetiche elementari . . . . . . . . . . 134
5.3.2 Onde piane ed elicità . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5.3.3 Onde elettromagnetiche e invarianza di gauge manifesta . . . . . . . 145
5.4 Effetto Doppler relativistico . . . . . . . . . . . . . . . . . . . . . . . . . . 151
5.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

6 Generazione di campi elettromagnetici 157


6.1 Il metodo della funzione di Green: equazione di Poisson . . . . . . . . . . . 158
6.1.1 Una soluzione particolare . . . . . . . . . . . . . . . . . . . . . . . . 159
6.1.2 Validità della soluzione e soluzione generale . . . . . . . . . . . . . 163
6.2 Il campo generato da una corrente generica . . . . . . . . . . . . . . . . . . 166
6.2.1 La funzione di Green ritardata . . . . . . . . . . . . . . . . . . . . . 169
6.2.2 Il potenziale vettore ritardato . . . . . . . . . . . . . . . . . . . . . 174
6.2.3 Validità della soluzione e trasformata di Fourier . . . . . . . . . . . 176
6.3 Campo di una particella in moto rettilineo uniforme . . . . . . . . . . . . . 178
6.3.1 Campo di una particella massiva . . . . . . . . . . . . . . . . . . . 179
6.3.2 Campo di una particella di massa nulla . . . . . . . . . . . . . . . . 183
6.4 Campo di una particella in moto arbitrario . . . . . . . . . . . . . . . . . . 187
6.4.1 Condizioni asintotiche. . . . . . . . . . . . . . . . . . . . . . . . . . 188
6.4.2 I campi di Lienard–Wiechert . . . . . . . . . . . . . . . . . . . . . . 190
6.4.3 Emissione di radiazione da cariche accelerate . . . . . . . . . . . . . 198
6.4.4 Limite non relativistico e formula di Larmor . . . . . . . . . . . . . 201
6.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 204

7 Irraggiamento 206
7.1 Il campo elettromagnetico nella zona delle onde . . . . . . . . . . . . . . . 208
7.1.1 Emissione di quadrimomento . . . . . . . . . . . . . . . . . . . . . . 211
7.1.2 Sorgenti monocromatiche e onde piane . . . . . . . . . . . . . . . . 212
7.2 La radiazione dell’antenna lineare . . . . . . . . . . . . . . . . . . . . . . . 214
7.3 Sviluppi non relativistici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
7.3.1 Sviluppo in multipoli . . . . . . . . . . . . . . . . . . . . . . . . . . 218
7.3.2 La radiazione di dipolo . . . . . . . . . . . . . . . . . . . . . . . . . 220
7.3.3 Potenza emessa da un’antenna lineare corta . . . . . . . . . . . . . 226
7.3.4 Diffusione Thomson della radiazione . . . . . . . . . . . . . . . . . 228
7.3.5 Bremsstrahlung dall’interazione coulombiana . . . . . . . . . . . . . 234
7.3.6 La radiazione dell’atomo d’idrogeno classico . . . . . . . . . . . . . 240
7.4 Radiazione di quadrupolo elettrico e di dipolo magnetico . . . . . . . . . . 242
7.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247

8 La radiazione gravitazionale 252


8.1 Onde gravitazionali e onde elettromagnetiche . . . . . . . . . . . . . . . . . 252
8.2 Le equazioni per un campo gravitazionale debole. . . . . . . . . . . . . . . 253
8.2.1 La relazione con le equazioni di Einstein . . . . . . . . . . . . . . . 255
8.3 Irraggiamento gravitazionale . . . . . . . . . . . . . . . . . . . . . . . . . . 258
8.3.1 Un argomento euristico per la formula di quadrupolo . . . . . . . . 259
8.4 La potenza della radiazione di quadrupolo . . . . . . . . . . . . . . . . . . 261
8.5 La pulsar binaria PSR 1913+16 . . . . . . . . . . . . . . . . . . . . . . . . 264
8.6 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268

9 Irraggiamento ultrarelativistico 269


9.1 Generalizzazione relativistica della formula di Larmor . . . . . . . . . . . . 270
9.1.1 Un argomento di covarianza . . . . . . . . . . . . . . . . . . . . . . 271
9.1.2 Deduzione della formula di Larmor relativistica . . . . . . . . . . . 273
9.2 Perdita di energia negli acceleratori . . . . . . . . . . . . . . . . . . . . . . 276
9.2.1 Acceleratori lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
9.2.2 Acceleratori circolari . . . . . . . . . . . . . . . . . . . . . . . . . . 279
9.3 Distribuzione angolare nel limite ultrarelativistico . . . . . . . . . . . . . . 281
9.4 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284

10 Analisi spettrale 286


10.1 Analisi di Fourier e risultati generali . . . . . . . . . . . . . . . . . . . . . 286
10.2 Analisi spettrale nel limite non relativistico . . . . . . . . . . . . . . . . . . 289
10.2.1 Bremsstrahlung a spettro continuo e catastrofe infrarossa . . . . . . 291
10.2.2 Bremsstrahlung a spettro discreto . . . . . . . . . . . . . . . . . . . 294
10.3 Analisi spettrale relativistica . . . . . . . . . . . . . . . . . . . . . . . . . . 296
10.3.1 Spettro di emissione di una particella singola . . . . . . . . . . . . . 297
10.3.2 Frequenze caratteristiche nel limite ultrarelativistico . . . . . . . . . 300
10.4 La radiazione del ciclotrone . . . . . . . . . . . . . . . . . . . . . . . . . . 303
10.4.1 Analisi spettrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
10.4.2 Lo spettro nel limite ultrarelativistico . . . . . . . . . . . . . . . . . 305
10.4.3 Distribuzione angolare . . . . . . . . . . . . . . . . . . . . . . . . . 307
10.4.4 Luce di sincrotrone . . . . . . . . . . . . . . . . . . . . . . . . . . . 309
10.5 Spettro di emissione di una corrente generica . . . . . . . . . . . . . . . . . 310
10.5.1 Corrente periodica . . . . . . . . . . . . . . . . . . . . . . . . . . . 310
10.5.2 Corrente aperiodica . . . . . . . . . . . . . . . . . . . . . . . . . . . 313

11 L’effetto Cerenkov 315


11.1 Campo di una particella in moto rettilineo uniforme in un mezzo . . . . . . 316
c
11.2 Il campo per v < . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 318
n
11.2.1 Analisi in frequenza . . . . . . . . . . . . . . . . . . . . . . . . . . . 319
c
11.3 Il campo per v > . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
n
11.3.1 Il campo nella zona delle onde e l’angolo di Cerenkov . . . . . . . . 325
11.4 Mezzi dispersivi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
11.5 Perdita di energia ed emissione di fotoni . . . . . . . . . . . . . . . . . . . 331
11.5.1 Un argomento euristico . . . . . . . . . . . . . . . . . . . . . . . . . 331
11.5.2 La formula di Frank e Tamm . . . . . . . . . . . . . . . . . . . . . 333
11.6 Rivelatori Cerenkov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336

12 La reazione di radiazione 338


12.1 Forze di frenamento: analisi preliminare . . . . . . . . . . . . . . . . . . . 341
12.1.1 Un argomento euristico per l’equazione di Lorentz–Dirac . . . . . . 343
12.2 L’equazione di Lorentz–Dirac . . . . . . . . . . . . . . . . . . . . . . . . . 344
12.2.1 Derivazione dell’equazione . . . . . . . . . . . . . . . . . . . . . . . 346
12.2.2 Determinazione dell’autocampo regolarizzato . . . . . . . . . . . . . 350
12.2.3 Caratteristiche dell’equazione di Lorentz–Dirac . . . . . . . . . . . . 351
12.2.4 La particella carica libera: soluzione esatta . . . . . . . . . . . . . . 355
12.2.5 Moto in campo costante: preaccelerazione . . . . . . . . . . . . . . 358
12.3 L’equazione integro–differenziale di Rohrlich . . . . . . . . . . . . . . . . . 361
12.3.1 Preaccelerazione e violazione della causalità . . . . . . . . . . . . . 363
12.4 Il problema relativistico a due corpi . . . . . . . . . . . . . . . . . . . . . . 366
12.4.1 Espansione non relativistica . . . . . . . . . . . . . . . . . . . . . . 368
12.5 Problemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374

13 Un tensore energia–impulso privo di singolarità 375


13.1 Linee guida della costruzione . . . . . . . . . . . . . . . . . . . . . . . . . . 377
13.2 Costruzione di Θµν
em per la particella libera . . . . . . . . . . . . . . . . . . 380

13.2.1 Esistenza di Θµν


em . . . . . . . . . . . . . . . . . . . . . . . . . . . . 381

13.2.2 Conservazione di Θµν


em . . . . . . . . . . . . . . . . . . . . . . . . . . 384

13.2.3 Una definizione operativa dell’energia elettromagnetica . . . . . . . 386


13.3 Costruzione generale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 387

14 Monopoli magnetici 390


14.1 La dualità elettromagnetica . . . . . . . . . . . . . . . . . . . . . . . . . . 391
14.2 L’Elettrodinamica classica in presenza di dioni . . . . . . . . . . . . . . . . 393
14.2.1 Leggi di conservazione . . . . . . . . . . . . . . . . . . . . . . . . . 395
14.3 La condizione di quantizzazione di Dirac . . . . . . . . . . . . . . . . . . . 397
14.3.1 Una carica e un monopolo . . . . . . . . . . . . . . . . . . . . . . . 397
14.3.2 Il momento angolare del sistema . . . . . . . . . . . . . . . . . . . . 399
14.3.3 Consistenza quantistica e condizione di quantizzazione di Dirac . . 401
1 I fondamenti della Relatività Ristretta

L’Elettrodinamica classica costituisce il prototipo per eccellenza di una teoria relativistica,


avendo contribuito in modo determinante alla nascita della Relatività stessa. Il principio
guida della relatività einsteiniana, che afferma che tutte le leggi della Fisica devono avere
la stessa forma in tutti i sistemi di riferimento inerziali, è emerso con forza da questa
teoria ed è andato consolidandosi sempre di più man mano che le nostre conscenze del
mondo microscopico si sono ampliate e approfondite. L’implementazione più naturale
ed elegante di questo principio, di fatto l’unica di una vera utilità, avviene attraverso il
paradigma della “covarianza a vista” realizzato nell’ambito del calcolo tensoriale. Questo
paradigma ha mostrato possedere carattere universale essendo stato applicato con successo
a qualsiasi teoria di tipo fondamentale, come le teorie che descrivono le quattro interazioni
fondamentali o la più speculativa Teoria delle superstringhe, e mantiene per di più la sua
piena validità anche a livello quantistico. La presentazione dell’Elettrodinamica fornita
in questo testo si baserà cosı̀ con forza, e diremo a ragione, su questo paradigma.
In questo capitolo introduttivo ripercorreremo innanzitutto i tratti essenziali del per-
corso logico che ha portato dai postulati della Relatività alla formulazione del paradigma
della covarianza a vista. È infatti importante tenere presente quali sono le assunzioni
apriorstiche fatte nella costruzione di una teoria, e distinguere le conseguenze inevitabili
di tali assunzioni dalle conseguenze di eventuali ipotesi aggiuntive formulate strada fa-
cendo. Riassumeremo poi in particolare gli elementi fondamentali del calcolo tensoriale
di cui faremo ampio uso in questo testo. Nella parte finale del capitolo anlizzeremo in
dettaglio la struttura del gruppo di Poincaré per via della sua connessione intima con le
leggi di conservazione, connessione che verrà sviscerata più avanti.

1.1 I postulati della Relatività

La Meccanica Newtoniana e la teoria della Relatività Ristretta si basano su alcune as-


sunzioni aprioristiche comuni sulle proprietà dello spazio vuoto e del tempo, mentre si
distinguono in modo fondamentale attraverso i “principi di relatività” su cui ciascuna
delle due teorie è basata.

1
Le assunzioni in comune sono costituite dalle proprietà dello spazio vuoto di essere
omogeneo e isotropo, e dall’omogeneità del tempo. Inoltre le leggi fisiche di entrambe le
teorie sono formulate rispetto a una classe particolare di sistemi di riferimento, i riferi-
menti inerziali, ed entrambe implementano l’equivalenza fisica di tutti questi riferimenti
attraverso un principio di relatività. Il principio di relatività galileiana della Meccanica
Newtoniana prevede che le leggi della meccanica mantengano la stessa forma sotto trasfor-
mazioni di Galileo da un sistema di riferimento a un altro, mentre il principio di relatività
einsteiniana richiede che tutte le leggi della fisica abbiano la stessa forma in tutti i sistemi
riferimenti, non facendo – a priori – nessuna ipotesi sul modo in cui trasformano lo spazio
e il tempo.
D’altra parte rispetto alla Meccanica Newtoniana la teoria della Relatività Ristretta
rinuncia al paradigma dell’assolutezza degli intervalli spaziali e temporali, sostituendolo
con il postulato della costanza della velocità della luce. In definitiva i postulati della fisica
relativistica risultano i seguenti:

I) Lo spazio è isotropo e omogeneo, e il tempo è omogeneo.

II) La velocità della luce è la stessa in tutti i sistemi di riferimento inerziali.

III) Le leggi della fisica hanno la stessa forma in tutti i sistemi di riferimento inerziali.

Per rendere operativi questi postulati, in particolare il postulato III) che pone forti
restrizioni sulla forme delle leggi fisiche ammesse, è necessario determinare innanzitutto
la forma delle trasformazioni delle coordinate spazio–temporali da un sistema di riferi-
mento a un altro. Prima di derivare la forma di queste trasformazioni dai postulati stessi
specifichiamo le notazioni che adottiamo in questo testo.
Indichiamo le coordinate spazio–temporali “controvarianti” di un evento con indici
greci, µ, ν, · · · = (0, 1, 2, 3),

xµ = (x0 , x1 , x2 , x3 ), x0 = ct,

dove d’ora in poi la velocità della luce c verrà posta uguale all’unità. Indichiamo le
componenti puramente spaziali dell’evento con indici latini, i = (1, 2, 3, ),

xi = (x1 , x2 , x3 ),

2
e scriveremo anche xµ = (x0 , xi ). Denotiamo inoltre la metrica di Minkowski, e la sua
inversa, con,
η µν = diag(1, −1, −1, −1) = ηµν , η µν ηνρ = δρµ .

Adottiamo poi la convenzione di Einstein della “somma sugli indici muti”, che sottintende
il simbolo di sommatoria su un indice che compare due volte nella stessa espressione. La
metrica di Minkowski permette di introdurre coordinate spazio–temporali “covarianti”
secondo,
xµ ≡ ηµν xν = (x0 , −x1 , −x2 − x3 ), xµ = η µν xν .

Scrivendo xµ = (x0 , xi ) avremo quindi x0 = x0 , xi = −xi . Si dice che la metrica di


Minkowski permette di abbassare e alzare gli indici.

1.2 Trasformazioni di Lorentz e di Poincaré

Come notato sopra, al contrario dei postulati della Meccanica Newtoniana i postulati
della Relatività non specificano a priori la forma delle trasformazioni delle coordinate
spazio–temporali nel passaggio da un sistema di riferimento a un altro; sono piuttosto i
postulati stessi che determinano in modo univoco la forma delle trasformazioni permesse,
che risulteranno essere le trasformazioni di Poincaré. In questa sezione ripercorriamo
brevemente la deduzione della forma di queste trasformazioni dai postulati, illustrando
cosı̀ l’estrema economia dei postulati stessi e sottolineando la solidità delle proprietà
formali che attraverso essi la Relatività Ristretta impone a tutte le leggi della fisica.

1.2.1 Linearità delle trasformazioni

Consideriamo un sistema di riferimento inerziali K, e in esso due eventi infinitesimamente


vicini, con coordinate xµ e xµ + dxµ . Le coordinate in un altro sistema di riferimento
K 0 saranno legate alle coordinate in K da una generica trasformazione x0µ = f µ (x). Se
le funzioni f µ sono sufficientemente regolari le coordinate degli stessi due eventi in K 0
differiranno allora di,
∂f µ (x) ν
dx0µ = dx ≡ Λµ ν (x) dxν .
∂xν

3
Tuttavia, per l’omogeneità dello spazio e del tempo, postulato I), la matrice Λµ ν (x) deve
essere indipendente da x, e integrando si perciò una relazione lineare tra le coordinate in
K e K 0,
x0µ = Λµ ν xν + aµ . (1.1)

Per le coordinate covarianti si ottiene allora,

e µ ν xν + a µ ,
x0µ = Λ e µ ν ≡ ηµα η νβ Λα β .
Λ (1.2)

I quattro parametri aµ corrispondono ad arbitrarie traslazioni dello spazio e del tempo, che
rappresentano in effetti una classe di trasformazioni permesse tra due sistemi di riferimento
inerziali. D’altra parte ci si convince facilmente che per una scelta arbitraria dei 16
parametri Λµ ν la (1.1) in generale non corrisponde a una trasformazione da un sistema
di riferimento inerziale a un altro. Per vederlo è sufficiente considerare la scelta Λµ ν =
k δ µ ν , corrispondente a una trasformazione di scala, che per k 6= 1 in generale non lascia
invarianti le leggi della fisica.

1.2.2 Invarianza dell’intervallo

Per determinare la classe delle matrici Λ che corrispondono a trasformazioni tra sistemi di
riferimento fisicamente permesse è necessario ricorrere anche al postulato II), dimostrando
“l’invarianza dell’intervallo”. Si definisce intervallo tra due eventi xµ e xµ + dxµ , con dxµ
differenze infinitesime o anche finite, la quantità,

ds2 ≡ dxµ dxν ηµν = dt2 − |d~x|2 ,

che si dimostra essere indipendente dal sistema di riferimento. Consideriamo, infatti,


l’intervallo tra gli stessi due eventi in un altro sistema di riferimento K 0 . Per (1.1) si ha,

ds02 = dx0µ dx0ν ηµν = dt02 − |d~x 0 |2 = Gµν dxµ dxν , (1.3)

dove la matrice simmetrica Gµν è definita da,

Gµν ≡ Λα µ Λβ ν ηαβ ,

e risulta indipendente dagli eventi considerati. Se i due eventi corrispondono al passaggio


di un raggio di luce si ha evidentemente ds2 = 0, e vale anche il viceversa. Dal postulato

4
II) segue allora che,

ds02 = 0 ⇔ ds2 = 0 ⇔ dt = ±|d~x|.

Concludiamo che la quantità ds02 , vista come polinomio del secondo ordine in dt, ha gli
zeri in dt = ±|d~x|. La (1.3) permette allora di scrivere,

ds02 = G00 (dt − |d~x|) (dt + |d~x|) = G00 ds2 , (1.4)

dove la quantità G00 può dipendere solo dal moto relativo dei due riferimenti. In parti-
colare, per l’invarianza per rotazioni – postulato I) – G00 può dipendere solo dal modulo
della velocità relativa, G00 (|~v |). Ma invertendo nella (1.4) i ruoli di K e K 0 avremmo
~v → −~v e quindi otterremmo G00 (|~v |) = 1/G00 (|~v |), e dunque G00 = 1. L’intervallo tra
due eventi qualsiasi è quindi lo stesso in tutti i sistemi di riferimento,

ds2 = ds02 ,

e la (1.3) pone dunque,


Gµν = ηµν .

Concludiamo che le matrici Λ che compaiono nelle trasformazioni (1.1) tra due sistemi di
riferimento sono soggette ai vincoli,

Λα µ Λβ ν ηαβ = ηµν ⇔ ΛT η Λ = η. (1.5)

L’insieme di queste matrici forma un gruppo di Lie, chiamato gruppo di Lorentz, che
viene anche indicato con,

O(1, 3) ≡ {Λ, matrici reali 4 × 4 /ΛT η Λ = η}.

Due generici sistemi di riferimento sono pertanto collegati da una trasformazione li-
neare non omogenea del tipo (1.1), dove Λ è un elemento del gruppo di Lorentz. L’insieme
di queste trasformazioni forma a sua volta un gruppo di Lie che viene chiamato gruppo
di Poincaré, P. Gli elementi di questo gruppo sono identificati univocamente dalle coppie
(Λα β , aµ ),
P ≡ {(Λ, a) /Λ ∈ O(1, 3), a ∈ R4 }.

5
Il gruppo O(1, 3) è omeomorfo al sottogruppo di P corrispondente ad a = 0, mentre
gli elementi di P corrispondenti a Λµ ν = δ µ ν formano il sottogruppo delle traslazioni.
Le trasformazioni delle coordinate (1.1) indotte dagli elementi del gruppo di Poincaré
vengono chiamate trasformazioni di Poincaré, mentre le trasformazioni corrispondenti ad
aµ = 0 vengono chiamate trasformazioni di Lorentz.
Strettamente parlando quello che abbiamo dimostrato finora è che una trasformazione
che collega due sistemi di riferimento inerziali è necessariamente una trasformazione di
Poincaré. A rigore dovremmo ancora convincerci che ogni trasformazione di Poincaré
corrisponde realmente al passaggio da un riferimento inerziale a un altro; è ovvio che
questo problema riguarda solo le trasformazioni di Lorentz in quanto le traslazioni hanno
un significato fisico immediato. Affronteremo questa questione nella sezione 1.4.

1.3 Leggi fisiche covarianti a vista

Una volta determinata la forma delle trasformazioni delle coordinate da un sistema di


riferimento a un altro possiamo procedere all’implementazione del postulato III), ovverosia
allo sviluppo di una strategia che permetta di derivare leggi fisiche che soddisfano il
principio di relatività einsteiniana. Prima di poter fare questo dobbiamo determinare
il modo in cui si trasformano in generale le grandezze fisiche quando si passa da un
riferimento a un altro.
Cominciamo notando che il gruppo di Lorentz possiede come sottogruppo il gruppo
delle rotazioni spaziali, vedi sezione 1.4, rappresentato dalle matrici 3 × 3 ortogonali Ri j ,

O(3) ≡ {R matrici reali 3 × 3 /RT R = I}.

Questo gruppo costituisce un gruppo di invarianza “a vista” per le equazioni della Mec-
canica Newtoniana, in quanto queste genericamente sono scritte in forma tri–vettoriale.
Esempi ne sono l’equazione di Newton stessa, F~ = m~a, oppure la formula per il momento
angolare di un corpo rigido, Li = I ij ω j , dove I ij è il tensore d’inerzia,
X
I ij = mn (xin xjn − rn2 δ ij ),
n
j
e ω è lo pseudo–vettore velocità angolare. Notiamo comunque che le grandezze fi-
siche coinvolte sono raggruppate in vettori o tensori tridimensionali, che trasformano

6
linearmente sotto O(3). Abbiamo per esempio,

F 0i = Ri j F j , I 0ij = Ri m Rj n I mn .

Essendo O(3) sottogruppo di O(1, 3) possiamo allora assumere che le grandezze fisiche
che compaiono nelle leggi della fisica relativistica siano raggruppate in multipletti che tra-
sformano linearmente sotto il gruppo di Lorentz. Nel linguaggio della teoria dei gruppi si
dice che ciascuno di questi multipletti deve essere sede di una rappresentazione, riducibi-
le o irriducibile, del gruppo di Lorentz. Da un risultato fondamentale della teoria delle
rappresentazioni dei gruppi segue allora che questi multipletti devono formare “tensori
quadridimensionali di rango (m, n)” sotto l’azione del gruppo di Lorentz.
Per definizione un tensore quadridimensionale di rango (m, n) porta m indici contro-
varianti e n indici covarianti,
TNM ≡ Tνµ11···ν
···µm
n
,

ed è caratterizzato dalla specifica legge di trasformazione sotto una generica trasformazio-


ne di Poincaré (1.1), che specificheremo tra un momento. Tensori di rango (0,0) vengono
chiamati scalari, e tensori di rango (1,0) e (0,1) vengono chiamati vettori, rispettivamente
controvarianti e covarianti.
Più in generale considereremo campi tensoriali di rango (m, n), che rispetto ai ten-
sori esibiscono anche una dipendenza dalla coordinata quadridimensionale x, Tνµ11···ν
···µm
n
(x).
Per definizione la sua legge di trasformazione sotto una trasformazione di Poincaré delle
coordinate, x0 = Λx + a, è data da,

Tν0µ1 ···ν
1 ···µm e ν1 β1 · · · Λ
(x0 ) = Λµ1 α1 · · · Λµm αm Λ e νn βn T α1 ···αm (x). (1.6)
n β1 ···νn

In particolare un campo tensoriale è invariante per traslazioni. La legge di trasformazione


di un tensore di rango (m, n) si ottiene semplicemente dalla (1.6) omettendo la dipendenza
dalle coordinate spazio–temporali. In seguito per semplicità useremo la dicitura generica
“tensore” sia per un campo tensoriale che per un tensore, in quanto sarà chiaro dal contesto
di che tipo di oggetto si sta trattando.
Una volta accettato che le osservabili fisiche in una teoria relativistica si devono rag-
gruppare in tensori quadridimensionali, l’implementazione del postulato III) – la relati-
vità einsteiniana – avviene in analogia con la Meccanica Newtoniana. Cosı̀ come le leggi

7
di quest’ultima eguagliando vettori tridimensionali a vettori tridimensionali rispettano
automaticamente la richiesta di invarianza sotto rotazioni spaziali, le leggi della fisica
relativistica avranno automaticamente la stessa forma in tutti i sistemi di riferimento
inerziali, se sono scritte nel linguaggio quadritensoriale, cioè, eguagliano quadritensori a
N
quadritensori. Se SM e TNM sono due tensori dello stesso rango schematicamente avremo
infatti,
M
SN (x) = TNM (x) in K ⇒ 0M
SN (x0 ) = TN0M (x0 ) in K 0 , (1.7)

come si vede moltiplicando la prima equazione con un’opportuna serie di matrici Λ. Un’e-
quazione scritta in forma quadritensoriale come la (1.7) si dice essere “covariante a vista”,
in quanto soddisfa automaticamente il principio di relatività einsteiniana.
In conclusione, il paradigma della covarianza a vista costituisce il metodo più diretto
ed efficace per implementare il postulato III) in una qualsiasi teoria relativistica: in ultima
analisi questo pardigma risulta equivalente al postulato stesso in quanto non sono note
leggi fisiche che hanno la stessa forma in tutti i riferimenti inerziali, ma non possono essere
poste in forma covariante a vista.
Di seguito riassumiamo gli elementi fondamentali del calcolo tensoriale in quanto
strumento essenziale per la costruzione di equazioni covarianti a vista.

1.3.1 Calcolo tensoriale

Di seguito elenchiamo le operazioni principali che si possono eseguire sui tensori, lasciando
eventuali dimostrazioni per lo più come esercizio.
Indici covarianti e controvarianti. Un tensore di rango (m, n) può essere trasformato
in un tensore di rango (m − k, n + k), alzando o abbassando k indici con la metrica di
Minkowski. In generale il tensore ottenuto viene indicato ancora con lo stesso simbolo.
Per esempio, per m = 2, n = 1 e k = 2 si scrive,

Tαβρ = ηαµ ηβν T µν ρ .

Di conseguenza un tensore di rango (m, n) è equivalente a tutti gli effetti a un tensore di


rango (m − k, n + k), motivo per cui come rango di un tensore si definisce spesso l’intero
m + n.

8
Prodotti tra tensori. Il “prodotto” tra due tensori di rango (m, n) e (k, l) è un tensore
di rango (m + k, n + l).
Contrazione degli indici e prodotti scalari. A partire da un tensore di rango (m, n) si
possono costruire tensori di rango (m − k, n − k), contraendo k indici covarianti con k
indici controvarianti. Per esempio, a partire da un tensore T µν ρ di rango (2, 1) contraendo
un indice si ottiene il vettore controvariante,

T µν ν = T µν ρ δνρ . (1.8)

In particolare la contrazione degli indici del prodotto di due vettori, T µ Uν , dà lo scalare,

T µ Uν δµν = T µ Uµ = T µ U ν ηµν .

Indicheremo il “quadrato” di un vettore con V 2 ≡ V µ Vµ .


Gradiente di un campo tensoriale. Il gradiente quadri–dimensionale, o più semplice-
mente la “derivata”, di un campo tensoriale di rango (m, n) costituisce un campo tensoriale
di rango (m, n + 1). Indicheremo il gradiente rispetto alle coordinate spazio–temporali
controvarianti con il simbolo,

∂µ ≡ .
∂xµ
Si noti che l’operatore ∂µ porta l’indice in basso in quanto corrisponde a un vettore
covariante. Cosı̀ la derivata di un campo scalare ϕ(x) è il campo vettoriale covariante
∂µ ϕ(x).
Simmetrie. Un tensore di rango (2, 0) si dice simmetrico se S µν = S νµ , e antisimmetrico
se Aµν = −Aνµ , proprietà che vengono preservate dalle trasformazioni di Poincaré. La
contrazione doppia del prodotto tra un tensore simmetrico e uno antisimmetrico è zero,

Aµν Sµν = 0.

Si definiscono parte simmetrica e parte antisimmetrica di un generico tensore di rango


(2, 0) T µν i tensori,
1 µν 1 µν
T (µν) ≡ (T + T νµ ), T [µν] ≡ (T − T νµ ),
2 2
il primo essendo un tensore simmetrico e il secondo un tensore antisimmetrico. Si ha la
decomposizione,
T µν = T (µν) + T [µν] .

9
Per la contrazione doppia del prodotto di un generico tensore T µν con un tensore simme-
trico, rispettivamente antisimmetrico, valgono le identità,

T µν Sµν = T νµ Sµν = T (µν) Sµν , T µν Aµν = −T νµ Aµν = T [µν] Aµν . (1.9)

Un tensore di rango (n, 0) si dice completamente (anti)simmetrico se è (anti)simmetrico


nello scambio di qualsiasi coppia di indici, proprietà preservata dall’azione del gruppo di
Poincaré. Si definisce parte completamente antisimmetrica di un tensore T µ1 ···µn di rango
(n, 0), il tensore dello stesso rango,
1
T [µ1 ···µn ] ≡ (T µ1 µ2 ···µn − T µ2 µ1 ···µn + · · ·),
n!
dove nella somma compaiono tutte le n! permutazioni degli indici, ciascuna con il segno
(−)p dove p è l’ordine della permutazione. Il tensore T [µ1 ···µn ] è completamente antisim-
metrico, ed esso è nullo se T µ1 ···µn è simmetrico anche in una sola coppia di indici. Inoltre
la contrazione doppia del prodotto di T [µ1 ···µn ] con un tensore di rango (0, 2) simmetrico
è nulla.
Proprietà speculari valgono per la parte completamente simmetrica di un tensore di
rango (n, 0),
1
T (µ1 ···µn ) ≡ (T µ1 µ2 ···µn + T µ2 µ1 ···µn + · · ·).
n!
Tensori invarianti. Un tensore TNM si dice invariante sotto il gruppo di Lorentz O(1, 3)
se per ogni Λ ∈ O(1, 3) si ha
TN0M = TNM .

Osserviamo che da (1.5) segue che le matrici Λ ∈ O(1, 3) soddisfano |detΛ| = 1. Se


ci limitiamo alla richiesta di invarianza sotto trasformazioni di Lorentz corrispondenti
a detΛ = +1, usando la teoria dei gruppi si può dimostrare che un generico tensore
invariante è necessariamente un polinomio nei due tensori invarianti fondamentali,

η αβ e εαβγδ ,

dove εαβγδ è il tensore (di Levi–Civita) completamente antisimmetrico, determinato in


modo univoco dalla condizione ε0123 = 1. La restrizione alle sole matrici con detΛ = +1
deriva dal fatto che per una generica matrice Λ 4 × 4 si ha l’identità del determinante,

Λα µ Λβ ν Λγ ρ Λδ σ εµνρσ = detΛ · εαβγδ ,

10
proprietà che identifica il tensore di Levi–Civita come uno “pseudotensore” invariante.
Questo tensore gode delle proprietà,

µ ν ρ σ µ ν ρ
εµνρσ εαβγδ = −4! δ[α δβ δγ δδ] , εµνρσ εαβγσ = −3! δ[α δβ δγ] ,

µ ν
εµνρσ εαβρσ = −2!2! δ[α δβ] , εµνρσ εανρσ = −3! δαµ , εµνρσ εµνρσ = −4!

Il fatto che la metrica di Minkowski sia un tensore invariante segue invece direttamente
dalla (1.5).

1.4 Struttura del gruppo di Lorentz

In questa sezione vogliamo analizzare brevemente la struttura del gruppo di Lorentz alla
luce del fatto che le matrici Λ che rappresentano trasformazioni ammesse di coordinate da
un sistema inerziale a un altro, sono vincolate dalla (1.5). In particolare vogliamo trovare
una parametrizzazione esplicita per la generica matrice Λ che soddisfa questo vincolo per
individuare le corrispondenti operazioni fisiche che connettono due sistemi di riferimento,
questione lasciata aperta nella sezione 1.2.2. Come vedremo a questo scopo sarà utile
eseguire un’analisi dettagliata delle trasformazioni di Lorentz prossime all’identità.
Cominciamo con il notare che i vincoli (1.5) comportano le condizioni |detΛ| = 1 e
|Λ0 0 | ≥ 1. Il gruppo di Lorentz risulta quindi scisso in quattro sottoinsiemi disgiunti,
a seconda del valore di detΛ e del segno di Λ0 0 . Si chiama gruppo di Lorentz proprio il
sottogruppo di O(1, 3) definito da,

SO(1, 3)c ≡ {Λ ∈ O(1, 3)/detΛ = 1, Λ0 0 ≥ 1}.

Il simbolo “S” indica comunemente il fatto che il determinante delle matrici vale +1, e il
pedice “c” si riferisce al fatto che il gruppo di Lorentz proprio risulta connesso all’unità,
al contrario di O(1, 3). Siccome gli altri tre sottoinsiemi di O(1, 3) si possono ottenere
da SO(1, 3)c attraverso trasformazioni discrete è sufficiente occuparsi di questo ultimo
gruppo.
Conosciamo già due classi importanti di elementi di SO(1, 3)c . La prima classe è
costituita dalle rotazioni spaziali definite da,

Λi j = Ri j , Λ0 0 = 1, Λ0 i = 0 = Λi 0 ,

11
dove R ∈ SO(3) ≡ {R ∈ O(3)/detR = 1}. Si verifica infatti immediatamente che la
matrice Λ cosı̀ definita soddisfa la (1.5).
La seconda classe importante è costituita dalle trasformazioni di Lorentz speciali. Per
un sistema di riferimento che si muove con velocità v lungo l’asse x abbiamo per esempio,
 
γ −βγ 0 0
 −βγ γ 0 0 
Λµ ν = 
 0
, (1.10)
0 1 0 
0 0 0 1

dove β = v e γ = 1/ 1 − v 2 . In generale possiamo eseguire trasformazioni di Lorentz
speciali con velocità ~v arbitraria, purché in modulo minore di uno, e le matrici Λ corrispon-
denti dipenderanno quindi da tre parametri indipendenti, vale a dire dalle tre componenti
della velocità. Le rotazioni spaziali dipendono a loro volta da tre parametri indipendenti,
per esempio i tre angoli di Eulero, e ci aspettiamo quindi che i 16 elementi della generica
matrice Λ ∈ SO(1, 3)c possano esprimersi in termini di 6 variabili indipendenti. In altre
parole, il gruppo di Lie SO(1, 3)c dovrebbe avere dimensione 6.
Per dimostrare la correttezza di questa conlusione riscriviamo la (1.5) come,

H ≡ ΛT ηΛ − η = 0, (1.11)

che corrisponde a un sistema di 16 equazioni nelle 16 incognite Λµ ν , vale a dire H µν = 0.


Tuttavia, siccome per costruzione H è una matrice 4 × 4 simmetrica, solo 10 di queste
equazioni sono linearmente indipendenti, e la generica soluzione Λ potrà quindi esprimersi
effettivamente in termini di 16 − 10 = 6 parametri indipendenti.

1.4.1 Trasformazioni infinitesime e trasformazioni finite

Per individuare una possibile scelta di questi 6 parametri consideriamo una generica
trasformazione di Lorentz prossima all’identità,

Λ µ ν = δ µ ν + Ωµ ν , |Ωµ ν | ¿ 1.

Imponendo la (1.11) e tenendo solo i termini lineari in Ωµ ν otteniamo,

(δ α µ + Ωα µ ) ηαβ (δ β ν + Ωβ ν ) − ηµν = 0 ⇒ ηνα Ωα µ = −Ωβ ν ηβµ . (1.12)

12
Definendo la matrice,
ωµν ≡ ηµβ Ωβ ν ,

risulta anche,
Ωµ ν = η µα ωαν , (1.13)

e la relazione in (1.12) diventa allora,

ωµν = −ωνµ . (1.14)

ω è quindi una matrice antisimmetrica e come tale ha sei elementi indipendenti. Con-
cludiamo che la generica trasformazione di Lorentz infinitesima dipende da sei parametri
liberi, potendo essere scritta come,

Λµ ν = δ µ ν + η µα ωαν . (1.15)

A questo punto siamo anche in grado di dare un’espressione esplicita per il generico
elemento finito di SO(1, 3)c . In forma matriciale risulta semplicemente,

Λ = e Ω, (1.16)

purché Ω soddisfi la relazione (1.12) oppure, equivalentemente, ω soddisfi la (1.14). Per


dimostrare che le matrici Λ date in (1.16) soddisfano effettivamente la condizione (1.11)
notiamo intanto che la (1.12) in forma matriciale si scrive,

η Ω = −ΩT η ⇔ ΩT = −η Ω η.

Risulta allora,

T
ΛT η Λ = e Ω η e Ω = e−η Ω η η e Ω = η e− Ω η η e Ω = η, c.v.d.

Notiamo infine che le matrici Λ date da (1.16), pur dipendendo da sei parametri indipen-
denti, parametrizzano solo SO(1, 3)c e non l’intero gruppo di Lorentz. Infatti, siccome
l’esponenziale di una matrice è una funzione continua dei suoi elementi, l’insieme delle
matrici e Ω è connesso con continuità alla matrice identità.
Per concludere chiariamo il significato fisico dei sei parametri ωµν analizzando di nuovo
una generica trasformazione infinitesima. In notazione tridimensionale, data la (1.14), in

13
tutta generalità possiamo porre,

ω00 = 0, (1.17)

ωi0 = v i = −ω0i (1.18)

ωij = ϕ εijk uk , (1.19)

dove il vettore ~v corrisponderà alla velocità infinitesima di un sistema di riferimeno ri-


spetto all’altro, mentre ϕ sarà l’angolo di rotazione infinitesimo attorno alla direzione
individuata dal versore ~u. Che queste interpretazioni sono in effetti corrette si vede
scrivendo esplicitamente le trasformazioni infinitesime delle coordinate, usando la (1.15),

x0µ = Λµ ν xν = xµ + η µα ωαν xν .

Otteniamo,

t0 = t + η 00 ω0i xi = t − ~v · ~x, (1.20)

x0i = xi + η ij (ωj 0 t + ωj k xk ) = xi − v i t + ϕ( ~u × ~x)i . (1.21)

Per ~v = 0 si ottiene in effetti una rotazione spaziale infinitesima di un angolo ϕ intorno


ad ~u, mentre per ϕ = 0 si riconosce una trasformazione di Lorentz speciale infinitesima

con velocità relativa ~v . Si noti che nelle (1.20), (1.21) sono assenti i fattori 1/ 1 − v 2 in
quanto essi introdurrebbero correzioni quadratiche in ωµν , mentre nella presente analisi
ci siamo limitati ai termini lineari in ωµν .
Infine, a titolo di esempio facciamo vedere in che modo possiamo riottenere la tra-
sformazione di Lorentz speciale finita data in (1.10), a partire dalla formula generale
(1.16). A questo scopo nella parametrizzazione generale (1.17)–(1.19) poniamo ϕ = 0 e
v i = (e
v , 0, 0), con,
ve = v + o(v 2 ).

In questo caso le componenti non nulle di ωµν sono,

ω10 = ve = −ω01 .

Dalla (1.13) segue allora che gli elementi non nulli della matrice Ωµ ν sono dati da,

Ω0 1 = −e
v = Ω1 0 . (1.22)

14
A questo punto il calcolo di e Ω può essere eseguito agevolmente sviluppando l’esponenziale
in serie di Taylor, ed è facile vedere che il risultato coincide con la (1.10), per un’opportuna
scelta di ve, vedi problema 1.7.

1.5 Problemi

1.1 Usando le tecniche della sezione 1.4 si trovi una parametrizzazione esplicita per la
generica matrice R appartenente a O(3).

1.2 Si dimostri che il tensore dato in (1.8) corrisponde a un vettore controvariante.

1.3 Si dimostri che l’operatore ∂µ corrisponde a un vettore covariante.

1.4 Si dimostrino le relazioni (1.9).

1.5 Si dimostri che la matrice Λµ ν data in (1.10) soddisfa il vincolo (1.5).

1.6 Dato un generico tensore T µνρ di rango (3, 0) si dimostri che si ha,

T [µνρ] = 0 ⇔ εµνρσ T µνρ = 0.

1.7 Si consideri la matrice,


 
0 −ev 0 0
 −ev 0 0 0 
Ωµ ν =
 0
,
0 0 0 
0 0 0 0
corrispondente a una trasformazione di Lorentz speciale infinitesima lungo l’asse x, vedi
(1.22). Si dimostri che l’esponenziale e Ω coincide con la trasformazione di Lorentz speciale
finita data in (1.10), per un’opportuna scelta di ve. [Sugg.: si sviluppi l’esponenziale in
serie di Taylor e si noti che la matrice,
µ ¶
0 1
M≡ ,
1 0

gode delle identità algebriche,


µ ¶
2n 1 0
M = , M 2n+1 = M,
0 1

per ogni intero positivo n.]

15
2 Le equazioni dell’Elettrodinamica

In questo capitolo presenteremo le equazioni che governano la dinamica di un sistema di


particelle cariche puntiformi in interazione con il campo elettromagnetico, ne illustreremo
ruolo e significato e analizzeremo le loro caratteristiche generali. Una parte sostanziale
del corso sarà poi dedicata ad un’analisi approfondita delle soluzioni e delle conseguenze
fisiche di queste equazioni.
Cominciamo con l’introdurre le grandezze fisiche che caratterizzano dal punto di vista
cinematico il moto di una singola particella relativistica.

2.1 Cinematica di una particella relativistica

Linee di universo causali. In Meccanica Newtoniana le legge oraria di una particella cor-
risponde alla curva tridimensionale ~y (t) ≡ (x(t), y(t), z(t)) 1 . In ambito relativistico per
motivi di covarianza si introduce la traiettoria quadridimensionale γ della particella –
detta anche linea di universo – che è descritta da quattro funzioni di un parametro reale
λ,
y µ (λ) = (y 0 (λ), ~y (λ)),

che in generale supporremo essere di classe C 2 . Perchè una linea di universo sia fisicamente
accettabile è necessario che essa sia causale e diretta nel futuro. Diremo che una linea di
universo è causale e diretta nel futuro quando, definito il vettore tangente,

µ dy µ
V = ,

risultano soddisfatte le condizioni,


a) V 2 ≥ 0, ∀λ,
b) V 0 > 0, ∀λ.
Se la condizione b) è sostituita con la richiesta V 0 < 0, ∀λ la linea di universo si dice
invece causale e diretta nel passato. La condizione a) segue dal fatto che in una teoria
relativistica una particella non può superare la velocità della luce, mentre la condizione b)
1
Di solito la legge oraria di una particella viene indicata con ~x(t). Noi preferiamo la notazione
~y (t) al posto di ~x(t), per evitare la confusione con il generico evento (t, ~x) in cui si valuta il campo
elettromagnetico.

16
assicura che il parametro λ è una funzione monotona crescente del tempo, proprietà il cui
significato verrà chiarito tra un momento. Da un punto di vista geometrico la condizione
a) definisce l’interno del cono luce, mentre l’aggiunta della condizione b) ne delimita la
metà “in avanti”, ovvero, il “cono luce futuro”. D’ora in poi supporremo, dunque, che
la linea di universo percorsa da una qualsiasi particella sia causale e diretta nel futuro,
ovvero, che il suo vettore tangente V µ appartenga all’interno del cono luce futuro, per
ogni λ.
Per la condizione b), ovvero dy 0 /dλ > 0, la funzione y 0 (λ) può essere invertita per
determinare in modo univoco il parametro in funzione del tempo,

y 0 (λ) = t ⇒ λ(t).

Le componenti spaziali ~y (λ) descrivono invece la traiettoria tridimensionale della particel-


la. La legge oraria tridimensionale si ottiene, infine, eliminando dalla traiettoria spaziale
il parametro λ in favore del tempo, e per semplicità la scriveremo come,

~y (λ(t)) ≡ ~y (t).

In seguito indicheremo velocità e accelerazione tridimensionali con,


d~y d~v
~v = , ~a = .
dt dt
Invarianza per riparametrizzazione. Rispetto alla Meccanica Newtoniana sembrerebbe
che la linea di universo relativistica introduce un quarto grado di libertà nella dinamica
della particella – la funzione y 0 (λ). Tuttavia, questo grado di libertà risulta “spurio”,
ovvero inosservabile, in quanto riflette l’arbitrarietà della scelta del parametro. Due linee
di universo y1µ (λ) e y2µ (λ) risultano, infatti, fisicamente equivalenti se sono collegabili da
una ridefinizione del parametro, vale a dire se esiste una funzione f da R in R, invertibile
e di classe C 2 insieme alla sua inversa, tale che,

y1µ (f (λ)) = y2µ (λ).

Si dice che le due linee di universo sono collegate da una riparametrizzazione. È evidente
che le leggi orarie associate a due linee di universo collegate da una riparametrizzazione
sono identiche,
~y1 (t) = ~y2 (t).

17
Saremo quindi autorizzati a usare le linee di universo per descrivere il moto di una par-
ticella, al posto delle leggi orarie, purché le equazioni del moto che postuleremo risultino
invarianti per riparametrizzazione. Si noti che la stessa legge oraria ~y (t) è una funzione in-
variante per riparametrizzazione e risulta una “grandezza osservabile”, mentre le funzioni
~y (λ) e y 0 (λ) non lo sono.
Se tutte le equazioni che scriveremo risulteranno invarianti per riparametrizzazione
è lecito scegliere un parametro arbitrario. Una scelta che adotteremo di frequente è la
componente µ = 0 della traiettoria stessa, vale a dire il tempo, λ = y 0 ≡ t. In questo caso
la linea di universo sarà parametrizzata da,

y µ (t) = (t, ~y (t)).

Un’altra scelta di estrema utilità è il cosiddetto tempo proprio s, che ha il pregio di


essere invariante simultaneamente per trasformazioni di Lorentz e per riparametrizzazione.
Formalmente esso è definito da,
p
ds = dy µ dyµ , (2.1)

che costituisce una notazione abbreviata per l’espressione,


Z λr µ
dy dyµ
s(λ) = 0 dλ0
dλ0 + s(0), (2.2)
0 dλ
dove s(0) è una costante arbitraria. Mentre l’invarianza di Lorentz di s è manifesta, la
sua invarianza per riparametrizzazione è conseguenza del fatto che nella formula appena
scritta i fattori dλ0 formalmente si cancellano. Si noti inoltre che grazie alla causalità
della linea di universo – condizione a) di cui sopra – il radicando in (2.2) è mai negativo,
µ ¶2
dy µ dyµ dt
= (1 − v 2 ) ≥ 0.
dλ dλ dλ
Il concetto di tempo proprio permette poi di definire la derivata invariante,
d 1 d
≡q . (2.3)
ds dy µ dyµ dλ
dλ dλ

Grazie all’invarianza per riparametrizzazione di s, nelle (2.2) e (2.3) possiamo usare come
parametro il tempo, ottenendo cosı̀,
Z tp
d 1 d
s(t) = 1 − v 2 (t0 ) dt0 + s(0), =p . (2.4)
0 ds 1 − v 2 (t) dt

18
Quadrivelocità, quadriaccelerazione e quadrimomento sono definiti da,
µ ¶
µ dy µ 1 ~v duµ
u = = √ ,√ , wµ = , pµ = muµ ,
ds 1−v 2 1−v 2 ds
e soddisfano identicamente le relazioni,

uµ uµ = 1, uµ wµ = 0, p2 ≡ pµ pµ = m2 , (2.5)

dove m è la massa della particella. Per l’energia e la quantità di moto della particella si
ottengono allora le note espressioni,
m m~v
ε ≡ p0 = √ , p~ = √ .
1 − v2 1 − v2
Notiamo ancora che per ogni fissato istante t0 esiste sempre un sistema di riferimento
inerziale K – chiamato “sistema a riposo istantaneo” – in cui la particella all’istante t0 è
a riposo. Si verifica facilmente che in K in questo istante si ha,

uµ = (1, ~0), wµ = (0, ~a).

2.2 L’Elettrodinamica di particelle puntiformi

Introduciamo ora il sistema fisico la cui dinamica è l’oggetto di studio primario di questo
testo: un sistema di N particelle cariche puntiformi interagenti con il campo elettroma-
gnetico. Le variabili cinematiche indipendenti che lo descrivono sono le 4N funzioni yrµ (λr )
con r = 1, . . . , N , che parametrizzano le linee di universo γr percorse dalle particelle, e il
campo tensoriale di Maxwell F µν (x) antisimmetrico,

F µν = −F νµ .

Per ciascuna delle particelle possiamo definire le quantità cinematiche introdotte nella
sezione precedente: il tempo proprio sr , la quadrivelocità uµr , la quadriaccelerazione wrµ , e
il quadrimomento pµr = mr uµr , dove mr è la massa della particella r–esima. Per il momento
parametrizziamo ogni linea di universo γr con un parametro λr arbitrario.
Se indichiamo con er la carica della particella r–esima, al sistema di cariche resta
associata la (densità di) quadricorrente elettrica,
X Z X Z dy µ
µ µ 4 r 4
j (x) = er dyr δ (x − yr ) ≡ er δ (x − yr (λr )) dλr . (2.6)
r γr r
dλ r

19
Questa espressione risulta manifestamente Lorentz–covariante e – come conviene a qual-
siasi grandezza osservabile – essa è anche invariante per riparametrizzazione in quanto
i fattori dλr formalmente si cancellano. Ricordiamo inoltre che questa corrente risulta
conservata identicamente,
∂µ j µ = 0. (2.7)

Le proprietà di una generica quadricorrente elettrica conservata verranno analizzate in


dettaglio nel paragrafo 2.4.1. Quı̀ ci limitiamo a osservare che la corrente di un sistema di
particelle puntiformi strettamente parlando non può essere considerata come un “campo
vettoriale”, in quanto le sue quattro componenti, coinvolgendo la funzione–δ di Dirac,
non sono “funzioni di x” ma elementi di S 0 (R4 ), vale a dire distribuzioni temperate. La
corrente data in (2.6) va quindi considerata piuttosto come un “campo vettoriale a valori
nelle distribuzioni”. Le conseguenze di questa circostanza verranno discusse in dettaglio
nella prossima sezione, dove analizzeremo a fondo la natura distribuzionale delle equazioni
di Maxwell.
~ B)
Ricordiamo che il tensore di Maxwell è legato ai campi elettrico e magnetico (E, ~

dalle note relazioni,

F 00 = 0 (2.8)

F i0 = Ei (2.9)
1
F ij = − εijk B k ↔ B i = − εijk F jk , (2.10)
2

e che gli invarianti di Lorentz indipendenti che si possono formare con le componenti di
F µν sono dati da,

~ · B,
εµνρσ Fµν Fρσ = −8 E ~ F µν Fµν = 2 (B 2 − E 2 ). (2.11)

Presentiamo ora le tre equazioni fondamentali che governano la dinamica del nostro
sistema,

dpµr
= er F µν (yr ) urν , (2.12)
dsr
εµνρσ ∂ν Fρσ = 0, (2.13)

∂µ F µν = j ν , (2.14)

20
che chiamiamo rispettivamente Equazioni di Lorentz, Identità di Bianchi ed Equazione di
Maxwell. Scopo di queste equazioni è di determinare univocamente i campi F µν (x) e le
linee di universo yrµ (λr ) – modulo riparametrizzazioni – date certe condizioni iniziali, vale
a dire, di dare luogo a un ben definito problema di Cauchy in accordo con il determinismo
newtoniano. Per le coordinate yrµ il problema di Cauchy verrà specificato nel prossimo
paragrafo mentre per il tensore di Maxwell lo affronteremo più avanti.
Di seguito analizzeremo brevemente la struttura e il significato delle singole equazioni.

2.2.1 Equazione di Lorentz

Per non appesantire la notazione consideriamo una singola particella di carica e e linea di
unverso y µ (λ), che deve dunque soddisfare l’equazione di Lorentz,

dpµ
= eF µν (y) uν . (2.15)
ds

Prima di tutto facciamo notare che in questa equazione il campo elettromagnetico ri-
sulta valutato sulla traiettoria della particella in quanto con F µν (y) si intendono le sei
funzioni di una variabile F µν (y(λ)). Assunto noto il campo elettromagnetico F µν (x) le
(2.15) cositituiscono allora formalmente quattro equazioni differenziali del secondo ordine
nelle quattro funzioni incognite y µ (λ). D’altra parte queste equazioni risultano invarianti
per riparametrizzazione perché l’unica variabile che vi compare esplicitamente è il tempo
proprio s, e ciò comporta che esse determinano le y µ (λ) solo modulo una riparametriz-
zazione in accordo con quanto richiesto nella sezione 2.1. In particolare queste equazioni
dovrebbero allora determinare univocamente la legge oraria ~y (t) note le condizioni iniziali,

~y (0) e ~v (0). (2.16)

Vediamo allora due approcci diversi – ma matematicamente e fisicamente equivalenti – di


formulare il problema alle condizioni iniziali.
Approccio covariante. In questo approccio si considera s come una variabile indipen-
dente, vale a dire non legata alla traiettoria dalla (2.2), e si parametrizza la linea di
universo con s. Corrispondentemente le (2.15) sono considerate come quattro equazioni
differenziali del secondo ordine nelle quattro funzioni incognite y µ (s), che ora però sono

21
legate dal vincolo supplementare, vedi (2.1),

dy µ dyµ
u2 = = 1. (2.17)
ds ds

Tuttavia, il contenuto di questo vincolo risulta meno restrittivo di quanto non potrebbe
sembrare a prima vista. Le (2.15) assicurano infatti che esso è automaticamente soddi-
sfatto per ogni valore s, una volta che è soddisfatto all’istante iniziale, diciamo per s = 0.
Per vederlo è sufficiente moltiplicare le (2.15) con uµ . Il membro di destra si annulla al-
lora identicamente, perché F µν uµ uν = 0 grazie all’antisimmetria del tensore di Maxwell.
Quindi deve annullarsi anche il membro di sinistra,

dpµ m d 2
0 = uµ = u.
ds 2 ds

u2 è quindi indipendente da s, e se vale 1 per s = 0 vale 1 per ogni s.


Analizziamo ora le condizioni iniziali. Essendo le (2.15) del secondo ordine esse hanno
soluzione unica note le condizioni iniziali,

dy µ
y µ (0), (0) ≡ uµ (0).
ds

Per quanto riguarda y µ (0) osserviamo che, traslando il tempo iniziale, senza perdita di
generalità possiamo porre y 0 (0) = 0, mentre ~y (0) fa parte dei dati iniziali “fisici”, vedi
(2.16). Per quanto riguarda invece uµ (0), una volta assegnata la velocità iniziale ~v (0)
poniamo prima,
~v (0)
~u(0) = p ,
1 − v 2 (0)
e imponiamo poi il vincolo (2.17) all’istante s = 0,
p 1
u0 (0) = 1 + |~u(0)|2 = p .
1 − v 2 (0)

A questo punto le (2.15) determinano le y µ (s) in modo univoco, e il vincolo (2.17) è


automaticamente soddisfatto per ogni s. La legge oraria ~y (t) si ottiene infine usando
l’equazione y 0 (s) = t per determinare s come funzione di t, e sostituendo la funzione
risultante s(t) in ~y (s).
L’approccio covariante è molto conveniente quando il campo elettromagnetico ha una
forma analitica semplice, vedi per esempio il problema 2.7.

22
Approccio non covariante. In questo approccio si affronta la soluzione delle (2.15)
parametrizzando la linea di universo con il tempo,

y µ (t) = (t, ~y (t)),

con il vantaggio palese che non sono presenti gradi di libertà spuri. In questo caso abbiamo
ancora quattro equazioni differenziali del secondo ordine, ma le incognite sono solo le tre
funzioni ~y (t). Tuttavia, possiamo fare vedere che solo tre delle quattro equazioni (2.15)
sono funzionalmente indipendenti. Per fare questo definiamo il quadrivettore,

dpµ
Hµ ≡ − eF µν uν ,
ds

e scriviamo l’equazione di Lorentz nella forma,

H µ = 0.

Dalle (2.8)–(2.10) si ricavano facilmente le componenti spaziali e temporale di H µ ,


µ ³ ´¶
~ 1 d~p ~ ~
H = √ − e E + ~v × B ,
1 − v 2 dt

µ ¶
0 1 dε ~
H = √ − e ~v · E .
1 − v2 dt

A questo punto osserviamo che vale identicamente – anche senza usare la (2.15) –

~ = 0.
uµ H µ = u0 H 0 − ~u · H (2.18)

Infatti, in contrasto con l’approccio precedente, in questo caso la relazione uµ wµ = 0 è


un’identità, e vale ancora uµ uν F µν = 0. Ne discende che H 0 dipende funzionalmente da
~ essendo,
H
~
~u · H
H0 = ~
= ~v · H.
u0
La componente temporale dell’equazione di Lorentz, H 0 = 0, è allora automaticamente
~ = 0. È allora sufficiente
soddisfatta se sono soddisfatte le sue componenti spaziali, H
risolvere queste ultime che, essendo del secondo ordine nelle derivate temporali, assumono
a tutti gli effetti il ruolo di “equazione di Newton” per la particella,

d~p ³ ´
~ ~
= e E + ~v × B . (2.19)
dt
23
Dato F µν (x) e note le condizioni iniziali ~y (0), ~v (0), essa ammette soluzione unica per la
legge oraria ~y (t). La componente temporale dell’equazione di Lorentz corrisponde invece
alla legge della potenza,
dε ~
= e ~v · E, (2.20)
dt
ed è quindi conseguenza dell’equazione di Newton, esattamente come in fisica non relati-
vistica. Infine, nota ~y (t) la (2.4) fornisce s(t) e permette quindi di ricostruire y µ (s).
Concludiamo questo paragrafo insistendo sul significato preciso della (2.19), come
spiegato all’inizio di questo paragrafo,
à !
d m ~v (t) h i
p ~ ~y (t)) + ~v (t) × B(t,
= e E(t, ~ ~y (t)) . (2.21)
dt 1 − v(t)2

2.2.2 Identità di Bianchi

L’“identità” (2.13) nella nomenclatura comune costituisce “metà” delle equazioni di Max-
well, più precisamente quella metà che non lega il campo elettromagnetico alla corrente
ma ne vincola la forma. In effetti è facile trovare soluzioni semplici di questa equazione
in termini di un potenziale vettore Aµ , detto anche campo di Maxwell o campo di gauge,
ponendo,
Fµν = ∂µ Aν − ∂ν Aµ . (2.22)

Sostituendo in (2.13) si trova infatti,

εµνρσ ∂ν Fρσ = εµνρσ (∂ν ∂ρ Aσ − ∂ν ∂σ Aρ ) = 0, (2.23)

in quanto in entrambi i termini si contrae una coppia di indici simmetrici – quelli delle
derivate – con una coppia di indici antisimmetrici – quelli del tensore di Levi–Civita. Ma
usando i metodi della Geometria Differenziale si può dimostrare un risultato più forte: per
ogni campo tensoriale antisimmetrico Fµν soddisfacente l’equazione (2.13) esiste un campo
vettoriale Aµ , tale che Fµν possa essere scritto come in (2.22) 2 . La conclusione, forse
sorprendente, è che la (2.22) rappresenta la soluzione generale dell’identità di Bianchi.
2
Questo risultato è valido purché lo spazio–tempo considerato sia topologicamente banale, come per
esempio R4 .

24
Tuttavia, potenziali vettori diversi possono dare luogo allo stesso F µν . Infatti, dato
un campo scalare Λ qualsiasi si può definire un nuovo potenziale vettore,

A0µ = Aµ + ∂µ Λ, (2.24)

e si verifica immediatamente che vale,

0
Fµν = ∂µ A0ν − ∂ν A0µ = Fµν + ∂µ ∂ν Λ − ∂ν ∂µ Λ = Fµν ,

grazie alla commutatività delle derivate parziali. Le trasformazioni (2.24), che vengono
chiamate trasformazioni di gauge, lasciano quindi il tensore di Maxwell invariante.
In definitiva possiamo affermare che “l’identità” di Bianchi può essere risolta identica-
mente in termini di un potenziale vettore, ma che il potenziale vettore stesso è determinato
solo modulo una trasformazione di gauge. Schematicamente abbiamo,

εµνρσ ∂ν Fρσ = 0 ⇐⇒ Fµν = ∂µ Aν − ∂ν Aµ , con Aµ ≈ Aµ + ∂µ Λ. (2.25)

La nostra strategia per affrontare il sistema (2.12)–(2.14) sarà – nella maggior parte dei
casi – di considerare risolta l’identità di Bianchi in termini di Aµ , rimanendo quindi con
le equazioni (2.12) e (2.14) nelle incognite yrµ e Aµ .
~ in notazione tridimensionale le (2.22) corri-
Ricordiamo che, ponendo Aµ = (A0 , A),
spondono alle relazioni note,
~
E ~ 0 − ∂A ,
~ = −∇A ~ =∇
B ~ × A.
~ (2.26)
∂t

2.2.3 Equazione di Maxwell

L’equazione (2.14) è da considerarsi come la vera e propria equazione del moto per il campo
elettromagnetico, in quanto lega F µν alla quadricorrente elettrica. Questa equazione
quantifica quindi il modo in cui la corrente genera il campo. Ricordiamo che l’equazione è
consistente con l’equazione di continuità della corrente, ∂ν j ν = 0, grazie all’antisimmetria
del tensore di Maxwell, che implica l’identità,

∂ν ∂µ F µν = 0.

Come abbiamo appena osservato, una volta risolta l’identità di Bianchi secondo la
(2.22), l’equazione di Maxwell diventa in realtà un’equazione per il potenziale vettore.

25
Avremmo quindi quattro equazioni differenziali alle derivate parziali del secondo ordine,
nelle quattro incognite Aµ . Tuttavia, questo conteggio è solo parzialmente significativo,
per due motivi: primo, le componenti del potenziale vettore non sono tutte “fisiche” in
quanto soggette alle trasformazioni di gauge; infatti, potenziali vettori diversi possono cor-
rispondere agli stessi campi elettrici e magnetici, ma sono solo questi ultimi a poter essere
osservati sperimentalmente. Secondo, le quattro componenti dell’equazione di Maxwell
non sono funzionalmente indipendenti. Per vederlo definiamo,

Gν ≡ ∂µ F µν − j ν ,

e scriviamo le equazione di Maxwell nella forma Gν = 0. Grazie alle identità ricordate


poc’anzi è poi immediato vedere che le Gν soddisfano identicamente il vincolo,

∂ν Gν = 0 ⇒ ~ · G.
∂0 G0 = −∇ ~ (2.27)

La derivata della componente temporale dell’equazione di Maxwell è quindi legata alle


sue componenti spaziali. Tuttavia, questo vincolo non è di tipo algebrico – non coinvolge
direttamente le equazioni del moto ma le loro derivate – e quindi non è immediato indi-
viduare le equazioni indipendenti. Risolveremo questo problema più avanti, nell’ambito
della formulazione del problema di Cauchy per il campo elettromagnetico, quando avremo
a disposizione i mezzi per affrontarlo. Concludiamo questa sezione con qualche ulteriore
commento sul sistema (2.12)–(2.14).
Sui gradi di libertà del campo elettromagnetico. Daremo una definizione precisa di ciò
che intendiamo con i “gradi di libertà” associati a un generico campo ϕ(x) in sezione 5.1,
dove analizzeremo anche a fondo i gradi di libertà del campo elettromagnetico. Quali-
tativamente possiamo dire che con i gradi di libertà di un sistema fisico si intendono le
variabili indipendenti necessarie per descriverne la dinamica. In particolare si richiede
che le equazioni del moto siano in grado di determinare il loro valore a un istante ge-
nerico, assegnati certi dati iniziali. Possiamo svolgere un’analisi preliminare dei gradi di
libertà contenuti nel campo elettromagnetico, se partiamo dalle (2.13), (2.14) riscritte nel
consueto formalismo tridimensionale,
~
∂E
− ~ ×B
+∇ ~ = ~j, (2.28)
∂t
26
~
∂B ~ ×E
+∇ ~ = 0, (2.29)
∂t
~ ·E
∇ ~ = j 0, (2.30)
~ ·B
∇ ~ = 0. (2.31)

~ ~x) e B(t,
Le (2.28), (2.29) costituiscono sei equazioni nelle sei funzioni incognite E(t, ~ ~x),
~ eB
che coinvolgono le derivate prime di E ~ rispetto al tempo: esse vanno quindi considerate

come equazioni dinamiche. Queste equazioni ammettono infatti soluzione unica, note le
~ ~x), B(0,
sei condizioni iniziali E(0, ~ ~x). Al contrario, le due equazioni scalari (2.30) e (2.31)

non contengono derivate temporali e vanno quindi considerate come vincoli, piuttosto che
come equazioni dinamiche. In particolare, le sei condizioni iniziali non possono essere
assegnate arbitrarimente, perché esse sono soggette ai vincoli (2.30), (2.31),

~ · E(0,
∇ ~ ~x) = j 0 (0, ~x),

~ · B(0,
∇ ~ ~x) = 0.

All’istante t = 0 è quindi sufficiente assegnare 6 − 2 = 4 componenti del campo elet-


tromagnetico, in quanto a quello stesso istante le rimanenti due componenti risultano
determinate in termini delle altre quattro. A questo punto non è difficile dimostrare
che, se le equazioni (2.28), (2.29) sono soddisfatte per qualsiasi t, e le (2.30), (2.31) so-
no soddisfatte all’istante t = 0, allora queste ultime sono automaticamente soddisfatte
per qualsiasi t, vedi problema 2.11. Ci aspettiamo quindi che il campo elettromagnetico
corrisponda non a sei, ma solo a quattro “gradi di libertà fisici del primo ordine”.
Sulle soluzioni del sistema (2.12)–(2.14) . L’insieme di queste equazioni costituisce un
sistema di equazioni differenziali non lineari fortemente accoppiate che, eccetti casi raris-
simi, non è risolubile esattamente: la forma dei campi determina il moto delle particelle
secondo le (2.12), e i campi a loro volta sono determinati dal moto delle particelle secondo
le (2.14), e dalle (2.13). Tuttavia, in molte situazioni fisiche il problema può essere ridotto
difatti a considerare una delle due seguenti situazioni, in cui le equazioni si disaccoppiano:
I) É dato un campo elettromagnetico “esterno” nel vuoto, soddisfacente, cioè, le (2.13)
e (2.14) con j µ = 0. Esempi sono un campo elettromagnetico costante e uniforme in
una certa regione dello spazio, come quello tra le due paratie di un condensatore, oppure

27
un’onda elettromagnetica piana di frequenza e ampiezza data. In molti casi si chiede di
determinare il moto di una particella carica sottoposta a un tale campo. Questo problema
si riconduce allora alla soluzione delle sole equazioni (2.12) nelle incognite yrµ .
II) È assegnato il moto di una particella carica, oppure di più particelle cariche, e si chie-
de di determinare il campo elettromagnetico creato da questo sistema di cariche in moto.
Questo problema riguarda solamente le equazioni (2.13) e (2.14) che, come vedremo,
possono essere risolte esattamente, in termini dei celebri potenziali di Lienard–Wiechert.
In entrambi i casi, però, bisogna tenere presente che la dinamica vera del sistema è
governata dall’intero set di equazioni (2.12)–(2.14), e che si sta considerando soltanto una
schematizzazione della situazione fisica reale, la cui validità deve essere valutata caso per
caso.
In astratto la strategia da seguire per risolvere il sistema delle equazioni fondamentali
dell’Elettrodinamica, e che in linea di principio seguiremo anche noi in questo testo, è la
seguente. Risolta l’identità di Bianchi in termini di un potenziale vettore Aµ , si trova la
soluzione esatta dell’equazione di Maxwell per Aµ – e quindi per F µν – in termini delle
traiettorie generiche yrµ . Dopodichè si sostituisce il campo F µν cosı̀ trovato nelle equazioni
di Lorentz, che diventano quindi delle equazioni non locali, ma chiuse, nelle sole incognite
yrµ . Risolte queste equazioni si possono sostituire le yrµ risultanti in F µν , per ottenere
infine il campo elettromagnetico come funzione delle sole x.
Come menzionato sopra questo programma raramente può essere portato a termine in
modo esplicito, per via delle difficoltà tecniche coinvolte. Ma vedremo, per di più, che nel
corso della sua attuazione emergeranno anche difficoltà concettuali – causati dalla natura
puntiforme delle particelle cariche – che minano irrimediabilmente la consistenza interna
dell’Elettrodinamica classica. In altre parole, vedremo l’Elettrodinamica classica entrare
in contraddizione con se stessa. D’altra parte da un punto di vista sperimentale questa
teoria descrive tutti i fenomeni elettromagnetici classici con estrema precisione: teoria ed
esperimento sono in perfetto accordo. Resterà quindi da spiegare come mai le inconsi-
stenze interne della teoria non si manifestano anche a livello sperimentale. Vedremo, per
l’appunto, che è facile predisporre esperimenti in cui queste inconsistenze si tradurreb-
bero in fenomeni fisicamente osservabili. Tuttavia, vedremo anche che questi fenomeni

28
occorrerebbero su scale spazio–temporali alle quali gli effetti quantistici non possono più
essere trascurati. A queste scale l’Elettrodinamica classica perde quindi la sua validità
fenomenologica, ed essa deve essere sostituita dalla Teoria Quantistica di Campo. In
altri termini: sono proprio gli effetti quantistici a mascherare le inconsistenze interne
dell’Elettrodinamica classica – rendendole inosservabili.
Sulle cariche elettriche. Per il momento abbiamo tacitamente assunto che le cariche
elettriche delle particelle costituiscano un arbitrario insieme di costanti {er }. Siamo con-
fortati in questa ipotesi dal fatto che – per quanto riguarda le analisi svolte finora sul
sistema (2.12)–(2.14) – non abbiamo incontrato nessuna inconsistenza: questo sistema di
equazioni sembra consistente qualsiasi siano i valori delle er . A questo proposito possia-
mo, però, anche notare che le cariche elettriche entrano nelle equazioni fondamentali in
due modi diversi: nelle equazioni di Lorentz, e nell’equazione di Maxwell attraverso la
corrente. È evidente che a priori non c’è nessun motivo per cui i due insiemi di cariche
siano identici. Potremmo, cioè, usare nelle equazioni di Lorentz le cariche {er }, e nella
definizione della corrente (2.6) un insieme diverso {e∗r }, e le equazioni fondamentali man-
terrebbero tutte le buone proprietà discusse finora. Rimane allora da capire cosa ci ha
spinto a identificare questi due insiemi di cariche fin dall’inizio. Un’indicazione cruciale
che ci aiuta a rispondere a questa domanda viene dal limite non relativistico. Consideria-
mo in questo limite due particelle con cariche (e1 , e∗1 ) e (e2 , e∗2 ), e chiamiamo ~r il raggio
vettore che congiunge la particella 1 alla particella 2. Allora dall’equazione di Maxwell
(2.30) ci possiamo calcolare il campo elettrico quasi–statico creato dalla particella 1 nel
punto in cui si trova la particella 2, e viceversa,
∗ ∗
~ 2 = e1 ~r ,
E ~ 1 = − e2 ~r ,
E
4π r3 4π r3

mentre nel limite non relativistico i campi magnetici possono essere trascurati. In questo
limite le equazioni di Lorentz (2.19) ci danno allora per la forza F~12 esercitata dalla
particella 1 sulla particella 2, e viceversa,
∗ ∗
~ 2 = e2 e1 ~r ,
F~12 = e2 E ~ 1 = − e1 e2 ~r .
F~21 = e1 E
4π r3 4π r3

Si vede quindi che la terza legge di Newton, ovverosia il principio di azione e reazione

29
F~12 = −F~21 , che è un postulato fondamentale della Meccanica Newtoniana, vale solo se,

e1 e2

= ∗.
e1 e2

Ripetendo questo ragionamento per un’arbitraria coppia di particelle si conclude che la


validità della terza legge di Newton richiede che il rapporto er /e∗r sia una costante uni-
versale, che può essere posta uguale all’unità riscalando il campo elettromagnetico e le
cariche. Si ottiene cosı̀,
er = e∗r .

A livello non relativistico l’origine di questa identificazione risiede dunque nel principio
di azione e reazione. D’altra parte, sempre a livello non relativistico questo principio è
equivalente alla conservazione della quantità di moto totale di un sistema isolato,

d
(~p1 + p~2 ) = F~21 + F~12 = 0.
dt

A livello relativistico dobbiamo allora aspettarci che l’identificazione dei due tipi di carica
venga imposta dalla richiesta di conservazione del quadrimomento totale, in particolare
dell’energia. Nella sezione 2.4 vedremo in effetti che questo è ciò che succede.

2.3 La natura distribuzionale del campo elettromagnetico

Abbiamo già fatto notare che le componenti della quadricorrente j µ non sono funzioni,
bensı̀ distribuzioni, supportate sulle linee di universo delle particelle. Dall’equazione di
Maxwell (2.14) si deduce allora che le componenti di F µν non possono essere “funzioni
derivabili” lungo le linee di universo, perché altrimenti anche le componenti del quadri-
vettore ∂µ F µν sarebbero funzioni. Traiamo allora le seguente conclusioni: I) il tensore
F µν è necessariamente singolare lungo le linee di universo, e vedremo che la singolarità
in questione è del tipo 1/r2 , se r indica la distanza spaziale dalla linea di universo; II)
l’equazione di Maxwell (2.14) non ha senso come equazione differenziale nello spazio delle
funzioni, mentre essa sarà perfettamente ben definita se la consideriamo come equazione
differenziale nello spazio delle distribuzioni temperate S 0 (R4 ) 3 .
3
In ultima analisi il ruolo della (2.14) è unicamente quello di qualificare le singolarità di F µν lungo
le linee di universo, visto che nel loro complemento la corrente si annulla, e quindi ivi vale banalmente
∂µ F µν = 0.

30
In questa nuova ottica le componenti di F µν andranno dunque considerate come ele-
menti di S 0 (R4 ), e le derivate che compaiono nella (2.14) andranno considerate come
derivate nel senso delle distribuzioni. Per consistenza allora anche l’identità di Bianchi
(2.13) deve essere riguardata come equazione differenziale in S 0 (R4 ). Si noti che questa
reinterpretazione delle due equazioni di Maxwell come equazioni differenziali nello spazio
delle distribuzioni è consistente, perché esse sono lineari in F µν .
Una volta che abbiamo dato un significato matematico preciso alle equazioni di Max-
well e Bianchi possiamo chiederci se ora anche l’equazione di Lorentz risulta ben definita.
È immediato vedere che la risposta a questa domanda è negativa. Infatti, nelle (2.12)
compare F µν (yr ), cioè il campo elettromagnetico valutato proprio sulla traiettoria del-
la particella, luogo dove esso è singolare: le quantità F µν (yr ) sono quindi divergenti e
l’equazione di Lorentz è mal definita. L’interpretazione fisica di questa patologia è che
l’interazione della particella con il campo elettromagnetico da essa stessa creata – l’au-
tointerazione – è di intensità infinita. Si intuisce facilmente che la causa prima di questa
divergenza “ultravioletta”, dovuta cioè alle leggi che determinano la fisica a piccole distan-
ze, è proprio la natura puntiforme delle particelle cariche, come anticipato nel paragrafo
precedente.
Nel capitolo 12 discuteremo possibili soluzioni pragmatiche al problema dell’autointe-
razione infinita, ma nessuna di queste risulterà soddisfacente dal punto di vista teorico,
se ci si confina all’ambito dell’Elettrodinamica classica.

2.3.1 Lo spazio delle distribuzioni

Prima di illustrare con qualche esempio il significato – e la necessità – di questa nuova


interpretazione delle leggi dell’Elettrodinamica, ricordiamo qualche elemento operativo
della teoria delle distribuzioni (temperate) in uno spazio di dimensione arbitraria.
Distribuzioni e funzioni di test. In D dimensioni lo spazio delle funzioni di test S ≡
S(RD ) è lo spazio vettoriale delle funzioni complesse ϕ(x) di classe C ∞ , che all’infinito de-
crescono insieme a tutte le loro derivate più rapidamente dell’inverso di qualsiasi potenza.
Devono, cioè, essere finite tutte le “seminorme”,

||ϕ||P,Q ≡ sup x∈RD |P(x)Q(∂)ϕ(x)| , (2.32)

31
dove con P intendiamo un generico monomio nelle xµ e con Q un generico monomio nelle
derivate parziali ∂µ . Per quanto riguarda la topologia di cui si dota S si rimanda a un
testo di Metodi Matematici. Lo spazio delle distribuzioni S 0 ≡ S 0 (RD ) è allora definito
come l’insieme dei funzionali F che sono lineari e continui su S,

F : S → C,

ϕ → F (ϕ). (2.33)

Una generica distribuzione F ∈ S 0 è completamente determinata dai valori F (ϕ) che essa
assume quando viene applicata a una generica funzione di test ϕ ∈ S. Ricordiamo ora un
teorema che è di grande utilità pratica quando si tratta di stabilire se un dato funzionale
lineare su S risulta continuo.
Teorema: un funzionale lineare F su S è continuo, cioè, appartiene ad S 0 , se e solo se esso
può essere maggiorato da una somma finita di seminorme di ϕ, vale a dire,
X
|F (ϕ)| ≤ CP,Q ||ϕ||P,Q , ∀ ϕ ∈ S, (2.34)

per opportune costanti positive CP,Q indipendenti da ϕ.


Un’importante classe di distribuzioni è quella costituita dalle distribuzioni regolari,
ovvero dalle distribuzioni che sono rappresentate da funzioni. Si dice che una distribuzione
F è rappresentata dalla funzione f (x) da RD in C quando si ha,
Z
F (ϕ) = f (x) ϕ(x) dD x.

Sfruttando il teorema di cui sopra è allora facile dimostrare che rappresentano distribu-
zioni regolari in particolare tutte le funzioni limitate, e tutte le funzioni con singolarità
integrabili, che divergono all’infinito al massimo come qualche potenza, vedi problema 2.4.
Ricordiamo inoltre che in generale le distribuzioni non si possono moltiplicare o divi-
dere tra di loro, e che il valore di una distribuzione F in un punto x in generale non è una
quantità ben definita. Tuttavia, certe proprietà delle distribuzioni risultano di “accesso
immediato” se si ricorre alla notazione “simbolica”, vale a dire se si introduce formalmente
la quantità F (x). In notazione simbolica scriveremo per esempio,
Z
F (ϕ) = F (x) ϕ(x) dD x.

32
2.3.2 Operazioni sulle distribuzioni

Le operazioni che presentiamo di seguito si riferiscono a distribuzioni F che operano su


funzioni di test ϕ appartenenti ad S, ma in molti casi queste operazioni mantengono
la loro validità anche quando le distribuzioni vengono applicate a funzioni molto meno
regolari di quelle appartenenti a S.
Derivate di distribuzioni. Ogni elemento F ∈ S 0 ammette derivate parziali ∂µ F ∈ S 0 ,
definite da,
(∂µ F )(ϕ) = −F (∂µ ϕ). (2.35)

Dalla definizione segue immediatamente che le derivate parziali nel senso delle distribu-
zioni commutano sempre,
∂µ ∂ν F = ∂ν ∂µ F.

La valutazione esplicita della derivata di una distribuzione F è facilitata se in un sottoin-


sieme B di RD essa può essere rappresentata da una funzione di classe C ∞ . In questa
regione la derivata può essere calcolata semplicemente nel senso delle funzioni, e il calcolo
della derivata di F è ridotto essenzialmente alla determinazione di ∂µ F nel complemento
di B, che è il luogo dove F è singolare. Siccome le singolarità delle distribuzioni con cui
avremo a che fare costituiscono sempre insiemi di misura nulla, questa strategia si rivelerà
molto efficace.
Convoluzione. La convoluzione F ∗ ϕ tra una distribuzione F e una funzione di test ϕ
è una distribuzione che in notazione simbolica è data da,
Z
(F ∗ ϕ)(x) = F (x − y) ϕ(y) dD y.

Per le sue derivata si ha,

∂µ (F ∗ ϕ) = ∂µ F ∗ ϕ = F ∗ ∂µ ϕ.

Se anche F ∈ S si ha inoltre F ∗ ϕ = ϕ ∗ F .
Funzione–δ di Dirac unidimensionale. La distribuzione di Dirac unidimensionale δa
supportata in x = a, con a ∈ R, è l’elemento di S 0 (R) definito da δa (ϕ) = ϕ(a), per
ogni ϕ ∈ S(R). Essa al solito viene rappresentata dalla funzione simbolica δ(x − a) che

33
soddisfa,
Z
δ(x − a) ϕ(x) dx = ϕ(a).

La δ di Dirac gode di alcune importanti proprietà che ora elencheremo usando la notazione
simbolica. Per la sua derivata n–esima si ha,
Z n n
d nd ϕ
δ(x − a) ϕ(x) dx = (−) (a).
dxn dxn

Per ogni f ∈ OM (R) – l’insieme delle funzioni C ∞ su R polinomialmente limitate insieme


a tutte le loro derivate – si ha poi,

f (x) δ(x − a) = f (a) δ(x − a). (2.36)

Questa relazione comporta alcune semplici identità, come per esempio,

d d
x δ(x) = 0, x2 δ(x) = 0, x δ(x) = −δ(x), etc.
dx dx

Queste identità si dimostrano facilmente usando la regola di Leibnitz, valida per prodotti
del tipo f F , con f ∈ OM (R) e F ∈ S 0 (R). Se c è un numero reale diverso da zero vale
anche,
δ(x − a)
δ(c (x − a)) = .
| c|
Data una funzione reale f (x), in certe condizioni resta definita anche l’espressione δ(f (x)).
Puı̀ precisamente, se f è derivabile e ha un numero finito di zeri {xn } tali che le derivate
prime f 0 (xn ) sono tutte diverse da zero, si definisce,
X δ(x − xn )
δ(f (x)) = . (2.37)
n
|f 0 (xn )|

L’origine di questa definizione diventa evidente se si applicano entrambi i membri a una


funzione di test, e se nell’integrale risultante a primo membro si esegue formalmente
il cambiamento di variabile x → y = f (x). Un caso che incontreremo di frequente
corrisponde alla funzione f (x) = x2 − a2 , a 6= 0, per cui la (2.37) dà,

1
δ(x2 − a2 ) = (δ(x − a) + δ(x + a)) . (2.38)
2|a|

Dalla definizione della convoluzione data sopra segue inoltre che si ha,

δ ∗ ϕ = ϕ,

34
per ogni ϕ ∈ S.
Funzione–δ di Dirac quadridimensionale. La distribuzione di Dirac si generalizza im-
mediatamente a uno spazio di dimensione arbitraria. Per definitezza, e in vista dell’uso
che ne faremo in seguito, quı̀ presentiamo il caso quadridimensionale.
Dato un quadrivettore aµ la distribuzione di Dirac δa , supportata in xµ = aµ , è l’ele-
mento di S 0 (R4 ) definito da δa (ϕ) = ϕ(a), per ogni ϕ ∈ S(R4 ). Essa viene rappresentata
dall’espressione simbolica,

δ 4 (x − a) = δ(x0 − a0 ) δ 3 (~x − ~a) = δ(x0 − a0 )δ(x1 − a1 )δ(x2 − a2 )δ(x3 − a3 ), (2.39)

e si scrive,
Z
δa (ϕ) = δ 4 (x − a) ϕ(x) d4 x = ϕ(a).

Per le sue derivate si ottiene,

(∂µ δa )(ϕ) = −δa (∂µ ϕ) = −∂µ ϕ(a),

che in notazione simbolica si scrive come,


Z
∂µ δ 4 (x − a) ϕ(x) d4 x = −∂µ ϕ(a).

Per ogni f ∈ OM (R4 ) si ha poi,

f (x) δ 4 (x − a) = f (a) δ 4 (x − a).

In questo caso da questa relazione seguono le identità,

xµ δ 4 (x) = 0, xµ xν ∂ρ δ 4 (x) = 0, xµ ∂ν δ 4 (x) = −δνµ δ 4 (x), etc.

Se Cµ ν è una qualsiasi matrice 4 × 4 invertibile si ha inoltre,

δ 4 (x − a)
δ 4 (C(x − a)) = .
| det C|

La quadricorrente in notazione tridimensionale. Per illustrare l’uso della δ di Dirac


come funzione simbolica deriviamo la forma tridimensionale della quadricorrente j µ di un
sistema di particelle, vedi (2.6). A questo scopo esplicitiamo l’integrale r–esimo in (2.6),

35
scegliendo come variabile di integrazione la coordinata temporale della particella r–esima,
cioè, λr = yr0 . Usando la (2.39) si ottiene,
X Z X Z
µ dyrµ (yr0 ) 4 0 0 dyrµ (yr0 )
j (x) = er δ (x−yr (yr )) dyr = er δ(t−yr0 ) δ 3 (~x−~yr (yr0 )) dyr0 .
r γr dyr0 r γr dyr0

A questo punto si può eseguire l’integrale della δ(t − yr0 ) in dyr0 , considerando il resto
dell’integrando come una “funzione di test”, la quale va quindi valutata in yr0 = t. Si
ottiene,
X dyrµ (t) 3
j µ (t, ~x) = er δ (~x − ~yr (t)),
r
dt
dove è sottinteso che yr0 (t) = t. Scrivendo separatamente parte temporale e parte spaziale
si ottengono rispettivamente la densità di carica e la densità di corrente spaziale,
X
j 0 (t, ~x) = er δ 3 (~x − ~yr (t)), (2.40)
r
X
~j(t, ~x) = er ~vr (t) δ 3 (~x − ~yr (t)). (2.41)
r

Distribuzioni con supporto in un punto. Completiamo l’elenco delle proprietà della δ


di Dirac enunciando un teorema che vincola fortemente la forma di una distribuzione che
è “diversa da zero” solo in un insieme finito di punti, vale a dire il cui supporto è costituito
da un insieme finito di punti.
Teorema: Una distribuzione F ∈ S 0 (RD ) il cui supporto è costituito dal punto xµ = aµ ,
è necessariamente una combinazione lineare finita della δ D (x − a) e delle sue derivate.
Avremo, cioè,

F = c δ D (x − a) + cµ ∂µ δ D (x − a) + · · · + cµ1 ···µn ∂µ1 · · · ∂µn δ D (x − a), (2.42)

dove i cµ1 ···µk sono coefficienti costanti. Se il supporto di una distribuzione è invece co-
stituito da un insieme finito di punti, essa è data da una somma di espressioni del tipo
(2.42). Come vedremo questo teorema risulterà molto utile nella soluzione di equazioni
algebriche per distribuzioni.
Trasformata di Fourier di una distribuzione. La trasformata di Fourier costituisce una
biiezione di S in se stesso ed, opportunamente estesa, di S 0 in se stesso. Indicheremo la
trasformata di Fourier di un generico elemento ϕ ∈ S con ϕ,
b e analogamente quella di un

36
generico elemento F ∈ S 0 con Fb. Nello spazio–tempo di Minkowski quadridimensionale
per una generica funzione di test si ha,
Z Z
1 4 −ik·x 1
ϕ(k)
b = d xe ϕ(x), ϕ(x) = d4 k eik·x ϕ(k),
b
(2π)2 (2π)2

dove abbiamo introdotto le quattro variabili duali k ≡ k µ e definito k · x ≡ k µ xν ηµν . Si


noti che, strettamente parlando, per quanto riguarda la variabile ~x la nostra definizione
corrisponde in realtà all’antitrasformata di Fourier. La trasformata di Fourier di una
distribuzione è allora definita da,

Fb(ϕ) = F (ϕ),
b ∀ ϕ ∈ S.

Da questa definizione segue facilmente che in notazione simbolica si ha,


Z Z
1 1
Fb(k) = 4
d xe −ik·x
F (x), F (x) = d4 k eik·x Fb(k),
(2π)2 (2π)2

ma insistiamo sul fatto che questi integrali sono da intendersi come tali solo se la distri-
buzione F è sufficientemente regolare.
Per le derivate e la moltiplicazione per una coordinata si ha,

∂ b
∂d b
µ F (k) = i kµ F (k), xd
µ F (k) = i F (k),
∂kµ

con ovvie estensioni alla trasformata di Fourier di un generico polinomio in xµ e ∂ν ,


applicato a F . Ricordiamo in particolare le trasformate della δ 4 e delle sue derivate,

1 ikµ
δ[
4 (x)(k) = , ∂\ 4
µ δ (x)(k) = .
(2π)2 (2π)2

Per concludere riportiamo la formula per la trasformata di Fourier della convoluzione


tra un elemento F di S 0 e un elemento ϕ di S. In uno spazio a dimensione D in notazione
simbolica si ha,
\
F ∗ ϕ (k) = (2π)D/2 Fb(k) ϕ(k).
b

2.3.3 Identità di Bianchi e forme differenziali

Una volta assodato che le equazioni per il campo elettromagnetico devono essere formulate
nello spazio delle distribuzioni è opportuno riesaminarle in questo nuovo ambito. In questo

37
paragrafo rianalizzeremo l’identità di Bianchi (2.13) e la sua soluzione generale (2.22),
mentre nel prossimo paragrafo ci dedicheremo all’equazione di Maxwell.
Come ora sappiamo le componenti di F µν non sono derivabili ovunque – come funzioni
– e le derivate ∂ν Fρσ che compaiono nella (2.13) vanno eseguite nel senso delle distribuzioni.
Si ripresenta allora la domanda se l’espressione Fµν = ∂µ Aν − ∂ν Aµ è ancora soluzione
dell’identità di Bianchi, ovverosia, se il calcolo formale eseguito in (2.23) è ancora valido.
Se vogliamo dare senso a questa domanda, come prima cosa dobbiamo considerare anche
le componenti di Aµ come distribuzioni. A questo punto la correttezza del risultato (2.23)
– indipendentemente dalla presenza o meno di singolarità in Aµ , purché di carattere
distribuzionale – segue semplicemente dal fatto che le derivate nel senso delle distribuzioni
commutano.
Per dimostrare il viceversa, cioè, che in S 0 (R4 ) ogni soluzione di (2.13) può essere
scritta nella forma (2.22), conviene fare uso di un formalismo che viene introdotto in
Geometria Differenziale 4 , più precisamente il formalismo delle “p–forme differenziali a
valori nello spazio delle distribuzioni”. Questi oggetti geometrici – che vengono chiamati
anche più semplicemente “p–forme” – sono essenzialmente tensori di rango (0, p) comple-
tamente antisimmetrici a valori in S 0 (R4 ). L’analisi che segue, non essendo indispensabile
per la comprensione del resto del testo, è rivolta a coloro che sono familiari con questo
formalismo.
Nel linguaggio delle forme al tensore antisimmetrico F µν resta associata la due–forma,

1 ν
F = dx ∧ dxµ Fµν . (2.43)
2

Ricordiamo poi che sull’algebra delle forme è definito l’operatore “differenziale esterno”
d, che associa a una p–forma una (p + 1)–forma, e risulta nihilpotente, cioè soddisfa,

d2 = 0.

Nell’ambito delle forme a valori nelle distribuzioni questa proprietà è conseguenza diretta
del fatto che le derivate parziali nel senso delle distribuzioni commutano sempre. Per
4
Un testo che presenta la Geometria Differenziale con particolare riferimento alle sue applicazioni in
fisica, compreso il linguaggio delle forme differenziali, è “Analysis, Manifolds and Physics”, di Yvonne
Choquet–Bruhat, Cecile DeWitt–Morette e Margaret Dillard–Bleick, ed. North–Holland, Amsterdam,
1982.

38
definizione il differenziale esterno di F è la tre–forma,

1 ν
dF = dx ∧ dxµ ∧ dxρ ∂[ρ Fµν] .
2

L’identità di Bianchi è allora equivalente alla richiesta che F sia una forma chiusa, cioè,
che valga dF = 0. Infatti, vedi problema 2.2,

dF = 0 ⇔ ∂[ρ Fµν] = 0.

Siccome F è una forma chiusa, secondo il Lemma di Poincaré nello spazio delle forme a
valori nelle distribuzioni, essa è anche esatta 5 . Esiste, cioè, una uno–forma A = dxν Aν a
valori nelle distribuzioni tale che,
F = dA. (2.44)

Esplicitando il differenziale si ottiene,

1 ν
F = dx ∧ dxµ Fµν = d(dxν Aν ) = dxν ∧ dxµ ∂[µ Aν] ,
2

e quindi,
Fµν = 2∂[µ Aν] = ∂µ Aν − ∂ν Aµ ,

che corrisponde alla (2.22). D’altra parte, dato che l’operatore d è nihilpotente la uno–
forma A data in (2.44) è a sua volta definita modulo uno–forme esatte,

A ≈ A + dΛ, (2.45)

dove Λ è una zero–forma, ovverosia un campo scalare. Siccome dΛ = dxµ ∂µ Λ la (2.45) si


traduce in,
Aµ ≈ Aµ + ∂µ Λ,

cosicchè ritroviamo che il potenziale vettore è definito modulo una trasformazione di


gauge. In conclusione, nel linguaggio delle forme differenziali le relazioni (2.25) si scrivono
semplicemente,
dF = 0 ⇐⇒ F = dA, con A ≈ A + dΛ.
5
Nello spazio delle forme differenziali a valori in S 0 (RD ) il lemma di Poincaré asserisce che ogni forma
chiusa è anche esatta. Questo è essenzialmente dovuto al fatto che lo spazio RD è topologicamente banale.

39
Si vede che da un lato il formalismo delle forme differenziali è utile perché fornisce
una notazione compatta che evita di indicare esplicitamente gli indici; dall’altro lato
nell’ambito della teoria delle distribuzioni esso permette di definire le componenti delle p–
forme “globalmente” – vale a dire in tutto R4 – anche in presenza di singolarità. Notiamo,
tuttavia, che questo formalismo non si applica a tensori che non sono completamente
antisimmetrici.

2.3.4 Il campo elettromagnetico della particella statica

La necessità di considerare le equazioni che governano la dinamica del campo elettroma-


gnetico nello spazio delle distribuzioni, emerge molto chiaramente dal semplice esempio
di una particella statica. Per questo motivo analizzeremo ora in dettaglio questo caso.
Ad una particella statica nell’origine corrisponde la linea di universo, y 0 (t) = t, ~y (t) =
0, e quindi ~v (t) = 0. Secondo le (2.40) e (2.41) ad essa corrisponde la quadricorrente,

j 0 (t, ~x) = e δ 3 (~x), ~j(t, ~x) = 0.

In questo caso sappiamo che il campo magnetico è nullo,

~ = 0,
B

e che il campo elettrico è statico. L’equazione di Maxwell e l’identità di Bianchi si riducono


allora rispettivamente a,

~ ·E
∇ ~ = e δ 3 (~x), ~ ×E
∇ ~ = 0, (2.46)

vedi (2.28)–(2.31). Come è noto la soluzione di questo sistema di equazioni dovrebbe


essere data dal campo coulombiano,

~ ~x) = e ~x ,
E(t, r = |~x|, (2.47)
4π r3

affermazione che ora rianalizzeremo criticamente.


~ nel senso delle funzioni. Dato
Come analisi preliminare ci calcoliamo le derivate di E
che ∂i r = xi /r, per ~x 6= 0 si ottiene facilmente,
µ ¶
j e ij xi xj
∂i E = δ −3 2 . (2.48)
4πr3 r

40
L’identità di Bianchi sarebbe quindi soddisfatta in quanto ∂i E j − ∂j E i = 0, mentre
l’equazione di Maxwell sarebbe violata, perché si otterrebbe ∂i E i = 0 ! L’errore sta
~ che l’operator ∂i nello spazio delle funzioni.
evidentemente nell’avere considerato sia E
Rianalizziamo dunque il problema nello spazio di distribuzioni S 0 ≡ S 0 (R3 ), appro-
priato per il caso statico. Come prima cosa dobbiamo domandarci se le componenti E i
del campo elettrico (2.47) appartengono effettivamente ad S 0 . La risposta è affermativa
~ ha solo una singolarità integrabile in ~x = 0, e all’infinito è limitato da una
in quanto E
costante, vedi problema 2.4. Le derivate ∂i E j sono allora ben definite in S 0 , ma esse vanno
– per l’appunto – calcolate nel senso delle distribuzioni, vale a dire applicando la (2.35).
Presentiamo prima i calcoli spiegando i passaggi intermedi di seguito,
Z Z
j j e 3xj e xj
(∂i E )(ϕ) = −E (∂i ϕ) = − d x 3 ∂i ϕ = − lim d3 x ∂i ϕ
4π r 4π ε→0 r> ε r3

Z · µ j ¶ µ j¶ ¸
e 3 x x
= − lim d x ∂i 3
ϕ − ∂i ϕ
4π ε→0 r> ε r r3

·Z Z µ ¶ ¸
e i j 1 3 ij xi xj
= lim dΩ n n ϕ + dx 3 δ −3 2 ϕ
4π ε→0 r=ε r>ε r r

Z µ ¶
e ij e 1
3 ij xi xj
= δ ϕ(0) + dx 3 δ −3 2 ϕ. (2.49)
3 4π r r

Spieghiamo ora i passaggi. L’integrando della prima riga appartiene a L1 (R3 ), e cosı̀
possiamo eseguire l’integrale introducendo una successione invadente qualsiasi. Abbiamo
usato la successione invadente Vε = R3 \Sε , dove Sε è la palla di raggio ε centrata nel-
l’origine. Siccome in Vε l’integrando è di classe C ∞ abbiamo poi potuto usare il calcolo
differenziale standard. Nella seconda riga abbiamo cosı̀ usato la regola di Leibnitz e nella
terza il teorema di Gauss. Il bordo di Vε è costituito dalla sfera all’infinito, che non dà
contributo al flusso perché ϕ svanisce all’infinito più rapidamente dell’inverso di qualsiasi
potenza, e dalla sfera di raggio ε centrata nell’origine. Per valutare l’integrale su questa
sfera abbiamo usato coordinate polari ~x ↔ (r, Ω), con Ω = (φ, ϑ) e dΩ ≡ senϑ dϑ dφ,
e introdotto il versore radiale uscente ni = xi /ε. L’elemento di superficie diventa allora

41
dΣi = ni ε2 dΩ. Infine abbiamo ultilizzato l’integrale sugli angoli, vedi problema 2.6,
Z
4π ij
dΩ ni nj = δ .
3
~
Riscrivendo la (2.49) in notazione simbolica otteniamo in definitiva per le derivate di E
nel senso delle distribuzioni,
µ ¶
e e xi xj
∂i E = δ ij δ 3 (~x) +
j ij
δ −3 2 . (2.50)
3 4πr3 r

Confrontando con la (2.48) si vede che il calcolo “naiv” è valido per ~x 6= 0, ma non è
capace di rivelare la presenza del termine supportato in ~x = 0, dove il campo elettrico è
infatti singolare 6 .
Come si vede l’espressione (2.50) soddisfa ora entrambe le equazioni di (2.46), la prima
in particolare essendo equivalente all’identità in S 0 ,

~ · ~x = 4π δ 3 (~x).
∇ (2.51)
r3

Infine possiamo rileggere i nostri risultati in termini del potenziale coulombiano A0 . La


~ ×E
soluzione generale dell’identità di Bianchi ∇ ~ = 0 è infatti data da,

~ = −∇A
E ~ 0.

Data la (2.47) si verifica facilmente (esercizio) che questa relazione è soddisfatta – anche
nel senso delle distribuzioni – se si sceglie il potenziale,

e
A0 = , (2.52)
4πr

appartenente anch’esso S 0 . L’analisi svolta sopra implica allora la validità dell’equazione


di Poisson −∇2 A0 = e δ 3 (~x), dalla quale segue la nota identità,

1
∇2 = −4π δ 3 (~x). (2.53)
r

L’equazione di Lorentz. Una volta risolte l’equazione di Maxwell e l’identità di Bianchi


possiamo considerare l’equazione di Lorentz, le cui componenti indipendenti sono date
6
Si noti che il secondo e il terzo termine in (2.50), che per r → 0 si comportano entrambi come 1/r3 ,
presi separatamente non costituiscono affatto distribuzioni. È solo la particolare combinazione lineare
che compare in (2.50), con coefficiente relativo −3, ad essere un elemento di S 0 .

42
in (2.21). Siccome abbiamo ~v = p~ = 0, il membro di sinistra di questa equazione è
identicamente nullo. D’altra parte, dato che ~y (t) = 0 il membro di destra della (2.21) si
~ ~0), espressione che – data la (2.47) – diverge! Ritroviamo cosı̀ che la
ridurrebbe a e E(t,
forza esercitata dal campo elettromagnetico generato da una particella puntiforme sulla
particella stessa è divergente, e che l’equazione di Lorentz è inconsistente. A dire il vero
nel caso statico quı̀ considerato conosciamo una soluzione pragmatica del problema: in
~ ~0) uguale a zero,
accordo con l’esperienza dobbiamo porre la quantità mal definita E(t,
perché sperimentalmente si osserva che una particella statica non subisce nessuna forza.
Vedremo, tuttavia, che nel caso generale di una particella in moto vario questa semplice
ricetta non risulta implementabile, perché entrerebbe in conflitto con la conservazione del
quadrimomento totale.
L’energia infinita del campo elettromagnetico. Concludiamo l’analisi della particella
statica con un ulteriore commento, anticipando l’espressione per la densità di energia
del campo elettromagnetico, vedi paragrafo 2.4.3,
1 2
ρem = (E + B 2 ).
2
~ = 0, l’energia totale del campo elettromagnetico di una
Vista la (2.47) e dato che B
particella statica risulterebbe quindi,
Z ³ e ´2 Z d3 x
3
εem = ρem d x = ,
4π r4
che corrisponde a una “costante” divergente, per via del comportamento singolare del-
l’integrando in r → 0. D’altra parte, nel caso sotto esame l’energia della particella è
m
conservata banalmente, essendo ε = √ = m, e allora – se si deve conservare l’ener-
1 − v2
gia totale – anche l’energia εem del campo elettromagnetico dovrebbe essere una costante
(finita). Nel capitolo 13 vedremo che nel caso statico l’unico valore di εem compatibile
con l’invarianza relativistica, in realtà è εem = 0. Ma vedremo anche che nel caso di
una particella in moto arbitrario, questa semplice scelta “fatta a mano” violerebbe sia la
conservazione del quadrimomento totale, sia l’invarianza relativistica.
È abbastanza evidente che il problema dell’energia infinita del campo elettromagnetico
– cosı̀ come quello dell’autointerazione infinita di una particella carica – è conseguenza
della natura puntiforme delle particelle elementari: mentre il secondo in ultima analisi è

43
tuttora irrisolto, vedi capitolo 12, il primo ha trovato una soluzione – anche se solo di
recente – nell’ambito della teoria delle distribuzioni 7 . Noi la presenteremo in una forma
alternativa nel capitolo 13.

2.4 Le costanti del moto dell’Elettrodinamica

In Fisica un ruolo fondamentale viene giocato dalle costanti del moto associate alla di-
namica di un sistema, ovverosia dalle grandezze fisiche che si conservano durante la sua
evoluzione temporale. D’altra parte, come è noto esiste un legame molto stretto tra leggi
di conservazione e simmetrie continue di una teoria, legame che viene concretizzato dal
teorema di Noether. L’importanza concettuale di questo teorema che, oltre a stabilire
l’esistenza di costanti del moto ne fornisce anche la forma esplicita, risiede nella sua ge-
neralità: è valido in qualsiasi teoria le cui equazioni del moto possano essere dedotte da
un principio variazionale. Per l’Elettrodinamica di particelle puntiformi, le cui equazioni
del moto sono relativamente semplici, deriveremo ora la forma delle principali costanti del
moto in modo euristico – senza ricorrere a questo teorema – utilizzando invece nozioni di
elettromagnetismo di base. La verifica che le costanti del moto cosı̀ ottenute combaciano
perfettamente con quelle previste dal teorema di Noether verrà poi fatta nel capitolo 4.

2.4.1 Conservazione e invarianza della carica elettrica

Come prototipo di una legge di conservazione locale, che sia cioè basata su un’equazione di
continuità per un’opportuna quadricorrente j µ , consideriamo la conservazione della carica
elettrica. Se la materia carica è costituita da particelle puntiformi la corrente è data dalla
(2.6); se la carica è invece distribuita con continuità la corrente ha una forma generica. Per
quello che segue la forma particolare della corrente sarà irrilevante, in quanto assumeremo
soltanto che essa goda delle seguenti proprietà:
I) j µ è un campo vettoriale,
II) j µ soddisfa l’equazione di continuità, ∂µ j µ = 0,
III) lim|~x|→∞ |~x|3 j µ (t, ~x) = 0, richiediamo cioè che per ogni t fissato la corrente decada
7
E.G.P. Rowe, Phys. Rev. D 18 3639 (1978).

44
all’infinito spaziale più rapidamente di 1/|~x|3 , proprietà certamente posseduta da (2.40)
e (2.41).
Sotto queste ipotesi vogliamo ora dimostrare che esiste una carica totale Q conservata,
e che essa è uno scalare sotto trasformazioni di Lorentz.
La costruzione della carica segue una procedura standard, che consiste nell’integrare
l’equazione di continuità su un volume V ,
Z Z
∂0 0 3
j d x=− ~ · ~j d3 x.

V V

Applicando il teorema di Gauss e definendo la carica contenuta in un volume V come


R
QV = V j 0 d3 x, si ottiene poi l’equazione di conservazione locale,
Z
dQV ~
~j · dΣ.
=− (2.54)
dt ∂V

La derivata della carica contenuta nel volume V eguaglia dunque l’opposto del flusso della
corrente spaziale attraverso il bordo di V . Se estendiamo ora il volume a tutto R3 , per la
proprietà III) converge l’integrale della densità j 0 su tutto lo spazio, mentre va a zero il
flusso della corrente spaziale all’infinito 8 . Si ottiene quindi la carica conservata,
Z
dQ
Q= j 0 d3 x, = 0. (2.55)
dt

Che la carica totale sia un invariante di Lorentz – proprietà certamente non posseduta
dalla carica in un volume finito QV – è un po’ meno ovvio. Per dimostrarlo valutiamo la
carica, che è indipendente dal tempo, all’istante t = 0 e la riscriviamo come segue,
Z Z Z Z
0 3 0 4 0 4
Q= j (0, ~x) d x = j (x) δ(t) d x = j (x)∂0 H(t) d x = j µ (x) ∂µ H(t) d4 x.

Abbiamo introdotto la funzione di Heaviside H(t), nulla per t < 0 e uguale a 1 per t ≥ 0,
legata alla δ di Dirac dalla nota relazione,

dH(t)
= δ(t).
dt
8
Se V si estende a tutto lo spazio possiamo scegliere per ∂V una sfera di raggio R e mandare R
all’infinito. Conviene passare a coordinate ~ = ~n R2 dΩ, dove ~n é il versore normale
R polari. Ponendo
R dΣ
~
alla sfera e Ω l’angolo solido, otteniamo ∂V j · dΣ = dΩ ~n · (limR→∞ R2 ~j). Ma per la proprietà III) il
~
limite tra parentesi è zero.

45
Consideriamo ora la carica totale Q0 in un altro sistema di riferimento, legato al primo da
una trasformazione di Lorentz propria x0µ = Λµ ν xν , Λ0 0 ≥ 1. Con lo stesso procedimento
di cui sopra troviamo,
Z
0
Q = j 0µ (x0 ) ∂µ0 H(t0 ) d4 x0 .

Sfruttando le trasformazioni di Lorentz,

j 0µ (x0 ) = Λµ ν j ν (x),
e µ ρ ∂ρ ,
∂µ0 = Λ

d4 x0 = |detΛ| d4 x = d4 x,

si ottiene poi,
Z
0
Q = j µ (x)∂µ H(t0 ) d4 x,

dove,
t 0 = Λ 0 0 t + Λ 0 i xi . (2.56)

Possiamo infine valutare la differenza,


Z Z
Q − Q = j (x) ∂µ (H(t ) − H(t)) d x = ∂µ [j µ (x) (H(t0 ) − H(t))] d4 x,
0 µ 0 4
(2.57)

dove nell’ultimo passaggio abbiamo sfruttato l’equazione di continuità. Dividiamo ora la


quadridivergenza in parte spaziale e parte temporale, applicando alla prima il teorema di
Gauss in d = 3, e alla seconda il teorema fondamentale del calcolo in t. Supponendo di
poter scambiare gli ordini di integrazione si ottiene,
Z Z Z
0
Q − Q = dt 0 ~ + d3 x j 0 (x)(H(t0 ) − H(t))|t=+∞ .
(H(t ) − H(t))~j(x) · dΣ t=−∞
Γ∞

Nel primo termine Γ∞ è una superficie sferica posta all’infinito spaziale, dove ~j si annulla
più rapidamente di 1/|~x|3 ; l’integrale del flusso è quindi zero. Nel secondo termine dob-
biamo valutare la differenza H(t0 ) − H(t) nei limiti t → ±∞, per ~x fissato. Grazie al
fatto che Λ0 0 ≥ 1, dalla (2.56) si vede che per t → +∞ anche t0 → +∞, ed entrambe
le funzioni di Heaviside vanno a 1, mentre per t → −∞ anche t0 → −∞ ed entrambe le
funzioni di Heaviside vanno a zero. Anche il secondo integrale è quindi zero e abbiamo,

Q0 = Q.

46
2.4.2 Tensore energia–impulso e conservazione del quadrimomento

In questo paragrafo – e nel successivo – illustreremo come il principio di conservazione


dell’energia e della quantità di moto – cardine di qualsiasi teoria fisica fondamentale – vie-
ne realizzato nell’ambito dell’Elettrodinamica, come conseguenza delle equazioni (2.12)–
(2.14). Ma prima di considerare il caso particolare dell’Elettrodinamica, imposteremo ora
il problema in una generica teoria relativistica.
In una teoria relativistica l’energia costituisce la quarta componente di un quadri-
vettore, appunto del quadrimomento. Siccome una trasformazione di Lorentz mescola
energia e quantità di moto ci aspettiamo quindi che la conservazione della prima non
possa avvenire senza la contemporanea conservazione della seconda. In realtà stiamo
quindi cercando quattro costanti del moto raggruppate nel quadrimomento P ν , la cui
componente temporale P 0 = ε rappresenta l’energia totale del sistema.
In analogia con la carica elettrica ci aspettiamo anche per il quadrimomento leggi di
conservazione locali, ovverosia ci aspettiamo che ad ogni componente del quadrimomento
P ν sia associata una corrente conservata. Indichiamo le quattro correnti risultanti con,

j µ(ν) (x) ≡ T µν (x), (2.58)

grandezza che viene chiamata “tensore energia–impulso”.


In base a quanto abbiamo appena detto postuliamo che in una teoria relativistica la
conservazione del quadrimomento sia conseguenza dell’esistenza di un tensore energia–
impulso, che gode delle seguenti proprietà:
I) T µν è un campo tensoriale,
II) T µν soddisfa l’equazione di continuità, ∂µ T µν = 0,
III) lim|~x|→∞ |~x|3 T µν (t, ~x) = 0.
La proprietà I) assicura in particolare la covarianza dell’equazione di continuità II), cioè,
se essa vale in un sistema di riferimento vale in tutti i sistemi di riferimento.
Procediamo ora come nel caso della corrente elettrica per dedurre l’esistenza di quan-
tità conservate. Integrando l’equazione di continuità su un volume finito otteniamo,
Z Z
0ν 3
∂0 T d x=− ∂i T iν d3 x. (2.59)
V V

47
In base all’identificazione (2.58) le componenti T 0ν corrispondono alla densità di quadri-
momento, e il quadrimomento contenuto in un volume V è dunque dato da,
Z
ν
PV = T 0ν d3 x. (2.60)
V

La (2.59) ci dice allora che le quantità T iν sono da interpretarsi come “densità di corrente
di quadrimomento”. Infatti, applicando il teorema di Gauss si ottiene l’equazione del
flusso,
Z
dPVν
=− T iν dΣi . (2.61)
dt ∂V

Scriviamo in particolare le componenti ν = 0 delle (2.60), (2.61), che riguardano l’energia


εV ≡ PV0 contenuta nel volume V ,
Z Z
dεV
εV = T 00 d3 x, =− T i0 dΣi .
V dt ∂V

Si vede che mentre T 00 rappresenta la densità di energia, il vettore tridimensionale T i0


rappresenta il flusso di energia, entrambe quantità che in seguito giocheranno un ruolo
importante. Interpretazioni analoghe valgono per le componenti T µi , che riguardano la
quantità di moto.
Se infine nella (2.61) estendiamo il volume a tutto lo spazio, grazie alla proprietà III)
deduciamo che il quadrimomento totale è conservato,
Z
dP ν
P = T 0ν d3 x,
ν
= 0. (2.62)
dt
A questo punto facciamo notare che il quadrimomento PVν contenuto in un volume finito
– che in generale dipende dal tempo – non ha proprietà ben definite sotto trasformazioni
di Lorentz, mentre, se vogliamo che la conservazione del quadrimomento totale sia una
proprietà preservata nel passaggio da un sistema di riferimento a un altro, dobbiamo
dimostrare che P ν costituisce effettivamente un quadrivettore. La dimostrazione di questo
fatto si basa sulle proprietà I)–III), e segue da vicino quella dell’invarianza della carica
elettrica del paragrafo precedente. Eseguendo gli stessi passaggi si ottiene facilmente,
Z Z
ν µν 4
P = T (x) ∂µ H(t) d x, P = T 0µν (x0 ) ∂µ0 H(t0 ) d4 x0 .

Considerando che i tensori energia–impulso nei due riferimenti sono legati dalla relazione,

T 0µν (x0 ) = Λµ α Λν β T αβ (x),

48
si ottiene,
Z
0ν ν
P =Λ β T µβ (x) ∂µ H(t0 ) d4 x.

Calcoliamo allora la differenza,


Z Z
£ ¤
P −Λ β P = Λ β T (x)∂µ (H(t )−H(t)) d x = Λ β ∂µ T µβ (x)(H(t0 ) − H(t)) d4 x,
0ν ν β ν µβ 0 4 ν

dove nell’ultimo passaggio abbiamo sfruttato l’equazione di continuità. L’integrale otte-


nuto è della stessa forma dell’integrale (nullo) in (2.57), e quindi anch’esso è zero. Vale
dunque,
P 0ν = Λν β P β ,

come volevamo dimostrare.

2.4.3 Il tensore energia–impulso dell’Elettrodinamica

In questo paragrafo diamo una dimostrazione costruttiva dell’esistenza di un tensore


energia–impulso per l’Elettrodinamica classica, che goda delle proprietà postulate nel
paragrafo precedente. Deriveremo prima, in modo euristico, la forma della densità di
energia T 00 , dopodichè useremo l’invarianza di Lorentz per ricostruire l’intero tensore.
Per cominciare ricordiamo la nota formula per la densità di energia del campo elet-
tromagnetico,
00 1 2
Tem = (E + B 2 ). (2.63)
2
00
Chiaramente l’energia totale conservata non potrà essere data solo dall’integrale di Tem ,
perché sappiamo che il campo elettromagnetico scambia energia con le particelle cariche.
00
Per quantificare questo scambio ci calcoliamo la derivata temporale di Tem , usando le
equazioni di Maxwell nella forma (2.28)–(2.31),
00
∂Tem ~ ~
~ · ∂E + B
= E ~ · ∂B
∂t ³∂t ∂t´
~· ∇
= E ~ ×B~ − ~j − B
~ ·∇
~ ×E
~
³ ´
~ −∇
= −~j · E ~ · E ~ ×B
~ .

Integriamo ora questa relazione su tutto lo spazio. Applicando all’ultimo termine il teo-
~ eB
rema di Gauss e assumendo che E ~ decrescano all’infinito spaziale abbastanza rapida-

mente, vediamo che esso non dà contributo. Ricordando la forma della corrente spaziale

49
(2.41) possiamo allora scrivere,
Z Z X Z
d 00 3 ~ ~ 3 ~ ~x) δ 3 (~x − ~yr (t)) d3 x (2.64)
Tem d x = − E · j d x = − er ~vr · E(t,
dt r
à !
X d X
= − ~ ~yr (t)) = −
er ~vr · E(t, εr , (2.65)
r
dt r
p
dove abbiamo usato la legge della potenza (2.20), con εr = mr / 1 − vr2 . La relazione che
abbiamo ottenuto ci dice che si conserva l’energia totale del sistema, nella forma,
Z X Z Ã X
!
00 3 1
ε = Tem d x+ εr = (E 2 + B 2 ) + εr δ 3 (~x − ~yr (t)) d3 x.
r
2 r

Da questa formula possiamo dedurre l’espressione della densità di energia,


1 2 X
T 00 = (E + B 2 ) + εr δ 3 (~x − ~yr (t)).
2 r

Viene allora naturale assumere che il tensore energia–impulso totale possa essere scritto
come somma di due contributi, uno che rappresenta solo i campi e l’altro che rappresenta
solo le particelle,
T µν = Tem
µν
+ Tpµν , (2.66)

con le condizioni,
1 2 X
00
Tem = (E + B 2 ), Tp00 = εr δ 3 (~x − ~yr (t)). (2.67)
2 r

Con queste posizioni cerchiamo ora di determinare i due tensori separatamente, sfrut-
tando il fatto che sotto trasformazioni di Lorentz entrambi si devono trasformare in modo
covariante.
00
Cominciamo con il contributo del campo elettromagnetico. Siccome Tem è bilineare in
~ eB
E ~ – che sono le componenti del tensore F µν – e siccome le trasformazioni di Lorentz
µν
sono lineari, possiamo concludere che tutte le componenti di Tem devono essere bilineari
in F µν . La covarianza di Lorentz impone allora la seguente struttura generale, dove a, b
e c sono per il momento costanti arbitrarie 9 ,

µν
Tem = a F µ α F αν + b η µν F αβ Fαβ + c F µν F α α . (2.68)
9
A priori potrebbero essere presenti anche contributi che coinvolgono il tensore di Levi–Civita εµνρσ ,
ma questi renderebbero Temµν
uno pseudotensore. Per parità, ovverosia per ~x → −~x, E ~ → −E,~ B~ → B,~
00
la componente Tem dovrebbe allora cambiare di segno, in contraddizione con la (2.63) che resta invece
invariante.

50
L’ultimo termine è identicamente nullo grazie all’antisimmetria di F αβ . Per determinare
00
le costanti a e b calcoliamo Tem dalla (2.68) e confrontiamo il risultato con la (2.67),

00
Tem = aF 0 α F α0 + b η 00 · 2(B 2 − E 2 )

= aF 0 i F i0 + 2b (B 2 − E 2 ) = (a − 2b)E 2 + 2bB 2 .

Il confronto dà a = 1, b = 1/4, e quindi,

µν 1 µν αβ
Tem = F µ α F αν + η F Fαβ . (2.69)
4

Per determinare Tpµν riscriviamo la componente Tp00 in (2.67) nel modo seguente,
XZ XZ X Z
00 4 0 0 4
Tp = εr δ (x − yr ) dyr = εr ur δ (x − yr ) dsr = mr u0r u0r δ 4 (x − yr ) dsr .
r r r

Questa forma suggerisce di porre,


X Z
Tpµν = mr uµr uνr δ 4 (x − yr ) dsr , (2.70)
r

che è un tensore per trasformazioni di Lorentz e riproduce la componente 00 corretta. È


sottinteso che l’integrale curvilineo è esteso all’intera linea di universo di ciascuna parti-
cella, come nella definizione della quadricorrente. Integrando nuovamente la δ temporale
possiamo riscrivere questo tensore in modo non manifestamente covariante, in una forma
che sarà utile nel prossimo paragrafo,
X pµ pν
r r
Tpµν = δ 3 (~x − ~yr (t)). (2.71)
r
εr

Facciamo notare che i tensori dati in (2.69) e (2.70) sono simmetrici in µ e ν, e quindi lo
è anche il tensore energia–impulso totale,

T µν = T νµ .

Per il momento questa proprietà sembra accidentale, ma essa giocherà un ruolo rilevante
in seguito.
µν
L’equazione di continuità per T µν . Le formula per Tpµν e Tem appena trovate sono state
dedotto in modo euristico, ma la loro giustificazione definitiva discende dal fatto che si
può dimostrare che il tensore energia–impulso totale T µν è conservato se,

51
a) F µν soddisfa l’identità di Bianchi e l’equazione di Maxwell,
b) le coordinate delle particelle soddisfano l’equazione di Lorentz.
Per dimostrarlo calcoliamo la quadridivergenza dei due tensori separatamente, comincian-
do dal tensore elettromagnetico,

µν 1
∂µ Tem = ∂µ F µα Fα ν + F µα ∂µ Fα ν + Fαβ ∂ ν F αβ
2
1 ¡ ¢ 1
= −F να jα + Fαβ ∂ α F βν − ∂ β F αν + Fαβ ∂ ν F αβ
2 2
1 ¡ ¢
= −F να jα + Fαβ ∂ α F βν + ∂ β F να + ∂ ν F αβ
2
X Z
= − er F να (yr )urα δ 4 (x − yr ) dsr . (2.72)
r

Abbiamo usato l’equazione di Maxwell, l’identità di Bianchi nella forma (2.89), e la


definizione della quadricorrente.
Per calcolare la quadridivergenza del tensore energia–impulso delle particelle si ese-
10
guono gli stessi passaggi del calcolo della quadridivergenza della corrente elettrica ,
XZ XZ
d 4
∂µ Tpµν = pνr uµr 4
∂µ δ (x − yr ) dsr = − pνr
δ (x − yr ) dsr
r r
dsr
X Z dpν X ¯sr =+∞
= r 4
δ (x − yr ) dsr − pνr δ 4 (x − yr )¯sr =−∞
r
dsr r
Z
X dpν
r 4
= δ (x − yr ) dsr . (2.73)
r
dsr

Sommando questo risultato alla (2.72) si ottiene,


X Z µ dpν ¶
µν r
∂µ T = − er F (yr )urα δ 4 (x − yr ) dsr = 0,
να
(2.74)
r
dsr

in virtù dell’equazione di Lorentz.


Concludiamo che le formule (2.66), (2.69) e (2.70) individuano un tensore energia–
impulso che soddisfa le proprietà I) e II) del paragrafo precedente. Sotto ipotesi molto
generali si può inoltre fare vedere che esso soddisfa anche la proprietà III) sul suo anda-
mento asintotico. Il contributo Tpµν soddisfa questa proprietà in modo ovvio. Per quanto
µν
riguarda invece il tensore Tem vedremo che esso la soddisfa, per esempio, se l’accelerazione
10
Per non appesantire la notazione in questo calcolo usiamo per le distribuzioni la notazione simbolica.
Per rendersi conto che i passaggi eseguiti sono corretti è sufficiente applicare i risultati intermedi a una
funzione di test ϕ.

52
delle particelle cariche svanisce per t → −∞ con sufficiente rapidità (in particolare se le
particelle sono accelerate solo per un intervallo temporale finito). Nel capitolo 6 faremo,
infatti, vedere che in questo caso il campo elettromagnetico ha l’andamento asintotico
tipico di un campo coulombiano,
1
F µν ∼ , per r = |~x| → ∞.
r2
µν
Siccome Tem è quadratico in F µν ne segue che asintoticamente,

µν 1
Tem ∼ ,
r4
e quindi r3 Tem
µν
→ 0.
Prima di procedere osserviamo che nella dimostrazione dell’equazione di continuità
appena svolta abbiamo evidentemente sottointeso l’identificazione dei due tipi di carica
discussi alla fine del paragrafo 2.2.3, vale a dire abbiamo posto er = e∗r . Ricordiamo che le
{e∗r } sono le cariche che compaiono – a priori – nella corrente, e che le {er } sono quelle che
compaiono nelle equazioni di Lorentz. Ma è facile ripetere gli stessi passaggi di cui sopra
senza usare questa identificazione, e si vede immediatamente che al posto di ∂µ T µν = 0 si
otterrebbe, vedi (2.74),
X Z
µν
∂µ T = (er − e∗r ) F να (yr ) δ 4 (x − yr ) dyrα . (2.75)
r

L’equazione di continuità è quindi violata, a meno che non si abbia er = e∗r . L’identificazio-
ne dei due tipi di carica è quindi effettivamente necessaria per assicurare la conservazione
del quadrimomento totale del sistema, come anticipato nel paragrafo 2.2.3.
Il significato delle componenti di T µν . Analizziamo ora brevemente il significato del-
le singole componenti di T µν , cominciando di nuovo con il contributo elettromagnetico.
Calcoli elementari danno,

00 1 2
Tem = (E + B 2 ), (2.76)
2
i0
Tem 0i
= Tem ~ × B)
= (E ~ i, (2.77)
ij 1 2
Tem = (E + B 2 ) δ ij − E i E j − B i B j . (2.78)
2
00
Riotteniamo ovviamente la densità di energia Tem dalla quale eravamo partiti. Nelle com-
ponenti miste riconosciamo poi il vettore di Poynting S i che, come sappiamo, rappresenta

53
effettivamente il flusso di energia del campo elettromagnetico,

i0
Tem = S i, ~=E
S ~ × B.
~ (2.79)

Vediamo inoltre che il vettore di Poynting eguaglia anche la densità di quantità di moto
0i
Tem . Le componenti spazio–spazio invece formano un tensore simmetrico che viene chia-
mato “tensore degli sforzi di Maxwell”; esso rappresenta il flusso della quantità di moto.
Infine osserviamo che il tensore energia–impulso elettromagnetico è a traccia nulla,

µ µν
Tem µ = Tem ηµν = 0.

Per quanto riguarda il tensore energia–impulso delle particelle, dalla (2.71) si vede che
la densità di quadrimomento ha la forma aspettata,
X
Tp0µ = pµr δ 3 (~x − ~yr (t)). (2.80)
r

Infatti, il quadrimomento totale delle particelle che a un istante considerato si trovano


all’interno di un volume V è dato da,
Z X Z X
0µ 3
Tp d x = pµr δ 3 (~x − ~yr (t)) d3 x = pµr ,
V r V r∈V

dove la somma si estende a tutte le particelle contenute in V .


Concludiamo questo paragrafo riprendendo il bilancio del quadrimomento riferito a
un volume V . Secondo la (2.61) il quadrimomento che abbandona nell’unità di tempo il
volume V é dato da,
Z
dPVµ
=− T iµ dΣi .
dt ∂V

L’intgrale a secondo membro è un integrale di superficie e riceve – a priori – contributi



sia da Tem che da Tpiµ . Ma siccome le particelle all’istante considerato stanno o all’interno
o all’esterno della superficie, il termine Tpiµ non contribuisce e si ottiene,
Z
dPVµ iµ
=− Tem dΣi . (2.81)
dt ∂V

In altre parole, la variazione del quadrimomento totale contenuto in V , che risulta dalla
somma del quadrimomento delle particelle e di quello del campo elettromagnetico, è cau-
sata dal solo flusso elettromagnetico. In particolare per “l’energia irradiata” nell’unità di

54
tempo dal volume V otteniamo,
Z Z
dεV i0 i ~ · dΣ.
~
=− Tem dΣ = − S (2.82)
dt ∂V ∂V

Questa importante relazione sarà la formula cardine per l’analisi energetica di tutti i
fenomeni di irraggiamento.

2.4.4 Conservazione del momento angolare

In questo paragrafo stabiliremo la legge di conservazione locale del momento angolare qua-
dridimensionale, in una generica teoria relativistica. Applicheremo poi la ricetta ottenuta
all’Elettrodinamica.
Sappiamo che in un sistema isolato di particelle non relativistiche, oltre all’energia e
alla quantità di moto si conserva anche il momento angolare tridimensionale, nella forma,
X X
Li = (~yr × p~r )i = εijk yrj pkr ,
r r

dove p~r = mr~vr è la quantità di moto non relativistica della particella r–esima. In una
teoria relativistica questa legge di conservazione vettoriale, opportunamente generalizzata
dovrebbe acquisire carattere covariante quadridimensionale. Ma il tentativo più naturale
di estendere il momento angolare a un quadrivettore fallisce, in quanto il prodotto esterno
tridimensionale non ammette nessuna estensione quadrivettoriale. Tuttavia, possiamo
sfruttare il fatto che in tre dimensioni ogni vettore è equivalente a un tensore doppio
antisimmetrico,
X
Lij ≡ εijk Lk = (yri pjr − yrj pir ). (2.83)
r
In quanto tensore antisimmetrico questa espressione ammette ora un’estensione naturale
a un quadritensore antisimmetrico di rango due,
X
Lαβ
p = (yrα pβr − yrβ pαr ), Lαβ βα
p = −Lp , (2.84)
r

purché identifichiamo pαr con il quadrimomento relativistico della particella. Un tensore


di questo tipo corrisponderebbe quindi a sei quantità conservate. In realtà dovevamo
aspettarci che il momento angolare relativistico fosse costituito da più di tre componenti.
Sappiamo, infatti, che in fisica Newtoniana la conservazione del momento angolare discen-
de dall’invarianza per rotazioni spaziali, le quali costituiscono un gruppo a tre parametri.

55
A livello relativistico questo gruppo si allarga al gruppo di Lorentz che costituisce invece
un gruppo a sei parametri, e quindi risulta naturale la comparsa di altrettante quantità
conservate.
Come per la carica elettrica e il quadrimomento assumiamo anche in questo caso leggi
di conservazione locali. Ipotizziamo quindi l’esistenza di un tensore “densità di corrente
di momento angolare” di rango tre M µαβ , con le proprietà,
I) M µαβ = −M µβα ,
II) ∂µ M µαβ = 0.
Alla luce della (2.84), vedi sotto, postuliamo la seguente definizione,

M µαβ = xα T µβ − xβ T µα . (2.85)

La proprietà I) è allora valida per costruzione. Per quanto riguarda la II) calcoliamo,

∂µ M µαβ = δµα T µβ + xα ∂µ T µβ − δµβ T µα − xβ ∂µ T µα = T αβ − T βα ,

dove abbiamo sfruttato la conservazione del tensore energia–impulso. Vediamo ora che se
quest’ultimo è anche simmetrico – come nel caso dell’Elettrodinamica – allora risulta in
effetti l’equazione di continuità,
∂µ M µαβ = 0.

Seguendo il procedimento standard e assumendo opportuni andamenti asintotici dei campi


all’infinito, segue allora che esistono sei quantità conservate date da,
Z Z
αβ 0αβ 3
L = M d x = (xα T 0β − xβ T 0α ) d3 x, Lαβ = −Lβα . (2.86)

Con il consueto procedimento si dimostra poi anche che le quantità Lαβ costituiscono
un tensore di rango due sotto trasformazioni di Lorentz. Inoltre, in assenza di campo
elettromagnetico, cioè per un sistema di particelle neutre, usando la (2.80) si vede im-
mediatamente che la (2.86) si riduce alla (2.84). Giustifichiamo cosı̀ – a posteriori – la
definizione del momento angolare relativistico data in (2.85).
In realtà i campi M µαβ si comportano come campi “tensoriali” solo sotto trasformazioni
di Lorentz, mentre sotto traslazioni, xµ → x0µ = xµ + aµ , essi trasformano in modo
“anomalo”,
M 0µαβ (x0 ) = M µαβ (x) + aα T µβ (x) − aβ T µα (x).

56
Ricordiamo, appunto, che sotto traslazioni un tensore non dovrebbe cambiare. In modo
simile le quantità conservate (2.86) trasformano secondo, vedi (2.62),

L0αβ = Lαβ + aα P β − aβ P α . (2.87)

Questa anomalia si spiega facilmente osservando che la densità di momento angolare


(2.85) è stata calcolata considerando implicitamente come polo l’origine O, con coordinate
xµO = 0. Per un polo generico la (2.85) si generalizza invece come,

MOµαβ = (xα − xαO )T µβ − (xβ − xβO )T µα ,

espressione che risulta ora invariante per traslazioni e preserva, per di più, le proprietà I) e
II) di cui sopra. La (2.87) può allora essere interpretata come la versione relativistica della
nota regola di cambiamento del momento angolare non relativistico per un cambiamento
del polo, xµO → x0µ µ µ
O = xO − a .

Esplicitiamo ora la forma delle costanti del moto Lαβ nel caso dell’Elettrodinamica.
1
Analizziamo separatamente le componenti Lij , ovverosia il vettore Li = 2
εijk Ljk che
corrisponde al momento angolare spaziale, e le tre nuove costanti del moto K i ≡ L0i , che
vengono chiamate boost. Per il momento angolare spaziale la (2.79) e la (2.80) danno,
Z Z Ã !
1 X
Li = εijk Ljk = εijk xj T 0k d3 x = εijk xj S k + pkr δ 3 (~x − ~yr ) d3 x,
2 r

e quindi,
Z X
~ =
L ~ d3 x +
(~x × S) ~ p,
~yr × p~r ≡ Lem + L (2.88)
r
risultato non sorprendente, dato che il vettore di Poynting rappresenta la densità di
quantità di moto del campo elettromagnetico.
Il significato dei boost. Analizziamo ora le componenti (0 i) di Lαβ , in una teoria
relativistica generica. Dalla (2.86) otteniamo le costanti del moto,
Z Z
K = L = t T d x − xi T 00 d3 x,
i 0i 0i 3

R
dove nelle quantità P i = T 0i d3 x riconosciamo la quantità di moto totale conservata del
sistema. Per dare un’interpretazione al secondo termine di K i definiamo la posizione del
“centro di massa” di un sistema relativistico come,
R
~x T 00 d3 x
~xcm (t) ≡ R 00 3 ,
T dx

57
R
dove ε = T 00 d3 x è l’energia totale conservata del sistema. Si noti che questa formula si
ottiene dalla corrispondente espressione non relativistica sostituendo la densità di massa
con la densità di energia. La costanza del vettore di boost,

~ = t P~ − ε ~xcm (t),
K

è allora equivalente all’affermazione che il centro di massa del sistema si muove di moto
rettilineo uniforme, con velocità data da,
P~
~vcm = .
ε
Resta, tuttavia, da notare che il concetto di centro di massa di un sistema, per come
l’abbiamo introdotto non è un concetto relativisticamente invariante, nel senso che le sue
coordinate (t, ~xcm ) non costituiscono un quadrivettore: il centro di massa di un sistema è
rappresentato da punti diversi in sistemi di riferimento diversi.
In definitiva, dalle equazioni del moto dell’Elettrodinamica siamo riusciti a dedurre
l’esistenza delle dieci quantità conservate P ν e Lαβ – tante quanti sono i parametri con-
tinui che parametrizzano il gruppo di Poincaré. Abbiamo già anticipato che alla base di
questa “coincidenza” numerica c’è un legame profondo esistente in natura tra principi di
simmetria e leggi di conservazione, legame che a livello matematico viene decodificato dal
teorema di Noether.

2.5 Problemi

2.1 Si dimostri che il quadrato della quadriaccelerazione w2 ≡ wµ wµ soddisfa,

w2 ≤ 0.

[Sugg.: si sfrutti l’identità wµ uµ = 0.] Si dimostri che in termini di velocità e accelerazione


tridimensionali si ha,
a2 − (~a × ~v )2
w2 = − .
(1 − v 2 )3

2.2 Si dimostri che le seguenti tre versioni dell’identità di Bianchi sono equivalenti tra
di loro:

∂µ Fνρ + ∂ν Fρµ + ∂ρ Fµν = 0, (2.89)

58
∂[µ Fνρ] = 0,

εµνρσ ∂ν Fρσ = 0.

2.3 Si trovino tutte le soluzioni per F ∈ S 0 (R) dell’equazione in una dimensione,

(x2 − a2 )F (x) = 0, a > 0.

Si dimostri che ogni soluzione può essere posta nella forma F (x) = f (x)δ(x2 − a2 ), per
un’opportuna funzione continua f .

2.4 Si dimostri che una funzione f (x) : RD → C definisce un elemento F ∈ S 0 (RD ),


dato da,
Z
F (ϕ) = f (x) ϕ(x) dD x, (2.90)

se 1) f è integrabile in modulo su una qualsiasi palla di RD – in particolare se possiede un


numero finito di singolarità integrabili – e 2) se essa è asintoticamente polinomialmente
limitata. Una funzione f si dice asintoticamente polinomialmente limitata se esistono una
distanza d, un intero positivo N e una costante positiva C, tali che per ogni x per cui
r ≥ d si abbia,
|f (x)| ≤ C r2N ,
p
dove r ≡ (x1 )2 + · · · + (xD )2 . [Sugg.: È necessario e sufficiente dimostrare che vale la
(2.34) per opportuni monomi P e Q. A questo scopo è utile suddividere il dominio di
integrazione nella (2.90) in una palla sufficientemente grande e nel suo complemento in
RD , e sfruttare le proprietà asintotiche (2.32) della ϕ.]

2.5 Si dimostri il “Teorema di Birkhoff”, enunciato come segue. Sia data una
quadricorrente a simmetria sferica, ma in generale non statica,

j 0 (~x, t) = ρ(r, t),


xi
j i (~x, t) = j(r, t),
r

a supporto spaziale compatto, cioè,

j µ (~x, t) = 0 per r > r0 , ∀ t.

59
Allora il campo elettromagnetico generato dalla quadricorrente nel vuoto, vale a dire nella
regione r > r0 , è statico, essendo dato da,
Z
~ = Q ~x ,
E ~ = 0,
B Q= ρ(r, t) d3 x.
4π r3 r<r0

~ = ~x f (r, t), B
[Sugg.: si usi l’Ansatz E ~ = ~x g(r, t), implicato dalla simmetria sferica.] Se

ne conclude in particolare che una distribuzione di corrente a simmetria sferica – seppure


costituita da cariche accelerate – non può irradiare onde elettromagnetiche, perché il
campo da essa generato è statico.

2.6 Integrali invarianti in 3 dimensioni. Si definisca il tensore doppio tridimensio-


nale,
Z
ij
H = dΩ ni nj , (2.91)
R
dove dΩ = senϑ dϑ dϕ è la misura dell’angolo solido in 3 dimensioni, con dΩ = 4π, e
ni = xi /r, r = |~x|. L’integrando nella (2.91) dipende quindi solo dagli angoli.
R
a) Si dimostri che si può scrivere H ij = d3 x δ(r − 1) xi xj .
b) Si dimostri che H ij è un tensore invariante per SO(3), cioè,

Ri m Rj n H mn = H ij , ∀ R ∈ SO(3).

[Sugg.: si esegua il cambiamento di variabili xi = Ri k y k nell’integrando del punto a)].


c) Sapendo che gli unici tensori invarianti indipendenti per SO(3) sono δ ij e εijk , si
concluda che H ij = C δ ij per qualche costante C. Si determini C contraendo la (2.91)
con δ ij .
d) Secondo questa linea di argomenti si stabilisca la seguente tabella di integrali invarianti:
Z
dΩ = 4π,
Z
dΩ ni = 0,
Z
4π ij
dΩ ni nj = δ ,
3
Z
dΩ ni nj nk = 0,
Z
4π ij kl
dΩ ni nj nk nl = (δ δ + δ ik δ jl + δ il δ jk ).
15

60
2.7 Una particella di carica e e massa m si trova in presenza di un campo elettroma-
gnetico costante e uniforme F µν . La quadrivelocità iniziale della particella per s = 0 sia
uµ (0), con u2 (0) = 1. Seguendo l’approccio covariante del paragrafo 2.2.1,
a) si dimostri che in questo caso l’equazione di Lorentz è equivalente all’equazione del
primo ordine,
dy µ £ ¤µ
= uµ (s) = esA ν uν (0),
ds
per un’opportuna matrice costante Aµ ν , determinandola esplicitamente.
b) Si verifichi esplicitamente che u2 (s) = 1 ∀ s. [Sugg.: si noti che esA ∈ SO(1, 3)c ∀ s.]
c) Si dimostri che la quantità w2 = wµ (s)wµ (s) è indipendente da s, esprimendola in
termini di F µν e uµ (0).
~ = |B|
d) Escluso il caso in cui |E| ~ e simultaneamente E
~ ⊥B
~ = 0, esiste sempre un sistema
~ e B
di riferimento in cui E ~ sono paralleli e diretti lungo l’asse delle x: E
~ = (E, 0, 0),
~ = (B, 0, 0). Si dimostri che in questo riferimento la matrice A è diagonale a blocchi
B
2 × 2.
e) Sfruttando questa struttura di A si determini esA sviluppando l’esponenziale in serie,
e risommandolo in termini delle funzioni sen, cos, cosh e senh.
f) Ponendo come velocità iniziale ~v0 = (0, v0 , 0), cioè,
1
uµ (0) = p (1, 0, v0 , 0),
1 − v02
si determinino uµ (s) e y µ (s), e quindi la legge oraria ~y (t). In questo quesito per semplicità
si ponga B = 0.

2.8 Si consideri un sistema di N particelle cariche nel limite non relativistico, vr ¿ 1,


che creano quindi un campo elettromagnetico dato da,
N
X
~ = −∇A
~ 0, 0 er ~ = 0.
E A (t, ~x) = , B
r=1
4π|~x − ~yr (t)|

a) Utilizzando l’equazione di Coulomb −∇2 A0 = j 0 , si dimostri che l’energia del campo


R
elettromagnetico εem = 21 d3 x (E 2 + B 2 ) può essere riscritta “formalmente” come somma
delle energie potenziali relative di tutte le cariche,
Z N
1 3 0 0 1 X er es
εem = d xA j = . (2.92)
2 2 r,s=1 4π|~yr (t) − ~ys (t)|

61
b) Si sottragga da questa espressione la parte divergente dovuta all’autointerazione, e si
scriva l’energia totale del sistema campo elettromagnetico + particelle cariche, aggiungen-
do l’energia cinetica non relativistica di queste ultime. Si dimostri che l’energia totale cosı̀
ottenuta risulta conservata nel limite non relativistico. Si noti che mentre l’espressione
originale per εem è sempre positiva – qualsiasi siano i segni delle cariche – ciò non è più
vero per l’espressione (2.92), dopo la sottrazione della parte divergente (esempio: N = 2,
e1 = −e2 ).

2.9 Si trovi la soluzione generale y µ (λ) dell’equazione del moto per la particella libera,

d2 y µ
= 0,
ds2

parametrizzando la linea di universo con un parametro λ generico, vedi (2.3). Si verifichi


che la soluzione generale è determinata solo modulo una riparametrizzazione.

2.10 Si dimostri che “l’equazione di Newton” (2.21) può essere posta nella forma,

m ~a = F~ (~y , ~v ),

per un’opportuna forza F~ .

2.11 Si dimostri che se un campo elettromagnetico F µν (x) soddisfa le equazioni di Max-


well (2.28), (2.29) per ogni t, e le equazioni (2.30), (2.31) a t = 0, allora esso soddisfa
automaticamente le (2.30), (2.31) per ogni t. [Sugg.: si valuti la divergenza spaziale delle
(2.28), (2.29).]

2.12 Si verifichi esplicitamente che il tensore tridimensionale,


µ ¶
1 ij xi xj
δ −3 2 ,
r3 r

che compare al membro di destra della (2.50), appartiene a S 0 (R3 ).

Soluzione Problema 2.3 L’equazione,

(x2 − a2 )F (x) = 0, a > 0, (2.93)

62
implica che F può essere “diversa da zero” solo per x = ±a, ovverosia che il supporto di F
è {−a, a}, che è un insieme di punti. Il teorema enunciato nel paragrafo 2.3.2, vedi (2.42),
implica allora che F è una combinazione lineare finita di δ(x ± a) e delle loro derivate.
Evidentemente,
F0 ≡ c1 δ(x − a) + c2 δ(x + a),

è soluzione dell’equazione (2.93), con c1 e c2 costanti aribitrarie, come si verifica subito


usando la (2.36). Per quanto riguarda invece le derivate prime notiamo che, derivando
l’identità (x2 − a2 ) δ(x ± a) = 0, si ottiene,

(x2 − a2 )δ 0 (x ± a) = −2xδ(x ± a) = ±2a δ(x ± a) 6= 0.

Quindi le derivate prime non sono soluzioni di (2.93), e allo stesso modo si dimostra che
nemmeno le derivate successive lo sono. F0 è quindi la soluzione generale della (2.93).
Per porre F0 nella forma richiesta nel problema è sufficiente ricordare la (2.38), e
moltiplicarla per una generica funzione continua f ,

1
F1 ≡ f (x)δ(x2 − a2 ) = (f (a)δ(x − a) + f (−a)δ(x + a)).
2a

Siccome f (a) e f (−a) possono assumere qualsiasi valore F0 può quindi sempre essere
posta nella forma F1 .

~ eB
Soluzione Problema 2.5 Inserendo gli Ansatz dati per E ~ nelle equazioni di Max-
~ ·E
well nel vuoto, ∇ ~ = 0, ∇
~ ·B
~ = 0, si trovano equazioni differenziali che determinano

completamente la dipendenza di f e g da r,

F (t) G(t)
f (r, t) = , g(r, t) = .
r3 r3
~ e B,
Inserendo queste formule di nuovo negli Ansatz per E ~ si trova che vale identicamente
~ ×E
∇ ~ =0=∇
~ × B.
~ Usando questi risultati nelle rimanenti due equazioni di Maxwell

nel vuoto, si trova che F (t) e G(t) sono funzioni costanti. Queste costanti si determinano,
~ ·E
infine, applicando il teorema di Gauss alle equazioni di Maxwell complete, ∇ ~ = ρ,
~ ·B
∇ ~ = 0.

63
3 Metodi variazionali in teoria di campo

Nel capitolo precedente abbiamo illustrato le equazioni fondamentali dell’Elettrodinami-


ca evidenziando le loro proprietà più salienti, tra cui l’invarianza sotto trasformazioni
del gruppo di Poincaré. Abbiamo poi scoperto che queste equazioni godono di un’altra
importante proprietà, cioè, quella di garantire la conservazione del quadrimomento e del
momento angolare quadridimensionale. A prima vista questi due aspetti – l’invarianza
relativistica e la presenza di leggi di conservazione – non sembrano avere niente a che
fare l’uno con l’altro. Ma in realtà le equazioni dell’Elettrodinamica posseggono un’al-
tra caratteristica fondamentale, che a questo punto appare ancora completamente velata:
esse discendono da un principio variazionale. Come vedremo è proprio questa proprietà
aggiuntiva ad assicurare la validità delle leggi di conservazione – stabilite “a mano” nel ca-
pitolo precedente – e a qualificare definitivamente l’Elettrodinamica come un’interazione
fondamentale.
In questo capitolo rideriveremo dunque le equazioni del moto e le leggi di conservazio-
ne dell’Elettrodinamica usando il metodo variazionale – metodo che in generale fornisce
una descrizione alternativa, compatta e elegante, della dinamica di un generico sistema
fisico. L’importanza che questo metodo riveste in Fisica si desume dal fatto che tutte
le teorie fondamentali, dal Modello Standard delle particelle elementari fino alla Relati-
vità Generale e alla più speculativa Teoria delle Stringhe, sono deducibili da un principio
variazionale: senza un tale principio la consistenza interna di queste teorie sarebbe difficil-
mente controllabile, e non sarebbero garantite le principali leggi di conservazione. Infatti,
come anticipato nella sezione 2.4, la validità del teorema di Noether, che rivela la pro-
fonda connessione esistente in natura tra principi di simmetria e leggi di conservazione,
necessita di un principio variazionale.
Lo strumento fondamentale del metodo variazionale è il principio di minima azione.
Questo principio si basa sulla conoscenza di un’unica funzione delle variabili dinamiche del
sistema – la lagrangiana L – dalla quale per integrazione discende un funzionale, l’azione
I. Il pregio tecnico del metodo consiste nell’estrema economia impiegata nella derivazione
di una teoria fisica: assegnata la sola funzione L il principio di minima determina univo-

64
camente la dinamica del sistema, e il teorema di Noether fornisce poi la forma esplicita
delle leggi di conservazione.
Quantizzazione e invarianza relativistica. C’è un’ulteriore circostanza che conferisce al
metodo variazionale un ruolo fondamentale: è il fatto che esso costituisce il punto di par-
tenza indispensabile per la quantizzazione canonica di una qualsiasi teoria. Ricordiamo,
infatti, che è la lagrangiana a determinare la forma dei momenti coniugati e, attraverso
la trasformata di Legendre, l’hamiltoniana – oggetto su cui si fonda la quantizzazione
canonica di una qualsiasi teoria. Notiamo, tuttavia, che in una teoria relativistica la
quantizzazione canonica non costituisce una procedura covariante a vista, semplicemen-
te perché l’hamiltoniana, essendo la quarta componente di un quadrivettore, non è un
invariante relativistico. D’altra parte per le teorie relativistiche esiste una procedura di
quantizzazione alternativa, quella dell’integrale funzionale di Feynman, che si basa diret-
tamente sull’azione – e quindi non sull’hamiltoniana, ma sulla lagrangiana – e che ha il
pregio di mantenere la teoria quantistica covariante a vista.
Nelle teorie relativistiche il metodo variazionale è soggetto, infatti, a un ulterio-
re vincolo: l’azione deve essere un’invariante per trasformazioni di Poincaré, cioè, un
quadriscalare,
I = I 0.

Sotta questa ipotesi le equazioni del moto che ne derivano soddisfano automaticamente
il principio di relatività einsteiniana. Infatti, secondo il principio di minima azione le
configurazioni che soddisfano le equazioni del moto sono quelle che rendono stazionaria
l’azione – δI = 0 – sotto opportune variazioni delle variabili dinamiche. Schematicamente
abbiamo allora,

Equazioni del moto in K ↔ δI = 0 ↔ δI 0 = 0 ↔ Equazioni del moto in K0 .

Le equazioni del moto hanno quindi automaticamente la stessa forma in tutti i sistemi di
riferimento.
Località. Concludiamo questa nota introduttiva soffermandoci su un aspetto peculiare
della dinamica delle particelle relativistiche, la località dell’interazione. Ricordiamo prima
di tutto che in fisica newtoniana le particelle interagiscono attraverso forze che esercitano

65
un’azione a distanza. Per esempio, una particella di carica e2 esercita su una particella
di carica e1 la forza,
e1 e2 ~y1 − ~y2
F~ = ,
4π |~y1 − ~y2 |3
la quale viene trasmessa istantaneamente: se a un dato istante la seconda particella si
sposta, la prima ne subisce l’effetto allo stesso istante. Un’interazione – non locale – di
questo tipo corrisponde a un segnale che si propaga con velocità infinita, ed è quindi in
conflitto con i principi della Relatività Ristretta. In una teoria relativistica, invece, le
particelle non interagiscono tra di loro direttamente ma attraverso i campi, e l’interazione
tra campi e particelle è un’azione a contatto, ovverosia, locale. Cosı̀ la forza di Lorentz
subita da una particella carica relativistica,

e F µν (y)uν ,

dipende solo dal valore del campo nel punto y µ dello spazio–tempo dove essa si trova, e
non dalle posizioni delle altre particelle o dai valori del campo in altri punti. L’interazione
elettromagnetica tra particelle cariche si propaga quindi con la velocità di propagazione
del campo elettromagnetico, cioè, con la velocità della luce. Per confronto osserviamo
che a livello quantistico la richiesta di località si traduce nel fatto che l’interazione tra
particelle cariche è mediata dai quanti del campo elettromagnetico, ovverosia dai fotoni,
che viaggiano a loro volta con la velocità della luce. L’interazione tra questi ultimi e le
particelle cariche, nella schematizzazione dei grafici di Feynman avviene di nuovo in un
punto, e risulta quindi a sua volta “locale”.
In una teoria relativistica sono quindi i campi a implementare la località dell’inte-
razione, e cosı̀ essi vanno considerati a tutti gli effetti come gradi di libertà dinamici
indipendenti, alla stessa stregua delle coordinate delle particelle: mentre in fisica non
relativistica il concetto di campo è utile, in una teoria relativistica esso è indispensabile.
In conlusione, la formulazione di una teoria fisica attraverso il metodo variazionale
avviene secondo il seguente schema:

I) Individuare l’espressione dell’azione.

II) Derivare le equazioni del moto attraverso il principio di minima azione.

66
III) Usare il teorema di Noether per derivare le leggi di conservazione.

Per quanto detto sopra, in fisica relativistica genericamente avremo a che fare con
un sistema di particelle puntiformi in interazione con un sistema di campi. Un sistema
fisico i cui gradi di libertà consistono di soli campi viene chiamato “teoria di campo”. In
generale dovremo quindi implementare il metodo variazionale per un sistema di particelle
in interazione con una teoria di campo. In questo capitolo svilupperemo dunque prima
il metodo variazionale per una generica teoria di campo che, come vedremo, può essere
considerata come un sistema lagrangiano con un numero infinito di gradi di libertà. Per
questo motivo nel paragrafo che segue ricorderemo brevemente in che cosa consiste il
metodo per un sistema lagrangiano con un numero finito di gradi di libertà, ovverosia, in
meccanica classica.
Nel prossimo capitolo estenderemo infine il principio variazionale a un sistema di
particelle cariche interagenti con il campo elettromagnetico.

3.1 Principio di minima azione in meccanica classica

Consideriamo un sistema meccanico non relativistico, conservativo e olonomo, a N gradi


di libertà, descritto dalle coordinate lagrangiane qn (t), n = 1, · · · , N. Indicheremo le coor-
dinate collettivamente con q = (q1 , · · · , qN ), e le loro derivate prime con q̇ = (q̇1 , · · · , q̇N ),
dove,
dqn
q̇n = .
dt
Sappiamo allora che esiste una funzione di 2N variabili, la lagrangiana L(q, q̇), tale che le
equazioni del moto del sistema meccanico sottostante siano equivalenti alle equazioni di
Lagrange,
d ∂L ∂L
− = 0, n = (1, · · · , N ). (3.1)
dt ∂ q̇n ∂qn
Ricordiamo l’esempio prototipico di un sistema di M particelle non vincolate, con
coordinate cartesiane ~yi (t), i = 1, · · · , M , nel qual caso le coordinate lagrangiane sono date
da q = (~y1 , · · · , ~yM ), e N = 3M . Se indichiamo il potenziale di interazione reciproca con
P
V (q), e l’energia cinetica totale delle particelle con T (q̇) = 21 i mi vi2 , allora la lagrangiana

67
di questo sistema è data da,
L(q, q̇) = T − V.

Fissiamo ora due estremi temporali t1 < t2 , e associamo alla generica lagrangiana L il
seguente funzionale I delle leggi orarie q(t), chiamato azione,
Z t2
I[q] = L(q(t), q̇(t)) dt. (3.2)
t1

Possiamo allora dimostrare il principio di minima azione, detto anche principio di Hamil-
ton.
Principio di minima azione: le leggi orarie q(t) soddisfano le equazioni di Lagrange
(3.1) nell’intervallo [t1 , t2 ], se e solo se esse rendono l’azione I[q] stazionaria per variazioni
δq = (δq1 , · · · , δqN ) arbitrarie purché nulle agli estremi, vale a dire,

δqn (t1 ) = 0 = δqn (t2 ).

Prima di dimostrare il principio spieghiamo la terminologia usata nell’enunciato. In-


nanzitutto specifichiamo che le δqn (t) indicano N funzioni reali del tempo con le stesse
proprietà di regolarità delle qn (t). Introduciamo poi il concetto di “variazione dell’azione”
11
δI attorno a una configurazione q, per delle variazioni δq assegnate. Poniamo ,
¯
d ¯
δI ≡ I[q + α δq]¯¯ , (3.3)
dα α=0

dove α è un parametro reale. Siccome l’azione (3.2) è data dall’integrale di una funzione
delle q e q̇ che supponiamo essere sufficientemente regolare, la (3.3) equivale a,

I[q + α δq] − I[q] ³ ´


δI = lim = I[q + δq] − I[q] . (3.4)
α→0 α lin

Con l’ultima espressione intendiamo la quantità I[q + δq] − I[q] sviluppata in serie di
Taylor attorno a q, e arrestata al termine lineare in δq. Per calcolare δI userermo in
pratica sempre la (3.4), tralasciando il pedice “lin”.
Si dice, infine, che la configurazione q rende l’azione I stazionaria per delle variazioni
δq date, se risulta δI = 0.
11
Si tenga presente che δI è in realtà un funzionale delle 2N funzioni q e δq, e andrebbe quindi
propriamente indicato con δI[q, δq].

68
Passiamo ora a dimostrare il principio di minima azione calcolando la variazione δI
usando la (3.4),
Z
t2 ³ ´
δI = I[q + δq] − I[q] = L(q + δq, q̇ + δ q̇) − L(q, q̇) dt
t
Z t2 Z t2 X1µ ¶
∂L ∂L d δqn
= δL dt = δqn + dt
t1 t1 n
∂qn ∂ q̇n dt
Z t2 X µ µ ¶ ¶
∂L d ∂L d ∂L
= δqn + δqn − δqn dt
t1 n
∂q n dt ∂ q̇ n dt ∂ q̇ n
Z t2 X µ ¶ ¯t2
∂L d ∂L X ∂L ¯
= − δqn dt + δqn ¯¯ .
t1 n
∂qn dt ∂ q̇n n
∂ q̇n t1

Se vale δqn (t1 ) = 0 = δqn (t2 ) l’ultima sommatoria è nulla. Si conclude allora che δI = 0
per variazioni δqn arbitrarie nell’intervallo aperto (t1 , t2 ), se e solo se le qn (t) soddisfano
le equazioni di Lagrange (3.1) nell’intervallo [t1 , t2 ].

3.2 Principio di minima azione in teoria di campo

Una teoria classica di campo è descritta da un certo numero di funzioni dello spazio–tempo,
ϕr (t, ~x) ≡ ϕr (x), r = 1, · · · , N , i – campi lagrangiani – che indicheremo collettivamente
con ϕ = (ϕ1 , · · · , ϕN ). Questi campi descrivono completamente il sistema nel senso che
ogni grandezza fisica osservabile potrà esprimersi in funzione di essi, ma in generale essi
stessi non sono necessariamente osservabili. Nel caso dell’Elettrodinamica, per esempio,
i campi lagrangiani non saranno i campi elettrico e magnetico bensı̀ le componenti del
quadripotenziale, ϕ = (A0 , A1 , A2 , A3 ), legate ai primi dalla relazione (2.22). In questo
caso i campi lagrangiani non sono osservabili perché sono definiti modulo trasformazioni
di gauge, mentre le componenti del tensore F µν sono gauge invarianti e costituiscono
grandezze osservabili.
Scrivendo ϕr (t, ~x) ≡ qr,~x (t) e identificando la coppia (r, ~x) con “l’indice” n del caso
finito dimensionale, possiamo pensare l’insieme dei campi come un sistema lagrangiano
con un numero infinito di gradi di libertà. Anche in una teoria di campo cercheremo
quindi di derivare la dinamica del sistema da un principio di minima azione, a partire
da un’azione I[ϕ] che sarà ora un funzionale dei campi. In questo caso partiremo da
una densità lagrangiana L, in seguito chiamata ancora semplicemente lagrangiana, che in

69
analogia con il caso finito dimensionale sarà funzione dei campi ϕ e delle loro derivate
ϕ̇ = ∂0 ϕ. Tuttavia, se vogliamo che l’azione sia un’invariante relativistico, allora la
lagrangiana dovrà dipendere necessariamente da tutte le derivate parziali ∂µ ϕ,

L(ϕ(x), ∂ϕ(x)).

La lagrangiana L, propriamente detta, sarà allora ottenuta sommando su tutti i gradi di


libertà, ovverosia integrando la densità lagrangiana sulla coordinata spaziale ~x,
Z
L(t) = L(ϕ(x), ∂ϕ(x)) d3 x.

Definiamo, infine, l’azione della teoria di campo come,


Z t2 Z t2
I[ϕ] = L(t) dt = L(ϕ(x), ∂ϕ(x)) d4 x. (3.5)
t1 t1

Per questa azione vogliamo ora formulare un principio variazionale, analogo al principio
di minima azione per un sistema a finiti gradi di libertà. Come in quel caso supponiamo
che le funzioni ϕ(x) e L(ϕ, ∂ϕ) siano sufficientemente regolari in modo tale che la (3.4),
opportunamente generalizzata, sia ancora valida, ma oltre a questo imponiamo opportune
condizioni asintotiche su queste funzioni. Più precisamente richiediamo che all’infinito
spaziale i campi e le loro derivate si annullino con sufficiente rapidità. In particolare
avremo,
lim ϕr (t, ~x) = 0. (3.6)
|~
x|→∞

Supponiamo inoltre che la lagrangiana si annulli con sufficiente rapidità per ϕ → 0, di


modo tale che nella (3.5) l’integrale nella variabile ~x su tutto R3 esista finito.
Le equazioni analoghe alle (3.1) per la lagrangiana L sono allora le equazioni di Eulero–
Lagrange,
∂L ∂L
∂µ − = 0, (3.7)
∂(∂µ ϕr ) ∂ϕr
equazioni che vanno riguardate come le equazioni del moto dei campi. Possiamo allora
enunciare il principio variazionale per una teoria classica di campo.
Principio di minima azione in teoria di campo: le leggi orarie ϕr (t, ~x) soddisfano le
equazioni di Eulero–Lagrange nell’intervallo [t1 , t2 ], se e solo se esse rendono l’azione I[ϕ]

70
stazionaria per variazioni δϕr arbitrarie purché nulle agli estremi, vala a dire δϕr (t1 , ~x) =
0 = δϕr (t2 , ~x), per ogni ~x.
La stazionarietà del funzionale I[ϕ] rispetto a variazioni δϕr è definita in modo comple-
tamente analogo alla stazionarietà del funzionale I[q] rispetto a variazioni δqn , vedi (3.3)
e la discussione susseguente. È inoltre sottinteso che le variazioni δϕr che prendiamo in
considerazione hanno le stesse proprietà di regolarità e le stesse proprietà asintotiche dei
campi ϕr .
Per dimostrare il principio calcoliamo dapprima la variazione di (3.5) per variazioni
δϕr arbitrarie dei campi,
¯
d ¯
δI = I[ϕ + α δϕ]¯¯ = I[ϕ + δϕ] − I[ϕ]
dα α=0
Z t2 ³ ´
= L(ϕ + δϕ, ∂ϕ + δ∂ϕ) − L(ϕ, ∂ϕ) d4 x
t
Z 1t2 Z t2 X µ ¶
4 ∂L ∂L
= δL d x = δϕr + δ ∂µ ϕr d4 x.
t1 t1 r
∂ϕ r ∂(∂ ϕ
µ r )

Siccome per definizione abbiamo,

δ ∂µ ϕr = ∂µ (ϕr + δϕr ) − ∂µ ϕr = ∂µ δϕr ,

usando la regola di Leibnitz si ottiene,


Z t2 X µ ¶ Z t2 X µ ¶
∂L ∂L 4 ∂L
δI = − ∂µ δϕr d x + ∂µ δϕr d4 x. (3.8)
t1 r
∂ϕ r ∂(∂ ϕ
µ r ) t1 r
∂(∂ ϕ
µ r )

Il secondo integrale, il cui integrando è una quadridivergenza, è nullo. Per dimostrarlo


usiamo il teorema fondamentale del calcolo nella variabile temporale, e il teorema di Gauss
tridimensionale con una superficie chiusa Γ∞ posta all’infinito spaziale,
Z t2 X µ ¶ ¯t2 Z µZ ¶
∂L XZ ∂L ¯ X t2 ∂L
∂µ 4
δϕr d x = 3
dx ¯
δϕr ¯ + i
δϕr dΣ dt.
t1 r
∂(∂ µ ϕ r ) r
∂ ϕ̇r t 1 r t 1 Γ ∞
∂(∂ i ϕ r )

Il primo termine a secondo membro è nullo se le variazioni δϕr si annullano sugli iperpiani
t = t1 e t = t2 , mentre il secondo termine è nullo perché all’infinito spaziale i campi
svaniscono. La (3.8) si riduce allora al primo integrale, e vediamo che δI si annulla per
qualsiasi scelta delle δϕr se e solo se i campi soddisfano le equazioni di Eulero–Lagrange.

71
3.2.1 Ipersuperfici nello spazio di Minkowski

In questo paragrafo introduciamo alcune nozioni riguardanti le ipersuperfici in quattro


dimensioni, di cui ci serviremo in seguito.
Per definizione un’ipersuperficie Γ nello spazio quadridimensionale di Minkowski è un
sottoinsieme – per essere più precisi, una sottovarietà – di R4 di dimensione tre. In forma
parametrica un’ipersuperficie è descritta da quattro funzioni di tre parametri,

xµ (λ), (3.9)

dove con λ indichiamo la terna {λa }, con a = 1, 2, 3. Alternativamente essa può essere
rappresentata in forma implicita in termini di un’unica funzione scalare f (x) attraverso,

xµ ∈ Γ ⇔ f (x) = 0.

Si passa da una rappresentazione all’altra, per esempio, invertendo le funzioni spaziali


~x(λ) nella (3.9) per determinare i parametri λ(~x) come funzioni di ~x, e definendo poi,

f (x) ≡ x0 − x0 (λ(~x)).

Useremo una rappresentazione o l’altra a seconda della convenienza. Si noti comunque


che vale identicamente,
f (x(λ)) = 0. (3.10)

Una classe importante di ipersuperfici è costituita dagli iperpiani, che in forma impli-
cita sono descritti da una funzione del tipo,

f (x) = Mµ (xµ − xµ0 ) = 0, (3.11)

dove Mµ e xµ0 sono vettori costanti. L’iperpiano corrispondente a (3.11) passa per il punto
xµ0 ed è ortogonale al vettore Mµ .
Vettori tangenti e normali. In un generico punto P ≡ xµ (λ) ∈ Γ i tre vettori,
∂xµ (λ)
Vaµ ≡ , (3.12)
∂λa
costituiscono una base per lo “spazio tangente”, sicché un generico vettore tangente a Γ
in P può essere scritto come combinazione lineare di questi,
3
X
µ
V = ca Vaµ ,
a=1

72
per certi coefficienti ca . Sempre in P possiamo anche definire il “vettore normale” a Γ,
come il vettore Nµ (λ) ortogonale a tutti i vettori tangenti,

Nµ Vaµ = 0, ∀ a. (3.13)

Per come l’abbiamo definito Nµ è determinato a meno di un fattore di normalizzazione.


Differenziando l’identità (3.10) rispetto a λa si ottiene,
∂f ∂xµ ∂f µ
0= = V ,
µ
∂x ∂λ a ∂xµ a
sicchè otteniamo per Nµ la semplice espressione,
∂f
Nµ = .
∂xµ
A questo punto siamo in grado di definire i tre tipi di ipersuperficie che ci interesseranno
in seguito.
Definizione. Un’ipersuperficie Γ si dice di tipo spazio, tempo o nullo, se in ogni punto
di Γ vale rispettivamente,

N 2 > 0, N 2 < 0, N 2 = 0,

caratteristiche che sono evidentemente invarianti sotto trasformazioni di Lorentz.


Ipersuperfici di tipo spazio. Per un’ipersuperficie di tipo spazio abbiamo N 2 > 0, e di
conseguenza i vettori tangenti sono tutti di tipo spazio. Per vederlo è sufficiente sfruttare
il fatto che se N 2 > 0, allora per ogni punto P ∈ Γ esiste un sistema di riferimento in
cui il vettore normale ha la forma Nµ = (N0 , 0, 0, 0). La condizione Nµ V µ = 0 comporta
allora che in questo sistema di riferimento si ha V 0 = 0, e quindi,

V 2 < 0.

Si può inoltre far vedere che un’ipersuperficie Γ è di tipo spazio, se e solo se per ogni
coppia di punti (x, y) appartenenti a Γ vale,

(x − y)2 < 0.

Questa caratterizzazione alternativa è immediata nel caso degli iperpiani (3.11), per cui
si ha,
∂f
Nµ = = Mµ .
∂xµ
73
Infatti, se x e y appartengono a Γ e M 2 > 0, allora la (3.11) implica che,

(xµ − y µ )Mµ = 0 ⇒ (x − y)2 < 0,

ed è facile convincersi che vale anche il viceversa. Nel caso particolare in cui M µ =
(1, 0, 0, 0) otteniamo gli iperpiani a tempo costante,

f (x) = Mµ (xµ − xµ0 ) = t − t0 = 0,

che sono le particolari ipersuperfici di tipo spazio che abbiamo usato per definire l’azione
(3.5). In forma parametrica, vedi (3.9), questi iperpiani si scrivono,

x0 (λ) = t0 , xi (λ) = λi . (3.14)

Ipersuperfici di tipo tempo. Per un’ipersuperficie di tipo tempo abbiamo N 2 < 0,


ma in questo caso i vettori tangenti possono essere di tipo spazio, tempo o nullo. Se
consideriamo, per esempio, l’iperpiano con M µ = (0, 0, 0, 1) la condizione V µ Mµ = 0
dà V µ = (V 0 , V x , V y , 0), e V 2 può quindi essere positivo, negativo o nullo. Un’altra
ipersuperficie di tipo tempo è rappresentata dalla funzione,

1 2
f (x) = (~x − R2 ) = 0, Nµ = (0, ~x), N 2 = −|~x|2 < 0,
2

che corrisponde alla sfera di raggio R al variare del tempo. Per R → ∞ questa ipersu-
perficie corrisponde a una “ipersuperficie di tipo tempo all’infinito spaziale”, un tipo di
ipersuperficie che incontreremo tra poco.
L’elemento di ipersuperficie. In seguito faremo uso del teorema di Gauss in quattro
dimensioni, e quindi ci servirà l’elemento di ipersuperficie tridimensionale. Consideriamo
dunque l’integrale della quadridivergenza di un vettore W µ su un volume quadridimen-
sionale V , con bordo l’ipersuperficie Γ ≡ ∂V . Se parametrizziamo Γ come in (3.9) allora
il teorema di Gauss – che riportiamo senza dimostrazione – asserisce che,
Z Z
∂µ W d x = W µ dΣµ ,
µ 4
(3.15)
V Γ

dove l’elemento di ipersuperficie tridimensionale è dato da, vedi (3.12),

dΣµ = εµαβγ V1γ V2β V3α d3 λ.

74
Siccome vale identicamente,
³ ´
Vaµ εµαβγ V1γ V2β V3α = 0, ∀ a,

concludiamo che,
εµαβγ V1γ V2β V3α = Nµ ,

dove un’eventuale costante di normalizzazione è stata assorbita nel vettore normale Nµ .


Abbiamo quindi,
dΣµ = Nµ d3 λ.

~ = ~n dΣ.
Si noti l’analogia con la forma dell’elemento di superficie bidimensionale, dΣ
Se una falda di Γ è costituita da un’iperpiano a tempo costante, vedi (3.14), allora è
immediato vedere che su questa falda dΣµ si riduce a,

dΣ0 = d3 λ ≡ d3 x, dΣi = 0,

come c’era da aspettarsi. Il corrispondente contributo all’integrale (3.15) diventa allora,


Z ¯
0 3 ¯
¯
W d x¯ .
t=t0

3.2.2 Invarianza relativistica

Fino a questo punto non abbiamo fatto nessuna ipotesi sulle proprietà di invarianza della
teoria di campo in considerazione. In questo paragrafo analizzeremo alcune caratteristiche
importanti del principio di minima azione, nel caso particolare di una teoria di campo
relativistica.
Principio di minima azione covariante a vista. Nel caso di una teoria di campo re-
lativistica ci aspettiamo che le equazioni del moto siano covarianti a vista. A questo
proposito notiamo che se i campi sono suddivisi in multipletti tensoriali e se L è un inva-
riante relativistico, cioè, un campo scalare, allora le equazioni di Eulero–Lagrange (3.7)
sono effettivamente covarianti a vista. In una teoria relativistica richiederemo dunque che
la lagrangiana sia uno scalare sotto trasformazioni di Poincaré, vale a dire,

L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 )) = L(ϕ(x), ∂ϕ(x)), x0 = Λx + a. (3.16)

75
Possiamo allora domandarci se anche l’azione sia uno scalare – come richiesto nell’intro-
duzione a questo capitolo. In realtà dalla scrittura (3.5) emerge un’ostruzione immediata
all’invarianza di I: mentre la misura dell’integrale è invariante,

d4 x0 = |detΛ| d4 x = d4 x,

la regione d’integrazione non lo è affatto, in quanto la variabile temporale è integrata


su un intervallo finito. Tuttavia, non è difficile ovviare a questo problema. È sufficiente
sostituire nella (3.5) gli iperpiani t = t1 e t = t2 , che delimitano la regione d’integrazione
quadridimensionale, con due generiche ipersuperfici di tipo spazio Γ1 e Γ2 che non si
intersecano. Un iperpiano a tempo costante è in effetti una particolare ipersuperficie di
tipo spazio, che in seguito a una trasformazione di Poincaré non sarà più un iperpiano
a tempo costante, ma resterà pur sempre un’ipersuperficie di tipo spazio. Consideriamo
allora l’azione generalizzata,
Z Γ2
I[ϕ] = L(ϕ(x), ∂ϕ(x)) d4 x, (3.17)
Γ1

che grazie a (3.16) è ora un invariante relativistico,


Z Γ02 Z Γ2
0 0 0 0 0 0 4 0
I = L(ϕ (x ), ∂ ϕ (x )) d x = L(ϕ(x), ∂ϕ(x)) d4 x = I.
Γ01 Γ1

Possiamo allora formulare un principio di minima azione covariante a vista, richiedendo


che l’azione (3.17) sia stazionaria per variazioni δϕr arbitrarie, purché nulle su Γ1 e Γ2 .
La versione relativisticamente invariante della condizione asintotica (3.6) è invece,

lim ϕr (x) = 0. (3.18)


x2 →− ∞

È poi evidente che il principio di minima azione basato sulla (3.17) fornisce come equazioni
del moto ancora le equazioni di Eulero–Lagrange (3.7).
Quadridivergenze. Aggiungiamo ora un commento riguardo all’esistenza e all’unicità
della lagrangiana. Data L, le equazioni del moto (3.7) sono ovviamente univocamente
determinate, ma spesso si deve affrontare il problema inverso: dato un insieme di equazioni
del moto per i campi, si cerca una lagrangiana da cui esse discendano. È chiaro che per
un insieme arbitrario di equazioni del moto – seppure relativistiche – questo problema

76
in generale non ammette nessuna soluzione, nel senso che non esiste nessuna lagrangiana
per cui queste equazioni possano essere poste nella forma (3.7). D’altra parte, se una tale
lagrangiana esiste – come per tutte le teorie fisiche fondamentali – è facile vedere che in
generale essa non è unica. In particolare, se a e b sono costanti reali è immediato verificare
che le lagrangiane L e,
Lb = a L + b,

danno luogo alle stesse equazioni di Eulero–Lagrange.


Un’ambiguità un po’ meno ovvia è costituita, invece, dall’aggiunta di una quadridi-
vergenza,
Lb = L + ∂µ C µ (ϕ),

dove le C µ (ϕ) sono quattro funzioni arbitrarie dei campi, con le stesse proprietà di rego-
larità di L. Possiamo, infatti, fare vedere che Lb e L danno luogo alle stesse equazioni di
Eulero–Lagrange. A questo scopo calcoliamo la differenza tra le azioni associate alle due
lagrangiane, e applichiamo il teorema di Gauss quadridimensionale,
Z Γ2 Z Γ2 Z Γ2 Z
Ib − I = Lb d4 x − 4
Ld x = µ 4
∂µ C d x = C µ dΣµ .
Γ1 Γ1 Γ1 ∂V4

V4 indica il volume di integrazione quadridimensionale il cui bordo è composto da Γ1 e Γ2 ,


e da un’ipersuperficie di tipo tempo posta all’infinito spaziale, Γ∞ , si veda il paragrafo
precedente. Si ha allora,
Z Z Z
Ib − I = µ
C dΣµ − µ
C dΣµ + C µ dΣµ .
Γ2 Γ1 Γ∞

L’integrale su Γ∞ è nullo per via della condizione asintotica (3.18). Viceversa, i primi due
integrali sono diversi da zero, ma coinvolgono solo i valori dei campi sulle ipersuperfici Γ1
e Γ2 , che nel principio di minima azione sono tenuti fissi. Abbiamo quindi δ(Ib − I) = 0,
cioè,
δ Ib = δI,

e le due azioni danno quindi luogo alle medesime equazioni di Eulero–Lagrange. In con-
clusione possiamo affermare che tutte le lagrangiane che differiscono per una quadridiver-
genza sono fisicamente equivalenti.

77
Località. Concludiamo questo paragrafo con un’ulteriore restrizione sul tipo di lagran-
giane che ammetteremo in una teoria relativistica di campo. Alla richesta di invarianza
relativistica aggiungeremo, infatti, quella di località, analoga alla richiesta di “azione a con-
tatto” tra particelle e campi, discussa nell’introduzione a questo capitolo. Nel caso di una
teoria di campo la località richiede che la lagrangiana sia data da una somma di prodotti
dei campi e delle loro derivate prime, valutati nello stesso punto dello spazio–tempo.
Illustriamo questa richiesta nel caso di una teoria di campo con due campi scala-
ri, ϕ1 (x) ≡ A(x), e ϕ2 (x) ≡ B(x). In questo caso ammetteremo, per esempio, una
lagrangiana del tipo,

1 1
L1 = ∂µ A(x) ∂ µ A(x) + ∂µ B(x) ∂ µ B(x) − g A2 (x) B 2 (x), (3.19)
2 2

mentre non accetteremo la lagrangiana,


Z
1 1
L2 = ∂µ A(x) ∂ µ A(x) + ∂µ B(x) ∂ µ B(x) − gN A2 (x) [(x − y)2 ]N B 2 (y) d4 y,
2 2
(3.20)

dove gN è una “costante di accoppiamento” reale, e N è un intero positivo. Infatti, mentre


in L1 il campo A(x) è “in contatto” con il campo B valutato nello stesso punto x, in L2
il campo A(x) è in contatto con B(y) per un qualsiasi valore di y. Dal punto di vista
delle equazioni di Eulero–Lagrange questo vorrebbe dire che la dinamica di A nel punto
x è influenzata dai valori di B in tutti i punti dello spazio, in contrasto con la “località”
dell’interazione.
Ribadiamo, comunque, che la lagrangiana L2 è uno scalare sotto trasformazioni di
Poincaré, e che darebbe dunque luogo a equazioni del moto relativistiche ben definite.
Sussiste, tuttavia, un ulteriore motivo che ci porta a rigettare lagrangiane come queste. Il
fatto è che lagrangiane come (3.20) non hanno carattere “fondamentale”: l’intero N che
ivi compare è completamente arbitrario, anzi, potremmo sostituire il fattore gN [(x − y)2 ]N
con una qualsiasi funzione f (x, y) invariante sotto il gruppo di Poincaré. Sviluppata in
serie di Taylor una tale funzione ha la forma generale,

X
f (x, y) = gN [(x − y)2 ]N ,
N =0

78
ed essa introdurrebbe quindi un numero infinito di costanti di accoppiamento gN inde-
terminate. Per mantenere il carattere predittivo della teoria la forma della f , ovvero il
valore delle costanti gN , dovrebbe allora essere dedotta da una teoria “più fondamentale”.
Lagrangiane del tipo L2 rappresentano infatti tipicamente teorie effettive, vale a dire teo-
rie approssimate che riproducono correttamente i risultati sperimentali solo in particolari
regimi fisici, per esempio a basse o ad alte energie.
Consistenza quantistica. Le restrizioni più forti sulla scelta delle lagrangiane relativi-
stiche permesse provengono, tuttavia, dall’approccio della teoria quantistica relativistica
di campo. Nell’ambito di questo approccio si dimostra, infatti, che le lagrangiane classiche
che a livello quantistico danno luogo a teorie consistenti devono essere:
a) invarianti sotto trasformazioni di Poincaré,
b) locali,
c) polinomi nei campi e nelle loro derivate, di ordine massimo quattro.
Queste restrizioni limitano di molto la forma delle lagrangiane permesse, e insieme ad
altre richeste di invarianza spesso permettono di determinarle univocamente. Esempi ne
sono le lagrangiane “fondamentali” che descrivono le interazioni elettrodeboli e quelle forti.
Al contrario, la lagrangiana che nell’ambito della Relatività Generale descrive l’interazione
gravitazionale soddisfa le richiesta a) e b) ma non la c) – la causa essendo la complicata
autointerazione del campo gravitazionale. È questo il motivo per cui, con le conoscenze
che abbiamo acquisito fino ad oggi, questa interazione appare tuttora in conflitto con le
leggi della Meccanica Quantistica.

3.2.3 La lagrangiana per l’equazione di Maxwell

In questo paragrafo illustriamo il metodo variazionale derivando le equazioni che gover-


nano la dinamica del campo elettromagnetico da un principio di minima azione. In linea
di principio si tratta quindi di ottenere le equazioni (2.13) e (2.14) come equazioni di
Eulero–Lagrange relative ad un’opportuna lagrangiana. La prima questione da affrontare
riguarda allora la scelta dei campi lagrangiani ϕr . Siccome le (2.13), (2.14) corrispon-
dono a otto equazioni dovremmo avere altrettanti campi lagrangiani. La scelta naturale
ϕr ≡ F µν – che tra l’altro avrebbe il pregio di introdurre solo campi osservabili – è dunque

79
esclusa, perché il tensore di Maxwell corrisponde non a otto ma solo a sei campi indipen-
~ e B.
denti, vale a dire E ~ Questa strada risulta quindi impraticabile, si veda in particolare

il problema 3.9, e dobbiamo cercarne un’altra.


Una strategia alternativa consiste nel procedere come anticipato nei paragrafi 2.2.2 e
2.2.3. Risolviamo, cioè, l’identità di Bianchi attraverso,

Fµν ≡ ∂µ Aν − ∂ν Aµ ,

e consideriamo come campi lagrangiani le componenti del quadripotenziale,

ϕr = Aµ , (3.21)

r = µ = (0, 1, 2, 3). Secondo questa strategia il principio di minima azione dovrebbe allora
dare luogo alle equazioni di Maxwell,

∂µ F µν − j ν = 0, (3.22)

come equazioni di Eulero–Lagrange associate a un’opportuna lagrangiana L. Si noti che


la scelta dei campi lagrangiani (3.21) è ora consistente con il fatto che le equazioni (3.22)
sono quattro in numero.
Il problema si riduce allora a trovare una lagrangiana L(A, ∂A), polinomiale in A e
∂A, tale che le equazioni di Eulero–Lagrange ad essa associate,

∂L ∂L
∂µ − = 0, (3.23)
∂(∂µ Aν ) ∂Aν

equivalgano alle (3.22). La lagrangiana che cerchiamo dovrà essere certamente un in-
variante relativistico, ma dato che abbiamo risolto l’identità di Bianchi introducendo il
potenziale vettore, essa dovrà essere altresı̀ invariante per trasformazioni di gauge,

A0µ = Aµ + ∂µ Λ,

modulo quadridivergenze. Per quanto riguarda, invece, la corrente assumeremo solo che
essa sia conservata, ∂µ j µ = 0, e che non dipenda da Aµ . Per individuare lo scalare L pro-
cediamo in modo euristico, sfruttando la struttura della (3.22). Il primo termine di questa
equazione è lineare in Aµ , mentre il secondo ne è indipendente. Corrispondentemente la

80
lagrangiana dovrà contenere un termine quadratico in Aµ , L1 , e uno lineare in Aµ , L2 .
Considerata poi la forma particolare dei due termini nella (3.22) L1 dovrà contenere due
derivate, mentre L2 dovrà esserne privo.
Cerchiamo ora di determinare L1 . Questo termine deve contenere le derivate del
quadripotenziale. L’invarianza di gauge impone allora che esso dipende da Aµ solo attra-
verso il campo gauge–invariante F µν , e in definitiva L1 deve allora essere quadratico in
quest’ultimo. In effetti abbiamo due invarianti quadratici a disposizione,

F µν Fµν e εµνρσ Fµν Fρσ .

Tuttavia, grazie all’identità di Bianchi il secondo invariante corrisponde a una quadridi-


vergenza,

εµνρσ Fµν Fρσ = 2 εµνρσ ∂µ Aν Fρσ = 2∂µ ( εµνρσ Aν Fρσ ) − 2Aν ( εµνρσ ∂µ Fρσ )

= 2∂µ ( εµνρσ Aν Fρσ ) . (3.24)

12
Esso dà quindi un contributo irrilevante alla lagrangiana . Possiamo quindi concludere
che L1 è proporzionale a F µν Fµν .
Consideriamo ora L2 . Questo termine deve essere lineare in Aµ e coinvolgere la corrente
jµ . L’unico scalare che possiamo formare con queste quantità è L2 ∝ Aµ j µ . Verifichiamone
l’invarianza di gauge,

A0µ j µ = Aµ j µ + ∂µ Λj µ = Aµ j µ + ∂µ (Λj µ ) − Λ ∂µ j µ .

Siccome la corrente è conservata vediamo che L2 è in effetti gauge invariante – modulo


una quadridivergenza.
Per ottenere l’equazione di Maxwell con i coefficienti corretti poniamo,
1
L = L1 + L2 = − F µν Fµν − j ν Aν . (3.25)
4
Verifichiamo ora che con questa scelta per L le equazioni (3.23) corrispondono proprio
∂L
all’equazione di Maxwell. Al termine ∂Aν
contribuisce solo L2 ,
∂L
= −j ν ,
∂Aν
12
Il termine εµνρσ Fµν Fρσ in realtà è uno pseudoscalare e, anche se non fosse una quadridivergenza,
contribuirebbe all’equazione del moto con un termine pseudovettoriale, mentre l’equazione di Maxwell è
vettoriale.

81
∂L
mentre alla derivata ∂(∂µ Aν )
contribuisce solo L1 . Per determinarla è conveniente calcolare
la variazione di L1 per una variazione infinitesima di ∂A,
1 1
δL1 = − F µν δFµν = − F µν (δ∂µ Aν − δ∂ν Aµ ) = −F µν δ(∂µ Aν ),
2 2
e quindi,
∂L
= −F µν . (3.26)
∂(∂µ Aν )
In definitiva otteniamo,
∂L ∂L
∂µ − = −∂µ F µν + j ν = 0, (3.27)
∂(∂µ Aν ) ∂Aν
che è l’equazione di Maxwell.
Il ruolo del potenziale vettore. Concludiamo questa deduzione con un commento sul
ruolo del potenziale vettore in Elettrodinamica, classica e quantistica. Intanto insistiamo
sul fatto che a livello classico l’equazione di Maxwell e l’identità di Bianchi di per sé
possono essere formulate, e risolte, senza mai introdurre il potenziale vettore, in quanto
quest’ultimo costituisce solo un ausilio “utile”. Al contrario, se vogliamo far discende-
re queste equazioni da un principio variazionale allora – come abbiamo appena visto –
l’introduzione del potenziale vettore risulta indispensabile. Ma il principio variazionale
costituisce, a sua volta, il punto di partenza irrinunciabile per la quantizzazione di una
qualsiasi teoria: concludiamo cosı̀ che, mentre a livello classico l’uso del potenziale vetto-
re è un “optional”, a livello quantistico la sua introduzione è inevitabile. Considerazioni
completamente analoghe valgono per il ruolo dei potenziali vettore nelle altre interazioni
fondamentali.
Sui mediatori delle interazioni deboli e forti. Chiudiamo questo paragrafo con un com-
mento sulla struttura della lagrangiana (3.25) nel caso particolare di corrente nulla, j µ = 0.
In questo caso l’equazione (3.22) descrive il campo di Maxwell nel vuoto, disaccoppiato
da qualsiasi carica, ovvero un campo “libero”. La lagrangiana,
1
L1 = − F µν Fµν ,
4
descrive quindi un campo di gauge libero. Come abbiamo visto la struttura di questa
lagrangiana è essenzialmente determinata dai principi di invarianza relativistica e di inva-
rianza di gauge. Non stupisce allora che anche la propagazione libera dei mediatori delle

82
interazioni deboli e forti, che sono soggette agli stessi principi, sia descritta da lagrangiane
completamente analoghe. Ai mediatori delle interazioni deboli Z 0 e W ± sono associati ri-
spettivamente il campo di gauge reale Zµ0 , e i campi di gauge complessi Wµ± = (W1µ ±i W2µ ),
con i corrispondenti tensori di Maxwell,
0
Fµν = ∂µ Zν0 − ∂ν Zµ0 , ±
Fµν = ∂µ Wν± − ∂ν Wµ± ,

mentre agli otto mediatori delle interazioni forti sono associati i campi gluonici AIµ , I =
1, · · · , 8, con i relativi tensori di Maxwell,
I
Fµν = ∂µ AIν − ∂ν AIµ .

La lagrangiana totale che descrive la propagazione libera di tutti questi campi risulta
allora, Ã !
8
X
1
L0 = − F µν Fµν + F 0µν F 0 µν + F +µν F − µν + F Iµν F I µν .
4 I=1
La lagrangiana “libera” L1 dà luogo alle equazioni di Maxwell nel vuoto ∂µ F µν = 0, le
cui soluzioni sono onde (elettromagnetiche), che si propagano con la velocità della luce. Di
conseguenza i mediatori associati hanno massa nulla. Ma mentre i fotoni e i gluoni sono
effettivamente particelle prive di massa, i mediatori delle interazioni deboli sono in realtà
massivi. La lagrangiana L0 andrà allora completata con l’aggiunta di un termine Lm ,
dipendente solo da Wµ± e Zµ0 , che tenga conto delle masse mW e mZ di queste particelle.
Si può vedere che questo termine deve essere dato da, vedi anche il problema 3.1,
1 ¡ 2 ¢
Lm = 2
mW Wµ+ W −µ + m2Z Zµ0 Z 0µ , (3.28)
2~
dove la presenza della costante di Planck ~ è suggerita da motivi dimensionali. D’al-
tra parte si verifica immediatamente che l’espressione in (3.28) non è invariante sotto le
trasformazioni di gauge,

Wµ± → Wµ± + ∂µ Λ± , Zµ0 → Zµ0 + ∂µ Λ0 ,

e anche la lagrangiana totale L0 +Lm romperebbe quindi questa invarianza. Per quello che
concerne le interazioni deboli si può, tuttavia, vedere che questa rottura della simmetria
non inficia la consistenza della teoria, se essa avviene in modo “spontaneo”. Per maggiori
dettagli su questo argomento e per la giustificazione della (3.28) rimandiamo a un testo
di particelle elementari.

83
3.3 Il Teorema di Noether

Il Teorema di Noether asserisce in generale che a ogni gruppo a un parametro di simmetrie


di una teoria fisica, corrisponde una costante del moto, cioè, una quantità conservata.
A titolo di esempio ricordiamo che in una teoria invariante per traslazioni temporali si
conserva l’energia, mentre se essa è invariante per rotazioni spaziali si conserva il momento
angolare.
Prima di proseguire specifichiamo meglio cosa intendiamo con “invarianza di una
teoria”, nel contesto del teorema di Noether. In primo luogo si potrebbe intendere
l’invarianza delle equazioni del moto che governano la dinamica della teoria, sotto l’azio-
ne del gruppo di simmetria. Tuttavia vedremo che questa richiesta risulta genericamente
troppo debole, perché l’invarianza delle equazioni del moto in generale non è sufficiente
per garantire la presenza di costanti del moto. Il teorema di Noether si basa, infatti, sulle
ipotesi più restrittive che,
1) le equazioni del moto discendano da un principio variazionale,
2) l’azione associata sia invariante sotto il gruppo di simmetrie.
Come abbiamo visto in teoria di campo l’azione è data a sua volta in termini di una
lagrangiana,
Z
I= L d4 x.

Per le teorie di campo considerate da noi l’invarianza dell’azione sarà poi sempre conse-
13
guenza dell’invarianza della misura d’integrazione e, separatamente, della lagrangiana
– modulo quadridivergenze .
Un’altro aspetto importante, peculiare del teorema di Noether in teoria di campo, è
che esso assicura la conservazione locale della grandezza fisica in questione. Questo vuol
dire che si conserva non solo una “carica” totale, ma che la conservazione è conseguenza
di un’equazione di continuità. Per ogni gruppo di simmetrie a un parametro il teorema
implica, cioè, l’esistenza di una quadricorrente J µ a divergenza nulla,

∂µ J µ = 0.
13
Nel caso di “simmetrie interne” per definizione le coordinate non cambiano, x0µ = xµ ⇒ d4 x0 = d4 x.
Per trasformazioni di Poincaré, invece, abbiamo x0µ = Λµ ν xν + aµ ⇒ d4 x0 = d4 x |det Λ| = d4 x.

84
R
Come visto questo assicura che la variazione della carica QV = V
J 0 d3 x in un volume V ,
è necessariamente accompagnata da un flusso di carica attraverso il suo bordo,
Z
dQV
=− J~ · dΣ.
~
dt ∂V

Non è, cioè, possibile che la carica scompaia in un punto e compaia in un altro punto,
senza “fluire” da un punto all’altro.
In Teoria dei Campi esiste una dimostrazione generale e semplice del teorema di Noe-
ther per le cosiddette “simmetrie interne”, cioè, per simmetrie che non coinvolgono trasfor-
mazioni dello spazio–tempo, come per esempio le trasformazioni di gauge. Al contrario,
il gruppo di Poincaré origina proprio da trasformazioni dello spazio–tempo, e per questo
gruppo di simmetrie la dimostrazione del teorema è leggermente più complicata. Tuttavia,
date l’importanza concettuale e la rilevanza fenomenologica che esso ricopre, in questa
sezione dimostreremo il teorema di Noether per il gruppo di Poincaré in una generica teo-
ria di campo relativistica. Il sottogruppo delle traslazioni costituisce un gruppo a quattro
parametri a cui corrisponderanno quattro grandezze conservate, che identificheremo con
il quadrimomento totale, mentre il sottogruppo di Lorentz costituisce un gruppo a sei
parametri a cui corrisponderanno altrettante grandezze conservate, che identificheremo
con il momento angolare quadridimensionale totale del sistema.

3.3.1 Trasformazioni di Poincaré infinitesime

Per dimostrare il teorema di Noether sfrutteremo in particolare l’invarianza della lagran-


giana sotto trasformazioni di Poincaré infinitesime. In questo paragrafo determineremo
preliminarmente le variazioni dei campi sotto trasformazioni “infinitesime” – vale a dire
trasformazioni valutate al primo ordine nei parametri ω µν e aµ – la cui forma esplicita ci
servirà poi nella dimostrazione del teorema.
Finora abbiamo indicato l’insieme dei campi lagrangiani genericamente con ϕ =
(ϕ1 , · · · , ϕN ). In una teoria relativistica i singoli campi devono essere raggruppati in
“multipletti” che costituiscono tensori sotto trasformazioni di Poincaré, per esempio cam-
pi scalari Φ(x), campi vettoriali Aµ (x), campi tensoriali di rango due B µν (x), etc. È ovvio
che possiamo avere anche più campi dello stesso rango. L’indice r dell’insieme {ϕr }N
r=1

indica allora tutte le componenti di tutti i multipletti.

85
Incominciamo ricordando la forma di una generica trasformazione di Poincaré delle
coordinate,
x0µ = Λµ ν xν + aµ , (3.29)

dove la matrice di Lorentz è data da, vedi paragrafo 1.4.1,


µ
Λµ ν = eω ν , ω µν = −ω νµ . (3.30)

Sotto questa trasformazione i singoli campi trasformano a seconda del loro rango tenso-
riale,

Φ0 (x0 ) = Φ(x), A0µ (x0 ) = Λµ ν Aν (x), B 0µν (x0 ) = Λµ α Λν β B αβ (x), (3.31)

e cosı̀ via. Possiamo indicare queste trasformazioni complessivamente con,

ϕ0r (x0 ) = Mr s ϕs (x), (3.32)

per una qualche matrice N × N Mr s , indipendente da x. Si noti in particolare che queste


trasformazioni sono lineari nei campi ϕr .
Possiamo allora definire due tipi di variazioni – per il momento finite – dei campi: le
variazioni totali δϕr , e le variazioni in forma δϕr ,

δϕr ≡ ϕ0r (x0 ) − ϕr (x) (3.33)

δϕr ≡ ϕ0r (x) − ϕr (x). (3.34)

Passiamo ora alla valutazione di queste variazioni per trasformazioni di Poincaré infinite-
sime. Queste ultime corrispondono a trasformazioni di Lorentz infinitesime,

Λµ ν = δ µ ν + ω µ ν ,

e a traslazioni infinitesime. Per le coordinate otteniamo le trasformazioni infinitesime,

δxµ = x0µ − xµ = (δ µ ν + ω µ ν )xν + aµ − xµ = aµ + ω µ ν xν . (3.35)

Usando le (3.31) troviamo allora le seguenti trasformazioni totali infinitesime, intese al


primo ordine in ω αβ e aµ ,

δΦ = Φ0 (x0 ) − Φ(x) = 0,

δAµ = (δ µ ν + ω µ ν )Aν (x) − Aµ (x) = ω µ ν Aν (x),

δB µν = (δ µ α + ω µ α )(δ ν β + ω ν β )B αβ (x) − B µν (x) = ω µ α B αν (x) + ω ν β B µβ (x),

86
e cosı̀ via. Da questi esempi si capisce che le generiche variazioni δϕr sono lineari nei
parametri ω µν e nei campi stessi, si veda anche la (3.32). Possiamo allora scrivere la
formula generale,
1
δϕr = ωαβ Σαβ r s ϕs , (3.36)
2
dove le quantità Σαβ r s sono antisimmetriche in α e β 14
,

Σαβ r s = −Σβα r s ,

e la sommatoria su s è sottintesa. Le espressioni esplicite di queste quantità si leggono


facilmente dalle trasformazioni infinitesime totali dei campi calcolate sopra. Per esempio,
per il campo scalare Φ si ha semplicemente Σαβ 1 1 = 0, mentre per il campo vettoriale
Aµ ≡ ϕr si ha,
Σαβ r s = δrα η βs − δrβ η αs . (3.37)

Calcoliamo ora la versione infinitesima delle variazioni in forma. Aggiungendo e to-


gliendo nella (3.34) lo stesso termine e usando la (3.36), al primo ordine in ω αβ e aµ si
ottiene,

δϕr = ϕ0r (x) − ϕ0r (x0 ) + ϕ0r (x0 ) − ϕr (x)

= ϕ0r (x) − ϕ0r (x + δx) + δϕr

= −δxν ∂ν ϕ0r + δϕr = −δxν ∂ν ϕr + δϕr


1
= −δxν ∂ν ϕr + ωαβ Σαβ r s ϕs , (3.38)
2
dove nella penultima riga abbiamo tenuto conto che la differenza tra ϕr e ϕ0r è del primo
ordine in ω αβ e aµ .

3.3.2 Teorema di Noether per il gruppo di Poincaré

In una teoria di campo classica il teorema di Noether riferito al gruppo di Poincaré si


enuncia come segue.
Teorema di Noether. Si consideri una teoria di campo la cui dinamica discenda dall’a-
zione,
Z
I= d4 x L,

14
Nella (3.36) gli indici α e β di Σαβ r s sono contratti con la coppia antisimmetrica di ωαβ ; ciò implica
che comunque solo la parte antisimmetrica in α e β di Σαβ r s contribuisce a ωαβ Σαβ r s .

87
per un’opportuna lagrangiana L, ovvero, una teoria di campo le cui equazioni del moto
siano date dalla (3.7). Allora, se L è invariante per traslazioni si conserva localmente
il quadrimomento, il tensore energia–impulso essendo dato dalla (3.44), mentre se L è
invariante per trasformazioni di Lorentz, allora si conserva localmente il momento angolare
quadridimensionale, il tensore densità di momento angolare essendo dato dalla (3.45).
Queste leggi di conservazione sono valide purché i campi soddisfino le equazioni di Eulero–
Lagrange (3.7).
Per comprendere meglio il significato dell’invarianza per traslazioni di L consideriamo
una classe di lagrangiane leggermente più ampia di quella considerata finora, del tipo,

L(ϕ(x), ∂ϕ(x), x), (3.39)

dove ammettiamo, cioè, che L abbia anche una generica dipendenza esplicita da x. Per
una traslazione, x0 = x + a, abbiamo ϕ0r (x0 ) = ϕr (x), e per la lagrangiana traslata si
ottiene allora,
L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 ), x0 ) = L(ϕ(x), ∂ϕ(x), x + a),

che uguaglia L(ϕ(x), ∂ϕ(x), x) solo se L non dipende esplicitamente da x. Possiamo quindi
affermare che una lagrangiana è invariante per traslazioni se e sole se essa non esibisce
dipendenza esplicita da x.
Dimostrazione. Il primo passo nella dimostrazione del teorema di Noether consiste nel
valutare la variazione della lagrangiana per un’arbitraria trasformazione finita di Poincaré
dei campi, vedi (3.29) e (3.31),

∆L ≡ L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 ), x0 ) − L(ϕ(x), ∂ϕ(x), x). (3.40)

Per ogni x fissato questa espressione è una funzione dei parametri ω αβ e aµ , e come tale
può essere sviluppata in serie di Taylor attorno ai valori ω αβ = 0 = aµ . Siccome ∆L si
annulla per valori nulli dei parametri, otteniamo uno sviluppo del tipo,

∆L = δL + o(ω αβ , aµ )2 ,

dove con δL, la “variazione infinitesima della lagrangiana”, abbiamo indicato i termi-
ni di ∆L lineari in ω αβ e aµ . Se L è invariante sotto l’azione del gruppo di Poincaré

88
avremo ∆L = 0 identicamente, ovvero ∀ ω αβ , ∀ aµ , e per il teorema sull’identità delle
serie di potenze ne seguirà che δL = 0, ∀ ω αβ , ∀ aµ . Sfruttando quest’ultima identità e
assumendo la validità delle equazioni di Eulero–Lagrange potremo poi concludere che le
quadridivergenze di certi tensori sono nulli.
Secondo questa strategia dobbiamo dunque trovare un’espressione esplicita per δL. A
questo scopo è conveniente aggiungere e togliere a ∆L lo stesso termine, e valutare poi
l’espressione risultante tenendo solo i termini lineari nei parametri,

δL = [L(ϕ0 (x0 ), ∂ 0 ϕ0 (x0 ), x0 ) − L(ϕ0 (x), ∂ϕ0 (x), x)]lin

+ [L(ϕ0 (x), ∂ϕ0 (x), x) − L(ϕ(x), ∂ϕ(x), x)]lin .

I due termini della prima parentesi quadra differiscono solo per la sostituzione x → x0 =
x + δx, mentre nella seconda parentesi quadra i campi differiscono per la variazione in
forma (3.34). Tenendo conto che ∂µ δxµ = ηµν ω µν = 0, vedi (3.35), e definendo i “momenti
coniugati”,
∂L
Πµr = , (3.41)
∂(∂µ ϕr )
si ottiene allora,

∂L
δL = δxµ ∂µ L + δϕr + ∂µ δϕr Πµr
∂ϕr
µ ¶
µ δL µr
= ∂µ (δx L) + δϕr − ∂µ Π + ∂µ (δϕr Πµr )
∂ϕr
µ ¶
µ µr δL µr
= ∂µ [δx L + δϕr Π ] + δϕr − ∂µ Π , (3.42)
∂ϕr

dove la sommatoria su r è sottintesa. Valutiamo ora il termine tra parentesi quadre in


(3.42), usando la formula (3.38) per la variazione infinitesima dei campi,

1 µr
δxµ L + δϕr Πµr = δxν (η µν L − Πµr ∂ ν ϕr ) + Π ωαβ Σαβ r s ϕs . (3.43)
2

Prima di procedere definiamo il tensore energia–impulso canonico,

Teµν = Πµr ∂ ν ϕr − η µν L, (3.44)

e il tensore densità di momento angolare canonico,

fµαβ = xα Teµβ − xβ Teµα + Πµr Σαβ r s ϕs ,


M fµαβ = −M
M fµβα . (3.45)

89
Usando queste definizioni e la (3.35), la (3.43) diventa,

1
δxµ L + δϕr Πµr = −(aν + ωνρ xρ )Teµν + Πµr ωαβ Σαβ r s ϕs
2
1
= −aν Te + ωαβ M
µν f .µαβ
(3.46)
2

Per la variazione di L sotto una generica trasformazione di Poincaré infinitesima otteniamo


cosı̀ il seguente risultato,
µ ¶
eµν 1 fµαβ + δϕr δL µr
δL = −aν ∂µ T + ωαβ ∂µ M − ∂µ Π . (3.47)
2 ∂ϕr

Supponiamo ora, per esempio, che la lagrangiana sia invariante per il sottogruppo a
un parametro del gruppo di Poincaré costituito dalle traslazioni nel tempo,

t0 = t + a0 , ~x 0 = ~x.

Come visto sopra questo equivale all’assunzione che in L sia assente la dipendenza esplicita
da t. Allora abbiamo,

δL = 0, per ai = 0 = ωαβ , a0 arbitrario.

Se in più imponiamo che i campi soddisfino le equazioni di Eulero–Lagrange,

δL
∂µ Πµr − = 0,
∂ϕr

si ricordi la definizione (3.41), allora dalla (3.47) si ricava,

0 = −a0 ∂µ Teµ0 = 0, ∀ a0 ⇒ ∂µ Teµ0 = 0.

Abbiamo cosı̀ ottenuto l’equazione di continuità per l’energia, che assicura che l’energia
è localmente conservata.
Allo stesso modo dalla (3.47) segue che a ciascuno dei dieci parametri (aµ , ωαβ ) cor-
risponde una corrente a quadridivergenza nulla e una grandezza localmente conservata,
se la lagrangiana è invariante sotto il corrispondente gruppo a un paramentro: ad a0
(traslazioni del tempo) corrisponde la conservazione locale dell’energia, ad a1 (traslazioni
lungo l’asse x) quella della componente x della quantità di moto, ad ω12 (rotazioni attor-
no all’asse z) quella della componente z del momento angolare, ad ω01 (trasformazioni di

90
Lorentz speciali lungo l’asse x) quella della componente x del boost, e via di seguito. In
partciolare se la lagrangiana è invariante sotto l’intero gruppo delle traslazioni si conserva
localmente il quadrimomento, mentre se essa è invariante sotto l’intero gruppo di Loren-
tz allora si conserva localmente il momento angolare quadridimensionale. Abbiamo cosı̀
concluso la dimostrazione del teorema.
In particolare se L è invariante sotto l’intero gruppo di Poincaré, dalla (3.47) ottenia-
mo,
1
−aν ∂µ Teµν + ωαβ ∂µ M
fµαβ = 0, ∀ aµ , ∀ ω αβ ,
2
e quindi,
∂µ Teµν = 0, fµαβ = 0.
∂µ M

In questo caso abbiamo dieci costanti del moto, raggruppate nel quadrimomento e nel
momento angolare quadridimensionale,
Z Z
P = Te0µ d3 x,
e µ eαβ =
L f0αβ d3 x.
M

Insistiamo sul fatto che queste leggi di conservazione sono valide purché i campi soddisfino
le equazioni del moto di Eulero–Lagrange.
Per illustrare la portata di questo teorema nominiamo il fatto che le teorie che descri-
vono le quattro interazioni fondamentali soddisfano il principio di relatività einsteiniana,
e che sono formulate in termini di un principio variazionale: in queste teorie il teorema di
Noether assicura allora che la conservazione del quadrimomento e del momento angolare
è automatica.
Sulle densità di corrente canoniche. Concludiamo questo paragrafo con qualche osser-
vazione sulla struttura delle correnti conservate trovate. Come prima cosa notiamo che
il tensore energia–impulso canonico (3.44) in generale non è simmetrico. In Relatività
Ristretta questa circostanza di per sé non costituisce nessun problema. Viceversa, si può
vedere che l’esistenza di un tensore energia–impulso simmetrico è una richiesta irrinun-
ciabile, se si vuole accoppiare una teoria di campo alla gravità secondo i postulati della
15
Relatività Generale . Come seconda cosa facciamo notare che l’espressione (3.45) per
15
Le equazioni di Einstein eguagliano, infatti, un opportuno tensore doppio simmetrico, formato
con la metrica gµν (x) e le sue derivate, al tensore energia–impulso; queste equazioni sarebbero quindi
inconsistenti se quest’ultimo non fosse simmetrico.

91
la densità di momento angolare canonico non è “standard”, nel senso che non è della
semplice forma standard xα Teµβ − xβ Teµα . In realtà queste due “anomalie” sono legate tra
di loro. Infatti, la divergenza della densità di momento angolare standard non si annulla,
uguagliando proprio la parte antisimmetrica del tensore energia–impulso canonico,
³ ´
∂µ xα Teµβ − xβ Teµα = Teαβ − Teβα .

fµαβ si riduce alla forma standard xα Teµβ −


D’altra parte dalla (3.45) si vede che il tensore M
xβ Teµα , solo se le quantità Σαβ r s svaniscono, ma questo succede solo se i campi della teoria
sono tutti campi scalari. In quest’ultimo caso, d’altro canto, non è difficile dimostrare che
Teµν è in effetti simmetrico, vedi problema 3.6.
Concludiamo che, per quanto riguarda la densità di momento angolare la “anomalia”
appena discussa non costituisce un problema di tipo concettuale, ma solo di naturalez-
za, mentre per quanto riguarda il tensore energia–impulso sorgerebbe un problema di
incompatibilità con l’interazione gravitazionale, se non fosse possibile trovare un tensore
energia–impulso simmetrico. Questo problema verrà affrontato e risolto in tutta generalità
nelle sezioni 3.4 e 3.5.

3.3.3 Tensore energia–impulso canonico per il campo di Maxwell

In questo paragrafo esemplifichiamo la costruzione generale del tensore energia–impulso


canonico (3.44), nel caso semplice di un campo di Maxwell libero, j µ = 0. La dinamica
di questo campo è governata dalla lagrangiana, vedi (3.25),

1
L1 = − F µν Fµν , (3.48)
4

con ϕr ≡ Aα . Ricordiamo la forma dei momenti coniugati, determinati in (3.26),

∂L1
Πµα = = −F µα . (3.49)
∂(∂µ Aα )

Il tensore energia–impulso canonico discende allora direttamente dalla (3.44),

1
Teem
µν
= −F µα ∂ ν Aα + η µν F αβ Fαβ . (3.50)
4

Notiamo che questo tensore soffre di due patologie: non é simmetrico, e non è nemmeno
gauge–invariante. Affronteremo questi problemi nel paragrafo 3.4.1.

92
3.4 Costruzione di un tensore energia–impulso simmetrico

In questa sezione faremo vedere che in una teoria di campo lagrangiana invariante sot-
to trasformazioni di Poincaré, è sempre possibile costruire un tensore energia–impulso
simmetrico, la costruzione essendo canonica.
A questo proposito notiamo che il tensore energia–impulso di una teoria in realtà non
è definito univocamente. Consideriamo, infatti, un generico tensore di rango tre φρµν che
sia antisimmetrico nei primi due indici,

φρµν = −φµρν .

Possiamo allora definire un tensore energia–impulso modificato attraverso,

T µν = Teµν + ∂ρ φρµν . (3.51)

Questo tensore gode, infatti, delle seguenti due proprietà:


1) ∂µ T µν = 0,
R
2) P ν ≡ T 0ν d3 x = Peν .
T µν è dunque conservato, come lo è Teµν , ed esso dà luogo allo stesso quadrimomento
totale di Teµν . La prima proprietà discende dal fatto che,

∂µ ∂ρ φρµν = 0,

in quanto una coppia di indici antisimmmetrici contrae una coppia di indici simmetrici.
La seconda segue invece da,
Z ³ ´ Z Z Z
ν e
P −P = ν 0ν
T −T e0ν 3 ρ0ν 3 i0ν 3
d x = ∂ρ φ d x = ∂i φ d x = φi0ν dΣi = 0, (3.52)
Γ∞

dove abbiamo usato che φ00ν = 0, come conseguenza dell’antisimmetria di φρµν nei primi
due indici. Nell’ultimo passaggio abbiamo applicato il teorema di Gauss, con Γ∞ su-
perficie all’infinito spaziale, e abbiamo inoltre supposto che φρµν decada all’infinito più
rapidamente di 1/r2 . La proprietà 2) assicura in particolare che l’hamiltoniana del siste-
ma, rappresentata dalla componente P 0 , non dipende dal tensore energia–impulso che si
considera. T µν può dunque essere riguardato come tensore energia–impulso della teoria –
alla stessa stregua di Teµν . Sfruttando questa libertà di scelta dimostreremo ora il seguente
teorema.

93
Teorema. Sia data una lagrangiana invariante sotto l’azione del gruppo di Poincaré.
Allora si può costruire un tensore φρµν antisimmetrico in ρ e µ, tale che il tensore energia–
impulso T µν dato in (3.51) risulti simmetrico, la costruzione essendo canonica.
Dimostrazione. Siccome per ipotesi la lagrangiana è invariante sotto trasformazioni
dell’intero gruppo di Poincaré, per la dimostrazione del teorema possiamo servirci del
teorema di Noether e ricorrere ai tensori Teµν e M
fµαβ a quadridivergenza nulla, definiti

in (3.44) e (3.45). Riprendiamo in particolare l’espressione per la densità di momento


angolare,
fµαβ = xα Teµβ − xβ Teµα + V µαβ ,
M V µαβ ≡ Πµr Σαβ r s ϕs , (3.53)

dove abbiamo introdotto il tensore V µαβ , antisimmetrico negli ultimi due indici,

V µαβ = −V µβα .

fµαβ che Teµν sono a quadridivergenza nulla, si ottiene,


Sfruttando il fatto che sia M

fµαβ = ∂µ xα Teµβ − ∂µ xβ Teµα + ∂µ V µαβ ,


0 = ∂µ M (3.54)

ovverosia, cambiando di nome agli indici,

∂ρ V ρµν = Teνµ − Teµν , (3.55)

che equivale proprio alla parte antisimmetrica di Teνµ . Tuttavia, non possiamo identificare
V ρµν direttamente con φρµν , perché il primo non è antisimmetrico in ρ e µ. Se poniamo
invece,
1 ρµν
φρµν = (V − V µρν − V νρµ ) , (3.56)
2
possiamo verificare che questo tensore gode delle seguenti proprietà:
a) φρµν = −φµρν ,
³ ´
b) ∂ρ φρµν = 12 Teνµ − Teµν − 12 ∂ρ (V µρν + V νρµ ).
La prima proprietà, che assicura che φρµν dà luogo a una modifica consistente di Teµν ,
discende dall’antisimmetria di V νρµ negli ultimi due indici; la seconda è conseguenza
diretta di (3.55) e (3.56). Infine possiamo determinare il nuovo tensore energia–impulso
usando la (3.51), e sfruttando la proprietà b),

µν eµν ρµν 1 ³ eνµ eµν ´ 1


T = T + ∂ρ φ = T +T − ∂ρ (V µρν + V νρµ ) ,
2 2
94
che è manifestamente simmetrico in µ e ν. Sfruttando l’antisimmetria di V µνρ negli ultimi
due indici e usando la nostra convenzione sulla simmetrizzazione dei tensori, possiamo
riscrivere questo risultato anche come,

T µν = Te(µν) + ∂ρ V (µν)ρ , ∂µ T µν = 0. (3.57)

Abbiamo quindi dato una dimostrazione costruttiva dell’esistenza di un tensore energia–


impulso a quadridivergenza nulla e simmetrico, che dà luogo allo stesso quadrimomento
totale conservato del tensore energia–impulso canonico. Facciamo, però, notare che il
quadrimomento PVµ contenuto in un volume finito dipende dal tensore energia–impulso
che si considera. Tuttavia, questo quadrimomento non ha carattere tensoriale, cioè PVµ
non è un quadrivettore.
Dalla dimostrazione appena svolta traiamo inoltre le seguenti conclusioni. L’esistenza
di un tensore energia–impulso conservato richiede soltanto l’invarianza per traslazioni
di una teoria, mentre l’esistenza di un tensore energia–impulso conservato e simmetrico
richiede in più che essa sia invariante sotto trasformazioni di Lorentz. Infatti, nella nostra
fµαβ = 0, vedi (3.54) e
costruzione di φρµν era essenziale l’equazione di continuità ∂µ M
(3.55), che a sua volta discende dall’invarianza di Lorentz via il teorema di Noether.
Il gruppo di Poincaré e la Relatività Generale. Concludiamo questa sezione con una
considerazione sul doppio ruolo dell’invarianza di Poincaré nell’interazione gravitazionale.
In primo luogo menzioniamo il fatto che in base al Principio di Equivalenza qualsiasi
teoria invariante sotto trasformazioni del gruppo di Poincaré, nell’ambito della Relatività
Generale ammette un cosiddetto “accoppiamento minimale” consistente con un campo
gravitazionale esterno. In secondo luogo ricordiamo che la consistenza delle equazioni
di Einstein, che governano la dinamica del campo gravitazionale, necessita del tensore
energia–impulso simmetrico (3.57) – la cui esistenza è assicurata, a sua volta, dall’inva-
rianza di Poincaré. Possiamo allora affermare che la consistenza dell’interazione gravi-
tazionale di un sistema fisico – benchè coinvolga un gruppo di simmetrie più ampio del
16
gruppo di Poincaré, cioè, il gruppo dei diffeomorfismi – è garantita in ultima analisi
16
Un diffeomorfismo è una generica trasformazione di coordinate xµ → x0µ (x), invertibile e di classe C ∞
insieme alla sua inversa. I diffeomorfismi costituiscono quindi una generalizzazione delle trasformazioni
di Poincaré, x0µ (x) = Λµ ν xν + aµ .

95
dall’invarianza di Poincaré del sistema in assenza di interazione gravitazionale. L’im-
portanza di questa invarianza sta anche in questo: oltre ad assicurare la covarianza delle
equazioni del moto e la conservazione delle grandezze fisiche fondamentali, essa garantisce
anche la consistenza interna della Relatività Generale.

3.4.1 Tensore energia–impulso simmetrico per il campo di Maxwell

A titolo di esempio determiniamo il tensore energia–impulso simmetrico per il campo


di Maxwell libero. La lagrangiana di questo sistema è data in (3.48), e l’equazione di
Eulero–Lagrange associata è l’equazione di Maxwell nel vuoto, vedi (3.27),

∂µ F µν = 0. (3.58)

Il tensore energia–impulso canonico associato a questa lagrangiana è stato determinato


nella (3.50),
1
Teem
µν
= −F µα ∂ ν Aα + η µν F αβ Fαβ .
4
Denotando i campi di gauge indistintamente con Ar o Aα , ricordiamo anche la forma dei
momenti coniugati (3.49), e delle matrici Σαβ r s per un campo vettoriale, vedi (3.37),

Πµr = −F µr , Σαβ r s = δrα η βs − δrβ η αs .

Calcoliamo dapprima il tensore V µαβ , antisimmetrico in α e β,

V µαβ ≡ Πµr Σαβ r s As = −F µα Aβ + F µβ Aα . (3.59)

Determiniamo poi il tensore φρµν definito in (3.56), vedi problema 3.7,

φρµν = −F ρµ Aν , (3.60)

antisimmetrico in ρ e µ. Per la sua divergenza si ottiene allora,

∂ρ φρµν = −∂ρ F ρµ Aν − F ρµ ∂ρ Aν = F µα ∂α Aν ,

dove abbiamo utilizzato l’equazione di Eulero–Lagrange (3.58). Il nuovo tensore energia–


impulso risulta in definitiva,
1 1
µν
Tem = Teem
µν
+ ∂ρ φρµν = F µα (∂α Aν − ∂ ν Aα ) + η µν F αβ Fαβ = F µα Fα ν + η µν F αβ Fαβ ,
4 4
che è gauge invariante oltre che simmetrico, ed in perfetto accordo con la (2.69).

96
3.5 Densità di momento angolare “standard”

Concludiamo questo capitolo dimostrando che per una lagrangiana L invariante per il
gruppo di Poincaré esiste sempre una densità di momento angolare M µαβ “standard”,
legata al tensore energia–impulso simmetrico dalla relazione,

M µαβ = xα T µβ − xβ T µα . (3.61)

La dimostrazione di questa proprietà segue una strategia molto simile a quella usata per
dimostrare l’esistenza di un tensore energia–impulso simmetrico. Sfrutteremo, cioè, il fatto
che anche la densità di momento angolare è determinata a meno della quadridivergenza
di un tensore con opportune proprietà di antisimmetria. Dimostreremo, infatti, che esiste
un tensore Λµναβ di rango quattro, antisimmetrico nella prima coppia di indici oltre che
nella seconda, tale che,
fµαβ + ∂ρ Λρµαβ ,
M µαβ = M

con M µαβ definito in (3.61). Con un argomento standard, vedi (3.52), si verifica allora
facilmente che,
Z Z
Lαβ
≡ 3
d xM 0αβ
= f0αβ ≡ L
d3 x M eαβ ,

purché Λµναβ svanisca all’infinito spaziale più rapidamente di 1/r2 .


Incominciamo la dimostrazione ricordando la definizione della densità canonica di
momento angolare,

fµαβ = xα Teµβ − xβ Teµα + V µαβ ,


M V µαβ ≡ Πµr Σαβ r s ϕs ,

e la relazione tra il tensore energia–impulso canonico e quello simmetrico,

1 ρµν
T µν = Teµν + ∂ρ φρµν , φρµν ≡ (V − V µρν − V νρµ ) . (3.62)
2

Allora si può scrivere,

fµαβ = xα T µβ − xβ T µα − xα ∂ρ φρµβ + xβ ∂ρ φρµα + V µαβ


M
¡ ¢
= M µαβ − ∂ρ xα φρµβ − xβ φρµα + φαµβ − φβµα + V µαβ
¡ ¢
= M µαβ − ∂ρ xα φρµβ − xβ φρµα ,

97
dove nell’ultimo passaggio abbiamo usato la definizione di φρµν riportata in (3.62), che
comporta l’identità,
φαµβ − φβµα = −V µαβ .

Otteniamo quindi,

fµαβ + ∂ρ Λρµαβ ,
M µαβ = M con Λρµαβ ≡ xα φρµβ − xβ φρµα , (3.63)

dove Λρµαβ è antisimmetrico nella prima coppia di indici oltre che nella seconda, che è
quanto volevamo dimostrare.

3.6 Problemi

3.1 Si consideri un campo scalare reale ϕ (“particella neutra con spin 0 e massa m”)
con lagrangiana,
1¡ ¢ λ
L= ∂µ ϕ∂ µ ϕ − m2 ϕ2 − ϕ4 ,
2 4!
dove m e λ sono costanti reali.
a) Si scrivano le equazioni di Eulero–Lagrange associate a L.
b) Si verifichi esplicitamente che tali equazioni sono equivalenti alla richiesta di stazio-
Rt
narietà dell’azione I = t12 L d4 x, per variazioni generiche del campo ϕ, purché nulle in
t = t1 e t = t2 .

3.2 Si consideri un campo scalare complesso Φ = ϕ1 + iϕ2 (“particella carica con spin 0
e massa m”) con lagrangiana,
λ ∗ 2
L = ∂µ Φ∗ ∂ µ Φ − m2 Φ∗ Φ − (Φ Φ) ,
4
dove m e λ sono costanti reali.
a) Si scrivano le equazioni di Eulero–Lagrange associate a L. [Sugg.: si considerino come
campi indipendenti Φ e Φ∗ .]
b) Si dica per quali valori di λ e m le equazioni del moto per ϕ1 e ϕ2 risultano disaccoppiate
tra di loro.

3.3 Si consideri l’azione,


Z t2
I= L d4 x,
t1

98
con L data in (3.25).
a) Si determini la variazione di I per variazioni generiche di Aµ .
b) Si verifichi esplicitamente che la variazione di I è nulla per variazioni arbitrarie dei
campi, purché nulle in t = t1 e t = t2 , se e solo se il campo di gauge soddisfa l’equazione
di Maxwell.

3.4 Si consideri la lagrangiana per il campo reale scalare data nel problema 3.1.
a) Si derivi il tensore energia–impulso canonico, analizzandone le proprietà di simmetria.
b) Si scriva l’espressione esplicita per la densità di energia e per l’energia totale del sistema.
Si dica per quali valori di m e λ l’energia è definita positiva.

3.5 Si verifichi esplicitamente che il tensore energia–impulso canonico del campo di


Maxwell libero dato in (3.50) ha quadridivergenza nulla.

3.6 Si dimostri che per una teoria di campo di soli campi scalari il tensore energia–
impulso canonico è simmetrico. [Sugg.: per l’invarianza di Lorentz la lagrangiana può
dipendere da ∂µ ϕr solo attraverso la “matrice” Mrs = ∂µ ϕr ∂ µ ϕs , simmetrica in r e s.]

3.7 Si verifichi che per un campo di Maxwell libero il tensore φρµν ha la forma data in
(3.60).

fµαβ per un campo di Max-


3.8 Si determini la densità di momento angolare canonico M
well libero. Si verifichi che la corrispondente densità di momento angolare “standard”,
come definita in (3.63), risulta uguale a xα Tem
µβ
− xβ Tem
µα
.

~ B},
3.9 Si consideri una teoria di campo descritta dai sei campi lagrangiani ϕ ≡ {E, ~

con lagrangiana,
~ ³ ´
~ · ∂B + 1 E
L=E ~ ·∇
~ ×E
~ +B
~ ·∇
~ ×B
~ − ~j · B,
~
∂t 2

dove ~j è un campo esterno indipendente da ϕ. Si confrontino le equazioni del moto


associate a questa lagrangiana con le equazioni di Maxwell (2.28)–(2.31).

3.10 Si consideri la lagrangiana L del campo complesso del problema 3.2.


a) Si verifichi che L è invariante sotto il gruppo a un parametro di trasformazioni (gruppo

99
U (1) di “trasformazioni di gauge globali”),

Φ0 (x) = eiΛ Φ(x), Φ∗0 (x) = e−iΛ Φ∗ (x), Λ ∈ R,

con Λ indipendente da x.
b) Si dimostri che sotto una generica variazione infinitesima Φ → Φ + δΦ si ha,
µ ¶ µ ¶
∂L ∂L ∂L
δL = − ∂µ δΦ + c.c. + ∂µ δΦ + c.c.
∂Φ ∂(∂µ Φ) ∂(∂µ Φ)

c) Si dimostri il teorema di Noether relativo al gruppo di simmetria di cui al punto a),


determinando la forma esplicita della corrente j µ associata. [Sugg.: per una trasforma-
zione infinitesima si ha δΦ = Φ0 − Φ = iΛΦ.]
d) Si verifichi esplicitamente che la corrente j µ è conservata, se il campo Φ soddisfa le
equazioni di Eulero–Lagrange determinate nel punto a) del problema 3.2.

100
4 Il metodo variazionale per l’Elettrodinamica di par-
ticelle puntiformi

In questa sezione estenderemo il metodo variazionale a una teoria di campo accoppiata


ad un sistema di particelle puntiformi. Per concretezza ci limiteremo a considerare il
caso dell’Elettrodinamica, ovvero una teoria di campo con un unico campo vettoriale Aµ ,
interagente con un sistema di particelle cariche.

4.1 Principio variazionale per una particella libera

Prima di considerare il sistema accoppiato deduciamo la forma dell’azione per una par-
ticella relativistica libera. La richiesta di stazionarietà di questa azione deve allora dare
luogo alle equazioni del moto di una particella libera, cioè,

dpµ
= 0. (4.1)
ds

Si tratta in sostanza di trovare la generalizzazione relativistica dell’azione newtoniana per


la particella libera, con coordinate lagrangiane ~y (t),
Z tb µ ¶
1 2
I0 [~y ] = mv dt, (4.2)
ta 2

dove questa volta abbiamo indicato gli estremi temporali con ta e tb , al posto di t1 e
t2 . Come abbiamo visto il primo passo nella formulazione di un principio variazionale
consiste nella scelta delle variabili lagrangiane. In questo caso stiamo cercando un’azione
relativistica, e le coordinate lagrangiane appropriate non sono allora le ~y (t), ma le quattro
funzioni,
y µ (λ),

che parametrizzano una generica linea di universo. Conseguentemente l’azione I[y] che
stiamo cercando dovrà essere invariante non solo sotto trasformazioni di Poincaré, ma
anche sotto riparametrizzazione, perché tale è l’equazione (4.1).
Come primo passo nella covariantizzazione di I0 sostituiamo la misura dt con la misura
invariante, sia per Poincaré che per riparametrizzazione,
r
dy µ dyµ
ds = dλ,
dλ dλ

101
che nel limite non relativistico si riduce in effetti a dt. L’azione che stiamo cercando
dovrebbe quindi avere la forma,
Z b
I[y] = l(y, ẏ) ds,
a

per un’opportuna lagrangiana invariante l. In questa espressione a e b indicano gli estremi


del tratto di linea di universo considerato, e abbiamo definito,
dy µ
ẏ µ = .

A questo punto facciamo notara che, al contrario delle “velocità” ẏ µ , le coordinate y µ
in realtà non hanno carattere “tensoriale”, perché sotto traslazioni non sono invarianti.
Di conseguenza l non può dipendere dalle y µ , ma solo dalle ẏ µ . D’altra parte l’unico
quadriscalare indipendente che possiamo formare con le ẏ µ è la quantità,

ẏ µ ẏµ ,

ma questa non è invariante sotto riparametrizzazione. Concludiamo che l deve essere


indipendente anche dalle ẏ µ , e quindi necessariamente una costante. Poniamo allora per
l’azione relativistica,
Z b
I[y] = l ds,
a

che dal punto di vista geometrico corrisponde alla “lunghezza” dell’arco quadridimen-
sionale della linea di universo compreso tra a e b. Per determinare infine la costante l
richiediamo che nel limite non relativistico, v ¿ 1, questa azione si riduca a I0 . A questo
scopo ricordiamo la definizione di ds e ne eseguiamo lo sviluppo non relativistico,
µ ¶
√ v 2
4
ds = 1 − v 2 dt = 1 − + o(v ) dt.
2
Arrestandoci al termine quadratico ottieniamo allora,
Z tb µ ¶
l 2
I[y] = l(ta − tb ) − v dt.
ta 2
Il primo termine è indipendente dalle variabili dinamiche ed è irrilevante. Il secondo si
riduce in effetti a I0 se poniamo l = −m. Otteniamo quindi per l’azione relativistica di
una particella libera,
Z b Z br
dy µ dyµ
I[y] = −m ds = −m dλ. (4.3)
a a dλ dλ

102
Ci possiamo ora domandare quali sono le linee di universo che rendono stazionaria
17
questa azione per variazioni generiche delle coordinate ,

δy µ (λ) = y 0µ (λ) − y µ (λ),

purché nulle ai bordi,


δy µ (a) = 0 = δy µ (b). (4.4)

Faremo ora vedere che le linee di universo in questione sono esattamente quelle che soddi-
sfano le (4.1). Per farlo calcoliamo la variazione dell’azione (4.3) per variazioni generiche
delle coordinate,
Z b µ µ ¶ Z b µ µ ¶
1 dy dyµ 1 dy d δyµ
δI = −m q δ dλ = −m q dλ.
a 2 dy µ dyµ dλ dλ a dy µ dyµ dλ dλ
dλ dλ dλ dλ

Usando le relazioni, r
dy µ dyµ ds dy µ
= , pµ = m ,
dλ dλ dλ ds
otteniamo,
Z b
d δyµ
δI = − pµ ds,
a ds
e integrando per parti arriviamo poi a,
¯b Z b
dpµ
µ ¯
δI = −p δyµ ¯ + δyµ ds.
a a ds

Se imponiamo ora che l’azione sia stazionaria per variazioni δy µ arbitrarie purché soddi-
sfacenti le (4.4), il primo termine si annulla, e otteniamo la condizione di stazionarietà,

dpµ
= 0.
ds

4.2 L’azione per l’Elettrodinamica

In questa sezione consideriamo un generico sistema di particelle cariche in interazione con


il campo elettromagnetico. Se introduciamo come al solito un potenziale vettore Aµ e
17
In alternativa l’azione di una particella relativistica potrebbe essere considerata anche come funzionale
delle variabili lagrangiane ~y (t), al posto delle y µ (λ). In questo caso si otterrebbero equazioni del moto
completamente equivalenti, ma non in forma covariante a vista. È facile vedere che nel caso della particella
libera, per esempio, dalla (4.3) si otterrebbe l’equazione d~ p/dt = 0, al posto di dpµ /ds = 0. La scelta
µ
delle variabili y (λ) ha evidentemente il pregio di mantenere la covarianza a vista.

103
definiamo,
Fµν = ∂µ Aν − ∂ν Aµ ,

allora le equazione del moto di questo sistema sono l’equazione di Maxwell (2.14) per il
potenziale vettore, e le equazioni di Lorentz (2.12) per le particelle. In questa sezione
rideriveremo queste equazioni da un principio variazionale. Useremo poi il teorema di
Noether applicato al gruppo di Poincaré, per riottenere le noti leggi di conservazione.
Confermeremo in particolare le espressioni esplicite delle correnti (2.69), (2.70) e (2.85),
ottenute precedentemente in modo euristico.
Punto di partenza deve essere un’azione I[A, yr ] – funzionale del campo elettroma-
gnetico Aµ (x) e delle linee di universo yrµ (λr ) delle particelle – che sia invariante sotto
trasformazioni di Poincaré. Abbiamo già dedotte l’equazione di Maxwell da un prin-
cipio variazionale a partire dalla lagrangiana (3.25), e conosciamo inoltre l’azione (4.3)
corrispondente a una particella libera. Per l’azione del sistema interagente viene allora
naturale ipotizzare l’espressione,
Z Z Σb X Z br
1 Σb µν 4 µ 4
I[A, yr ] = − F Fµν d x − Aµ j d x − mr dsr = I1 + I2 + I3 . (4.5)
4 Σa Σa r ar

In questa espressione gli integrali quadridimensionali sono eseguiti tra due ipersuperfici
di tipo spazio Σa e Σb non intersecantesi, mentre ar e br sono rispettivamente i punti
18
d’intersezione della linea di universo r–esima con Σa e Σb . Interpretiamo I1 come la
parte dell’azione che descrive la propagazione libera di Aµ , I3 come la parte che descrive il
moto libero delle cariche, e I2 come la parte che descrive l’interazione tra particelle cariche
e campo elettromagnetico. La giustificazione ultima di questa azione deriva, ovviamente,
dal fatto che essa dà luogo alle equazioni del moto desiderate, come faremo vedere di
seguito.
Per impostare il problema variazionale è conveniente riscrivere l’azione in una forma
diversa. Sfruttando la definizione della corrente possiamo intanto riscrivere il termine di
interazione,
Z Σb X Z X Z br
4
I2 = − Aµ (x) er δ (x − yr ) dyrµ 4
d x=− er Aµ (yr ) dyrµ . (4.6)
Σa r r ar

18
Ogni linea di universo γr interseca le ipersuperfici Σa,b un’unica volta, perché la prima è di tipo
tempo, mentre le seconde sono di tipo spazio.

104
Come nella sezione precedente introduciamo per le derivate delle variabili lagrangiane
yrµ (λr ) la notazione abbreviata,
dyrµ
ẏrµ = .
dλr
Usando (4.3) e (4.6) è allora immediato ottenere,
X Z br
I2 + I3 = − (mr dsr + er Aµ (yr )dyrµ ) (4.7)
r ar
XZ br µ q ¶
µ µ
= − mr ẏr ẏrµ + er Aµ (yr )ẏr dλr (4.8)
r ar
XZ br
= Lr (yr , ẏr ) dλr , (4.9)
r ar

dove abbiamo definito le Lagrangiane “ordinarie”,


p
Lr (yr , ẏr ) = −mr ẏrν ẏrν − er Aν (yr ) ẏrν . (4.10)

Dalle formule scritte si vede anche che l’azione può essere posta nella forma,
Z Σb
I= L d4 x,
Σa

se definiamo la lagrangiana totale,


X Z
1 µν µ
L = L1 + L2 + L3 = − F Fµν − Aµ j − mr δ 4 (x − yr ) dsr (4.11)
4 r
XZ
= L1 + Lr δ 4 (x − yr ) dλr . (4.12)
r

Il problema variazionale. Secondo il principio variazionale cerchiamo ora le configu-


razioni di campi e particelle che rendono stazionaria l’azione – δI = 0 – per variazioni
arbitrarie δAµ e δyrµ , purché soddisfacenti,

δAµ |Σa = 0 = δAµ |Σb , δyrµ (ar ) = 0 = δyrµ (br ).

Consideriamo separatamente variazioni dei campi e variazioni delle linee di universo. Per
variazioni dei campi, siccome I3 è indipendente da Aµ , il problema si riduce a considerare
R
l’azione I1 +I2 = d4 x (L1 +L2 ). Ma sappiamo che le configurazioni dei campi che rendo-
no stazionaria questa azione sono quelle che soddisfano le equazioni di Eulero–Lagrange
associate alla lagrangiana L1 + L2 . Queste ultime, d’altro canto, sono state derivate nella
sezione 3.2.3 e viste coincidere con l’equazione di Maxwell (3.27).

105
Resta da imporre la stazionarietà dell’azione per variazioni delle coordinate. In questo
caso, siccome I1 è indipendente dalle yr , è sufficiente considerare l’azione I2 +I3 . Potremmo
calcolare la variazione di questa azione con le tecniche usate nella sezione precedente,
e troveremmo che le condizioni di stazionarietà coincidono proprio con le equazioni di
Lorentz, vedi problema 4.1.
Di seguito proponiamo una dimostrazione alternativa di questo risultato, basata di-
rettamente sul metodo lagrangiano per un sistema a finiti di gradi di libertà, vedi sezione
3.1. Riprendiamo a questo scopo l’azione I2 + I3 , scritta come in (4.9). Questa azione si
separa in una somma di termini,
X Z br
I2 + I3 = I[yr ], I[yr ] = Lr (yr , ẏr ) dλr ,
r ar

ciascuno dei quali dipende solo da una delle coordinate. L’azione I2 + I3 sarà quindi
stazionaria se ciascuna I[yr ] è stazionaria per variazioni generiche delle yrµ , con le solite
condizioni agli estremi. Ma I[yr ] è l’integrale della lagrangiana ordinaria Lr , corrisponden-
te a un sistema lagrangiano con quattro gradi di libertà. Come sappiamo dalla sezione 3.1,
il problema della stazionarietà di questa azione si riduce allora alle equazioni di Lagrange
associate, vale a dire,
d ∂Lr ∂Lr
− µ = 0.
dλr ∂ ẏrµ ∂yr
Valutiamo dunque i due termini di questa equazione, tralasciando per semplicità l’indice
r. Dalla (4.10) si ottiene immediatamente,
∂L
= −e ∂µ Aν ẏ ν .
∂y µ
Calcoliamo poi,
∂L mẏµ
µ
= − √ ν − eAµ (y) = −pµ − eAµ (y), (4.13)
∂ ẏ ẏ ẏν
dove abbiamo introdotto il quadrimomento pµ della particella, ed utilizzato la solita
√ ds
relazione ẏ ν ẏν = dλ . Infine dobbiamo valutare,
d ∂L dpµ
= − − e ẏ ν ∂ν Aµ .
dλ ∂ ẏ µ dλ
In definitiva otteniamo,
µ ¶
d ∂L ∂L dpµ ds dpµ
µ
− µ =− + e ẏ ν (∂µ Aν − ∂ν Aµ ) = − − eFµν uν = 0, (4.14)
dλ ∂ ẏ ∂y dλ dλ ds
che è l’equazione di Lorentz.

106
4.3 Il teorema di Noether in Elettrodinamica

Nella sezione precedente abbiamo stabilito un principio variazionale per l’Elettrodinamica


classica, compatibile con i postulati della Relatività Ristretta. Più precisamente, abbia-
mo individuato un’azione invariante sotto trasformazione del gruppo di Poincaré da cui
discendono le equazioni del moto per campi e particelle. Secondo il teorema di Noether
dovrebbe quindi essere possibile derivare la forma delle “correnti” conservate T µν e M µαβ ,
sfruttando l’invarianza dell’azione rispettivamente per traslazioni e per trasformazioni di
Lorentz. Anche in questo caso la dimostrazione del teorema può essere svolta secondo la
strategia adottata nel capitolo precedente per un sistema di soli campi, ma dal punto di
vista tecnico essa è leggermente più complicata per via della presenza delle particelle.
Seguendo il metodo della sezione 3.3 impostiamo la dimostrazione a partire non diret-
tamente dall’azione, ma dalla lagrangiana del sistema, vedi (4.11). Per brevità indichiamo
le dipendenze funzionali di questa lagrangiana con L(A(x), yr , x), omettendo di indicare
esplicitamente la dipendenza dalle derivate ∂A e ẏr . Notiamo, comunque, che formal-
mente questa lagrangiana esibisce anche una dipendenza esplicita dalla coordinata x –
indicata dal suo terzo argomento – attraverso le δ 4 (x − yr ) che compaiono in (4.11). Tut-
tavia, vedremo fra poco che in questo caso non sussiste nessuna rottura dell’invarianza
per traslazioni.
Per le trasformazioni di Poincaré adottiamo le notazioni del paragrafo 3.3.1. Per
trasformazioni finite abbiamo,

x0µ = Λµ ν xν + aµ , yr0µ = Λµ ν yrν + aµ , A0µ (x0 ) = Λµ ν Aν (x),

e per trasformazioni infinitesime, Λµ ν = δ µ ν + ω µ ν , ne segue,

δxµ = aµ + ω µ ν xν , δyrµ = aµ + ω µ ν yrν . (4.15)

Per le trasformazioni del campo vettoriale distinguiamo di nuovo trasformazioni totali e


trasformazioni in forma,

δAα ≡ A0α (x0 ) − Aα (x) = ωα β Aβ (x),

δAα ≡ A0α (x) − Aα (x) = −δxν ∂ν Aα + δAα = −δxν ∂ν Aα + ωα β Aβ (x). (4.16)

107
L’invarianza di L sotto trasformazioni di Poincaré è allora espressa dall’identità,

δL ≡ L(A0 (x0 ), yr0 , x0 ) − L(A(x), yr , x) = 0. (4.17)

Difatti l’unico elemento nella (4.11) la cui invarianza va controllata è la δ 4 di Dirac,


δ 4 (x − yr )
δ 4 (x0 − yr0 ) = δ 4 (Λx + a − (Λyr + a)) = δ 4 (Λ(x − yr )) = = δ 4 (x − yr ).
|detΛ|
Questo vuol dire che le trasformazioni delle δ 4 in seguito potranno essere semplicemente
ignorate.
Manipoliamo ora l’identità (4.17) in completa analogia con il caso di una teoria con
soli campi. Scriviamo,

δL = [L(A0 (x0 ), yr0 , x0 ) − L(A0 (x), yr , x)] + [L(A0 (x), yr , x) − L(A(x), yr , x)] .

I due termini della prima parentesi quadra differiscono solo per le variazioni (4.15) di x
e yr , mentre nella seconda parentesi quadra compare solo una trasformazione in forma
di Aµ . Nella prima parentesi quadra conviene usare l’espressione (4.12), mentre nella
seconda è più conveniente la (4.11). Si ottiene cosı̀,
" # · ¸
XZ ∂L
µ 4 µν
δL = δx ∂µ L1 + δLr δ (x − yr ) dλr + δAν + Π ∂µ δAν . (4.18)
r
∂A ν

Con δLr intendiamo quı̀ la variazione di Lr per le variazioni delle yr date in (4.15), e
∂L
abbiamo usato la definizione consueta per i momenti coniugati, Πµν ≡ ∂(∂µ Aν )
= −F µν .
Alla seconda parentesi quadra contribuiscono solo i termini L1 +L2 , e possiamo riscriverla
come,
· ¸
∂L µν µν ∂L µν
δAν + Π ∂µ δAν = ∂µ (Π δAν ) + − ∂µ Π δAν ,
∂Aν ∂Aν
= ∂µ (Πµν δAν ) + (∂µ F µν − j ν ) δAν ,

dove nell’ultimo termine riconosciamo l’equazione di Maxwell. In modo completamen-


te analogo possiamo manipolare la variazione di Lr , facendo comparire le equazioni di
Lorentz,
µ ¶ µ ¶
∂Lr ν ∂Lr d ν ∂Lr ∂Lr d ∂Lr
δLr = δyrν + δ ẏr = δyr ν + δyr ν

∂yrν ∂ ẏrν dλr ∂ ẏr ∂yrν dλr ∂ ẏrν
µ ¶ µ ¶
d ∂Lr dsr dprν
= δyrν ν + − Fνµ uµr δyrν ,
dλr ∂ ẏr dλr dsr

108
dove l’ultimo termine corrisponde alle equazioni di Lorentz, vedi (4.14). Il primo termine,
invece, inserito in (4.18), attraverso un’integrazione per parti dà luogo a,
Z µ ¶ Z
d ν ∂Lr ∂Lr d 4
δyr ν δ (x − yr ) dλr = − δyrν ν
4
δ (x − yr ) dλr
dλr ∂ ẏr ∂ ẏr dλr
µ ¶¯λr =+∞
ν ∂Lr 4
¯
+ δyr ν
δ (x − yr ) ¯¯ .
∂ ẏr λr =−∞

Per ogni x fissato, per λr → ±∞ la δ 4 (x − yr ) si annulla, quindi il secondo termine è


nullo. Per quanto riguarda il primo termine notiamo invece che,
d 4
δ (x − yr ) = −ẏrµ ∂µ δ 4 (x − yr ) = −∂µ (ẏrµ δ 4 (x − yr )),
dλr
e otteniamo una quadridivergenza,
Z µ ¶ µZ ¶
d ν ∂Lr 4 µ ν ∂Lr 4
δyr ν δ (x − yr ) dλr = ∂µ ẏr δyr δ (x − yr ) dλr .
dλr ∂ ẏr ∂ ẏrν
Inseriamo ora questi risultati nella (4.18),
" #
XZ ∂L r
δL = ∂µ δxµ L1 + Πµν δAν + ẏrµ δyrν ν δ 4 (x − yr ) dλr (4.19)
r
∂ ẏr
X Z µ ¶
µν ν dprν
+ (∂µ F − j ) δAν + − Fνµ ur δyrν δ 4 (x − yr ) dsr .
µ

r
dsr

Questa formula ha ora la stuttura prevista dal teorema di Noether: eguaglia la va-
riazione della lagrangiana alla quadridivergenza di un certo quadrivettore – la parentesi
quadra – modulo termini proporzionali alle equazioni del moto. È ora un semplice eserci-
zio esplicitare la parentesi quadra e determinare i coefficienti di aν e di ω αβ , per ottenere
la forma esplicita delle correnti conservate. È sufficiente inserire le formule (4.13), (4.15)
e (4.16). Per i primi due termini della parentesi quadra in (4.19) otteniamo,

δxµ L1 + Πµν δAν = δxν (η µν L1 − Πµν ∂ ν Aν ) + Πµν δAν = −δxν Teem


µν
− F µν ωνρ Aρ , (4.20)

dove abbiamo ritrovato il tensore energia–impulso canonico per un campo di Maxwell


libero, (3.50). Per il terzo termine in (4.19) notiamo che per le proprietà della δ 4 possiamo
sostituire δyrν con δxν . Con l’aiuto di (4.13) e parametrizzando l’integrale con il tempo
proprio, questo termine può allora essere posto nella forma,
XZ XZ
µ ν ∂Lr 4
ẏr δyr ν
δ (x − yr ) dλr = −δxν uµr (pνr + er Aν (yr )) δ 4 (x − yr ) dsr
r
∂ ẏ r
¡ r µν ¢
= −δxν Tp + j µ Aν , (4.21)

109
dove abbiamo ritrovato il tensore energia–impulso delle particelle, (2.70). Sommando
(4.20) e (4.21) ed esplicitando δxν = aν + ωνβ xβ , la parentesi quadra in (4.19) può allora
essere scritta come,
³ ´ 1
−δxν Tpµν e
+ Tem + j A − F µν ωνρ Aρ = −aν Teµν + ωαβ M
µν µ ν fµαβ ,
2

dove abbiamo definito i tensori energia–impulso e densità di momento angolare canonici


dell’Elettrodinamica classica,

Teµν = Tpµν + Teem


µν
+ j µ Aν (4.22)
fµαβ = xα Teµβ − xβ Teµα − F µα Aβ + F µβ Aα .
M (4.23)

In definitiva possiamo riscrivere la (4.19) come,

1
δL = −aν ∂µ Teµν + fµαβ
ωαβ ∂µ M (4.24)
2
X Z µ dprν ¶
+ (∂µ F µν ν
− j ) δAν + − Fνµ ur δyrν δ 4 (x − yr ) dsr ,
µ

r
dsr

da confrontare con l’analoga identità per una teoria di soli campi, vedi (3.47).
Dato che la lagrangiana è invariante per l’intero gruppo di Poincaré abbiamo che
δL = 0 identicamente. Concludiamo quindi che, se i campi e le particelle soddisfano le
rispettive equazioni del moto, allora i tensori Teµν e M
fµαβ risultano conservati,

∂µ Teµν = 0 = ∂µ M
fµαβ . (4.25)

Tensore energia–impulso simmetrico e densità di momento angolare standard. Di nuo-


vo vediamo che le correnti che abbiamo ottenuto non hanno la forma che abbiamo trovato
nei paragrafi 2.4.3 e 2.4.4 con metodi euristici; in particolare Teµν non è simmetrico e M
fµαβ

non ha la forma standard. Inoltre, nessuno dei due tensori è gauge invariante. Vediamo
comunque che in assenza di particelle Teµν si riduce a Teem
µν
, mentre in assenza di campo
elettromagnetico esso si riduce a Tpµν . Ma nella (4.22) c’è anche il termine di interferenza
j µ Aν , di interpretazione più difficile. Tuttavia, anche in questo caso possiamo adottare
la strategia generale per la simmetrizzazione del tensore energia–impulso, sviluppata in
sezione 3.4. Poniamo,

T µν = Teµν + ∂ρ φρµν , φρµν = −φµρν , (4.26)

110
dove il tensore φρµν è dato in termini del tensore V µαβ secondo la definizione (3.56). D’altra
parte quest’ultimo si può determinare confrontando la (4.23) con la (3.53). Risulta,

V µαβ = −F µα Aβ + F µβ Aα ,

come nel caso del campo di Maxwell libero, vedi (3.59). Anche il tensore φρµν è allora
quello corrispondente al campo di Maxwell libero,

φρµν = −F ρµ Aν .

Tuttavia, in presenza di particelle la divergenza di questo tensore contiene anche un


termine proporzionale alla corrente. Risulta infatti,

∂ρ φρµν = −∂ρ F ρµ Aν − F ρµ ∂ρ Aν = −j µ Aν − F αµ ∂α Aν .

Aggiungendo questa espressione a (4.22) si vede che il termine di interferenza j µ Aν si


cancella, e che si ricombina il tensore energia–impulso simmetrico del campo elettroma-
gnetico,
T µν = Tem
µν
+ Tpµν , ∂µ T µν = 0,

a conferma dei risultati (2.69) e (2.70) del capitolo 2.


Analogamente, secondo la (3.63) si può modificare la densità di momento angolare
(4.23) ponendo,

fµαβ + ∂ρ Λρµαβ ,
M µαβ = M Λρµαβ = xα φρµβ − xβ φρµα .

Nel nostro caso risulta,

∂ρ Λρµαβ = φαµβ + xα ∂ρ φρµβ − (α ↔ β) = F µα Aβ + xα (T µβ − Teµβ ) − (α ↔ β).

Aggiungendo questo termine a (4.23) si vede immediatamente che risulta,

M µαβ = xα T µβ − xβ T µα ,

in accordo con il nostro risultato euristico (2.85).


Abbiamo cosı̀ riottenuto la forma dei tensori energia–impulso e densità di momento
angolare per l’Elettrodinamica. Più del risultato, già noto, è importante il metodo che

111
abbiamo utilizzato, cioè, il teorema di Noether. Nella sezione 3.3 abbiamo dato una
dimostrazione generale di questo teorema per una teoria di soli campi. In questa sezione
abbiamo dimostrato il teorema in una situazione fisica molto diversa, in cui alcuni gradi di
libertà non sono distribuiti con continuità nello spazio, come i campi, ma costituiscono dei
“difetti” puntiformi, appunto le particelle. In questo capitolo abbiamo difatti illustrato
una circostanza molto generale, e cioè che in Fisica il teorema di Noether vale a tutti i
livelli: vale per teorie contenenti campi, particelle, stringhe e – più in generale – membrane
di qualsiasi estensione spaziale; vale a livello newtoniano cosı̀ come vale in Relatività
Ristretta e in Relatività Generale, vale in Fisica Classica e in Meccanica Quantistica, in
Teoria Quantistica Relativistica dei Campi e, ancora, nelle Teorie di Superstringa.

4.4 Invarianza di gauge e conservazione della carica elettrica

Nella sezione precedente abbiamo discusso il teorema di Noether relativo al gruppo di


Poincaré, con conseguente conservazione del quadrimomento e del momento angolare
quadridimensionale. Ma in Elettrodinamica esiste un’altra grandezza conservata – non
associata al gruppo di Poincaré – che è la carica elettrica, e se vale il teorema di Noether,
allora anche ad essa dovrebbe essere associato un gruppo a un parametro di simmetrie.
In effetti l’Elettrodinamica è dotata di una simmetria fondamentale che abbiamo già am-
piamento esplorato – l’invarianza di gauge – che potrebbe essere legata alla conservazione
della carica via il teorema di Noether.
Per analizzare questo possibile nesso facciamo intanto notare che le trasformazioni di
gauge costituiscono effettivamente un gruppo (abeliano), con un solo parametro Λ. Posto

A01µ = Aµ + ∂µ Λ1 ,

abbiamo infatti,
A02µ = A01µ + ∂µ Λ2 = Aµ + ∂µ (Λ1 + Λ2 ).

Esploriamo allora la variazione della lagrangiana (4.11) sotto una generica trasformazione
di gauge δAµ = A0µ − Aµ = ∂µ Λ. Risulta,

δL = −∂µ Λj µ = −∂µ (Λj µ ) + Λ ∂µ j µ ∼


= Λ ∂µ j µ ,

112
dove abbiamo sfruttato il fatto che le lagrangiana sono definite modulo quadridivergenze.
Avremmo dunque trovato proprio il legame implicato dal teorema di Noether, ovvero che
l’invarianza della lagrangiana implica la conservazione locale della carica,

δL = 0 ⇒ ∂µ j µ = 0. (4.27)

Tuttavia, il nesso appena evidenziato non segue proprio le linee del teorema di Noether,
per come l’abbiamo illustrato nella sezione precedente. Il primo motivo è che il parametro
Λ(x) non è un parametro “globale”, ovvero costante, come invece previsto dal teorema
di Noether; d’altra parte se Λ è costante la trasformazione di gauge si riduce banalmente
alla trasformazione identica. Il secondo motivo è che nella derivazione della (4.27) le
equazioni del moto dell’Elettrodinamica non hanno giocato nessun ruolo, mentre il loro uso
era essenziale nella dimostrazione delle leggi di conservazione (4.25). Sappiamo, infatti,
che la corrente (2.6) è conservata identicamente, indipendentemente dalla validità delle
equazioni del moto.
Si intuisce che questa a–simmetria esistente in Elettrodinamica classica tra il gruppo
di Poincarè e il gruppo delle trasformazioni di gauge, è dovuta al fatto che le particelle
cariche in questo ambito vengono trattate come “difetti” puntiformi: conseguentemente
la conservazione della carica totale – in ultima analisi – corrisponde semplicemente al
“conteggio” delle particelle contenute in un dato volume. Infatti, integrando la (2.40) su
un volume finito V si ottiene per la carica QV (t) contenuta all’istante t in V ,
Z X Z X
0 3
QV (t) = j (t, ~x) d x = er δ 3 (~x − ~yr (t)) d3 x = er ,
V r V r∈ V

dove la somma si estende a tutte le particelle che all’istante t si trovano in V .


Si può, al contrario, vedere che quando anche le particelle cariche vengono rappresenta-
te da campi – alla stessa stregua del campo elettromagnetico – allora la conservazione della
carica elettrica segue esattamente lo schema “a la Noether”, illustrato sopra per la con-
servazione di quadrimomento e momento angolare quadridimensionale. Questo succede,
per esempio, nell’ambito della teoria quantistica relativistica di campo.

113
4.5 Problemi

4.1 Seguendo il procedimento della sezione 4.1 si deducano le equazioni di Lorentz (2.12),
imponendo la stazionarietà dell’azione (4.8) per variazioni generiche δyrµ delle coordinate,
purché nulle in ar e br .

4.2 Si deduca la forma della lagrangiana di un sistema di cariche non relativistiche


interagenti con un campo elettromagnetico esterno, eseguendo il limite non relativistico
dell’azione (4.7),

114
5 Onde elettromagnetiche

In questo capitolo avviamo la ricerca di soluzioni esatte dell’equazioni di Maxwell e l’analisi


delle loro proprietà. La prima classe di soluzioni che analizzeremo è costituita dalle onde
piane elettromagnetiche, le quali costituiscono un particolare insieme completo di soluzioni
dell’equazione di Maxwell nel vuoto, cioè, in assenza di sorgenti,

j µ = 0.

La rilevanza fenomenologica di queste soluzioni è evidente. Basta pensare che l’energia


fornita dal sole viaggia interamente a cavallo di onde elettromagnetiche, e che qualsiasi
tipo di segnale che si propaga sulla terra via “etere” è costituito da queste onde. Ricor-
diamo inoltre che la quasi totalità dell’informazione che acquisiamo sull’universo arriva
sulla terra tramite segnali luminosi emessi da oggetti stellari, segnali costituiti da onde
elettromagnetiche che si propagano nello spazio vuoto su distanze molto grandi.
L’universo stesso poi è pervaso dalla cosiddetta radiazione cosmica di fondo, con ottima
approssimazione isotropa ed omogenea, che è caratterizzata da uno spettro in frequenza
di corpo nero ad una temperatura di T = 2.73 o K. Questa radiazione è messaggera di
un’epoca primordiale in cui la materia era costituita prevalentemente da particelle cariche
dissociate, soggette in continuazione a urti di natura elettromagnetica. Dopo “l’ultimo
scattering” e la conseguente ricombinazione delle particelle cariche in molecole neutre, il
campo di radiazione prodotto in questi urti si è disaccoppiato dalle cariche e si manifesta
oggi come “radiazione” di fondo – apparentemente priva di sorgenti.
In questo capitolo studieremo le proprietà delle onde elettromagnetiche, in quanto
base completa di soluzioni dell’equazione di Maxwell nel vuoto. Nel prossimo capitolo ci
occuperemo invece delle soluzioni dell’equazione di Maxwell in presenza di sorgenti. In
particolare determineremo il campo elettromagnetico esatto creato da una quadricorrente
j µ arbitraria. Lontano dalle sorgenti questo campo soddisfa di nuovo l’equazione di Max-
well nel vuoto, ed in quella regione potrà quindi essere analizzato a sua volta in termini
di onde elettromagnetiche.
Tuttavia, prima di poter affrontare questi argomenti dobbiamo capire qual è il conte-
nuto cinematico del campo elettromagnetico, ovverosia, quali sono le variabili indipendenti

115
che descrivono il suo stato in ogni istante. Detto in altre parole, dobbiamo individuare i
gradi di libertà fisici coinvolti nell’evoluzione temporale del campo elettromagnetico. Solo
allora saremo in grado di impostare correttamente il problema di Cauchy, cioè, di assegna-
re un insieme completo di dati iniziali, che attraverso l’equazione di Maxwell determinano
il valore del campo in ogni istante.

5.1 I gradi di libertà del campo elettromagnetico

Innanzitutto dobbiamo spiegare cosa intendiamo con “grado di libertà” in una generica
teoria di campo. La definizione che ne daremo costituisce una generalizzazione del con-
cetto analogo in meccanica classica – prototipo di un sistema lagrangiano a finiti gradi
di libertà. Prima di passare alla teoria di campo è allora utile ricordare brevemente il
significato di questo importante concetto in meccanica.

5.1.1 I gradi di libertà in meccanica newtoniana

In meccanica newtoniana il concetto di grado di libertà si riferisce al numero di variabili


lagrangiane necessarie per descrivere cinematicamente un sistema fisico. Per esempio,
una particella che si muove nello spazio tridimensionale è caratterizzata da tre gradi di
libertà, in quanto la sua posizione è specificata in ogni istante t dalle tre coordinate ~y (t).
Ma possiamo analizzare lo stesso sistema fisico anche da un altro punto vista, ponendoci
la domanda: quanti dati iniziali, diciamo a t = 0, dobbiamo assegnare per poter predire
la posizione della particella in ogni istante? La risposta – sei e non tre – è strettamente
legata alla dinamica della particella, vale a dire all’equazione di Newton,

d2 ~y
m = F~ ,
dt2

quale equazione differenziale del secondo ordine nel tempo, che richiede di assegnare sia
~y (0) che ~v (0). Potremmo porre il problema dinamico equivalentemente nella forma,

d~v d~y
m = F~ , = ~v ,
dt dt

che rappresenterebbe in effetti un sistema a sei gradi di libertà. Ci rendiamo cosı̀ conto
che la convenzione comune “una particella corrisponde a tre gradi di libertà” sottintende

116
in realtà tre gradi di libertà del secondo ordine. Equivalentemente potremmo infatti dire
che una particella corrisponde a sei gradi di libertà del primo ordine. La preferenza
per la prima convenzione discende dal fatto che il determinismo newtoniano – confermato
sperimentalmente in modo universale – prevede in generale che una variabile fondamentale
è determinata in ogni istante, se a un dato istante si conoscono il suo valore e la sua
derivata prima.
D’ora in poi useremo il termine “grado di libertà” – sottintendendo “del secondo
ordine” – per una variabile la cui dinamica sia governata da un’equazione del moto che,
noti il suo valore e la sua derivata ad un dato istante, determina la variabile in ogni
istante.

5.1.2 I gradi di libertà in teoria di campo

In teoria di campo le variabili fondamentali sono i campi – che da un punto di vista


meccanico corrispondono a un sistema a infiniti gradi di libertà. Mantenendo l’analogia
con la meccanica, ma adattando la prospettiva, diamo allora la seguente definizione.
Definzione. Diremo che un campo ϕ(t, ~x) corrisponde a un grado di libertà (del secondo
ordine) se le equazioni del moto che governano la sua dinamica sono tali, che noti ϕ(0, ~x)
e ∂0 ϕ(0, ~x) in tutto lo spazio, esse determinano ϕ(t, ~x) per ogni t.
Come prototipo di un’equazione di questo tipo consideriamo l’equazione per un campo
scalare,
2 ϕ = P (ϕ), (5.1)

dove P (ϕ) è un polinomio in ϕ e,

2 ≡ ∂µ ∂ µ = ∂02 − ∇2 ,

è l’operatore d’Alembertiano, completamento relativistico dell’operatore Laplaciano tri-


dimensionale. Questa equazione è del secondo ordine nella derivata temporale e ci aspet-
tiamo quindi che essa assegni a ϕ un grado di libertà. Per convincerci che questo è
effettivamente il caso fissiamo i dati iniziali,

ϕ(0, ~x) e ∂0 ϕ(0, ~x),

117
e cerchiamo di determinare ϕ(t, ~x) imponendo la (5.1). Se assumiamo che la soluzione sia
una funzione analitica in t possiamo svilupparla in serie di Taylor,
X∞
∂0n ϕ(0, ~x) n
ϕ(t, ~x) = t , (5.2)
n=0
n!

e cercare di determinare i coefficienti usando la (5.1). I coefficienti con n = 0 e n = 1


sono fissati dai dati inizili. Il coefficiente con n = 2 si ottiene invece valutando la (5.1) in
t = 0,
∂02 ϕ(0, ~x) = ∇2 ϕ(0, ~x) + P (ϕ(0, ~x)).

Derivando poi la (5.1) una volta rispetto al tempo e valutandola in t = 0 si ottiene il


coefficiente con n = 3,

∂03 ϕ(0, ~x) = ∇2 ∂0 ϕ(0, ~x) + P 0 (ϕ(0, ~x)) ∂0 ϕ(0, ~x).

Derivando ripetutamente la (5.1) rispetto al tempo si ottengono cosı̀ tutte le derivate


∂0n ϕ(0, ~x) in termini delle derivate spaziali dei dati iniziali ϕ(0, ~x) e ∂0 ϕ(0, ~x), e la solu-
zione è quindi univocamente determinata. È poi facile vedere che si giunge alla stessa
conclusione se P è un arbitrario polinomio in ϕ e ∂µ ϕ, e anche se il membro di destra
della (5.1) contiene un termine aggiuntivo noto j(x), indipendente da ϕ.

5.1.3 Il problema di Cauchy per l’equazione di Maxwell

Siamo ora in grado di affrontare il problema di Cauchy, ovverosia il problema alle condi-
zioni inziali, per l’equazione di Maxwell. In particolare vogliamo stabilire quanti e quali
sono i gradi di libertà associati alla propagazione del campo elettromagnetico. Se secondo
la nostra consueta strategia risolviamo l’identità di Bianchi introducendo un potenziale
vettore Aµ , allora il sistema di equazioni da risolvere schematicamente si scrive,

∂µ F µν = j ν , F µν ≡ ∂ µ Aν − ∂ ν Aµ , Aµ ≈ Aµ + ∂ µ Λ.

Condizioni asintotiche. Prima di affrontare la soluzione di questo sistema specifichia-


mo la classe di configurazioni del potenziale vettore e della corrente che consideriamo
“fisicamente accettabili”. Assumeremo intanto che la corrente sia nota e – ovviamente – a

118
quadridivergenza nulla. Supporremo inoltre che per ogni t fissato essa sia a supporto spa-
ziale compatto, come succede per qualsiasi distribuzione di carica realizzabile in natura.
Richiederemo, cioè, che,
j µ (t, ~x) = 0, per |~x| > R, (5.3)

dove il raggio R in generale dipende da t. Corrispondentemente accetteremo come so-


luzioni “fisiche” dell’equazione di Maxwell solo quelle che per ogni t fissato all’infinito
spaziale si annullano,
lim Aµ (t, ~x) = 0. (5.4)
|~
x|→∞

Si può, infatti, vedere che questa condizione discende essenzialmente dall’assunzione che
non ci siano cariche all’infinito.
Nel caso particolare di un campo elettromagnetico nel vuoto, in realtà non sembra
esserci nessun legame tra la condizione (5.4) e la posizione delle cariche – semplicemente
perché le cariche sono assenti. Tuttavia, un “campo nel vuoto” costituisce la schema-
tizzazione matematica di una situazione realizzabile fisicamente, in cui il campo è stato
generato da delle cariche “lontane” in un “passato lontano”, e quindi anche in questo
caso all’infinito esso sarà zero. Facciamo comunque notare che la condizione (5.4) esclude
anche certe soluzioni idealizzate – di per sé non fisiche – che vengono però spesso uti-
lizzate in Elettrodinamica per semplificare le analisi svolte. Cosı̀ essa esclude il campo
elettromagnetico costante e uniforme f µν , con potenziale vettore,

1
Aµ (x) = xν f νµ , F µν (x) = f µν ,
2

i campi prodotti da fili e piani infiniti uniformemente carichi, e la stessa onda piana, in
quanto infinitamente estesa, vedi (5.61).
Esplicitiamo ora l’equazione di Maxwell in termini del potenziale vettore,

∂µ (∂ µ Aν − ∂ ν Aµ ) = 2Aν − ∂ ν (∂µ Aµ ) = j ν .

Per via della presenza delle derivate seconde rispetto al tempo ci si potrebbe aspettare
che questo sistema corrisponda a quattro gradi di libertà. Tuttavia, questa conclusione è
affrettata, per i seguenti due motivi.

119
Un vincolo. Il primo motivo è costituito dal fatto che – come già notato nel para-
grafo 2.2.3 – le quattro componenti dell’equazione di Maxwell non sono funzionalmente
indipendenti. Definito,

Gν ≡ ∂µ F µν − j ν = 2Aν − ∂ ν (∂µ Aµ ) − j ν , (5.5)

vale infatti identicamente,

∂ν Gν = 0 ⇒ ∂0 G0 = −∂i Gi . (5.6)

Ciò significa che le quattro equazioni di Maxwell,

Gµ = 0,

sono equivalenti al sistema,

Gi (t, ~x) = 0, ∀t (5.7)

G0 (0, ~x) = 0. (5.8)

Infatti, imposto Gi (t, ~x) = 0 ∀ t la (5.6) assicura che ∂0 G0 (t, ~x) = 0, e quindi la funzione
G0 (t, ~x) è indipendente dal tempo; è allora sufficiente imporre il suo annullamento all’i-
stante t = 0. La componento 0 dell’equazione di Maxwell si riduce quindi a un vincolo
sui dati iniziali, e non va considerata come una vera e propria equazione del moto.
Invarianza di gauge e gauge–fixing. Il secondo motivo per cui il conteggio dei gradi
di libertà di cui sopra è errato è costituito dal fatto che il potenziale vettore è definito
solo modulo una trasformazione di gauge: i potenziali Aµ e Aµ + ∂ µ Λ corrispondono allo
stesso campo elettromagnetico F µν , e sono quindi fisicamente equivalenti. Si rende allora
necessario selezionare tra tutti i potenziali vettore associati ad un dato F µν , un unico
rappresentante, ovverosia, come si suol dire, attuare un “gauge–fixing” su Aµ . Evidente-
mente ci sono infiniti modi diversi di fissare la gauge, tutti fisicamente equivalenti. Noi
optiamo per la cosiddetta “gauge di Lorentz”, rappresentata dal vincolo,

∂µ Aµ = 0, (5.9)

per il suo pregio di essere preservata sotto trasformazioni di Lorentz 19 . La consistenza di


questa scelta deriva dal fatto che a partire da un potenziale vettore arbitrario è sempre
19 ~ ·A
Gauge–fixing non covarianti usati talvolta sono la gauge di Coulomb ∇ ~ = 0, e la gauge assiale
A = 0, oppure, più in generale, nµ Aµ = 0, con nµ vettore costante.
0

120
possibile eseguire una trasformazione di gauge, tale che il nuovo potenziale vettore abbia
quadridivergenza nulla,
∂µ (Aµ + ∂ µ Λ) = 0.

È infatti sufficiente scegliere Λ tale che,

2Λ = −∂µ Aµ ,

equazione che, come visto nel paragrafo precedente, ammette in effetti infinite soluzioni.
Con il gauge–fixing (5.9) l’equazione di Maxwell (5.5) si semplifica e diventa,

Gµ = 2Aµ − j µ = 0.

Useremo questa forma per le componenti spaziali Gi dell’equazione mentre, per quello che
segue, per la componente G0 è più conveniente usare l’espressione originale (5.5),

G0 = 2A0 − ∂ 0 (∂0 A0 + ∂i Ai ) − j 0 = −∇2 A0 − ∂i (∂ 0 Ai ) − j 0 = 0. (5.10)

Si noti che questa equazione non contiene la derivata seconda rispetto al tempo: come an-
ticipato sopra, essa va infatti interpretata come un vincolo, piuttosto che come equazione
dinamica.
Invarianza di gauge residua. Resta a questo punto la domanda se la gauge di Lorentz
è completa, cioè, se essa fissa il potenziale vettore univocamente. La risposta è negativa
perché, assumendo che valga ∂µ Aµ = 0 e volendo restare nella classe di potenziali che
soddisfano questa condizione, possiamo ancora eseguire trasformazioni di gauge Aµ →
Aµ + ∂ µ Λ, a patto che,

∂µ (Aµ + ∂ µ Λ) = 0 ⇒ 2Λ = 0.

Sussiste, cioè, l’invarianza di gauge “residua”,

Aµ ≈ Aµ + ∂ µ Λ, 2Λ = 0. (5.11)

Anche il gauge–fixing dell’invarianza residua può essere eseguito in infiniti modi equiva-
lenti. Noi optiamo per le condizioni,

A3 (0, ~x) = 0 = ∂0 A3 (0, ~x), (5.12)

121
che si possono in effetti imporre eseguendo una trasformazione di gauge residua. Per
farlo vedere ricordiamo dal paragrafo precedente che la soluzione dell’equazione 2Λ = 0
è completamente determinata dalle “condizioni iniziali”,

Λ(0, ~x) ≡ Φ1 (~x), ∂0 Λ(0, ~x) ≡ Φ2 (~x).

Per una trasformazione di gauge abbiamo,

A03 = A3 + ∂ 3 Λ, (5.13)

ed è facile vedere che esistono dei campi Φ1 e Φ2 tali che,

A03 (0, ~x) = A3 (0, ~x) + ∂ 3 Λ(0, ~x) = A3 (0, ~x) + ∂ 3 Φ1 (~x) = 0, (5.14)

∂0 A03 (0, ~x) = ∂0 A3 (0, ~x) + ∂ 3 ∂0 Λ(0, ~x) = ∂0 A3 (0, ~x) + ∂ 3 Φ2 (~x) = 0. (5.15)

Infatti, è sufficiente scegliere per Φ1 e Φ2 delle primitive rispetto alla variabile x3 , rispet-
tivamente di −A3 (0, ~x) e −∂0 A3 (0, ~x). Per il potenziale trasformato le (5.14) e (5.15)
equivalgono allora effettivamente alle (5.12).
In conclusione, tenendo conto delle condizioni di gauge–fixing (5.9) e (5.12) ci siamo
ricondotti al seguente sistema di equazioni,

2Ai = j i , (5.16)

∇2 A0 = −∂i (∂ 0 Ai ) − j 0 , per t = 0, (5.17)

∂µ Aµ = 0, (5.18)

A3 (0, ~x) = 0 = ∂0 A3 (0, ~x). (5.19)

Facciamo ora vedere che questo sistema ammette in effetti soluzione unica per Aµ (t, ~x),
una volta assegnate le condizioni iniziali “fisiche”,

A1 (0, ~x), ∂0 A1 (0, ~x), A2 (0, ~x), ∂0 A2 (0, ~x). (5.20)

Intanto osserviamo che con queste condizioni iniziali e con le (5.19), le tre equazioni (5.16)
determinano Ai (t, ~x) per ogni t. Noti i campi Ai , la (5.17) determina allora univocamente
A0 (0, ~x), perché nello spazio delle funzioni che svaniscono all’infinito il Laplaciano tridi-
mensionale ammette inverso unico, vedi sezione 6.1. Noti A0 (0, ~x) e i campi Ai (t, ~x), la

122
(5.18) determina infine A0 (t, ~x) per ogni t,
Z t
0 0
A (t, ~x) = A (0, ~x) − ~ · A(t
∇ ~ 0 , ~x) dt0 .
0

In conclusione, una volta assegnate le quattro condizioni iniziali fisiche (5.20), l’equa-
zione di Maxwell determina i campi Aµ (t, ~x) in modo univoco. Con la procedura scelta
da noi i campi “fisici” sono risultati A1 e A2 , ma è chiaro che una scelta diversa del
gauge–fixing porterà ad assegnazioni diverse. Quello che resterà però invariato è il nu-
mero di condizioni iniziali – quattro – che si possono imporre arbitrariamente. Resta
poi il problema, solo tecnico, di come si deducono i dati (5.20) a partire dai dati iniziali
osservabili sperimentalmente, che sono i campi elettrico e magnetico all’istante iniziale.
~ ~x) e B(0,
Difatti, noti E(0, ~ ~x) e imposti i gauge–fixing (5.18) e (5.19), la determinazione

dei dati iniziali (5.20) è un semplice esercizio, lasciato al lettore.


I due gradi di libertà del campo elettromagnetico. Dai dati indipendenti (5.20) vedia-
mo infine che il campo elettromagnetico corrisponde a due gradi di libertà, come anticipato
nel paragrafo 2.2.3, e non a quattro. Dalla nostra trattazione si desume in particolare
che il meccanismo che elimina da Aµ due gradi di libertà è essenzialmente il seguente: un
grado di libertà viene assorbito dall’invarianza di gauge e l’altro dall’invarianza di gauge
residua, in concomitanza con il fatto che una delle quattro equazioni di Maxwell in realtà
è un vincolo. Aggiungiamo, tuttavia, che 1) quali siano le componenti di Aµ che appaiono
come fisiche, dipende dalla scelta del gauge–fixing, e che 2) sotto una trasformazione di
Lorentz queste componenti non restano invariate. Infatti, mentre la gauge di Lorentz
(5.9) è invariante sotto trasformazioni di Lorentz, le condizioni (5.12) non lo sono. È im-
portante notare che questa circostanza non viola affatto l’invarianza relativistica, perchè,
come abbiamo visto, in qualsiasi sistema di riferimento le condizioni (5.12) possono essere
ripristinate eseguendo un’opportuna trasformazione di gauge.
Il fatto che i gradi di libertà fisici del campo elettromagnetico sono due ha varie con-
seguenze importanti: a livello classico esso implica, come vedremo tra poco, che le onde
elettromagnetiche sono caratterizzate da due vettori di polarizzazione indipendenti, men-
tre a livello quantistico esso comporta che i fotoni esistono in due stati di polarizzazione
indipendenti, contrassegnati da “elicità” opposte.

123
5.2 L’equazione delle onde

Consideriamo un campo scalare reale con lagrangiana,

1
L= ∂µ ϕ∂ µ ϕ. (5.21)
2
L’equazione di Eulero–Lagrange associata a questa lagrangiana viene chiamata equazione
delle onde, o anche equazione di d’Alembert,

∂L ∂L
∂µ − = ∂µ ∂ µ ϕ = 2ϕ = 0. (5.22)
∂(∂µ ϕ) ∂ϕ
Essa riveste un ruolo importante in Fisica e in particolar modo in Elettrodinamica, motivo
per cui ora analizzeremo in dettaglio la sua soluzione generale. In particolare vedremo che
la ricerca delle soluzioni dell’equazione di Maxwell nel vuoto sarà molto facilitata dalla
conoscenza della soluzione generale della (5.22). In analogia con le condizioni asintotiche
(5.4) considereremo solo soluzioni che soddisfano,

lim ϕ(t, ~x) = 0. (5.23)


|~
x|→∞

Se assumiamo che eventuali singolarità di ϕ(x) siano di tipo distribuzionali, vale a dire
se assumiamo che ϕ sia un elemento di S 0 (R4 ), un metodo potente per risolvere l’equazione
delle onde è fornito dalla trasformata di Fourier, che costituisce appunto una biiezione di
S 0 in se stesso. Ricordiamo che in notazione simbolica questa trasformata è definita da,
Z Z
1 4 −ik·x 1
ϕ(k)
b = d xe ϕ(x), ϕ(x) = d4 k eik·x ϕ(k),
b (5.24)
(2π)2 (2π)2
dove abbiamo introdotto la variabile duale k ≡ k µ e definito k · x = k µ xµ ηµν . Tra le
proprietà della trasformata di Fourier ci serviranno le seguenti, vedi paragrafo 2.3.2.
1) Se il campo ϕ è reale, come da noi sottinteso, allora la trasformata soddisfa,

b ∗ (k) = ϕ(−k).
ϕ b (5.25)

Per vederlo è sufficiente prendere il complesso coniugato della prima relazione in (5.24),
e sfruttare il fatto che ϕ∗ (x) = ϕ(x).
2) Se ϕ(x) è un campo scalare sotto trasformazioni di Lorentz, e se assegniamo a k µ
carattere vettoriale,
k 0µ = Λµ ν k ν ,

124
allora anche la trasformata ϕ(k)
b è un campo scalare,

b0 (k 0 ) = ϕ(k).
ϕ b

Per la dimostrazione è sufficiente usare le relazioni k 0 · x0 = k · x, e d4 x0 = d4 x.


3) Per la trasformata delle derivate di ϕ abbiamo,

[P\
(∂µ )ϕ](k) = P (ikµ )ϕ(k),
b

dove P (∂µ ) è un qualsiasi polinomio nelle derivate parziali ∂µ .


Usando la proprietà 3) è immediato eseguire la trasformata di Fourier dell’equazione
delle onde, e si ottiene,
k 2 ϕ(k)
b = 0, (5.26)

dove,
k 2 = kµ k µ = (k 0 )2 − |~k|2 .

In seguito useremo anche,


ω ≡ |~k|,

per indicare la “frequenza”. Vediamo che la trasformata di Fourier ha mutato l’equazio-


ne differenziale (5.22) in un’equazione algebrica, facilmente risolubile nello spazio delle
distribuzioni. Dalla (5.26) si vede in particolare che ϕ(k)
b ha come supporto il cono luce,

k 0 = ±|~k|,

ed è quindi chiaro che essa non può essere una “funzione” ordinaria. In realtà le soluzioni
di questa equazione cadono in due categorie, che ora analizzeremo separatamente.
Soluzioni di tipo I. Analizziamo innanzitutto le soluzioni in una regione del cono luce
che non contenga l’origine, cioé, per ~k 6= 0. Per ~k fissato è allora conveniente considerare
le ϕ(k)
b come distribuzioni nella sola variabile k 0 , perché in questo modo le soluzioni della
(5.26) possono essere derivate direttamente dalla soluzione del problema 2.3. È infatti
sufficiente eseguire in questo problema le sostituzioni,

x → k0, a → ω, x2 − a2 → (k 0 )2 − ω 2 = k 2 , f (x) → f (k),

125
con f (k) generica funzione complessa di k µ , per ottenere le soluzioni della (5.26),

bI (k) = δ(k 2 )f (k).


ϕ (5.27)

Ricordando che ϕ(x) è reale la (5.25) impone poi,

f ∗ (k) = f (−k). (5.28)

Inoltre, dato che δ(k 2 ) è Lorentz–invariante e ϕ(k)


b è campo scalare, anche la funzione
f (k) è dunque uno scalare per trasformazioni di Lorentz. Usando le proprietà della δ di
Dirac possiamo allora esplicitare le soluzioni (5.27) come segue,

1 ¡ ¢
ϕ
bI (k) = δ(k 0 − ω) + δ(k 0 + ω) f (k 0 , ~k)

1 ³ ´
= 0 ~ 0
δ(k − ω)f (ω, k) + δ(k + ω)f (−ω, k) ~

1 ³ ´
= 0 ~ 0 ∗
δ(k − ω) ε(k) + δ(k + ω) ε (−k) , ~ (5.29)

dove nell’ultimo passaggio abbiamo definito la funzione complessa di tre variabili,

ε(~k) ≡ f (ω, ~k),

e sfruttato la (5.28).
Soluzioni di tipo II. Il problema 2.3 è ben posto solo se a 6= 0, ovvero ω 6= 0, che
esclude dal cono luce l’origine quadridimensionale k µ = 0. Potrebbero dunque esistere
ulteriori soluzioni della (5.26), supportate nel punto k µ = 0. Per il teorema sulle distribu-
zioni supportate in un punto, vedi paragrafo 2.3.2, sappiamo allora che queste soluzioni
sarebbero necessariamente combinazioni lineari finite della δ 4 (k) e delle sue derivate,
N
X
ϕ
bII (k) = C µ1 ···µn ∂µ1 · · · ∂µn δ 4 (k), (5.30)
n=1

dove i C µ1 ···µn sono arbitrari tensori costanti completamente simmetrici. Antitrasformando


questa espressione nello spazio delle configurazioni e tenendo conto che la trasformata della
δ 4 vale 1/(2π)4 si ottiene,
N
1 X
ϕII (x) = (−i)n C µ1 ···µn xµ1 · · · xµn . (5.31)
(2π)4 n=1

126
Inserendo questa espressione nella (5.22) è facile vedere che l’equazione di d’Alembert è
soddisfatta, se e solo se i tensori simmetrici C sono anche a traccia nulla,

Cν νµ3 ···µn = 0. (5.32)

Ed è altrettanto immediato vedere che queste condizioni ammettono infinite soluzioni. Per
esempio, nel caso n = 2, che corrisponde a un polinomio del secondo ordine, la soluzione
generale della (5.32) è data da,

1 µν ρ
C µν = H µν − η H ρ,
4

dove H µν è un’arbitraria matrice simmetrica costante. Concludiamo quindi che esiste una
seconda classe di soluzioni, rappresentate dalla (5.31), che sono polinomi in xµ . Tuttavia,
come tali non svaniscono all’infinito spaziale, e quindi non le ammettiamo come soluzioni
fisiche.
Ritorniamo allora alle soluzioni di tipo I (5.29), antitrasformandole nello spazio delle
coordinate secondo la (5.24). Integrando la δ di Dirac in k 0 e eseguendo nell’integrale
che coinvolge ε∗ (−~k) il cambiamento di variabili ~k → −~k, si ottiene la soluzione generale
dell’equazione delle onde,
Z 3 Z ³ ´
1 dk 0 i(k0 x0 −~k·~
x) 0 ~k) + δ(k 0 + ω) ε∗ (−~k) ,
ϕ(x) = dk e δ(k − ω) ε(
(2π)2 2ω
Z 3 ³ ´
1 d k ik·x ~
= e ε(k) + c.c. . (5.33)
(2π)2 2ω

Sottolineiamo il fatto che nell’espressione finale (5.33) la componente k 0 nell’esponenziale


è definita da k 0 = +ω, e che k 2 = 0. Vediamo quindi che la soluzione generale è identificata
da due funzioni reali di tre variabili,

ε(~k) = ε1 (~k) + i ε2 (~k),

in accordo con il fatto che un campo scalare che soddisfa l’equazione delle onde corrisponde
a un grado di libertà. Difatti non è difficile determinare ε1 (~k) e ε2 (~k) in termini dei dati
iniziali ϕ(~x, 0) e ∂0 ϕ(~x, 0), e viceversa, vedi il prossimo paragrafo.
Onde elementari. Vediamo che la soluzione generale (5.33) dell’equazione delle onde
può essere riguardata come una sovrapposizione di infinite “onde elementari” di vettore

127
d’onda ~k fissato,
ϕel (x) = ε(~k) eik·x + c.c., k 0 = ω. (5.34)

Esaminiamo ora le principali proprietà di queste onde.


a) Le ϕel sono onde piane, i cui piani delle fasi sono ortogonali a ~k. Per t fissato su un
piano delle fasi la funzione ϕel (x) assume lo stesso valore.
b) Le ϕel sono onde che si propagano con la velocità della luce nella direzione di ~k. Se
scegliamo ~x//~k abbiamo infatti: kµ xµ = ω t − ~k · ~x = ω(t − |~x|).
c) Le ϕel sono onde monocromatiche di frequenza ω, periodo T = 2π/ω e lunghezza d’onda
λ = 2πc/ω, fissati.
d) Le ϕel sono onde scalari nel senso che il “tensore di polarizzazione” ε, che ne identifica
l’intensità, è uno scalare sotto trasformazioni di Lorentz.
e) Contenuto in energia. Dalla lagrangiana (5.21) è immediato ottenere il tensore energia–
impulso del campo, vedi problema 3.4,

1 µν α
T µν = ∂ µ ϕ∂ ν ϕ − η ∂ ϕ∂α ϕ. (5.35)
2

Per valutarlo determiniamo le derivate dell’onda elementare,

∂µ ϕel (x) = i kµ ε(~k) eik·x + c.c.

e introduciamo il “vettore” di tipo nullo,

kµ ~k
nµ ≡ , n0 = 1, ~n = , n2 = nµ nµ = 0, (5.36)
ω ω

dove ~n è il versore tridimensionale che indica la direzione di propagazione dell’onda. Allora


possiamo scrivere in modo compatto,

∂µ ϕel = nµ ϕ̇el ,

e ne segue che ∂ α ϕel ∂α ϕel = 0. Usando queste relazioni nella (5.35) e inserendo la (5.34)
si ottiene,
¡ ¢
T µν = nµ nν ϕ̇2el = nµ nν ω 2 2|ε|2 − ε2 e2ik·x − ε∗2 e−i2k·x . (5.37)

Mediando il tensore energia–impulso su scale temporali grandi rispetto al periodo e su


scale spaziali grandi rispetto alla lunghezza d’onda, gli esponenziali si mediano a zero e

128
si ottiene,
hT µν i = 2 k µ k ν |ε|2 .

Vediamo che la densità di energia dell’onda vale in media hT 00 i = 2 ω 2 |ε|2 , mentre il


flusso di energia vale hT 0i i = 2 ω 2 |ε|2 ni ed è diretto lungo la direzione di propagazione
dell’onda. Considerando infine un volume V piccolo, ma grande rispetto alla lunghezza
d’onda, possiamo determinare il quadrimomento P µ ivi contenuto. Otteniamo,

P 0 = hT 00 i V = 2 ω 2 |ε|2 V, P i = hT 0i i V = 2 ω 2 |ε|2 V ni .

La massa della “particella” corrispondente a questo volume risulta allora essere uguale a
zero in quanto,
¡ ¢2 ¡ ¢
M 2 = P µ Pµ = 2 ω 2 |ε|2 V 1 − |~n|2 = 0.

Questo risultato è in accordo con il fatto che in teoria quantistica di campo la particella
associata a un campo scalare soddisfacente l’equazione delle onde (5.22), è in effetti una
particella (neutra e di spin zero) priva di massa.

5.2.1 Il problema alle condizioni iniziali

Affrontiamo infine il problema alle condizioni iniziali. Vogliamo, cioè, trovare la forma
esplicita della soluzione dell’equazione delle onde, fissati i dati iniziali,

ϕ(0, ~x) ≡ f (~x),

∂0 ϕ(0, ~x) ≡ g(~x).

Si tratta dunque di determinare la funzione complessa ε(~k) della (5.33), in termini del-
le due funzioni reali f e g. A questo scopo è conveniente sviluppare queste ultime in
trasformata di Fourier,
Z Z
1 ~ 1 ~
f (~x) = 3/2
d3 k e−ik·~x fb(~k), g(~x) = d3 k e−ik·~x gb(~k), (5.38)
(2π) (2π)3/2

e valutare la (5.33) e la sua derivata temporale a t = 0,


Z 3 ³ ´
1 d k −i~k·~x ~
f (~x) = ϕ(0, ~x) = e ε(k) + c.c. ,
(2π)2 2ω
Z 3 ³ ´
1 dk −i~k·~
x ~
g(~x) = ∂0 ϕ(0, ~x) = i ω e ε(k) + c.c. . (5.39)
(2π)2 2ω

129
Confrontando con le (5.38) e antitrasformando si trova,

1 1 ³ ~ ´
fb(~k) = √ ∗ ~
ε(k) + ε (−k) ,
2π 2ω
1 i ³ ~ ´
gb(~k) = √ ∗ ~
ε(k) − ε (−k) ,
2π 2

e quindi,
p ³ ´
ε(~k) = b ~ ~
(2π) ω f (k) − i gb(k) .

Sostituendo questa espressione nella (5.33) si ottiene,


Z
1 d3 k h ik·x ³ b ~ ~
´ i
ϕ(x) = e ω f (k) − ib
g (k) + c.c. . (5.40)
(2π)3/2 2ω

Infine possiamo invertire le trasformate (5.38) per riesprimere fb e gb in termini di f e g.


Sostituendo le espressioni che ne risultano nella (5.40) si trova infine la formula cercata,
vedi problema 5.1,
Z
ϕ(t, ~x) = d3 y [D(t, ~x − ~y ) ∂0 ϕ(0, ~y ) + ∂0 D(t, ~x − ~y ) ϕ(0, ~y )] , (5.41)

dove il “kernel antisimmetrico” D è dato da,


Z Z
1 d3 k ¡ ik·x ¢ 1 sen(ωt) i~k·~x
D(t, ~x) = e − e−ik·x = d3 k e . (5.42)
(2π)3 2ωi (2π)3 ω

La trasformata di Fourier tridimensionale che compare in questa espressione è da inten-


dersi nel senso delle distribuzioni. Eseguendola esplicitamente si trova, vedi problema
5.1,
1 1
D(t, ~x) = (δ(t − r) − δ(t + r)) = ε(t) δ(x2 ), (5.43)
4πr 2π
dove ε(·) indica la funzione “segno” e r = |~x|. Dalle espressioni scritte sopra si deduce
facilmente che questo kernel gode delle seguenti proprietà,

2D = 0, (5.44)

D(0, ~x) = 0, (5.45)

∂0 D(0, ~x) = δ 3 (~x). (5.46)

Usando queste proprietà è poi immediato verificare esplicitamente che la (5.41) soddisfa
l’equazione delle onde (5.22), con le corrette condizioni iniziali. Per quanto riguarda

130
ϕ(0, ~x) questo discende direttamente dalle (5.45), (5.46), mentre per quanto riguarda
∂0 ϕ(0, ~x), derivando la (5.41) rispetto al tempo e ponendo t = 0 si ottiene,
Z
£ ¤
∂0 ϕ(0, ~x) = d3 y ∂0 D(0, ~x − ~y ) ∂0 ϕ(0, ~y ) + ∂02 D(0, ~x − ~y ) ϕ(0, ~y ) .

Il primo integrale si riduce a ∂0 ϕ(0, ~x) grazie alla (5.46), mentre il secondo si annulla
perché la (5.44) valutata in t = 0 dà,

∂02 D(0, ~x) = ∇2 D(0, ~x) = 0,

grazie alla (5.45). Torneremo sul significato fisico del kernel D, e le conseguenti proprietà
della soluzione (5.41), nella prossima sezione.

5.3 Soluzioni dell’equazione di Maxwell nel vuoto

In questa sezione determineremo la soluzione generale dell’equazione di Maxwell in assenza


di sorgenti,

∂µ F µν = 0, F µν ≡ ∂ µ Aν − ∂ ν Aµ , Aµ ≈ Aµ + ∂ µ Λ. (5.47)

Un campo elettromagnetico che soddisfa questa equazione viene chiamato “campo libero”,
oppure “campo di radiazione”. Stiamo quindi cercando la forma di un generico campo
di radiazione. Siccome il sistema di equazioni in questione è lineare nei campi, la tecnica
di soluzione più appropriata è ancora quella della trasformata di Fourier. Ricordiamo
infatti che, in base all’analisi svolta nella sezione 2.3, consideriamo sia F µν che Aµ come
distribuzioni temperate.
Per affrontare la soluzione del sistema (5.47) dobbiamo innanzitutto decidere il tipo di
gauge–fixing che vogliamo adottare. Come esemplificato nel paragrafo 5.1.3, ci conviene
scegliere la gauge di Lorentz,
∂µ Aµ = 0,

per via della sua covarianza a vista, mentre ci riserviamo di fissare la gauge residua in
un secondo momento. Secondo l’analisi svolta nel paragrafo 5.1.3, particolarizzata al caso
j µ = 0, dobbiamo allora risolvere il seguente sistema,

2Aµ = 0, (5.48)

131
∂µ Aµ = 0, (5.49)

Aµ ≈ Aµ + ∂ µ Λ, 2Λ = 0. (5.50)

La trasformata di Fourier del potenziale vettore è definita in modo standard,


Z
bµ 1
A (k) = d4 x e−ik·x Aµ (x),
(2π)2
b
e analogamente quella Λ(k) bµ (k) e
del campo Λ(x). L’unica differenza sostanziale tra A
la trasformata di Fourier del campo scalare ϕ(k),
b è che sotto trasformazioni di Lorentz
bµ (k) trasforma come un campo vettoriale, vedi problema 5.2,
A

b0µ (k 0 ) = Λµ ν A
A bν (k).

Il sistema di equazioni differenziali (5.48)–(5.50) muta allora nuovamente in un sistema


algebrico,

bµ (k) = 0,
k2A (5.51)
bµ (k) = 0,
kµ A (5.52)
bµ (k) ≈ A
A bµ (k) + i k µ Λ(k),
b b
k 2 Λ(k) = 0. (5.53)

La soluzione generale della (5.51) si ottiene come nel caso delle onde scalari, vedi (5.27)
e (5.29), con l’unica differenza che la funzione “peso” ora è un quadrivettore f µ (k),
³ ´
bµ (k) = δ(k 2 )f µ (k) = 1 δ(k 0 − ω) εµ (~k) + δ(k 0 + ω) ε∗µ (−~k) ,
A (5.54)

dove abbiamo posto,


εµ (~k) ≡ f µ (ω, ~k), ω = |~k|.

Cosı̀ come nel caso delle onde scalari ε(~k) era un quadriscalare cosı̀ ora εµ (~k) è un quadri-
vettore, che viene chiamato “vettore di polarizzazione”. A questo punto la (5.52) impone
su questo vettore la condizione di “trasversalità”,

kµ εµ = 0, con k 0 = ω. (5.55)

b si ottiene,
Analogamente, risolvendo l’equazione (5.53) per Λ

b 1 ³ 0 ~ 0 ∗ ~
´
Λ(k) = δ(k − ω)λ(k) − δ(k + ω)λ (−k) .
2ωi
132
La (5.53) asserisce allora che i vettori di polarizzazione, oltre a essere soggetti al vincolo
(5.55), sono definiti modulo la trasformazione di gauge residua,

εµ (~k) ≈ εµ (~k) + k µ λ(~k). (5.56)

Si noti che questa trasformazione preserva la gauge di Lorentz (5.55), in quanto grazie a
k 2 = 0 si ha,
kµ (εµ + k µ λ) = 0.

Si evince cosı̀ che delle quattro componenti del vettore di polarizzazione solo due hanno
rilevanza fisica: una componente viene eliminata dalla condizione (5.55), e un’altra dalla
gauge residua (5.56). Scegliendo per esempio nella (5.56),

ε0
λ=− ,
ω

possiamo annullare ε0 , e la (5.55) si riduce allora a,

~k · ~ε = 0,

che impone l’annullamento della componente di ~ε lungo la direzione di ~k. Riconfermiamo


cosı̀ il fatto che il campo elettromagnetico propaga due gradi di libertà fisici.
Antitrasformando la (5.54) si trova infine il potenziale vettore nello spazio delle coor-
dinate,
Z
µ 1 d3 k ³ ik·x µ ~ ´
A (x) = e ε (k) + c.c. , (5.57)
(2π)2 2ω
e per il campo elettromagnetico si ottiene allora,
Z
µν µ ν 1 ν µ d3 k ¡ ik·x µ ν ¢
F =∂ A −∂ A = i e [k ε − k ν εµ ] + c.c. . (5.58)
(2π)2 2ω

Introducendo per la variabile di integrazione ~k coordinate polari, ~k ↔ (ω, ϕ, ϑ), d3 k =


ω 2 dω dΩ, si può anche scrivere,
Z ∞ Z ³ ´
µν i iωt −i~k·~
x µ ν ν µ
F (t, ~x) = dω e ω dΩ e [k ε − k ε ] + c.c. (5.59)
2(2π)2 0

Riconosciamo in particolare che questa espressione può essere posta nella forma,
Z ∞
µν 1
F (t, ~x) = √ dω eiωt F µν (ω, ~x), F ∗µν (ω, ~x) = F µν (−ω, ~x). (5.60)
2π −∞

133
Vediamo cosı̀ che la trasformata di Fourier di F µν nella sola variabile t, ovvero la quantità
F µν (ω, ~x), rappresenta il peso relativo con cui ogni frequenza ω compare nella sovrappo-
sizione di onde piane, di cui è composto il campo elettromagnetico nel vuoto. Questo
risultato verrà utilizzato quando analizzeremo il contenuto energetico della radiazione
“frequenza per frequenza”, cioè, quando eseguiremo la sua analisi spettrale, vedi capitolo
10.

5.3.1 Proprietà delle onde elettromagnetiche elementari

Dalla soluzione generale (5.57) dell’equazione di Maxwell nel vuoto vediamo che il generico
potenziale vettore risulta sovrapposizione di onde elementari, con vettore d’onda ~k fissato,

Aµel (x) = εµ eik·x + c.c., k 0 = ω, kµ εµ = 0, εµ ≈ εµ + k µ λ. (5.61)

Dalla sezione 5.2 sappiamo già che queste onde sono piane, moncocromatiche, e che viag-
giano con la velocità della luce. Ma queste onde non sono scalari, perché il tensore di
polarizzazione εµ è ora un vettore.
Le relazioni delle onde. Per derivare le caratteristiche addizionali derivanti dalla na-
turale tensoriale di queste onde, vedi le proprietà 1) – 4) elencate sotto, è conveniente
trovare un’opportuna forma per le derivate di Aµel . Per non appesantire la notazione d’ora
in poi indicheremo questo potenziale vettore semplicemente con Aµ . Derivando la (5.61)
risulta allora,
∂µ Aν = ikµ εν eik·x + c.c. (5.62)

Seguendo la notazione della sezione 5.2, vedi (5.36),

kµ ~k
nµ ≡ , n0 = 1, ~n = , n2 = nµ nµ = 0,
ω ω

dalle (5.61) e (5.62) seguono cosı́ facilmente le “relazioni delle onde”,

∂µ Aν = nµ Ȧν , nµ Ȧµ = 0, nµ nµ = 0. (5.63)

Queste relazioni investono un ruolo importante perché, come vedremo più avanti, non
valgono solo per le onde piane, ma anche per un generico campo elettromagnetico nella
cosiddetta “zona delle onde”, ovvero a grandi distanze dalle sorgenti. La dimostrazione

134
delle proprietà 1), 2) e 4) si baserà infatti su queste relazioni, e non sulle formule esplicite
(5.61): queste proprietà varranno quindi anche per un generico campo nella zona delle
onde – circostanza che sfrutteremo pesantemente quando studieremo il fenomeno dell’ir-
raggiamento da parte di cariche accelerate, vedi capitolo 7.
1) Onde trasverse. Le onde elettromagnetiche sono polarizzate trasversalmente, vale a
dire,
~ = 0 = ~n · B.
~n · E ~ (5.64)

I campi elettrico e campo magnetico sono quindi sempre ortogonali alla direzione di pro-
pagazione. Per far vedere questo determiniamo il campo elettromagnetico usando le
(5.63),
F µν = ∂ µ Aν − ∂ ν Aµ = nµ Ȧν − nν Ȧµ . (5.65)

Quindi,

E i = F i0 = ni Ȧ0 − Ȧi = ni (nk Ȧk ) − Ȧi (5.66)


1
B i = − εijk F jk = −εijk nj Ȧk , (5.67)
2

dove abbiamo usato che,


nµ Ȧµ = 0 ⇒ Ȧ0 = nk Ȧk . (5.68)

Le condizioni di trasversalità (5.64) seguono allora immediatamente dalle (5.66), (5.67).


~ e B.
2) Relazione tra E ~ Le onde elettromagnetiche sono tali che,

~ = |B|,
|E| ~ ~ ·B
E ~ = 0. (5.69)

Per fare vedere questo è sufficiente ricordare la forma degli invarianti quadratici,

~ · B,
εαβγδ Fαβ Fγδ = −8 E ~ F αβ Fαβ = 2 (B 2 − E 2 ).

Inserendo la (5.65) si trova che entrambi gli invarianti sono nulli – il primo per l’antisim-
metria del tensore di Levi–Civita, e il secondo per le (5.63) – e seguono le (5.69). Possiamo
riassumere le proprietà 1) e 2) nelle formule,

~ = ~n × E,
B ~ ~ = 0.
~n · E (5.70)

135
3) Due stati di polarizzazione fisici. Per ogni ~k fissato esistono due stati di polarizzazione
fisici indipendenti. Abbiamo già accennato a questo fatto nel paragrafo precedente, quı̀ lo
illustriamo da un altro punto di vista. Per concretezza scegliamo come asse z la direzione
di propagazione dell’onda, sicché,

k µ = (ω, 0, 0, ω).

La condizione kµ εµ = 0 pone allora εµ = (ε0 , ε1 , ε2 , ε0 ). Questo vettore di polarizzazione


può essere considerato come sovrapposizione dello stato “longitudinale” non fisico,

εµl = (ε0 , 0, 0, ε0 ),

e dei due stati di polarizzazione “trasversi” fisici,

εµt = (0, ε1 , ε2 , 0).

Questa terminologia è giustificata dal fatto che lo stato longitudinale può essere eliminato
con una trasformazione di gauge residua,

εµ → ε0µ = εµ + λ k µ = (ε0 + λω, ε1 , ε2 , ε0 + λω),

scegliendo λ = −ε0 /ω, mentre gli stati trasversi sono gauge invarianti e quindi osservabili.
Vedremo che in pratica non sarà quasi mai necessario usare l’invarianza di gauge residua
per eliminare lo stato longitudinale dal potenziale vettore – operazione che violerebbe
l’invarianza di Lorentz manifesta. Al contrario, la presenza formale dello stato longitudi-
nale può essere usata in molti casi per controllare la correttezza dei calcoli che si stanno
svolgendo: infatti, tutti le quantità osservabili non devono risentire della presenza dello
stato longitudinale. Dal punto di vista matematico questa richiesta si traduce nel fatto
che le grandezze osservabili devono essere invarianti sotto trasformazioni di gauge residue.
A titolo di esempio consideriamo i campi elettrico e magnetico dati in (5.66), (5.67),
che certamente costitituiscono delle grandezze osservabili. Dalle (5.61) vediamo che la
trasformazione di gauge residua per l’onda elementare assume la forma,

Aµ → Aµ + nµ ϕ, (5.71)

136
dove ϕ è un’arbitraria onda piana scalare di vettore d’onda ~k. È allora immediato verificare
che sotto queste trasformazioni le espressioni (5.66), (5.67) sono invarianti,

E i → E i + ni (nk nk ϕ̇) − ni ϕ̇ = E i

B i → B i − εijk nj nk ϕ̇ = B i .

La presenza di due soli gradi di libertà fisici nelle onde piane elettromagnetiche può essere
~ è
desunta anche direttamente dalle relazioni (5.70): queste implicano appunto che B
~ e che E
completamente determinato in termini di E, ~ è vincolato dall’equazione ~n · E
~ = 0.

Fissato ~k le uniche osservabili fisiche indipendenti dell’onda sono quindi le due componenti
~ ortogonali ad ~n.
di E
4) Contenuto in energia. Il contenuto in energia e quantità di moto di un generico campo
elettromagnetico è espresso dal tensore energia–impulso (2.69),

µν 1 µν αβ
Tem = F µ α F αν + η F Fαβ .
4

Valutiamolo per le onde elementari usando le (5.65). Sappiamo già che l’invariante F αβ Fαβ
si annulla, e resta da valutare,

µν
Tem = (nµ Ȧα − nα Ȧµ )(nα Ȧν − nν Ȧα ) = −nµ nν (Ȧα Ȧα ), (5.72)

da confrontare con la (5.37). Possiamo riscrivere questa formula in vari modi. Eliminando
Ȧ0 secondo la (5.68), otteniamo un’espressione che coinvolge solo il potenziale vettore
spaziale,
µν
Tem = nµ nν (Ȧi Ȧj ) Λij , Λij ≡ δ ij − ni nj . (5.73)

Da questa espressione si vede in particolare che il tensore energia–impulso – certamente


una grandezza osservabile – è invariante sotto le trasformazioni di gauge residue (5.71),
che equivalgono alla sostituzione,

Ai → Ai + ni ϕ. (5.74)

Per vederlo è sufficiente notare che vale identicamente,

Λij nj = 0.

137
In effetti la matrice 3 × 3 simmetrica Λij è un proiettore di rango due, che elimina da
µν
Tem la componente longitudinale di Ai – quella parallela a ni – la quale non può essere
trasportatrice di quadrimomento, in quanto non fisica. Quanto detto diventa molto tra-
sparente se scegliamo come asse z la direzione di propagazione dell’onda, ni = (0, 0, 1).
In questo caso la (5.73) si riduce a,
µ ³ ´2 ¶ h i
µν µ ν i i i i
Tem = n n Ȧ Ȧ − n Ȧ = nµ nν (Ȧ1 )2 + (Ȧ2 )2 , (5.75)

mentre la (5.74) equivale a,

A1 → A1 , A2 → A2 , A3 → A3 + ϕ.

L’invarianza del tensore energia–impulso sotto trasformazioni di gauge residue si riduce


allora semplicemente al fatto che esso non dipende dalla componente longitudinale A3 .
Confrontando la (5.75) con la (5.37) riscontriamo di nuovo il fatto che alle onde elettro-
magnetiche restano associati due gradi di libertà fisici – trasportatori di quadrimomento
– uno rappresentato da A1 e l’altro da A2 . Secondo l’analisi svolta dopo la formula (5.37)
ci aspettiamo inoltre che a livello quantistico a ciascuno dei due stati trasversi sia asso-
ciata una particella priva di massa, ovvero un fotone “trasverso”. Nel prossimo paragrafo
vedremo che quello che distingue questi due stati trasversi tra di loro è l’elicità.
Infine, usando la (5.66) è facile vedere che possiamo riscrivere la (5.73) anche come,

µν ~ 2= 1 µ ν³ ~ 2 ´
~ 2 ,
Tem = nµ nν |E| n n |E| + |B|
2

espressione che è in accordo con il fatto che per le onde piane il vettore di Poynting assume
la forma, vedi (5.70),
~=E
S ~ ×B
~ =E
~ × (~n × E)
~ = |E|
~ 2 ~n. (5.76)

00
Ritroviamo quindi le formule generali Tem = 12 (E 2 + B 2 ), e Tem
0i
= S i . In particolare il
flusso di energia in un’onda piana è diretto lungo la direzione di propagazione dell’onda,
come c’era da aspettarsi.
Concludiamo questo paragrafo con il caveat che le proprietà 1)–4) valgono per le onde
elettromagnetiche elementari (5.61), e non per un generico campo di radiazione (5.58),
sovrapposizione generica delle prime. Ma abbiamo anticipato che il potenziale vettore

138
lontano dalle sorgenti – nella zona (asintotica) delle onde – pur non essendo un’onda
piana elementare soddisferà ugualmente le relazioni delle onde (5.63). Come già osservato
le proprietà 1), 2) e 4) saranno quindi valide anche per un generico campo elettromagnetico
nella zona delle onde. Ci riferiamo in particolare alle formule (5.66), (5.70) e (5.73), che
danno il campo elettrico, il campo magnetico e il tensore energia–impulso in termini del
solo potenziale vettore spaziale,

~˙ + (~n · A
~ = −A
E ~˙ ) ~n = ~n × (~n × A
~˙ ), (5.77)
~ = ~n × E,
B ~ ~ = 0,
~n · E (5.78)
µν
Tem ~ 2,
= nµ nν (Ȧi Ȧj ) Λij = nµ nν |E| Λij ≡ δ ij − ni nj . (5.79)

Insistiamo su questo punto perché, come vedremo, l’analisi energetica di quasi tutti i fe-
nomeni di radiazione non richiede la conoscenza del potenziale vettore esatto, ma soltanto
la conoscenza della sua forma asintotica nella zona delle onde. Per quest’ultima potremo
allora usare le formule molto semplici scritte sopra, e l’analisi energetica risulterà cosı̀
notevolmente semplificata.

5.3.2 Onde piane ed elicità

In questo paragrafo analizzeremo una proprietà caratteristica delle onde piane, che viene
chiamata elicità. Questo concetto riveste un ruolo significativo per la sua connessione
con un’altra grandezza fisica, che gioca invece un ruolo fondamentale nella descrizione
20
quantistica di un’onda, ovvero lo spin . Più precisamente, si può far vedere che l’elicità
di un’onda piana corrisponde esattamente allo spin delle particelle che la rappresentano
a livello quantistico. Per chiarire meglio il significato di questo concetto metteremo a
confronto onde scalari, onde elettromagnetiche e onde gravitazionali.
Riportiamo dunque la forme delle onde piane rispettivamente nei tre casi,

ϕ(x) = ε(~k) eik·x + c.c., (5.80)

Aµ (x) = εµ (~k) eik·x + c.c., kµ εµ = 0, εµ ≈ εµ + λ k µ , (5.81)


1 ν µ
hµν (x) = εµν (~k) eik·x + c.c., kµ εµν = k ε µ, εµν ≈ εµν + λµ k ν + λν k µ . (5.82)
2
20
Il termine “elicità” viene talvolta usato anche a livello quantistico. In quel caso si intende la proiezione
dello spin di una particella priva di massa lungo la sua direzione di propagazione.

139
Onde gravitazionali. Per le onde gravitazionali abbiamo riportato le previsioni fatte
dalla Relatività Generale. In uno spazio–tempo curvo la forma dell’intervallo si generalizza
a,
ds2 = dxµ dxν ηµν → ds2 = dxµ dxν gµν (x),

dove il tensore simmetrico gµν (x) rappresenta la “metrica” del continuo spazio–temporale.
Se la si scrive come,
gµν (x) = ηµν + hµν (x),

allora il campo gravitazionale è rappresentato dal tensore doppio simmetrico hµν . Questo
campo descrive dunque lo scostamento della metrica di uno spazio–tempo curvo dalla
metrica “piatta” ηµν . Si può poi vedere che nell’approssimazione di campi gravitazionali
deboli, ovvero per,
|hµν | ¿ 1,

le equazioni di Einstein ammettono come soluzioni le onde piane date nella (5.82). In
questo caso il tensore di polarizzazione εµν è simmetrico, ed è soggetto alle condizioni di
gauge–fixing e di invarianza di gauge residua, riportate in formula. In questo caso si hanno
quattro parametri di gauge, λµ , ed è immediatamente verificare che le trasformazioni di
gauge residua preservano la condizione di gauge–fixing. Grazie a k 2 = 0, vale infatti,

1 ν µ
kµ (εµν + λµ k ν + λν k µ ) = k (ε µ + λµ kµ + λµ kµ ), ∀ λµ .
2

Anche le onde gravitazionali viaggiano con la velocità della luce. Per determinare il
numero di gradi di libertà associati a queste onde osserviamo innanzitutto che il tensore
εµν , essendo simmetrico, ha dieci componenti indipendenti. Abbiamo quattro condizioni
di gauge–fixing, e quattro trasformazioni di gauge residua, rappresentate dal vettore λµ .
Le onde gravitazionali sono quindi caratterizzate da 10 − 4 − 4 = 2 gradi di libertà –
esattamente come le onde elettromagnetiche. Dal punto di vista cinematico l’unica cosa
che le distingue dalle onde elettromagnetiche – in ultima analisi – è l’elicità.
Elicità. Il concetto di elicità è legato alle proprietà di trasformazione dei tensori di
polarizzazione ε(~k), εµ (~k), εµν (~k), sotto una certa classe di rotazioni tridimensionali. Ri-
cordiamo che sotto una generica trasformazione di Lorentz Λµ ν questi tensori sono soggetti

140
a leggi di trasformazione ben definite,

ε0 (~k 0 ) = ε(~k), ε0µ (~k 0 ) = Λµ ν εν (~k), ε0µν (~k 0 ) = Λµ α Λν β εαβ (~k), (5.83)

dove,
k 0µ = Λµ ν k ν .

Ricordiamo che k 0 = ω = |~k|, in quanto k 2 = 0. Consideriamo ora un generico vettore


d’onda ~k, che teniamo fisso in tutta l’analisi che segue. Una generica onda piana è allora
completamente caratterizzata dal suo tensore di polarizzazione, soggetto alla rispettiva
condizione di gauge–fixing. Chiamiamo Vi (i = 1, 2, 3) lo spazio vettoriale lineare comples-
so dei tensori di polarizzazione in ciascuno dei tre casi, vincolati dalle rispettive condizioni
di gauge–fixing. Le dimensioni di di questi spazi sono allora,

d1 = 1, d2 = 4 − 1 = 3, d3 = 10 − 4 = 6.

Definiamo ora il sottogruppo G del gruppo di Lorentz, costituito dalle rotazioni spaziali
di un generico angolo ϑ attorno alla direzione di ~k. G costituisce un sottogruppo di Lie
abeliano ad un solo parametro in quanto, se indichiamo il suo generico elemento con
Λµ ν (ϑ), abbiamo,
Λµ ν (ϑ1 )Λν ρ (ϑ2 ) = Λµ ρ (ϑ1 + ϑ2 ).

Per trasformazioni di questo tipo ~k resta ovviamente invariante,

k 0µ = Λµ ν (ϑ) k ν = k µ .

Nelle (5.83) trasformano allora solo i tensori di polarizzazione, ma non i loro argomenti. Di
conseguenza le polarizzazioni trasformate continuano a soddisfare le condizioni di gauge–
fixing indicate in (5.80)–(5.82), con lo stesso k µ . Concludiamo quindi che ciascuno spazio
vettoriale Vi è sede di una rappresentazione di G – in generale riducibile. Ma secondo
un noto teorema della teoria dei gruppi, le rappresentazioni complesse irriducibili del
gruppo G sono tutte unidimensionali, con sede i numeri complessi E ∈ C, e in ogni
rappresentazione irriducibile il gruppo agisce secondo,

E → E 0 = ei hϑ E, (5.84)

141
per un qualche numero reale h.
Deve allora essere possibile decomporre lo spazio vettoriale Vi delle polarizzazioni in di
sottospazi unidimensionali, sedi di rappresentazioni irriducibili di G del tipo (5.84). Ogni
sottospazio rappresenta cosı̀ un grado di libertà – fisico o non fisico – e la polarizzazione
E associata trasforma per una rotazione attorno a ~k secondo la (5.84). A ciascuno dei
gradi di libertà dell’onda piana, classificati in questo modo, resta quindi associato in modo
univoco un numero reale h – che viene chiamato elicità.
Il fatto importante è che si può dimostrare che a un grado di libertà con elicità h, a
livello quantistico corrisponde una particella di spin h.
Per eseguire esplicitamente la decomposizione in rappresentazioni irriducibili in ciascu-
no dei tre casi, è conveniente scegliere come asse z la direzione di ~k, sicché k µ = (ω, 0, 0, ω).
La matrice Λµ ν (ϑ) è allora la matrice di rotazione di un angolo ϑ attorno all’asse z,
 
1 0 0 0
 0 cos ϑ sen ϑ 0 
Λµ ν (ϑ) = 
 0 −sen ϑ cos ϑ 0  .
 (5.85)
0 0 0 1
Per ridurre le rappresentazioni di G date in (5.83) in rappresentazioni unidimensionali,
occorre trovare opportune combinazioni lineari E delle componenti dei tensori di pola-
rizzazione, tali che per esse le trasformazioni (5.83) assumano la forma diagonale (5.84).
Eseguiamo ora questa riduzione in ciascuno dei tre casi.
Onde scalari. Per le onde scalari abbiamo d1 = 1. Per qualsiasi trasformazione di Lo-
rentz, e quindi anche per la trasformazione Λµ ν (ϑ), abbiamo ε0 = ε. La rappresentazione
è già unidimensionale e vale la (5.84) con E = ε, e h = 0. Le onde scalari corrispondono
quindi a un solo grado di libertà fisico, di elicità zero.
Onde elettromagnetiche. Per queste onde abbiamo d2 = 3. Per via del gauge–fixing
kµ εµ = 0 il vettore εµ ha infatti tre componenti indipendenti: le due polarizzazioni fisiche
trasverse ε1 e ε2 , e la componente non fisica longitudinale ε3 = ε0 . Esplicitando la
trasformazione ε0µ = Λµ ν (ϑ) εν , si ottiene,

ε00 = ε0 ,

ε01 = cos ϑ ε1 + sen ϑ ε2 ,

ε02 = −sen ϑ ε1 + cos ϑ ε2 ,

142
ε03 = ε3 .

Riconosciamo quindi che la componente longitudinale porta elicità zero. Le combinazioni


lineari delle componenti trasverse che diagonalizzano la trasformazione, sono invece date
da,
E± = ε1 ∓ iε2 .

Infatti,

E−0 = ε01 + iε02 = cos ϑ ε1 + sen ϑ ε2 + i (−sen ϑ ε1 + cos ϑ ε2 ) = e−iϑ E− ,

e analogamente per E+ . Risulta quindi,

E±0 = e±i ϑ E± .

Concludiamo che un’onda elettromagnetica contiene uno stato di polarizzazione non fisico,
di elicità zero, e due stati di polarizzazione fisici, di elicità h = ±1. Si può poi vedere,
vedi problema 5.5, che questi due stati corrispondono a onde elettromagnetiche polarizzate
circolarmente – rispettivamente in senso orario e antiorario.
Onde gravitazionali. Nel caso dell’onda gravitazionale il tensore di polarizzazione εµν ,
per via del gauge–fixing,
1 ν µ
kµ εµν = k ε µ, (5.86)
2
ha d3 = 6 componenti indipendenti, di cui due fisici e quattro non fisici. Per brevità in
questo caso ci occupiamo solo delle due componenti fisiche. Per individuarle facciamo
notare che le componenti 0µ di εµν possono essere eliminate con una trasformazione di
gauge residua,
ε00µ = ε0µ + λ0 k µ + λµ ω = 0.

È sufficiente scegliere,
µ ¶
0 1 00 i 1 1 i 00 0i
λ =− ε , λ = nε −ε .
2ω ω 2

Una volta posto ε0µ = 0, le condizioni (5.86) per ν = 0 implicano,

εµ µ = −εii = 0, (5.87)

143
e per ν = i esse si riducono allora a,

kµ εµi = −k j εji = 0.

Dato che abbiamo scelto ~k = (0, 0, ω), si ottiene quindi che anche ε3µ = 0. La (5.87) dà
allora,
ε11 + ε22 = 0.

Concludiamo cosı̀ che possiamo annullare tutte le componenti di εµν , tranne,

ε12 = ε21 , e ε11 = −ε22 .

ε12 e ε11 rappresentano allora le due polarizzazioni fisiche indipendenti. Si noti in par-
ticolare che esse sono invarianti sotto le trasformazioni residue di (5.82), perché k µ non
ha componenti lungo le direzioni x e y. Per una rotazione attorno all’asse z queste
componenti si trasformano secondo,

ε0µν = Λµ α (ϑ)Λν β (ϑ) εαβ ,

ed esplicitando si trova,

ε011 = Λ1 1 (ϑ)Λ1 1 (ϑ)ε11 + 2Λ1 2 (ϑ)Λ1 1 (ϑ)ε12 + Λ1 2 (ϑ)Λ1 2 (ϑ)ε22

= cos2 ϑ ε11 + 2 sen ϑ cos ϑ ε12 − sen2 ϑ ε11

= cos 2ϑ ε11 + sen 2ϑ ε12 .

E analogamente,
ε012 = −sen 2ϑ ε11 + cos 2ϑ ε12 .

Come per le onde elettromagnetiche queste trasformazioni si diagonalizzano ponendo,

E± = ε11 ∓ iε12 .

Ma ora risulta,
E±0 = e±2i ϑ E± .

Le due polarizzazioni fisiche contenute in un’onda gravitazionale hanno quindi elicità


h = ±2. A livello classico le onde elettromagnetiche e le onde gravitazionali hanno dunque

144
in comune la velocità di propagazione e il numero di gradi di libertà, ma si distinguono
per l’elicità.
Possiamo quindi concludere che a livello quantistico un campo scalare, la cui dinamica
discenda dalla lagrangiana (5.21), corrisponderà a una particella priva di massa e di
spin, che il campo elettromagnetico sarà composto da particelle prive di massa di spin
±1, i fotoni, mentre il campo gravitazionale, supposto che esista una teoria quantistica
consistente dell’interazione gravitazionale, sarà composto da particelle prive di massa di
spin ±2, i gravitoni.
Basi diverse di soluzioni. In questa sezione abbiamo studiato una particolare base
completa di soluzioni dell’equazione di Maxwell nel vuoto, le onde piane, e ne abbiamo
analizzato le proprietà piú salienti. Ne menzioniamo ora un’altra, non meno significativa
e forse la più caratteristica: per trasformazioni di Lorentz ogni suo elemento va in un altro
elemento della stessa base. Detto in altre parole, sotto trasformazioni di Lorentz l’onda
piana (5.61) resta un’onda piana.
Tuttavia è chiaro che la base delle onde piane, pur essendo di particolare rilevanza,
non è l’unica base di interesse fisico. Un altro importante sistema completo di soluzioni
è costituito dalle cosiddette onde sferiche, sistema che risulta molto utile nello sviluppo
sistematico della radiazione in multipoli. Non ci occuperemo in dettaglio di questo si-
stema di soluzioni, perché avremo bisogno dello sviluppo in multipoli solo nel limite non
relativistico, dove sarà sufficiente tenere conto dei termini di dipolo e di quadrupolo. Si
21
vedano tuttavia i paragrafi 9.6 e 9.7 del testo di J.D. Jackson .

5.3.3 Onde elettromagnetiche e invarianza di gauge manifesta

Abbiamo visto che l’introduzione del potenziale vettore risulta inevitabile se si vuole
basare l’Elettrodinamica su un principio variazionale, il quale costituisce a sua volta il
punto di partenza indispensabile per la quantizzazione della teoria. D’altra parte il difetto
principale delle procedure che coinvolgono il campo di gauge – e non direttamente il campo
elettromagnetico – è la mancanza dell’invarianza di gauge manifesta, sicché l’assenza di
gradi di libertà non fisici in linea di principio deve essere controllata di volta in volta.
21
J.D. Jackson, Classical Electrodynamics, 3a edizione, Wiley & Sons, New York, 1998.

145
In realtà nell’ambito dell’Elettrodinamica classica l’introduzione del potenziale vettore
costituisce solo un fatto di convenienza, in quanto può rendere più agevole lo studio di certi
fenomeni. Abbbiamo visto, per esempio, che l’introduzione del potenziale vettore, insieme
all’uso della trasformata di Fourier, ci ha permesso di risolvere agevolmente l’equazione di
Maxwell nel vuoto – salvo di controllare poi alla fine l’invarianza di gauge della procedura.
Rimarchiamo, tuttavia, che l’intera Elettrodinamica classica può essere analizzata an-
che senza mai nominare il potenziale vettore Aµ , ma usando solo il campo elettromagnetico
F µν , con i pregi evidenti che in questo modo non si introducono mai elementi non–fisici e
che l’invarianza di gauge è manifesta. Per illustrare le tecniche che si usano e le difficoltà
che si incontrano in questo framework alternativo, in questo paragrafo risolviamo di nuovo
le equazioni di Maxwell nel vuoto – utilizzando solo il campo elettromagnetico.
In questa ottica alternativa dobbiamo riconsiderare oltre all’equazione di Maxwell
anche l’identità di Bianchi, e il sistema da risolvere è allora,

∂µ F µν = 0, (5.88)
1
∂[µ Fνρ] = (∂µ Fνρ + ∂ν Fρµ + ∂ρ Fµν ) = 0. (5.89)
3

Come primo passo della soluzione dimostriamo che tutte le componenti del campo elettro-
magnetico devono soddisfare l’equazione delle onde. Per fare vedere questo è sufficiente
applicare all’identità di Bianchi l’operatore ∂ µ . Risulta,

2Fνρ + ∂ν ∂ µ Fρµ + ∂ρ ∂ µ Fµν = 0.

Grazie alla (5.88) il secondo e il terzo termine di questa equazione sono nulli, e si ottiene
effettivamente,
2F µν = 0. (5.90)

Facciamo però notare che questa equazione segue dalle (5.88), (5.89), ma non le implica.
Con l’esperienza accumulata finora è comunque immediato scrivere la soluzione generale
della (5.90),
Z
µν 1 d3 k ³ ik·x µν ~ ´
F = e f (k) + c.c. , (5.91)
(2π)2 2ω
dove f µν (~k) per il momento è un arbitrario tensore complesso antisimmetrico, e ricordiamo
che k 2 = 0. A questo punto cerchiamo di capire per quali f µν l’espressione appena scritta

146
soddisfa anche le (5.88), (5.89). Calcoliamo allora,
Z 3 ³ ´
µν i d k ik·x µν ~
∂ρ F = e kρ f (k) + c.c. ,
(2π)2 2ω
dove abbiamo portato la derivata sotto il segno di integrale e derivato l’esponenziale.
L’equazione di Maxwell e l’identitià di Bianchi equivalgono quindi rispettivamente alle
equazioni algebriche,

kµ f µν = 0, (5.92)

k[µ fνρ] = 0. (5.93)

Non è difficile convincersi che la soluzione generale della seconda è,

fµν = kµ βν − kν βµ , (5.94)

per qualche vettore complesso β µ , e che la prima allora implica che,

kµ β µ = 0. (5.95)

D’altra parte si vede anche subito che non tutti i vettori β µ danno luogo a soluzioni
diverse. Infatti, i vettori β µ e β µ + λ k µ soddisfano entrambi la (5.95), ma danno luogo
allo stesso f µν .
È allora immediato vedere che le soluzioni (5.91), con f µν dato dalle (5.94) e (5.95),
combaciano perfettamente con le soluzioni (5.58) trovate usando il potenziale vettore –
previa l’identificazione,
β µ = i εµ .

Problema di Cauchy. Analizziamo ora brevemente il problema alle condizioni iniziali


per il campo elettromagnetico. In realtà, data la (5.90) e visti gli sviluppi del paragrafo
5.2.1, sappiamo già come si scrive F µν in funzione dei valori del campo all’istante inziale,
vedi (5.41),
Z
µν
F (x) = d3 y [D(t, ~x − ~y ) ∂0 F µν (0, ~y ) + ∂0 D(t, ~x − ~y ) F µν (0, ~y )] . (5.96)

D’altra parte, le derivate temporali ∂0 F µν (0, ~y ) all’istante iniziale sono determinati dai
valori iniziali degli stessi campi F µν (0, ~y ), attraverso le (5.88) e (5.89). Risultano infatti
le solite relazioni,
~ =∇
∂0 E ~ × B,
~ ~ = −∇
∂0 B ~ × E.
~

147
Valutandole a t = 0 e inserendole nella (5.96) si ottiene allora,
Z h i
~
E(x) = ~ × B(0,
d3 y D(t, ~x − ~y ) ∇ ~ ~y ) + ∂0 D(t, ~x − ~y ) E(0,
~ ~y ) , (5.97)
Z h i
~
B(x) = 3 ~ ~ ~
d y −D(t, ~x − ~y ) ∇ × E(0, ~y ) + ∂0 D(t, ~x − ~y ) B(0, ~y ) . (5.98)

A questo punto è un semplice esercizio verificare che queste espressioni soddisfano in effetti
le (5.88) e (5.89) per ogni t, purché i dati iniziali soddisfino i vincoli di fisicità,

~ · E(0,
∇ ~ ~x) = 0 = ∇
~ · B(0,
~ ~x).

Vediamo di nuovo che solo quattro campi iniziali possono essere scelti in modo arbitrario,
per esempio,
E 1 (0, ~x), E 2 (0, ~x), B 1 (0, ~x), B 2 (0, ~x), (5.99)

a conferma del fatto che il campo elettromagnetico corrisponde a due gradi di libertà del
secondo ordine.
Covarianza. Concludiamo questo paragrafo con una breve analisi delle proprietà strut-
turali delle formule risolutive (5.96)–(5.98); in particolare vogliamo fare vedere come si
può rendere la (5.96) manifestamente Lorentz–covariante. Riprendiamo la forma esplicita
del kernel antisimmetrico (5.43),
1 1
D(x) = [δ(t − |~x|) − δ(t + |~x|)] = ε(t) δ(x2 ), (5.100)
4π|~x| 2π
e facciamo vedere che esso è invariante sotto trasformazioni di Lorentz proprie xµ →
Λµ ν xν ,
D(Λx) = D(x), Λ ∈ SO(1, 3)c . (5.101)

Dato che il fattore δ(x2 ) è manifestamente invariante, per dimostrare la (5.101) è sufficiente
fare vedere che ε(t) – il segno di t – è invariante sotto trasformazioni di Lorentz proprie,
se xµ è di tipo tempo o nullo,

x2 = t2 − |~x|2 ≥ 0, ovvero |t| > |~x|. (5.102)

Per fare vedere questo notiamo che per Λ ∈ SO(1, 3)c abbiamo Λ0 0 ≥ 1, e che la condizione
Λµ α Λν β η αβ = η µν , per µ = ν = 0, implica,

~ 2,
(Λ0 0 )2 = 1 + |L| L i ≡ Λ0 i . (5.103)

148
Per il tempo trasformato abbiamo allora,
à !
~ · ~x
L
~ · ~x = Λ0 0
t0 = Λ0 0 t + Λ0 i xi = Λ0 0 t + L t+ 0 .
Λ0

Siccome le (5.102), (5.103) implicano,


¯ ¯
¯L~ ¯ ~ · |~x|
¯ · ~x ¯ |L|
¯ 0 ¯≤ q ≤ |t|,
¯Λ0¯ ~ 2
1 + |L|
abbiamo dunque che il segno di t0 uguaglia quello di t.
Invarianza relativistica dei coni luce. Con l’analisi appena svolta abbiamo in partico-
lare dimostrato che il “cono luce futuro” e il “cono luce passato”, ovvero, gli insiemi di
quadrivettori,

L+ = {V µ ∈ R4 /V 2 ≥ 0, V 0 > 0}, L− = {V µ ∈ R4 /V 2 ≥ 0, V 0 < 0},

sono invarianti sotto trasformazioni di Lorentz proprie. Useremo queste proprietà nel
prossimo capitolo.
Data la (5.101) siamo ora in grado covariantizzare la (5.96), generalizzandola al caso
in cui i valori “iniziali” dei campi sono dati su un’arbitrario iperpiano di tipo spazio Γ,
vedi paragrafo 3.2.1. Questi iperpiani sono caratterizzati da un vettore normale di tipo
tempo costante Nµ , che possiamo normalizzare scegliendo Nµ N µ = 1. Ricordiamo che
l’equazione di Γ è,
Nµ (xµ − xµ0 ) = 0.

Se si assegnano i valori di F µν e della sua derivata normale Nρ ∂ ρ F µν su Γ, allora la


versione covariante della (5.96) si scrive,
Z
F (x) = dΣρ [D(x − y) ∂ ρ F µν (y) + ∂ ρ D(x − y) F µν (y)] ,
µν
(5.104)
Γ

dove la misura dΣρ = Nρ d3 λ è stata definita nel paragrafo 3.2.1. Per verificare che la
(5.104) soddisfa le condizioni al bordo corrette, nonché l’equazione 2F µν = 0, occorro
usare le seguenti versioni covarianti delle proprietà (5.44)–(5.46) del kernel,

2D = 0, (5.105)

D(x) = 0, per x2 < 0 (5.106)


Z ∞
∂µ D(x)|Nν xν =0 = Nµ δ 4 (x − N λ) dλ. (5.107)
−∞

149
Causalità. L’altra proprietà importante del kernel consiste nel fatto che esso è suppor-
tato sul (bordo del) cono luce, vale a dire è diverso da zero solo per t = ±|~x|. Questa
circostanza assicura che un generico campo elettromagnetico – e non solo le onde piane
– si propaga con la velocità della luce. Se supponiamo, per esempio, che i campi iniziali
(5.99) siano diversi da zero solo all’interno di una sfera di raggio L, allora nelle (5.97),
(5.98) l’integrale su ~y si restringe alla regione |~y | < L. Di conseguenza, in un generico
punto ~x all’esterno della sfera, a un istante t > 0 il campo sarà diverso da zero solo se per
qualche |~y | < L si ha,
|~x − ~y | = t.

In ~x il primo segnale giungerà quindi all’istante t = |~x| − L, mentre in tutti gli istanti
t < |~x| − L il campo elettromagnetico in ~x sarà nullo.
Essendo invariante per trasformazioni di Lorentz, il kernel è in particolare invariante
per rotazioni spaziali ~x → R ~x, con R ∈ SO(3),

D(t, R~x) = D(t, ~x).

Da questo segue che il campo elettromagnetico si propaga localmente in modo isotropo


in tutte le direzioni, a conferma del principio di Huygens.
Inversione temporale. L’ultima caratteristica del kernel che facciamo notare è che esso
cambia di segno per inversione temporale t → −t,

D(−t, ~x) = −D(t, ~x).

Vogliamo fare vedere che questa proprietà è intimamente legata con l’invarianza per
inversione temporale dell’equazione delle onde,
¡ ¢
2ϕ = ∂02 − ∇2 ϕ = 0,

la quale resta appunto invariata se si sostituisce ∂0 con −∂0 . Ciò comporta che se ϕ(t, ~x)
è soluzione, allora è soluzione anche la funzione,

ϕ(t,
e ~x) ≡ ϕ(−t, ~x).

In particolare la soluzione ϕ
e è univocamente determinata dalle condizioni iniziali,

ϕ(0,
e ~x) = ϕ(0, ~x), ∂0 ϕ(0,
e ~x) = −∂0 ϕ(0, ~x).

150
Scrivendo la (5.41) per ϕ
e si ottiene allora,
Z
ϕ(x)
e = d3 y [−D(t, ~x − ~y ) ∂0 ϕ(0, ~y ) + ∂0 D(t, ~x − ~y ) ϕ(0, ~y )] .

D’altra parte ϕ
e può essere anche ottenuta effettuando nella (5.41) la sostituzione t → −t,
Z
ϕ(x)
e = d3 y [D(−t, ~x − ~y ) ∂0 ϕ(0, ~y ) − ∂0 D(−t, ~x − ~y ) ϕ(0, ~y )] .

Si vede che affinché le due formule coincidano è necessario e sufficiente che D sia fun-
zione antisimmetrica di t. Vediamo quindi che l’antisimmetria del kernel (5.100) è – in
ultima analisi – una conseguenza dell’invarianza per inversione temporale delle equazio-
ni di Maxwell. Si può vedere che la trasformazione t → −t costituisce, in realtà, una
simmetria discreta esatta non solo dell’interazione elettromagnetica, ma anche di quelle
gravitazionale e forte, mentre è violata dalle interazioni deboli.
Infine facciamo notare che l’invarianza per inversione temporale è intrinseca anche alla
meccanica non relativistica, in quanto l’equazione di Newton,
d2~x
m = F~ = −∇V
~ (~x),
dt2
è invariante per t → −t, purché il potenziale non dipenda esplicitamente dal tempo. E
anche in questo caso ne consegue che se ~x(t) è soluzione, allora lo è anche ~x(−t).

5.4 Effetto Doppler relativistico

Nella sezione precedente abbiamo visto che nel passaggio da un sistema di riferimento a
un altro, un’onda piana elementare resta un’onda piana elementare, ma polarizzazione,
direzione di propagazione e frequenza cambiano. In questo paragrafo ci occuperemo in
particolare del cambiamento della frequenza. A questo scopo consideriamo una sorgente
che emette segnali luminosi monocromatici di frequenza “propria” – vale a dire quando

è a riposo – ω0 = λ0
, in tutte le direzioni. Vogliamo allora determinare la frequenza del
segnale, quando la sorgente si trova in moto rettilineo uniforme con velocità ~v .
Consideriamo allora il sistema di riferimento K ∗ in cui la sorgente è a riposo. In
K ∗ la quadrivelocità della sorgente e il vettore d’onda quadridimensionale sono dati
rispettivamente da,
u∗µ = (1, ~0), k ∗µ = (ω0 , ~k0 ).

151
Nel sistema di riferimento K del laboratorio le analoghe quantità sono date da,
µ ¶
1 ~v
µ
u = √ ,√ , k µ = (ω, ~k).
1−v 2 1−v 2

Se indichiamo l’angolo tra la direzione di propagazione dell’onda e la velocità della sorgente


– entrambe misurate in K – con α, possiamo sfruttare l’invarianza di Lorentz dello scalare
u · k per ottenere,

1
ω0 = u∗µ k ∗µ = uµ k µ = √ (ω − ω v cos α).
1 − v2

Per frequenza e lunghezza d’onda nel sistema del laboratorio si ottiene allora,

1 − v2 1 − v cos α
ω= ω0 , λ= √ λ0 . (5.108)
1 − v cos α 1 − v2

Queste formule descrivono l’effetto Doppler relativistico.


Nei casi particolari in cui la sorgente che si avvicina (allontana) frontalmente abbiamo
α = 0 (α = π), e ripristinando la velocità della luce otteniamo,

1 ∓ v/c
λ= p λ0 . (5.109)
1 − v 2 /c2

Questa formula può essere confrontata con la formula dell’effetto Doppler non relativistico,

λn.r. = (1 ∓ v/vp ) λ0 ,

dove vp rappresenta la velocità di propagazione del segnale. Si vede che se la sorgente si


muove con velocità v piccola rispetto alla velocità della luce, il risultato relativistico si
riduce formalmente a quello non relativistico, se si pone vp = c.
Redshift cosmologico. Concludiamo la sezione con un’applicazione importante dell’ef-
fetto Doppler relativistico, il cosiddetto redshift. Per sorgenti che si allontanano dall’osser-
vatore frontalmente, la (5.109) permette di ricavare la variazione relativa della lunghezza
d’onda, s
λ − λ0 1 + v/c
z≡ = − 1 > 0. (5.110)
λ0 1 − v/c
Le lunghezze d’onda aumentano dunque all’aumentare della velocità. Questo fenomeno
è noto come “redshift”, in quanto le frequenze si abbassano e le righe spettrali si sposta-
no verso il rosso, ed è di importanza fondamentale in cosmologia: attraverso un’analisi

152
sistematica del “redshift cosmologico” nella radiazione emessa dalle galassie, Hubble nel
1929 è stato in grado di scoprire l’espansione dell’universo. Le galassie osservate da lui
avevano velocità piccole rispetto alla velocità della luce, dell’ordine di v ≈ 3.000km/s,
per cui l’aumento relativo delle lunghezze d’onda era piccolo. Sviluppando la (5.110) si
ottiene infatti,
v
z≈ = 10−2 .
c
Ma oggi sono note anche galassie con valori di z molto elevati. Per esempio, per la galassia
8C1435+635 nel 1994 si è misurato il redshift z = 4.25, corrispondente a una velocità di
allontanamento pari a v = 0.93 c.
Per concludere notiamo che misure molto precise del redshift cosmologico nelle su-
pernovae di tipo Ia, effettuate di recente, hanno permesso di trarre conclusioni nuove e
rivoluzionarie sullo stato del nostro universo: da queste misure sappiamo, infatti, che
l’universo non solo è in espansione, ma che sta accelerando. D’altra parte secondo la Re-
latività Generale un universo che accelera esige necessariamente una costante cosmologica
diversa zero e positiva, circostanza che ha arricchito la cosmologia odierna di una serie di
problematiche nuove, tuttora irrisolte.

5.5 Problemi

5.1 In riferimento alla soluzione dell’equazione delle onde del paragrafo 5.2.1,
a) si dimostri che la (5.40) si può riscrivere come in (5.41);
b) si dimostri che il kernel antisimmetrico D dato in (5.42) può essere scritto come in
(5.43). [Sugg.: si passi dalla variabile d’integrazione ~k in coordinate polari, e si sfrutti
l’invarianza per rotazioni per porre ~x = (0, 0, |~x|). Infine si ricordi che la δ di Dirac
ammette la rappresentazione simbolica in trasformata di Fourier,
Z
1
δ(x − a) = eik(x−a) dk.]

5.2 Supponendo che Aµ (x) sia un campo vettoriale e che per una trasformazione di
Lorentz si abbia k 0µ = Λµ ν k ν , si dimostri che anche la trasformata di Fourier,
Z
b µ 1
A (k) = d4 x e−ik·x Aµ (x),
(2π)2

153
è un campo vettoriale nella variabile k.

5.3 Utilizzando il gauge–fixing,


A0 = 0,

si dimostri che l’equazione di Maxwell, ∂µ F µν = j ν , propaga due gradi di libertà fisici. Si


adotti la seguente strategia:
a) si impongano condizioni iniziali per A1 e A2 e le loro derivate temporali, a t = 0;
b) si determini la forma delle trasformazioni di gauge residue;
c) imponendo l’equazione G0 ≡ ∂µ F µ0 − j 0 = 0 a t = 0, e utilizzando le trasformazioni di
gauge residue, si fissino le condizioni iniziali per A3 e ∂0 A3 a t = 0.

5.4 Partendo dalla (5.58) si deducano le espressioni generali per i campi elettrico e
magnetico nel vuoto,
Z
1 ¡ ik·x ¢
~ ~x) =
E(t, d 3
k i e [(~n · ~
ε) ~
n − ~
ε] + c.c. ,
2(2π)2
Z
1 ¡ ¢
~
B(t, ~x) = d3 k i eik·x [~ε × ~n] + c.c. .
2(2π)2

a) Si verifichi che questi campi soddisfano le equazioni di Maxwell nel vuoto (2.28)–(2.31),
nonché le equazioni delle onde,
~ = 0 = 2B.
2E ~

~ ~x) e B(0,
b) Noti i campi iniziali E(0, ~ ~x), si determini il campo vettoriale tridimensionale,

V~ (~k) ≡ ~ε − (~n · ~ε) ~n,

~ eB
e quindi E ~ ad ogni t. [Sugg.: si veda il paragrafo 5.2.1.]

c) Il campo ~ε(~k) è univocamente determinato?

5.5 Si consideri un’onda piana elementare propagantesi lungo l’asse z, con vettore d’onda
k µ = (ω, 0, 0, ω), e polarizzazione εµ = (ε0 , ε1 , ε2 , ε0 ) generica,

Aµ (x) = εµ eik·x + c.c.

~ ~x) e B(t,
a) Si determinino esplicitamente i campi E(t, ~ ~x) e si verifichi che essi sono

gauge–invarianti, ovvero indipendenti da ε0 , e che soddisfano le condizioni di trasversalità

154
E 3 = 0 = B3.
b) Nel piano trasverso (x, y) si definisca il campo elettrico complesso E ≡ E 1 + iE 2 . Si
dimostri che risulta,
¡ ¢
E = −i ω E− eik·x − E+∗ e−ik·x , (5.111)

dove E± sono gli “autostati” di elicità: E± = ε1 ∓ iε2 .


c) Si verifichi che per E− = 0 (E+ = 0) la punta del campo elettrico descrive un’elica
percorsa in senso orario, di “elicità” positiva, (antiorario, di “elicità” negativa), corri-
spondente a polarizzazione circolare lungo la direzione del moto (in direzione opposta al
moto). La soluzione generale (5.111) corrisponde quindi a una generica sovrapposizione
dei due stati di polarizzazione circolare.
d) Se εµ è reale si ha E−∗ = E+ . Si verifichi che in questo caso l’onda risulta polarizzata
~ ha direzione costante.
linearmente, ovvero, che E

5.6 Si dimostri che il tensore energia impulso associato all’onda elettromagnetica ele-
mentare (5.61), mediato su scale temporali grandi rispetto al periodo è dato da,

µν
hTem i = −2 k µ k ν ε∗α εα .

00
Si dimostri che vale hTem i ≥ 0.

5.7 Si consideri l’onda scalare “sferica”,

1
ϕ(t, ~x) = G(t − r), r ≡ |~x|,
r

dove G è una funzione arbitraria.


a) Si dimostri che ϕ soddisfa l’equazione delle onde 2ϕ = 0, in ogni regione spaziale che
non contiene il punto ~x = 0. [Sugg.: può essere utile scrivere il Laplaciano in coordinate
polari, µ ¶2
2 1 ∂ 1 2
∇ = r+ L,
r ∂r r2
dove L2 è un operatore differenziale che coinvolge solo gli angoli.]
b) Si spieghi perché ϕ non è soluzione dell’equazione delle onde in tutto lo spazio, e se ne
dia un’interpretazione fisica.

155
5.8 Si consideri l’equazione delle onde in una dimensione spaziale,

¡ ¢
∂t2 − ∂x2 ϕ(x, t) = 0.

Utilizzando la tecnica della trasformata di Fourier si dimostri che la soluzione generale di


questa equazione si può scrivere come,

ϕ(t, x) = f (x − t) + g(x + t),

con f e g funzioni arbitrarie.

156
6 Generazione di campi elettromagnetici

Nel capitolo precedente abbiamo determinato la forma di un generico campo di radiazione,


ovverosia di un campo elettromagnetico che soddisfa l’equazione di Maxwell in assenza
di sorgenti. Abbiamo trovato che questo campo consiste di una sovrapposizione lineare
di onde piane, monocromatiche e trasverse, che si propagano con la velocità della luce,
le onde elettromagnetiche. In questo capitolo affronteremo un altro problema centrale
dell’Elettrodinamica classica: la determinazione del campo elettromagnetico generato da
un’arbitraria distribuzione di cariche in movimento. Risolveremo, infatti, l’equazione di
Maxwell in presenza di una generica quadricorrente j µ conservata. Scopo ultimo di questo
capitolo è la derivazione di formule esplicite per i campi elettrico e magnetico, creati da
una singola particella carica in moto arbitrario. Questi campi rivestono a loro volta un
ruolo cruciale in Elettrodinamica classica, e portano i nomi dei loro scopritori, Lienard
(1898), e Wiechert (1900).
In presenza di correnti il campo elettromagnetico deve soddisfare le equazioni,

∂µ F µν = j ν , F µν = ∂ µ Aν − ∂ ν Aµ ,

ovverosia, in gauge di Lorentz,

2Aµ = j µ , (6.1)

∂µ Aµ = 0. (6.2)

Queste equazioni sono lineari in Aµ , ma non omogenee. La soluzione generale si potrà


quindi scrivere come somma di una soluzione particolare Aµret , e della soluzione generale
Aµin del sistema omogeneo associato,

Aµ = Aµret + Aµin . (6.3)

Il potenziale Aµin è dunque la soluzione generale del sistema,

2Aµin = 0, ∂µ Aµin = 0,

che corrisponde a un campo di Maxwell libero. Dal capitolo precedente sappiamo allora
che Aµin è una generica sovrapposizione di onde elettromagnetiche piane – un generico
campo di radiazione – che gioca il ruolo di un campo esterno “entrante dall’infinito”.

157
Il “potenziale ritardato” Aµret rappresenta invece il campo generato causalmente dalla
corrente j µ , secondo le equazioni (6.1) e (6.2), della cui soluzione ci occuperemo nelle
prossime sezioni. Siccome nel resto di questo capitolo ignoreremo il campo di radiazione,
indicheremo Aµret semplicemente con Aµ .
I pedici in e ret significano rispettivamente incoming e retarded. Questa nomenclatura
deriva dal fatto che convenzionalmente la radiazione Aµin , che si sovrappone al potenziale
ritardato (fisico) Aµret , viene considerata entrante dall’infinito. Per completezza menzio-
niamo che la soluzione (6.3) può essere scritta formalmente anche in termini del cosiddetto
potenziale avanzato (non fisico) Aµadv , vedi sezione 6.2,

Aµ = Aµadv + Aµout .

La radiazione sovrapposta ad Aµadv viene considerata uscente verso l’infinito, outgoing, e


indicata con Aµout . I potenziali Aµadv e Aµout hanno una certa rilevanza nella teoria dello
scattering, ma noi non ce ne serviremo. Questa nomenclatura diventerà comunque più
trasparente, quando avremo risolto l’equazione di Maxwell.
Una tecnica efficace per risolvere equazioni differenziali alle derivate parziali del tipo
(6.1), è costituita dal cosiddetto “metodo della funzione di Green”. Prima di applicare
questo metodo alla soluzione della (6.1), nella prossima sezione lo illustriamo nel caso
di un’equazione più semplice, ma fisicamente rilevante, ovvero, quello dell’equazione di
Poisson.

6.1 Il metodo della funzione di Green: equazione di Poisson

Consideriamo l’equazione di Poisson in tre dimensioni spaziali,

−∇2 F (~x) = ϕ(~x), (6.4)

nell’incognita F . Per definitezza assumiamo che sia,

F ∈ S 0 (R3 ), ϕ ∈ S(R3 ),

ma vedremo che le soluzioni che troveremo saranno valide sotto ipotesi meno restrittive.
Se interpretiamo F come il potenziale elettrico A0 , e ϕ come la densità di carica j 0 , allora

158
la (6.4) si identifica con l’equazione fondamentale dell’Elettrostatica. Ispirati da questa
interpretazione aggiungiamo allora la richiesta ulteriore che ϕ sia a supporto compatto,

ϕ(~x) = 0, per |~x| > R.

Corrispondentemente imponiamo la condizione “fisica” che F si annulli all’infinito,

lim F (~x) = 0. (6.5)


|~
x|→∞

Vedremo, infatti, che con questa condizione asintotica l’equazione di Poisson ammetterà
soluzione unica. Per completezza ricordiamo che in generale non ha senso imporre una
condizione asintotica, come la (6.5), a una distribuzione. Tuttavia, vedremo che per
un’ampia classe di “funzioni” ϕ, non necessariamente appartenenti ad S, le soluzioni
della (6.4) sono rappresentate da funzioni, di classe C ∞ al di fuori di un compatto di R3 .
Per tali ϕ la (6.5) è quindi ben posta. Esempi ne sono le ϕ corrispondenti alla densità di
carica associata a un numero finito di cariche puntiformi statiche,
N
X
ϕ(~x) = er δ 3 (~x − ~yr ), (6.6)
r=1

che appartengono ad S 0 , ma non ad S.


Discuteremo comunque la soluzione generale dell’equazione di Poisson – indipenden-
temente dalla validità della (6.5) – alla fine di questa sezione.

6.1.1 Una soluzione particolare

Siccome l’equazione di Poisson è un’equazione lineare non omogenea, la sua soluzio-


ne generale è data da una soluzione particolare, sovrappposta alla soluzione generale
dell’equazione omogenea associata, ovvero, dell’equazione di Laplace,

∇2 F = 0.

Ovviamente la soluzione particolare non è unica, ma possiamo circoscriverla attraverso


qualche richiesta aggiuntiva. Osserviamo che la (6.4) è “congiuntamente lineare” in F e
ϕ, nel senso che una soluzione particolare relativa alla densità di carica ϕ1 +ϕ2 , può essere
ottenuta sommando le soluzioni individuali F1 e F2 . Lasciando per il momento da parte le

159
proprietà di regolarità delle grandezze coinvolte, possiamo allora avanzare l’ipotesi che il
valore di F in ~x dipende linearmente dai valori che ϕ assume in tutti i punti dello spazio,
ovvero, che per ogni ~x fissato il numero F (~x) definisca “un funzionale lineare e continuo”
f~x , sullo spazio delle ϕ,
F (~x) = f~x (ϕ).

In notazione simbolica avremo allora,


Z Z
F (~x) = d y f~x (~y ) ϕ(~y ) ≡ d3 y g(~x, ~y ) ϕ(~y ),
3
(6.7)

per qualche funzione incognita di due variabili g(~x, ~y ). Possiamo vincolare la forma di
questa funzione se adottiamo l’interpretazione elettrostatica della (6.4), e invochiamo il
gruppo di simmetria dello spazio tridimensionale vuoto, ovvero, le rototraslazioni,

~x → ~x 0 = R ~x + ~a, R ∈ SO(3), ~a ∈ R3 .

In un altro sistema di riferimento la (6.7) diventa infatti 22 ,


Z
F (~x ) = d3 y 0 g(~x 0 , ~y 0 ) ϕ0 (~y 0 ).
0 0

Sotto queste trasformazioni il potenziale elettrico e la densità di carica siano invarianti,

F 0 (~x 0 ) = F (~x), ϕ0 (~x 0 ) = ϕ(~x),

e dato che d3 y 0 = d3 y, ne segue che deve essere,

g(~x 0 , ~y 0 ) = g(~x, ~y ),

per una qualsiasi rototraslazione. Scegliendo R = 1 e ~a = −~y si ottiene allora,

g(~x, ~y ) = g(~x − ~y , 0) ≡ g(~x − ~y ),

mentre l’invarianza per rotazioni impone poi che g(~x) dipenda solo da |~x|. La (6.7) si
riduce allora a,
Z
F (~x) = d3 y g(~x − ~y ) ϕ(~y ), g(~x) = g(|~x|). (6.8)

22
Si noti che la funzione g deve essere indipendente dal sistema di riferimento, perché in caso contrario
un osservatore in un altro sistema di riferimento potrebbe accorgersi di essere stato rototraslato. In altre
parole, deve valere g(~x 0 , ~y 0 ) = g(~x, ~y ), e non g 0 (~x 0 , ~y 0 ) = g(~x, ~y ).

160
Ricordando la definizione della convoluzione, vedi paragrafo 2.3.2, si riconosce che questa
formula può essere riscritta in modo compatto come,

F = g ∗ ϕ. (6.9)

Posta in questa forma la soluzione F apparterrà effettivamente a S 0 , purché anche g


appartenga a S 0 . Ricordiamo, infatti, che la convoluzione tra una distribuzione e una
funzione di test definisce sempre una distribuzione.
La funzione di Green. Data la (6.8), l’equazione di Poisson si trasforma ora in un’e-
quazione per g,
Z
2
−∇ F (~x) = − d3 y ∇2 g(~x − ~y ) ϕ(~y ) = ϕ(~x).

Per l’arbitrarietà della ϕ dovrà dunque valere,

−∇2 g(~x − ~y ) = δ 3 (~x − ~y ),

ovvero, più semplicemente,


−∇2 g(~x) = δ 3 (~x). (6.10)

Questa equazione identifica g come la funzione di Green associata all’equazione (6.4),


chiamata talvolta anche “propagatore”, o “kernel integrale” dell’equazione. Il metodo
della funzione di Green consiste nel risolvere esplicitamente l’equazione per il kernel (6.10),
e di scrivere la soluzione dell’equazione di partenza nella forma integrale (6.8). L’efficacia
del metodo risiede nel fatto che esso riconduce la soluzione della (6.4), che a priori dovrebbe
essere risolta per ogni ϕ separatamente, alla soluzione di una sola equazione: l’equazione
del kernel (6.10).
L’inverso del Laplaciano. La particolare forma della soluzione (6.9), (6.10) permette
di dare un’interpretazione alternativa a g. Infatti, come qualsiasi kernel integrale anche
g induce un operatore lineare O nello spazio delle funzioni su R3 , definito da,

ϕ → O ϕ = g ∗ ϕ.

Alla luce dell’identità,

−∇2 O ϕ = −∇2 (g ∗ ϕ) = −(∇2 g) ∗ ϕ = δ 3 ∗ ϕ = ϕ,

161
l’operatore O costituisce un inverso dell’operatore −∇2 . Per questo motivo si dice anche
che il kernel g “inverte il Laplaciano”, e formalmente si scrive,
1
= g.
−∇2
Ci siamo dunque ricondotti alla soluzione del sistema,

−∇2 g(~x) = δ 3 (~x), g(~x) = g(|~x|), g ∈ S 0. (6.11)

In realtà conosciamo già una soluzione di questo sistema, vedi (2.53),


1
g(~x) = . (6.12)
4π|~x|
Ma essa è anche unica, modulo l’aggiunta di una costante additiva. Infatti, come faremo
vedere sotto, l’equazione omogenea associata alla (6.11),

∇2 g = 0,

ammette come unica soluzione invariante per rotazioni la costante. Ma è facile vedere che
l’addizione di una costante alla (6.12), porta a una F che non svanisce all’infinito.
Sostituendo la (6.12) nella (6.8) possiamo allora affermare che una soluzione particolare
dell’equazione di Poisson è data da,
Z
1 1
F (~x) = d3 y ϕ(~y ), (6.13)
4π |~x − ~y |
espressione che riproduce correttamente il potenziale elettrico creato da una densità di
carica statica. Resta da verificare la validità della condizione asintotica (6.5). Per fare
questo valutiamo il limite,
Z Z
1 3 |~x| 1 Q
lim |~x| F (~x) = lim dy ϕ(~y ) = d3 y ϕ(~y ) = ,
|~
x|→∞ 4π |~x|→∞ |~x − ~y | 4π 4π
dove Q è la “carica” totale, finita, perché ϕ è a supporto compatto. Asintoticamente F
va quindi a zero come,
Q
F (~x) ∼ . (6.14)
4π|~x|
Infine facciamo notare che la formula risolutiva (6.13), assieme all’andamento asintoti-
co (6.14), possono restare validi anche se ϕ non appartiene ad S, ma è, per esempio, della
forma più singolare (6.6). In questo caso la (6.13) si riduce infatti all’espressione nota,
X P
er er
F (~x) = ∼ r , per |~x| → ∞.
r
4π|~x − ~yr | 4π|~x|

162
6.1.2 Validità della soluzione e soluzione generale

Affrontiamo ora la questione della validità della soluzione (6.13), ovvero della (6.9),

F = g ∗ ϕ, (6.15)

in generale. Ricordiamo che avevamo richiesto F ∈ S 0 e ϕ ∈ S. Come osservato sopra,


la funzione di Green (6.12) appartiene ad S 0 , e di conseguenza la convoluzione in (6.15)
definisce effettivamente un elemento di S 0 , se ϕ appartiene ad S. Per di più in questo
caso la convoluzione equivale proprio all’integrale (6.13). Tuttavia, come abbiamo fatto
notare nel paragrafo precedente, in diversi casi di interesse fisico ϕ non appartiene a
S. In Elettrostatica esempi sono la (6.6), oppure certe densità di carica macroscopiche
“singolari”, come quelle corrispondenti a distribuzioni di carica superficiali, o filiformi. In
questi casi abbiamo,
ϕ ∈ S 0, ϕ∈
/ S,

e la (6.15) è a priori priva di senso, perché in generale la convoluzione tra due distribuzioni
non è definita.
Una convoluzione tra due distribuzioni. Per uscire dall’empasse manteniamo per il mo-
mento ϕ ∈ S, ed eseguiamo la trasformata di Fourier della (6.15), vedi paragrafo 2.3.2,

Fb(~k) = (2π)3/2 gb(~k) ϕ(


b ~k). (6.16)

Sappiamo che la trasformata gb sta in S 0 , ma possiamo anche valutarla esplicitamente.


Per determinarla in modo spedito procediamo formalmente, cioè, scrivendo l’integrale
corrispondente – di per sé divergente – e sfruttando l’invarianza per rotazioni per porre
~k = (0, 0, k), con k = |~k|. Valutiamo l’integrale passando in coordinate polari,
Z Z ∞ Z 2π Z 1
~ 1 3 −i~k·~
x 1 1 2 1
gb(k) = 3/2
d xe = 3/2
r dr dϕ d cos ϑ e−i cos ϑrk
(2π) 4π|~x| (2π) 4π 0 r
Z ∞ Z ∞0 −1
i ¡ ¢ i
= 3/2
dr e−ikr − eikr = 3/2
dx e−ikx ε(x)
2 (2π) k 0 2 (2π) k −∞
i
= εb (k), .
2 (2π) k
Nell’ultimo passaggio abbiamo introdotto la trasformata di Fourier della funzione segno,
ε(x) = H(x) − H(−x),
Z ∞
r µ ¶
1 −ikx 2 1
εb (k) = √ dx e ε(x) = −i P ,
2π −∞ π k

163
dove P indica la “parte principale”. Dato che k è positivo si ottiene in definitiva,

1
gb(~k) = ∈ S 0, (6.17)
(2π)3/2 |~k|2

e quindi,
1
Fb(~k) = b ~k).
ϕ( (6.18)
~
|k| 2

Si noti in particolare l’esatta corrispondenza tra le relazioni (6.17), (6.18), e le trasformate


di Fourier delle equazioni (6.10), (6.4).
A questo punto notiamo, però, che il membro di destra della (6.18) – e più in generale
della (6.16) – ha senso anche se gb ∈ S 0 e ϕ
b ∈ OM 23
, perché il prodotto di una generica
distribuzione con una funzione in OM definisce sempre una distribuzione, vedi paragrafo
24
2.3.2. D’altra parte, per il teorema di Paley–Wiener la trasformata di Fourier di una
generica distribuzione ϕ ∈ S 0 a supporto compatto, appartiene a OM . Di conseguenza, per
una tale ϕ il membro di destra della (6.18) costituisce una distribuzione in S 0 . In questo
caso possiamo allora definire F come l’antitrasformata di Fourier del membro di destra
della (6.18).
In conclusione, l’espressione formale (6.15), definita come l’antitrasformata di Fourier
del membro di destra della (6.16), costituisce una soluzione della (6.4) con F ∈ S 0 , purché
ϕ sia una distribuzione a supporto compatto. Tali sono in particolare tutte le distribuzioni
statiche di carica realizzate in natura.
Unicità della soluzione ed equazione di Laplace. Per concludere discutiamo brevemen-
te la soluzione generale della (6.4), indipendentemente dalla condizione asintotica (6.5).
Per ottenere la soluzione generale dell’equazione di Poisson è sufficiente aggiungere alla
soluzione particolare (6.13), la soluzione generale F0 dell’equazione omogenea associata,
ovvero dell’equazione di Laplace,
∇2 F0 (~x) = 0. (6.19)

Questa equazione ammette in effetti infinite soluzioni, ma nessuna di queste svanisce


all’infinito. Per provarlo troviamo la soluzione generale per F0 ∈ S 0 (R3 ). A questo scopo
23
Ricordiamo che con OM (RD ) si intende lo spazio delle funzioni C ∞ su RD , polinomialmente limitate
assieme a tutte le loro derivate parziali.
24
Vedi per esempio, M. Reed e B. Simon, Methods of Modern Mathematical Physics – I Functional
Analysis, Academic Press, New York, 1980.

164
è conveniente eseguire la trasformata di Fourier della (6.19),

|~k|2 Fb0 (~k) = 0, (6.20)

e sfruttare il teorema sulle distribuzioni con supporto in un punto, vedi paragrafo 2.3.2.
L’equazione appena scritta implica, infatti, che Fb0 (~k) ha come supporto l’origine ~k = 0.
Essa è dunque necessariamente una combinazione lineare finita della δ 3 (~k) e delle sue
derivate. Avremo cioè,
N
X
Fb0 (~k) = C i1 ···in ∂i1 · · · ∂in δ 3 (~k), (6.21)
n=1

dove i C i1 ···in sono tensori costanti completamente simmetrici. Inserendo questa espres-
sione nella (6.20) si trova che, affinché Fb0 (~k) sia soluzione, è necessario e sufficiente che i
coefficienti siano a traccia nulla, vedi il problema analogo per l’equazione di D’Alembert
in sezione 5.2,
δi1 i2 C i1 ···in = 0. (6.22)

Esistono quindi effettivamente infinite soluzioni. Tuttavia, eseguendo l’antitrasformata di


Fourier della (6.21), si ottiene semplicemente il polinomio,
N
1 X
F0 (~x) = 3/2
(−i)n C i1 ···in xi1 · · · xin , (6.23)
(2π) n=1

che all’infinito diverge. Concludiamo che l’equazione di Laplace non ammette soluzioni
che svaniscono all’infinito, esclusa la soluzione banale F0 = 0.
Infine, per dimostrare l’unicità della soluzione del sistema (6.11), facciamo vedere che
l’equazione di Laplace non ammette soluzioni invarianti per rotazioni, a parte la costante.
A questo scopo è conviente introdurre una base di soluzioni alternativa alle (6.23), che
si ottiene risolvendo la (6.19) in coordinate polari. Scrivendo il Laplaciano come nel
problema 5.7, è infatti immediato vedere che la base di soluzioni che ne risulta è data da,

F0lm (~x) = rl Ylm (ϕ, ϑ), (6.24)

dove le Ylm sono le armoniche sferiche, e r = |~x|. Contando le potenze di ~x nella (6.23),
si vede che l’indice l della base (6.24) si identifica direttamente con l’intero n della base
(6.23). Usando la base F0lm si vede poi che l’unica soluzione dell’equazione di Laplace
invariante per rotazioni, ovvero, indipendente dagli angoli, è F000 , che è una costante.

165
Metodo della funzione di Green in generale. Il metodo della funzione di Green si gene-
ralizza facilmente a un’equazione differenziale lineare in uno spazio D–dimensionale, che
coinvolge un arbitrario operatore polinomiale nelle derivate parziali P (∂),

P (∂) F = ϕ.

Secondo l’esempio appena svolto la funzione di Green g associata a questa equazione deve
soddisfare l’equazione del kernel,

P (∂) g(x) = δ D (x),

e la soluzione si scrive come,


F = g ∗ ϕ.

Infatti, ricordando le proprietà della convoluzione riportate nel paragrafo 2.3.2 si trova,

P (∂) F = P (∂) (g ∗ ϕ) = P (∂) g ∗ ϕ = δ D ∗ ϕ = ϕ.

6.2 Il campo generato da una corrente generica

Cerchiamo ora di applicare il metodo della funzione di Green per risolvere l’equazione di
Maxwell in presenza di una generica corrente conservata, in gauge di Lorentz,

2Aµ = j µ , (6.25)

∂µ Aµ = 0. (6.26)

Come anticipato cercheremo non la soluzione generale, ma il campo generato causalmente


dalla corrente j µ . Per il momento per definitezza assumeremo che sia,

Aµ ∈ S 0 ≡ S 0 (R4 ), j µ ∈ S ≡ S(R4 ). (6.27)

Ricordiamo tuttavia che – come nel caso dell’equazione di Poisson – la corrente di un siste-
ma di particelle puntiformi in realtà non sta in S, ma in S 0 . Anche nel caso dell’equazione
di Maxwell, alla fine dovremo allora affrontare il problema di come estendere la soluzione
al caso “fisico” – in cui j µ ∈ S 0 . La differenza principale tra la (6.25) e l’equazione di
Poisson è essenzialmente che la seconda vive in tre dimensioni spaziali, mentre la prima

166
è formulata nello spazio quadrimensionale di Minkowski: il suo gruppo di invarianza sarà
quindi il gruppo di Poincaré, in sostituzione del gruppo delle rototraslazioni.
Ci occuperemo prima della soluzione della (6.25), e imporremo poi la gauge di Lorentz
alle soluzioni trovate. Per la linearità congiunta in Aµ e j µ dell’equazione di Maxwell,
cerchiamo ora una soluzione della forma,
Z
µ
A (x) = d4 y G(x, y) j µ (y), (6.28)

dove la funzione di Green G(x, y) è una funzione incognita delle coordinate spazio–
temporali xµ e y µ . Come prima cosa vediamo allora quali sono i vincoli imposti a questa
funzione dalla richiesta di covarianza sotto trasformazioni di Poincaré. Cambiando sistema
di riferimento,
xµ → x0µ = Λµ ν xν + aµ ,

abbiamo,
Z
0µ 0
A (x ) = d4 y 0 G(x0 , y 0 )j 0µ (y 0 ),

e dato che si ha,

A0µ (x0 ) = Λµ ν Aν (x), j 0µ (y 0 ) = Λµ ν j ν (y), d4 y 0 = d4 y,

segue facilmente,
Z
ν
A (x) = d4 y G(x0 , y 0 )j ν (y).

Confrontando con la (6.28) concludiamo allora che G deve essere invariante per trasfor-
25
mazioni di Poincaré, cioè ,

G(Λx + a, Λy + a) = G(x, y), ∀ Λµ ν ∈ SO(1, 3)c , ∀ aµ ∈ R4 .

Scegliendo Λµ ν = δ µ ν , e aµ = −y µ si ottiene,

G(x, y) = G(x − y, 0) ≡ G(x − y).


25
Come nel caso dell’equazione di Poisson la quantità G(x, y) va considerata non come un campo
scalare in x e y, ma come una funzione invariante di x e y, con una dipendenza funzionale ben definita.
Questa funzione deve essere la stessa in ogni sistema di riferimento, altrimenti due correnti con la stessa
dipendenza funzionale in due diversi sistemi di riferimento, darebbero luogo a potenziali con dipendenze
funzionali diverse, in contrasto con il principio di relatività einsteiniana. In altre parole, deve valere
G(x0 , y 0 ) = G(x, y), e non G0 (x0 , y 0 ) = G(x, y).

167
Scegliendo poi aµ = 0 e Λµ ν generico, si trova che G(x) deve essere invariante per
26
trasformazioni di Lorentz proprie ,

G(Λx) = G(x), ∀ Λµ ν ∈ SO(1, 3)c . (6.29)

In particolare vediamo allora che la (6.28) può essere scritta nella forma prevista dal
metodo della funzione di Green,
Z
µ
A (x) = d4 y G(x − y) j µ (y), (6.30)

ovvero, in notazione compatta,


Aµ = G ∗ j µ . (6.31)

Sostituendo infine la (6.30) nella (6.25) si trova,


Z
2A (x) = d4 y 2G(x − y) j µ (y) = j µ (x),
µ

che comporta per la funzione di Green l’equazione,

2G(x) = δ 4 (x). (6.32)

La soluzione dell’equazione di Maxwell è quindi ricondotta alla soluzione di questa equa-


zione, compatibilmente con il vincolo (6.29).
Tuttavia, si può vedere che le condizioni (6.29) e (6.32) non determinano ancora la
funzione di Green univocamente. Aggiungiamo a questo punto una richiesta fisica, concer-
nente la propagazione causale del campo elettromagnetico: richiediamo che il potenziale
Aµ (x) nel punto x non possa dipendere dai valori della corrente j µ (y) in punti y che sono
temporalmente successivi a x, ovverosia, punti per cui x0 < y 0 . Questo vuol dire che deve
essere G(x − y) = 0 per x0 < y 0 , ovvero,

G(x) = 0, ∀ t < 0.

Vedremo che con questa richiesta aggiuntiva le (6.29) e (6.32) ammettono un’unica solu-
zione. La funzione di Green risultante viene chiamata “funzione di Green ritardata”, e
viene indicata con Gret .
26
Tra un attimo spiegheremo il motivo per cui G non può essere invariante sotto l’intero gruppo di
Lorentz.

168
Per spiegare la nomenclatura osserviamo che in certe analisi teoriche si introduce anche
la “funzione di Green avanzata”, definita da,

Gadv (x) = 0, ∀ t > 0, (6.33)

alla quale si può associare la soluzione formale,

Aµadv = Gadv ∗ j µ .

Tuttavia, non rispettando la causalità questa soluzione non giocherà nessun ruolo nella
nostra trattazione.

6.2.1 La funzione di Green ritardata

La funzione di Green ritardata è definita dalle condizioni,

2G(x) = δ 4 (x), (6.34)

G(Λx) = G(x), ∀ Λ ∈ SO(1, 3)c , (6.35)

G(x) = 0, ∀ t < 0. (6.36)

Prima di procedere alla soluzione di questo sistema di equazioni, dimostriamo che la


soluzione, se esiste è, unica.
Unicità della funzione di Green. Per dimostrare l’unicità della funzione di Green è
sufficiente dimostrare che non esistono soluzioni dell’equazione delle onde – l’equazione
omogenea associata –
2F = 0, (6.37)

soddisfacenti (6.35) e (6.36). Determineremo prima tutte le soluzioni della (6.37) soddi-
sfacenti la (6.35), ovvero F (Λx) = F (x), e alla fine imporremo la (6.36). Per eseguire
questa analisi è conveniente passare in trasformata di Fourier, F (x) → Fb(k). La Lorentz–
invarianza di F (x) si traduce allora semplicemente nella Lorentz–invarianza di Fb(k), come
funzione di k µ . Infatti, eseguendo il cambiamento di variabili x = Λy, d4 x = d4 y, si ha,
Z Z
1 1
Fb(Λk) = 4
d xe −i Λk·x
F (x) = d4 y e−i Λk·Λy F (Λy)
(2π)2 (2π)2
Z
1
= d4 y e−i k·y F (y) = Fb(k).
(2π)2

169
Dobbiamo dunque risolvere il sistema,

k 2 Fb(k) = 0, Fb(Λk) = Fb(k), ∀ Λ ∈ SO(1, 3)c .

In realtà l’equazione delle onde è stata risolta in tutta generalità in sezione 5.2, e possiamo
quindi ricorrere ai risultati di quella sezione. Avevamo trovato che le soluzioni cadono in
due classi, rispettivamente,

FbI = δ(k 2 )f (k) (6.38)


XN
b
FII = C µ1 ···µn ∂µ1 · · · ∂µn δ 4 (k), Cν νµ3 ···µn = 0, (6.39)
n=1

dove i tensori C µ1 ···µn sono completamente simmetrici. Si tratta allora di selezionare da


ciascuna di queste classi le soluzioni Lorentz–invarianti. Per quanto riguarda le soluzioni
di tipo I osserviamo che, per l’invarianza per rotazioni spaziali, f può dipendere solo da
k 0 = ±|~k|. Ma le uniche funzioni di k 0 Lorentz–invarianti sul cono luce, sono la costante
e la funzione segno ε(k 0 ). Tenendo conto della condizione di realtà Fb ∗ (k) = Fb(−k), si
ottengono cosı̀ le due soluzioni linearmente indipendenti,

Fb1 = δ(k 2 ), Fb2 = i ε(k 0 ) δ(k 2 ).

Per quanto riguarda invece le soluzioni di tipo II osserviamo che l’invarianza di Lorentz
impone che i tensori completamente simmetrici C µ1 ···µn devono essere tensori Lorentz–
invarianti. I tensori di rango dispari devono allora essere nulli, mentre quelli di rango
pari devono essere proporzionali al prodotto completamente simmetrizzato di metriche di
Minkowski. Deve essere, cioè,

C µ1 ···µn = an η (µ1 µ2 · · · η µn−1 µn ) ,

dove gli an sono costanti. Ma questi tensori devono essere anche a traccia nulla, vedi
(6.39),
(n + 2) an (µ3 µ4
Cν νµ3 ···µn = η · · · η µn−1 µn ) = 0.
n−1
Ne segue che deve essere an = 0 per n 6= 0. Per n = 0 otteniamo invece una terza soluzione
indipendente,
Fb3 = δ 4 (k).

170
Si noti che queste tre soluzioni si possono ottenere formalmente dalla (5.29), scegliendo
rispettivamente ε(~k) = 1, i, ω δ 3 (~k). Le antitrasformate delle Fbi possono essere valutate
analiticamente, e noi le riportiamo senza dimostrazione:
µ ¶
1 1
F1 = − P ,
π x2
F2 = −ε(t) δ(x2 ),
1
F3 = ,
(2π)2

dove “P ” indica la parte principale rispetto alla variabile x0 . Si vede che tutte e tre le
soluzioni sono invarianti per SO(1, 3)c , come da costruzione, ma nessuna di esse soddisfa
la condizione di causalità (6.36). La funzione di Green ritardata, se esiste, è quidi unica.
Determinazione della funzione di Green ritardata. Determiniamo ora la soluzione del
sistema (6.34)–(6.36). Notiamo innanzitutto che l’invarianza per rotazioni spaziali,

G(t, R ~x) = G(t, ~x), ∀ R ∈ SO(3),

implica che G può dipendere da ~x solo attraverso la variabile r = |~x|,

G = G(t, r).

Poniamoci ora nella regione ~x 6= 0, t arbitrario. In questa regione si deve avere 2G = 0.


Per ~x 6= 0 è lecito usare coordinate polari, e scrivere il Laplaciano come nel problema 5.7.
Sfruttando il fatto che G non dipende dagli angoli si ottiene allora,
µ ¶
2 1 2 1¡ 2 ¢
2G = ∂t − ∂r r G = ∂t − ∂r2 (rG) = 0, (6.40)
r r

che corrisponde all’equazione delle onde in una dimensione. Ricordando la forma della
sua soluzione generale, vedi problema 5.8, abbiamo dunque,

1
G(t, r) = (f (t − r) + g(t + r)) ,
r

dove f e g sono funzioni arbitrarie di una variabile. Ma siccome G deve annullarsi ∀ t < 0
dobbiamo scegliere g = 0, e restiamo con,

1
G= f (t − r).
r

171
Per determinare f imponiamo ora che G soddisfi l’equazione del kernel (6.34) “in tutto
lo spazio”, ovvero, nel senso delle distribuzioni,

∂t2 G − ∇2 G = δ 3 (~x) δ(t). (6.41)

Indicando la derivata della f rispetto al suo argomento con un “primo”, abbiamo intanto,

1 00
∂t2 G = f (t − r).
r

Per valutare invece il Laplaciano occorre procedere con un po’ di cautela, per via della
singolarità in r = 0 del fattore 1/r. Possiamo comunque applicare la regola di Leibnitz per
le derivate, se supponiamo che f (t − r) sia regolare in r = 0, proprietà che verificheremo
a posteriori,
µ ¶ µ ¶ ³ ´
2 21 1 2 ~ 1 ~
∇ G= ∇ f (t − r) + ∇ f (t − r) + 2 ∇ · ∇ f (t − r) .
r r r

Per funzioni invarianti per rotazioni e regolari in r = 0, possiamo usare la forma del
Laplaciano utilizzata in (6.40). Abbiamo quindi,

1 2 2
∇2 f (t − r) = ∂r (rf (t − r)) = f 00 (t − r) − f 0 (t − r).
r r

Ricordiamo poi che nel senso delle distribuzioni si ha,

~ 1 = − ~x ,
∇ ∇2
1
= −4π δ 3 (~x),
r r3 r

e che
~ (t − r) = − ~x f 0 (t − r).
∇f
r
Si vede allora che le derivate prime di f si cancellano e rimane,

1 00
∇2 G = −4π δ 3 (~x) f (t) + f (t − r).
r

La (6.41) si riduce allora a,

¡ ¢
∂t2 − ∇2 G = 4πδ 3 (~x)f (t) = δ 3 (x) δ(t),

e quindi deve essere,


1
f (t) = δ(t).

172
Concludiamo che la funzione di Green ritardata è data da,
1
Gret = δ(t − r). (6.42)
4πr
Questa espressione soddisfa la (6.36), ma non sembra soddisfare (6.35). In realtà, ricor-
dando l’identità,
1
δ(x2 ) = δ(t2 − r2 ) = [δ(t − r) + δ(t + r)] ,
2r
possiamo riscrivere la (6.42) nella forma manifestamente Lorentz–invariante,
1
Gret = H(x0 ) δ(x2 ). (6.43)

Analogamente per la funzione di Green avanzata (6.33) si otterrebbe,
1
Gadv = δ(t + r) (6.44)
4πr
1
= H(−x0 ) δ(x2 ). (6.45)

In definitiva abbiamo dunque ottenuto due funzioni di Green soddisfacenti (6.34) e (6.35),
entrambi appartenenti ad S 0 , vedi problema 6.1. In particolare vale quindi,

2Gret = δ 4 (x),

2Gadv = δ 4 (x).

A priori avremmo quindi potuto scegliere come funzione di Green qualsiasi combinazione
del tipo,
G = α Gret + (1 − α) Gadv , 2G = δ 4 (x),

con α numero reale arbitrario, ma la condizione di causalità (6.36) seleziona il valore


α = 1 ! D’ora in poi al posto di Gret scriveremo semplicemente G.
Osserviamo inoltre che c’è un semplice legame tra i kernel avanzati e ritardati, e il
kernel antisimmetrico D introdotto nel paragrafo 5.2.1, vedi (5.43). Vale infatti,

D = Gret − Gadv , (6.46)

da cui discende immediatamente l’equazione caratteristica del kernel antisimmetrico,

2D = 0,

che lo identifica come “propagatore” delle onde elettromagnetiche libere.

173
6.2.2 Il potenziale vettore ritardato

Inserendo la (6.43) nella (6.30) otteniamo cosı̀ il “potenziale ritardato” Aµ ≡ Aµret ,


Z
µ 1
A (x) = d4 y H(x0 − y 0 ) δ((x − y)2 )j µ (y), (6.47)

in forma covariante a vista. Usando invece la (6.42) possiamo integrare sulla coordinata
y 0 e riscriverlo come,
Z
µ 1 1
A (t, ~x) = d4 y δ(t − y 0 − |~x − ~y |) j µ (y 0 , ~y )
4π |~x − ~y |
Z
1 1
= d3 y j µ (t − |~x − ~y |, ~y ). (6.48)
4π |~x − ~y |

In seguito faremo uso sia della (6.47) che della (6.48); la prima scrittura ha il pregio di
essere manifestamente Lorentz–invariante, la seconda quello di contenere un’integrazione
in meno.
Resta allora da imporre la condizione di gauge–fixing (6.26), che abbiamo lasciato in
sospeso. La soluzione appena scritta, con i criteri imposti, ha il carattere di unicità. Per
consistenza la condizione di Lorentz dovrebbe allora essere soddisfatta automaticamente.
In realtà questo è quello che succede. Per farlo vedere è sufficiente ricorrere alla (6.31) e
usare le proprietà della convoluzone del paragrafo 2.3.2,

∂µ Aµ = ∂µ (G ∗ j µ ) = G ∗ ∂µ j µ = 0,

dove abbiamo sfruttato la conservazione della quadricorrente. Si noti che il potenziale


Aµ = G ∗ j µ soddisfa la gauge di Lorentz indipendentemente dalla forma di G.
Funzioni di Green e causalità. Analizziamo ora brevemente la struttura causale della
soluzione (6.47). Abbiamo derivato questa formula imponendo la “condizione minimale”
che la funzione di Green si annulli per tempi negativi, assicurando cosı̀ che eventi futuri
non possano influenzare eventi passati. D’altra parte una semplice richiesta di questo
tipo è in palese conflitto con la Relatività Ristretta, perché in generale l’ordinamento
temporale tra due eventi non viene preservato da una trasformazione di Lorentz. Per
preservare l’ordinamento temporale bisogna imporre una condizione ulteriore, cioè, che
due eventi possano influenzarsi solo se sono a distanza di tipo tempo o nullo. Infatti,

174
secondo la causalità relativistica un evento y può influenzare un evento x, solo se valgono
le due condizioni,
(x − y)2 ≥ 0, x0 ≥ y 0 ,

che definiscono il cone luce futuro di y – insieme che sappiamo essere invariante sotto
trasformazioni di Lorentz proprie, vedi paragrafo 5.3.3. L’evento y può quindi influenzare
l’evento x, solo se x appartiene al cono luce futuro di y. Corrispondentemente una generica
funzione di Green causale e relativistica deve godere delle proprietà minimali,

G(x) = 0, ∀ t < 0.

G(x) = 0, ∀ x2 < 0.

La funzione di Green (6.43) dell’equazione di Maxwell non solo possiede queste proprietà,
ma è anche supportata interamente sul bordo del cono luce. Come conseguenza nella
(6.47) il potenziale vettore in un punto x è causalmente connesso solo con punti y della
corrente che stanno a distanze di tipo luce da x, e che appartengono al passato di x.
Concludiamo che nel campo elettromagnetico l’informazione si propaga dalle particelle
cariche al punto di osservazione con la velocità della luce, e non viceversa. Vedremo
che sarà proprio questa asimmetria per inversione temporale, imposta dalla causalità, a
dar luogo – in ultima analisi – al fenomeno dell’irraggiamento, ovvero, dell’emissione di
radiazione da parte di particelle cariche accelerate. Nel paragrafo 6.4.3 vedremo, infatti,
che per via di questa asimmetria le particelle accelerate emettono energia – e non la
assorbono.
Il ritardo. Concludiamo questo paragrafo con un ulteriore commento sulla struttura
relativistica della (6.48), confrontandola con la soluzione (6.13) dell’equazione di Poisson.
Riportiamo la (6.13) nell’interpretazione dell’Elettrostatica, “accendendo” il tempo,
Z
0 1 1
A (t, ~x) = d3 y j 0 (t, ~y ). (6.49)
4π |~x − ~y |

Per confrontare questa espressione con la (6.48) riscriviamo anche quest’ultima, reinse-
rendo le potenze della velocità della luce. Risulta,
Z µ ¶
µ 1 3 1 µ |~x − ~y |
A (t, ~x) = dy j t− , ~y .
4π |~x − ~y | c

175
Vediamo che l’unica differenza tra le due formule è la comparsa del “ritardo” − |~x−~
c
y|
, nel-
l’argomento temporale della corrente. Questo termine corrisponde esattamente al tempo
che la luce impiega per passare dal punto ~y in cui è situata la carica, al punto di osser-
vazione ~x, dove si valuta il campo. Il campo all’istante t nel punto ~x dipende quindi dal
|~
x−~ y|
valore della corrente nel punto ~y , all’istante “ritardato” t0 = t − c
. Nel potenziale
elettrostatico (6.49) si suppone, invece, un’interazione non locale a distanza, e il ritardo
viene trascurato.

6.2.3 Validità della soluzione e trasformata di Fourier

In questo paragrafo discuteremo brevemente i limiti di validità della soluzione formale


(6.47), o alternativamente della (6.31), date le singolarità presenti necessariamente in una
corrente j µ di particelle puntiformi.
Dato che G ∈ S 0 , la soluzione (6.31),

Aµ = G ∗ j µ , (6.50)

è in effetti ben definita in S 0 , purché j µ stia in S, come supposto in (6.27). Ma in realtà


sappiamo che le correnti fisiche non stanno in S, ma in S 0 , e per di più questa volta esse
non sono nemmeno a supporto a compatto – come succedeva invece nel caso dell’equazione
di Poisson – semplicemente perché la corrente j µ in generale è diversa da zero per qualsiasi
−∞ < t < +∞ ! Non possiamo quindi più applicare il teorema di Paley–Wiener, come
in sezione 6.1. Ciononostante, come in quel caso possiamo cercare di dare un senso alla
(6.50), passando in trasformata di Fourier. Senza dimostrazione riportiamo le formule per
le trasformate di Fourier in S 0 dei kernel ritardati e avanzati,
µ µ ¶ ¶
bret (k) = − 1 1 0 2
G P + i π ε(k ) δ(k ) (6.51)
(2π)2 k2
µ µ ¶ ¶
badv (k) = − 1 1 0 2
G P − i π ε(k ) δ(k ) . (6.52)
(2π)2 k2

Si noti, comunque, la compatibilità di queste formule con la trasformata di Fourier


dell’equazione del kernel (6.32), e con le (5.42), (6.46).
A questo punto possiamo eseguire esplicitamente la trasformata di Fourier della (6.50),
µ µ ¶ ¶
b 2 b b 1
µ µ
A (k) = (2π) Gret (k) j (k) = − P + i π ε(k ) δ(k ) b
0 2
j µ (k). (6.53)
k2

176
Come anticipato sopra, la trasformata della corrente, b
j µ (k), in generale non appartiene
ad OM , e quindi non è garantito che il prodotto a secondo membro sia ben definito. Illu-
striamo la situazione, considerando la corrente di una particella carica in moto rettilineo
uniforme, y µ (λ) = uµ λ,
Z
µ µ
j (x) = e u dλ δ 4 (x − u λ).

La sua trasformata di Fourier è facile da valutare,


Z Z Z
b e uµ e uµ e uµ
j µ (k) = 4
d xe −ik·x 4
dλ δ (x − u λ) = dλ e−ik·u λ = δ(u · k),
(2π)2 (2π)2 2π

e come si vede, essa non appartiene a OM , bensı̀ a S 0 . Ciononostante, in certi casi il


prodotto formale (6.53), ovvero l’espressione,
µ µ ¶ ¶
b µ e uµ 1 0 2
A (k) = − P + i π ε(k ) δ(k ) δ(u · k), (6.54)
2π k2

possono essere comunque ben definiti in S 0 . Per vedere quando questo succede conside-
riamo separatamente i casi di particelle massive, e particelle prive di massa.
a) Traiettorie di tipo tempo. Per una particella massiva la traiettoria è di tempo, e
possiamo porci nel suo sistema di riferimento a riposo. In questo sistema abbiamo uµ =
(1, 0, 0, 0) e δ(u · k) = δ(k 0 ). Il secondo termine del prodotto (6.54) è allora nullo, in
quanto,
1 ³ 0 ~ ´
ε(k 0 ) δ(k 2 ) δ(u · k) = δ(k − |k|) − δ(k 0 + |~k|) δ(k 0 ) = 0. (6.55)
2|~k|
La (6.54) si riduce allora a,
µ ¶
bµ 1 e uµ e uµ
A (k) = −P δ(k 0 ) = δ(k 0 ),
k2 2π ~
2π|k| 2

che appartiene effettivamente a S 0 . In realtà in questo caso è anche immediato determinare


bµ (k) esplicitamente – si veda la (6.17) – per ottenere il
l’antitrasformata di Fourier di A
noto potenziale coulombiano,
e uµ
Aµ (x) = . (6.56)
4π|~x|
Similmente si può vedere che il prodotto (6.53) definisce una distribuzione temperata, se la
corrente j µ (x) corrisponde a un’arbitraria linea d’universo di tipo tempo. E in questi casi
vedremo esplicitamente che anche le rappresentazioni integrali (6.47) e (6.48) sono sempre

177
ben definite – motivo per cui d’ora in poi ci serviremo sempre di queste rappresentazioni
esplicite.
b) Traiettorie di tipo luce. Per una particella carica priva di massa la quadrivelocità
soddisfa u2 = 0, e possiamo metterci nel sistema di riferimento in cui uµ = (1, 0, 0, 1),
sicché δ(u · k) = δ(k 0 − k 3 ). In questo caso avremmo, al posto di (6.55),

ε(k 0 ) δ(k 2 ) δ(u · k) = ε(k 0 ) δ((k 1 )2 + (k 2 )2 ) δ(k 0 − k 3 ).

A questa espressione formale si può associare un elemento di S 0 , ponendo,

δ((k 1 )2 + (k 2 )2 ) = π δ(k 1 ) δ(k 2 ).

Questa identificazione emerge se si applica il primo membro a una funzione di test di


p
S(R2 ). Usando coordinate polari bidimensionali (ϑ, ρ = (k 1 )2 + (k 2 )2 ), si ottiene infatti,
Z Z 2π Z ∞
2 1 2 2 2 1 2
d k δ((k ) + (k ) ) ϕ(k , k ) = dϑ ρ dρ δ(ρ2 ) ϕ(ρ, ϑ)
0 0
Z Z ∞
1 2π
= dϑ dρ2 δ(ρ2 ) ϕ(ρ, ϑ) = π ϕ(0).
2 0 0

La (6.54) diventerebbe allora,


µ ¶
bµ e uµ 1
A (k) = − i π ε(k ) δ(k ) δ(k ) δ(k 0 − k 3 ),
2 3 1 2
(6.57)
2π (k 1 )2 + (k 2 )2
che non appartiene a S 0 . Infatti, mentre il secondo addendo sta in S 0 , la funzione,
1
,
(k 1 )2 + (k 2 )2
non è localmente integrabile in R4 , e non ammette nessuna regolarizzazione in S 0 . Per una
particella priva di massa il prodotto (6.53) non costituisce, dunque, una distribuzione. In
questo caso questa formula, e la (6.47), sono prive di senso e devono essere abbandonate
– insieme al metodo della funzione di Green. Nondimeno vedremo che le (6.25), (6.26)
ammettono soluzioni ben definite nel senso delle distribuzioni, anche per particelle prive di
massa, e le determineremo esplicitamente in sezione 6.3.2 seguendo una strada alternativa.

6.3 Campo di una particella in moto rettilineo uniforme

Come prima applicazione della formula (6.47), in questa sezione calcoleremo il campo
elettromagnetico creato da una particella carica in moto rettilineo uniforme. Tratteremo

178
separatamente i casi di particelle massive e particelle prive di massa. Nel primo caso
il campo potrebbe essere calcolato anche attraverso una trasformazione di Lorentz dal
sistema a riposo della particella, dove,

~ = e ~x ,
E ~ = 0,
B
4π r3

al sistema di riferimento del laboratorio, vedi problema 6.3. Tuttavia, questa procedura
romperebbe l’invarianza di Lorentz manifesta. Nel secondo caso – per di più – questa pro-
cedura non sarebbe nemmeno applicabile, perché non esiste nessun sistema di riferimento
in cui una particella di massa nulla è a riposo. Nel paragrafo 6.3.2 vedremo comunque
che il campo di una particella priva di massa può essere dedotto da quello di una parti-
cella massiva, attraverso un’opportuna procedura di limite nel senso delle distribuzioni,
superando cosı̀ le difficoltà menzionate alle fine della sezione precedente.

6.3.1 Campo di una particella massiva

Secondo la (6.47) come prima cosa dobbiamo esplicitare la forma della corrente j µ (y)
associata a una particella in moto rettilineo uniforme. La linea di universo di una particella
con quadrivelocità costante si scrive,

y µ (s) = y µ (0) + uµ s, u2 = 1,

e se scegliamo l’origine del sistema di riferimento in modo tale che a t = 0 la particella


passi per l’origine, abbiamo più semplicemente,

y µ (s) = uµ s.

Per la quadricorrente si ottiene allora,


Z Z
µ µ 4 µ
j (y) = e ds u δ (y − y(s)) = e u ds δ 4 (y − u s). (6.58)

Sostituendo nella (6.47) otteniamo allora,


Z Z
µ e µ
A (x) = u d y ds H(x0 − y 0 ) δ((x − y)2 ) δ 4 (y − us)
4

Z
e µ
= u ds H(x0 − su0 ) δ((x − us)2 )

Z
e µ
= u ds H(x0 − su0 ) δ(f (s)). (6.59)

179
Abbiamo definito la funzione di s,

f (s) ≡ (x − us)2 = x2 − 2 s (ux) + s2 , (u x) ≡ uµ xµ ,

sottintendendo la dipendenza da xµ e uµ . Per valutare l’integrale della (6.59) dobbiamo


esplicitare la distribuzione δ(f (s)) in base alla (2.37), e quindi dobbiamo preventivamente
individuare gli zeri della f . Essendo quadratica f (s) ha due zeri,
p
s± = (u x) ∓ (ux)2 − x2 , f (s± ) = 0, (6.60)

entrambi reali. La quantità scalare (ux)2 − x2 è, infatti, sempre maggiore o uguale a zero.
Per rendercene conto possiamo sfruttare l’invarianza di Lorentz e valutarla nel sistema di
riferimento in cui la particella è a riposo, dove si ha uµ = (1, ~0). Si ottiene allora,

(ux)2 − x2 = (x0 )2 − ((x0 )2 − |~x|2 ) = |~x|2 ≥ 0. (6.61)

Secondo la (2.37) abbiamo allora,


δ(s − s+ ) δ(s − s− )
δ(f (s)) = + . (6.62)
|f 0 (s+ )| |f 0 (s− )|
Essendo,
f 0 (s) = 2(s − ux),

abbiamo inoltre,
p
|f 0 (s± )| = 2 (ux)2 − x2 .

Inserendo questi elementi nella (6.59) si ottiene allora,


Z
µ e uµ ¡ ¢
A (x) = p ds H(x0 − s+ u0 ) δ(s − s+ ) + H(x0 − s− u0 ) δ(s − s− ) .
4π (ux)2 − x2

Per valutare l’integrale rimanente dobbiamo studiare i segni di x0 −s± u0 . Per farlo usiamo
argomenti di covarianza. Se definiamo i quadrivettori,

V±µ = xµ − s± uµ ,

per costruzione questi vettori appartengono al cono luce, V±2 = 0. Il segno delle componen-
ti temporali V±0 = x0 − s± u0 è allora un invariante di Lorentz, e possiamo determinarlo nel
riferimento a riposo della particella. In questo riferimento abbiamo, vedi (6.60) e (6.61),

s± = x0 ∓ |~x| ⇒ V±0 = x0 − s± u0 = ±|~x|.

180
Concludiamo che in qualsiasi riferimento vale,

x0 − s+ u0 > 0, x0 − s− u0 < 0.

Di conseguenza,
H(x0 − s+ u0 ) = 1, H(x0 − s− u0 ) = 0.

Si ottiene quindi,
e uµ
Aµ (x) = p , (6.63)
4π (ux)2 − x2
formula manifestamente Lorentz–invariante. Vediamo in particolare che per la particella
statica, uµ = (1, 0, 0, 0), riotteniamo il noto potenziale coulombiano, vedi anche (6.56),

e ~ = 0.
A0 = , A (6.64)
4π|~x|

Infine possiamo calcolare il campo elettromagnetico. Dato che si ha,

µ ν e xµ − uµ (ux) ν
∂ A = u , (6.65)
4π ((ux)2 − x2 )3/2

risulta,
e x µ uν − x ν uµ
F µν = ∂ µ Aν − ∂ ν Aµ = . (6.66)
4π ((ux)2 − x2 )3/2
Contraendo invece nella (6.65) µ con ν, si verifica che il potenziale soddisfa la gauge di
Lorentz ∂µ Aµ = 0, come da costruzione.
~ e B.
I campi E ~ Partendo dalla (6.66) analizzeremo ora le proprietà generali dei campi

elettrico e magnetico prodotti da una particella in moto rettilineo uniforme, confrontandoli


in particolare con i campi di una particella non relativistica, v ¿ 1. Analizzeremo poi
questi campi anche nel regime opposto, quello ultrarelativistico, corrispondente a una
particella che si muove con velocità prossima a quella della luce.
~ eB
Cominciamo con il calcolo di E ~ a partire dalla (6.66),

e x i u0 − x 0 ui e u0 xi − v i t
E i = F i0 = = .
4π ((ux)2 − x2 )3/2 4π ((ux)2 − x2 )3/2

1 1 e kij xi uj − xj ui e u0 kij v i xj
B k = − εkij F ij = − ε = ε
2 2 4π ((ux)2 − x2 )3/2 4π ((ux)2 − x2 )3/2
e u0 kij v i (xj − v j t)
= ε = εkij v i E j . (6.67)
4π ((ux)2 − x2 )3/2

181
Abbiamo, cioè, ripristinando la velocità della luce,

~ = ~v × E.
B ~ (6.68)
c

In ogni punto il campo magnetico è dunque una semplice funzione del campo elettrico, ed
è quindi sufficiente analizzare quest’ultimo. In particolare vediamo che rispetto al campo
elettrico il campo magnetico è soppresso di un fattore v/c, in accordo con il fatto che il
secondo rappresenta un effetto dinamico.
Per analizzare la forma del campo elettrico è conveniente introdurre il vettore,

~ = ~x − ~v t,
R

congiungente in ogni istante t il punto di osservazione ~x con la posizione ~y (t) = ~v t della


particella. Con semplice algebra si trova allora,
~ 2 − v 2 R2
R2 + (~v · R)
(ux)2 − x2 = ,
1 − v2

e quindi,
~
(1 − v 2 )R
~ = e
E . (6.69)
~ 2 − v 2 R2 )3/2
4π (R2 + (~v · R)
~ il campo elettrico si può scrivere come,
Se introduciamo infine l’angolo ϑ tra ~v e R,

~ = (1 − v 2 ) ~ nr ,
E E (6.70)
(1 − v 2 sen2 ϑ)3/2

dove abbiamo introdotto il campo coulombiano non relativistico,


~
~ nr = e R .
E
4π R3

Analizziamo ora le proprietà del campo elettrico ottenuto. Intanto vediamo che per
~ decade come 1/r2 , come il campo coulombiano non
ogni t fissato, a grandi distanze E
relativistico, e quindi abbiamo l’andamento asintotico,

1
F µν ∼ , per r → ∞. (6.71)
r2
~ è ancora un campo centrale, cioè, è diretto lungo la retta passante per la posizione
Inoltre E
della particella e il punto di osservazione. Tuttavia, questo campo non è più a simmetria
sferica come il campo coulombiano non relativistico, perché il suo modulo ora dipende

182
~ rispettivamente ortogonale (ϑ = π/2) e parallelo (ϑ = 0, π)
dalla direzione. Infatti, per R
a ~v , la (6.70) dà per i corrispondenti moduli del campo elettrico,

1
E⊥ = √ Enr > Enr , (6.72)
1 − v2
Ek = (1 − v 2 ) Enr < Enr . (6.73)

Lungo la direzione del moto il campo risulta quindi schiacciato, in entrambi i versi, mentre
lungo le direzioni ortogonali al moto il campo risulta potenziato. In particolare, per
velocità che si approssimano alla velocità della luce il primo svanisce, mentre il secondo
va a infinito. Difatti per velocità molto elevate il campo elettromagnetico è praticamente
nullo in tutte le direzioni, tranne per valori di ϑ molti vicini a π/2.
Vista la (6.68), risultati analoghi valgono per il modulo del campo magnetico. Dato
~ è radiale, questa formula ci dice inoltre che le linee di campo di B
che E ~ sono circonferenze

ortogonali alla traiettoria della particella, e concentriche con essa.

6.3.2 Campo di una particella di massa nulla

Abbiamo dedotto il campo (6.66) nell’ipotesi che la velocità della particella sia costante,
ma minore di quella della luce. In questo paragrafo affrontiamo il problema del campo
elettromagnetico generato da una particella carica di massa nulla, che viaggia dunque
con la velocità della luce. Per le peculiarità dei campi di una particella ultrarelativistica,
appena messe in evidenza, ci aspettiamo campi con singolarità molto pronunciate, ai quali
si potrà dare senso solo nello spazio delle distribuzioni.
Per una particella che viaggia con la velocità della luce il tempo proprio non è definito,
e dobbiamo parametrizzare la sua linea di universo con un parametro λ generico. Se
introduciamo il quadrimomento pµ della particella possiamo parametrizzarla secondo,

y µ (λ) = pµ λ, p2 = 0, p0 = |~p| > 0,

dove di nuovo abbiamo supposto che per t = 0 la particella passi per l’origine. La direzione
del moto è allora,
p~
~n = ,
|~p|

183
e la traiettoria tridimensionale è data da ~y (t) = ~n t. Per quello che segue è conveniente
definire anche il vettore nullo,


nµ = (1, ~n) = , n2 = 0.
p0

La quadricorrente della particella è comunque data da,


Z
µ µ
J (x) = e p δ 4 (x − λp) dλ = e nµ δ 3 (~x − ~n t),

e il sistema di equazioni da risolvere è,

∂µ F µν = J ν , ∂[µ Fνρ] = 0. (6.74)

Una procedura di limite. Vogliamo ora derivare la soluzione di questo sistema dai ri-
sultati del paragrafo precedente, con un’opportuna procedura di limite. Ponendo nella
(6.58) ~v = v ~n e ricordando le (2.40), (2.41) per una particella singola, si vede intanto che
abbiamo il limite in S 0 (R4 ),
S 0 − lim j µ = J µ .
v→1

Siccome il tensore F µν definito in (6.66) soddisfa per costruzione,

∂µ F µν = j ν , ∂[µ Fνρ] = 0,

e siccome le derivate costituiscono operazioni continue in S 0 , se esiste il limite di F µν per


v → 1 nel senso delle distribuzioni, allora il tensore,

F µν ≡ S 0 − lim F µν , (6.75)
v→1

soddisfa automaticamente le (6.74). Insistiamo sul fatto che questa strategia ha senso solo
se i limiti di cui sopra vengono eseguiti nel senso delle distribuzioni: si noti in particolare
che il limite puntuale di F µν è nullo quasi ovunque, vedi (6.69).
Affrontiamo ora la determinazione del limite (6.75), partendo non direttamente dal-
la (6.66) ma dall’espressione del potenziale (6.63), che appare più semplice. Se questo
potenziale ammettesse limite nel senso delle distribuzioni, potremmo infatti scrivere,
³ ´ ³ ´
S 0 − lim F µν = ∂ µ S 0 − lim Aν − ∂ ν S 0 − lim Aµ .
v→1 v→1 v→1

184
Ora, eseguendo il limite puntuale della (6.63) si ottiene in effetti il risultato finito,

e nµ
lim Aµ (x) = , (n x) = t − ~n · ~x,
v→1 4π |(n x)|

ma questa espressione non costituisce una distribuzione! Vedremo tra poco che in realtà
il limite di Aµ nel senso delle distribuzioni non esiste – in accordo con il fatto che l’espres-
sione (6.57) non costituisce una distribuzione. Sorge allora la domanda se F µν ammette
effettivamente limite in S 0 , oppure no. La risposta può essere ancora affermativa se la
parte di Aµ che “diverge” per v → 1 in S 0 , in qualche modo non contribuisce a F µν .
A questo proposito ricordiamo in effetti che il potenziale è definito solo modulo una
trasformazione di gauge. Affinché F µν ammetta un limite ben definito è allora sufficiente
che la parte divergente del potenziale possa essere eliminata con una trasformazione di
gauge. Consideriamo, per esempio, una trasformazione di gauge con parametro,

e ¯ p ¯
¯ 2 2 ¯
Λ= ln ¯(ux) − (ux) − x ¯ . (6.76)

Con un semplice calcolo si trova che il potenziale trasformato, del tutto equivalente a
(6.63) ma non più soddisfacente la gauge di Lorentz, è dato da,
à !
eµ = Aµ + ∂ µ Λ = e (ux) xµ eν − ∂ ν A
eµ ,
A 1+ p 2
, F µν = ∂ µ A (6.77)
4π 2
(ux) − x 2 x

dove con 1/x2 intendiamo la sua parte principale. Grazie al limite puntuale,

(ux)
lim p = ε(nx),
v→1 (ux)2 − x2
dove ε(·) indica la distribuzione segno, non è difficile vedere che il limite distribuzionale
del potenziale trasformato ora è ben definito, e che coincide semplicemente con il suo
limite puntuale,
eµ = e xµ
Aµ ≡ S 0 − lim A H(n x). (6.78)
v→1 2π x2
eµ ammette limite per v → 1, mentre nello stesso limite il parametro di gauge Λ
Dato che A
diverge, vedi (6.76), risulta ora anche chiaro perché (6.63) non poteva ammettere limite.
Usando le (6.77), (6.78), possiamo ora determinare il campo elettromagnetico creato
da una particella carica di massa nulla, in moto in direzione ~n,
µ ν ν µ
eµ ) = ∂ µ Aν − ∂ ν Aµ = e n x − n x δ(n x).
eν − ∂ ν A
F µν = S 0 − lim F µν = S 0 − lim (∂ µ A
v→1 v→1 2π x2

185
Per i campi elettrico e magnetico si ottiene allora facilmente,

e ~x − ~n t
E~ = − δ(n x), ~
B = ~n × E, ~n · E = 0. (6.79)
2π x2

In particolare per i “moduli” vale E = B.


Se vede che in ogni istante i campi sono diversi da zero solo sul piano passante per la
posizione della particella in quell’istante, e perpendicolare alla sua velocità. Per esempio,
se la particella si muove lungo l’asse z si ha,

e
E~ = (x, y, 0) δ(z − t), (6.80)
2π(x2
+ y2)
e
B~ = (−y, x, 0) δ(z − t), (6.81)
2π(x + y 2 )
2

e all’istante t i campi sono non nulli solo sul piano z = t, dove sono “molto intensi”, cioè,
proporzionali alla δ di Dirac. Ricordiamo poi che per costruzione questi campi soddisfano
le equazioni di Maxwell. Si verifica per esempio facilmente che vale, vedi problema 6.4,

~ · E~ = e δ(x) δ(y) δ(z − t) = j 0 (x),


∇ ~ · B~ = 0.
∇ (6.82)

Infine, se si vuole nuovamente ottenere un potenziale nella gauge di Lorentz, è suffi-


ciente eseguire un’altra trasformazione di gauge,
³ e ¯ 2 ¯´ e
Aeµ = Aµ − ∂ µ H(n x) ln ¯x ¯ = − ln |x2 | δ(n x) nµ , ∂µ Aeµ = 0.
4π 4π

Shock waves. Campi del tipo (6.79) vengono chiamati “shock waves”, perché in ogni
istante il campo è diverso da zero solo su un piano, che avanza con la velocità della luce.
Succede allora che una carica di prova avverte un effetto solo nell’istante in cui questo
piano la colpisce, subendo una variazione istantanea, ma finita, della propria quantità di
moto. Supponiamo, per esempio, che il piano d’onda della particella colpisca all’istante
t = 0 una particella di carica e∗ non relativistica, v ¿ 1, nella posizione (x, y, 0) ≡ ~b. In
questo caso nell’equazione di Lorentz,

d~p
= e∗ (E + ~v × B)
dt

il campo magnetico è trascurabile. Inserendo in questa formula la (6.80), e integrando


tra un instante precedente e uno successivo all’urto, si trova che alla particella viene

186
comunicata la quantità di moto,
Z Z Z
t
d~p t t
e ~b e∗ e ~b e∗ e ~b
∆~p = dt = e∗ E~ dt = e∗ δ(z(t) − t) dt = ' .
−t dt −t −t 2π b2 2π b2 (1 − vz ) 2π b2 c

Nel risultato finale abbiamo ripristinato la velocità della luce, per evidenziare il fatto che
si tratta di un effetto relativistico. L’urto provoca quindi un “kick” di allontanamento se
le cariche sono dello stesso segno, e un kick di avvicinamento se sono di segno opposto.
Osserviamo, comunque, che in Elettrodinamica il fenomeno delle shock waves costi-
tuisce solo un’estrapolazione matematica – e non una situazione fisicamente realizzabile –
perché in natura non esistono particelle cariche prive di massa. Al contrario, risolvendo le
equazione di Einstein si può vedere che il campo gravitazionale generato da una particella
27
che viaggia con la velocità della luce, è ancora di tipo shock wave . Ma questa volta le
soluzioni hanno valenza fisica, perché qualsiasi particella senza massa – come il fotone –
essendo dotata di energia è gravitazionalmente “carica”, e quindi crea un campo gravita-
zionale di questo tipo. In questo caso l’estrapolazione matematica descrive, dunque, una
situazione realizzata in natura.

6.4 Campo di una particella in moto arbitrario

Come seconda applicazione importante della (6.8), determiniamo il campo elettromagne-


tico creato da una particella che percorre un’arbitraria traiettoria di tipo tempo. Rispetto
al moto rettilineo uniforme la particella possiede dunque un’accelerazione generalmente
non nulla, e vedremo che il campo generato apparirà qualitativamente molto diverso. Le
peculiarità distintive che emergeranno rispetto al moto rettilineo uniforme si possono rias-
sumere come segue. Il campo di tipo coulombiano (6.66) verrà deformato, ma manterrà il
suo andamento a grandi distanze, ovvero 1/r2 . In aggiunta comparirà un campo nuovo,
dovuto all’accelerazione della particella, che a grandi distanze decadrà più debolmente,
ovvero come 1/r, e che sarà quindi dominante rispetto al primo. Vedremo poi che sarà
proprio questo andamento asintotico più intenso ad essere responsabile del fenomeno del-
l’irraggiamento, del quale ci occuperemo in dettaglio nel prossimo capitolo: gli artefici
dell’irraggiamento sono dunque le cariche accelerate.
27
P. Aichelburg e R. Sexl, Gen. Rel. Grav. 2 (1971) 303).

187
6.4.1 Condizioni asintotiche.

Cominciamo con qualche considerazione di carattere generale, sulle traiettorie delle par-
ticelle cariche che prenderemo in considerazione.
Riferendoci a una singola particella ricordiamo che possiamo parametrizzare la sua
linea di universo con il tempo proprio, y µ (s), ma anche con il tempo t,

t ≡ y 0 (s) −→ s(t) −→ y µ (s(t)).

Con un abuso di linguaggio, in questo secondo caso indicheremo la linea di universo,


per semplicità, di nuovo con y µ (t) ≡ (t, ~y (t)). Ricordiamo poi che, a parte una costante
additiva, la relazione esplicita tra i due parametri è,
Z tp
d~y
s(t) = 1 − v 2 (t0 ) dt0 , ~v (t) ≡ . (6.83)
0 dt

Dato che in natura non esistono particelle cariche di massa nulla, prenderemo in conside-
razione solo particelle massive, per cui ad ogni istante finito si ha v < 1. Per t → ±∞, in
linea di principio può succedere che v tende a 1, come per esempio nel caso di una par-
ticella in un campo elettrico costante e uniforme, vedi problema 2.7. Difatti imporremo
una condizione leggermente più forte, cioè, che esista una velocità vM tale che,

v(t) ≤ vM < 1, ∀ t. (6.84)

Sotto questa condizione si ha,


p q
2
1 − v 2 (t) ≥ 1 − vM ,

e la (6.83) implica allora che,


lim s(t) = ±∞, (6.85)
t→±∞

Ciò assicura che i parametri s e t possono essere usati equivalentemente, per tutta l’evo-
luzione temporale. Difatti, per i moti realizzati in natura la condizione (6.84) è sempre
soddisfatta, come ora illustreremo. Le traiettorie che si riscontrano sperimentalmente
sono essenzialmente di due tipi – moti limitati e moti illimitati – e analizzeremo ora
separatamente questi due casi.

188
Moti illimitati. Per questi moti per definizione la quadrivelocità della particella am-
mette limiti finiti per t → ±∞,
lim uµ = uµ± .
t→±∞

Questa ipotesi è equivalente ad assumere che le velocità ordinarie ammettano limiti ~v± , con
v± < 1. Fisicamente queste condizioni sono motivate dal fatto che non esistono campi di
forza con un’estensione spaziale illimitata. All’infinito l’accelerazione deve quindi essere
nulla, e la velocità tendere a un vettore costante. È allora ovvio che esiste un valore
vM , per cui vale la (6.84). Esempi tipici di moti illimitati sono le traiettorie aperte di
un esperimento di scattering. Si può comunque vedere che anche per campi (costanti e
uniformi) che si estendono fino all’infinito, per cui le velocità limite eguagliano la velocità
della luce, si hanno le relazioni asintotiche, vedi problema 2.7,

s(t) ∼ ± ln |t|.

Anche in questo caso valgono quindi le (6.85).


Moti limitati. Per questi moti sono soddisfatti i vincoli,

v(t) ≤ vM < 1, |~y (t)| ≤ L, ∀ t.

Questa categoria riguarda particelle confinate a una regione limitata dello spazio, come
per esempio un elettrone in un’antenna, oppure una particella carica in un ciclotrone. Nel
primo caso la particella è sottoposta a una forza “costante” oscillante, ma contempora-
neamente dissipa energia per effetto Joule e per irraggiamento. Il risultato è che la sua
energia resta limitata, e quindi la sua velocità strettamente minore di quella della luce.
Nel caso del ciclotrone, durante alcuni tratti del ciclo, oltre al campo magnetico sono
presenti anche campi elettrici acceleranti, che tendono a fare aumentare l’energia della
particella. Tuttavia, a regime questo aumento è completamente compensato dalla perdita
di energia per irraggiamento e, come vedremo, esiste una velocità massima minore della
velocità della luce – seppure spesso molto vicina ad essa.
Infine notiamo che, dato che in natura tutti i campi acceleranti F µν hanno intensità
limitata, la (6.84) assicura, per di più, che l’accelerazione ordinaria ~a resta limitata, vedi
problema 2.10. Ricordando la relazione tra ~a e wµ si vede allora che anche la quadriacce-
lerazione di una particella carica è sempre limitata, sia per i moti limitati che per quelli

189
illimitati. In seguito tutte le traiettorie considerate saranno supposte appartenere a una
di queste due categorie.

6.4.2 I campi di Lienard–Wiechert

Per determinare il campo elettromagnetico creato da una particella in moto arbitrario,


procediamo formalmente come nel caso di una particella in moto rettilineo uniforme.
Riprendiamo la forma generale della corrente,
Z
µ
j (y) = e ds uµ (s) δ 4 (y − y(s)),

e la inseriamo nella (6.30),


Z Z
µ e
A (x) = d y ds uµ (s) H(x0 − y 0 ) δ((x − y)2 ) δ 4 (y − y(s))
4

Z
e
= ds uµ (s) H(x0 − y 0 (s)) δ((x − y(s))2 )

Z
e
= ds uµ (s) H(x0 − y 0 (s)) δ(f (s)). (6.86)

Abbiamo definito la funzione,

f (s) = (x − y(s))2 = (x0 − y 0 (s))2 − |~x − ~y (s)|2 ,

in cui sottintendiamo la dipendenza dal punto di osservazione xµ = (x0 , ~x), che è fissato.
Come prima, per valutare δ(f (s)) dobbiamo individuare gli zeri della f . Dimostreremo
ora che questa funzione ha esattamente due zeri s± (x), soddisfacenti,

x0 − y 0 (s+ ) > 0, x0 − y 0 (s− ) < 0. (6.87)

Per fare questo sfrutteremo le proprietà generali delle traiettorie di tempo considerate,
discusse nel paragrafo precedente.
Determinazione degli zeri di f (s). Incominciamo con l’osservare che si hanno i limiti,

lim f (s) = +∞. (6.88)


s→±∞

Per i moti limitati questo è ovvio, perché per s → ±∞ si ha,

y 0 (s) = t(s) → ±∞,

190
mentre ~y (s) resta limitata. Per i moti illimitati, invece, per s → ±∞ le quadrivelocità
tendono a limiti uµ± ben definiti, e quindi,

y µ (s) → uµ± s ⇒ f (s) → x2 − 2 (xu± ) s + s2 → +∞.

Dai limiti (6.88) segue che f (s) ha almeno un estremale – in particolare almeno un minimo
– e quindi la sua derivata almeno uno zero. Scegliamo un estremale qualsiasi, s = a.
Calcolando la derivata,
f 0 (s) = −2(xµ − y µ (s)) uµ (s), (6.89)

si deduce che,
f 0 (a) = −2(xµ − y µ (a)) uµ (a) = 0.

28
Ne segue che ,
f (a) < 0.

Per provare questo sfruttiamo il fatto che le quantità f (s) e f 0 (s) sono scalari per trasfor-
mazioni di Lorentz, quindi possiamo calcolarle in un sistema di riferimento arbitrario. Sce-
gliamo il sistema di riferimento in cui per s = a la particella è a riposo, uµ (a) = (1, 0, 0, 0).
Allora abbiamo,

0 = f 0 (a) = −2(x0 − y 0 (a)) ⇒ f (a) = −|~x − ~y (a)|2 < 0.

Tutti i minimi e massimi di f (s) si trovano dunque nel semipiano inferiore. Questa
informazione, assieme al fatto che per s → ±∞ f va a +∞, implica che per ogni xµ
fissato f possiede esattamente due zeri s± ,

f (s± ) = 0, s+ < s− .

In s+ f passa da valori positivi a valori negativi, e in s− da valori negativi a valori positivi.


Di conseguenza abbiamo,
f 0 (s+ ) < 0, f 0 (s− ) > 0.

Valutando queste disuguaglianze tramite la (6.89) nei riferimenti in cui la particella è


a riposo, rispettivamente agli istanti s+ e s− , si ottengono le relazioni (6.87) in questi
28
In tutta questa analisi è sottointeso che x non appartenga alla linea di universo della particella, cioè,
x 6= y µ (s), ∀ s. Nei punti x appartenenti alla linea di universo il potenziale vettore diverge.
µ

191
µ
riferimenti. Ma dato che i vettori xµ − y± (s) appartengono al cono luce, il segno di
x0 − y ±
0
(s) è un invariante relativistico. Concludiamo quindi che le disuguaglianze (6.87)
valgono in qualsiasi sistema di riferimento, c.v.d.
Il quadripotenziale di Lienard–Wiechert. A questo punto possiamo valutare l’integran-
do della (6.86), usando la (2.37),
µ ¶
0 0 δ(s − s+ ) δ(s − s− )
0 0
H(x − y (s)) δ(f (s)) = H(x − y (s)) +
|f 0 (s+ )| |f 0 (s− )|
δ(s − s+ ) δ(s − s− )
= H(x0 − y 0 (s+ )) 0 + H(x0 − y 0 (s− )) 0
|f (s+ )| |f (s− )|
δ(s − s+ ) δ(s − s+ )
= 0
= .
|f (s+ )| 2(x − y(s+ ))u(s+ )

Sostituendo nella (6.86) si ottiene il quadripotenziale di Lienard–Wiechert,


¯
e uµ (s) ¯
µ
A (x) = ¯ , (6.90)
4π (x − y(s))u(s) ¯s=s+ (x)

dove la funzione s+ (x) è determinata in modo univoco dalle relazioni,

(x − y(s))2 = 0, x0 − y 0 (s) > 0, (6.91)

equivalenti a,
x0 − y 0 (s) = |~x − ~y (s)|. (6.92)

Il tempo ritardato. Per renderci conto del significato della posizione y µ (s+ ) della par-
ticella al tempo proprio s+ , è più conveniente parametrizzare la sua linea di universo con
il tempo,

d~y (t0 ) 1
t0 = y 0 (s), y µ (t0 ) = (t0 , ~y (t0 )), ~v (t0 ) = , uµ (t0 ) = p (1, ~v (t0 )).
dt0 1− v(t0 )2
Questo permette di riscrivere il potenziale di Lienard–Wiechert come,

e uµ (t0 )
Aµ (x) =
4π (x − y(t0 )) u(t0 )

e (1, ~v (t0 ))
=
4π t − t0 − (~x − ~y (t0 )) · ~v (t0 )
³ 0
´
e 1, ~v(tc )
= , (6.93)
4π |~x − ~y (t0 )| − (~x − ~y (t0 )) · ~v(t0 )
c

192
dove il “tempo ritardato” t0 (t, ~x) è determinato dalla (6.92),

1
t − t0 = |~x − ~y (t0 )|. (6.94)
c

Nelle formule finali abbiamo reinserito la velocità della luce, per evidenziare le correzioni
relativistiche; per il caso statico si veda la (6.64). Come si vede, il potenziale nel punto
xµ = (t, ~x) non dipende dalle variabili cinematiche della particella all’istante t, bensı̀ dai
valori di posizione e velocità all’istante ritardato t0 . Dalla (6.94) si vede che questo istante
è determinato in modo tale che l’evento (t0 , ~y (t0 )) sia connesso attraverso un segnale di tipo
luce “futuro”, al punto d’osservazione xµ . La presenza del ritardo comporta nella (6.93)
correzioni relativistiche implicite, in quanto t0 = t − o(1/c). Più precisamente, eseguendo
lo sviluppo non relativistico della (6.94) si ottiene,
µ ¶
0 |~x − ~y (t)| (~x − ~y (t)) · ~v (t) 1
t (t, ~x) = t − − +o . (6.95)
c c2 c3

Al denominatore della (6.93) compare poi una correzione relativistica esplicita, per la
presenza del termine proporzionale a v(t0 )/c.
I campi di Lienard–Wiechert. Passiamo ora al calcolo del campo elettromagnetico
F µν = ∂ µ Aν − ∂ ν Aµ . In seguito per semplicità con “s” indicheremo la funzione di x s+ (x).
Introduciamo oltre alla quadriaccelerazione wµ = duµ /ds, il quadrivettore dipendente da
x,
Lµ (x) ≡ xµ − y µ (s), (6.96)

dove bisogna tenere presente che la dipendenza da x avviene anche attraverso s. Allora il
sistema (6.91) può essere riscritto come,

Lα Lα = 0, L0 = |~x − ~y (s)|. (6.97)

Per il potenziale e il campo elettromagnetico si ottiene allora,


µ ¶
µ e uµ µν e 1 µ ν 1 µ ν
A = , F = ∂ u − ∂ (uL) u − (µ ↔ ν) . (6.98)
4π (uL) 4π (uL) (uL)2

Per determinare le derivate rimanenti dobbiamo valutare le derivate parziali di s ≡ s(x)


rispetto a xµ . A questo scopo è sufficiente derivare la (6.97) rispetto a xµ ,
µ ¶
α α α ∂s dyα ∂s
0 = L ∂µ Lα = L ∂µ (xα − yα (s)) = L ηαµ − µ = Lµ − (uL) µ ,
∂x ds ∂x

193
che dà,
∂s Lµ
µ
= .
∂x (uL)
Possiamo ora calcolare le derivate che compaiono in F µν ,
∂s duν Lµ wν
∂ µ uν = = ,
∂xµ ds (uL)
∂s dyν L µ uν
∂µ Lν = ηµν − µ = ηµν − ,
∂x ds (uL)
e quindi,

∂µ (uL) = (∂µ uν )Lν + uν ∂µ Lν


µ ¶
1 ν Lµ uν
= Lµ (wL) + u ηµν −
(uL) (uL)
1
= ((wL) − 1)Lµ + uµ .
(uL)
Sostituendo queste espressioni nella (6.98) si ottiene infine un’espressione covariante a
vista, per il campo elettromagnetico prodotto da una particella carica in moto arbitrario,
e ³ ´
F µν = Lµ ν
u + L µ
[(uL) w ν
− (wL) u ν
] − (µ ↔ ν) . (6.99)
4π(uL)3
Campi di velocità e campi di accelerazione. Come prima cosa vogliamo analizzare il
comportamento della (6.99) a grandi distanze dalla particella. A questo scopo è convenien-
te suddividere i termini che compaiono in F µν in due classi, in base alla loro dipendenza
dalla variabile,
R ≡ L0 = |~x − ~y (s)|,

vedi (6.97). È anche conveniente definire il versore nullo,



mµ ≡ , mµ mµ = 0,
R
con componenti,
~x − ~y (s)
m0 = 1, m
~ = , |m|
~ = 1.
|~x − ~y (s)|
Scrivendo Lµ = R mµ possiamo allora riscrivere il campo (6.99) come somma di due
contributi, il “campo di velocità” Fvµν , e il “campo di accelerazione” Faµν ,

F µν = Fvµν + Faµν , (6.100)


e
Fvµν = 3 2
(mµ uν − mν uµ ) , (6.101)
4π(um) R
e ³ ´
Faµν = m µ
[(um) w ν
− (wm) u ν
)] − (µ ↔ ν) . (6.102)
4π(um)3 R

194
In Faµν abbiamo incluso i termini proporzionali a 1/R, e in Fvµν i termini proporzionali
a 1/R2 . Come si vede il primo risulta proporzionale alla quadriaccelerazione, mentre il
secondo ne è indipendente.
Analizziamo ora gli andamenti di questi campi a grandi distanze dalla particella. Per
fare questo supponiamo che la particella si muova in una regione limitata dello spazio,

|~y | ≤ D,

e consideriamo il campo in un punto ~x lontano da questa regione,

r ≡ |~x| À D.

Allora abbiamo le identificazioni asintotiche,


~x − ~y ~x
R = |~x − ~y | ≈ r, m
~ = ≈ ≡ ~n. (6.103)
|~x − ~y | r
Siccome per qualsiasi valore di r i vettori uµ , wµ e mµ sono limitati, vediamo che a grandi
distanze dalla particella il campo di accelerazione decade come,
1
Faµν ∼ , (6.104)
r
mentre il campo di velocità decade come,
1
Fvµν ∼ . (6.105)
r2
In particolare vediamo che a grandi distanze il campo di accelerazione domina sul campo
di velocità, e quindi il campo totale decade come,
1
F µν ∼ ,
r
in contrapposizione con l’andamento del campo del moto rettilineo uniforme, vedi (6.71).
Consideriamo ora più da vicino il campo di velocità, riscrivendolo come,
e
Fvµν = (Lµ uν − Lν uµ ) . (6.106)
4π(uL)3
È facile vedere che per un moto rettilineo uniforme questo campo si riduce in realtà alla
(6.66). Infatti, se y µ (s) = uµ s, si ha Lµ = xµ − uµ s, e quindi,

Lµ uν − Lν uµ = xµ uν − xν uµ ,
p
(uL) = uµ (xµ − uµ s) = (ux) − s+ (x) = (ux)2 − x2 ,

195
vedi (6.60). Il campo Fvµν rappresenta quindi una deformazione del campo elettromagneti-
co di una particella in moto rettilineo uniforme, ed eredita in particolare il suo andamento
asintotico 1/r2 . Per questo motivo Fvµν viene anche chiamato “campo coulombiano”.
Un effetto genuinamente nuovo è invece rappresentato dalla comparsa del campo di
accelerazione Faµν – causato appunto dall’accelerazione della particella – che a grandi
distanze soppianta il campo di velocità. Nel prossimo paragrafo vedremo che è proprio
questo campo a causare il fenomeno dell’irraggiamento.
~ e B.
I campi E ~ Esplicitiamo ora i campi elettrico e magnetico corrispondenti alla

(6.99). Usando le (6.100)–(6.102), questi campi possono a loro volta essere suddivisi
in campi di velocità, indipendenti dall’accelerazione e proporzionali a 1/R2 , e in campi di
accelerazione, lineari nell’accelerazione e proporzionali a 1/R,

~ = E
E ~v + E
~ a,

~ = B
B ~v + B
~ a.

Esplicitiamo prima la quadriaccelerazione in termini dell’accelerazione spaziale ~a = d~v /dt0 ,

~a · ~v 1
wµ = 2 3/2
uµ + (0, ~a).
(1 − v ) (1 − v 2 )

Si vede allora che il termine proporzionale a uµ si cancella, quando wµ viene inserito in


[(um) wν − (wm) uν ]. Usando anche che,

1
(um) = √ (1 − ~v · m),
~
1 − v2

con calcoli elementari dalle (6.101), (6.102) si trova allora, ripristinando la velocità della
luce,
³ ´¡ ¢
v2 ~v
e 1 − c 2 m
~ − c
~v
E = ¡ ¢3 , ~v = m
B ~v,
~ ×E (6.107)
4πR 2 ~
v · m
~
1− c
£¡ ¢ ¤
~a e m ~ × m ~ − ~vc × ~a ~a = m ~ a,
E = ¡ ¢ , B ~ ×E (6.108)
4πc2 R ~ 3
1 − ~v·m c

che sono i campi di Lienard–Wiechert. Si badi che le quantità cinematiche ~y , ~v e ~a che


compaiono in queste formule sono valutate all’istante ritardato t0 (x), definito dalla (6.94).

196
Vediamo che in ogni punto i campi elettrico e magnetico sono ortogonali tra di loro, in
quanto si ha,
~ =m
B ~
~ × E.

~ v si vede poi che si può anche scrivere,


Data l’espressione particolare di E

~ v = ~v × E
B ~v.
c

Il campo magnetico di velocità è quindi soppresso di un fattore v/c rispetto al campo


elettrico di velocità, come nel caso del moto rettilineo uniforme, vedi (6.68). Viceversa,
i campi elettrico e magnetico di accelerazione sono invece uguali in modulo, in quanto si
ha,
m ~ a = 0,
~ ·E ~a = m
B ~ a,
~ ×E ~ a | = |E
|B ~ a |, (6.109)

relazioni che sfrutteremo nel prossimo paragrafo.


~ v , i campi E
Facciamo infine notare che rispetto al campo di velocità E ~a e B
~ a portano

un prefattore 1/c2 . I campi di accelerazione rappresentano quindi degli effetti prettamente


relativistici !
Andamenti asintotici in generale. Concludiamo questo paragrafo con una generaliz-
zazione importante. Grazie al fatto che la (6.47) è lineare nella corrente, gli andamenti
asintotici del campo (6.99) derivati sopra si estendono, infatti, automaticamente al campo
elettromagnetico generato da un arbitrario sistema di cariche puntiformi. In particolare
il campo si scriverà ancora come,

F µν = Fvµν + Faµν , (6.110)

dove a grandi distanze,


1 1
Fvµν ∼ , Faµν ∼ . (6.111)
r2 r
Per il campo totale si avrà quindi di nuovo,

1
F µν ∼ . (6.112)
r

A livello asintotico si possono generalizzare anche le (6.109), ricordando che per grandi r
si ha l’identificazione, vedi (6.103),
m
~ ≈ ~n,

197
dove il versore radiale ~n è indipendente dalle traiettorie delle particelle. Per un siste-
ma arbitrario di particelle dalle (6.109) – per linearità – si ottengono allora le relazioni
asintotiche,

~ a = 0,
~n · E ~ a = ~n × E
B ~ a, ~ a | = |E
|B ~ a |, per r → ∞. (6.113)

Ancora, siccome anche le correnti “macroscopiche” – come quelle corrispondenti agli elet-
troni in un’antenna o in un circuito elettrico – possono essere pensate come sovrapposizioni
delle correnti elementari delle cariche costituenti, gli andamenti asintotici (6.113) valgono
anche per i campi generati da tali correnti.

6.4.3 Emissione di radiazione da cariche accelerate

Ora che abbiamo un’espressione per il campo elettromagnetico prodotto da una particella
carica in moto arbitrario, possiamo chiederci sotto quali condizioni una particella cede o
assorbe energia o, più in generale, quadrimomento, attraverso questo campo. Non siamo
quindi interessati al quadrimomento che le particelle cedono al campo, ma piuttosto al
quadrimomento che il sistema campo + particelle cede all’“ambiente” – che è quello che
viene rivelato sperimentalmente. Con un abuso di linguaggio, che adotteremo anche noi,
si parla comunque di “quadrimomento emesso dalle particelle”.
Formula fondamentale per l’emissione di quadrimomento. Consideriamo dunque un ge-
nerico sistema di particelle cariche interagenti con il campo elettromagnetico. Come ab-
biamo visto, il trasporto di quadrimomento di un tale sistema è quantificato dal tensore
energia–impulso del solo campo elettromagnetico, vedi paragrafo 2.4.3,

µν 1 µν αβ
Tem = F µ α F αν + η F Fαβ .
4

In particolare, se consideriamo “positivo” il quadrimomento emesso – come d’ora in poi


faremo sempre – il quadrimomento emesso nell’unità di tempo da una superficie chiusa Γ
è dato da, vedi (2.81),
Z
dP µ µi
= Tem dΣi . (6.114)
dt Γ

Tuttavia, il quadrimomento che può essere considerato definitivamente ceduto dal sistema
all’ambiente, è solo quello che successivamente non viene riassorbito. Il quadrimomento

198
29
in questione è quindi quello che riesce a raggiungere l’infinito spaziale . Questo vuol
dire che nell’integrale in (6.114) dobbiamo scegliere per Γ una sfera di raggio r, e poi fare
~ = ~n r2 dΩ,
tendere r all’infinito. Scrivendo l’elemento di superficie della sfera come dΣ
dove dΩ è l’angolo solido, per il quadrimomento emesso nell’unità di tempo otteniamo
allora,
Z
dP µ
= r2 µi i
Tem n dΩ, r → ∞. (6.115)
dt
Da questa espressione possiamo infine selezionare il quadrimomento emesso nell’unità di
tempo e nell’unità di angolo solido, in direzione ~n,

d2 P µ ¡ µi i ¢
= r2 Tem n , r → ∞, (6.116)
dt dΩ

dove d’ora in poi il limite per r → ∞ sarà sempre sottinteso. La (6.116) costituisce la
formula fondamentale per l’analisi di tutti i fenomeni di irraggiamento. Si vede allora in
µi
particolare che, per valutare il quadrimomento emesso, è sufficiente selezionare da Tem i
contributi che vanno come 1/r2 ovverosia, dato che Tem
µν
è proporzionale a (F µν )2 , da F µν
quelli che vanno come 1/r. Ma visti gli andamenti asintotici (6.111), questo significa che
al membro di destra della (6.116) contribuisce solo il campo di accelerazione.
La doppia conclusione di questa analisi – completamente generale – è che al quadrimo-
mento emesso da un sistema di cariche contribuisce solo il campo di accelerazione, e che
per determinare il primo è sufficiente valutare il secondo a grandi distanze dalle cariche.
Emissione di energia. Consideriamo ora più in dettaglio l’emissione di energia. Per
l’energia P 0 ≡ ε emessa nell’unità di tempo e nell’unità di angolo solido, ovverosia, per la
potenza W = dε/dt emessa nell’unità di angolo solido, la componente zero della (6.116)
0i
fornisce, si ricordi che Tem = S i,

dW d2 ε ~ · ~n).
= = r2 (S (6.117)
dΩ dt dΩ

Ma per quanto concluso sopra, al vettore di Poynting contribuiscono solo i campi di


accelerazione,
~=E
S ~ ×B
~ → ~a × B
E ~ a,
29
A livello quantistico questo significa che consideriamo “emessi” solo quei fotoni che riescono a
raggiungere l’infinto, e non vengono successivamente risassorbiti dalle particelle.

199
e questi ultimi vanno inoltre valutati a grandi distanze. Possiamo allora usare le relazioni
asintotiche (6.113), per derivare la semplice formula,

~=E
S ~a × B
~a = E
~ a × (~n × E
~ a ) = ~n |E
~ a |2 . (6.118)

~ ha la stessa direzione e lo stesso verso di ~n, e ne segue che il flusso


Risulta, quindi, che S
di energia è sempre radiale uscente, verso l’infinito: l’energia viene quindi sempre emessa
dalle particelle, e mai assorbita ! Questa circostanza è una conseguenza diretta del fatto
che abbiamo utilizzato il kernel ritardato Gret ; se avessimo usato il kernel avanzato Gadv ,
il flusso di energia sarebbe stato invece sempre entrante dall’infinito.
Se inseriamo la (6.118) nella (6.117) vediamo che la potenza emessa dipende in modo
semplice dal modulo del campo elettrico di accelerazione, valutato a grandi distanze dalla
particella,
dW ~ a |2 ,
= c r 2 |E (6.119)
dΩ
~ a decade come 1/r,
dove abbiamo ripristinato la velocità della luce. Grazie al fatto che E
~ a | = |E
la potenza emessa sarà in particolare sempre finita. Inoltre, siccome |B ~ a | abbiamo,

W =0 ⇔ Faµν = 0.

La presenza o assenza di energia emessa costituisce quindi un fenomeno Lorentz invarian-


te, cioè, indipendente dal sistema di riferimento. In presenza di una singola particella
abbiamo inoltre, vedi la (6.102) e il problema 6.2,

Faµν = 0 ⇔ wµ = 0.

La presenza o assenza di energia emessa è quindi legata inscindibilmente all’accelerazione


della particella.
Il campo di accelerazione come campo di radiazione. Possiamo infine cercare di met-
tere in relazione il campo di accelerazione Faµν , con i “campi di radiazione” – le soluzioni
dell’equazione di Maxwell nel vuoto, che abbiamo studiato nel capitolo precedente. A
questo proposito notiamo che nel complemento della linea di universo, il campo totale
(6.100) soddisfa evidentemente le equazioni di un campo di radiazione,

∂µ F µν = 0 = ∂[µ Fνρ] .

200
Ma dato che F µν = Fvµν + Faµν , e che Fvµν decade come 1/r2 , ne segue che Faµν (che di per
sè decade solo come 1/r) soddisfa queste equazioni asintoticamente, vale a dire modulo
termini 1/r2 , µ ¶ µ ¶
1 1
∂µ Faµν =o , ∂[µ Fa νρ] = o .
r2 r2
Ci aspettiamo allora che a grandi distanze dalla particella il campo di accelerazione si
comporti come un campo di radiazione, e che risulti in particolare sovrapposizone di on-
de piane. Dalla formula del vettore di Poynting (6.118) – formalmente identico a quello
delle onde piane (5.76) – si desume allora che le onde che compongono Faµν si propagano
necessariamente lungo la direzione radiale uscente. Siamo quindi portati a concludere che
l’energia emessa (6.119) viaggia asintoticamente a cavallo di un campo di radiazione, che
è composto da onde elettromagnetiche che si propagano in direzione radiale. Nel prossi-
mo capitolo renderemo questa affermazione precisa, analizzando in dettaglio le proprietà
asintotiche di un generico campo di accelerazione Faµν . Per le caratteristiche appena de-
scritte, il campo di accelerazione viene spesso anche chiamato semplicemente “campo di
radiazione”.
In conclusione, una carica accelerata cede energia e quantità di moto attraverso il suo
campo di radiazione, liberando onde elettromagnetiche che le trasportano fino all’infinito.

6.4.4 Limite non relativistico e formula di Larmor

Per illustrare il significato delle formule del paragrafo precedente determiniamo la potenza
totale emessa da una particella carica accelerata in tutte le direzioni,
Z
dW
W= dΩ, (6.120)
dΩ

nel limite non relativistico. Per essere precisi, vogliamo valutare questa potenza all’ordine
più basso in 1/c che, come vedremo, corrisponde a W ∼ 1/c3 .
Data la (6.119) si tratta dunque di valutare il campo elettrico di accelerazione all’ordine
più basso in 1/c. Siccome questo campo porta un prefattore 1/c2 , nella (6.108) possiamo
allora trascurare i fattori v/c, ottenendo,

~a = e ~ a |2 = ~ × ~a|2
e2 | m
E m
~ × (m
~ × ~a), |E . (6.121)
4πR c2 16 π 2 R2 c4

201
La validità di questa approssimazione richiede dunque in particolare che la particella si
muova con velocità piccola rispetto alla velocità della luce,

v ¿ c,

come c’era da aspettarsi. Per determinare la distribuzione angolare della potenza emessa
~ a asintoticamente, a grandi distanze dalla particella,
(6.119) dobbiamo inoltre valutare E
per cui secondo le (6.103) si ha R → r e m
~ → ~n. La (6.119) diventa allora,
dW e2
= 2 3
|~n × ~a|2 . (6.122)
dΩ 16 π c
La potenza emessa nell’unità di angolo solido è quindi quadratica nell’accelerazione della
particella, ma esibisce anche una dipendenza esplicita dalla direzione ~n in cui si osserva
la radiazione.
Il ritardo asintotico. Prima di poter determinare la potenza totale integrando la (6.122)
sull’angolo solido, occorre fare una precisazione sull’interpretazione di questa formula in
relazione alla propagazione causale della radiazione. Questa formula dà, infatti, l’energia
emessa dalla particella nell’unità di tempo e nell’unità di angolo solido in direzione ~n
– rivelata all’istante t a una distanza r molto grande dalla particella, e il membro di
dW
sinstra della (6.122) andrebbe quindi scritto meglio come dΩ
(t, r, ~n). L’accelerazione che
compare al membro di destra della formula è, invece, valutata all’istante ritardato t0 (t, ~x),
determinato dalla relazione (6.94),
1
t − t0 = |~x − ~y (t0 )|. (6.123)
c
Anche questa relazione va valutata asintoticamente, per punti di osservazione ~x molto
lontani dalla traiettoria della particella. Supponiamo allora che la particella sia confinata
alla sfera SD , di raggio D e centro nell’origine: |~y (t)| < D, ∀ t, e scegliamo r = |~x| À D.
Ricordando che ~n = ~x/r abbiamo allora lo sviluppo,
¯ ¯ r
¯ ~
y (t0 ¯
) 0 2 0
|~x − ~y (t )| = r ¯¯~n −
0 ¯ = r 1 − 2 ~n · ~y (t ) + y (t )
r ¯ r r2
µ µ ¶¶ µ ¶
~n · ~y (t0 ) 1 0 1
= r 1− +o 2 = r − ~n · ~y (t ) + o , (6.124)
r r r
e si ottiene per la versione asintotica della (6.123),
r ~n · ~y (t0 ) ~n · ~y (t0 )
t0 = t − + ≡T+ . (6.125)
c c c
202
La (6.122) si scrive quindi più precisamente,

dW e2 2
(t, r, ~n) = 2 3
|~n × ~a(t0 )| , (6.126)
dΩ 16 π c

dove la funzione t0 = t0 (t, ~x) è definita dalla relazione implicita (6.125).


Vediamo che il tempo ritardato (6.125) è composto da un termine “macroscopico”,
T = t − rc , e da un contributo “microscopico”, ~n · ~y (t0 )/c. Il primo rappresenta l’istante
(ritardato) in cui la radiazione deve lasciare il centro di SD , per giungere all’istante t
nel punto di rivelazione ~x. Questo istante è indipendente dal moto della particella e
dalla direzione di osservazione ~n. Il termine microscopico rappresenta invece un ritardo
aggiuntivo causato dal moto ~y (t) della particella all’interno di SD , e dipende da ~n. Siccome
questo termine è inoltre soppresso di un fattore 1/c, nel limite non relativistico esso potrà
essere trascurato, vedi sotto.
Il membro di destra della (6.126) esibisce quindi una dipendenza esplicita da ~n, e una
implicita attraverso t0 . Di conseguenza l’integrale sugli angoli nella (6.120) in generale
non può essere eseguito analiticamente. Possiamo comunque risolvere iterativamente la
(6.125) attraverso uno sviluppo non relativistico in potenze di 1/c,
µ ¶
0 ~n · ~y (T ) (~n · ~y (T ))(~n · ~v (T )) 1
t =T+ + 2
+ 3 .
c c c

che porta a, µ ¶
0 ~n · ~y (T ) ˙ 1
~a(t ) = ~a(T ) + ~a(T ) + . (6.127)
c c2
Tuttavia, dato che la (6.126) è stata ottenuta trascurando nella (6.108) i fattori v/c,
per consistenza anche nella (6.127) dobbiamo omettere i termini di ordine 1/c, e tenere
quindi solo il contributo di ordine zero ~a(T ), che equivale a porre t0 = T . In questo limite
si trascura quindi, in particolare, il ritardo microscopico. In conclusione, nel limite non
relativistico la radiazione che viene rivelata a un istante t a una distanza r dalla particella,
viene considerata emessa dalla particella all’istante ritardato T = t − rc , e quindi l’energia
emessa corrisponente (6.126) deve dipendere dal valore dell’accelerazione ~a(T ) allo stesso
istante.
Nello sviluppo (6.127) i termini di ordine 1/c e successivi rappresentano, invece, corre-
zioni relativistiche di ordine superiore. Per una trattazione sistematica degli sviluppi non

203
relativistici rimandiamo alla sezione 7.3, dove faremo in particolare vedere che, affinchè il
ritardo microscopico possa essere trascurato, è necessario che le particelle si muovano con
velocità piccole rispetto alla velocità della luce.
Formula di Larmor. Nell’approssimazione non relativistica l’accelerazione ~a(T ) ≡ ~a
nella (6.126) risulta indipendente dagli angoli, e la potenza totale (6.120) può allora essere
valutata esplicitamente. Per fare questo è sufficiente scegliere come asse z la direzione di
~a, e usare le relazioni,

|~n × ~a|2 = | ~a |2 sen2 ϑ, dΩ = senϑ dϑ dϕ.

Risulta allora,
Z 2π Z π
e2 | ~a |2
W= dϕ sen3 ϑ dϑ.
16 π 2 c3 0 0

Svolgendo gli integrali si ottiene una formula semplice per la potenza totale emessa da
una particella non relativistica, con carica e e accelerazione ~a,
e2 | ~a |2
W= , (6.128)
6π c3
che è la nota formula di Larmor (1897). Insistiamo sul fatto che in questa formula la
potenza W(t, r) rivelata a un istante t a una distanza r dalla particella, coinvolge al
membro di destra l’accelerazione valutata all’istante t − rc . Proprio perché la radiazione
si propaga con velocità c, la formula può allora anche essere interpretata dicendo che, se
a un dato istante la particella possiede l’accelerazione ~a, in quell’istante essa emette la
potenza e2 |~a|2 /6πc3 . Torneremo su questo punto in sezione 9.1, dove discuteremo la gene-
ralizzazione relativistica della (6.128). Le conseguenze fenomenologiche della formula di
Larmor saranno invece analizzate nel prossimo capitolo, dove la rideriveremo nell’ambito
di un approccio più sistematico.

6.5 Problemi

6.1 Si dimostri che la funzione di Green ritardata (6.43) definisce una distribuzione in
S 0 (R4 ).

6.2 Si dimostri che il campo Faµν asintotico dato in (6.102) è nullo in ogni direzione ~n,
se e solo se wµ = 0. [Sugg.: può essere utile usare il sistema a riposo istantaneo.]

204
6.3 Si consideri una particella di carica e che si muove con velocità v costante lungo
l’asse z, nel sistema di riferimento del laboratorio K. Si consideri che nel sistema di
riferimento K 0 , dove la particella è a riposo in ~x 0 = 0, il quadripotenziale vale,

e
A0µ (x0 ) = (1, 0, 0, 0).
4π|~x 0 |

a) Si determini la trasformazione di Lorentz Λµ ν che connette un evento in K con l’evento


corrispondente in K 0 .
b) Si determini il potenziale Aµ (x) in K sfruttando il fatto che esso è un quadrivettore, e
si confronti il risultato con la (6.63).

6.4 Si verifichi che i campi elettrico e magnetico di una particella priva di massa soddi-
sfano le equazioni (6.82), dimostrando in particolare che in due dimensioni vale l’identità
distribuzionale,
~ · ~x = 2π δ 2 (~x),

r2
p
dove ~x ≡ (x, y) e r = x2 + y 2 .
Se ne deduca che la funzione di Green del laplaciano bidimensionale è data dal
logaritmo, µ ¶ µ ¶
1 1 p
2
∇ ln r = (∂x2 + ∂y2 ) ln x2 + y 2 = δ 2 (~x).
2π 2π

205
7 Irraggiamento

Con “irraggiamento” si intende genericamente il fenomeno dell’emissione di radiazione


da parte di un generico sistema carico. Nel capitolo precedente abbiamo derivato un’e-
spressione esatta per il campo elettromagnetico generato da una particella carica in moto
arbitrario. Abbiamo visto che se la particella è accelerata, allora essa genera un campo di
accelerazione che a grandi distanze decade come 1/r e che trasporta energia e quantità di
moto. Abbiamo anche constatato che l’analisi quantitativa della radiazione, e in partico-
lare la determinazione del quadrimomento emesso, in realtà non richiedono la conoscenza
dei campi di Lienard–Wiechert esatti, ma solo della loro forma asintotica.
Nel presente capitolo vogliamo eseguire un’analisi sistematica della radiazione emessa
da un arbitrario sistema carico, rappresentato da una quadricorrente j µ generica. Siccome
a livello microscopico qualsiasi sistema carico può essere pensato come composto da un
insieme di particelle cariche puntiformi, il suo campo a grandi distanze decade ancora
come 1/r, e per analizzare la radiazione emessa è di nuovo sufficiente determinare il suo
andamanto asintotico. Uno degli scopi principali di questo capitolo sarà in particolare la
determinazione del quadrimomento emesso dal sistema nell’unità di tempo, vedi (6.116),

d2 P µ ¡ µi i ¢
= r2 Tem n . (7.1)
dt dΩ

Siccome al membro di destra di questa formula contribuiscono solo i campi F µν che a


grandi distanze decadono come 1/r, per valutare il quadrimomento emesso è allora suffi-
ciente selezionare anche dal quadripotenziale Aµ di (6.48) i contributi che vanno come 1/r.
La prossima sezione sarà dunque dedicata a un’analisi sistematica del quadripotenziale a
grandi distanze dal sistema carico, ovvero nella “zona della onde”.
Decomposizione spettrale della corrente. Concludiamo questa premessa con una speci-
ficazione sulla natura delle correnti che considereremo. In primo luogo queste dovranno
certamente essere conservate, ∂µ j µ = 0. Le correnti che compaiono nella realtà fisica si
suddividono poi naturalmente in due categoria a seconda della loro dipendenza dal tem-
po, correnti aperiodiche e correnti periodiche. Nel primo caso la corrente ammette una
trasformata di Fourier nella sola variabile temporale, ovvero, ammette la “decomposizione

206
spettrale”,
Z ∞
µ 1
j (t, ~x) = √ dω eiωt j µ (ω, ~x), (7.2)
2π −∞

dove la trasformata j µ (ω, ~x) rappresenta il “peso continuo” con cui la frequenza ω compare
nella corrente. Siccome la corrente è reale questi pesi devono soddisfare la condizione di
realtà,
j µ∗ (ω, ~x) = j µ (−ω, ~x),

a causa della quale in seguito le frequenze saranno considerate sempre positive. Esempi
di processi che corrispondono a correnti aperiodiche sono gli urti elastici tra particelle
cariche, o il passaggio di una particella carica attraverso una zona limitata con un campo
elettromagnetico non nullo.
Se la corrente è invece periodica nel tempo con periodo T – come la corrente macro-
scopica in un’antenna, o quella dovuta a una particella carica in un ciclotrone – allora la
30
decomposizione (7.2) viene sostituita dalla serie di Fourier ,

X
µ µ µ∗ µ
j (t, ~x) = eiN ω0 t jN (~x), jN (~x) = j−N (~x), (7.3)
N =−∞

2π µ
dove ω0 = T
è la frequenza fondamentale. In questo caso jN (~x) rappresenta il “peso
discreto” con cui la frequenza,
ωN = N ω 0 ,

compare nella corrente.


In seguito considereremo anche “sorgenti monocromatiche” corrispondenti a correnti
con frequenza fissata, del tipo,

j µ (t, ~x) = eiωt j µ (ω, ~x) + c.c. (7.4)

Qualsiasi sorgente potrà quindi essere pensata come sovrapposizione – discreta o continua
– di sorgenti monocromatiche. La denominazione “frequenza” per la variabile duale ω
30
In realtà la (7.3) può essere riguardata come un caso particolare della (7.2), se si pone,

X
µ
√ µ
j (ω, ~x) = 2π δ(ω − ωN )jN (~x).
N =−∞

207
deriva dal fatto che, come vedremo, una sorgente monocromatica genera un campo elet-
tromagnetico che nella zona delle onde assume la forma di un’onda piana monocromatica,
con la stessa frequenza ω della sorgente.

7.1 Il campo elettromagnetico nella zona delle onde

In questa sezione considereremo una generica corrente a supporto spaziale compatto. Sce-
gliendo opportunamente l’origine spaziale del sistema di riferimento, il suo supporto
spaziale sarà allora contenuto in una palla di raggio R e avremo,

j µ (t, ~x) = 0, per |~x| > R, ∀ t.

La limitazione a correnti siffatte trova la sua motivazione fisica nel fatto che le distribuzioni
di carica realizzabili in natura sono necessariamente confinate a una regione limitata.
Il potenziale nella zona delle onde. Definiamo come “zona delle onde” la regione lon-
31
tana dalle cariche, ovvero la regione spaziale ,

|~x| ≡ r À R. (7.6)

Per i motivi detti valutiamo ora il quadripotenziale esatto (6.48),


Z
µ 1 1
A (x) = d3 y j µ (t − |~x − ~y |, ~y ), (7.7)
4π |~x − ~y |

nella zona delle onde, arrestandoci ai termini di ordine 1/r. Siccome la corrente nell’in-
tegrando è nulla per |~y | > R, l’integrale in d3 y può essere ristretto ai valori di ~y per cui
|~y | ≤ R. In base alla (7.6) abbiamo allora,

|~x| À |~y |.
31
Come “zona delle onde” si definisce spesso la regione degli r che oltre alla (7.6) soddisfano anche,

R2
r À λ, rÀ , (7.5)
λ
dove λ = 2π/ω è la lunghezza d’onda, e ω indica la generica frequenza presente nella corrente (7.2). Se r
soddisfa queste relazioni ulteriori, allora le formule (7.9) e (7.10) mantengono la loro validità anche per
valori finiti di r, e non solo asintoticamente. Per esempio, per arrivare alla (7.9) nell’argomento temporale
della corrente in (7.7) abbiamo trascurato un termine o(y 2 /r), vedi (7.8), che nello sviluppo della corrente
darebbe luogo a un contributo del tipo (y 2 /r)∂0 j µ . Considerando la componente monocromatica (7.4)
schematicamente si ha ∂0 j µ ' iωj µ , e quindi questo termine è trascurabile se ωy 2 /r < ωR2 /r ¿ 1, che
equivale alla seconda condizione in (7.5).

208
Introducendo il versore radiale ~n = ~x/r abbiamo allora gli sviluppi, vedi (6.124),
r µ ¶
~n · ~y y 2 1
|~x − ~y | = r 1 − 2 + 2 = r − ~n · ~y + o , (7.8)
r r r
µ ¶
1 1 1
= +o 2 .
|~x − ~y | r r
Inserendo queste espansioni in (7.7) si ottiene il potenziale nella zona delle onde,
Z µ ¶
µ 1 3 µ 1
A (x) = d y j (t − r + ~n · ~y , ~y ) + o . (7.9)
4πr r2
In seguito trascureremo i termini di ordine 1/r2 , in quanto siamo interessati solo al termine
leading – che è di ordine 1/r come anticipato. Si noti in particolare che l’integrale che
moltiplica il fattore 1/4πr dipende, oltre che da ~x, anche dal tempo. Di conseguenza il
potenziale (7.9) darà luogo a un campo F µν che a grandi distanze decade ancora come 1/r,
vedi sotto, corrispondente appunto a un campo di accelerazione. Per confronto ricordiamo
che anche il potenziale coulombiano statico è proporzionale a 1/r, ma che in quel caso il
coefficiente di proporzionalità è indipendente dal tempo e il campo corrispondente decade
allora come 1/r2 , e non come 1/r.
Notiamo poi nella (7.9) la comparsa del tempo ritardato “macroscopico” T = t − r,
che tiene conto del tempo che il campo elettromagnetico impiega per raggiungere il punto
di osservazione, a partire dal centro della palla contenente le cariche. Il termine ~n · ~y
tiene invece conto del ritardo “microscopico” delle cariche individuali, a seconda della
loro posizione all’interno della palla.
Le relazioni delle onde. Le proprietà principali del campo elettromagnetico nella zona
della onde, derivato dal potenziale (7.9), seguono dalle relazioni delle onde (5.63),

∂µ Aν = nµ Ȧν , nµ Ȧµ = 0, nµ nµ = 0, (7.10)

relazioni che ora dimostreremo essere valide anche per il potenziale (7.9), modulo ter-
mini di ordine 1/r2 . Cominciamo definendo il “quadrivettore” nullo nµ = (n0 , ~n) con
componenti,
~x
n0 = 1, ~n = , n2 = 0.
r
Calcoliamo poi le derivate rispetto a t e xi dell’integrando della (7.9)
1 µ
j (t − r + ~n · ~y , ~y ),
r
209
tralasciando di scrivere esplicitamente gli argomenti,
µ ¶
1 ν 1
∂0 j = ∂0 j ν ,
r r
µ ¶ µ ¶
1 ν xi ν 1
∂i j = − 2 ∂0 j + o 2 .
r r r
Modulo termini di ordine 1/r2 queste relazioni equivalgono a,
µ ¶ µ ¶
1 ν 1 ν
∂µ j = n µ ∂0 j .
r r
Dalla (7.9) si ottiene allora,
Z µ ¶ Z µ ¶ Z
ν 1 3 1 ν 1 3 1 ν 1
∂µ A = d y ∂µ j = d y nµ ∂0 j = n µ ∂0 d3 y j ν = nµ ∂0 Aν ,
4π r 4π r 4πr
che è la prima relazione in (7.10). La seconda è conseguenza del fatto che il potenziale
per costruzione soddisfa la gauge di Lorentz, ∂µ Aµ = 0.
Una volta appurato che valgono le (7.10), concludiamo che il campo elettromagnetico
nella zona delle onde condivide con le onde piane le proprietà (5.77)–(5.79),
h i
E~ = −A ~˙ + (~n · A
~˙ ) ~n = ~n × ~n × A
~˙ , (7.11)
~ = ~n × E,
B ~ ~ = 0,
~n · E ~ = |B|,
|E| ~ (7.12)
¯ ¯2
µν ¯ ~˙ ¯¯ = nµ nν |E|
~ 2,
Tem = nµ nν (Ȧi Ȧj ) Λij = nµ nν ¯~n × A Λij ≡ δ ij − ni nj . (7.13)

In particolare i campi elettrico e magnetico sono ortogonali tra di loro, e la direzione di


propagazione del campo è la radiale uscente ~n. Infatti, dalle (7.12) segue che il vettore di
Poynting è parallelo e concorde a ~n,

~=E
S ~ ×B
~ = ~n |E|
~ 2. (7.14)

Le relazioni (7.12) e (7.14) generalizzano in particolare le formule asintotiche (6.113) e


(6.118) – valide per il campo asintotico di un sistema di particelle puntiformi – al caso di
una corrente generica. Dalla (7.9) segue inoltre l’andamento asintotico,
1
Ȧµ ∼ ,
r
e le (7.11), (7.12) comportano allora per il campo elettromagnetico l’andamento asintotico
previsto, F µν ∼ 1/r.
Notiamo infine che la valutazione esplicita delle formule (7.11)–(7.13) richiede solo la
~ del quadrivettore (7.9).
conoscenza della parte spaziale A

210
7.1.1 Emissione di quadrimomento

Inserendo la formula per il tensore energia–impulso asintotico (7.13) nella (7.1) otte-
niamo un’espressione compatta per la distribuzione angolare del quadrimomento emesso
nell’unità di tempo,
d2 P µ ~ 2.
= r2 nµ |E| (7.15)
dt dΩ
Per calcolare invece il quadrimomento emesso nell’unità di tempo in tutte le direzioni,
occorre integrare il membro di destra della (7.15) sull’angolo solido totale,
Z
dP µ ~ 2.
= r2 dΩ nµ |E| (7.16)
dt

Per processi di radiazione transitori, ovvero processi originati da cariche che sono accele-
rate solo per un intervallo finito di tempo, sarà finito anche il quadrimomento emesso in
direzione ~n nell’unità di angolo solido, durante l’intero processo,
Z ∞
dP µ ~ 2 dt.
= r 2 nµ |E|
dΩ −∞


Indicando come al solito la potenza emessa con = W, le componenti temporale e
dt
spaziali della (7.15) si scrivono, vedi (7.11),

d2 ε dW ~ 2 = r2 (Ȧi Ȧj Λij ),


= = r2 |E| Λij ≡ δ ij − ni nj , (7.17)
dt dΩ dΩ
d2 P~ dW
= ~n. (7.18)
dt dΩ dΩ

Si noti in particolare la compensazione delle potenze di r nella (7.17), una volta inserita
la (7.9). Si vede che per il campo elettromagnetico nella zona delle onde, 1) il flusso di
quantità di moto è determinato localmente dal flusso di energia e, 2) la quantità di moto
e l’energia soddisfano localmente le relazioni,

∆P~ = ~n ∆ε, (∆ε)2 − |∆P~ |2 = 0, (7.19)

come nel caso delle onde piane. Siccome a livello quantistico il fenomeno dell’irraggia-
mento corrisponde all’emissione di fotoni, le (7.19) indicano allora che queste particelle
sono prive di massa, e che si propagano in direzione radiale. Torneremo su alcuni aspetti
quantistici della radiazione nel capitolo 10.

211
Il risultato più importante di questo paragrafo è la relazione (7.17), in quanto punto
di partenza per l’analisi energetica di tutti i fenomeni di radiazione: essa permette di
determinare la distribuzione angolare e temporale della radiazione emessa da una generica
corrente j µ , una volta valutata la parte spaziale del potenziale vettore attraverso la (7.9).

7.1.2 Sorgenti monocromatiche e onde piane

Abbiamo appena constatato che il campo elettromagnetico nella zona delle onde possiede
molte delle proprietà delle onde piane. Questo fatto chiaramente non è casuale perché,
essendo j µ (t, ~x) = 0 per |~x| > R, al di fuori della palla di raggio R il campo è un campo
libero. Pur non essendo libero in tutto lo spazio, la sua forma si avvicinerà tanto più a
quella di un campo libero in tutto lo spazio, quanto più ci allontaniamo dalla sorgente.
C’è allora da aspettarsi che nella zona delle onde il campo elettromagnetico risulti con
buona approssimazione una sovrapposizione di onde piane, e non stupisce che esso erediti
le loro proprietà più salienti. Tuttavia, è altrettanto chiaro che in generale questo campo
non sarà costituito da una singola onda piana monocromatica.
Per decomporre il campo nella zona delle onde in onde elementari, sfruttiamo la li-
nearità in j µ del potenziale vettore (7.9), e utilizziamo le decomposizioni spettrali del-
la corrente (7.2) e (7.3). Considerando una singola frequenza ω inseriamo la sorgente
monocromatica (7.4) nella (7.9),
Z
µ 1
A (x) = d3 y eiω(t−r+~n·~y) j µ (ω, ~y ) + c.c.
4πr
Z
1 iω(t−r)
= e d3 y eiω(~n·~y) j µ (ω, ~y ) + c.c.
4πr
≡ εµ eik·x + c.c. (7.20)

Abbiamo definito il vettore d’onda k µ con componenti,

k 0 = ω, ~k = ω ~n,

soddisfacente,
k 2 = 0, k · x = k µ xµ = ω(t − r),

e il vettore di polarizzazione,
Z
µ 1
ε = d3 y eiω(~n·~y) j µ (ω, ~y ). (7.21)
4πr

212
Vediamo allora che una sorgente monocromatica genera un campo che nella zona delle
onde si riduce formalmente a un’onda piana, con i vettori d’onda e di polarizzazione
indicati. In particolare, una corrente di frequenza ω genera un’onda della stessa frequenza.
Onde piane e onde sferiche. Tuttavia, la (7.20) non costituisce un’onda piana vera
e propria, perché sia il vettore d’onda, sia il vettore di polarizzazione esibiscono una
dipendenza residua dalla posizione ~x = ~n r. In particolare il vettore di polarizzazione porta
il prefattore 1/r, la cui presenza è tra l’altro richiesta dalla conservazione dell’energia.
Infatti, scrivendo il vettore di Poynting mediato nel tempo associato all’onda (7.20) si ha,
vedi il problema 5.6,
~ = −2 ~n ω 2 ε∗µ εµ ,
S

~ è proporzionale a 1/r2 . Di conseguenza l’energia che attraversa la sezione


e si vede che S
di un cono di apertura angolare dΩ nell’unità di tempo,

~ · (~n r2 dΩ),
S

è indipendente da r. L’energia fluisce quindi verso l’infinito, conservandosi. La polariz-


zazione εµ dipende poi anche dalla direzione ~n, attraverso l’esponenziale nell’integrando
della (7.21). Per queste particolari dipendenze da r e ~n il potenziale (7.20) corrisponde,
propriamente parlando, a una sovrapposizione di “onde sferiche”, vedi il testo di J.D.
32
Jackson , piuttosto che a un’onda piana.
Tuttavia, in una regione con estensioni spaziali L piccole rispetto a r,

L ¿ r,

i vettori k µ e εµ risultano praticamente costanti, e localmente la (7.20) appare quindi


come un’onda piana. Infatti, all’interno di una regione di questo tipo le variazioni relative
di r e ~n sono limitate da,
∆r L L
< , |∆~n| < ,
r r r
e la variazione relativa di ~k equivale allora a,

|∆~k| L
= |∆~n| < ¿ 1.
ω r
32
J.D. Jackson, Classical Electrodynamics, 3a edizione, Wiley & Sons, New York, 1998.

213
Per quanto riguarda invece la variazione del vettore di polarizzazione, dalla (7.21) si ricava,
Z µ ¶
µ 1 3 ∆r
∆ε = dy − + i ω (∆~n · ~y ) eiω(~n·~y) j µ (ω, ~y ).
4πr r
Considerando che |~y | < R abbiamo,
¯ ¯
¯ ∆r ¯ L L
¯− ¯
¯ r + i ω (∆~n · ~y )¯ < r + ωR |∆~n| < (1 + ωR) r .

Siccome per sistemi microscopici ωR corrisponde alla velocità delle cariche nella corrente,
vedi la prossima sezione, anche la variazione relativa di εµ è allora dell’ordine di L/r ¿ 1.
Se a titolo di esempio consideriamo la radiazione emessa dal sole e osservata sulla terra,
r corrisponde alla distanza terra–sole, r = 1.5 · 108 km, mentre L è il diametro della terra,
L = 1.2 · 104 km. Sulla superficie della terra il vettore d’onda e il vettore di polarizzazione
sono quindi soggetti a variazioni relative molto piccole, dell’ordine di L/r ∼ 10−4 , e la
radiazione osservata risulta in pratica composta da onde piane.
Sorgenti generiche. Data la linearità della (7.9), questi risultati si estendono diretta-
mente alle generiche quadricorrenti (7.2) e (7.3). Nel caso generale il campo elettroma-
gnetico nella zona delle onde risulta dunque – localmente – sovrapposizione di onde piane
monocromatiche, e le frequenze presenti nella radiazione sono un sottoinsieme di quelle
presenti nella corrente. Può, infatti, succedere che l’integrale nella (7.21) sia zero.
In particolare, a un arbitrario sistema di cariche che eseguono un moto periodico di
periodo T , corrisponde una corrente periodica del tipo (7.3), e sistemi siffatti emettono
quindi radiazione con frequenze appartenenti all’insieme,

ωN = N ω0 , N = 1, 2, 3 · · · .

Viceversa, a un sistema di particelle che seguono orbite aperte corrisponde una corrente
aperiodica del tipo (7.2), e un tale sistema di cariche emette quindi radiazione con uno
spettro continuo di frequenze.

7.2 La radiazione dell’antenna lineare

Dalle formule derivate nella sezione precedente si vede che il calcolo del quadrimomento
~ nella zona delle onde. Sfortu-
emesso richiede la valutazione del potenziale spaziale A
natamente l’integrale che compare nella (7.9) raramente può essere eseguito in modo

214
esatto, ed in generale è necessario ricorrere a un approccio perturbativo, come per esem-
pio lo sviluppo in multipoli che presenteremo nella prossima sezione. Uno dei rari casi
in cui l’integrale nella (7.9) può essere valutato esattamente è quello dell’antenna lineare,
alimentata al centro.
Senza entrare nei dettagli diamo la forma della densità di corrente spaziale in un’an-
tenna lineare di lunghezza L disposta lungo l’asse z, alimentata al centro da un generatore
di frequenza ω,

~j(t, ~y ) = I δ(y1 ) δ(y2 ) sen(ω(L/2 − |y3 |)) cos(ωt) ~u, (7.22)


I0
I ≡ . (7.23)
sen(ωL/2)

È sottinteso che ~j = 0 per |y 3 | ≥ L/2. Si vede che la corrente si annulla al bordo,


per y 3 = ±L/2, mentre per ogni t fissato essa è massima al “gap”, ovvero in y 3 = 0,
che è il punto in cui viene alimentata. I0 ha le dimensioni di una corrente, nel senso di
carica per unità di tempo, e corrisponde alla corrente al gap. ~u = (0, 0, 1) è il versore
lungo z. Confrontando con la (7.4) vediamo in particolare che la (7.22) è una corrente
monocromatica, e quindi essa emette radiazione monocromatica di frequenza ω e lunghezza
d’onda λ = 2π/ω.
Per determinare il potenziale nella zona delle onde inseriamo la (7.22) nella (7.9),
Z L/2 Z Z
~ ~x) = I~u
A(t, dy 3
dy 1
dy 2 δ(y 1 ) δ(y 2 ) sen(ω(L/2 − |y 3 |)) cos(ω(t − r + ~n · ~y )).
4πr −L/2

Possiamo integrare le funzioni δ in y 1 e y 2 , sostituendo ~n · ~y = n1 y 1 + n2 y 2 + n3 y 3 con


n3 y 3 = cosϑ y 3 , dove ϑ è l’angolo tra ~n e l’asse z. Si ottiene cosı̀,
Z L/2
~ ~x) = I~u
A(t, dy 3 sen(ω(L/2 − |y 3 |)) cos(ω(t − r + cos ϑ y 3 )).
4πr −L/2

L’integrazione rimanente su y 3 è elementare e porta a,


µ µ ¶ ¶
~ I cos(ω(t − r)) ωL ωL
A(t, ~x) = cos cosϑ − cos ~u. (7.24)
2πr ω sen2 ϑ 2 2

~˙ Dalle
Il potenziale vettore è quindi in ogni punto parallelo all’asse z, cosı̀ come lo è A.
(7.11) vediamo allora che il campo elettrico giace sempre nel piano individuato dall’asse
z e da ~n, essendo ortogonale a ~n.

215
La distribuzione angolare della potenza emessa si ottiene invece derivando la (7.24)
rispetto al tempo, e inserendo l’espressione risultante nella (7.17). Sfruttando il fatto che
~˙ è diretto lungo l’asse z risulta,
A

dW ¯ ¯2
¯ ~˙ ¯
= r2 (Ȧi Ȧj Λij ) = r2 ¯A ¯ sen2 ϑ. (7.25)
dΩ

La derivata temporale della (7.24) equivale alla sostituzione,

cos(ω(t − r)) → −ω sen(ω(t − r)).

Eseguendo inoltre la media temporale della (7.25) dobbiamo effettuare la sostituzione,

sen2 (ω(t − r)) → 1/2.

In definitiva otteniamo per la distribuzione angolare della potenza media emessa dall’an-
33
tenna lineare l’espressione ,
¯ ¯
dW I2 ¯ cos ¡ ωL cosϑ¢ − cos ωL ¯2
¯ 2 ¯
= 02 ¯ 2
ωL ¯ . (7.26)
dΩ 8π ¯ sen( 2 ) senϑ ¯

Da questa formula si vede che l’esistenza di direzioni in cui dW/dΩ è massima o minima
dipende fortemente dai valori del rapporto,

ωL πL
= .
2 λ

Invece di eseguire un’analisi sistematica della distribuzione angolare (7.26), di seguito ci


limiteremo a considerare qualche caso particolare. Vediamo comumque che dW/dΩ è
sempre nulla per ϑ = 0, cioè, lungo la direzione dell’antenna, mentre ha un massimo per
ϑ = π/2, cioè nel piano ortogonale all’antenna, a patto che sia L/λ 6= 2 n con n intero.
Inoltre si può vedere facilmente che se L ≤ λ allora la potenza non ha altri estremali,
mentre se L > λ allora esistono ulteriori direzioni in cui essa è massima o nulla.
Qualitativamente possiamo dividere le antenne in due categorie, antenne “lunghe”
corrispondenti a L ' λ, e antenne “corte” corrispondenti a L ¿ λ. Tratteremo le
ultime in dettaglio nel paragrafo 7.3.3 nell’ambito dell’approssimazione di dipolo, mentre
di seguito consideriamo un tipico esempio di antenna lunga.
33
Si noti che per L = n λ, con n intero, la normalizzazione di I nella (7.23) deve essere cambiata.

216
Antenne lunghe. Casi particolarmente interessanti di antenne lunghe sono le antenne
a “mezz’onda” di lunghezza L = λ/2, e quelle a “onda intera” di lunghezza L = λ.
Consideriamo a titolo d’esempio un’antenna a mezz’onda, per cui ωL/2 = π/2. In questo
caso la (7.26) si riduce a, ¡ ¢
dW I02 cos2 π2 cosϑ
= 2 ,
dΩ 8π sen2 ϑ
che ha un unico massimo in ϑ = π/2 e un unico minimo in ϑ = 0, dove si annulla. Se
vogliamo invece analizzare “l’efficienza” dell’antenna a mezz’onda dobbiamo calcolare la
potenza totale,
Z Z 2π Z π ¡ ¢ Z ¡ ¢
dW I02 cos2 π2 cosϑ I02 π cos2 π2 cosϑ
W= dΩ = 2 dϕ dϑ = dϑ .
dΩ 8π 0 0 senϑ 4π 0 senϑ

L’ultimo integrale può esser valutato solo numericamente e vale 1.22. In definitiva otte-
niamo,
1 2 (1/2)
W = 0.097 I02 = I R . (7.27)
2 0 rad
Abbiamo introdotto la “resistenza di radiazione” dell’antenna a mezz’onda,

(1/2)
Rrad = 2 · 0.097,

da non confondere con la sua resistenza ohmica Rohm . Se torniamo alle unità di misura
del sistema MKS, il nostro valore adimensionale della resistenza deve essere moltiplicato
per la “resistenza del vuoto”,
r
µ0
R0 = ≈ 377 Ohm.
ε0

La resistenza di radiazione dell’antenna a mezz’onda diventa allora,

(1/2)
Rrad = 2 · 0.097 R0 ≈ 73 Ohm, (7.28)

mentre per un’antenna a onda intera si otterrebbe,

(1)
Rrad ≈ 201Ohm.

Si può vedere che questi valori della resistenza sono tipicamente molto maggiori della
resistenza ohmica dell’antenna,
Rohm ¿ Rrad .

217
Un’antenna lunga costituisce quindi un radiatore molto efficace, in quanto la maggior
parte dell’energia fornita dal generatore viene irradiata sotto forma di onde elettromagne-
tiche, mentre solo una piccola parte viene dissipata per effetto Joule. Nel paragrafo 7.3.3
vedremo, invece, che un’antenna corta costituisce al contrario un radiatore poco efficace,
in quanto in quel caso si ha Rohm À Rrad .

7.3 Sviluppi non relativistici

In sezione 7.1 abbiamo ricondotto il calcolo del quadrimomento emesso da una generica
distribuzione di carica, si vedano le (7.17) e (7.18), alla determinazione della parte spa-
ziale del quadripotenziale nella zona delle onde (7.9), che quı̀ riportiamo ripristinando la
velocità della luce,
Z µ ¶
µ 1 3 µ r ~n · ~y
A (x) = d yj t− + , ~y . (7.29)
4πr c c c

Insistiamo sul fatto che questo procedimento fornisce risultati esatti. Tuttavia, in pratica
non è quasi mai possibile valutare l’integrale tridimensionale nella (7.29) analiticamente,
ed è quindi necessario ricorrere a qualche approccio perturbativo. Se le cariche si muovono
con velocità piccole rispetto alla velocità della luce, allora risulta appropriato un metodo
perturbativo che viene chiamato “sviluppo in multipoli”. Vediamo in che cosa consiste.

7.3.1 Sviluppo in multipoli

Per definizione lo sviluppo in multipoli


µ del potenziale
¶ (7.29) equivale a uno sviluppo in se-
r ~
n · ~
y
rie di Taylor della corrente j µ t − + , ~y attorno al tempo ritardato macroscopico
c c
r ~n · ~y
T = t − , considerando come parametro di sviluppo il ritardo microscopico ,
c c
Z ³ ´
µ 1 ~n · ~y 1 (~n · ~y )2 2 µ
A (x) = d3 y j µ (T, ~y ) + ∂t j µ (T, ~y ) + ∂ t j (T, ~
y ) + · · · . (7.30)
4πr c c 2 c2

Come si vede questo sviluppo equivale a un’espansione in potenze di 1/c, e costitui-


sce quindi uno sviluppo non relativistico. Il primo termine nella (7.30) viene chiamato
“termine di dipolo”, il secondo “termine di quadrupolo”, e cosı̀ via.
Spieghiamo innanzitutto il motivo per cui questa espansione risulta appropriata, se le
velocità delle particelle cariche che compongono la corrente j µ sono piccole rispetto alla

218
velocità della luce. Supponiamo che queste particelle si muovano con velocità caratteristi-
ca v. Esse impiegano allora il tempo caratteristico R/v per attraversare la palla di raggio
R entro la quale sono confinate, e ne segue che la corrente varia sensibilmente su scale
temporali dell’ordine di t0 = R/v. Dato che |~y | < R, possiamo allora dare la seguente
stima del ritardo microscopico,
¯ ¯
¯ ~n · ~y ¯ R v
¯ ¯
¯ c ¯ < c = c t0 . (7.31)

Siccome la corrente
µ varia su ¶ scale temporali caratteristiche dell’ordine di t0 , concludiamo
~n · ~y
allora che j µ T + , ~y differisce poco da j µ (T, ~y ), a patto che il ritardo microscopico
c
sia molto minore di t0 , ¯ ¯
¯ ~n · ~y ¯
¯ ¯
¯ c ¯ ¿ t0 . (7.32)

Ma per la (7.31) ciò equivale a,

v
t0 ¿ t0 ⇒ v ¿ c.
c

Per velocità piccole rispetto a c la corrente potrà allora essere sviluppata in serie di potenze
~n · ~y
di .
c
Un modo alternativo per analizzare il significato dello sviluppo in multipoli consiste
nell’analizzare Aµ frequenza per frequenza, cioè, considerando la corrente monocromatica
(7.4),
j µ (t, ~x) = eiωt j µ (ω, ~x) + c.c. (7.33)

con frequenza ω fissata. La velocità caratteristica delle cariche risulta allora essere v = ωR.
Siccome in questo caso schematicamente abbiamo,

∂tN jµ ' ω N jµ ,

dalla (7.31) segue che il termine N –esimo dello sviluppo in (7.30) ammonta a,

1 (~n · ~y )N N 1 (ωR)N 1 ³ v ´N
∂ t jµ (T, ~
y ) ' jµ (T, ~
y ) = jµ (T, ~y ),
N ! cN N ! cN N! c
v
che equivale quindi direttamente a uno sviluppo in serie di potenze di .
c

219
7.3.2 La radiazione di dipolo

Il resto di questa sezione sarà dedicato a un’analisi dettagliata dell’approssimazione di


ordine più basso – l’approssimazione di dipolo – che equivale a considerare nella (7.30)
solo il primo termine dello sviluppo,
Z ³
i 1 3 i r ´
A (x) = d yj t − , ~y . (7.34)
4πr c c

Ricordiamo che per l’analisi della radiazione emessa è sufficiente determinare Ai . Il campo
elettromagnetico risultante dalla (7.34) viene chiamato “campo di dipolo”, e la radiazione
ad esso associata “radiazione di dipolo”. Quando le velocità delle cariche in gioco sono
piccole rispetto alla velocità della luce, l’approssimazione di dipolo fornisce in generale
valori sufficientemente accurati per il campo asintotico e per il quadrimomento irradiato.
Se si richiede, invece, un grado di precisione più elevato, oppure se il campo di dipolo è
nullo, allora nella (7.30) bisogna tenere conto anche dell’ordine successivo, corrispondente
al “campo di quadrupolo”. Come vedremo in sezione 7.4, l’energia emessa trasportata
³ v ´2
dal campo di quadrupolo è soppressa di un fattore rispetto a quella trasportata dal
c
campo di dipolo.
Il momento di dipolo. La (7.34) può essere riscritta in modo più semplice, se si intro-
duce per una generica quadricorrente j µ il suo momento di dipolo (elettrico),
Z
i
D (t) ≡ d3 x xi ρ(t, ~x), j 0 = c ρ. (7.35)

Come conseguenza dell’equazione di continuità ∂µ j µ = 0, la sua derivata temporale


soddisfa,
Z
i
Ḋ (t) = d3 x j i (t, ~x). (7.36)

Infatti, dato che ρ̇ = ∂0 j 0 , si ha,


Z Z Z Z
i 3 i 0 3 i k 3
£ i k i
¤
Ḋ (t) = d x x ∂0 j = − d x x ∂k j = − d x ∂k (x j ) − j = d3 x j i ,

dove nell’ultimo passaggio la derivata totale non contribuisce, perché per |~x| > R la
corrente è zero. La (7.34) diventa allora semplicemente,

1
Ai = Ḋi , (7.37)
4πr c

220
dove è sottointeso che il momento di dipolo è valutato all’istante ritardato macroscopico
t − rc . La caratteristica principale di questa formula – peculiare per l’approssimazione
di dipolo – è che esprime Ai in termini della sola densità di carica, senza coinvolgere
esplicitamente la corrente spaziale.
Il potenziale scalare A0 . Per l’analisi della radiazione è sufficiente la conoscenza di Ai ,
ma per completezza facciamo notare che nello sviluppo (7.30) occorre fare una distinzione
tra Ai e A0 . Questa distinzione deriva dal fatto che la componente temporale della corrente
è legata alla densità di carica ρ dalla relazione j 0 = c ρ, mentre le sue componenti spaziali
sono indipendenti da c. Per una singola particella si ha, infatti, ~j = ~v ρ. Ne segue
che, se nello sviluppo in multipoli (7.30) per Ai ci si arresta all’ordine (~n · ~y )N /cN , per
consistenza nello sviluppo di A0 bisogna considerare anche il termine successivo di ordine
(~n ·~y )N +1 /cN +1 . In approssimazione di dipolo nel calcolo di A0 bisogna allora tenere conto
anche del termine lineare in ~n · ~y /c. La (7.30) dà allora,
µZ Z ¶ Ã !
1 1 1 ni Ḋi
A0 = d3 y c ρ + ~n · ∂t d3 y ~y c ρ = Q+ , (7.38)
4πr c c 4πr c
R
dove Q = d3 x ρ è la carica totale conservata del sistema. Si riconosce nel primo termine,
indipendente dal tempo, il potenziale coulombiano, mentre il secondo, dipendente dal
tempo, coinvolge a sua volta il momento di dipolo. Si noti come nell’approssimazione di
dipolo il potenziale vettore (7.37), (7.38) soddisfi la gauge di Lorentz ∂µ Aµ = 0, modulo
termini di ordine 1/r2 . D’ora in poi porremo di nuovo c = 1.
Emissione di quadrimomento. Dato il potenziale vettore (7.37) possiamo usare le (7.11)
e (7.12), valide nella zona delle onde, per ottenere espressioni semplici per i campi di
dipolo,
~ = − 1 [D
E ~¨ − (~n · D) ~ = − 1 ~n × D.
~¨ ~n],
B ~¨ (7.39)
4πr 4πr
~¨ e ~n. Inserendo infine la
Il campo elettrico giace quindi nel piano individuato da D
(7.37) nella (7.17) otteniamo la distribuzione angolare della potenza emessa da un generico
sistema di cariche non relativistiche,

dW 1 1 ¯ ¯2 1 ¯ ¯
i j ij i j ¯ ~¨ ¯ ¯ ¨ ¯2
~
= D̈ D̈ (δ − n n ) = ¯D¯ sen2 ϑ = ¯~n × D ¯ , (7.40)
dΩ 16 π 2 16 π 2 16 π 2

221
~¨ e ~n. Vediamo quindi che la radiazione di dipolo ha una distri-
dove ϑ è l’angolo tra D
~¨ mentre è massima
buzione angolare molto semplice: essa è nulla lungo la direzione di D,
nel piano ortogonale a D.~¨

La potenza totale si ottiene invece integrando dW/dΩ sugli angoli. Usando gli integrali
invarianti del problema 2.6 risulta,
Z Z
dW 1 i j
¡ ¢
W = dΩ = 2
D̈ D̈ dΩ δ ij − ni nj
dΩ 16π
µ ¶
1 i j ij 4π ij 1 ¯¯ ~¨ ¯¯2
= D̈ D̈ 4π δ − δ = ¯D¯ . (7.41)
16π 2 3 6π

Al contrario, la quantità di moto totale emessa in tutte le direzioni è nulla. Infatti, dalla
(7.18) segue,
Z Z
dP k dW
k 1
= n dΩ = D̈i D̈j dΩ nk (δ ij − ni nj ) = 0, (7.42)
dt dΩ 16π 2

dove di nuovo si sono usati gli integrali invarianti. L’annullamento della quantità di moto
totale emessa è dovuta al fatto che, come conseguenza dell’invarianza della (7.40) per
~n → −~n, le energie emesse in due direzioni opposte sono uguali; ne segue che le quantità
di moto emesse in direzioni opposte si cancellano.
Sistemi di particelle e Bremsstrahlung. Consideriamo ora come caso particolare un si-
stema di particelle cariche puntiformi non relativistiche. In questo caso la densità di carica

X
j 0 (t, ~x) = er δ 3 (~x − ~yr (t)),
r

e per il momento di dipolo la (7.35) dà,


Z X X X
~
D(t) = d3 x ~x er δ 3 (~x − ~yr (t)) = er ~yr (t) ⇒ ~¨ =
D er ~ar , (7.43)
r r r

dove ~ar è l’accelerazione della particella r–esima. Secondo la (7.41) un tale sistema emette
quindi radiazione di dipolo con potenza istantanea,
¯ ¯2
1 ¯¯X ¯
¯
W= ¯ er ~ar ¯ . (7.44)
6π ¯ ¯
r

Questa formula, che lega l’energia emessa direttamente alla causa della radiazione – l’ac-
celerazione delle particelle – generalizza la formula di Larmor (6.128) a un sistema di più

222
particelle. Si noti, in particolare, che la potenza emessa non è data dalla somma delle
P 2
potenze individuali, ovvero 6π 1
ar |2 , in quanto sono presenti anche dei termini di
r er |~

“interferenza” tra le varie particelle. La presenza di questi termini è conseguenza del


fatto che il campo elettromagnetico soddisfa il principio di sovrapposizione, e che obbe-
disce quindi alle leggi dell’interferenza. Se indichiamo il campo elettrico asintotico della
~ r , vedi (7.45), la (7.17) si scrive per l’appunto,
particella r–esima con E
¯ ¯
dW ¯X ¯2
¯ ~ r ¯¯ ,
= r2 ¯ E
dΩ ¯ r ¯

dW
P ~ 2
e non dΩ
= r2 r |E r | .

Il fenomeno della radiazione emessa da particelle cariche a causa di un’accelerazione


momentanea, o prolungata nel tempo, viene genericamente chiamato Bremsstrahlung,
ovvero, radiazione di frenamento. La formula (7.44) quantifica l’entità di questa radiazione
– sommata sugli angoli – per un arbitrario sistema di particelle non relativistiche. Nei
prossimi paragrafi analizzeremo in dettaglio vari casi di Bremsstrahlung non relativistica,
tra cui la diffusione Thomson, e la radiazione emessa a causa dell’interazione coulombiana
tra due particelle cariche.
Particella singola. Consideriamo più in dettaglio il caso di una particella singola, per
~¨ = e ~a. Per i campi a grandi distanze le (7.39) danno allora,
cui D

~ = − e [~a − (~n · ~a) ~n],


E ~ = − e ~n × ~a.
B (7.45)
4πr 4πr

Si noti come questi campi siano fondamentalmente diversi dai campi prodotti a grandi
distanze da una particella non relativistica in moto rettilineo uniforme, vedi (6.70) e
(6.68). Vediamo in particolare che in questo caso il campo elettrico non è più radiale –
essendo piuttosto ortogonale alla direzione radiale ~n – e che appartiene al piano formato
da ~n e ~a. Per la distribuzione angolare della radiazione la (7.40) dà invece,

dW e2 |~n × ~a|2
= . (7.46)
dΩ 16 π 2

Vediamo che la particella non emette radiazione lungo la direzione dell’accelerazione, men-
tre l’emissione è massima nel piano ortogonale ad essa. Anticipiamo che questa proprietà
della distribuzione angolare della radiazione è caratteristica per il limite non relativisti-

223
co. Vedremo, infatti, che per particelle ultrarelativistiche la distribuzione angolare della
radiazione sarà radicalmente diversa.
Infine, per la potenza totale emessa da una particella singola non relativistica con
carica e e accelerazione ~a, la (7.44) si riduce a,

e2 | ~a |2
W= ,

che è la formula di Larmor (6.128).


Si noti come le formule per una singola particella non relativistica appena derivate,
siano in perfetto accordo con i limiti non relativistici delle corrispondenti formule esatte
derivate nel paragrafo 6.4.4, a partire dai campi di Lienard–Wiechert.
Assenza della radiazione di dipolo. Menzioniamo ora alcuni casi importanti in cui la
radiazione di dipolo è assente. Oltre al caso ovvio di un sistema di cariche che si muovono
di moto rettilineo uniforme, quindi molto distanti tra di loro, la radiazione di dipolo è
assente per un sistema isolato di cariche con rapporto er /mr = γ indipendente da r. In
questo caso il momento di dipolo si può infatti scrivere come,
X X
~
D(t) = er ~yr (t) = γ mr ~yr (t),
r r

e quindi,
³X ´
~¨ = γ d
D mr ~vr = 0,
dt
in quanto la quantità di moto totale di un sistema isolato non relativistico è una costante
del moto. Concludiamo in particolare che in qualsiasi processo isolato che coinvolge solo
una specie di particelle, come per esempio lo scattering tra due particelle identiche, non
c’è emissione di radiazione di dipolo.
La radiazione di dipolo è pure assente per una distribuzione sferica di cariche. Ciò è
conseguenza del teorema di Birkhoff, vedi problema 2.5, che assicura che una distribuzione
sferica di carica nel vuoto dà luogo a un campo statico. E un campo statico non può
emettere radiazione. Per verificare che le nostre formule sono in accordo con questa
previsione, è sufficiente ricordare che per una distribuzione sferica la densità di carica
dipende solo da r e t,
j 0 (t, ~x) = j 0 (t, r).

224
Per il momento di dipolo si ottiene allora, usando coordinate polari e sfruttando gli
integrali invarianti,
Z µZ ¶ µZ ¶
i 3 i 0 3 0 i
D (t) = d x x j (t, r) = r drj (t, r) dΩ n = 0.

Nei casi in cui la radiazione di dipolo è assente diventa dunque rilevante il termine di ordine
successivo nello sviluppo (7.30), ovvero, quello corrispondente alla campo di quadrupolo.
Per sistemi a simmetria sferica la radiazione è evidentemente assente a tutti gli ordini.
Riepilogo. Concludiamo questo paragrafo riassumendo le varie formule per il potenziale
vettore, e la corrispondente distribuzione angolare della potenza emessa.
a) Potenziale esatto:
Z
µ 1 1
A (x) = d3 y j µ (t − |~x − ~y |, ~y ).
4π |~x − ~y |

b) Potenziale nella zona delle onde:


Z
µ 1
A (x) = d3 y j µ (t − r + ~n · ~y , ~y ).
4πr

c) Potenziale nella zona delle onde in approssimazione di dipolo:


Z
i 1 1
A (x) = d3 y j i (t − r, ~y ) = Ḋi .
4πr 4πr

a) Potenza locale esatta:


dW ~ × B)
~ · ~n.
= r2 (E
dΩ
b) Potenza “emessa” esatta:
dW
= r2 (Ȧi Ȧj Λij ).
dΩ
c) Potenza emessa in approssimazione di dipolo:

dW 1 ¯ ¯
¯ ¨ ¯2
~
= ¯~n × D ¯ .
dΩ 16π 2

Nell’approssimazione di dipolo si può anche determinare la potenza totale emessa in tutte


le direzioni,
1 ¯¯ ~¨ ¯¯2
W= ¯D¯ .

225
7.3.3 Potenza emessa da un’antenna lineare corta

Come prima applicazione dell’approssimazione di dipolo determiniamo la potenza emessa


da un’antenna lineare alimentata al centro, molto più corta della lunghezza d’onda su cui
emette,
L ¿ λ, ovvero ωL ¿ 1. (7.47)

Siccome la potenza emessa da un’antenna lineare di lunghezza arbitraria è già stata cal-
colata in modo esatto, vedi sezione 7.2, l’analisi che segue ci permetterà in particolare di
discutere i limiti di validità dell’approssimazione di dipolo in un esempio concreto.
Ripartiamo dalla corrente spaziale (7.22),
3
~j(t, ~y ) = I0 δ(y 1 ) δ(y 2 ) sen(ω(L/2 − |y |)) cos(ωt) ~u. (7.48)
sen(ωL/2)
In questo caso l’approssimazione di dipolo è in effetti appropriata perché il tempo carat-
teristico con cui varia la corrente è t0 = 2π/ω, e la condizione (7.32) diventa allora,

|~n · ~y | ≤ L ¿ t0 = 2π/ω,

che è soddisfatta grazie alla (7.47). La potenza emessa dall’antenna può allora essere
calcolata usando la (7.40), che coinvolge solo il momento di dipolo. La determinazione di
quest’ultimo richiede in realtà la conoscenza della densità di carica, ma questa può essere
determinata a sua volta sfruttando la conservazione della quadricorrente,
∂ 3
∂0 j 0 = −∂i j i = − j .
∂y 3
Dalla (7.48) si ottiene allora facilmente,

0 1 cos(ω(L/2 − |y 3 |))
2
j (t, ~y ) = I0 δ(y ) δ(y ) sen(ωt) ε(y 3 ),
sen(ωL/2)
dove ε(·) è la funzione segno. Possiamo allora calcolare il momento di dipolo,
Z Z
~ 3 0 I 0 sen(ωt)
D(t) = d y ~y j (t, ~y ) = d3 y ~y δ(y 1 ) δ(y 2 ) cos(ω(L/2 − |y 3 |)) ε(y 3 )
sen(ωL/2)
Z
2I0 sen(ωt) ~u L/2 3 3 2I0 sen(ωt)(1 − cos(ωL/2))
= dy y cos(ω(L/2 − y 3 )) = ~u.
sen(ωL/2) 0 ω 2 sen(ωL/2)
Siccome per ipotesi abbiamo ωL ¿ 1, questa espressione si riduce a,

~ = I0 L sen(ωt) ~u,
D ~¨ = − 1 I0 ωL sen(ωt) ~u.
D
2ω 2
226
La potenza istantanea si ottiene allora dalla (7.40),

dW (I0 ωL)2 sen2 (ω(t − r))


= 2
sen2 ϑ,
dΩ 64 π

dove ϑ è l’angolo tra ~n e l’asse z. Eseguendo la media temporale su un periodo abbiamo


< sen2 (ω(t − r)) >= 1/2, e quindi,

dW (I0 ωL)2
= 2
sen2 ϑ, (7.49)
dΩ 128 π

da confrontare con il risultato esatto (7.26). In effetti si vede facilmente che nel limite
ωL ¿ 1 quest’ultimo si riduce alla (7.49). Per quanto riguarda la distribuzione angolare
notiamo che la potenza approssimata (7.49) ha una distribuzione molto semplice – tipica
per la radiazione di dipolo – con un massimo nel piano ortogonale all’antenna, e uno zero
nella direzione parallela ad essa. Da un confronto qualitativo tra la (7.49) e la (7.26)
emerge allora che fino a quando L ≤ λ quest’ultima ha in effetti una forma molto simile
alla prima: un unico massimo in ϑ = π/2 e uno zero in ϑ = 0.
La discrepanza maggiore tra il trattamento esatto e l’approssimazione di dipolo emer-
ge, invece, se si confrontano le intensità delle radiazioni. Per rendercene conto, per sem-
plicità consideriamo la potenza totale. Integrando la (7.49) sull’angolo solido si ottiene
infatti,
(ωL)2 2 1 2 (c)
W= I = I0 Rrad , (7.50)
48 π 0 2
dove la resistenza di radiazione è data da,
µ ¶2
(c) (ωL)2 π L
Rrad = = .
24 π 6 λ

Reinserendo la resistenza del vuoto, R0 ≈ 377 Ohm, risulta dunque,


µ ¶2 µ ¶2
(c) π L L
Rrad = R0 = 197 Ohm. (7.51)
6 λ λ

Se in accordo con l’ipotesi di lavoro (7.47) scegliamo, per esempio, L = λ/50 otteniamo,

(c)
Rrad = 0.08 Ohm,

(1/2)
che è molto minore della resistenza (7.28) dell’antenna a mezz’onda, Rrad = 73 Ohm.
Tuttavia, il dato più rilevante è che la resistenza ohmica di un’antenna corta può essere

227
(c)
dello stesso ordine di grandezza di Rrad , o anche sensibilmente maggiore: un’antenna corta
costituisce quindi in generale un radiatore poco efficace.
Infine possiamo chiederci quale risultato avremmo ottenuto se per l’antenna a mez-
z’onda – sbagliando – avessimo usato l’approssimazione di dipolo. Il risultato sarebbe
stata la (7.50) con L = π/ω, cioè,

π 2
W= I = 0.065 I02 ,
48 0

al posto della (7.27), W = 0.097 I02 . Avremmo quindi ottenuto il corretto ordine di
grandezza, ma un valore numerico sbagliato.

7.3.4 Diffusione Thomson della radiazione

Un fenomeno che ricopre un ruolo importante in Elettrodinamica è costituito dalla dif-


fusione di radiazione elettromagnetica da parte di una particella carica libera. Se questo
processo viene considerato a livello classico, esso è descritto da un’onda elettromagnetica
che investe una particella carica, e viene chiamato “diffusione Thomson”. A livello quan-
tistico lo stesso processo è invece descritto dall’urto tra un fotone e una particella carica,
e viene chiamato “effetto Compton”.
Vediamo in cosa consiste qualitativamente la diffusione Thomson. Se un’onda elet-
tromagnetica piana incide su una particella carica libera, la particella incomincerà ad
oscillare, principalmente lungo la direzione del campo elettrico. Essendo accelerata es-
sa emetterà a sua volta radiazione elettromagnetica. Questa radiazione “diffusa” viene
emessa in direzioni diverse da quella dell’onda incidente, ma vedremo che per velocità non
relativistiche della particella, essa ha la stessa frequenza dell’onda incidente.
Consideriamo dunque una generica onda piana “incidente” in direzione ~u, con campi
elettrico e magnetico dati da, vedi problema 5.5,

E~ = E~0 eik·x + c.c., B~ = ~u × E,


~

dove E~0 è un generico vettore complesso costante, ortogonale a ~u. In seguito assumeremo
che l’onda incidente sia polarizzata linearmente, vale a dire che E~ abbia direzione costante.
Avremo allora,
E~0∗ = E~0 .

228
L’intensità media dell’onda incidente, definita come l’energia che attraversa l’unità di
superficie nell’unità di tempo è allora data da,

~ >=< |E|
I0 =< |S| ~ 2 >= 2 E02 . (7.52)

In seguito supporremo che l’intensità dell’onda incidente sia sufficientemente bassa, in


modo tale che la velocità della particella si mantenga molto minore della velocità della
luce. Per l’analisi della radiazione emessa risulterà dunque appropriata l’approssimazione
di dipolo.
Vediamo ora qual è l’effetto di questa onda se investe una particella di massa m e
carica e. Per moti non relativistici dovremo risolvere l’equazione,
³ ´
m ~a = e E~ + ~v × B~ . (7.53)

~ = |E|,
Siccome abbiamo v ¿ 1 e |B| ~ il campo magnetico può essere trascurato. L’equa-

zione da risolvere si scrive allora più precisamente,

d2 ~y (t) ~
m 2
= e E~0 ei(ω t − k · ~y (t)) + c.c. = 2 e E~0 cos(ω t − ~k · ~y (t)).
dt
Se supponiamo che la direzione di incidenza sia z – nel qual caso ~k = (0, 0, ω) – e che E~0
sia diretto lungo x, si ottiene la soluzione stazionaria,

2 e E0
x(t) = − cos(ωt), y(t) = z(t) = 0. (7.54)
m ω2

La particella si mette quindi a oscillare attorno all’origine lungo la direzione del campo
elettrico incidente, con la sua stessa frequenza ω. Vediamo in particolare che la no-
stra approssimazione non relativistica è consistente, purché la velocità massima vM della
particella sia molto minore di 1,

2 e E0
vM = ¿ 1. (7.55)

L’onda diffusa. Dalle (7.54) si ottiene l’accelerazione,

2 e E~0
~a(t) = cos(ωt). (7.56)
m

229
A questo punto possiamo applicare le formule (7.45) e (7.46), per scrivere i campi di
radiazione e la potenza emessa,

~ e2 ³ ~ ~
´
~ = ~n × E,
~
E = − E0 − (~n · E0 ) ~n cos(ω(t − r)), B (7.57)
2πm r
dW e4 ³ 2 ´
~0 )2 cos2 (ω(t − r)),
= E 0 − (~
n · E (7.58)
dΩ 4π 2 m2
Il campo elettromagnetico di radiazione, che rappresenta l’onda diffusa, ha quindi la stessa
frequenza dell’onda incidente, ma si propaga radialmente in tutte le direzioni. Inoltre la
sua intensità è massima nel piano passante per la particella ed ortogonale a E~0 . Vediamo
poi che la sua polarizzazione appartiene sempre al piano formato da E~0 e ~n.
Onda incidente non polarizzata. Analizziamo ora più in dettaglio la distribuzione an-
golare (7.58) della potenza emessa. Possiamo intanto eseguire la media temporale, che
1
equivale alla sostituzione cos2 (ω(t − r)) → . Inoltre, nella maggior parte dei casi la
2
radiazione incidente non è polarizzata, ma ammonta a una sovrapposizione equiprobabile
di tutte le polarizzazioni E~0 ortogonali a ~k, come nel caso della luce naturale. In questo
caso dobbiamo mediare la distribuzione angolare della potenza emessa (7.58), su tutte
le polarizzazioni ortogonali a ~k. Per fare questo esplicitiamo i termini della (7.58) che
dipendendono dalle polarizzazioni,

E02 − (~n · E~0 )2 = E02 − (nx E0x + ny E0y )2 = E02 − n2x E0x
2
− n2y E0y
2
− 2 nx ny E0x E0y .

2
Prendendo la media di questa espressione si ha < E0x 2
>=< E0y >= 21 E02 , e < E0x E0y >= 0.
Inoltre, se chiamiamo ϑ l’angolo tra ~n e la direzione di inicidenza, nel presente caso l’asse
z, allora abbiamo nz = cosϑ, e quindi n2x + n2y = sen2 ϑ. Si ottiene cosı̀,
1 1
< E02 − (~n · E~0 )2 >= E02 − sen2 ϑ E02 = (1 + cos2 ϑ) E02 .
2 2
Per un’onda incidente non polarizzata dalla (7.58) si ottiene allora la potenza diffusa,
µ ¶
dW e4 E02
= (1 + cos2 ϑ). (7.59)
dΩ n.p. 16 π 2 m2
Si vede che questa potenza risulta massima lungo la direzione di propagazione dell’onda
incidente, in entrambi i versi ϑ = 0 e ϑ = π, in accordo con il fatto che per qualsiasi
polarizzazione dell’onda incidente, la particella oscilla nel piano ortogonale alla direzione
di incidenza.

230
Infine possiamo integrare la (7.59) sugli angoli per ottenere la potenza totale. Usando,
Z Z 2π Z π
2 16 π
dΩ (1 + cos ϑ) = dϕ senϑ dϑ (1 + cos2 ϑ) = , (7.60)
0 0 3

si ottiene,
Z µ ¶
dW e4 E02
W= dΩ = .
dΩ n.p. 3 πm2
Lo stesso risultato si può ovviamente anche ottenere inserendo la (7.56) nella formula di
Larmor (6.128) per la potenza totale, e mediando sul tempo. Il risultato cosı̀ ottenuto è
indipendente dalle polarizzazioni, e la media su queste è quindi banale.
Sezione d’urto. Dal punto di vista sperimentale le grandezze rilevanti in un processo

di diffusione sono la sezione d’urto differenziale , ed eventualmente la sezione d’urto
dΩ

totale σ. Nel caso in questione è definita come l’energia diffusa nell’unità di tempo
dΩ
in una data direzione nell’unità di angolo solido, divisa l’energia incidente per unità di
superficie nell’unità di tempo, ovvero, l’intensità incidente I0 , vedi (7.52). Analogamente,
σ è definita come l’energia diffusa nell’unità di tempo in tutte le direzioni, divisa l’intensità
incidente. Dalle formule scritte sopra risulta,
µ ¶
dσ 1 dW 1 + cos2 ϑ 2
= = r0 , (7.61)
dΩ I0 dΩ n.p. 2

dove abbiamo introdotto il raggio classico della particella r0 , che per l’elettrone vale,

e2
r0 = = 2.8 · 10−13 cm. (7.62)
4πm c2

Possiamo confrontare questo raggio con il raggio di Bohr rB , e la lunghezza d’onda


Compton λC dell’elettrone,

4π~2 ~
rB = = 5.3 · 10−9 cm, λC = = 3.8 · 10−11 cm. (7.63)
me2 mc

La sezione d’urto totale si ottiene integrando la (7.61) su tutti gli angoli. Usando di nuovo
la (7.60) ottiene,
Z
dσ W 8π 2
σ= dΩ = = r . (7.64)
dΩ I0 3 0
Questa sezione d’urto viene chiamata sezione d’urto di Thomson. Essa ha le dimensioni
di una superficie e – vista la definizione – può essere interpretata come la superficie che

231
l’elettrone “offre” come bersaglio all’onda incidente. È proprio questa circostanza che
permette di interpretare r0 come il raggio classico dell’elettrone.
Bilancio del quadrimomento e reazione di radiazione. Concludiamo l’analisi della dif-
fusione Thomson con un commento sulla conservazione del quadrimomento in questo
processo. Ricordiamo innanzitutto che in approssimazione di dipolo la radiazione emessa
complessivamente non trasporta quantità di moto, vedi (7.42). Di conseguenza alla radia-
zione diffusa, rappresentata dal campo (7.57), complessivamente non è associata nessuna
quantità di moto. Inoltre, vista la definizione di σ, il processo di diffusione in questione
può essere interpretato come segue: di tutta l’onda incidente, concettualmente infinita-
mente estesa, solo la parte che colpisce la superficie σ viene diffusa, mentre il resto passa
indisturbato e costituisce l’onda trasmessa.
Consideriamo ora il bilancio del quadrimomento separatamente per l’onda trasmessa,
l’onda diffusa e la particella. Per l’onda trasmessa il quadrimomento iniziale e finale
sono evidentemente uguali. Anche la particella conserva in media il suo quadrimomento,
perché essa si trova in moto stazionario. All’onda diffusa prima della diffusione è associato
il flusso di energia σI0 , mentre dopo la diffusione le è associato il flusso W; siccome si ha
W = σI0 la sua energia si conserva. Al contrario, il suo flusso di quantità di moto prima
della diffusione vale,
dPz
= σI0 ,
dt
mentre dopo la diffusione esso è nullo! Dato che la quantità di moto totale del sistema si
deve conservare, dobbiamo concludere che la quantità di moto mancante è stata trasferita
alla particella. Quest’ultima deve quindi subire una forza media in avanti pari a,

dPz 16 π 2 2
Fz = = r E , (7.65)
dt 3 0 0

forza che andrebbe ad aggiungersi al membro di destra della (7.53).


~ v ×B)
Emerge quindi il seguente quadro. La forza e(E+~ ~ costituisce la causa primaria che

imprime un’accelerazione alla particella. Di conseguenza la particella dà luogo a un campo


di radiazione emettendo onde elettromagnetiche le quali, a loro volta, provocano una
reazione di rinculo nella particella, rappresentata dalla forza Fz . Questa forza scaturisce
quindi dall’interazione tra la particella e il campo da essa stessa creata, e viena chiamata

232
alternativamente “reazione di radiazione”, “forza di autointerazione”, o anche “forza di
frenamento”. Si noti che mentre la forza di Lorentz e(E~ + ~v × B)
~ – la causa primaria – è

lineare in E0 , la reazione di radiazione Fz – un effetto secondario – è quadratica in E0 , e


corrisponde a una correzione relativistica. Stimando il rapporto tra le due forze si ottiene
infatti, vedi (7.55) e (7.62),

Fz 16 π r02 vM r0 vM
= E0 ∼ ω r 0 = 2π .
e E0 3e c λ c

Nel capitolo 12 vedremo che la validità dell’Elettrodinamica classica richiede comunque


che sia λ > r0 . La forza di reazione è quindi soppressa rispetto alla forza di Lorentz dal
fattore non relativistico vM /c.
Per completezza aggiungiamo che in realtà è possibile dedurre la presenza della rea-
zione di radiazione (7.65), direttamente dall’equazione di Lorentz “completa” (2.21),

d~p
= e(E~ + ~v × B)
~ + e(E
~ + ~v × B),
~ (7.66)
dt
~ e B
dove E ~ sono i campi di Lienard–Wiechert prodotti dalla particella stessa. Tutta-

via, in questo caso non è lecito usare le loro espressioni asintotiche (7.57), perché nella
(7.66) questi campi sono valutati nella posizione della particella – dove essi sono diver-
genti. Un’analisi dettagliata del membro di destra della (7.66) conferma sı̀ la presenza
del termine (7.65), ma rivela anche la presenza di termini infiniti: l’equazione di Lorentz,
nella sua forma originale (2.21), dovrà dunque essere abbondonata. Anticipiamo che una
trattazione sistematica della reazione di radiazione, che comporta in particolare la sostitu-
zione dell’equazione di Lorentz con l’equazione di Lorentz–Dirac, vede l’Elettrodinamica
classica entrare in contraddizione con se stessa, vedi capitolo 12.
Effetti quantistici. La diffusione Thomson come quı̀ analizzata non tiene conto di effetti
quantistici, in quanto trascura il fatto che le onde elettromagnetiche sono costituite da
particelle, i fotoni. A livello quantistico il processo di diffusione di radiazione di frequenza
ω da parte di elettroni si realizza, infatti, attraverso urti tra fotoni “incidenti” di energia
~ ω, ed elettroni, e viene chiamato effetto Compton. In questo caso “l’onda” uscente è
costituita da fotoni che si propagano in tutte le direzioni ϑ. Fino a quando le lunghezze
d’onda della radiazione incidente sono molto maggiori della lunghezza d’onda Compton,

233
2πc ~
λ= À λC = , e quindi ~ω ¿ mc2 , gli effetti quantistici possono essere trascurati,
ω mc
ed è valida l’analisi svolta sopra. Viceversa, per λ ≈ λC il fotone incidente cede parte
della sua energia all’elettrone, ed emerge quindi dall’urto con una frequenza più piccola,
ovvero, con una lunghezza d’onda λ0 maggiore di λ. Imponendo la conservazione del
quadrimomento risulta, infatti, la nota formula dell’effetto Compton,

λ0 = λ + 2π(1 − cosϑ)λC ,

dove ϑ è l’angolo tra il fotone entrante e quello uscente.


Le differenze principali rispetto all’analisi classica della diffusione sono quindi 1) che
l’energia non viene più irradiata con continuità, ma sotto forma di quanti di luce e 2) che
la frequenza della radiazione uscente è minore di quella della radiazione incidente. Inoltre
si può vedere 3) che la sezione d’urto di Thomson subisce una correzione quantistica che
al primo ordine in ~ risulta in,
µ ¶
8π 2 λC
σ= r 1 − 4π .
3 0 λ
Per λ À λC i fotoni entranti e uscenti hanno praticamente la stessa energia ~ω,
indipendentemente dall’angolo di diffusione ϑ, e in questo limite sono inoltre valide le
formule per le sezioni d’urto (7.61), (7.64). In questo limite l’energia delle radiazioni
incidente ed uscente è data semplicemente dal numero di fotoni moltiplicato per ~ω, e
quindi queste sezioni d’urto danno allora anche il numero di fotoni diffusi nell unità di
tempo, diviso il numero di fotoni incidenti per unità di superficie nell’unità di tempo,
ovvero il “flusso entrante”.

7.3.5 Bremsstrahlung dall’interazione coulombiana

In questo paragrafo consideriamo la radiazione generata dall’interazione elettromagnetica


tra due particelle cariche in moto non relativistico – prototipo di Bremsstrahlung non
relativistica. Di nuovo siamo interessati principalmente alla determinazione dell’energia
emessa sotto forma di radiazione. Dato che nel limite non relativistico l’interazione elet-
tromagnetica tra due particelle è governata dal potenziale coulombiano α/r, le orbite
relative sono coniche, ovvero ellissi, iperboli o parabole. La conoscenza della forma ana-
litica delle orbite faciliterà notevolmente l’analisi della potenza emessa e, come vedremo,

234
essa ci permetterà di determinare l’energia totale irraggiata durante il moto in modo
esatto.
Consideriamo dunque un sistema isolato formato da due particelle cariche, con masse
m1 e m2 e cariche e1 e e2 . Indichiamo i vettori posizione rispettivamente con ~r1 e ~r2 , la
posizione relativa con ~r = ~r1 − ~r2 , e quella del centro di massa con ~rCM . Allora abbiamo,

m2 m1
~r1 = ~rCM + ~r, ~r2 = ~rCM − ~r. (7.67)
m1 + m2 m1 + m2

Secondo la teoria dei moti relativi la dinamica del sistema è allora governata dalle equa-
zioni del moto,
~r
µ ~¨r = α , ~¨rCM = 0, (7.68)
r3
dove,
e1 e2 m1 m2
α= , µ= ,
4π (m1 + m2 )
essendo µ la massa ridotta.
Cinematica delle coniche. Siccome il potenziale coulombiano è centrale e a simmetria
sferica, il moto relativo è piano, e si conservano l’energia ε e il momento angolare L.
Introducendo le coordinate polari piane r e ϕ si ha,

1 α
ε= µ v2 + , L = µ r2 ϕ̇. (7.69)
2 r

Per il potenziale in questione le orbite del moto relativo sono coniche. Se l’energia è
negativa, e quindi necessariamente α < 0, l’orbita è un ellisse di equazione,

(1 − e2 ) a
r(ϕ) = , (7.70)
1 + e cosϕ

dove l’eccentricità e e il semiasse maggiore a sono dati da,


s
2 εL2 α
e= 1+ 2
, a=− . (7.71)
µα 2ε

Il periodo risulta essere, s


µ a3
T = 2π .
| α|
Si noti che il momento angolare può essere scritto anche come,
p √
L= µ a| α| 1 − e2 .

235
Se l’energia è invece positiva, le orbite sono iperboli di equazione,

(e2 − 1) a
r(ϕ) = , (7.72)
±1 + e cosϕ

dove il segno + corrisponde al caso attrattivo, α < 0, e il segno – al caso repulsivo, α > 0.
I parametri e ed a sono ancora dati dalle (7.71), ma ora le costanti del moto possono
essere espressi anche in termini del parametro d’impatto b e della velocità asintotica v0 ,

1
ε= µ v02 , L = µ b v0 . (7.73)
2

Ricordiamo poi che nel caso delle iperboli la variabile angolare è limitata da,

1
−ϕ0 < ϕ < ϕ0 , cos ϕ0 = ∓ . (7.74)
e

L’energia emessa. Torniamo ora al calcolo dell’energia emessa via Bremsstrahlung.


Secondo la (7.41) la potenza emessa istantanea è data in termini del momento di dipolo
del sistema, dalla formula,
1 ¯ ¯2
¯ ~¨ ¯
W= ¯D¯ . (7.75)

~ usando le (7.67),
Possiamo valutare D
µ ¶
~ = e1 ~r1 + e2 ~r2 = (e1 + e2 ) ~rCM + µ e1 e2
D − ~r.
m1 m2

Derivando due volte e usando le (7.68) si ottiene,


µ ¶ µ ¶
¨
~ e1 e2 ¨ e1 e2 ~r
D=µ − ~r = − α 3.
m1 m2 m1 m2 r

Per la potenza istantanea si ottiene allora 34 ,


µ ¶2
α 2 e1 e2 1
W= − . (7.76)
6π m1 m2 r4

Vediamo che la radiazione di dipolo è assente se le due particelle hanno lo stesso rapporto
e/m – in particolare se le particelle sono identiche – come dimostrato nel paragrafo 7.3.2.
Se siamo interessati all’energia emessa tra due istanti temporali t1 e t2 , dobbiamo inte-
grare la (7.76) tra questi istanti. L’integrale risultante può essere ricondotto a un integrale
34
Ricordiamo che questa formula rappresenta la potenza emessa W(t, r) all’istante t a una distanza r
molto grande dalla particella, se il raggio r che compare a secondo membro è valutato all’istante ritardato
t − r. Se valutiamo il raggio r invece in t, allora la formula fornisce l’energia che viene emessa all’istante
t e che raggiunge l’infinito. Torneremo su questo punto nel capitolo 9.

236
sugli angoli, valutabile esattamente, se sfruttiamo la costanza del momento angolare (7.69)
per scrivere,
µ r2
dt = dϕ.
L
Se indichiamo gli angoli corrispondenti ai due istanti temporali t1 e t2 con ϕ1 e ϕ2 , l’energia
emessa tra questi due istanti risulta allora,
Z t2 µ ¶2 Z ϕ2
µ α2 e1 e2 1
∆ε = W dt = − dϕ. (7.77)
t1 6πL m1 m2 ϕ1 r2

Inserendo in questa espressione le equazioni polari (7.70) e (7.72) si ottengono integrali


elementari che possono essere valutati esattamente. Consideriamo ora separatamente moti
ellittici e moti iperbolici.
Moti ellittici. Se il moto relativo è ellittico entrambe le particelle compiono moti pe-
riodici di periodo T . La corrente associata j µ è allora pure periodica, e il sistema emette
quindi radiazione sulle frequenze discrete ωN = 2πN/T , con N intero, vedi paragrafo
7.1.2. In questo caso l’energia totale emessa è evidentemente infinita, e ha senso solo la
potenza media, ottenuta mediando la (7.77) su un periodo,
Z µ ¶2 Z 2π
1 T µ α2 e1 e2 1
W = W dt = − dϕ
T 0 6πL T m1 m2 0 r2
µ ¶2 Z 2π
µ α2 e1 e2 1
= − (1 + e cosϕ)2 dϕ.
6πL T m1 m2 a2 (1 − e2 )2 0

Usando l’integrale, µ ¶
Z 2π
2 e2
(1 + e cosϕ) dϕ = 2π 1 + ,
0 2
e sostituendo i valori cinematici dati sopra si ottiene,
µ ¶2 2
α2 e1 e2 1 + e2
W= − . (7.78)
6πa4 m1 m2 (1 − e2 )5/2

L’energia che la Bremsstrahlung asporta invece durante un ciclo è data da,

∆εc = T W.

Una conseguenza importante della Bremsstrahlung è che l’energia totale del sistema “ca-
riche + campo”, che nel limite non relativistico quı̀ in esame è data dalla (7.69), non
può restare costante, perché durante ogni ciclo essa deve diminuire della quantità T W.

237
Di conseguenza le orbite ellittiche non possono restare stabili e si devono, in particolar
modo, “aprire”, entrando in un regime spiraleggiante. La causa diretta di questo feno-
meno è di nuovo la forza di frenamento, le cui conseguenze fisiche saranno analizzate in
modo sistematico più avanti, vedi capitolo 12. Nel prossimo paragrafo quantitificheremo
comunque la perdita di energia (7.78) in un caso importante dal punto di visto storico,
quello dell’atomo di idrogeno classico, e vedremo che la forza di frenamento lo farebbe
collassare in una frazione di secondo.
Moti iperbolici. Se il moto relativo è iperbolico, entrambe le particelle compiono moti
aperiodici. Anche la corrente associata è allora aperiodica, e il sistema emette dunque
radiazione con uno spettro continuo di frequenze. Questo processo corrisponde a un urto
tra due particelle cariche che arrivano dall’infinito, si deflettono a vicenda, e poi escono
di nuovo verso l’infinito. Negli istanti iniziale e finale l’accelerazione delle due particelle è
nulla, e l’energia totale irradiata durante l’intero processo, come vedremo, risulta finita.
Per calcolarla dobbiamo porre nella (7.77) t1 = −∞ e t2 = +∞, ovvero ϕ1 = −ϕ0 e
ϕ2 = ϕ0 , vedi (7.74). Inserendo la (7.72) nella (7.77) troviamo per l’energia irradiata
durante l’intero processo,
Z ∞ µ ¶2 Z ϕ0
µ α 2 e1 e2 1
∆ε = W dt = − 2 (e2 − 1)2
(±1 + e cosϕ)2 dϕ
−∞ 6πL m 1 m 2 a −ϕ0
µ ¶2 ³ ´
µα 2
e1 e2 1 2
p
= − 2
(2 + e ) ϕ0 ± 3 (e − 1) .
6πL m1 m2 a2 (e2 − 1)2
Usando le (7.73) possiamo esprimere questo risultato in termini della velocità asintotica
v0 e del parametro d’impatto b. Per fare questo è conveniente introdurre il parametro
adimensionale,
∓1 α π
γ=√ = , ϕ0 = − arctg γ.
2
e −1 µ v02 b 2
Si noti che nel caso attrattivo si ha γ < 0, mentre nel caso repulsivo risulta γ > 0. Dopo
semplici passaggi si ottiene allora,
µ ¶2 h ³π ´ i
µ3 v05 e1 e2 2
∆ε = − (3γ + 1) − arctg γ − 3γ γ 3 . (7.79)
6π α m1 m2 2
Notiamo che per parametri d’impatto grandi, corrispondenti a valori di γ piccoli, l’energia
irradiata va a zero, µ ¶2
α2 e1 e2 1
∆ε ≈ − , (7.80)
12 v0 m1 m2 b3

238
in accordo con il fatto che per b grandi le orbite si discostano poco da traiettorie rettilinee.
Parametri d’impatto piccoli. Se il parametro d’impatto va invece a zero, si ha un urto
frontale e,
|γ| → ∞.

In questo caso la (7.79) ha due andamenti diversi, a seconda che il potenziale sia attrat-
tivo o repulsivo. Nel caso attrattivo si ha γ → −∞, e entrambi i termini tra le parentesi
quadre in (7.79) vanno a più infinito. Anche l’energia irradiata tende quindi a più in-
finito, in accordo con il fatto che l’accelerazione diverge quando le particelle collidono.
Si noti, tuttavia, che in questo caso anche la velocità delle particelle va a più infinito, e
l’approssimazione non relativistica non è più valida.
Nel caso repulsivo le particelle si avvicinano invece solo fino alla distanza minima,


rm = ,
µ v02

e l’energia totale irradiata deve quindi essere finita. In questo caso il parametro γ tende
a +∞, ed eseguendo il limite nella (7.79) si trova,
µ ¶2
2 µ3 v05 e1 e2
∆ε0 ≡ lim ∆ε = − . (7.81)
γ→∞ 45 π α m1 m2

Per renderci conto dell’entità dell’energia irradiata assumiamo che una delle due particelle
sia molto più pesante dell’altra, m2 À m1 , e che le cariche siano uguali, come succede
per esempio nell’urto protone/positrone. In queste condizioni il processo equivale all’urto
della particella leggera contro la particella pesante, considerata praticamente a riposo. Si
ha allora µ ≈ m1 e α = e2 /4π, e otteniamo,

8 m1 v05
∆ε0 ≈ .
45
1
Infine, dato che ora ε ≈ 2
m1 v02 , per la diminuzione relativa dell’energia della particella
leggera durante l’urto otteniamo,

∆ε0 16 ³ v0 ´3
≈ .
ε 45 c

Siccome siamo nel limite non relativistico abbiamo v0 ¿ c, e quindi ∆ε0 /ε ¿ 1. Come nel
caso (7.80) la perdita di energia per irraggiamento è quindi completamente trascurabile.

239
Nel prossimo capitolo analizzeremo il fenomeno dell’irraggiamento nel limite ultrarela-
tivistico, ovvero per v ≈ c, e vedremo che le conseguenze saranno drasticamente diverse.
Vedremo, infatti, che per velocità prossime alla velocità della luce gli effetti radiativi
possono dare luogo a perdite di energia notevoli, anche negli urti dovuti all’interazione
coulombiana.

7.3.6 La radiazione dell’atomo d’idrogeno classico

In questo paragrafo illustriamo brevemente il quadro fenomenologico che emergerebbe


per l’atomo d’idrogeno, se la sua dinamica fosse governata dalle leggi della fisica classica.
Concentreremo la nostra analisi sullo stato fondamentale dell’atomo, che classicamente
corrisponde all’elettrone che compie un moto circolare uniforme attorno al protone, con
velocità v ¿ 1. Possiamo allora applicare le formule derivate nel paragrafo precedente
per il moto ellittico, nel caso particolare di eccentricità nulla.
Dato che il protone è molto più pesante dell’elettrone vale m2 À m1 ≡ m e µ ≈ m,
e2
e inoltre in questo caso abbiamo α = − e r = a. Siccome la forza centripeta vale

2 2
mv e
= , l’energia totale e la velocità angolare dell’elettrone diventano, vedi (7.69),
r 4πr2
r r
e2 1 2 v e2 r0 m e4
ε=− = − mv , ω= = = = , (7.82)
8πr 2 r 4π m r3 r3 (4π)2 ~ 3

dove abbiamo introdotto il raggio classico r0 dell’elettrone, e identificato r con il raggio


di Bohr, vedi (7.63).
Il moto dell’elettrone è periodico con periodo T = 2π/ω, e la sua accelerazione ~a(t) è
quindi una funzione periodica semplice. Secondo le (7.45) il campo di radiazione è allora
costituito da una singola onda monocromatica di frequenza ω. Concludiamo che l’atomo
d’idrogeno classico emetterebbe radiazione unicamente sulla frequenza fondamentale ω.
Come vedremo più avanti, vedi sezione 10.4, una particella relativistica in moto circolare
uniforme emette, invece, radiazione su tutte le frequenze ωN = N ω, con N intero. Queste
previsioni sono comunque in contrasto con la formula quantistica di Rydberg, che prevede
le frequenze di emissione,
µ ¶
1 1 1 m e4
ωM N = 2
− 2 ,
2 N M (4π)2 ~ 3

240
dove N e M sono interi.
Torniamo ora al calcolo della potenza emessa dall’atomo classico. Ponendo nella (7.78)
l’eccentricità uguale a zero si ottiene,
µ 2 ¶2
e e2 e2 r02 e2 4 2
W= = = ω r , (7.83)
4π 6π m2 r4 6π r4 6π

in accordo con la formula di Larmor (6.128). Siccome W = − abbiamo dunque quan-
dt
tificato la perdita di energia dell’atomo. Ma dato che ε ∝ −1/r questa perdita comporta
anche una diminuzione del raggio. Dalle (7.82), (7.83) si ottiene la variazione relativa,

1 dr 1 dε 4 r2
=− = − 03 ≈ −2 · 1010 /s,
r dt ε dt 3r

dove abbiamo sostituito i valori (7.62), (7.63). Si vede che il raggio dell’orbita dell’elet-
trone si ridurrebbe a metà in meno di 10−10 s, e l’atomo di idrogeno classico collasserebbe
nella frazione di un secondo ! Si noti in particolare che la velocità dell’elettrone andrebbe
allora a più infinito, vedi (7.82).
È comunque interessante calcolare la diminuzione relativa dell’energia dell’atomo du-
rante un ciclo,
∆ε TW 2πW 8π ³ r0 ´3/2
= = = ≈ 3 · 10−6 ,
ε ε ωε 3 r
che è in realtà una frazione molto piccola. Quello che in ultima analisi fa collassare l’atomo
di idrogeno classico in pochissimo tempo è la brevità di un ciclo,
r
2π r r
T = ≈ 1.4 · 10−16 s.
c r0

Per concludere aggiungiamo che la velocità dell’elettrone è data da,


r
v r0
= ωr = ≈ 0.7 · 10−2 ,
c r

ed era quindi corretto affrontare il problema nell’approssimazione non relativistica di


dipolo.
Conlcudiamo questo paragrafo con un caveat sui limiti di validità della nostra analisi.
Da un punto di vista quantitativo l’analisi quı̀ eseguita è infatti valida solo fino a quando
il raggio dell’orbita dell’elettrone non varia apprezzabilmente. Se il raggio non è costante
non è più costante nemmeno l’accelerazione da inserire nella formula di Larmor, e anche la

241
potenza emessa varierebbe nel tempo. L’equazione del moto dell’elettrone dovrebbe allora
essere risolta tenendo conto della perdita di energia attraverso la formula di Larmor, la
quale coinvolge a sua volta l’accelerazione incognita. Le equazioni differenziali risultanti
sarebbero non lineari, e non risolubili in modo analitico. Per di più, come notato sopra, la
diminuzione del raggio porta a un aumento della velocità, la quale per r → 0 tenderebbe
a più infinito. Riassumendo, per affrontare il problema dell’atomo di idrogeno classico
in modo corretto, in linea di principio bisognerebbe risolvere le equazioni di Maxwell e
di Lorentz complete, come sistema accoppiato. Inoltre da un certo istante in poi non
è più lecito affrontare il problema nell’approssimazione non relativistica. Tuttavia, le
conclusioni qualitative della nostra trattazione restano comunque valide.

7.4 Radiazione di quadrupolo elettrico e di dipolo magnetico

Nei casi in cui la radiazione di dipolo è assente, ovverosia, quando la derivata seconda del
momento di dipolo si annulla,
~¨ = 0,
D

nello sviluppo in multipoli (7.30) diventa rilevante il termine perturbativo successivo,


cioè, quello lineare in ~n · ~y /c. Questo termine dà luogo alle cosiddette radiazioni di
quadrupolo elettrico e di dipolo magnetico, soppresse rispetto a quella di dipolo elettrico
di un fattore non relativistico v/c. In questa sezione determiniamo l’apporto all’eneriga
irradiata, dovuto a queste radiazioni. Per via della formula generale (7.17) è di nuovo
sufficiente determinare la parte spaziale del quadripotenziale.
~ fino all’ordine 1/c2 . Riprendiamo lo sviluppo (7.30), considerando ora
Il potenziale A
anche il termine lineare in ~n · ~y /c. Sottintendendo che la quadricorrente j µ è valutata in
(t − r, ~y ), e ponendo c = 1, abbiamo allora,
Z ³ ´
i 1
A = j i + (nk y k ) ∂t j i d3 y,
4πr
· Z µ ¶ ¸
1 i k 1¡ k i i k
¢ 1¡ k i i k
¢ 3
= Ḋ + n ∂t y j −y j + y j +y j dy
4πr 2 2
µ Z ¶
1 i ik k 1 k ¡ k i i k
¢ 3
= Ḋ − Ṁ n + n ∂t y j +y j d y . (7.84)
4πr 2

242
Abbiamo definito il tensore tridimensionale antisimmetrico,
Z
ik 1 ¡ i k ¢
M ≡ x j − xk j i d3 x,
2
legato al momento di dipolo magnetico,
Z
~ ≡1
M d3 x ~x × ~j,
2
dalle relazioni,
1 ijk jk
Mi = ε M , M ij = εijk M k . (7.85)
2
Per un sistema di particelle, per cui,
X
~j(t, ~x) = er ~vr (t) δ 3 (~x − ~yr (t)),
r

si ha in particolare,
X
~ =1
M er ~yr × ~vr . (7.86)
2 r
L’ultimo termine in (7.84) può invece essere valutato introducendo il momento di quadru-
polo elettrico Dij della distribuzione di carica, e la sua versione “ridotta” Dij , a traccia
nulla,
Z
ij 1 ij kk
D = d3 x xi xj ρ, ρ = j 0, Dij = Dij − δ D , Dii = 0. (7.87)
3
L’ultimo termine nella (7.84) può infatti essere espresso in termini di Dij sfruttando
l’identità,
Z
ij
¡ ¢
Ḋ = xi j j + xj j i d3 x,

analoga alla (7.36). La si dimostra – come nel caso di quest’ultima – con un’integrazione
per parti, usando la conservazione della quadricorrente, e ricordando che j µ ha supporto
compatto,
Z Z Z
ij i j 0 3
¡ ¢
Ḋ = x x (∂k j )d x = ∂k xi xj j k d3 x
x x ∂0 j d x = − i j k 3

Z Z
¡ i j i j
¢ k 3 ¡ i j ¢
= δk x + x δk j d x = x j + xj j i d3 x.

Otteniamo quindi,
µ ¶
i 1 i 1 ij j ij j
A = Ḋ − Ṁ n + D̈ n
4πr 2
µ µ ¶ ¶
1 i ij j 1 ij 1 ij kk D̈kk i
= Ḋ − Ṁ n + D̈ − δ D̈ nj + n, (7.88)
4πr 2 3 24πr

243
dove abbiamo tolto e aggiunto lo stesso termine. Consideriamo ora l’ultimo termine di
questa espressione. Dalla definizione (7.87) risulta che Dkk è funzione solo di t − r, perché
nell’integrale la densità di carica ρ è valutata in (t − r, ~x). Questo ci permette di scrivere,
à ! µ ¶
D̈kk (t − r) i i Ḋkk (t − r) 1
n =∂ +o 2 . (7.89)
24πr 24πr r

Il termine o(1/r2 ) è ininfluente perché il potenziale è valutato nella zona delle onde. Inoltre
1
sappiamo che una funzione del tipo r
f (t − r) soddisfa l’equazione delle onde per r 6= 0,
vedi problema 5.7. Questo ci permette di concludere che l’ultimo termine nella (7.88)
può essere eliminato con una trasformazione di gauge residua, Ai → Ai + ∂ i Λ, 2Λ = 0,
scegliendo,
Ḋkk (t − r)
Λ=− .
24πr
Alla stessa conclusione si giunge osservando che un contributo ad Ai che è proporzionale a
ni , come quello in (7.89), comunque non contribuisce alla potenza (7.17), perché Λij nj = 0.
Ritroviamo il fatto che l’energia, essendo una quantità osservabile, è invariante sotto
trasformazioni di gauge.
In definitiva, a meno di una trasformazione di gauge, e ripristinando la velocità della
luce, otteniamo per il potenziale corretto fino all’ordine 1/c2 ,
µ ¶
i 1 i 1 ij j 1 ij j
A = Ḋ − Ṁ n + D̈ n . (7.90)
4πr c c 2c

In questa approssimazione il campo nella zona delle onde risulta quindi sovrapposizione
lineare di un campo di dipolo elettrico, un campo di dipolo magnetico e un campo di
quadrupolo elettrico. Gli ultimi due sono soppressi di un fattore 1/c rispetto al primo, e
costituiscono quindi correzioni relativistiche di ordine superiore. Confrontando la (7.43)
con la (7.86) si vede in particolare che, schematicamente, si ha,

M ij ∼ v Di .

La potenza totale. In presenza dei campi di dipolo magnetico e di quadrupolo elettrico


la distribuzione angolare della potenza emessa (7.17) esibisce ora una dipendenza dagli
angoli abbastanza complicata, perché ora ni compare non solo in Λij , ma anche in Ai .

244
Ciononostante è ancora possibile derivare un’espressione compatta per la potenza totale.
Integrando la (7.17) sull’angolo solido si ottiene infatti,
Z
r2
W = (Ȧi Ȧj Λij ) dΩ (7.91)
c
  
Z ik ˙ ik
jl ˙ jl
1 M̈ D̈ M