Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
che è stata svolta qui, seguendo Planck e Levi–Civita. Si noti in particolare che la relazione E = mc2
viene data da Einstein non nell’originario articolo del 1905, dal titolo L’elettrodinamica dei corpi
in movimento, ma in una brevissima nota successiva, dal titolo L’inerzia di un corpo dipende dal
suo contenuto di energia?, in cui si fa un uso essenziale delle proprietà del campo elettromagnetico,
anziché della pura dinamica di una particella.
257
258 Andrea Carati e Luigi Galgani
prima parte la trattazione viene svolta a livello “elementare”, ovvero senza fare ri-
corso al calcolo tensoriale, come d’altra parte avviene nella trattazione di Einstein.
Preliminarmente, verranno forniti dei richiami sulle equazioni di Maxwell in modo
da costruire un ponte con la trattazione familiare allo studente dai corsi di Fisica
Generale.
In una seconda parte le equazioni di Maxwell e le equazioni di moto per una
particella in campo elettromagnetico vengono poi discusse con i metodi del calcolo
tensoriale (che Einstein utilizzò in una fase successiva, quando ne ebbe bisogno per
formulare la relatività generale). È ovvio che questa trattazione richiederebbe dun-
que un lungo excursus di tipo geometrico sul calcolo tensoriale, che nel presente
corso non abbiamo la possibilità di svolgere in maniera completa. Si deve dunque
compiere un difficile compromesso. Siamo fiduciosi che la scelta qui compiuta
possa risultare positiva.
circostanza mostra che la distinzione tra campo elettrico e campo magnetico (ov-
vero il corrispondente spezzamento della forza di Lorentz) è relativa e non assoluta
(cioè dipende dal sistema di riferimento). Su questo punto importante ritorneremo
più sotto, mostrando che i campi E ed H costituiscono una unità (Tensore di Fa-
raday, di ordine 2 ed emisimmetrico) nello spaziotempo, nello stesso senso in cui
costituisce una unità un vettore in IRn , che è un oggetto assoluto, ovvero indipen-
dente dalla base eventualmente scelta (mentre le componenti del vettore non sono
assolute, ma dipendono dalla base). Ma per ora procediamo in maniera elementare.
Le equazioni di Maxwell nel vuoto hanno la forma (usiamo il sistema CGS
elettromagnetico, forse poco familiare allo studente, ma la scelta delle unità è del
tutto irrilevante)
div H = 0
1 ∂H
rot E + = 0 (6.1.2)
c ∂t
div E = ρ
1 ∂E
rot H − = j/c , (6.1.3)
c ∂t
dove ρ = ρ(t, x), j = j(t, x) sono la densità di carica e la densità di corrente, che si
pensano assegnate funzioni di (t, x) (materia data o assegnata, come si usa dire),
mentre c è la velocità della luce nel vuoto.4 Le prime due equazioni si dicono
costituire la coppia omogenea (non hanno secondi membri), mentre le altre due
costituiscono la coppia non omogenea, o con sorgenti. Come si vede, si tratta di
equazioni lineari nei campi, sicché vale il principio di sovrapposizione (che è un
teorema): “i campi generati da (ρ1 + ρ2 , j1 + j2 ) sono la somma dei campi creati da
(ρ1 , j1 ) e da (ρ2 , j2 )”.
Dove appare il tempo t, lı̀ c’è sempre c, in maniera che appaia la formazione ct (sicché si potrebbe
prendere come variabile in luogo del tempo la quantità τ = ct). Per questo motivo avviene anche
che la velocità v appare sempre nella forma v/c (si pensi v come la derivata della posizione di una
particella rispetto al tempo), e lo stesso avviene per la corrente o la densità di corrente (perché la
densità di corrente dovuta a una particella è proporzionale alla sua velocità).
5 Ovvero, div B = 0 , rot E + ∂B = 0 , div D = ρ , rot H = j + ∂D , B = µ H , D = ε E. Si veda
∂t ∂t 0 0
ad esempio R. Becker, Electromagnetic fields and interactions, Dover (New York, 1964), Sez. 53,
pag. 257.
260 Andrea Carati e Luigi Galgani
rot E = 0
div E = ρ elettrostatica
div H = 0
rot H = j/c magnetostatica.
−∆A = j/c .
magnetostatica nel vuoto si riduce alla Legge di Biot e Savart, che può leggersi
dall’equazione rot H = j/c mediante il teorema di Stokes.
Nel caso generale (non statico) si passa alle equazioni di Maxwell cambiando
l’equazione rot E = 0 nell’equazione rot E + 1c ∂H∂t = 0, che traduce in termini diffe-
renziali la legge di induzione di Faraday (una variazione di campo magnetico pro-
duce un certo ben definito campo elettrico). Si pensi all’analogia con rot H = j/c.
Qui si ha rot E = − 1c ∂H ∂H
∂t : quindi, se è assegnato ∂t , questo campo svolge un ruolo
analogo a quello svolto da j nell’equazione di Biot e Savart, e quindi produce un
certo campo elettrico E analogo al campo magnetico H di Biot e Savart creato da
j.
Infine, nel passaggio all’elettromagnetismo
si cambia anche l’equazione rot H =
1 ∂E
j/c nell’equazione rot H = c j + ∂t che si legge nel modo seguente: una varia-
zione di campo elettrico produce un campo magnetico esattamente (a parte un se-
gno) come nella legge di Faraday una variazione di campo magnetico produce un
campo elettrico. In altri termini, 1c ∂E∂t agisce come una corrente elettrica e viene
detto corrente di spostamento8 . Proprio questo termine, introdotto da Maxwell per
pure ragioni teoriche, fa sı̀ che esistano le onde elettromagnetiche nel vuoto (l’a-
naloga proprietà in presenza di materia verrà dimostrata più sotto facendo uso dei
potenziali elettromagnetici). Si ha infatti la
1 ∂2
E = 0, H = 0 = 2 2
−∆ .
c ∂t
∂ρ
+ div j = 0 . (6.1.4)
∂t
8 Perché 1 ∂D
in effetti si dovrebbe considerare e il vettore D veniva chiamato “spostamento”
c ∂t ,
elettrico.
9 L’operatore viene chiamato “quadratello” oppure “dalembertiano”.
262 Andrea Carati e Luigi Galgani
(2002).
Meccanica Razionale 1: Teoria della relatività, parte seconda 265
attraverso una funzione χ(t, x) arbitraria. Quando si compie uan scelta si usa dire
che è stato scelto un “gauge”. In particolare, i potenziali possono essere scelti in
maniera di soddisfare la cosiddetta “condizione di Lorentz” (gauge di Lorentz)
1 ∂Φ
div A + =0 (6.1.7)
c ∂t
oppure la condizione (gauge di Coulomb)
div A = 0 . (6.1.8)
Φ = ρ
A = j/c . (6.1.9)
A0 = A + grad χ
con un arbitraria χ (perché rot grad χ = 0, sicché rot A0 = rot A). Ogni
scelta della funzione χ si dice costituire la scelta di un “gauge”. Tutta-
via, si richiede che, al variare della scelta di χ (al variare del gauge),
12 Ammettiamo qui di essere in un dominio opportuno: va bene ad esempio il caso in cui il dominio
è tutto IR3 . La dimostrazione di questi fatti è banalissima quando si usi la trasformata di Fourier.
Questo verrà esposto in un’appendice attualmente non ancora scritta.
266 Andrea Carati e Luigi Galgani
1 ∂Φ
f (t, x) := div A + 6= 0
c ∂t
0
e ricerchiamo un’opportuna χ in modo che sia div A0 + 1c ∂Φ
∂t = 0. Ma
si ha, in virtù delle (6.1.6),
1 ∂Φ0 1 ∂Φ 1 ∂2 χ
div A0 + = div A + + ∆χ − 2 2 = f (t, x) − χ .
c ∂t c ∂t c ∂t
1 1∂
ρ = div E = −div (grad Φ + Ȧ) = −∆Φ − div A ,
c c ∂t
1 ∂2 Φ
ρ = −∆Φ + = Φ.
c2 ∂t 2
13 In altri termini, si ammette che i campi siano “oggetti fisici”, vale a dire osservabili, e quindi
ben definiti come funzioni di t ed x. I potenziali invece, essendo non univocamente determinati,
vengono considerati come strumenti “nonfisici”, aventi una pura utilità matematica. In realtà, questo
atteggiamento tradizionale verso i potenziali è parso scosso dopo la scoperta del cosiddetto “effetto
Aharonov–Bohm”, che a prima vista sembrerebbe comportare che si debba attribuire significato fisico
ai potenziali. Ciò tuttavia non è vero. Rimandiamo la discussione ad una appendice (non ancora
scritta).
14 Anche questo fatto è ovvio quando si usa la traformata di Fourier.
Meccanica Razionale 1: Teoria della relatività, parte seconda 267
1 1 1
j/c = rot H − Ė = rot rot A + (grad Φ̇ + Ä) =
c c c
1 1
= grad div A − ∆A + grad Φ̇ + 2 Ä =
c c
1
= A + grad (div A + Φ̇) = A
c
15 Lostesso cui si deve la scoperta del campo gravitazionale “creato” da una particella puntiforme
nell’ambito della relatività generale. Questo risuktato venne illustrato in due famosi lavori scritti nel
1916 nell’ospedale di guerra di Brno, dove Schwarzschild morı̀ poco dopo.
268 Andrea Carati e Luigi Galgani
∂V (em)
∂v = −A/c, e dunque16
d ∂V (em)
1 ∂A
=− + (v · grad)A .
dt ∂v c ∂t
D’altra parte si ha
∂ (em) 1
V ≡ gradV (em) = grad Φ − grad(v · A) ,
∂x c
ovvero
∂iV (em) = ∂i ∑ Φ − vk ∂i Ak
k
(abbiamo denotato ∂i ≡ ∂
∂xi ). Si usa infine l’identità17 sicché
d ∂V (em) ∂V (em) 1 ∂A v v
− = −grad Φ − + × rot A = E + × H .
dt ∂v ∂x c ∂t c c
Q.E.D.
Ora, già in ambito non relativistico era ben noto che è possibile scrivere le
equazioni di moto di una particella in forma lagrangiana anche se si è in presenza
di forze Q dipendenti dalla velocità, purché tali forze Q ammettano un potenziale
generalizzato V , nel senso che si abbia
d ∂V ∂V
Q= − .
dt ∂v ∂x
Infatti, dalla formula del binomio lagrangiano già sappiamo che l’equazione ma =
F con F = −gradV0 può scriversi nella forma
d ∂L0 ∂L0
− =0
dt ∂v ∂x
con
L0 = T −V0
(T = 21 mv2 ). Dunque, se si considera l’equazione
ma = F + Q
16 Si usa, come al solito ddtf = ∂∂tf + (grad f ) · ẋ se f = f (t, x) e si ammette x = x(t) sicché si
introduce la funzione f˜(t) := f (t, x(t)). Per un abuso di linguaggio si denota poi f˜ ≡ f . Nel nostro
caso, invece di f si ha il vettore A e si considera separatamente ogni componente Ai di A. Per
semplicità di notazione scriviamo (grad Ai ) · v ≡ (v · grad)Ai , esattamente come si fa per le equazioni
di Eiulero dei fluidi perfetti.
17 Si tratta in sostanza della nota identità del doppio prodotto vettore, adattata all’operatore
con
d ∂V ∂V
F = −gradV0 , Q= − ,
dt ∂v ∂x
tale equazione può scriversi nella forma
d ∂L ∂L
− = 0, L = L0 −V .
dt ∂v ∂x
In questo senso, dunque, le equazioni di moto per le particelle soggette a forze di-
pendenti dalla velocità ma ammettenti un potenziale generalizzato possono essere
scritte in forma lagrangiana.
Nel nostro caso, abbiamo una particella carica soggetta a forza di Lorentz, che
ammette il potenziale generalizzato V (em) . Si ha dunque la
Proposizione 4 L’equazione di Newton (nonrelativistica)
v
ma = e (E + × H)
c
è equivalente all’equazione di Lagrange
d ∂L ∂L
− =0
dt ∂v ∂x
dove la lagrangiana L è definita da
1
L = mv2 − eV (em) . (6.2.1)
2
Abbiamo ora il problema di postulare una forma per l’equazione di moto di una
particella relativistica in presenza di campi E ed H assegnati, o equivalentemente
in presenza dei corrispondenti potenziali Φ ed A. La più semplice scelta possibi-
le che si riduca all’equazione non relativistica ma = F(em) per piccole velocità si
ottiene procedendo in modo analogo a quello del caso nonrelativistico, usando ora
ovviamente la corretta “lagrangiana meccanica”
q
L(mecc) = −mc2 1 − v2 /c2 . (6.2.2)
d v
(mγv) = e(E + × H) (6.2.4)
dt c
Veniamo ora al teorema dell’energia. In meccanica nonrelativistica questo si
ottiene mpltiplicando scalarmente per la velocità v l’equazione ma = F, e si ha in
tal modo Ṫ = F · v dove T = (1/2)mv2 è l’energia cinetica. In ambito relativistico
il teorema dell’energia si ottiene analogamente moltiplicando scalarmente per v la
(6.2.4). Si ha allora la1819
d
mγc2 = eE · v . (6.2.5)
dt
d d
v· mγv = mγc2 ,
dt dt
e questo è un utile esercizio.20 Q.E.D.
∂L
p= (6.2.7)
∂v
18 Landau chiama energia cinetica la quantità E = mγc2 , anche se essa contiene l’energia a riposo
mc2 .
19 Si noti che alla variazioe di energia non contri buisce il campo magnetico, perché esso esercita
Pertanto, ricordando che L(mecc) dt = −mc ds, otteniamo che l’azione S relativa
R R
È molto istruttivo a questo punto confrontare il metodo qui seguito per giustifi-
care questo assioma, con il metodo seguito da Landau e Lifshitz (Teoria dei campi).
Noi abbiamo scelto un procedimento di tipo induttivo, che può forse avere qualche
utilità dal punto di vista pedagogico. Non vi è dubbio tuttavia che il procedimento
diretto e compatto di Landau e Lifshitz è estremamente più comodo e significativo,
almeno quando si sia in grado di apprezzarlo pienamente.
veda la formula (10) a pag. 45. Nelle nostre notazioni, tale formula si legge x0 = x − vt, y0 = γ−1 y,
z0 = γ−1 z, t 0 = t − vx/c2 . Quindi, per ottenere le trasformazioni di Lorentz occorre passare dalle
variabili primate ad altre che si ottengono moltiplicando quelle primate per γ. Tuttavia, ai fini che si
proponeva Voigt questo fatto è inessenziale.
274 Andrea Carati e Luigi Galgani
notazione c = 1. Definiamo22
∂2 u ∂2 u ∂2 ∂2
u ≡ 2 − 2 ≡ − u;
∂t ∂x ∂t 2 ∂x2
l’operatore viene detto “dalembertiano” e mediante esso l’equazione di d’Alem-
bert prende la forma
u = 0 .
Nel capitolo sull’equazione di d’Alembert abbiamo già osservato che, quando si
considera una equazione, in generale essa cambia di forma se si esegue un cam-
biamento di variabili: ad esempio passando dalle coordinate (t, x) alle coordina-
te (ξ, η) = (t − x,t + x) l’equazione di d’Alembert assume la forma (denotiamo
∂x ≡ ∂x∂
, ∂2xx ≡ ∂x ∂x etc)
∂ξ ∂η u = 0 ,
e anzi proprio di questo artificio ci siamo serviti per integrare l’equazione. Si ha
invece la
Proposizione 8 Il dalembertiano non cambia forma sotto trasformazioni di Lo-
rentz, ovvero si ha
0 =
dove 0 = ∂t20t 0 − ∂2x0 x0 , = ∂tt2 − ∂2xx .
= γ2 (1 − v2 ) 0 = 0 .
Q.E.D.
22 Consideriamo il caso di una sola dimensione spaziale
23 Questa identità operatoriale è analoga alla familiare identità algebrica a2 − b2 = (a + b) (a − b).
Meccanica Razionale 1: Teoria della relatività, parte seconda 275
c2t 02 − l 02 = c2t 2 − l 2 .
∂2 ∂2 ∂2 ∂2
+ = +
∂x2 ∂y2 ∂x0 2 ∂y0 2
x02 + y02 = x2 + y2
E = Ek + E⊥ , H = Hk + H⊥
E0 = E0 k + E0 ⊥ , H0 = H0 k + H0 ⊥ .
j = jk + j⊥ , j0 = j0 k + j0 ⊥ .
Si ha allora la
276 Andrea Carati e Luigi Galgani
E0 k = Ek
E0 ⊥ = γ(E⊥ − H × v)
H0 k = Hk
H0 ⊥ = γ(H⊥ + E × v)
ρ0 = γ(ρ − v jx )
j0 x = γ( jx − vρ)
j0 ⊥ = j⊥ (ovvero jy0 = jy , jz0 = jz ) .
∂t H + rot E = 0 , div H = 0 ;
∂t Hx = ∂z Ey − ∂y Ez , ∂x Hx = −(∂y Hy + ∂z Hz ) . (6.3.3)
∂t 0 Hx = γ[∂t Hx + v∂x Hx ] ,
24 Si
ua il fatto che, a causa della contrazione delle lunghezze lungo la direzione di traslazione di
K0 rispetto a K (mentre restano inalterate le lunghezze trasversali), passando da K a K 0 i volumi si
contraggono del fattore γ−1 . Dunque, dovendo restare inalterata la carica contenuta in un volume,
deve cossispondentente variare la desità di carica.
25 A parte la notazione, seguiamo qui quasi alla lettera il paragrafo 6 del lavoro di Einstein del
1905.
Meccanica Razionale 1: Teoria della relatività, parte seconda 277
∂t Hx = ∂z Ey − ∂y Ez
si vede allora che le due equazioni sono della stessa forma se si pone26
ovvero
H0k = Hk , E0⊥ = γ(E⊥ − H × v) .
∂t Ex = ∂y Hz − ∂z Hy − jx , ∂x Ex = −(∂y Ey + ∂z Ez ) + ρ ,
e si ottiene
div0 E0 = γ (ρ − v jx ) ,
ρ0 = γ(ρ − v jx ) .
Q.E.D.
26 In effetti, basterebbe porre Hx0 = αHx , Ey0 = αγ(Ey − vHz ), Ez0 = αγ(Ez + vHy ) con una costante
α (dipendente parametricamente da v). Ma, come nel capitolo precedente, si assume α = α(v2 ) e si
mostra α2 = 1, da cui α = 1 per continuità in v = 0.
27 Basta usare le relazioni già trovate E 0 = E , E 0 = γ(E − vH ), E 0 = γ(E + vH ), ∂ 0 = γ(∂ +
x x y y z z z y x x
v∂t ), ∂y0 = ∂y , ∂z0 = ∂z .
278 Andrea Carati e Luigi Galgani
Da ciò segue in particolare, come già osservato, che l’azione S relativa alla parti-
cella in campo elettromagnetico ha carattere geometrico nello spaziotempo.
In effetti, il calcolo tensoriale era già stato sviluppato nell’ambito degli spazi
vettoriali e più in generale delle varietà differenziabili, ed esposto in un classico la-
voro28 29 di Ricci e Levi Civita del 1901, con cui tuttavia Einstein non era familiare
nel 1905. Il contributo di Minkowski consistette sostanzialmente nell’estendere tali
metodi al caso in cui la varietà è lo spaziotempo della relatività ristretta, concepito
dunque come una varietà piatta, ovvero come uno spazio vettoriale, con la peculia-
rità però di essere munita di un prodotto scalare non definito positivo anziché del
prodotto scalare consueto.
È proprio questo l’elemento caratteristico che costringe anche noi, a questo
punto, a introdurre degli elementi geometrici che lo studente aveva potuto finora
ignorare. In breve si tratta di rendersi conto di quanto segue:
• Quando si ha a che fare con uno spazio vettoriale, diciamolo V , si deve tenere
conto del fatto che esistono non solo i vettori, diciamoli x, y, v, w, elemen-
ti dello spazio V stesso, ma anche i covettori, ovvero funzionali lineari su
V (che definiremo subito sotto, come anche altre altre quantità algebriche,
come i funzionali multilineari);
• Ora, come mai questo fatto ha potuto essere ignorato nelle trattazioni ele-
mentari della fisica? Ciò è dovuto al fatto che lo spazio ordinario è munito di
un prodotto scalare, perdipiù euclideo (cioè definito positivo). Infatti da una
parte l’esistenza di un prodotto scalare (o di una metrica, come anche si dice)
comporta (come vedremo più sotto) che esiste un isomorfismo naturale tra
covettori e vettori, cioè che ad ogni covettore corrisponde biunivocamente (e
in maniera intrinseca) un vettore, sicché i covettori possono nella sostanza
scomparire, o piuttosto essere ignorati, rimanere in qualche modo nascosti,
in ombra. Ma questo nascondimento è ancor più favorito, in pratica, nel caso
in cui la metrica è anche euclidea. Infatti, in tal caso, se si scelgono vettori
base ortonormali rispetto alla metrica considerata (cioè se si scelgono coor-
dinate cartesiane ortoganali), risulta che le componenti che individuano un
vettore addirittura coincidono con le componenti del corrispondente covet-
tore. Dunque, concretamente, lavorando in coordinate cartesiane ortoganali
si ha che vettori e corrispondenti covettori materialmente coincidono, e si
può comportarsi proprio come se i covettori non esistessero. Ed è proprio in
questo spirito che viene condotto l’insegnamento universitario elementare.
Dobbiamo dunque cominciare col prendere atto che esistono i covettori, e do-
vremo pertanto abituarci a distinguere le componenti dei vettori da quelle dei co-
vettori. Entra qui sulla scena il gioco degli indici, sul quale faremo un breve com-
mento qui sotto: infatti le componenti xi dei vettori vengono denotate con indici in
alto, quelle αi dei covettori con indici in basso.30 Vedremo inoltre che il prodotto
scalare è un funzionale bilineare, con coefficienti che hanno dunque indici in bas-
so, gik . Dovremo poi imparare a maneggiare l’isomorfismo tra vettori e covettori
indotto dalla metrica, il quale viene poi concretamente realizzato mediante l’ope-
razione di abbassamento e innalzamento degli indici. Poche altre cose saranno
infine sufficienti per procedere (regola della traccia, ....).31
sentito dire, lo spaziotempo è concepito come varietà curva, con curvatura legata alla gravità, allora
si ha bisogno di pochi altri strumenti. Precisamente: il tensore di curvatura e la derivata covariante,
Questa era già sostanzialmente nota alla fine del diciannovesimo secolo, e di uso comune anche
negli spazi piatti quando si usano coordinate generali (non cioè cartesiane ortognali), ad esempio per
determinare la struttura dell’operatore laplaciano. Questa nozione è in stretta relazione con quella di
connessione geodetica (introdotta da Levi Civita nel 1916, e subito estesa da Weyl a spazi non muniti
di metrica), che è necessaria per generalizzare la nozione di parallelismo, e quindi confrontare vettori
di spazi tamgenti diversi, come si fa esempio quando si definisce l’accelerazione.
Meccanica Razionale 1: Teoria della relatività, parte seconda 281
1952).
33 Il riassunto è il seguente. “The study of tensor calculus is, without doubt, attended by conceptual
difficulties – over and above the apprehension inspired by indices, which must be overcome. From
the formal aspect, however, the method of reckoning used is of extreme simplicity; it is much easier
than, e.g., the apparatus of elementary vector–calculus. There are two operations, multiplication
and contraction; then putting the components of two tensors with totally different indices alongside
of one another; the identification of an upper index with a lower one, and, finally, summation (not
expressed) over this index.
282 Andrea Carati e Luigi Galgani
I covettori. Possiamo ora dire come si definiscono i covettori (rispetto allo spazio
vettoriale V ): essi sono i funzionali lineari su V , cioè le applicazioni (funzioni!) α
a valori reali, con dominio V ,
α : V → IR
aventi la proprietà di linearità, ovvero che
gonali sugli assi, che è una nozione che richiede l’esistenza di un prodotto scalare. Qui non esiste
ancora nessun prodotto scalare. Eventualmente, esiste solo la “proiezione per parallelismo”, che
corrisponde all’uso della “regola del parallelogrammo”.
Meccanica Razionale 1: Teoria della relatività, parte seconda 283
αi = α(ei ) (i = 1, . . . , n) .
∑ xi ei = ∑ xi α(ei ) = ∑ αi xi ≡ αi xi ,
α(x) = α
i i i
ovvero:
α(ei ) = αi (i = 1, . . . , n) , (6.4.2)
α(xi ei ) = αi xi . (6.4.3)
fatto è illustrato in Appendice, insieme con un’altra osservazione relativa alla rap-
presentazione dei covettori mediante iperpiani nello spazio vettoriale V , che è di
particolare interesse per lo studio della propagazione di onde piane.37
∂f
∂i f ≡ (6.4.4)
∂xi
che viene solitamente chiamata il gradiente di f e considerata come un vettore. Ma
si vede subito che si tratta invece di un covettore (o meglio, di un campo covet-
toriale, ovvero una legge che attribuisce un covettore ad ogni punto di coordinate
x1 , . . . , xn ). Infatti, basta a tal fine ricordare la definizione di derivata direziona-
le e osservare che (∂i f ) vi è proprio la derivata direzionale di f nella direzione
(v1 . . . , vn ). Si tratta quindi di una quantità assoluta, indipendente dalla base, che
dipende linearmente dal vettore con componenti vk : dunque per definizione abbia-
mo a che fare con un covettore. Confermeremo questo fatto più sotto, controllando
che, sotto cambiamento di coordinate, la n–upla ∂i f si trasforma proprio come
richiesto per le componenti di un covettore.
g(v, w) = 0 ∀w comporta v = 0 .
.
39 Questa è la traduzione della proprietà di nondegenerazione.
Meccanica Razionale 1: Teoria della relatività, parte seconda 285
(la funzione) “prendere il prodotto scalare con il fissato vettore v”: in formule
αv (·) = g(v, ·) .
gik = g(ei , ek ) ,
e vengono introdotte in maniera del tutto naturale. Infatti, nella base {ei } i due
vettori v, w si scrivono v = vi ei , w = wk ek e dunque, per la bilinearità del prodotto
scalare g, si ha
ed è chiaro che {αk } è proprio il covettore g(v, ·) che si ottiene fissando v nel
prodotto scalare. Per questo motivo le componenti del covettore α ≡ αv vengono
denotate addirittura cone vk , perchè sono le componenti del covettore univocamen-
te associato al vettore v, e dunque si scrive vk := gik vi . Anzi, poiché si assume
che il prodotto scalare sia simmetrico, g(v, w) = g(w, v), sicché gik = gki , si scrive
anche
vk = gki vi
È questa l’operazione di abbassamento dell’indice.
Veniamo ora all’innalzamento dell’ indice, procedendo nella maniera più piatta
possibile. Ritornando alla notazione αk = gik vi per il covettore αk univocamente
associato al vettore vi , è ovvio che la corrispondenza inversa si scrive nella forma
vi = gik αk
dove gik sono gli elementi della matrice inversa di {gik } (la ragione degli indici in
alto si comprenderà più avanti), ovvero definiti da
αi = gik αk .
sopra. In altri termini, più in generale, sia data una qualsiasi varietà (differenzia-
bile) M, che localmente possiamo riferire a una carta con coordinate x1 , . . . , xn .40
Allora in ogni punto di M, individuato dalle coordinate x = (x1 , . . . , xn ). è definito
lo spazio vettoriale tangente alla varietà (denotato con Tx M), i cui elementi sono
nient’altro che le velocità di tutti i movimenti (curve parametrizzate) che passano
per quel punto. Dal capitolo sulle equazioni di Lagrange abbiamo imparato come
l’assegnazione delle coordinate locali x = (x1 , . . . , xn ) definisca naturalmente una
base vettoriale (che abbiamo chiamato base coordinata) in ciascun spazio tangente
Tx M.
Dunque la situazione che ci interessa è quella di una varietà (che per noi poi
sarà lo spaziotempo, isomorfo ad IR4 ) in cui si hanno delle coordinate (x1 , . . . , xn )
oppure (x0 1 , . . . , x0 n ) (due diverse carte; nel nostro caso, le coordinate rispetto a due
sistemi inerziali K, K 0 ). In ogni punto di tale spazio è definito lo spazio vettoriale
tangente Tx M. Questo spazio prende il posto di V , e ad esso possiamo dunque asso-
ciare lo spazio duale Tx∗ M (spazio dei funzionali lineari relativi a Tx M), e cosı̀ anche
possiamo considerare i funzionali bilineari. Per definizione, un campo vettoriale
su M è una funzione che ad ogni punto x di M associa un vettore di Tx M; analoga-
mente un campo covettoriale è una funzione che ad ogni punto x di M associa un
elemento di Tx∗ M. Cosı̀, anche, assegnare una metrica (o un prodotto scalare) vuol
dire dare una funzione che ad ogni punto x di M associa un funzionale bilineare su
Tx M (che sia simmetrico e nondegenere).
0i
Tra l’altro, si noti che nella prima relazione figura la matrice jacobiana ∂x ∂xk
,
mentre nelle seconda appare la sua inversa (anzi, la trasposta dell’inversa), come si
vede in virtù della relazione41
∂x0 i ∂xk
= δil (6.4.8)
∂xk ∂x0 l
ovvero
∂x0 i
α0i per ogni (v1 , . . . , vn ) ∈ IRn ,
k
− αk v =0
∂xk
0i
ovvero44 α0i ∂x
∂xk
− αk = 0 , k = 1, . . . , n, o anche
∂x0 i
αk = α0i . k = 1, . . . , n .
∂xk
∂x k
Moltiplicando per ∂x 0 l , sommando su k e usando la (6.4.8) (e cam-
biando nome agli indici) si ottiene infine la seconda delle (6.4.6).
Q.E.D.
dei vettori base ei (per questo hanno entrambi gli indici in basso), mentre le componenti dei vettori
cambiano in maniera “contraria” (contravariano) rispetto a come cambiano i vettori base (per questo
hanno gli indici in alto, come i covettori–base εi , che contravariano anch’essi.
290 Andrea Carati e Luigi Galgani
consiste nel fatto che non ci si deve ricordare se si debba fare interve-
nire la matrice jacobiana o la sua inversa (o addirittura la trasposta
di quest’ultima).
α0i v0 i = αk vk
∂x j ∂xl
g0ik = g jl , (6.4.10)
∂x0 i ∂x0 k
ovvero le componenti gik della matrice definente la metrica si com-
portano in maniera covariante. Si dice che la metrica è un tensore
doppio, due volte covariante.
vi = gik αk ,
tensoriale data nel citato articolo di Einstein (si veda la formula (6) relativa ai “vettori covarianti”).
Si tratta di un esempio particolare di quello che Einstein chiama “un teorema che sarà spesso utile
per mettere in evidenza il carattere tensoriale” (parte finale del paragrafo 7).
Meccanica Razionale 1: Teoria della relatività, parte seconda 291
∂x0 i ∂x0 k jl
g0 ik = g , (6.4.11)
∂x j ∂x l
α : V → IR , v : V ∗ → IR ,
Definizione dei campi tensoriali. Si capisce in tal modo come si possa pervenire
alla seguente
Definizione: Data una varietà M e una sua carta locale con coordi-
nate x1 , . . . xn , un tensore (o meglio un campo tensoriale) di tipo r, s
(ovvero r volte contravariante, s volte covariante) è individuato da
j ,..., j
componenti Ti1 1,...,is r con la proprietà che, al cambiare della carta (ov-
vero sotto trasformazione delle coordinate), le nuove componenti sono
j ,..., j
date da T 0 i11,...,isr , dove
αi vi = α0k v0 k .
E infatti si ha49
= δlk αl vk = αl vl
48 Si tratta di una funzione a valori reali definita sulla varietà, diciamo F : M → IR. Essa definisce
un numero reale per ogni punto della varietà; e allora la forma funzionale della funzione f che
rappresenta F deve necessariamente variare al variare delle coordinate proprio in maniera tale che
non cambi il valore di F in corrispondenza di un definito punto della varietà. Ad esempio, se M è la
retta reale, e x una coordinata, allora lo scalare F : M → IR sarà rappresentato da una funzione reale di
variabile reale, diciamo f = f (x). Se poi si passa a un’altra coordinata x0 = x0 (x), allora la medesima
funzione F : M → IR sarà rappresentata da una diversa funzione f 0 definita da f 0 (x0 ) = f (x(x0 )).
49 Si ricordi che gli indici su cui si somma sono “muti” o indici fantoccio (“dummy”) e si può dar
Q.E.D.
∂xl ∂xm ∂2 xm
∂0i ∂0k f 0 = 0 i 0 k
∂l ∂m f + 0 i 0 k ∂m f . (6.4.14)
∂x ∂x ∂x ∂x
In effetti, esiste un modo generale per ottenere quantità geometriche (cioè aven-
ti carattere tensoriale) per derivazione di tensori quando si abbia a disposizione una
metrica. Questo procedimento fu inventato da Levi Civita nel 1916 e fu poi gene-
ralizzato da H.Weyl (derivata covariante) ed è stato da noi implicitamente usato,
senza farlo notare esplicitamente, nella deduzione dell’equazione di Lagrange.
Dimenticandoci ora del problema generale della derivata covariante, ci basta
qui avere constatato (nel caso delle derivate seconde, ma si vede subito che il ri-
sultato è generale) che, se ci si limita a trasformazioni lineari (come le rotazioni
nello spazio euclideo, e le trasformazioni di Lorentz nello spaziotempo), è vero
che le operazioni di derivazione aggiungono altrettanti indici di covarianza. Ad
esempio, se ci si limita a trasformazioni lineari, allora ∂i ∂k f (dove f è uno scalare)
si comporta come un tensore due volte covariante (di tipo 0 − 2); analogamente, se
vi sono le componenti di un vettore (o meglio, di un campo vettoriale), allora ∂k vi
si comporta come un tensore di tipo 1 − 1, e ∂i vi come uno scalare (la divergenza
del campo vettoriale v) e cosı̀ via.
Particolarmente importante è il seguente esempio, che sarà di fondamentale in-
teresse per il campo elettromagnetico. Se Aµ è un vettore, e Aµ il corrispondente
covettore, allora ∂µ Aν è un tensore due volte covariante, come lo è anche il tensore
Fµν := ∂µ Aν − ∂ν Aµ . Questo tensore doppio Fµν è evidentemente emisimmetrico
(Fµν = −Fνµ ), sicché è individuato da 6 componenti. Se Aµ ≡ (Φ, A) è il quadripo-
tenziale, allora verificheremo che le componenti indipendenti del tensore Fµν sono
proprio le componenti del campo elettrico E e del campo magnetico H. Il tensore
Fµν viene talvolta detto Tensore di Faraday.
Possiamo infine concludere questi cenni di calcolo tensoriale con il seguente
fondamentale esempio.
0 = g0 µ ν ∂0µ ∂0ν
51 Sottointendiamo,ottenuto con trasformazioni lineari come quelle di Lorentz, perchè altrimenti
dovremmo introdurre la derivata covariante in luogo dell’ordinaria derivazione.
296 Andrea Carati e Luigi Galgani
∂µ ∂µ u = 0 ovvero gµ ν ∂µ ∂ν u = 0 , (6.4.15)
u = A exp[ikµ xµ ] (6.4.16)
con dei parametri kµ liberi. Per ogni fissato kµ si tratta di un’ onda
piana perché il luogo geometrico u =cost è definito nello spaziotempo
dalla condizione kµ xµ =cost, ovvero da un iperpiano. A sua volta (al
modo solito), questo iperpiano nello spaziotempo corrisponde nello
spazio ordinario a una famiglia di piani paralleli che traslano con
una certa velocità. Questa viene determinata nel modo seguente.
Si osserva che la condizione che u soddisfi l’equazione di d’Alembert
si traduce nella condizione gµ ν kµ kν = 0, ovvero
kµ kµ = 0 . (6.4.17)
|ω| = ck , k = ||k|| .
ω0 = ω γ (1 − vl/c) . (6.4.18)
la forma di d’Alembert
Φ = ρ , A = j/c . (6.5.3)
Osserviamo ora la potenza del formalismo quadridimensionale. Il primo passo
consiste nel porre come assioma che la densità di carica ρ e la densità di corrente j
si mettono assieme a formare il quadrivettore densità di quadricorrente jµ definito
da54
{ jµ } ≡ (ρc, j) . (6.5.4)
Da qui segue allora che anche i potenziali costituiscono un quadrivettore, cioè si
può porre
{Aµ } ≡ (Φ, A) . (6.5.5)
Questa è infatti coerente con la (6.5.4), perché il dalembertiano è invariante.
La prima semplificazione di scrittura che si ottiene allora è che la condizione
di Lorentz (6.5.2) viene scritta in forma quadridimensionale nella semplicissima e
simmetrica forma
∂µ Aµ = 0 . (6.5.6)
Inoltre, anche le relazioni tra potenziali e campi, dalla loro forma estremamen-
te asimmetrica (6.5.1) vengono ad assumere una forma estremamente elegante e
semplice nel formalismo quadridimensionale. Infatti si ha ad esempio
Hz = ∂1 A2 − ∂2 A1
Ez = −∂0 A3 − ∂3 A0 ,
e si osserva anzitutto che questa scrittura assume forma più simmetrica se si ab-
bassano gli indici (e dunque cambiamo di segno alle componenti spaziali), perché
allora si ha
−Hz = ∂1 A2 − ∂2 A1
Ez = ∂0 A3 − ∂3 A0 .
Considerando anche le altre relazioni in maniera analoga, è allora spontaneo intro-
durre il tensore doppio
∂µ F µ ν = jν /c (ν = 0, 1, 2, 3) , (6.5.10)
∂λ Fµ ν + ∂µ Fν λ + ∂ν Fλ µ = 0 , (λ, µ, ν = 0, 1, 2, 3) . (6.5.11)
= −mcaµ + ec Fµ ν uν ,
e dunque le equazioni di Eulero–Lagrange hanno la forma
e
mcaµ = Fµν uν .
c
Q.E.D.
La base duale. Cominciamo con l’osservare che, data una base {ei } in V , esistono
n covettori che si possono veramente toccare con mano. Si tratta dei covettori che
corrispondono alla familiare operazione di “misurare i vettori”, cioè misurare le
componenti di un vettore rispetto alla base assegnata. Infatti, ben sappiamo che,
data la base, ogni vettore x è univocamente determinato da componenti x1 , . . . , xn
tramite la (6.4.1), x = ∑i xi ei ≡ xi ei . Si tratta ora di compiere l’operazione inversa,
cioè determinare le componenti quando sia dato il vettore. Il salto psicologico che
si deve compiere è di pensare alle componenti come ottenute mediante un’opera-
zione, cioè come una funzione che produce un numero in corrispondenza di ogni
vettore. Fissato un ben definito vettore tra i vettori base ei , ad esempio e1 , allora il
numero x1 è una funzione a valori reali definita su V , ovvero si ha x1 : V → IR, ed è
evidente che tale funzione è lineare. Dunque l’operazione di misurare (o estrarre)
la i–esima componente di un vettore quando sia fissata una base55 è un covettore,
che denoteremo con εi :
εi (∑ xk ek ) ≡ εi (xk ek ) = xi . (6.6.7)
k
57 Da quanto detto risulta in particolare che V e V ∗ hanno la stessa dimensione, perché ogni co-
vettore α ∈ V ∗ è univocamente individuato da n numeri αi . Naturalmente, anche V ∗ , essendo uno
Meccanica Razionale 1: Teoria della relatività, parte seconda 303
in altri termini, Π è il nucleo (ingl. kernel) del funzionale lineare α. Allora tutti
sappiamo che Π è un piano passante per l’origine dello spazio vettoriale V . Si noti
che ogni covettore β = a α (a ∈ IR), multiplo di quello considerato, evidentemente
definisce lo stesso piano Π. Viceversa, ad ogni piano passante per l’origine di V
sono associati infiniti covettori, che si ottengono l’uno dall’altro moltiplicando uno
arbitrario di essi per un numero. Se si vuole, è possibile poi identificare ognuno di
tali covettori assegnando, in aggiunta al piano passante per l’origine, anche il piano
ad esso parallelo sul quale quel particolare covettore prende il valore 1. Si capisce
dunque perché i covettori svolgono un ruolo importante in ottica nella discussione
dei fronti d’onda, e più in generale nello studio dei fenomeni di propagazione delle
onde.
Nelle trattazioni elementari riferite allo spazio euclideo E 3 , non si fa alcun rife-
rimento ai covettori perché un piano passante per l’origine viene definito attraverso
la scelta di un vettore n ad esso ortogonale. Ovvero, fissato il vettore n in E 3 , il
piano Π è definito da
Π = {x ∈ IR3 : x · n = 0} . (6.6.11)
Ma, come già abbiamo osservato, ciò è possibile solo in virtù del fatto che nello
spazio euclideo E 3 è assegnata una metrica (cioè un prodotto scalare), e questo
fatto, come mostriamo nel testo, fornisce un isomorfismo naturale tra vettori e co-
vettori. Si tenga tuttavia presente che, se si prende in V una base che non è ortonor-
male rispetto all’assegnato prodotto scalare, allora i coefficienti che figurano nella
definizione analitica del piano, ovvero i numeri αi (le componenti del covettore
spazio vettoriale, avrà il suo duale, che coerentemente denoteremo con (V ∗ )∗ , o più semplicemnte
con V ∗∗ (biduale di V ) e si mostra iimediatamente che (nel caso finito–dimensionale) si ha V ∗∗ = V .
Invece V ∗ e V sono proprio due spazi diversi, che possono venir posti in corrispondenza biunivoca in
maniera “naturale” solo quando si introduca un nuovo elemento nello spazio vettoriale, ad esempio
(come nel caso che a noi interessa qui) una metrica, ovvero un prodotto scalare, come è mostrato nel
testo.
304 Andrea Carati e Luigi Galgani
α definente il piano), non coincidono affatto con le componenti del vettore n che
figura nella definizione (6.6.11). Questo fatto è spesso causa di confusione nelle
trattazioni elementari.