Sei sulla pagina 1di 156

Valter Moretti

Dipartimento di Matematica
Facolt`a di Scienze M.F.N
Universit`a di Trento
Teoria della Relativit`a Speciale: formulazione
matematica.
Con unintroduzione alla formulazione matematica della Relativit`a Generale.
Corso di Metodi Geometrici in Fisica Matematica
per le Lauree Specialistiche in Matematica e in Fisica
Facolt`a di Scienze MFN, Universit`a di Trento,
anno accademico 2005-2006
1
Scopi e Prerequisiti Matematici.
Il ne di queste dispense `e quello di presentare una veste matematica rigorosa della struttura
di base della Teoria della Relativit`a Speciale e introdurre le idee fondamentali della Teoria della
Relativit`a Generale. Quindi laccento non sar`a posto sulla Fisica (che, almeno per quanto riguar-
da la meccanica classica deve essere gi`a nota al lettore) ma sulla formalizzazione matematica
rigorosa dei concetti sici e sullutilizzo di tecniche geometriche superiori.
Le dispense sono divise in 8 capitoli, esse riguardano la formulazione geometrico dierenziale del-
la teoria della relativit`a speciale nella sua forma sicamente elementare e la struttura del gruppo
di Lorentz. Lultimo capitolo concerne lintroduzione di alcune idee matematiche che stanno alla
base della Teoria della Relativit`a generale. In queste parti, prima verr`a costruita ed esamina-
ta a fondo, partendo dai postulati base di Einstein, la struttura causale dello spaziotempo (la
struttura dei coni causali) esplicitandone il signicato sico. Verr`a poi esaminata la cinemat-
ica della teoria della relativit`a studiandone (da un punto di vista superiore matematicamente
parlando) alcuni aspetti classici quali la dilatazione degli intervalli di tempo e la contrazione
delle lunghezze. Inne si passer`a alla formulazione della dinamica mostrando come essa porti
naturalmente al principio di equivalenza massa energia:
E = mc
2
.
I capitoli 6 e 7 riguardano essenzialmente la struttura topologica del gruppo di Lorentz e teo-
remi di fattorizzazione di tale gruppo esaminati dal punto di vista della teoria dei gruppi di
Lie matriciali e del teorema di decomposizione polare in dimensione nita. In particolare, nel
capitolo 6 daremo alcune nozioni di teoria dei gruppi di Lie con particolare riguardo ai gruppi di
Lie matriciali, studiando come esempio la struttura del gruppo O(3). Nel capitolo 7 studieremo
la struttura del gruppo di Lorentz come gruppo di Lie matriciale e proveremo alcuni risultati
di rappresentazione e decomposizione dei suoi elementi. Nellultimo capitolo introdurremo il
pricipio di equivalenza di Einstein e ne mostreremo il suo contenuto geometrico dierenziale us-
ando coordinate normali Riemanniane adattate a geodetiche di tipo tempo. Mostreremo inne
come una denizione naturale di presenza di gravit`a in relativit`a (denita come presenza di
accelerazione della deviazione geodetica) conduca naturalmente ad identicare la gravit`a con la
curvatura (tensore di Riemann) dello spaziotempo.
Dato che il corso `e rivolto a studenti delle Lauree Specialistiche in Matematica e in Fisica ed a
studenti di corsi di Dottorato di Ricerca, il livello della matematica usata non `e elementare. I
prerequisiti per poter comprendere appieno il contenuto di queste dispense consistono nel calcolo
tensoriale (per es. vedi [1, 7]) e nella geometria dierenziale delle variet`a dotate di metrica (per
es. vedi [2, 3, 4, 5, 6, 7, 8]). In particolare lo studente deve avere nozioni elementari di geometria
ane [9] e delle associate strutture dierenziabili e metriche. Richiami di tali nozioni sono dati
in Appendice A e in Appendice B.
Ringraziamento. Lautore ringrazia il dott. V. Marini che si `e preso cura di correggere gli errori
2
di vario genere contenuti nella prima stesura di queste dispense ed il dott. B. Cocciaro per
importanti discussioni sui fondamenti della Relativit`a Speciale.
3
Indice
1 I principi sici della Relativit`a Speciale. 7
1.1 La crisi della visione classica. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Una nozione feconda e duratura: lo Spaziotempo. . . . . . . . . . . . . . . . . . . 9
1.3 Sistemi di riferimento e problema della sincronizzazione. . . . . . . . . . . . . . . 10
1.3.1 Il problema della sincronizzazione. . . . . . . . . . . . . . . . . . . . . . . 11
1.4 I postulati sici fondamentali della Relativit`a Speciale. . . . . . . . . . . . . . . . 13
1.4.1 Costanza della velocit`a della luce. . . . . . . . . . . . . . . . . . . . . . . 13
1.4.2 Principio dinerzia. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.4.3 Principio di Relativit`a. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 I gruppi di Lorentz e di Poincare. 16
2.1 Dai postulati della Relativit`a speciale al gruppo di Poincare. . . . . . . . . . . . 16
2.1.1 Postulati della Relativit`a in sistemi di coordinate minkowskiane. . . . . . 16
2.1.2 Determinazione delle trasformazioni di coordinate tra riferimenti inerziali. 19
2.2 IL gruppo di Lorentz ed il gruppo di Poincare. . . . . . . . . . . . . . . . . . . . 24
2.2.1 Il sottogruppo ortocrono. . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3 Lo spaziotempo della Relativit`a Speciale e la struttura causale. 32
3.1 Lo spaziotempo della Relativit`a Speciale. . . . . . . . . . . . . . . . . . . . . . . 32
3.1.1 Orientazione temporale dei sistemi di coordinate minkowskiane. . . . . . . 34
3.1.2 Sistemi di Riferimento inerziali. . . . . . . . . . . . . . . . . . . . . . . . . 34
3.1.3 Riduzione a trasformazioni di Lorentz speciali. . . . . . . . . . . . . . . . 37
3.2 Coni spaziotemporali e orientamento temporale. . . . . . . . . . . . . . . . . . . . 38
3.2.1 Coni spaziotemporali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.2 Orientazione temporale dello spaziotempo. . . . . . . . . . . . . . . . . . . 41
3.2.3 Orientazione temporale indotta dai riferimenti inerziali. . . . . . . . . . . 42
3.3 La struttura causale di M
4
: causalit`a e linee di universo. . . . . . . . . . . . . . . 44
3.3.1 Relativit`a ed assolutezza delordinamento temporale. . . . . . . . . . . . 44
3.3.2 Discussione critica sulla struttura causale. . . . . . . . . . . . . . . . . . . 46
3.3.3 Linee di universo come curve di tipo causale. . . . . . . . . . . . . . . . . 47
3.4 Ancora sulla struttura causale: determinismo, localit`a e paradosso EPR. . . . . . 49
4
4 Cinematica in Relativit`a Speciale. 53
4.1 Nozioni elementari: Tempo proprio e Quadrivelocit`a . . . . . . . . . . . . . . . . 53
4.1.1 Velocit`a di trascinamento e legge di composizione delle velocit`a . . . . . 58
4.2 Dilatazione degli intervalli di tempo e paradosso dei gemelli. . . . . . . . . . . 62
4.3 Peculiarit`a della cinematica relativistica. . . . . . . . . . . . . . . . . . . . . . . 67
4.3.1 Contrazione dei Volumi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.3.2 Contrazione delle lunghezze. . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.3.3 Deformazione degli angoli. . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5 Dinamica in Relativit`a Speciale: covarianza delle leggi siche ed equazioni
della dinamica. 74
5.1 Nozione di massa, quadriforza e quadrimpulso per punti materiali. . . . . . . . . 75
5.1.1 Teorema delle forze vive relativistico. . . . . . . . . . . . . . . . . . . . 80
5.2 Conservazione del quadri impulso e principio di equivalenza massa-energia. . . . 82
5.2.1 Legge di conservazione del quadri impulso. . . . . . . . . . . . . . . . . . 82
5.2.2 Il principio di equivalenza massa energia. . . . . . . . . . . . . . . . . . . 86
6 Elementi di teoria dei gruppi di Lie matriciali. 91
6.1 Richiami sui gruppi di Lie. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.2 Gruppi di Lie di matrici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
6.3 I gruppi di Lie O(3) e SO(3). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
6.4 Teorema di rappresentazione di O(3) e SO(3). . . . . . . . . . . . . . . . . . . . . 107
7 La struttura del gruppo di Lie O(1, 3). 112
7.1 Il gruppo di Lie matriciale O(1, 3). . . . . . . . . . . . . . . . . . . . . . . . . . . 112
7.2 Le trasformazioni pure di Lorentz o boosts e la decomposizione polare del
gruppo di Lorentz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
7.3 Teoremi di decomposizione e rappresentazione del gruppo di Lorentz. . . . . . . . 127
7.4 Le componenti connesse del gruppo di Lorentz. . . . . . . . . . . . . . . . . . . . 129
8 Le idee sico-matematiche alla base della teoria Generale della Relativit`a . 132
8.1 Il Principio di Equivalenza di Einstein ed i fondamenti sico-geometrici della
Relativit`a Generale. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
8.2 Exponential map e le sue applicazioni in Relativit`a generale. . . . . . . . . . . . 135
8.2.1 Lexponential map e le coordinate normali attorno ad un punto. . . . . . 135
8.2.2 Coordinate normali adattate ad una curva assegnata. . . . . . . . . . . . 139
8.2.3 La versione geometrica dei postulati di Einstein: riferimenti localmente
inerziali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142
8.3 La deviazione geodetica e la gravit`a come curvatura dello spaziotempo. . . . . . 144
8.3.1 Lequazione della deviazione geodetica ed il tensore di curvatura di Riemann.145
5
A Richiami di geometria ane e strutture dierenziabili associate. 148
A.1 Spazi ani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
A.2 Trasformazioni ani, coordinate cartesiane e strutture dierenziabili associate. . 148
A.3 Isomorsmo naturale tra T
p
A
n
e lo spazio delle traslazioni. . . . . . . . . . . . . 149
A.4 Induzione di tensori (pseudo) metrici su ogni T
p
A
n
. . . . . . . . . . . . . . . . . . 150
B Richiami di geometria dierenziale (pseudo) riemanniana. 151
B.1 Prodotti scalari e pseudo prodotti scalari. . . . . . . . . . . . . . . . . . . . . . . 151
B.2 (Pseudo)Metriche e variet`a (pseudo)riemanniane. . . . . . . . . . . . . . . . . . . 153
B.3 Variet`a (pseudo)riemanniane, globalmente e localmente piatte. . . . . . . . . . . 153
B.4 Metriche e pseudo metriche indotte. . . . . . . . . . . . . . . . . . . . . . . . . . 154
6
Capitolo 1
I principi sici della Relativit`a
Speciale.
In questo capitolo ci occuperemo di costruire la struttura spaziotemporale della Teoria della
Relativit`a Speciale. Non seguiremo un approccio storico. La formulazione che presenteremo nel
seguito della Teoria della Relativit`a Speciale `e ben pi` u avanzata dal punto di vista matematico
della formulazione originale di Einstein del 1905 [11] pur conservandone il contenuto sico. In
particolare faremo uso della geometria dierenziale n da subito, cosa che Einstein non fece
nella prima formulazione. La natura dello spaziotempo di variet`a dierenziabile con metrica
iperbolico normale venne infatti riconosciuta e studiata, a partire da Minkowski, tra il 1905 e
il 1916 anno della presentazione della Teoria della Relativit`a Generale da parte di Einstein. In
questultima a dierenza della teoria Speciale, la struttura geometrico dierenziale `e lelemento
centrale.
1.1 La crisi della visione classica.
Alla ne del 1800, quando le equazioni dellelettromagnetismo ebbero forma completa nelle
famose Equazioni di Maxwell, si comprese che linvarianza galileiana discussa precedentemente
non poteva essere estesa allelettromagnetismo.
Le equazioni di Maxwell prevedono che, in assenza di sorgenti, il campo elettromagnetico si
propaghi sotto forma di onde elettromagnetiche in conformit`a con lequazione di DAlembert

1
c
2

t
2
+
3

i=1

(x
i
)
2
= 0 .
Nel nostro caso `e una qualsiasi componente del campo elettrico o magnetico e t, x
1
, x
2
, x
3
sono coordinate cartesiane ortonormali associate ad un sistema di riferimento. In particolare si
comprese, e questo fu uno dei trion della sica del 1800, che la luce `e unonda elettromagnetica
unicando la teoria dellottica con quella dellelettromagnetismo. Dalla teoria delle equazioni di
7
DAlembert risulta che il parametro c, che ha le dimensioni di una velocit`a, si deve interpretare
come la velocit`a delle onde elettromagnetiche indipendentemente dalla direzione di propagazione
nel sistema di riferimento considerato. La stessa teoria di Maxwell fornisce il valore di c, di circa
300.000 km/s in termini di grandezze elettrostatiche che possono essere misurate indipendente-
mente dal fenomeno di propagazione ondosa sopra descritto.
Il punto di contrasto con linvarianza galileiana `e per`o il seguente.
`
E facile vericare per sos-
tituzione diretta e assumendo che i campi considerati siano propriamente campi vettoriali in
ogni spazio assoluto, che la forma dellequazione di sopra non `e invariante sotto cambiamento
di sistema di riferimento quando la trasformazione di coordinate `e un elemento del gruppo di
Galileo. Le stesse equazioni di Maxwell da cui segue lequazione delle onde di sopra non sono
invarianti per trasformazioni di Galileo. Lidea pi` u semplice che fu proposta per interpretare
questo stato di cose `e che lequazione delle onde scritta valesse in realt`a solo in un partico-
lare sistema di riferimento detto sistema di riferimento delletere. Dal punto di vista sico,
tale sistema di riferimento avrebbe dovuto essere in quiete con il mezzo, appunto letere, in
cui si propagherebbero le onde elettromagnetiche. Che il sistema di riferimento delletere fosse
inerziale oppure no, sembrava comunque che lelettromagnetismo, a dierenza della meccanica,
selezionasse un unico e particolare sistema di riferimento privilegiato. Si osservi che ci`o ha riper-
cussione anche nella sica dei corpi materiali, no ad allora trattati dalla meccanica classica,
perche le onde elettromagnetiche interagiscono sui corpi materiali che portano cariche o correnti
elettriche, esercitando su di essi delle forze. Si noti che ci`o non `e comunque in contrasto con la
descrizione spaziotemporale di base della meccanica classica che `e indipendente dallassunzione
o meno dellinvarianza galileiana. Per tale motivo tale descrizione continu`o ad essere usata.
Il contrasto sperimentale con le fondazioni stesse della descrizione spaziotemporale classica non
tard`o per`o ad arrivare. Allinterno di tale formulazione, tenendo conto che un impulso lumi-
noso deve essere pensato come unonda elettromagnetica, che ha velocit`a c in un particolare
riferimento, segue subito che la velocit`a dello stesso impulso deve essere dierente se valutata
in un altro sistema di riferimento. In questordine di idee, `e alquanto improbabile che la terra
nel suo moto attorno al sole si trovi perennemente in quiete nel riferimento delletere, per cui
ci si deve aspettare di poter valutare sulla terra una velocit`a della luce dierente a seconda del
momento. Ulteriormente, se la terra non fosse in quiete con letere, la velocit`a della luce non
dovrebbe avere un comportamento isotropo come prescritto dallequazione di DAlembert, ma la
velocit`a della luce dovrebbe dipendere dalla sua direzione rispetto alla direzione del moto della
terra nel riferimento delletere. Valutando la velocit`a della luce sulla terra lungo due percorsi
ortogonali posti in direzioni opportune, si dovrebbero misurare delle dierenze di velocit`a lungo
i due cammini.
Due celebri esperimenti di questo genere furono eettivamente eseguiti nel 1887 da Michelson
e Morley [12]. Su un piano orizzontale che poteva orientarsi arbitrariamente attorno allasse
verticale, un raggio di luce partiva da una sorgente S e nel punto P, al centro del piano, veniva
diviso in due raggi da uno specchio semiriettente. Tali raggi percorrevano due percorsi rettilinei
uguali ma reciprocamente ortogonali no a raggiungere due specchi che li riettevano indietro
verso P. Da P venivano deessi in S

dove un ne interferometro valutava leventuale ritardo


relativo del tempo di arrivo dei due raggi nel punto nale di ricongiungimento. Il risultato degli
8
esperimenti, eseguiti con diverse modicazioni per valutare tutte le possibilit`a, fu totalmente
negativo: nessuna dierenza di tempi di arrivo e quindi di velocit`a venne misurata in qualunque
periodo dellanno pur orientando lapparato in qualunque direzione. Questo fatto sperimentale `e
in diretto contrasto con la formulazione classica se si esclude la situazione altamente improbabile
in cui la terra `e sempre in quiete con letere.
Dal 1887 no al 1905, anno in cui A. Einstein pubblic`o il suo articolo intitolato Sull Elettro-
dinamica dei Corpi in Movimento in cui vennero gettate le basi della Teoria della Relativit`a
Speciale, varie proposte furono avanzate per spiegare il risultato negativo di Michelson e Mor-
ley; e per fare coesistere la meccanica con lelettromagnetismo. Vennero proposte alcune teorie
basate sul trascinamento parziale delletere da parte della terra assumendo completamente il
corpus della meccanica classica, ma anche teorie pi` u radicali che mettevano in discussione alcuni
punti della formulazione della meccanica classica. Queste ultime vennero costruite anche da
parte di valenti teorici tra cui spiccano i nomi di Lorentz e Poincare
1
. Noi non ci occuperemo di
tutte queste teorie e considereremo unicamente la Teoria della Relativit`a Speciale, che non solo
spiega il risultato di Michelson e Morley (benche sembra che Einstein non fosse a conoscenza
di tali esperimenti nel 1905), ma ha ricevuto tali e tante conferme sperimentali che `e ritenuta
sicuramente pi` u vicina alla realt`a sica di quanto non lo fosse la descrizione classica (che ne `e
una approssimazione in particolari regimi di basse velocit`a). Basti dire che la Teoria della Rel-
ativit`a Speciale viene quotidianamente usata dalla tecnologia per produrre strumenti. Tenedo
conto della Relativit`a Speciale vengono progettati gli accelaratori di particelle del CERN in cui
le particelle non possono pi` u essere trattate classicamente a causa delle loro altissime velocit`a
relative (oltre che per la loro natura quantistica).
1.2 Una nozione feconda e duratura: lo Spaziotempo.
Un punto di vista sul mondo sico che permise (ad Einstein) di uscire dalla crisi della visione
classica, `e quello basato sulla nozione di evento e di spaziotempo. Da questo punto di vista
tutto ci`o che accade o esiste deve essere decomponibile in eventi. Un evento `e la minima de-
terminazione spaziotemporale possibile, inviduata dallassegnazione di tre coordinate spaziali ed
una temporale. In questo approccio, tutto ci`o che accade deve ammettere una descrizione in
termini di relazioni o coincidenze tra eventi. Linsieme degli eventi costituisce lo spaziotempo.
Dal punto di vista sico `e naturale assumere, ed `e stato tacitamente assunto nella formulazione
della meccancia classica, che lo spaziotempo abbia una natura continua (cio`e una topologia
localmente omeomorfa a R
4
, di Hausdor ed a base numerabile) e dierenziabile (per potere
impostare equazioni dierenziali che determinano levoluzione dei sistemi sici), in altre parole
che sia una variet`a dierenziabile a 4 dimensioni
2
. Lo spaziotempo classico e, come vedremo,
1
Poincare present` o una teoria molto simile alla teoria della Relativit` a di Einstein con sottili dierenze dal
punto di vista losoco basate sul suo punto di vista convenzionalista. Il dibattito sulla dierenza tra la teoria di
Poincare e quella di Einstein `e tuttora acceso ed aperto, vedi [13].
2
Attualmente si specula sulla eventuale natura non continua dello spaziotempo stesso a scale molto piccole
(scale di Planck 10
33
cm e 10
43
s). In ogni caso `e noto da molti anni che la struttura spaziotemporale suddetta
non `e adeguata a descrivere tutti i fenomeni sici osservati in natura. Per ci` o che riguarda i cosiddetti sistemi
9
quello relativistico, ammette strutture di carattere metrico oltre alla struttura topologica e quel-
la dierenziabile. Dal punto di vista sico ci sono strutture metriche di tue tipi apparentemente
distinti corrispondenti alle misurazioni di intervalli di tempo e le misurazioni di interval-
li di spazio tra coppie di eventi. In meccanica classica le misure di spazio e di tempo sono
assolute, ci`o signica che esse non dipendono dal sistema di riferimento. Come vedremo la
rivoluzione della Relativit`a ha mostrato che tali strutture sono in realt`a relative al sistema di
riferimento, ma al contempo sono parti di una struttura metrica spaziotemporale assoluta che
ha particolari propriet`a di simmetria (almeno no a quando si trascura la descrizione relativis-
tica dellinterazione gravitazionale) descritte dal cosiddetto gruppo di Poincare (che include il
gruppo di Lorentz). La geometria dello spaziotempo che ne consegue si `e rivelata il linguaggio
matematico per poter trattare di argomenti profondamente sici come la nozione di causalit`a.
Le implicazioni di questo nuovo punto di vista sono state incredibilmente feconde dal punto di
vista sico ed hanno avuto inuenze fondamentali nello sviluppo di tutta la sica del 1900. La
teoria della relativit`a ha costruito, insieme alla meccanica quantistica, il linguaggio stesso ed il
paradigma della sica teorica di un secolo intero di ricerca.
Da questo punto di vista i metodi ed il linguaggio della geometria (dierenziale in particolare) e
dellanalisi funzionale degli spazi di Hilbert sono entrati nella struttura delle teorie siche mod-
erne come parte centrale. A titolo di esempio si pu`o ricordare che la nozione di particella nelle
teorie quantistiche relativistiche viene data in termini di rappresentazioni unitarie irriducibili
del gruppo (di Lie) di Lorentz.
1.3 Sistemi di riferimento e problema della sincronizzazione.
Per costruire la struttura matematica della teoria della relativit`a speciale ci metteremo su un
livello pi` u generale di quello usato in sica classica per evitare di incorrere in contraddizione con
i dati sperimentali come accade assumendo tutto il corpus classico. In questa prima parte, che
`e essenzialmente euristica, non daremo denizioni formali cosa che invece faremo una volta che
la struttura matematica della teoria sar`a stata costruita.
Assumeremo temporaneamente che: uno spaziotempo sia una variet`a dierenziabile a 4 dimen-
sioni M
4
. Ulteriormente, volendo rimanere su un piano pi` u generale della formulazione classica,
assumeremo che un sistema di riferimento F nello spaziotempo M
4
sia dato assegnando uno
spazio euclideo tridimensionale reale E
3
F
detto spazio di quiete di F (con funzione distanza d
F
)
ed un dieomorsmo

F
: M
4
x (t
F
(x), P
F
(x)) R E
3
F
dove x t
F
(x) `e detta (funzione) coordinata temporale di F.
Inne, procedendo come in sica classica possiamo denire le coordinate cartesiane solidali
analogamente al caso classico. Scelto un riferimento F, si ssi un sistema di coordinate
sici quantistici, una descrizione molto pi` u adeguata delle loro propriet` a siche non viene data in una variet` a
dierenziabile, ma in uno spazio di Hilbert complesso innito dimensionale.
10
cartesiane ortonormali

F
: E
3
F
P (x
1
(P), x
2
(P), x
3
(P)) = X(P) R
3
nello spazio di quiete E
3
F
di F ed una costante t
0
R delle dimensioni di un tempo. Il sistema
di coordinate globali indotto su M
4

F
: M
4
x (t(x) +t
0
,
F
(P
F
(x))) .
`e detto sistema di coordinate cartesiane ortonormali solidali con F.
Ogni sottovarit` a
Ft
, determinata dai punti a t costante, `e detta spazio di quiete con F al
tempo t R.
`
E chiaro che ogni
Ft
`e dieomeorfa a E
3
F
e sulla prima pu`o essere indotta una distanza d
Ft
dalla distanza di E
3
F
che identica metricamente i due spazi Euclidei.
Commenti 1.1.
(1) Dal punto di vista sico dobbiamo assumere che per denire i sistemi di riferimento si siano
deniti una classe di regoli rigidi ideali ed una classe di orologi ideali. Lidealit`a dei regoli sig-
nica che scelti due regoli arbitrariamente, essi risultano di uguale lunghezza se sono in quiete
nello stesso posto in un arbitrario riferimento inerziale e che tale fatto permane anche dopo che
i regoli hanno subito diverse storie (incluse accelerazioni), una volta riportati in quiete relativa
in un arbitrario riferimento inerziale (anche diverso dal primo). Lo stesso criterio si applica per
la nozione di idealit`a di orologi: presi due orologi essi risultano battere il tempo nello stesso
modo quando sono in quiete nello stesso posto in un riferimento inerziale e tale fatto permane
anche dopo che gli orologi hanno subito diverse storie, una volta riportati in quiete relativa in
un riferimento inerziale (anche diverso dal primo). Si noti che al secondo incontro gli orologi
possono non risultare sincronizzati anche se erano stati sincronizzati al primo incontro. I regoli
ideali servono a denire la distanza usata nello spazio euclideo E
3
F
, gli orologi ideali servono a
denire le misure di intervalli di tempo t
F
del riferimento.
(2) Esistono in natura orologi ideali? la risposta `e positiva. Gli stessi atomi sono dei piccoli
orologi nel senso che, con le dovute precisazioni siche, emettono radiazione con frequenze de-
terminate il cui periodo pu`o essere usato come il periodo di un orologio. Tali orologi, si sono
rivelati la migliore approssimazione di orolgi ideali disponibile in natura
1.3.1 Il problema della sincronizzazione.
Dal punto di vista sico, la nozione di spazio di quiete la assumeremo primitiva. La nozione di
coordinata temporale del riferimento, in assenza del postulato di esistenza del tempo assoluto,
richiede ulteriori precisazioni assolutamente non banali. Lidea `e di porre un orologio ideale in
quiete in ogni punto dello spazio di quiete e quindi sincronizzare a distanza tutti questi orologi,
cio`e scegliere, con un ssato criterio, lorigine del tempo per ciascun orologio, lavorando su coppie
arbitrarie di orologi. Le richieste siche sulla nozione di sincronizzazione sono che:
(a) permanere nel tempo una volta imposta su una coppia di orologi,
11
(b) deve essere una propriet`a transitiva (se A `e sincronizzato con B e B lo `e con C allora A
`e sincronizzato con C), simmetrica (se A `e sincronizzato con B allora B `e sincronizzato con A)
e riessiva (ogni orologio A `e sincronizzato con se stesso).
A priori, si possono immaginare alcune procedure per sincronizzare due orologi in quiete nei
punti distinti P e Q di E
3
F
, esaminiamone 3:
(1) prendiamo lorologio in Q, portiamolo in P, sincronizziamolo con lorologio in P e
riportiamolo in Q;
(2) prendiamo un terzo orologio O in moto senza accelerazione rispetto a F sullasse con-
tenente il segmento PQ. Quando lorologio O passa per P lo sincronizziamo con quello fermo
in tale punto. Successivamente sincronizziamo lorologio in Q con O non appena questultimo
passa per Q;
(3) lanciamo verso Q un segnale di velocit`a nota in F dallorologio in P. Quindi sincronizzi-
amo lorologio in Q con quello in P tenedo conto della distanza tra P e Q e del tempo impiegato
dal segnale a raggiungere Q.
Nella sica classica si assume che esista il cosiddetto tempo assoluto: una funzione T : M
4
R,
denita a meno di una costante additiva, che assegna ad ogni evento il suo tempo e che viene
misurato, a meno di una costante additiva corrispondente alla scelta dellorigine del tempo per
lorologio in questione, da ogni orologio ideale.
`
E chiaro che, in sica classica, lipotesi di esisten-
za del tempo assoluto misurato dagli orologi ideali implica immediatamente che queste procedure
di sincronizzazione siano tutte equivalenti. Tuttavia dato che non vogliamo ripristinare lo schema
classico che sappiamo non essere in accordo con i fatti, dobbiamo esaminare criticamente le pos-
sibilit`a senza assumere a priori che diano luogo alla stessa nozione di sincronizzazione. Bisogna
in particolare vericare che almeno una delle tre procedure sia sicamente sensata, cioe che
soddis i requisiti (a) e (b) di sopra. Questo fatto non `e per nulla ovvio.
Nel caso (1) ci pu`o essere il problema, ammettendo che F sia inerziale, che nello spostare lorolo-
gio da Q a P con accelerazione iniziale e decelerazione nale, si possa alterare il meccanismo di
funzionamento dellorologio a causa delle forze interne che si sviluppano
3
. Si pu`o supporre come
di fatto accade con orologi ben fatti che i problemi insorgano durante le fasi di accelerazione (e
decelerazione), ma che gli orologi continuino a segnare il tempo nello stesso modo (ci`o ha senso
confrontando coppie di orologi) una volta terminata la fase di accelerazione dopo un certo tempo
di rilassamento. Questo fatto per`o incia la procedura di sincronizzazione che tiene conto di ci`o
che accade anche durante la fase di accelerazione. Senza un modello preciso del funzionamento
di orologio tale procedura `e dubbia.
Il caso (2), lavorando con un orologio in moto rettilineo uniforme evita il problema di sopra,
ma assume che le dierenze di velocit` a di orologi sincronizzati nello stesso posto non abbiano
3
Stiamo parlando in termini di forze ed accelerazioni che sono denite nello schema classico e ci o sembra
incoerente con il discorso generale. Si osservi tuttavia che dal punto di vista sperimentale la sica classica funziona
eccezionalmente bene quando le velocit` a in gioco sono piccole rispetto a quelle della luce. Assumendo di spostare
gli orologi con piccolissime accelerazioni e piccolissime velocit` a, si pu` o ritenere valido lo schema classico. Questa
approssimazione `e in realt` a un utilissimo principio guida che deve essere soddisfatto dalla sica relativistica: tutte
le leggi relativistiche devono ridursi a quelle classiche nel limite di piccole velocit` a.
12
rilevanza sica, questo fatto non `e ovvio. In realt`a si pu`o provare che, con qualche altra ipote-
si di carattere matematico, il criterio (2) porta direttamente alla formulazione classica dello
spaziotempo.
Il metodo (3) sembra condurre ad un circolo vizioso in quanto, per poter conoscere la velocit`a del
segnale, bisogna misurarla e per fare ci`o bisogna avere gi`a sincronizzato a distanza una coppia
di orologi. Si osservi per`o che la velocit`a di un segnale pu`o essere valutata con un unico orologio
purche il percorso seguito dal segnale sia chiuso. Ulteriormente, tale velocit`a pu`o dipendere dal
moto del riferimento rispetto al mezzo in cui si propaga il segnale (ci`o pu`o anche dare luogo ad
anisotropia).
1.4 I postulati sici fondamentali della Relativit`a Speciale.
La Teoria della Relativit`a Speciale si basa su due o tre (a volte quattro) postulati sici a seconda
dei punti di vista. Noi useremo tre postulati che elenchiamo nel seguito, con alcuni commenti.
1.4.1 Costanza della velocit`a della luce.
La scelta del criterio di sincronizzazione adottato da Einstein per formulare la Teoria della Rel-
ativit`a Speciale `e il (3) (una volta misurata la velocit`a della luce su un percorso chiuso). Questa
scelta viene fatta enunciando un corrispondente principio.
RS1. Costanza della velocit`a della luce. Esistono sistemi di riferimento in cui, con una
opportuna procedura di sincronizzazione a distanza, la velocit`a della luce nel vuoto assume lo
stesso valore, indipendente dalla direzione di propagazione e dal riferimento.
Commenti 1.2.
(1) Si osservi che il postulato stesso ssa la procedura di sincronizzazione, che coincide con la
procedura (3).
(2) Il contenuto sico del postulato `e proprio che (3) sia una buona procedura di sincronizzazione
per una certa classe di riferimenti, cioe soddis le richieste (a) e (b).
(3) Il postulato di Einstein implica immediatamente che la velocit`a della luce misurata su per-
corsi chiusi, in quiete con i sistemi di riferimento citati nel postulato, sia costante ed indipendente
dal riferimento. Questo fatto `e indipendente dalla procedura di sincronizzazione a distanza in
quanto pu`o essere controllato sperimentalmente usando un unico orologio. Esso stato vericato
sperimentalmente molte volte con esperimenti del tipo di quelli Michelson-Morley (vedi per es.
[14]).
(4) Riguardo alle condizioni (a) e (b) risulta che esse sono soddisfatte. Sperimentalmente si
vede che la nozione di sincronizzazzione implicita in RS1 permanere nel tempo una volta im-
posta. Inoltre, la propriet`a di riessivit`a `e vericata banalmente, mentre quella di simmetria e
transitivit`a seguono dallevidenza sperimentale dellinvarianza della velocit`a della luce misurata
su percorsi chiusi (lasciamo la prova al lettore). In realt`a si pu`o provare, ma la procedura non
13
`e semplice, che la condizione (a) `e anchessa soddisfatta come conseguenza teorica del fatto che
la velocit`a della luce sia invariante se valutata su percorsi chiusi.
(5)
`
E importante notare che, a priori, possono esserci e di fatto ci sono, altre procedure di
sincronizzazione dierenti da quella implicita in RS1 che sono ugualmente sicamente sensate
(soddisfano (a) e (b) e implicano linvarianza della velocit`a della luce valutata su percorsi chiusi).
Tali nozioni portano ad una descrizione alternativa, ma sicamente equivalente a quella della
Relativit`a Speciale [15].
(6) Nel formulare RS1 `e sottointeso che si `e fatta una scelta delle unit`a di misura di tem-
po e spazio per tutti i riferimenti in questione. Tali unit`a di misura possono essere alterate,
soddisfacendo ancora RS1, moltiplicando unit`a di tempo e di spazio per uno stesso fattore,
eventualmete diverso per ogni riferimento.
1.4.2 Principio dinerzia.
Il principio successivo riguarda i sistemi di riferimento inerziali. Essi sono deniti esattamente
come nel caso classico. Rivediamo brevemente la loro denizione. Lidea di fondo `e di studiare
il moto dei corpi quando sono posti a distanza molto grande dagli altri corpi delluniverso. La
nostra idealizzazione di corpo sar`a quella del punto materiale, cio`e un corpo sico la cui strut-
tura interna non sia rilevante e la cui evoluzione spaziotemporale sia descrivibile da una linea
di universo.
`
E chiaro che avendo a disposizione un unico punto materiale nelluniverso non hanno alcun
senso sico proposizioni riguardanti il suo stato di moto in quanto questo dipende dalla scelta
del riferimento e pu`o essere ssato arbitrariamente scegliendo opportunamente il riferimento.
Se consideriamo invece un insieme di pi` u punti materiali, in generale non `e possibile trovare
un riferimento in cui poter assegnare, rispetto ad esso, uno stato di moto scelto a piacimento
a ciascuno dei punti materiali contemporaneamente. Il Principio dinerzia o dichiara in parti-
colare cosa succede quando allontaniamo a distanze grandissime un numero arbitrario di punti
materiali, reciprocamente e dagli altri corpi delluniverso. Punti materiali che soddisfano tale
requisito di lontananza sono detti isolati. Proprio perche non `e in generale possibile ssare
lo stato di moto di tanti punti materiali contemporaneamente mediate una scelta opportuna
del riferimento, il postulato dinerzia ha un contenuto sico altamente non banale: esso aerma
che esistno riferimenti in cui tutti i corpi isolati sono in moto a velocit`a costante (di valore
dipendente dal corpo considerato)
RS2. Principio dinerzia. La classe dei sistemi di riferimento in RS1 coincide con quella
dei sistemi di riferimento inerziali individuati dalla richiesta che, rispetto ad ognuno di essi,
tutti i punti materiali isolati si muovano a velocit`a costante.
Commenti 1.3.
(1) Assumeremo che la nozione di punto materiale isolato sia assoluta, cioe indipendente dal
riferimento: se un punto `e isolato in un riferimento lo deve essere in tutti gli altri.
14
(2) Come in sica classica si assume di poter disporre di un punto materiale isolato in ogni evento
dello spaziotempo (per un intervallo temporale piccolo ma nito) e con velocit`a arbitrariamente
scelta in direzione e modulo variabile dal valore zero no ad almeno il valore della velocit`a della
luce.
1.4.3 Principio di Relativit`a.
Lultimo principio di Einstein concerne lestensione del principio di relativit`a galileiano a tutta
la sica, inclusi i fenomeni elettromagnetici.
RS3. Principio di Relativit`a. Non `e in alcun modo possibile privilegiare un sistema di
riferimento nella classe dei sistemi di riferimento inerziali tramite i risultati di esperimenti di
sica.
15
Capitolo 2
I gruppi di Lorentz e di Poincare.
2.1 Dai postulati della Relativit`a speciale al gruppo di Poincare.
Quello che ora vogliamo fare in questa sezione `e determinare la legge di trasformazione tra le
coordinate cartesiane ortonormali solidali con due dierenti sistemi di riferimento inerziali. Ci`o
sar`a fatto usando i principi RS1 e RS2 pi` u altre ipotesi di carattere matematico o sico matem-
atico che enunceremo quando necessarie.
Nota 2.1. Dora in poi il valore universale della velocit` a della luce sar` a indicato con c.
2.1.1 Postulati della Relativit`a in sistemi di coordinate minkowskiane.
Deniamo preventivamente dei sistemi di coordinate che ci saranno utili in tutto il seguito.
Consideriamo un sistema di riferimento F in M
4
. Fissiamo un sistema di coordinate cartesiane
ortonormali

F
: E
3
F
P (x
1
(P), x
2
(P), x
3
(P)) = X(P) R
3
nello spazio di quiete E
3
F
di F ed una costante t
0
R delle dimensioni di un tempo. Il sistema
di coordinate globali indotto su M
4

F
: M
4
x (ct(x) +ct
0
,
F
(P
F
(x))) .
`e detto sistema di coordinate minkowskiane solidali con F.
Consideriamo un riferimento inerziale F. In coordinate minkowskiane associate a F, levoluzione
di un punto materiale sar`a descritta in tali coordinate da 4 funzioni dierenziabili
x
i
= x
i
(u) i=0,1,2,3,
dove u (a, b) `e un qualsiasi parametro che soddisfa dx
0
/du ,= 0 per ogni punto u (a, b). Dora
in poi le lettere latine usate per denotare un indice potranno assumere tutti i valori 0, 1, 2, 3,
16
mentre gli indici greci potranno assumere solo i valori 1, 2, 3. La velocit`a del punto materiale
rispetto a F avr`a componenti
v

=
dx

dt
= c
dx

du
dx
0
du
.
Il modulo quadro della velocit`a in F vale
v
2
= c
2
3

=1
(U

)
2
(U
0
)
2
dove U
i
:=
dx
i
du
. (2.1)
La teoria si deve ridurre a quella classica per piccole velocit`a in cui tutte le velocit`a sono
ammissibili. Di conseguenza assumeremo che linsieme C
x,F
dei vettori tangenti nellevento x
alle linee di universo di punti materiali passanti per tale evento includa i vettori di T
x
M associati
a moti con velocit`a sucientemente piccole in F ed in ogni direzione. In virt` u di (2.1) C
x,F
dovr`a includere un cono aperto con asse attorno allasse U

= 0. In altre parole, per qualche


costante v
0
> 0 delle dimensioni di una velocit`a,
_
U T
x
M
4

0 <
3

=1
(U

)
2
<
v
2
0
c
2
(U
0
)
2
_
C
x,F
dove U
i
:=
dx
i
du
. (2.2)
Daltra devono essere ammissibili i moti alla velocit`a della luce in ogni direzione. Di conseguenza
ci aspettiamo che tutte le velocit`a no a quella della luce siano ammissibili per cui
_
U T
x
M
4

0 <
3

=1
(U

)
2
(U
0
)
2
_
C
x,F
dove U
i
:=
dx
i
du
. (2.3)
In particolare, risulta subito che condizione necessaria e suciente anche il moto sia rettilineo
uniforme rispetto a F `e che, per ogni i,
dx
i
du
dx
0
du
= costante .
Ci`o equivale a dire che le derivate in u di tutti i rapporti di sopra sono nulle in (a, b). Calcoliamo
esplicitamente le derivate di tali rapporti:
d
du
_
dx
i
du
dx
0
du
_
=
_
dx
0
du
_
2
_
d
2
x
i
du
2
dx
0
du

d
2
x
0
du
2
dx
i
du
_
. (2.4)
Si tenga conto che dx
0
/du ,= 0 per ipotesi, inoltre se il moto `e rettilineo uniforme per u (a, b),
vale dx
j
/du = c
j
dx
0
/du per certe costanti c
j
. Se c
j
,= 0, allora dx
0
/du = (c
j
)
1
dx
j
/du ed il
fatto che il il moto sia rettilineo uniforme per u (a, b), ossia si annulli il primo membro di
(2.4), implica subito:
d
2
x
i
du
2
dx
j
du

d
2
x
j
du
2
dx
i
du
= 0 per ogni u (a, b).
17
Se il moto `e rettilineo uniforme e c
j
= 0 allora dx
j
/du = 0 su (a, b) perche dx
j
/du = c
j
dx
0
/du.
In tal caso lidentit`a di sopra vale banalmente unaltra volta. Quindi, se il moto `e rettilineo
uniforme per u (a, b) allora
d
2
x
i
du
2
dx
j
du

d
2
x
j
du
2
dx
i
du
= 0 per ogni u (a, b) e i, j = 0, 1, 2, 3.
Se viceversa valgono le identit`a di sopra allora ponendo j = 0 e dividendo per (dx
0
/du)
2
,= 0 si
ha che
d
du
_
dx
i
du
dx
0
du
_
= 0
su (a, b) per cui il moto `e rettilineo uniforme. In denitiva il moto `e rettilineo uniforme se e solo
se:
d
2
x
i
du
2
dx
j
du

d
2
x
j
du
2
dx
i
du
= 0 per ogni u (a, b) e i, j = 0, 1, 2, 3. (2.5)
Vediamo ora come scrivere che la velocit`a del punto materiale considerato ha modulo pari a c.
Se teniamo conto della (2.1) e introduciamo la matrice di coecienti
:=
_

_
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
_

_
, (2.6)
la condizione v
2
= c
2
si riscrive equivalentemente, dove, dora in poi, `e sottointesa la somma
sugli indici ripetuti,

ij
dx
i
du
dx
j
du
= 0 . (2.7)
Consideriamo ora un secondo sistema di riferimento inerziale F

con coordinate minkowskiane


y
0
, y
1
, y
2
, y
3
. Data la natura di variet`a dello spaziotempo, i due sistemi di coordinate saranno
legati da una trasformazione biettiva da R
4
a R
4
dierenziabile, con inversa dierenziabile che
formalmente esprimeremo come
y
i
= y
i
(x
0
, x
1
, x
2
, x
3
) dove (x
0
, x
1
, x
2
, x
3
) R
4
e i = 0, 1, 2, 3.
Dato che la nozione di punto materiale isolato non dipende dal riferimento e che abbiamo assunto
di poter disporre di punti materiali isolati in ogni luogo e tempo (per intervalli di tempo piccoli
ma niti) con velocit`a arbitrarie (almeno nei limiti detti sopra), il moto rettilineo uniforme di un
punto materiale in un riferimento inerziale pu`o sempre essere pensato come dovuto al fatto che
il punto materiale `e isolato. Concludiamo che il moto rettilineo uniforme di un punto materiale
(isolato o no) in un riferimento inerziale deve essere descritto come moto rettilineo uniforme
in ogni altro sistema di riferimento inerziale. In particolare ci`o si applica anche per moti alla
18
velocit`a della luce che possono sempre pensarsi come propri di segnali luminosi. Abbiamo allora
la seguente coppia di richieste sulla trasformazione
y
i
= y
i
(x
0
, x
1
, x
2
, x
3
) dove (x
0
, x
1
, x
2
, x
3
) R
4
e i = 0, 1, 2, 3.
(a) in virt` u di RS2 il moto di un punto materiale con linea di universo : u M
4
appare
rettilineo uniforme in F

(per un certo intervallo di tempo) se appare rettilineo uniforme in F


(per un corrispondente intervallo di tempo), ovvero
d
2
y
i
du
2
dy
j
du

d
2
y
j
du
2
dy
i
du
= 0 se
d
2
x
i
du
2
dx
j
du

d
2
x
j
du
2
dx
i
du
= 0 (2.8)
dove la linea di universo `e rappresentata in coordiniate minkowskiane di F con le funzioni
dierenziabili x
i
= x
i
(u), soggette al vincolo (2.3) in ogni evento attraversato, e in quelle di F

con le funzioni dierenziabili y


i
= y
i
(u), i = 0, 1, 2, 3;
(b) in particolare, in virt` u di RS1, un punto materiale con linea di universo : u M
4
si
muove alla velocit`a della luce in F

se si muove alla velocit`a della luce in F. Ovvero

ij
dy
i
du
dy
j
du
= 0 se
ij
dx
i
du
dx
j
du
= 0 , (2.9)
dove la linea di universo `e rappresentata in coordiniate minkowskiane di F con le funzioni
dierenziabili x
i
= x
i
(u), soggette al vincolo (2.3) in ogni evento attraversato, e in quelle di F

con le funzioni dierenziabili y


i
= y
i
(u), i = 0, 1, 2, 3.
2.1.2 Determinazione delle trasformazioni di coordinate tra riferimenti in-
erziali.
Il problema iniziale si riduce a quello di voler determinare la pi` u generale trasformazione biettiva
da R
4
in R
4
dierenziabile
y
i
= y
i
(x
0
, x
1
, x
2
, x
3
) dove (x
0
, x
1
, x
2
, x
3
) R
4
e i = 0, 1, 2, 3,
tale che soddis (a) e (b) di sopra per ogni scelta della curva di universo usata in (a) e (b) con
le richieste ivi fatte. Ora passeremo a trarre due utili conseguenze matematiche di (a) e (b) che
determineranno la soluzione generale del problema.
Trattamento di (a). Essendo
y
i
(u) = y
i
(x
0
(u), x
1
(u), x
2
(u), x
3
(u)) ,
valgono le identit`a
d
2
y
i
du
2
dy
j
du

d
2
y
j
du
2
dy
i
du
=
y
i
x
p
y
j
x
q
_
d
2
x
p
du
2
dx
q
du

d
2
x
q
du
2
dx
p
du
_
+
dx
p
du
dx
q
du
dx
r
du
_

2
y
i
x
p
x
q
y
j
x
r


2
y
j
x
p
x
q
y
i
x
r
_
. (2.10)
19
e quindi, in virt` u di (7), in ogni evento x vale
0 = U
p
U
q
U
r
_

2
y
i
x
p
x
q
[
x
y
j
x
r
[
x


2
y
j
x
p
x
q
[
x
y
i
x
r
[
x
_
. (2.11)
dove le componenti di U T
x
M
4
, U
i
= dx
i
/du si riferiscono ad un moto rettilineo uniforme di
un punto materiale e sono valutate quando la corrispondente linea di universo passa per x. Il
secondo membro di (2.11) pu`o pensarsi, a x e i, j ssati, come un polinomio P
(ij)
(x)
[U
0
, U
1
, U
2
, U
3
]
nelle variabili U
i
. Tale polinomio si annulla in un insieme aperto per la condizione (2.3) (in realt`a
`e suciente la condizione pi` u debole(2.2)), di conseguenza si annulla ovunque, cio`e tutti i suoi
coecienti sono nulli. In particolare, per i coecienti del terzo ordine deve essere:

3
P
(ij)
(x)
U
a
U
b
U
c
= 0 .
Il calcolo esplicito del primo membro produce le identit`a che devono valere in ogni evento x M
4
e per ogni scelta degli indici i, j, a, b, c:

2
y
i
x
a
x
b
y
j
x
c
+

2
y
i
x
b
x
c
y
j
x
a
+

2
y
i
x
c
x
a
y
j
x
b


2
y
j
x
a
x
b
y
i
x
c


2
y
j
x
b
x
c
y
i
x
a


2
y
j
x
c
x
a
y
i
x
b
= 0
Moltiplicando per x
c
/y
j
ed eettuando una somma sugli indici ripetuti, lidentit`a trovata
implica la seguente utile conseguenza di (a) valida in ogni evento x M
4
:

2
y
i
x
a
x
b
[
x
=
a
(x)
y
i
x
b
[
x
+
b
y
i
x
a
[
x
(2.12)
dove

k
(x) :=
1
5

2
y
j
x
c
x
k
[
x
y
c
x
j
[
x
. (2.13)
Trattamento di (b). Notiamo che

ij
dy
i
du
dy
j
du
=
_

ij
y
i
x
p
y
j
x
q
_
dx
p
du
dx
q
du
. (2.14)
In tal modo la condizione (b) si riscrive

ij
U
i
U
j
= 0 implica
ij
y
i
x
p
[
x
y
j
x
q
[
x
U
p
U
q
= 0 . (2.15)
In altri termini

x
(U, U) = 0 se (U, U) = 0 , (2.16)
20
dove il vettore U T
x
M
4
, con componenti U
k
= dx
k
/du rispetto alla base associata in x dalle
coordinate minkowskiane di F, `e soggetto alla restrizione (2.3), e la forma quadratica

x
`e
denita da

x
(U, U) :=
ij
y
i
x
p
[
x
y
j
x
q
[
x
U
p
U
q
, (2.17)
In particolare vale (U, U) = 0 e quindi

x
(U, U) = 0 se
(U
0
)
2
=
3

=1
(U

)
2
.
Un vettore di questo tipo si ottiene ponendo U
0
V
= [V [ e U

V
= V

, dove [V [ :=
_

3
=1
(V

)
2
.
Rappresentiamo

x
con la matrice simmetrica di coecienti c
00
, c
0
= c
0
, c

= c

.
La condizione

x
(U
V
, U
V
) = 0 si riscrive:
c
00
[V [
2
+ 2
3

=1
[V [V

c
0
+
3

,=1
V

= 0
per V

R. Ossia
2
3

=1
[V [V

c
0
+
3

,=1
V

(c

+c
00

) = 0
per ogni V

R. Questo `e possibile solo se: c

= c
00

e c
0
= 0. Infatti, scegliendo
inizialmente un vettore colonna di numeri V

R e poi il vettore colonna dei numeri V

R,
si ha che devono valere entrambe le condizioni:
2
3

=1
[V [V

c
0
+
3

,=1
V

(c

+c
00

) = 0
e
2
3

=1
[V [V

c
0
+
3

,=1
V

(c

+c
00

) = 0
per ogni V

R. Ma allora devono valere separatamente le condizioni:


3

=1
[V [V

c
0
= 0 e
3

,=1
V

(c

+c
00

) = 0
per ogni V

R. La prima richiesta implica che: c


0
= 0 per ogni = 1, 2, 3. La seconda,
tenuto conto della simmetria dei coecienti c

+ c
00

, implica che
1
c

+ c
00

= 0 cioe :
1
Se A `e una matrice simmetrica n n e vale u
t
Au = 0 per ogni u R
n
, ponendo u = x + y abbiamo:
x
t
Ax +y
t
Ay +x
t
Ay +y
t
Ax = 0, ossia x
t
Ay +y
t
Ax = 0. Ma, dato che A
t
= A, vale anche y
t
Ax = x
t
Ay, per cui
deve essere x
t
Ay = 0 per ogni scelta di x, y R
n
, che signica A = 0.
21
c

= c
00

. In denitiva, se indichiamo con (x) il coeciente c


00
, deve essere:

x
= (x) ,
dove x (x) R `e una funzione arbitraria. Tale funzione `e dierenziabile perche, interpre-
tando le forme quadratiche come matrici reali 4 4 risulta subito
3(x) = tr(

x
) =
pq

ij
y
i
x
p
[
x
y
j
x
q
[
x
,
dove la traccia `e quella ordinaria per matrici 44. Lultimo membro `e banalmente dierenziabile,
inoltre (x) `e strettamente positivo a causa di (2.17) e del teorema di Sylvester sulla permanenza
della segnatura [9] di una forma quadratica sotto lazione di una trasformazione di similitudine.
Concludiamo che (b) implica che

ij
y
i
x
p
[
x
y
j
x
q
[
x
= (x)
pq
, (2.18)
dove x (x) `e una funzione strettamente positiva e dierenziabile.
Inne, nelle ipotesi di validit`a di (a) e (b) deriviamo in x
r
la (2.18) esprimendo le derivate
seconde delle y
i
tramite (2.12). In tal modo si ottiene

ij
__

p
y
i
x
r
+
r
y
i
x
p
_
y
j
x
q
+
_

q
y
j
x
r
+
r
y
j
x
q
_
y
i
x
p
_
[
x
=

x
r

pq
.
Usando ancora la (2.18), lidentit`a trovata si riduce a

rq
+
q

pr
+ 2
r

pq
=
ln
x
r

pq
.
Consideriamo tale sistema come un sistema algebrico nelle incognite
r
e ln /x
r
.
`
E facile
ottenere per verica diretta che tale sistema ammette lunica soluzione, per ogni x M e
k = 0, 1, 2, 3:

k
(x) = 0 , (2.19)
ln
x
r
= 0 . (2.20)
Da (2.13), tenendo conto che la matrice jacobiana di passaggio dalle coordinate x
0
, x
1
, x
2
, x
3
alle
coordinate y
0
, y
1
, y
2
, y
3
`e invertibile, le soluzioni di sopra implicano che per ogni i = 0, 1, 2, 3,
y
i
x
j
[
x
= costante , (2.21)
(x) = costante . (2.22)
22
Mettendo tutto insieme, abbiamo ottenuto che, la trasformazione di coordinate minkowskiane
x
0
, x
1
, x
2
, x
3
e y
0
, y
1
, y
2
, y
3
riferite a due riferimenti inerziali rispettivamente F e F

deve essere
della forma:
y
i
= C
i
+L
i
j
x
j
(2.23)
dove i 4 coecienti C
i
R sono arbitrari e i 16 coecienti L
i
j
R soddisfano le relazioni

ij
L
i
p
L
j
q
=
pq
,
dove > 0 `e una costante. Si noti che se rideniamo le unit`a di misura dello spazio e del tempo
del riferimento F dilatando di un fattore comune
1/2
(ci`o non `e in contraddizione con i postulati
della Relativit`a come precisato dopo RS1), possiamo sempre ridurci alla trasformazione indotta
dai coecienti
i
j
:=
1/2
L
i
j
. Infatti, denendo nuove coordinate minkowskiane su F date da
x
j
:=

x
j
, avremmo da (2.23) che dovr`a essere:
y
i
= C
i
+

i
j
x
j
, (2.24)
e cioe:
y
i
= C
i
+
i
j
x
j
.
Indicando nuovamente senza la barra le coordinate associate a F, avremmo allora:
y
i
= C
i
+
i
j
x
j
, (2.25)
dove i coecienti C
i
R sono arbitrari e, per costruzione, le matrici di coecienti
i
j
soddisfano la relazione di Lorentz:

t
= . (2.26)
Supponiamo viceversa che F sia un riferimento inerziale dotato di coordinate minkowskiane
x
0
, x
1
, x
2
, x
3
e che F

sia un secondo riferimento dotato di coordinate minkowskiane y


0
, y
1
, y
2
, y
3
che sono connesse alle precedenti tramite (2.25) e (2.26).
`
E immediato vericare che F

deve
essere inerziale perche, a causa della linearit`a, le trasformazioni lineari di sopra preservano il
moto rettilineo uniforme (basta notare che se la condizione (2.5) `e soddisfatta nel riferimento
F, risulta essere soddisfatta anche in F

) e la nozione di punto materiale isolato `e assunta es-


sere indipendente dal riferimento. Ulteriormente la condizione (2.26) assicura immediatamente
tramite (2.7) che un punto materiale in moto alla velocit`a della luce in F `e visto in F

in moto
alla velocit`a della luce.
In denitiva abbiamo provato il seguente teorema:
Teorema 2.1. Assumendo:
(a) la validit`a del principio dinerzia RS2,
(b) la validit`a del principio di costanza della velocit`a della luce RS1,
(c) di poter disporre di un punto materiale isolato in ogni evento dello spaziotempo per un in-
tervallo di tempo nito (rispetto a qualche riferimento inerziale),
23
(d) che la velocit`a dei punti materiali nei riferimenti inerziali possa avere componenti in ogni
direzione e verso e di modulo compreso almeno nellintervallo [0, c] (2.3),
allora vale quanto segue.
(1) La legge di trasformazione tra due sistemi di coordinate minkowskiane solidali con due rispet-
tivi sistemi di riferimento inerziali deve essere lineare.
(2) Pi` u precisamente (previa una eventuale ridenizione delle unit`a di misura di lunghezze
spaziali ed intervalli temporali nei riferimenti inerziali in conformit`a con la validit`a dei principi
sopra assunti) le trasformazioni (2.25) con C
i
R e la matrice dei coecienti
i
j
soddisfacente
(2.26), sono tutte e sole le trasformazioni di sistemi di coordinate minkowskiane solidali con i
rispettivi sistemi di riferimento inerziali.
Nota 2.2. Al ne di ottenere = 1 abbiamo sfruttato la possibilit`a di ridenire dilatando
o contraendo se necessario le unit`a di misura dei singoli riferimenti inerziali (senza alterare
il valore della velocit`a della luce). Una questione che si deve porre sicamente `e allora la
seguente. Consideriamo tre arbitrari sistemi di riferimento inerziali F
l
con l = 1, 2, 3.
ij
indica il coeciente che si ottiene esprimendo la legge di trasformazione (2.24) quando le
coordinate y
0
, . . . , y
3
sono relative al riferimento i mentre le coordinate x
0
, . . . , x
3
sono relative
al riferimento j. Per costruzione deve risultare:

ij
=
ik

kj
, se i, j, k 1, 2, 3 . (2.27)
Scegliendo i = j = k e poi i = j si hanno in particolare le realzioni

ii
= 1 ,
ik
=
1
ki
. (2.28)
In base alle ipotesi no ad ora fatte, non e possibile concludere a questo punto che
ik
= 1, cioe
che le unit`a di misura possano essere ssate, una volta per tutte in tutti i riferimenti inerziali,
al ne di poter usare sempre la legge di trasformazione (2.25) tra i corrispettivi sistemi di coor-
dinate per ogni coppia di riferimenti inerziali. Unipotesi abbastanza debole per ottenere questo
risultato `e la richiesta che per ogni coppia di riferimenti inerziali F
i
, F
j
distinti vi sia un terzo
riferimento inerziale F
k
per il quale valga
ki
=
kj
. Dalla (2.27) e dalla seconda in (2.28) si
ha immediatamente che deve essere
ij=1
.
`
E possibile mostrare che lesistenza di F
k
suddetto
`e conseguenza dellipotesi di isotropia delle leggi siche formulate nei riferimenti inierziali, se si
assume tale ipotesi. Tuttavia noi non ci occuperemo qui della richiesta generale dellisotropia
ed assumeremo direttamente che si possano scegliere una volta per tutte i coecienti pari a
= 1 per ogni coppia di riferimenti inerziali.
2.2 IL gruppo di Lorentz ed il gruppo di Poincare.
Possiamo ora introdurre i gruppi di Lorentz e Poincare tramite il seguente teorema che prova che
le trasformazioni tra coordinate minkowskiane ottenute nella sezione precedente, tenuto conto
24
dellosservazione 2.2, formano un gruppo.
Teorema 2.2. (I gruppi di Lorentz e di Poincare.)
(1) Linsieme delle matrici reali 4 4, soddisfacenti

t
= . (2.29)
con
:=
_

_
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
_

_
, (2.30)
formano un gruppo, O(1, 3), sottogruppo di GL(4, R) detto Gruppo di Lorentz. O(1, 3) `e
chiuso rispetto alloperazione di trasposizione di matrici.
(2) Linsieme delle trasformazioni da R
4
in R
4
denite da
P
(C,)
: R
4
X C + X , (2.31)
con C R
4
, e O(1, 3) formano un gruppo, IO(1, 3), sottogruppo del gruppo delle funzioni
biettive da R
4
in R
4
detto Gruppo di Poincare
2
.
Dimostrazione. Per prima cosa proviamo che O(1, 3) `e un gruppo sottogruppo di GL(4, R). A
tal ne notiamo che la matrice identit`a soddisfa (2.29) per cui `e suciente provare che O(1, 3)
`e chiuso rispetto al prodotto di matrici ed alloperazione di inversa.
Per quanto riguarda il primo punto, notiamo che, se
t

= e
t
= allora banalmente

= per cui (

)
t

= . Quindi O(1, 3) `e chiuso rispetto al prodotto di matrici.


Per quanto riguarda la chiusura rispetto alloperazione di inversa, notiamo che dal teorema di
Binet,
t
= implica (det
t
)(det )(det ) = det = 1 ossia (det )
2
= 1. Per tale motivo
det ,= 0 e quindi esiste
1
se O(1, 3).
Daltra parte, se O(1, 3) allora vale anche
t
= . Infatti, moltiplicando ambo membri
di
t
= per a sinistra e tenendo conto che = I, si ha

t
= ,
per cui

t
= ()
1
=
1
= .
Ci`o prova che O(1, 3) `e chiuso rispetto alla trasposizione di matrici. Per concludere riguardo alla
chiusura rispetto allinversa, notiamo che se
t
= allora (
t
)
1
=
1
ossia
1

1t
=
, ossia
1t
O(1, 3). Applicando la chiusura rispetto alla trasposizione otteniamo che
1
=
2
Il simbolo IO(1, 3), ed in particolare la lettera I, deriva dal fatto che il gruppo di Poincar`e si chiama anche
gruppo pseudoortogonale inomogeneo.
25
(
1t
)
t
O(1, 3) se O(1, 3).
Per quanto riguarda la seconda parte del teorema, notiamo che la trasformazione (2.31) con
C = 0 e = I appartiene allinsieme considerato di trasformazioni e P
(0,I)
`e la funzione identit`a
da R
4
in R
4
. Di conseguenza `e suciente mostrare che linsieme di trasformazioni considerato
`e chiuso rispetto alla composizione e alloperazione di calcolo dellinversa. Per quanto riguarda
il primo punto esso `e di immediata prova perche se P
(C

)
e P
(C,)
sono nellinsieme di
trasformazioni considerato
P
(C

)
P
(C,)
= P
(C

C,

)
`e ancora una trasformazione dellinsieme considerato perche

O(1, 3) se

, O(1, 3).
come provato sopra.
Per quanto riguarda la chiusura rispetto al calcolo dellinversa notiamo che se P
(C,)
`e nellin-
sieme di trasformazioni considerato,
P
1
(C,)
= P
(
1
C,
1
)
ed il secondo menbro `e ben denito ed `e ancora elemento dellinsieme di trasformazioni consid-
erato perche
1
O(1, 3) se O(1, 3) come provato sopra. 2
Nota 2.3.
(1) La scrittura O(1, 3) `e riferita al numero di volte in cui appare 1 (una volta) ed al numero di
volte in cui appare +1 (tre volte) nella matrice diagonale . Il gruppo O(1, 3) `e un sottocaso di
una classe di gruppi ciascuno dei quali `e indicato con O(n, m) dove n, m sono interi non negativi
arbitrari con m > 0. Tali gruppi vengono detti genericamente pseudo ortogonali.
`
E chiaro che
per n = 0 si ritrovano i soliti gruppi ortogonali O(0, m) = O(m). Precisiamo che in alcuni testi
i signicati di n e m in O(n, m) sono invertiti rispetto alla notazione usata qui.
(2) Se A e B sono gruppi,
b

bB
`e una classe di automorsmi gruppali su A (cioe
isomorsmi gruppali
b
: A A) che rappresentano B, se vale
b

b
=
bb
per ogni
coppia di elementi b, b

B, dove `e lusuale composizione di funzioni e bb

`e il prodotto
gruppale in B di b e b

. Per ogni coppia di gruppi A, B dotata di una classe di automorsmi


gluppali su A che rappresentano B, si pu`o costruire una struttura gruppale su A B detta
prodotto semidiretto dei gruppi A e B. In questo caso il prodotto su AB `e denito come:
(a, b) (a

, b

) := (a
b
(a

), bb

) ,
dove a
b
(a

) `e il prodotto gruppale in A di a e
b
(a

). Si dimostra facilmente che il prodotto


denito sopra rende A B un gruppo. Nel caso in cui
b
= id
A
per ogni b A, la struttura di
gruppo costruita prende il nome di prodotto diretto dei gruppi A e B.
Risulta ovvio che IO(1, 3) `e un prodotto semidiretto del gruppo (abeliano) delle traslazioni di
R
4
e del gruppo di Lorentz O(1, 3). con automorsmi

deniti come:

C := C , per ogni O(1, 3) e ogni C R


4
.
26
Esercizi 2.1.
1. Mostrare che se O(1, 3) allora

1
=
t
.
2. Se O(1, 3) pu`o accadere che
0
0
= 0?
Soluzione. Dalla denizione di O(1, 3) si ha che deve essere
1 =
00
= (
0
0
)
2
+
3

=1

.
per cui la risposta `e negativa.
Esempi 2.1.
1. Si consideri una matrice R O(3), ossia una matrice reale 3 3 tale che R
t
R = I. Si prova
immediatamente, usando la denizione del gruppo di Lorentz che la matrice

R
:=
_

_
1 0 0 0
0
0 R
0
_

_
`e un elemento del gruppo di Lorentz. Similmente P
(C,
R
)
`e nel gruppo di Poincare per ogni
C R
4
. In questo modo abbiamo ritrovato il fatto sicamente ovvio, che allinterno dellinsieme
delle trasformazioni di coordinate tra due riferimenti ci devono anche essere la trasformazioni di
coordinate allinterno di uno stesso riferimento, cio`e trasformazioni che non coinvolgono velocit`a
relative. Come vedremo pi` u avanti, ed esattamente come avviene per il gruppo di Galileo, una
matrice del gruppo di Lorentz pu`o infatti essere decomposta in pi` u parti di cui solo una parte
coinvolge la cinematica. Gli aspetti interessanti che dierenziano la cinematica relativistica
da quella classica sono riferiti a tale parte della decomposizione di un elemento del gruppo di
Poincare.
2. Si considerino le trasformazioni dette trasformazioni speciali di Lorentz lungo lasse x
3
:=
_

_
0 0 v/c
0 1 0 0
0 0 1 0
v/c 0 0
_

_
dove := 1/
_
1 v
2
/c
2
e v (c, c). Si verica subito, applicando la denizione del gruppo
di Lorentz, che questa trasformazione `e un elemento di tale gruppo. Lazione esplicita della
matrice di sopra `e la seguente.
t

= (t
v
c
2
x
3
) , (2.32)
x
1
= x
1
, (2.33)
x
2
= x
2
, (2.34)
x
3
= (x
3
vt) , (2.35)
27
dove (t, x
1
, x
2
, x
3
) e (t

, x
1
, x
2
, x
3
) sono le coordinate di uno stesso evento riferite a due sistemi
di coordinate minkowskiane dierenti relativi a due riferimenti F e F

rispettivamente. Si noti
che per t = 0 e x
1
= x
2
= x
3
= 0 troviamo che t

= 0 e x
1
= x
2
= x
3
= 0. Questo signica che
i due riferimenti hanno posto lorigine degli assi e del tempo in uno stesso evento O. Al tempo
t = t

= 0 i due osservatori si vedono reciprocamente con le origini rispettive degli assi spaziali
coincidenti.
Laspetto pi` u interessante delle trasformazioni di sopra `e che esse implicano che la nozione di
contemporaneit`a dipenda dal riferimento. Infatti, dalla (2.32) risulta subito che se due eventi
p, q M
4
con coordinate spaziali x
3
(p) ,= x
3
(q) a giudizio del riferimento F risultano avere
la stessa coordinata temporale t(p) = t(q), ci`o sar`a falso nel giudizio dellaltro riferimento!
Torneremo in seguito su tutti questi fenomeni apparentemente paradossali.
Vediamo ora di dare un signicato sico al parametro v. Consideriamo un punto P in quiete con
il riferimento F

con coordinate (costanti!) (x


1
, x
2
, x
3
). Tale punto descriver`a una curva nelle
coordinate dellaltro riferimento e parametrizzata in t

. Possiamo esprimere la curva in funzione


di t usando direttamente (2.35). Otteniamo in tal modo:
x
1
(t) = x
1
, (2.36)
x
2
(t) = x
2
, (2.37)
x
3
(t) = vt +
x
3

, (2.38)
dove x
3
`e costante.
`
E allora chiaro che v rappresenta il valore (con segno) della velocit`a con
cui si vedono muovere nel riferimento F i punti in quiete nel riferimento F

. Tale velocit`a non


dipende dal punto ed `e perci`o una velocit`a di trascinamento. Le trasformazioni speciali giocano
un ruolo simile a quello giocato dalle trasformazioni pure di Galileo lungo un asse.
3. Per motivi sperimentali le trasformazioni di Lorentz trovate sopra si devono ridurre a quelle
di Galilei in qualche approssimazione di piccole velocit`a di trascinamento. Se ci`o non fosse
avremmo scoperto le trasformazioni di Lorentz molto tempo prima dellinizo del 1900.
`
E chiaro
che possiamo confrontare v solo con c. Consideriamo lo sviluppo di Taylor della funzione
(v/c) = 1/
_
1
_
v
c
_
2
che compare in (2.32)-(2.35).
(v/c) = 1 +
v
2
2c
2
+o
_
v
4
c
4
_
.
Dal punto di vista pratico c 3 10
5
km/s `e una velocit`a grandissima. Vediamo qualche stima.
Per velocit`a relative tra sistemi di riferimento dellordine al pi` u di 1000km/s, troviamo al pi` u
v
2
/c
2
10
4
per cui il fattore nelle (2.32)-(2.35) `e del tutto trascurabile. Se lavoriamo con
distanze dellordine al pi` u di 100.000 km e velocit`a come detto sopra, il secondo addendo nel
28
secondo membro di (2.32) produce valori di tempo dellordine al pi` u di 10
3
s. Trascurando
completamente sia che il secondo addendo nel secondo membro di (2.32) otteniamo
t

= t , (2.39)
x
1
= x
1
, (2.40)
x
2
= x
2
, (2.41)
x
3
= x
3
vt . (2.42)
Questa `e una trasformazione pura di Galilei lungo lasse x
3
.
2.2.1 Il sottogruppo ortocrono.
In realt`a la classe di trasformazioni di Poincare `e troppo vasta per il seguente motivo sico: la
classe dei sistemi di riferimento usati in sica ha la peculiarit`a che ogni sistema di riferimento
giudica lo scorrere del tempo nella stessa direzione. (Si osservi che non `e comunque scorretto dal
punto di vista matematico ammettere luso di riferimenti i cui il tempo `e visto scorrere allindi-
etro.) La richiesta di non invertire il senso di scorrimento del tempo per eventi che avvengono
nello stesso posto spaziale in un riferimento inerziale si traduce nel requisito matematico in
riferimento alle solite coordinate minkowskiane:
y
0
x
0

p
> 0
per ogni evento p M
4
. Tale requisito, si traduce immediatamente nella richiesta sui coecienti

i
j

0
0
> 0 . (2.43)
Nella sica classica il requisito di non inveritire il senso del tempo `e automatico quando si assume
che la coordinata temporale di ogni riferimento coincida con il tempo assoluto a meno di una
costante additiva.
Teorema 2.3. (I gruppi di Lorentz e di Poincare ortocroni.)
(1) (i) Se O(1, 3) allora
0
0
< 0 oppure
0
0
> 0, e queste disuguaglianze sono rispettiva-
mente equivalenti a
0
0
1 e
0
0
+1.
(ii) Linsieme delle matrici del gruppo di Lorentz O(1, 3) tali che
0
0
> 0 forma un
sottogruppo O(1, 3) detto il gruppo di Lorentz ortocrono. Tale gruppo `e chiuso rispetto
alla trasposizione di matrici.
(2) Linsieme delle trasformazioni del gruppo di Poincare P
(C,)
con O(1, 3) forma un
sottogruppo detto gruppo di Poincare ortocrono indicato con IO(1, 3).
(3) Denita la matrice, T := detta inversione del tempo dove `e data dalla (2.6), vale
(i) T O(1, 3),
29
(ii) TT = I.
(iii) per ogni O(1, 3), T O(1, 3) se e solo se , O(1, 3).
(iv) O(1, 3) coincide con lunione dei due insiemi disgiunti O(1, 3) e TO(1, 3) , dove
TO(1, 3) := T [ O(1, 3).
Dimostrazione. La prova di (i) in (1) `e immediata: dalla condizione
t
= si ha che deve
essere
1 =
00
= (
0
0
)
2
+
3

=1

, (2.44)
da cui la tesi segue immediatamente. In base a (i) le condizioni
0
0
> 0 e
0
0
1 sono
equivalenti. Le dimostrazioni della parte (ii) di (1) e della parte (2) sono molto simili, con ovvie
modiche, a quelle del teorema 2.2. Ci limitiamo pertanto a provare che se O(1, 3) allora

1
O(1, 3) e che, se ,

O(1, 3) allora

O(1, 3) . Si osservi che `e ovvio che


I O(1, 3) e che
t
O(1, 3) se O(1, 3).
Per quanto riguarda la chiusura rispetto alla operazione di calcolo dellinversa notiamo che, per
computo diretto si verica che
1
=
t
per ogni O(1, 3). Daltra parte, si verica
direttamente facendo il calcolo esplicito dei prodotti matriciali che (
t
)
0
0
= (
t
)
0
0
=
0
0
per cui la tesi `e provata.
Passiamo alla verica della chiusura rispetto al prodotto. Dobbiamo provare che se valgono

0
0
> 0,
0
0
> 0 allora (

)
0
0
> 0. Partiamo dallespressione
(

)
0
0
=
0
0

0
0
+
3

=1

0
.
Questa pu`o essere scritta come:
(

)
0
0
=
0
0
(
t
)
0
0
+
3

=1

(
t
)
0

Per concludere la dimostrazione `e suciente mostrare che

=1

(
t
)
0

[
0
0
(
t
)
0
0
[ , (2.45)
per cui il segno di (

)
0
0
(che non pu`o annullarsi per (i) di (1) ) coincide con quello di
0
0

0
0
ed `e quindi positivo. Dimostriamo (2.45). Dalla disuguaglianza di Cauchy-Schwarz

=1

(
t
)
0

_
3

=1

_
_
_
3

=1
(
t
)
0

(
t
)
0

_
_
.
30
Possiamo usare (2.44) applicandola a e
t
(tenendo conto che
t
appartiene al gruppo di
Lorentz dato che appartiene a tale gruppo che `e chiuso sotto trasposizione.) (2.44) implica
immediatamente che
3

=1

(
0
0
)
2
e
3

=1
(
t
)
0

t
)
0

((
t
)
0
0
)
2
,
che insieme implicano (2.45).
La dimostrazione di (3) per quanto riguarda (i) e (ii) `e ovvia per computo diretto. Per quanto
riguarda (iii) e (iv) si basa su (i) di (1): se O(1, 3) pu`o accadere solo uno dei due casi mu-
tuamente esclusivi
0
0
> 0 oppure
0
0
< 0 e la moltiplicazione di una matrice O(1, 3) per
T a sinistra (oppure equivalentemente a destra), banalmente scambia i due casi come risultato. 2
Nota 2.4. Linsieme TO(1, 3) non `e un sottogruppo di O(1, 3) perche non contiene lidentit`a.
31
Capitolo 3
Lo spaziotempo della Relativit`a
Speciale e la struttura causale.
In questo capitolo faremo ora uso di elementari nozioni di geometria (pseudo)riemanniana [1,
2, 5, 6]. Un richiamo di alcune nozioni `e riportato nellAppendice B. Il ne del capitolo `e
quello di presentare in forma rigorosa e deduttiva, tramite appropriate nozioni di geometria
(pseudo)riemanniana, il contenuto sico dei capitoli precedenti sviluppato ulteriormente no ad
includere la struttura causale dello spaziotempo.
3.1 Lo spaziotempo della Relativit`a Speciale.
Abbiamo visto nel capitolo precedente che le trasformazioni tra sistemi coordinate minkowskiane
hanno la struttura data dal gruppo di Poincare
P
(C,)
: R
4
X C + X , (3.1)
dove le matrici sono elementi del gruppo di Lorentz denito dalla richiesta:

t
= . (3.2)
Tali fatti hanno alcune conseguenze determinanti.
(a) Il fatto che le coordinate minkowskiane siano globali e che le trasformazioni di Poincare
siano lineari induce naturalmente su M
4
una struttura di spazio ane in cui lapplicazione che
associa a coppie di punti vettori `e denita come segue. Si ssi un evento generico O M
4
e si
consideri lo spazio vettoriale reale V := T
O
M
4
. Si ssi un sistema di coordinate minkowskiane
(x
0
, x
1
, x
2
, x
3
) di origine O. Siano e
0
, e
1
, e
2
, e
3
i vettori di base associati a tali coordinate in
V = T
O
M
4
. Se p, q M
4
associamo alla coppia ordinata (p, q) il vettore

pq V tale che

pq := (x
i
(q) x
i
(p))e
i
.
Usando le trasformazioni del gruppo di Poincare (che connettono coppie di sistemi di coordinate
minkowskiane) `e immediato provare che lapplicazione denita in tal modo non dipende dalle
32
coordinate minkowskiane usate. Ulteriormente tale applicazione soddisfa banalmente le richieste
per denire una struttura ane (vedi Appendice A), come il lettore pu`o facilmente provare
1
.
Quindi: lo spaziotempo della Relativit`a speciale `e una variet`a dierenziabile con struttura di
spazio ane in cui i sistemi di coordinate minkowskiane formano una sottoclasse della classe
delle coordinate cartesiane su M
4
.
(b) Se deniamo su M
4
un tensore pseudometrico
:=
ij
dx
i
dx
j
dove (x
0
, x
1
, x
2
, x
3
) sono un sistema di coordinate minkowskiane, il tensore metrico di sopra as-
sume forma diagonale diag(1, 1, 1, 1) canonica ovunque su M
4
. Ulteriormente, in virt` u di (3.2),
la analoga metrica che viene denita usando un altro sistema di coordinate minkowskiane coin-
cide con stessa. In altre parole possiamo denire direttamente nello spazio delle traslazioni
dello spazio ane e poi indurlo sullo spazio ane in modo canonico (vedi Appendice A). In tal
modo risulta provato che:
la classe dei sistemi di coordinate minkowskiane determina univocamente una pseudometrica
con segnatura (1, 3) su M
4
, che in tal modo diventa una variet` a Lorentziana (vedi Appendice
B) globalmente piatta, in cui i sistemi di coordinate minkowskiani sono tutti e soli i sistemi di
coordinate cartesiane pseudoortonormali. Il gruppo O(1, 3) coincide con il gruppo di stabilit`a
della pseudo metrica di tale variet` a (vedi Appendice B).
Tutto ci`o conduce ad enunciare la seguente denizione, dimenticando la costruzione euristica
fatta no ad ora e ridenendo i sistemi di coordinate minkowskiani.
Denizione 3.1. (Lo spaziotempo della Teoria della Relativit`a Speciale.) Lo
spaziotempo della Teoria della Relativit`a Speciale M
4
, detto spaziotempo di Minkowski, `e
una variet`a dierenziabile a 4 dimensioni, lorentziana e globalmente piatta.
I sistemi di coordinate cartesiane pseudoortonormali rispetto a sono detti sistemi di co-
ordinate minkowskiane di M
4
. Indicheremo con M la classe dei sistemi di coordinate
minkowskiane sullo spaziotempo.
Il passo successivo `e quello di dare una denizione formale di sistema di riferimento inerziale
nel contesto geometrico dierenziale appena introdotto. Ovviamente tale denizione deve de-
terminare i sistemi di riferimento inerziali gi`a introdotti in modo euristico nella costruzione
appunto euristica che ci ha portato allo spaziotempo visto come variet`a lorentziana. Lidea `e
quella di denire i sistemi di riferimento inerziali partendo dalle coordinate minkowskiane che ab-
biamo formalmente (ri)denito sopra. Tuttavia, prima di fare ci`o dobbiamo ssare la direzione
del tempo nella classe M delle coordinate minkowskiane sullo spaziotempo, selezionando la
sottoclasse delle coordinate minkowskiane nelle quali il tempo scorre verso il futuro.
1
Le richieste sullapplicazione (p, q)

pq sono che (i) per ogni p M
4
e u V esiste un unico q M
4
con

pq = u e (ii)

pq +

qr =

pr per ogni p, q, r M
4
.
33
3.1.1 Orientazione temporale dei sistemi di coordinate minkowskiane.
Come notato precedentemente, solo le trasformazioni del gruppo ortocrono di Poincare hanno
signicato sico, se vogliamo attribuire alle coordinate minkowskiane il signicato di coordinate
siche associate ad osservatori. Infatti solo le trasformazioni ortocrone non invertono il senso
dello scorrere del tempo. Usando il gruppo ortocrono, deniamo in M la seguente relazione:
se ,

M,

se e solo se


1
IO(1, 3) . (3.3)
Proposizione 3.1. La relazione denita su M in (3.3) `e una relazione di equivalenza che
ammette due sole classi di equivalenza.
Dimostrazione. Dato che IO(1, 3) `e un gruppo valgono i seguenti fatti.
1
= id
IO(1, 3), per cui `e riessiva. Inoltre se


1
IO(1, 3) allora
1
= (


1
)
1

IO(1, 3), per cui `e simmetrica. Inne se


1

1
2
IO(1, 3) e
2

1
3
IO(1, 3) allora

1
3
= (
1

1
2
) (
2

1
3
) IO(1, 3), per cui `e anche transitiva. In denitiva `e una
relazione di equivalenza. Proviamo che ci sono solo due classi di equivalenza. Preso Mcon-
sideriamo

:= P
(0,T)
, per costruzione

Me ,

dato che

1
= P
(0,T)
, IO(1, 3)
visto che T , O(1, 3). Quindi ci sono almeno due classi di equivalenza: quella di e quella di

. Per provare che sono le uniche due `e suciente dimostrare che se


1
M e vale ,
1
,
allora


1
. Eccone la prova. ,
1
signica
1
1
, IO(1, 3) . Per (iii) in (3) in
teorema 2.3 questo equivale a dire che P
(0,T)
(
1
1
) IO(1, 3) che equivale, a sua volta, a
(P
(0,T)
)
1
1
IO(1, 3), cioe :

1
1
IO(1, 3), che signica, come volevamo,


1
. 2
Se i sistemi di coordinate Minkowskiane ,

appartengono alla stessa classe di equivalenza, e


solo allora, la trasformazione di coordinate tra tali sistemi di coordinate `e elemento del gruppo
ortocrono di Poincare . Dal punto di vista sico, ssare unorientazione temporale nella classe
delle coordinate minkowskiane signica dichiarare in quale delle due classi disgiunte di sistemi di
coordinate minkowskiane si vede il tempo scorrere in avanti. Ha allora senso dare la seguente
denizione.
Denizione 3.2. La scelta di una delle due classi di equivalenza suddette, che indicheremo
con M (e la rimanente con M) si dice orientazione temporale di M. Se M si dice
che `e orientato positivamente nel tempo.
Nota 3.1. Dora in poi lavoreremo solo con sistemi di coordinate minkowskiane in M.
3.1.2 Sistemi di Riferimento inerziali.
Ora possiamo dare una denizione geometrica di sistema di riferimento inerziale. Lidea sica `e
che due sistemi di coordinate minkowskiane deniscano lo stesso sistema di riferimento quando
sono connessi da una rototraslazione spaziale e/o da una traslazione temporale costanti nel
34
tempo. Dal punto di vista matematico, tale idea `e supportata dal fatto che le trasformazioni

R
:=
_

_
1 0 0 0
0
0 R
0
_

_
, (3.4)
dove R O(3) sono elementi di O(1, 3) come si prova per computo diretto. Di conseguenza le
trasformazioni P
(C,
R
)
appartengono a IO(1, 3) per ogni C R
4
e ogni R O(3).
Deniamo in M la seguente relazione:
se ,

M ,

se e solo se


1
= P
(C,
R
)
per qualche C R
4
e R O(3) .
`
E immediato vericare che si tratta di una relazione di equivalenza. Gli elementi F dello spazio
quoziente M / , ossia le classi di equivalenza associate a tale relazione, saranno per denizione,
i sistemi di riferimento inerziali.
Denizione 3.3. (Sistemi di riferimento inerziali.) Le classi di equivalenza associate
alla relazione di equivalenza su M,
se ,

M ,

se e solo se


1
= P
(C,
R
)
per qualche C R
4
e R O(3) ,
sono dette sistemi di riferimento inerziali. Linsieme dei sistemi di riferimento inerziali sar`a
indicato con S. Se F S e F, si dice che `e un sistema di coordinate minkowskiane
solidali con F.
Commenti 3.1.
(1) Notiamo che per costruzione se ,

M sono solidali con il sistema di riferimento inerziale


F, posto : M
4
p (x
0
(p), x
1
(p), x
2
(p), x
3
(p)) e

: M
4
p (x
0
(p), x
1
(p), x
2
(p), x
3
(p)),
le funzioni, coordinate temporali, p x
0
(p) e p x
0
(p) saranno legate dalla relazione x
0
(p) =
x
0
(p) +k, dove k R `e una costante indipendente da p. Di conseguenza:

x
0
[
p
=

x
0
[
p
=:
F
Viene in tal modo denito un campo vettoriale controvariante associato a F ed indipendente
dalla scelta del sistema di coordinate minkowskiane scelto in F. Vale banalmente (
F
[
F
) =
1. Si noti inne che, dato che al variare di p, i vettori

x
0
[
p
hanno sempre le stesse componenti
in coordinate cartesiane, essi determinano un unico vettore, indicato sempre con
F
, nello spazio
delle traslazioni dello spazio ane (vedi Appendice A).
(2) Se ,

F S, con ovvie notazioni, la classe di sottovariet`a a due a due disgiunte la cui


unione coincide con tutto M
4
_

Ft
:= q M
4
[ x
0
(q) = t
_
tR
,
35
coincide con la classe di sottovariet`a
_

Ft
:= q M
4
[ x
0
(q) = t
_
t

R
.
Tuttavia il risultato non vale se e

appartengono a due diversi sistemi di riferimento inerziali.


(3) Fissato F S, le sottovariet`a
Ft
ricevono naturalmente una struttura di spazio ane
indotta da quella di M
4
in cui il sistema di coordinate x
1
, x
2
, x
3
indotte da qualunque F
sono un sistema di coordinate cartesiane.
(4) Fissato F S, il tensore metrico
Ft
indotto da su ogni
Ft
risulta essere a segnatura
ellittica e ci`o rende ogni
Ft
una variet`a riemanniana. Tale metrica riemanniana, dal punto di
vista sico `e la metrica che corrisponde agli strumenti di misura delle lunghezze spaziali (regoli
ideali) in quiete con F. La distanza d
t
sullo spazio di quiete con F,
Ft
soddisfa:
d
Ft
(P, Q) =
_

ij
(x
i
(p) x
i
(q))(x
j
(p) x
j
(q)) ,
dove p, q M
4
sono gli eventi corrispondenti ai punti P, Q nello spazio di quiete con F ad un
uguale tempo ssato.
(5) Fissato F S, come `e immediato vericare, ogni sistema di coordinate cartesiane indotto
su
Ft
da un sistema di coordinate minkowskiane F (semplicemente ssando la coordinata
temporale al valore prestabilito da t di
Ft
) `e un sistema di coordinate cartesiane ortonormali
per
Ft
. Quindi ogni
Ft
`e una sottovariet`a di M
4
che `e anche variet`a riemanniana globalmente
piatta, cio`e uno spazio euclideo.
(6) Se F S, il campo
F
risulta essere ortogonale allunica
t
che passa per p, nel senso che
i prodotti scalari tra

x
0
ed i vettori

x

T
p

t
, = 1, 2, 3 risultano tutti nulli.
(7) Le linee integrali del campo
F
suddetto sono sotto variet`a dierenziabili unidimensionali
embedded in M
4
su cui (notare il segno!) induce una metrica ellittica, le risultanti variet`a
riemanniane sono globalmente piatte. Tale metrica riemanniana, dal punto di vista sico `e la
metrica che corrisponde agli strumenti di misura degli intervalli temporali (orologi ideali) in
quiete con F. Lintervallo di tempo trascorso per F tra due eventi p, q M
4
con le stesse
coordinate minkowskiane spaziali (x
1
, x
2
, x
3
) in F `e ancora
t
F
(p, q) =
1
c
_

ij
(x
i
(p) x
i
(q))(x
j
(p) x
j
(q)) .
(8)
`
E chiaro che, riferendosi alle denizioni euristiche date nella sezione 1.3, ogni coordinata
temporale x
0
di quelle considerate sopra e riferite ad uno stesso F S altro non `e che ct
F
+k

per qualche costante k

R, dove t
F
era la coordinata temporale del riferimento F. Similmente,
lo spazio di quiete con F, E
3
F
, si pu`o identicare come variet`a riemanniana globalmente piatta
(cio`e spazio euclideo) con una qualsiasi delle sottovariet`a
t
.
Denizione 3.4. (Strutture nei sistemi di riferimento inerziali.) Sia F un sistema di
riferimento inerziale in M
4
.
(a) Il campo vettoriale
F
(con (
F
[
F
) = 1), dato in ogni evento dal vettore tangente
36
alla coordinata temporale di un qualsiasi F `e detto campo vettoriale temporale (o
semplicemente vettore temporale) associato a F. La metrica euclidea indotta da sulle
sottovariet`a unidimensionali curve integrali del campo
F
, `e detta metrica temporale di F.
(b) Se F e x
0
`e la prima funzione coordinata di F, t
F
:= x
0
/c : M
4
R denita
a meno di costanti additive `e detta coordinata temporale (globale) di F. Ogni sottovariet`a
tridimensionale (ovunque normale a
F
),
Ft
:= p M
4
[t
F
(p) = t, `e detta spazio di quiete
di F al tempo t. La metrica euclidea indotta da su
Ft
`e detta metrica spaziale di F al
tempo t.
Dalla denizione data e dalla discussione precedente risulta chiaro che allinterno di un ssato
riferimento inerziale la struttura geometrica `e la stessa che si aveva in meccanica classica. Le
dierenze nascono quando si considerano due diversi riferimenti inerziali. In tal caso, a dieren-
za della meccanica classica, ogni sistema di riferimento inerziale ha la propria classe di spazi di
quiete a tempo ssato. Tali spazi non coincidono pi` u se si considerano sistemi di riferimento in-
erziali dierenti. Lo stesso fatto accade per le coordinate temporali di dierenti riferimenti. Tale
situazione `e responsabile dei fenomeni di dilatazione degli intervalli di tempo e contrazione
delle lunghezze spaziali che esamineremo pi` u avanti.
Nella Relativit`a non c`e un modo univoco di separare lo spazio dal tempo nello spaziotempo.
Per tale motivo lo spaziotempo acquista unimportanza superiore rispetto allo spazio ed al tem-
po separatamente: gli oggetti sici devono essere visti e descritti come oggetti spaziotemporali.
Nota 3.2. Alla ne del nostro ragionamento euristico abbiamo visto che le coordinate carte-
siane ortonormali nello spaziotempo deniscono solo sistemi di riferimento inerziali. Ci si pu`o
chiedere se esistano altri sistemi di riferimento che non siano inerziali, ma che diano luogo a
sistemi di coordinate globali, in cui lo spazio di quiete sia ancora uno spazio euclideo (rispetto
alla metrica indotta da ) isometrico a E
3
la cui unione `e tutto lo spaziotempo. Si pu`o mostrare
che la risposta `e negativa. In ogni caso la denizione di sistema di riferimento generale pu`o
essere nuovamente considerata, fuori dal contesto euristico iniziale, una volta che la struttura
sico-geometrica della relativit`a sia stata completata. Tale analisi `e necessaria per fondare la
Teoria della Relativit`a Generale.
3.1.3 Riduzione a trasformazioni di Lorentz speciali.
Per concludere diamo un teorema tecnico che dimostreremo in un prossimo capitolo e che traduce
in termini matematici ci`o che ci si aspetta dallintuizione sica: presi due sistemi di riferimento
inerziali F e F

`e sempre possibile trovare sistemi di coordinate minkowskiane solidali con cias-


cuno di essi in modo tale che la trasformazione di coordinate sia una trasformazione speciale di
Lorentz lungo lasse x
3
.
Teorema 3.1. Se F, F

S, esistono F e

tali che

1
`e una trasformazione
37
speciale di Lorentz lungo x
3
, ossia `e rappresentata da una matrice di O(1, 3) della forma
:=
_

_
0 0 v/c
0 1 0 0
0 0 1 0
v/c 0 0
_

_
dove := 1/
_
1 v
2
/c
2
e v (c, c).
Dimostrazione. La tesi segue dal teorema 7.7 come provato nella nota 7.2. 2.
3.2 Coni spaziotemporali e orientamento temporale.
La seguente classicazione dei vettori in M
4
`e di larghissimo uso nelle teorie relativistiche. Una
giusticazione della terminologia introdotta sar`a data tra poco.
Denizione 3.5. Se (M, ) `e una variet`a quadridimensionale lorentziana, in particolare
M = M
4
, per ogni x M, i vettori v T
x
M 0 vengono classicati come segue:
(a) v `e di tipo spazio se (v[v) > 0;
(b) v `e di tipo tempo se (v[v) < 0; linsieme dei vettori di tipo tempo in T
x
M `e indicato con
I
x
e viene detto cono temporale in x;
(c) v `e di tipo luce se (v[v) = 0; linsieme contenente il vettore nullo e i vettori di tipo luce
in T
x
M viene detto cono di luce in x;
(d) v `e di tipo causale se v `e indierentemente di tipo tempo o di tipo luce; linsieme conte-
nente il vettore nullo e i vettori causali in T
x
M `e indicato con J
x
e viene detto cono causale
in x.
La terminologia si estende ai campi vettoriali controvarianti in modo naturale (es. un campo
vettoriale controvariante `e detto di tipo tempo se in ogni punto della variet`a determina un
vettore di tipo tempo).
Nota 3.3. Il vettore nullo 0 non `e classicato in alcun modo nella denizione di sopra anche
se appartiene, per denizione a J
x
.
3.2.1 Coni spaziotemporali.
La struttura degli insiemi contenenti i tipi di vettori sopra deniti `e piuttosto interessante. Se s-
siamo una base pseudoortonormale in T
x
M (in particolare nel caso M = M
4
), B = e
0
, e
1
, e
2
, e
3

con (e
0
[e
0
) = 1 (e quindi (e

[e

) = 1), risulta chiaro che un vettore v = v


i
e
i
,= 0: `e di tipo
tempo se e solo se
(v
0
)
2
>
3

=1
(v

)
2
.
38
`e di tipo causale se e solo se
(v
0
)
2

=1
(v

)
2
> 0 ,
mentre `e di tipo luce se e solo se
(v
0
)
2
=
3

=1
(v

)
2
> 0 ,
Passiamo ora a studiare con maggior dettaglio la struttura di I
x
. Vale la seguente importante
proposizione.
Proposizione 3.2. In riferimento alla denizione 3.5, per ogni x T
x
M, linsieme I
x
risulta essere unione sconnessa di due insiemi aperti e connessi, I
1x
e I
2x
detti falde di I
x
,
nella topologia indotta su I
x
da quella dello spazio tengente. Vale inoltre quanto segue.
(a) I
1x
e I
2x
risultano essere insiemi conici: se u, v I
1x
(risp. I
2x
) allora au +bv I
1x
(risp.
I
2x
) per ogni coppia a, b > 0.
(b) Fissata una base pseudo ortonormale B = e
0
, e
1
, e
2
, e
3
T
x
M, I
1x
e I
2x
sono individuati
da, non necessariamente in questordine:
_
v T
x
M

(v
0
)
2
>
3

=1
(v

)
2
, v
0
> 0
_
e
_
v T
x
M

(v
0
)
2
>
3

=1
(v

)
2
, v
0
< 0
_
.
(c) Se u
x
, v
x
I
x
allora (u
x
[v
x
) ,= 0, in particolare u
x
, v
x
appartengono alla stessa falda se e
solo se (u
x
[v
x
) < 0 ed appartengono a falde diverse se e solo se (u
x
[v
x
) > 0.
Dimostrazione. Dimostriamo contemporaneamente la prima parte della tesi ed i punti (a) e
(b). Fissata la base pseudo ortonormale B = e
0
, e
1
, e
2
, e
3
T
x
M, linsieme I
x
`e dato dai
vettori v
x
= v
i
e
i
che soddisfano
(v
0
)
2
>
3

=1
(v

)
2
,
per cui si decompone nellunione disgiunta dei due sottoinsiemi:
C
B>
:=
_
v T
x
M

(v
0
)
2
>
3

=1
(v

)
2
, v
0
> 0
_
e
C
B<
:=
_
v T
x
M

(v
0
)
2
>
3

=1
(v

)
2
, v
0
< 0
_
.
`
E chiaro che tali insiemi sono separatamente aperti e connessi nella topologia di R
4
che `e omeo-
morfa a quella di T
x
M tramite lomeomorsmo dato dalla trasformazione lineare non singolare
39
che associa le componenti di un vettore con il vettore stesso. Quindi C
B>
e C
B<
coincidono con
le componenti connesse di I
x
. Inoltre `e evidente che si tratta di insiemi conici. Se cambiamo
base, scegliendo unaltra base pseudo ortonormale B

= e

0
, e

1
, e

2
, e

3
in T
p
M, possiamo denire
gli analoghi insiemi C
B

>
e C
B

<
che risulteranno ancora coincidere con le componenti connesse
di I
x
. Essendo queste denite univocamente dalla topologia di T
x
M, dovr`a essere C
B

>
C
B>
e C
B

<
C
B<
oppure C
B

>
C
B<
e C
B

<
C
B>
, dove il simbolo indica che i corrispondenti
insiemi di T
x
M coincidono.
(c) Se u
x
, v
x
I
x
, allora, rispetto alla base pseudo ortonormale B: (v
0
)
2
>

3
=1
(v

)
2
e
(u
0
)
2
>

3
=1
(u

)
2
, per cui
(v
0
u
0
)
2
>
_
3

=1
(v

)
2
__
3

=1
(u

)
2
_

=1
(v

)
2
,
dove abbiamo usato la disuguaglianza di Schwartz nellultimo passaggio. Ma allora
(v
x
[u
x
) = (v
0
u
0
) +
3

=1
v

,= 0
ed ha segno positivo se e solo se v
0
u
0
< 0 e cioe u
x
e v
x
appartengono a falde opposte, oppure
negativo se e solo se v
0
u
0
> 0 e cioe u
x
e v
x
appartengono alla stessa falda. 2
Abbiamo provato che, indipendentemente dalla scelta della base, I
x
risulta essere un insieme
aperto e sconnesso dato da un cono a due falde (aperte e connesse) di vertice nellorigine. Valendo
che v
x
J
x
, se e solo se le sue componenti soddisfano:
(v
0
)
2

=1
(v

)
2
,
e tenuto conto che la topologia di R
4
`e omeomorfa a quella di T
x
M (tramite lomeomorsmo
dato dalla trasformazione lineare non singolare che associa le componenti di un vettore con il
vettore stesso) J
x
risulta essere un insieme chiuso e connesso. J
x
`e la chiusura di I
x
. La frontiera
di I
x
, che coincide con quella di J
x
, `e linsieme dei vettori di tipo luce in x unitamente al vettore
nullo di T
x
M.
Nota 3.4. Le denizioni appena date valgono pi` u in generale in riferimento ad una variet`a
lorentziana M di dimensione n 2.
Consideriamo ora in particolare il caso M = M
4
e sfruttiamo la sua struttura ane.
Denizione 3.6. Nello spazio ane M
4
attraverso lapplicazione che associa punti a vettori
uscenti da un medesimo punto, cio`e attraverso le coordinate cartesiane: I
x
T
x
M
4
denisce
I
x
M
4
e J
x
T
x
M
4
denisce J
x
M
4
.
40
Dato che lapplicazione che associa punti a vettori uscenti da un medesimo punto `e un omeo-
morsmo
2
da T
x
M
4
a M
4
, le propriet`a topologiche dette sopra di I
x
e J
x
valgono immutate per
I
x
e J
x
rispettivamente.
3.2.2 Orientazione temporale dello spaziotempo.
Vogliamo denire unorientazione temporale di M
4
tramite la struttura dei coni introdotta prece-
dentemente. Lavoreremo nel caso generale di una variet`a quadridimensionale lorentziana con-
nessa (M.). Consideriamo, se esiste, un campo vettoriale Z controvariante di tipo tempo che
sia (almeno) continuo su tutto M.
Denizione 3.7. Sia (M, ) una variet`a dierenziabile quadridimensionale lorentziana di
classe C

. Assumendo M connessa, si dice che M `e temporalmente orientabile, se esiste


su M un campo vettoriale controvariante Z di tipo tempo (almeno) continuo.
Nota 3.5. Si osservi che la richiesta non `e ovvia e ci sono variet`a lorentziane in cui non `e
possibile denire alcun campo vettoriale controvariante di tipo tempo che risulti essere continuo
su tutta la variet`a. Tuttavia lo spaziotempo di Minkowski `e banalmente temporalmente ori-
entabile: un campo vettoriale Z con le caratteristiche di sopra esiste ed `e dato, per esempio, dal
campo
F
di un qualsiasi sistema di riferimento inerziale.
Il campo Z selezioner`a in ogni x M uno solo degli insiemi I
1x
e I
2x
e avremo in tal modo
denito unapplicazione, che assegna ad ogni punto x M uno solo dei due insiemi I
1x
, I
2x
.
Denizione 3.8. Se (M, ) `e una variet`a quadridimensionale lorentziana temporalmente
orientabile, si ssi un campo vettoriale controvariante (almeno) continuo di tipo tempo Z denito
su tutto M
4
.
(a) lapplicazione T che assegna ad ogni punto x M uno solo dei due insiemi I
1x
, I
2x
`e detta
orientazione temporale di M
4
(indotta da Z).
(b) (i) I
+
x
:= T(x) `e detto cono temporale futuro in x e I

x
:= I
x
I
+
x
`e detto cono temporale
passato in x.
(ii) J
+
x
:= I
+
x
, `e detto cono causale futuro e J

x
:= I

x
`e detto cono causale passato.
(iii) I vettori causali in J
+
x
sono detti diretti verso il futuro, i vettori causali in J

x
sono
detti diretti verso il passato.
(c) Nel caso in cui M = M
4
valgono le seguenti ulteriori denizioni:
(i) Il futuro temporale (o futuro cronologico) di x, I
+
x
, `e dato dallinsieme degli eventi
di M
4
individuati dai vettori di I
+
x
tramite la struttura ane di M
4
,
(ii) il passato temporale (o passato cronologico) di x, I

x
, `e dato dallinsieme degli
eventi di M
4
individuati dai vettori di I

x
tramite la struttura ane di M
4
,
2
La topologia su M
4
, che `e uno spazio ane, `e quella indotta su M
4
dalle coordinate cartesiane a partire da
quella di R
4
. Questultima `e banalmente omeomorfa a quella che abbiamo considerato sopra su T
x
M
4
.
41
(iii) il futuro causale di x, J
+
x
, `e denito come I
+
x
,
(iv) il passato causale di x, J

x
, `e denito come I

x
.
Nota 3.6. Si osservi che J
+
x
e J

x
contengonon anche il vettore nullo che non `e un vettore
causale. Similmente J
+
x
e J

x
includono anche il punto x.
Vale il seguente fondamentale risultato.
Proposizione 3.3. Esistono e sono solo due le possibili orientazioni temporali per ogni vari-
et`a quadridimensionale lorentziana (M, ) connessa e temporalmente orientabile (in particolare
ci`o vale per lo spaziotempo della relativit`a speciale M
4
).
Dimostrazione. Sia Z un campo vettoriale controvariante di tipo tempo che sia almeno contin-
uo su M. Esso determina unorientazione temporale di M. Una seconda e dierente orientazione
`e individuata da Z. Mostriamo che non ce ne sono altre. Se scegliamo un campo vettoriale
controvariante continuo di tipo tempo Z

, non necessariamente coincidente con Z e denito su


tutto M, in virt` u di (c) in proposizione 3.2 la funzione:
f : M x
(Z
x
[Z

x
)
[(Z
x
[Z

x
)[
,
`e ben denita in quanto il denominatore non si annulla mai. Essendo essa continua ed essendo
M connessa, f(M) deve essere una delle due componenti connesse di 1, +1 (con la topologia
indotta da R). Questo signica che il segno di (Z
x
[Z

x
) `e costante su M. In base a (c) in
proposizione 3.2, Z

apparterr`a , per ogni x M, alla stessa falda di Z se (Z[Z

) < 0 oppure
apparterr`a sempre alla falda a cui non appartiene Z, se (Z[Z

) > 0. 2
3.2.3 Orientazione temporale indotta dai riferimenti inerziali.
Per concludere studiamo la relazione tra sistemi di riferimento inerziali e coni temporali in M
4
.
Come conseguenza di tale risultato segue anche che i sistemi inerziali sono biunivocamente de-
terminati dai vettori unitari del cono temporale futuro I
+
x
per un arbitrario punto x.
Proposizione 3.4. Si consideri la classe dei sistemi inerziali S in M
4
.
(1) I sistemi di riferimento inerziali F S determinano, tramite i vettori temporali associati

F
, ununica orientazione temporale di M
4
indicata con T.
(2) Fissato x M
4
e considerato I
+
x
= T (x), lapplicazione che assegna ad ogni riferimento
inerziale F S il corrispondente vettore
Fx
I
+
x
`e unapplicazione iniettiva e suriettiva.
Dimostrazione. (1)
`
E suciente provare che se F, F

S allora (
F
[
F
) < 0. Infatti,
scelto un sistema di coordinate minkowskiane in ciascuno dei due riferimenti, rispettivamente
42
x
0
, x
1
, x
2
, x
3
e x
0
, x
1
, x
2
, x
3
,
F
e
F
coincidono per denizione con
0
:= /x
0
e

0
:=
/x
0
rispettivamente. Avremo anche, se
i
:= /x
i
,

0
=
i
0

i
,
da cui
(
F
[
F
) =
i
0
(

i
[

0
) =
i
0

i0
=
0
0
< 0 ,
dove abbiamo usato il fatto che O(1, 3).
(2) Il fatto che lapplicazione sia iniettiva ha la seguente ragione. Se
0
=

0
allora deve essere

i
0
=
i
0
. Imponendo la condizione di Lorentz
t
= , si vede immediatamente che deve
anche essere
0
i
=
0
i
. Quindi reimponendo la condizione di Lorentz sulla matrice risultante
si trova che deve avere la forma
R
dellesempio 2.1.1 in cui R O(3). Per denizione
di sistema di riferimento inierziale deve allora essere F = F

. Passiamo alla suriettivit`a. Se


v u I
+
x
[ (u[u) = 1 poniamo e
0
:= v e completiamolo a base pseudoortonormale di T
x
M
4
aggiungendo tre vettori e

di tipo spazio ortonormalizzati e normali a e


0
. La base ottenuta gen-
era un sistema di coordinate cartesiane pseudoortonormali connesso ad un qualsiasi sistema di
coordinate minkowskiane da una matrice in O(1, 3): infatti il vettore temporale
F
in x di un
sistema inerziale associato ad ogni altro sistema di coordinate minkowskiane `e in I
+
x
come visto
sopra per cui, per denizione di I
+
x
, (e
0
[
F
) < 0. Come visto sopra questo fatto equivale a dire
che la matrice di Lorentz relativa ai due sistemi di coordinate minkowskiane soddisfa
0
0
> 0
per cui `e in O(1, 3). Di conseguenza le coordinate cartesiane associate a e
0
, e
1
, e
2
, e
3
deniscono
un sistema di coordinate minkowskiane ed un riferimento inerziale F
v
tale che
F
v
= e
0
= v. 2
Nota 3.7. Dora in poi assumeremo sempre su M
4
lorientazione temporale T indotta dalla
classe dei riferimenti inerziali.
Vale inne la seguente proposizione. La dimostrazione `e immediata se si tiene conto che se
v = v
i
e
i
, rispetto ad una base pseudo ortonormale e
0
, e
1
, e
2
, e
3
con (e
0
[e
0
) = 1, la condizione
(e
0
[v) < 0 equivale a dire v
0
> 0.
Proposizione 3.5. Considerando un sistema di coordinate minkowskiane associate and un
riferimento inerziale, in componenti rispetto alla base associata in T
x
M
4
risulta:
I
+
x
=
_
(v
0
, v
1
, v
2
, v
3
) R
4

(v
0
)
2
>
3

=1
(v

)
2
, v
0
> 0
_
e
I

x
=
_
(v
0
, v
1
, v
2
, v
3
) R
4

(v
0
)
2
>
3

=1
(v

)
2
, v
0
< 0
_
e ancora
J
+
x
=
_
(v
0
, v
1
, v
2
, v
3
) R
4

(v
0
)
2

=1
(v

)
2
, v
0
0
_
43
e
J

x
=
_
(v
0
, v
1
, v
2
, v
3
) R
4

(v
0
)
2

=1
(v

)
2
, v
0
0
_
.

Commenti 3.2.
(1) Si noti che J
+
x
J

x
= 0.
(2) Ovviamente I
+
x
I

x
= mentre J
+
x
J

x
= x.
Esercizi 3.1.
1. Provare che q I
+
p
se e solo se p I

q
. Generalizzare il risultato a q J
+
p
se e solo se
p J

q
.
Soluzione. Si ssi un sistema di coordinate minkowskiane. In tali coordinate q I
+
p
signica
che la componente temporale del vettore di tipo tempo

pq `e positiva. Questo `e equivalente a
dire che la componente temporale del vettore di tipo tempo

qp `e negativa e questo equivale a
p I

q
. Nel secondo caso la dimostrazione procede nello stesso modo escluso il caso p = q che `e
ovvio.
2. Provare che se p I
+
q
e q I
+
r
allora p I
+
r
.
3. Rinforzare il risultato di sopra provando che se p I
+
q
e q J
+
r
oppure p J
+
q
e q I
+
r
,
allora p I
+
r
.
3.3 La struttura causale di M
4
: causalit`a e linee di universo.
In questa sezione vedremo come la metrica sia connessa alla causalit`a. Consideriamo due
eventi p e q. Supponiamo che in q accada qualcosa e che in p ci sia una (con-)causa di ci`o
che accade in q. Ci chiediamo se la struttura geometrica della relativit`a ed il suo signicato
sico suggeriscano qualche relazione geometrica tra p e q. I risultati che otterremo contengono
una spiegazione evidente della terminologia utilizzazata per classicare i vettori dello spazio di
Minkowski e dei nomi che abbiamo dato agli insiemi J

p
.
3.3.1 Relativit`a ed assolutezza delordinamento temporale.
Lidea comune a tutte le interpretazioni siche del concetto di causalit`a `e che, condizione neces-
saria perche ci`o che accada in p sia causa di ci`o che accade in q, `e che p preceda temporalmente q.
In relativit`a, la contemporaneit`a tra eventi `e relativa al sistema di riferimento come visto nelle-
sempio 2.1.2 e potrebbe accadere che anche lordinamento temporale sia similmente relativo al
riferimento, rendendo in tal modo impossibile una buona nozione di causalit`a. Rinunciare allas-
solutezza dellordinamento temporale delle relazioni causali comporterebbe una complicazione
forse insuperabile nella formulazione delle leggi siche. Vale il seguente importante risultato.
44
Proposizione 3.6. Si considerino p, q M
4
.
(1) Se q J
+
p
J

p
e se la coordinata temporale di q `e rispettivamente strettamente maggiore
di quella di p, uguale a quella di p, oppure strettamente minore di quella di p in un sistema di
riferimento inerziale, tale relazione vale in ogni altro sistema di riferimento inerziale.
(2) Se q , J
+
p
J

p
, allora ci sono sempre tre sistemi di riferimento inerziali F

, = 1, 2, 3
con funzioni coordinata temporale rispettivamente x
0
()
, tali che:
(i) x
0
(1)
(p) > x
0
(1)
(q),
(ii) x
0
(2)
(p) = x
0
(2)
(q),
(iii) x
0
(3)
(p) < x
0
(3)
(q).
Dimostrazione. In questa dimostrazione il vettore

pq sar`a sempre pensato come vettore in
T
p
M
4
(vedi Appendice A).
(1) Occupiamoci del caso in cui la coordinata temporale di q `e strettamente maggiore di quella di
p. Usando un sistema di coordinate minkowskiano e la proposizione 3.5 si vede subito che deve
essere

pq J
+
p
0. Tale fatto non dipende dalle coordinate scelte e tantomeno dal riferimento
inerziale. Quindi usando ancora la proposizione 3.5, ma scegliendo un altro riferimento inerziale
segue subito che la la coordinata temporale di q `e strettamente maggiore di quella di p. Nel caso
in cui la coordinata temporale di q `e strettamente minore di quella di p si procede analogamente
riducendosi a lavorare in J

p
0. Inne, se le due coordinate coincidono, deve necessariamente
essere q J
+
p
J

p
ossia q = p e la prova della tesi `e ovvia.
(2) Se q , J
+
p
J

p
, il vettore

pq ,= 0 deve essere di tipo spazio. Deniamo il versore
e
3
:=

pq/
_
(

pq[

pq) e completiamo tale versore a base pseudoortonormale in T
p
M
4
, e
0
, e
1
, e
2
, e
3
,
dove e
0
`e di tipo tempo ed appartiene a I
+
p
e gli altri versori sono di tipo spazio. Il sistema di
coordinate minkowskiane x
0
, x
1
, x
2
, x
3
con origine in p associato a tale base denisce un riferi-
mento inerziale per il punto (2) della proposizione 3.4. Nelle coordinate minkowskiane denite,
x
0
(p) = x
0
(q) = 0 per costruzione. Consideriamo ora una trasformazione in O(1, 3) data da una
matrice speciale di Lorentz denita nellesempio 2.1.2. Dato che > 0, tale matrice appartiene
a O(1, 3) per cui `e una trasformazione di coordinate minkowskiane tra riferimenti inerziali.
`
E immediato provare che, nelle nuove coordinate minkowskiane x
0
, x
1
, x
2
, x
3
connesse alle
x
0
, x
1
, x
2
, x
3
tramite la matrice speciale di Lorentz detta, x
0
(q) < x
0
(q) se v > 0 e x
0
(q) > x
0
(q)
se v < 0 dove v (c, c) `e il parametro denito nellesempio 2.1.2. 2
La proposizione appena dimostrata suggerisce che abbia senso dire che quello che accade nel-
levento p possa essere causa di quello che accade nellevento q solo se q J
+
p
. Questo se si
richiede che la causa preceda temporalmente leetto in ogni sistema di riferimento.
`
E facile provare che q , J
+
p
J

p
`e equivalente a p , J
+
q
J

q
. Similmente q J
+
p
J

p
equivale
a p J
+
q
J

q
. Inne q I
+
p
I

p
`e equivalente a p I
+
q
I

q
ed `e conseguenza di q J
+
p
J

p
.
Possiamo dare la seguente denizione che sintetizza uil signicato sico delle relazioni geomet-
riche tra eventi.
Denizione 3.9. Siano p, q M
4
.
45
(a) p e q di dicono temporalmente connessi se q I
+
p
I

p
(o equivalentemente p I
+
q
I

q
).
(b) p e q di dicono causalmente connessi se q J
+
p
J

p
(o equivalentemente p J
+
q
J

q
).
(c) p e q di dicono causalmente separati o causalmente sconnessi o spazialmente sepa-
rati se non sono causalmente connessi.
3.3.2 Discussione critica sulla struttura causale.
Un punto importante da non dimenticare nella discussione precedente `e comunque la parziale
convenzionalit`a del processo di sincronizzazione einsteinano (cfr le osservazioni dopo lenunciato
del principio RS1). A causa di tale parziale convenzionalit`a , si potrebbe ancora discutere
se la relativit`a dellordinamento temporale tra eventi causalmente separati, dimostrata nella
proposizione 3.6, non sia in realt`a basata su un elemento convenzionale. In tal caso il divieto
di relazioni causali tra eventi spazialmente separati potrebbe essere non sico, ma aggirabile
con una dierente formalizzazione che non adotti il criterio di sincronizzazione einsteniano. Dis-
cutiamo questo punto alla luce del principio di relativit`a e non solo alla luce del principio di
invarianza della velocit`a della luce.
Consideriamo un generico evento p M
4
. Ammettiamo possibile che ci`o che accade in p possa
essere causa di qualcosa che accade in un altro evento q, supponendo che ci`o possa avvenire
anche se q `e spazialmente separato da p. In questo caso, per la proposizione 3.6, ci sar`a un
riferimento F in cui q `e nel passato di p. Per lequivalenza tra i sistemi di riferimento inerziali,
sancita dal principio di relativit`a RS2, dobbiamo concludere che p pu`o essere causa di un evento
q, causalmente separato da p, giacente nel passato di p in ogni ssato riferimento inerziale F. In
altre parole, se si ammette la possibilit`a di relazioni causa eetto tra eventi spazialmente sepa-
rati, queste devono potersi ammettere sia verso il futuro che verso il passato di ogni riferimento
inerziale, a causa del principio di relativit`a.
Questo risultato potrebbe sembrare innocuo dato che siamo partiti dallassunto della convenzion-
alit`a della procedura di sincronizzazione di Einstein: non dovremmo necessariamente spaventarci
difronte a relazioni causali verso il passato, dato che lordinamento temporale si basa su una
costruzione, almeno in parte, convenzionale. Invece il risultato ha eetti dirompenti. Prendiamo
una particella materiale che descrive una storia : (a, b) M
4
nello spaziotempo, supposta de-
scritta da un parametro che cresce verso il futuro. Sia p = (t
p
) e q = (t
q
) con t
p
> t
q
.
Attraverso, eventualmente, un terzo evento q

`e sempre possibile fare in modo che p sia spazial-


mente separato da q

e q

sia spazialmente separato da q. Se ammettiamo la possibilit`a di


relazione causali tra eventi spazialmente separati, possiamo quindi causare qualcosa nel passato
(riferito allordinamento della curva) di p, precisamente nellevento q, agendo in p tramite la
catena p-q

e q

-q. Questo produce i ben noti paradossi causali della fantascienza (le relazioni
causali suddette potrebbero concretizzarsi in una telefonata a qualcuno nel passato al ne di
impedire qualcosa nel presente).
Questa discussione porta a concludere che, in virt` u del principio di relativit`a ed indipendente-
mente dalla natura convenzionale del processo di sincronizzazione einsteniano, non pu`o esserci
una relazione di causa eetto tra due eventi p e q se tali eventi sono spazialmente separati nel
46
senso della denizione 3.9.
Esercizi 3.2.
1. Mostrare che in Relativit`a non ha pi` u senso sico la nozione di corpo rigido.
Suggerimento: Possiamo considerare un telegrafo costituito da unasta rigida lunghissima:
muovendo un estremo laltro estremo istantaneamente (per il vincolo di rigidit`a) si muoverebbe
anchesso.
3.3.3 Linee di universo come curve di tipo causale.
Il risultato ottenuto dalla precedente discussione comporta anche alcuni vincoli alla denizione
di linea di universo come storia di un punto materiale nello spaziotempo. Lidea assunta dalla
relativit`a e connessa allidea di localit`a (nel senso di negazione dell esistenza di azione a dis-
tanza) `e che quando ci`o che accade in q `e causato da qualcosa che accade in p, qualche segnale
sico si propaghi da p a q lungo una linea di universo veicolata da un sistema sico intermediario.
Non solo, ma attraverso le linee di universo di punti materiali che connettono p a q, si possano
sempre stabilire relazioni di causa-eetto. Ne consegue che le linee di universo di punti materiali
possono connettere solo eventi causalmente connessi. Vediamo di riscrivere tale restrizione in
termini matematici pi` u facili da maneggiare.
Proposizione 3.7. Si consideri una curva dierenziabile : (a, b) M
4
non singolare, ossia
(t) ,= 0 per ogni t (a, b). Condizione necessaria e suciente anche (t

) J
+
(t)
(t) per
ogni t, t

(a, b) con t < t

`e che (u) J
+
(u)
per ogni u (a, b).
Dimostrazione. Se (t

) J
+
(t)
0 per ogni t

> t, allora pensando



(t)(t

) come applicato
in (t), deve essere

(t)(t

)/(t t

) J
+
(t)
per ogni t

> t. Dato che J


+
(t)
`e chiuso sar`a anche
(t) = lim
t

(t)(t

)
t t

J
+
(t)
,
ci`o prova met`a della tesi.
Supponiamo viceversa che 0 ,= (u) J
+
(u)
per ogni u (a, b) e assumiamo, per assurdo, che ci
siano due punti (u) e (u

), u < u

sulla curva tali che: (u

) , J
+
(u)
(u), cioe (u) (u

)
non sia di tipo causale futuro. Ci sono allora tre casi possibili.
(1) I due punti (u) e (u

), con u < u

, sono causalmente separati. Se ci`o fosse sarebbe


(u

) (u) ,= 0 di tipo spazio. Deniamo e


1
come il versore, normalizzato a 1 ed applicato in
(u) ottenuto dalla normalizzazione di (u

) (u). Completiamo e
1
a base pseudo ortonormale
e
0
, e
1
, e
2
, e
3
con e
0
di tipo tempo in I
+
(u)
e i rimanenti versori di tipo spazio. Deniamo coordinate
minkowskiane centrate in (u) e generate dalla base detta. In tali coordinate, per costruzione
x
0
((u

)) = x
0
((u)) per cui ci sar`a un punto u
0
(u, u

) in cui dx
0
/du[
u
0
= 0. In tale punto si
47
ha
( (u
0
)[ (u
0
)) =
_
dx
0
du
[
u
0
_
2
+
3

=1
_
dx

du
[
u
0
_
2
=
3

=1
_
dx

du
[
u
0
_
2
0
Daltra parte per ipotesi (u
0
) J
+
(u
0
)
per cui, in particolare, ( (u
0
)[ (u
0
)) 0. Usando tale
risultato sopra abbiamo che deve essere contemporaneamente
dx
0
du
[
u
0
= 0 ,
ma anche
3

=1
_
dx

du
[
u
0
_
2
= 0 ,
ossia (u
0
) = 0. Questo `e impossibile per ipotesi.
(2) I due punti (u) e (u

), con u < u

, sono tali che (u

) (u) `e di tipo causale passato.


Scegliamo un sistema di coordinate minkowskiane associate ad un riferimento inerziale F con
asse temporale diretto verso il futuro. In queste coordinate, se la curva `e parametrizzata come
x
i
= x
i
(u), deve essere x
0
(u

) < x
0
(u). Pertanto deve esistere u
0
(u, u

) con dx
0
/du[
u
0
=
(x
0
(u

) x
0
(u))/(u

u) < 0. Pertanto, in (u
0
), il vettore tangente a , che `e di tipo causale
(cioe tempo o luce) per ipotesi, non pu`o essere diretto verso il futuro. Questo `e assurdo.
(3) I due punti (u) e (u

), con u < u

, sono tali che (u

) = (u). Scegliamo un sistema


di coordinate minkowskiane associate ad un riferimento inerziale F con asse temporale diretto
verso il futuro. In queste coordinate, se la curva `e parametrizzata come x
i
= x
i
(u), deve essere
x
0
(u

) = x
0
(u). Pertanto deve esistere u
0
(u, u

) con dx
0
/du[
u
0
= (x
0
(u

)x
0
(u))/(u

u) = 0.
Pertanto, in (u
0
), il vettore tangente a , non pu`o essere di tipo causale (cioe tempo o luce).
Questo `e assurdo.
2
Dora in poi assumeremo che i punti materiali abbiano evoluzione in M
4
descritta da linee di
universo cio`e curve con vettore tangente mai nullo, di tipo causale ed orientato positivamente
nel tempo. Diamo a tal ne le seguenti denizioni.
Denizione 3.10. Sia (M, ) una variet`a quadridimensionale lorentziana connessa e tempo-
ralmente orientata (in particolare M = M
4
). Se : I M `e una curva C
1
non singolare (cioe
con vettore tangente mai nullo) dove I R `e un intervallo, essa `e detta:
(a) di tipo tempo e futuro orientata, se (u) I
+
(u)
per ogni u I,
(b) di tipo causale e futuro orientata, se (u) J
+
(u)
per ogni u I,
(c) di tipo spazio, se `e ovunque di tipo spazio.
Le curve C
1
non singolari di tipo causale e futuro orientate sono dette linee di universo o,
equivalentemente, curve di universo
48
Nota 3.8. Se riparametrizziamo una linea di universo = (u) con un nuovo parametro
funzione C
1
di u, z = z(u) tale che dz/du > 0, la nuova funzione = (u(z)) descrive ancora
una linea di universo e non altera, punto per punto, la natura del vettore tangente che rimane
di tipo tempo futuro o luce futuro a seconda del caso. Vedremo tra poco che nel caso in cui il
vettore tangente sia di tipo tempo (futuro), c`e una parametrizzazione naturale particolare con
signicato sico.
3.4 Ancora sulla struttura causale: determinismo, localit`a e -
paradosso EPR.
In questa parte cercheremo di precisare ulteriormente, in termini sici, la nozione di determin-
ismo insieme alla nozione di localit`a. Vedremo anche come le teorie quantistiche diano luogo a
fenomeni che apparentemente violano la struttura causale dello spaziotempo, ma che in realt`a
non lo fanno.
Per cominciare, ricordiamo che in Relativit`a Speciale, se due eventi p e q non sono causalmente
connessi, cio`e sono spazialmente separati, allora esistono sempre due sistemi di coordinate globali
riferite a due osservatori (inerziali) legati da una trasformazione di Poincare del sottogruppo or-
tocrono, che giudicano, rispetto alla propria coordinata temporale, rispettivamente, p precedere
q oppure q precedere p. Quindi, nel caso in esame, lordine temporale tra p e q non `e denibile
in modo assoluto e ogni relazione causale tra eventi in p e q sarebbe impossibile come notato
precedentemente. Precisiamo la nozione di causa ed eetto come segue.
Dato un evento e ed una classe di eventi G che non contiene e, diremo che una classe di fenomeni
sici G
g

gG
che avvengono negli eventi corrispondenti agli indici g G `e causa del fenomeno
sico E
e
che avviene in e, o equivalentemente, E
e
`e eetto di G
g

gG
se e solo se valgono le
seguenti due condizioni:
(1) e
gG
J
+
g
,
(2) ogni qual volta avvengono i fenomeni G
g

gG
allora avviene il fenomeno E
e
.
Nota 3.9. I fenomeni sici di cui si parla sopra devono essere descritti nel linguaggio della
relativit`a speciale (cioe in termini di tensori). La locuzione ogni qual volta deve quindi essere
interpretata come segue. Accanto allevento e ed alla classe di eventi G, dobbiamo immaginare
di poter considerare altri eventi e

e altre classi di eventi G

ottenuti dai precedenti tramite un


operazione di isometria spaziotemporale, cio`e una trasformazione P del gruppo di Poincare
ortocrono proprio, interpretata in senso attivo (cioe che sposta i punti della variet`a). Tale
trasformazione individua fenomeni sici che avvengono in e

e G

, E

e G

gG
rispettivamente,
ottenuti da E
e
e G
g

gG
sotto lazione di P. La locuzione ogni qual volta `e proprio riferita alla
scelta arbitraria della trasformazione P del gruppo di Poincare. In questo senso la condizione
(2) si deve intepretare come:
per ogni scelta di P, in e

avviene E

, se G

gG
avvengono in G

.
Nel seguito la locuzione ogni qual volta deve essere interpretata come indicato sopra.
49
Si osservi inne che e
gG
J
+
g
implica e


gG
J
+
g
per ogni scelta di P nel gruppo ortocrono
di Poincare, per cui la condizione (1) ha senso in tale interpretazione.
La denizione data di causa e di eetto esprime in termini sici pi` u precisi la nozione di causalit`a
relativistica. Usando tali nozioni, il principio del determinismo in sica relativistica pu`o
allora essere enunciato nella sua forma pi` u debole possibile come:
ogni fenomeno sico Q
q
che avviene in un evento q ha una causa nellinsieme di fenomeni sici
che avvengono negli eventi p J

q
q.
Questo signica in particolare che esistono leggi siche che permettono di determinare (prevedere)
tutti i fenomeni sici che avvengono in q conoscendo corrispondenti fenomeni sici che avven-
gono nei punti p J

q
q.
Si pu`o enunciare il principio del determinismo in forme molto pi` u forti assumendo che i fenomeni
sici in q siano completamente determinati assegnado fenomeni sici che avvengono in sottoin-
siemi propri opportuni di J

q
q (porzioni di sottovariet`a tridimensionali di tipo spazio che
intersecano linsieme detto, per esempio).
Dati due eventi p e q, due fenomeni sici P
p
e Q
q
che avvengono nei rispettivi eventi si dicono
correlati se e solo se:
ogni qual volta avviene uno dei due allora avviene anche laltro.
Il principio di localit`a pu`o essere enunciato nella sua forma pi` u debole nel modo seguente:
dati due eventi p e q, e considerati due fenomeni sici F
p
ed F
q
che avvengono nei due eventi
rispettivamente, se F
p
ed F
q
sono correlati e non hanno una causa comune (in (J

p
J

q
)p, q)
allora uno dei due fenomeni `e (parte di una) causa dellaltro ed in particolare p e q sono
causalmente connessi.
I principi di determinismo e localit`a sono violati da alcuni fenomeni quantistici. Per quanto
riguarda il determinismo, secondo la meccanica quantistica esso `e violato dal processo di misura
quantistico: il risultato della misura in un evento q di qualche propiet`a di un sistema quantistico
non `e prevedibile anche conoscendo tutto ci`o che accade in J

q
q. In altre parole, quando
misuriamo una propriet`a di un sistema quantistico con un certo strumento in un certo posto ed
ad un certo tempo il fenomeno, lindice dello strumento segna tale valore non ha (in generale)
una causa nel senso preciso detto sopra.
La violazione del principio di localit`a `e una questione molto pi` u delicata ed `e connessa con il
cosiddetto paradosso Einstein-Podolsky-Rosen (EPR) [16]. Tale paradosso fu elaborato, in un
celebre articolo, dagli autori citati sopra per provare che la meccanica quantistica non poteva
considerarsi una teoria completa ai ni della descrizione del mondo sico nella formulazione
standard detta di Copenhagen. La procedura degli autori fu la seguente. In primo luogo essi
provarono che la meccanica quantistica prevede lesistenza di alcuni fenomeni sici particolari.
In secondo luogo essi mostrarono che tali fenomeni sici sono in contrasto con ipotesi siche
che, a giudizio di Einstein, Podolsky e Rosen, sarebboro dovute essere pi` u fondamentali della
50
stessa meccanica quantistica. Una di queste ipotesi era proprio il principio di localit`a. Quindi,
in caso di evidenza sperimentale dei fenomeni quantistici evidenziati da Einstein, Podolsky e
Rosen una delle ipotesi fondamentali, tra cui la localit`a, avrebbe dovuto essere violata. Senza
entrare nei dettagli dellanalisi EPR diremo solo che la formulazione standard della meccanica
quantistica aerma che esistono coppie di fenomeni sici macroscopici correlati dati da risultati
di misurazioni su sistemi microscopici di alcune grandezze siche che avvengono in coppie di
eventi lontani, anche nel caso in cui tali eventi non siano causalmente connessi e i corrispondenti
fenomeni non hanno una causa (nel senso preciso detto sopra) e quindi nemmeno una causa
comune.
Secondo EPR le correlazioni suddette, se osservate avrebbero dovuto sussistere per una causa
comune (cioe a causa di uno stato di cose preesistente alle misurazioni). Non potendo, tale
causa comune essere descritta con le variabili della Meccanica Quantistica per principio, le-
sistenza delle correlazioni avrebbe implicato lincompletezza della descrizione della realt`a data
dalla Meccanica Quantistica.
Quando EPR presentarono il loro celebre lavoro, la tecnologia non era in grado di testare speri-
mentalmente la presenza o lassenza dei fenomeni quantistici di cui sopra, per cui la discussione
rimase ad un livello puramente teorico e per molti versi ideologico. Una rielaborazione del para-
dosso EPR fu proposta da John Bell allinizio degli anni 1960 in termini di spin o di coppie di
particelle. In un geniale articolo del 1963, Bell dimostr`o che, con una scelta opportuna delle
grandezze da misurare che devono essere pi` u di due (nella realt`a si misurano le tre componenti
dello spin di particelle massive o stati di polarizzazione di fotoni) che darebbero luogo alle cor-
relazioni suddette, `e possibile distinguere sperimentalmente tra le due situazioni in cui i valori
delle grandezze: (i) sono ssate prima delle misure, oppure (ii) vengono ssate al momento
delle misure. Bell dimostr`o che, in presenza delle correlazioni, la situazione (i) vale solo se sono
vericate una serie di disuguaglianze tra gli esiti delle misure: le famose disuguaglianze di Bell.
`
E importante precisare che le disuguaglianze di Bell valgono indipendentemente dal fatto che
si assuma come vera o falsa la formulazione standard della Meccanica Quantistica. A partire
dal 1972 sono stati fatti diversi esperimenti (in particolare lesperimento decisivo `e stato fatto
nel 1982 da A. Aspect, J. Dalibard e G. Roger [18]) per testare lesistenza delle correlazioni
suddette insieme alla validit`a o alla violazione delle disuguaglianze di Bell. Gli esperimenti
hanno dimostrato, nellambito degli errori sperimentali, che (a) le correlazioni esistono, (b) le
disuguaglianze di Bell sono violate.
Quindi, se si accettano gli esiti degli esperimenti suddetti, indipendentemente dallaccettare o
meno la formulazione standard della Meccanica Quantistica, si deve concludere che le correlazioni
previste dalla Meccanica Quantistica esistono e gli esiti delle misure sono ssati al momento delle
misurazioni. Quindi la localit`a sembrerebbe essere violata dai fenomeni sperimentali. Malgrado
la situazione sembri molto intricata, la rinuncia al principio di localit`a per i fenomeni quantis-
tici EPR non distrugge la formulazione causale della relativit`a. Si pu`o provare rigorosamente
che, se si assume il formalismo della Meccanica Quantistica [18], proprio per la contemporanea
violazione del principio di determinismo e del principio di localit`a, non `e possibile trasmettere
informazione utile da un evento allaltro per mezzo di correlazioni di tipo EPR tra coppie di
51
eventi spazialmente separati
3
. In altre parole, se p e q sono eventi spazialmente separati, non `e
possibile fare avvenire qualcosa in q facendo deliberatamente avvenire qualche fenomeno in p.
Se invece ci`o fosse possibile ci troveremmo a dover applicare la nozione di causa-eetto ad
una coppia di fenomeni che avvengono in eventi spazialmente separati per i quali quindi lordine
temporale non `e assoluto. Ci`o contrasterebbe con la richiesta irrinunciabile dellordinamento
temporale assoluto tra causa ed eetto e la struttura causale della Relativit`a Speciale sarebbe
messa in discussione.
3
In questo senso, come si dice nel linguaggio dei sici, i fenomeni connessi al paradosso EPR non permettono
la trasmissione di informazione a velocit` a superluminare.
52
Capitolo 4
Cinematica in Relativit`a Speciale.
In questo capitolo studieremo gli sviluppi della sica elementare della teoria della relativit`a
speciale. In particolare vedremo alcuni fenomeni cinematici storicamente molto importanti,
quali la dilatazione degli intervalli di tempo e la contrazione delle lunghezze
4.1 Nozioni elementari: Tempo proprio e Quadrivelocit`a .
Considereremo ora alcuni importanti risultati validi in Relativit`a Speciale e concernenti alcuni
fatti non banali di cinematica. Per prima cosa consideriamo una linea di universo : u (u)
M
4
con u [a, b] di tipo tempo. Possiamo cambiare il parametro u denendo:
s(u) :=
_
u
a
_
( (v)[ (v)) dv .
s corrisponde allascissa curvilinea lorentziana, ossia al parametro che misura la lunghezza del-
la curva in riferimento alla metrica della variet`a lorentziana. Si osservi che ds/du > 0 per
costruzione per cui la funzione u s(u) `e un dieomorsmo strettamente crescente e, ri-
parametrizzando la curva in s, il nuovo vettore tangente
s
`e proporzionale al vecchio tramite
un fattore positivo, appunto ds/du. Ci`o implica immediatamente che la curva riparametrizzata
sia ancora una linea di universo. Inne notiamo che:
(
s
[
s
) =
_
du
ds

du
ds

_
=
_
du
ds
_
2
( [ ) =
_
du
ds
_
2
_

_
ds
du
_
2
_
= 1 .
Dato che per costruzione
s
`e punto per punto in I
+
(s)
usando la proposizione 3.4 possiamo
associare un riferimento inerziale F
(s
0
)
a
s
[
(s
0
)
, in generale uno diverso ad ogni evento (u
0
)
raggiunto dalla curva. In tale riferimento le componenti spaziali di
s
e pi` u in generale del
vettore tangente a u (u
0
) saranno nulle. Se x
0
, x
1
, x
2
, x
3
sono coordinate minkowskiane
associate al riferimento suddetto in corrispondenza dellevento (u
0
) corrispondente al valore s
0
53
dellascissa curvilinea, la curva sar`a parametrizzata come x
i
= x
i
(s) in modo tale che, per
costruzione:
dx
i
ds
[
s
0
=
i
0
. (4.1)
Di conseguenza, applicando la teoria dello sviluppo di Taylor per le variabili spaziali x

, =
1, 2, 3 e per la variabile temporale x
0
avremo che:
x

(s) = x

(s
0
) + (s s
0
)O

(s s
0
) , (4.2)
mentre:
x
0
(s) = x
0
(s
0
) + (s s
0
) + (s s
0
)O(s s
0
) , (4.3)
dove le funzioni O
i
(a) sono innitesime per a 0. La seconda equazione pu`o essere riscritta
come:
x
0
= s + sO(s) .
Se dividiamo i due membri per c e deniamo := s/c abbiamo lidentit`a
t = + O() . (4.4)
dove t := x
0
/c `e la coordinata temporale del riferimento. Vediamo allora che, a meno di
innitesimi di ordine superiore al primo, nellintorno di
0
= s
0
/c, gli intervalli di tempo valutati
nel riferimento F
(s
0
)
coincidono con quelli del parametro . In particolare, di conseguenza, se
t
0
:= t(s
0
), per = 1, 2, 3 avremo:
dx

dt

t
0
=
dx

0
=
1
c
dx

ds

s
0
= 0 ,
dove abbiamo usato (4.1) per valutare lultima derivata. Concludiamo che nel riferimento F
(s
0
)
il punto materiale `e visto fermo allistante t
0
corrispondente al valore s
0
dellascissa curvilinea.
Di conseguenza il riferimento inerziale F
(s
0
)
si deve pensare come il riferimento inerziale di
quiete istantanea nellevento (s
0
) con la particella descritta dalla linea di universo . Ulterior-
mente (4.4) precisa che, a meno di innitesimi di ordine superiore al primo, gli intervalli di tempo
valutati nel riferimento di quiete istantanea in (s
0
), coincidono con gli intervalli del parametro
= s/c. Se assumiamo lesistenza di orologi il cui valutare il tempo non `e inuenzato dalle
forze che agiscono su di essi, la coordinata pu`o essere interpretata come il tempo valutato da
un orologio in quiete con il punto materiale. Per tale motivo la coordinata viene detta tempo
proprio della linea di universo. Almeno per punti materiali costituiti da particelle atomiche o
subatomiche, il postulato sico di identicare il parametro con il tempo valutato in quiete con
la particella indipendentemente dallaccelerazione della stessa, funziona decisamente bene (vedi
per es. [19]). Tale postulato prende il nome di postulato degli orologi.
Il vettore tangente alla curva riparametrizzata in viene detto quadrivelocit`a. Diamo formal-
mente le denizioni presentate in modo informale.
54
Denizione 4.1. (Tempo proprio, quadrivelocit`a e sistema di quiete istantanea.)
Si consideri una linea di universo : [a, b] u (u) M
4
di tipo tempo. Si denisca il nuovo
parametro:
s(u) :=
_
u
a
_
( (v)[ (v)) dv . (4.5)
(a) Il parametro := s/c ridenito eventualmente a meno di una costante additiva `e detto
tempo proprio di .
(b) il vettore V

:=

:= c
s
, che soddisfa (

) = c
2
`e detto quadrivelocit`a di .
(c) Per un ssato valore di
0
, il sistema di riferimento inerziale associato, secondo (2) di propo-
sizione 2.3, al vettore
s
tangente a s (u(s)) in (u(c
0
)) `e detto sistema inerziale di
quiete istantanea con allistante di tmpo proprio
0
.
Commenti 4.1.
(1) Nel caso in cui la linea di universo non sia di tipo tempo non `e pi` u possibile interpretare
ovunque
s
come un vettore tangente alla coordinata temporale di un sistema di coordinate
minkowskiane perche
s
pu`o essere di tipo luce. Nei tratti in cui la curva diventa di tipo luce, il
parametro s diventa singolare, nel senso che rimane costante al crescere del parametro inizial-
mente scelto per parametrizzare la curva.
(2) Non pu`o accadere che una linea di universo = (u) sia di tipo tempo in un punto isolato
(u
0
). Se il vettore tangente in (u
0
) `e di tipo tempo, la funzione continua (dierenziabile)
u ( (u)[ (u)) `e negativa in u
0
e quindi deve permanere tale in un intorno di u
0
. Quindi se
in (u
0
) il vettore tangente `e di tipo tempo, `e possibile denire il tempo proprio in un intorno
di u
0
ed ha quindi senso denire la quadrivelocit`a in (u
0
).
Vogliamo ora arrivare alla nozione di velocit`a di un punto materiale, ossia di una linea di uni-
verso di tipo tempo o causale, rispetto ad un riferimento inerziale F. Alcune premesse sono
necessarie.
Consideriamo un riferimento inerziale F ed un evento p M
4
. Sia
Fp
lunico spazio di quiete
con F passante per p. Il fatto che T
p
M
4
ammetta una base dovuta a coordinate cartesiane
solidali con F, in cui quindi e
0
=
Fp
e e
1
, e
2
, e
3
formano una base dello spazio tangente di
T
p

Fp
, implica lesistenza della decomposizione:
T
p
M
4
= L(
Fp
) T
p

Fp
.
L(
Fp
) `e lo spazio lineare generato da
Fp
. In realt`a la decomposizione di sopra `e diretta (e
per questo abbiamo usato il simbolo ) cio`e per ogni v T
p
M
4
, la decomposizione v = T
v
+X
v
dove T
v
L(
Fp
) e X
v
T
p

Fp
`e unica. Infatti, tenedo conto che
Fp
`e di tipo tempo e i
vettori di T
p

Fp
sono di tipo spazio, risulta immediatamente: L(
Fp
) T
p

Fp
= 0. E questo
`e equivalente alla unicit`a della decomposizione di ogni v detta sopra.
Consideriamo ora una linea di universo di tipo tempo e parametrizzata in un parametro u.
Fissiamo un riferimento inerziale F. Se p := (
0
)
F
0
e passando alla parametrizzazione
55
del tempo proprio, possiamo decomporre univocamente la quadrivelocit`a V

(
0
) come
V

(
0
) =

V (
0
) +c(
0
)
Fp
,
dove

V (
0
) T
p

Fp
. Dato che (F
p
[V
p
) < 0 deve essere c() > 0 . Parametrizzando la curva
in coordinate minkowskiane x
0
, x
1
, x
2
, x
3
associate a F, () > 0 altro non `e che dx
0
/d.
`
E
allora chiaro che il vettore di T
p

Fp
v :=

V

3
=1
dx

d
[

dt
d
[

0
=
3

=1
dx

dt
[
t(
0
)

x
.
ha il signicato sico di velocit`a di rispetto a F.
Se consideriamo una linea di universo di tipo causale, non ci sono problemi ad applicare la
denizione data no a quando il vettore tangente `e di tipo tempo. Nei punti (u
0
) (o nei tratti)
in cui il vettore tangente di una linea di universo `e di tipo luce (ma si ricordi che non pu`o
mai essere nullo comunque per denizione di linea di universo) la quadrivelocit`a non `e denita
perche il parametro privilegiato dato dal tempo proprio diventa singolare. In ogni caso, il vettore
tangente relativo alla parametrizzazione iniziale pu`o essere decomposto univocamente come
(u
0
) =

U (u
0
) +c(u
0
)
Fp
,
Proviamo a denire nel punto (u
0
) la velocit`a:
v :=

U

.
Tale denizione pu`o essere sensata se `e invariante sotto riparametrizzazione (visto che non c`e
una parametrizzazione con signicato sico particolare deve andare bene per tutte le parametriz-
zazioni!). Se cambiamo la parametrizzazione della curva

= (u(z)) dove du/dz > 0 per non


alterare il senso di percorrenza della curva ovvero la direzione del tempo, il vettore (z) sar`a
ancora di tipo luce diretto verso il futuro e

(z) =
du
dz
(u), per cui il rapporti tra le componenti
rimangono invariati e la velocit`a calcolata con la formula di sopra rispetto alla nuova parametriz-
zazione risulta essere la stessa ottenuta con la vecchia parametrizzazione. Si osservi che lo stesso
discorso si pu`o fare anche per curve di tipo tempo. In quel caso, la velocit`a denita in quel
caso `e banalmente invariante sotto riparametrizzazioni dierenziabili che non alterano il verso
di percorrenza della curva e le due denizioni coincidono. Da questo punto di vista la velocit`a
denita nel caso di vettori tangenti di tipo luce `e la naturale estensione della denizione data nel
caso di vettori tangenti di tipo tempo. Possiamo quindi dare la seguente denizione riassuntiva.
Denizione 4.2. Sia : u (u) una linea di universo e F un sistema di riferimento
inerziale. Se p = (u
p
), la velocit`a di rispetto a F nellevento p `e il vettore di T
p

Fp
v
p
[
F
:=

U
p

p
,
56
dove
Fp
`e lunico spazio di quiete di F passante per p e
(u
p
) = c
p

Fp
+

U
p
(4.6)
`e la decomposizioni diretta del vettore tangente a in p su
Fp
e T
p

Fp
.
Nota 4.1. Vogliamo sottolineare la profonda dierenza tra i concetti di velocit`a e di quadriv-
elocit`a: mentre la velocit`a `e una nozione che dipende dallassegnazione di un riferimento, la
nozione di quadrivelocit`a `e del tutto indipendente da una tale assegnazione e non ha alcun cor-
rispondente in meccanica classica.
Fissato un sistema di coordinate minkowskiane di un riferimento inerziale F ed una linea di
universo , nei punti in cui la curva `e di tipo tempo possiamo sempre esprimere le componenti
rispetto a F della quadrivelocit`a V = V

in funzione delle componenti della velocit`a v = v

[
F
rispetto a F. Infatti sappiamo che
c
2
()
2
+
3

=1
(V

)
2
= c
2
.
dove > 0. Lidentit`a di sopra si riscrive, tenendo conto della denizione di velocit`a
c
2
()
2
+
3

=1
(v

)
2
= c
2
.
da cui:
_
=
1

1v
2
/c
2
,
V

= v

,
(4.7)
dove v
2
=

3
=1
(v

)
2
`e il modulo quadrato di v nella metrica spaziale di F.
Nel caso di linee di universo di tipo luce, la relazione (4.7) cessa di valere, ma vale
=
1
c

_
3

=1
(U

)
2
, (4.8)
in riferimento alla (4.6). La prova `e immediata usando ( (u
0
)[ (u
0
)) = 0 unitamente a
(u
0
) J
+
(u
0
)
che implica per continuit`a la non negativit`a di .
Abbiamo il seguente teorema relativo allidea popolare che aerma che non si pu`o superare la
velocit`a della luce.
Teorema 4.1. In ogni sistema di riferimento inerziale, il modulo (riferito alla metrica spaziale
del riferimento) della velocit`a di una arbitraria linea di universo `e inferiore o al pi` u uguale
57
alla velocit`a della luce. Questultimo fatto accade solo negli eventi sulla linea di universo in cui
il vettore tangente `e di tipo luce.
Dimostrazione. Mettiamoci i coordinate minkowskiane solidali con il riferimento inerziale
considerato.
[v[
2
= (v[v) =

_
U

_
2
.
Nel caso il vettore tangente sia di tipo luce, la (4.8) implica subito che lultimo membro di sopra
sia c
2
. Nel caso in cui il vettore tangente sia di tipo tempo vale (V [V ) = c
2
che si pu`o
riscrivere c
2

2
= c
2
+ V
2
, per cui
2
1 e V
2
= c
2
(
2
1). In questo caso, usando il tempo
proprio come parametro:
[v[
2
= (v[v) =

_
V

_
2
= c
2
_
1
1

2
_
.
Lultimo membro `e inferiore a c
2
dato che
2
1. 2
4.1.1 Velocit`a di trascinamento e legge di composizione delle velocit`a .
Per concludere mostriamo come denire la velocit`a di trascinamento di un riferimento inerziale
F rispetto ad un altro riferimento inerziale F

.
Consideriamo sistemi di coordinate minkowskiane in F e F

le cui funzioni coordinate saranno


indicate rispettivamente con x
0
, x
1
, x
2
, x
3
e y
0
, y
1
, y
2
, y
3
. Un punto materiale in quiete con F,
avr`a una linea di universo di tipo tempo descritta da x
0
= x
0
, x

= q

dove le q

sono 3 costanti.
Abbiamo usato il parametro x
0
per parametrizzare la curva. Nelle coordinate di F

, la stessa
linea di universo sar`a descritta da
y
i
(x
0
) = C
i
+
i

+
i
0
x
0
. (4.9)
Dalla denizione 3.2, la velocit`a di tale linea di universo rispetto a F

sar`a dunque, nelle


coordinate y
1
, y
2
, y
3
indotte su ogni spazio di quiete di F

:
v

F|F
= c

0
0
. (4.10)
Si osservi che il secondo membro `e costante, nel senso che ha componenti costanti in coordi-
nate minkowskiane ovvero determina, tramite lisomorsmo tra spazio tengente e spazio delle
traslazioni di M
4
, lo stesso vettore v
F|F
nello spazio delle traslazioni di M
4
indipendentemente
dallevento x. Indicheremo con v
F|F
indierentemente il campo vettoriale in ogni
F

t
ovvero
il vettore associato nello spazio delle traslazioni di M
4
.
`
E facilissimo provare che cambiando sis-
temi di coordinate minkowskiane solidali a F e F

, il vettore (campo vettoriale) v


F|F
rimane
immutato.
`
E chiaro che tale vettore (campo vettoriale) altro non `e che la velocit`a associata in
58
F

al campo di quadrivelocit`a
F
.
Denizione 4.3. (Velocit`a di trascinamento.) Siano F e F

due sistemi di riferimento


inerziali in M
4
e si ssino due sistemi di coordinate minkowskiane solidali con i due riferimenti
con funzioni coordinate x
0
, x
1
, x
2
, x
3
e y
0
, y
1
, y
2
, y
3
rispettivamente e y
i
= C
i
+
i
j
x
j
. Il campo
v
F|F
, denito da (4.10) su ogni spazio di quiete di F

in coordinate cartesiane indotte da coor-


dinate minkowskiane solidali con F

`e detto velocit`a di trascinamento di F rispetto a F

.
Vediamo ora di scrivere la legge che corrisponde in relativit`a speciale alla legge di composizione
delle velocit`a di trascinamento. Consideriamo due riferimenti inerziali F e F

connessi da una
trasformazione P
(C,)
IO(1, 3) dove C = 0 e `e una trasformazione di Lorentz speciale lungo
lasse x
3
(vedi teorema 3.1). In base al teorema 3.1, per ogni coppia di sistemi di riferimento
inerziali, `e sempre possibile trovare due sistemi di coordinate solidali con ciascuno dei due in
modo tale che la trasformazione di coordinate sia una trasformazione speciale di Lorentz lungo
lasse x
3
. In virt` u di ci`o, quanto segue `e in realt`a del tutto generale. Parametrizziamo con la
velocit`a v
r
= v
3
F|F

= v
3
F

|F
(vedi esercizio 4.1.4) invece che con v
3
F

|F
:=
_

r
0 0
r
v
r
/c
0 1 0 0
0 0 1 0

r
v
r
/c 0 0
r
_

_
Sopra
r
:= 1/
_
1 v
2
r
/c
2
. Si osservi che con la scelta delle nostre coordinate v
1
F|F

= v
2
F|F

=
0.
Consideriamo quindi una linea di universo = (u), in coordinate di F data da x
i
= x
i
(u) e
nelle coordinate di F

data da y
i
= C
i
+
i
j
x
j
(u). Indicheremo con v

le componenti della
velocit`a di rispetto a F nelle coordinate x

e con v

le componenti della velocit`a di rispetto


a F

nelle coordinate y

.
Vogliamo determinare le componenti v

in funzione delle componenti v

. Si osservi che il
discorso pu`o essere fatto solo in componenti, visto che i vettori velocit`a considerati appartengono
a spazi vettoriali dierenti e relativi a spazi di quiete di riferimenti dierenti.
Applicando le due denizioni di sopra otteniamo subito, se V

`e la componente -esima e c la
componente 0-esima nelle coordinate di F della quadrivelocit`a di e V

, c

sono le analoghe
componenti in F

:
v

=
V

= c

0
c

0
0
c +
0

= c

0
c
c
0
0
+
0

,
e quindi
v

0
0
v

+c

0
0
1 +

0

0
0
v

c
=

0
0
v

+v

F|F

1 +

0

0
0
v

c
.
59
Usando la forma esplicita della matrice troviamo
_

_
v
1
=
v
1

r
,
v
2
=
v
2

r
,
v
3
=
v
3
+v
r
1+
v
3
v
r
c
2
,
che possiamo riscrivere, con ovvie notazioni
_
_
_
v

=
v

r
,
v
||
=
v
||
+v
r
1+
v
||
v
r
c
2
.
(4.11)
Questa `e la legge di composizione delle velocit`a relativistiche.
Si osservi che anche per moti che avvengono unicamente nelle direzioni perpendicolari alla veloc-
it`a relativa tra i due riferimenti (nel giudizio di entrambi i riferimenti), il modulo della velocit`a
di un punto materiale rispetto a F

risulta comunque diminuita rispetto a quella valutata in


F di un fattore 1/
r
< 1 (che tende comunque a 1 nel limite v
r
/c 0
+
per raccordarsi alla
situazione classica). Viceversa se denotiamo v := v
||
e v

= v
||
e se consideriamo solo moti
che avvengono lungo lasse x
3
in F (che implica che il moto avvenga lungo lasse x
3
in F

),
lunica relazione non banale `e la legge di composizione delle velocit`a per trasformazioni
speciali:
v

=
v +v
r
1 +
vv
r
c
2
. (4.12)
Si pu`o notare che per piccole velocit`a, ossia vv
r
c
2
, la formula si riduce allanaloga galileiana.
Inoltre nel caso limite v = c otteniamo v

= c in conformit`a con il teorema 4.1.


In termini di velocit`a di trascinamento, se F, F

e F

sono sistemi di riferimento inerziali e


sono note le componenti delle rispettive velocit`a di trascinamento v
F|F
in F

e v
F

|F
in F

e ancora la trasformazione di coordinate tra F

e F

`e speciale lungo il terzo asse spaziale,


allora le componenti di v
F|F
in F

soddisfano la legge di composizione relativistica delle


velocit`a di trascinamento in contrapposizione con lanaloga classica che corrisponde alla
semplice somma di velocit`a :
_
_
_
v

F|F

= v

F|F

1
F

|F

,
v
||
F|F

=
_
v
||
F|F

+v
F

|F

__
1 +
1
c
2
v
||
F|F

v
F

|F

_
1
.
(4.13)
Le componenti parallele e perpendicolari sono riferite allasse (comune) lungo il quale
avviene il moto relativo di F

e F

e, con abuso di notazione, v


F

|F
denota lunica compo-
nente di tale velocit`a nella base associata alle coordinate minkowskiane in F

.
Esercizi 4.1.
60
1. Si consideri p M
4
ed un riferimento inerziale F. Dalla teoria generale delle decompo-
sizioni dirette, esisteranno due operatori lineari surgettivi detti proiettori della decomposizione;
P

Fp
: T
p
M
4
L(
Fp
) e P

Fp
: T
p
M
4
T
p

Fp
tali che, per ogni v T
p
M
4
, P

Fp
(v) = T
v
e
P

Fp
(v) = X
v
.
Provare che:
(i) P

Fp
P

Fp
= P

Fp
e P

Fp
P

Fp
= P

Fp
,
(ii) P

Fp
+P

Fp
= I,
(iii)P

Fp
P

Fp
= P

Fp
P

Fp
= 0.
2. Mostrare che se t
F
`e la coordinata temporale globale associata a F, e p M
4
:
P

Fp
= c , dt
Fp
)
Fp
,
e quindi
P

Fp
= I c , dt
Fp
)
Fp
.
3. Gli spazi L(
Fp
) e T
p

Fp
sono chiaramente ortogonali. Esiste un teorema che assicura che
se V `e uno spazio con prodotto scalare e V = V
1
+V
2
dove V
1
e V
2
sono sottospazi reciprocamente
ortogonali, allora la decomposizione `e diretta: V = V
1
V
2
(cio`e, per ogni vettore di V la coppia
di vettori in V
1
e V
2
la cui somma `e il vettore detto `e unica). Perche non abbiamo potuto usare
tale teorema?
4. Scelti dei sistemi di coordinate minkowskiane in F e F

come in denizione 4.3, si provi


che in tali coordinate, le componenti di v
F|F
e v
F

|F
sono legate da
v

F|F
= v

|F
.
5. Mostrare che la velocit`a di trascinamento di un riferimento inerziale F rispetto ad un
altro F

non dipende dai sistemi di coordinate minkowskiane solidali con i due riferimenti usati
per denire le componenti di tale velocit`a.
6. Si considerino due riferimenti inerziali F e F

. Si supponga che un punto materiale in


moto rettilineo uniforme rispetto a F

abbia velocit`a relativa rispetto a F

data dal vettore u


in uno spazio di quiete di F

. Sia nota v := v
F|F
come vettore nello stesso spazio di quiete.
Dimostrare che se w `e la velocit`a del punto materiale rispetto a F (in un suo spazio di quiete)
allora
[w[ = c

1
(1 u
2
/c
2
)(1 v
2
/c
2
)
(1 u v/c
2
)
2
,
dove v
2
:= [v[
2
, u
2
:= [u[
2
i moduli essendo calcolati con la metrica spaziale dei corrispondenti
riferimenti e denota il prodotto scalare associato alla metrica spaziale di F

.
7. In uno spazio ane A, una retta uscente da P A con vettore tangente n V spazio
delle traslazioni di A, `e denita come R u P +un. Si dimostri che se : R M
4
`e una linea
di universo descrivente levoluzione di un punto materiale in moto rettilineo uniforme rispetto
a qualche riferimento inerziale, = (u) (dove u `e un parametro arbitrario tale che `e di tipo
causale futuro) `e una retta di M
4
con vettore tangente di tipo causale futuro, oppure esiste una
riparametrizzazione di che non ne altera il verso di percorrenza e che la trasforma in una retta
61
con vettore tangente di tipo causale futuro.
Viceversa provare che una retta di M
4
con vettore tangente di tipo causale futuro `e una linea di
universo che descrive il moto rettilineo uniforme di un punto materiale rispetto a qualche rifer-
imento inerziale e se il vettore non `e di tipo luce, il parametro che descrive la retta `e legato al
tempo proprio tramite una trasformazione lineare non omogenea con coeciente moltiplicativo
strettamente positivo.
4.2 Dilatazione degli intervalli di tempo e paradosso dei gemel-
li.
Consideriamo una linea di universo di tipo tempo = () dove R `e il tempo proprio
misurato dallorologio ideale in quiete con il punto materiale associato alla linea di universo.
Consideriamo quindi un riferimento inerziale F con funzione coordinata temporale t
F
i cui
valori etichettano gli spazi di quiete
Ft
di F. Supponiamo che lorologio solidale con il punto
materiale sia sincronizzato su
Ft
1
con gli orologi di F per cui (t
1
) = t
1
quando interseca

Ft
1
. Lasciamo evolvere la linea di universo no a quando interseca
Ft
2
. La domanda che
ci poniamo `e: che tempo (t
2
) segner`a lorologio solidale con in tale evento?
`
E facile provare (vedi sotto) che se il modulo della velocit`a di rispetto a F `e costante, vale la
celebre formula della dilatazione degli intervalli di tempo:
t =

_
1
v
2
c
2
, (4.14)
dove t := t
2
t
1
e := (t
2
) (t
1
). In questo caso particolare `e chiaro che deve valere
t
2
> (t
2
) quando (t
1
) = t
1
se v ,= 0.
Vogliamo mostrare che nel caso generale, eccettuato il caso in cui il punto materiale `e sempre
in quiete in F in [t
1
, t
2
], lorologio solidale con segner`a un tempo (t
2
) < t
2
. Tale fenomeno
cade sotto il nome di dilatazione degli intervalli di tempo
1
.
Per provare lasserto di sopra, riparametrizziamo la linea di universo attraverso la coordinata
t
F
. Questo `e sempre possibile perche, ssato un sistema di coordinate minkowskiane solidale
con F, `e descritta da funzioni dierenziabili x
i
= x
i
() con dx
0
/d > 0 al ne di avere
quadrivelocit`a diretta verso il futuro, inoltre x
0
e ct
F
dieriscono per una costante additiva che
possiamo sempre supporre essere nulla ridenendo t
F
. Faremo tale scelta dora in poi. Usando
la denizione 3.1 avremo che
(t
2
) (t
1
) =
1
c
_
ct
2
ct
1

_
1
3

=1
_
dx

dx
0
_
2
dx
0
1
La dilatazione `e ovviamente riferita allintervallo di tempo misurato da F rispetto a quello di tempo proprio.
62
In altri termini, tenedo conto della denizione di velocit`a rispetto a F:
(t
2
) (t
1
) =
_
t
2
t
1
_
1
v
2
(t)
c
2
dt , (4.15)
dove con v
2
(t) abbiamo denotato il modulo della velocit`a di rispetto a F su
Ft
. In particolare
se il modulo della velocit`a `e costante, abbiamo la (4.14). Essendo tutte le funzioni continue
(t
2
) (t
1
) (t
2
t
1
) max
__
1
v
2
(t)
c
2

t [t
1
, t
2
]
_
(t
2
t
1
) 1 ,
e quindi
(t
2
) (t
1
) t
2
t
1
.
Sicuramente vale il segno di uguaglianza se v 0 su [t
1
, t
2
]. Mostriamo che ci`o accade esclusiva-
mente in tale caso. Infatti se v(t
0
) > 0 per qualche t
0
[t
1
, t
2
], per continuit`a ci`o accadr`a in un
intorno di t
0
, per cui ci sar`a un intorno di t
0
in cui
_
1
v
2
(t)
c
2
< 1. Restringendo tale intorno,
a causa della continuit`a troveremo un intorno aperto U di t
0
su cui (e sulla cui chiusura) vale
_
1
v
2
(t)
c
2
< 1 per qualche > 0. In denitiva, ci sar`a un intervallo aperto (a, b) [t
1
, t
2
]
su cui
_
1
v
2
(t)
c
2
< 1 . Quindi, se A = [t
1
, t
2
] (a, b)
(t
2
) (t
1
) =
_
A
_
1
v
2
(t)
c
2
dt +
_
b
a
_
1
v
2
(t)
c
2
dt
Il secondo membro `e maggiorato da
_
A
1 dt +
_
b
a
(1 ) dt <
_
A
1 dt +
_
b
a
1 dt =
_
t
2
t
1
dt = t
2
t
1
.
Abbiamo quindi trovato che:
Teorema 4.2. Sia : R M
4
una linea di universo di tipo tempo parametrizzata nel
tempo proprio e sia F un sistema di riferimento inerziale con coordinata temporale globale t
F
.
Se interseca
Ft
1
al tempo proprio
1
ed interseca
Ft
2
al tempo proprio
2
allora:

1
t
2
t
1
,
In particolare, se per qualche istante di tempo proprio la velocit`a di rispetto a F non `e nulla,
allora necessariamente:

1
< t
2
t
1
.

63
Commenti 4.2.
(1) Il teorema di sopra ha una conseguenza interessante.
`
E chiaro che lintervallo di tempo
proprio misurato lungo una curva causale si pu`o interpretare come una lunghezza Lorentziana,
in quanto (4.5) ha la stessa struttura della formula della lunghezza di una curva in geometria
Riemanniana. Una dierenza importante `e che ci sono curve che non si riducono ad un punto e
che hanno lunghezza Lorentziana nulla: tutte le curve con vettore tangente di tipo luce hanno
tale propriet`a. Tuttavia c`e unaltra propriet`a notevole che distingue la lunghezza riemanniana
da quella lorentziana. Consideriamo un punto materiale in moto rettilineo uniforme rispetto a
qualche riferimento inerziale e ssiamo due eventi p e q lungo la sua linea di universo . Quindi
consideriamo un secondo punto materiale la cui linea di universo

connette la stessa coppia


di eventi. Dato che possiamo sempre trovare un riferimento inerziale in cui il primo punto `e in
quiete, in base al teorema precedente, la lunghezza Lorentziana

:=
_

_
( (u)[ (u))du ,
sar`a sempre maggiore o uguale della lunghezza Lorentziana

:=
_

_
(

(u)[

(u))du .
La linea di universo tra p e q `e un segmento di retta rispetto alla struttura ane di M
4
,
lunico segmento che connette p e q, mentre in generale

`e una curva generica di tipo tempo


che connette gli stessi eventi.
Quindi: al contrario di quanto accade nella geometria riemanniana, il segmento di retta di tipo
tempo futuro che connette una coppia di eventi temporalmente connessi massimizza il funzionale
lunghezza lorentziana denito sulla classe delle curve di tipo tempo futuro che connettono tali
eventi. In geometria riemanniana i segmenti di retta su variet`a globalmente piatte minimizzano
lanalogo funzionale.
(2) Un caso rilevante del teorema di sopra `e quando descrive levoluzione di un punto materiale
in quiete con un secondo sistema di riferimento inerziale F

. In tal caso gli intervalli di tempo


proprio [
1
,
2
] coincidono con intervalli di tempo misurati rispetto all coordinata temporale
globale di F

. Di conseguenza ciascun osservatore giudicher`a gli intervalli di tempo, misurati


con i suoi orologi di quiete, dilatati rispetto agli intervalli di tempo misurati dallaltro osservatore,
quando tali intervalli siano riferiti a coppie di eventi come precisato sopra.
Apparentemente la situazione `e paradossale perche il ruolo giocato dai due riferimenti sembra
essere interscambiabile (si ricordi che i moduli della velocit`a di trascinamento di F rispetto a
F

e quello della velocit`a di trascinamento di F

rispetto a F sono uguali) mentre il loro ruolo


nel risultato nale sicuramente non lo `e. Tuttavia la spiegazione `e semplice. Nel confronto

1
< t
2
t
1
.
Sopra `e ora riferito la coordinata temporale di F

, il ruolo giocato dai due osservatori non `e


simmetrico: per F

gli eventi considerati a cui si attribuiscono i tempi


1
e
2
sono nello stesso
64
posto spaziale e i tempi suddetti sono valutati da un unico orologio in quiete con F

, mentre per
F tali eventi non sono nello stesso posto e ci vogliono due orologi in quiete con F per misurare
t
1
e t
2
.
Anche F verichi un analogo fenomeno di dilatazione dei suoi intervalli temporali rispetto a
quelli di F

sar`a necessario considerare unaltra coppia di eventi, questa volta nello stesso posto
per F ma non pi` u nello stesso posto per F

.
(3) Il fenomeno della dilatazione degli intervalli di tempo `e stato un importante test per valutare
sperimentalmente la teoria della relativit`a. In eetti tale fenomeno `e comunemente osservato
dagli sperimentatori che lavorano con particelle subatomiche instabili. Tali particelle, una volta
prodotte, decadono in altre particelle dopo un certo tempo T
0
detto vita media e denito in un
sistema di riferimento in quiete con la particella stessa. Quando le particelle in esame vengono
prodotte con velocit`a v vicine a quelle della luce, rispetto al sistema di riferimento del laboratorio,
si assiste ad una dilatazione della vita media in conformit`a con la relazione, valida per velocit`a
costanti,
T =
T
0
_
1 v
2
/c
2
.
Per esempio per quanto riguarda esperimenti con pioni vedi [20]. Si osservi che per applicare
la formula di sopra, ovvero la (4.14), `e suciente che il modulo della velocit`a sia costante, la
direzione pu`o cambiare: la formula `e applicabile a moti circolari uniformi.
Il fenomeno della dilatazione degli intervalli di tempo, ed in particolare (4.14) su moti circolari
uniformi, `e stato anche testato sperimentalmente usando orologi atomici in volo attorno alla terra
in direzioni opposte ed a velocit`a uguali e costanti rispetto alla terra. Lesperimento `e quello
famosissimo di Haefele and Keating che ha dato esito positivo. Nellidea di tale esperimento si
tiene conto del fatto che la terra non `e un riferimento inerziale a causa del moto di rotazione
attorno al proprio asse (il moto di rivoluzione attorno al sole `e trascurabile). Il sistema inerziale
di riferimento `e dunque quello in cui la terra `e vista ruotare sul proprio asse alla velocit`a angolare
di 2 radianti in 24 ore. In questo sistema di riferimento F si usano le formule della dilatazione
degli intervalli di tempo per gli orologi in volo tenendo conto delle velocit`a degli aerei che
trasportano gli orologi. Si osservi che le velocit`a dei due aerei riferite a F sono diverse per cui si
hanno dierenti ritardi rispetto ad un orologio in quiete in F, ma anche rispetto ad un orologio
in rotazione con la terra. Da [21]: During October, 1971, four cesium atomic beam clocks were
own on regularly scheduled commercial jet ights around the world twice, once eastward and
once westward, to test Einsteins theory of relativity with macroscopic clocks. From the actual
ight paths of each trip, the theory predicted that the yng clocks, compared with reference clocks
at the U.S. Naval Observatory, should have lost 40 23 nanoseconds during the eastward trip
and should have gained 27521 nanoseconds during the westward trip ... Relative to the atomic
time scale of the U.S. Naval Observatory, the ying clocks lost 59 10 nanoseconds during the
eastward trip and gained 273 7 nanosecond during the westward trip, where the errors are the
corresponding standard deviations.
65
Eastward Journey
Predicted 40 23ns
Measured 59 10ns
Wesward Journey
Predicted + 275 21ns
Measured + 273 7ns
(4) Nel contesto del fenomeno della dilatazione degli intervalli di tempo, si inserisce il celebre
paradosso dei gemelli. Si considerano due gemelli A e B inizialmente in quiete relativa. Quindi
B parte su unastronave e viagga a velocit`a prossime a quelle della luce rispetto ad A. Quando
B torna in quiete con A dovr`a essere pi` u giovane di A per il fenomeno della dilatazione degli
intervalli di tempo. Il punto apparentemente paradossale `e che il moto `e relativo, per cui si
pu`o pensare che sia stato A a viaggiare ad alte velocit`a rispetto a B. In denitiva A dovrebbe
essere a sua volta pi` u giovane di B!
La spiegazione `e la seguente. Gli intervalli di tempo misurati dai due gemelli rispetto al
personale tempo proprio, tra levento partenza p e levento ritorno r si ottengono integran-
do
_
(
A
(u)[
A
(u)) e
_
(
B
(u)[
B
(u)) sulle corrispondenti linee di universo e tra i due
eventi detti,
A
: (a, b) M
4
e
B
: (a, b) M
4
dove per comodit`a e senza perdere generalit`a,
si `e usato lo stesso parametro.
Quindi `e possibile dare una risposta non contraddittoria allinterno del formalismo della teoria
alla domanda: chi sar`a alla ne pi` u giovane? La risposta dipender`a dalla forma delle due linee
di universo. In particolare per il teorema dimostrato, se una delle due linee di universo, diciamo
quella di A, descrive il moto di quiete in un riferimento inerziale, il gemello B risulter`a al suo
ritorno pi` u giovane di A. Si osservi che in tal caso la linea di universo di B non pu`o descrivere
anche essa un moto di quiete rispetto ad un (altro) riferimento inerziale. Dal punto di vista
sico, mettendosi in quiete nel riferimento inerziale di A, B deve prima allontanarsi e poi ri-
avvicinarsi ad A, per cui il suo moto sar`a accelerato rispetto ad A e non ci sar`a alcun riferimento
inerziale in cui B `e in quiete. Dal punto di vista geometrico, come in ogni spazio ane, c`e un
unico segmento di retta (temporale futura) che congiunge i due eventi p e r e al pi` u uno solo
dei due gemelli pu`o avere linea di universo descritta da tale segmento e quindi essere in quiete
in un riferimento inerziale (qui il segmento `e una porzione di una linea di universo di un punto
in quiete).
In denitiva laermazione il moto `e relativo `e falsa quando non si considerino moti rettilinei
uniformi.
(5) Altri due fenomeni connessi con il fenomeno della dilatazione degli intervalli temporali sono i
seguenti. Uno `e leetto Doppler trasverso: se una sorgente di onde elettromagnetiche ruota
a velocit`a costante v attorno ad un rilevatore, la frequenza rilevata `e diversa da quella misurata
in quiete con la sorgente. Tale eetto `e del tutto assente in sica classica. La spegazione `e
ancora una volta data dalla formula
T =
T
0
_
1 v
2
/c
2
,
66
dove ora T
0
`e il periodo di emissione dellonda valutato nel riferimento di quiete della sorgente e
T `e il periodo valutato nel riferimento del laboratorio in cui la sorgente ruota a velocit`a costante
v. Passando alle frequenze f
0
, f (che sono inversamente proporzionali ai periodi), la formula di
sopra implica subito, con analogo signicato dei simboli,
f = f
0
_
1 v
2
/c
2
,
in cui si vede che la frequenza osservata `e pi` u bassa rispetto a quella in quiete con la sorgente.
Laltro fenomeno `e lallargamento di fasci di particelle cariche. Se si cerca di preparare
un fascio di particelle cariche dello stesso segno si deve tenere conto della repulsione reciproca
che provoca inevitabilmente un allargamento della sezione trasversale del fascio. Tuttavia tale
fenomeno di allargamento appare tanto pi` u lento quanto pi` u il fascio `e veloce. Unaltra volta la
spiegazione qualitativa e quantitativa si pu`o dare con il fenomeno della dilatazione degli intervalli
di tempo.
4.3 Peculiarit`a della cinematica relativistica.
Consideriamo ora un altro tipico fenomeno relativistico, quello della contrazione dei volumi e
delle lunghezze: ci chiediamo come varino le propriet`a metriche di un corpo descritto in un
riferimento inerziale in cui `e in moto (a velocit`a costante), rispetto alle analoghe propriet`a
valutate nel riferimento di quiete con il corpo.
In meccanica classica le propriet`a geometriche dei corpi non dipendono dal riferimento dato che
le metriche spaziali sono propriet`a assolute indipendenti dal riferimento. In relativit`a le metriche
spaziali sono invece indotte da quella spaziotemporale sugli spazi di quiete dei vari riferimenti.
Pertanto non `e per nulla ovvio che le propriet`a metriche dei corpi siano invarianti al variare del
riferimento.
Fissiamo due riferimenti inerziali F e F

. Sia
Ft
0
una sottovariet`a di
Ft
0
di dimensione
m 3, per qualche t
0
R e supporremo in seguito che tale sottovariet`a abbia misura, indotta
da quella spaziale di
Ft
0
, nita. Se assumiamo, al ne di investigare la questione sollevata
sopra, che denoti un insieme di punti materiali che al variare di t
F
rimangano in quiete con
F, tale insieme genera un tubo di universo
T

= x +t
F
[ x , t R
dove
F
`e intepretato come vettore nello spazio ane delle traslazioni di M
4
. Notiamo che ogni
sezione di T

,
t
1
ottenuta intersecando T

con
Ft
1
`e chiaramente isometrica ad ogni altra
sezione
t
2
= T


Ft
2
(in particolare stesso) sotto lazione della traslazione

t
1
x x + (t
2
t
1
)
F

t
2
.
Prendiamo ora un nuovo riferimento inerziale F

in cui linsieme di punti materiali suddetti `e


visto muoversi. Il riferimento F

sezioner`a il tubo di universo T

con i suoi spazi di quiete


Ft

67
in una classe di insiemi

= T

t
che in generale avranno una forma e propriet`a geo-
metriche e metriche dierenti da quelle di . Tuttavia le traslazioni, rappresentanti levoluzione
spaziotemporale del corpo,

1
x x + (t

2
t

1
)
_
1 (v
F|F
)
2
/c
2

2
, (4.16)
saranno ancora isometrie ovvero, in altre parole, il moto del corpo apparir`a come rigido. Per
provare quanto detto notiamo che ogni funzione di traslazione V : M
4
x x + v M
4
, se v
`e nello spazio delle traslazioni di M
4
, `e un dieomorsmo ed unisometria rispetto alla metrica
. Limmagine di
F

1
secondo un tale dieomorsmo `e proprio
F

2
se il v = k
F
2
dove
(t

2
t

1
) = (k
F
[
F
) .
Ma, per denizione di velocit`a di trascinamento ed usando (4.7),
(
F
[
F
) =
1
_
1 v
2
F|F

/c
2
,
da cui si ottiene la (4.16). Restringendosi alla sottovariet`a

1
, limmagine secondo V di tale
insieme `e la sottovariet`a dieomorfa ed isometrica

2
. Quindi il dieomorsmo nale da

1
a

2
sar`a ancora unisometria nelle metriche indotte da sulle sottovariet`a considerate.
Vogliamo determinare le relazioni metriche tra le sottovariet`a
t
(che rappresentano un insieme
di punti materiali fermi nel riferimento F) rispetto a

(che rappresentano lo stesso inseme di


punti materiali che `e visto in movimento in F

).
`
E chiaro che possiamo confrontare due qualsiasi
elementi delle due classi dette sopra essendo, allinterno di ogni classe, tutte le sottovariet`a tra
di loro isometriche.
Per procedere `e molto comodo parametrizzare la sottovariet`a

che `e denita nello spazio


di quiete di F

, usando le coordinate spaziali dellaltro riferimento: F. Infatti scegliendo


un opportuno sistema di coordinate minkowskiane solidali con F, si pu`o descrivere come
x
0
= 0 e (x
1
, x
2
, x
3
) D, dove D R
3
`e dieomorfo a . Scegliamo un sistema di coordinate
minkowskiane solidali con F

. Linsieme

= T

0
per una ssata costante t

0
`e individuato
dalle condizioni x
0
= ct

0
e x

, (x
1
, x
2
, x
3
) D. Quindi, in coordinate di F, linsieme

`e individuato risolvendo
ct

0
=
0
0
x
0
+
0

.
In tal modo

corrisponde allinsieme di R
4
:
x
0
=
ct

0
0
con (x
1
, x
2
, x
3
) D .
2
Infatti, ssando una base pseudo ortonornale in O
F

1
con e
0
dato da
F
e gli altri tre versori di tipo
spazio contenuti in T
O

1
, si conclude subito che O+k
F
`e un punto di
F

2
quando la componente rispetto
a e
0
di tale vettore nella base detta vale t

2
t

1
.
68
`
E chiaro che possiamo usare le coordinate x
1
, x
2
, x
3
per denire una carta globale su un aperto U

contenente

(eventualmente U

se `e una sottovariet`a tridimensionale) le cui coordinate,


per evitare ambiguit`a, le indicheremo con y
1
, y
2
, y
3
. In queste coordinate la metrica spaziale di
F

ossia quella indotta da su U

`e data dai coecienti:


g

=
x
i
y

x
j
y


ij
dove
x

= y

, (4.17)
x
0
=
ct

0
0
. (4.18)
Il calcolo esplicito di g

fornisce:
g

(
0
0
)
2
(4.19)
Questa identit`a permette di confrontare le propriet`a metriche di con quelle di

. Esamineremo
tre casi nelle prossime tre sezioni.
4.3.1 Contrazione dei Volumi.
Assumiamo che sia una sottovariet`a tridimensionale che indicheremo con V con misura (vol-
ume) nita. Confronteremo i volumi di V , vol(V ) con quello di V

, vol(V

) riferiti alle metriche


spaziali dei corrispettivi riferimenti inerziali.
A tal ne si ha
vol(V

) =
_
D
_
detg

dy
1
dy
2
dy
3
dove g

`e la matrice di coecienti g

, mentre
vol(V ) =
_
D
dx
1
dx
2
dx
3
dato che la metrica spaziale di F nelle coordinate minkowskiane `e rappresentata da g

. Per costruzione

detg

`e una costante nelle coordinate y


1
, y
2
, y
3
e ancora y

= x

su D.
Concludiamo che
vol(V

) =
_
detg

vol(V ) .
Lemma 4.1. Se A `e una matrice complessa n n di coecienti A

+C

, vale
det A = 1 +
n

=1
C
2

.
69

Dimostrazione. Vale
det A =

n
A
1
1
A
n
n
,
dove `e la densit`a tensoriale di Ricci-Levi-Civita [1] e vale

n
= 1 se
1

n
`e una
permutazione di 1, . . . , n ed il segno `e dato dalla parit`a della permutazione: se la permu-
tazione `e dispari, mentre + se la permutazione `e pari. Inne

n
= 0 se
1

n
non `e una
permutazione di 1, . . . , n.
In altre parole
det A =

n
_

1
1

n
n
+C
1
C

2
2

n
n
+ +
1
1

n1
n1
C
n
C

n
_
,
tutti gli altri termini forniscono contributo nullo perche sono del tipo

n
C
k
C

k
C
h
C

h
=

n
C
h
C

h
C
k
C

k

e

n
=

n
.
Ma

n
_

1
1

n
n
+C
1
C

2
2

n
n
+ +
1
1

n1
n1
C
n
C

n
_
,
vale proprio

1n
+
1n
C
2
1
+ +
1n
C
2
n
= 1 +
n

=1
C
2

.
2
Nel caso in esame applicando, il lemma con
C

= i

0
0
si ottiene
det g

= 1

0
0
_
2
= 1
v
2
F|F

c
2
.
Concludiamo che vale la formula di contrazione relativistica dei volumi:
vol(V

) = vol(V )
_
1
v
2
c
2
, (4.20)
dove vol(V ) `e valutato in quiete con linsieme di punti materiali V , mentre vol(V

) `e il volume
dello stesso insieme di punti materiali valutato in un riferimento inerziale in cui i punti materiali
sono visti muoversi con la stessa velocit`a costante di modulo v.
70
4.3.2 Contrazione delle lunghezze.
Passiamo a considerare il caso in cui sia un variet`a unidimensionale, che indicheremo con,
, come per esempio un segmento, con misura (lunghezza) nita. Vogliamo ora confrontare le
lunghezze () e (

).
Possiamo parametrizzare come [a, b] u (u), cio`e in coordinate x

, u x

(u) e la sua
lunghezza sar`a data da
() =
_
b
a

_
3

=1
_
dx

du
_
2
du ,
dove abbiamo usato il fatto che la metrica spaziale di F nelle coordinate dette `e banalmente
g

. Similmente se g

data da (4.19)`e la metrica spaziale di F

nelle coordinate y

= x

si ha
(

) =
_
b
a
_
g

dx

du
dx

du
du .
Sopra
g

dx

du
dx

du
=
3

=1
_
dx

du
_
2

,=1
dx

du

0
0
dx

du

0
0
.
Questo pu`o essere riscritto:
g

dx

du
dx

du
=
3

=1
_
dx

du
_
2

=1
_
dx

du
v

|F
c
_
2
.
e quindi
(

) =
_
b
a

_
3

=1
_
dx

du
_
2

=1
_
dx

du
v

|F
c
_
2
du .
Nel caso la curva sia un segmento, lo possiamo sempre parametrizzare come
x

(u) = x

0
+u()n

,
dove u [0, 1] e n

sono le componenti di un versore nello spazio di quiete considerato per F.


In tal caso otteniamo subito:
(

) = ()

1
(n v)
2
c
2
, (4.21)
dove v := v
F

|F
e indica il prodotto scalare associato alla metrica spaziale di F. Ci sono due
situazioni interessanti in cui la formula di sopra si applica:
(a) `e un segmento perpendicolare a v
F

|F
. In tal caso il secondo addendo sotto il segno di
radice si annulla e troviamo
(

) = () .
71
(b) `e un segmento parallelo a v
F

|F
. In tal caso troviamo subito la formula della
contrazione relativistica delle lunghezze o formula della contrazione di Lorentz
(

) = ()
_
1
v
2
c
2
(4.22)
dove () `e valutata in quiete con linsieme di punti materiali formanti il segmento , mentre
(

) `e la lunghezza dello stesso insieme di punti materiali valutato in un riferimento inerziale


in cui i punti materiali sono visti muoversi con la stessa velocit`a costante di modulo v nella
direzione stessa del segmento.
Nota 4.2. Ci si pu`o chiedere se la contrazione di cui sopra si veda in senso proprio. Questa `e
una domanda complessa che implica nozioni di ottica relativistica. Diciamo solo che la cosa non
`e ovvia. Per esempio si pu`o mostrare che una sorgente luminosa sferica in moto non viene vista
contratta nella direzione del moto, ma si osserva una contrazione uniforme.
In ogni caso la contrazione di Lorentz `e un fenomeno reale indipendentemente dal fatto di ci`o
che si osservi o meno. Per esempio, unautomobile di lunghezza L
0
misurata in quiete, pu`o es-
sere tutta contenuta per breve tempo in un garage di lunghezza L
0
/2 con due porte (di entrata
e di uscita lungo il moto dellauto) che si chiudono e si riaprono contemporaneamente e molto
velocemente, purch`e la velocit`a dellauto rispetto al garage sia tanto sostenuta che la contrazione
di Lorentz ne riduca la lunghezza a L

< L
0
/2.
Esercizi 4.2.
1. In riferimento allosservazione di sopra, si supponga che la velocit`a costante dellauto
rispetto al garage sia tale che la lunghezza dellauto nel riferimento del garage sia esattamente
L
0
/2. Si supponga che le porte del garage di spessore nullo si aprano e si chiudano contempo-
raneamente ed istantaneamente. Esattamente quando tutta lauto si trova a passare nel garage,
per un solo istante lauto viene chiusa nel garage dalle due porte, che poi si riaprono lasciando
lauto uscire dal garage senza incidenti.
Si consideri ora la descrizione del fenomeno data dal guidatore dellauto. Per lui il garage dovr`a
avere una lunghezza sicuramente inferiore a L
0
/2 per la contrazione di Lorentz. Come `e possibile,
a giudizio del guidatore, che lauto venga chiusa nel garage sia pure per un istante?
2. Nellesperimento ideale di sopra si supponga che invece della seconda porta, a parit`a di
tutte le altre condizioni, ci sia un muro impenetrabile e che lauto sia fatta di materiale fargilissi-
mo. Un osservatore in quiete con il garage vedr`a la porta (lunica rimasta) chiudersi dietro lauto
incolume un istante prima che essa si schianti contro il muro. Tenendo chiusa la porta, supposta
impenetrabile, tutti i pezzi dellauto rimangono nel garage. Per il guidatore invece ci`o non pu`o
accadere essendo il garage troppo corto: la porta dovrebbe abbattersi per tagliare parte del-
lauto prima che la punta si schianti contro il muro. Come mettere daccordo i due punti di vista?
72
4.3.3 Deformazione degli angoli.
Lequazione (4.19) permette di confrontare anche le deformazioni cinematiche degli angoli. Con-
sideriamo due sottovariet`a date da due segmenti
1
: u O+un
1
e
2
: u O+un
2
, u [0, 1]
uscenti dallo stesso punto O, con versori tangenti n
1
e n
2
e sia langolo (acuto) tra tali seg-
menti. Ovviamente cos =

1
n

2
. Le corrispondenti sottovariet`a

1
e

2
, avranno vettori
tangenti n

1
e n

2
formanti un angolo

, che nelle coordinate y


1
, y
2
, y
3
hanno le stesse componenti
n

1
e

2
(ma non saranno pi` u versori!). Avremo che, in virt` u di (4.19) e con le stesse notazioni
[n

1
[[n

2
[ cos

= n
1
n
2

(n
1
v)(n
2
v)
c
2
.
I moduli [n

1
[, [n

2
[ non sono altro che le norme dei vettori calcolate con la metrica spaziale di
F

. La struttura ane identica i moduli di tali vettori con le lunghezze di corrispondenti


segmenti. Possiamo quindi usare (4.21) per valutare questi moduli ottenendo la formula della
deformazione relativistica degli angoli:
cos

=
cos
(n
1
v)(n
2
v)
c
2
_
_
1
(n
1
v)
2
c
2
__
1
(n
2
v)
2
c
2
_
, (4.23)
dove, lo ricordiamo v = v
F

|F
.
Nota 4.3. In generale risulter`a ,=

. Tuttavia ci sono alcuni casi notevoli in cui sussiste


luguaglianza. (1) se n
1
e n
2
sono paralleli (cos = 1), e quindi il concetto di parallelismo
`e invariante al variare del riferimento inerziale quando sussista nel riferimento di quiete con
langolo. (2) oppure se ciascuno dei due vettori n
1
, n
2
`e o parallelo o ortogonale a v
F

|F
. In
particolare la condizione di ortogonalit`a non `e preservata al variare del riferimento.
73
Capitolo 5
Dinamica in Relativit`a Speciale:
covarianza delle leggi siche ed
equazioni della dinamica.
Ci occuperemo ora della formulazione della dinamica nella teoria della relativit`a speciale. Avre-
mo due principi guida. In realt`a useremo diverse altre ipotesi ad hoc strada facendo. In ogni
caso ci sono, come detto due grandi principi guida.
Uno `e il principio di relativit`a:
RS3. Principio di Relativit`a. Non `e in alcun modo possibile privilegiare un sistema di
riferimento nella classe dei sistemi di riferimento inerziali tramite i risultati di esperimenti di
sica.
In meccanica classica lanalogo principio ristretto alla meccanica veniva tradotto in termini
matematici richiedendo linvarianza della forma delle leggi della meccanica quando scritte in co-
ordinate cartesiane solidali con ogni sistema di riferimento inerziale. Un modo (ma non lunico)
di esprimere il principio di relativit`a `e quello di richiedere che le leggi siche siano descritte in
termini di tensori (pi` u in generale campi tensoriali). In tal modo, in componenti e rispetto a
coordinate minkowskiane associate ad ogni riferimento inerziale, la forma delle leggi siche `e
preservata. Questo principio cade sotto il nome di Principio di Covarianza. Esso `e equiv-
alente allaermazione che le leggi siche hanno forma invariante sotto lazione del gruppo di
Poincare ortocrono
1
. Si osservi che esistono formulazioni equivalenti della relativit`a che non
1
Pi` u precisamente si `e visto sperimentalmente negli anni 50 che il gruppo ortocrono contiene trasformazioni
(inversioni di parit` a) che non lasciano invariata la forma delle leggi siche: le leggi siche sono in realt` a invarianti
sotto lazione del sottogruppo di Poincare ortocrono proprio che introdurremo pi` u avanti. Esiste un teorema della
teoria quantistica relativistica che aerma che oltre allinvarianza sotto lazione del gruppo ortocrono proprio,
sussiste anche linvarianza sotto lazione combinata di inversione del tempo T, inversione di parit` a P e coniugazione
di carica C (operazione che consiste nello scambiare il segno di tutte le cariche elettriche). Tale teorema cade
sotto il nome di teorema PCT (vedi per es [22]).
74
sono formulate in termini di tensori e che preservano la forma delle leggi siche al variare del
riferimento inerziale, per esempio la formulazione hamiltoniana.
Il secondo pricipio di cui faremo uso `e il
Principio di corrispondenza. Le leggi della meccanica in relativit`a si devono ridurre a quelle
della meccanica classica nel limite di piccole velocit`a.
5.1 Nozione di massa, quadriforza e quadrimpulso per punti
materiali.
In base al principio di corrispondenza sopra citato, la denizione della massa di un punto ma-
teriale pu`o ancora essere data assumendo la validit`a della legge di conservazione dellimpulso
totale di un sistema di punti materiali nel limite di velocit`a piccole rispetto a quelle della luce:
le masse sono denite da rapporti di velocit`a una volta scelta la massa unitaria. Non `e impor-
tante il valore di tali velocit`a che possono essere piccole a piacere purche non tutte nulle. Si
osservi ancora che dal punto di vista sico possiamo controllare le condizioni iniziali assumendo
le velocit`a iniziali piccole a piacere, lavorando con intervalli di tempo sucientemente piccoli
tali velocit`a rimarranno piccole.
Nota 5.1. In realt`a, con questo approccio ci sono dei problemi (gi`a presenti classicamente)
quando si tenta di denire la massa di una particella carica, in quanto `e ben noto che le par-
ticelle cariche emettono onde elettromagnetiche nel momento in cui sono accelerate (anche se
la velocit`a `e nulla) e londa elettromagnetica sottrae impulso al sistema. Noi ignoreremo tale
problema pensando di lavorare con particelle prive di carica.
Denizione 5.1. (Punto materiale o particella.) Un punto materiale o particella `e
dato tramite lassegnazione di una linea di universo in M
4
, : (a, b) u (u) di tipo tempo
(futuro) detta linea di universo del punto materiale o particella, ed uno scalare m > 0
delle dimensioni di un massa detto massa del punto materiale o particella.
Consideriamo dunque un punto materiale di linea di universo di massa m e supponiamo che
il punto sia sottoposto a qualche forma di interazione. Parametrizziamo la linea di universo del
punto materiale con il tempo proprio : = (). Ci aspettiamo dal principio di corrispondenza
che qualunque sia lequazione della dinamica, lavorando nel riferimento di quiete istantanea F

con la particella, ad un ssato valore del tempo proprio , essa assuma la forma
F

= m
dv

dt
.
Sopra v

sono le componenti della velocit`a del punto nel riferimento di quiete istantanea F

e
t `e la coordinata temporale di tale riferimento. Il vettore F

dipender`a dallambiente con cui


75
interagisce la particella. Nellistante considerato possiamo identicare dt con d:
F

= m
dv

d
.
Notiamo che abbiamo omesso la componente temporale, che in meccanica classica, e quindi
nel riferimento di quiete istantanea, non gioca alcun ruolo nelle equazioni della dinamica. Nel
riferimento di quiete istantanea, V

= v

, = 1 ed un semplice calcolo prova che


dv

d
=
dV

d
,
mentre
d
d
= 0 .
Quindi lequazione di sopra si riscrive, nel riferimento di quiete istantanea ed allistante consid-
erato:
F
i

= m
dV
i
d
.
dove abbiamo supposto che F
0

= 0. Descriviamo la stessa equazione di sopra in un altro sistema


di riferimento in cui la velocit`a della particella non `e nulla.
F
i
:=
i
j
F
j

dove `e la matrice di Lorentz che trasforma le coordinate del sistema di quiete nelle coordinate
di unaltro arbitrario sistema di riferimento inerziale. Siamo naturalmente portati ad assumere
che le equazioni della dinamica abbiano la forma, in ogni sistema di riferimento:
F
i
= m
dV
i
d
.
Anche valga il determinismo, cioe esista ununica soluzione una volta assegnate condizioni
iniziali in termini dellevento da cui esce la linea di universo e del vettore tangente di tale curva
nellevento considerato, assumeremo che F
i
siano funzioni note dellevento e del vettore tangente
alla curva in tale evento. Abbiamo quindi:
F
i
((), V ()) = m
dV
i
d
, (5.1)
Pi` u precisamente le 4 componenti F
i
devono essere viste come denenti un campo vettoriale
diereziabile sulla variet`a TM
4
, le rimanenti 4 componenti avendo forma ovvia in modo da
produrre il sistema del primordine su TM
4
:
_
F
i
((), V ()) = m
dV
i
d
,
mV
i
= m
d
i
d
.
(5.2)
76
Si osservi che ora lesistenza e lunicit`a della soluzione `e assicurata, ma niente ci assicura che (a)
la soluzione sia una curva di tipo tempo futuro e che (b) sia il tempo proprio (che equivale a
dire V
i
V
i
= c
2
ovunque sulla soluzione).
Daltra parte ci ricordiamo che rimane un vincolo da imporre sul vettore F: cioe che nel sistema
di quiete della particella, la componente temporale si annulli. Tale vincolo pu`o esprimersi con
la richiesta
F
i
(p, S)S
i
= 0 , (5.3)
per ogni scelta di (p, S) TM
4
tale che S
i
S
i
= c
2
e S `e diretto verso il futuro. Infatti
(5.3) `e una condizione che non dipende dalle coordinate minkowskiane usate e se espressa nel
riferimento di quiete istantanea dice proprio che
F
0
((), V ()) = 0 .
Si osservi che in realt`a la richiesta (5.3) `e necessaria quando si assume, come facciamo noi,
che la massa m della particella non dipenda dal tempo (proprio) e che la curva soluzione delle
equazioni sia una linea di universo di tipo tempo. Infatti dallequazione
V
i
V
i
= c
2
segue subito che
V
i
dV
i
d
= 0
da cui, segue subito la (5.3) se si assume (5.2) e tenuto conto che la quadrivelocit`a in ogni evento
pu`o essere scelta arbitrarimante rispettando V
i
V
i
= c
2
e lorientazione nel futuro. Il punto
importante `e che vale anche il viceversa:
Proposizione 5.1. Si consideri un campo vettoriale dierenziabile su TM
4
denito da, in un
sistema di coordinate globali naturali indotte da un sistema di coordinate minkowskiane su M
4
:
F

:= F
i
((p, S))

x
k
+mS
i

S
k
con m ,= 0 che soddis il vincolo:
F
i
((p, S))S
i
= 0
per ogni (p, S) TM
4
tale che (S, S) = c
2
e S I
+
p
. Si considerino una curva integrale di
tale campo, ossia (a, b) u ((u), S(u)) TM
4
soddisfacente
_
F
i
((u), S(u)) = m
dS
i
du
,
mS
i
= m
d
i
du
.
Se per u = u
0
(a, b) vale (S(u
0
)[S(u
0
)) = c
2
e S(u
0
) I
+
p
allora la curva `e una linea di
universo di tipo tempo, u `e il tempo proprio e S la quadrivelocit`a.
77
Dimostrazione. Essendo m ,= 0, lequazione del vincolo, su una soluzione del sistema di sopra
implica immediatamente
d
du
S
i
(u)S
i
(u) = 0 .
Di conseguenza
S
i
(u)S
i
(u) = S
i
(u
0
)S
i
(u
0
) = c
2
.
Ulteriormente, se F `e un riferimento inerziale, dato che
F
e S sono entrambi di tipo tempo la
funzione u (
F
[S(u)) `e non nulla per ogni u (a, b) dalla proposizione 3.2. Il segno `e quello
ssato da (
F
[S(u
0
)). Tale segno `e negativo perche S(u
0
) punta verso il futuro, ma allora per
ogni u (a, b), S(u) punta verso il futuro. Concludiamo che S(u) `e parallelo e orientato tempo-
ralmente come la quadrivelocit`a

= V , avendo anche la stessa lunghezza (S


i
(u)S
i
(u) = c
2
)
deve coincidere con V . Di conseguenza u = + costante. 2
Possiamo dare la seguente denizione:
Denizione 5.2. (Quadri forza.) Un campo vettoriale dierenziabile su TM
4
della for-
ma, in un sistema di coordinate naturali di tale variet`a indotte da un sistema di coordinate
minkowskiane su M
4
,
F := F
i
(p, S)

x
i
+mS
i

S
i
dove m > 0 `e una costante delle dimensioni di una massa, `e detto quadriforza agente su un
punto materiale di massa m, se soddisfa il vincolo
F
i
(p, S)S
i
= 0
per ogni (p, S) TM
4
con S
i
S
i
= c
2
e S I
+
p
.
Possiamo quindi enunciare la prima delle leggi della dinamica relativistica per punti materiali
sottoposti a forze esterne.
DRS1. Le linee di universo delle particelle di massa m sono determinate risolvendo lequazione
F
i
((), V ()) = m
dV
i
d
,
dove il primo membro `e la quadriforza agente sulla particella considerata.
Torna utile la seguente denizione che generalizza la nozione di impulso in meccanica classica.
Denizione 5.3. (Quadri impulso.) Data una particella con linea di universo = (),
(a, b), e massa m > 0 il campo vettoriale tangente alla curva e diretto verso il futuro denito
da
P := mV ,
78
`e detto quadri impulso associato alla particella.
Commenti 5.1.
(1) Il quadri impulso soddifa ovunque sulla linea di universo:
P
i
P
i
= m
2
c
2
. (5.4)
(2) Il quadri impulso pu`o anche essere assegnato a particelle di massa nulla (tipicamente fotoni
trattati per quanto possibile non quantisticamente).
`
E necessaria una regola, per il tipo di
particella di massa nulla assegnato, che selezioni un vettore tangente (di tipo luce futuro) alla
linea di universo della particella le cui componenti abbiano dimensioni di un impulso. Nel
caso dei fotoni questo viene fatto in funzione della frequenza e del vettore donda dellonda
associata alla particella. Fissato un riferimento inerziale F e in esso un sistema di coordinate
minkowskiane, rispetto a tali coordinate:
P
0
= /c e P

:= k

,
dove `e la frequenza dellonda associata al fotone misurata nel riferimento F, k

sono le
componenti spaziali del vettore donda e = h/(2) essendo h = 6.626 10
27
erg sec la costante
di Planck. A causa delle relazioni ben note = c[k[, risulta P
i
P
i
= 0.
Nel caso di massa nulla (5.4) diventa ovviamente:
P
i
P
i
= 0 . (5.5)
Lestensione di DRS1 al caso di particelle senza massa `e molto pi` u complesso e non ce ne oc-
cuperemo.
(3) Le componenti spaziali del quadri impulso, riferite a coordinate minkowskiane di un riferi-
mento inerziale e per una particella con massa non nulla, sono
P

= mv

=
mv
_
1
v
2
c
2
,
dove v `e la velocit`a della particella nel riferimento considerato. Nel regime di piccole velocit`a
(rispetto a quella della luce), le componenti spazali di P si riducono alle componenti dellimpulso
classico come ci si aspetta in conformit`a del principio di corrispondenza. Pi` u complicato `e il
signicato della componente temporale che studieremo sotto.
(4) Nelle vecchie trattazioni della relativit`a lequazione di sopra si riscriveva
P

= m(v)v ,
dove
m(v) :=
m
_
1
v
2
c
2
era la cosidetta massa relativistica che si contrapponeva alla massa di quiete m. Questa prolif-
erazione dei concetti di massa `e caduta in disuso con gli anni.
79
5.1.1 Teorema delle forze vive relativistico.
Ci occupiamo ora di stabilire il signicato sico della componente temporale dellequazione del
moto (5.1) in un generico sistema di riferimento che non `e in quiete (istantanea) con la particella
e della componente temporale del quadrimpulso.
Il vincolo (5.3) in un sistema di coordinate suddetto si scrive esplicitamente
cF
0
+

= 0
ossia
cF
0
=

.
Di conseguenza la componente temporale di (5.1) risulta essere scrivibile come

=
d
d
mc
2
,
Notiamo che
d
d
=
d
dt
e
(v/c) = 1 +v
2
/(2c
2
) +o((v/c)
4
) .
Se trascuriamo nelle formule di sopra le potenze di v/c ad ordini superiori al secondo e poniamo
F v :=

, si ritrova lidentit`a
F v =
d
dt
_
mc
2
+
1
2
mv
2
_
.
Questo `e il teorema delle forze vive che aerma che la potenza uguaglia la derivata temporale
dellenergia cinetica se si trascura il termine costante mc
2
che non fornisce comunque contrib-
uto al secondo membro per lazione della derivata, e se si pensano le componenti spaziali della
quadriforza F

come componenti di una forza classica. Quindi la componente temporale delle-


quazione (5.1) `e una generalizzazione relativistica del teorema delle forze vive. Ulteriormente,
se P
0
`e la componente temporale del quadri impulso,
T := cP
0
mc
2
si pu`o pensare come la generalizzazione relativistica dellenergia cinetica della particella in quan-
to si riduce ad essa nel caso di velocit`a basse rispetto a c. Nello stesso modo cF
0
deve essere
pensata come una generalizzazione della potenza al caso relativistico: si tratta dellenergia mec-
canica ceduta al punto materiale per unit`a di tempo proprio.
Mettiamo tutto insieme in una denizione che includa anche le denizioni di impulso e forza
relativistica.
80
Denizione 5.4. (Impulso, energia cinetica, forza e potenza relativistica.) Data una
particella con linea di universo = (), (a, b) e massa m e ssato un riferimento inerziale
F, limpulso e lenergia cinetica (relativistici) della particella rispetto al riferimento F sono
deniti rispettivamente come, per ogni evento su ,
p
F
:=

P , (5.6)
T
F
:= cP
0
mc
2
= c(P[
F
) mc
2
, (5.7)
dove P =

P +P
0

F
`e la decomposizione canonica indotta da F in ogni spazio tangente.
Se sulla particella agisce una quadriforza F, la forza e la potenza (relativistiche) rispetto al
riferimento F agenti sulla particella sono denite rispettivamente come, per ogni evento su
f
F
:=

F , (5.8)

F
:= cF
0
= c(F[
F
) , (5.9)
dove F =

F +F
0

F
`e la decomposizione canonica indotta da F in ogni spazio tangente.
Chiaramernte la componente temporale dellequazione (5.1) non `e altro che il teorema delle
forze vive relativistico:
Teorema 5.1. (Teorema delle forze vive.) Si consideri un punto materiale soggetto ad
una quadriforza F. In ogni riferimento inerziale F e per ogni istante di tempo proprio sulla
linea di universo del punto materiale valgono le equazioni:
f
F
v
F
=
F
, (5.10)

F
=
d
d
(mc
2
+T
F
) , (5.11)
dove indica il prodotto scalare negli spazi di quiete con F indotto dalla metrica spaziale di F.
Commenti 5.2.
(1) Una dierenza con il teorema classico `e che la derivata temporale `e riferita al tempo proprio.
(2) Nel sistema di quiete istantanea, il teorema delle forze vive si riduce ad una banalit`a:
0 = 0, perche la potenza dissipata in quel riferimento sul punto `e nulla. Tra poco esamineremo
unestensione dei concetti deniti, di fondamentale importanza dal punto di vista sico, in cui
la situazione sar`a completamente modicata.
(3) Nel caso di particella a massa nulla, semplicemente si denisce
T := cP
0
.
(4) Un altro modo di scrivere la formula dellenergia cinetica `e il seguente. Dato che vale
P
i
P
i
= m
2
c
2
, si ha:
cP
0
=

_
m
2
c
4
+c
2
3

=1
(P

)
2
, (5.12)
81
quindi
T =

_
m
2
c
4
+c
2
3

=1
(P

)
2
mc
2
.
`
E facile provare che se p := mv dove v `e la velocit`a rispetto al riferimento considerato, risulta
T =
p
2
2m
+mc
2
O
_
[p[
4
m
4
c
4
_
.
A meno di termini innitesimi del quarto ordine (p
2
/2m `e del secondo ordine), ritroviamo
lespressione classica dellenergia cinetica in termini dellimpulso. Nel caso di particelle a massa
nulla semplicemente risulta
T = c

_
3

=1
(P

)
2
,
Il limite a piccole velocit`a, o piccole componenti spaziali del quadri impulso, non `e di molto
interesse: le particelle senza massa hanno signicato solo relativistico.
5.2 Conservazione del quadri impulso e principio di equivalenza
massa-energia.
Se un punto materiale `e sottoposto ad una quadriforza nulla in un intervallo di tempo proprio,
la linea di universo del punto materiale `e un segmento di retta ane, cio`e un moto rettilineo
uniforme rispetto a qualche sistema di riferimento inerziale. Quello che pi` u ci interessa `e che il
quadri impulso `e conservato sulla linea di universo considerata. Quindi, rispetto ad un qualsiasi
sistema di riferimento inerziale lenergia cinetica relativistica e limpulso relativistico saranno
costanti del tempo proprio e quindi della coordinata temporale del riferimento.
5.2.1 Legge di conservazione del quadri impulso.
Vogliamo ora cercare di formulare la legge di conservazione del quadri impulso che generalizza
quella di conservazione dellimpulso e dellenergia per un sistema di punti materiali isolati al-
lesterno ma interagenti tra di essi. La formulazione pi` u elementare di tale principio sembrerebbe
consistere nella richiesta che il quadri impulso totale del sistema di punti materiali sia conservato
nel tempo di ogni riferimento inerziale. Le cose non sono tanto semplici perche non `e per nulla
ovvio come denire il quadri impulso totale. Il passaggio dalla meccanica del punto a quella di
un sistema di punti non `e per nulla ovvia quanto lo era in meccanica classica. Ci`o `e dovuto al
fatto che in generale non possiamo pi` u banalmente denire delle quantit`a totali, come il quadri
impulso totale o la quadriforza totale, sommando le rispettive quantit`a associate a singoli punti
82
materiali. Vediamo perche. Prima di tutto dobbiamo decidere quali eventi considerare sulla linea
di universo di ciascuna particella su cui leggere il quadri impulso per eseguire le somme dei vari
quadri impulsi. Prendiamo a titolo di esempio il caso di due punti materiali isolati dallesterno,
ma che interagiscono tra di loro con interazioni a distanza. Assumiamo che linterazione a
distanza sia tale che le loro linee di universo, quando i punti sono abbastanza spazialmente
vicini, smettono di essere dei segmenti e si incurvano, per poi diventare nuovamente segmenti
quando i punti si sono sono sucientemente spazialmente allontanati. Cosa `e il quadri im-
pulso totale del sistema dei due punti? Dato che il quadri impulso totale in componenti sar`a
valutato da riferimenti, `e naturale pensare che la procedura per denirlo sia quella di sezionare
le due linee di universo ,

con le sottovariet`a
Ft
spazi di quiete di un riferimento inerziale
F. Il quadri impulso totale al tempo t dovrebbe essere denito come P
t
+ P

t
dove tali quadri
impulsi sono quelli valutati in
Ft
e
Ft

rispettivamente. Il principio di conservazione


del quadri impulso dovrebbe quindi consistere nella richiesta che P
t
+P

t
non dipenda da t.
Questa procedura di denire il quadri impulso totale e quindi enunciare la legge di conservazione
del quadri impulso per sistemi di punti matriali isolati allesterno non `e comunque una buona
procedura per due motivi importanti.
(a) Con la denizione data, il principio di conservazione dellimpulso relativistico in ogni rifer-
imento inerziale, che segue immediatamente dal principio di conservazione del quadri impulso,
sarebbe equivalente al principio di azione e reazione. Tuttavia, in assenza del tempo assoluto
e se le forze si esercitano a distanza, il principio di azione e reazione pu`o solo essere formulato
separatamente in ogni sistema di riferimento inerziale rispetto alla coordinata temporale di tale
riferimento. Tuttavia `e facile produrre esempi semplici in cui la validit`a del principio di azione
e reazione in un riferimento inerziale implica che tale principio non valga in un altro sitema di
riferimento inerziale. Concludendo, con la procedura indicata per dare le denizioni ed enuncia-
re il principio, avremmo che la validit`a del principio di conservazione del quadri impulso totale
dovrebbe dipendere dal riferimento inerziale in netto contrasto con il principio di relativit`a.
(b) Un secondo motivo per rigettare le denizioni e lenunciazione proposta del principio di con-
servazione del quadri impulso totale `e il seguente. Il quadri impulso totale denito come detto
dipender`a in generale dal riferimento a dierenza dei quadri impulsi dei singoli punti materiali
del sistema che contribuiscono a denirlo. Per provare ci`o consideriamo ancora il sistema dei due
punti materiali di sopra. Si ssi un evento p sulla linea di universo , nella regione di spaziotem-
po in cui avviene linterazione per cui cui le due linee non sono segmenti in . Tenendo sso
p scegliamo due spazi di quiete
1
,
2
riferiti rispettivamente a due diversi riferimenti inerziali
F
1
e F
2
e assumiamo che entrambi gli spazi intersechino la prima linea in p.
`
E chiaro che i due
spazi di quiete intersecheranno laltra linea di universo

in due eventi diversi q


1
in
1

e q
2
in
2

e q
1
,= q
2
. In q
1
e q
2
, in generale, i quadri impulsi del secondo punto materiale P

1
e P

2
saranno dierenti perche la linea di universo

non `e un segmento (a causa dellinterazione) e


non ha quindi vettore tangente costante. Di conseguenza la procedura suggerita sopra fornisce
due quadri impulsi totali P
p
+P

1
e P
p
+P

2
in generale diversi, indipendentemente dal fatto che
essi si conservino o meno al variare del tempo del corrispondente riferimento.
Eccettuata la situazione in cui i punti materiali del sistema non interagiscano oppure interagis-
83
cano con interazioni puntuali (cioe non a distanza) ed istantanee, i problemi posti sopra sono
eettivi e non si risolvono. In realt`a c`e un motivo profondamente sico che andiamo ad illus-
trare. Gi`a in elettrodinamica classica in cui le forze non sono a distanza, il tentativo analogo a
quello di sopra per denire limpulso totale di un insieme di cariche generalmente in moto fallisce
miseramente perche non include un contributo essenziale: limpulso del campo elettromagneti-
co. Il fallimento del principio di azione e reazione nellelettrodinamica, a causa della veloci`a
nita con cui si propagano le perturbazioni del campo elettromagnetico costringe ad attribuire
al campo elettromagnetico un contributo allimpulso totale del sistema se si vuole mantenere
valido il principio di conservazione dellimpulso. La stessa cosa accade per lenergia. In relativ-
it`a, non esistono velocit`a di propagazione di alcunche che possa denire relazioni causali nello
spaziotempo, a causa della struttura causale dello stesso. In particolare quindi, non solo sar`a
necessario attribuire un quadri impulso al campo elettromagnetico ma a qualsiasi campo che de-
scrive interazioni a distanza tra particelle. Quello che di fatto accade, ma che non pu`o essere
spiegato nei dettagli a questo livello, `e che ad ogni campo che descrive interazioni viene associato
un campo tensoriale doppio simmetrico detto tensore energia-impulso. Fissato un riferimento
inerziale ed un suo spazio di quiete, il tensore energia impulso denisce una densit`a di quadri
impulso su tale spazio di quiete che deve essere integrata spazialmente per dare luogo al quadri
impulso del campo valutato in quel riferimento ed allistante considerato. Il quadri impulso
totale, denito dalla somma dei quadri impulsi dei punti e del quadri impulso del campo, gode
di due propriet`a che risolvono i problemi di sopra: (1) esso non dipende dal riferimento inerziale
usato per eseguire la somma, (2) esso non dipende dal tempo del riferimento che etichetta lo
spazio di quiete: cio`e `e conservato.
Passiamo a considerare la situazione molto pi` u elementare, ma sicamente interessante in cui
le interazioni tra particelle sono puntuali ed istantanee, cioe avvengono in eventi isolati. In tal
caso non ci sono problemi con il principio di azione e reazione. In altre parole considereremo
sistemi di punti materiali le cui linee di universo sono segmenti di rette ani (o semirette) di M
4
di tipo tempo futuro e conuiscono o escono da singoli eventi. Assumeremo, in tutta generalit`a,
che per ogni evento in cui avvengono interazioni, il numero di linee di universo entranti ed il nu-
mero di linee di universo uscenti possano essere in numero (nito) diverso (nessuno dei due pu`o
comunque essere nullo). Ci`o sicamente corrisponde alla creazione o distruzione di particelle.
Tali fenomeni sono ammessi sia in meccanica classica (si pensi ai possibili fenomeni di urto di
palline di plastilina), sia in fenomeni connessi alla sica delle particelle atomiche e sub atomiche.
DRS2 (Principio di conservazione del quadri impulso per interazioni puntuali ed
istantanee) Si consideri un processo di interazione tra particelle nello spaziotempo M
4
descritto
in un intorno aperto dellevento s M
4
come segue. Ci sono N 0 linee di universo (di
tipo tempo futuro)
(i)
: (
(i)
,
(i)
] M
4
, i = 1, . . . , N ed altre M 0 linee di universo (di tipo
tempo futuro)

(j)
: [

(j)
,

(j)
) M
4
, j = 1, . . . , M corrispondenti al moto rettilineo uniforme
in qualche riferimento inerziale di corrispondenti punti materiali, tali che
lim
u
+
i

(i)
(u) e
(i)
(
i
) = s per ogni i = 1, . . . , N
84
e

(j)
(

j
) = s e lim
u

(j)
(u) per ogni j = 1, . . . , M
In tale processo, se P
i
sono i quadri impulsi sulle linee di universo
i
e P

j
sono i quadri impulsi
sulle linee di universo

j
vale che il quadri impulso totale prima dellinterazione uguaglia
quello totale dopo linterazione:
N

i=1
P
i
=
M

j=1
P

j
. (5.13)
Commenti 5.3.
(1)
`
E importante notare che le linee di universo primate sono necessariamente nel futuro causale
di s mentre quelle non primate sono nel passato causale si s per la proposizione 2.6. Di con-
seguenza ogni riferimento inerziale descriver`a le linee di universo
i
come quelle delle particelle
prima dellinterazione e le linee di universo

j
come quelle delle particelle dopo linterazione. Per
lo stesso motivo ogni riferimento inerziale interpreter`a

N
i=1
P
i
come il quadri impulso totale
prima dellinterazione e

M
j=1
P

j
come il quadri impulso totale dopo linterazione.
(2) Se F S ha uno spazio di quiete
Ft
che interseca tutte le linee
i
ma non s allora tale
spazio di quiete non pu`o avere intersezione con le linee

j
. Se ci`o fosse, avremmo due eventi
spazialmente separati (perche appartenenti alla stesso spazio di quiete e non coincidenti avendo
coordinata temporale dierente) che devono essere anche causalmente connessi per lesercizio
3.1.2 (o 3.1.3 se qualche linea di universo `e di tipo luce), e ci`o `e impossibile. Se
Ft
contiene s,
ovviamente non pu`o contenere altri punti delle linee di universo. Se
Ft
interseca tutte le linee

j
ma non s allora tale spazio di quiete non pu`o avere intersezione con le linee
i
similmente a
sopra. In tal modo, dato che i quadri impulsi sono costanti sulle linee di universo, il quadri im-
pulso totale iniziale

N
i=1
P
i
si pu`o eettivamente calcolare sommando i quadri impulsi nei punti
di intersezione con le
i
tra uno spazio di quiete qualsiasi di qualsiasi riferimento inerziale (che
abbia intersezione con tutte le
j
). Nello stesso modo, il quadri impulso totale nale

M
j=1
P

j
si
pu`o eettivamente calcolare sommando i quadri impulsi nei punti di intersezione con le

j
tra
uno spazio di quiete qualsiasi di qualsiasi riferimento inerziale (che abbia intersezione con tutte
le

i
).
(3) Se qualche linea di universo `e di tipo luce, il principio di conservazione del quadri impulso
totale per interazioni puntuali ed istantanee si estende banalmente purche ovviamente siano
deniti i quadri impulsi sulle linee di universo di tipo nullo.
(4) Il principio di conservazione del quadri impulso totale si applica al caso seguente in par-
ticolare. Si consideri un diagramma dinterazione nello spaziotempo M
4
costituito da una
rete i cui rami elementari detti gambe sono un numero nito tra segmenti (non degeneri) e
semirette di M
4
, tutti di tipo causale futuro e i cui nodi detti vertici sono eventi isolati e sono
dati dai punti estremi delle gambe. Vi sono due tipi di gambe: quelle esterne date da semirette
e quelle interne denite dai segmenti. Una gamba si dice: uscente da un vertice se i punti della
gamba sono nel futuro causale del vertice, entrante in un vertice se i punti della gamba sono
85
nel passato causale del vertice. (I punti interni a segmenti o semirette che siano attraversati dal
solo segmento o semiretta considerati non sono vertici per denizione.)
Una rete di questo tipo descrive un processo di scattering o diusione di un numero nito
di particelle che evolvono liberamente lungo le linee di universo date dalle gambe entranti, in-
teragiscono puntualmente ed istantaneamente tra di loro nei vertici e i prodotti dellinterazione
tornano ad evolvere liberamente, come particelle uscenti dal processo, lungo le gambe uscenti
della rete.
Consideriamo, in un diagrama di interazione come quello denito sopra, un vertice s e un in-
torno di s che non contenga altri vertici e gambe che non passano per s. Ammettendo che
il diagramma descriva un processo di interazione tra particelle e che quindi ogni linea di uni-
verso del diagramma abbia associato un quadri impulso, in possiamo imporre il principio di
conservazione del quadri impulso DRS2 e fare altrettanto per ogni altro vertice del diagramma
dinterazione.
Se tale principio `e valido per il diagramma considerato si pu`o vericare che vale il seguente fatto.
Consideriamo F S e un suo spazio di quiete
Ft
. Le intersezioni tra tale spazio di quiete ed
il diagramma sono costituite da un numero nito di punti. La somma dei quadri impulsi deniti
su tali punti (associati alle corrispondenti linee di universo) non dipende n`e dallo spazio di quiete

Ft
e nemmeno dal riferimento inerziale F. Tale quadri impulso `e il quadri impulso totale del
sistema. In particolare, andando sucientemente indietro nel tempo,
Ft
intersecher`a solo
gambe esterne entranti. In tal modo il quadri impulso totale coincide con il quadri impulso
totale delle particelle entranti. Nello stesso modo il quadri impulso totale risulta coincidere con
il quadri impulso totale delle particelle uscenti.
Esercizi 5.1.
1. Mostrare che in un diagramma di interazione come quello denito nel punto (4) sopra,
se `e valido DRS2, non ci possono essere vertici senza linee entranti oppure senza linee uscenti.
Intepretare sicamente il risultato come limpossibilit`a della creazione/sparizione (di che cosa?)
dal/nel nulla.
Suggerimento. Il punto cruciale `e che, in ogni riferimento inerziale, P
0
> 0 per ogni quadri
impulso di una particella anche a massa nulla. La somma di numeri positivi non pu`o mai
produrre il numero 0.
5.2.2 Il principio di equivalenza massa energia.
Il principio di conservazione del quadri impulso, anche nella sua forma elementare enunciata
sopra, ha delle conseguenze importantissime per quanto riguarda la relazione tra massa ed
energia.
Per illustrare tali conseguenze, consideriamo preventivamente la seguente situazione. Si consideri
un sistema di punti materiali (di massa non nulla) non interagenti tra di essi e isolati con lesterno,
con quadri impulsi P
(i)
e masse m
(i)
, i = 1, . . . , N.
`
E possibile trattare, matematicamente, il
sistema complessivo come un unico punto associando ad esso un unico quadri impulso ed una
unica massa. Dato che P :=

i
P
(i)
`e di tipo tempo futuro essendo tali i P
(i)
ed essendo un cono
86
ogni I
+
q
, per la proposizione 2.3, ci sar`a un unico riferimento inerziale F
G
con
F
G
parallelo a
P. Tale riferimento `e detto baricentrale. In tale riferimento solo la componente temporale di
P `e non nulla e vale:
M :=
P
0
c
=
N

i=1
m
(i)
+
N

i=1
T
F(i)
c
2
.
Se dunque vogliamo dare senso al concetto di massa totale del sistema per questa via, dobbiamo
denirla come la somma delle masse delle particelle componenti con laggiunta delle energie
cinetiche delle stesse particelle valutate nel riferimento baricentrale. In tal modo si vede che le
energie cinetiche danno sorprendentemente un contributo alla massa complessiva del sistema.
Si pu`o obiettare che in realt`a il discorso `e del tutto formale e che in realt`a non esiste alcun
punto materiale associato al sistema complessivo. Questo `e vero, ma la situazione cambia radi-
calmente con il seguente esempio dove le formule matematiche sono simili ma il signicato sico
`e profondamente diverso. Consideriamo un processo di decadimento di particelle comunemente
osservato in sica delle particelle. Una particella di massa M e quadri impulso P, istantanea-
mente e puntualmente decade in due particelle di masse m
1
, m
2
e quadri impulsi P
1
, P
2
. Prima
e dopo il decadimanto le particelle sono libere. Classicamante il fenomeno `e possibile solo se
M = m
1
+m
2
,
per la legge di addizione delle masse. Ulteriormente, sempre nel caso classico, lenergia cinetica
delle particelle nali se non `e nulla `e creata a spese di qualche forma di energia interna della
particella iniziale (per esempio energia chimica negli esplosivi). Relativisticamente ci sono altre
possibilit`a. Se ci poniamo nel sistema baricentrale delle due particelle nali, in tale riferimento
la particella iniziale di massa M `e vista in quiete (no a quando esiste) e gli impulsi delle due
particelle nali sono uguali ed opposti. La conservazione del quadri impulso in tale riferimento
ha come unica equazione non banale quella data dalla componente temporale:
M = m
1
+m
2
+
T
(1)
c
2
+
T
(2)
c
2
.
Questa equazione dice che la massa complessiva delle due particelle nali pu`o essere inferiore
alla massa della particella iniziale, e la dierenza di massa si trasforma in energia cinetica delle
particelle nali secono la celeberrima equazione di Einstein
E = mc
2
,
dove in questo casso E = T
(1)
+ T
(2)
`e unenergia cinetica e m = M m
1
m
2
`e la dierenza
delle masse.
Deve essere precisato che non solo leneunciato teorico del principio di conservazione del quadri
impulso ammette tali fenomeni in linea di principio, ma sperimentalmente si osservano eetti-
vamente fenomeni come quello suddetto in cui
m
1
+m
2
< M .
87
In tali casi la dierenza di massa `e davvero tramutata in energia cinetica secondo lequazione
di Einstein.
`
E fondamentale notare che lenergia cinetica non `e lunica forma di energia nota, ma ne es-
istono di diverso tipo: meccanica, chimica, termodinamica, ecc. Tali forme di energia si possono
trasformare luna nellaltra in conformit`a con la legge generale di conservazione dellenergia.
`
E
allora naturale formulare il:
Principio di equivalenza massa energia. Il contenuto complessivo energetico di un cor-
po, valutato in quiete con esso, corrisponde alla massa dello stesso corpo tramite lequazione:
E = mc
2
.
Tale principio, unito al principio di conservazione dellenergia, ha ricevuto e riceve continua-
mente nella sica delle alte energie molteplici conferme sperimentali ed `e oggi accettato come
vero.
Commenti 5.4.
(1) Come conseguenza della conservazione dellenergia e del principio di equivalenza massa en-
ergia, la massa cessa di essere una grandezza additiva e conservata. Ulteriormente sono possibili
trasmutazioni di massa in diverse forme di energia (nel rispetto dellequazione di Einstein).
(2) Consideriamo il processo inverso di quello studiato sopra, in cui due punti materiali macro-
scopici, per esempio due palline di plastilina, si scontrano nel riferimento baricentrale e danno
luogo ad un unico punto materiale fermo, con massa
M = m
1
+m
2
+
T
(1)
c
2
+
T
(2)
c
2
,
dove abbiamo usato la stessa notazione di sopra. Osserviamo che a causa del valore enorme di
c
2
, la dierenza M(m
1
+m
2
) risulta essere molto piccola nelle scale usuali di energie e masse.
Infatti dal punto di vista classico tale dierenza `e considerata nulla. Dal punto di vista classico si
aerma anche che lenergia cinetica T
(1)
+T
(2)
viene imagazzinata sotto forma di energia interna
nella particella di massa M nale: in questottica il punto nale `e in realt`a un sistema termod-
inamico. A conferma di tale fatto, in conformit`a con le propriet`a generali dellenergia interna
termodinamica, si assiste sperimentalmente ad un aumento della temperatura della particella
nale rispetto alla temperatura delle due particelle iniziali (supposte con la stessa temperatura).
Un modo naturale di fare coesistere i due punti di vista `e quello di aermare che la massa M
nale denisce il contenuto complessivo di energia della particella nel suo riferimento di quiete:
lenergia interna termodinamica `e inclusa nel calcolo di Mc
2
. In altre parole, se scaldiamo un
sistema termodinamico, quindi cedendogli energia non meccanica (senza variazioni di energia
cinetica), la massa del sistema deve aumentare di Q/c
2
dove Q `e la quantit`a complessiva di
energia non meccanica (calore) ceduta al sistema.
Da questo punto di vista si pu`o generalizzare la legge DRS1 denendo quadri forze non mecca-
niche ed assumendo variabile la massa del punto materiale soggetto alla quadriforza. Assumiamo
88
ancora valida
F =
dP
d
,
ma omettiamo il vincolo
(F[P) = 0
nella denizione di quadriforza. Lo scalare (F[P) valutato in un evento della linea di universo
del punto materiale risulta avere il valore
(F[P) = m()cF
0

dove il secondo membro `e riferito al sistema di riferimento istantaneamente in quiete con il punto
materiale. Quindi
Q := m
1
(F[P) = cF
0

misura lenergia non meccanica ceduta al punto materiale nel suo sistema di quiete istantanea e
per unit` a di tempo proprio. Dalla condizione
(P[P) = m
2
c
2
si ricava subito che vale:
Q =
d
d
m()c
2
. (5.14)
`
E immediato vericare che la stessa equazione si trova scrivendo la componente temporale del-
lequazione della dinamica nel riferimento di quiete istantanea della particella.
Si osservi che lassenza del vincolo (F[P) = 0 impone unequazione di pi` u sul moto della
particella: la componente temporale dellequazione della dinamica nel sistema di quiete della
particella non `e pi` u banale, ma diventa lequazione (5.14). Tuttavia, ora anche m = m() `e
una variabile del problema per cui il problema del moto risulta comunque essere determinato.
Per concludere, notiamo che nel caso di quadriforze completamente meccaniche, il vincolo (5.3)
comporta immediatamente la costanza della massa della particella attraverso la stessa (5.14).
Esercizi 5.2.
1. Pu`o una particella di massa M diminuire la sua massa ed aumentare la sua energia
cinetica spontaneamente in modo istantaneo e puntuale?
Suggerimento: si esamini la conservazione del quadri impulso nel riferimento di quiete con la
particella prima della trasformazione.
2. Un fotone pu`o trasformarsi spontaneamente, istantaneamente e puntualmente in due
particelle di massa non nulla?
Suggerimento: si esamini la conservazione del quadri impulso nel riferimento baricentrale della
coppia di particella dopo la trasformazione.
3. Si consideri una quadriforza non totalmente meccanica F, la si decomponga in parte
meccanica e parte non meccanica come
F = F
m
+F
nm
89
dove
F
nm
:=
(P[F)P
m
2
c
2
.
Mostrare che il teorema delle forze vive ora assume la forma
f
Fm
v
F
+Q =
d
d
(mc
2
+T
F
) ,
dove la forza relativistica f
Fm
`e riferita alla sola parte meccanica della quadriforza.
Concludere che vale anche la forma completamente meccanica del teorema delle forze vive:
f
Fm
v
F
=
d
d
T
F
.
Suggerimento: Esplicitare la componente temporale della legge della dinamica in un arbitrario
riferimento F, quindi notare che per costruzione (F
m
[P) = 0 e scrivere tale equazione come
una relazione tra F
0
m
e f
Fm
v
F
. Lultima relazione da provare segue dalla prima relazione da
provare e da (5.14).
4. Nei processi di fusione nucleare, due nuclei si fondono per dare luogo a un unico nucleo
nale. La massa del nucleo nale `e inferiore alla somma delle masse dei due nulclei iniziali: si
ha cio`e un difetto di massa. Cercare di spiegare in termini semiclassici, tenendo conto che lo
stato nale si pu`o considerare come uno stato legato, perche tale difetto di massa appare. Dove
`e nita la massa che manca?
Suggerimento: Lenergia meccanica del sistema nale si pu`o pensare come data dai contributi
delle due masse pi` u lenergia meccanica del sistema (potenziale + cinetica). Per liberare i
due nuclei dallo stato legato bisogna compiere del lavoro positivo sul sistema per cui lenergia
meccanica `e negativa.
90
Capitolo 6
Elementi di teoria dei gruppi di Lie
matriciali.
In questo capitolo vedremo alcune propriet`a dei gruppi di Lie matriciali che poi applicheremo
nel caso del gruppo di Lorentz.
6.1 Richiami sui gruppi di Lie.
Denizione 6.1. (Gruppo di Lie.) Un gruppo di Lie `e una variet`a dierenziabile (di
classe C

) G dotata di applicazioni dierenziabili


: G g g
1
G,
e
: GG (g, h) gh G,
dove G G `e dotata della struttura dierenziabile prodotto, tali che (G, , ) sia un gruppo in
cui `e la moltiplicazione gruppale e `e la funzione che associa linverso ad ogni elemento del
gruppo.
Nota 6.1. La richiesta di dierenziabilit`a pu`o essere indebolita no a considerare gruppi, che
diremo topologici, che siano solamente variet`a di classe C
0
(variet`a topologiche) con operazioni
di gruppo continue rispetto alla topologia del della variet`a. Viceversa su alcuni testi la richiesta
di dierenziabilit`a `e raorzata con quella di analiticit`a: si richiede cio`e che la variet`a sia una
variet`a analitica (C

) e che le operazioni di gruppo siano funzioni analitiche. Se si accetta la


denizione di gruppo di Lie che abbiamo dato noi, i gruppi di Lie con struttura C

appena
introdotti vengono detti gruppi di Lie analitici. In realt`a queste denizioni apparentemente di-
verse sono tutte equivalenti a causa di un famoso teorema di Gleason, Montgomery e Zippin del
1952. Tale teorema prova che ogni gruppo topologico ammette sempre una sotto-struttura dif-
ferenziabile di classe analitica C

rispetto a cui le operazioni di gruppo sono funzioni analitiche


91
e tale struttura `e univocamente determinata.
Consideriamo un elemento g G, esso denisce unapplicazione dierenziabile P
g
: G h
P
g
(h) = gh. Quindi, se P
g
:= dP
g
, P
g
: T
h
G T
gh
G. Ulteriormente dalle propriet`a del
dierenziale vale P
fg
= P
f
P
g
. Fissato A T
1
G, possiamo allora considerare lequazione
dierenziale del primordine
df
dt
= P
f(t)
A.
con la condizione iniziale f(0) = 1 elemento neutro di G.
In base ai noti teoremi di esistenza ed unicit`a una soluzione f = f
A
(t) esiste ed `e unica local-
mente. Consideriamo ora la funzione, per t

R ssato t H(t) := f
A
(t

)f
A
(t). Se deriviamo
in t avremo:
H(t) = f
A
(t

)f
A
(t) = P
f
A
(t

)
(f
A
(t))
per come `e denita P e quindi segue che
dH(t)
dt
=
df
A
(t

)f
A
(t)
dt
= P
f
A
(t

)
df
A
(t)
dt
= P
f
A
(t

)
P
f
A
(t)
A = P
H(t)
A.
Daltra parte la funzione t H

(t) := f
A
(t

+t) soddisfa la stessa equazione dierenziale:


dH

(t)
dt
=
df
A
(t

+t)
dt
=
df
A
(t

+t)
d(t

+t)
= P
f
A
(t

+t)
A = P
H

(t)
A.
e vale la condizione iniziale comune H(0) = H

(0) = f
A
(t

). Per il teorema di unicit`a conclu-


diamo che H(t) = H

(t) ossia, per ogni A T


1
G vale la propriet`a di sottogruppo ad un
parametro
f
A
(t

)f
A
(t) = f
A
(t

+t)( = f
A
(t)f
A
(t

) )
purche t, t

, t

+ t appartengano al dominio della soluzione. La soluzione pu`o essere estesa in


una soluzione massimale (che `e sicuramente completa se G `e compatto usando la propriet`a di
sottogruppo ad un parametro).
Denizione 6.2. (Sottogruppo ad un parametro.) Sia G un gruppo di Lie. Per ogni
vettore A T
1
G, la soluzione massimale dellequazione
df
dt
= P
f(t)
A,
indicata con
t exp(tA)
`e detta sottogruppo ad un parametro generato da A.
Nota 6.2. Si osservi che in particolare (exp(tA))
1
= exp(tA) purch`e sia t che t ap-
partengano al dominio della funzione.
92
Consideriamo ora A T
1
G ssato e la classe di applicazioni parametrizzate per t denito in un
intorno di 0:
F
t,A
: G g exp(tA) g exp(tA)
Dato che F
t,A
(1) = 1, il dierenziale dF
t,A
[
1
denisce unapplicazione da T
1
G nello spazio tan-
gente al punto exp(tA) 1 exp(tA) cio`e T
1
G.
Denizione 6.3. (Aggiunto e commutatore.) Sia G un gruppo di Lie e si ponga, per
A T
1
G,
F
t,A
: G g exp(tA) g exp(tA) .
(a) Il dierenziale dF
t,A
[
1
indicato con
Ad F
t,A
: T
1
G T
1
G,
e detto laggiunto di F
t,A
.
(b) Il commutatore `e lapplicazione da T
1
GT
1
G in T
1
G data da
[A, B] :=
d
dt
[
t=0
(Ad F
t,A
) B .
per ogni coppia A, B T
1
G.
Proposizione 6.1. In riferimento alle denizioni date si vericano facilmente le seguenti
propriet`a del commutatore, la linearit` a a sinistra:
[aA+bB, C] = a[A, C] +b[B, C]
lantisimmetria:
[A, B] = [B, A]
(questa implica che la linearit` a valga anche a destra) e lidentit`a di Jacobi:
[A, [B, C]] + [B, [C, A]] + [C, [A, B]] = 0
dove A, B, C T
1
G e a, b R sono arbitrari.
Dimostrazione. Vedi [23] 2.
Nota 6.3. Si noti che la linearit`a a sinistra e lanti simmetria implicano immediatamente la
linearit`a a destra, per cui il commutatore `e bilineare.
Denizione 6.4. (Algebre di Lie.) La struttura algebrica data da uno spazio vettoriale V
con unapplicazione, detta commutatore, , : V V V che gode delle propriet`a di linearit`a
a sinistra, antisimmetria e identit`a di Jacobi `e detta algebra di Lie. Ulteriormente:
(a) date due algebre di Lie (V, , ) e (V

, ,

), un isomorsmo di spazi vettoriali : V V

`e
93
detto isomorsmo di algebre di Lie se conserva la struttura di algebra di Lie, ossia soddisfa
anche (A), (B)

= (A, B) per ogni A, B V ;


(b) se G `e un gruppo di Lie, lalgebra di Lie costituita dallo spazio tangente T
1
G insieme al
commutatore [ , ] di denizione 6.3 `e detta algebra di Lie del gruppo G.
Un famoso teorema dovuto a Lie prova che:
Teorema 6.1. (Teorema di Lie.) Se due gruppi di Lie G e G

hanno algebre di Lie isomorfe


allora esiste un dieomorsmo da un intorno dellidentit`a di G ad un intorno dellidentit`a di G

che `e isomorsmo di gruppo: tali gruppi di Lie sono detti localmente isomor.
Inoltre per ogni algebra di Lie c`e un gruppo di Lie semplicemente connesso che ammette tale
algebra di Lie come algebra di Lie del gruppo, tale gruppo `e determinato a meno di isomorsmi
di gruppi di Lie, cio`e di dieomorsmi che sono anche isomorsmi gruppali.
Dimostrazione. Vedi [23] 2.
Denizione 6.5. (Sottogruppo di Lie.) Se G `e un gruppo di Lie e G

G `e una sottova-
riet`a embedded di G che `e ancora gruppo rispetto alle operazioni di gruppo di G ristrette a G

,
allora G

acquista naturalmente una struttura di gruppo di Lie indotta da quella di G e si dice


sottogruppo di Lie di G.
Commenti 6.1.
(1)
`
E immediato provare che lalgebra di Lie di G

risulta essere una sottoalgebra di Lie di


G, nel senso che T
1
G

`e sottospazio vettoriale di T
1
G e il commutatore su T
1
G

`e la restrizione
del commutatore di T
1
G a T
1
G

.
(2) Esiste un teorema molto potente (es. vedi [24]) che assicura che ogni sottogruppo chiuso
K di un gruppo di Lie analitico G `e un sottogruppo di Lie analitico di G. La dimostrazione
richiede tecniche avanzate. In realt`a il teorema ha validit`a generale per gruppi di Lie con la
nostra denizione: la richiesta di analiticit`a pu`o essere omessa a causa del teorema di Gleason,
Montgomery e Zippin che assicura che ogni gruppo di Lie `e anche un gruppo analitico di Lie
rispetto ad una struttura dierenziabile analitica univocamente determinata.
In virt` u dellultimo commento possiamo eneunciare il seguente fondamentale teorema.
Teorema 6.2. Se G

G `e sottogruppo chiuso del gruppo di Lie G, allora `e anche sottogrup-


po di Lie di G. .
Esercizi 6.1.
1. Se G `e un gruppo di Lie e A
1
, . . . A
n
`e una base nella sua algebra di Lie, essendo il
commutatore bilineare sullalgebra a valori nellalgebra, deve essere rappresentato da un tensore
C T

1
GT

1
GT
1
G
94
In componenti
[A
i
, A
j
] = C
ij
k
A
k
.
Le componenti di T sono dette costanti di struttura del gruppo.
Dimostrare che se due gruppi di Lie hanno le stesse costanti di struttura rispetto a due basi
nelle rispettive algebre di Lie allora sono localmente isomor nel senso del teorema di Lie.
Suggerimento: Provare che lapplicazione lineare che identica le due basi `e un isomorsmo
di algebre di Lie.
2. Sia G un gruppo di Lie e sia A
1
, . . . , A
n
una base della sua algebra di Lie. Si consideri
lapplicazione denita su un intorno sucientemente piccolo dellorigine di R
n
F : (x
1
, . . . , x
n
) e
P
n
k=1
x
n
A
n
.
Dimostrare che tale applicazione (1) `e ben denita, cio`e lintorno sucientmente piccolo di cui
sopra esiste davvero, e che (2) denisce un sistema di coordinate della struttura dierenziabile
di G nellintorno dellidentit`a del gruppo. Tale sistema di coordinate viene detto sistema di
coordinate di prima specie.
Suggerimento: dai teoremi sulla dipendenza dai parametri dellequazione nelle soluzioni delle
equazioni dierenziali del primordine su variet`a segue che la funzione detta `e localmente ben
denita. Inoltre, se e
1
, . . . , e
n
`e la base canonica di R
n
, dF
0
: e
i
A
i
per ogni i = 1, . . . , n, per
cui dF
0
: R
n
T
1
G `e iniettiva (e quindi surgettiva essendo i due spazi delle stesse dimensioni).
Il teorema della funzione implicita implica subito che F sia un dieomorsmo locale tra R
n
e G
a valori in un intorno di 1 G.
3. Sia G un gruppo di Lie e sia A
1
, . . . , A
n
una base della sua algebra di Lie. Si consideri
lapplicazione denita su un intorno sucientemente piccolo dellorigine di R
n
H : (x
1
, . . . , x
n
) e
x
1
A
1
e
x
n
A
n
.
Dimostrare che tale applicazione (1) `e ben denita, cio`e lintorno sucientemente piccolo di cui
sopra esiste davvero e che (2) denisce un sistema di coordinate della struttura dierenziabile
di G nellintorno dellidentit`a del gruppo. Tale sistema di coordinate viene detto sistema di
corodinate di seconda specie.
Suggerimento: Ognuno dei gruppi ad un parametro x
i
e
x
i
A
i
`e denito per x
i
in un intorno
di 0, per cui c`e un intorno rettangolare dellorigine di R
n
in cui la funzione `e denita. Inoltre,
se e
1
, . . . , e
n
`e la base canonica di R
n
, si prova facilmente che dH
0
: e
i
A
i
per costruzione
per ogni i = 1, . . . , n, per cui dH
0
: R
n
T
1
G `e iniettiva (e quindi surgettiva essendo i due
spazi delle stesse dimensioni). Il teorema della funzione implicita implica subito che H sia un
dieomorsmo locale tra R
n
e G a valori in un intorno di 1 G.
6.2 Gruppi di Lie di matrici.
Passiamo a specializzare la teoria a gruppi di Lie di matrici.
`
E importante precisare che questa
non `e una forte restrizione in quanto si pu`o provare che ogni gruppo di Lie compatto `e isomorfo ad
95
un gruppo di Lie matriciale (per quelli non compatti il teorema non vale, un controesempio tipico
`e il rivestimento universale del gruppo SL(2, R)). Nel seguito GL(n, K) indicher`a il gruppo delle
matrici n n non singolari (cio`e con determinante non nullo) sul campo K e M(n, K) indicher`a
linsieme completo delle matrici n n sul campo K che `e sempre R oppure C.
Le coordinate naturali di K
n
2
, x
1
, . . . , x
n
2
determinano una matrice di M(n, K) se si identicano
le righe di questultima come gli n gruppi di coordinate contigui di n elementi. Dora in poi
seguiremo questa convenzione.
Possiamo mettere su M(n, K) la topologia indotta dalla norma naturale di K
n
2
che lo rende
spazio normato completo. Possiamo riscrivere tale norma come, se A M(n, K):
[[A[[ :=

_
n

i,j=1
[A
ij
[
2
.
Abbiamo ora bisogno di alcuni risultati riguardanti lestensione della funzione esponenziale a
valori in M(n, C). Tali risultati sono enunciati in tre lemmi di seguito. Il primo `e in realt`a pi` u
generale.
Lemma 6.1. Si consideri lapplicazione
M(n, K) A [[A[[ :=

_
n

i,j=1
[A
ij
[
2
.
con K = C o R. Valgono le seguenti propriet`a.
(1) Tale applicazione `e una norma su M(n, K).
(2) Se A, B M(n, K) allora
[[AB[[ [[A[[[[B[[ .
(3) Lo spazio M(n, C) dotato della norma detta sopra `e completo.
(4) Se K z A(z) M(n, R) `e una funzione arbitraria a valori in M(n, R), allora
lim
zz
0
A(z) = A
0
se e solo se per ogni i, k = 1, . . . , n
lim
zz
0
(A(z))
ik
= (A
0
)
ik
.

Dimostrazione. (1) Lapplicazione denita sopra non `e altro che la norma di K


n
2
scritta in
modo dierente. (2)
[[AB[[
2
=
n

i,j,k=1
[A
ij
B
jk
[
2
=
n

i,j,k=1
[A
ij
[
2
[B
jk
[
2

i,k=1

j
[A
ij
[
4

p
[B
pk
[
4
,
96
dove abbiamo applicato la disuguaglianza di Cauchy-Schwartz. Si tenga ora conto che banal-
mente (basta quadrare ambo membri):

j
[A
ij
[
4

j
[A
ij
[
2
e vale la stessa cosa per B. Per cui dalle disuguaglianze di sopra
[[AB[[
2
=
n

i,j,k=1
[A
ij
B
jk
[
2

i,k=1

j
[A
ij
[
2

p
[B
pk
[
2

i,j=1
[A
ij
[
2
n

k,p=1
[B
pk
[
2
che signica
[[AB[[
2
[[A[[
2
[[B[[
2
.
Estraendo la radice quadrata ad ambo membri si ha la tesi. (3)
`
E un risultato generale che tutti
gli spazi vettoriali di dimensione nita dotati di norma sono completi rispetto alla topologia
indotta dalla norma (vedi [25]).
(4) Si tratta della ben nota propriet`a (dai corsi elementari di analisi) di funzioni da K a K
p
tenendo conto che la norma denita `e quella di K
p
con p = n
2
. 2
Nota 6.4. Linsieme delle matrici complesse n n unitamente alla norma denita sopra per
la completezza di M(n, K) deniscono quella che si chiama unalgebra di Banach.
Lemma 6.2. Se A M(n, C) e z C, la serie

k=0
z
k
A
k
k!
converge assolutamente (rispetto a alla norma di M(n, C)) ed uniformemente nella topologia di
M(n, C) in ogni disco [z[ R < + e pu`o essere derivata sotto il segno di serie in z innite
volte. In particolare:
(1) la funzione
C z e
zA
:=

k=0
z
k
A
k
k!
(6.1)
`e ben denita e innitamente dierenziabile su C;
(2) per ogni z C vale
d
dz
e
zA
= Ae
zA
= e
zA
A, (6.2)
(3) per ogni coppia z, z

C vale
e
zA+z

A
= e
zA
e
z

A
= e
z

A
e
zA
. (6.3)
97

Dimostrazione. La dimostrazione si basa sulla validit`a degli analoghi teoremi delle serie di
funzioni complesse a valori complessi che si estendono banalmente per serie di funzioni da C a
valori in spazi di Banach. In particolare vale il teorema di Weierstrass che assicura che se una
serie `e dominata da una serie di termini numerici positivi allora si ha la convergenza assoluta e
uniforme. Nel nostro caso, se [z[ R, per il lemma 6.1

z
k
A
k
k!

[z[
k
[[A[[
k
k!
R
k
[[A[[
k
k!
e la serie di termini positivi

k=0
R
k
[[A[[
k
k!
converge (a exp(R[[A[[)).
(1) Similmente, la serie delle derivate di ordine p converge uniformemente in [z[ R perche
dominata dalla serie convergente di termini positivi

k=0
R
k
[[A[[
p
[[A[[
k
k!
= [[A[[
p
e
R||A||
.
questo implica che per ogni intero p e per ogni coppia i, j = 1, . . . , n la serie di funzioni a valori
in C

k=0
d
p
dz
p
z
k
(A
k
)
ij
k!
coverge assolutamente ed uniformemente. Usando iterativamente un noto teorema di analisi si
trova allora che, per ogni intero q e per ogni coppia i, j = 1, . . . , n esiste la derivata q esima di
(exp(zA))
ij
e vale
d
q
dz
q
(exp(zA))
ij
=

k=0
d
q
dz
q
z
k
(A
k
)
ij
k!
.
In base alla propriet`a (4) del lemma 4.1, esiste la derivata q esima di exp(zA) nella norma [[ [[
e vale
d
q
e
zA
dz
q
=

k=0
d
q
dz
q
z
k
(A
k
)
k!
.
In particolare la somma della serie pu`o essere derivata sotto il segno di somma innite volte.
Passiamo a (2) Semplicemente derivando sotto il segno di somma si ha
d
dz
e
zA
=

k=1
Az
k1
A
k1
(k 1)!
=

k=1
z
k1
A
k1
(k 1)!
A
98
Ridenendo k = p 1 e usando il lemma 4.1 da cui le propriet`a
[[A(exp(zA) S
n
)[[ [[A[[[[(exp(zA) S
n
)[[ 0
e
[[(exp(zA) S
n
)A[[ [[(exp(zA) S
n
)[[[[A[[ 0
dove S
n
`e la ridotta della serie troncata allordine n, si ha

p=0
Az
p
A
p
p!
= A

p=0
z
p
A
p
p!
=
_
_

p=0
z
p
A
p
p!
_
_
A :,
che `e la tesi.
Per concludere la prova di (3) `e identica a quella che si ha per la funzione esponenziale a valori
numerici complessi, tenendo conto del fatto che (zA)(z

A) = (z

A)(zA) che viene usato in un


passaggio (vedi per esempio le prime pagine di [25]). 2
Nota 6.5. La propriet`a (3) si pu`o rinforzare, usando la stessa dimostrazione, in
e
A+B
= e
A
e
B
= e
B
e
A
sotto lipotesi che
AB = BA.
In assenza di tale ipotesi la propriet`a enunciata `e generalmente falsa.
Lemma 6.3. Se A M(n, C) allora, per ogni t C
det e
tA
= e
ttr A
,
in particolare
det e
A
= e
tr A
.

Dimostrazione. Si consideri lapplicazione


C t det e
tA
.
Vogliamo calcolarne la derivata per t arbitrario. Ci interessa cio`e
lim
h0
dete
(t+h)A
dete
tA
h
= lim
h0
det(e
tA
e
hA
) dete
tA
h
= dete
tA
lim
h0
dete
hA
1
h
purche lultimo limite esista. Vale
e
hA
= I +hA+ho(h) ,
99
dove o(h) 0 se h 0 nella topologia metrica di C
n
2
per cui
lim
h0
det e
(t+h)A
dete
tA
h
= dete
tA
lim
h0
det(I +hA+ho(h)) 1
h
.
Ricordiamo che
detB =
i
1
...i
n
B
1i
1
B
ni
n
,
per cui si ha subito che
det(I +hA+ho(h)) = 1 +h
n

i=1
A
ii
+h0(h) .
Inserendo sopra troviamo che:
ddete
tA
dt
= dete
tA
trA.
Ci`o prova anche che la funzione considerata `e innitamente dierenziabile. Quindi la funzione
innitamente dierenziabile f
A
: C t det e
tA
soddifa lequazione dierenziale
df
A
(t)
dt
= (tr A)f
A
(t) .
La funzione innitamente dierenziabile g
A
: C t e
ttr A
soddisfa banalmente la stessa
equazione dierenziale
dg
A
(t)
dt
= (tr A)g
A
(t) .
Entrambe le funzioni soddisfano la condizione iniziale f
A
(0) = g
A
(0) = 1, di conseguenza per il
teorema di unicit`a delle soluzioni massimali delle equazioni dierenziali del primordine, le due
funzioni coincidono per ogni t C e deve essere:
dete
tA
= e
ttr A
.
Questo implica la tesi per t = 1. 2
Proposizione 6.2. (Il gruppo di Lie GL(n, R)). Il gruppo GL(n, R) delle matrici reali
n n invertibili `e un gruppo di Lie con la struttura di variet`a dierenziabile indotta da R
n
2
.
Valgono ulteriormente le seguenti propriet`a.
(1) Lalgebra di Lie di GL(n, R) `e data dallinsieme di matrici reali n n, M(n, R) ed il
commutatore `e denito come
[A, B] = AB BA,
per ogni coppia A, B M(n, R).
(2) I sottogruppi ad un parametro di GL(n, R
n
) sono completi (cio`e deniti su tutto R nel
parametro) ed hanno la forma
R t e
tA
100
per ogni A M(n, R), dove lesponenziale `e quello denito nel lemma 6.2
Dimostrazione. Pensiamo le matrici A reali nn come punti di R
n
2
le cui coordinate naturali
individuano, se lette di seguito in gruppi contigui di n elementi (le n righe di A). Per quanto
riguarda il fatto che GL(n, R) sia un gruppo di Lie, `e suciente dimostrare due cose:
(1) GL(n, R) `e una variet`a dierenziabile;
(2) le operazioni di composizione e di calcolo dellinversa sono dierenziabili rispetto alla strut-
tura dierenziabile di R
n
2
.
La funzione determinante da R
n
2
in R `e indubbiamente dierenziabile in quanto `e un polinomio
nelle coordinate globali di R
n
2
. La controimmagine di R 0 secondo tale funzione `e chiara-
mente un insieme aperto essendo la funzione continua. Possiamo assegnare a tale insieme la
struttura di variet`a dierenziabile restringendo la carta globale naturale di R
n
2
a tale insieme.
Ci`o denisce una struttura dierenziabile su GL(n, R) che altro non `e che linsieme dei punti
di R
n
2
sui quali la funzione determinante `e non nulla. La seconda propriet`a `e ovvia per quanto
riguarda la moltiplicazione, per il calcolo della funzione inversa lo `e anche usando, nellinsieme
aperto che denisce la variet`a GL(n, R), la regola di Kramer per il calcolo dellinversa, in quanto
le componenti (coordinate di R
n
2
) della matrice inversa di A GL(n, R), sono funzioni razionali
con denominatori mai nulli nelle coordinate che deniscono la matrice A.
Veniamo alla seconda parte. Dimostriamo (1) e (2) insieme. Se A M(n, R), si consideri la
funzione R t e
tA
. In base al lemma 6.3 tale funzione ammette valori solamente in GL(n, R)
perche det e
tA
= e
ttr A
> 0 per ogni A M(n, R). Usando (2) di lemma 4.2 otteniamo
d
dt
e
tA
= Ae
tA
= e
tA
A.
Per t = 0 si riottiene la matrice A che dunque `e in T
1
GL(n, R) perch`e e
0A
= 1. Abbiamo provato
che M(n, R) T
1
GL(n, R). Dato che deve essere per costruzione dim T
1
GL(n, R) n
2
e che
dim M(n, R) = n
2
allora M(n, R) = T
1
GL(n, R). Se A T
1
GL(n, R) = M(n, R), lequazione
che denisce il sottogruppo ad un parametro generato da A si scrive banalmente (specializzando
la denizione 6.1 e tenendo conto che il prodotto del gruppo `e quello matriciale ordinario):
df
A
(t)
dt
= f
A
(t)A.
La funzione R t e
tA
denita nel lemma 6.2 soddifa banalmente tale equazione dierenziale
di sopra a causa di (2) del suddetto lemma. Per lunicit`a della soluzione questa `e lunica soluzione
ed `e dunque la forma esplicita del sottogruppo ad un parametro generato da A. Si noti che per
costruzione la soluzione `e completa. Applicando la denizione in (b) di denizione 6.3 si ha
immediatamente che il commutatore dellalgebra di Lie di GL(n, R) `e
[A, B] =
d
dt
[
t=0
_
e
tA
Be
tA
_
= AB BA
per ogni coppia A, B M(n, R). 2
101
Possiamo allora dare la seguente denizione.
Denizione 6.6. (Gruppo di Lie matriciale reale n n). Un gruppo di Lie matriciale
reale n n `e un sottogruppo di Lie di GL(n, R).
Abbiamo le seguenti propriet`a elementari dei gruppi di Lie matriciali di immediata verica.
Proposizione 6.3. (Propriet`a dei gruppi di Lie matriciali). Sia G un gruppo di Lie
matriciale reale n n allora valgono le seguenti propriet` a.
(1) G `e un gruppo di Lie con la struttura di variet`a dierenziabile indotta da R
n
2
.
(2) Lalgebra di Lie di G `e una sotto algebra di M(n, R) dotata del commutatore
[A, B] = AB BA.
(3) I sottogruppi ad un parametro di G sono completi ed hanno la forma
R t e
tA
per ogni A T
1
G, dove lesponenziale `e quello denito nel lemma 6.2
Dimostrazione
`
E tutto immediata conseguenza della proposizione 6.2 2
6.3 I gruppi di Lie O(3) e SO(3).
Esaminiamo un gruppo di Lie molto importante, il gruppo delle rotazioni n-dimensionali O(n):
O(n) := R M(n, R) [ RR
t
= I .
Abbiamo il seguente teorema.
Teorema 6.3. (Propriet`a elementari del gruppo di Lie O(n).) si consideri linsieme di
matrici:
O(n) := R M(n, R) [ RR
t
= I .
Allora valgono le seguenti propriet`a.
(1) O(n) `e un gruppo di Lie matriciale reale n n chiuso rispetto alla trasposizione di matrici
ed `e detto gruppo delle rotazioni n-dimensionali.
(2) Lalgebra di Lie di O(n), indicata con o(n), `e data dallo spazio vettoriale delle matrici nn
reali antisimmetriche. Tale spazio ha dimensione n(n 1)/2.
(3) O(n) `e compatto.
102
Dimostrazione. (1) Prima di tutto mostriamo che O(n) `e un gruppo ed `e chiuso rispetto alla
trasposizione. I O(n) banalmente, se R, R

O(n) allora
(RR

)(RR

)
t
= RR

R
t
R
t
= RIR
t
= RR
t
= I ,
per cui O(n) `e chiuso rispetto al prodotto.
`
E suciente provare, per concludere che O(n) `e un
gruppo, che esso `e chiuso rispetto al calcolo dellinversa. Il fatto che RR
t
= I implica che
detR detR
t
= 1 ossia (detR)
2
= 1 da cui detR = 1, ma in ogni caso detR ,= 0 per cui
esiste la matrice inversa di ogni R O(n) e coincide con la trasposta di R. Se proviamo che
R
1
O(n) abbiamo provato anche la chiusura rispetto alla trasposizione. Se R O(n), dato
che linversa destra coincide con quella sinistra si ha R
1
R = I, trasponendo R
t
(R
1
)
t
= I
ma essendo R
t
= R
1
, abbiamo che R
1
(R
1
)
t
= I ossia R
1
O(n). Con ci`o abbiamo
provato che O(n) `e un gruppo rispetto al prodotto di matrici, per cui `e anche sottogruppo di
GL(n, R). Per concludere il punto (1) dato che O(n) GL(n, R), `e suciente provare che O(n)
`e una sottovariet`a embedded di R
n
2
. Ricordiamo un ben noto teorema detto teorema dei valori
regolari [26, 2]:
si considerino due variet` a dierenziabili M, N con dimensione rispettivamente m, n con m > n, e
una funzione dierenziabile f : M N. Se p N `e tale che per tutti i punti x P := f
1
(p)
df
x
`e suriettiva (cio`e la matrice jacobiana associata ha rango n) allora P M `e una sottovariet` a
embedded di M di dimensione mn.
Notiamo che la richiesta che df
x
sia suriettiva `e equivalente alla richiesta che:
il nucleo di df
x
abbia dimensione mn.
Consideriamo allora la denizione di O(n). In coordinate di R
n
2

ik

j=1
x
ij
x
kj
= 0 .
Queste equazioni non sono tutte indipendenti: se scambio i e k riottengo le stesse equazioni. Le
equazioni indipendenti sono per esempio quelle corrispondenti alla matrice triangolare superiore
di una matrice simmetrica nn, cio`e le equazioni di sopra con la restrizione i k. Quindi sono
n(n + 1)/2. Deniamo allora una funzione da
f : R
n
2
R
n(n+1)/2
con componenti
f
ik
(x
11
, x
12
, . . . , x
nn
) =
ik

j=1
x
ij
x
kj
dove i k. f `e chiaramente dierenziabile, mostriamo che i punti R O(n) = f
1
(0), dove
0 `e il vettore nullo di R
n(n+1)/2
, sono tali che il nucleo di df
R
ha dimensione n
2
n(n + 1)/2(=
n(n 1)/2). In base al teorema dei valori regolari ci`o mostra che O(n) `e una sottovariet`a
embedded di R
n
2
(e quindi GL(n, R) che contiene O(n) ed ha la struttura dierenziabile indotta
da R
n
2
) di dimensione n(n 1)/2. Cominciamo a provare che il nucleo di df
I
ha dimensione
103
n(n1)/2. Per calcolare la dimensione del nucleo di df
I
consideriamo tutte le curve dierenziabili
R = R(u) che soddisfano R(u)R(u)
t
= I e R(0) = I e calcoliamo la dimensione dello spazio
generato dai vettori tangenti nel punto I a tali curve. Per costruzione tale spazio `e il nucleo di
df
I
. Da R(u)R(u)
t
= I otteniamo, se

R denota il vettore tangente in u = 0 cio`e in I:

R +

R
t
= 0
ossia

R =

R
t
.
Le matrici trovate sono antisimmetriche reali n n. Daltra parte se A `e una matrice antisim-
metrica reale n n, la curva R(u) := e
uA
, che ammette A come vettore tangente in I, soddisfa
R(u)R(u)
t
= I: direttamente dalla denizione di esponenziale
e
uA
(e
uA
)
t
= e
uA
e
uA
t
= e
uA
e
uA
= e
(uu)A
= I
Dunque il nucleo di df
I
`e dato dallo spazio vettoriale reale delle matrici reali n n antisimmet-
riche.
`
E facile provare che tale spazio ha dimensione n(n 1)/2.
Passiamo ora a considerare il generico punto g O(n). Come sopra consideriamo tutte le
curve dierenziabili R = R(u) che soddisfano R(u)
t
R(u) = I (che equivale a R(u)R(u)
t
= I) e
R(0) = g e calcoliamo la dimensione dello spazio generato dai vettori tangenti nel punto I a tali
curve. Per costruzione tale spazio `e il nucleo di df
g
. Da R(u)
t
R(u) = I otteniamo, se

R denota
il vettore tangente in u = 0 cio`e in g:

R
t
g +g
t

R = 0
ossia, essendo g
t
= g
1
,
g
1

R = (g
1

R)
t
.
Questo signica che

R appartiene al nucleo di df
g
se e solo se

R = gA
dove A =

R
t
g `e antisimmetrica reale per

R
t
g + g
t

R = 0. Cio`e A appartiene al nucleo di df
I
.
Lapplicazione generata da g `e per costruzione P
g
e quindi `e un isomorsmo di spazi vettoriali
essendo il dierenziale del dieomorsmo P
g
: GL(n, R) GL(n, R). Quindi il nucleo di df
g
ha
la stessa dimensione di quello di df
I
e ci`o prova che siamo nelle ipotesi del teorema dei valori
regolari: O(n) `e una sottovariet`a embedded di GL(n, R).
(2) In realt`a la dimostrazione `e stata data sopra in quanto i vettori tangenti a I in O(n) si
ottengono come i vettori tangenti per u = 0 delle curve R = R(u) che soddisfano R(u)R(u)
t
= I
e R(0) = I. Abbiamo visto sopra che tale spazio coincide con quello delle matrici antisimmetriche
reali n n che ha dimensione n(n 2)/2.
(3)
`
E suciente provare che O(n) `e un sottinsieme chiuso e limitato di R
n
2
in quanto, in R
k
, i
chiusi limitati sono compatti (e viceversa). Per quanto riguarda la chiusura, `e chiaro che O(n)
contiene i suoi punti di accumulazione: se A
k
O(n) e A
k
A R
n
2
per k allora
104
banalmente A
t
k
A
t
e I = A
n
A
t
n
AA
t
. Quindi A O(n). La limitatezza nella norma di R
n
2
`e ovvia. Infatti, se R O(n):
[[R[[
2
=
n

i=1
_
_
n

j=1
R
ij
R
ij
_
_
=
n

i=1

ii
= n .
2
Teorema 6.4. (Struttura topologica di O(3) rispetto alla connessione.) Il gruppo di
Lie matriciale O(3) ha due componenti connesse date rispettivamente da:
il gruppo di Lie matriciale compatto (e connesso)
SO(3) := R O(3) [ det R = 1
detto gruppo speciale delle rotazioni tridimensionali e linsieme compatto (che non `e
sottogruppo)
PSO(3) := PR O(3) [ R SO(3)
dove P := I `e linversione di parit`a.
Dimostrazione. Si consideri R O(3). Allora det R = 1 direttamente dalla denizione di
O(3).
`
E immediato provare che il sottoinsieme delle matrici di O(3) con determinante 1 forma
un sottogruppo di O(3) che indicheremo con SO(3). Indichiamo con PSO(3) linsieme conte-
nente le matrici con determinante 1, O(3) SO(3).
`
E chiaro che tali due insiemi sono disgiunti
e la loro unione `e O(3). Deniamo P := I, vale P PSO(3). Se R O(3) pu`o solo essere
R SO(3) oppure R PSO(3). Valendo PP = I segue subito che PR, R PSO(3) se e solo
se rispettivamente R, PR SO(3). Di conseguenza, PSO(3) = PR O(3) [ R SO(3).
Mostreremo ora che SO(3) `e aperto, connesso e compatto. (Le stesse propriet`a varranno anche
per PSO(3) perch`e lazione di P `e un dieomeorsmo. Tuttavia I , PSO(3) per cui questul-
timo non `e sottogruppo.)
Consideriamo R SO(3). Dato che R `e reale e che il polinomio caratteristico associato `e di
terzo grado, dal teorema fondamentale dellalgebra segue che R dovr`a avere almeno un auto-
valore reale che corrisponde ad una radice reale di tale polinomio (le altre due o sono reali
o sono complesse coniugate). La matrice R pu`o sempre pensarsi come matrice unitaria in C
3
in tal caso `e noto che (1) `e diagonalizzabile, (2) gli autovalori sono della forma e
i
per qualche
R. Riassumendo: uno dei tre autovalori
1
deve essere reale con modulo 1 e gli altri due
devono essere anche essi reali oppure complessi coniugati ed in ogni caso tutti con modulo 1.
Per cui pu`o essere solo
1
= +1 o
1
= 1. Nel secondo caso, al ne di avere determinante,
1 cio`e prodotto degli autovalori uguale a 1, anche gli altri due autovalori devono essere reali e,
dovendo essere della forma e
i
almeno uno dei due deve essere 1. In denitiva: ogni R SO(3)
ammette sempre lautovalore 1.
Sia e
1
un autovettore normalizzato associato allautovalore 1. Completiamo e
1
a base ortonor-
male di R
3
: e
1
, e
2
, e
3
. La trasformazione dalla base canonica a quella ottenuta sar`a rappresentata
105
da una matrice L di O(3) perche entrambe le basi sono ortonormali. Quindi avremo che esiste
L O(3) tale che
LRL
t
= R

:=
_
_
1 0 0
e a b
f c d
_
_
. (6.4)
La matrice a secondo membro sar`a necessariamente in O(3) perch`e composizione di matrici
di O(3). Il calcolo del determinante con la regola di Binet mostra che R SO(3) implica
R

SO(3). Imponendo la condizione di appartenenza a SO(3) si vede subito che


R

=
_
_
1 0 0
0 a b
0 c d
_
_
. (6.5)
dove a
2
+b
2
= c
2
+d
2
= 1, ac +bd = 0 e ad bc = 1. Si conclude facilmente che le matrice R

deve avere la forma


R

:=
_
_
1 0 0
0 cos sin
0 sin cos
_
_
. (6.6)
dove R. Abbiamo provato che per ogni R SO(3) esiste L O(3) tale che
R = L
t
R

R
L
per qualche
R
R. Se lasciamo variare da 0 a
R
abbiamo una curva continua L
t
R

L
che congiunge I a R. Quindi SO(3) `e connesso per archi continui. Di conseguenza `e connesso.
Si osservi che SO(3) `e anche un sottoinsieme aperto (nella topologia relativa) di O(3) essendo
lintersezione tra O(3) e la controimmagine di (0, +) della funzione continua che calcola il
determinante su GL(n, R).
Come gi`a detto, dato che R PR `e un dieomorsmo di O(3), manda aperti connessi in aperti
connessi per cui essendo SO(3) aperto e connesso, PSO(3) `e aperto e connesso. Essendo i due
insiemi connessi disgiunti con unione pari a O(3), essi costituiscono le componenti connesse di
O(3).
Per costruzione essendo SO(3) una componente connessa di O(3) `e anche banalmente una sot-
tovariet`a di O(3) nella struttura dierenziabile indotta e quindi SO(3) `e un sottogruppo di Lie
di O(3) e quindi un gruppo di Lie matriciale. Dato che le componenti connesse sono banalmente
aperte e chiuse, SO(3) `e chiuso nel compatto O(3) per cui `e compatto. Dato che I SO(3)
segue anche che lalgebra di Lie di SO(3) coincide con quella di O(3). 2
Corollario. Vale so(3) = o(3) dove so(3) := T
1
SO(3).
106
Dimostrazione. PSO(3) non `e un sottogruppo di O(3) perch`e non contiene lidentit`a. Solo la
componente connessa SO(3) contiene lidentit`a e ci`o implica imemdiatamente che
T
1
SO(3) = T
1
O(3) .
2
6.4 Teorema di rappresentazione di O(3) e SO(3).
Introduciamo una base particolare di so(3) data dalle matrici
(S
i
)
jk
=
ijk
,
dove `e la solita densit`a tensoriale di Ricci-Levi-Civita, esplicitamente
S
1
:=
_
_
0 0 0
0 0 1
0 1 0
_
_
, (6.7)
S
2
:=
_
_
0 0 1
0 0 0
1 0 0
_
_
, (6.8)
S
3
:=
_
_
0 1 0
1 0 0
0 0 0
_
_
, (6.9)
Tali matrici sono antisimmetriche e quindi appartengono a so(3), inoltre `e immediato provare
che sono linearmente indipendenti per cui sono una base di so(3). Le costanti di struttura
assumono una forma semplice in questa base, come si prova per computo diretto
[S
i
, S
j
] =
ij
k
S
k
, (6.10)
dove
ij
k
=
ijk
sono le componenti della solita densit`a tensoriale di Ricci-Levi-Civita.
Vogliamo inne provare un teorema di rappresentazione delle matrici di SO(3). Abbiamo bisog-
no di alcuni risultati preliminari.
Lemma 6.4. Per ogni R SO(3) vale lidentit`a
RS
i
R
t
=
3

j=1
R
t
ij
S
j
.
107

Dimostrazione. Partiamo dalla nota relazione

ijk
R
pi
R
qj
R
rk
= (det R)
pqr
,
dove gli indici sono stati abbassati con la metrica
ij
e la matrice R `e arbitaria. Se R SO(3),
la relazione di sopra diventa, cambiando anche i segni ad ambo membri:

ijk
R
pi
R
qj
R
rk
=
pqr
ossia

i
R
pi
(RS
i
R
t
)
qr
= (S
p
)
qr
ossia moltiplicando per R
pj
e sommando su p

ij
(RS
i
R
t
)
qr
=

p
R
pj
(S
p
)
qr
che si riscrive
(RS
j
R
t
) =

p
R
t
jp
(S
p
)
2
Il lemma appena provato permette di concludere con un teorema di rappresentazione di SO(3).
Teorema 6.5. (Rappresentazione di SO(3).) R SO(3) se e solo se esistono un versore
n S
2
e un numero R tale che
R = e
nS
dove
n S :=
3

i=1
n
i
S
i
essendo le matrici S
i
T
1
SO(3) date da
(S
i
)
jk
=
ijk
.

Dimostrazione. Come provato nella dimostrazione del teorema 6.4, se R SO(3) allora esiste
L O(3) tale che R = LR

L
t
dove R

`e data in (6.6). Possiamo sempre cambiare, se necessario,


L in PL = L al ne di avere L SO(3) senza alterare il risultato di sopra.
`
E facile provare
che
R

= e
S
1
108
Infatti calcolando la derivata in del primo membro tramite la (6.6), si trova facilmente che
dR

d
= S
1
R

.
Daltra parte vale anche
de
S
1
d
= S
1
e
S
1
.
per cui le due funzioni soddisfano la stessa equazione dierenziale, ma anche la stessa condizione
iniziale:
R
0
= e
0S
1
= I ,
per cui coincidono. Ne consegue che (dove usiamo la notazione n S :=

i
n
i
S
i
):
R = Le
S
1
L
t
= Le
e
1
S
L
1
.
Usando lo sviluppo dellesponenziale si ha
Le
e
1
S
L
1
= L(I+e
1
S+
1
2
e
1
Se
1
S+ )L
1
= I+e
1
LSL
1
+
1
2
e
1
LSL
1
e
1
LSL
1
+
dove abbiamo inserito dei fattori I = L
1
L nei punti oppurtuni, per cui
Le
e
1
S
L
1
= e
e
1
LSL
1
= e
e
1
LSL
t
.
Usando il lemma 4.4, con ovvie notazioni
n LSL
t
= e
1
(L
t
S) = (Le
1
) S ,
In denitiva, tenendo conto che n `e un versore di S
2
se e solo se n = Ae
1
per qualche A SO(3),
abbiamo provato che, se R SO(3) allora per qualche R e n S
2
,
R = e
nS
.
Viceversa se scegliamo n S
2
e R e deniamo:
R := e
nS
,
allora, ricordando che le matrici S
i
sono antisimmetriche:
RR
t
= e
nS
(e
nS
)
t
= e
nS
e
nS
t
= e
nS
e
nS
= e
()nS
= I .
Per cui R O(3). Daltra parte detR = e
ntrS
= e
0
= 1, per cui R SO(3). 2
Si ha ovviamente il seguente corollario.
109
Corollario. R PSO(3) se e solo se esistono un versore n S
2
e un numero R tale che
R = e
nS
.

Dimostrazione. Dato che PP = I, vale R PSO(3) se e solo se PR SO(3), da cui segue


immediatamente la prova della tesi essendo P = I. 2
Commenti 6.2.
(1) Ci si pu`o chiedere se per una R SO(3) la coppia , n che rappresenta R tramite il teorema
6.5 sia unica.
`
E chiaro che se R la risposta `e negativa. Se restringiamo a [0, 2] lintervallo
di variazione di la risposta `e ancora negativa perche una rotazione di riferita al versore n `e
la stessa cosa che una rotazione di 2 riferita al versore n (bisogna associare le rotazioni
ai versori secondo la stessa orientazione, per es la legge della mano destra). Possiamo allora
scegliere il range di in [0, ]. In tal caso le uniche ambiguit`a sono la descrizione di I che
corrisponde a = 0 e qualunque n S
2
e le rotazioni di rispetto a n e n che sono in realt`a
la stessa rotazione.
(2) Quanto detto sopra consente una descrizione della topologia di SO(3) pi` u approfondita. I
punti di SO(3) li possiamo infatti determinare dai vettori n R
3
con [0, ] e n S
2
. In
tal modo i punti di SO(3) corrispondono ai punti di una palla chiusa in R
3
di raggio tale che,
per ogni diametro, i punti diametralmente opposti sulla supercie della palla sono identicati.
Tali punti corrispondo alle rotazioni di attorno a n che sono, come detto la stessa cosa.
Possiamo mettere una topologia su tale spazio di punti P, semplicemente inducendola da quella
di SO(3) mappando le basi di intorni di SO(3) in P. Ogni cammino (continuo) chiuso in P
che non interseca il bordo della palla, `e omotopo ad un punto in P. La stessa cosa accade per
cammini chiusi che arrivano no al bordo della palla, eccetto il caso di cammini che connettono
due punti diametralmente opposti posti sulla supercie della palla: questi cammini apparente-
mente aperti, sono chiusi per la struttura dello spazio topologico e non sono omotopi a punti:
lo spazio non `e semplicemente connesso. Si osservi che ognuno di tali cammini che connette
due punti diametralmente opposti sulla supercie della palla, purche si avvolga una volta sola,
`e banalmente omotopo al cammino corrispondente dato dallo stesso diametro che connette i
due punti. Due cammini del tipo detto dati da due diametri dierenti, sono sempre tra di loro
omotopi ruotando un diametro verso laltro tenendo sso il centro della palla. In denitiva ci
sono solo cammini omotopi a punti e cammini, che non lo sono, ma sono omotopi tra di loro a
patto che si avvolgano una volta sola. Per cammini che si avvolgono pi` u volte la situazione `e
la stessa di cammini in R
3
privato di un retta, per cammini che si avvolgono pi` u volte attorno
a tale retta. Ci`o porta a intuire che
1
(SO(3)) = Z. In eetti tale fatto si pu`o rigorosamente
provare.
Esercizi 6.2.
110
1. Si consideri il gruppo commutativo delle traslazioni su R
n
dato da R
n
stesso: se t R
n
L
t
: R
n
x x +t R
n
.
Mostrare che tale gruppo `e un gruppo di Lie matriciale sottogruppo di GL(n+1, R) con algebra
di Lie identicabile con R
n
stesso.
Suggerimento. Considerare R
n
come il piano in R
n+1
di equazione
(x
1
, . . . , x
n+1
) R
n+1
[ x
n+1
= 1 .
Quindi considerare la classe di matrici
_
I t
0 1
_
. (6.11)
2. Mostrare che il gruppo di Galileo `e un gruppo di Lie matriciale sottogruppo di GL(5, R).
Suggerimento. Considerare la classe di matrici
_

R,V
0
C
0 1
_
; (6.12)
dove C R
4
`e il vettore colonna con C
t
= (c, X
0
) e

R,V
0
_
1 0
V
0
R
_
; (6.13)
dove V
0
R
3
e R O(3).
3. Mostrare che lalgebra di Lie del gruppo di Galileo `e isomorfa alla somma diretta so(3)R
7
come spazio vettoriale ma non lo e come algebra di Lie (cio`e il commutatore non soddisfa
[(A, t), (A

, t

)] = ([A, A

], 0) ,
dove A, A

so(3) e t R
7
).
111
Capitolo 7
La struttura del gruppo di Lie
O(1, 3).
In questa parte studieremo O(1, 3) come gruppo di Lie matriciale e daremo alcuni teoremi sulla
rappresentazione delle sue matrici. In particolare proveremo il teorema 2.4 che aerma che le
matrici di Lorentz sono decomponibili in una trasformazione di Lorentz speciale preceduta e
seguita da due rotazioni spaziali.
7.1 Il gruppo di Lie matriciale O(1, 3).
Similmente a quanto provato per O(n) dimostriamo che O(1, 3) `e un gruppo di Lie matriciale.
Teorema 7.1. (Propriet`a elementari del gruppo di Lie O(1, 3).) Il gruppo di Lorentz
O(1, 3) := M(4, R) [
t
= ,
dove
=
_

_
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
_

_
, (7.1)
soddisfa le seguenti propriet`a.
(1) O(1, 3) `e un gruppo di Lie matriciale reale 44 chiuso rispetto alla trasposizione di matrici.
(2) Lalgebra di Lie di O(1, 3), indicata con o(1, 3) `e data dallo spazio vettoriale a 6 dimensioni
delle matrici L, 4 4 reali che soddisfano la propriet`a
L
t
= L . (7.2)
112
(3) O(1, 3) `e chiuso in R
16
ma non `e compatto.
Dimostrazione. (1) Il fatto che O(1, 3) `e un sottogruppo di GL(4, R) ed `e chiuso rispetto alla
trasposizione `e stato provato nel teorema 2.2 Vogliamo provare che O(1, 3) `e una sottovariet`a
embedded di R
16
usando la stessa procedura seguita nel teorema 6.3 per O(n).
Consideriamo allora la denizione di O(1, 3). In coordinate di R
16

ik

j,r=1
x
ij

jr
x
kr
= 0 .
Queste equazioni non sono tutte indipendenti: se si scambiano i e k si riottengono le stesse
equazioni. Le equazioni indipendenti sono per esempio quelle corrispondenti alla matrice trian-
golare superiore di una matrice simmetrica 4 4, cio`e le equazioni di sopra con la restrizione
i k. Quindi sono 10. Deniamo allora una funzione da
f : R
16
R
10
con componenti (se
rs
:=
rs
)
f
ik
(x
11
, x
12
, . . . , x
44
) =
ik

j,r=1
x
ij

jr
x
kr
dove i k. f `e chiaramente dierenziabile, mostriamo che i punti O(1, 3) = f
1
(0), dove
0 `e il vettore nullo di R
10
, sono tali che il nucleo di df

ha dimensione 16 10 = 6. In base al
teorema dei valori regolari ci`o mostra che O(1, 3) `e una sottovariet`a embedded di R
16
(e quindi
di GL(4, R) che contiene O(1, 3) ed ha la struttura dierenziabile indotta da R
16
) di dimensione
6. Cominciamo a provare che il nucleo di df
I
ha dimensione 6. Per calcolare la dimensione del
nucleo di df
I
consideriamo tutte le curve dierenziabili = (u) che soddisfano (u)(u)
t
=
e (0) = I e calcoliamo la dimensione dello spazio generato dai vettori tangenti nel punto I a
tali curve. Per costruzione tale spazio `e il nucleo di df
I
. Da (u)(u)
t
= otteniamo, se

denota il vettore tangente in u = 0 cio`e in I:

t
= 0
ossia, ricordando che =
t
=
1
,

t
.
Le matrici trovate hanno la struttura:
L =
_

_
1 c
t
c A
_

_
, (7.3)
113
dove A `e una matrice antisimmetrica reale 3 3 e c un vettore colonna di R
3
. Daltra parte
se L ha la struttura di sopra, la curva (u) := e
uL
, che ammette L come vettore tangente in
I, soddisfa (u)(u)
t
= : direttamente dalla denizione di esponenziale e tenendo conto che
= I,
e
uL
(e
uL
)
t
= e
uL
e
uL
t
= e
uL
e
uL
t
= e
uL
e
uL
t

= e
uL
e
uL
=
Dunque il nucleo di df
I
`e dato dallo spazio vettoriale reale delle matrici reali 44 che soddisfano
(7.3).
`
E facile provare che tale spazio ha dimensione 6: la matrice antisimmetrica A dipende da
3 elementi, mentre il vettore c ha 3 componenti.
Passiamo ora a considerare il generico punto g O(1, 3). Come sopra consideriamo tutte le curve
dierenziabili = (u) che soddisfano
t
(u)(u) = (che equivale a (u)(u)
t
= per la
chiusura del gruppo rispetto al calcolo della trasposta) e (0) = g e calcoliamo la dimensione
dello spazio generato dai vettori tangenti nel punto g a tali curve. Per costruzione tale spazio `e
il nucleo di df
g
. Da
t
(u)(u) = otteniamo, se

denota il vettore tangente in u = 0 cio`e in
g:

t
g +g
t


= 0 .
Essendo = 1 e valendo g
t
= g
1
da g O(1, 3), lidentit`a di sopra si riscrive con qualche
passaggio:
g
1

= (g
1

)
t
.
Questo signica che

R appartiene al nucleo di df
g
se e solo se

= gL
dove L soddisfa (7.3). Cio`e L appartiene al nucleo di df
I
. Lapplicazione generata da g `e
per costruzione P
g
e quindi `e un isomorsmo di spazi vettoriali essendo il dierenziale del
dieomorsmo P
g
: GL(4, R) GL(4, R). Quindi il nucleo di df
g
ha la stessa dimensione di
quello di df
I
e ci`o prova che siamo nelle ipotesi del teorema dei valori regolari: O(1, 3) `e una
sottovariet`a embedded di GL(4, R).
(2) In realt`a la dimostrazione `e stata data sopra in quanto i vettori tangenti a I in O(1, 3) si
ottengono come i vettori tangenti per u = 0 delle curve = (u) che soddisfano (u)(u)
t
=
e (0) = I. Abbiamo visto sopra che tale spazio coincide con quello delle matrici reali 4 4 che
ha dimensione 6 denito da (7.2).
(3) Per la chiusura si procede esattamente come per O(3), per la non compattezza `e suciente
provare che O(1, 3) non `e limitato in R
16
in quanto, in R
k
, i chiusi limitati sono tutti e soli
compatti e viceversa. Si consideri a tal ne la matrice
() =
_

_
cosh sinh 0 0
sinh cosh 0 0
0 0 1 0
0 0 0 1
_

_
,
`e immediato vericare che (1) () O(1, 3) per ogni R, ma anche (2) [[()[[
2
=
2 + 2 cosh
2
+ 2 sinh
2
+ per +. 2
114
Passiamo a studiare O(1, 3). Una base di matrici di tale spazio vettoriale `e data, come si prova
facilmente, dalle seguenti 6 matrici. le prime tre, S
1
, S
2
e S
3
sono denita da, per i = 1, 2, 3
S
i
=
_

_
0 0 0 0
0
0 S
i
0
_

_
, (7.4)
dove S
1
, S
2
e S
3
sono denite in (6.7), (6.8), (6.9) rispettivamente. Le rimanenti 3 matrici dette
boosts sono date da
K
1
=
_

_
0 1 0 0
1 0 0 0
0 0 0 0
0 0 0 0
_

_
, (7.5)
K
2
=
_

_
0 0 1 0
0 0 0 0
1 0 0 0
0 0 0 0
_

_
, (7.6)
K
3
=
_

_
0 0 0 1
0 0 0 0
0 0 0 0
1 0 0 0
_

_
. (7.7)
Se poniamo
ij
k
:=
ijk
, si verica facilmente per computo diretto che valgono le seguenti
relazioni di commutazione (dove c`e la regola di somma sugli indici ripetuti):
[S
i
, S
j
] =
ij
k
S
k
, (7.8)
[K
i
, K
j
] =
ij
k
S
k
, (7.9)
[S
i
, K
j
] =
ij
k
K
k
. (7.10)
Tali relazioni sono spesso chiamate impropriamente, le relazioni di commutazione del grup-
po di Lorentz.
Commenti 7.1.
(1) Se deniamo

R
=
_

_
1 0 0 0
0
0 R
0
_

_
; (7.11)
115
dove R O(3), lapplicazione O(3) R
R
O(1, 3) `e una rappresentazione fedele (cio`e
iniettiva) di O(3) data in termini di matrici di Lorentz.
(2) Il teorema 6.5 si estende banalmente alle matrici
R
, con R SO(3), nellasserto che se
R SO(3) allora

R
= e
mS
, (7.12)
per qualche scelta di R e m S
2
, e viceversa ogni matrice nel secondo membro di (7.12) `e
della forma (7.11) dove
R = e
mS
.
Lultima delle relazioni di commutazione del gruppo di Lorentz ha un importante corollario che
`e il corrispondente del lemma 6.4 e che ci servir`a tra poco. Al solito se n S
2
e A = (A
1
, A
2
, A
3
)
`e un vettore di matrici usiamo la notazione (dove `e sottintesa la somma sugli indici ripetuti):
n A := n
i
A
i
.
Lemma 7.1. In riferimento alle matrici scritte sopra, vale lidentit`a:
e
nS
m Ke
nS
=
_
e
nS
m
_
K, (7.13)
per ogni coppia n, m S
2
e R.
Dimostrazione. La dimostrazione si ottiene come segue. Si deniscano le due funzioni
dierenziabili a valori matriciali:
f
p
: e
nS
K
p
e
nS
e
g
p
:

k
_
e
nS
_
pk
K
k
.
Derivando f
p
in ed usando le regole di commutazione (7.10) si prova facilmente che
df
p
d
= n
i

pi
j
f
j
() .
Nello stesso modo, usando la denizione delle matrici S
k
:
dg
p
d
= n
i

pi
j
g
j
() .
Dunque le due funzioni soddisfano la stessa equazione dierenziale e coincidono in = 0
banalmente. Per il teorema di unicit`a globale sono la stessa funzione:
e
nS
K
p
e
nS
=

k
_
e
nS
_
pk
K
k
116
da cui
e
nS
m
p
K
p
e
nS
= m
p

k
_
e
nS
_
pk
K
k
ossia
e
nS
m Ke
nS
= m
_
e
nS
K
_
e quindi
e
nS
m Ke
nS
=
_
e
nS
m
_
K.
2
7.2 Le trasformazioni pure di Lorentz o boosts e la decompo-
sizione polare del gruppo di Lorentz.
Abbiamo bisogno di qualche risultato e denizione preliminare.
Ricordiamo lenunciato del teorema di decomposizione polare [2] specializzazto al caso di dimen-
sione nita.
Teorema 7.2. (Teorema di decomposizione polare in dimensione nita.) Sia V
uno spazio vettoriale di dimensione nita sul campo C oppure R, dotato di prodotto scalare
hermitiano, rispettivamente prodotto scalare reale simmetrico. Sia A : V V un operatore
iniettivo (equivalentemente suriettivo).
(1) Se K = C allora:
(i) esistono e sono unici un operatore strettamente positivo M : V V ed un operatore
unitario, rispettivamente ortogonale, U : V V tali che sussista la decomposizione:
A = UM ,
(ii) esistono e sono unici un operatore strettamente positivo M

: V V ed un operatore
unitario, rispettivamente ortogonale, U

: V V tali che sussista la decomposizione:


A = M

,
(iii) Vale U = U

e M

= UMU

.
(2) Se K = R valgono ancora (i), (ii) e (iii) di sopra con le uniche dierenze che M e M

sono
operatori simmetrici strettamente positivi e U, U

sono operatori ortogonali.


Deniamo preventivamente una matrice che sar`a utile in tutto il seguito.
P(= ) :=
_

_
1 0 0 0
0
0 I
0
_

_
; (7.14)
117
`e detta inversione di parit`a. Si osservi che la matrice tridimensionale I `e stata preceden-
temente indicata con P. In questa sezione P indicher`a invece la matrice di sopra che ne `e una
banale estensione. Ricordiamo che linversione del tempo
T(= ) :=
_

_
1 0 0 0
0
0 I
0
_

_
; (7.15)
Le matrici I, P, T, PT = TP formano un sottogruppo commutativo di O(1, 3) che diremo sot-
togruppo discreto di Lorentz.
Ora, per prima cosa mostriamo che il teorema di decomposizione polare per operatori su R
4
applicato a matrici di Lorentz produce una coppia di matrici di Lorentz. Tale risultato non `e
aatto banale: se O(1, 3) il teorema di decomposizione polare per operatori su R
4
(con
prodotto scalare positivo usuale) assicura che (in una delle due versioni)
= MU
dove M = M
t
e M > 0 e U O(4). Niente assicura a priori che M, U O(1, 3)! In realt`a vale
il seguente teorema.
Teorema 7.3. (Decomposizione polare di O(1, 3).) Sia O(1, 3) allora vale quanto
segue:
(1) esiste ed `e unica una coppia di matrici
p
, M(4, R) tali che
=
p
(7.16)
unitamente a
p
=
t
p
,
p
> 0 e O(4);
(2) esiste ed `e unica una coppia di matrici

p
,

M(4, R) tali che


=

p
(7.17)
unitamente a

p
=

t
p
,

p
> 0 e

O(4);
(3) vale in realt`a:
=

, (7.18)

p
=
t

p
; (7.19)
(4) le decomposizioni in (1) e (2) sono decomposizioni allinterno di O(1, 3) in quanto risulta

p
,

p
, O(1, 3) ,
ed ulteriormente:
(i) =
R
, oppure
118
(ii) = T
R
, oppure
(ii) = P
R
, oppure
(iv) = PT
R
,
e
R
`e una pura rotazione speciale spaziale data dalla (7.11):

R
=
_

_
1 0 0 0
0
0 R
0
_

_
;
dove R SO(3).
(5) le matrici
p
,

p
godono delle seguenti propriet`a:
(i) det
p
= det

p
= 1,
(ii)
p
,

p
O(1, 3).
Dimostrazione. Riguardo ai punti (1),(2) e (3) la dimostrazione segue immediatamente dal
teorema di decomposizione polare (teorema 7.2) per operatori sullo spazio vettoriale reale R
4
dotato del prodotto scalare (u[v) =

4
i=1
u
i
v
i
. Per provare la prima parte del punto(4) procedi-
amo come segue. Notiamo che, dato che esiste
1
p
per la stretta positivit`a di
p
, `e suciente
provare che
p
O(1, 3). Ci`o implica subito che =
1
p
O(1, 3) perche prodotto di due
elementi di O(1, 3) e

p
=
t

p
O(1, 3) perch`e prodotto di tre elementi di O(1, 3). Quindi
proviamo che
p
O(1, 3).
Da O(1, 3) =
p
e tenendo conto che
p
`e simmetrica troviamo che

p
=
e quindi

t
=
1
p

1
p
. (7.20)
Eseguendo il calcolo dellinversa ad ambo membri e tenendo conto che
t
=
1
e = I, si ha

t
=
p

p
. (7.21)
Uguagliando i secondi membri di (7.20) e (7.21) ed usando ancora = I si ha subito

2
p
=
2
p
. (7.22)
Notiamo che
2
p
0 ed `e simmetrico per costruzione per cui ammette ununica radice quadra-
ta. Questultima deve essere
p
in quanto
p
`e simmetrica e positiva e vale (
p
)
2
=

p
=
2
p
. Daltra parte lunica radice quadrata di
2
p
(che `e simmetrica e positiva) `e

1
p
(che `e simmetrica e positiva). In denitiva, estraendo le radici quadrate da ambo membri
di (7.22) otteniamo:

p
=
1
p
,
119
che equivale, moltiplicando a destra per
p
ed a sinistra per (usando = I), a

t
p
= ,
dove si `e tenuto conto del fatto che
p
=
t
p
. Abbiamo ottenuto che
p
O(1, 3) con ci`o, come
detto `e provata la prima parte di (4). Per la seconda parte, `e suciente notare che in base a alla
prima parte, O(1, 3) O(4), ossia
t
= e
t
= I. Imponendo entrambe le condizioni
su una generica matrice reale 4 4 risulta immediatamente che essa deve avere la forma
_

_
1 0 0 0
0
0 R
0
_

_
dove R O(3) da cui segue immediatamente la tesi tenendo conto del teorema 6.4 Tale risultato
completa la dimostrazione di (4).
La prova di (5) `e immediata. Consideriamo solo
p
senza perdere generalit`a. La positivit`a di
p
implica che
0
0
0 per cui
p
O(1, 3). La stessa positivit`a implica che tutti gli autovalori
di
p
siano non negativi per cui det
p
0, ma dovendo essere det
p
= 1 (perch`e
p

t
p
=
da cui (det
p
)
2
= 1) deve valere det
p
= 1. 2
Denizione 7.1. (Trasformazioni Pure di Lorentz.) Una trasformazione
p
O(1, 3) `e
detta trasformazione o matrice pura di Lorentz se soddisfa le due condizioni:
(a)

p
=
t
p
,
(b)

p
> 0 .
Equivalentemente una trasformazioni di Lorentz `e pura se `e il fattore simmetrico positivo della
decomposizione polare di una matrice di Lorentz.
Commenti 7.2.
(1)
`
E chiaro che, essendo
p
simmetrica e non singolare
p
> 0 equivale a
p
0 usando la
decomposizione spettrale.
(2)
`
E chiaro che le trasformazioni pure sono tutte e sole le matrici
p
del teorema 7.3 che si
ottengono decomponendo polarmente tutte le matrici di Lorentz. Si tenga conto del fatto che la
decomposizione polare di una trasformazione pura coincide con la stessa matrice da decomporre
per lunicit`a della decomposizione.
(3) In particolare quindi ogni trasformazione pura soddisfa det
p
= 1 e
p
O(1, 3).
Passiamo a dare un primo teorema di rappresentazione delle trasformazioni pure di Lorentz.
Tale teorema ed il successivo servir`a sia a studiare le componenti connesse del gruppo di Lorentz
sia a dare un teorema di rappresentazione del gruppo di Lorentz.
120
Teorema 7.4. (Rappresentazione delle trasformazioni pure.) Le matrici pure di
Lorentz soddisfano le seguenti propriet`a:
(a) il loro insieme coincide con la classe di matrici di M(4, R) della forma:
_

_
B
t
B I+ BB
t
/(1 +)
_

_
, (7.23)
dove
=
_
1 +B
2
(7.24)
e B R
3
`e un qualsiasi vettore colonna,
(b) se
p
`e denita come in (7.23), R SO(3) e
R
`e denita da (7.11), allora

t
R
=
_

_
(RB)
t
RB I+ RB(RB)
t
/(1 +)
_

_
, (7.25)
dove =
_
1 + (RB)
2
(=

1 +B
2
).
Dimostrazione. Cominciamo con la prova di (b). Tale prova si ottiene facendo il calcolo diretto
del prodotto
R

t
R
per una generica R M(4, R). Tale prodotto fornisce immediatamente il
secondo membro di (7.25) dove per`o =

1 +B
2
. Se ulteriormente vale R SO(3), il modulo
di B coincide con quello di RB e ci`o non altera il valore di .
(a) Partendo da una generica matrice di M(4, R) della forma
:=
_

_
c
t
b A
_

_
, (7.26)
dove b, c R
3
sono due qualsiasi vettori colonna e A M(3, R) `e arbitraria, la simmetria di
implica che b = c, il cui valore comune lo indicheremo con B, e A = A
t
, la richiesta di positivit`a
della matrice implica che > 0 e A > 0. Inne limposizione della condizione di Lorentz

t
= porta alle condizioni:
(1) =

1 +B
2
in cui si deve scegliere il segno positivo per la positivit`a di gamma;
(2) AB = B;
(3) AA
t
= I +BB
t
che equivale a A
2
= I +BB
t
per la simmetria di A.
Dallultima equazione e tenuto conto del fatto che A > 0, si evince che A deve coincidere
con la radice quadrata di I + BB
t
che `e univocamente denita come sappiamo dalla sezione
precedente. Tenendo conto di (1), una matrice evidentemente (strettamente) positiva il cui
121
quadrato `e I +BB
t
`e I +BB
t
/(1 +) e che soddisfa anche (2). Questa `e dunque la soluzione.
Abbiamo provato che le matrici pure hanno la forma (7.23). Daltra parte, se
p
O(1, 3) ha
la forma (7.23), `e immediato provare che si tratta di una matrice simmetrica che soddisfa il
vincolo
p

t
p
= . Mostriamo che tale matrice `e anche necessariamente (strettamente) positiva
e ci`o conclude la dimostrazione. Se
p
ha la forma (7.25) con B ,= 0 (in caso contrario la tesi `e
ovviamente vera), usando la formula (7.25) con una R SO(3) opportuna possiamo ruotare il
vettore B in modo che abbia solo la prima componente non nulla.
`
E chiaro che, essendo
R
non
singolare, la matrice
R

t
R
`e (strettamente) positiva se e solo se
p
`e (strettamente) positiva.
Quindi la tesi si riduce a provare che una matrice della forma
_

_
B 0 0
B (1 + +B
2
)/(1 +) 0 0
0 0 1 0
0 0 0 1
_

_
, (7.27)
`e positiva dove B R. Si noti che B
2
=
2
1 per costruzione, per cui la matrice di sopra `e
scrivibile come:
_

_
B 0 0
B 0 0
0 0 1 0
0 0 0 1
_

_
, (7.28)
Il calcolo degli autovalori fornisce oltre a 1 contato due volte

= [B[ .
Essendo =

1 +B
2
> [B[ risulta

> 0, per cui tutti gli autovalori sono strettamente posi-


tivi e la matrice `e strettamente positiva. 2
Nota 7.1. Supponiamo che
p
sia la matrice di Lorentz pura che connette coordinate
minkowskiane dei riferimenti inerziali F e F

:
x

i
= C
i
+
i
p
j
x
j
.
Il vettore B R
3
`e costituito dalle componenti di

V /c nelle coordinate di F

, dove V =
c
F
+

V `e la quadri velocit`a di F. Nella componente temporale, il fattore `e proprio
0
p
0
.
In questo senso e con notazione impropria, si pu`o scrivere

p
=
_


V
t
/c

V /c I+

V

V
t
/[c
2
(1 +)]
_

_
, (7.29)
122
Similmente, se v denota il vettore colonna di R
3
le cui componenti sono le componenti della
velocit`a di trascinamento di F in F

allora si pu`o scrivere

p
=
_

_
v
t
/c
v/c I+
2
vv
t
/[c
2
(1 +)]
_

_
, (7.30)
dove la relazione tra e v come gi`a provato (vedi sotto la denizione 4.2) `e = 1/
_
1 v
2
/c
2
.
Unultima parametrizzazione si ottiene come segue partendo direttamente da (7.23). Lequazione
(7.24) implica che possiamo parametrizzare e [B[ come segue:
= cosh , (7.31)
[B[ = sinh , (7.32)
dove [0, +). Introducendo il versore n S
2
, la corrispondenza (, n) B := (sinh )n `e
biunivoca eccetto per B = 0 che corrisponde a tutti i valori di n e = 0. Inne notiamo che,
essendo sinh
2
= cosh
2
1,
BB
t
/(1 +) = (sinh
2
)nn
t
/(1 + cosh ) = (cosh 1)nn
t
.
In denitiva, le trasformazioni pure le possiamo rappresentare come

p
=
_

_
cosh (sinh )n
t
(sinh )n I+ (cosh 1)nn
t
_

_
, (7.33)
dove [0, +) e n S
2
ed, eccetto per = 0, la corrispondenza sopra scritta tra trasfor-
mazioni pure di Lorentz e parametri (, n) [0, +) S
2
`e biunivoca.
In termini di velocit`a di trascinamento di F rispetto a F

, con le convenzioni usate sopra, si ha


subito che
v/[v[ = n , (7.34)
[v[/c = tanh . (7.35)
Lultima rappresentazione trovata nellosservazione di sopra pu`o anche essere scritta in altro
modo.
Teorema 7.5. (Rappresentazione esponenziale delle trasformazioni pure.) Le trasfor-
mazioni pure di Lorentz sono tutte e sole le matrici della forma
e
nK
, (7.36)
123
dove n S
2
e R. Inoltre la corrispondenza tra matrici pure di Lorentz e coppia di parametri
(, n) ad esse associate `e biunivoca se n S
2
e > 0.
Dimostrazione. In base allosservazione di sopra,`e suciente provare che, per ogni (, n)
R S
2
:
e
nK
=
_

_
cosh (sinh )n
t
(sinh )n I+ (cosh 1)nn
t
_

_
. (7.37)
Per provare ci`o indichiamo con

il primo e secondo membro della (7.37). Vogliamo provare


che

.
A tale scopo notiamo che per ogni n S
2
esiste R SO(3) tale che Rn = e
1
primo vettore della
base canonica di R
3
. Consideriamo allora
R
associata a R secondo la (7.11). Il calcolo diretto
(o passando per (b) del teorema 7.4) prova subito che

t
R
=
_

_
cosh (sinh )e
t
1
(sinh )e
1
I+ (cosh 1)e
1
e
t
1
_

_
. (7.38)
In altre parole:

t
R
=
_

_
cosh sinh 0 0
sinh cosh 0 0
0 0 1 0
0 0 0 1
_

_
. (7.39)
Consideriamo ora

. Usando lo sviluppo dellesponenziale non ci sono dicolt`a a provare che

t
R
= e
n
R
K
t
R
.
Usando (7.12) ed il lemma 6.1 nel secondo membro abbiamo immediatamente che

t
R
= e
(Rn)K
,
ossia

t
R
= e
e
1
K
= e
K
1
.
Inne il calcolo esplicito dellesponenziale e
K
1
(per esempio con la solita procedura basata sul
teorema di unicit`a delle soluzioni di equazioni dierenziali) mostra che

t
R
= e
K
1
=
_

_
cosh sinh 0 0
sinh cosh 0 0
0 0 1 0
0 0 0 1
_

_
. (7.40)
124
Per confronto con (7.39) abbiamo ottenuto che

t
R
=
R

t
R
,
che implica subito, moltiplicando a sinistra per
t
R
e a destra per
R

.
la dimostrazione `e conclusa. 2
Le trasformazioni pure di Lorentz includono le ben note cosiddette trasformazioni speciali di
Lorentz che si ottengono quando la velocit`a di trascinamento `e parallela ad uno dei tre assi delle
coordinate spaziali minkowskiane. Abbiamo gi`a incontrato le trasformazioni speciali lungo lasse
x
3
varie volte nelle sezioni precedenti.
Denizione 7.2. (Trasformazioni speciali di Lorentz.) Una trasformazione pura di
Lorentz tale che, in riferimento alla rappresentazione del teorema 6.4, n = e
i
(i-esimo versore di
R
3
) `e detta trasformazione speciale di Lorentz lungo lasse x
i
.
Se v `e il valore scalare con segno della velocit`a di trascinamento di F rispetto a F

dotati di
coordinate minkowskiane in modo tale che la trasformazione di coordinate
x

i
=
i
j
x
j
sia una trasformazione speciale lungo lasse iesimo, risulta subito che, posto x
0
= ct e x

0
= ct

e j ,= i,
t

= (t +
v
c
2
x
i
) , (7.41)
x

i
= (x
i
+vt) , (7.42)
x

j
= x
j
. (7.43)
dove al solito = 1/
_
1 v
2
/c
2
.
Commenti 7.3.
(1) Come gi`a osservato precedentemente le trasformazioni di Lorentz non preservano gli angoli
tra i versori. Tuttavia ci`o accade per trasformazioni speciali di Lorentz: in entrambi i riferimenti
connessi da una trasformazione speciale di Lorentz, la terna dellaltro riferimento individuer`a una
terna in movimento che sar`a ancora ortogonale. Si osservi che ci`o non accade per trasformazioni
pure generiche per cui non si pu`o aermare che le trasformazioni pure sono le trasformazioni che
corrispondono ai moti relativi di terne inerziali ad assi paralleli. Lunica aermazione sicamente
sensata `e che, in base al teorema di decomposizione delle matrici di Lorentz, le trasformazioni
pure sono le trasformazioni di Lorentz che non contengono rotazioni. A dierenza della situazione
classica ci`o non implica automaticamente che le terne di assi rappresentate nei rispettivi spazi
125
di quiete procedano ad assi paralleli.
(2)
`
E immediato provare che:
le trasformazioni speciali di Lorentz lungo lasse i-esimo costituiscono un sottogruppo ad un
parametro del gruppo di Lorentz generato dal boost K
i
.
Tuttavia, a causa della relazione di commutazione
[K
i
, K
j
] =
ij
k
S
k
,
la composizione di due trasformazioni speciali lungo assi dierenti non `e nemmeno una trasfor-
mazione pura! Linsieme delle trasformazioni pure di Lorentz non `e un sottogruppo del gruppo
di Lorentz.
Questo risultato ha conseguenze siche non banali, per esempio nel fenomeno della precessione
di Thomas in cui in un riferimento inerziale F si descrive una terna di assi solidale ad un altro
riferimento inerziale F

(e quindi in moto in F) come se ruotasse, anche se tale terna soddisfa


una denizione relativisticamente invariante di terna non rotante.
(3) In riferimento alla rappresentazione delle trasformazioni pure discussa sopra:

p
=
_

_
v
t
/c
v/c I+
2
vv
t
/[c
2
(1 +)]
_

_
,
si verica subito che (essendo immutato il valore di in tutti e tre i casi)
P
p
P =
_

_
v
t
/c
v/c I+
2
(v)(v
t
)/[c
2
(1 +)]
_

_
,
e
T
p
T =
_

_
v
t
/c
v/c I+
2
(v)(v
t
)/[c
2
(1 +)]
_

_
,
mentre
PT
p
TP =
_

_
v
t
/c
v/c I+
2
vv
t
/[c
2
(1 +)]
_

_
.
Il signicato sico di queste identit`a `e ovvio se si tiene conto che sia linversione del tempo e sia
linversione di parit`a devono cambiare segno al vettore velocit`a. Si osservi che come conseguenza
di quanto ottenuto e del fatto che TT = PP = TPTP = I, si ha che T, P, TP non commutano
con le matrici del gruppo di Lorentz quando queste contengano trasformazioni pure di Lorentz
nella decomposizione polare.
126
7.3 Teoremi di decomposizione e rappresentazione del gruppo
di Lorentz.
Per concludere possiamo enunciare e provare un teorema di rappresentazione del gruppo di
Lorentz ortocrono proprio ed in particolare possiamo provare il teorema 3.1.
Teorema 7.6. (Rappresentazione del gruppo di Lorentz ortocrono proprio.) Le
matrici SO(1, 3) sono tutte e sole le matrici di M(4, R) della forma
=
R

p
, (7.44)
per ogni scelta di R SO(3) e per ogni trasformazione pura di Lorentz
p
; ovvero
= e
nS
e
mK
, (7.45)
per ogni scelta di n, m S
2
, , R.
Equivalentemente, le matrici SO(1, 3) sono tutte e sole le matrici di M(4, R) della forma
=

R
, (7.46)
per ogni scelta di R

SO(3) e per ogni trasformazione pura di Lorentz

p
; ovvero
= e

K
e

S
, (7.47)
per ogni scelta di n

, m

S
2
,

R. Inoltre valgono i seguenti fatti.


(1) In entrambi i casi le coppie (m, ) e (m

) sono determinate biunivocamente da I ,=


SO(1, 3) purch`e ci si restringa allinsieme S
2
(0, +).
(2) In entrambi i casi le coppie (, n) e (

, n

) sono determinate biunivocamente da I ,=


SO(1, 3) purch`e ci si restringa allinsieme S
2
(0, ] e con leccezione che (n, ) e (n, )
producono lo stesso primo fattore nel secondo membro di (7.45), e rispettivamente (n

) e
(n

) che producono lo stesso secondo fattore nel secondo membro di (7.47).


(3) Per una ssata SO(1, 3), ,= I, in riferimento alle decomposizioni (7.45) e (7.47) e
con le restrizioni in (1) e (2) valgono le identicazioni
n

= n , (7.48)

= , (7.49)
m

= e
nS
m, (7.50)

= . (7.51)

Dimostrazione. Se SO(1, 3), per il teorema 7.3, =


p
dove
p
`e pura. Si noti che

1
p
SO(1, 3) per il punto (5) del teorema 7.3 ed essendo SO(1, 3) un gruppo. Allora
127
=
1
p
SO(1, 3) e deve essere necessariemante della forma
R
(7.11) con R SO(3).
Usando (7.12) ed il teorema 7.5 abbiamo inne che:
= e
mS
e
nK
per qualche , R e n, m S
2
. Se, viceversa consideriamo una matrice della forma =
e
mS
e
nK
il teorema 7.5 assicura che e
nK
SO(1, 3). Inoltre e
mS
`e della forma (7.11) con
R = e
mS
SO(3) per cui `e immediato avere che e
mS
SO(1, 3) Essendo SO(1, 3) un
gruppo, = e
mS
e
nK
SO(1, 3). La dimostrazione si esegue nello stesso modo con le debite
dierenze considerando una decomposizione =
p
. Il punto (1) segue dallosservazione (1)
dopo il teorema 6.5 e dallunicit`a dei fattori della decomposizione polare del teorema 7.3. Il pun-
to (2) segue dal teorema 7.5 e dallunicit`a dei fattori della decomposizione polare del teorema
7.3. Il punto (3) segue dal punto (3) del teorema 7.3. 2
Segue immediatamente un importante conseguenza che presentiamoi come teorema.
Teorema 7.7. (Decomposizione in trasformazioni speciali e rotazioni.) Se
SO(1, 3) allora esistono R, R

SO(3) ed una trasformazione speciale di Lorentz lungo il terzo


asse
3
tali che:
=
R

R
,
ovvero in altri termini
= e
nS
e
K
3
e

S
,
per qualche n, n

S
2
, ,

, R.
Dimostrazione. In base al teorema precedente, se SO(1, 3) , = e
nS
e
mK
. Sia
B SO(3) tale che Bm = e
3
. Allora usando il lemma 7.1 e la (7.12):
e
mK
= e
(Be
3
)K
= e

B
e
3
K
t
B
=
B
e
e
3
K

t
B
=
B
e
K
3

B
t .
Di conseguenza, ponendo
R
= e
nS
,
= e
nS

B
e
K
3

B
t =
R

B
e
K
3

t
B
.
Dato che A
A
`e una rappresentazione gruppale,
R

B
=
RB
e dunque
=
RB
e
K
3

B
t .
Ridenendo le matrici di SO(3): RB come R e B
t
come R

segue banalmente la tesi. 2


Nota 7.2. Il teorema provato ha come conseguenza il teorema 3.1. Infatti se F e F

sono
sistemi di riferimento inerziali, scelti due sistemi di coordinate minkowskiane F,

, la
trasformazione di Poincare che lega tali sistemi di coordinate, ossia


1
, sar`a della forma
z
i
= C
i
+
i
j
z
j
.
128
dove O(1, 3) e C
i
R. Ridenendo le coordinate in F

come
y
i
= (
R
)
i
j
(z

j
C
j
)
dove R O(3), il nuovo sistema di coordinate sar`a ancora solidale con F

e varr`a
y
i
=
i
j
z
j
,
dove =
R
. Ci sono due possibilit`a: det = 1 ed in tal caso SO(1, 3) con la scelta
banale R = I, oppure det = 1; in tal caso, scegliendo R = I, risulta SO(1, 3) .
In denitiva abbiamo trovato due sistemi di coordinate minkowskiane solidali con F e F

e
connessi da una trasformazione di Lorentz ortocrona propria.
y
i
=
i
j
z
j
,
con SO(1, 3). Applicando il teorema 7.7 a e denendo x

i
:= (
R
t )
i
j
y
j
e x
i
= (
R
)
i
j
z
j
,
per costruzione i due nuovi sistemi di coordinate minkowskiane sono ancora solidali con F

e
F e inoltre vale
x

i
=
_
e
K
3
_
i
j
x
j
,
cio`e la trasformazione di coordinate `e una trasformazione speciale lungo il terzo asse.
7.4 Le componenti connesse del gruppo di Lorentz.
Consideriamo i seguenti sottoinsiemi di O(1, 3):
O(1, 3)
+
:= O(1, 3) [ det > 0 ,
0
0
> 0 , (7.52)
O(1, 3)

:= O(1, 3) [ det < 0 ,


0
0
> 0 , (7.53)
O(1, 3)
+
:= O(1, 3) [ det > 0 ,
0
0
< 0 , (7.54)
O(1, 3)

:= O(1, 3) [ det < 0 ,


0
0
< 0 . (7.55)
`
E chiaro che si tratta di insiemi disgiunti per costruzione, inoltre
O(1, 3) := O(1, 3)
+
O(1, 3)

O(1, 3)
+
O(1, 3)

(7.56)
in quanto se O(1, 3), come pi` u volte notato, det = 1 ed ulteriormente
0
0
+1 oppure

0
0
1 per il il teorema 2.3. Per gli stessi motivi possiamo equivalentemente riscrivere il
membro di destra delle denizioni di sopra come:
O(1, 3)
+
:= O(1, 3) [ det = +1 ,
0
0
> +1 , (7.57)
O(1, 3)

:= O(1, 3) [ det = 1 ,
0
0
> +1 , (7.58)
O(1, 3)
+
:= O(1, 3) [ det = +1 ,
0
0
< 1 , (7.59)
O(1, 3)

:= O(1, 3) [ det = 1 ,
0
0
< 1 . (7.60)
129
Notiamo ancora che O(1, 3)
+
`e un sottogruppo di O(1, 3) come `e immediato provare tenendo
conto che risulta essere lintersezione del sottogruppo ortocrono O(1, 3) e del sottogruppo
SO(1, 3) costituito dalle matrici di Lorentz con determinante +1 (il fatto che tale insieme sia
un sottogruppo `e di verica immediata).
I rimanenti sottoinsiemi O(1, 3)

, O(1, 3)
+
, O(1, 3)

non sono sottogruppi perche non


contengono I per denizione.
Tenendo conto del fatto che TT = PP = I dove linversione del tempo T e linversione di parit`a
P sono denite in (7.15) (ovvero nel teorema 2.3) e (7.14) segue subito che, con ovvie notazioni:
O(1, 3)

= PO(1, 3)
+
,
O(1, 3)
+
= PTO(1, 3)
+
,
O(1, 3)

= TO(1, 3)
+
.
Il risultato pi` u importante `e comunque che i 4 sottoinsiemi di O(1, 3) sopra deniti sono le
componenti connesse del gruppo di Lorentz:
Teorema 7.8. (Componenti connesse del gruppo di Lorentz.) I quattro sottoinsiemi
di O(1, 3) deniti in (7.57)-(7.60) costituiscono le componenti connesse del gruppo di Lorentz di
cui solo
SO(1, 3):= O(1, 3)
+

detto (sotto) gruppo ortocrono proprio o (sotto) gruppo ortocrono speciale `e sottogrup-
po di O(1, 3).
Valgono inne le relazioni:
O(1, 3)

= PSO(1, 3) , (7.61)
O(1, 3)
+
= PTSO(1, 3) , (7.62)
O(1, 3)

= TSO(1, 3) . (7.63)

Dimostrazione. Dato che i quattro insiemi sono disgiunti e la loro unione `e O(1, 3) lunica
cosa che rimane da provare e che non `e stata gi`a provata sopra `e che essi sono aperti e connessi.
`
E suciente provare che SO(1, 3) `e aperto e connesso. Una volta provato ci`o, essendo la
moltiplicazione per T, P, TP un dieomorsmo di O(1, 3) in O(1, 3), segue che anche O(1, 3)

, O(1, 3)
+
, O(1, 3)

sono aperti e connessi.


SO(1, 3) `e aperto (nella topologia di O(1, 3)) perche dato dallintersezione di due insiemi
aperti: rispettivamente la controimmagine dellinsieme (0, +) rispetto a det : O(1, 3) R e la
controimmagine dello stesso insieme rispetto alla funzione che calcola
0
0
per ogni O(1, 3).
La connessione di SO(1, 3) si prova come segue. Se SO(1, 3), per il teorema 7.3, =
p

dove
p
`e pura. Si noti che
1
p
SO(1, 3) per il punto (5) del teorema 7.3 ed essendo
SO(1, 3) un gruppo. Allora =
1
p
SO(1, 3) e deve essere necessariemante della forma
130

R
(7.11) con R SO(3). Usando (7.12) ed il teorema 7.5 abbiamo inne che:
= e
mS
e
nK
per qualche , R e n, m S
2
. Possiamo costruire un cammino continuo
[0, 2] t (t) SO(1, 3)
che connette I a in SO(1, 3):
(t) := e
tmS
se t [0, 1) ,
(t) := e
mS
e
(t1)nK
se t [1, 2] .
Il fatto che per ogni t [0, 2] gli elementi del cammino siano in SO(1, 3) `e immediato. Scegliendo
di seguito u e v in modo da esaurire tutti i casi possibili da vericare, si ha
det e
umS
e
vnK
= det e
umS
det e
vnK
= e
vntrK
e
umtrS
= e
0
e
0
= 1 ,
dove e
umS
=
R
`e dato da (7.11) per cui e
umS
O(1, 3) e inne e
umtrS
`e una trasfor-
mazione pura per il teorema 7.5 per cui `e un elemento di O(1, 3) per il teorema 7.3 punto (5).
Dunque SO(1, 3) `e connesso per archi e quindi connesso. 2
Segue immediatamente un ovvio ma importante corollario.
Corollario. SO(1, 3) `e un gruppo di Lie matriciale in quanto sottogruppo di Lie di O(1, 3),
inoltre, se so(1, 3) denota lalgebra di Lie di SO(1, 3), so(1, 3)= o(1, 3).
Nota 7.3.
`
E ovvio che da (7.61), (7.62) e (7.63) seguano teoremi di decomposizione e rap-
presentazione delle componenti connesse del gruppo di Lorentz diverse da quella che contiene
lidentit`a gruppale.
Esercizi 7.1. .
1. Mostrare che il gruppo di Poincare `e un gruppo di Lie matriciale sottogruppo di GL(5, R).
Suggerimento. Considerare la classe di matrici
_
C
0 1
_
; (7.64)
dove C R
4
e O(1, 3).
2. Mostrare che lalgebra di Lie del gruppo di Poincare `e la somma diretta so(1, 3) R
4
come spazio vettoriale, ma non lo e come algebra di Lie (cio`e il commutatore non soddisfa
[(A, t), (A

, t

)] = ([A, A

], 0) ,
dove A, A

so(1, 3) e t R
4
).
131
Capitolo 8
Le idee sico-matematiche alla base
della teoria Generale della Relativit`a
.
8.1 Il Principio di Equivalenza di Einstein ed i fondamenti sico-
geometrici della Relativit`a Generale.
La teoria della Relativit`a Generale fu formulata da Einstein dieci anni dopo la teoria della
Relativit`a Speciale. La seconda ingloba la teoria del campo gravitazionale allinterno della
geometria dello spaziotempo. Lidea centrale di Einstein per rappresentare la gravit`a in termini
geometrici `e basata sul cosiddetto principio di equivalenza. Il principio di equivalenza che
formuleremo tra poco `e basato sullosservazione fondamentale, sottolineata da Einstein, che la
massa gravitazionale e la massa inerziale coincidono. La prima `e la costante M, caratteristica
di un corpo, che compare nella formula della gravitazione universale di Newton:
F = G
MM

[[P Q[[
3
(P Q) ,
dove F `e la forza gravitazionale che il corpo di massa M

in Q esercita sul corpo di massa M in


P. La massa inerziale m `e invece la costante, caratteristica di un corpo, che appare nel secondo
principio della dinamica:
F(t, P, v) = ma
P
,
dove a
P
`e laccelerazione del punto materiale P di massa inerziale m, valutata in un riferimento
inerziale, e F `e la forza totale agente sul punto materiale. Newton postul`o che
M = m.
Questa coincidenza di valori `e stata vericata sperimentalmente con incredibile precisione in
diversi esperimenti con pendoli a torsione di Eotvos (con un errore di relativo di 10
9
) e da Dicke
132
e collaboratori in tempi pi recenti (con un errore relativo di 10
12
). La coincidenza delle due
nozioni di massa ha limportante conseguenza stabilita dal cosiddetto Principio di Equivalenza
di Einstein (in forma debole) che sancisce, in sica classica, lequivalenza tra locale i campi
gravitazionali e le forze inerziali:
Principio di Equivalenza di Einstein.
`
E possibile annullare localmente leetto dinamico
del campo gravitazionale tramite le forze inerziali in un riferimento in caduta libera nel campo
gravitazionale. Viceversa `e possibile creare gli eetti dinamici dovuti ad un campo gravitazionale
lavorando in un riferimento accelerato rispetto ad un riferimento inerziale.
Nota 8.1. Localmente signica sopra: in regioni spaziali sucientemente piccole e per
intervalli di tempo sucientemente brevi.
Esemplichiamo il signicato sico di tale principio. In sica classica, consideriamo un campo
gravitazionale g = g(t, P) arbitrario valutato in coordinate di un riferimento ineziale I. g(t, P)
`e quindi il vettore accelerazione di gravit`a nel punto P nello spazio di quiete del riferimento
ed allistante t. Consideriamo ora un nuovo riferimento, non inerziale, I

in caduta libera nel


campo gravitazionale. Tale riferimento si costruisce prendendo una particella O che si muove
nel riferimento I con accelerazione:
a
O
[
I
(t) = g(t, O(t)) .
Dotiamo quindi il punto O di un sistema di assi cartesiani ortonormali centrati ad ogni istante
in O(t) e assumiamo che tali assi non ruotino rispetto agli assi di I. In tal modo il riferimento
I

solidale con O e con gli assi costruiti non ruota rispetto a I.


Svolgiamo ora elementari esperimenti di dinamica nel riferimento I

. Prendiamo un punto
materiale P dotato di massa inerziale m e massa gravitazionale M e lanciamolo, partendo da O
con una arbitraria velocit`a iniziale. Quale sar`a il suo moto in I

? Le equazioni del moto di P


in I si scrivono:
ma
P
[
I
= Mg(t, P(t)) .
Ma, essendo il moto di I

rispetto a I puramente traslatorio, abbiamo anche che:


a
P
[
I
(t) = a
P
[
I
(t) +a
O
[
I
(t)
Pertanto le equazioni del moto di P nel riferimento I

si possono scrivere
ma
P
[
I
(t) = ma
O
[
I
(t) +Mg(t, P(t)) ,
ovvero, tenendo conto di a
O
[
I
(t) = g(t, O(t)),
ma
P
[
I
(t) = mg(t, O(t)) +Mg(t, P(t)) .
Inne tenendo conto che m = M si trova che, per ogni punto materiale di massa inerziale
arbitraria m:
ma
P
[
I
(t) = m(g(t, P(t)) g(t, O(t))) .
133
Vediamo allora che tanto pi` u il punto P si trova vicino allorigine O delle coordinate del rifer-
imento I

e questo succeder`a considerando tempi suucientemente piccoli dato che il punto


materiale P parte inizialmente da O tanto pi` u il suo moto assomiglier`a al moto rettilineo
uniforme, come se il punto non fosse sottoposto ad alcuna forza, alla forza gravitazionale in
particolare.
Viceversa possiamo creare gli eetti di un campo gravitazionale lavorando in un riferimento non
inerziale I

accelerato rispetto ad un riferimento inerziale I. A titolo esemplicativo, supponi-


amo che I

sia determinato rispetto al riferimento inerziale I assegnando, come prima, il moto


accelerato dellorigine degli assi di I

, indicata con O e supposta avere accelerazione costante


a
O
[
I
rispetto a I. Supporremo nuovamente che il moto di I

sia puramente traslatorio rispetto


a I. Lequazione della dinamica, per un punto materiale P di massa m non sottoposto a forze,
sar`a nel riferimento I:
ma
P
[
I
= 0
e quindi, nel riferimento I

:
ma
P
[
I
(t) = ma
O
[
I
g .
In altre parole, nel riferimento I

vale, per ogni punto materiale di qualunque massa inerziale


m e massa gravitazionale M:
ma
P
[
I
(t) = Mg (8.1)
dove il campo gravitazionale che appare in I `e denito da g = a
O
[
I
. Lequazione (8.1),
ancora una volta, ha senso perche M = m.
Nota 8.2. Questi risultati non sono aatto banali perche coinvolgono la natura del campo
gravitazionale e la struttura generale della formulazione della dinamica in sica classica. Con-
siderando altri tipi di campi di forze in luogo del campo gravitazionale, non si ha lo stesso
risultato, anche assumendo luguaglianza della massa inerziale e di quella gravitazionale.
Un secondo risultato conseguente dal fatto che la massa gravitazionale coincida con quella in-
erziale, `e che il moto di un punto materiale in un assegnato campo gravitazionale non dipende
dalla massa del corpo, ma solo dalla sua posizione e velocit`a iniziale.
Questi due fatti portarono Einstein, nel tentativo di dare una descrizione relativistica della grav-
it`a estendendo la teoria della relativit` a speciale, ad assumere i seguenti fatti, che fondano la
teoria della relativit`a generale:
RG1. Lo spaziotempo, anche nella situazione che corrisponde classicamante alla presenza di
gravitazione, `e descritto da variet`a dierenziabile quadridimensionale con metrica lorentziana
, connessa e temporalmente orientata.
Nota 8.3. La richiesta di connessione (necessaria per lorientabilit`a temporale) `e sicamente
ovvia: non ci sarebbe nessuna possibilit`a di comunicare tra regioni sconnesse.
134
RG2. Il moto dei corpi puntiformi che classicamante erano visti come sottoposti al solo campo
gravitazionale `e descritto dalle geodetiche (di tipo causale futuro) nello spaziotempo rispetto alla
connessione di Levi-Civita associata a . In questo senso, il contenuto sico del campo gravi-
tazionale classico `e ora descritto da propriet`a della metrica dello spaziotempo.
RG3. Esistono sistemi di riferimento, corrispondenti a quelli che classicamante erano i sistemi
di riferimento di caduta libera, in cui le leggi della sica, formulate nella teoria speciale della
relativit`a nei sistemi di riferimento inerziali, sono ancora valide localmente. In particolare le
geodetiche temporali appaiono, localmente, come moti rettilinei uniformi.
Il terzo dei tre principi enunciati sopra cade sotto il nome di principio di equivalenza forte.
Mostreremo tra poco come dare signicato matematico alle assunzioni di Einstein. Per fare ci`o
, introdurremo alcuni potenti strumenti matematici di geometria dierenziale (pseudo) rieman-
niana.
Per concludere possiamo dare la seguente denizione di spaziotempo del tutto generale, che sar`a
lambiente nel quale sviluppare la teoria della Relativit`a generale:
Denizione 8.1. Uno spaziotempo della relativit`a generale, o pi` u brevemente uno
spaziotempo, `e una variet`a dierenziabile di dimensione 4 e classe C

dotata di una metrica


C

lorentziana . Tale variet`a `e assunta essere connessa ed orientata temporalmente. .


8.2 Exponential map e le sue applicazioni in Relativit`a generale.
Introdurremo ora uno strumento matematico importante che ci permetter`a di dare signica-
to matematicamente rigoroso al principio di equivalenza di Einstein per formulare la Relatvit`a
Generale. Questo strumento `e un particolare sistema di coodinate nellintorno di un ssato pun-
to di una variet`a (pseudo) riemanniana o pi` u in generale di una variet`a dotata di connessione
ane. Attraverso tale sistema di coordinate si pu`o identicare un intorno della variet`a con lo
spazio tangente alla variet`a .
8.2.1 Lexponential map e le coordinate normali attorno ad un punto.
Consideriamo una variet`a dierenziabile M dotata di una connessione ane . Assumeremo
che entrambe siano C

anche se C
2
`e suciente per quanto segue. Se (U, ) `e una car-
ta locale su M con coordinate x
1
, . . . , x
n
, consideriamo le coordinate naturali locali su TM,
(x
1
, . . . , x
n
, x

1
, . . . , x

n
) indotte dalla carta (U, ).
Ricordiamo che questo sistema di coordinate naturali indotto dalla carta locale (U, ) su M con
coordinate x
1
, . . . , x
n
`e denito dal fatto che ogni vettore tangente in T
p
M con U p e con
coordinate x
1
p
, . . . , x
n
p
, ha componenti:
x

i
v

x
i
[
p
.
135
Lelemento (p, v) TM `e dunque individuato dalla 2n-pla (x
1
p
, . . . , x
n
p
, x

1
v
, . . . , x

n
v
).
Il problema di Cauchy associato allequazione delle geodetiche della connessione , visto come
un problema di Cauchy del primordine in TM, si scrive esplicitamente nelle coordinate dette:
_

_
dx

i
dt
= (x
1
(t), . . . , x
n
(t))
i
jk
x

j
x

k
,
dx
i
dt
= x

i
(t) ,
x
i
(0) = x
i
p
x

i
(0) = x

i
p
,
i = 1, . . . n . (8.2)
In particolare (x
1
p
, . . . , x
n
p
) sono le coordinate di p U, il punto di partenza dalla geodetica con
vettore tangente iniziale x

p
= x

i
p

x
i
[
p
. Indichiamo lunica soluzione massimale (in U) di (8.2)
con = (p, v
p
, t), dove p U, v
p
T
p
M e t appartiene a qualche intervallo aperto I 0 che
dipende da p e v
p
in generale. Nel seguito rappresenteremo (p, v
p
) in termini delle corrispondenti
coordinate (x
1
p
, . . . , x
n
p
, x

1
v
p
, . . . , x

n
v
p
) (U) R
n
R
n
R
n
.
Come ben noto, dalla teoria generale dei sistemi di equazioni dierenziali, se uno considera
soluzioni massimali e ne varia le condizioni iniziali p U, v
p
T
p
M, prendendo t nel risultante
intervallo, il dominio globale R
n
R
n
R di = (p, v
p
, t), al variare di tutte le variabili
(p, v
p
, t) risulta essere un insieme aperto di R
n
R
n
R. Di conseguenza, se ssiamo r U, ci
sar`a un insieme di forma V
r
B

(0) (, ) con > 0, essendo B

(0) la palla aperta in R


n
di raggio > 0 centrata in 0 ed essendo V
r
U un intorno aperto di r tale che
V
r
B

(0) (, ) (p, v
p
, t) (p, v
p
, t)
`e ben denita. Riduciamoci dora in poi a lavorare su questo insieme.
Lequazione (8.2) ed il teorema di unicit`a delle soluzioni dei sistemi di equazioni dierenziali
implicano subito che, per ogni > 0, se la geodetica t (p, v
p
, t) `e denita per t (, ),
allora la geodetica t (p, v
p
, t) `e denita per t (/, /), e
(p, v
p
, t) = (p, v
p
, t) . (8.3)
(Infatti il membro di destra, pensato come una funzione di t (/, /), soddisfa lequazione
delle geodetiche con vettore tangente iniziale in p dato da v
p
.) Quindi possiamo ssare > 0
piccolo a sucienza al ne di ottenere

:= / > 1. Concludiamo che, se (p, u


p
) V
r
B

(0)
con

= , allora la funzione:
V
r
B

(0) (p, u
p
) (p, u
p
, t)
`e ben denita per t (

) (1, 1). In denitiva, se > 0 `e sucientemente piccolo, la


funzione
V
r
B

(0) (p, u
p
) exp
p
(u
p
) := (p, u
p
, 1) (8.4)
`e ben denta. Si osservi che teoremi noti riguardanti la dipendenza regolare delle soluzioni di
equazioni dierenziali dai dati iniziali implicano che (p, u
p
) exp
p
(u
p
) `e una funzione C

.
136
Per ogni p V
r
, la palla B

(0) R
n
si identica con un intorno aperto e stellato dellorigine
1
di T
p
M. Lidenticazione avviene tramite la funzione che associa al vettore colonna di R
n
il
corrispondente vettore di T
p
M con le stesse componenti rispetto alla base /x
i
[
p

i=1,...,n
.
Denizione 8.2. Sia M una variet`a dierenziabile C

dotata di una connessione ane


di classe C

.
(a) La funzione (8.4) denita in un insieme aperto E TM, (sucientemente piccolo e rappre-
sentato, in coordinate locali naturali di TM, come prodotto V
r
B

(0)) `e detta exponential


map su E.
(b) Se p M, la restrizione dellexponential map a p U
0
, dove U
0
`e un opportune intorno
aperto e stellato dellorigine 0 di T
p
M, `e detto exponential map centrato in p.
Nota 8.4. Lequazione (8.3) con t = 1 si scrive
(p, v
p
, 1) = (p, v
p
, ) ,
ossia:
exp
p
(v
p
) = (p, v
p
, ) .
Questa identit`a dice che la funzione (ben denita perche lintorno di denizione di exp
p
`e
stellato)
[0, 1] exp
p
(v
p
) M, (8.5)
denisce lunico segmento di geodetica che parte da p, con vettore tangente v
p
e parametro ane
[0, 1].
Possiamo ora enunciare e provare il risultato fondamentale riguardante lexponential map.
Teorema 8.1. Sia M una variet`a dierenziabile C

dotata di una connessione ane di


classe C

. Si consideri lexponential map centrato in un punto p M. Valgono i seguenti fatti.


(a) In un intorno aperto e stellato U
0
dellorigine di T
p
M, lexponential map denisce un dieo-
morsmo sullinsieme aperto exp
p
(U
0
). In tal modo i vettori in un intorno aperto dellorigine di
T
p
M vengono dierenziabilmente e biunivocamente identicati con i punti in un intorno aperto
di p.
(b) Se ha torsione nulla e e
pi

i=1,...,n
T
p
M `e una base, si consideri il sistema di coordinate
locali su exp
p
(U
0
) che associa q exp
p
(U
0
) alle componenti di exp
1
p
(q) respetto alla base detta:
q
_
exp
1
p
(q), e
1
p
), , exp
1
p
(q), e
1
p
)
_
.
In quel sistema di coordinate i coecienti di connessione di si annullano in p.
(c) Se `e la connessione di Levi-Civita associata con una (pseudo)-metrica di classe C

1
Un intorno aperto e stellato dellorigine O di uno spazio vettoriale topologico V `e un intorno aperto U di 0
tale che, se v U, allora il segmento che unisce 0 a v `e anchesso completamente contenuto in U.
137
su M, e e
pi

i=1,...,n
T
p
M `e una base, in riferimento alle coordinate locali introdotte in (a),
le componenti delle derivate della metrica rispetto alle coordinate si annullano in p.
Dimostrazione. Per dimostrare (a) `e suciente fare vedere che d exp
p
[
p
`e non singolare.
Fissiamo un sistema di coordinate locali attorno a p con coordinate x
1
, . . . , x
n
and denotiamo
con (exp
p
(v))
i
la componente i-esima della funzione di exp
p
(v). Vale, dove non usiamo la
convenzione di somma sugli indici ripetuti:

v
j

v=0
_
exp
_
n

i=1
v
i
e
pi
__
k
=

v
j

v=0
_
exp
_
v
j
e
pj
__
k
=

=0
(exp (e
pj
))
k
.
Usando losservazione 8.4 si ha inne:

v
j

v=0
_
exp
_
n

i=1
v
i
e
pi
__
k
=

=0

k
(p, e
pj
, ) = e
k
pj
,
dove e
k
pj
`e la k-esima componente di e
pj
rispetto alla base /x
i
[
p

i=1,...,n
. Le la matrice le cui
colonne sono le componenti di questi vettori di R
n
`e nonsingolare dato che e
pj

j=1,...,n
`e una
base. La dimostrazione di (a) `e terminata.
In coordinate y
1
, . . . , y
n
denite su exp
p
(U
0
) e che associano q exp
p
(U
0
) con le componenti
di exp
1
p
(q) rispetto alla base e
pi

i=1,...,n
, ogni geodetica che parte da p con vettore tangente
iniziale v
p
= v
i
e
pi
ha dunque equazione: y
i
() = v
i
. Infatti, la curva v
i
, in tali coordinate,
viene trasformata dallexponential map in p in:
exp
p
_

i=1
v
i
e
pi
_
= (p, v
p
, 1) = (p, v
p
, ) .
Per le geodetiche uscenti da p e lavorando in tali coordinate vale che, per i = 1, . . . , n
d
2
y
i
()
d
2
= 0 .
Daltra parte deve anche valere, per la denizione generale di geodetica:
d
2
y
i
d
2
+
i
jk
(y
1
(), . . . , y
n
())
dy
j
d
dy
k
d
= 0 .
Di conseguenza, per ogni [0, 1]:

i
jk
(y
1
(), . . . , y
n
())
dy
j
d
dy
k
d
= 0 .
In particolare, se = 0:

i
jk
(p)v
j
v
k
= 0 , per ogni scelta dei v
j
R, j = 1, . . . , n. (8.6)
138
Se la connessione ha torsione nulla, cioe
i
jk
=
i
kj
, (8.6) implica, scegliendo v
i
= u
i
+ z
i
per
ogni u
i
, z
i
R, che deve valere
i
jk
(p)u
j
z
k
= 0 per ogni u
i
, z
i
R. Di conseguenza:

i
jk
(p) = 0 .
La dimostrazione di (c) ora segue immediatamente tenendo conto del fatto che lidentit`a = 0,
valida per la connessione di Levi-Civita, in coordinate ha la forma, se = g
ij
dx
i
dx
j
:
g
ki
y
j
=
s
jk
g
si
+
s
ji
g
ks
.
2
Denizione 8.3. Sia M una variet`a dierenziabile C

dotata di una connessione ane


di classe C

e sia p M. Si consideri un intorno aperto stellato dellorigine 0 di T


p
M su cui
exp
p
denisce un dieomorsmo locale. Se e
pi

i=1,...,n
T
p
M `e una base, le coordinate locali
denite su exp
p
(U
0
) che associano ogni q exp
p
(U
0
) alle componenti di exp
1
p
(q) sulla base
detta:
q
_
exp
1
p
(q), e
1
p
), , exp
1
p
(q), e
1
p
)
_
sono dette coordinate normali (riemanniane) centrate in p.
8.2.2 Coordinate normali adattate ad una curva assegnata.
Passiamo a considerare un sistema di coordinate normali pi` u complesso ed associato ad una
assegnata curva dierenziabile. Se M `e la solita variet`a dierenziabile dotata di una metrica
riemanniana o lorentziana = g
ij
dx
i
dx
j
, sia : (a, b) M una curva dierenziabile regolare,
cioe con (t) ,= 0 per ogni t (a, b). Nel caso lorentziano assumeremo ulteriormente che sia
di tipo tempo, cioe g( (t), (t)) < 0 per ogni valore del parametro t (a, b).
Fissiamo t
0
(a, b) e consideriamo una base del sottospazio N
(t
0
)
di T
(t
0
)
normale a (t
0
),
e
(t
0
)i

i=2,...,n
. Quindi trasportiamo parallelamente tale base lungo usando la procedura del
trasporto parallelo. Dato che la procedura del trasporto parallelo conserva le relazioni metriche
ed `e biettiva, e
(t)i

i=2,...,n
denisce ancora una base per il sottospazio N
(t)
di T
(t)
M normale
a (t). Inne consideriamo la funzione:
R
n
(t, v
2
, . . . , v
n
) exp
(t)
_
n

i=2
v
i
e
(t)i
_
(8.7)
Il signicato geometrico della funzione denita in (8.7) dovrebbe essere chiaro: tale funzione
associa (t, v
2
, . . . , v
n
) con il punto in M raggiunto dalla geodetica che parte da (t) con vettore
tangente iniziale

n
i=2
v
i
e
(t)i
normale ad , quando il valore del parametro ane su di essa
vale 1.
Discutiamo il dominio di denizione della funzione (8.7). Fissiamo coordinate locali x
1
, . . . , x
n
su un insieme aperto U (t
0
). La funzione exp su TM `e denita su un insieme aperto
139
piccolo a sucienza E TM tale che, nelle coordinate x
1
, . . . , x
n
, x

1
, . . . , x

n
, ha la forma
V B

(0) R
n
R
n
, dove V corrisponde ad un intorno aperto di (t
0
) e B

(0) `e una palla


aperta di raggio > 0 centrata nellorigine di R
n
. In queste coordinate (8.7) si esplicita come:
(t, v
2
, . . . , v
n
) exp
(x
1
(t),...,x
n
(t))
_
n

k=1
x

k
(t, v
2
, . . . , v
n
)

x
k

(x
1
(t),...,x
n
(t))
_
, (8.8)
dove `e parametrizzata come x
k
= x
k
(t) e
x

k
(t, v
2
, . . . , v
n
) :=
n

i=2
v
i
_
e
(x
1
(t),...,x
n
(t))i
, dx
k
[
(x
1
(t),...,x
n
(t))
_
.
Dato che tutte le funzioni coinvolte sono continue, si prova facilmente che il membro di destra
in (8.8) `e ben denito per (t, v
2
, . . . , v
n
) (t
0
, t
0
+) D, essendo D R
n1
qualche palla
aperta centrata nellorigine di R
n1
.
Teorema 8.2. Sia M una variet`a dierenziabile C

dotata di una metrica C

riemanniana
o lorentziana = g
ij
dx
i
dx
j
, e sia : (a, b) M una curva dierenziabile con (t) ,= 0 per
ogni t (a, b), `e assunta essere di tipo tempo nel caso lorentziano. Si scelga t
0
(a, b), e
si consideri una base del sottospazio N
(t
0
)
di T
(t
0
)
M normale a (t
0
), e
(t
0
)i

i=2,...,n
e si
trasporti tale base lungo in e
(t)i

i=2,...,n
per ogni t (a, b) usando la procedura del trasporto
parallelo. Inne si consideri la funzione:
(t
0
, t
0
+) D (t, v
2
, . . . , v
n
) exp
(t)
_
n

i=2
v
i
e
(t)i
_
(8.9)
per qualche > 0 ed essendo D R
n1
una palla aperta centrata nellorigine di R
n1
. Valgono
i seguenti fatti.
(a) Restringendo se necessario linsieme di denizione, la funzione (8.9) denisce un dieome-
orsmo locale.
(b) Nella carta locale attorno ad dotata di coordinate
(y
1
, y
2
, . . . , y
n
) := (t, v
2
, . . . , v
n
) ,
i coecienti di connessione della connessione di Levi-Civita soddisfano, per i = 1, . . . , n,

i
jk
((t)) = 0 , se t (t
0
, t
0
+) e (j, k) ,= (1, 1). (8.10)
(c) Se `e una geodetica, nel sistema suddetto di coordinate locali attorno ad , i coecienti
di connessione della connessione di Levi-Civita soddisfano:

i
jk
((t)) = 0 , se t (t
0
, t
0
+) e i, j, k = 1, . . . , n. (8.11)
140
Ulteriormente, nel sistema di coordinate detto, le derivate delle componenti della metrica si an-
nullano lungo per t (t
0
, t
0
+).
Dimostrazione. Si considerino coordinate normali x
1
, . . . , x
n
centrate in p = (t
0
) ed associate
alla base (t
0
) e
(t
0
)i

i=2,...,n
. In questo caso /x
1
[
p
= (t
0
) e /x
i
[
p
= e
(t
0
)i
per
i = 2, . . . , n.
La formula di derivazione delle funzioni composte produce immediatamente:

y
1

(t
0
)
_
exp
(t)
_
n

i=2
y
i
e
(t)i
__
k
=

t

t=t
0
_
exp
(t)
(0)
_
k
+
n

i=2
y
i
g
k
(t, y
2
, . . . , y
n
)

(y
2
,...,y
n
)=(0,...,0)
,
dove le funzioni g
k
sono C

. Dato che exp


(t)
(0) = (t), si conclude che:

y
1

(t
0
)
_
exp
(t)
_
n

i=2
y
i
e
(t)i
__
k
=

t

t=t
0

k
(t) + 0 =
k
(t
0
) =
_

y
1

(t
0
)
_
k
=
k
1
,
Per j = 2, . . . , n, usando losservazione 8.4 si arriva a (dove non vale la somma sugli indici
ripetuti):

y
j

(t
0
)
_
exp
(t)
_
n

i=2
y
i
e
(t)i
__
k
=

y
j

(y
2
,...,y
n
)=(0,...,0)
_
exp
(t
0
)
_
y
j
e
(t
0
)j
_
_
k
= (e
(t
0
)j
)
k
=
k
j
.
Quindi, per h, k = 1, . . . , n, si ha:

y
h

(t
0
)
_
exp
(t)
_
n

i=2
y
i
e
(t)i
__
k
=
k
h
,
e pertanto il rango della funzione (8.9) vale n in (t
0
) e quindi tale funzione denisce un dif-
feomorsmo locale attorno a p. Questo risultato conclude la prova di (a). La prova di (b)
si ottiene procedendo come nella prova dellanalogo statement nel teorema 8.1, usando i fatti
seguenti. (i) Le geodetiche che partono da (t) con vettore tangente iniziale

n
i=2
v
i
y
i
[
(t)
hanno equazione y
1
() = t (costante!) e y
j
() = v
j
per j = 2, . . . , n, questo comporta che

k
ij
((t)) = 0 if i, j = 2, . . . , n. (ii) I vettori /y
j
con j = 2, . . . , n soddisfano lequazione del
trasporto parallelo rispetto ad , cioe rispetto a /y
1
:
d
dt

k
j
+
i
1

k
ir
((t))
r
j
= 0 ,
questo fatto implica che
k
1j
((t)) =
k
j1
((t)) = 0 per j = 2, . . . , n.
Per la dimostrazione di (c) notiamo che, se `e una geodetica, in coordinate y
1
, . . . , y
n
, la curva
y
j
() = 0 costantemente se j = 2, . . . , n e y
1
() = `e una geodetica perche coincide con .
Quindi con la stessa procedura usata precedentemente ne consegue che deve essere
k
11
((t)) = 0.
141
2
Denizione 8.4. Sia M una variet`a dierenziabile C

dotata di una metrica riemanniana o


lorentziana di classe C

. Si consideri una curva dierenziabile non singolare : (a, b) M


che `e ulteriormente assunta essere di tipo tempo se la metrica `e lorentziana. Un sistema di
coordinate denito in un intorno di un segmento di curva centrato in t
0
(a, b):
(t) [ t (t
0
, t
0
+) ,
come precisato in (b) di teorema 8.2 `e detto sistema di coordinate riemanniane adattate a .
8.2.3 La versione geometrica dei postulati di Einstein: riferimenti localmente
inerziali.
Prima di tutto notiamo che, se assumiamo che la descrizione relativistica del moto in caduta
libera nel campo gravitazionale classico assegnato sia data dal moto geodetico nello spaziotempo
M rispetto alla connessione di Levi-Civita della metrica , abbiamo come risultato che la linea
di universo di un corpo classicamente sottoposto alla sola forza di gravit`a non dipende dalla
massa, ma solo dallevento da cui parte la geodetica e dalla quadrivelocit`a iniziale della geode-
tica. Questo `e in perfetta armonia con il risultato classico che il moto di un punto materiale
soggetto al solo campo gravitazionale non dipenda dalla massa del punto, ma solo dalla posizione
ed dalla velocit`a iniziale del punto.
Consideriamo ora un corpo in caduta libera nel campo gravitazionale, ossia, nella visione einste-
niana, una geodetica causale diretta verso il futuro. Assumiamo pi` u fortemente che la geodetica
, parametrizzata nel tempo proprio , sia di tipo tempo futuro (`e suciente assumere ci`o in
un evento, le propriet`a del trasporto parallelo implicano che ci`o sar`a vero in tutti gli altri eventi
raggiunti dalla geodetica). Parametrizziamo la geodetica con il tempo proprio che pu`o essere
denito esattamente come nella denizione 4.1 senza alcun problema. Nello spazio tengente a
ciascun evento raggiunto dalla geodetica possiamo dare signicato sico agli oggetti matematici,
mutuando tale signicato da quello che si ha in relativit`a speciale. Lo spazio tangente T
()
M
sar`a decomposto in una somma diretta ortogonale:
L( ())
()
,
dove
()
ha la naturale interpretazione di spazio di quiete istantaneo con un osservatore la cui
evoluzione temporale `e descritta dalla geodetica e il cui asse temporale `e indicato dal vettore
quadrivelocit`a V () := (). Possiamo ripristinare la denizione di velocit`a di una curva di
universo

(generalmente diversa da ), rispetto allosservatore in quiete con , nellevento ()


in cui le due curve si intersecano. La denizione 4.2 pu`o essere usata senza alcun problema e
con le stesse propriet`a gi`a viste nello spazio di Minkowski. Si ha in particolare che le curve
di tipo luce descrivono punti materiali in moto alla velocit`a della luce per ogni osservatore. In
questo contesto possiamo introdurre la nozione di riferimento localmente inerziale attorno ad
una geodetica di tipo tempo. Un riferimento localmente inerziale `e individuato, nellintorno di
142
un segmento di geodetica () con t (
0
,
0
+ ) da un sistema di coordinate riemanniane
adattate a , x
0
= c, x
1
, x
2
, x
3
. Al solito x
0
indica la coordinata temporale e x

indica la
generica coordinata spaziale = 1, 2, 3. In tale sistema di coordinate il principio RG3 assume
una forma matematicamente chiara. Mostriamo in quale senso si possa dire che in tali sistemi
di coordinate il campo gravitazionale `e localmente assente. Consideriamo una geodetica di
tipo tempo futuro corrispondente allevoluzione spaziotemporale di un corpo puntiforme lanciato
dallosservatore descritto da e lasciato evolvere in caduta libera. Il lancio avviene nellevento
(
0
). In coordinate riemanniane si ha che `e descritta da x
i
= x
i
(), dove `e un qualsiasi
parametro ane, con (0) = (
0
) e pertanto x

(0) = 0 e x
0
(0) = c
0
. Usando lo sviluppo di
Taylor attorno a = 0 abbiamo, dove O
i
() 0 se 0:
x
i
() =
dx
i
d

=0
+

2
2
d
2
x
i
d
2

=0
+
2
O
i
() .
Daltra parte dovr`a anche valere, dato che `e una geodetica:
d
2
x
i
d
2
=
i
jk
(())
dx
j
d
dx
k
d
.
Usando (c) del teorema 8.2 concludiamo che:
d
2
x
i
d
2

=0
= 0 .
Pertanto:
x
i
() = x
i
(0) +
dx
i
d

=0
+
2
O
i
() . (8.12)
Usando il fatto che e sono entrambe di tipo tempo futuro si conclude subito che deve essere
dx
0
/d[
0
> 0. Questo signica che in un intorno di = 0, possiamo usare x
0
= c e quindi
il tempo del riferimento localmente inerziale, per parametrizzare la curva . Con questo
parametro:
v

0
:= c
dx

=0
dx
0
d

=0
=
dx

=
0
`e la velocit`a iniziale del punto materiale individuato da nel riferimento localmente inerziale.
La componente temporale di (8.12) rnisce allora:
c() c
0
=
dx
0
d

=0
+
2
O
i
()
la quale, sostituita nelle componenti spaziali della (8.12) fornisce per = 1, 2, 3:
x

() = (
0
)v

0
+ (
0
)
2
O
i
((
0
)) . (8.13)
143
Questequazione dice che il moto del punto `e visto come un moto rettilineo uniforme a meno di
innitesimi di ordine superiore al secondo, e non semplicemente superiore al primordine, come
accade per ogni moto approssimato con Taylor nellintorno di ogni ssato istante! In altre parole
non vi `e accelerazione. In questo preciso senso, nei sistemi di riferimento localmente inerziali il
moto dei corpi sottoposti al solo campo gravitazionale appare rettilineo uniforme.
Le leggi della sica espresse in un evento di un riferimento inerziale in relativit`a speciale possono
estendersi, al caso generale, ammettendo che in coordinate localmente inerziali abbiano la stessa
forma che avevano in coordinate minkowskiane in relativit`a speciale. In questo schema rientrano
anche le leggi esprimibili con equazioni dierenziali del primoordine: in tal caso possono essere
trascritte, in coordinate localmente inerziali, in modo identico a come apparivano in relativit`a
speciale tenendo conto del fatto che i coecienti di connessione si annullano in tali coordinate
(esattamente su ) come i coecienti di connessione si annullavano in coordinate minkowskiane.
Questo `e il modo matematicamente preciso di intendere il principio di equivalenza forte.
8.3 La deviazione geodetica e la gravit`a come curvatura dello
spaziotempo.
La questione che ci poniamo ora `e cosa sia il corrispondente sico-matematico del campo grav-
itazionale classico nella nuova formulazione dello spaziotempo. La nozione classica basata sul
concetto di forza non la possiamo pi` u usare, perche le propriet`a del corrispondente relativis-
tico del campo gravitazionale classico sono descritte dalla metrica e non da una quadriforza.
Inoltre il principio di equivalenza che aerma che si possa annullare localmente il campo gravi-
tazionale, non permetterebbe comunque luso di una forza o quadrirza per descrivere lazione
gravitazionale, visto che una quadriforza non pu`o essere annullata (essendo un tensore) con la
scelta oculata di un sistema di coordinate: se `e nulla in un sistema di coordinate `e nulla in ogni
sistema di coordinate. Dal punto di vista classico, eccettuata la situazione sicamente criticabile
da diversi punti di vista, di un campo gravitazionale statico, uniforme ed innitamente esteso
nello spazio e nel tempo, in presenza di campo gravitazionale si manifesta accelerazione relativa
tra qualche coppia di particelle lanciate nel campo con velocit`a iniziale arbitraria. Adotter-
emo questa evidenza sperimentale come denizione di presenza di gravit`a . Per enunciare la
denizione abbiamo bisogno di qualche concetto matematuco preliminare.
Denizione 8.5. In uno spaziotempo (M, ), una famiglia a due parametri di geode-
tiche temporali `e una classe di geodetiche di tipo tempo futuro (t, s), dove t (a, b) `e un
parametro ane che corre su ogni geodetica t (t, s). s (c, d) `e un parametro che etichetta
le singole geodetiche, e la funzione (t, s) (t, s) `e C

e denisce una sottovariet`a embedded


di dimensione 2 su cui (t, s) siano coordinate ammissibili.
In base alla denizione data , se T := /t e S := /s, vale
[T, S] = 0 , (8.14)
144
dato che T ed S sono i campi tangenti ad un sistema di coordinate. Questa identit`a , dato che
la connessione di Levi-Civita ha torsione nulla [2], pu`o anche essere riscritta come:
T
k

k
S
h
S
k

k
T
h
= 0 . (8.15)
Se s `e ssato, il campo S[
(t,s)
rappresenta lo spostamento innitesimo verso una geodetica
vicina a t (t, s). Per tale motivo S `e detto campo di deviazione geodetica. La velocit`a
di deviazione geodetica rispetto ad una geodetica (, s) ed al parametro ane t su di essa,
`e dunque espressa da v(t, s) := (
T
S)(t, s) e laccelerazione della deviazione geodetica `e
espressa da a(t, s) := (
T

T
S)(t, s). Diamo allora la seguente denizione.
Denizione 8.6. In un insieme aperto M con (M, ) spaziotempo, si dice che `e pre-
sente gravit`a quando per qualche famiglia famiglia a due parametri di geodetiche temporali
a valori in , laccelerazione della deviazione geodetica `e non nulla in qualche evento su qualche
geodetica della famiglia.
8.3.1 Lequazione della deviazione geodetica ed il tensore di curvatura di
Riemann.
Ricordiamo che su ogni variet`a C

(pseudo-)Riemanniana M la cui metrica C

`e indicata
con = g
ij
dx
i
dx
j
con connessione di Levi-Civita , si denisce un campo tensoriale detto
tensore di curvatura di Riemann [2], denito punto per punto come lunico tensore R(p)
T
p
M

T
p
M

T
p
M

T
p
M tale che
(
i

i
)T
k
[
p
= R
ijr
k
(p)T
r
(p) , (8.16)
per ogni campo tensoriale controvariante T (di classe C

).
Il fatto che R
ijr
k
(p) deniscano un tensore segue dal fatto che, come si prova per computo
diretto, lapplicazione
U V T U
i
V
j
(
i

i
)T
k
[
p
dipende solo dal valore assunto da T, U, V in p ed `e lineare, e tenendo inne conto che le
trasformazioni lineari che associano tensori a tensori sono a loro volta rappresentabili tramite
tensori.
Il fatto che il campo tensoriale p R(p) sia C

risulta immediatamente dal fatto che in


coordinate il calcolo diretto mostra che:
R
ijr
k
=

k
ir
x
j

k
jr
x
i

l
(
l
ir

k
lj

l
jr

k
li
) , (8.17)
che `e una funzione C

delle coordinate.
Ricordiamo che il tensore di curvatura di Ricci, Ric, che gioca un ruolo importante nelle
equazioni di Einstein `e dato dalla contrazione:
Ric
ik
= R
ijk
j
.
145
Ricordiamo inne che una variet`a (pseudo-)riemanniana si dice localmente piatta [2] se ogni suo
punto `e contenuto in una carta locale nella quale la metrica `a componenti costanti (in forma
diagonale canonica).
`
E chiaro per costruzione che, se M `e localmente piatta, allora R(p) = 0 in
ogni punto della variet`a , dato che in tal caso, nellintorno di ogni p M esiste un sistema di
coordinate in cui la metrica assume valore costante e per cui i coecienti di connessione sono
tutti nulli. In tale sistema di coordinate R si deve annullare in virt` u della (8.17). Essendo R
un tensore, si annullar`a allora in ogni sistema di coordinate. In realt`a , usando il teorema di
Frobenius, si riesce a provare una proposizione pi` u forte [2]:
Proposizione 8.1. Sia (M, ) una variet`a (pseudo-)Riemanniana (di classe C

con metrica
di classe C

). (M, ) `e localmente piatta se, e solo se, il tensore di Riemann associato alla
connessione di Levi-Civita si annulla in ogni suo punto.
Mostriamo ora come laccelerazione della deviazione geodetica sia connessa al tensore di cur-
vatura di Riemann.
Teorema 8.3. In uno spaziotempo (M, ), si consideri una famiglia a due parametri di
geodetiche temporali (t, s), dove t (a, b) e s (c, d) e siano T := /t e S := /s. Vale
allora la formula della deviazione geodetica:
(
T

T
S)
k
= R
ijl
k
S
j
T
i
T
l
. (8.18)

Dimostrazione. Usando (8.15) si trova subito:


T
i

i
(T
j

j
S
k
) = T
i

i
_
S
j

j
T
k
_
,
quindi
T
i

i
(T
j

j
S
k
) =
_
T
i

i
S
j
_

j
T
k
+S
j
T
i

j
T
k
.
Usando nellultimo memebro la (8.17), si ha:
T
i

i
(T
j

j
S
k
) =
_
T
i

i
S
j
_

j
T
k
+S
j
T
i

i
T
k
R
ijl
k
S
j
T
i
T
l
.
Usando ancora (8.15) nel primo addendo a secondo memebro troviamo:
T
i

i
(T
j

j
S
k
) =
_
S
i

i
T
j
_

j
T
k
+S
j
T
i

i
T
k
R
ijl
k
S
j
T
i
T
l
.
Scambiando i nomi degli indici i e j nel primo addendo a secondo membro si ottiene inne:
T
i

i
(T
j

j
S
k
) =
_
S
j

j
T
i
_

i
T
k
+S
j
T
i

i
T
k
R
ijl
k
S
j
T
i
T
l
.
Possiamo riscrivere tutto come:
T
i

i
(T
j

j
S
k
) = S
j

j
_
T
i

i
T
k
_
R
ijl
k
S
j
T
i
T
l
.
146
Ricordando il signicato di T, valendo T
i

i
T
k
= 0 a causa dellequazione della geodetica di cui
T `e il vettore tangente, otteniamo la (8.18). 2
In base alla denizione 8.6 possiamo concludere che in una regione di spaziotempo non `e
presente gravit`a quando il tensore di curvatura di Riemann si annulla in tale regione. In realt`a
si pu`o provare che vale anche il viceversa: se in un insieme aperto di spaziotempo non `e
presente gravit`a allora il tensore di Riemann `e nullo in tale regione. Concludiamo che lassenza
di gravit` a `e equivalente alla locale piattezza dello spaziotempo.
Nota 8.5.
(1) Nel senso chiarito sopra, lequivalente della gravit`a nella relativit`a generale `e la curvatura
(intesa come tensore di curvatura di Riemann) dello spaziotempo. Equivalentemente, lassenza
di gravit` a `e equivalente alla locale piattezza dello spaziotempo.
(2) I successivi sviluppi della relativit`a generale mostrano che la curvatura, nel senso pi` u debole
dato dal tensore di curvatura di Ricci
2
, `e legata alle masse presenti nello spaziotempo attraverso
le celebri equazioni di Einstein.
Una conseguenza immediata del nuovo punto di vista `e che, in presenza di curvatura cioe gravit`a
, in generale non esistono pi` u i riferimenti inerziali estesi della relativit`a speciale. In situazioni di
curvatura debole ci dobbiamo aspettare, e questo si ottiene davvero sviluppando la matematica
della relativit`a , che in regioni relativamente estese lontane dalle masse, esistano sistemi di
coordinate tali che, con buona approssimazione, abbiano propriet`a vicine a quelle dei sistemi di
riferimento minkowskiani.
Questo risultato ha una conseguenza molto profonda dal punto di vista epistemologico, che
cambia radicalmente uno dei pilastri su cui si basava la sica classica. Dal punto di vista
classico i riferimenti inerziali erano assegnati a priori e non erano conseguenza di alcun principio
pi` u profondo se non di quello che ne sanciva semplicemente lesistenza. Ora lesistenza o meno dei
sistemi di riferimento inerziali dipende dalla curvatura dello spaziotempo che `e legata, tramite
le equazioni di Einstein, al contenuto energetico dello spaziotempo rappresentato dalle masse
presenti in esso.
2
Il fatto che le equazioni di Einstein leghino le sorgenti di gravit` a al tensore di Ricci e non a quello di Riemann
`e dovuto, dal punto di vista sico, al fatto che la gravit` a si propaga fuori dalle sorgenti, per cui ci pu` o essere
curvatura (tensore di Riemann) anche fuori dalle sorgenti.
147
Appendice A
Richiami di geometria ane e
strutture dierenziabili associate.
A.1 Spazi ani
Uno spazio ane reale n-dimensionale, A
n
`e una terna (A
n
, V,

) dove A
n
`e un insieme
i cui elementi sono detti punti, V `e uno spazio vettoriale reale n-dimensionale detto spazio
delle traslazioni o spazio dei vettori liberi e

: A
n
A
n
V `e una funzione che gode
delle due seguenti propriet`a
(i) per ogni coppia di elementi P A
n
, v V ce un unico punto Q A
n
tale che

PQ = v.
(ii)

PQ+

QR =

PR per ogni terna P, Q, R A


n
.

PQ `e detto vettore con punto iniziale P e punto nale Q.


Spesso si usa la notazione QP per indicare

PQ. Unaltra notazione comoda `e la seguente. Se


P A
n
e v V , P +v A
n
indica lunico punto Q in A
n
tale che QP = v.
Una retta uscente da P A
n
con vettore tangente m V `e lapplicazione R t P +tm A
n
.
Un segmento (di retta) si ottiene limitando t ad un intervallo di R.
(Dal punto di vista insiemistico due rette uscenti dallo stesso punto con vettori tangenti pro-
porzionali secondo un numero reale non nullo coincidono). Uno spazio ane dotato di un
prodotto scalare (vedi Appendice B) denito nello spazio delle traslazioni `e detto spazio eu-
clideo.
A.2 Trasformazioni ani, coordinate cartesiane e strutture dif-
ferenziabili associate.
Una funzione : A
n
1
A
m
m
`e detta trasformazione ane se `e invariante per traslazioni (cioe
(P +u) (Q+u) = (P) (Q) per ogni P, Q A
n
e ogni u V
1
spazio delle traslazioni di
A
n
1
) e L

: P Q (P) (Q) denisce una trasformazione lineare da V


1
a V
2
spazio delle
148
traslazioni di A
m
2
. Le trasformazioni ani conservano la struttura di spazio ane.
Ogni spazio ane A
n
ammette una struttura di variet`a topologica e C

dierenziabile naturale
indotta da una classe di sistemi di coordinate globali naturali tra di loro compatibili detti
sistemi di coordinate cartesiane. Un tale sistema di coordinate si costruisce come segue.
Si ssi O A
n
ed una base e
1
, . . . , e
n
dello spazio delle traslazioni V . Variando P A
n
,
le componenti di ogni vettore

OP rispetto alla base scelta, deniscono una funzione biettiva
f : A
n
R
n
. La topologia euclidea di R
n
induce tramite f una topologia su A
n
(denendo gli
aperti di A
n
come le controimmagini degli aperti di R
n
) che lo rende spazio topologico omeomorfo
a R
n
e quindi una variet`a topologica di dimensione n. Si verica facilmente che la topologica
denita in tal modo non dipende dalla scelta di O e nemmeno dalla scelta della base in V .
Ulteriormente la funzione f denisce da sola un atlante C

su A
n
e dota tale spazio di una
struttura dierenziabile generata da tale atlante. In tal contesto la funzione f `e detta sistema
di coordinate cartesiane (di origine O e assi e
1
, . . . , e
n
). Se g : A
n
R
n
`e unaltro sistema di
coordinate cartesiane f g
1
: R
n
R
n
e g f
1
: R
n
R
n
sono C

in quanto, come si prova


subito sono trasformazioni lineari non omogenee. Quindi la struttura dierenziabile individuata
da g `e la stessa individuata da f.
Se : A
n
1
A
m
m
`e una trasformazione ane, si prova immediatamente che, scelte coordinate
cartesiane in entrambi gli spazi ani f : A
n
1
R
n
, g : A
m
2
R
m
, la funzione rappresentata
in tali coordinate, g f
1
, ha la forma di una trasformazione lineare non omogenea da R
n
a
R
m
:
x
i
2
=
n

j=1
L
i
j
x
j
+c
i
.
Viceversa ogni trasformazione : A
n
1
A
m
m
, che per una scelta di sistemi di coordinate carte-
siane nei due spazi ani ha la forma lineare omogenea scritta sopra, `e necessariamente una
trasformazione ane. Si vede subito che le trasformazioni ani sono quindi dierenziabili e, se
sono biettive, sono dieomorsmi con inversa data ancora da una trasformazione ane.
A.3 Isomorsmo naturale tra T
p
A
n
e lo spazio delle traslazioni.
Consideriamo un punto p A
n
ed una curva dierenziabile : [0, ) A
n
uscente da p. Il
vettore tangente a in p pu`o essere denito in due modi diversi corrispondenti rispettivamente
alla nozione elementare di vettore applicato e vettore libero: (i) come un elemento di T
p
A
n
,
(p), oppure (ii) come un elemento dello spazio delle traslazioni V :

(V )
(p) = lim
h0

(0)(h)
h
.
Al variare di tutte le curve, lapplicazione (p)
(V )
(p) denisce un isomorsmo naturale
L
p
: T
p
A
n
V . In particolare, se e
1
, . . . , e
n
`e una base di V e : A
n
p (x
1
(p), . . . , x
n
(p)) `e
149
il sistema di coordinate cartesiane generate dalla base detta e centrate in O A
n
, risulta subito
che, per i = 1, . . . , n:
L
p

x
i
[
p
= e
i
.
Lesistenza dellisomorsmo detto ha la conseguenza determinante che permette di denire una
somma tra vettori appartenenti a due spazi tangenti in punti dierenti p e q: i vettori devono
essere trasportati in V tramite L
1
p
e L
1
q
dove possono essere sommati. Ovviamente il risul-
tato `e un vettore di V .
A.4 Induzione di tensori (pseudo) metrici su ogni T
p
A
n
.
Consideriamo uno spazio ane n-dimensionale A
n
e dotiamolo della struttura di variet`a dif-
ferenziabile naturale come detto sopra. Se V , spazio delle traslazioni, `e dotato di uno (pseudo)
prodotto scalare (Appendice B) possiamo indurre un analogo (pseudo)prodotto scalare g su og-
ni spazio tangente T
p
A
n
tramite lisomorsmo naturale L
p
sopra denito. A tale ne, per ogni
p A
n
e u, v T
p
A
n
deniamo
g
p
(u[v) := g(L
p
u[L
p
v) .
g
p
risulta esser uno (pseudo) prodotto scalare della stessa segnatura di g.
`
E immediato provare
che, al variare di p, le componenti di g
p
(u[v) nelle basi di T
p
A
n
associate ad un sistema di
coordinate cartesiane sono costanti e quindi, in particolare, dierenziabili. Come conseguenza A
n
dotato del campo tensoriale doppio non degenere
g
denito in ogni punto dal prodotto scalare
g
p
rende A
n
una variet`a (pseudo)riemanniana (vedi Appendice B). Se e
1
, . . . , e
n
`e una base in V
(pseudo)ortonormale per g (vedi Appendice B), il sistema di coordinate cartesiane generato da
tale base in un punto O A
n
, `e detto sistema di coordinate cartesiane (pseudo)ortonormali.
`
E immediato vericare che
g
sopra denito assume forma canonica nelle basi associate a tali
coordinate in ogni punto della variet`a.
150
Appendice B
Richiami di geometria dierenziale
(pseudo) riemanniana.
B.1 Prodotti scalari e pseudo prodotti scalari.
Una forma quadratica g sullo spazio vettoriale reale V `e detta non degenere se g(u[v) = 0 per
ogni u V implica v = 0. Si verica subito che, se V ha dimensione nita, g `e non degenere
se e solo se il determinante della matrice simmetrica G che rappresenta la forma quadratica su
una base dello spazio V `e non nullo, cio`e la matrrice G `e non singolare.
Mettiamoci preventivamente nel caso V = R
n
in cui le forme quadratiche sono matrici simmet-
riche (espresse nella base canonica) per costruzione. La segnatura di una forma quadratica
non degnere g denita su V = R
n
, `e la coppia ordinata (m, p), dove m + p = n, associata a g
come segue. Si consideri una trasformazione di similitudine g

= D
t
gD, dove D `e una opportu-
na matrice reale n n non singolare in modo tale che g

risulti diagonale e che ammetta sulla


diagonale solo i numeri 1. Nella segnatura, m `e il numero di volte in cui appare 1 mentre p `e
il numero di volte in cui appare +1 su tale diagonale. Il teorema di Sylvester [9] assicura che
(i) la matrice D suddetta esiste e (ii) ogni altra matrice reale n n non singolare che trasformi
per similitudine g in una matrice diagonale con soli 1 sulla diagonale principale, conserva la
segnatura. Quindi la segnatura `e ben denita ed `e una propriet`a di g.
Si osservi che se V `e ora un generico spazio vettoriale reale a n dimensioni e g `e rappresentata
dalla matrice G nella base e
1
, . . . , e
n
, e

D `e una matrice nn non singolare di componenti

D
ik
,

G =

D
t
G

D rappresenta la stessa forma quadratica g nella base e
k
=

D
hk
e
h
. Di conseguenza,
il teorema di Sylvester assicura che si possa denire univocamente la segnatura di g anche in
questo caso generale: la segnatura di g `e la segnatura della matrice G che rappresenta g su
una base qualsiasi di V . Tale denizione, in virt` u della seconda parte del teorema di Sylvester
non dipende dalla base scelta.
La segnatura di una forma quadratica g su uno spazio vettoriale reale V di dimensione n `e detta
euclidea (o ellittica) se m = 0 ovvero Lorentziana (o iperbolico normale) se m = 1 e p 1.
151
Una forma quadratica non degenere su uno spazio vettoriale V di dimensione nita n `e detta
prodotto scalare o rispettivamente pseudo prodotto scalare se la sua segnatura `e (0, p)
oppure (m, p) con m > 0, p > 0.
Una base di V , e
i

i=1,...,n
`e detta (pseudo) ortonormale se la matrice dei coecienti g(e
i
[e
j
)
assume forma canonica, cioe diag(1, . . . , 1, +1, . . . , +1) in cui 1 e +1 compaiono tante
volte come prescritto dalla segnatura di g. Lesistenza di (innite) basi (pseudo)ortonormali `e
garantita dallo stesso teorema di Sylvester.
Si prova facilmente, usando la diretta generalizzazione della procedura di ortogonalizzazione di
Gram-Schmidt, che per ogni ssato vettore u
1
V esistono vettori u
2
, . . . , u
n
V tale che
u
1
, . . . , u
n
costituisca una base (pseudo) ortonormale.
Se := diag(1, . . . , 1, +1, . . . , +1) `e la forma canonica della forma quadratica non degenere
g su V , linsieme delle matrici reali n n, D, tali che
D
t
D =
forma un gruppo. Tale gruppo `e detto gruppo di stabilit`a della (pseudo)metrica.
`
E chiaro
che per segnature ellittiche tale gruppo `e O(n) dove n `e la dimensione dello spazio V .
Chiaramente, interpretato in senso passivo, il gruppo di stabilit`a della pseudometrica coincide
con il gruppo delle trasformazioni da R
n
R
n
che trasformano le componenti di un vettore da
una base (pseudo)ortonormale in un altra base (pseudo)ortonormale di V . Nellinterpretazione
attiva, ssata una base (pseudo)ortonormale, il gruppo di stabilit`a della pseudometrica denisce,
in tale base, il gruppo di trasformazioni da V in V che preservano lo (pseudo)prodotto scalare.
Lassegnazione di uno (pseudo) prodotto scalare g( [ ) sullo spazio vettoriale reale di dimensione
nita V determina un isomorsmo naturale tra V ed il suo duale V

. Tale isomorsmo `e denito


da
#
g
: V u g(u[ ) V

.
Se e
1
, . . . , e
n
`e una base di V e e
1
, . . . , e
n
`e la base duale associata ed inne g := g
ij
e
i
e
j
=
g(e
i
[e
g
)e
i
e
j
`e la rappresentazione del tensore associato a g in V

detto tensore metrico,


allora lazione di #
g
in componenti delle basi dette `e data da
#
g
: v
i
v
k
:= g
ki
v
i
.
Dal teorema di universalit`a #
g
induce un analogo isomorsmo tra spazi del tipo V
n
V
n
e
V
n
V
n
che in componenti delle basi indotte da e
1
, . . . , e
2
e dalla sua duale agisce come:
t
i
1
...i
n
j
1
...j
p
t
k
1
...k
n
j
1
...j
p
:= g
k
1
i
1
g
k
n
i
n
t
i
1
...i
n
j
1
...j
p
.
Per tale motivo lazione di #
g
`e anche detta processo di abbassamento degli indici.
Lisomorsmo inverso di
g
:= (#
g
)
1
: V

V corrisponde ad un tensore in componenti


dato da g
ik
e
i
e
j
dove la matrice dei coecienti g
ik
`e linversa della matrice dei coecienti g
ij
che rappresentano #
g
nella base duale associata alla precedente e
1
, . . . , e
n
. Risulta che vale
lidentit`a
g
ik
g
jl
g
kl
= g
ij
152
(si noti che tale identit`a non `e evidente a priori perche il secondo membro non `e denito dal
primo ma g
ij
:= g(e
i
[e
j
)). Lazione di
g
si estende a prodotti tensoriali e denisce il processo
di innalzamento degli indici.
Si osservi inne che se lo spazio vettoriale `e dotato di un prodotto scalare g propriamente denito
(cio`e denito positivo), allora in basi ortonormali la rappresentazione di g `e data dal delta di
Kroneker e pertanto, il processo di alzare ed abbassare gli indici, in tali basi (e nelle duali
associate) non ha alcun eetto sui valori delle componenti:
v
i
=
ij
v
j
= v
i
malgrado esse si riferiscano a tensori in spazi diversi.
B.2 (Pseudo)Metriche e variet`a (pseudo)riemanniane.
Una (pseudo)metrica su una variet`a dierenziabile M di dimensione n `e data assegnando un
campo tensoriale dierenziabile covariante doppio simmetrico e non degenere , le cui matrici
rappresentative abbiano segnatura costante al variare del punto sulla variet`a. A tal proposito, si
osservi che la legge di trasformazione delle componenti di al variare del sistema di coordinate
locali = g
ij
dx
i
dx
j
= g

pq
dx
p
dx
q
`e, punto per punto, proprio una trasformazione di
similitudine generata da una matrice non singolare:
g

pq
(x) =
x
i
x
p
[
x
g
ij
(x)
x
j
x
q
[
x
.
In tal modo il teorema di Sylvester assicura che la segnatura sia una propriet`a del campo tenso-
riale . `e detto tensore metrico o metrica e la coppia (M, ) `e una variet`a riemanniana.
Se n, m > 0, `e detto tensore pseudo metrico o pseudo metrica e la coppia (M, ) `e una
variet`a pseudoriemanniana. In particolare, una variet`a lorentziana si ha quando n 2 e la
segnatura di `e lorentziana: (1, n 1) (ossia (1, +1, . . . , +1)), in tal caso il tensore pseudo-
metrico si dice tensore pseudometrico lorentziano.
B.3 Variet`a (pseudo)riemanniane, globalmente e localmente pi-
atte.
Una variet`a (pseudo)Riemanniana (M, ) `e detta globalmente piatta
1
quando:
(a) ammette una struttura ane compatibile con la struttura dierenziale,
(b) `e rappresentato dalla matrice diagonale costante in forma canonica in un sistema di coor-
dinate cartesiano generato dalla struttura ane.
1
Precisiamo che, a seconda degli autori, esistono comunque dierenti e non equivalenti denizioni della nozione
di globale piattezza.
153
(Si osservi che tutti gli altri sistemi di coordinate globali in cui la metrica ha costantemente
forma diagonale canonica risultano banalmente essere cartesiani.)
Un modo del tutto equivalente di assegnare una variet`a (pseudo) riemanniana globalmente pi-
atta `e quello di partire da uno spazio ane A
n
, di denire uno (pseudo)prodotto scalare nello
spazio delle traslazioni V e di indurre un tensore metrico sulla variet`a associata a A
n
tramite
lisomorsmo naturale tra V e lo spazio tangente ad ogni punto di A
n
. Come visto in Appendice
A, il tensore metrico ha allora componenti costantemente in forma canonica quando espresse in
coordinate cartesiane (pseudo) ortonormali.
`
E chiaro che uno spazio (ane) euclideo identica univocamente una variet`a riemanniana glob-
almente piatta e viceversa.
Una variet`a (pseudo)Riemanniana (M, ) `e detta localmente piatta se nellintorno U di og-
ni punto p M c`e una carta locale (U, ), : U q (x
1
(q), . . . , x
n
(q)) R
n
tale che
(q) = g
ij
(q)dx
i
[
q
dx
j
[
q
dove la matrice dei coecienti g
ij
(q) ha costantemente forma canon-
ica per ogni q U.
Una variet`a localmente piatta in generale non `e globalemnte piatta: un cilindro in E
3
con la
metrica indotta da quella di E
3
`e una variet`a localmente piatta che non `e globalmente piatta.
Condizioni necessarie e sucienti anch`e una variet`a (pseudo) riemanniana sia localmente pi-
atta sono date dallannullarsi ovunque del tensore di curvatura di Riemann [2].
B.4 Metriche e pseudo metriche indotte.
Se (M, ) `e una variet`a (pseudo)riemanniana di dimensione n e M `e una sottovariet`a
dierenziabile embedded in M di dimensione s n, la (pseudo)metrica induce un campo
tensoriale dierenziabile covariante doppio simmetrico

su che viene detto metrica o


pseudometrica (a seconda dei casi) indotta su quando non `e degenere in alcun punto di
. Si procede nel seguente modo. Dato che la variet`a `e embedded, per ogni punto p , lo
spazio tangente T
p
`e incluso canonicamente nello spazio tangente T
p
M come un sottospazio. Di
conseguenza, se u, v T
p
,
p
(u[v) `e ben denito e, se u, v sono campi vettoriali dierenziabili
su , `e una funzione dierenziabile di p . Ci`o denisce su il campo tensoriale dierenziabile
covariante doppio simmetrico

di cui sopra.
Dal punto di vista delle componenti, notiamo che c`e una carta locale di M, con coordinate
x
1
, . . . , x
n
, denita in un intorno U di p in cui U `e rappresentata dalle funzioni dierenziabili
x
i
(y
1
, . . . , y
s
), i = 1, . . . , n, dove y
1
, . . . , y
s
sono coordinate associate ad una carta locale denita
in un intorno V di p in . La matrice jacobiana delle funzioni dierenziabili dette ha rango s
in V . Risulta facilmente che, se q V e = g
ij
dx
i
dx
j
in U,

(q) = g
ij
(q)
x
i
y
a
[
q
x
j
y
b
[
q
dy
a
[
q
dy
b
[
q
.
154
Bibliograa
[1] V. Moretti, Multi-Linear Algebra and Tensor Calculus in Mathematical Physics
with Applications to Special Relativity, 2006.
http://www.science.unitn.it/moretti/dispense.html
[2] V. Moretti, Tensor analysis on dierentiable manifolds with applications to rela-
tivistic theories, 2006.
http://www.science.unitn.it/moretti/dispense.html
[3] E. Sernesi, Geometria 2, Bollati Boringhieri, Torino, 1990
[4] M.P.do Carmo, Riemannian Geometry, Birkhauser, Boston 1992
[5] B. ONeill, Semi-Riemannian Geometry with application to Relativity, Interscience
Publishers, New York, 1983
[6] J. K. Beem, P. E. Ehrlich, K. L. Easley, Global Lorentzian Geometry, Academic
Press, 1994
[7] B. A. Dubrovin, S. P. Novikov, A. T. Fomenko, Geometria Contemporanea Vol I,
Editori Riuniti/Mir, 1987
[8] B. A. Dubrovin, S. P. Novikov, A. T. Fomenko, Geometria Contemporanea Vol II,
Editori Riuniti/Mir, 1987
[9] E. Sernesi, Geometria 1, Bollati Boringhieri, Torino, 1990
[10] J.D. Jackson, Elettrodinamica Classica, Zanichelli, Trento, 1988
[11] A. Einstein, Ann. d. Physik, 17, (1905)
[12] A.A. Michelson and E.W. Morley, On the Relative Motion of the Earth and the
Luminiferous Ether, Am. J.Sci. (3rd series) 34 333-345 (1887).
vedi anche R.S. Shankland, Michelson - Morley Experiment, American Journal of
Physics 1964, p.16.
155
[13] U. Bottazzini I grandi della scienza: Poincare, LE SCIENZE n.7 febbraio 1999
e S. Bergia I grandi della scienza: Einstein, LE SCIENZE n.6 agosto 2000
(RISTAMPA).
[14] R.S. Shankland et al, Rev. Mod. Phys. 27 no.2, 167-178 (1955)
[15] S. Liberati, S.Sonego and Matt Visser, Faster-than-c Signals, Special Relativity and
Causality, Ann. Phys., 298, 2002
[16] A. Einstein, B. Podolsky, N. Rosen, Can quantum-mechanical description of the
physical reality be considered complete, Phys. Rev. 47, p777, (1935)
[17] B. dEspagnat, I fondamenti concettuali della Meccanica quantistica, Bibliopolis,
Napoli, 1995.
[18] G. Boniolo (a cura di), Filosoa della Fisica, Bruno Mondadori, 1997.
[19] M. Sherwin, Some Recent Experimental Tests of the Clock Paradox, Phys. Rev.
129 no. 1, 17 (1960)
[20] D. Frisch and J. Smith, Measurement of the Relativistic Time Dilation Using
Mesons, Am. J. Phys. 31, 342 (1963).
[21] Haefele and Keating Nature 227, 270 (1970),(Proposal); Science Vol. 177, 166 -
170 (1972) (Experiment)
[22] R.F. Streater and A.S. Wightman: PCT, Spin and Statistics, and All That,
Princeton University Press, revised version, Princeton, 2000.
[23] F.W. Warner: Foundation of Dierentiable Manifolds and Lie Groups, Springer-
Verlag, New York, 1975.
[24] M.A. Najmark e A.I. Stern: Teoria delle rappresentazioni dei gruppi, Editori
Riuniti, Roma, 1984.
[25] W. Rudin: Analisi Reale e Complessa, Bollati Boringhieri, Torino, 1974
W. Rudin: Functional Analysis, McGraw-Hill, Boston, 1991 seconda edizione.
[26] C. von Westenholtz: Dierential Forms in Mathematical Physics; North-Holland,
Amsterdam, (1978)
156