N Universit` a di Trento
nozioni elementari di geometria ane [9] e delle associate strutture dierenziabili e metriche. Richiami di tali nozioni sono dati in Appendice A e in Appendice B. Ringraziamento. Lautore ringrazia V. Marini che si ` e preso cura di correggere gli errori di vario genere contenuti nella prima stesura di queste dispense e S. Avona e F.M. Gambetta per avere segnalato diversi refusi sulle versioni successive. Lautore ringrazia B. Cocciaro e T. Russo per rilevanti osservazioni concettuali e discussioni.
Indice
1 I principi sici della Relativit` a Speciale. 1.1 La crisi della visione classica. . . . . . . . . . . . . . . 1.2 Lo Spaziotempo ed i sistemi di riferimento. . . . . . . 1.2.1 Il problema della sincronizzazione. . . . . . . . 1.3 I postulati sici fondamentali della Relativit` a Speciale. 1.3.1 Costanza della velocit` a della luce. . . . . . . . 1.3.2 Principio dinerzia. . . . . . . . . . . . . . . . . 1.3.3 Principio di Relativit` a. . . . . . . . . . . . . . . 7 7 9 12 13 14 15 15 17 17 17 20 25 30 33 33 35 35 38 39 42 44 46 46 48 49
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
2 I gruppi di Lorentz e di Poincar e. 2.1 Dai postulati della Relativit` a speciale al gruppo di Poincar e. . . . . . . . . . . . 2.1.1 Postulati della Relativit` a in sistemi di coordinate minkowskiane. . . . . . 2.1.2 Determinazione delle trasformazioni di coordinate tra riferimenti inerziali. 2.2 IL gruppo di Lorentz ed il gruppo di Poincar e. . . . . . . . . . . . . . . . . . . . 2.2.1 Il sottogruppo ortocrono. . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Lo spaziotempo della Relativit` a Speciale e la struttura causale. 3.1 Lo spaziotempo della Relativit` a Speciale. . . . . . . . . . . . . . . . . . . . . . . 3.1.1 Orientazione temporale dei sistemi di coordinate minkowskiane. . . . . . . 3.1.2 Sistemi di Riferimento inerziali. . . . . . . . . . . . . . . . . . . . . . . . . 3.1.3 Riduzione a trasformazioni di Lorentz speciali. . . . . . . . . . . . . . . . 3.2 Alcune nozioni geometriche elementari in variet` a Lorentziana quadridimensionali (M, g). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.1 Coni spaziotemporali. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.2.2 Orientazione temporale di una variet` a Lorentziana (M, g). . . . . . . . . . 4 3.3 La struttura causale di M : causalit` a e linee di universo. . . . . . . . . . . . . . . 3.3.1 Orientazione temporale indotta dai riferimenti inerziali in M4 . . . . . . . 3.3.2 Relativit` a ed assolutezza dellordinamento temporale e la struttura causale di M4 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3.3.3 Struttura causale e convenzionalit` a della procedura di sincronizzazione einsteiniana. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4
3.3.4 Linee di universo come curve di tipo causale. . . . . . . . . . . . . . . . . Ancora sulla struttura causale: determinismo, localit` a, paradosso EPR. . . . . .
51 53 57 58 63 66 71 74 75 77
4 Cinematica in Relativit` a Speciale. 4.1 Nozioni elementari: Tempo proprio e Quadrivelocit` a. . . . . . . . . . . 4.1.1 Velocit` a di trascinamento e legge di composizione delle velocit` a 4.2 Dilatazione degli intervalli di tempo e paradosso dei gemelli. . . . . 4.3 Peculiarit` a della cinematica relativistica. . . . . . . . . . . . . . . . . . 4.3.1 Contrazione dei Volumi. . . . . . . . . . . . . . . . . . . . . . . 4.3.2 Contrazione delle lunghezze. . . . . . . . . . . . . . . . . . . . . 4.3.3 Deformazione degli angoli. . . . . . . . . . . . . . . . . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
. . . . . . .
5 Dinamica in Relativit` a Speciale: covarianza delle leggi siche ed equazioni della dinamica. 79 5.1 Nozione di massa, quadriforza e quadrimpulso per punti materiali. . . . . . . . . 80 5.1.1 Teorema delle forze vive relativistico. . . . . . . . . . . . . . . . . . . . 85 5.2 Conservazione del quadri impulso e principio di equivalenza massa-energia. . . . 87 5.2.1 Legge di conservazione del quadri impulso. . . . . . . . . . . . . . . . . . 87 5.2.2 Il principio di equivalenza massa energia. . . . . . . . . . . . . . . . . . . 91 5.3 Il tensore energia-impulso. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95 5.3.1 Teorema della divergenza in forma covariante. . . . . . . . . . . . . . . . . 95 5.3.2 Il tensore energia impulso per il uido di materia non interagente. . . . . 98 5.3.3 Il tensore energia impulso. . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 5.3.4 Il tensore energia impulso del uido perfetto. . . . . . . . . . . . . . . . . 104 6 Elementi di teoria dei gruppi di Lie matriciali. 6.1 Richiami sui gruppi di Lie. . . . . . . . . . . . . . 6.2 Gruppi di Lie di matrici. . . . . . . . . . . . . . . 6.3 I gruppi di Lie O(3) e SO(3). . . . . . . . . . . . 6.4 Teorema di rappresentazione di O(3) e SO(3). . . 105 105 110 116 121 126 126 131 141 143 147 147 150 151 154
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
7 La struttura del gruppo di Lie O(1, 3). 7.1 Il gruppo di Lie matriciale O(1, 3). . . . . . . . . . . . . . . . . . . . 7.2 Le trasformazioni pure di Lorentz o boosts e la decomposizione gruppo di Lorentz. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7.3 Teoremi di decomposizione e rappresentazione del gruppo di Lorentz. 7.4 Le componenti connesse del gruppo di Lorentz. . . . . . . . . . . . . 8 Le idee sico-matematiche alla base della teoria 8.1 Fisica: il Principio di Equivalenza di Einstein. . . 8.2 Matematica: lexponential map. . . . . . . . . . . 8.2.1 Lexponential map e le coordinate normali 8.2.2 Coordinate normali adattate ad una curva 5
. . . . polare . . . . . . . . . . . .
. . . del . . . . . . . . .
. . . .
8.3
8.4
8.5
La versione geometrica di RG3 e nozione relativistica di gravit` a. . . . . . . . . . 8.3.1 Linterpretazione di RG3: sistemi di coordinate localmente inerziali. . . . 8.3.2 Il principio di equivalenza in forma forte e lequazione di conservazione del tensore energia impulso. . . . . . . . . . . . . . . . . . . . . . . . . . . 8.3.3 La deviazione geodetica e la gravit` a come curvatura dello spaziotempo. . Le equazioni del campo gravitazionale di Einstein. . . . . . . . . . . . . . . . . . 8.4.1 Il limite classico dellequazione della geodetica. . . . . . . . . . . . . . . . 8.4.2 Le equazioni di Einstein del campo gravitazionale. . . . . . . . . . . . . . Nozione generale di sistema di riferimento. . . . . . . . . . . . . . . . . . . . . . . 8.5.1 Sistemi di riferimento in Relativit` a generale. . . . . . . . . . . . . . . . . 8.5.2 Il problema della metrica spaziale ed il legame con procedure di sincronizzazione non einsteiniane. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8.5.3 Lo spazio di quiete del sistema di riferimento rotante. . . . . . . . . . . .
157 158 160 161 164 165 167 168 168 173 178 181 181 181 182 183 184 184 186 186 187
A Richiami di geometria ane e strutture dierenziabili associate. A.1 Spazi ani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . A.2 Trasformazioni ani, coordinate cartesiane e strutture dierenziabili associate. A.3 Isomorsmo naturale tra Tp An e lo spazio delle traslazioni. . . . . . . . . . . . A.4 Induzione di tensori (pseudo)metrici su ogni Tp An . . . . . . . . . . . . . . . . . B Richiami di geometria dierenziale (pseudo)riemanniana. B.1 Prodotti scalari e pseudo prodotti scalari. . . . . . . . . . . . . B.2 (Pseudo)Metriche e variet` a (pseudo)riemanniane. . . . . . . . . B.3 Variet` a (pseudo)riemanniane, globalmente e localmente piatte. B.4 Metriche e pseudo metriche indotte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . .
. . . .
Capitolo 1
1.1
Alla ne del 1800, quando le equazioni dellelettromagnetismo ebbero forma completa nelle famose Equazioni di Maxwell, si comprese che linvarianza galileiana discussa precedentemente non poteva essere estesa allelettromagnetismo. Le equazioni di Maxwell prevedono che, in assenza di sorgenti, il campo elettromagnetico si propaghi sotto forma di onde elettromagnetiche in conformit` a con lequazione di DAlembert
3 1 2 2 + =0. 2 2 c t (xi )2 i=1
Nel nostro caso ` e una qualsiasi componente del campo elettrico o magnetico e t, x1 , x2 , x3 sono coordinate cartesiane ortonormali associate ad un sistema di riferimento. In particolare si comprese, e questo fu uno dei trion della sica del 1800, che la luce ` e unonda elettromagnetica unicando la teoria dellottica con quella dellelettromagnetismo. Dalla teoria delle equazioni di 7
DAlembert risulta che il parametro c, che ha le dimensioni di una velocit` a, si deve interpretare come la velocit` a delle onde elettromagnetiche indipendentemente dalla direzione di propagazione nel sistema di riferimento considerato. La stessa teoria di Maxwell fornisce il valore di c, di circa 300.000 km/s in termini di grandezze elettrostatiche che possono essere misurate indipendentemente dal fenomeno di propagazione ondosa sopra descritto. ` facile vericare per soIl punto di contrasto con linvarianza galileiana ` e per` o il seguente. E stituzione diretta e assumendo che i campi considerati siano propriamente campi vettoriali in ogni spazio assoluto, che la forma dellequazione di sopra non ` e invariante sotto cambiamento di sistema di riferimento quando la trasformazione di coordinate ` e un elemento del gruppo di Galileo. Le stesse equazioni di Maxwell da cui segue lequazione delle onde di sopra non sono invarianti per trasformazioni di Galileo. Lidea pi` u semplice che fu proposta per interpretare questo stato di cose ` e che lequazione delle onde scritta valesse in realt` a solo in un particolare sistema di riferimento detto sistema di riferimento delletere. Dal punto di vista sico, tale sistema di riferimento avrebbe dovuto essere in quiete con il mezzo, appunto letere, in cui si propagherebbero le onde elettromagnetiche. Che il sistema di riferimento delletere fosse inerziale oppure no, sembrava comunque che lelettromagnetismo, a dierenza della meccanica, selezionasse un unico e particolare sistema di riferimento privilegiato. Si osservi che ci` o ha ripercussione anche nella sica dei corpi materiali, no ad allora trattati dalla meccanica classica, perch e le onde elettromagnetiche interagiscono sui corpi materiali che portano cariche o correnti elettriche, esercitando su di essi delle forze. Si noti che ci` o non ` e comunque in contrasto con la descrizione spaziotemporale di base della meccanica classica che ` e indipendente dallassunzione o meno dellinvarianza galileiana. Per tale motivo tale descrizione continu` o ad essere usata. Il contrasto sperimentale con le fondazioni stesse della descrizione spaziotemporale classica non tard` o per` o ad arrivare. Allinterno di tale formulazione, tenendo conto che un impulso luminoso deve essere pensato come unonda elettromagnetica, che ha velocit` a c in un particolare riferimento, segue subito che la velocit` a dello stesso impulso deve essere dierente se valutata in un altro sistema di riferimento. In questordine di idee, ` e alquanto improbabile che la terra nel suo moto attorno al sole si trovi perennemente in quiete nel riferimento delletere, per cui ci si deve aspettare di poter valutare sulla terra una velocit` a della luce dierente a seconda del momento. Ulteriormente, se la terra non fosse in quiete con letere, la velocit` a della luce non dovrebbe avere un comportamento isotropo come prescritto dallequazione di DAlembert, ma la velocit` a della luce dovrebbe dipendere dalla sua direzione rispetto alla direzione del moto della terra nel riferimento delletere. Valutando la velocit` a della luce sulla terra lungo due percorsi ortogonali posti in direzioni opportune, si dovrebbero misurare delle dierenze di velocit` a lungo i due cammini. Due celebri esperimenti di questo genere furono eettivamente eseguiti nel 1887 da Michelson e Morley [12]. Su un piano orizzontale che poteva orientarsi arbitrariamente attorno allasse verticale, un raggio di luce partiva da una sorgente S e nel punto P , al centro del piano, veniva diviso in due raggi da uno specchio semiriettente. Tali raggi percorrevano due percorsi rettilinei uguali ma reciprocamente ortogonali no a raggiungere due specchi che li riettevano indietro verso P . Da P venivano deessi in S dove un ne interferometro valutava leventuale ritardo relativo del tempo di arrivo dei due raggi nel punto nale di ricongiungimento. Il risultato degli 8
esperimenti, eseguiti con diverse modicazioni per valutare tutte le possibilit` a, fu totalmente negativo: nessuna dierenza di tempi di arrivo e quindi di velocit` a venne misurata in qualunque periodo dellanno pur orientando lapparato in qualunque direzione. Questo fatto sperimentale ` e in diretto contrasto con la formulazione classica se si esclude la situazione altamente improbabile in cui la terra ` e sempre in quiete con letere. Dal 1887 no al 1905, anno in cui A. Einstein pubblic` o il suo articolo intitolato Sull Elettrodinamica dei Corpi in Movimento in cui vennero gettate le basi della Teoria della Relativit` a Speciale, varie proposte furono avanzate per spiegare il risultato negativo di Michelson e Morley; e per fare coesistere la meccanica con lelettromagnetismo. Vennero proposte alcune teorie basate sul trascinamento parziale delletere da parte della terra assumendo completamente il corpus della meccanica classica, ma anche teorie pi` u radicali che mettevano in discussione alcuni punti della formulazione della meccanica classica. Queste ultime vennero costruite anche da parte di valenti teorici tra cui spiccano i nomi di Lorentz e Poincar e1 . Noi non ci occuperemo di tutte queste teorie e considereremo unicamente la Teoria della Relativit` a Speciale, che non solo spiega il risultato di Michelson e Morley (bench e sembra che Einstein non fosse a conoscenza di tali esperimenti nel 1905), ma ha ricevuto tali e tante conferme sperimentali che ` e ritenuta sicuramente pi` u vicina alla realt` a sica di quanto non lo fosse la descrizione classica (che ne ` e una approssimazione in particolari regimi di basse velocit` a). Basti dire che la Teoria della Relativit` a Speciale viene quotidianamente usata dalla tecnologia per produrre strumenti. Tenendo conto della Relativit` a Speciale vengono progettati gli acceleratori di particelle del CERN in cui le particelle non possono pi` u essere trattate classicamente a causa delle loro altissime velocit` a relative (oltre che per la loro natura quantistica).
1.2
Un punto di vista sul mondo sico che permise (ad Einstein) di uscire dalla crisi della visione classica, ` e quello basato sulla nozione di evento e di spaziotempo. Da questo punto di vista tutto ci` o che accade o esiste deve essere decomponibile in eventi. In questo approccio, tutto ci` o che accade deve ammettere una descrizione in termini di relazioni o coincidenze tra eventi. Un evento ` e la minima determinazione spaziotemporale possibile, individuata dallassegnazione di tre coordinate spaziali ed una temporale. Si deve sottolineare che ogni evento ` e un ente assoluto, cio` e del tutto indipendente da ogni possibile osservatore o sistema di riferimento. Le coordinate spaziotemporali che vengono assegnate agli eventi sono invece dipendenti dallosservatore o sistema di riferimento. Linsieme degli eventi costituisce lo spaziotempo. Dal punto di vista sico ` e naturale assumere, ed ` e stato tacitamente assunto nella formulazione della meccanica classica, che lo spaziotempo abbia una natura continua (cio` e una topologia localmente omeomorfa a R4 , di Hausdor ed a base numerabile) e dierenziabile (per potere impostare equazioni dierenziali che determinano levoluzione dei sistemi sici). Assumiamo quindi dora in poi che lo spazioPoincar e present` o una teoria molto simile alla teoria della Relativit` a di Einstein con sottili dierenze dal punto di vista losoco basate sul suo punto di vista convenzionalista. Il dibattito sulla dierenza tra la teoria di Poincar e e quella di Einstein ` e tuttora acceso ed aperto, vedi [13].
1
tempo sia una variet` a dierenziabile a 4 dimensioni che indicheremo con M 4 . In questo approccio, i sistemi di riferimento sono pensabili, in termini del tutto generali, come procedure siche per decomporre lo spaziotempo in spazio e tempo, assegnare cio` e determinazioni spaziali e determinazione temporale ad ogni evento dello spaziotempo. Assumeremo pertanto che, in termini del tutto generali, un sistema di riferimento F nello spaziotempo M 4 sia dato assegnando uno spazio euclideo tridimensionale reale E3 F detto spazio di quiete di F (con funzione distanza dF ) ed un dieomorsmo (cio` e, quindi una corrispondenza biunivoca dierenziabile con inversa dierenziabile) F : M 4 x (tF (x), PF (x)) R E3 F
dove x tF (x) ` e detta (funzione) coordinata temporale di F . Lo spazio di quiete di un riferimento E3 F corrisponde dunque allo spazio sico tridimensionale euclideo in quiete con un laboratorio nel quale si eseguono esperimenti. La coordinata temporale corrisponde al tempo letto su orologi ideali posti in quiete in tutti i punti di tale spazio e preventivamente sincronizzati con qualche procedura che discuteremo successivamente. Pi` u avanti, una volta introdotti e discussi gli assiomi della Relativit` a, daremo una denizione formale di sistema di riferimento specializzata alla situazione relativistica, ma compatibile con lidea euristica generale data sopra. Dal punto di vista sico dobbiamo assumere che per denire i sistemi di riferimento si siano deniti una classe di regoli rigidi ideali ed una classe di orologi ideali. Lidealit` a dei regoli signica che scelti due regoli arbitrariamente, essi risultano di uguale lunghezza se sono in quiete nello stesso posto in un arbitrario riferimento inerziale e che tale fatto permane anche dopo che i regoli hanno subito diverse storie (incluse accelerazioni), una volta riportati in quiete relativa in un arbitrario riferimento inerziale (anche diverso dal primo). Lo stesso criterio si applica per la nozione di idealit` a di orologi: presi due orologi essi risultano battere il tempo nello stesso modo quando sono in quiete nello stesso posto in un riferimento inerziale e tale fatto permane anche dopo che gli orologi hanno subito diverse storie, una volta riportati in quiete relativa in un riferimento inerziale (anche diverso dal primo). Si noti che al secondo incontro gli orologi possono non risultare sincronizzati anche se erano stati sincronizzati al primo incontro. I regoli ideali servono a denire la distanza usata nello spazio euclideo E3 F , gli orologi ideali servono a denire le misure di intervalli di tempo tF del riferimento. Esistono in natura orologi ideali? la risposta ` e positiva. Gli stessi atomi sono dei piccoli orologi nel senso che, con le dovute precisazioni siche, emettono radiazione con frequenze determinate il cui periodo pu` o essere usato come il periodo di un orologio. Tali orologi, si sono rivelati la migliore approssimazione di orologi ideali disponibile in natura. Lo spaziotempo classico e, come vedremo, quello relativistico, ammette dunque strutture di carattere metrico, corrispondenti allesistenza di strumenti di misura sici corrispondenti, oltre alla struttura topologica e quella dierenziabile. Lintroduzione dei sistemi di riferimento nel senso precisato sopra, implica che ci siano anche strutture metriche di tue tipi apparentemente distinti, corrispondenti alle misurazioni di intervalli di tempo e le misurazioni di intervalli di spazio tra coppie di eventi eseguite in ogni possibile sistema di riferimento. In meccanica classica queste misure di spazio e di tempo tra due eventi ssati sono, come ben 10
noto, assolute: ci` o signica che esse non dipendono dal sistema di riferimento. Sappiamo infatti che, per esempio, lintervallo di tempo tra due eventi, come la produzione ed il decadimento di una particella, non dipende dal riferimento in cui si esegue la misura. Similmente la distanza spaziale tra due eventi contemporanei non dipende nuovamente dal riferimento. Precisiamo qualche dettaglio su quanto abbiamo appena detto. Per quanto riguarda la coordinata temporale dei vari riferimenti, in meccanica classica esiste una richiesta basta su apparenti evidenze sperimentali che precisa che, a meno di costanti additive (corrispondenti alla possibilit` a di cambiare lorigine del tempo separatamente per ogni riferimento): tF = tF per ogni coppia di sistemi di riferimento F e F . Tale richiesta cade solitamente sotto il nome di assioma del tempo assoluto. Il tempo assoluto ` e dunque una funzione T : M 4 R denita a meno di costanti additive che si identica, in sica classica, con la coordinata temporale di ogni sistema di riferimento. Sempre in meccanica classica, gli spazi di quiete dei vari riferimenti si identicano tutti, ad ogni ssato tempo (assoluto!) t con lipersupercie dello spaziotempo t = {p M 4 | T (p) = t} che si pensa essere dotata di struttura di spazio euclideo tridimensionale. Ogni t ` e quindi, per ipotesi, uno spazio euclideo tridimensionale, detto spazio assoluto al tempo t. Si assume che tutte le misure di distanze ed angoli tra due eventi p, p t eseguite in dierenti sistemi di riferimento doincidono con le misure assolute rispetto alla struttura metrica di t . Questa richiesta cade usualmente sotto il nome di assioma dello spazio assoluto. Come vedremo tra poco la rivoluzione della Relativit` a ha mostrato, basandosi sulle evidenze sperimentali citate nella precedente sezione, che le strutture metriche spaziali e temporali sono invece relative al sistema di riferimento, ma al contempo sono parti di una struttura metrica spaziotemporale assoluta che ha particolari propriet` a di simmetria (almeno no a quando si trascura la descrizione relativistica dellinterazione gravitazionale) descritte dal cosiddetto gruppo di Poincar e (che include il gruppo di Lorentz). La geometria dello spaziotempo che ne consegue si ` e rivelata il linguaggio matematico per poter trattare di argomenti profondamente sici come la nozione di causalit` a. Commenti 1.1. (1) Le implicazioni del nuovo punto di vista relativistico, in cui si introdice una geometria dello spaziotempo, sono state incredibilmente feconde dal punto di vista sico ed hanno avuto inuenze fondamentali nello sviluppo di tutta la sica del 1900. La teoria della relativit` a ha costruito, insieme alla meccanica quantistica, il linguaggio stesso ed il paradigma della sica teorica di un secolo intero di ricerca. ` noto da molti anni che la struttura spaziotemporale come variet` (2) E a dierenziabile quadridimensionale non ` e completamente adeguata a descrivere tutti i fenomeni sici osservati in natura. Per ci` o che riguarda i cosiddetti sistemi sici quantistici, una descrizione molto pi` u adeguata delle loro propriet` a siche non viene data in una variet` a dierenziabile, ma in uno spazio di Hilbert complesso innito dimensionale. In realt` a le due strutture sono entrambe necessarie. Da questo punto di vista i metodi ed il linguaggio della geometria (dierenziale in particolare) e dellanalisi funzionale degli spazi di Hilbert sono entrati nella struttura delle teorie siche moderne come parte centrale. A titolo di esempio si pu` o ricordare che la nozione di particella nelle 11
teorie quantistiche relativistiche viene data in termini di rappresentazioni unitarie irriducibili del gruppo (di Lie) di Lorentz. (3) Si specula molto sulla eventuale natura non continua, o comunque non descritta da una variet` a di dimensione 4, dello spaziotempo stesso a scale molto piccole: le scale di Planck 1033 cm e 1043 s alle quali dovrebbe apparire qualche teoria quantistica dello spaziotempo. Esistono dierenti proposte: la teoria delle stringhe nelle sue dierenti varianti, la loop quantum ` tuttavia importante precisare gravity e approcci vari basati sulla geometria non commutativa. E che recenti osservazioni sperimentali eseguite con il telescopio spaziale Fermi Gamma-ray, riguardanti i cosiddetti -bursts, hanno abbassato la soglia per lesistenza di fenomeni di quantum gravity (come la violazione della simmetria di Lorentz) ben sotto la scala di Planck2 .
1.2.1
La nozione di coordinata temporale tF di un ssato sistema di riferimento F introdotta sopra, in assenza dellassioma classico del tempo assoluto, richiede ulteriori precisazioni. Come accennato sopra, la procedura sica per denire la nozione di coordinata temporale di un riferimento ` e quella di porre un orologio ideale in quiete in ogni punto dello spazio di quiete del riferimento e quindi sincronizzare a distanza tutti questi orologi, cio` e scegliere, con un ssato criterio, lorigine del tempo per ciascun orologio, lavorando su coppie arbitrarie di orologi. Il tempo segnato dallorologio che si trova in quiete con un evento, denisce il tempo in cui avviene quellevento nel riferimento considerato. Le richieste siche sulla nozione di sincronizzazione sono che: (a) permanere nel tempo una volta imposta su una coppia di orologi, (b) deve essere una propriet` a transitiva (se A ` e sincronizzato con B e B lo ` e con C allora A ` e sincronizzato con C), simmetrica (se A ` e sincronizzato con B allora B ` e sincronizzato con A) e riessiva (ogni orologio A ` e sincronizzato con se stesso). A priori, si possono immaginare alcune procedure per sincronizzare due orologi in quiete nei punti distinti P e Q di E3 F , esaminiamone 3: (1) prendiamo lorologio in Q, portiamolo in P , sincronizziamolo con lorologio in P e riportiamolo in Q; (2) prendiamo un terzo orologio O in moto senza accelerazione rispetto a F sullasse contenente il segmento P Q. Quando lorologio O passa per P lo sincronizziamo con quello fermo in tale punto. Successivamente sincronizziamo lorologio in Q con O non appena questultimo passa per Q; (3) lanciamo verso Q un segnale di velocit` a nota in F dallorologio in P . Quindi sincronizziamo lorologio in Q con quello in P tenendo conto della distanza tra P e Q e del tempo impiegato dal segnale a raggiungere Q. Nella sica classica si assume che esista il cosiddetto tempo assoluto: una funzione T : M 4 R, denita a meno di una costante additiva, che assegna ad ogni evento il suo tempo e che vieA. A. Abdo ed al. A limit on the variation of the speed of light arising from quantum gravity eects. Nature 462, 331-334 (19 November 2009).
2
12
ne misurato, a meno di una costante additiva corrispondente alla scelta dellorigine del tempo ` chiaro che, in sica classica, lipotesi di per lorologio in questione, da ogni orologio ideale. E esistenza del tempo assoluto misurato dagli orologi ideali implica immediatamente che queste procedure di sincronizzazione siano tutte equivalenti. Tuttavia dato che non vogliamo ripristinare lo schema classico che sappiamo non essere in accordo con i fatti, dobbiamo esaminare criticamente le possibilit` a senza assumere a priori che diano luogo alla stessa nozione di sincronizzazione. Bisogna in particolare vericare che almeno una delle tre procedure sia sicamente sensata, cio e che soddis i requisiti (a) e (b) di sopra. Questo fatto non ` e per nulla ovvio. Nel caso (1) ci pu` o essere il problema, ammettendo che F sia inerziale, che nello spostare lorologio da Q a P con accelerazione iniziale e decelerazione nale, si possa alterare il meccanismo di funzionamento dellorologio a causa delle forze interne che si sviluppano3 . Si pu` o supporre come di fatto accade con orologi ben fatti che i problemi insorgano durante le fasi di accelerazione (e decelerazione), ma che gli orologi continuino a segnare il tempo nello stesso modo (ci` o ha senso confrontando coppie di orologi) una volta terminata la fase di accelerazione dopo un certo tempo di rilassamento. Questo fatto per` o incia la procedura di sincronizzazione che tiene conto di ci` o che accade anche durante la fase di accelerazione. Senza un modello preciso del funzionamento di orologio tale procedura ` e dubbia. Il caso (2), lavorando con un orologio in moto rettilineo uniforme evita il problema di sopra, ma assume che le dierenze di velocit` a di orologi sincronizzati nello stesso posto non abbiano rilevanza sica, questo fatto non ` e ovvio. In realt` a si pu` o provare che, con qualche altra ipotesi di carattere matematico, il criterio (2) porta direttamente alla formulazione classica dello spaziotempo. Il metodo (3) sembra condurre ad un circolo vizioso in quanto, per poter conoscere la velocit` a del segnale, bisogna misurarla e per fare ci` o bisogna avere gi` a sincronizzato a distanza una coppia di orologi. Si osservi per` o che la velocit` a di un segnale pu` o essere valutata con un unico orologio purch e il percorso seguito dal segnale sia chiuso. Ulteriormente, tale velocit` a pu` o dipendere dal moto del riferimento rispetto al mezzo in cui si propaga il segnale (ci` o pu` o anche dare luogo ad anisotropia).
1.3
La Teoria della Relativit` a Speciale si basa su due o tre (a volte quattro) postulati sici a seconda dei punti di vista. Noi useremo tre postulati che elenchiamo nel seguito, con alcuni commenti.
Stiamo parlando in termini di forze ed accelerazioni che sono denite nello schema classico e ci o sembra incoerente con il discorso generale. Si osservi tuttavia che dal punto di vista sperimentale la sica classica funziona eccezionalmente bene quando le velocit` a in gioco sono piccole rispetto a quelle della luce. Assumendo di spostare gli orologi con piccolissime accelerazioni e piccolissime velocit` a, si pu` o ritenere valido lo schema classico. Questa approssimazione ` e in realt` a un utilissimo principio guida che deve essere soddisfatto dalla sica relativistica: tutte le leggi relativistiche devono ridursi a quelle classiche nel limite di piccole velocit` a.
3
13
1.3.1
La scelta del criterio di sincronizzazione adottato da Einstein per formulare la Teoria della Relativit` a Speciale ` e il (3) (una volta misurata la velocit` a della luce su un percorso chiuso). Questa scelta viene fatta enunciando un corrispondente principio. RS1. Costanza della velocit` a della luce. Esistono sistemi di riferimento in cui, con una opportuna procedura di sincronizzazione a distanza, la velocit` a della luce nel vuoto assume lo stesso valore, indipendente dalla direzione di propagazione e dal riferimento. Commenti 1.2. (1) Si osservi che il postulato stesso ssa la procedura di sincronizzazione, che coincide con la procedura (3). (2) Il contenuto sico del postulato ` e proprio che (3) sia una buona procedura di sincronizzazione per una certa classe di riferimenti, cio e soddis le richieste (a) e (b). (3) Il postulato di Einstein implica immediatamente che la velocit` a della luce misurata su percorsi chiusi, in quiete con i sistemi di riferimento citati nel postulato, sia costante ed indipendente dal riferimento. Questo fatto ` e indipendente dalla procedura di sincronizzazione a distanza in quanto pu` o essere controllato sperimentalmente usando un unico orologio. Esso stato vericato sperimentalmente molte volte con esperimenti del tipo di quelli Michelson-Morley (vedi per es. [14]), anche considerando sistemi di riferimento non inerziali (come la terra). Torneremo su questo punto discutendo la nozione di sistema di riferimento in Relativit` a Generale nel capitolo 8. (4) Riguardo alle condizioni (a) e (b) risulta che esse sono soddisfatte. Sperimentalmente si vede che la nozione di sincronizzazione implicita in RS1 permanere nel tempo una volta imposta. Inoltre, la propriet` a di riessivit` a` e vericata banalmente, mentre quella di simmetria e transitivit` a seguono dallevidenza sperimentale dellinvarianza della velocit` a della luce misurata su percorsi chiusi (lasciamo la prova al lettore). In realt` a si pu` o provare, ma la procedura non ` e semplice, che la condizione (a) ` e anchessa soddisfatta come conseguenza teorica del fatto che la velocit` a della luce sia invariante se valutata su percorsi chiusi. ` importante notare che, a priori, possono esserci e di fatto ci sono, altre procedure di (5) E sincronizzazione dierenti da quella implicita in RS1 che sono ugualmente sicamente sensate (soddisfano (a) e (b) e implicano linvarianza della velocit` a della luce valutata su percorsi chiusi). Tali nozioni portano ad una descrizione alternativa, ma sicamente equivalente a quella della Relativit` a Speciale [15]. In ogni caso, una volta costruita la teoria adottando una procedura di sincronizzazione sicamente ammissibile, le altre procedure di sincronizzazione devono potere essere modellizzate allinterno della teoria basata sulla procedura di sincronizzazione di Einstein, cio e nello spaziotempo ed usando il linguaggio geometrico adeguato. Torneremo su questo punto discutendo la nozione di sistema di riferimento in Relativit` a Generale nel capitolo 8, mostrando in cosa consistano in pratica procedure di sincronizzazione dierenti da quella einsteiniana. (6) Nel formulare RS1 ` e sottinteso che si ` e fatta una scelta delle unit` a di misura di tempo e spazio per tutti i riferimenti in questione. Tali unit` a di misura possono essere alterate, soddisfacendo 14
ancora RS1, moltiplicando unit` a di tempo e di spazio per uno stesso fattore, eventualmente diverso per ogni riferimento.
1.3.2
Principio dinerzia.
Il principio successivo riguarda i sistemi di riferimento inerziali. Una volta assunta la denizione di sistema di riferimento data precedentemente, essi sono individuati esattamente come nel caso classico in relazione al moto dei corpi isolati. Lidea di fondo ` e di studiare il moto dei corpi quando sono posti a distanza molto grande dagli altri corpi delluniverso. La nostra idealizzazione di corpo sar` a quella del punto materiale, cio` e un corpo sico la cui struttura interna non sia rilevante e la cui evoluzione spaziotemporale sia descrivibile da una linea di universo. ` chiaro che avendo a disposizione un unico punto materiale nelluniverso non hanno alcun E senso sico proposizioni riguardanti il suo stato di moto in quanto questo dipende dalla scelta del riferimento e pu` o essere ssato arbitrariamente scegliendo opportunamente il riferimento. Se consideriamo invece un insieme di pi` u punti materiali, in generale non ` e possibile trovare un riferimento in cui poter assegnare, rispetto ad esso, uno stato di moto scelto a piacimento a ciascuno dei punti materiali contemporaneamente. Il Principio dinerzia o dichiara in particolare cosa succede quando allontaniamo a distanze grandissime un numero arbitrario di punti materiali, reciprocamente e dagli altri corpi delluniverso. Punti materiali che soddisfano tale requisito di lontananza sono detti isolati. Proprio perch e non ` e in generale possibile ssare lo stato di moto di tanti punti materiali contemporaneamente mediate una scelta opportuna del riferimento, il postulato dinerzia ha un contenuto sico altamente non banale: esso aerma che esistano riferimenti in cui tutti i corpi isolati sono in moto a velocit` a costante (di valore dipendente dal corpo considerato) RS2. Principio dinerzia. La classe dei sistemi di riferimento in RS1 coincide con quella dei sistemi di riferimento inerziali individuati dalla richiesta che, rispetto ad ognuno di essi, tutti i punti materiali isolati si muovano a velocit` a costante. Commenti 1.3. (1) Assumeremo che la nozione di punto materiale isolato sia assoluta, cio e indipendente dal riferimento: se un punto ` e isolato in un riferimento lo deve essere in tutti gli altri. (2) Come in sica classica si assume di poter disporre di un punto materiale isolato in ogni evento dello spaziotempo (per un intervallo temporale piccolo ma nito) e con velocit` a arbitrariamente scelta in direzione e modulo variabile dal valore zero no ad almeno il valore della velocit` a della luce.
1.3.3
Principio di Relativit` a.
Lultimo principio di Einstein concerne lestensione del principio di relativit` a galileiano a tutta la sica, inclusi i fenomeni elettromagnetici.
15
RS3. Principio di Relativit` a. Le leggi della sica assumono la stessa forma in ogni sistema di riferimento inerziale. Nota 1.1. Il principio implica che non sia in alcun modo possibile privilegiare un sistema di riferimento nella classe dei sistemi di riferimento inerziali tramite i risultati di esperimenti di sica, dato che possiamo riprodurre il risultato di un esperimento ottenuto in un certo sistema di riferimento, in un qualsiasi altro sistema di riferimento preparando nello stesso modo lapparato sperimentale.
16
Capitolo 2
Quello che ora vogliamo fare in questa sezione ` e determinare la legge di trasformazione tra le coordinate cartesiane ortonormali solidali con due dierenti sistemi di riferimento inerziali. Ci` o sar` a fatto usando i principi RS1 e RS2 pi` u altre ipotesi di carattere matematico o sico matematico che enunceremo quando necessarie. Nota 2.1. Dora in poi il valore universale della velocit` a della luce sar` a indicato con c.
2.1.1
Deniamo preventivamente dei sistemi di coordinate che ci saranno utili in tutto il seguito. Consideriamo un sistema di riferimento F in M 4 . Fissiamo un sistema di coordinate cartesiane ortonormali F : E3 P (x1 (P ), x2 (P ), x3 (P )) = X (P ) R3 F nello spazio di quiete E3 F di F ed una costante t0 R delle dimensioni di un tempo. Il sistema di coordinate globali indotto su M 4 F : M 4 x (ct(x) + ct0 , F (PF (x))) .
` e detto sistema di coordinate minkowskiane solidali con F . Consideriamo un riferimento inerziale F . In coordinate minkowskiane associate a F , levoluzione di un punto materiale sar` a descritta in tali coordinate da 4 funzioni dierenziabili xi = xi (u) i=0,1,2,3, dove u (a, b) ` e un qualsiasi parametro che soddisfa dx0 /du = 0 per ogni punto u (a, b). Dora in poi le lettere latine usate per denotare un indice potranno assumere tutti i valori 0, 1, 2, 3, 17
mentre gli indici greci potranno assumere solo i valori 1, 2, 3. La velocit` a del punto materiale rispetto a F avr` a componenti dx dx du v = = c dx 0 . dt du Il modulo quadro della velocit` a in F vale v 2 = c2 (U )2 dove U i := 0 )2 ( U =1
3 dxi du
(2.1)
La teoria si deve ridurre a quella classica per piccole velocit` a in cui tutte le velocit` a sono ammissibili. Di conseguenza assumeremo che linsieme Cx,F dei vettori tangenti nellevento x alle linee di universo di punti materiali passanti per tale evento includa i vettori di Tx M associati a moti con velocit` a sucientemente piccole in F ed in ogni direzione. In virt` u di (2.1) Cx,F dovr` a includere un cono aperto con asse attorno allasse U = 0. In altre parole, per qualche costante v0 > 0 delle dimensioni di una velocit` a,
U Tx M 4
dxi du
(2.2)
Daltra devono essere ammissibili i moti alla velocit` a della luce in ogni direzione. Di conseguenza ci aspettiamo che tutte le velocit` a no a quella della luce siano ammissibili per cui
3
U Tx M 4 0 <
(U )2 (U 0 )2
=1
Cx,F dove U i :=
dxi du
(2.3)
In particolare, risulta subito che condizione necessaria e suciente anch e il moto sia rettilineo uniforme rispetto a F ` e che, per ogni i,
dxi du dx0 du
= costante .
Ci` o equivale a dire che le derivate in u di tutti i rapporti di sopra sono nulle in (a, b). Calcoliamo esplicitamente le derivate di tali rapporti: 2 2 i dxi d dx0 d x dx0 d2 x0 dxi du . (2.4) = dx0 du du du2 du du2 du du Si tenga conto che dx0 /du = 0 per ipotesi, inoltre se il moto ` e rettilineo uniforme per u (a, b), vale dxj /du = cj dx0 /du per certe costanti cj . Se cj = 0, allora dx0 /du = (cj )1 dxj /du ed il fatto che il moto sia rettilineo uniforme per u (a, b), ossia si annulli il primo membro di (2.4), implica subito: d2 xi dxj d2 xj dxi = 0 per ogni u (a, b). du2 du du2 du 18
Se il moto ` e rettilineo uniforme e cj = 0 allora dxj /du = 0 su (a, b) perch e dxj /du = cj dx0 /du. In tal caso lidentit` a di sopra vale banalmente unaltra volta. Quindi, se il moto ` e rettilineo uniforme per u (a, b) allora d2 xi dxj d2 xj dxi = 0 per ogni u (a, b) e i, j = 0, 1, 2, 3. du2 du du2 du Se viceversa valgono le identit` a di sopra allora ponendo j = 0 e dividendo per (dx0 /du)2 = 0 si ha che dxi d du =0 dx0 du du su (a, b) per cui il moto ` e rettilineo uniforme. In denitiva il moto ` e rettilineo uniforme se e solo se: d2 xi dxj d2 xj dxi = 0 per ogni u (a, b) e i, j = 0, 1, 2, 3. du2 du du2 du (2.5)
Vediamo ora come scrivere che la velocit` a del punto materiale considerato ha modulo pari a c. Se teniamo conto della (2.1) e introduciamo la matrice di coecienti
:=
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
(2.6)
la condizione v 2 = c2 si riscrive equivalentemente, dove, dora in poi, ` e sottintesa la somma sugli indici ripetuti, ij dxi dxj =0. du du (2.7)
Consideriamo ora un secondo sistema di riferimento inerziale F con coordinate minkowskiane y 0 , y 1 , y 2 , y 3 . Data la natura di variet` a dello spaziotempo, i due sistemi di coordinate saranno legati da una trasformazione biettiva da R4 a R4 dierenziabile, con inversa dierenziabile che formalmente esprimeremo come y i = y i (x0 , x1 , x2 , x3 ) dove (x0 , x1 , x2 , x3 ) R4 e i = 0, 1, 2, 3. Dato che la nozione di punto materiale isolato non dipende dal riferimento e che abbiamo assunto di poter disporre di punti materiali isolati in ogni luogo e tempo (per intervalli di tempo piccoli ma niti) con velocit` a arbitrarie (almeno nei limiti detti sopra), il moto rettilineo uniforme di un punto materiale in un riferimento inerziale pu` o sempre essere pensato come dovuto al fatto che il punto materiale ` e isolato. Concludiamo che il moto rettilineo uniforme di un punto materiale (isolato o no) in un riferimento inerziale deve essere descritto come moto rettilineo uniforme in ogni altro sistema di riferimento inerziale. In particolare ci` o si applica anche per moti alla 19
velocit` a della luce che possono sempre pensarsi come propri di segnali luminosi. Abbiamo allora la seguente coppia di richieste sulla trasformazione y i = y i (x0 , x1 , x2 , x3 ) dove (x0 , x1 , x2 , x3 ) R4 e i = 0, 1, 2, 3. (a) in virt` u di RS2 il moto di un punto materiale con linea di universo : u M 4 appare rettilineo uniforme in F (per un certo intervallo di tempo) se appare rettilineo uniforme in F (per un corrispondente intervallo di tempo), ovvero d2 y i dy j d2 y j dy i d2 xi dxj d2 xj dxi = 0 se =0 (2.8) du2 du du2 du du2 du du2 du dove la linea di universo ` e rappresentata in coordiniate minkowskiane di F con le funzioni dierenziabili xi = xi (u), soggette al vincolo (2.3) in ogni evento attraversato, e in quelle di F con le funzioni dierenziabili y i = y i (u), i = 0, 1, 2, 3; (b) in particolare, in virt` u di RS1, un punto materiale con linea di universo : u M 4 si muove alla velocit` a della luce in F se si muove alla velocit` a della luce in F . Ovvero dxi dxj dy i dy j = 0 se ij =0, (2.9) du du du du dove la linea di universo ` e rappresentata in coordiniate minkowskiane di F con le funzioni i i dierenziabili x = x (u), soggette al vincolo (2.3) in ogni evento attraversato, e in quelle di F con le funzioni dierenziabili y i = y i (u), i = 0, 1, 2, 3. ij
2.1.2
Il problema iniziale si riduce a quello di voler determinare la pi` u generale trasformazione biettiva 4 4 da R in R dierenziabile y i = y i (x0 , x1 , x2 , x3 ) dove (x0 , x1 , x2 , x3 ) R4 e i = 0, 1, 2, 3, tale che soddis (a) e (b) di sopra per ogni scelta della curva di universo usata in (a) e (b) con le richieste ivi fatte. Ora passeremo a trarre due utili conseguenze matematiche di (a) e (b) che determineranno la soluzione generale del problema. Trattamento di (a). Essendo y i (u) = y i (x0 (u), x1 (u), x2 (u), x3 (u)) , valgono le identit` a d2 y i dy j d2 y j dy i du2 du du2 du = + y i y j xp xq
d2 xp dxq d2 xq dxp du2 du du2 du dxr 2 y i y j 2 y j y i p q r . du xp xq xr x x x
dxp dxq du du 20
(2.10)
(2.11)
dove le componenti di U Tx M 4 , U i = dxi /du si riferiscono ad un moto rettilineo uniforme di un punto materiale e sono valutate quando la corrispondente linea di universo passa per x. Il (ij ) secondo membro di (2.11) pu` o pensarsi, a x e i, j ssati, come un polinomio P(x) [U 0 , U 1 , U 2 , U 3 ] nelle variabili U i . Tale polinomio si annulla in un insieme aperto per la condizione (2.3) (in realt` a ` e suciente la condizione pi` u debole (2.2)), di conseguenza si annulla ovunque, cio` e tutti i suoi coecienti sono nulli. In particolare, per i coecienti del terzo ordine deve essere: 3 P(x)
(ij )
U a U b U c
=0.
Il calcolo esplicito del primo membro produce le identit` a che devono valere in ogni evento x M 4 e per ogni scelta degli indici i, j, a, b, c: 2 y i y j 2 y i y j 2 y i y j 2 y j y i 2 y j y i 2 y j y i + + =0 xa xb xc xb xc xa xc xa xb xa xb xc xb xc xa xc xa xb Moltiplicando per xc /y j ed eettuando una somma sugli indici ripetuti, lidentit` a trovata 4 implica la seguente utile conseguenza di (a) valida in ogni evento x M : 2yi y i y i | = ( x ) | + |x x a x b xa xb xb xa dove k (x) := 1 2yj y c | |x . x 5 xc xk xj (2.13) (2.12)
y i y j ij p q x x
dxp dxq . du du
(2.14)
In tal modo la condizione (b) si riscrive ij U i U j = 0 implica ij In altri termini x (U, U ) = 0 se (U, U ) = 0 , 21 (2.16) y i y j |x |x U p U q = 0 . xp xq (2.15)
dove il vettore U Tx M 4 , con componenti U k = dxk /du rispetto alla base associata in x dalle coordinate minkowskiane di F , ` e soggetto alla restrizione (2.3), e la forma quadratica x ` e denita da x (U, U ) := ij y i y j |x |x U p U q , xp xq
3
(2.17)
3 0 = |V | e U = V , dove |V | := 2 Un vettore di questo tipo si ottiene ponendo UV =1 (V ) . V Rappresentiamo x con la matrice simmetrica di coecienti c00 , c0 = c0 , c = c . La condizione x (UV , UV ) = 0 si riscrive:
3 3
c00 |V |2 + 2
=1
|V |V c0 +
, =1
V V c = 0
per V R. Ossia 2
|V |V c0 +
=1 , =1
V V (c + c00 ) = 0
per ogni V R. Questo ` e possibile solo se: c = c00 e c0 = 0. Infatti, scegliendo inizialmente un vettore colonna di numeri V R e poi il vettore colonna dei numeri V R, si ha che devono valere entrambe le condizioni:
3 3
2
=1
|V |V c0 +
, =1 3 3
V V (c + c00 ) = 0
e 2
|V |V c0 +
=1 , =1
V V (c + c00 ) = 0
|V |V c0 = 0
=1
e
, =1
V V (c + c00 ) = 0
per ogni V R. La prima richiesta implica che: c0 = 0 per ogni = 1, 2, 3. La seconda, tenuto conto della simmetria dei coecienti c + c00 , implica che1 c + c00 = 0 cio e: c = c00 . In denitiva, se indichiamo con (x) il coeciente c00 , deve essere: x = (x) ,
Se A ` e una matrice simmetrica n n e vale ut Au = 0 per ogni u Rn , ponendo u = x + y abbiamo: t x Ax + y Ay + xt Ay + y t Ax = 0, ossia xt Ay + y t Ax = 0. Ma, dato che At = A, vale anche y t Ax = xt Ay , per cui deve essere xt Ay = 0 per ogni scelta di x, y Rn , che signica A = 0.
t 1
22
dove x (x) R ` e una funzione arbitraria. Tale funzione ` e dierenziabile perch e, interpretando le forme quadratiche come matrici reali 4 4 risulta subito y i y j |x |x , xp xq dove la traccia ` e quella ordinaria per matrici 44. Lultimo membro ` e banalmente dierenziabile, inoltre (x) ` e strettamente positivo a causa di (2.17) e del teorema di Sylvester sulla permanenza della segnatura [9] di una forma quadratica sotto lazione di una trasformazione di similitudine. Concludiamo che (b) implica che 3(x) = tr(x ) = pq ij y i y j |x |x = (x)pq , xp xq dove x (x) ` e una funzione strettamente positiva e dierenziabile. ij (2.18)
Inne, nelle ipotesi di validit` a di (a) e (b) deriviamo in xr la (2.18) esprimendo le derivate i seconde delle y tramite (2.12). In tal modo si ottiene y i y i y j y j y j y i ij p r + r p + q r + r q = pq . q p x x x x x x xr Usando ancora la (2.18), lidentit` a trovata si riduce a ln pq . xr Per concludere, moltiplichiamo entrambi i membri per qs e sommiamo sullindice q il risultato nale, tenendo conto del fatto che 3 q =0 uq qs = us , ottenendo: p rq + q pr + 2r pq =
3
p rs +
q =0
q pr qs + 2r ps =
ln ps . xr
(2.19)
Consideriamo tale sistema come un sistema algebrico nelle incognite r e ln /xr . Scegliendo p = r = 0 e insieme a s = 1, 2, 3, il sistema produce s = 0 per s = 1, 2, 3. Tenendo conto di ci` o ed assumendo s = 0, p = r = 1, dallo stesso sistema si ricava anche 0 = 0. Inne tenendo ln conto che tutte le funzioni r sono nulle, il sistema (2.19) fornisce x r = 0 per r = 0, 1, 2, 3. Concludiamo che lunica soluzione del sistema (2.19), per ogni x M e k = 0, 1, 2, 3: k (x) = 0 , ln = 0. xr (2.20) (2.21)
Da (2.13), tenendo conto che la matrice jacobiana di passaggio dalle coordinate x0 , x1 , x2 , x3 alle coordinate y 0 , y 1 , y 2 , y 3 ` e invertibile, le soluzioni di sopra implicano che per ogni i = 0, 1, 2, 3, y i |x = costante , xj (x) = costante . 23 (2.22) (2.23)
Mettendo tutto insieme, abbiamo ottenuto che, la trasformazione di coordinate minkowskiane x0 , x1 , x2 , x3 e y 0 , y 1 , y 2 , y 3 riferite a due riferimenti inerziali rispettivamente F e F deve essere della forma: y i = C i + Li j x j (2.24) dove i 4 coecienti C i R sono arbitrari e i 16 coecienti Li j R soddisfano le relazioni ij Li p Lj
q
= pq ,
dove > 0 ` e una costante. Si noti che se rideniamo le unit` a di misura dello spazio e del tempo del riferimento F dilatando di un fattore comune 1/2 (ci` o non ` e in contraddizione con i postulati della Relativit` a come precisato dopo RS1), possiamo sempre ridurci alla trasformazione indotta dai coecienti i j := 1/2 Li j . Infatti, denendo nuove coordinate minkowskiane su F date da j j x := x , avremmo da (2.24) che dovr` a essere: (2.25) y i = C i + i j xj , e cio e: y i = C i + i j xj . Indicando nuovamente senza la barra le coordinate associate a F , avremmo allora: y i = C i + i j xj , (2.26)
j
dove i coecienti C i R sono arbitrari e, per costruzione, le matrici di coecienti i soddisfano la relazione di Lorentz: t = .
(2.27)
Supponiamo viceversa che F sia un riferimento inerziale dotato di coordinate minkowskiane x0 , x1 , x2 , x3 e che F sia un secondo riferimento dotato di coordinate minkowskiane y 0 , y 1 , y 2 , y 3 ` immediato vericare che F deve che sono connesse alle precedenti tramite (2.26) e (2.27). E essere inerziale perch e, a causa della linearit` a, le trasformazioni lineari di sopra preservano il moto rettilineo uniforme (basta notare che se la condizione (2.5) ` e soddisfatta nel riferimento F , risulta essere soddisfatta anche in F ) e la nozione di punto materiale isolato ` e assunta essere indipendente dal riferimento. Ulteriormente la condizione (2.27) assicura immediatamente tramite (2.7) che un punto materiale in moto alla velocit` a della luce in F ` e visto in F in moto alla velocit` a della luce. In denitiva abbiamo provato il seguente teorema: Teorema 2.1. Assumendo: (a) la validit` a del principio dinerzia RS2, (b) la validit` a del principio di costanza del valore c della velocit` a della luce RS1, in particolare adottando la procedura di sincronizzazione einsteiniana, 24
(c) di poter disporre di un punto materiale isolato in ogni evento dello spaziotempo per un intervallo di tempo nito (rispetto a qualche riferimento inerziale), (d) che la velocit` a dei punti materiali nei riferimenti inerziali possa avere componenti in ogni direzione e verso e di modulo compreso almeno nellintervallo [0, c] (2.3), allora vale quanto segue. (1) La legge di trasformazione tra due sistemi di coordinate minkowskiane solidali con due rispettivi sistemi di riferimento inerziali deve essere lineare. (2) Pi` u precisamente (previa una eventuale ridenizione delle unit` a di misura di lunghezze spaziali ed intervalli temporali nei riferimenti inerziali in conformit` a con la validit` a dei principi sopra assunti) le trasformazioni (2.26) con C i R e la matrice dei coecienti i j soddisfacente (2.27), sono tutte e sole le trasformazioni di sistemi di coordinate minkowskiane solidali con i rispettivi sistemi di riferimento inerziali. Nota 2.2. Al ne di ottenere = 1 abbiamo sfruttato la possibilit` a di ridenire dilatando o contraendo se necessario le unit` a di misura dei singoli riferimenti inerziali (senza alterare il valore della velocit` a della luce). Una questione che si deve porre sicamente ` e allora la seguente. Consideriamo tre arbitrari sistemi di riferimento inerziali Fl con l = 1, 2, 3. ij indica il coeciente che si ottiene esprimendo la legge di trasformazione (2.25) quando le coordinate y 0 , . . . , y 3 sono relative al riferimento i mentre le coordinate x0 , . . . , x3 sono relative al riferimento j . Per costruzione deve risultare: ij = ik kj , se i, j, k {1, 2, 3} .
1 ik = ki .
(2.28)
In base alle ipotesi no ad ora fatte, non ` e possibile concludere a questo punto che ik = 1, cio e che le unit` a di misura possano essere ssate, una volta per tutte in tutti i riferimenti inerziali, al ne di poter usare sempre la legge di trasformazione (2.26) tra i corrispettivi sistemi di coordinate per ogni coppia di riferimenti inerziali. Unipotesi abbastanza debole per ottenere questo risultato ` e la richiesta che per ogni coppia di riferimenti inerziali Fi , Fj distinti vi sia un terzo riferimento inerziale Fk per il quale valga ki = kj . Dalla (2.28) e dalla seconda in (2.29) si ` possibile mostrare che lesistenza di Fk suddetto ha immediatamente che deve essere ij =1 . E ` e conseguenza dellipotesi di isotropia delle leggi siche formulate nei riferimenti inerziali, se si assume tale ipotesi. Tuttavia noi non ci occuperemo qui della richiesta generale dellisotropia ed assumeremo direttamente che si possano scegliere una volta per tutte i coecienti pari a = 1 per ogni coppia di riferimenti inerziali.
2.2
Possiamo ora introdurre i gruppi di Lorentz e Poincar e tramite il seguente teorema che prova che le trasformazioni tra coordinate minkowskiane ottenute nella sezione precedente, tenuto conto 25
dellosservazione 2.2, formano un gruppo. Teorema 2.2. (I gruppi di Lorentz e di Poincar e.) (1) Linsieme delle matrici reali 4 4, soddisfacenti t = . con
(2.30)
:=
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
(2.31)
formano un gruppo, O(1, 3), sottogruppo di GL(4, R) detto Gruppo di Lorentz. O(1, 3) ` e chiuso rispetto alloperazione di trasposizione di matrici. (2) Linsieme delle trasformazioni da R4 in R4 denite da P(C,) : R4 X C + X , (2.32)
con C R4 , e O(1, 3) formano un gruppo, IO(1, 3), sottogruppo del gruppo delle funzioni biettive da R4 in R4 detto Gruppo di Poincar e2 . Dimostrazione. Per prima cosa proviamo che O(1, 3) ` e un gruppo sottogruppo di GL(4, R). A tal ne notiamo che la matrice identit` a soddisfa (2.30) per cui ` e suciente provare che O(1, 3) ` e chiuso rispetto al prodotto di matrici ed alloperazione di inversa. Per quanto riguarda il primo punto, notiamo che, se t = e t = allora banalmente t t = per cui ( )t = . Quindi O(1, 3) ` e chiuso rispetto al prodotto di matrici. Per quanto riguarda la chiusura rispetto alloperazione di inversa, notiamo che dal teorema di Binet, t = implica (det t )(det )(det ) = det = 1 ossia (det )2 = 1. Per tale motivo det = 0 e quindi esiste 1 se O(1, 3). Daltra parte, se O(1, 3) allora vale anche t = . Infatti, moltiplicando ambo membri di t = per a sinistra e tenendo conto che = I , si ha t = , per cui t = ( )1 = 1 = . Ci` o prova che O(1, 3) ` e chiuso rispetto alla trasposizione di matrici. Per concludere riguardo alla chiusura rispetto allinversa, notiamo che se t = allora (t )1 = 1 ossia 1 1t = , ossia 1t O(1, 3). Applicando la chiusura rispetto alla trasposizione otteniamo che 1 =
2 Il simbolo IO(1, 3), ed in particolare la lettera I , deriva dal fatto che il gruppo di Poincar` e si chiama anche gruppo pseudo ortogonale inomogeneo.
26
(1t )t O(1, 3) se O(1, 3). Per quanto riguarda la seconda parte del teorema, notiamo che la trasformazione (2.32) con C = 0 e = I appartiene allinsieme considerato di trasformazioni e P(0,I ) ` e la funzione identit` a 4 4 da R in R . Di conseguenza ` e suciente mostrare che linsieme di trasformazioni considerato ` e chiuso rispetto alla composizione e alloperazione di calcolo dellinversa. Per quanto riguarda il primo punto esso ` e di immediata prova perch e se P(C , ) e P(C,) sono nellinsieme di trasformazioni considerato P(C , ) P(C,) = P(C + C, ) ` e ancora una trasformazione dellinsieme considerato perch e O(1, 3) se , O(1, 3). come provato sopra. Per quanto riguarda la chiusura rispetto al calcolo dellinversa notiamo che se P(C,) ` e nellinsieme di trasformazioni considerato,
1 P( C,) = P(1 C,1 )
ed il secondo membro ` e ben denito ed ` e ancora elemento dellinsieme di trasformazioni consi 1 derato perch e O(1, 3) se O(1, 3) come provato sopra. 2 Nota 2.3. (1) La scrittura O(1, 3) ` e riferita al numero di volte in cui appare 1 (una volta) ed al numero di volte in cui appare +1 (tre volte) nella matrice diagonale . Il gruppo O(1, 3) ` e un sottocaso di una classe di gruppi ciascuno dei quali ` e indicato con O(n, m) dove n, m sono interi non negativi ` chiaro che arbitrari con m > 0. Tali gruppi vengono detti genericamente pseudo ortogonali. E per n = 0 si ritrovano i soliti gruppi ortogonali O(0, m) = O(m). Precisiamo che in alcuni testi i signicati di n e m in O(n, m) sono invertiti rispetto alla notazione usata qui. (2) Se A e B sono gruppi, {b }bB ` e una classe di automorsmi gruppali su A (cio e isomorsmi gruppali b : A A) che rappresentano B , se vale b b = bb per ogni coppia di elementi b, b B , dove ` e lusuale composizione di funzioni e bb ` e il prodotto gruppale in B di b e b . Per ogni coppia di gruppi A, B dotata di una classe di automorsmi gruppali su A che rappresentano B , si pu` o costruire una struttura gruppale su A B detta prodotto semidiretto dei gruppi A e B . In questo caso il prodotto su A B ` e denito come: (a, b) (a , b ) := (ab (a ), bb ) ,
dove ab (a ) ` e il prodotto gruppale in A di a e b (a ). Si dimostra facilmente che il prodotto denito sopra rende A B un gruppo. Nel caso in cui b = idA per ogni b A, la struttura di gruppo costruita prende il nome di prodotto diretto dei gruppi A e B . Risulta ovvio che IO(1, 3) ` e un prodotto semidiretto del gruppo (abeliano) delle traslazioni di R4 e del gruppo di Lorentz O(1, 3). con automorsmi deniti come: C := C , per ogni O(1, 3) e ogni C R4 . 27
Esercizi 2.1. 1. Mostrare che se O(1, 3) allora 1 = t . 2. Se O(1, 3) pu` o accadere che 0 0 = 0? Soluzione. Dalla denizione di O(1, 3) si ha che deve essere
3
1 = 00 = (0 0 )2 +
=1
0 0 .
per cui la risposta ` e negativa. Esempi 2.1. 1. Si consideri una matrice R O(3), ossia una matrice reale 3 3 tale che Rt R = I . Si prova immediatamente, usando la denizione del gruppo di Lorentz che la matrice
R :=
1 0 0 0 0 0 R 0
` e un elemento del gruppo di Lorentz. Similmente P(C,R ) ` e nel gruppo di Poincar e per ogni 4 C R . In questo modo abbiamo ritrovato il fatto sicamente ovvio, che allinterno dellinsieme delle trasformazioni di coordinate tra due riferimenti ci devono anche essere la trasformazioni di coordinate allinterno di uno stesso riferimento, cio` e trasformazioni che non coinvolgono velocit` a relative. Come vedremo pi` u avanti, ed esattamente come avviene per il gruppo di Galileo, una matrice del gruppo di Lorentz pu` o infatti essere decomposta in pi` u parti di cui solo una parte coinvolge la cinematica. Gli aspetti interessanti che dierenziano la cinematica relativistica da quella classica sono riferiti a tale parte della decomposizione di un elemento del gruppo di Poincar e. 2. Si considerino le trasformazioni dette trasformazioni speciali di Lorentz lungo lasse x3
:=
dove := 1/ 1 v 2 /c2 e v (c, c). Si verica subito, applicando la denizione del gruppo di Lorentz, che questa trasformazione ` e un elemento di tale gruppo. Lazione esplicita della matrice di sopra ` e la seguente. v t = (t 2 x3 ) , (2.33) c x 1 = x1 , (2.34)
0 0 v/c
0 1 0 0
0 v/c 0 0 1 0 0
x 2 = x2 , x
3
(2.35)
3
= (x vt) , 28
(2.36)
dove (t, x1 , x2 , x3 ) e (t , x 1 , x 2 , x 3 ) sono le coordinate di uno stesso evento riferite a due sistemi di coordinate minkowskiane dierenti relativi a due riferimenti F e F rispettivamente. Si noti che per t = 0 e x1 = x2 = x3 = 0 troviamo che t = 0 e x 1 = x 2 = x 3 = 0. Questo signica che i due riferimenti hanno posto lorigine degli assi e del tempo in uno stesso evento O. Al tempo t = t = 0 i due osservatori si vedono reciprocamente con le origini rispettive degli assi spaziali coincidenti. Laspetto pi` u interessante delle trasformazioni di sopra ` e che esse implicano che la nozione di contemporaneit` a dipenda dal riferimento. Infatti, dalla (2.33) risulta subito che se due eventi p, q M 4 con coordinate spaziali x3 (p) = x3 (q ) a giudizio del riferimento F risultano avere la stessa coordinata temporale t(p) = t(q ), ci` o sar` a falso nel giudizio dellaltro riferimento! Torneremo in seguito su tutti questi fenomeni apparentemente paradossali. Vediamo ora di dare un signicato sico al parametro v . Consideriamo un punto P in quiete con il riferimento F con coordinate (costanti!) (x 1 , x 2 , x 3 ). Tale punto descriver` a una curva nelle coordinate dellaltro riferimento e parametrizzata in t . Possiamo esprimere la curva in funzione di t usando direttamente (2.36). Otteniamo in tal modo: x1 (t) = x 1 , x (t) = x , x3 (t) = vt + x3 ,
2 2
` allora chiaro che v rappresenta il valore (con segno) della velocit` dove x 3 ` e costante. E a con cui si vedono muovere nel riferimento F i punti in quiete nel riferimento F . Tale velocit` a non dipende dal punto ed ` e perci` o una velocit` a di trascinamento. Le trasformazioni speciali giocano un ruolo simile a quello giocato dalle trasformazioni pure di Galileo lungo un asse. 3. Per motivi sperimentali le trasformazioni di Lorentz trovate sopra si devono ridurre a quelle di Galilei in qualche approssimazione di piccole velocit` a di trascinamento. Se ci` o non fosse ` chiaro avremmo scoperto le trasformazioni di Lorentz molto tempo prima dellinizio del 1900. E che possiamo confrontare v solo con c. Consideriamo lo sviluppo di Taylor della funzione 2 v (v/c) = 1/ 1 c che compare in (2.33)-(2.36). v2 (v/c) = 1 + 2 + o 2c
v4 c4
Dal punto di vista pratico c 3 105 km/s ` e una velocit` a grandissima. Vediamo qualche stima. Per velocit` a relative tra sistemi di riferimento dellordine al pi` u di 1000km/s, troviamo al pi` u 2 2 4 v /c 10 per cui il fattore nelle (2.33)-(2.36) ` e del tutto trascurabile. Se lavoriamo con distanze dellordine al pi` u di 100.000 km e velocit` a come detto sopra, il secondo addendo nel
29
secondo membro di (2.33) produce valori di tempo dellordine al pi` u di 103 s. Trascurando completamente sia che il secondo addendo nel secondo membro di (2.33) otteniamo t x x x
1 2 3
= t, = x , = x , = x vt .
3 2 1
2.2.1
Il sottogruppo ortocrono.
In realt` a la classe di trasformazioni di Poincar e` e troppo vasta per il seguente motivo sico: la classe dei sistemi di riferimento usati in sica ha la peculiarit` a che ogni sistema di riferimento giudica lo scorrere del tempo nella stessa direzione. (Si osservi che non ` e comunque scorretto dal punto di vista matematico ammettere luso di riferimenti i cui il tempo ` e visto scorrere allindietro.) La richiesta di non invertire il senso di scorrimento del tempo per eventi che avvengono nello stesso posto spaziale in un riferimento inerziale si traduce nel requisito matematico in riferimento alle solite coordinate minkowskiane: y 0 x0 >0
p
per ogni evento p M 4 . Tale requisito, si traduce immediatamente nella richiesta sui coecienti i j 0 0 > 0 . (2.44)
Nella sica classica il requisito di non invertire il senso del tempo ` e automatico quando si assume che la coordinata temporale di ogni riferimento coincida con il tempo assoluto a meno di una costante additiva. Teorema 2.3. (I gruppi di Lorentz e di Poincar e ortocroni.) (1) (i) Se O(1, 3) allora 0 0 < 0 oppure 0 0 > 0, e queste disuguaglianze sono rispettivamente equivalenti a 0 0 1 e 0 0 +1. (ii) Linsieme delle matrici del gruppo di Lorentz O(1, 3) tali che 0 0 > 0 forma un sottogruppo O(1, 3) detto il gruppo di Lorentz ortocrono. Tale gruppo ` e chiuso rispetto alla trasposizione di matrici. (2) Linsieme delle trasformazioni del gruppo di Poincar e P(C,) con O(1, 3) forma un sottogruppo detto gruppo di Poincar e ortocrono indicato con IO(1, 3). (3) Denita la matrice, T := detta inversione del tempo dove ` e data dalla (2.6), vale (i) T O(1, 3), 30
(ii) T T = I . (iii) per ogni O(1, 3), T O(1, 3) se e solo se O(1, 3). (iv) O(1, 3) coincide con lunione dei due insiemi disgiunti O(1, 3) e T O(1, 3) , dove T O(1, 3) := {T | O(1, 3)}. Dimostrazione. La prova di (i) in (1) ` e immediata: dalla condizione t = si ha che deve essere
3
1 = 00 = (0 0 )2 +
=1
0 0 ,
(2.45)
da cui la tesi segue immediatamente. In base a (i) le condizioni 0 0 > 0 e 0 0 1 sono equivalenti. Le dimostrazioni della parte (ii) di (1) e della parte (2) sono molto simili, con ovvie modiche, a quelle del teorema 2.2. Ci limitiamo pertanto a provare che se O(1, 3) allora 1 O(1, 3) e che, se , O(1, 3) allora O(1, 3) . Si osservi che ` e ovvio che t I O(1, 3) e che O(1, 3) se O(1, 3). Per quanto riguarda la chiusura rispetto alla operazione di calcolo dellinversa notiamo che, per computo diretto si verica che 1 = t per ogni O(1, 3). Daltra parte, si verica direttamente facendo il calcolo esplicito dei prodotti matriciali che ( t )0 0 = (t )0 0 = 0 0 per cui la tesi ` e provata. Passiamo alla verica della chiusura rispetto al prodotto. Dobbiamo provare che se valgono 0 0 > 0, 0 0 > 0 allora ( )0 0 > 0. Partiamo dallespressione
3
( )0 0 = 0 0 0 0 +
=1
0 0 .
( )0 0 = 0 0 ( t )0 0 +
=1
0 ( t )0
0 ( t )0 |0 0 ( t )0 0 | ,
=1
(2.46)
per cui il segno di ( )0 0 (che non pu` o annullarsi per (i) di (1) ) coincide con quello di 0 0 0 0 ed ` e quindi positivo. Dimostriamo (2.46). Dalla disuguaglianza di Cauchy-Schwarz 2
3 3 3
0 ( t )0
=1
=1
0 0
( t )0 ( t )0
=1
Possiamo usare (2.45) applicandola a e t (tenendo conto che t appartiene al gruppo di Lorentz dato che appartiene a tale gruppo che ` e chiuso sotto trasposizione.) (2.45) implica 31
immediatamente che
3 3
0 0 (0 0 )2
=1
( t )0 ( )0 (( t )0 0 )2 ,
=1
che insieme implicano (2.46). La dimostrazione di (3) per quanto riguarda (i) e (ii) ` e ovvia per computo diretto. Per quanto riguarda (iii) e (iv) si basa su (i) di (1): se O(1, 3) pu` o accadere solo uno dei due casi mutuamente esclusivi 0 0 > 0 oppure 0 0 < 0 e la moltiplicazione di una matrice O(1, 3) per T a sinistra (oppure equivalentemente a destra), banalmente scambia i due casi come risultato. 2 Nota 2.4. Linsieme T O(1, 3) non ` e un sottogruppo di O(1, 3) perch e non contiene lidentit` a.
32
Capitolo 3
3.1
Abbiamo visto nel capitolo precedente che le trasformazioni tra sistemi coordinate minkowskiane hanno la struttura data dal gruppo di Poincar e P(C,) : R4 X C + X , (3.1)
dove le matrici sono elementi del gruppo di Lorentz denito dalla richiesta: t = . (3.2)
Tali fatti hanno alcune conseguenze determinanti. (a) Il fatto che le coordinate minkowskiane siano globali e che le trasformazioni di Poincar e siano lineari induce naturalmente su M 4 una struttura di spazio ane in cui lapplicazione che associa a coppie di punti vettori ` e denita come segue. Si ssi un evento generico O M 4 e si consideri lo spazio vettoriale reale V := TO M 4 . Si ssi un sistema di coordinate minkowskiane (x0 , x1 , x2 , x3 ) di origine O. Siano e0 , e1 , e2 , e3 i vettori di base associati a tali coordinate in V = TO M 4 . Se p, q M 4 associamo alla coppia ordinata (p, q ) il vettore pq V tale che pq := (xi (q ) xi (p))ei . Usando le trasformazioni del gruppo di Poincar e (che connettono coppie di sistemi di coordinate minkowskiane) ` e immediato provare che lapplicazione denita in tal modo non dipende dalle 33
coordinate minkowskiane usate. Ulteriormente tale applicazione soddisfa banalmente le richieste per denire una struttura ane (vedi Appendice A), come il lettore pu` o facilmente provare1 . Quindi: lo spaziotempo della Relativit` a speciale ` e una variet` a dierenziabile con struttura di spazio ane in cui i sistemi di coordinate minkowskiane formano una sottoclasse della classe delle coordinate cartesiane su M 4 . (b) Se deniamo su M 4 un tensore (pseudo)metrico := ij dxi dxj dove (x0 , x1 , x2 , x3 ) sono un sistema di coordinate minkowskiane, il tensore metrico di sopra assume forma diagonale diag (1, 1, 1, 1) canonica ovunque su M 4 . Ulteriormente, in virt` u di (3.2), la analoga metrica che viene denita usando un altro sistema di coordinate minkowskiane coincide con stessa. In altre parole possiamo denire direttamente nello spazio delle traslazioni dello spazio ane e poi indurlo sullo spazio ane in modo canonico (vedi Appendice A). In tal modo risulta provato che: la classe dei sistemi di coordinate minkowskiane determina univocamente una (pseudo)metrica con segnatura (1, 3) su M 4 , che in tal modo diventa una variet` a Lorentziana (vedi Appendice B) globalmente piatta, in cui i sistemi di coordinate minkowskiani sono tutti e soli i sistemi di coordinate cartesiane pseudo ortonormali. Il gruppo O(1, 3) coincide con il gruppo di stabilit` a della (pseudo)metrica di tale variet` a (vedi Appendice B). Tutto ci` o conduce ad enunciare la seguente denizione, dimenticando la costruzione euristica fatta no ad ora e ridenendo i sistemi di coordinate minkowskiani. Denizione 3.1. (Lo spaziotempo della Teoria della Relativit` a Speciale.) Lo spa4 ziotempo della Teoria della Relativit` a Speciale M , detto spaziotempo di Minkowski, ` e una variet` a dierenziabile a 4 dimensioni, con metrica Lorentziana globalmente piatta. I sistemi di coordinate cartesiane pseudo ortonormali rispetto a sono detti sistemi di coordinate minkowskiane di M4 . Indicheremo con M la classe dei sistemi di coordinate minkowskiane sullo spaziotempo. Il passo successivo ` e quello di dare una denizione formale di sistema di riferimento inerziale nel contesto geometrico dierenziale appena introdotto. Ovviamente tale denizione deve determinare i sistemi di riferimento inerziali gi` a introdotti in modo euristico nella costruzione appunto euristica che ci ha portato allo spaziotempo visto come variet` a Lorentziana. Lidea ` e quella di denire i sistemi di riferimento inerziali partendo dalle coordinate minkowskiane che abbiamo formalmente (ri)denito sopra. Tuttavia, prima di fare ci` o dobbiamo ssare la direzione del tempo nella classe M delle coordinate minkowskiane sullo spaziotempo, selezionando la sottoclasse delle coordinate minkowskiane nelle quali il tempo scorre verso il futuro.
1 Le richieste sullapplicazione (p, q ) pq sono che (i) per ogni p M 4 e u V esiste un unico q M 4 con pq = u e (ii) pq + qr = pr per ogni p, q, r M 4 .
34
3.1.1
Come notato precedentemente, solo le trasformazioni del gruppo ortocrono di Poincar e hanno signicato sico, se vogliamo attribuire alle coordinate minkowskiane il signicato di coordinate siche associate ad osservatori. Infatti solo le trasformazioni ortocrone non invertono il senso dello scorrere del tempo. Usando il gruppo ortocrono, deniamo in M la seguente relazione: se , M , se e solo se 1 IO(1, 3) . (3.3)
Proposizione 3.1. La relazione denita su M in (3.3) ` e una relazione di equivalenza che ammette due sole classi di equivalenza. Dimostrazione. Dato che IO(1, 3) ` e un gruppo valgono i seguenti fatti. 1 = id IO(1, 3), per cui ` e riessiva. Inoltre se 1 IO(1, 3) allora 1 = ( 1 )1 1 1 IO(1, 3) , per cui ` e simmetrica. Inne se 1 2 IO (1, 3) e 2 3 IO (1, 3) allora 1 1 1 e anche transitiva. In denitiva ` e una 1 3 = (1 2 ) (2 3 ) IO (1, 3), per cui ` relazione di equivalenza. Proviamo che ci sono solo due classi di equivalenza. Preso M consideriamo := P(0,T ) , per costruzione M e dato che 1 = P(0,T ) IO(1, 3) visto che T O(1, 3) . Quindi ci sono almeno due classi di equivalenza: quella di e quella di . Per provare che sono le uniche due ` e suciente dimostrare che se 1 M e vale 1 , 1 IO(1, 3) . Per (iii) in (3) in allora 1 . Eccone la prova. 1 signica 1 1 teorema 2.3 questo equivale a dire che P(0,T ) ( 1 ) IO(1, 3) che equivale, a sua volta, a 1 1 e : (P(0,T ) ) 1 IO (1, 3), che signica, come volevamo, 1 . 2 1 IO (1, 3), cio Se i sistemi di coordinate Minkowskiane , appartengono alla stessa classe di equivalenza, e solo allora, la trasformazione di coordinate tra tali sistemi di coordinate ` e elemento del gruppo ortocrono di Poincar e . Dal punto di vista sico, ssare unorientazione temporale nella classe delle coordinate minkowskiane signica dichiarare in quale delle due classi disgiunte di sistemi di coordinate minkowskiane si vede il tempo scorrere in avanti. Ha allora senso dare la seguente denizione. Denizione 3.2. La scelta di una delle due classi di equivalenza suddette, che indicheremo con M (e la rimanente con M ) si dice orientazione temporale di M. Se M si dice che ` e orientato positivamente nel tempo. Nota 3.1. Dora in poi lavoreremo solo con sistemi di coordinate minkowskiane in M.
3.1.2
Ora possiamo dare una denizione geometrica di sistema di riferimento inerziale. Lidea sica ` e che due sistemi di coordinate minkowskiane deniscano lo stesso sistema di riferimento quando sono connessi da una rototraslazione spaziale e/o da una traslazione temporale costanti nel
35
tempo. Dal punto di vista matematico, tale idea ` e supportata dal fatto che le trasformazioni
R :=
1 0 0 0 0 , 0 R 0
(3.4)
dove R O(3) sono elementi di O(1, 3) come si prova per computo diretto. Di conseguenza le trasformazioni P(C,R ) appartengono a IO(1, 3) per ogni C R4 e ogni R O(3). Deniamo in M la seguente relazione: se , M , se e solo se 1 = P(C,R ) per qualche C R4 e R O(3) .
` immediato vericare che si tratta di una relazione di equivalenza. Gli elementi F dello spazio E quoziente M / , ossia le classi di equivalenza associate a tale relazione, saranno per denizione, i sistemi di riferimento inerziali. Denizione 3.3. (Sistemi di riferimento inerziali.) Le classi di equivalenza associate alla relazione di equivalenza su M, se , M , se e solo se 1 = P(C,R ) per qualche C R4 e R O(3) ,
sono dette sistemi di riferimento inerziali. Linsieme dei sistemi di riferimento inerziali sar` a indicato con S. Se F S e F , si dice che ` e un sistema di coordinate minkowskiane solidali con F . Commenti 3.1. (1) Notiamo che per costruzione se , M sono solidali con il sistema di riferimento inerziale F , posto : M4 p (x0 (p), x1 (p), x2 (p), x3 (p)) e : M4 p (x 0 (p), x 1 (p), x 2 (p), x 3 (p)), le funzioni, coordinate temporali, p x0 (p) e p x 0 (p) saranno legate dalla relazione x 0 (p) = x0 (p) + k , dove k R ` e una costante indipendente da p. Di conseguenza: |p = |p =: F 0 x x 0 Viene in tal modo denito un campo vettoriale controvariante associato a F ed indipendente dalla scelta del sistema di coordinate minkowskiane scelto in F . Vale banalmente (F |F ) = 1. Si noti inne che, dato che al variare di p, i vettori x 0 |p hanno sempre le stesse componenti in coordinate cartesiane, essi determinano un unico vettore, indicato sempre con F , nello spazio delle traslazioni dello spazio ane (vedi Appendice A). (2) Se , F S, con ovvie notazioni, la classe di sottovariet` a a due a due disgiunte la cui unione coincide con tutto M4 F t := {q M4 | x0 (q ) = t} tR , 36
coincide con la classe di sottovariet` a F t := {q M4 | x 0 (q ) = t} t R . Tuttavia il risultato non vale se e appartengono a due diversi sistemi di riferimento inerziali. (3) Fissato F S, le sottovariet` a F t ricevono naturalmente una struttura di spazio ane indotta da quella di M4 in cui il sistema di coordinate x1 , x2 , x3 indotte da qualunque F sono un sistema di coordinate cartesiane. (4) Fissato F S, il tensore metrico F t indotto da su ogni F t risulta essere a segnatura ellittica e ci` o rende ogni F t una variet` a riemanniana. Tale metrica riemanniana, dal punto di vista sico ` e la metrica che corrisponde agli strumenti di misura delle lunghezze spaziali (regoli ideali) in quiete con F . La distanza dt sullo spazio di quiete con F , F t soddisfa: dF t (P, Q) = ij (xi (p) xi (q ))(xj (p) xj (q )) , dove p, q M4 sono gli eventi corrispondenti ai punti P, Q nello spazio di quiete con F ad un uguale tempo ssato. (5) Fissato F S, come ` e immediato vericare, ogni sistema di coordinate cartesiane indotto su F t da un sistema di coordinate minkowskiane F (semplicemente ssando la coordinata temporale al valore prestabilito da t di F t ) ` e un sistema di coordinate cartesiane ortonormali per F t . Quindi ogni F t ` e una sottovariet` a di M4 che ` e anche variet` a riemanniana globalmente piatta, cio` e uno spazio euclideo. (6) Se F S, il campo F risulta essere ortogonale allunica t che passa per p, nel senso che i prodotti scalari tra x 0 ed i vettori x Tp t , = 1, 2, 3 risultano tutti nulli. (7) Le linee integrali del campo F suddetto sono sotto variet` a dierenziabili unidimensionali embedded in M4 su cui (notare il segno!) induce una metrica ellittica, le risultanti variet` a riemanniane sono globalmente piatte. Tale metrica riemanniana, dal punto di vista sico ` e la metrica che corrisponde agli strumenti di misura degli intervalli temporali (orologi ideali) in quiete con F . Lintervallo di tempo trascorso per F tra due eventi p, q M4 con le stesse coordinate minkowskiane spaziali (x1 , x2 , x3 ) in F ` e ancora tF (p, q ) = 1 ij (xi (p) xi (q ))(xj (p) xj (q )) . c
` chiaro che, riferendosi alle denizioni euristiche date nella sezione 1.2, ogni coordinata (8) E temporale x0 di quelle considerate sopra e riferite ad uno stesso F S altro non ` e che ctF + k per qualche costante k R, dove tF era la coordinata temporale del riferimento F . Similmente, lo spazio di quiete con F , E3 o identicare come variet` a riemanniana globalmente piatta F , si pu` (cio` e spazio euclideo) con una qualsiasi delle sottovariet` a t . Denizione 3.4. (Strutture geometriche nei sistemi di riferimento inerziali.) Sia F un sistema di riferimento inerziale in M4 . (a) Il campo vettoriale F (con (F |F ) = 1), dato in ogni evento dal vettore tangente 37
alla coordinata temporale di un qualsiasi F ` e detto campo vettoriale temporale (o semplicemente vettore temporale) associato a F . La metrica euclidea indotta da sulle sottovariet` a unidimensionali curve integrali del campo F , ` e detta metrica temporale di F . 0 (b) Se F e x ` e la prima funzione coordinata di F , tF := x0 /c : M4 R denita a meno di costanti additive ` e detta coordinata temporale (globale) di F . Ogni sottovariet` a tridimensionale (ovunque normale a F ), F t := {p M4 | tF (p) = t}, ` e detta spazio di quiete di F al tempo t. La metrica euclidea indotta da su F t ` e detta metrica spaziale di F al tempo t. Dalla denizione data e dalla discussione precedente risulta chiaro che allinterno di un ssato riferimento inerziale la struttura geometrica ` e la stessa che si aveva in meccanica classica. Le dierenze nascono quando si considerano due diversi riferimenti inerziali. In tal caso, a dierenza della meccanica classica, ogni sistema di riferimento inerziale ha la propria classe di spazi di quiete a tempo ssato. Tali spazi non coincidono pi` u se si considerano sistemi di riferimento inerziali dierenti. Lo stesso fatto accade per le coordinate temporali di dierenti riferimenti. Tale situazione ` e responsabile dei fenomeni di dilatazione degli intervalli di tempo e contrazione delle lunghezze spaziali che esamineremo pi` u avanti. Nella Relativit` a non c` e un modo univoco di separare lo spazio dal tempo nello spaziotempo. Per tale motivo lo spaziotempo acquista unimportanza superiore rispetto allo spazio ed al tempo separatamente: gli oggetti sici devono essere visti e descritti come oggetti spaziotemporali. Nota 3.2. Alla ne del nostro ragionamento euristico abbiamo visto che le coordinate cartesiane ortonormali nello spaziotempo deniscono solo sistemi di riferimento inerziali. Ci si pu` o chiedere se esistano altri sistemi di riferimento che non siano inerziali, ma che diano luogo a sistemi di coordinate globali, in cui lo spazio di quiete sia ancora uno spazio euclideo (rispetto alla metrica indotta da ) isometrico a E3 la cui unione ` e tutto lo spaziotempo. Si pu` o mostrare che la risposta ` e negativa. In ogni caso la denizione di sistema di riferimento generale pu` o essere nuovamente considerata, fuori dal contesto euristico iniziale, una volta che la struttura sico-geometrica della relativit` a sia stata completata. Tale analisi ` e necessaria per fondare la Teoria della Relativit` a Generale.
3.1.3
Per concludere diamo un teorema tecnico che dimostreremo in un prossimo capitolo e che traduce in termini matematici ci` o che ci si aspetta dallintuizione sica: presi due sistemi di riferimento inerziali F e F ` e sempre possibile trovare sistemi di coordinate minkowskiane solidali con ciascuno di essi in modo tale che la trasformazione di coordinate sia una trasformazione speciale di Lorentz lungo lasse x3 . Teorema 3.1. Se F , F S, esistono F e F tali che 1` e una trasformazione
38
speciale di Lorentz lungo x3 , ossia ` e rappresentata da una matrice di O(1, 3) della forma
:=
0 0 v/c
0 1 0 0
0 v/c 0 0 1 0 0
Dimostrazione. La tesi segue dal teorema 7.7 come provato nella nota 7.2. 2.
3.2
Introdurremo ora una classicazione dei vettori in M4 ed alcune strutture geometriche associate di larghissimo uso nelle teorie relativistiche. In Appendice B sono riassunte alcune nozioni utili che adopereremo di seguito. Per maggiore generalit` a daremo le denizioni nel caso generale di una variet` a Lorentziana quadridimensionale generica (M, g), dato che tali nozioni sono usate anche in Relativit` a Generale. Una giusticazione della terminologia introdotta sar` a data successivamente nel caso minkowskiano. Assumeremo sempre, nel caso generico, che la variet` a e la metrica siano smooth cio` e di classe C , inoltre la nozione di variet a che usiamo include la richiesta che la variet` a sia uno spazio topologico di Hausdor a base numerabile. Denizione 3.5. Se (M, g) ` e una variet` a quadridimensionale lorentziana, in particolare M = M4 e g = , per ogni x M , i vettori v Tx M \ {0} vengono classicati come segue: (a) v ` e di tipo spazio se g(v |v ) > 0; (b) v ` e di tipo tempo se g(v |v ) < 0; linsieme dei vettori di tipo tempo in Tx M ` e indicato con Ix e viene detto cono temporale in x; (c) v ` e di tipo luce se g(v |v ) = 0; linsieme contenente il vettore nullo e i vettori di tipo luce in Tx M viene detto cono di luce in x; (d) v ` e di tipo causale se v ` e indierentemente di tipo tempo o di tipo luce; linsieme contenente il vettore nullo e i vettori causali in Tx M ` e indicato con Jx e viene detto cono causale in x. La terminologia si estende ai campi vettoriali controvarianti in modo naturale (es. un campo vettoriale controvariante ` e detto di tipo tempo se in ogni punto della variet` a determina un vet tore di tipo tempo) ed ai vettori covarianti q Tx M \ {0} ed ai campi vettoriali covarianti in modo naturale (es. un vettore covariante ` e detto di tipo tempo il corrispondente vettore controvariante, ottenuto attraverso lisomorsmo naturale tra lo spazio dei vettori controvarianti e quello dei vettori covarianti generato dalla metrica, ` e di tipo tempo).
39
Nota 3.3. Il vettore nullo 0 non ` e classicato in alcun modo nella denizione di sopra anche se appartiene, per denizione a Jx . Possiamo dare una corrispondente denizione per le sottovariet` a embedded di dimensione 3. Se S ` e una sottovariet` a embedded (n1)-dimensionale della variet` a dierenziabile n-dimensionale M , nellintorno di ogni punto p S essa ` e individuata dal luogo dei punti q M che soddisfano (1) f (q ) = 0, dove f : M R ` e una certa funzione dierenziabile con (2) dfp = 0. Dimostriamo questa aermazione. Lesistenza di f deriva dalla richiesta che S sia una sottovariet` a embedded di co-dimensione 1. Per denizione, nellintorno in M di p S deve allora esistere un sistema di coordinate x0 , x1 , . . . , xn1 in cui S ` e descritta come il luogo dei punti (nellintorno detto) con x0 = 0 e le x1 , . . . , xn1 deniscono una carta locale di S nellintorno di p. Dato che vale ovviamente dx0 = 0, possiamo dunque denire una f che soddis (1) e (2) come la funzione coordinata x0 in un intorno in M di p (e in qualsiasi altro modo fuori da tale intorno). Ogni (altra) funzione f : M R che soddisfa (1) e (2) nellintorno di p, avr` a dierenziale in p dato f n1 f . La richiesta di validit` 0 da: dfp = x | dx a di (1) e la natura delle coordinate p 0 |p dx + =1 x f 0 1 n 1 x ,x ,...,x implicano immediatamente che x |p = 0 per = 1, . . . , n 1. La richiesta di f validit` a di (2) implica allora che x 0 |p = 0. Concludiamo che, nella classe di tutte le funzioni f : M R che soddisfano i requisiti (1) e (2) rispetto a S e p, il dierenziale dfp ` e determinato a meno di un fattore non nullo. Per denizione np := dfp ` e il covettore normale a S in p, esso ` e denito a meno di un fattore non nullo. Vale inne la relazione, che pu` o essere usata per denire alternativamente, ma equivalentemente, np : np , Yp = 0 se e solo se Yp Tp S . (3.5) Per provarla, ricordiamo che le n 1 coordinate x1 , . . . , xn1 introdotte sopra deniscono un sistema locale di coordinate su S nellintorno di p e quindi {/x |p }=1,...,n1 ` e una base di 0 0 Tp S e, conseguentemente, dx , x = 0 per = 1, . . . , n 1. Dato che dxp coincide con np = 0 per = 1, . . . , n 1 implica lidentit` a in (3.5) a meno di un fattore non nullo, dx0 , x se Yp Tp S . Viceversa se Yp Tp M , decomponendo tale vettore sulla base dei vettori /xa |p b a a dellidentit` a con a = 0, 1, . . . , n 1 e tenendo conto del fatto che dxa p , /x |p = b , la validit` 0 in (3.5) implica che la componente lungo /x |p deve essere nulla. Quindi Yp ` e combinazione lineare dei vettori /x |p con = 1, . . . , n 1 cio e` e un elemento di Tp S . Denizione 3.6. Se S ` e una sottoavariet` a embedded tridimensionale della variet` a lorentziana quadridimensionale (M, g), S ` e detta essere: di tipo spazio se il suo covettore normale ` e di tipo tempo, di tipo tempo se il suo covettore normale ` e di tipo spazio, di tipo luce (equivalentemente di tipo nullo) se il suo covettore normale ` e di tipo luce. Vale la seguente proposizione.
40
Proposizione 3.2. Se S ` e una sottovariet` a embedded tridimensionale della variet` a lorentziana quadridimensionale (M, g), S ` e di tipo spazio se e solo se lo spazio tangente a S in ogni suo punto ` e un sottospazio di Tp M formato da vettori di tipo tempo. Dimostrazione. Per ogni p S , consideriamo il vettore controvariante Np Tp M che otteniaa := g ab (n ) (in forma intrinseca n := g(N |)). mo alzando lindice del covettore normale: Np p b p p In virt` u della (3.5), Np sar` a normale al piano tangente di S in p. Assumiamo ora che S sia di tipo spazio, e quindi np e Np siano di tipo tempo, e proviamo che i vettori di Tp S sono tutti di tipo spazio. Possiamo ridenire Np , moltiplicandolo per un fattore non nullo, in modo che valga g(Np |Np ) = 1. Nelle ipotesi fatte possiamo quindi completare Np a base di Tp M aggiungendo 3 vettori e , con = 1, 2, 3, normali a Np (che quindi, per (3.5), devono essere tre elementi linearmente indipendenti di Tp S e quindi una base di esso) che siano a due due ortogonali e normalizzati come g(e |e ) = 1. Dato che la metrica deve essere di tipo iperbolico normale e diagonale nella base {Np , e1 , e2 , e3 } e sappiamo che g(Np |Np ) = 1, deve risultare g(e |e ) = 1. Di conseguenza i vettori e sono di tipo spazio e lo sono tutte le loro combinazioni lineari, cio e i vettori di Tp S . Assumiamo ora che i vettori di Tp S sono di tipo spazio e proviamo che S ` e di tipo spazio. In tali ipotesi saranno di tipo spazio anche tre vettori di una base ortonormale di Tp S . Possiamo completare a base di Tp M tale terna di vettori con un quarto vettore Np normale ad essi. Tale vettore, se normalizzato, pu` o solo soddisfare g(Np |Np ) = 1, dato che la metrica ` e di tipo iperbolico normale e deve essere in forma canonica nella base detta. Per costruzione il vettore np := g(Np |) soddisfa lidentit` a in (3.5) ed ` e quindi il covettore normale a S in p. Per costruzione np ` e di tipo tempo e quindi S ` e di tipo tempo dato che p S ` e qualunque. 2 ` evidente che quando ssiamo un sistema di riferimento F nello spaziotempo di Minkowski E M4 , le sottovariet` a F t denente lo spazio di quiete al tempo t del riferimento sono sottovariet` a tridimensionali embedded di tipo spazio. Tuttavia non sono le uniche possibili anche nello spaziotempo di Minkowski. In generale si possono costruire sottovariet` a di tipo spazio che risultano essere curve rispetto alla metrica indotta h, mentre le F t sono globalmente piatte per costruzione. Nota 3.4. (1) Se S ` e una sottovariet` a embedded di M , i vettori tangenti a S si possono pensare come vettori tangenti a M . In questo modo la metrica g di M valutata in un punto p S induce una forma quadratica h (un tensore covariante doppio simmetrico) su ogni Tp S , che si dice metrica indotta su S . A causa dellembedding smooth, h denisce un campo tensoriale smooth su S . Tuttavia h potrebbe essere degenere e quindi non rappresentare un vero tensore metrico e nemmeno un tensore pseudo-metrico su S . In base alla proposizione 3.2, la sottovariet` a tridimensionale embedded S M ` e di tipo spazio se e solo se la metrica h indotta dalla metrica lorentziana dello spaziotempo g su ` e denita positiva, cio` e ` e un prodotto scalare propriamente detto. In tal modo (, h) ` e una variet` a riemanniana in senso proprio. 41
(2) Seguendo la stessa dimostrazione della proposizione 3.2 si verica che S risulta essere di tipo spazio se e solo se la metrica indotta h su S ` e ancora una metrica lorentziana (in dimensione 3 in questo caso), in tal modo (S, h) ` e una variet` a lorentziana di dimensione 3. (3) Se ` e di tipo luce se allora la metrica indotta h ` e degenere, perch e il vettore controvariante associato a np risulta essere tangente a in ogni punto p, ma risulta anche essere di tipo nullo.
3.2.1
Coni spaziotemporali.
La struttura degli insiemi contenenti i tipi di vettori della denizione 3.5 ` e piuttosto interessante. Se ssiamo una base pseudo ortonormale in Tx M (in particolare nel caso M = M4 ), B = {e0 , e1 , e2 , e3 } con g(e0 |e0 ) = 1 (e quindi g(e |e ) = 1), risulta chiaro che un vettore v = v i ei = 0: ` e di tipo tempo se e solo se
3
(v )2 .
=1
(v )2 > 0 ,
=1
(v 0 )2 =
(v )2 > 0 ,
=1
Passiamo ora a studiare con maggior dettaglio la struttura di Ix . Vale la seguente importante proposizione. Proposizione 3.3. In riferimento alla denizione 3.5, per ogni x Tx M , linsieme Ix risulta essere unione sconnessa di due insiemi aperti e connessi, I1x e I2x detti falde di Ix , nella topologia indotta su Ix da quella dello spazio tangente. Vale inoltre quanto segue. (a) I1x e I2x risultano essere insiemi conici: se u, v I1x (risp. I2x ) allora au + bv I1x (risp. I2x ) per ogni coppia a, b > 0. (b) Fissata una base pseudo ortonormale B = {e0 , e1 , e2 , e3 } Tx M , I1x e I2x sono individuati da, non necessariamente in questordine:
3
v Tx M
(v 0 )2 >
(v )2 , v 0 > 0
=1
v Tx M
(v 0 )2 >
(v )2 , v 0 < 0
=1
(c) Se ux , vx Ix allora g(ux |vx ) = 0, in particolare ux , vx appartengono alla stessa falda se e solo se g(ux |vx ) < 0 ed appartengono a falde diverse se e solo se g(ux |vx ) > 0.
42
Dimostrazione. Dimostriamo contemporaneamente la prima parte della tesi ed i punti (a) e (b). Fissata la base pseudo ortonormale B = {e0 , e1 , e2 , e3 } Tx M , linsieme Ix ` e dato dai vettori vx = v i ei che soddisfano
3
(v ) >
0 2
(v )2 ,
=1
per cui si decompone nellunione disgiunta dei due sottoinsiemi: CB> := e CB< :=
3
v Tx M
(v 0 )2 >
(v )2 , v 0 > 0
=1 3
v Tx M
(v 0 )2 >
(v )2 , v 0 < 0
=1
` chiaro che tali insiemi sono separatamente aperti e connessi nella topologia di R4 che ` E e omeomorfa a quella di Tx M tramite lomeomorsmo dato dalla trasformazione lineare non singolare che associa le componenti di un vettore con il vettore stesso. Quindi CB> e CB< coincidono con le componenti connesse di Ix . Inoltre ` e evidente che si tratta di insiemi conici. Se cambiamo base, scegliendo unaltra base pseudo ortonormale B = {e0 , e1 , e2 , e3 } in Tp M , possiamo denire gli analoghi insiemi CB > e CB < che risulteranno ancora coincidere con le componenti connesse di Ix . Essendo queste denite univocamente dalla topologia di Tx M , dovr` a essere CB > CB> e CB < CB< oppure CB > CB< e CB < CB> , dove il simbolo indica che i corrispondenti insiemi di Tx M coincidono. 2 (c) Se ux , vx Ix , allora, rispetto alla base pseudo ortonormale B : (v 0 )2 > 3 =1 (v ) e 3 2 0 2 (u ) > =1 (u ) , per cui
3 3 3
(v 0 u0 )2 >
(v )2
=1
(u )2
=1
(v u )2 ,
=1
g(vx |ux ) = (v 0 u0 ) +
=1
v u = 0
ed ha segno positivo se e solo se v 0 u0 < 0 e cio e ux e vx appartengono a falde opposte, oppure negativo se e solo se v 0 u0 > 0 e cio e ux e vx appartengono alla stessa falda. 2 Abbiamo provato che, indipendentemente dalla scelta della base, Ix risulta essere un insieme aperto e sconnesso dato da un cono a due falde (aperte e connesse) di vertice nellorigine. Valendo che vx Jx , se e solo se le sue componenti soddisfano:
3
(v )
0 2
(v )2 ,
=1
43
e tenuto conto che la topologia di R4 ` e omeomorfa a quella di Tx M (tramite lomeomorsmo dato dalla trasformazione lineare non singolare che associa le componenti di un vettore con il vettore stesso) Jx risulta essere un insieme chiuso e connesso. Jx ` e la chiusura di Ix . La frontiera di Ix , che coincide con quella di Jx , ` e linsieme dei vettori di tipo luce in x unitamente al vettore nullo di Tx M . Nota 3.5. Le denizioni appena date valgono pi` u in generale in riferimento ad una variet` a lorentziana M di dimensione n 2. Consideriamo ora in particolare il caso M = M4 e sfruttiamo la sua struttura ane. Denizione 3.7. Nello spazio ane M4 attraverso lapplicazione che associa punti a vettori uscenti da un medesimo punto, cio` e attraverso le coordinate cartesiane: Ix Tx M4 denisce Ix M4 e Jx Tx M4 denisce Jx M4 . Dato che lapplicazione che associa punti a vettori uscenti da un medesimo punto ` e un omeo2 4 4 morsmo da Tx M a M , le propriet` a topologiche dette sopra di Ix e Jx valgono immutate per Ix e Jx rispettivamente.
3.2.2
Vogliamo denire unorientazione temporale di M4 tramite la struttura dei coni introdotta precedentemente. Lavoreremo nel caso generale di una variet` a quadridimensionale lorentziana connessa (M, g). Consideriamo, se esiste, un campo vettoriale Z controvariante di tipo tempo che sia (almeno) continuo su tutto M . Denizione 3.8. Sia (M, g) una variet` a dierenziabile quadridimensionale lorentziana di classe C . Assumendo M connessa, si dice che M ` e temporalmente orientabile, se esiste su M un campo vettoriale controvariante Z di tipo tempo (almeno) continuo. Nota 3.6. Si osservi che la richiesta non ` e ovvia e ci sono variet` a lorentziane in cui non ` e possibile denire alcun campo vettoriale controvariante di tipo tempo che risulti essere continuo su tutta la variet` a. Tuttavia lo spaziotempo di Minkowski ` e banalmente temporalmente orientabile: un campo vettoriale Z con le caratteristiche di sopra esiste ed ` e dato, per esempio, dal campo F di un qualsiasi sistema di riferimento inerziale. Il campo Z selezioner` a in ogni x M uno solo degli insiemi I1x e I2x e avremo in tal modo denito unapplicazione, che assegna ad ogni punto x M uno solo dei due insiemi I1x , I2x .
La topologia su M4 , che ` e uno spazio ane, ` e quella indotta su M4 dalle coordinate cartesiane a partire da 4 quella di R . Questultima ` e banalmente omeomorfa a quella che abbiamo considerato sopra su Tx M4 .
2
44
Denizione 3.9. Se (M, g) ` e una variet` a quadridimensionale lorentziana temporalmente orientabile, si ssi un campo vettoriale controvariante (almeno) continuo di tipo tempo Z denito su tutto M . (a) lapplicazione T che assegna ad ogni punto x M uno solo dei due insiemi I1x , I2x ` e detta orientazione temporale di M (indotta da Z ). + e detto cono temporale (b) (i) I+ e detto cono temporale futuro in x e I x := T (x) ` x := Ix \ Ix ` passato in x. + (ii) J+ e detto cono causale futuro e J e detto cono causale passato. x := Ix , ` x := Ix ` + (iii) I vettori causali in Jx sono detti diretti verso il futuro, i vettori causali in J x sono detti diretti verso il passato. (c) Nel caso in cui M = M4 valgono le seguenti ulteriori denizioni: +, ` (i) Il futuro temporale (o futuro cronologico) di x, Ix e dato dallinsieme degli eventi 4 + di M individuati dai vettori di Ix tramite la struttura ane di M4 , , ` (ii) il passato temporale (o passato cronologico) di x, Ix e dato dallinsieme degli 4 eventi di M individuati dai vettori di Ix tramite la struttura ane di M4 , + +, ` (iii) il futuro causale di x, Jx e denito come Ix , (iv) il passato causale di x, Jx , ` e denito come Ix .
e un vettore Nota 3.7. Si osservi che J+ x e Jx contengono anche il vettore nullo che non ` + causale. Similmente Jx e Jx includono anche il punto x.
Vale il seguente fondamentale risultato. Proposizione 3.4. Esistono e sono solo due le possibili orientazioni temporali per ogni variet` a quadridimensionale lorentziana (M, g) connessa e temporalmente orientabile (in particolare ci` o vale per lo spaziotempo della relativit` a speciale M4 ). Dimostrazione. Sia Z un campo vettoriale controvariante di tipo tempo che sia almeno continuo su M . Esso determina unorientazione temporale di M . Una seconda e dierente orientazione ` e individuata da Z . Mostriamo che non ce ne sono altre. Se scegliamo un campo vettoriale controvariante continuo di tipo tempo Z , non necessariamente coincidente con Z e denito su tutto M , in virt` u di (c) in proposizione 3.3 la funzione: f :M x g(Zx |Zx ) , |g(Zx |Zx )|
` e ben denita in quanto il denominatore non si annulla mai. Essendo essa continua ed essendo M connessa, f (M ) deve essere una delle due componenti connesse di {1, +1} (con la topologia indotta da R). Questo signica che il segno di g(Zx |Zx ) ` e costante su M . In base a (c) in proposizione 3.3, Z apparterr` a , per ogni x M , alla stessa falda di Z se g(Z |Z ) < 0 oppure apparterr` a sempre alla falda a cui non appartiene Z , se g(Z |Z ) > 0. 2
45
3.3
In questa sezione ci concentreremo sulla struttura geometrica dello spaziotempo di Minkowski M4 giusticando in termini sici la terminologia precedentemente introdotta. Per prima cosa mostreremo che M4 ammette unorientazione temporale indotta dalla classe dei sistemi di riferimento inerziali. Successivamente vedremo come la metrica dello spaziotempo di Minkowski M4 sia connessa alla causalit` a.
3.3.1
Per concludere studiamo la relazione tra sistemi di riferimento inerziali e coni temporali in M4 . Come conseguenza di tale risultato segue anche che i sistemi inerziali sono biunivocamente determinati dai vettori unitari del cono temporale futuro I+ x per un arbitrario punto x. Proposizione 3.5. Si consideri la classe dei sistemi inerziali S in M4 . (1) I sistemi di riferimento inerziali F S determinano, tramite i vettori temporali associati F , ununica orientazione temporale di M4 indicata con T . (2) Fissato x M4 e considerato I+ x = T (x), lapplicazione che assegna ad ogni riferimento inerziale F S il corrispondente vettore F x I+ e unapplicazione iniettiva e suriettiva. x ` ` suciente provare che se F , F S allora (F |F ) < 0. Infatti, Dimostrazione. (1) E scelto un sistema di coordinate minkowskiane in ciascuno dei due riferimenti, rispettivamente x0 , x1 , x2 , x3 e x 0 , x 1 , x 2 , x 3 , F e F coincidono per denizione con 0 := /x0 e 0 := /x 0 rispettivamente. Avremo anche, se i := /xi , 0 = i 0 i , da cui (F |F ) = i 0 (i |0 ) = i 0 i0 = 0 0 < 0 , dove abbiamo usato il fatto che O(1, 3). (2) Il fatto che lapplicazione sia iniettiva ha la seguente ragione. Se 0 = 0 allora deve essere i . Imponendo la condizione di Lorentz t = , si vede immediatamente che deve i 0 = 0 0 . Quindi re imponendo la condizione di Lorentz sulla matrice risultananche essere 0 i = i te si trova che deve avere la forma R dellesempio 2.1.1 in cui R O(3). Per denizione di sistema di riferimento inerziale deve allora essere F = F . Passiamo alla suriettivit` a. Se + v {u Ix | (u|u) = 1} poniamo e0 := v e completiamolo a base pseudo ortonormale di Tx M4 aggiungendo tre vettori e di tipo spazio ortonormalizzati e normali a e0 . La base ottenuta genera un sistema di coordinate cartesiane pseudo ortonormali connesso ad un qualsiasi sistema di coordinate minkowskiane da una matrice in O(1, 3): infatti il vettore temporale F in x di un sistema inerziale associato ad ogni altro sistema di coordinate minkowskiane ` e in I+ x come visto sopra per cui, per denizione di I+ x , (e0 |F ) < 0. Come visto sopra questo fatto equivale a dire che la matrice di Lorentz relativa ai due sistemi di coordinate minkowskiane 46
soddisfa 0 0 > 0 per cui ` e in O(1, 3) . Di conseguenza le coordinate cartesiane associate a e0 , e1 , e2 , e3 deniscono un sistema di coordinate minkowskiane ed un riferimento inerziale Fv tale che Fv = e0 = v . 2 Nota 3.8. Dora in poi assumeremo sempre su M4 lorientazione temporale T indotta dalla classe dei riferimenti inerziali. Vale inne la seguente proposizione. La dimostrazione ` e immediata se si tiene conto che se i v = v ei , rispetto ad una base pseudo ortonormale e0 , e1 , e2 , e3 con (e0 |e0 ) = 1, la condizione (e0 |v ) < 0 equivale a dire v 0 > 0. Proposizione 3.6. Considerando un sistema di coordinate minkowskiane associate and un riferimento inerziale, in componenti rispetto alla base associata in Tx M4 risulta: I+ x = e I x = e ancora J+ x = e J x = Commenti 3.2. (1) Si noti che J+ x Jx = {0}. + I = mentre J + J = {x}. (2) Ovviamente Ix x x x Esercizi 3.1. + se e solo se p I . Generalizzare il risultato a q J + se e solo se 1. Provare che q Ip q p p Jq . + signica Soluzione. Si ssi un sistema di coordinate minkowskiane. In tali coordinate q Ip che la componente temporale del vettore di tipo tempo pq ` e positiva. Questo ` e equivalente a dire che la componente temporale del vettore di tipo tempo qp ` e negativa e questo equivale a . Nel secondo caso la dimostrazione procede nello stesso modo escluso il caso p = q che ` p Iq e ovvio. 47
3
(v 0 , v 1 , v 2 , v 3 ) R4
(v 0 )2 >
(v )2 , v 0 > 0
=1
(v 0 , v 1 , v 2 , v 3 ) R4
(v 0 )2 >
(v )2 , v 0 < 0
=1 3
(v 0 , v 1 , v 2 , v 3 ) R4
(v 0 )2
(v )2 , v 0 0
=1 3
(v 0 , v 1 , v 2 , v 3 ) R4
(v 0 )2
(v )2 , v 0 0
=1
+ e q I + allora p I + . 2. Provare che se p Iq r r + e q J + oppure p J + e q I + , 3. Rinforzare il risultato di sopra provando che se p Iq r q r + allora p Ir .
3.3.2
Consideriamo due eventi p e q . Supponiamo che in q accada qualcosa e che in p ci sia una corrispondente (con-)causa. Ci chiediamo se la struttura geometrica della relativit` a ed il suo signicato sico suggeriscano qualche relazione geometrica tra p e q . I risultati che otterremo contengono una spiegazione evidente della terminologia utilizzata per classicare i vettori dello . spazio di Minkowski e dei nomi che abbiamo dato agli insiemi Jp Lidea comune a tutte le interpretazioni siche del concetto di causalit` a` e che, condizione necessaria perch e ci` o che accada in p sia causa di ci` o che accade in q , ` e che p preceda temporalmente q . In relativit` a, la contemporaneit` a tra eventi ` e relativa al sistema di riferimento come visto nellesempio 2.1.2 e potrebbe accadere che anche lordinamento temporale sia similmente relativo al riferimento, rendendo in tal modo impossibile una buona nozione di causalit` a. Rinunciare allassolutezza dellordinamento temporale delle relazioni causali comporterebbe una complicazione forse insuperabile nella formulazione delle leggi siche. Vale il seguente importante risultato. Proposizione 3.7. Si considerino p, q M4 . + J e se la coordinata temporale di q ` (1) Se q Jp e rispettivamente strettamente maggiore p di quella di p, uguale a quella di p, oppure strettamente minore di quella di p in un sistema di riferimento inerziale, tale relazione vale in ogni altro sistema di riferimento inerziale. + J , allora ci sono sempre tre sistemi di riferimento inerziali F , = 1, 2, 3 (2) Se q Jp p con funzioni coordinata temporale rispettivamente x0 , tali che: ( ) 0 (q ), (i) x0 ( p ) > x (1) (1) 0 (q ), (ii) x0 ( p ) = x (2) (2) 0 (q ). (iii) x0 ( p ) < x (3) (3) Dimostrazione. In questa dimostrazione il vettore pq sar` a sempre pensato come vettore in 4 Tp M (vedi Appendice A). (1) Occupiamoci del caso in cui la coordinata temporale di q ` e strettamente maggiore di quella di p. Usando un sistema di coordinate minkowskiano e la proposizione 3.6 si vede subito che deve essere pq J+ p \ {0}. Tale fatto non dipende dalle coordinate scelte e tanto meno dal riferimento inerziale. Quindi usando ancora la proposizione 3.6, ma scegliendo un altro riferimento inerziale segue subito che la la coordinata temporale di q ` e strettamente maggiore di quella di p. Nel caso in cui la coordinata temporale di q ` e strettamente minore di quella di p si procede analogamente riducendosi a lavorare in J p \ {0}. Inne, se le due coordinate coincidono, deve necessariamente + J ossia q = p e la prova della tesi ` essere q Jp e ovvia. p + (2) Se q Jp Jp , il vettore pq = 0 deve essere di tipo spazio. Deniamo il versore
48
e3 := pq/ ( pq | pq ) e completiamo tale versore a base pseudo ortonormale in Tp M4 , e0 , e1 , e2 , e3 , dove e0 ` e di tipo tempo ed appartiene a I+ p e gli altri versori sono di tipo spazio. Il sistema di coordinate minkowskiane x0 , x1 , x2 , x3 con origine in p associato a tale base denisce un riferimento inerziale per il punto (2) della proposizione 3.5. Nelle coordinate minkowskiane denite, x0 (p) = x0 (q ) = 0 per costruzione. Consideriamo ora una trasformazione in O(1, 3) data da una matrice speciale di Lorentz denita nellesempio 2.1.2. Dato che > 0, tale matrice appartiene a O(1, 3) per cui ` e una trasformazione di coordinate minkowskiane tra riferimenti ` immediato provare che, nelle nuove coordinate minkowskiane x 0 , x 1 , x 2 , x 3 coninerziali. E nesse alle x0 , x1 , x2 , x3 tramite la matrice speciale di Lorentz detta, x0 (q ) < x 0 (q ) se v > 0 e x0 (q ) > x 0 (q ) se v < 0 dove v (c, c) ` e il parametro denito nellesempio 2.1.2. 2
La proposizione appena dimostrata suggerisce (ma la questione ` e pi` u sottile, come vedremo nel prossimo paragrafo) che abbia senso dire che quello che accade nellevento p possa essere causa + . Questo se si richiede che la causa preceda di quello che accade nellevento q solo se q Jp temporalmente leetto in ogni sistema di riferimento. + + + J ` ` facile provare che q Jp E p e equivalente a p Jq Jq . Similmente q Jp Jp equivale + J . Inne q I + I ` + + J . a p Jq e conseguenza di q Jp q p p e equivalente a p Iq Iq ed ` p Possiamo dare la seguente denizione che sintetizza il signicato sico delle relazioni causali tra eventi in termini geometrici. Denizione 3.10. Siano p, q M4 . + I (o equivalentemente p I + I ). (a) p e q di dicono temporalmente connessi se q Ip p q q + (o equivalentemente p J + J ). (b) p e q di dicono causalmente connessi se q Jp Jp q q (c) p e q di dicono causalmente separati o causalmente sconnessi o spazialmente separati se non sono causalmente connessi. Le denizioni tra le relazioni di coppie di eventi enunciate sopra corrispondono a quella che si chiama struttura causale dello spaziotempo.
3.3.3
Un punto importante da non dimenticare nella discussione precedente ` e comunque la convenzionalit` a insita nel processo di sincronizzazione einsteiniano (cfr le osservazioni dopo lenunciato del principio RS1 ed il capitolo 8). La nozione di coordinata temporale globale di un sistema di riferimento inerziale ` e basata profondamente su tale procedura di sincronizzazione. A causa di tale convenzionalit` a, ci si deve chiedere quanto la relativit` a dellordinamento temporale tra eventi spazialmente separati (nel senso della denizione 3.10), dimostrata nella proposizione 3.7, sia basata sulla scelta iniziale della procedura di sincronizzazione einsteiniana. Il divieto di relazioni causali tra eventi spazialmente separati potrebbe non avere alcun signicato sico, se la relativit` a dellordinamento temporale tra eventi spazialmente separati non risultasse esistere in una dierente formalizzazione che non adottasse il criterio di sincronizzazione einsteiniano, 49
ma un altro che fosse ancora sicamente ammissibile nel senso chiarito discutendo lenunciato del principio RS1 (ed in particolare che sia in accordo con levidenza sica che la velocit` a della luce su percorsi chiusi risulti essere costante). Dimenticandoci della relativit` a dellordinamento temporale tra eventi spazialmente separati, discutiamo allora la possibilit` a di legami causali tra eventi spazialmente separati, alla luce del principio di relativit` a, dato che questo ` e un altro ingrediente fondamentale della costruzione. Consideriamo un generico evento p M4 . Ammettiamo possibile che ci` o che accade in p possa essere causa di qualcosa che accade in un altro evento q , anche nel caso in cui q sia spazialmente separato da p. In tale situazione, per la proposizione 3.7, ci sar` a un riferimento F in cui q ` e nel passato di p. Per lequivalenza tra i sistemi di riferimento inerziali, sancita dal principio di relativit` a RS3, dobbiamo concludere che p pu` o essere causa di un evento q , causalmente separato da p, giacente nel passato di p in ogni ssato riferimento inerziale F . In altre parole, se si ammette la possibilit` a di relazioni causa eetto tra eventi spazialmente separati, queste devono potersi ammettere sia verso il futuro che verso il passato di ogni riferimento inerziale, a causa del principio di relativit` a. Questo risultato non ` e ancora conclusivo, dato che dobbiamo nuovamente ricordare che la denizione di tempo globale di un riferimento si basa sulla procedura di sincronizzazione di Einstein che ` e parzialmente convenzionale. Per arrivare ad una conclusione, applichiamo il risultato ad una particella materiale che descrive una storia : (a, b) M4 nello spaziotempo, supposta descritta da un parametro che cresce verso il futuro. Sia p = (tp ) e q = (tq ) con tp > tq . Attraverso, eventualmente, un terzo evento q ` e sempre possibile fare in modo che p sia spazialmente separato da q e q sia spazialmente separato da q . Pi` u in generale si vede facilmente che ogni coppia di eventi dello spaziotempo pu` o essere congiunta da una spezzata di segmenti con vettore tangente di tipo spazio. Se, ammettiamo la possibilit` a di relazione causali tra eventi spazialmente separati, possiamo quindi causare qualcosa nel passato riferito allordinamento della curva di p, precisamente nellevento q , agendo in p tramite una catena di eventi spazialmente separati. Questo produce i ben noti paradossi causali della fantascienza (le relazioni causali suddette potrebbero concretizzarsi in una telefonata a qualcuno nel passato al ne di impedire qualcosa nel presente). Si osservi che il risultato nale, essendo riferito a due eventi lungo la storia di ununica particella, prescinde completamente da ogni scelta convenzionale di una procedura di sincronizzazione, di Einstein o dierente. Questa discussione porta a concludere che, in virt` u del principio di relativit` a ed indipendentemente dalla natura convenzionale del processo di sincronizzazione einsteiniano, non pu` o esserci una relazione di causa eetto tra due eventi p e q se tali eventi sono spazialmente separati nel senso della denizione 3.10. Esercizi 3.2. 1. Mostrare che in Relativit` a non ha pi` u senso sico la nozione di corpo rigido. Suggerimento: Possiamo considerare un telegrafo costituito da unasta rigida lunghissima: muovendo un estremo laltro estremo istantaneamente (per il vincolo di rigidit` a) si muoverebbe anchesso.
50
3.3.4
Il risultato ottenuto dalla precedente discussione comporta anche alcuni vincoli alla denizione di linea di universo come storia di un punto materiale nello spaziotempo. Lidea assunta dalla relativit` a e connessa allidea di localit` a (nel senso di negazione dell esistenza di azione a distanza) ` e che quando ci` o che accade in q ` e causato da qualcosa che accade in p, qualche segnale sico si propaghi da p a q lungo una linea di universo veicolata da un sistema sico intermediario. Non solo, ma attraverso le linee di universo di punti materiali che connettono p a q , si possano sempre stabilire relazioni di causa-eetto. Ne consegue che le linee di universo di punti materiali possono connettere solo eventi causalmente connessi. Vediamo di riscrivere tale restrizione in termini matematici pi` u facili da maneggiare. Proposizione 3.8. Si consideri una curva dierenziabile : (a, b) M4 non singolare, ossia + (t) = 0 per ogni t (a, b). Condizione necessaria e suciente anch e (t ) J (t) \ {(t)} per + ogni t, t (a, b) con t < t ` e che (u) J(u) per ogni u (a, b). + Dimostrazione. Se (t ) J (t) \ {0} per ogni t > t, allora pensando (t)(t ) come applicato + e chiuso sar` a anche in (t), deve essere (t)(t )/(t t ) J+ (t) per ogni t > t. Dato che J(t) ` (t)(t ) (t) = lim J+ (t) , t t t t ci` o prova met` a della tesi. Supponiamo viceversa che 0 = (u) J+ (u) per ogni u (a, b) e assumiamo, per assurdo, che ci + e (u) (u ) siano due punti (u) e (u ), u < u sulla curva tali che: (u ) J (u) \ {(u)}, cio non sia di tipo causale futuro. Ci sono allora tre casi possibili. (1) I due punti (u) e (u ), con u < u , sono causalmente separati. Se ci` o fosse sarebbe (u ) (u) = 0 di tipo spazio. Deniamo e1 come il versore, normalizzato a 1 ed applicato in (u) ottenuto dalla normalizzazione di (u ) (u). Completiamo e1 a base pseudo ortonormale e0 , e1 , e2 , e3 con e0 di tipo tempo in I+ (u) e i rimanenti versori di tipo spazio. Deniamo coordinate minkowskiane centrate in (u) e generate dalla base detta. In tali coordinate, per costruzione x0 ((u )) = x0 ((u)) per cui ci sar` a un punto u0 (u, u ) in cui dx0 /du|u0 = 0. In tale punto si ha 2 2 2 3 3 dx0 dx dx ( (u0 )| (u0 )) = |u + |u = |u 0 du 0 du 0 du 0 =1 =1 Daltra parte per ipotesi (u0 ) J+ (u0 )| (u0 )) 0. Usando tale (u0 ) per cui, in particolare, ( risultato sopra abbiamo che deve essere contemporaneamente dx0 |u = 0 , du 0
51
ma anche
3 =1
dx |u du 0
=0,
ossia (u0 ) = 0. Questo ` e impossibile per ipotesi. (2) I due punti (u) e (u ), con u < u , sono tali che (u ) (u) ` e di tipo causale passato. Scegliamo un sistema di coordinate minkowskiane associate ad un riferimento inerziale F con asse temporale diretto verso il futuro. In queste coordinate, se la curva ` e parametrizzata come xi = xi (u), deve essere x0 (u ) < x0 (u). Pertanto deve esistere u0 (u, u ) con e dx0 /du|u0 = (x0 (u ) x0 (u))/(u u) < 0. Pertanto, in (u0 ), il vettore tangente a , che ` di tipo causale (cio e tempo o luce) per ipotesi, non pu` o essere diretto verso il futuro. Questo ` e assurdo. (3) I due punti (u) e (u ), con u < u , sono tali che (u ) = (u). Scegliamo un sistema di coordinate minkowskiane associate ad un riferimento inerziale F con asse temporale diretto verso il futuro. In queste coordinate, se la curva ` e parametrizzata come xi = xi (u), deve essere x0 (u ) = x0 (u). Pertanto deve esistere u0 (u, u ) con dx0 /du|u0 = (x0 (u ) x0 (u))/(u u) = 0. Pertanto, in (u0 ), il vettore tangente a , non pu` o essere di tipo causale (cio e tempo o luce). Questo ` e assurdo. 2 Dora in poi assumeremo che i punti materiali abbiano evoluzione in M4 descritta da linee di universo cio` e curve con vettore tangente mai nullo, di tipo causale ed orientato positivamente nel tempo. Diamo a tal ne le seguente denizioni nel caso di una variet` a lorentziana quadridimensionale generica (M, g). Denizione 3.11. Sia (M, g) una variet` a quadridimensionale lorentziana connessa e tempo4 ralmente orientata (in particolare M = M ). Se : I M ` e una curva C non singolare (cio e con vettore tangente mai nullo) dove I R ` e un intervallo, essa ` e detta: (a) di tipo tempo e futuro orientata, se (u) I+ (u) per ogni u I , (b) di tipo causale e futuro orientata, se (u) J+ (u) per ogni u I , (c) di tipo spazio, se ` e ovunque di tipo spazio. Le curve C non singolari di tipo causale e futuro orientate sono dette linee di universo o, equivalentemente, curve di universo Nota 3.9. Se riparametrizziamo una linea di universo = (u) con un nuovo parametro funzione C di u, z = z (u) tale che dz/du > 0, la nuova funzione = (u(z )) descrive ancora una linea di universo e non altera, punto per punto, la natura del vettore tangente che rimane di tipo tempo futuro o luce futuro a seconda del caso. Vedremo tra poco che nel caso in cui il vettore tangente sia di tipo tempo (futuro), c` e una parametrizzazione naturale particolare con signicato sico.
52
3.4
In questa parte cercheremo di precisare ulteriormente, in termini sici, la nozione di determinismo insieme alla nozione di localit` a. Vedremo anche come le teorie quantistiche diano luogo a fenomeni che apparentemente violano la struttura causale dello spaziotempo, ma che in realt` a non lo fanno. Per cominciare, ricordiamo che in Relativit` a Speciale, se due eventi p e q non sono causalmente connessi, cio` e sono spazialmente separati, allora esistono sempre due sistemi di coordinate globali riferite a due osservatori (inerziali) legati da una trasformazione di Poincar e del sottogruppo ortocrono, che giudicano, rispetto alla propria coordinata temporale, rispettivamente, p precedere q oppure q precedere p. Quindi, nel caso in esame, lordine temporale tra p e q non ` e denibile in modo assoluto e ogni relazione causale tra eventi in p e q sarebbe impossibile come notato precedentemente. Precisiamo la nozione di causa ed eetto come segue. Dato un evento e ed una classe di eventi G che non contiene e, diremo che una classe di fenomeni sici {Gg }gG che avvengono negli eventi corrispondenti agli indici g G ` e causa del fenomeno sico Ee che avviene in e, o equivalentemente, Ee ` e eetto di {Gg }gG se e solo se valgono le seguenti due condizioni: +, (1) e gG Jg (2) ogni qual volta avvengono i fenomeni {Gg }gG allora avviene il fenomeno Ee . Nota 3.10. I fenomeni sici di cui si parla sopra devono essere descritti nel linguaggio della relativit` a speciale (cio e in termini di tensori). La locuzione ogni qual volta deve quindi essere interpretata come segue. Accanto allevento e ed alla classe di eventi G, dobbiamo immaginare di poter considerare altri eventi e e altre classi di eventi G ottenuti dai precedenti tramite un operazione di isometria spaziotemporale, cio` e una trasformazione P del gruppo di Poincar e ortocrono proprio, interpretata in senso attivo (cio e che sposta i punti della variet` a). Tale trasformazione individua fenomeni sici che avvengono in e e G , Ee e {Gg }gG rispettivamente, ottenuti da Ee e {Gg }gG sotto lazione di P . La locuzione ogni qual volta ` e proprio riferita alla scelta arbitraria della trasformazione P del gruppo di Poincar e. In questo senso la condizione (2) si deve interpretare come: per ogni scelta di P , in e avviene Ee , se {Gg }gG avvengono in G . Nel seguito la locuzione ogni qual volta deve essere interpretata come indicato sopra. + implica e + Si osservi inne che e gG Jg g G Jg per ogni scelta di P nel gruppo ortocrono di Poincar e, per cui la condizione (1) ha senso in tale interpretazione. La denizione data di causa e di eetto esprime in termini sici pi` u precisi la nozione di causalit` a relativistica. Usando tali nozioni, il principio del determinismo in sica relativistica pu` o allora essere enunciato nella sua forma pi` u debole possibile come: ogni fenomeno sico Qq che avviene in un evento q ha una causa nellinsieme di fenomeni sici
53
Questo signica in particolare che esistono leggi siche che permettono di determinare (prevedere) tutti i fenomeni sici che avvengono in q conoscendo corrispondenti fenomeni sici che \ { q }. avvengono nei punti p Jq Si pu` o enunciare il principio del determinismo in forme molto pi` u forti assumendo che i fenomeni sici in q siano completamente determinati assegnando fenomeni sici che avvengono in \ {q } (porzioni di sottovariet` sottoinsiemi propri opportuni di Jq a tridimensionali di tipo spazio che intersecano linsieme detto, per esempio). Dati due eventi p e q , due fenomeni sici Pp e Qq che avvengono nei rispettivi eventi si dicono correlati se e solo se: ogni qual volta avviene uno dei due allora avviene anche laltro. Il principio di localit` a pu` o essere enunciato nella sua forma pi` u debole nel modo seguente: dati due eventi p e q , e considerati due fenomeni sici Fp ed Fq che avvengono nei due eventi J ) \{p, q }) rispettivamente, se Fp ed Fq sono correlati e non hanno una causa comune (in (Jp q allora uno dei due fenomeni ` e (parte di una) causa dellaltro ed in particolare p e q sono causalmente connessi. I principi di determinismo e localit` a sono violati da alcuni fenomeni quantistici. Per quanto riguarda il determinismo, secondo la meccanica quantistica esso ` e violato dal processo di misura quantistico: il risultato della misura in un evento q di qualche propiet` a di un sistema quantistico \ {q }. In altre parole, quando non ` e prevedibile anche conoscendo tutto ci` o che accade in Jq misuriamo una propriet` a di un sistema quantistico con un certo strumento in un certo posto ed ad un certo tempo il fenomeno, lindice dello strumento segna tale valore non ha (in generale) una causa nel senso preciso detto sopra. La violazione del principio di localit` a` e una questione molto pi` u delicata ed ` e connessa con il cosiddetto paradosso Einstein-Podolsky-Rosen (EPR) [16]. Tale paradosso fu elaborato, in un celebre articolo, dagli autori citati sopra per provare che la meccanica quantistica non poteva considerarsi una teoria completa ai ni della descrizione del mondo sico nella formulazione standard detta di Copenhagen. La procedura degli autori fu la seguente. In primo luogo essi provarono che la meccanica quantistica prevede lesistenza di alcuni fenomeni sici particolari. In secondo luogo essi mostrarono che tali fenomeni sici sono in contrasto con ipotesi siche che, a giudizio di Einstein, Podolsky e Rosen, sarebbero dovute essere pi` u fondamentali della stessa meccanica quantistica. Una di queste ipotesi era proprio il principio di localit` a. Quindi, in caso di evidenza sperimentale dei fenomeni quantistici evidenziati da Einstein, Podolsky e Rosen una delle ipotesi fondamentali, tra cui la localit` a, avrebbe dovuto essere violata. Senza entrare nei dettagli dellanalisi EPR diremo solo che la formulazione standard della meccanica quantistica aerma che esistono coppie di fenomeni sici macroscopici correlati dati da risultati di misurazioni su sistemi microscopici di alcune grandezze siche che avvengono in coppie di eventi lontani, anche nel caso in cui tali eventi non siano causalmente connessi e i corrispondenti 54
fenomeni non hanno una causa (nel senso preciso detto sopra) e quindi nemmeno una causa comune. Secondo EPR le correlazioni suddette, se osservate avrebbero dovuto sussistere per una causa comune (cio e a causa di uno stato di cose preesistente alle misurazioni). Non potendo, tale causa comune essere descritta con le variabili della Meccanica Quantistica per principio, lesistenza delle correlazioni avrebbe implicato lincompletezza della descrizione della realt` a data dalla Meccanica Quantistica. Quando EPR presentarono il loro celebre lavoro, la tecnologia non era in grado di testare sperimentalmente la presenza o lassenza dei fenomeni quantistici di cui sopra, per cui la discussione rimase ad un livello puramente teorico e per molti versi ideologico. Una rielaborazione del paradosso EPR fu proposta da John Bell allinizio degli anni 1960 in termini di spin o di coppie di particelle. In un geniale articolo del 1963, Bell dimostr` o che, con una scelta opportuna delle grandezze da misurare che devono essere pi` u di due (nella realt` a si misurano le tre componenti dello spin di particelle massive o stati di polarizzazione di fotoni) che darebbero luogo alle correlazioni suddette, ` e possibile distinguere sperimentalmente tra le due situazioni in cui i valori delle grandezze: (i) sono ssate prima delle misure, oppure (ii) vengono ssate al momento delle misure. Bell dimostr` o che, in presenza delle correlazioni, la situazione (i) vale solo se sono vericate una serie di disuguaglianze tra gli esiti delle misure: le famose disuguaglianze di Bell. ` importante precisare che le disuguaglianze di Bell valgono indipendentemente dal fatto che si E assuma come vera o falsa la formulazione standard della Meccanica Quantistica. A partire dal 1972 sono stati fatti diversi esperimenti (in particolare lesperimento decisivo ` e stato fatto nel 1982 da A. Aspect, J. Dalibard e G. Roger [18]) per testare lesistenza delle correlazioni suddette insieme alla validit` a o alla violazione delle disuguaglianze di Bell. Gli esperimenti hanno dimostrato, nellambito degli errori sperimentali, che (a) le correlazioni esistono, (b) le disuguaglianze di Bell sono violate. Quindi, se si accettano gli esiti degli esperimenti suddetti, indipendentemente dallaccettare o meno la formulazione standard della Meccanica Quantistica, si deve concludere che le correlazioni previste dalla Meccanica Quantistica esistono e gli esiti delle misure sono ssati al momento delle misurazioni. Quindi la localit` a sembrerebbe essere violata dai fenomeni sperimentali. Malgrado la situazione sembri molto intricata, la rinuncia al principio di localit` a per i fenomeni quantistici EPR non distrugge la formulazione causale della relativit` a. Si pu` o provare rigorosamente che, se si assume il formalismo della Meccanica Quantistica [18], proprio per la contemporanea violazione del principio di determinismo e del principio di localit` a, non ` e possibile trasmettere informazione utile da un evento allaltro per mezzo di correlazioni di tipo EPR tra coppie di eventi spazialmente separati3 . In altre parole, se p e q sono eventi spazialmente separati, non ` e possibile fare avvenire qualcosa in q facendo deliberatamente avvenire qualche fenomeno in p. Se invece ci` o fosse possibile ci troveremmo a dover applicare la nozione di causa-eetto ad una coppia di fenomeni che avvengono in eventi spazialmente separati per i quali quindi lordine temporale non ` e assoluto. Ci` o contrasterebbe con la richiesta irrinunciabile dellordinamento
In questo senso, come si dice nel linguaggio dei sici, i fenomeni connessi al paradosso EPR non permettono la trasmissione di informazione a velocit` a superluminare.
3
55
temporale assoluto tra causa ed eetto e la struttura causale della Relativit` a Speciale sarebbe messa in discussione.
56
Capitolo 4
|g( (v )| (v ))| dv .
dove ` e stato ssato c (a, b). Per costruzione s ` e il parametro che misura la lunghezza della curva, partendo dal punto (c) ssato su di essa, in riferimento alla metrica della variet` a. Nota 4.1. Si osservi che ds/du > 0 per costruzione per cui la funzione u s(u) ` e un dieomorsmo strettamente crescente e, riparametrizzando la curva in s, il nuovo vettore tangente s ` e proporzionale al vecchio tramite un fattore positivo, appunto ds/du. Nota 4.2. troviamo: Dalla denizione di s applicando il primo teorema fondamentale del calcolo ds = |g( (v )| (v ))| , du
2 du du du 2 du 2 du 2 ds = g( | ) = |g( | )| = = 1 . ds ds ds ds ds du
pertanto: g (s |s ) = g
57
Dunque: g (s |s ) = 1 . (4.1) Il segno, ovviamente, dipende dalla segnatura della metrica e dal tipo di curva che stiamo considerando.
4.1
Ci occuperemo ora di alcuni importanti risultati validi in Relativit` a Speciale e concernenti alcuni fatti non banali di cinematica. Consideriamo una linea di universo : u (u) M4 con u (a, b) di tipo tempo, per cui | ( (v )| (v ))| = ( (v )| (v )) > 0 e possiamo applicare la denizione 4.1, denendo lascissa curvilinea lorentziana: u s(u) := ( (v )| (v )) dv .
c
Come osservato sopra, riparametrizzando la curva in s, il nuovo vettore tangente s ` e proporzionale al vecchio tramite il fattore positivo ds/du. Ci` o implica immediatamente che la curva riparametrizzata sia ancora una linea di universo. Inne notiamo in particolare che, nel caso particolare considerato, la (4.1) si riduce a: (s |s ) = 1 . Dato che per costruzione s ` e punto per punto in I+ (s) usando la proposizione 3.5 possiamo associare un riferimento inerziale F(s0 ) a s |(s0 ) , in generale uno diverso ad ogni evento (u0 ) raggiunto dalla curva. In tale riferimento le componenti spaziali di s e pi` u in generale del vettore tangente a u (u0 ) saranno nulle. Se x0 , x1 , x2 , x3 sono coordinate minkowskiane associate al riferimento suddetto in corrispondenza dellevento (u0 ) corrispondente al valore s0 dellascissa curvilinea, la curva sar` a parametrizzata come xi = xi (s) in modo tale che, per costruzione: dxi i |s = 0 . (4.2) ds 0 Di conseguenza, applicando la teoria dello sviluppo di Taylor per le variabili spaziali x , = 1, 2, 3 e per la variabile temporale x0 avremo che: x (s) = x (s0 ) + (s s0 )O (s s0 ) , mentre: x0 (s) = x0 (s0 ) + (s s0 ) + (s s0 )O(s s0 ) , (4.4) dove le funzioni Oi (a) sono innitesime per a 0. La seconda equazione pu` o essere riscritta come: x0 = s + sO(s) . 58 (4.3)
dove t := x0 /c ` e la coordinata temporale del riferimento. Vediamo allora che, a meno di innitesimi di ordine superiore al primo, nellintorno di 0 = s0 /c, gli intervalli di tempo valutati nel riferimento F(s0 ) coincidono con quelli del parametro . In particolare, di conseguenza, se t0 := t(s0 ), per = 1, 2, 3 avremo: dx dt =
t0
dx d
=
0
1 dx c ds
=0,
s0
dove abbiamo usato (4.2) per valutare lultima derivata. Concludiamo che nel riferimento F(s0 ) il punto materiale ` e visto fermo allistante t0 corrispondente al valore s0 dellascissa curvilinea. Di conseguenza il riferimento inerziale F(s0 ) si deve pensare come il riferimento inerziale di quiete istantanea nellevento (s0 ) con la particella descritta dalla linea di universo . Ulteriormente (4.5) precisa che, a meno di innitesimi di ordine superiore al primo, gli intervalli di tempo valutati nel riferimento di quiete istantanea in (s0 ), coincidono con gli intervalli del parametro = s/c. Se assumiamo lesistenza di orologi il cui valutare il tempo non ` e inuenzato dalle forze che agiscono su di essi, la coordinata pu` o essere interpretata come il tempo valutato da un orologio in quiete con il punto materiale. Per tale motivo la coordinata viene detta tempo proprio della linea di universo. Almeno per punti materiali costituiti da particelle atomiche o subatomiche, il postulato sico di identicare il parametro con il tempo valutato in quiete con la particella indipendentemente dallaccelerazione della stessa, funziona decisamente bene (vedi per es. [19]). Tale postulato prende il nome di postulato degli orologi. Il vettore tangente alla curva riparametrizzata in viene detto quadrivelocit` a. Diamo formalmente le denizioni presentate in modo informale. Denizione 4.2. (Tempo proprio, quadrivelocit` a e sistema di quiete istantanea.) Si consideri una linea di universo : [a, b] u (u) M4 di tipo tempo. Si denisca il nuovo parametro: s(u) :=
u a
( (v )| (v )) dv .
(4.6)
(a) Il parametro := s/c ridenito eventualmente a meno di una costante additiva ` e detto tempo proprio di . (b) il vettore V := := cs , che soddisfa ( | ) = c2 ` e detto quadrivelocit` a di . (c) Per un ssato valore di 0 , il sistema di riferimento inerziale associato, secondo (2) di proposizione 2.3, al vettore s tangente a s (u(s)) in (u(c0 )) ` e detto sistema inerziale di quiete istantanea con allistante di tempo proprio 0 . Commenti 4.1. (1) Nel caso in cui la linea di universo non sia di tipo tempo non ` e pi` u possibile interpretare 59
ovunque s come un vettore tangente alla coordinata temporale di un sistema di coordinate minkowskiane perch e s pu` o essere di tipo luce. Nei tratti in cui la curva diventa di tipo luce, il parametro s diventa singolare, nel senso che rimane costante al crescere del parametro inizialmente scelto per parametrizzare la curva. (2) Non pu` o accadere che una linea di universo = (u) sia di tipo tempo in un punto isolato (u0 ). Se il vettore tangente in (u0 ) ` e di tipo tempo, la funzione continua (dierenziabile) u ( (u)| (u)) ` e negativa in u0 e quindi deve permanere tale in un intorno di u0 . Quindi se in (u0 ) il vettore tangente ` e di tipo tempo, ` e possibile denire il tempo proprio in un intorno di u0 ed ha quindi senso denire la quadrivelocit` a in (u0 ). Vogliamo ora arrivare alla nozione di velocit` a di un punto materiale, ossia di una linea di universo di tipo tempo o causale, rispetto ad un riferimento inerziale F . Alcune premesse sono necessarie. Consideriamo un riferimento inerziale F ed un evento p M4 . Sia F p lunico spazio di quiete con F passante per p. Il fatto che Tp M4 ammetta una base dovuta a coordinate cartesiane solidali con F , in cui quindi e0 = F p e e1 , e2 , e3 formano una base dello spazio tangente di Tp F p , implica lesistenza della decomposizione: Tp M4 = L(F p ) Tp F p . L(F p ) ` e lo spazio lineare generato da F p . In realt` a la decomposizione di sopra ` e diretta (e 4 per questo abbiamo usato il simbolo ) cio` e per ogni v Tp M , la decomposizione v = Tv + Xv dove Tv L(F p ) e Xv Tp F p ` e unica. Infatti, tenendo conto che F p ` e di tipo tempo e i vettori di Tp F p sono di tipo spazio, risulta immediatamente: L(F p ) Tp F p = {0} . E questo ` e equivalente alla unicit` a della decomposizione di ogni v detta sopra. Consideriamo ora una linea di universo di tipo tempo e parametrizzata in un parametro u. Fissiamo un riferimento inerziale F . Se p := (0 ) F 0 e passando alla parametrizzazione del tempo proprio, possiamo decomporre univocamente la quadrivelocit` a V (0 ) come V (0 ) = V (0 ) + c (0 )F p , dove V (0 ) Tp F p . Dato che (Fp |Vp ) < 0 deve essere c ( ) > 0 . Parametrizzando la curva ` in coordinate minkowskiane x0 , x1 , x2 , x3 associate a F , ( ) > 0 altro non ` e che dx0 /d . E allora chiaro che il vettore di Tp F p v := V =
dx 3 =1 d |0 x dt d |0
dx | x . dt t(0 ) =1
ha il signicato sico di velocit` a di rispetto a F . Se consideriamo una linea di universo di tipo causale, non ci sono problemi ad applicare la denizione data no a quando il vettore tangente ` e di tipo tempo. Nei punti (u0 ) (o nei tratti) in cui il vettore tangente di una linea di universo ` e di tipo luce (ma si ricordi che non pu` o 60
mai essere nullo comunque per denizione di linea di universo) la quadrivelocit` a non ` e denita perch e il parametro privilegiato dato dal tempo proprio diventa singolare. In ogni caso, il vettore tangente relativo alla parametrizzazione iniziale pu` o essere decomposto univocamente come (u0 ) = U (u0 ) + c (u0 )F p , Proviamo a denire nel punto (u0 ) la velocit` a: v := U .
Tale denizione pu` o essere sensata se ` e invariante sotto riparametrizzazione (visto che non c` e una parametrizzazione con signicato sico particolare deve andare bene per tutte le parametrizzazioni!). Se cambiamo la parametrizzazione della curva = (u(z )) dove du/dz > 0 per non alterare il senso di percorrenza della curva ovvero la direzione del tempo, il vettore (z ) (z ) = du sar` a ancora di tipo luce diretto verso il futuro e ( u ), per cui il rapporti tra le comdz ponenti rimangono invariati e la velocit` a calcolata con la formula di sopra rispetto alla nuova parametrizzazione risulta essere la stessa ottenuta con la vecchia parametrizzazione. Si osservi che lo stesso discorso si pu` o fare anche per curve di tipo tempo. In quel caso, la velocit` a denita in quel caso ` e banalmente invariante sotto riparametrizzazioni dierenziabili che non alterano il verso di percorrenza della curva e le due denizioni coincidono. Da questo punto di vista la velocit` a denita nel caso di vettori tangenti di tipo luce ` e la naturale estensione della denizione data nel caso di vettori tangenti di tipo tempo. Possiamo quindi dare la seguente denizione riassuntiva. Denizione 4.3. Sia : u (u) una linea di universo e F un sistema di riferimento inerziale. Se p = (up ), la velocit` a di rispetto a F nellevento p ` e il vettore di Tp F p vp |F U p := , p
dove F p ` e lunico spazio di quiete di F passante per p e (up ) = cp F p + U p ` e la decomposizioni diretta del vettore tangente a in p su F p e Tp F p . Nota 4.3. Vogliamo sottolineare la profonda dierenza tra i concetti di velocit` a e di quadrivelocit` a: mentre la velocit` a` e una nozione che dipende dallassegnazione di un riferimento, la nozione di quadrivelocit` a` e del tutto indipendente da una tale assegnazione e non ha alcun corrispondente in meccanica classica. Fissato un sistema di coordinate minkowskiane di un riferimento inerziale F ed una linea di universo , nei punti in cui la curva ` e di tipo tempo possiamo sempre esprimere le componenti 61 (4.7)
rispetto a F della quadrivelocit` a V = V in funzione delle componenti della velocit` a v = v |F rispetto a F . Infatti sappiamo che
3
c2 ( )2 +
(V )2 = c2 .
=1
dove > 0. Lidentit` a di sopra si riscrive, tenendo conto della denizione di velocit` a
3
c2 ( )2 + da cui: V
(v )2 = c2 .
=1
= =
1 1v 2 /c2 v ,
(4.8)
2 e il modulo quadrato di v nella metrica spaziale di F . dove v 2 = 3 =1 (v ) ` Nel caso di linee di universo di tipo luce, la relazione (4.8) cessa di valere, ma vale 3 1 (U )2 , = c =1
(4.9)
in riferimento alla (4.7). La prova ` e immediata usando ( (u0 )| (u0 )) = 0 unitamente a che implica per continuit` a la non negativit` a di . (u0 ) J+ (u0 ) Abbiamo il seguente teorema relativo allidea popolare che aerma che non si pu` o superare la velocit` a della luce. Teorema 4.1. In ogni sistema di riferimento inerziale, il modulo (riferito alla metrica spaziale del riferimento) della velocit` a di una arbitraria linea di universo ` e inferiore o al pi` u uguale alla velocit` a della luce. Questultimo fatto accade solo negli eventi sulla linea di universo in cui il vettore tangente ` e di tipo luce. Dimostrazione. Mettiamoci i coordinate minkowskiane solidali con il riferimento inerziale considerato. 2 U 2 |v | = (v |v ) = . Nel caso il vettore tangente sia di tipo luce, la (4.9) implica subito che lultimo membro di sopra sia c2 . Nel caso in cui il vettore tangente sia di tipo tempo vale (V |V ) = c2 che si pu` o riscrivere c2 2 = c2 + V 2 , per cui 2 1 e V 2 = c2 ( 2 1). In questo caso, usando il tempo proprio come parametro: 2 V 1 2 2 |v | = (v |v ) = =c 1 2 . 62
4.1.1
Per concludere mostriamo come denire la velocit` a di trascinamento di un riferimento inerziale F rispetto ad un altro riferimento inerziale F . Consideriamo sistemi di coordinate minkowskiane in F e F le cui funzioni coordinate saranno indicate rispettivamente con x0 , x1 , x2 , x3 e y 0 , y 1 , y 2 , y 3 . Un punto materiale in quiete con F , avr` a una linea di universo di tipo tempo descritta da x0 = x0 , x = q dove le q sono 3 costanti. Abbiamo usato il parametro x0 per parametrizzare la curva. Nelle coordinate di F , la stessa linea di universo sar` a descritta da
i 0 y i (x0 ) = C i + i q + 0 x .
(4.10)
Dalla denizione 3.2, la velocit` a di tale linea di universo rispetto a F sar` a dunque, nelle coordinate y 1 , y 2 , y 3 indotte su ogni spazio di quiete di F :
vF |F = c
0 . 0 0
(4.11)
Si osservi che il secondo membro ` e costante, nel senso che ha componenti costanti in coordinate minkowskiane ovvero determina, tramite lisomorsmo tra spazio tangente e spazio delle traslazioni di M4 , lo stesso vettore vF |F nello spazio delle traslazioni di M4 indipendentemente dallevento x. Indicheremo con vF |F indierentemente il campo vettoriale in ogni F t ovvero ` facilissimo provare che cambiando siil vettore associato nello spazio delle traslazioni di M4 . E stemi di coordinate minkowskiane solidali a F e F , il vettore (campo vettoriale) vF |F rimane ` chiaro che tale vettore (campo vettoriale) altro non ` immutato. E e che la velocit` a associata in F al campo di quadrivelocit` a F . Denizione 4.4. (Velocit` a di trascinamento.) Siano F e F due sistemi di riferimento 4 inerziali in M e si ssino due sistemi di coordinate minkowskiane solidali con i due riferimenti con funzioni coordinate x0 , x1 , x2 , x3 e y 0 , y 1 , y 2 , y 3 rispettivamente e y i = C i + i j xj . Il campo vF |F , denito da (4.11) su ogni spazio di quiete di F in coordinate cartesiane indotte da coordinate minkowskiane solidali con F ` e detto velocit` a di trascinamento di F rispetto a F . Vediamo ora di scrivere la legge che corrisponde in relativit` a speciale alla legge di composizione delle velocit` a di trascinamento. Consideriamo due riferimenti inerziali F e F connessi da una trasformazione P(C,) IO(1, 3) dove C = 0 e ` e una trasformazione di Lorentz speciale lungo 3 lasse x (vedi teorema 3.1). In base al teorema 3.1, per ogni coppia di sistemi di riferimento inerziali, ` e sempre possibile trovare due sistemi di coordinate solidali con ciascuno dei due in modo tale che la trasformazione di coordinate sia una trasformazione speciale di Lorentz lungo
63
lasse x3 . In virt` u di ci` o, quanto segue ` e in realt` a del tutto generale. Parametrizziamo con la 3 3 3 velocit` a vr = vF |F = vF |F (vedi esercizio 4.1.4) invece che con vF |F
:=
r 0 0 r vr /c
0 1 0 0
0 r vr /c 0 0 1 0 0 r
2 2 /c2 . Si osservi che con la scelta delle nostre coordinate v 1 Sopra r := 1/ 1 vr F |F = vF |F = 0. Consideriamo quindi una linea di universo = (u), in coordinate di F data da xi = xi (u) e nelle coordinate di F data da y i = C i + i j xj (u). Indicheremo con v le componenti della velocit` a di rispetto a F nelle coordinate x e con v le componenti della velocit` a di rispetto a F nelle coordinate y . Vogliamo determinare le componenti v in funzione delle componenti v . Si osservi che il discorso pu` o essere fatto solo in componenti, visto che i vettori velocit` a considerati appartengono a spazi vettoriali dierenti e relativi a spazi di quiete di riferimenti dierenti. Applicando le due denizioni di sopra otteniamo subito, se V ` e la componente -esima e c la componente 0-esima nelle coordinate di F della quadrivelocit` a di e V , c sono le analoghe componenti in F :
v = e quindi
V + 0 c v + 0 c V =c 0 = c , 0 c + 0 V c0 0 + 0 v
0 v + c 0 0 0 0 0 v 1+ 0 0 c
v 0 0
+ vF |F 0 v 0 0 c
1+
= = =
v1 r , v2 r , v 3 +vr 3 vr 1+ v 2
c
= =
v r , v || +vr 1+ v
|| v r c2
(4.12)
Questa ` e la legge di composizione delle velocit` a relativistiche. Si osservi che anche per moti che avvengono unicamente nelle direzioni perpendicolari alla velocit` a relativa tra i due riferimenti (nel giudizio di entrambi i riferimenti), il modulo della velocit` a di un punto materiale rispetto a F risulta comunque diminuita rispetto a quella valutata in 64
F di un fattore 1/r < 1 (che tende comunque a 1 nel limite vr /c 0+ per raccordarsi alla situazione classica). Viceversa se denotiamo v := v || e v = v || e se consideriamo solo moti che avvengono lungo lasse x3 in F (che implica che il moto avvenga lungo lasse x 3 in F ), lunica relazione non banale ` e la legge di composizione delle velocit` a per trasformazioni speciali: v = v + vr . r 1 + vv c2 (4.13)
Si pu` o notare che per piccole velocit` a, ossia vvr c2 , la formula si riduce allanaloga galileiana. Inoltre nel caso limite v = c otteniamo v = c in conformit` a con il teorema 4.1. In termini di velocit` a di trascinamento, se F , F e F sono sistemi di riferimento inerziali e sono note le componenti delle rispettive velocit` a di trascinamento vF |F in F e vF |F in F e ancora la trasformazione di coordinate tra F e F ` e speciale lungo il terzo asse spaziale, allora le componenti di vF |F in F soddisfano la legge di composizione relativistica delle velocit` a di trascinamento in contrapposizione con lanaloga classica che corrisponde alla semplice somma di velocit` a:
vF |F v ||
1 = vF | F F | F , 1 |F
F |F
= vF | F + vF
||
|F
1+
1 || v c 2 F |F
vF
(4.14)
Le componenti parallele e perpendicolari sono riferite allasse (comune) lungo il quale avviene il moto relativo di F e F e, con abuso di notazione, vF |F denota lunica componente di tale velocit` a nella base associata alle coordinate minkowskiane in F . Esercizi 4.1. 1. Si consideri p M4 ed un riferimento inerziale F . Dalla teoria generale delle decomposizioni dirette, esisteranno due operatori lineari surgettivi detti proiettori della decomposizione; PF p : Tp M4 L(F p ) e PF p : Tp M4 Tp F p tali che, per ogni v Tp M4 , PF p (v ) = Tv e PF p (v ) = Xv . Provare che: (i) PF p PF p = PF p e PF p PF p = PF p , (ii) PF p + PF p = I , (iii)PF p PF p = PF p PF p = 0. 2. Mostrare che se tF ` e la coordinata temporale globale associata a F , e p M4 : P F p = c e quindi PF p = I c , dtF p F p . 3. Gli spazi L(F p ) e Tp F p sono chiaramente ortogonali. Esiste un teorema che assicura che se V ` e uno spazio con prodotto scalare e V = V1 + V2 dove V1 e V2 sono sottospazi reciprocamente ortogonali, allora la decomposizione ` e diretta: V = V1 V2 (cio` e, per ogni vettore di V la coppia 65 , dtF p F p ,
di vettori in V1 e V2 la cui somma ` e il vettore detto ` e unica). Perch e non abbiamo potuto usare tale teorema? 4. Scelti dei sistemi di coordinate minkowskiane in F e F come in denizione 4.4, si provi che in tali coordinate, le componenti di vF |F e vF |F sono legate da
vF |F = vF |F
5. Mostrare che la velocit` a di trascinamento di un riferimento inerziale F rispetto ad un altro F non dipende dai sistemi di coordinate minkowskiane solidali con i due riferimenti usati per denire le componenti di tale velocit` a. 6. Si considerino due riferimenti inerziali F e F . Si supponga che un punto materiale in moto rettilineo uniforme rispetto a F abbia velocit` a relativa rispetto a F data dal vettore u in uno spazio di quiete di F . Sia nota v := vF |F come vettore nello stesso spazio di quiete. Dimostrare che se w ` e la velocit` a del punto materiale rispetto a F (in un suo spazio di quiete) allora (1 u2 /c2 )(1 v 2 /c2 ) |w | = c 1 , (1 u v/c2 )2 dove v 2 := |v |2 , u2 := |u|2 i moduli essendo calcolati con la metrica spaziale dei corrispondenti riferimenti e denota il prodotto scalare associato alla metrica spaziale di F . 7. In uno spazio ane A, una retta uscente da P A con vettore tangente n V spazio delle traslazioni di A, ` e denita come R u P + un. Si dimostri che se : R M4 ` e una linea di universo descrivente levoluzione di un punto materiale in moto rettilineo uniforme rispetto a qualche riferimento inerziale, = (u) (dove u ` e un parametro arbitrario tale che ` e di tipo 4 causale futuro) ` e una retta di M con vettore tangente di tipo causale futuro, oppure esiste una riparametrizzazione di che non ne altera il verso di percorrenza e che la trasforma in una retta con vettore tangente di tipo causale futuro. Viceversa provare che una retta di M4 con vettore tangente di tipo causale futuro ` e una linea di universo che descrive il moto rettilineo uniforme di un punto materiale rispetto a qualche riferimento inerziale e se il vettore non ` e di tipo luce, il parametro che descrive la retta ` e legato al tempo proprio tramite una trasformazione lineare non omogenea con coeciente moltiplicativo strettamente positivo.
4.2
Consideriamo una linea di universo di tipo tempo = ( ) dove R ` e il tempo proprio misurato dallorologio ideale in quiete con il punto materiale associato alla linea di universo. Consideriamo quindi un riferimento inerziale F con funzione coordinata temporale tF i cui valori etichettano gli spazi di quiete F t di F . Supponiamo che lorologio solidale con il punto materiale sia sincronizzato su F t1 con gli orologi di F per cui (t1 ) = t1 quando interseca 66
F t1 . Lasciamo evolvere la linea di universo no a quando interseca F t2 . La domanda che ci poniamo ` e: che tempo (t2 ) segner` a lorologio solidale con in tale evento? ` facile provare (vedi sotto) che se il modulo della velocit` E a di rispetto a F ` e costante, vale la celebre formula della dilatazione degli intervalli di tempo: t = 1
v2 c2
(4.15)
dove t := t2 t1 e := (t2 ) (t1 ). In questo caso particolare ` e chiaro che deve valere t2 > (t2 ) quando (t1 ) = t1 se v = 0. Vogliamo mostrare che nel caso generale, eccettuato il caso in cui il punto materiale ` e sempre in quiete in F in [t1 , t2 ], lorologio solidale con segner` a un tempo (t2 ) < t2 . Tale fenomeno cade sotto il nome di dilatazione degli intervalli di tempo1 . Per provare lasserto di sopra, riparametrizziamo la linea di universo attraverso la coordinata tF . Questo ` e sempre possibile perch e, ssato un sistema di coordinate minkowskiane solidale con F , ` e descritta da funzioni dierenziabili xi = xi ( ) con dx0 /d > 0 al ne di avere quadrivelocit` a diretta verso il futuro, inoltre x0 e ctF dieriscono per una costante additiva che possiamo sempre supporre essere nulla ridenendo tF . Faremo tale scelta dora in poi. Usando la denizione 3.1 avremo che 3 ct 2 1 dx 2 0 (t2 ) (t1 ) = dx 1 c ct1 dx0 =1 In altri termini, tenendo conto della denizione di velocit` a rispetto a F : t2 v 2 (t) (t2 ) (t1 ) = 1 2 dt , c t1
(4.16)
dove con v 2 (t) abbiamo denotato il modulo della velocit` a di rispetto a F su F t . In particolare se il modulo della velocit` a` e costante, abbiamo la (4.15). Essendo tutte le funzioni continue (t2 ) (t1 ) (t2 t1 ) max e quindi (t2 ) (t1 ) t2 t1 . Sicuramente vale il segno di uguaglianza se v 0 su [t1 , t2 ]. Mostriamo che ci` o accade esclusivamente in tale caso. Infatti se v (t0 ) > 0 per qualche t0 [t1 , t2 ], per continuit` a ci` o accadr` a in un
t) < 1. Restringendo tale intorno, intorno di t0 , per cui ci sar` a un intorno di t0 in cui 1 v c( 2 a causa della continuit` a troveremo un intorno aperto U di t0 su cui (e sulla cui chiusura) vale
1 2
v 2 (t) 1 2 c
t [t1 , t2 ]
(t2 t1 ) 1 ,
La dilatazione ` e ovviamente riferita allintervallo di tempo misurato da F rispetto a quello di tempo proprio.
67
1 su cui
v 2 (t) c2
< 1
v 2 (t) c2
per qualche
v 2 (t) 1 2 dt + c
b a
v 2 (t) dt c2
1 dt +
A a
(1 ) dt <
A
1 dt +
a
1 dt =
t1
dt = t2 t1 .
Abbiamo quindi trovato che: Teorema 4.2. Sia : R M4 una linea di universo di tipo tempo parametrizzata nel tempo proprio e sia F un sistema di riferimento inerziale con coordinata temporale globale tF . Se interseca F t1 al tempo proprio 1 ed interseca F t2 al tempo proprio 2 allora: 2 1 t2 t1 , In particolare, se per qualche istante di tempo proprio la velocit` a di rispetto a F non ` e nulla, allora necessariamente: 2 1 < t2 t1 . Commenti 4.2. ` chiaro che lintervallo di tempo (1) Il teorema di sopra ha una conseguenza interessante. E proprio misurato lungo una curva causale si pu` o interpretare come una lunghezza Lorentziana, in quanto (4.6) ha la stessa struttura della formula della lunghezza di una curva in geometria Riemanniana. Una dierenza importante ` e che ci sono curve che non si riducono ad un punto e che hanno lunghezza Lorentziana nulla: tutte le curve con vettore tangente di tipo luce hanno tale propriet` a. Tuttavia c` e unaltra propriet` a notevole che distingue la lunghezza riemanniana da quella lorentziana. Consideriamo un punto materiale in moto rettilineo uniforme rispetto a qualche riferimento inerziale e ssiamo due eventi p e q lungo la sua linea di universo . Quindi consideriamo un secondo punto materiale la cui linea di universo connette la stessa coppia di eventi. Dato che possiamo sempre trovare un riferimento inerziale in cui il primo punto ` e in quiete, in base al teorema precedente, la lunghezza Lorentziana := ( (u)| (u))du ,
68
La linea di universo tra p e q ` e un segmento di retta rispetto alla struttura ane di M4 , lunico segmento che connette p e q , mentre in generale ` e una curva generica di tipo tempo che connette gli stessi eventi. Quindi: al contrario di quanto accade nella geometria riemanniana, il segmento di retta di tipo tempo futuro che connette una coppia di eventi temporalmente connessi massimizza il funzionale lunghezza lorentziana denito sulla classe delle curve di tipo tempo futuro che connettono tali eventi. In geometria riemanniana i segmenti di retta su variet` a globalmente piatte minimizzano lanalogo funzionale. (2) Un caso rilevante del teorema di sopra ` e quando descrive levoluzione di un punto materiale in quiete con un secondo sistema di riferimento inerziale F . In tal caso gli intervalli di tempo proprio [1 , 2 ] coincidono con intervalli di tempo misurati rispetto all coordinata temporale globale di F . Di conseguenza ciascun osservatore giudicher` a gli intervalli di tempo, misurati con i suoi orologi di quiete, dilatati rispetto agli intervalli di tempo misurati dallaltro osservatore, quando tali intervalli siano riferiti a coppie di eventi come precisato sopra. Apparentemente la situazione ` e paradossale perch e il ruolo giocato dai due riferimenti sembra essere interscambiabile (si ricordi che i moduli della velocit` a di trascinamento di F rispetto a F e quello della velocit` a di trascinamento di F rispetto a F sono uguali) mentre il loro ruolo nel risultato nale sicuramente non lo ` e. Tuttavia la spiegazione ` e semplice. Nel confronto 2 1 < t2 t1 . Sopra ` e ora riferito la coordinata temporale di F , il ruolo giocato dai due osservatori non ` e simmetrico: per F gli eventi considerati a cui si attribuiscono i tempi 1 e 2 sono nello stesso posto spaziale e i tempi suddetti sono valutati da un unico orologio in quiete con F , mentre per F tali eventi non sono nello stesso posto e ci vogliono due orologi in quiete con F per misurare t1 e t2 . Anch e F verichi un analogo fenomeno di dilatazione dei suoi intervalli temporali rispetto a quelli di F sar` a necessario considerare unaltra coppia di eventi, questa volta nello stesso posto per F ma non pi` u nello stesso posto per F . (3) Il fenomeno della dilatazione degli intervalli di tempo ` e stato un importante test per valutare sperimentalmente la teoria della relativit` a. In eetti tale fenomeno ` e comunemente osservato dagli sperimentatori che lavorano con particelle subatomiche instabili. Tali particelle, una volta prodotte, decadono in altre particelle dopo un certo tempo T0 detto vita media e denito in un sistema di riferimento in quiete con la particella stessa. Quando le particelle in esame vengono prodotte con velocit` a v vicine a quelle della luce, rispetto al sistema di riferimento del laboratorio, si assiste ad una dilatazione della vita media in conformit` a con la relazione, valida per velocit` a costanti, T0 T = . 1 v 2 /c2 Per esempio per quanto riguarda esperimenti con pioni vedi [20]. Si osservi che per applicare la formula di sopra, ovvero la (4.15), ` e suciente che il modulo della velocit` a sia costante, la direzione pu` o cambiare: la formula ` e applicabile a moti circolari uniformi. 69
Il fenomeno della dilatazione degli intervalli di tempo, ed in particolare (4.15) su moti circolari uniformi, ` e stato anche testato sperimentalmente usando orologi atomici in volo attorno alla terra in direzioni opposte ed a velocit` a uguali e costanti rispetto alla terra. Lesperimento ` e quello famosissimo di Haefele and Keating che ha dato esito positivo. Nellidea di tale esperimento si tiene conto del fatto che la terra non ` e un riferimento inerziale a causa del moto di rotazione attorno al proprio asse (il moto di rivoluzione attorno al sole ` e trascurabile). Il sistema inerziale di riferimento ` e dunque quello in cui la terra ` e vista ruotare sul proprio asse alla velocit` a angolare di 2 radianti in 24 ore. In questo sistema di riferimento F si usano le formule della dilatazione degli intervalli di tempo per gli orologi in volo tenendo conto delle velocit` a degli aerei che trasportano gli orologi. Si osservi che le velocit` a dei due aerei riferite a F sono diverse per cui si hanno dierenti ritardi rispetto ad un orologio in quiete in F , ma anche rispetto ad un orologio in rotazione con la terra. Da [21]: During October, 1971, four cesium atomic beam clocks were own on regularly scheduled commercial jet ights around the world twice, once eastward and once westward, to test Einsteins theory of relativity with macroscopic clocks. From the actual ight paths of each trip, the theory predicted that the yng clocks, compared with reference clocks at the U.S. Naval Observatory, should have lost 40 23 nanoseconds during the eastward trip and should have gained 275 21 nanoseconds during the westward trip ... Relative to the atomic time scale of the U.S. Naval Observatory, the ying clocks lost 59 10 nanoseconds during the eastward trip and gained 273 7 nanosecond during the westward trip, where the errors are the corresponding standard deviations. Eastward Journey Predicted 40 23ns Measured 59 10ns Wesward Journey Predicted + 275 21ns Measured + 273 7ns (4) Nel contesto del fenomeno della dilatazione degli intervalli di tempo, si inserisce il celebre paradosso dei gemelli. Si considerano due gemelli A e B inizialmente in quiete relativa. Quindi B parte su unastronave e viagga a velocit` a prossime a quelle della luce rispetto ad A. Quando B torna in quiete con A dovr` a essere pi` u giovane di A per il fenomeno della dilatazione degli intervalli di tempo. Il punto apparentemente paradossale ` e che il moto ` e relativo, per cui si pu` o pensare che sia stato A a viaggiare ad alte velocit` a rispetto a B . In denitiva A dovrebbe essere a sua volta pi` u giovane di B ! La spiegazione ` e la seguente. Gli intervalli di tempo misurati dai due gemelli rispetto al personale tempo proprio, tra levento partenza p e levento ritorno r si ottengono integran do ( A (u)| A (u)) e ( B (u)| B (u)) sulle corrispondenti linee di universo e tra i due 4 eventi detti, A : (a, b) M e B : (a, b) M4 dove per comodit` a e senza perdere generalit` a, si ` e usato lo stesso parametro. Quindi ` e possibile dare una risposta non contraddittoria allinterno del formalismo della teoria 70
alla domanda: chi sar` a alla ne pi` u giovane? La risposta dipender` a dalla forma delle due linee di universo. In particolare per il teorema dimostrato, se una delle due linee di universo, diciamo quella di A, descrive il moto di quiete in un riferimento inerziale, il gemello B risulter` a al suo ritorno pi` u giovane di A. Si osservi che in tal caso la linea di universo di B non pu` o descrivere anche essa un moto di quiete rispetto ad un (altro) riferimento inerziale. Dal punto di vista sico, mettendosi in quiete nel riferimento inerziale di A, B deve prima allontanarsi e poi riavvicinarsi ad A, per cui il suo moto sar` a accelerato rispetto ad A e non ci sar` a alcun riferimento inerziale in cui B ` e in quiete. Dal punto di vista geometrico, come in ogni spazio ane, c` e un unico segmento di retta (temporale futura) che congiunge i due eventi p e r e al pi` u uno solo dei due gemelli pu` o avere linea di universo descritta da tale segmento e quindi essere in quiete in un riferimento inerziale (qui il segmento ` e una porzione di una linea di universo di un punto in quiete). In denitiva laermazione il moto ` e relativo ` e falsa quando non si considerino moti rettilinei uniformi. (5) Altri due fenomeni connessi con il fenomeno della dilatazione degli intervalli temporali sono i seguenti. Uno ` e leetto Doppler trasverso: se una sorgente di onde elettromagnetiche ruota a velocit` a costante v attorno ad un rilevatore, la frequenza rilevata ` e diversa da quella misurata in quiete con la sorgente. Tale eetto ` e del tutto assente in sica classica. La spiegazione ` e ancora una volta data dalla formula T0 T = , 1 v 2 /c2 dove ora T0 ` e il periodo di emissione dellonda valutato nel riferimento di quiete della sorgente e T` e il periodo valutato nel riferimento del laboratorio in cui la sorgente ruota a velocit` a costante v . Passando alle frequenze f0 , f (che sono inversamente proporzionali ai periodi), la formula di sopra implica subito, con analogo signicato dei simboli, f = f0 1 v 2 /c2 , in cui si vede che la frequenza osservata ` e pi` u bassa rispetto a quella in quiete con la sorgente. Laltro fenomeno ` e lallargamento di fasci di particelle cariche. Se si cerca di preparare un fascio di particelle cariche dello stesso segno si deve tenere conto della repulsione reciproca che provoca inevitabilmente un allargamento della sezione trasversale del fascio. Tuttavia tale fenomeno di allargamento appare tanto pi` u lento quanto pi` u il fascio ` e veloce. Unaltra volta la spiegazione qualitativa e quantitativa si pu` o dare con il fenomeno della dilatazione degli intervalli di tempo.
4.3
Consideriamo ora un altro tipico fenomeno relativistico, quello della contrazione dei volumi e delle lunghezze: ci chiediamo come varino le propriet` a metriche di un corpo descritto in un riferimento inerziale in cui ` e in moto (a velocit` a costante), rispetto alle analoghe propriet` a 71
valutate nel riferimento di quiete con il corpo. In meccanica classica le propriet` a geometriche dei corpi non dipendono dal riferimento dato che le metriche spaziali sono propriet` a assolute indipendenti dal riferimento. In relativit` a le metriche spaziali sono invece indotte da quella spaziotemporale sugli spazi di quiete dei vari riferimenti. Pertanto non ` e per nulla ovvio che le propriet` a metriche dei corpi siano invarianti al variare del riferimento. Fissiamo due riferimenti inerziali F e F . Sia F t0 una sottovariet` a di F t0 di dimensione m 3, per qualche t0 R e supporremo in seguito che tale sottovariet` a abbia misura, indotta da quella spaziale di F t0 , nita. Se assumiamo, al ne di investigare la questione sollevata sopra, che denoti un insieme di punti materiali che al variare di tF rimangano in quiete con F , tale insieme genera un tubo di universo T = {x + tF | x , t R} dove F ` e interpretato come vettore nello spazio ane delle traslazioni di M4 . Notiamo che ogni sezione di T , t1 ottenuta intersecando T con F t1 ` e chiaramente isometrica ad ogni altra sezione t2 = T F t2 (in particolare stesso) sotto lazione della traslazione t1 x x + (t2 t1 )F t2 .
Prendiamo ora un nuovo riferimento inerziale F in cui linsieme di punti materiali suddetti ` e visto muoversi. Il riferimento F sezioner` a il tubo di universo T con i suoi spazi di quiete F t in una classe di insiemi t = T F t che in generale avranno una forma e propriet` a geometriche e metriche dierenti da quelle di . Tuttavia le traslazioni, rappresentanti levoluzione spaziotemporale del corpo, t x x + (t2 t1 ) 1 (vF |F )2 /c2 F t , (4.17)
1 2
saranno ancora isometrie ovvero, in altre parole, il moto del corpo apparir` a come rigido. Per 4 provare quanto detto notiamo che ogni funzione di traslazione V : M x x + v M4 , se v ` e 4 nello spazio delle traslazioni di M , ` e un dieomorsmo ed unisometria rispetto alla metrica . Limmagine di F t1 secondo un tale dieomorsmo ` e proprio F t2 se il v = kF 2 dove (t2 t1 ) = (kF |F ) . Ma, per denizione di velocit` a di trascinamento ed usando (4.8), (F |F ) = 1
2 2 1 vF |F /c
da cui si ottiene la (4.17). Restringendosi alla sottovariet` a t , limmagine secondo V di tale 1 insieme ` e la sottovariet` a dieomorfa ed isometrica t . Quindi il dieomorsmo nale da t a
2 1 2 Infatti, ssando una base pseudo ortonormale in O F t con e0 dato da F e gli altri tre versori di tipo 1 spazio contenuti in TO F t1 , si conclude subito che O + kF ` e un punto diF t2 quando la componente rispetto a e0 di tale vettore nella base detta vale t2 t1 .
72
t sar` a ancora unisometria nelle metriche indotte da sulle sottovariet` a considerate. 2 Vogliamo determinare le relazioni metriche tra le sottovariet` a t (che rappresentano un insieme di punti materiali fermi nel riferimento F ) rispetto a t (che rappresentano lo stesso inseme di ` chiaro che possiamo confrontare due qualsiasi punti materiali che ` e visto in movimento in F ). E elementi delle due classi dette sopra essendo, allinterno di ogni classe, tutte le sottovariet` a tra di loro isometriche. Per procedere ` e molto comodo parametrizzare la sottovariet` a t che ` e denita nello spazio di quiete di F , usando le coordinate spaziali dellaltro riferimento: F . Infatti scegliendo un opportuno sistema di coordinate minkowskiane solidali con F , si pu` o descrivere come 0 1 2 3 3 x = 0 e (x , x , x ) D, dove D R ` e dieomorfo a . Scegliamo un sistema di coordinate minkowskiane solidali con F . Linsieme = T F t0 per una ssata costante t0 ` e individuato 0 1 2 3 dalle condizioni x = ct0 e x = x , (x , x , x ) D. Quindi, in coordinate di F , linsieme ` e individuato risolvendo ct0 = 0 0 x0 + 0 x . In tal modo corrisponde allinsieme di R4 : x0 = ct0 0 x 0 0 con (x1 , x2 , x3 ) D .
` chiaro che possiamo usare le coordinate x1 , x2 , x3 per denire una carta globale su un aperto U E contenente (eventualmente U = se ` e una sottovariet` a tridimensionale) le cui coordinate, per evitare ambiguit` a, le indicheremo con y 1 , y 2 , y 3 . In queste coordinate la metrica spaziale di F ossia quella indotta da su U ` e data dai coecienti: g = dove x = y , ct0 0 y x0 = . 0 0 Il calcolo esplicito di g fornisce: 0 0 (0 0 )2 (4.18) (4.19) xi xj ij y y
g =
(4.20)
Questa identit` a permette di confrontare le propriet` a metriche di con quelle di . Esamineremo tre casi nelle prossime tre sezioni.
73
4.3.1
Assumiamo che sia una sottovariet` a tridimensionale che indicheremo con V con misura (volume) nita. Confronteremo i volumi di V , vol(V ) con quello di V , vol(V ) riferiti alle metriche spaziali dei corrispettivi riferimenti inerziali. A tal ne si ha vol(V ) = detg dy 1 dy 2 dy 3
D
dato che la metrica spaziale di F nelle coordinate minkowskiane ` e rappresentata da g = . Per costruzione detg ` e una costante nelle coordinate y 1 , y 2 , y 3 e ancora y = x su D. Concludiamo che vol(V ) = detg vol(V ) . Lemma 4.1. Se A ` e una matrice complessa n n di coecienti A = + C C , vale
n
det A = 1 +
=1
2 C .
A11 Ann ,
dove ` e la densit` a tensoriale di Ricci-Levi-Civita [1] e vale 1 n = 1 se 1 n ` e una permutazione di 1, . . . , n ed il segno ` e dato dalla parit` a della permutazione: se la permutazione ` e dispari, mentre + se la permutazione ` e pari. Inne 1 n = 0 se 1 n non ` e una permutazione di 1, . . . , n. In altre parole det A =
1 n
11 nn + C1 C1 22 nn + + 11 n1n1 Cn Cn ,
tutti gli altri termini forniscono contributo nullo perch e sono del tipo
1 k h n
C k C k C h C h =
1 k h n
1 h k n
Ch Ch Ck Ck .
e =
1 h k n
Ma
1 n
11 nn + C1 C1 22 nn + + 11 n1n1 Cn Cn ,
74
vale proprio
1n
1n
2 C1
+ +
1n
2 Cn
=1+
=1
2 C .
0 0 0
2
2 vF |F
0 0 0
=1
c2
Concludiamo che vale la formula di contrazione relativistica dei volumi: v2 vol(V ) = vol(V ) 1 2 , c
(4.21)
dove vol(V ) ` e valutato in quiete con linsieme di punti materiali V , mentre vol(V ) ` e il volume dello stesso insieme di punti materiali valutato in un riferimento inerziale in cui i punti materiali sono visti muoversi con la stessa velocit` a costante di modulo v .
4.3.2
Passiamo a considerare il caso in cui sia un variet` a unidimensionale, che indicheremo con, , come per esempio un segmento, con misura (lunghezza) nita. Vogliamo ora confrontare le lunghezze () e ( ). Possiamo parametrizzare come [a, b] u (u), cio` e in coordinate x , u x (u) e la sua lunghezza sar` a data da 3 b dx 2 () = du , du a =1 dove abbiamo usato il fatto che la metrica spaziale di F nelle coordinate dette ` e banalmente g = . Similmente se g data da (4.20)` e la metrica spaziale di F nelle coordinate y = x si ha b dx dx ( ) = g du . du du a Sopra g
3 dx dx = du du =1
dx du
, =1
dx 0 dx 0 . du 0 0 du 0 0
75
dx du
2
=1
dx vF |F du c
2
( ) =
a =1
dx du
=1
dx vF |F du c
du .
dove u [0, 1] e n sono le componenti di un versore nello spazio di quiete considerato per F . In tal caso otteniamo subito: ( ) = () 1 (n v )2 , c2 (4.22)
dove v := vF |F e indica il prodotto scalare associato alla metrica spaziale di F . Ci sono due situazioni interessanti in cui la formula di sopra si applica: (a) ` e un segmento perpendicolare a vF |F . In tal caso il secondo addendo sotto il segno di radice si annulla e troviamo ( ) = () . (b) ` e un segmento parallelo a vF |F . In tal caso troviamo subito la formula della contrazione relativistica delle lunghezze o formula della contrazione di Lorentz v2 ( ) = () 1 2 (4.23) c dove () ` e valutata in quiete con linsieme di punti materiali formanti il segmento , mentre ( ) ` e la lunghezza dello stesso insieme di punti materiali valutato in un riferimento inerziale in cui i punti materiali sono visti muoversi con la stessa velocit` a costante di modulo v nella direzione stessa del segmento. Nota 4.4. Ci si pu` o chiedere se la contrazione di cui sopra si veda in senso proprio. Questa ` e una domanda complessa che implica nozioni di ottica relativistica. Diciamo solo che la cosa non ` e ovvia. Per esempio si pu` o mostrare che una sorgente luminosa sferica in moto non viene vista contratta nella direzione del moto, ma si osserva una contrazione uniforme. In ogni caso la contrazione di Lorentz ` e un fenomeno reale indipendentemente dal fatto di ci` o che si osservi o meno. Per esempio, unautomobile di lunghezza L0 misurata in quiete, pu` o essere tutta contenuta per breve tempo in un garage di lunghezza L0 /2 con due porte (di entrata e di uscita lungo il moto dellauto) che si chiudono e si riaprono contemporaneamente e molto 76
velocemente, purch` e la velocit` a dellauto rispetto al garage sia tanto sostenuta che la contrazione di Lorentz ne riduca la lunghezza a L < L0 /2. Esercizi 4.2. 1. In riferimento allosservazione di sopra, si supponga che la velocit` a costante dellauto rispetto al garage sia tale che la lunghezza dellauto nel riferimento del garage sia esattamente L0 /2. Si supponga che le porte del garage di spessore nullo si aprano e si chiudano contemporaneamente ed istantaneamente. Esattamente quando tutta lauto si trova a passare nel garage, per un solo istante lauto viene chiusa nel garage dalle due porte, che poi si riaprono lasciando lauto uscire dal garage senza incidenti. Si consideri ora la descrizione del fenomeno data dal guidatore dellauto. Per lui il garage dovr` a avere una lunghezza sicuramente inferiore a L0 /2 per la contrazione di Lorentz. Come ` e possibile, a giudizio del guidatore, che lauto venga chiusa nel garage sia pure per un istante? 2. Nellesperimento ideale di sopra si supponga che invece della seconda porta, a parit` a di tutte le altre condizioni, ci sia un muro impenetrabile e che lauto sia fatta di materiale fragilissimo. Un osservatore in quiete con il garage vedr` a la porta (lunica rimasta) chiudersi dietro lauto incolume un istante prima che essa si schianti contro il muro. Tenendo chiusa la porta, supposta impenetrabile, tutti i pezzi dellauto rimangono nel garage. Per il guidatore invece ci` o non pu` o accadere essendo il garage troppo corto: la porta dovrebbe abbattersi per tagliare parte dellauto prima che la punta si schianti contro il muro. Come mettere daccordo i due punti di vista?
4.3.3
Lequazione (4.20) permette di confrontare anche le deformazioni cinematiche degli angoli. Consideriamo due sottovariet` a date da due segmenti 1 : u O + un1 e 2 : u O + un2 , u [0, 1] uscenti dallo stesso punto O, con versori tangenti n1 e n2 e sia langolo (acuto) tra tali seg menti. Ovviamente cos = n a 1 e 2 , avranno vettori 1 n2 . Le corrispondenti sottovariet` tangenti n1 e n2 formanti un angolo , che nelle coordinate y 1 , y 2 , y 3 hanno le stesse componenti n u versori!). Avremo che, in virt` u di (4.20) e con le stesse notazioni 1 e 2 (ma non saranno pi` |n1 ||n2 | cos = n1 n2 (n1 v )(n2 v ) . c2
I moduli |n1 |, |n2 | non sono altro che le norme dei vettori calcolate con la metrica spaziale di F . La struttura ane identica i moduli di tali vettori con le lunghezze di corrispondenti segmenti. Possiamo quindi usare (4.22) per valutare questi moduli ottenendo la formula della deformazione relativistica degli angoli: cos = cos 1
(n1 v )(n2 v ) c2
(n1 v )2 c2
(n2 v )2 c2
(4.24)
77
dove, lo ricordiamo v = vF
|F .
Nota 4.5. In generale risulter` a = . Tuttavia ci sono alcuni casi notevoli in cui sussiste luguaglianza. (1) se n1 e n2 sono paralleli (cos = 1), e quindi il concetto di parallelismo ` e invariante al variare del riferimento inerziale quando sussista nel riferimento di quiete con langolo. (2) oppure se ciascuno dei due vettori n1 , n2 ` e o parallelo o ortogonale a vF |F . In particolare la condizione di ortogonalit` a non ` e preservata al variare del riferimento.
78
Capitolo 5
Dinamica in Relativit` a Speciale: covarianza delle leggi siche ed equazioni della dinamica.
Ci occuperemo ora della formulazione della dinamica nella teoria della relativit` a speciale. Avremo due principi guida. In realt` a useremo diverse altre ipotesi ad hoc strada facendo. In ogni caso ci sono, come detto due grandi principi guida. Uno ` e il principio di relativit` a: RS3. Principio di Relativit` a. Le leggi della sica assumono la stessa forma in ogni sistema di riferimento inerziale. In meccanica classica lanalogo principio ristretto alla meccanica veniva tradotto in termini matematici richiedendo linvarianza della forma delle leggi della meccanica quando scritte in coordinate cartesiane solidali con ogni sistema di riferimento inerziale. Un modo (ma non lunico) di esprimere il principio di relativit` a` e quello di richiedere che le leggi siche siano descritte in termini di tensori (pi` u in generale campi tensoriali). In tal modo, in componenti e rispetto a coordinate minkowskiane associate ad ogni riferimento inerziale, la forma delle leggi siche ` e preservata. Questo principio, che una versione pi` u precisa di RS3, cade sotto il nome di Principio di Covarianza. Esso aerma che le leggi siche hanno forma invariante sotto lazione del gruppo di Poincar e ortocrono1 . Si osservi che esistono formulazioni equivalenti della relativit` a che non sono formulate in termini di tensori e che preservano la forma delle leggi siche al variare
Pi` u precisamente si ` e visto sperimentalmente negli anni 50 che il gruppo ortocrono contiene trasformazioni (inversioni di parit` a) che non lasciano invariata la forma delle leggi siche: le leggi siche sono in realt` a invarianti sotto lazione del sottogruppo di Poincar e ortocrono proprio che introdurremo pi` u avanti. Esiste un teorema della teoria quantistica relativistica che aerma che oltre allinvarianza sotto lazione del gruppo ortocrono proprio, sussiste anche linvarianza sotto lazione combinata di inversione del tempo T , inversione di parit` a P e coniugazione di carica C (operazione che consiste nello scambiare il segno di tutte le cariche elettriche). Tale teorema cade sotto il nome di teorema P CT (vedi per es [22]).
1
79
del riferimento inerziale, per esempio la formulazione hamiltoniana. Il secondo pricipio di cui faremo uso ` e il Principio di corrispondenza. Le leggi della meccanica in relativit` a si devono ridurre a quelle della meccanica classica nel limite di piccole velocit` a.
5.1
In base al principio di corrispondenza sopra citato, la denizione della massa di un punto materiale pu` o ancora essere data assumendo la validit` a della legge di conservazione dellimpulso totale di un sistema di punti materiali nel limite di velocit` a piccole rispetto a quelle della luce: le masse sono denite da rapporti di velocit` a una volta scelta la massa unitaria. Non ` e importante il valore di tali velocit` a che possono essere piccole a piacere purch e non tutte nulle. Si osservi ancora che dal punto di vista sico possiamo controllare le condizioni iniziali assumendo le velocit` a iniziali piccole a piacere, lavorando con intervalli di tempo sucientemente piccoli tali velocit` a rimarranno piccole. Nota 5.1. In realt` a, con questo approccio ci sono dei problemi (gi` a presenti classicamente) quando si tenta di denire la massa di una particella carica, in quanto ` e ben noto che le particelle cariche emettono onde elettromagnetiche nel momento in cui sono accelerate (anche se la velocit` a` e nulla) e londa elettromagnetica sottrae impulso al sistema. Noi ignoreremo tale problema pensando di lavorare con particelle prive di carica. Denizione 5.1. (Punto materiale o particella.) Un punto materiale o particella ` e dato tramite lassegnazione di una linea di universo in M4 , : (a, b) u (u) di tipo tempo (futuro) detta linea di universo del punto materiale o particella, ed uno scalare m > 0 delle dimensioni di un massa detto massa del punto materiale o particella. Consideriamo dunque un punto materiale di linea di universo di massa m e supponiamo che il punto sia sottoposto a qualche forma di interazione. Parametrizziamo la linea di universo del punto materiale con il tempo proprio : = ( ). Ci aspettiamo dal principio di corrispondenza che qualunque sia lequazione della dinamica, lavorando nel riferimento di quiete istantanea F con la particella, ad un ssato valore del tempo proprio , essa assuma la forma
F =m
dv . dt
Sopra v sono le componenti della velocit` a del punto nel riferimento di quiete istantanea F e dipender` t` e la coordinata temporale di tale riferimento. Il vettore F a dallambiente con cui 80
dv . d
Notiamo che abbiamo omesso la componente temporale, che in meccanica classica, e quindi nel riferimento di quiete istantanea, non gioca alcun ruolo nelle equazioni della dinamica. Nel riferimento di quiete istantanea, V = v , = 1 ed un semplice calcolo prova che dv dV = , d d mentre d =0. d Quindi lequazione di sopra si riscrive, nel riferimento di quiete istantanea ed allistante considerato: dV i i F =m . d 0 = 0. Descriviamo la stessa equazione di sopra in un altro sistema dove abbiamo supposto che F di riferimento in cui la velocit` a della particella non ` e nulla.
j F i := i j F
dove ` e la matrice di Lorentz che trasforma le coordinate del sistema di quiete nelle coordinate di unaltro arbitrario sistema di riferimento inerziale. Siamo naturalmente portati ad assumere che le equazioni della dinamica abbiano la forma, in ogni sistema di riferimento: Fi = m dV i . d
Anch e valga il determinismo, cio e esista ununica soluzione una volta assegnate condizioni iniziali in termini dellevento da cui esce la linea di universo e del vettore tangente di tale curva nellevento considerato, assumeremo che F i siano funzioni note dellevento e del vettore tangente alla curva in tale evento. Abbiamo quindi: F i (( ), V ( )) = m dV i , d (5.1)
Non possiamo dire che F i individui un campo vettoriale su M4 , dato che esso dipende anche dal vettore V ( ) che, in generale pu` o scelto in diversi modi una volta che ` e stato ssato levento ( ). Un modo naturale di pensare le componenti F i ` e il seguente. Le componenti F i possono essere viste come le prime 4 componenti di un campo vettoriale dierenziabile sulla variet` a T M4 , le rimanenti 4 componenti avendo forma ovvia in modo da produrre il sistema di equazioni dierenziali del primordine su T M4 : F i (( ), V ( )) = m dV d , di i mV = m d . 81
i
(5.2)
Questo sistema di equazioni dierenziali del primordine ` e equivalente, ovviamente, al sistema di equazioni (5.1). Si osservi che ora lesistenza e lunicit` a della soluzione ` e assicurata, ma niente ci assicura che (a) la soluzione sia una curva di tipo tempo futuro e che (b) sia il tempo proprio (che equivale a dire V i Vi = c2 ovunque sulla soluzione). Daltra parte ci ricordiamo che rimane un vincolo da imporre sul vettore F : cio e che nel sistema di quiete della particella, la componente temporale si annulli. Tale vincolo pu` o esprimersi con la richiesta F i (p, S )Si = 0 , (5.3)
per ogni scelta di (p, S ) T M4 tale che S i Si = c2 e S ` e diretto verso il futuro. Infatti (5.3) ` e una condizione che non dipende dalle coordinate minkowskiane usate e se espressa nel riferimento di quiete istantanea dice proprio che F 0 (( ), V ( )) = 0 . Si osservi che in realt` a la richiesta (5.3) ` e necessaria quando si assume, come facciamo noi, che la massa m della particella non dipenda dal tempo (proprio) e che la curva soluzione delle equazioni sia una linea di universo di tipo tempo. Infatti dallequazione V i Vi = c2 segue subito che dV i =0 d da cui, segue subito la (5.3) se si assume (5.2) e tenuto conto che la quadrivelocit` a in ogni evento pu` o essere scelta arbitrariamente rispettando V i Vi = c2 e lorientazione nel futuro. Il punto importante ` e che vale anche il viceversa: Vi Proposizione 5.1. Si consideri un campo vettoriale dierenziabile su T M4 denito da, in un sistema di coordinate globali naturali indotte da un sistema di coordinate minkowskiane su M4 : F k ((p, S )) con m = 0 che soddis il vincolo: F i ((p, S ))Si = 0 per ogni (p, S ) T M4 tale che (S, S ) = c2 e S I+ p . Si considerino una curva integrale di 4 tale campo, ossia (a, b) u ((u), S (u)) T M soddisfacente F i ((u), S (u)) = m dS du , di i mS = m du .
i
+ mS k k k x S
82
Se per u = u0 (a, b) vale (S (u0 )|S (u0 )) = c2 e S (u0 ) I+ e una linea di p allora la curva ` universo di tipo tempo, u ` e il tempo proprio e S la quadrivelocit` a. Dimostrazione. Essendo m = 0, lequazione del vincolo, su una soluzione del sistema di sopra implica immediatamente d i S (u)Si (u) = 0 . du Di conseguenza S i (u)Si (u) = S i (u0 )Si (u0 ) = c2 . Ulteriormente, se F ` e un riferimento inerziale, dato che F e S sono entrambi di tipo tempo la funzione u (F |S (u)) ` e non nulla per ogni u (a, b) dalla proposizione 3.3. Il segno ` e quello ssato da (F |S (u0 )). Tale segno ` e negativo perch e S (u0 ) punta verso il futuro, ma allora per ogni u (a, b), S (u) punta verso il futuro. Concludiamo che S (u) ` e parallelo e orientato temporalmente come la quadrivelocit` a = V , avendo anche la stessa lunghezza (S i (u)Si (u) = c2 ) deve coincidere con V . Di conseguenza u = + costante. 2 Possiamo dare la seguente denizione: Denizione 5.2. (Quadri forza.) Lassegnazione dierenziabile di un vettore F (p, S ) i 2 e detta quadriforza se soddisfa il Tp M4 per ogni p M4 per ogni S I+ p con S Si = c ` vincolo F i (p, S )Si = 0
i 2 per ogni p M4 e S I+ p con S Si = c .
Possiamo quindi enunciare la prima delle leggi della dinamica relativistica per punti materiali sottoposti a forze esterne. DRS1. Le linee di universo delle particelle di massa m sono determinate risolvendo lequazione F (( ), V ( )) = m dV , d
dove il primo membro ` e la quadriforza agente sulla particella considerata. Torna utile la seguente denizione che generalizza la nozione di impulso in meccanica classica. Denizione 5.3. (Quadri impulso.) Data una particella con linea di universo = ( ), (a, b), e massa m > 0 il campo vettoriale tangente alla curva e diretto verso il futuro denito da P := mV , ` e detto quadri impulso associato alla particella.
83
Commenti 5.1. (1) Il quadri impulso soddisfa ovunque sulla linea di universo: P i Pi = m2 c2 . (5.4)
(2) Il quadri impulso pu` o anche essere assegnato a particelle di massa nulla (tipicamente fotoni trattati per quanto possibile non quantisticamente) e lo schema dinamico precedentemente ` necessaria una regola, per spiegato si estende a questa situazione con qualche accorgimento. E il tipo di particella di massa nulla assegnato, che selezioni un vettore tangente (di tipo luce futuro) alla linea di universo della particella le cui componenti abbiano dimensioni di un impulso. Nel caso dei fotoni questo viene fatto in funzione della frequenza e del vettore donda dellonda associata alla particella. Fissato un riferimento inerziale F e in esso un sistema di coordinate minkowskiane, rispetto a tali coordinate: P 0 = /c e P := k , dove ` e la frequenza dellonda associata al fotone misurata nel riferimento F , k sono le componenti spaziali del vettore donda e = h/(2 ) essendo h = 6.626 1027 erg sec la costante di Planck. A causa delle relazioni ben note = c|k |, risulta P i Pi = 0. Nel caso di massa nulla (5.4) diventa ovviamente: P i Pi = 0 . (5.5)
Lestensione di DRS1 al caso di particelle senza massa ` e molto pi` u complesso e non ce ne occuperemo. (3) Le componenti spaziali del quadri impulso, riferite a coordinate minkowskiane di un riferimento inerziale e per una particella con massa non nulla, sono mv P = mv = , 2 1 v 2 c dove v ` e la velocit` a della particella nel riferimento considerato. Nel regime di piccole velocit` a (rispetto a quella della luce), le componenti spaziali di P si riducono alle componenti dellimpulso classico come ci si aspetta in conformit` a del principio di corrispondenza. Pi` u complicato ` e il signicato della componente temporale che studieremo sotto. (4) Nelle vecchie trattazioni della relativit` a lequazione di sopra si riscriveva P = m(v )v , dove m(v ) := m 1
v2 c2
era la cosiddetta massa relativistica che si contrapponeva alla massa di quiete m. Questa proliferazione dei concetti di massa, del tutto inutile e concettualmente deleteria a parere dellautore, ` e caduta in disuso con gli anni.
84
5.1.1
Ci occupiamo ora di stabilire il signicato sico della componente temporale dellequazione del moto (5.1) in un generico sistema di riferimento che non ` e in quiete (istantanea) con la particella e della componente temporale del quadrimpulso. Il vincolo (5.3) in un sistema di coordinate suddetto si scrive esplicitamente cF 0 +
F V = 0
ossia cF 0 =
F v .
d mc2 , d
Notiamo che e
Se trascuriamo nelle formule di sopra le potenze di v/c ad ordini superiori al secondo e poniamo a F v := F v , si ritrova lidentit` d 1 F v = mc2 + mv 2 . dt 2 Questo ` e il teorema delle forze vive che aerma che la potenza uguaglia la derivata temporale dellenergia cinetica se si trascura il termine costante mc2 che non fornisce comunque contributo al secondo membro per lazione della derivata, e se si pensano le componenti spaziali della quadriforza F come componenti di una forza classica. Quindi la componente temporale dellequazione (5.1) ` e una generalizzazione relativistica del teorema delle forze vive. Ulteriormente, se P 0 ` e la componente temporale del quadri impulso, T := cP 0 mc2 si pu` o pensare come la generalizzazione relativistica dellenergia cinetica della particella in quanto si riduce ad essa nel caso di velocit` a basse rispetto a c. Nello stesso modo cF 0 deve essere pensata come una generalizzazione della potenza al caso relativistico: si tratta dellenergia meccanica ceduta al punto materiale per unit` a di tempo proprio. Mettiamo tutto insieme in una denizione che includa anche le denizioni di impulso e forza relativistica.
85
Denizione 5.4. (Impulso, energia cinetica, forza e potenza relativistica.) Data una particella con linea di universo = ( ), (a, b) e massa m e ssato un riferimento inerziale F , limpulso e lenergia cinetica (relativistici) della particella rispetto al riferimento F sono deniti rispettivamente come, per ogni evento su , pF := P , (5.6) TF := cP 0 mc2 = c (P |F ) mc2 , (5.7) dove P = P + P 0 F ` e la decomposizione canonica indotta da F in ogni spazio tangente. Se sulla particella agisce una quadriforza F , la forza e la potenza (relativistiche) rispetto al riferimento F agenti sulla particella sono denite rispettivamente come, per ogni evento su fF := F , (5.8) F := cF 0 = c (F |F ) , (5.9) dove F = F + F 0 F ` e la decomposizione canonica indotta da F in ogni spazio tangente. Chiaramente la componente temporale dellequazione (5.1) non ` e altro che il teorema delle forze vive relativistico: Teorema 5.1. (Teorema delle forze vive.) Si consideri un punto materiale soggetto ad una quadriforza F . In ogni riferimento inerziale F e per ogni istante di tempo proprio sulla linea di universo del punto materiale valgono le equazioni: = F , (5.10) d F = (mc2 + TF ) , (5.11) d dove indica il prodotto scalare negli spazi di quiete con F indotto dalla metrica spaziale di F . Commenti 5.2. (1) Una dierenza con il teorema classico ` e che la derivata temporale ` e riferita al tempo proprio. (2) Nel sistema di quiete istantanea, il teorema delle forze vive si riduce ad una banalit` a: 0 = 0, perch e la potenza dissipata in quel riferimento sul punto ` e nulla. Tra poco esamineremo unestensione dei concetti deniti, di fondamentale importanza dal punto di vista sico, in cui la situazione sar` a completamente modicata. (3) Nel caso di particella a massa nulla, semplicemente si denisce T := cP 0 . (4) Un altro modo di scrivere la formula dellenergia cinetica ` e il seguente. Dato che vale Pi P i = m2 c2 , si ha:
3
fF vF
cP 0 =
m2 c4 + c2
(P )2 ,
=1
(5.12)
86
quindi T =
m2 c4 + c2
(P )2 mc2 .
=1
` facile provare che se p := mv dove v ` E e la velocit` a rispetto al riferimento considerato, risulta p2 |p|4 2 T = . + mc O 2m m4 c4 A meno di termini innitesimi del quarto ordine (p2 /2m ` e del secondo ordine), ritroviamo lespressione classica dellenergia cinetica in termini dellimpulso. Nel caso di particelle a massa nulla semplicemente risulta
3
T =c
(P )2 ,
=1
Il limite a piccole velocit` a, o piccole componenti spaziali del quadri impulso, non ` e di molto interesse: le particelle senza massa hanno signicato solo relativistico.
5.2
Se un punto materiale ` e sottoposto ad una quadriforza nulla in un intervallo di tempo proprio, la linea di universo del punto materiale ` e un segmento di retta ane, cio` e un moto rettilineo uniforme rispetto a qualche sistema di riferimento inerziale. Quello che pi` u ci interessa ` e che il quadri impulso ` e conservato sulla linea di universo considerata. Quindi, rispetto ad un qualsiasi sistema di riferimento inerziale lenergia cinetica relativistica e limpulso relativistico saranno costanti del tempo proprio e quindi della coordinata temporale del riferimento.
5.2.1
Vogliamo ora cercare di formulare la legge di conservazione del quadri impulso che generalizza quella di conservazione dellimpulso e dellenergia per un sistema di punti materiali isolati allesterno ma interagenti tra di essi. La formulazione pi` u elementare di tale principio sembrerebbe consistere nella richiesta che il quadri impulso totale del sistema di punti materiali sia conservato nel tempo di ogni riferimento inerziale. Le cose non sono tanto semplici perch e non ` e per nulla ovvio come denire il quadri impulso totale. Il passaggio dalla meccanica del punto a quella di un sistema di punti non ` e per nulla ovvia quanto lo era in meccanica classica. Ci` o` e dovuto al fatto che in generale non possiamo pi` u banalmente denire delle quantit` a totali, come il quadri impulso totale o la quadriforza totale, sommando le rispettive quantit` a associate a singoli punti materiali. Vediamo perch e. Prima di tutto dobbiamo decidere quali eventi considerare sulla linea 87
di universo di ciascuna particella su cui leggere il quadri impulso per eseguire le somme dei vari quadri impulsi. Prendiamo a titolo di esempio il caso di due punti materiali isolati dallesterno, ma che interagiscono tra di loro con interazioni a distanza. Assumiamo che linterazione a distanza sia tale che le loro linee di universo, quando i punti sono abbastanza spazialmente vicini, smettono di essere dei segmenti e si incurvano, per poi diventare nuovamente segmenti quando i punti si sono sono sucientemente spazialmente allontanati. Cosa ` e il quadri impulso totale del sistema dei due punti? Dato che il quadri impulso totale in componenti sar` a valutato da riferimenti, ` e naturale pensare che la procedura per denirlo sia quella di sezionare le due linee di universo , con le sottovariet` a F t spazi di quiete di un riferimento inerziale F . Il quadri impulso totale al tempo t dovrebbe essere denito come Pt + Pt dove tali quadri impulsi sono quelli valutati in F t e F t rispettivamente. Il principio di conservazione del quadri impulso dovrebbe quindi consistere nella richiesta che Pt + Pt non dipenda da t. Nota 5.2. Questa procedura di denire il quadri impulso totale e quindi enunciare la legge di conservazione del quadri impulso per sistemi di punti materiali isolati allesterno non ` e comunque una buona procedura per due motivi importanti. (a) Con la denizione data, il principio di conservazione dellimpulso relativistico in ogni riferimento inerziale, che segue immediatamente dal principio di conservazione del quadri impulso, sarebbe equivalente al principio di azione e reazione. Tuttavia, in assenza del tempo assoluto e se le forze si esercitano a distanza, il principio di azione e reazione pu` o solo essere formulato separatamente in ogni sistema di riferimento inerziale rispetto alla coordinata temporale di tale riferimento. Tuttavia ` e facile produrre esempi semplici in cui la validit` a del principio di azione e reazione in un riferimento inerziale implica che tale principio non valga in un altro sistema di riferimento inerziale. Concludendo, con la procedura indicata per dare le denizioni ed enunciare il principio, avremmo che la validit` a del principio di conservazione del quadri impulso totale dovrebbe dipendere dal riferimento inerziale in netto contrasto con il principio di relativit` a. (b) Un secondo motivo per rigettare le denizioni e lenunciazione proposta del principio di conservazione del quadri impulso totale ` e il seguente. Il quadri impulso totale denito come detto dipender` a in generale dal riferimento a dierenza dei quadri impulsi dei singoli punti materiali del sistema che contribuiscono a denirlo. Per provare ci` o consideriamo ancora il sistema dei due punti materiali di sopra. Si ssi un evento p sulla linea di universo , nella regione di spaziotempo in cui avviene linterazione per cui cui le due linee non sono segmenti in . Tenendo sso p scegliamo due spazi di quiete 1 , 2 riferiti rispettivamente a due diversi riferimenti inerziali ` chiaro che i due F1 e F2 e assumiamo che entrambi gli spazi intersechino la prima linea in p. E spazi di quiete intersecheranno laltra linea di universo in due eventi diversi q1 in 1 e q2 in 2 e q1 = q2 . In q1 e q2 , in generale, i quadri impulsi del secondo punto materiale P1 e P2 saranno dierenti perch e la linea di universo non ` e un segmento (a causa dellinterazione) e non ha quindi vettore tangente costante. Di conseguenza la procedura suggerita sopra fornisce due quadri impulsi totali Pp + P1 e Pp + P2 in generale diversi, indipendentemente dal fatto che essi si conservino o meno al variare del tempo del corrispondente riferimento. Torneremo successivamente sui problemi sollevati nelle precedenti osservazioni. Passiamo a con88
siderare la situazione particolare, ma sicamente interessante in cui le interazioni tra particelle sono puntuali ed istantanee, cio e avvengono in eventi isolati. In tal caso non ci sono problemi con il principio di azione e reazione. In altre parole considereremo sistemi di punti materiali le cui linee di universo sono segmenti di rette ani (o semirette) di M4 di tipo tempo futuro e conuiscono o escono da singoli eventi. Assumeremo, in tutta generalit` a, che per ogni evento in cui avvengono interazioni, il numero di linee di universo entranti ed il numero di linee di universo uscenti possano essere in numero (nito) diverso (nessuno dei due pu` o comunque essere nullo). Ci` o sicamente corrisponde alla creazione o distruzione di particelle. Tali fenomeni sono ammessi sia in meccanica classica (si pensi ai possibili fenomeni di urto di palline di plastilina), sia in fenomeni connessi alla sica delle particelle atomiche e sub atomiche. DRS2 (Principio di conservazione del quadri impulso per interazioni puntuali ed istantanee) Si consideri un processo di interazione tra particelle nello spaziotempo M4 descritto in un intorno aperto dellevento s M4 come segue. Ci sono N 0 linee di universo (di tipo tempo futuro) (i) : ((i) , (i) ] M4 , i = 1, . . . , N ed altre M 0 linee di universo (di tipo tempo futuro) (j ) : [(j ) , (j ) ) M4 , j = 1, . . . , M corrispondenti al moto rettilineo uniforme in qualche riferimento inerziale di corrispondenti punti materiali, tali che
u+ i
In tale processo, se Pi sono i quadri impulsi sulle linee di universo i e Pj sono i quadri impulsi sulle linee di universo j vale che il quadri impulso totale prima dellinterazione uguaglia quello totale dopo linterazione:
N M
Pi =
i=1 j =1
Pj .
(5.13)
Commenti 5.3. ` importante notare che le linee di universo primate sono necessariamente nel futuro causale (1) E di s mentre quelle non primate sono nel passato causale si s per la proposizione 2.6. Di conseguenza ogni riferimento inerziale descriver` a le linee di universo i come quelle delle particelle prima dellinterazione e le linee di universo j come quelle delle particelle dopo linterazione. Per lo stesso motivo ogni riferimento inerziale interpreter` a N i=1 Pi come il quadri impulso totaM le prima dellinterazione e j =1 Pj come il quadri impulso totale dopo linterazione. (2) Se F S ha uno spazio di quiete F t che interseca tutte le linee i ma non s allora tale spazio di quiete non pu` o avere intersezione con le linee j . Se ci` o fosse, avremmo due eventi spazialmente separati (perch e appartenenti alla stesso spazio di quiete e non coincidenti avendo coordinata temporale dierente) che devono essere anche causalmente connessi per lesercizio 89
3.1.2 (o 3.1.3 se qualche linea di universo ` e di tipo luce), e ci` o` e impossibile. Se F t contiene s, ovviamente non pu` o contenere altri punti delle linee di universo. Se F t interseca tutte le linee j ma non s allora tale spazio di quiete non pu` o avere intersezione con le linee i similmente a sopra. In tal modo, dato che i quadri impulsi sono costanti sulle linee di universo, il quadri imo eettivamente calcolare sommando i quadri impulsi nei punti pulso totale iniziale N i=1 Pi si pu` di intersezione con le i tra uno spazio di quiete qualsiasi di qualsiasi riferimento inerziale (che abbia intersezione con tutte le j ). Nello stesso modo, il quadri impulso totale nale M j =1 Pj si pu` o eettivamente calcolare sommando i quadri impulsi nei punti di intersezione con le j tra uno spazio di quiete qualsiasi di qualsiasi riferimento inerziale (che abbia intersezione con tutte le i ). (3) Se qualche linea di universo ` e di tipo luce, il principio di conservazione del quadri impulso totale per interazioni puntuali ed istantanee si estende banalmente purch e ovviamente siano deniti i quadri impulsi sulle linee di universo di tipo nullo. (4) Il principio di conservazione del quadri impulso totale si applica al caso seguente in particolare. Si consideri un diagramma dinterazione nello spaziotempo M4 costituito da una rete i cui rami elementari detti gambe sono un numero nito tra segmenti (non degeneri) e semirette di M4 , tutti di tipo causale futuro e i cui nodi detti vertici sono eventi isolati e sono dati dai punti estremi delle gambe. Vi sono due tipi di gambe: quelle esterne date da semirette e quelle interne denite dai segmenti. Una gamba si dice: uscente da un vertice se i punti della gamba sono nel futuro causale del vertice, entrante in un vertice se i punti della gamba sono nel passato causale del vertice. (I punti interni a segmenti o semirette che siano attraversati dal solo segmento o semiretta considerati non sono vertici per denizione.) Una rete di questo tipo descrive un processo di scattering o diusione di un numero nito di particelle che evolvono liberamente lungo le linee di universo date dalle gambe entranti, interagiscono puntualmente ed istantaneamente tra di loro nei vertici e i prodotti dellinterazione tornano ad evolvere liberamente, come particelle uscenti dal processo, lungo le gambe uscenti della rete. Consideriamo, in un diagramma di interazione come quello denito sopra, un vertice s e un intorno di s che non contenga altri vertici e gambe che non passano per s. Ammettendo che il diagramma descriva un processo di interazione tra particelle e che quindi ogni linea di universo del diagramma abbia associato un quadri impulso, in possiamo imporre il principio di conservazione del quadri impulso DRS2 e fare altrettanto per ogni altro vertice del diagramma dinterazione. Se tale principio ` e valido per il diagramma considerato si pu` o vericare che vale il seguente fatto. Consideriamo F S e un suo spazio di quiete F t . Le intersezioni tra tale spazio di quiete ed il diagramma sono costituite da un numero nito di punti. La somma dei quadri impulsi deniti su tali punti (associati alle corrispondenti linee di universo) non dipende n` e dallo spazio di quiete F t e nemmeno dal riferimento inerziale F . Tale quadri impulso ` e il quadri impulso totale del sistema. In particolare, andando sucientemente indietro nel tempo, F t intersecher` a solo gambe esterne entranti. In tal modo il quadri impulso totale coincide con il quadri impulso totale delle particelle entranti. Nello stesso modo il quadri impulso totale risulta coincidere con il quadri impulso totale delle particelle uscenti. 90
Esercizi 5.1. 1. Mostrare che in un diagramma di interazione come quello denito nel punto (4) sopra, se ` e valido DRS2, non ci possono essere vertici senza linee entranti oppure senza linee uscenti. Interpretare sicamente il risultato come limpossibilit` a della creazione/sparizione (di che cosa?) dal/nel nulla. Suggerimento. Il punto cruciale ` e che, in ogni riferimento inerziale, P 0 > 0 per ogni quadri impulso di una particella anche a massa nulla. La somma di numeri positivi non pu` o mai produrre il numero 0.
5.2.2
Il principio di conservazione del quadri impulso, anche nella sua forma elementare enunciata sopra, ha delle conseguenze importantissime per quanto riguarda la relazione tra massa ed energia. Per illustrare tali conseguenze, consideriamo preventivamente la seguente situazione. Si consideri un sistema di punti materiali (di massa non nulla) non interagenti tra di essi e isolati con lesterno, ` possibile trattare, matematicamente, il con quadri impulsi P(i) e masse m(i) , i = 1, . . . , N . E sistema complessivo come un unico punto associando ad esso un unico quadri impulso ed una e di tipo tempo futuro essendo tali i P(i) ed essendo un cono unica massa. Dato che P := i P(i) ` ogni I+ , per la proposizione 2.3, ci sar` a un unico riferimento inerziale FG con FG parallelo a q P . Tale riferimento ` e detto baricentrale. In tale riferimento solo la componente temporale di P ` e non nulla e vale: N N TF (i) P0 M := = m(i) + . c c2 i=1 i=1 Se dunque vogliamo dare senso al concetto di massa totale del sistema per questa via, dobbiamo denirla come la somma delle masse delle particelle componenti con laggiunta delle energie cinetiche delle stesse particelle valutate nel riferimento baricentrale. In tal modo si vede che le energie cinetiche danno sorprendentemente un contributo alla massa complessiva del sistema. Si pu` o obiettare che in realt` a il discorso ` e del tutto formale e che in realt` a non esiste alcun punto materiale associato al sistema complessivo. Questo ` e vero, ma la situazione cambia radicalmente con il seguente esempio dove le formule matematiche sono simili ma il signicato sico ` e profondamente diverso. Consideriamo un processo di decadimento di particelle comunemente osservato in sica delle particelle. Una particella di massa M e quadri impulso P , istantaneamente e puntualmente decade in due particelle di masse m1 , m2 e quadri impulsi P1 , P2 . Prima e dopo il decadimento le particelle sono libere. Classicamente il fenomeno ` e possibile solo se M = m1 + m2 , per la legge di addizione delle masse. Ulteriormente, sempre nel caso classico, lenergia cinetica delle particelle nali se non ` e nulla ` e creata a spese di qualche forma di energia interna della particella iniziale (per esempio energia chimica negli esplosivi). Relativisticamente ci sono altre 91
possibilit` a. Se ci poniamo nel sistema baricentrale delle due particelle nali, in tale riferimento la particella iniziale di massa M ` e vista in quiete (no a quando esiste) e gli impulsi delle due particelle nali sono uguali ed opposti. La conservazione del quadri impulso in tale riferimento ha come unica equazione non banale quella data dalla componente temporale: T(1) T(2) + 2 . c2 c Questa equazione dice che la massa complessiva delle due particelle nali pu` o essere inferiore alla massa della particella iniziale, e la dierenza di massa si trasforma in energia cinetica delle particelle nali secondo la celeberrima equazione di Einstein M = m1 + m2 + E = mc2 , dove in questo casso E = T(1) + T(2) ` e unenergia cinetica e m = M m1 m2 ` e la dierenza delle masse. Deve essere precisato che non solo lenunciato teorico del principio di conservazione del quadri impulso ammette tali fenomeni in linea di principio, ma sperimentalmente si osservano eettivamente fenomeni come quello suddetto in cui m1 + m2 < M . In tali casi la dierenza di massa ` e davvero tramutata in energia cinetica secondo lequazione di Einstein. ` fondamentale notare che lenergia cinetica non ` E e lunica forma di energia nota, ma ne esistono di diverso tipo: meccanica, chimica, termodinamica, ecc. Tali forme di energia si possono ` trasformare luna nellaltra in conformit` a con la legge generale di conservazione dellenergia. E allora naturale formulare il: Principio di equivalenza massa energia. Il contenuto complessivo energetico di un corpo, valutato in quiete con esso, corrisponde alla massa dello stesso corpo tramite lequazione: E = mc2 . Tale principio, unito al principio di conservazione dellenergia, ha ricevuto e riceve continuamente nella sica delle alte energie molteplici conferme sperimentali ed ` e oggi accettato come vero. Commenti 5.4. (1) Come conseguenza della conservazione dellenergia e del principio di equivalenza massa energia, la massa cessa di essere una grandezza additiva e conservata. Ulteriormente sono possibili trasmutazioni di massa in diverse forme di energia (nel rispetto dellequazione di Einstein). (2) Consideriamo il processo inverso di quello studiato sopra, in cui due punti materiali macroscopici, per esempio due palline di plastilina, si scontrano nel riferimento baricentrale e danno luogo ad un unico punto materiale fermo, con massa M = m1 + m2 + 92 T(1) T(2) + 2 , c2 c
dove abbiamo usato la stessa notazione di sopra. Osserviamo che a causa del valore enorme di c2 , la dierenza M (m1 + m2 ) risulta essere molto piccola nelle scale usuali di energie e masse. Infatti dal punto di vista classico tale dierenza ` e considerata nulla. Dal punto di vista classico si aerma anche che lenergia cinetica T(1) + T(2) viene immagazzinata sotto forma di energia interna nella particella di massa M nale: in questottica il punto nale ` e in realt` a un sistema termodinamico. A conferma di tale fatto, in conformit` a con le propriet` a generali dellenergia interna termodinamica, si assiste sperimentalmente ad un aumento della temperatura della particella nale rispetto alla temperatura delle due particelle iniziali (supposte con la stessa temperatura). Un modo naturale di fare coesistere i due punti di vista ` e quello di aermare che la massa M nale denisce il contenuto complessivo di energia della particella nel suo riferimento di quiete: lenergia interna termodinamica ` e inclusa nel calcolo di M c2 . In altre parole, se scaldiamo un sistema termodinamico, quindi cedendogli energia non meccanica (senza variazioni di energia cinetica), la massa del sistema deve aumentare di Q/c2 dove Q ` e la quantit` a complessiva di energia non meccanica (calore) ceduta al sistema. Da questo punto di vista si pu` o generalizzare la legge DRS1 denendo quadri forze non meccaniche ed assumendo variabile la massa del punto materiale soggetto alla quadriforza. Assumiamo ancora valida dP F = , d ma omettiamo il vincolo (F |P ) = 0 nella denizione di quadriforza. Lo scalare (F |P ) valutato in un evento della linea di universo del punto materiale risulta avere il valore
0 (F |P ) = m( )cF
dove il secondo membro ` e riferito al sistema di riferimento istantaneamente in quiete con il punto materiale. Quindi 0 Q := m1 (F |P ) = cF misura lenergia non meccanica ceduta al punto materiale nel suo sistema di quiete istantanea e per unit` a di tempo proprio. Dalla condizione (P |P ) = m2 c2 si ricava subito che vale: Q= d m( )c2 . d (5.14)
` immediato vericare che la stessa equazione si trova scrivendo la componente temporale delE lequazione della dinamica nel riferimento di quiete istantanea della particella. Si osservi che lassenza del vincolo (F |P ) = 0 impone unequazione di pi` u sul moto della particella: la componente temporale dellequazione della dinamica nel sistema di quiete della 93
particella non ` e pi` u banale, ma diventa lequazione (5.14). Tuttavia, ora anche m = m( ) ` e una variabile del problema per cui il problema del moto risulta comunque essere determinato. Per concludere, notiamo che nel caso di quadriforze completamente meccaniche, il vincolo (5.3) comporta immediatamente la costanza della massa della particella attraverso la stessa (5.14). Esercizi 5.2. 1. Pu` o una particella di massa M diminuire la sua massa ed aumentare la sua energia cinetica spontaneamente in modo istantaneo e puntuale? Suggerimento: si esamini la conservazione del quadri impulso nel riferimento di quiete con la particella prima della trasformazione. 2. Un fotone pu` o trasformarsi spontaneamente, istantaneamente e puntualmente in due particelle di massa non nulla? Suggerimento: si esamini la conservazione del quadri impulso nel riferimento baricentrale della coppia di particella dopo la trasformazione. 3. Si consideri una quadriforza non totalmente meccanica F , la si decomponga in parte meccanica e parte non meccanica come F = Fm + Fnm dove (P |F )P . m2 c2 Mostrare che il teorema delle forze vive ora assume la forma d (mc2 + TF ) , fF m vF + Q = d dove la forza relativistica fF m ` e riferita alla sola parte meccanica della quadriforza. Concludere che vale anche la forma completamente meccanica del teorema delle forze vive: Fnm := fF m vF =
d TF . d Suggerimento: Esplicitare la componente temporale della legge della dinamica in un arbitrario riferimento F , quindi notare che per costruzione (Fm |P ) = 0 e scrivere tale equazione come 0 e f una relazione tra Fm F m vF . Lultima relazione da provare segue dalla prima relazione da provare e da (5.14). 4. Nei processi di fusione nucleare, due nuclei si fondono per dare luogo a un unico nucleo nale. La massa del nucleo nale ` e inferiore alla somma delle masse dei due nuclei iniziali: si ha cio` e un difetto di massa. Cercare di spiegare in termini semiclassici, tenendo conto che lo stato nale si pu` o considerare come uno stato legato, perch e tale difetto di massa appare. Dove ` e nita la massa che manca? Suggerimento: Lenergia meccanica del sistema nale si pu` o pensare come data dai contributi delle due masse pi` u lenergia meccanica del sistema (potenziale + cinetica). Per liberare i due nuclei dallo stato legato bisogna compiere del lavoro positivo sul sistema per cui lenergia meccanica ` e negativa. 94
5.3
Il tensore energia-impulso.
Eccettuata la situazione in cui i punti materiali di un sistema non interagiscano oppure interagiscano con interazioni puntuali (cio` e non a distanza) ed istantanee, i problemi posti nella nota 5.2 della sezione 5.2.1 sono eettivi e non si risolvono. In realt` a c` e un motivo profondamente sico che andiamo ad illustrare. Gi` a in elettrodinamica classica in cui le forze non sono a distanza, il tentativo classico di denire limpulso totale di un insieme di cariche come la somma degli impulsi delle cariche, generalmente in moto, fallisce miseramente perch e non include un contributo essenziale: limpulso del campo elettromagnetico e senza di esso limpulso totale del sistema non si conserva. Il fallimento del principio di azione e reazione nellelettrodinamica, a causa della veloci` a nita con cui si propagano le perturbazioni del campo elettromagnetico costringe ad attribuire al campo elettromagnetico un contributo allimpulso totale del sistema se si vuole mantenere valido il principio di conservazione dellimpulso. La stessa cosa accade per lenergia. In relativit` a, non esistono velocit` a di propagazione di alcunch e che possa denire relazioni causali nello spaziotempo, a causa della struttura causale dello stesso. In particolare quindi, non solo sar` a necessario attribuire un quadri impulso al campo elettromagnetico ma a qualsiasi campo che descrive interazioni a distanza tra particelle. Quello che di fatto accade, ` e che ad ogni campo che descrive interazioni viene associato un campo tensoriale doppio simmetrico detto tensore energia-impulso. Fissato un riferimento inerziale ed un suo spazio di quiete, il tensore energia impulso denisce una densit` a di quadri impulso su tale spazio di quiete che deve essere integrata spazialmente per dare luogo al quadri impulso del campo valutato in quel riferimento ed allistante considerato. Il quadri impulso totale, denito dalla somma dei quadri impulsi dei punti e del quadri impulso del campo, gode di due propriet` a che risolvono i problemi sollevati nella nota 5.2: (1) esso non dipende dal riferimento inerziale usato per eseguire la somma, (2) esso non dipende dal tempo del riferimento che etichetta lo spazio di quiete: cio` e` e conservato. Lo sforzo di impostare la teoria in termini di densit` a, denite puntualmente ` e anche importante in prospettiva per un secondo ne. Quando si passa dalla relativit` a speciale alla relativit` a generale, cessa di esistere la struttura di spazio ane che permette di sommare vettori applicati in punti distinti dello spaziotempo, come abbiamo fatto precedentemente per denire la nozione di quadrimpulso complessivo di un insieme di punti materiali non interagenti o interagenti in singoli eventi. Una descrizione in termini di densit` a, da integrare su opportune ipersuperci tridimensionali di tipo spazio pu` o ancora avere senso. In tale contesto le densit` a devono essere rappresentate, punto per punto, da opportuni campi tensoriali.
5.3.1
Abbiamo bisogno di qualche strumento tecnico per introdurre il tensore energia-impulso. Se (M, g) ` e una variet` a (pseudo-)riemanniana, la metrica g indice una misura naturale di volume g (sulla classe dei sottoinsiemi di Borel di M ) che, in ogni carta locale denita su M , cio` e
95
:U
dove E U M ` e un insieme di Borel, dx1 dxn denota la solita misura di Lebesgue in coordinate, cio` e denita in (U ) Rn e g (x1 , . . . , xn ) indica il determinante della matrice che, nelle coordinate considerate, individua il tensore metrico g. La denizione di un integrale sulle funzioni (a supporto compatto) denite su M , sfruttando la paracompattezza di M , si ottiene in modo standard con una partizione dellunit` a {fi }iI subordinata ad un atlante localmente nito2 {(Ui , i )}iI . Se F : M R ` e continua a supporto compatto3 si denisce: 1 n n F dg := (F i )(fi i ) |gi (x1 i , . . . , xi )|dxi dxi .
M i I Ui
Si dimostra che il funzionale lineare sulle funzioni continue a supporto compatto, denito in questo modo dal secondo membro non dipende dallatlante e dalla partizione dellunit` a. Dato che il funzionale denito sopra ` e positivo, il teorema della rappresentazione di Riesz assicura che esista ununica misura positiva -additiva di Borel regolare, indicata appunto con g , che assegna ai compatti misura nita e il cui integrale coincida con il funzionale denito sopra quando ci si restringe a lavorare con funzioni continue a supporto compatto. Se S M ` e una sottovariet` a tridimensionale embedded e h ` e la metrica indotta da g su S , viene a denirsi una misura naturale di volume h considerando (S, h) come variet` a (pseudo)riemanniana, nel caso in cui la metrica indotta h sia una vera (pseudo-)metrica, cio` e sia non degenere. In caso contrario il determinante h si annulla e la costruzione ` e problematica. Si pu` o dimostrare che il teorema di Stokes-Poincar e dato in termini di forme dierenziali, assume la seguente espressione facendo uso della connessione di Levi-Civita di (M, g). Teorema 5.2. Sia (M, g) una variet` a lorentziana di dimensione 4, X un campo vettoriale smooth su M e N M un sottoinsieme aperto chiusura compatta la cui frontiera M sia orientabile e sia lunione disgiunta di un numero nito di sottovariet` a embedded di dimensione 3, ciascuna separatamente di tipo spazio oppure tempo, e di un numero nito di sottovariet` a embedded di dimensione 2. In questo caso: Xdg =
N +N
X, n dh .
(5.15)
Lintegrale a secondo membro ` e da intendersi come la somma degli integrali sulle sottovariet` a tridimensionali di cui N ` e composta e n ` e il covettore normale uscente a N normalizzato a
Come noto si tratta di un atlante {(Ui , i )}iI tale che ogni p M ammette un intorno aperto Op che interseca un numero nito di domini Ui . {fi }iI ` e quindi una classe di funzioni continue a supporto compatto fi : M [0, 1] tali che e sempre iI fi (p) = 1 per ogni p M e con suppfi Ui per ogni i I ; la somma ` eseguita su un insieme nito di indici per la propriet` a degli intorni Op suddetta. 3 Dato che il supporto di F ` e compatto, esso pu` o essere ricoperto con un numero nito di intorni aperti Op della nota precedente e quindi la somma a secondo membro ` e nita.
2
96
g(n|n) = 1 a seconda del caso, inne X indica la divergenza calcolata rispetto alla connessione di Levi-Civita: X = a X a in ogni sistema di coordinate locali. Supponiamo che il campo X sia di tipo tempo nello spaziotempo di Minkowski M4 e soddis la condizione: X =0 (5.16) ovunque. Consideriamo un tubo T di linee integrali di X limitato da due sottovariet` a embedded S1 e S2 tridimensionali di tipo spazio per esempio due spazi di quiete F t1 , F t2 a tempi diversi, t2 > t1 , di un sistema di riferimento inerziale F dato che X, n = 0 sulla supercie laterale del tubo (che risulta essere di tipo tempo), lequazione (5.15) per il cilindro N ottenuto racchiudendo la porzione di T tra S1 e S2 fornisce lidentit` a 0=
+N
X, n dh .
(5.17)
Teniamo ora conto che le pareti laterali del cilindro non forniscono alcun contributo, dato che risulta X, n = 0 su di esse per costruzione. Possiamo allora riscrivere lidentit` a trovata come:
S2 T
X, n dh =
S1 T
X, n dh ,
(5.18)
dove i due versori n sono ora diretti uno in direzione entrante e laltro in direzione uscente (per esempio entrambi verso il futuro, pensando il tutto in M4 ) e non in direzione uscente da dalla porzione di tubo di usso che stiamo considerando. Questa scelta spiega lassenza del segno a secondo membro. Si osservi che in (5.18), nel caso generale non ` e richiesto che S1 e S2 siano normali a X . La (5.18) si presta ad uninterpretazione sica interessante: si tratta di un equazione di conservazione, nel tempo, della grandezza ottenuta integrando la densit` a X, n . In componenti, se pensiamo il tutto in M4 ed immaginiamo che S1 e S2 siano due spazi di quiete F t1 , F t2 a tempi diversi, t2 > t1 , di un sistema di riferimento inerziale F con coordinate minkowskiane x0 , x1 , x2 , x3 , risulta subito che n = dx0 , quando il vettore controvariante associato a n (che e diretto verso il futuro, abbiamo che X, n = X 0 . in questo caso ` e x0 ) ` Tuttavia si possono anche considerare spazi di quiete di due distinti sistemi di riferimento inerziali. La (5.18) implica allora anche che valori delle grandezze ottenute integrando la densit` a X, n non dipendano dal riferimento. Nota 5.3. (1) Il fatto di usare una versione del teorema di Stokes-Poincar e (5.15) che tiri in causa esplicitamente la struttura metrica dello spaziotempo invece di lavorare con forme dierenziali ` e, da una parte scomodo, dato che non ` e possibile trattare adeguatamente il caso in cui N includa porzioni estese di tipo luce su cui la misura indotta dalla metrica ` e degenere. Daltra parte, tale formulazione si presta ad interpretazioni siche importanti, dato che entra in gioco esplicitamente la connessione di Levi-Civita che ha un importante signicato sico, specialmente in relativit` a 97
generale, e che la misura spaziale ` e ssata una volta per tutte dalla metrica, cio` e sicamente parlando, dagli strumenti di misura a disposizione in ogni sistema di riferimento, indipendenti dalla densit` a che di deve integrare. (2) Si pu` o provare facilmente che, per X smooth di tipo tempo, la richiesta (5.18), assunta valida per ogni scelta del tubo T di linee integrali e delle sottovariet` a spaziali S1 , S2 , ` e in realt` a equivalente alla richiesta X = 0. Proviamolo. Assumiamo che valga (5.18) e quindi (5.17) in modo del tutto generale. Se in un punto p M fosse X = 0 allora, in un intorno O di tale punto, per continut` a, dovrebbe risultare | X | > c per qualche costante c > 0. Scegliendo un cilindro N O costruito con un tubo di linee integrali di X e due sottovariet` a di tipo spazio S1 , S2 come detto sopra (` e suciente lavorare in una carta locale restringendo O attorno a p se necessario), si arriverebbe ad ottenere N Xdg = 0 (dato che la misura degli aperti non vuoti ` e strettamente positiva per la misura g ) che in virt` u della (5.15) renderebbe impossibile la (5.17). (3) Linterpretazione data della (5.18) come legge di conservazione per la grandezza X, n prescinde completamente dal fatto di lavorare in relativit` a speciale e pu` o essere data in uno spaziotempo del tutto generale.
5.3.2
Partendo dalle considerazioni della sezione precedente, consideriamo il caso di un sistema esteso pi` u semplice possibile: una polvere di particelle, ciascuna con una massa assegnata, che non interagiscono e che evolvono con linee di universo tangenti ad un campo di quadrivelocit` a V. Tale campo ` e assunto essere smooth, denito in una qualche regione aperta T dello spaziotempo di Minkowski di forma tubolare, in modo tale che prese due sottovariet` a embedded tridimensionali di tipo spazio date da spazi di quiete di due riferimenti (non necessariamente lo stesso), la porzione di T che cade tra di esse sia a chiusura compatta. Si osservi che la non interazione tra le particelle implica che esse descrivano moti rettilinei uniformi in ogni sistema di riferimento inerziale; in altre parole le loro storie sono segmenti di retta quando parametrizzate con il tempo proprio. Conseguentemente soddisfano lequazione delle geodetiche V V = 0. Il sistema che stiamo descrivendo non ` e altro che la versione continua dellinsieme discreto di punti materiali non interagenti considerato precedentemente. Possiamo associare a tale sistema una densit` a di massa 0 pensata come una funzione smooth nella regione di spaziotempo che consideriamo. Qui si apre un problema: se parliamo di densit` a di massa signica che la massa si deve ottenere integrando tale densit` a nello spazio (tridimensionale) rispetto alla misura h . A quale riferimento inerziale ci stiamo riferendo per denire lo spazio di quiete? Una risposta sensata ` e quella di considerare un sistema di riferimento dierente per ogni evento p dello spaziotempo attraversato da una linea integrale di V . La densit` a di massa 0 (p) in p sar` a riferita allo spazio del sistema di riferimento inerziale con F = V (p). In altre parole, ci stiamo riferendo al sistema di riferimento inerziale in quiete con la particella la cui storia passa per p. Quale sar` a la densit` a di massa in un qualsiasi altro sistema di riferimento? Ragionando in via del tutto euristica, se 0 rappresenta un piccolo volume spaziale nel riferimento associato a V (p) 98
attorno a p, in un qualunque altro sistema di riferimento F , 0 corrisponder` a ad un piccolo volume spaziale attorno a p: v2 F = 0 1 2 c dove v ` e la velocit` a della particella considerata nel riferimento F , come abbiamo visto nella sezione 4.3.1. La stessa relazione pu` o essere scritta: F = 0 1
v2 c2
dove ` e la densit` a di massa vista nel riferimento F , tenuto conto del fatto che la massa ` e uno 0 scalare per cui F F = 0 0 . Abbiamo ottenuto che = 0 V , ovvero F = 0 V, nF c (5.19)
dove nF ` e il covettore normale agli spazi di quiete di F e diretto verso il futuro. Dobbiamo inne imporre un vincolo sulla densit` a 0 che corrisponde allidea che: la massa contenuta in una porzione di continuo che evolve secondo le curve integrali di V rimanga costante nel tempo. In altre parole stiamo pensando che la massa non sia altro che la somma delle masse innitesime associate ad ogni storia V e che ciascuna massa non vari nel tempo, perch e i punti non interagiscono; conseguentemente inseguendo una porzione di continuo associato ad un insieme di punti materiali, la massa di tale porzione deve rimanere sempre la stessa, dato che i punti materiali che la compongono sono sempre gli stessi. Il vincolo detto si esprime come 0 V, n dh = 0 V, n dh , (5.20)
F ,t2 T
F ,t2 T
dove T T ` e una qualsiasi sotto regione tubolare ottenuta selezionando un sottoinsieme aperto in F ,t2 e facendolo evolvere secondo V . Il risultato deve essere valido comunque scegliamo il sistema di riferimento inerziale F . Per quanto detto in (3) nella nota 5.3, la richiesta fatta ` e equivalente alla richiesta espressa in forma locale: (0 V ) = 0 , (5.21)
che assumeremo essere valida dora in poi, per ogni punto di T . Consideriamo ora la densit` a di quadri impulso del sistema di punti. Nel riferimento F , dato che ` e la densit` a di massa, essa sar` a descritta da: V = 0 V V, nF . c
Integrando questa grandezza, rispetto alla misura spaziale dh , sullo spazio di quiete F ,t del riferimento F otteniamo infatti limpulso totale del sistema calcolato nel riferimento F , al 99
tempo t di tale riferimento: non facciamo altro che sommare (attraverso un integrale) tutti i contributi mV dovuti a ciascun punto materiale la cui storia attraversa F ,t al tempo t. Tutto ci` o ci porta a denire il campo tensoriale controvariante, detto tensore energia impulso del sistema: T := 0 V V . (5.22) Nel seguito indicheremo con T ( ) il campo vettoriale che si ottiene contraendo il fattore V di sinistra con il campo vettoriale covariante . In componenti: T ( )k := i T ik per ogni campo vettoriale covariante .
In base a quanto detto sopra, dato un sistema di riferimento F con associate coordinate minkowskiane x0 , x1 , x2 , x3 , limpulso totale nel riferimento F nella direzione xi e nellevento p ` e data da: 1 i PF (5.23) T (dxi ), n dh , t = c F t mentre la densit` a di energia ` e data da: EF t = T (dx0 ), n dh .
F t
(5.24)
Vogliamo ora mostrare che, in virt` u del fatto che le particelle del nostro continuo sono non i e E interagenti e pertanto le loro linee di universo sono geodetiche, le grandezze PF F t sono t costanti al variare del tempo, cio` e sono conservate. Ulteriormente vedremo anche che le quattro grandezze dette sono le componenti di un quadrivettore, che dunque non dipende dalla scelta del riferimento inerziale F . Teorema 5.3. Il campo tensoriale energia impulso T in (5.22), nellipotesi che il campo di velocit` a V sia quello di particelle in moto geodetico e che valga lequazione di conservazione della massa (5.21) soddisfa lequazione: b T ab = 0 . (5.25) Conseguentemente: i , (a) per ogni ssato sistema di riferimento inerziale F , le quattro grandezze EF t /c, PF t denite in (5.24) e (5.23), sono costanti nel tempo; (b) al variare del riferimento F , tali grandezze costituiscono le componenti di un quadrivettore P indipendente dalla scelta di F . Dimostrazione. Vale b T ab = b (0 V a V b ) = b (0 V b )V a + 0 V b b V a . Entrambi gli addendi nali sono nulli, il primo per la (5.21) ed il secondo perch e vale lequazione delle geodetiche b a V b V = 0 per ogni linea di universo delle particelle. Fissato un riferimento F con coordinate minkowskiane x0 , x1 , x2 , x3 , dato che il campi dxa sono campi costanti (rispetto alla connessione di Levi-Civita), abbiamo che, se = ca dxa con ca costanti arbitrarie: T ( ) = b (ca T ab ) = ca b T ab = 0. Usando il teorema 5.2 con X = T ( ) 100
i comunque si scelga segue immediatamente la conservazione delle quattro grandezze EF t /c, PF t il sistema di riferimento. Per provare (b), consideriamo un covettore costante rispetto alla connessione di Levi-Civita e due sistemi di riferimento inerziali F e F . Fissiamo F t e F t in modo tale che le loro intersezioni con T non abbiano punti in comune ed individuino una regione N limitata nel passato e nel futuro rispettivamente da F t e F t . Applicando nuovamente il teorema 5.2 alla regione N si ottiene che
,t
T ( ), n dh =
F ,t T
T ( ), n dh .
EF t 0 +
Questo signica che i due membri deniscono lo stesso funzionale lineare P, sullo spazio dei covettori costanti , cio` e sullo spazio duale allo spazio delle traslazioni dello spazio ane 4 M . In altre parole deniscono un elemento dello spazio delle traslazioni stesso, cio` e un vettore 1 ,P2 ,P3 controvariante: P che ha componenti c1 EF t , PF nella base pseudo-ortonormale t F t F t 1 , P 2 , P 3 nella base associata alle coordinate minkowskiane di F e componenti c1 EF t , PF t Ft Ft pseudo-ortonormale associata alle coordinate minkowskiane di F . 2
5.3.3
Lequazione di conservazione (5.25) ` e molto interessante dal punto di vista sico: ` e espressa in forma completamente locale e quindi non necessita della struttura di spazio ane per sussistere e pertanto si pu` o imporre anche in ambienti in cui la struttura di spazio ane non pu` o esistere: lo spaziotempo della relativit` a generale. Ulteriormente ` e espressa in termini di operazioni tra tensori e pertanto si esprime, in componenti, nello stesso modo in ogni sistema di riferimento inerziale, rispettando a vista il principio di relativit` a. Si pu` o supporre che la (5.25) sia il modo in cui il principio di conservazione energia-impulso si debba esprimere nelle teorie relativistiche, anche quando il sistema interagisca. In eetti le cose stanno davvero in tal modo: ad ogni sistema sico trattato in relativit` a speciale (includendo i sistemi di campi come il campo elettromagnetico) si riesce sempre ad associare un tensore energia-impulso che, nel caso in cui il sistema sia isolato (ma possa auto interagire), integrato sugli spazi di quiete dei riferimenti inerziali, denisce lenergia e limpulso complessivi del sistema in tali riferimenti e che soddisfa lequazione (5.25) che garantisce la conservazione di tali quantit` a ed il fatto che diano luogo ad un unico quadrivettore energia impulso del sistema, indipendentemente dal riferimento. In via del tutto generale, se un campo tensoriale doppio controvariante T soddisfa lequazione (5.25) e se ` e un campo vettoriale covariante costante rispetto alla connessione di Levi-Civita: = 0 , 101
soddisfa lequazione (5.16) e pertanto vale lequazione di conservazione (5.18), che permette di denire grandezze conservate. La procedura pi` u diretta per denire il tensore energia impulso per un sistema sico passa per la formulazione lagrangiana e attraverso la formulazione del teorema di N other esteso al caso di sistemi continui (tipicamente campi). La formulazione lagrangiana ` e talmente potente che il risultato sopravvive anche passando in relativit` a generale, dove il teorema di N other non pu` o pi` u essere formulato (almeno nella stessa forma in cui si formula in relativit` a speciale). Vogliamo nel seguito fare ancora qualche osservazione rimanendo ancora fuori dalla formulazione lagrangiana, provando come lesistenza del tensore energia-impulso sia fortemente compatibile con risultati ben noti della meccanica dei continui classica. Le due equazioni fondamentali dei continui dalla meccanica classica sono le seguenti, valide in coordinate cartesiane t, x1 , x2 , x3 di un qualsiasi sistema di riferimento inerziale ed assumendo che il continuo evolva solo tramite auto interazione (non ci siano forze esterne di alcun genere):
3 + v = 0 t =1 x 3 3 v + v v = , t x x =1 =1
(5.27)
= 1, 2, 3 .
(5.28)
dove: v ` e la componente generica del campo di velocit` a del continuo, la densit` a di massa e indica il tensore degli sforzi di Cauchy del continuo: si tratta di un campo tensoriale dipendente anche dal tempo, tale che, se V ` e una porzione di continuo nello spazio di quiete del riferimento al tempo t, con bordo regolare orientabile V , allora, se P V vale:
3
s (t, P ) =
=1
(t, P )n (t, P ) ,
dove s (t, P ) ` e la densit` a superciale di forza (detta anche sforzo) che la porzione esterna di continuo esercita in P quando il covettore normale uscente a V in P ` e n(t, P ). Il tensore degli sforzi ` e una propriet` a del continuo considerato ed ` e in generale, legato con leggi costitutive alla deformazione del continuo oppure ad altre sue propriet` a (per esempio, alle variazioni del campo di velocit` a nel caso dei uidi). Lequazione (5.27) esprime la legge di conservazione della massa in regime non relativistico, attraverso unequazione di continuit` a. La (5.28) corrisponde invece alla seconda legge della dinamica per ogni particella di continuo. Si pu` o dimostrare che la conservazione classica del momento della quantit` a di moto impone al tensore degli sforzi lulteriore richiesta di simmetria: = . (5.29) 102
v = v v t t t
ed esprimendo la t in termini di derivate spaziali tenendo conto della (5.27), il set di equazioni (5.27)-(5.28) si riscrive del tutto equivalentemente:
3 + v = 0 t =1 x 3 v v = 0, v + t x =1
(5.30)
= 1, 2, 3 .
(5.31)
Vogliamo ora provare che se assumiamo che il nostro continuo ammetta una descrizione relativistica ed in particolare ammetta un tensore energia impulso T che soddis (5.25), e tale che T 00 0 rappresentino la densit` e 1 a di energia e la densit` a di impulso, la (5.25) si pu` o interpretare cT come una diretta generalizzazione del set di equazioni (5.27)-(5.28). Fissando un sistema di riferimento inerziale F e riferendosi a coordinate minkowskiane x0 = ct, x1 , x2 , x3 associate ad esso, la (5.25) si esplicita in:
3 1 00 1 0 T + T = 0 2 t c x c =1 3 1 0 T + T = 0, t c x =1
(5.32)
= 1, 2, 3 .
(5.33)
Se ammettiamo che, in regimi di piccole velocit` a (rispetto a c), T 00 /c2 e T 0 /c abbiano la stessa forma classica: T 00 /c2 e T 0 /c v , la prima delle due equazioni scritte sopra diventa la (5.32). La seconda diventa la (5.28) pur di identicare T con v v in regime di piccole velocit` a. In particolare esattamente nel sistema di quiete con una particella di continuo risulta: T = nel riferimento di quiete del continuo.
Nel caso del uido di particelle non interagenti vale = 0, ed infatti risulta T = 0 V V = 0 se , = 1, 2, 3 nel riferimento di quiete con una particella di continuo, dato che in tale riferimento V ha solo componente temporale. Nota 5.4. Nel caso in cui si trattino due sistemi sici in interazione, ciascuno dotato del suo tensore energia impulso T e T , ci si aspetta che il tensore energia impulso del sistema complessivo sia dato dalla somma dei due tensori energia impulso pi` u un terzo tensore che tiene conto dellinterazione dei due sistemi: T + T + Tint . Dal punto di vista sico ci si aspetta che se i due sistemi interagiscano, separatamente T , T e Tint non soddisno la (5.25), mentre essa sia soddisfatta dalla somma dei tre tensori energia impulso.
103
5.3.4
In meccanica dei continui classica, lesempio pi` u semplice di uido auto interagente ` e il cosiddetto uido perfetto, caratterizzato dal fatto che il suo tensore degli sforzi abbia struttura completamente isotropa, in coordinate cartesiane ortonormali dello spazio di quiete di un riferimento inerziale: = p (5.34) dove p 0 ` e la pressione del uido (allistante e nel punto considerato). La pressione ` e legata alle altre propriet` a del uido, in particolare la densit` a di massa ed il campo di velocit` a v, attraverso una qualche relazione costitutiva dipendente dal tipo di uido. Per costruire la generalizzazione relativistica di un tale sistema sico, osserviamo che in base alla discussione di sopra, nel riferimento inerziale di quiete istantanea con una particella di uido, ci si aspetta che valga: (T0 ) = p , (T0 )00 = c2 0 , dove 0 ` e la densit` a di massa valutata nel sistema di quiete (istantanea) con la particella di continuo considerata. In un riferimento inerziale generico, in cui le linee di universo delle particelle di uido hanno componenti V a dovr` a essere T ab = (p )a c (p )a d (T0 )cd , dove la matrice di Lorentz p ` e data dalla (7.29) (dove V ` e il vettore colonna delle 3 componenti spaziali della quadrivelocit` a V e c ` e la componente temporale):
t V /c
p = V /c I + V V t /[c2 (1 + )]
ed ` e tale che trasformi il vettore colonna di componenti (c, 0, 0, 0)t R4 nel vettore colonna le cui componenti sono quelle del quadrivettore V . Il calcolo diretto mostra che: V aV b ab a b ab T = 0 V V + p g + . (5.35) c2 Questo tensore energia impulso viene detto tensore energia impulso relativistico del uido perfetto. Nella (5.35), 0 ` e la densit` a di massa misurata in quiete con le particelle di uido mentre V ` e il campo di quadrivelocit` a di tali particelle. Nota 5.5. Il modello (5.35) di tensore energia impulso ` e usato in regimi relativistici molto spinti: per trattare la cosmologia. In tal caso le particelle sono le galassie (o gli ammassi galattici) che riempiono luniverso. In tali contesti, il vincolo classico p 0 cessa di essere, in generale valido e sono ammesse pressioni negative. 104
Capitolo 6
6.1
Denizione 6.1. (Gruppo di Lie.) Un gruppo di Lie ` e una variet` a dierenziabile (di classe C ) G dotata di applicazioni dierenziabili :G e :GG (g, h) gh G , dove G G ` e dotata della struttura dierenziabile prodotto, tali che (G, , ) sia un gruppo in cui ` e la moltiplicazione gruppale e ` e la funzione che associa linverso ad ogni elemento del gruppo. Nota 6.1. La richiesta di dierenziabilit` a pu` o essere indebolita no a considerare gruppi, che diremo topologici, che siano solamente variet` a di classe C 0 (variet` a topologiche) con operazioni di gruppo continue rispetto alla topologia del della variet` a. Viceversa su alcuni testi la richiesta di dierenziabilit` a` e raorzata con quella di analiticit` a: si richiede cio` e che la variet` a sia una variet` a analitica (C ) e che le operazioni di gruppo siano funzioni analitiche. Se si accetta la denizione di gruppo di Lie che abbiamo dato noi, i gruppi di Lie con struttura C appena introdotti vengono detti gruppi di Lie analitici. In realt` a queste denizioni apparentemente diverse sono tutte equivalenti a causa di un famoso teorema di Gleason, Montgomery e Zippin del 1952. Tale teorema prova che ogni gruppo topologico ammette sempre una sotto-struttura g g 1 G ,
105
dierenziabile di classe analitica C rispetto a cui le operazioni di gruppo sono funzioni analitiche e tale struttura ` e univocamente determinata. Consideriamo un elemento g G, esso denisce unapplicazione dierenziabile Pg : G h Pg (h) = gh. Quindi, se Pg := dPg , Pg : Th G Tgh G. Ulteriormente dalle propriet` a del dierenziale vale Pf g = Pf Pg . Fissato A T1 G, possiamo allora considerare lequazione dierenziale del primordine df = Pf (t) A . dt con la condizione iniziale f (0) = 1 elemento neutro di G. In base ai noti teoremi di esistenza ed unicit` a una soluzione f = fA (t) esiste ed ` e unica localmente. Consideriamo ora la funzione, per t R ssato t H (t) := fA (t )fA (t). Se deriviamo in t avremo: H (t) = fA (t )fA (t) = PfA (t ) (fA (t)) per come ` e denita P e quindi segue che dH (t) dfA (t )fA (t) dfA (t) = = PfA (t ) = PfA (t ) PfA (t) A = PH (t) A . dt dt dt Daltra parte la funzione t H (t) := fA (t + t) soddisfa la stessa equazione dierenziale: dH (t) dfA (t + t) dfA (t + t) = = = PfA (t +t) A = PH dt dt d(t + t)
(t) A
e vale la condizione iniziale comune H (0) = H (0) = fA (t ). Per il teorema di unicit` a concludiamo che H (t) = H (t) ossia, per ogni A T1 G vale la propriet` a di sottogruppo ad un parametro fA (t )fA (t) = fA (t + t)( = fA (t)fA (t ) ) purch e t, t , t + t appartengano al dominio della soluzione. La soluzione pu` o essere estesa in una soluzione massimale (che ` e sicuramente completa se G ` e compatto usando la propriet` a di sottogruppo ad un parametro). Denizione 6.2. (Sottogruppo ad un parametro.) Sia G un gruppo di Lie. Per ogni vettore A T1 G, la soluzione massimale dellequazione df = Pf (t) A , dt indicata con t exp(tA) ` e detta sottogruppo ad un parametro generato da A.
106
Nota 6.2. Si osservi che in particolare (exp(tA))1 = exp(tA) purch` e sia t che t appartengano al dominio della funzione. Consideriamo ora A T1 G ssato e la classe di applicazioni parametrizzate per t denito in un intorno di 0: Ft,A : G g exp(tA) g exp(tA) Dato che Ft,A (1) = 1, il dierenziale dFt,A |1 denisce unapplicazione da T1 G nello spazio tangente al punto exp(tA) 1 exp(tA) cio` e T1 G. Denizione 6.3. A T1 G, (Aggiunto e commutatore.) Sia G un gruppo di Lie e si ponga, per Ft,A : G (a) Il dierenziale dFt,A |1 indicato con Ad Ft,A : T1 G T1 G , e detto laggiunto di Ft,A . (b) Il commutatore ` e lapplicazione da T1 G T1 G in T1 G data da [A, B ] := per ogni coppia A, B T1 G. Proposizione 6.1. In riferimento alle denizioni date si vericano facilmente le seguenti propriet` a del commutatore, la linearit` a a sinistra: [aA + bB, C ] = a[A, C ] + b[B, C ] lantisimmetria: [A, B ] = [B, A] (questa implica che la linearit` a valga anche a destra) e lidentit` a di Jacobi: [A, [B, C ]] + [B, [C, A]] + [C, [A, B ]] = 0 dove A, B, C T1 G e a, b R sono arbitrari. Dimostrazione. Vedi [23] 2. Nota 6.3. Si noti che la linearit` a a sinistra e lanti simmetria implicano immediatamente la linearit` a a destra, per cui il commutatore ` e bilineare. d |t=0 (Ad Ft,A ) B . dt g exp(tA) g exp(tA) .
107
Denizione 6.4. (Algebre di Lie.) La struttura algebrica data da uno spazio vettoriale V con unapplicazione, detta commutatore, { , } : V V V che gode delle propriet` a di linearit` a a sinistra, antisimmetria e identit` a di Jacobi ` e detta algebra di Lie. Ulteriormente: (a) date due algebre di Lie (V, { , }) e (V , { , } ), un isomorsmo di spazi vettoriali : V V ` e detto isomorsmo di algebre di Lie se conserva la struttura di algebra di Lie, ossia soddisfa anche {(A), (B )} = ({A, B }) per ogni A, B V ; (b) se G ` e un gruppo di Lie, lalgebra di Lie costituita dallo spazio tangente T1 G insieme al commutatore [ , ] di denizione 6.3 ` e detta algebra di Lie del gruppo G. Un famoso teorema dovuto a Lie prova che: Teorema 6.1. (Teorema di Lie.) Se due gruppi di Lie G e G hanno algebre di Lie isomorfe allora esiste un dieomorsmo da un intorno dellidentit` a di G ad un intorno dellidentit` a di G che ` e isomorsmo di gruppo: tali gruppi di Lie sono detti localmente isomor. Inoltre per ogni algebra di Lie c` e un gruppo di Lie semplicemente connesso che ammette tale algebra di Lie come algebra di Lie del gruppo, tale gruppo ` e determinato a meno di isomorsmi di gruppi di Lie, cio` e di dieomorsmi che sono anche isomorsmi gruppali. Dimostrazione. Vedi [23] 2. Denizione 6.5. (Sottogruppo di Lie.) Se G ` e un gruppo di Lie e G G ` e una sottovariet` a embedded di G che ` e ancora gruppo rispetto alle operazioni di gruppo di G ristrette a G , allora G acquista naturalmente una struttura di gruppo di Lie indotta da quella di G e si dice sottogruppo di Lie di G. Commenti 6.1. ` immediato provare che lalgebra di Lie di G risulta essere una sottoalgebra di Lie di (1) E G, nel senso che T1 G ` e sottospazio vettoriale di T1 G e il commutatore su T1 G ` e la restrizione del commutatore di T1 G a T1 G . (2) Esiste un teorema molto potente (es. vedi [24]) che assicura che ogni sottogruppo chiuso K di un gruppo di Lie analitico G ` e un sottogruppo di Lie analitico di G. La dimostrazione richiede tecniche avanzate. In realt` a il teorema ha validit` a generale per gruppi di Lie con la nostra denizione: la richiesta di analiticit` a pu` o essere omessa a causa del teorema di Gleason, Montgomery e Zippin che assicura che ogni gruppo di Lie ` e anche un gruppo analitico di Lie rispetto ad una struttura dierenziabile analitica univocamente determinata. In virt` u dellultimo commento possiamo enunciare il seguente fondamentale teorema. Teorema 6.2. Se G G ` e sottogruppo chiuso del gruppo di Lie G, allora ` e anche sottogruppo di Lie di G. . Esercizi 6.1. 108
1. Se G ` e un gruppo di Lie e A1 , . . . An ` e una base nella sua algebra di Lie, essendo il commutatore bilineare sullalgebra a valori nellalgebra, deve essere rappresentato da un tensore
C T1 G T1 G T1 G
In componenti [Ai , Aj ] = Cij k Ak . Le componenti di T sono dette costanti di struttura del gruppo. Dimostrare che se due gruppi di Lie hanno le stesse costanti di struttura rispetto a due basi nelle rispettive algebre di Lie allora sono localmente isomor nel senso del teorema di Lie. Suggerimento: Provare che lapplicazione lineare che identica le due basi ` e un isomorsmo di algebre di Lie. 2. Sia G un gruppo di Lie e sia A1 , . . . , An una base della sua algebra di Lie. Si consideri lapplicazione denita su un intorno sucientemente piccolo dellorigine di Rn F : (x1 , . . . , xn ) e
n k=1
xn A n
Dimostrare che tale applicazione (1) ` e ben denita, cio` e lintorno sucientemente piccolo di cui sopra esiste davvero, e che (2) denisce un sistema di coordinate della struttura dierenziabile di G nellintorno dellidentit` a del gruppo. Tale sistema di coordinate viene detto sistema di coordinate di prima specie. Suggerimento: dai teoremi sulla dipendenza dai parametri dellequazione nelle soluzioni delle equazioni dierenziali del primordine su variet` a segue che la funzione detta ` e localmente ben denita. Inoltre, se e1 , . . . , en ` e la base canonica di Rn , dF0 : ei Ai per ogni i = 1, . . . , n, per cui dF0 : Rn T1 G ` e iniettiva (e quindi surgettiva essendo i due spazi delle stesse dimensioni). Il teorema della funzione implicita implica subito che F sia un dieomorsmo locale tra Rn e G a valori in un intorno di 1 G. 3. Sia G un gruppo di Lie e sia A1 , . . . , An una base della sua algebra di Lie. Si consideri lapplicazione denita su un intorno sucientemente piccolo dellorigine di Rn H : (x1 , . . . , xn ) ex
1A 1
ex
nA
Dimostrare che tale applicazione (1) ` e ben denita, cio` e lintorno sucientemente piccolo di cui sopra esiste davvero e che (2) denisce un sistema di coordinate della struttura dierenziabile di G nellintorno dellidentit` a del gruppo. Tale sistema di coordinate viene detto sistema di coordinate di seconda specie. i Suggerimento: Ognuno dei gruppi ad un parametro xi ex Ai ` e denito per xi in un intorno di 0, per cui c` e un intorno rettangolare dellorigine di Rn in cui la funzione ` e denita. Inoltre, se e1 , . . . , en ` e la base canonica di Rn , si prova facilmente che dH0 : ei Ai per costruzione per ogni i = 1, . . . , n, per cui dH0 : Rn T1 G ` e iniettiva (e quindi surgettiva essendo i due spazi delle stesse dimensioni). Il teorema della funzione implicita implica subito che H sia un dieomorsmo locale tra Rn e G a valori in un intorno di 1 G.
109
6.2
` importante precisare che questa Passiamo a specializzare la teoria a gruppi di Lie di matrici. E non ` e una forte restrizione in quanto si pu` o provare che ogni gruppo di Lie compatto ` e isomorfo ad un gruppo di Lie matriciale (per quelli non compatti il teorema non vale, un controesempio tipico ` e il rivestimento universale del gruppo SL(2, R)). Nel seguito GL(n, K) indicher` a il gruppo delle matrici n n non singolari (cio` e con determinante non nullo) sul campo K e M (n, K) indicher` a linsieme completo delle matrici n n sul campo K che ` e sempre R oppure C. 2 2 Le coordinate naturali di Kn , x1 , . . . , xn determinano una matrice di M (n, K) se si identicano le righe di questultima come gli n gruppi di coordinate contigui di n elementi. Dora in poi seguiremo questa convenzione. 2 Possiamo mettere su M (n, K) la topologia indotta dalla norma naturale di Kn che lo rende spazio normato completo. Possiamo riscrivere tale norma come, se A M (n, K):
n
||A|| :=
i,j =1
|Aij |2 .
Abbiamo ora bisogno di alcuni risultati riguardanti lestensione della funzione esponenziale a valori in M (n, C). Tali risultati sono enunciati in tre lemmi di seguito. Il primo ` e in realt` a pi` u generale. Lemma 6.1. Si consideri lapplicazione
M (n, K)
A ||A|| :=
i,j =1
|Aij |2 .
con K = C o R. Valgono le seguenti propriet` a. (1) Tale applicazione ` e una norma su M (n, K). (2) Se A, B M (n, K) allora ||AB || ||A||||B || . (3) Lo spazio M (n, C) dotato della norma detta sopra ` e completo. (4) Se K z A(z ) M (n, R) ` e una funzione arbitraria a valori in M (n, R), allora
z z0
lim A(z ) = A0
110
Dimostrazione. (1) Lapplicazione denita sopra non ` e altro che la norma di Kn scritta in modo dierente. (2) n n n ||AB ||2 = |Aij Bjk |2 = |Aij |2 |Bjk |2 |Aij |4 |Bpk |4 ,
i,j,k=1 i,j,k=1 i,k=1 j p
dove abbiamo applicato la disuguaglianza di Cauchy-Schwartz. Si tenga ora conto che banalmente (basta quadrare ambo membri): |Aij |4
j j
|Aij |2
||AB || =
i,j,k=1
|Aij Bjk |
i,k=1 j
|Aij |
2 p
|Bpk |
i,j =1
|Aij |
2 k,p=1
|Bpk |2
che signica ||AB ||2 ||A||2 ||B ||2 . ` un risultato generale che tutti Estraendo la radice quadrata ad ambo membri si ha la tesi. (3) E gli spazi vettoriali di dimensione nita dotati di norma sono completi rispetto alla topologia indotta dalla norma (vedi [25]). (4) Si tratta della ben nota propriet` a (dai corsi elementari di analisi) di funzioni da K a Kp tenendo conto che la norma denita ` e quella di Kp con p = n2 . 2 Nota 6.4. Linsieme delle matrici complesse n n unitamente alla norma denita sopra per la completezza di M (n, K) deniscono quella che si chiama unalgebra di Banach. Lemma 6.2. Se A M (n, C) e z C, la serie
zk
k=0
Ak k!
converge assolutamente (rispetto a alla norma di M (n, C)) ed uniformemente nella topologia di M (n, C) in ogni disco |z | R < + e pu` o essere derivata sotto il segno di serie in z innite volte. In particolare: (1) la funzione
z ezA :=
k=0
zk
Ak k!
(6.1)
` e ben denita e innitamente dierenziabile su C; (2) per ogni z C vale d zA e = AezA = ezA A , dz 111 (6.2)
(3) per ogni coppia z, z C vale ezA+z A = ezA ez A = ez A ezA . Dimostrazione. La dimostrazione si basa sulla validit` a degli analoghi teoremi delle serie di funzioni complesse a valori complessi che si estendono banalmente per serie di funzioni da C a valori in spazi di Banach. In particolare vale il teorema di Weierstrass che assicura che se una serie ` e dominata da una serie di termini numerici positivi allora si ha la convergenza assoluta e uniforme. Nel nostro caso, se |z | R, per il lemma 6.1 zk e la serie di termini positivi Ak k! |z |k ||A||k ||A||k Rk k! k! ||A||k k! (6.3)
Rk
k=0
converge (a exp(R||A||)). (1) Similmente, la serie delle derivate di ordine p converge uniformemente in |z | R perch e dominata dalla serie convergente di termini positivi
Rk ||A||p
k=0
questo implica che per ogni intero p e per ogni coppia i, j = 1, . . . , n la serie di funzioni a valori in C dp k (Ak )ij z dz p k! k=0 converge assolutamente ed uniformemente. Usando iterativamente un noto teorema di analisi si trova allora che, per ogni intero q e per ogni coppia i, j = 1, . . . , n esiste la derivata q esima di (exp(zA))ij e vale dq dq k (Ak )ij (exp( zA )) = z . ij q dz q dz k ! k=0 In base alla propriet` a (4) del lemma 4.1, esiste la derivata q esima di exp(zA) nella norma || || e vale dq ezA dq k (Ak ) = z . dz q dz q k! k=0 In particolare la somma della serie pu` o essere derivata sotto il segno di somma innite volte. Passiamo a (2) Semplicemente derivando sotto il segno di somma si ha
d zA Ak1 Ak1 e = Az k1 = z k 1 A dz ( k 1)! ( k 1)! k=1 k=1
112
Ridenendo k = p 1 e usando il lemma 4.1 da cui le propriet` a ||A(exp(zA) Sn )|| ||A||||(exp(zA) Sn )|| 0 e ||(exp(zA) Sn )A|| ||(exp(zA) Sn )||||A|| 0 dove Sn ` e la ridotta della serie troncata allordine n, si ha p p p A A A A :, Az p =A = zp zp p ! p ! p! p=0 p=0 p=0 che ` e la tesi. Per concludere la prova di (3) ` e identica a quella che si ha per la funzione esponenziale a valori numerici complessi, tenendo conto del fatto che (zA)(z A) = (z A)(zA) che viene usato in un passaggio (vedi per esempio le prime pagine di [25]). 2 Nota 6.5. La propriet` a (3) si pu` o rinforzare, usando la stessa dimostrazione, in eA+B = eA eB = eB eA sotto lipotesi che AB = BA . In assenza di tale ipotesi la propriet` a enunciata ` e generalmente falsa. Lemma 6.3. Se A M (n, C) allora, per ogni t C det etA = ettr A , in particolare Dimostrazione. Si consideri lapplicazione C t det etA . det eA = etr A .
Vogliamo calcolarne la derivata per t arbitrario. Ci interessa cio` e dete(t+h)A detetA det(etA ehA ) detetA detehA 1 = lim = detetA lim h0 h0 h0 h h h lim purch e lultimo limite esista. Vale ehA = I + hA + ho(h) , 113
dove o(h) 0 se h 0 nella topologia metrica di Cn per cui det e(t+h)A detetA det(I + hA + ho(h)) 1 = detetA lim . h0 h0 h h lim Ricordiamo che detB = per cui si ha subito che
n i1 ...in
B1i1 Bnin ,
det(I + hA + ho(h)) = 1 + h
i=1
Aii + h0(h) .
Inserendo sopra troviamo che: ddetetA = detetA trA . dt Ci` o prova anche che la funzione considerata ` e innitamente dierenziabile. Quindi la funzione innitamente dierenziabile fA : C t det etA soddisfa lequazione dierenziale dfA (t) = (tr A)fA (t) . dt La funzione innitamente dierenziabile gA : C t ettr A soddisfa banalmente la stessa equazione dierenziale dgA (t) = (tr A)gA (t) . dt Entrambe le funzioni soddisfano la condizione iniziale fA (0) = gA (0) = 1, di conseguenza per il teorema di unicit` a delle soluzioni massimali delle equazioni dierenziali del primordine, le due funzioni coincidono per ogni t C e deve essere: detetA = ettr A . Questo implica la tesi per t = 1. 2 Proposizione 6.2. (Il gruppo di Lie GL(n, R)). Il gruppo GL(n, R) delle matrici reali 2 n n invertibili ` e un gruppo di Lie con la struttura di variet` a dierenziabile indotta da Rn . Valgono ulteriormente le seguenti propriet` a. (1) Lalgebra di Lie di GL(n, R) ` e data dallinsieme di matrici reali n n, M (n, R) ed il commutatore ` e denito come [A, B ] = AB BA , per ogni coppia A, B M (n, R). (2) I sottogruppi ad un parametro di GL(n, Rn ) sono completi (cio` e deniti su tutto R nel parametro) ed hanno la forma R t etA 114
per ogni A M (n, R), dove lesponenziale ` e quello denito nel lemma 6.2 Dimostrazione. Pensiamo le matrici A reali n n come punti di Rn le cui coordinate naturali individuano, se lette di seguito in gruppi contigui di n elementi (le n righe di A). Per quanto riguarda il fatto che GL(n, R) sia un gruppo di Lie, ` e suciente dimostrare due cose: (1) GL(n, R) ` e una variet` a dierenziabile; (2) le operazioni di composizione e di calcolo dellinversa sono dierenziabili rispetto alla strut2 tura dierenziabile di Rn . 2 La funzione determinante da Rn in R ` e indubbiamente dierenziabile in quanto ` e un polinomio 2 nelle coordinate globali di Rn . La controimmagine di R \ {0} secondo tale funzione ` e chiaramente un insieme aperto essendo la funzione continua. Possiamo assegnare a tale insieme la 2 struttura di variet` a dierenziabile restringendo la carta globale naturale di Rn a tale insieme. Ci` o denisce una struttura dierenziabile su GL(n, R) che altro non ` e che linsieme dei punti 2 n di R sui quali la funzione determinante ` e non nulla. La seconda propriet` a` e ovvia per quanto riguarda la moltiplicazione, per il calcolo della funzione inversa lo ` e anche usando, nellinsieme aperto che denisce la variet` a GL(n, R), la regola di Kramer per il calcolo dellinversa, in quanto 2 le componenti (coordinate di Rn ) della matrice inversa di A GL(n, R), sono funzioni razionali con denominatori mai nulli nelle coordinate che deniscono la matrice A. Veniamo alla seconda parte. Dimostriamo (1) e (2) insieme. Se A M (n, R), si consideri la funzione R t etA . In base al lemma 6.3 tale funzione ammette valori solamente in GL(n, R) perch e det etA = ettr A > 0 per ogni A M (n, R). Usando (2) di lemma 4.2 otteniamo d tA e = AetA = etA A . dt Per t = 0 si riottiene la matrice A che dunque ` e in T1 GL(n, R) perch` e e0A = 1. Abbiamo provato che M (n, R) T1 GL(n, R). Dato che deve essere per costruzione dim T1 GL(n, R) n2 e che dim M (n, R) = n2 allora M (n, R) = T1 GL(n, R). Se A T1 GL(n, R) = M (n, R), lequazione che denisce il sottogruppo ad un parametro generato da A si scrive banalmente (specializzando la denizione 6.1 e tenendo conto che il prodotto del gruppo ` e quello matriciale ordinario): dfA (t) = fA (t)A . dt La funzione R t etA denita nel lemma 6.2 soddisfa banalmente tale equazione dierenziale di sopra a causa di (2) del suddetto lemma. Per lunicit` a della soluzione questa ` e lunica soluzione ed ` e dunque la forma esplicita del sottogruppo ad un parametro generato da A. Si noti che per costruzione la soluzione ` e completa. Applicando la denizione in (b) di denizione 6.3 si ha immediatamente che il commutatore dellalgebra di Lie di GL(n, R) ` e [A, B ] = per ogni coppia A, B M (n, R). 2
d |t=0 etA BetA = AB BA dt
2
115
Possiamo allora dare la seguente denizione. Denizione 6.6. (Gruppo di Lie matriciale reale n n). Un gruppo di Lie matriciale reale n n ` e un sottogruppo di Lie di GL(n, R). Abbiamo le seguenti propriet` a elementari dei gruppi di Lie matriciali di immediata verica. Proposizione 6.3. (Propriet` a dei gruppi di Lie matriciali). Sia G un gruppo di Lie matriciale reale n n allora valgono le seguenti propriet` a. 2 (1) G ` e un gruppo di Lie con la struttura di variet` a dierenziabile indotta da Rn . (2) Lalgebra di Lie di G ` e una sotto algebra di M (n, R) dotata del commutatore [A, B ] = AB BA . (3) I sottogruppi ad un parametro di G sono completi ed hanno la forma R t etA
per ogni A T1 G, dove lesponenziale ` e quello denito nel lemma 6.2 ` tutto immediata conseguenza della proposizione 6.2 2 Dimostrazione E
6.3
Esaminiamo un gruppo di Lie molto importante, il gruppo delle rotazioni n-dimensionali O(n): O(n) := {R M (n, R) | RRt = I } . Abbiamo il seguente teorema. Teorema 6.3. matrici: (Propriet` a elementari del gruppo di Lie O(n).) si consideri linsieme di O(n) := {R M (n, R) | RRt = I } . Allora valgono le seguenti propriet` a. (1) O(n) ` e un gruppo di Lie matriciale reale n n chiuso rispetto alla trasposizione di matrici ed ` e detto gruppo delle rotazioni n-dimensionali. (2) Lalgebra di Lie di O(n), indicata con o(n), ` e data dallo spazio vettoriale delle matrici n n reali antisimmetriche. Tale spazio ha dimensione n(n 1)/2. (3) O(n) ` e compatto.
116
Dimostrazione. (1) Prima di tutto mostriamo che O(n) ` e un gruppo ed ` e chiuso rispetto alla trasposizione. I O(n) banalmente, se R, R O(n) allora (RR )(RR )t = RR R t Rt = RIRt = RRt = I , ` suciente provare, per concludere che O(n) ` per cui O(n) ` e chiuso rispetto al prodotto.E e un gruppo, che esso ` e chiuso rispetto al calcolo dellinversa. Il fatto che RRt = I implica che detR detRt = 1 ossia (detR)2 = 1 da cui detR = 1, ma in ogni caso detR = 0 per cui esiste la matrice inversa di ogni R O(n) e coincide con la trasposta di R. Se proviamo che R1 O(n) abbiamo provato anche la chiusura rispetto alla trasposizione. Se R O(n), dato che linversa destra coincide con quella sinistra si ha R1 R = I , trasponendo Rt (R1 )t = I ma essendo Rt = R1 , abbiamo che R1 (R1 )t = I ossia R1 O(n). Con ci` o abbiamo provato che O(n) ` e un gruppo rispetto al prodotto di matrici, per cui ` e anche sottogruppo di GL(n, R). Per concludere il punto (1) dato che O(n) GL(n, R), ` e suciente provare che O(n) 2 ` e una sottovariet` a embedded di Rn . Ricordiamo un ben noto teorema detto teorema dei valori regolari [27, 2]: si considerino due variet` a dierenziabili M, N con dimensione rispettivamente m, n con m > n, e una funzione dierenziabile f : M N . Se p N ` e tale che per tutti i punti x P := f 1 ({p}) dfx ` e suriettiva (cio` e la matrice jacobiana associata ha rango n) allora P M ` e una sottovariet` a embedded di M di dimensione m n. Notiamo che la richiesta che dfx sia suriettiva ` e equivalente alla richiesta che: il nucleo di dfx abbia dimensione m n. 2 Consideriamo allora la denizione di O(n). In coordinate di Rn
n
j =1
ik
xij xkj = 0 .
Queste equazioni non sono tutte indipendenti: se scambio i e k riottengo le stesse equazioni. Le equazioni indipendenti sono per esempio quelle corrispondenti alla matrice triangolare superiore di una matrice simmetrica n n, cio` e le equazioni di sopra con la restrizione i k . Quindi sono n(n + 1)/2. Deniamo allora una funzione da f : Rn Rn(n+1)/2 con componenti f ik (x11 , x12 , . . . , xnn ) = ik
j =1 n
2
xij xkj
dove i k . f ` e chiaramente dierenziabile, mostriamo che i punti R O(n) = f 1 ({0}), dove 0` e il vettore nullo di Rn(n+1)/2 , sono tali che il nucleo di dfR ha dimensione n2 n(n + 1)/2(= n(n 1)/2). In base al teorema dei valori regolari ci` o mostra che O(n) ` e una sottovariet` a 2 embedded di Rn (e quindi GL(n, R) che contiene O(n) ed ha la struttura dierenziabile indotta 2 da Rn ) di dimensione n(n 1)/2. Cominciamo a provare che il nucleo di dfI ha dimensione 117
n(n1)/2. Per calcolare la dimensione del nucleo di dfI consideriamo tutte le curve dierenziabili R = R(u) che soddisfano R(u)R(u)t = I e R(0) = I e calcoliamo la dimensione dello spazio generato dai vettori tangenti nel punto I a tali curve. Per costruzione tale spazio ` e il nucleo di t dfI . Da R(u)R(u) = I otteniamo, se R denota il vettore tangente in u = 0 cio` e in I : +R t = 0 R ossia = R t . R Le matrici trovate sono antisimmetriche reali n n. Daltra parte se A ` e una matrice antisimmetrica reale n n, la curva R(u) := euA , che ammette A come vettore tangente in I , soddisfa R(u)R(u)t = I : direttamente dalla denizione di esponenziale euA (euA )t = euA euA = euA euA = e(uu)A = I Dunque il nucleo di dfI ` e dato dallo spazio vettoriale reale delle matrici reali n n antisimme` facile provare che tale spazio ha dimensione n(n 1)/2. triche. E Passiamo ora a considerare il generico punto g O(n). Come sopra consideriamo tutte le curve dierenziabili R = R(u) che soddisfano R(u)t R(u) = I (che equivale a R(u)R(u)t = I ) e R(0) = g e calcoliamo la dimensione dello spazio generato dai vettori tangenti nel punto I a tali denota curve. Per costruzione tale spazio ` e il nucleo di dfg . Da R(u)t R(u) = I otteniamo, se R il vettore tangente in u = 0 cio` e in g : tg + gtR =0 R ossia, essendo g t = g 1 , = (g 1 R ) . g 1 R appartiene al nucleo di dfg se e solo se Questo signica che R = gA R tg ` tg + gtR = 0. Cio` dove A = R e antisimmetrica reale per R e A appartiene al nucleo di dfI . Lapplicazione generata da g ` e per costruzione Pg e quindi ` e un isomorsmo di spazi vettoriali essendo il dierenziale del dieomorsmo Pg : GL(n, R) GL(n, R). Quindi il nucleo di dfg ha la stessa dimensione di quello di dfI e ci` o prova che siamo nelle ipotesi del teorema dei valori regolari: O(n) ` e una sottovariet` a embedded di GL(n, R). (2) In realt` a la dimostrazione ` e stata data sopra in quanto i vettori tangenti a I in O(n) si ottengono come i vettori tangenti per u = 0 delle curve R = R(u) che soddisfano R(u)R(u)t = I e R(0) = I . Abbiamo visto sopra che tale spazio coincide con quello delle matrici antisimmetriche reali n n che ha dimensione n(n 2)/2. 2 ` suciente provare che O(n) ` (3) E e un sottoinsieme chiuso e limitato di Rn in quanto, in Rk , i chiusi limitati sono compatti (e viceversa). Per quanto riguarda la chiusura, ` e chiaro che O(n) 2 contiene i suoi punti di accumulazione: se Ak O(n) e Ak A Rn per k allora 118
t
t
||R||2 =
i=1 j =1
Rij Rij
=
i=1
ii = n .
2 Teorema 6.4. (Struttura topologica di O(3) rispetto alla connessione.) Il gruppo di Lie matriciale O(3) ha due componenti connesse date rispettivamente da: il gruppo di Lie matriciale compatto (e connesso) SO(3) := {R O(3) | det R = 1} detto gruppo speciale delle rotazioni tridimensionali e linsieme compatto (che non ` e sottogruppo) P SO(3) := {P R O(3) | R SO(3)} dove P := I ` e linversione di parit` a. Dimostrazione. Si consideri R O(3). Allora det R = 1 direttamente dalla denizione di ` immediato provare che il sottoinsieme delle matrici di O(3) con determinante 1 forma O(3). E un sottogruppo di O(3) che indicheremo con SO(3). Indichiamo con P SO(3) linsieme conte` chiaro che tali due insiemi sono disgiunti nente le matrici con determinante 1, O(3) \ SO(3). E e la loro unione ` e O(3). Deniamo P := I , vale P P SO(3). Se R O(3) pu` o solo essere R SO(3) oppure R P SO(3). Valendo P P = I segue subito che P R, R P SO(3) se e solo se rispettivamente R, P R SO(3). Di conseguenza, P SO(3) = {P R O(3) | R SO(3)}. Mostreremo ora che SO(3) ` e aperto, connesso e compatto. (Le stesse propriet` a varranno anche per P SO(3) perch` e lazione di P ` e un dieomorsmo. Tuttavia I P SO(3) per cui questultimo non ` e sottogruppo.) Consideriamo R SO(3). Dato che R ` e reale e che il polinomio caratteristico associato ` e di terzo grado, dal teorema fondamentale dellalgebra segue che R dovr` a avere almeno un autovalore reale che corrisponde ad una radice reale di tale polinomio (le altre due o sono reali o sono complesse coniugate). La matrice R pu` o sempre pensarsi come matrice unitaria in C3 in tal caso ` e noto che (1) ` e diagonalizzabile, (2) gli autovalori sono della forma ei per qualche R. Riassumendo: uno dei tre autovalori 1 deve essere reale con modulo 1 e gli altri due devono essere anche essi reali oppure complessi coniugati ed in ogni caso tutti con modulo 1. Per cui pu` o essere solo 1 = +1 o 1 = 1. Nel secondo caso, al ne di avere determinante, 1 cio` e prodotto degli autovalori uguale a 1, anche gli altri due autovalori devono essere reali e, dovendo essere della forma ei almeno uno dei due deve essere 1. In denitiva: ogni R SO(3) ammette sempre lautovalore 1. Sia e1 un autovettore normalizzato associato allautovalore 1. Completiamo e1 a base ortonormale di R3 : e1 , e2 , e3 . La trasformazione dalla base canonica a quella ottenuta sar` a rappresentata 119
da una matrice L di O(3) perch e entrambe le basi sono ortonormali. Quindi avremo che esiste L O(3) tale che 1 0 0 LRLt = R := e a b . f c d
(6.4)
La matrice a secondo membro sar` a necessariamente in O(3) perch` e composizione di matrici di O(3). Il calcolo del determinante con la regola di Binet mostra che R SO(3) implica R SO(3). Imponendo la condizione di appartenenza a SO(3) si vede subito che 1 0 0 R = 0 a b . 0 c d
(6.5)
dove a2 + b2 = c2 + d2 = 1, ac + bd = 0 e ad bc = 1. Si conclude facilmente che le matrice R deve avere la forma 1 0 0 R := 0 cos sin . 0 sin cos dove R. Abbiamo provato che per ogni R SO(3) esiste L O(3) tale che R = Lt RR L per qualche R R. Se lasciamo variare da 0 a R abbiamo una curva continua Lt R L che congiunge I a R. Quindi SO(3) ` e connesso per archi continui. Di conseguenza ` e connesso. Si osservi che SO(3) ` e anche un sottoinsieme aperto (nella topologia relativa) di O(3) essendo lintersezione tra O(3) e la controimmagine di (0, +) della funzione continua che calcola il determinante su GL(n, R). Come gi` a detto, dato che R P R ` e un dieomorsmo di O(3), manda aperti connessi in aperti connessi per cui essendo SO(3) aperto e connesso, P SO(3) ` e aperto e connesso. Essendo i due insiemi connessi disgiunti con unione pari a O(3), essi costituiscono le componenti connesse di O(3). Per costruzione essendo SO(3) una componente connessa di O(3) ` e anche banalmente una sottovariet` a di O(3) nella struttura dierenziabile indotta e quindi SO(3) ` e un sottogruppo di Lie di O(3) e quindi un gruppo di Lie matriciale. Dato che le componenti connesse sono banalmente aperte e chiuse, SO(3) ` e chiuso nel compatto O(3) per cui ` e compatto. Dato che I SO(3) segue anche che lalgebra di Lie di SO(3) coincide con quella di O(3). 2 Corollario. Vale so(3) = o(3) dove so(3) := T1 SO(3).
(6.6)
120
Dimostrazione. P SO(3) non ` e un sottogruppo di O(3) perch` e non contiene lidentit` a. Solo la componente connessa SO(3) contiene lidentit` a e ci` o implica immediatamente che T1 SO(3) = T1 O(3) . 2
6.4
Introduciamo una base particolare di so(3) data dalle matrici (Si )jk = dove
ijk
(6.7)
(6.8)
(6.9)
Tali matrici sono antisimmetriche e quindi appartengono a so(3), inoltre ` e immediato provare che sono linearmente indipendenti per cui sono una base di so(3). Le costanti di struttura assumono una forma semplice in questa base, come si prova per computo diretto [Si , Sj ] =
ij k
Sk ,
(6.10)
dove ij k = ijk sono le componenti della solita densit` a tensoriale di Ricci-Levi-Civita. Vogliamo inne provare un teorema di rappresentazione delle matrici di SO(3). Abbiamo bisogno di alcuni risultati preliminari. Lemma 6.4. Per ogni R SO(3) vale lidentit` a
3
RSi Rt =
j =1
t Rij Sj .
121
pqr
dove gli indici sono stati abbassati con la metrica ij e la matrice R ` e arbitaria. Se R SO(3), la relazione di sopra diventa, cambiando anche i segni ad ambo membri: ossia Rpi (RSi Rt )qr = (Sp )qr
i ijk
pqr
2 Il lemma appena provato permette di concludere con un teorema di rappresentazione di SO(3). Teorema 6.5. (Rappresentazione di SO(3).) R SO(3) se e solo se esistono un versore n S2 e un numero R tale che R = enS dove n S :=
i=1 3
ni Si
essendo le matrici Si T1 SO(3) date da (Si )jk = Dimostrazione. Come provato nella dimostrazione del teorema 6.4, se R SO(3) allora esiste L O(3) tale che R = LR Lt dove R ` e data in (6.6). Possiamo sempre cambiare, se necessario, ` facile provare L in P L = L al ne di avere L SO(3) senza alterare il risultato di sopra. E che R = eS1 122
ijk
Infatti calcolando la derivata in del primo membro tramite la (6.6), si trova facilmente che dR = S1 R . d Daltra parte vale anche deS1 = S1 eS1 . d per cui le due funzioni soddisfano la stessa equazione dierenziale, ma anche la stessa condizione iniziale: R0 = e0S1 = I , per cui coincidono. Ne consegue che (dove usiamo la notazione n S := R = LeS1 Lt = Lee1 S L1 . Usando lo sviluppo dellesponenziale si ha 1 1 Lee1 S L1 = L(I +e1 S + e1 Se1 S + )L1 = I +e1 LSL1 + e1 LSL1 e1 LSL1 + 2 2 dove abbiamo inserito dei fattori I = L1 L nei punti opportuni, per cui Lee1 S L1 = ee1 LSL Usando il lemma 4.4, con ovvie notazioni n LSLt = e1 (Lt S ) = (Le1 ) S , In denitiva, tenendo conto che n ` e un versore di S2 se e solo se n = Ae1 per qualche A SO(3), abbiamo provato che, se R SO(3) allora per qualche R e n S2 , R = enS . Viceversa se scegliamo n S2 e R e deniamo: R := enS , allora, ricordando che le matrici Si sono antisimmetriche: RRt = enS (enS )t = enS enS = enS enS = e()nS = I . Per cui R O(3). Daltra parte detR = entrS = e0 = 1, per cui R SO(3). 2 Si ha ovviamente il seguente corollario.
t 1
in
i S ): i
= ee1 LSL .
123
Corollario. R P SO(3) se e solo se esistono un versore n S2 e un numero R tale che R = enS . Dimostrazione. Dato che P P = I , vale R P SO(3) se e solo se P R SO(3), da cui segue immediatamente la prova della tesi essendo P = I . 2 Commenti 6.2. (1) Ci si pu` o chiedere se per una R SO(3) la coppia , n che rappresenta R tramite il teorema ` chiaro che se R la risposta ` 6.5 sia unica. E e negativa. Se restringiamo a [0, 2 ] lintervallo di variazione di la risposta ` e ancora negativa perch e una rotazione di riferita al versore n ` e la stessa cosa che una rotazione di 2 riferita al versore n (bisogna associare le rotazioni ai versori secondo la stessa orientazione, per es la legge della mano destra). Possiamo allora scegliere il range di in [0, ]. In tal caso le uniche ambiguit` a sono la descrizione di I che corrisponde a = 0 e qualunque n S2 e le rotazioni di rispetto a n e n che sono in realt` a la stessa rotazione. (2) Quanto detto sopra consente una descrizione della topologia di SO(3) pi` u approfondita. I 3 punti di SO(3) li possiamo infatti determinare dai vettori n R con [0, ] e n S2 . In tal modo i punti di SO(3) corrispondono ai punti di una palla chiusa in R3 di raggio tale che, per ogni diametro, i punti diametralmente opposti sulla supercie della palla sono identicati. Tali punti corrispondo alle rotazioni di attorno a n che sono, come detto la stessa cosa. Possiamo mettere una topologia su tale spazio di punti P , semplicemente inducendola da quella di SO(3) mappando le basi di intorni di SO(3) in P . Ogni cammino (continuo) chiuso in P che non interseca il bordo della palla, ` e omotopo ad un punto in P . La stessa cosa accade per cammini chiusi che arrivano no al bordo della palla, eccetto il caso di cammini che connettono due punti diametralmente opposti posti sulla supercie della palla: questi cammini apparentemente aperti, sono chiusi per la struttura dello spazio topologico e non sono omotopi a punti: lo spazio non ` e semplicemente connesso. Si osservi che ognuno di tali cammini che connette due punti diametralmente opposti sulla supercie della palla, purch e si avvolga una volta sola, ` e banalmente omotopo al cammino corrispondente dato dallo stesso diametro che connette i due punti. Due cammini del tipo detto dati da due diametri dierenti, sono sempre tra di loro omotopi ruotando un diametro verso laltro tenendo sso il centro della palla. In denitiva ci sono solo cammini omotopi a punti e cammini, che non lo sono, ma sono omotopi tra di loro a patto che si avvolgano una volta sola. Per cammini che si avvolgono pi` u volte la situazione ` e la stessa di cammini in R3 privato di un retta, per cammini che si avvolgono pi` u volte attorno a tale retta. Ci` o porta a intuire che 1 (SO(3)) = Z. In eetti tale fatto si pu` o rigorosamente provare. Esercizi 6.2. 1. Si consideri il gruppo commutativo delle traslazioni su Rn dato da Rn stesso: se t Rn Lt : Rn x x + t Rn . 124
Mostrare che tale gruppo ` e un gruppo di Lie matriciale sottogruppo di GL(n + 1, R) con algebra di Lie identicabile con Rn stesso. Suggerimento. Considerare Rn come il piano in Rn+1 di equazione {(x1 , . . . , xn+1 ) Rn+1 | xn+1 = 1} . Quindi considerare la classe di matrici
I t 0 1
(6.11)
2. Mostrare che il gruppo di Galileo ` e un gruppo di Lie matriciale sottogruppo di GL(5, R). Suggerimento. Considerare la classe di matrici R,V0 C ; (6.12) 0 1 dove C R4 ` e il vettore colonna con C t = (c, X0 ) e 1 0 ; R,V0 V0 R
(6.13)
dove V0 R3 e R O(3). 3. Mostrare che lalgebra di Lie del gruppo di Galileo ` e isomorfa alla somma diretta so(3)R7 come spazio vettoriale ma non lo e come algebra di Lie (cio` e il commutatore non soddisfa [(A, t), (A , t )] = ([A, A ], 0) , dove A, A so(3) e t R7 ).
125
Capitolo 7
7.1
Similmente a quanto provato per O(n) dimostriamo che O(1, 3) ` e un gruppo di Lie matriciale. Teorema 7.1. (Propriet` a elementari del gruppo di Lie O(1, 3).) Il gruppo di Lorentz O(1, 3) := { M (4, R) | t = } , dove
1 0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
(7.1)
soddisfa le seguenti propriet` a. (1) O(1, 3) ` e un gruppo di Lie matriciale reale 4 4 chiuso rispetto alla trasposizione di matrici. (2) Lalgebra di Lie di O(1, 3), indicata con o(1, 3) ` e data dallo spazio vettoriale a 6 dimensioni delle matrici L, 4 4 reali che soddisfano la propriet` a Lt = L . 126 (7.2)
(3) O(1, 3) ` e chiuso in R16 ma non ` e compatto. Dimostrazione. (1) Il fatto che O(1, 3) ` e un sottogruppo di GL(4, R) ed ` e chiuso rispetto alla trasposizione ` e stato provato nel teorema 2.2 Vogliamo provare che O(1, 3) ` e una sottovariet` a embedded di R16 usando la stessa procedura seguita nel teorema 6.3 per O(n). Consideriamo allora la denizione di O(1, 3). In coordinate di R16
n
ik
j,r=1
xij jr xkr = 0 .
Queste equazioni non sono tutte indipendenti: se si scambiano i e k si riottengono le stesse equazioni. Le equazioni indipendenti sono per esempio quelle corrispondenti alla matrice triangolare superiore di una matrice simmetrica 4 4, cio` e le equazioni di sopra con la restrizione i k . Quindi sono 10. Deniamo allora una funzione da f : R16 R10 con componenti (se rs := rs )
n
xij jr xkr
dove i k . f ` e chiaramente dierenziabile, mostriamo che i punti O(1, 3) = f 1 ({0}), dove 0` e il vettore nullo di R10 , sono tali che il nucleo di df ha dimensione 16 10 = 6. In base al teorema dei valori regolari ci` o mostra che O(1, 3) ` e una sottovariet` a embedded di R16 (e quindi di GL(4, R) che contiene O(1, 3) ed ha la struttura dierenziabile indotta da R16 ) di dimensione 6. Cominciamo a provare che il nucleo di dfI ha dimensione 6. Per calcolare la dimensione del nucleo di dfI consideriamo tutte le curve dierenziabili = (u) che soddisfano (u) (u)t = e (0) = I e calcoliamo la dimensione dello spazio generato dai vettori tangenti nel punto I a tali curve. Per costruzione tale spazio ` e il nucleo di dfI . Da (u) (u)t = otteniamo, se denota il vettore tangente in u = 0 cio` e in I : + t = 0 ossia, ricordando che = t = 1 , = t . Le matrici trovate hanno la struttura:
ct A
L=
(7.3)
127
dove A ` e una matrice antisimmetrica reale 3 3 e c un vettore colonna di R3 . Daltra parte se L ha la struttura di sopra, la curva (u) := euL , che ammette L come vettore tangente in I , soddisfa (u) (u)t = : direttamente dalla denizione di esponenziale e tenendo conto che = I , t t t euL (euL )t = euL euL = euL euL = euL euL = euL euL = Dunque il nucleo di dfI ` e dato dallo spazio vettoriale reale delle matrici reali 4 4 che soddisfano ` (7.3). E facile provare che tale spazio ha dimensione 6: la matrice antisimmetrica A dipende da 3 elementi, mentre il vettore c ha 3 componenti. Passiamo ora a considerare il generico punto g O(1, 3). Come sopra consideriamo tutte le curve dierenziabili = (u) che soddisfano t (u) (u) = (che equivale a (u) (u)t = per la chiusura del gruppo rispetto al calcolo della trasposta) e (0) = g e calcoliamo la dimensione dello spazio generato dai vettori tangenti nel punto g a tali curve. Per costruzione tale spazio ` e denota il vettore tangente in u = 0 cio` il nucleo di dfg . Da t (u) (u) = otteniamo, se e in g: t g + g t =0. Essendo = 1 e valendo g t = g 1 da g O(1, 3), lidentit` a di sopra si riscrive con qualche passaggio: = (g 1 ) t . g 1 appartiene al nucleo di dfg se e solo se Questo signica che R = gL dove L soddisfa (7.3). Cio` e L appartiene al nucleo di dfI . Lapplicazione generata da g ` e per costruzione Pg e quindi ` e un isomorsmo di spazi vettoriali essendo il dierenziale del dieomorsmo Pg : GL(4, R) GL(4, R). Quindi il nucleo di dfg ha la stessa dimensione di quello di dfI e ci` o prova che siamo nelle ipotesi del teorema dei valori regolari: O(1, 3) ` e una sottovariet` a embedded di GL(4, R). (2) In realt` a la dimostrazione ` e stata data sopra in quanto i vettori tangenti a I in O(1, 3) si ottengono come i vettori tangenti per u = 0 delle curve = (u) che soddisfano (u) (u)t = e (0) = I . Abbiamo visto sopra che tale spazio coincide con quello delle matrici reali 4 4 che ha dimensione 6 denito da (7.2). (3) Per la chiusura si procede esattamente come per O(3), per la non compattezza ` e suciente provare che O(1, 3) non ` e limitato in R16 in quanto, in Rk , i chiusi limitati sono tutti e soli compatti e viceversa. Si consideri a tal ne la matrice
() =
` e immediato vericare che (1) () O(1, 3) per ogni R, ma anche (2) ||()||2 = 2 + 2 cosh2 + 2 sinh2 + per +. 2
128
Passiamo a studiare O(1, 3). Una base di matrici di tale spazio vettoriale ` e data, come si prova facilmente, dalle seguenti 6 matrici. le prime tre, S1 , S2 e S3 sono denita da, per i = 1, 2, 3
Si =
0 0 0 0 0 , 0 Si 0
(7.4)
dove S1 , S2 e S3 sono denite in (6.7), (6.8), (6.9) rispettivamente. Le rimanenti 3 matrici dette boosts sono date da
K1 =
0 1 0 0 0 0 1 0 0 0 0 1
1 0 0 0 0 0 0 0 0 0 0 0
0 0 0 0 1 0 0 0 0 0 0 0
0 0 0 0 0 0 0 0 1 0 0 0
(7.5)
K2 =
(7.6)
K3 =
(7.7)
Se poniamo ij k := ijk , si verica facilmente per computo diretto che valgono le seguenti relazioni di commutazione (dove c` e la regola di somma sugli indici ripetuti): [Si , Sj ] = [Si , Kj ] =
ij k ij k
Sk ,
k
[Ki , Kj ] =
ij
Sk ,
Kk .
Tali relazioni sono spesso chiamate impropriamente, le relazioni di commutazione del gruppo di Lorentz. Commenti 7.1. (1) Se deniamo
R =
1 0 0 0 0 ; 0 R 0 129
(7.11)
dove R O(3), lapplicazione O(3) R R O(1, 3) ` e una rappresentazione fedele (cio` e iniettiva) di O(3) data in termini di matrici di Lorentz. (2) Il teorema 6.5 si estende banalmente alle matrici R , con R SO(3), nellasserto che se R SO(3) allora R = emS , (7.12)
per qualche scelta di R e m S2 , e viceversa ogni matrice nel secondo membro di (7.12) ` e della forma (7.11) dove R = emS .
Lultima delle relazioni di commutazione del gruppo di Lorentz ha un importante corollario che ` e il corrispondente del lemma 6.4 e che ci servir` a tra poco. Al solito se n S2 e A = (A1 , A2 , A3 ) ` e un vettore di matrici usiamo la notazione (dove ` e sottintesa la somma sugli indici ripetuti): n A := ni Ai . Lemma 7.1. In riferimento alle matrici scritte sopra, vale lidentit` a: enS m K enS = enS m K ,
(7.13)
per ogni coppia n, m S2 e R. Dimostrazione. La dimostrazione si ottiene come segue. dierenziabili a valori matriciali: fp : enS Kp enS e gp :
k
enS
pk
Kk .
fj () .
gj () .
Dunque le due funzioni soddisfano la stessa equazione dierenziale e coincidono in = 0 banalmente. Per il teorema di unicit` a globale sono la stessa funzione: enS Kp enS = enS pk Kk
k
130
enS
pk
Kk
ossia e quindi 2
7.2
Abbiamo bisogno di qualche risultato e denizione preliminare. Ricordiamo lenunciato del teorema di decomposizione polare [2] specializzato al caso di dimensione nita. Teorema 7.2. (Teorema di decomposizione polare in dimensione nita.) Sia V uno spazio vettoriale di dimensione nita sul campo C oppure R, dotato di prodotto scalare hermitiano, rispettivamente prodotto scalare reale simmetrico. Sia A : V V un operatore iniettivo (equivalentemente suriettivo). (1) Se K = C allora: (i) esistono e sono unici un operatore strettamente positivo M : V V ed un operatore unitario, rispettivamente ortogonale, U : V V tali che sussista la decomposizione: A = UM , (ii) esistono e sono unici un operatore strettamente positivo M : V V ed un operatore unitario, rispettivamente ortogonale, U : V V tali che sussista la decomposizione: A=M U , (iii) Vale U = U e M = U M U . (2) Se K = R valgono ancora (i), (ii) e (iii) di sopra con le uniche dierenze che M e M sono operatori simmetrici strettamente positivi e U , U sono operatori ortogonali. Deniamo preventivamente una matrice che sar` a utile in tutto il seguito.
P (= ) :=
1 0 0 0 0 ; 0 I 0 131
(7.14)
` e detta inversione di parit` a. Si osservi che la matrice tridimensionale I ` e stata precedentemente indicata con P . In questa sezione P indicher` a invece la matrice di sopra che ne ` e una banale estensione. Ricordiamo che linversione del tempo
T (= ) :=
1 0 0 0 0 ; 0 I 0
(7.15)
Le matrici I, P, T, P T = T P formano un sottogruppo commutativo di O(1, 3) che diremo sottogruppo discreto di Lorentz. Ora, per prima cosa mostriamo che il teorema di decomposizione polare per operatori su R4 applicato a matrici di Lorentz produce una coppia di matrici di Lorentz. Tale risultato non ` e aatto banale: se O(1, 3) il teorema di decomposizione polare per operatori su R4 (con prodotto scalare positivo usuale) assicura che (in una delle due versioni) = MU dove M = M t e M > 0 e U O(4). Niente assicura a priori che M, U O(1, 3)! In realt` a vale il seguente teorema. Teorema 7.3. (Decomposizione polare di O(1, 3).) Sia O(1, 3) allora vale quanto segue: (1) esiste ed ` e unica una coppia di matrici p , M (4, R) tali che = p unitamente a p = t p , p > 0 e O (4); (2) esiste ed ` e unica una coppia di matrici p , M (4, R) tali che = p unitamente a p = t p , p > 0 e O (4); (3) vale in realt` a: = , p = p ;
t
(7.16)
(7.17)
(7.18) (7.19)
(4) le decomposizioni in (1) e (2) sono decomposizioni allinterno di O(1, 3) in quanto risulta p , p , O(1, 3) , ed ulteriormente: (i) = R , oppure 132
(ii) = T R , oppure (ii) = P R , oppure (iv) = P T R , e R ` e una pura rotazione speciale spaziale data dalla (7.11):
R =
1 0 0 0 0 ; 0 R 0
dove R SO(3). (5) le matrici p , p godono delle seguenti propriet` a: (i) det p = det p = 1, (ii) p , p O(1, 3). Dimostrazione. Riguardo ai punti (1),(2) e (3) la dimostrazione segue immediatamente dal teorema di decomposizione polare (teorema 7.2) per operatori sullo spazio vettoriale reale R4 i i dotato del prodotto scalare (u|v ) = 4 i=1 u v . Per provare la prima parte del punto(4) proce1 diamo come segue. Notiamo che, dato che esiste a di p , ` e suciente p per la stretta positivit` 1 O (1, 3) perch provare che p O(1, 3). Ci` o implica subito che = e prodotto di due p t elementi di O(1, 3) e p = p O(1, 3) perch` e prodotto di tre elementi di O(1, 3). Quindi proviamo che p O(1, 3). Da O(1, 3) = p e tenendo conto che p ` e simmetrica troviamo che p t p = e quindi
1 1 t = p p .
(7.20)
Eseguendo il calcolo dellinversa ad ambo membri e tenendo conto che t = 1 e = I , si ha t = p p . Uguagliando i secondi membri di (7.20) e (7.21) ed usando ancora = I si ha subito
2 2 p = p .
(7.21)
(7.22)
Notiamo che 2 e simmetrico per costruzione per cui ammette ununica radice quap 0 ed ` drata. Questultima deve essere p in quanto p ` e simmetrica e positiva e vale ( p )2 = 2 2 p p = p . Daltra parte lunica radice quadrata di e simmetrica e positiva) ` e p (che ` 1 p (che ` e simmetrica e positiva). In denitiva, estraendo le radici quadrate da ambo membri di (7.22) otteniamo: 1 p = p ,
133
che equivale, moltiplicando a destra per p ed a sinistra per (usando = I ), a p t p =, dove si ` e tenuto conto del fatto che p = t o, come p . Abbiamo ottenuto che p O (1, 3) con ci` detto ` e provata la prima parte di (4). Per la seconda parte, ` e suciente notare che in base a alla prima parte, O(1, 3) O(4), ossia t = e t = I . Imponendo entrambe le condizioni su una generica matrice reale 4 4 risulta immediatamente che essa deve avere la forma
1 0 0 0 0 0 R 0
dove R O(3) da cui segue immediatamente la tesi tenendo conto del teorema 6.4 Tale risultato completa la dimostrazione di (4). La prova di (5) ` e immediata. Consideriamo solo p senza perdere generalit` a. La positivit` a di p implica che 0 0 0 per cui p O(1, 3). La stessa positivit` a implica che tutti gli autovalori di p siano non negativi per cui det p 0, ma dovendo essere det p = 1 (perch` e p t p = 2 da cui (detp ) = 1) deve valere det p = 1. 2 Denizione 7.1. (Trasformazioni Pure di Lorentz.) Una trasformazione p O(1, 3) ` e detta trasformazione o matrice pura di Lorentz se soddisfa le due condizioni: (a) p = t p, (b) p > 0 . Equivalentemente una trasformazioni di Lorentz ` e pura se ` e il fattore simmetrico positivo della decomposizione polare di una matrice di Lorentz. Commenti 7.2. ` chiaro che, essendo p simmetrica e non singolare p > 0 equivale a p 0 usando la (1) E decomposizione spettrale. ` chiaro che le trasformazioni pure sono tutte e sole le matrici p del teorema 7.3 che si (2) E ottengono decomponendo polarmente tutte le matrici di Lorentz. Si tenga conto del fatto che la decomposizione polare di una trasformazione pura coincide con la stessa matrice da decomporre per lunicit` a della decomposizione. (3) In particolare quindi ogni trasformazione pura soddisfa det p = 1 e p O(1, 3). Passiamo a dare un primo teorema di rappresentazione delle trasformazioni pure di Lorentz. Tale teorema ed il successivo servir` a sia a studiare le componenti connesse del gruppo di Lorentz sia a dare un teorema di rappresentazione del gruppo di Lorentz.
134
Teorema 7.4. (Rappresentazione delle trasformazioni pure.) Le matrici pure di Lorentz soddisfano le seguenti propriet` a: (a) il loro insieme coincide con la classe di matrici di M (4, R) della forma:
Bt I + BB t /(1 + )
(7.23)
dove = 1 + B2 (7.24)
e B R3 ` e un qualsiasi vettore colonna, (b) se p ` e denita come in (7.23), R SO(3) e R ` e denita da (7.11), allora
R p t R =
RB
(7.25)
dove =
1 + (RB )2 (= 1 + B 2 ).
Dimostrazione. Cominciamo con la prova di (b). Tale prova si ottiene facendo il calcolo diretto del prodotto R p t M (4, R). Tale prodotto fornisce immediatamente il R per una generica R secondo membro di (7.25) dove per` o = 1 + B 2 . Se ulteriormente vale R SO(3), il modulo di B coincide con quello di RB e ci` o non altera il valore di . (a) Partendo da una generica matrice di M (4, R) della forma
ct A
:=
(7.26)
dove b, c R3 sono due qualsiasi vettori colonna e A M (3, R) ` e arbitraria, la simmetria di implica che b = c, il cui valore comune lo indicheremo con B , e A = At , la richiesta di positivit` a della matrice implica che > 0 e A > 0. Inne limposizione della condizione di Lorentz t = porta alle condizioni: (1) = 1 + B 2 in cui si deve scegliere il segno positivo per la positivit` a di gamma; (2) AB = B ; (3) AAt = I + BB t che equivale a A2 = I + BB t per la simmetria di A. Dallultima equazione e tenuto conto del fatto che A > 0, si evince che A deve coincidere con la radice quadrata di I + BB t che ` e univocamente denita come sappiamo dalla sezione precedente. Tenendo conto di (1), una matrice evidentemente (strettamente) positiva il cui 135
quadrato ` e I + BB t ` e I + BB t /(1 + ) e che soddisfa anche (2). Questa ` e dunque la soluzione. Abbiamo provato che le matrici pure hanno la forma (7.23). Daltra parte, se p O(1, 3) ha la forma (7.23), ` e immediato provare che si tratta di una matrice simmetrica che soddisfa il t vincolo p p = . Mostriamo che tale matrice ` e anche necessariamente (strettamente) positiva e ci` o conclude la dimostrazione. Se p ha la forma (7.25) con B = 0 (in caso contrario la tesi ` e ovviamente vera), usando la formula (7.25) con una R SO(3) opportuna possiamo ruotare il ` chiaro che, essendo R non vettore B in modo che abbia solo la prima componente non nulla. E t singolare, la matrice R p R ` e (strettamente) positiva se e solo se p ` e (strettamente) positiva. Quindi la tesi si riduce a provare che una matrice della forma
B B (1 + + B 2 )/(1 + ) 0 0 0 0
0 0 1 0
0 0 0 1
(7.27)
` e positiva dove B R. Si noti che B 2 = 2 1 per costruzione, per cui la matrice di sopra ` e scrivibile come:
B 0 0 B 0 0 0 0 1 0 0 0 0 1
(7.28)
Il calcolo degli autovalori fornisce oltre a 1 contato due volte = |B | . Essendo = 1 + B 2 > |B | risulta > 0, per cui tutti gli autovalori sono strettamente positivi e la matrice ` e strettamente positiva. 2 Nota 7.1. Supponiamo che p sia la matrice di Lorentz pura che connette coordinate minkowskiane dei riferimenti inerziali F e F :
j x = C i + i p jx . i
Il vettore B R3 ` e costituito dalle componenti di V /c nelle coordinate di F , dove V = cF + V ` e la quadri velocit` a di F . Nella componente temporale, il fattore ` e proprio 0 p 0. In questo senso e con notazione impropria, si pu` o scrivere
t V /c
p = V /c I + V V t /[c2 (1 + )]
(7.29)
136
Similmente, se v denota il vettore colonna di R3 le cui componenti sono le componenti della velocit` a di trascinamento di F in F allora si pu` o scrivere
v t /c I + 2 vv t /[c2 (1 + )]
p =
v/c
(7.30)
dove la relazione tra e v come gi` a provato (vedi sotto la denizione 4.3) ` e = 1/ 1 v 2 /c2 . Unultima parametrizzazione si ottiene come segue partendo direttamente da (7.23). Lequazione (7.24) implica che possiamo parametrizzare e |B | come segue:
= cosh , |B | = sinh ,
(7.31) (7.32)
dove [0, +). Introducendo il versore n S2 , la corrispondenza (, n) B := (sinh )n ` e biunivoca eccetto per B = 0 che corrisponde a tutti i valori di n e = 0. Inne notiamo che, essendo sinh2 = cosh2 1, BB t /(1 + ) = (sinh2 )nnt /(1 + cosh ) = (cosh 1)nnt . In denitiva, le trasformazioni pure le possiamo rappresentare come
cosh
p =
(sinh )n
(7.33)
dove [0, +) e n S2 ed, eccetto per = 0, la corrispondenza sopra scritta tra trasformazioni pure di Lorentz e parametri (, n) [0, +) S2 ` e biunivoca. In termini di velocit` a di trascinamento di F rispetto a F , con le convenzioni usate sopra, si ha subito che v/|v | = n , |v |/c = tanh . (7.34) (7.35)
Lultima rappresentazione trovata nellosservazione di sopra pu` o anche essere scritta in altro modo. Teorema 7.5. (Rappresentazione esponenziale delle trasformazioni pure.) Le trasformazioni pure di Lorentz sono tutte e sole le matrici della forma enK , (7.36)
137
dove n S2 e R. Inoltre la corrispondenza tra matrici pure di Lorentz e coppia di parametri (, n) ad esse associate ` e biunivoca se n S2 e > 0. Dimostrazione. In base allosservazione di sopra,` e suciente provare che, per ogni (, n) R S2 :
cosh
(sinh )nt
enK =
(7.37)
Per provare ci` o indichiamo con e il primo e secondo membro della (7.37). Vogliamo provare che = . A tale scopo notiamo che per ogni n S2 esiste R SO(3) tale che Rn = e1 primo vettore della base canonica di R3 . Consideriamo allora R associata a R secondo la (7.11). Il calcolo diretto (o passando per (b) del teorema 7.4) prova subito che
cosh
R t R = In altre parole:
(sinh )e1
(7.38)
R t R =
(7.39)
Consideriamo ora . Usando lo sviluppo dellesponenziale non ci sono dicolt` a a provare che
nR KR . R t R =e
t
Usando (7.12) ed il lemma 6.1 nel secondo membro abbiamo immediatamente che
(Rn)K R t , R =e
ossia
e1 K R t = eK1 . R =e
Inne il calcolo esplicito dellesponenziale eK1 (per esempio con la solita procedura basata sul teorema di unicit` a delle soluzioni di equazioni dierenziali) mostra che
K1 R t = R =e
(7.40)
che implica subito, moltiplicando a sinistra per t R e a destra per R = . la dimostrazione ` e conclusa. 2 Le trasformazioni pure di Lorentz includono le ben note cosiddette trasformazioni speciali di Lorentz che si ottengono quando la velocit` a di trascinamento ` e parallela ad uno dei tre assi delle coordinate spaziali minkowskiane. Abbiamo gi` a incontrato le trasformazioni speciali lungo lasse x3 varie volte nelle sezioni precedenti. Denizione 7.2. (Trasformazioni speciali di Lorentz.) Una trasformazione pura di Lorentz tale che, in riferimento alla rappresentazione del teorema 6.4, n = ei (i-esimo versore di R3 ) ` e detta trasformazione speciale di Lorentz lungo lasse xi . Se v ` e il valore scalare con segno della velocit` a di trascinamento di F rispetto a F dotati di coordinate minkowskiane in modo tale che la trasformazione di coordinate x = i j xj sia una trasformazione speciale lungo lasse i esimo, risulta subito che, posto x0 = ct e x 0 = ct e j = i, t x x
dove al solito = 1/ 1 v 2 /c2 .
i j i
= (t +
v i x ), c2 = (xi + vt) , = x .
j
Commenti 7.3. (1) Come gi` a osservato precedentemente le trasformazioni di Lorentz non preservano gli angoli tra i versori. Tuttavia ci` o accade per trasformazioni speciali di Lorentz: in entrambi i riferimenti connessi da una trasformazione speciale di Lorentz, la terna dellaltro riferimento individuer` a una terna in movimento che sar` a ancora ortogonale. Si osservi che ci` o non accade per trasformazioni pure generiche per cui non si pu` o aermare che le trasformazioni pure sono le trasformazioni che corrispondono ai moti relativi di terne inerziali ad assi paralleli. Lunica aermazione sicamente sensata ` e che, in base al teorema di decomposizione delle matrici di Lorentz, le trasformazioni pure sono le trasformazioni di Lorentz che non contengono rotazioni. A dierenza della situazione 139
classica ci` o non implica automaticamente che le terne di assi rappresentate nei rispettivi spazi di quiete procedano ad assi paralleli. ` immediato provare che: (2) E le trasformazioni speciali di Lorentz lungo lasse i-esimo costituiscono un sottogruppo ad un parametro del gruppo di Lorentz generato dal boost Ki . Tuttavia, a causa della relazione di commutazione [Ki , Kj ] =
ij k
Sk ,
la composizione di due trasformazioni speciali lungo assi dierenti non ` e nemmeno una trasformazione pura! Linsieme delle trasformazioni pure di Lorentz non ` e un sottogruppo del gruppo di Lorentz. Questo risultato ha conseguenze siche non banali, per esempio nel fenomeno della precessione di Thomas in cui in un riferimento inerziale F si descrive una terna di assi solidale ad un altro riferimento inerziale F (e quindi in moto in F ) come se ruotasse, anche se tale terna soddisfa una denizione relativisticamente invariante di terna non rotante. (3) In riferimento alla rappresentazione delle trasformazioni pure discussa sopra:
I+
v t /c 2 vv t /[c2 (1 + )]
p =
v/c
v t /c
P p P = e
v t /c I + 2 (v )(v t )/[c2 (1 + )]
T p T =
v/c
mentre
I+
v t /c 2 vv t /[c2 (1 + )]
P T p T P =
v/c
Il signicato sico di queste identit` a` e ovvio se si tiene conto che sia linversione del tempo e sia linversione di parit` a devono cambiare segno al vettore velocit` a. Si osservi che come conseguenza 140
di quanto ottenuto e del fatto che T T = P P = T P T P = I , si ha che T, P, T P non commutano con le matrici del gruppo di Lorentz quando queste contengano trasformazioni pure di Lorentz nella decomposizione polare.
7.3
Per concludere possiamo enunciare e provare un teorema di rappresentazione del gruppo di Lorentz ortocrono proprio ed in particolare possiamo provare il teorema 3.1. Teorema 7.6. (Rappresentazione del gruppo di Lorentz ortocrono proprio.) Le matrici SO(1, 3) sono tutte e sole le matrici di M (4, R) della forma = R p , per ogni scelta di R SO(3) e per ogni trasformazione pura di Lorentz p ; ovvero = enS emK , (7.45) (7.44)
per ogni scelta di n, m S2 , , R. Equivalentemente, le matrici SO(1, 3) sono tutte e sole le matrici di M (4, R) della forma = p R , per ogni scelta di R SO(3) e per ogni trasformazione pura di Lorentz p ; ovvero = e m K e n S , (7.47) (7.46)
per ogni scelta di n , m S2 , , R. Inoltre valgono i seguenti fatti. (1) In entrambi i casi le coppie (m, ) e (m , ) sono determinate biunivocamente da I = SO(1, 3) purch` e ci si restringa allinsieme S2 (0, +). (2) In entrambi i casi le coppie (, n) e ( , n ) sono determinate biunivocamente da I = SO(1, 3) purch` e ci si restringa allinsieme S2 (0, ] e con leccezione che (n, ) e (n, ) producono lo stesso primo fattore nel secondo membro di (7.45), e rispettivamente (n , ) e (n , ) che producono lo stesso secondo fattore nel secondo membro di (7.47). (3) Per una ssata SO(1, 3), = I , in riferimento alle decomposizioni (7.45) e (7.47) e con le restrizioni in (1) e (2) valgono le identicazioni n m = n, = , = e
nS
= . 141
Dimostrazione. Se SO(1, 3) , per il teorema 7.3, = p dove p ` e pura. Si noti che 1 p SO(1, 3) per il punto (5) del teorema 7.3 ed essendo SO(1, 3) un gruppo. Allora 1 = p SO (1, 3) e deve essere necessariamente della forma R (7.11) con R SO (3). Usando (7.12) ed il teorema 7.5 abbiamo inne che: = emS enK per qualche , R e n, m S2 . Se, viceversa consideriamo una matrice della forma = emS enK il teorema 7.5 assicura che enK SO(1, 3) . Inoltre emS ` e della forma (7.11) con R = emS SO(3) per cui ` e immediato avere che emS SO(1, 3) Essendo SO(1, 3) un gruppo, = emS enK SO(1, 3) . La dimostrazione si esegue nello stesso modo con le debite dierenze considerando una decomposizione = p . Il punto (1) segue dallosservazione (1) dopo il teorema 6.5 e dallunicit` a dei fattori della decomposizione polare del teorema 7.3. Il punto (2) segue dal teorema 7.5 e dallunicit` a dei fattori della decomposizione polare del teorema 7.3. Il punto (3) segue dal punto (3) del teorema 7.3. 2 Segue immediatamente un importante conseguenza che presentiamo come teorema. Teorema 7.7. (Decomposizione in trasformazioni speciali e rotazioni.) Se SO(1, 3) allora esistono R, R SO(3) ed una trasformazione speciale di Lorentz lungo il terzo asse 3 tali che: = R 3 R , ovvero in altri termini = enS eK3 e n S , per qualche n, n S2 , , , R. Dimostrazione. In base al teorema precedente, se SO(1, 3) , = enS emK . Sia B SO(3) tale che Bm = e3 . Allora usando il lemma 7.1 e la (7.12):
K3 B t . emK = e(Be3 )K = eB e3 KB = B ee3 K t B = B e
t
Di conseguenza, ponendo R = enS , = enS B eK3 B t = R B eK3 t B . Dato che A A ` e una rappresentazione gruppale, R B = RB e dunque = RB eK3 B t . Ridenendo le matrici di SO(3): RB come R e B t come R segue banalmente la tesi. 2
142
Nota 7.2. Il teorema provato ha come conseguenza il teorema 3.1. Infatti se F e F sono sistemi di riferimento inerziali, scelti due sistemi di coordinate minkowskiane F , F , la trasformazione di Poincar e che lega tali sistemi di coordinate, ossia 1 , sar` a della forma
j z i = C i + i jz .
dove O(1, 3) e C i R. Ridenendo le coordinate in F come y i = (R )i j (z C j ) dove R O(3), il nuovo sistema di coordinate sar` a ancora solidale con F e varr` a y i = i j z j , dove = R . Ci sono due possibilit` a: det = 1 ed in tal caso SO(1, 3) con la scelta banale R = I , oppure det = 1; in tal caso, scegliendo R = I , risulta SO(1, 3) . In denitiva abbiamo trovato due sistemi di coordinate minkowskiane solidali con F e F e connessi da una trasformazione di Lorentz ortocrona propria. y i = i j z j , con SO(1, 3). Applicando il teorema 7.7 a e denendo x i := (Rt )i j y j e xi = (R )i j z j , per costruzione i due nuovi sistemi di coordinate minkowskiane sono ancora solidali con F e F e inoltre vale i i x = eK3 j xj , cio` e la trasformazione di coordinate ` e una trasformazione speciale lungo il terzo asse.
j
7.4
Consideriamo i seguenti sottoinsiemi di O(1, 3): O(1, 3)+ := { O(1, 3) | det > 0 , 0 0 > 0} , O(1, 3) := { O(1, 3) | det < 0 , O(1, 3)+ := { O(1, 3) | det > 0 ,
0 0 0 0 0 0
O(1, 3) := { O(1, 3) | det < 0 , ` chiaro che si tratta di insiemi disgiunti per costruzione, inoltre E
(7.56)
143
in quanto se O(1, 3), come pi` u volte notato, det = 1 ed ulteriormente 0 0 +1 oppure 0 0 1 per il il teorema 2.3. Per gli stessi motivi possiamo equivalentemente riscrivere il membro di destra delle denizioni di sopra come: O(1, 3)+ := { O(1, 3) | det = +1 , 0 0 > +1} , O(1, 3) := { O(1, 3) | det = 1 ,
0 0 0 0 0 0
Notiamo ancora che O(1, 3)+ ` e un sottogruppo di O(1, 3) come ` e immediato provare tenendo conto che risulta essere lintersezione del sottogruppo ortocrono O(1, 3) e del sottogruppo SO(1, 3) costituito dalle matrici di Lorentz con determinante +1 (il fatto che tale insieme sia un sottogruppo ` e di verica immediata). I rimanenti sottoinsiemi O(1, 3) , O(1, 3)+ , O(1, 3) non sono sottogruppi perch e non contengono I per denizione. Tenendo conto del fatto che T T = P P = I dove linversione del tempo T e linversione di parit` a P sono denite in (7.15) (ovvero nel teorema 2.3) e (7.14) segue subito che, con ovvie notazioni: O(1, 3) = P O(1, 3)+ , O(1, 3)+ = P T O(1, 3)+ , O(1, 3) = T O(1, 3)+ . Il risultato pi` u importante ` e comunque che i 4 sottoinsiemi di O(1, 3) sopra deniti sono le componenti connesse del gruppo di Lorentz: Teorema 7.8. (Componenti connesse del gruppo di Lorentz.) I quattro sottoinsiemi di O(1, 3) deniti in (7.57)-(7.60) costituiscono le componenti connesse del gruppo di Lorentz di cui solo SO(1, 3):= O(1, 3)+ detto (sotto) gruppo ortocrono proprio o (sotto) gruppo ortocrono speciale ` e sottogruppo di O(1, 3). Valgono inne le relazioni: O(1, 3) = P SO(1, 3) , O(1, 3)+ = P T SO(1, 3) , O(1, 3) = T SO(1, 3) . Dimostrazione. Dato che i quattro insiemi sono disgiunti e la loro unione ` e O(1, 3) lunica cosa che rimane da provare e che non ` e stata gi` a provata sopra ` e che essi sono aperti e connessi. 144 (7.61) (7.62) (7.63)
` suciente provare che SO(1, 3) ` E e aperto e connesso. Una volta provato ci` o, essendo la moltiplicazione per T, P, T P un dieomorsmo di O(1, 3) in O(1, 3), segue che anche O(1, 3) , O(1, 3)+ , O(1, 3) sono aperti e connessi. SO(1, 3) ` e aperto (nella topologia di O(1, 3)) perch e dato dallintersezione di due insiemi aperti: rispettivamente la controimmagine dellinsieme (0, +) rispetto a det : O(1, 3) R e la controimmagine dello stesso insieme rispetto alla funzione che calcola 0 0 per ogni O(1, 3). La connessione di SO(1, 3) si prova come segue. Se SO(1, 3), per il teorema 7.3, = p 1 dove p ` e pura. Si noti che p SO (1, 3) per il punto (5) del teorema 7.3 ed essendo 1 SO(1, 3) un gruppo. Allora = p SO (1, 3) e deve essere necessariamente della forma R (7.11) con R SO(3). Usando (7.12) ed il teorema 7.5 abbiamo inne che: = emS enK per qualche , R e n, m S2 . Possiamo costruire un cammino continuo [0, 2] che connette I a in SO(1, 3): (t) := etmS se t [0, 1) , (t) := emS e(t1)nK se t [1, 2] . Il fatto che per ogni t [0, 2] gli elementi del cammino siano in SO(1, 3) ` e immediato. Scegliendo di seguito u e v in modo da esaurire tutti i casi possibili da vericare, si ha det eumS evnK = det eumS det evnK = evntrK eumtrS = e0 e0 = 1 , dove eumS = R ` e dato da (7.11) per cui eumS O(1, 3) e inne eumtrS ` e una trasformazione pura per il teorema 7.5 per cui ` e un elemento di O(1, 3) per il teorema 7.3 punto (5). Dunque SO(1, 3) ` e connesso per archi e quindi connesso. 2 Segue immediatamente un ovvio ma importante corollario. Corollario. SO(1, 3) ` e un gruppo di Lie matriciale in quanto sottogruppo di Lie di O(1, 3), inoltre, se so(1, 3) denota lalgebra di Lie di SO(1, 3), so(1, 3)= o(1, 3). ` ovvio che da (7.61), (7.62) e (7.63) seguano teoremi di decomposizione e rapNota 7.3. E presentazione delle componenti connesse del gruppo di Lorentz diverse da quella che contiene lidentit` a gruppale. Esercizi 7.1. . 1. Mostrare che il gruppo di Poincar e` e un gruppo di Lie matriciale sottogruppo di GL(5, R). Suggerimento. Considerare la classe di matrici C ; (7.64) 0 1 145 t (t) SO(1, 3)
dove C R4 e O(1, 3). 2. Mostrare che lalgebra di Lie del gruppo di Poincar e` e la somma diretta so(1, 3) R4 come spazio vettoriale, ma non lo e come algebra di Lie (cio` e il commutatore non soddisfa [(A, t), (A , t )] = ([A, A ], 0) , dove A, A so(1, 3) e t R4 ).
146
Capitolo 8
8.1
La teoria della Relativit` a Generale fu formulata da Einstein dieci anni dopo la teoria della Relativit` a Speciale. La seconda ingloba la teoria del campo gravitazionale allinterno della geometria dello spaziotempo. Lidea centrale di Einstein per rappresentare la gravit` a in termini geometrici ` e basata sul cosiddetto principio di equivalenza. Il principio di equivalenza che formuleremo tra poco ` e basato sullosservazione fondamentale, sottolineata da Einstein, che la massa gravitazionale e la massa inerziale coincidono. La prima ` e la costante M , caratteristica di un corpo, che compare nella formula della gravitazione universale di Newton: F = G MM (P Q) , ||P Q||3
dove F ` e la forza gravitazionale che il corpo di massa M in Q esercita sul corpo di massa M in P . La massa inerziale m ` e invece la costante, caratteristica di un corpo, che appare nel secondo principio della dinamica: F (t, P, v ) = ma , dove veca ` e laccelerazione del punto materiale P di massa inerziale m, valutata in un riferimento inerziale, e vecF ` e la forza totale agente sul punto materiale. Newton postul` o che M =m. 147
Questa coincidenza di valori ` e stata vericata sperimentalmente con incredibile precisione in diversi esperimenti con pendoli a torsione di E otvos (con un errore di relativo di 109 ) e da Dicke e collaboratori in tempi pi recenti (con un errore relativo di 1012 ). La coincidenza delle due nozioni di massa ha limportante conseguenza stabilita dal cosiddetto Principio di Equivalenza di Einstein (in forma debole) che sancisce, in sica classica, lequivalenza tra locale i campi gravitazionali e le forze inerziali: ` possibile annullare localmente leetto dinamico Principio di Equivalenza di Einstein. E del campo gravitazionale tramite le forze inerziali in un riferimento in caduta libera nel campo gravitazionale. Viceversa ` e possibile creare gli eetti dinamici dovuti ad un campo gravitazionale lavorando in un riferimento accelerato rispetto ad un riferimento inerziale. Nota 8.1. Localmente signica sopra: in regioni spaziali sucientemente piccole e per intervalli di tempo sucientemente brevi. Esemplichiamo il signicato sico di tale principio. In sica classica, consideriamo un campo gravitazionale g = g (t, P ) arbitrario valutato in coordinate di un riferimento inerziale I . g (t, P ) ` e quindi il vettore accelerazione di gravit` a nel punto P nello spazio di quiete del riferimento ed allistante t. Consideriamo ora un nuovo riferimento, non inerziale, I in caduta libera nel campo gravitazionale. Tale riferimento si costruisce prendendo una particella O che si muove nel riferimento I con accelerazione: gO |I (t) = g (t, O(t)) . Dotiamo quindi il punto O di un sistema di assi cartesiani ortonormali centrati ad ogni istante in O(t) e assumiamo che tali assi non ruotino rispetto agli assi di I . In tal modo il riferimento I solidale con O e con gli assi costruiti non ruota rispetto a I . Svolgiamo ora elementari esperimenti di dinamica nel riferimento I . Prendiamo un punto materiale P dotato di massa inerziale m e massa gravitazionale M e lanciamolo, partendo da O con una arbitraria velocit` a iniziale. Quale sar` a il suo moto in I ? Le equazioni del moto di P in I si scrivono: maP |I = M g (t, P (t)) . Ma, essendo il moto di I rispetto a I puramente traslatorio, abbiamo anche che: aP |I (t) = aP |I (t) + aO |I (t) Pertanto le equazioni del moto di P nel riferimento I si possono scrivere maP |I (t) = maO |I (t) + M g (t, P (t)) , ovvero, tenendo conto di aO |I (t) = g (t, O(t)), maP |I (t) = mg (t, O(t)) + M g (t, P (t)) . 148
Inne tenendo conto che m = M si trova che, per ogni punto materiale di massa inerziale arbitraria m: maP |I (t) = m (g (t, P (t)) g (t, O(t))) . Vediamo allora che tanto pi` u il punto P si trova vicino allorigine O delle coordinate del riferimento I e questo succeder` a considerando tempi sucientemente piccoli dato che il punto materiale P parte inizialmente da O tanto pi` u il suo moto assomiglier` a al moto rettilineo uniforme, come se il punto non fosse sottoposto ad alcuna forza, alla forza gravitazionale in particolare. Viceversa possiamo creare gli eetti di un campo gravitazionale lavorando in un riferimento non inerziale I accelerato rispetto ad un riferimento inerziale I . A titolo esemplicativo, supponiamo che I sia determinato rispetto al riferimento inerziale I assegnando, come prima, il moto accelerato dellorigine degli assi di I , indicata con O e supposta avere accelerazione costante aO |I rispetto a I . Supporremo nuovamente che il moto di I sia puramente traslatorio rispetto a I . Lequazione della dinamica, per un punto materiale P di massa m non sottoposto a forze, sar` a nel riferimento I : maP |I = 0 e quindi, nel riferimento I : maP |I (t) = maO |I g . In altre parole, nel riferimento I vale, per ogni punto materiale di qualunque massa inerziale m e massa gravitazionale M : maP |I (t) = M g (8.1) dove il campo gravitazionale che appare in I ` e denito da g = aO |I . Lequazione (8.1), ancora una volta, ha senso perch e M = m. Nota 8.2. Questi risultati non sono aatto banali perch e coinvolgono la natura del campo gravitazionale e la struttura generale della formulazione della dinamica in sica classica. Considerando altri tipi di campi di forze in luogo del campo gravitazionale, non si ha lo stesso risultato, anche assumendo luguaglianza della massa inerziale e di quella gravitazionale. Un secondo risultato conseguente dal fatto che la massa gravitazionale coincida con quella inerziale, ` e che il moto di un punto materiale in un assegnato campo gravitazionale non dipende dalla massa del corpo, ma solo dalla sua posizione e velocit` a iniziale. Questi due fatti portarono Einstein, nel tentativo di dare una descrizione relativistica della gravit` a estendendo la teoria della relativit` a speciale, ad assumere i seguenti tre principi, che fondano la teoria della relativit` a generale. RG1. Lo spaziotempo, anche nella situazione che corrisponde classicamente alla presenza di gravitazione, ` e descritto da variet` a dierenziabile quadridimensionale M con metrica lorentziana g, connessa e temporalmente orientata. Ulteriormente, generalizzando le analoghe identicazioni dalla Relativit` a Speciale, valgono le seguenti identicazioni tra enti sici ed enti matematici. 149
(a) La storia di un punto materiale ` e descritta nello spaziotempo da una curva dierenziabile di tipo causale futuro orientata, cio e da una linea di universo nel senso della denizione 3.11. (b) Nel caso di una linea di universo di tipo tempo, il tempo proprio (cio e il tempo misurato da un orologio ideale in quiete con un punto materiale) coincide con lascissa curvilinea della curva (denizione 4.1) divisa per c, denendo il vettore tangente quadrivelocit` a V che soddisfa g(V |V ) = c2 . (c) Lo spazio sico di quiete con il punto materiale in un evento della sua storia ` e descritto, a livello innitesimo, dal sottospazio dello spazio tangente a quellevento normale al vettore tangente all curva dotato del prodotto scalare denito positivo indotto da g. Nota 8.3. La richiesta di connessione (necessaria per lorientabilit` a temporale) ` e sicamente ovvia: non ci sarebbe nessuna possibilit` a di comunicare tra regioni sconnesse. RG2. Il moto dei corpi puntiformi che classicamente erano visti come sottoposti al solo campo gravitazionale ` e descritto dalle geodetiche (di tipo causale futuro) nello spaziotempo rispetto alla connessione di Levi-Civita associata a g. In questo senso, il contenuto sico del campo gravitazionale classico ` e ora descritto da propriet` a della metrica dello spaziotempo. Lultimo dei tre principi, che enunciamo di seguito, cade spesso sotto il nome di principio di equivalenza forte. Tale principio ` e il pi` u dicile da interpretare matematicamente, in particolare ` e dicile dare un signicato preciso alle locuzioni locale e localmente nel contesto geometrico dierenziale introdotto dai precedenti due principi. Per fare ci` o abbiamo bisogno di nuovi strumenti e risultati matematici che introdurremo nella prossima sezione. RG3. Esistono sistemi di coordinate locali, associati a sistemi di riferimento di caduta libera, in cui i moti descritti da geodetiche temporali appaiono localmente come moti rettilinei uniformi. In tali sistemi di riferimento le leggi della sica assumono la stessa forma che avevano nei sistemi di riferimento inerziali della teoria relativistica speciale. Nota 8.4. Deve essere chiaro che la prima parte di RG3 ` e una riformulazione della prima aermazione del principio di equivalenza, quando si tiene conto di RG2.
8.2
Introdurremo ora uno strumento matematico importante che ci permetter` a di dare signicato matematicamente rigoroso alla prima aermazione contenuta nel principio RG3. Questo strumento ` e un particolare sistema di coordinate nellintorno di un ssato punto di una variet` a (pseudo)riemanniana o pi` u in generale di una variet` a dotata di connessione ane. Attraverso tale sistema di coordinate si pu` o identicare un intorno della variet` a con lo spazio tangente alla variet` a.
150
8.2.1
Consideriamo una variet` a dierenziabile M dotata di una connessione ane . Assumeremo che entrambe siano C anche se C 2 ` e suciente per quanto segue. Se (U, ) ` e una carta locale su M con coordinate x1 , . . . , xn , consideriamo le coordinate naturali locali su T M , (x1 , . . . , xn , x 1 , . . . , x n ) indotte dalla carta (U, ). Ricordiamo che questo sistema di coordinate naturali indotto dalla carta locale (U, ) su M con coordinate x1 , . . . , xn ` e denito dal fatto che ogni vettore tangente in Tp M con U p e con n , ha componenti: coordinate x1 , . . . , x p p i x v i |p . x
1 n n Lelemento (p, v ) T M ` e dunque individuato dalla 2n-pla (x1 p , . . . , xp , x v , . . . , x v ). Il problema di Cauchy associato allequazione delle geodetiche della connessione , visto come un problema di Cauchy del primordine in T M , si scrive esplicitamente nelle coordinate dette:
i = 1, . . . n .
(8.2)
n In particolare (x1 p , . . . , xp ) sono le coordinate di p U , il punto di partenza dalla geodetica con vettore tangente iniziale x p = x i p xi |p . Indichiamo con = (p, vp , t) U , la proiezione in U dellunica soluzione massimale di (8.2) dove p U , vp Tp M e t appartiene a qualche intervallo aperto I 0 che dipende da p e vp in generale. Nel seguito rappresenteremo (p, vp ) in termini n 1 n n n n delle corrispondenti coordinate (x1 p , . . . , xp , x vp , . . . , x vp ) (U ) R R R . Come ben noto, dalla teoria generale dei sistemi di equazioni dierenziali, se uno considera soluzioni massimali e ne varia le condizioni iniziali p U , vp Tp M , prendendo t nel risultante intervallo, il dominio globale Rn Rn R di = (p, vp , t), al variare di tutte le variabili (p, vp , t) risulta essere un insieme aperto di Rn Rn R. Di conseguenza, se ssiamo r U , ci sar` a un insieme di forma Vr B (0) ( , ) con > 0, essendo B (0) la palla aperta in Rn di raggio > 0 centrata in 0 ed essendo Vr U un intorno aperto di r tale che
Vr B (0) ( , )
(p, vp , t) (p, vp , t)
` e ben denita. Riduciamoci dora in poi a lavorare su questo insieme. Lequazione (8.2) ed il teorema di unicit` a delle soluzioni dei sistemi di equazioni dierenziali implicano subito che, per ogni > 0, se la geodetica t (p, vp , t) ` e denita per t ( , ), allora la geodetica t (p, vp , t) ` e denita per t ( /, /), e (p, vp , t) = (p, vp , t) . (8.3)
(Infatti il membro di destra, pensato come una funzione di t ( /, /), soddisfa lequazione delle geodetiche con vettore tangente iniziale in p dato da vp .) Quindi possiamo ssare > 0 151
Vr B (0)
` e ben denita per t ( , ) (1, 1). In denitiva, se > 0 ` e sucientemente piccolo, la funzione Vr B (0) (p, up ) expp (up ) := (p, up , 1) (8.4) ` e ben denita. Si osservi che teoremi noti riguardanti la dipendenza regolare delle soluzioni di equazioni dierenziali dai dati iniziali implicano che (p, up ) expp (up ) ` e una funzione C . Per ogni p Vr , la palla B (0) Rn si identica con un intorno aperto e stellato dellorigine1 di Tp M . Lidenticazione avviene tramite la funzione che associa al vettore colonna di Rn il corrispondente vettore di Tp M con le stesse componenti rispetto alla base {/xi |p }i=1,...,n . Denizione 8.1. Sia M una variet` a dierenziabile C dotata di una connessione ane di classe C . (a) La funzione (8.4) denita in un insieme aperto E T M , (sucientemente piccolo e rappresentato, in coordinate locali naturali di T M , come prodotto Vr B (0)) ` e detta exponential map su E . (b) Se p M , la restrizione dellexponential map a {p} U0 , dove U0 ` e un opportune intorno aperto e stellato dellorigine 0 di Tp M , ` e detto exponential map centrato in p. Nota 8.5. Lequazione (8.3) con t = 1 si scrive (p, vp , 1) = (p, vp , ) , ossia: expp (vp ) = (p, vp , ) . e stellato) Questa identit` a dice che la funzione (ben denita perch e lintorno di denizione di expp ` [0, 1] expp (vp ) M, (8.5)
denisce lunico segmento di geodetica che parte da p, con vettore tangente vp e parametro ane [0, 1]. Possiamo ora enunciare e provare il risultato fondamentale riguardante lexponential map. Teorema 8.1. Sia M una variet` a dierenziabile C dotata di una connessione ane di classe C . Si consideri lexponential map centrato in un punto p M . Valgono i seguenti fatti.
1 Un intorno aperto e stellato dellorigine O di uno spazio vettoriale topologico V ` e un intorno aperto U di 0 tale che, se v U , allora il segmento che unisce 0 a v ` e anchesso completamente contenuto in U .
152
(a) In un intorno aperto e stellato U0 dellorigine di Tp M , lexponential map denisce un dieomorsmo sullinsieme aperto expp (U0 ). In tal modo i vettori in un intorno aperto dellorigine di Tp M vengono dierenziabilmente e biunivocamente identicati con i punti in un intorno aperto di p. (b) Se ha torsione nulla e {epi }i=1,...,n Tp M ` e una base, si consideri il sistema di coordinate 1 locali su expp (U0 ) che associa q expp (U0 ) alle componenti di exp p (q ) respetto alla base detta: 1 1 1 1 q exp . p (q ), ep , , expp (q ), ep In quel sistema di coordinate i coecienti di connessione di si annullano in p. (c) Se ` e la connessione di Levi-Civita associata con una (pseudo)metrica g di classe C su M , e {epi }i=1,...,n Tp M ` e una base, in riferimento alle coordinate locali introdotte in (a), le componenti delle derivate della metrica rispetto alle coordinate si annullano in p. e non singolare. Dimostrazione. Per dimostrare (a) ` e suciente fare vedere che d expp |p ` 1 n Fissiamo un sistema di coordinate locali attorno a p con coordinate x , . . . , x and denotiamo con (expp (v ))i la componente i-esima della funzione di expp (v ). Vale, dove non usiamo la convenzione di somma sugli indici ripetuti: v j
n k
exp
v =0 i=1
v i epi
v j
k exp v j epj = v =0
exp
v =0 i=1
v epi
=0
k (p, epj , ) = ek pj ,
dove ek e la k -esima componente di epj rispetto alla base {/xi |p }i=1,...,n . Le la matrice le cui pj ` colonne sono le componenti di questi vettori di Rn ` e non singolare dato che {epj }j =1,...,n ` e una base. La dimostrazione di (a) ` e terminata. In coordinate y 1 , . . . , y n denite su expp (U0 ) e che associano q expp (U0 ) con le componenti 1 di exp p (q ) rispetto alla base {epi }i=1,...,n , ogni geodetica che parte da p con vettore tangente iniziale vp = v i epi ha equazione: y i () = v i come segue immediatamente dalla (8.5). Per le geodetiche uscenti da p e lavorando in tali coordinate vale allora che, per i = 1, . . . , n d2 y i () =0. d2 Daltra parte deve anche valere, per la denizione generale di geodetica: dy j dy k d2 y i i 1 n + ( y ( ) , . . . , y ( )) =0. jk d2 d d Di conseguenza, per ogni [0, 1]:
1 n i jk (y (), . . . , y ())
dy j dy k =0. d d
153
In particolare, se = 0:
j k i jk (p)v v = 0 ,
(8.6)
i i i i Se la connessione ha torsione nulla, cio e i jk = kj , (8.6) implica, scegliendo v = u + z per j k i i ogni ui , z i R, che deve valere i jk (p)u z = 0 per ogni u , z R. Di conseguenza:
i jk (p) = 0 . La dimostrazione di (c) ora segue immediatamente tenendo conto del fatto che lidentit` a g = 0, i valida per la connessione di Levi-Civita, in coordinate ha la forma, se g = gij dx dxj : gki s = s jk gsi + ji gks . y j 2 Denizione 8.2. Sia M una variet` a dierenziabile C dotata di una connessione ane di classe C e sia p M . Si consideri un intorno aperto stellato dellorigine 0 di Tp M su cui e una base, le coordinate locali expp denisce un dieomorsmo locale. Se {epi }i=1,...,n Tp M ` 1 denite su expp (U0 ) che associano ogni q expp (U0 ) alle componenti di exp p (q ) sulla base detta: 1 1 1 1 q exp p (q ), ep , , expp (q ), ep sono dette coordinate normali (riemanniane) centrate in p.
8.2.2
Passiamo a considerare un sistema di coordinate normali pi` u complesso ed associato ad una assegnata curva dierenziabile. Se M ` e la solita variet` a dierenziabile dotata di una metrica riemanniana o lorentziana g = gij dxi dxj , sia : (a, b) M una curva dierenziabile regolare, cio e con (t) = 0 per ogni t (a, b). Nel caso lorentziano assumeremo ulteriormente che sia di tipo tempo, cio e g ( (t), (t)) < 0 per ogni valore del parametro t (a, b). Fissiamo t0 (a, b) e consideriamo una base del sottospazio N(t0 ) di T(t0 ) normale a (t0 ), {e(t0 )i }i=2,...,n . Quindi trasportiamo parallelamente tale base lungo usando la procedura del trasporto parallelo. Dato che la procedura del trasporto parallelo conserva le relazioni metriche ed ` e biettiva, {e(t)i }i=2,...,n denisce ancora una base per il sottospazio N(t) di T(t) M normale a (t). Inne consideriamo la funzione:
n
(t, v , . . . , v ) exp(t)
i=2
v i e(t)i
(8.7)
Il signicato geometrico della funzione denita in (8.7) dovrebbe essere chiaro: tale funzione associa (t, v 2 , . . . , v n ) con il punto in M raggiunto dalla geodetica che parte da (t) con vettore i tangente iniziale n i=2 v e(t)i normale ad , quando il valore del parametro ane su di essa vale 154
1. Discutiamo il dominio di denizione della funzione (8.7). Fissiamo coordinate locali x1 , . . . , xn su un insieme aperto U (t0 ). La funzione exp su T M ` e denita su un insieme aperto 1 piccolo a sucienza E T M tale che, nelle coordinate x , . . . , xn , x 1 , . . . , x n , ha la forma V B (0) Rn Rn , dove V corrisponde ad un intorno aperto di (t0 ) e B (0) ` e una palla aperta di raggio > 0 centrata nellorigine di Rn . In queste coordinate (8.7) si esplicita come:
n
x (t, v 2 , . . . , v n )
xk
,
(x1 (t),...,xn (t))
(8.8)
Dato che tutte le funzioni coinvolte sono continue, si prova facilmente che il membro di destra in (8.8) ` e ben denito per (t, v 2 , . . . , v n ) (t0 , t0 + ) D, essendo D Rn1 qualche palla aperta centrata nellorigine di Rn1 . Teorema 8.2. Sia M una variet` a dierenziabile C dotata di una metrica C riemanniana i j o lorentziana g = gij dx dx , e sia : (a, b) M una curva dierenziabile con (t) = 0 per ogni t (a, b), ` e assunta essere di tipo tempo nel caso lorentziano. Si scelga t0 (a, b), e si consideri una base del sottospazio N(t0 ) di T(t0 ) M normale a (t0 ), {e(t0 )i }i=2,...,n e si trasporti tale base lungo in {e(t)i }i=2,...,n per ogni t (a, b) usando la procedura del trasporto parallelo. Inne si consideri la funzione:
n
(t0 , t0 + ) D
(t, v 2 , . . . , v n ) exp(t)
i=2
v i e(t)i
(8.9)
per qualche > 0 ed essendo D Rn1 una palla aperta centrata nellorigine di Rn1 . Valgono i seguenti fatti. (a) Restringendo se necessario linsieme di denizione, la funzione (8.9) denisce un dieomorsmo locale. (b) Nella carta locale attorno ad dotata di coordinate (y 1 , y 2 , . . . , y n ) := (t, v 2 , . . . , v n ) , i coecienti di connessione della connessione di Levi-Civita soddisfano, per i = 1, . . . , n, i jk ((t)) = 0 , se t (t0 , t0 + ) e (j, k ) = (1, 1). (8.10)
(c) Se ` e una geodetica, nel sistema suddetto di coordinate locali attorno ad , i coecienti di connessione della connessione di Levi-Civita soddisfano: i jk ((t)) = 0 , se t (t0 , t0 + ) e i, j, k = 1, . . . , n. 155 (8.11)
Ulteriormente, nel sistema di coordinate detto, le derivate delle componenti della metrica si annullano lungo per t (t0 , t0 + ). Dimostrazione. Si considerino coordinate normali x1 , . . . , xn centrate in p = (t0 ) ed associate alla base { (t0 )} {e(t0 )i }i=2,...,n . In questo caso /x1 |p = (t0 ) e /xi |p = e(t0 )i per i = 2, . . . , n. La formula di derivazione delle funzioni composte produce immediatamente: y 1
n k
exp(t)
(t0 ) i=2
y i e(t)i
t=t0
k exp(t) (0) +
y i g k (t, y 2 , . . . , y n )
i=2 (y 2 ,...,y n )=(0,...,0)
dove le funzioni g k sono C . Dato che exp(t) (0) = (t), si conclude che: y 1
n k
exp(t)
(t0 ) i=2
y e(t)i
= t
(t) + 0 = (t0 ) =
t=t0
y 1
k
k = 1 , (t0 )
Per j = 2, . . . , n, usando losservazione 8.5 si arriva a (dove non vale la somma sugli indici ripetuti): y j
n k
exp(t)
(t0 ) i=2
y i e(t)i
y j
(y 2 ,...,y n )=(0,...,0)
exp(t)
(t0 ) i=2
y e(t)i
k = h ,
e pertanto il rango della funzione (8.9) vale n in (t0 ) e quindi tale funzione denisce un dieomorsmo locale attorno a p. Questo risultato conclude la prova di (a). La prova di (b) si ottiene procedendo come nella prova dellanalogo statement nel teorema 8.1, usando i fatti seguenti. (i) i Le geodetiche che partono da (t) con vettore tangente iniziale n i=2 v y i |(t) hanno equazione y 1 () = t (costante!) e y j () = v j per j = 2, . . . , n, questo comporta che k ij ((t)) = 0 if j i, j = 2, . . . , n. (ii) I vettori /y con j = 2, . . . , n soddisfano lequazione del trasporto parallelo rispetto ad , cio e rispetto a /y 1 : d k i k r + 1 ir ((t))j =0, dt j
k questo fatto implica che k 1j ((t)) = j 1 ((t)) = 0 per j = 2, . . . , n. Per la dimostrazione di (c) notiamo che, se ` e una geodetica, in coordinate y 1 , . . . , y n , la curva y j () = 0 costantemente se j = 2, . . . , n e y 1 () = ` e una geodetica perch e coincide con . Quindi con la stessa procedura usata precedentemente ne consegue che deve essere k 11 ((t)) = 0.
156
2 Denizione 8.3. Sia M una variet` a dierenziabile C dotata di una metrica riemanniana o lorentziana g di classe C . Si consideri una curva dierenziabile non singolare : (a, b) M che ` e ulteriormente assunta essere di tipo tempo se la metrica ` e lorentziana. Un sistema di coordinate denito in un intorno di un segmento di curva centrato in t0 (a, b): {(t) | t (t0 , t0 + )} , come precisato in (b) di teorema 8.2 ` e detto sistema di coordinate riemanniane adattate a .
8.3
Procediamo ora con la trascrizione, in termini matematici, del principio RG3. Successivamente ci interrogheremo sul signicato della nozione di gravit` a in relativit` a generale e vedremo che essa coincide con la curvatura dello spaziotempo. Partiamo, in conformit` a con i principi RG1 e RG2, con la seguente denizione di spaziotempo del tutto generale, che sar` a lambiente nel quale sviluppare tutta la teoria della Relativit` a generale: Denizione 8.4. Uno spaziotempo della relativit` a generale, o pi` u brevemente uno spaziotempo, ` e una variet` a dierenziabile di dimensione 4 e classe C dotata di una metrica C lorentziana g. Tale variet` a ` e assunta essere connessa ed orientata temporalmente e non ammettere curve causali futuro orientate (denizione 3.11) che siano chiuse. . Commenti 8.1. (1) La richiesta di non ammettere curve causali (futuro orientate) chiuse serve ad evitare problemi di carattere sico, per esempio riguardanti lesistenza delle soluzioni di equazioni dierenziali iperboliche descriventi levoluzione di sistemi sici, oltre ad evitare i paradossi causali della fantascienza. Nel caso dello spaziotempo di Minkowski, tali curve non possono esistere, ma possono esistere su variet` a lorentziane connesse orientate temporalmente. Tale condizione viene spesso raorzata richiedendo che non possano esistere curve causali futuro orientate che tornino arbitrariamente vicine a loro stesse. In termini matematici questa richiesta viene enunciata dalla cosiddetta condizione di causalit` a forte come segue: per ogni intorno aperto Up di ogni punto p M esiste un secondo intorno aperto di p, Vp Up , tale che ogni curva causale futuro orientata interseca Vp una volta sola, cio e dando luogo ad un insieme connesso. (2) Si potrebbe assumere che lo spaziotempo sia, pi` u semplicemente, temporalmente orientabile e non temporalmente orientato. In eetti, volendo essere rigorosi dal punto di vista sico fondazionale, la scelta dellorientazione temporale deve essere ssata dalle stesse leggi siche (la termodinamica), piuttosto che essere messa a mano. 157
8.3.1
In conformit` a con il principio RG1 le storie dei punti materiali nello spaziotempo sono descritte da curve dierenziabili di tipo causale, cio e da linee di universo nel senso della denizione 3.11. Se, in conformit` a con il principio RG2 assumiamo in particolare che la descrizione relativistica del moto in caduta libera nel campo gravitazionale classico assegnato sia data dal moto geodetico nello spaziotempo M rispetto alla connessione di Levi-Civita della metrica g, abbiamo come risultato che la linea di universo di un corpo classicamente sottoposto alla sola forza di gravit` a non dipende dalla massa, ma solo dallevento da cui parte la geodetica e dalla quadrivelocit` a iniziale della geodetica. Questo ` e in perfetta armonia con il risultato classico che il moto di un punto materiale soggetto al solo campo gravitazionale non dipenda dalla massa del punto, ma solo dalla posizione ed dalla velocit` a iniziale del punto. Consideriamo ora un corpo in caduta libera nel campo gravitazionale, ossia, nella visione einsteiniana, una geodetica causale diretta verso il futuro. Assumiamo pi` u fortemente che la geodetica , parametrizzata nel tempo proprio , sia di tipo tempo futuro (` e suciente assumere ci` o in un evento, le propriet` a del trasporto parallelo implicano che ci` o sar` a vero in tutti gli altri eventi raggiunti dalla geodetica). Parametrizziamo la geodetica con il tempo proprio che pu` o essere denito esattamente come nella denizione 4.2 senza alcun problema. In virt` u di RG1, nello spazio tangente a ciascun evento raggiunto dalla geodetica possiamo dare signicato sico agli oggetti matematici, mutuando tale signicato da quello che si ha in relativit` a speciale. Lo spazio tangente T ( ) M sar` a decomposto in una somma diretta ortogonale: L( ( )) ( ) , dove ( ) ha la naturale interpretazione di spazio di quiete istantaneo con un osservatore la cui evoluzione temporale ` e descritta dalla geodetica e il cui asse temporale ` e indicato dal vettore quadrivelocit` a V ( ) := ( ). In tale spazio di quiete, per costruzione, la velocit` a della luce vale c in ogni direzione isotropicamente, dato che la struttura ` e la stessa che si ha in un riferimento inerziale nello spaziotempo di Minkowski. Possiamo ripristinare la denizione di velocit` a di una curva di universo (generalmente diversa da ), rispetto allosservatore in quiete con , nellevento ( ) in cui le due curve si intersecano. La denizione 4.3 pu` o essere usata senza alcun problema e con le stesse propriet` a gi` a viste nello spazio di Minkowski. Si ha in particolare che le curve di tipo luce descrivono punti materiali in moto alla velocit` a della luce per ogni osservatore. In questo contesto possiamo introdurre la nozione di sistema di coordinate localmente inerziale attorno ad una geodetica di tipo tempo. Un sistema di coordinate localmente inerziale nellintorno di un segmento di geodetica ( ) con t (0 , 0 + ) ` e un sistema di coordinate riemanniane adattate a , x0 = c, x1 , x2 , x3 . Al solito x0 indica la coordinata temporale e x indica la generica coordinata spaziale = 1, 2, 3. Questo sistema di coordinate ` e quello assunto esistere nel principio RG3 come ora discuteremo. Consideriamo una geodetica di tipo tempo futuro corrispondente allevoluzione spaziotemporale di un corpo puntiforme lanciato dallosservatore descritto da e lasciato evolvere in caduta libera. Il lancio avviene nellevento (0 ). In coordinate riemanniane si ha che ` e descritta da xi = xi (), dove ` e un qualsiasi parametro ane, con (0) = (0 ) e pertanto x (0) = 0 e 158
2 d2 xi 2 d2
+ 2 O i ( ) .
=0
Daltra parte dovr` a anche valere, dato che ` e una geodetica: dxj dxk d2 xi i = ( ( )) . jk d2 d d Usando (c) del teorema 8.2 concludiamo che: d2 xi d2 Pertanto: xi () = xi (0) + =0.
=0
dxi d
+ 2 Oi () .
=0
(8.12)
Usando il fatto che e sono entrambe di tipo tempo futuro si conclude subito che deve essere dx0 /d|0 > 0. Questo signica che in un intorno di = 0, possiamo usare x0 = c e quindi il tempo del sistema di coordinate localmente inerziali, per parametrizzare la curva . Con questo parametro:
v0 := c dx d =0 dx0 d =0
dx d
= 0
` e la velocit` a iniziale del punto materiale individuato da nel sistema di coordinate localmente inerziali. La componente temporale di (8.12) fornisce allora: c () c0 = dx0 d + 2 O0 ()
=0
(8.13)
Questequazione dice, come richiesto dal principio RG3 che il moto del punto ` e visto come un moto rettilineo uniforme a meno di innitesimi di ordine superiore al secondo, e non semplicemente superiore al primordine, come accade per ogni moto approssimato con Taylor nellintorno di ogni ssato istante! In altre parole non vi ` e accelerazione. In questo preciso senso, nei sistemi di coordinate localmente inerziali il moto dei corpi sottoposti al solo campo gravitazionale appare rettilineo uniforme.
159
8.3.2
Il principio di equivalenza in forma forte e lequazione di conservazione del tensore energia impulso.
Per concludere commentiamo la seconda parte dellenunciato RG3. Le leggi della sica espresse in un evento di un riferimento inerziale in relativit` a speciale possono estendersi, al caso generale, ammettendo che in coordinate localmente inerziali abbiano la stessa forma che avevano in coordinate minkowskiane in relativit` a speciale. In questo schema rientrano anche le leggi esprimibili con equazioni dierenziali del primoordine: in tal caso possono essere trascritte, in coordinate localmente inerziali, in modo identico a come apparivano in relativit` a speciale tenendo conto del fatto che i coecienti di connessione si annullano in tali coordinate (esattamente su ) come i coecienti di connessione si annullavano in coordinate minkowskiane. Questo ` e il modo matematicamente preciso di intendere il principio di equivalenza forte. Seguendo questa idea possiamo aermare che sono dunque ancora valide nozioni come massa e quadri impulso per punti materiali e tensore energia impulso per sistemi estesi, anche in Relativit` a Generale e la formulazione della dinamica, entro certi limiti, avr` a ancora validit` a . Inoltre, trattando la descrizione covariante delle equazioni di Maxwell e le relative approssimazioni per denire i raggi luminosi (equazione delliconale), si verica che la storia delle particelle di luce (treni donda), anche in relativit` a generale devono essere descritte da curve di universo di tipo luce. Una conseguenza importante di questa idea, che gioca un ruolo fondamentale nel determinare le equazioni di Einstein che collegano la materia alla geometria, ` e data dallequazione (5.25): b T ab = 0 , che esprime nello spaziotempo di Minkowski la conservazione del tensore energia impulso T ab che esprime il contenuto energetico impulsivo della materia presente nello spaziotempo. Lequazione (5.25) ` e del primordine e pertanto ci si aspetta che sopravviva passando dalla ` per` relativit` a speciale alla relativit` a generale. E o importante osservare, che nel caso generale, tale equazione non corrisponde pi` u alla legge di conservazione di alcuna quantit` a integrata su sottovariet` a tridimensionali di tipo spazio. Questo perch` e, volendo seguire la stessa procedura seguita nello spaziotempo di Minkowski, per ottenere una grandezza conservata nel senso della sezione 5.3.1, bisogna contrarre il tensore energia impulso con un campo vettoriale covariante costante rispetto alla connessione di Levi-Civita, come spiegato nella sezione 5.3.3. Non ` e per nulla ovvio che uno spaziotempo generico ammetta un campo covettoriale costante rispetto alla connessione di Levi-Civita. Tuttavia la richiesta pu` o essere indebolita. Se la metrica dello spaziotempo ammette un campo vettoriale di Killing, cio` e un campo covettoriale K per il quale valgono le equazioni di Killing: a Ka + b Kb = 0 e se il tensore energia impulso ` e simmetrico (T ab = T ba ), allora il campo vettoriale: X b := Ka T ab
160
soddisfa lequazione, come si verica immediatamente dalla (5.25) e dallequazione di Killing tenendo conto della simmetria di T ab : a X a = 0 . Tale identit` a implica immediatamente una legge di conservazione per la grandezza X, n , come chiarito nella sezione 5.3.1 tenendo conto di (3) nella nota 5.3. Non entriamo in ulteriori commenti tecnici, ma diciamo solo che lequazione di Killing ` e equivalente alla richiesta che LK g = 0, cio` e la derivata di Lie della metrica si annulla quando ` e calcolata rispetto a K . Questo signica che la presenza di un campo di Killing corrisponde alla presenza di una simmetria geometrica della metrica: muovendosi lungo le linee integrali di K , le propriet` a metriche dello spaziotempo rimangono invarianti. Nel caso in cui K sia di tipo tempo, ha ancora senso pensare la grandezza conservata associata a X b := Ka T ab come a una forma di energia relativa alla direzione temporale individuata da K .
8.3.3
La questione che ci poniamo ora ` e cosa sia il corrispondente sico-matematico del campo gravitazionale classico nella nuova formulazione dello spaziotempo. La nozione classica basata sul concetto di forza non la possiamo pi` u usare, perch e le propriet` a del corrispondente relativistico del campo gravitazionale classico sono descritte dalla metrica e non da una quadriforza. Inoltre il principio di equivalenza che aerma che si possa annullare localmente il campo gravitazionale, non permetterebbe comunque luso di una forza o quadriforza per descrivere lazione gravitazionale, visto che una quadriforza non pu` o essere annullata (essendo un tensore) con la scelta oculata di un sistema di coordinate: se ` e nulla in un sistema di coordinate ` e nulla in ogni sistema di coordinate. Dal punto di vista classico, eccettuata la situazione (sicamente criticabile da diversi punti di vista) di un campo gravitazionale statico uniforme ed innitamente esteso nello spazio e nel tempo, in presenza di campo gravitazionale si manifesta accelerazione relativa tra qualche coppia di particelle lanciate nel campo con velocit` a iniziale arbitraria. Adotteremo questa evidenza sperimentale come denizione di presenza di gravit` a . Per enunciare la denizione abbiamo bisogno di qualche concetto matematico preliminare. Denizione 8.5. In uno spaziotempo (M, g), una famiglia a due parametri di geodetiche temporali ` e una classe di geodetiche di tipo tempo futuro (t, s), dove t (a, b) ` e un parametro ane che corre su ogni geodetica t (t, s). s (c, d) ` e un parametro che etichetta le singole geodetiche, e la funzione (t, s) (t, s) ` e C e denisce una sottovariet` a embedded di dimensione 2 su cui (t, s) siano coordinate ammissibili. In base alla denizione data , se T := /t e S := /s, vale [T, S ] = 0 , (8.14)
161
dato che T ed S sono i campi tangenti ad un sistema di coordinate. Questa identit` a , dato che la connessione di Levi-Civita ha torsione nulla [2], pu` o anche essere riscritta come: T k k S h S k k T h = 0 . (8.15)
Se s ` e ssato, il campo S | (t,s) rappresenta lo spostamento innitesimo verso una geodetica vicina a t (t, s). Per tale motivo S ` e detto campo di deviazione geodetica. La velocit` a di deviazione geodetica rispetto ad una geodetica (, s) ed al parametro ane t su di essa, ` e dunque espressa da v (t, s) := (T S )(t, s) e laccelerazione della deviazione geodetica ` e espressa da a(t, s) := (T T S )(t, s). Diamo allora la seguente denizione. Denizione 8.6. In un insieme aperto M con (M, g) spaziotempo, si dice che ` e presente gravit` a quando per qualche famiglia famiglia a due parametri di geodetiche temporali a valori in , laccelerazione della deviazione geodetica ` e non nulla in qualche evento su qualche geodetica della famiglia. Ricordiamo che su ogni variet` a C (pseudo)riemanniana M la cui metrica C ` e indicata con i j g = gij dx dx con connessione di Levi-Civita , si denisce un campo tensoriale detto tensore di curvatura di Riemann [2], denito punto per punto come lunico tensore R(p) Tp M Tp M Tp M Tp M tale che (i j j i )T k |p = Rijr k (p)T r (p) , (8.16)
per ogni campo tensoriale controvariante T (di classe C ). Il fatto che Rijr k (p) deniscano un tensore segue dal fatto che, come si prova per computo diretto, lapplicazione U V T U i V j (i j j i )T k |p dipende solo dal valore assunto da T, U, V in p ed ` e lineare, e tenendo inne conto che le trasformazioni lineari che associano tensori a tensori sono a loro volta rappresentabili tramite tensori. Il fatto che il campo tensoriale p R(p) sia C risulta immediatamente dal fatto che in coordinate il calcolo diretto mostra che: Rijr k = k k jr ir xj xi
k l k (l ir lj jr li ) , l
(8.17)
che ` e una funzione C delle coordinate. Ricordiamo che il tensore di curvatura di Ricci, Ric, che gioca un ruolo importante nelle equazioni di Einstein ` e dato dalla contrazione: Ricik = Rijk j . Ricordiamo inne che una variet` a (pseudo)riemanniana si dice localmente piatta [2] se ogni suo punto ` e contenuto in una carta locale nella quale la metrica ` a componenti costanti (in forma 162
` chiaro per costruzione che, se M ` diagonale canonica). E e localmente piatta, allora R(p) = 0 in ogni punto della variet` a , dato che in tal caso, nellintorno di ogni p M esiste un sistema di coordinate in cui la metrica assume valore costante e per cui i coecienti di connessione sono tutti nulli. In tale sistema di coordinate R si deve annullare in virt` u della (8.17). Essendo R un tensore, si annullar` a allora in ogni sistema di coordinate. In realt` a , usando il teorema di Frobenius, si riesce a provare una proposizione pi` u forte [2]: Proposizione 8.1. Sia (M, g) una variet` a (pseudo)riemanniana (di classe C con metrica g di classe C ). (M, g) ` e localmente piatta se, e solo se, il tensore di Riemann associato alla connessione di Levi-Civita si annulla in ogni suo punto. Mostriamo ora come laccelerazione della deviazione geodetica sia connessa al tensore di curvatura di Riemann. Teorema 8.3. In uno spaziotempo (M, g), si consideri una famiglia a due parametri di geodetiche temporali (t, s), dove t (a, b) e s (c, d) e siano T := /t e S := /s. Vale allora la formula della deviazione geodetica: (T T S )k = Rijl k S j T i T l . Dimostrazione. Usando (8.15) si trova subito:
T i i (T j j S k ) = T i i S j j T k ,
(8.18)
quindi
T i i (T j j S k ) = T i i S j j T k + S j T i i j T k .
Usando nellultimo memebro la (8.17), si ha: T i i (T j j S k ) = T i i S j j T k + S j T i j i T k Rijl k S j T i T l . Usando ancora (8.15) nel primo addendo a secondo memebro troviamo: T i i (T j j S k ) = S i i T j j T k + S j T i j i T k Rijl k S j T i T l . Scambiando i nomi degli indici i e j nel primo addendo a secondo membro si ottiene inne: T i i (T j j S k ) = S j j T i i T k + S j T i j i T k Rijl k S j T i T l . Possiamo riscrivere tutto come:
T i i (T j j S k ) = S j j T i i T k Rijl k S j T i T l .
163
Ricordando il signicato di T , valendo T i i T k = 0 a causa dellequazione della geodetica di cui T ` e il vettore tangente, otteniamo la (8.18). 2 In base alla denizione 8.6 possiamo concludere che in una regione di spaziotempo non ` e presente gravit` a quando il tensore di curvatura di Riemann si annulla in tale regione. In realt` a, sfruttando le propriet` a di simmetria degli indici del tensore di Riemann, si pu` o provare che vale anche il viceversa [2]: se in un insieme aperto di spaziotempo non ` e presente gravit` a allora il tensore di Riemann ` e nullo in tale regione. Concludiamo che lassenza di gravit` a` e equivalente alla locale piattezza dello spaziotempo. Nota 8.6. (1) Nel senso chiarito sopra, lequivalente della gravit` a nella relativit` a generale ` e la curvatura (intesa come tensore di curvatura di Riemann) dello spaziotempo. Equivalentemente, lassenza di gravit` a` e equivalente alla locale piattezza dello spaziotempo. (2) I successivi sviluppi della relativit` a generale mostrano che la curvatura, nel senso pi` u debole dato dal tensore di curvatura di Ricci2 , ` e legata alle masse presenti nello spaziotempo attraverso le celebri equazioni di Einstein, come vedremo pi` u avanti. Una conseguenza immediata del nuovo punto di vista ` e che, in presenza di curvatura (cio` e di gravit` a in termini sici), in generale non esistono pi` u i riferimenti inerziali estesi della relativit` a speciale. In situazioni di curvatura debole ci dobbiamo aspettare (e questo si ottiene davvero sviluppando la matematica della relativit` a ) che in regioni relativamente estese lontane dalle masse, esistano sistemi di coordinate tali che, con buona approssimazione, abbiano propriet` a vicine a quelle dei sistemi di riferimento minkowskiani. Questo risultato ha una conseguenza molto profonda dal punto di vista epistemologico, che cambia radicalmente uno dei pilastri su cui si basava la sica classica. Dal punto di vista classico i riferimenti inerziali erano assegnati a priori e non erano conseguenza di alcun principio pi` u profondo se non di quello che ne sanciva semplicemente lesistenza. Ora lesistenza o meno dei sistemi di riferimento inerziali dipende dalla curvatura dello spaziotempo che ` e legata, tramite le equazioni di Einstein, al contenuto energetico-impulsivo dello spaziotempo rappresentato dal tensore energia impulso della materia presente in esso.
8.4
In questa sezione arriveremo a scrivere le equazioni del campo gravitazionale di Einstein, cio` e le equazioni che legano il tensore energia impulso della materia alla metrica. Per prima cosa mostriamo come, sotto ragionevoli ipotesi, le equazioni di Newton del moto di un punto materiale
2 Il fatto che le equazioni di Einstein leghino le sorgenti di gravit` a al tensore di Ricci e non a quello di Riemann ` e dovuto, dal punto di vista sico, al fatto che la gravit` a si propaga fuori dalle sorgenti, per cui ci pu` o essere curvatura (tensore di Riemann) anche fuori dalle sorgenti.
164
in un campo gravitazionale classico si ottengano come equazione della geodetica, in conformit` a con lassunto RG3.
8.4.1
Assumiamo vera lidea di Einstein che la gravit` a sia in qualche modo legata alla metrica dello spaziotempo, in modo tale che lo spaziotempo localmente piatto (localmente di Minkowski) descriva la sica dello spaziotempo in assenza di gravit` a. Dobbiamo allora aspettarci che, se la variet` a non ` e piatta (eventualmente anche a causa della scelta spagliata delle coordinate), le geodetiche soddisno unequazione vicina a quella che descrive il moto dei corpi in caduta libera in presenza di un potenziale gravitazionale della meccanica newtoniana: d2 x = 2 dt x = 1, 2, 3 .
Ci` o deve accadere in qualche limite classico assumendo che la metrica si discosti poco dalla metrica di Minkowski, ma assumendo anche che le velocit` a in gioco siano piccole rispetto alla velocit` a della luce, perch e questa ` e la situazione nella quale, dal punto di vista sperimentale, sappiamo che la sica di Newton funziona benissimo. Vogliamo vericare se questa idea ` e sensata e trovare, nellapprossimazione fatta, il corrispondente geometrico, del potenziale newtoniano . Consideriamo uno spaziotempo della relativit` a generale ed assumiamo che esista un sistema di coordinate x0 = ct, x2 , x2 , x3 , nella regione di spaziotempo considerata , in cui le propriet` a metriche e le propriet` a cinematiche dei sistemi sici presenti in abbiano un comportamento semiclassico / relativistico speciale. Pi` u precisamente faremo le seguenti assunzioni. 0 (a) La coordinata x = ct deve essere di tipo tempo, in altre parole g00 = g(x0 , x0 ) < 0. Anche il covettore dx0 sar` a assunto essere ovunque di tipo tempo (questo non ` e implicato dalla precedente richiesta), in modo tale che le sottovariet` a a x0 costante, su cui sono denite le coordinate x1 , x2 , x3 , sono sottovariet` a di tipo spazio. (b) La velocit` a in gioco, del sistema sico considerato, pensata come il vettore colonna di derivate dx a della luce. ( d , = 1, 2, 3, deve essere piccola rispetto al valore c della velocit` indica qui il tempo proprio). (c) Le componenti della metrica saranno assunte essere molto vicine alle componenti della metrica di Minkowski : gij = ij + hij con |hij | < < 1, ed anche le variazioni temporali della metrica saranno assunte essere trascurabili rispetto a quelle spaziali (metrica quasi stazionaria): hij h < < xij , con = 1, 2, 3. x0 Consideriamo allora, nelle nostre coordinate che soddisfano (a), lequazione della geodetica per un punto materiale che soddisfa (b) quando la metrica, in coordinate, soddisfa (c). Assumendo che la geodetica sia parametrizzata con il tempo proprio, la richiesta sulla quadrivelocit` a c2 = g( | ) ,
165
si scrive esplicitamente:
1 = (1 + h00 )
dt d
1 c2
3 =1
dx d
2 3 dt dx 1 + 2 c =1 d d c
h
, =1
dx dx . d d
In base alle assunzioni in (b) e in (c), possiamo trascurare quasi tutto ottenendo: 1 = dt . d
Per cui, nel seguito, identicheremo t ed il tempo proprio . Lequazione della geodetica: d2 xi 1 ir dxj dxk = g ( , k grj + xj gkr xr gjk ) x dt2 2 dt dt tenendo conto della decomposizione gij = ij + hij , dove i coecienti ij sono costanti, si possono equivalentemente scrivere: gri 1 dxj dxk d2 xi r = ( h + h h ) j k rj x jk x kr dt2 2 x dt dt
scegliendo r = = 1, 2, 3 diventa:
3 d2 x 1 d2 x dxj dxk + h0 2 = (xk hj + xj hk x hjk ) . 2 dt dt 2 dt dt =1
Nel primo membro possiamo trascurare il secondo addendo rispetto al primo dato che |hij | < <1 per ipotesi, ottenendo: d2 x 1 dxj dxk = . ( k hj + xj hk x hjk ) x dt2 2 dt dt e quindi c 3 d2 x c2 dx h00 ) h0 ) h h + = ( ( h + h 0 0 0 0 x 0 0 x x x dt2 2 x 2 =1 x dt 1 3 dx dx (x h + x h x h ) . 2 , =1 dt dt
Nel secondo membro, le ultime due somme possono essere trascurate rispetto al primo addendo a secondo membro, a causa del fattore c2 e del fatto che | dx < c. Nellespressione che rimane, dt | < possiamo trascurare x0 h0 + x0 h0 rispetto a x h00 per lipotesi, che abbiamo fatto, di metrica quasi stazionaria. Giungiamo alla formula nale: d2 x c2 h00 = dt2 2 x 166 = 1, 2, 3 . (8.19)
che pu` o anche essere scritta, dato che gij = ij + hij in (8.21) e i coecienti ij sono costanti nelle coordinate considerate: d2 x c2 g00 = = 1, 2, 3 . (8.20) dt2 2 x Queste sono le equazioni di Newton per un corpo nel campo gravitazionale con potenziale = c2 g00 2 oppure equivalentemente = c2 h00 . 2 (8.21)
La dierenza nelle due scelte non ha rilevanza in sica classica, in cui il potenziale gravitazionale ` e denito a meno di una costante additiva. Tale costante si pu` o convenzionalmente ssare richiedendo che allinnito il potenziale si annulli. Se ` e vero che lontano dalle masse la metrica tende a diventare quella di Minkowski, tale convenzione corrisponde ad identicare 2 con c2 h00 .
8.4.2
Giungiamo al problema pi` u interessante, cio` e di scrivere le equazioni relativistiche che corrispondono, nella sica di Newton alle equazioni di Poisson: = 4k (8.22)
che dicono come il potenziale gravitazionale ` e generato dalla materia, classicamente individuata dalla densit` a di massa . Sopra k ` e la costante gravitazionale che appare nella formula di Newton di gravitazione universale. Le equazioni relativistiche che corrispondono (8.22) dovranno collegare la materia alla geometria dello spaziotempo. Si pu` o vedere con esempi concreti che, in situazioni semiclassiche (in cui, in particolare le velocit` a delle parti dei sistemi sici sono piccole rispetto alla velocit` a della luce), la componente T 00 del tensore energia impulso, che di fatto coincide con la densit` a di energia, domina su tutte le altre componenti. Quindi il contenuto energetico-impulsivo ` e dominato dalla parte energetica, che pu` o pensarsi come uno scalare se le velocit` a in gioco tra i riferimenti sono piccole rispetto a c. Lidea di Einstein fu quella che, in regimi ultrarelativistici, il tensore energia impulso dovesse prendere il posto di nelle equazioni corrispondenti alla (8.22) e che la nuova equazione connettesse la geometria al tensore energia impulso Tij descrivente, localmente, la materia. Dato che Tij ` e un tensore, nel caso pi` u elementare possibile, lequazione cercata dovr` a avere una forma del tipo: Hij = Tij , (8.23) dove a primo membro appare un tensore costruito con la sola geometria dello spaziotempo cio` e, in coordinate, con le componenti della metrica e le loro derivate. Dato che in (8.22) il campo appare derivato al secondo ordine, lidea di Einstein, tenendo conto di (8.20), fu che H dovesse essere scritto con al pi` u le derivate seconde della metrica gij in ogni sistema di coordinate.
167
Un punto cruciale ` e che, come osservato nella sezione 8.3.2, il tensore energia impulso deve soddisfare le equazioni di conservazione: j T ij = 0 , e questa richiesta implica un fortissimo vincolo sul primo membro di (8.23). Lidea di Einstein fu che lequazione di conservazione appena scritta doveva vedersi come una conseguenza della (8.23). Questo signica che H ij deve essere un tensore, costruito in componenti con al pi` u le derivate seconde delle componenti del tensore metrico e che soddis, per costruzione, lequazione: j H ij = 0 . (8.24)
Si pu` o dimostrare che, a meno della scelta di due costanti, esiste un solo tensore che soddisfa tutti i vincoli detti, ed ha la forma: 1 Hij = Ricij gij S + gij . (8.25) 2 dove e sono costanti da determinare. pu` o essere ssata imponendo che le equazioni (8.23) si riducano a (8.22), nel limite di campi deboli, cio` e gij = ij + hij con |hij | < < 1, ammettendo c che , a meno di costanti additive, corrisponda a 2 h00 come in (8.20), ed assumendo che il termine T 00 = c2 prevalga sulle altre componenti del tensore energia impulso. Si trova in tal modo che: c4 = . 8k Le equazioni di Einstein risultano dunque essere: 1 8k Ricab gab S + gab = 4 Tab . 2 c (8.26)
La costante ` e detta costante cosmologica e il suo valore non ` e ancora noto, malgrado sia connesso con recentissime osservazioni sperimentali.
8.5
In questa sezione ci occuperemo della nozione generale di sistema di riferimento in relativit` a generale, tenendo conto che non possiamo pi` u basarci sulla struttura di spazio ane dello spaziotempo, come accadeva nel caso dello spaziotempo di Minkowski. La discussione porter` a a rivedere la procedura di sincronizzazione einsteiniana che abbiamo discusso costruendo la relativit` a speciale nella sezione 1.2.
8.5.1
Come gi` a discusso nel caso delle geodetiche di tipo tempo, possiamo mutuare dalla Relativit` a Speciale alcune nozioni metriche locali nel caso di una generica linea di universo di tipo tempo. 168
Data una linea di universo = (t) di tipo tempo, la quadrivelocit` a della linea di universo nellevento (t) ` e , come nel caso della relativit` a speciale, il vettore tangente alla curva V(t) normalizzato con la richiesta g(V(t) |V(t) ) = c2 . Si osservi che il parametro t ` e del tutto generico ed, in generale, non ha le dimensioni di un tempo. Viceversa, il parametro della linea di universo associato alla scelta V = / del vettore tangente, ` e , in base al postulato RG1 il tempo proprio della linea di universo, cio e il tempo misurato da un orologio ideale in quiete con il punto materiale la cui storia ` e descritta da . Lo spazio tangente T (t) M sar` a decomposto in una somma diretta ortogonale rispetto alla metrica g: L( (t)) (t) , (8.27)
dove (t) ha la naturale interpretazione di spazio di quiete innitesimo istantaneo in (t) con il punto materiale la cui storia ` e descritta da . La metrica indotta su (t), che si riduce al numero g( (t)| (t)), individua lunit` a di misura del tempo proprio, la metrica spaziale indotta su (t) descrive gli strumenti sici per misurare le distanze e gli angoli attorno a (t). Questa nozione di spazio di quiete innitesimo ` e compatibile con la procedura di sincronizzazione di Einstein che abbiamo usato in Relativit` a Speciale, dato che la struttura geometrica e linterpretazione sica ` e esattamente la stessa che si ha nello spaziotempo di Minkowski. (In ogni caso il fatto che la velocit` a della luce risulti essere pari a c isotropicamente segue subito da quanto diremo nellosservazione (2) sotto, eseguendo esplicitamente il calcolo e tenendo conto del fatto che le particelle di luce evolvono lungo curve di tipo nullo). Vogliamo ora cercare di estendere queste nozioni locali (a rigore innitesime) cercando di denire una nozione di sistema di riferimento esteso in Relativit` a Generale, tenendo per` o conto che non abbiamo pi` u a nostra disposizione alcuna struttura ane come accadeva invece in M4 . Come ora illustreremo, lidea pi` u generale di sistema di riferimento in uno spaziotempo (M, g) ` e quella di una classe C di curve dierenziabili di tipo tempo, assegnate con una legge dierenziabile, tali che: (a) riempiano tutto lo spaziotempo e (b) non si autointersechino e neppure si intersechino a due a due. La denizione di C include lassegnazione dierenziabile (anche al variare della curva) di un parametro t, che descrive ciascuna curva selezionando un vettore tangente, t , diretto verso il futuro. Vediamo in quale modo la classe C corrisponde ad un sistema di riferimento. Ogni evento p dello spaziotempo sar` a intercettato esattamente da una di queste curve p e da un unico valore del parametro tp lungo tale curva. La particolare curva p che intercetta p sar` a la posizione spaziale di p nel riferimento C , mentre il valore tp individuer` a la posizione temporale di p nel riferimento C . Si osservi che il parametro t non coincide con il tempo proprio della linea di universo considerata se il vettore tangente non ` e unitario (assumendo c = 1). Lassegnazione di C con la scelta del parametro privilegiato t, individua una campo dierenziabile X di vettori di tipo tempo, Xp , per ogni punto dello spaziotempo p M . Xp ` e il vettore tangente in p (calcolato rispetto al parametro t) dellunica curva di che passa per p. Viceversa C` e quasi completamente ricostruito da X in termini delle curve integrali di tale campo vettoriale. In questa costruzione, il parametro delle curve integrali coincide con t a meno della scelta dellorigine su ciascuna curva, cio` e a meno di una costante additiva che dipende dalla curva. 169
In base allultima osservazione diamo una denizione indebolita di sistema di riferimento evitando, per il momento, di ssare una nozione di tempo globale, cio` e di ssare lorigine del parametro temporale t su ogni linea di universo del riferimento. La seguente nozione di riferimento, se non ` e precisato altro, permette solo di ssare la posizione di ogni evento dello spaziotempo (ma non la posizione temporale) e ci` o ne giustica il nome. Denizione 8.7. Un sistema di riferimento spaziale X in uno spaziotempo (M, g) ` e un campo vettoriale dierenziabile di tipo tempo X orientato verso il futuro. Dato un evento p M , lunica curva integrale p di X che intercetta p ` e la posizione spaziale di p nel riferimento spaziale X. Un punto materiale ` e in quiete nel riferimento spaziale X se gli eventi sulla linea di universo del punto materiale hanno la stessa posizione spaziale in X Commenti 8.2. (1) La nozione di punto materiale in quiete con un riferimento ` e stata data indipendentemente da ogni nozione di spazio di quiete di un riferimento. Tale denizione si estende ovviamente al caso di corpi costituiti di pi` u di un punto materiale. (2) Si osservi che non abbiamo ancora parlato delle nozioni metriche temporali e spaziali che si devono pensare associate con un riferimento spaziale X. Nello spazio tangente a ciascun evento p M , possiamo comunque introdurre le nozioni metriche locali, come gi` a detto precedentemente. Come gi` a detto, lo spazio tangente Tp M ` e decomposto in una somma diretta ortogonale rispetto alla metrica g: L(Xp ) Xp , (8.28) e valgono le interpretazioni siche precedentemente discusse. In particolare, se = (u) ` e la linea di universo di un generico punto materiale, possiamo sempre decomporre il suo vettore tangente rispetto alla decomposizione ortogonale detta sopra di T(u) M : (u) = tX(u) + X(u) . La velocit` a di rispetto al riferimento spaziale X sar` a allora data dal vettore di (u) X(u) c v(u) |X := g(X(u) |X(u) ) t Il fattore
c g(X(u) |X(u) )
(8.29)
riferita al vettore X (t) e non alla quadrivelocit` a vettore V (t) , ovvero alla nozione di tempo t e non al tempo proprio valutato lungo le linee di universo del riferimento X. Malgrado la denizione introdotta di sistema di riferimento spaziale sia globale, la nozione appena usata di spazio di quiete con il riferimento (t) ` e ancora locale, pi` u precisamente relativa al solo spazio tangente. Apparentemente una denizione di spazio di quiete in grande, in comune per tutte le linee di universo di X pu` o essere data da una sottovariet` a tridimensionale S0 che 170
intersechi ogni linea di universo del riferimento in un corrispondente (t ) e che sia tangente ad ogni (t ) nei punti di intersezione. Si osservi che assegnando una tale sottovariet` a S0 si pu` o ssare su S0 lorigine del parametro t per ogni curva integrale di X, dando luogo ad una nozione globale di tempo. Tuttavia vi sono situazioni in cui una tale sottovariet` a , normale ad ogni curva integrale, non esiste, come vedremo pi` u avanti. Daremo pertanto una nozione pi` u generale di spazio di quiete di un riferimento spaziale X. Possiamo ora introdurre la nozione di spazio di quiete con un riferimento spaziale X denendo la nozione di tempo universale. Lidea ` e di decomporre lo spaziotempo come lunione disgiunta di spazi tridimensionali Su etichettati da un parametro u che denisce un tempo universale. In questottica, ogni Su denisce lo spazio al tempo u. Per esplicitare in termini matematici questidea, il parametro u deve essere pensato assumere i valori di funzione dierenziabile U : M R che soddisfa dU = 0 in ogni evento dello spaziotempo. In tal modo ciascuno degli elementi non vuoti della classe di insiemi di eventi della forma Su := {p M | U (p) = u}, con u R, acquista la struttura di sottovariet` a embedded di dimensione 3, come ragionevole volendo denire una nozione di spazio al tempo ssato. Per costruzione risulta subito che, come detto sopra: (a) Su Su = se u = u e, (b) per ogni p M esiste up R con p Sup . In altre parole M ammette una foliazione data dalle sottovariet` a tridimensionali Su . Unulteriore richiesta, meno innocua di quanto potrebbe sembrare (e che giusticheremo pi` u avanti) ` e che ogni Su sia una sottovariet` a di tipo spazio. Questo ` e equivalente a richiedere, in base alla proposizione provata sopra, che dU sia ovunque di tipo tempo. Si osservi che questultima richiesta implica automaticamente che dU = 0 ovunque ed, anche, che dU possa solo essere ovunque orientato verso il futuro oppure ovunque orientato verso il passato, dato che la variet` a lorentziana (M, g) ` e supposto temporalmente orientabile e temporalmente orientata. Denizione 8.8. Se (M, g) ` e uno spaziotempo, un tempo universale ` e una funzione dierenziabile U : M R, con dU di tipo tempo ovunque su M . Se u R ` e tale che Su := {p M | U (p) = u} = , la sottovariet` a embedded tridimensionale di tipo spazio Su ` e detta spazio al tempo (universale) u. Se p M , lunica Sup che include p ` e la posizione temporale di p rispetto al tempo universale U. Quando sono assegnati un riferimento spaziale X ed un tempo universale U , ci sono due nozioni di tempo: una ` e quella data dal parametro t delle linee integrali di X e laltra il tempo universale U che denisce lo spazio Su ad ogni tempo u. Perch e queste due nozioni siano in accordo ` e suciente che X e U soddisno il seguente requisito: dU, X = 1 ovunque su M , (8.30)
171
che pu` o essere riscritta come: d U ( (t)) = 1 dt per ogni curva integrale di X.
Questa identit` a equivale inne alla seguente condizione di evidente signicato sico. Per ogni curva integrale di X esiste una costante c R tale che U ( (t)) = t + c per ogni t nellintervallo di denizione di . (8.31)
Possiamo allora decidere di scegliere la costante additiva arbitraria insita nella denizione del parametro t di ogni curva integrale di X in modo tale che c = 0 e quindi t coincida ovunque con u. Nota 8.7. Si osservi che (8.31) implica banalmente che ogni curva integrale di X pu` o intersecare ogni Su al pi` u una volta. Sotto queste ipotesi ` e ragionevole interpretare ogni Su come lo spazio di quiete al tempo u del riferimento spaziale X e pensare alla coppia (X, U ) come un sistema di riferimento in M . Denizione 8.9. Nello spaziotempo (M, g), un sistema di riferimento spaziale X ed un tempo universale U sono detti compatibili se vale la condizione (8.30). In tal caso, la coppia (X, U ) con la scelta c = 0 delle costanti in (8.31) per ogni linea integrale di X denisce un sistema di riferimento in M ed ogni spazio a tempo universale ssato Su ` e detto spazio di quiete al tempo u del riferimento (X, U ). Nota 8.8. Nel seguito indicheremo un sistema di riferimento con la coppia (X, U ) sottintendendo la scelta c = 0 delle costanti in (8.31) per ogni linea integrale di X. Commenti 8.3. (1) Se ` e assegnato un tempo universale U ` e facile costruire un riferimento spaziale X compatibile con esso oppure con il tempo universale U . Tale campo vettoriale pu` o essere costruito come segue assumendo che dU sia orientato verso il passato (in caso contrario la costruzione funziona per U ). Dato che dU ` e di tipo tempo si pu` o scegliere con dierenziabilit` a un campo vettoriale di tipo Y tempo orientato verso il futuro. Per costruzione dU, Y = Y a (dU )b gab =: f > 0 ovunque nello spaziotempo. Conseguentemente il campo vettoriale X su M individuato, per ogni p M , dal vettore Xp := f (p)1 Yp ` e ben denito, di tipo tempo futuro e soddisfa la condizione di compatibilit` a (8.30) rispetto a U . (2) Una classe sicamente importantissima di spazitempo, gli spazitempo globalmente iperbolici [5, 6, 26], in cui ricadono quasi tutti gli spazitempo interessanti per le applicazioni in sica, ammettono sempre una funzione tempo universale ed una corrispondente foliazione data dalle variet` a Su in virt` u delle propriet` a geometriche da essi possedute. In tal caso tutte le sottovariet` a 172
Su risultano anche essere dieomorfe tra di esse, cosa non garantita nel caso generale. (3) Nella cosiddetta trattazione ADM delle equazioni di Einstein [26] lo spaziotempo viene eettivamente decomposto usando un sistema di riferimento nel senso sopra denito. Il campo vettoriale X viene ulteriormente decomposto come X a = N (dU )a + N a dove il campo vettoriale N a ` e detto campo di shift, mentre il campo scalare N si dice lapse function. Tali oggetti giocano un importante ruolo nella soluzione delle equazioni di Einstein. (4) Nel caso in cui si lavori nello spaziotempo di Minkowski (M4 , ), un esempio evidente di sistema di riferimento nel senso generalizzato appena denito, ` e dato da ogni sistema di riferimento inerziale F . In tal caso il campo X coincide con il campo F , mentre il tempo universale U pu` o essere preso come la coordinata temporale tF di ogni sistema di coordinate minkowskiane che individua F .
8.5.2
Il problema della metrica spaziale ed il legame con procedure di sincronizzazione non einsteiniane.
La domanda che ora ci poniamo ` e quale tipo di metrica ha senso sico assegnare sopra ogni spazio di quiete di un riferimento (X, U ) nel senso della denizione 8.9, richiedendo che tale metrica descriva le propriet` a sico-metriche dello spazio del riferimento che si possono investigare con strumenti di misura sici quali regoli, teodoliti ecc. La domanda non ` e aatto banale. Come ricordato sopra, nel caso in cui si lavori nello spaziotempo di Minkowski (M4 , ), un esempio ovvio di sistema di riferimento nel senso generalizzato appena denito, ` e dato, seguendo la denizione 3.4 e la discussione che precede tale denizione, da ogni sistema di riferimento inerziale F . In tal caso il campo X coincide con il campo F ed ` e quindi normalizzato a 1, mentre il tempo universale U pu` o essere preso come la coordinata temporale tF di F come denita in relativit` a speciale. In tal caso che la metrica sugli spazi di quiete del riferimento coincide, per costruzione, con la metrica indotta da quella dello spaziotempo. Possiamo ragionevolmente aspettarci che tale scelta abbia senso sico un riferimento (X, U ) in uno spaziotempo generico, (M, g), quando gli spazi Su risultino essere ovunque normali alle linee integrali del campo X. In tal caso lo spazio tangente di ogni evento p Su coincide con il sottospazio Xp della decomposizione ortogonale (8.27) ereditandone le propriet` a metriche. Nel caso in cui Su non sia normale ai sottospazi Xp la questione rimane aperta. Osserviamo che la scelta delle ipersuperci Su come spazi di quiete sono individuate come il luogo degli eventi in cui gli orologi delle linee di universo del riferimento spaziale X, che segnano il tempo universale U , segnando un valore comune u. Quindi lassegnazione delle ipersupercie Su corrisponde, dal punto di vista sico, ad una precisa procedura di sincronizzazione degli orologi in quiete nel riferimento. Deve essere chiaro che tali orologi non sono orologi ideali nel caso generale, dato che valutano un tempo universale che non coincide, in generale, con il tempo proprio delle linee di universo del riferimento. Tuttavia, per esempio nello spaziotempo di Minkowski, pu` o comunque accadere che U coincida con il tempo proprio delle linee di universo di X, ma gli
173
spazi di quiete Su a U costante non coincidano comunque con sottovariet` a tridimensionali perpendicolari a X. Si pu` o facilmente produrre un riferimento di questo genere in (M4 , ), denendo X come F per un sistema di riferimento inerziale F , ma scegliendo lorigine del tempo proprio di tutte le linee integrali di F sullo spazio di quiete F ,t0 di un altro sistema di riferimento F = F , per un ssato valore del tempo t0 di F . In questo modo viene a denirsi una funzione di tempo universale U , che coincide ancora con il tempo proprio su ciascuna linea integrale di F , ma tale che le sottovariet` a a U costante, Su , sono ottenute con traslazioni rigide, lungo le linee integrali di F dello spazio di quiete F ,t0 . Pertanto le Su non sono mai perpendicolari a F . Tuttavia la coppia (X, U ) costruita in questo modo denisce un sistema di riferimento nel senso generale. Nel sistema di riferimento costruito in questo modo gli orologi ideali portati da ciascuna linea di universo del riferimento devono essere stati sincronizzati in modo dierente da quanto stabilito nella procedura di sincronizzazione di Einstein che, come sappiamo, corrisponde ad avere spazi di quiete perpendicolari alle curve integrali di F . Tuttavia non ` e chiaro, dal punto di vista sperimentale, in cosa consista tale nuova procedura di sincronizzazione. Se sapessimo come misurare le distanze sugli spazi di quiete Su e conoscessimo il valore della velocit` a della luce c nelle varie direzioni lungo percorsi aperti (che non ` e detto coincidere ancora con c in ogni direzione), la procedura di sincronizzazione potrebbe allora essere descritta, similmente a quella einsteiniana, imponendo che la velocit` a della luce abbia il valore c quando valutata tra due orologi in quiete nel riferimento considerato e posti distanza nota. Avremmo in tal modo anche una possibile procedura sica per costruire materialmente il sistema di riferimento (X, U ) in (M4 , ). In realt` a abbiamo due informazioni sulle quali possiamo contare: (1) levidenza sperimentale che il valore della velocit` a della luce ` e costante e vale c su ogni percorso chiuso in ogni sistema di riferimento se valutata con un orologio ideale (cio` e rispetto al tempo proprio), (2) le particelle di luce sono descritte nello spaziotempo da curve di tipo luce (geodetiche), come osservato alla ne della sezione 8.3.1. Mostriamo come, assumendo la validit` a di (1) nel caso pi` u generale possibile per i sistemi di riferimento della denizione 8.9 ed usando (2), sia possibile assegnare una metrica in negli spazi di quiete di un generico riferimento (X, U ) e come, a posteriori, si possa interpretare la scelta degli spazi Su in termini di una precisa procedura di sincronizzazione, almeno nel caso in cui U sia il tempo proprio lungo le linee di universo del riferimento. In uno spaziotempo generico (M, g), consideriamo un riferimento (X, U ) nel senso della denizione 8.9. Fissiamo un evento p M in modo tale che p Sup con up = U (p). Consideriamo un secondo evento nello stesso spazio di quiete q Sup , idealmente innitamente prossimo a p, che sia individuato dal vettore Yp Tp Sup . Consideriamo quindi una particella di luce che, partendo dalla linea di universo del riferimento che contiene p, arrivi a quella che contiene q e ritorni sulla linea di universo di p. Le due parti della storia della particella di luce saranno descritte da due vettori nulli che, data linnitesimalit` a del processo possiamo pensare nello spazio tangente di p: N+ Tp M e N Tp M . Possiamo decomporre questi vettori come N = u Xp Yp 174
dove u 0. La richiesta che N sia di tipo luce implica che: g(u Xp Yp |u Xp Yp ) = 0 che si sviluppa come: (u )2 g(Xp |Xp ) 2u g(Xp |Yp ) + g(Yp |Yp ) = 0 . Queste relazioni permettono inne di ricavare, tenendo esplicitamente conto del vincolo u 0, di g(Xp |Xp ) > 0 e di g(Yp |Yp ) 0: g(Xp |Yp )2 g(Xp |Xp )g(Yp |Yp ) g(Xp |Yp ) u = + . g(Xp |Xp ) g(Xp |Xp ) Lintervallo di tempo universale totale, perch` e la luce compia il percorso di andata e ritorno, ` e quindi: g(Xp |Yp )2 g(Xp |Xp )g(Yp |Yp ) . (8.32) u = 2 g(Xp |Xp ) g(Xp |Xp ) Moltiplicando i due membri per otteniamo il corrispondente intervallo di tempo c proprio, rispetto alla linea di universo del riferimento (X, U ) passante per p: = 2 c g(Yp |Yp ) + g(Xp |Yp )g(Xp |Yp ) . g(Xp |Xp ) (8.33)
Se inne teniamo conto del requisito (2), anch` e la velocit` a della luce calcolata sul percorso chiuso considerato valga ancora c, dobbiamo concludere che la lunghezza spaziale nello spazio di quiete Su del vettore Yp deve valere: LYp = c /2 = g(Yp |Yp ) + g(Xp |Yp )g(Xp |Yp ) g(Xp |Xp ) (8.34)
In altre parole la lunghezza di Yp , cio` e la distanza tra p e levento q innitamente prossimo a p, entrambi nello spazio di quiete del riferimento (X, U ), ` e quella indotta dalla metrica hSu denita su Su dallassegnazione delle forme bilineari: hp (Yp |Zp ) := g(Yp |Zp ) + g(Xp |Yp )g(Xp |Zp ) g(Xp |Xp ) per ogni Yp , Zp Tp Sup . (8.35)
Si osservi che hp ` e denita su tutto lo spazio tengente in p mentre hSu ne ` e la restrizione ai vettori tangenti alla supercie Su . La metrica hSu denita su Su ` e la metrica che corrisponde alle operazioni siche di calcolo di lunghezze ed angoli nello spazio di quiete Su del riferimento (X, U ).
175
Dopo che abbiamo introdotto la metrica hp con motivazioni siche, possiamo chiarirne il signicarto geometrico. Fissato il vettore Xp di tipo tempo tangente a p, un secondo vettore Yp tangente allo spaziotempo in p pu` o essere decomposto ortogonalmente come: Yp = Yp + g(Yp |Xp )Xp . g(Xp |Xp )
In questa decomposizione ortogonale Yp si trova nel sottopazio ortogonale a Xp , quindi costituito da soli vettori di tipo spazio. Lapplicazione lineare: PXp : Yp Yp , Yp := Yp g(Yp |Xp )Xp g(Xp |Xp )
` e un proiettore che estrae la parte di Yp che giace nello spazio di quiete con losservatore microscopico che evolve lungo Xp . Si verica immediatamente facendo il calcolo esplicito che: hp (Yp |Zp ) = g(PXp Yp |PXp Zp ) per ogni coppia di vettori Yp .Zp Tp M . (8.36)
Di conseguenza, la forma quadratica hp ` e almeno semidenita positiva ed ha un ben preciso signicato geometrico legato alla struttura metrica standard dello spaziotempo. Commenti 8.4. (1) La metrica hSu ` e eettivamente una metrica riemanniana, cio` e denita positiva. Questo segue dal fatto che la restrizione di g alla sottovariet` a Su di tipo spazio individua una metrica denita positiva come provato nella proposizione 3.2 e la forma bilineare simmetrica Tp M Tp M (Xp , Yp ) g(Xp |Yp )g(Xp |Zp ) g(Xp |Xp )
` e semidenita positiva per costruzione. (2) Nel caso in cui le linee di universo del sistema di riferimento sono normali agli spazi di quiete, cio` e quando Xp ` e normale a Tp Su , quindi in particolare considerando sistemi di riferi4 mento inerziali in (M , ), la metrica hSu coincide con quella indotta su Su dalla metrica dello spaziotempo g in accordo con le nostre assunzioni nel costruire il formalismo della relativit` a speciale. (3) Avendo a disposizione una metrica spaziale possiamo calcolare la velocit` a di un punto materiale in moto nel riferimento (X, U ). Se le linee di universo di X non sono normali agli spazi di quiete individuati dal tempo universale U , tale nozione di velocit` a risulter` a in generale dierente da quella calcolata come in (8.29), in cui si usava solo la struttura di X. Lo spazio tangente Tp M ` e decomposto in una somma diretta ortogonale rispetto alla metrica g: L(Xp ) Tp Sup , (8.37)
In particolare, se = (t) ` e la linea di universo di un generico punto materiale, possiamo sempre decomporre il suo vettore tangente rispetto alla decomposizione ortogonale detta sopra di T(t) M : (t) = uX(t) + Y(t) . (8.38) 176
La velocit` a di rispetto al riferimento spaziale X sar` a allora data da Y(t) c v(t) |(X,U ) := g(X(u) |X(u) ) u Il fattore
c g(X(u) |X(u) )
(8.39)
al vettore X (u) e non alla quadrivelocit` a vettore V (u) , ovvero alla nozione di tempo universale u e non al tempo proprio valutato lungo le linee di universo del riferimento X. Usando lespressione trovata e considerando una particella luminosa descritta da = (t), si ricava il valore della velocit` a della luce in funzione del vettore Y(t) nella decomposizione (8.38) c ||v(t) |(X,U ) || = g(X(t) | Y(t) ) 1+
g(X(t) |X(t) )|| Y(t) ||
a lespressione trovata la norma || || ` e quella associata alla metrica hSu . Si noti che in realt` dipende solo dalla direzione di Y(t) ma non dalla sua lunghezza. In denitiva possiamo scrivere che, nel riferimento (X, U ), la velocit` a della luce valutata attorno allevento p e nella direzione Np , dove Np Tp SU (p) ed ha norma unitaria rispetto alla metrica naturale del sistema di riferimento hSU (p) , vale: c c(p, Np )|(X,U ) = (8.40) g(Xp |Np ) 1+
g(Xp |Xp )
Si dimostra facilmente che il denominatore ` e sempre strettamente positivo nelle ipotesi fatte. Si osservi che cambiando segno a Np il valore della velocit` a della luce cambia. Si noti che, malgrado la velocit` a della luce dipenda dal tempo, dal posto e dalla direzione, per costruzione deve essere comunque rispettato il requisito sico che la velocit` a della luce su un percorso chiuso abbia il solito valore costante c. (4) Lespressione trovata (8.40) per il valore della velocit` a della luce denisce3 la procedura di sincronizzazione che si deve adoperare sperimentalmente per sincronizzare gli orologi (che segnano il tempo universale e non quello proprio se g(Xp |Xp ) = 1) per costruire lo spazio di quiete del riferimento di cui si ` e discusso precedentemente. Si osservi che la velocit` a della luce risulta avere il solito valore c isotropicamente ed omogeneamente su uno spazio di quiete Su se e solo se g(Xp |Np ) = 0 per ogni versore Np e per ogni p Su . Questo equivale a dire, come ci si aspettava, che le linee di universo del riferimento sono normali allo spazio di quiete del riferimento Su . Si osservi che in tal caso la sincronizzazione usata per costruire lo spazio di quiete ` e quella di Einstein solo se g(Xp |Xp ) = 1, cio` e se il tempo universale coincide con il tempo proprio delle curve di universo del riferimento. (5) Se ammettiamo che sottovariet` a ad U costante, nella denizione di tempo universale e quindi di sistema di riferimento, possano non essere di tipo spazio, alcune delle formule precedenti continuano ad essere valide, ma possono nascere patologie di vario genere (del tipo di velocit` a innite), lasciamo al lettore lanalisi di tali situazioni. Questo fatto, in denitiva, giustica la nostra scelta di richiedere che dU fosse di tipo tempo.
3
177
8.5.3
A titolo di esempio applichiamo il formalismo introdotto in un caso elementare che comunque ha un certo interesse sico. Consideriamo, nello spaziotempo di Minikowski (M4 , ), un sistema di riferimento inerziale F ed un sistema di coordinate minkowskiane x0 , x1 , x2 , x3 solidali con F . Passiamo inne ad un nuovo sistema di coordinate locali cilindriche t, r, , , individuate da t = x0 R, r (0, +), z = x3 R, (, ), dove si assume anche r = (x1 )2 + (x2 )2 e x1 = r cos , x2 = r sin . Per concludere, consideriamo un terzo sistema di coordinate denite dalle richieste, se > 0 ` e una certa costante ssata: t := t, r := r, z := z ma := + t. Le coordinate t , r , , z sono dette, per ovvi motivi, coordinate del riferimento rotante. In realt` a tali coordinate deniscono un sistema di riferimento (X, U ). Questo sistema di riferimento ` e detto sistema di riferimento rotante. nel senso generale su (M4 , ) scegliendo come campo vettoriale X quello individuato dalle linee integrali di t ed adoperando come tempo universale la coordinata t . Si trova in questo modo che: X := t = t Osservando che: = c2 dt dt + dr dr + r2 d d + dz dz , concludiamo che: = (c2 + 2 r2 )dt dt + dr dr + r 2 d d + dz dz r 2 d dt + dt d , (8.42) in particolare: (t |t ) = c2 + 2 r2 , e quindi il parametro t non coincide con il tempo proprio delle curve integrali di t . Si osservi ancora che, dallidentit` a di sopra, si evince che il campo vettoriale X che stiamo considerando ` e di tipo tempo solo quando r < c/ e allora ci restringiamo a lavorare in tale regione dello spaziotempo, considerandola come lo spazitempo completo. Si osservi che dt = dt e pertanto denendo il tempo universale U come t , abbiamo eettivamente una funzione dierenziabile che dierenziale di tipo tempo. Lidea intuitiva ` e che lo spazio di quiete di (X, U ) denito come appena detto sia dato dalle sottovariet` a a t costante, dato che le coordinate r , , z sono un sistema di coordinate ammissibili su tali sottovariet` a . Si osservi che risultando da (8.42): (t | ) = (t | ) = r2 abbiamo che lo spazio di quiete del riferimento non ortogonale alle curve di universo del riferimento. La metrica spaziale del riferimento non sar` a allora quella indotta da sulle variet` aat costante, ma sar` a invece data dalla formula (8.35). Nel caso specico si ottiene subito che, in riferimento alle coordinate x 1 := r , x 2 := , x 3 = z possiamo scrivere che la metrica spaziale del riferimento rotante, su ogni spazio a t costante ` e individuata dalla matrice di coecienti: hij = cij + r4 2 i j c2 2 r2 178 (8.43) (8.41)
dove cij individuano la della metrica euclidea standard in coordinate cilindriche: cij dx i dx j = dr dr + r 2 d d + dz dz . (8.44)
Si osservi che le dierenze di coordinata r corrispondono ad una misura di distanza per segmenti radiali, e la stessa cosa accade nella direzione verticale z , dato che i termini correttivi nella metrica appena scritta intervengono solo nella direzione angolare. Viceversa le cose cambiano drasticamente nella direzione angolare. Si verica per esempio subito che, in base a tale metrica, la lunghezza della circonferenza di raggio R vale: 2R 1
2 R2 c2
(8.45)
che ` e quanto ci sia aspettava da unanalisi intuitiva basata sulluso diretto della trasformazione di Lorentz. La velocit` a della luce sar` a in generale dierente da c e dipender` a dalle direzioni: in particolare nella direzione radiale essa assume il solito valore c, nella direzione della coordinata si hanno i due valori c c = , 1 r c a seconda del verso: c+ corrisponde alla velocit` a della luce in direzione tangenziale contraria al verso di rotazione delle sistema rotante rispetto a quello inerziale, mentre c corrisponde alla velocit` a della luce nel verso opposto. Lasciamo la dimostrazione della formula scritta sopra al lettore. Una domanda che ci si pu` o porre ` e se sia possibile denire unaltra nozione di spazio di quiete del riferimento rotante (cio` e del spaziale individuato dalle curve integrali di t ) in modo tale che tale spazio risulti ovunque normale a t e quindi la velocit` a della luce abbia valore costante c ovunque ed in ogni direzione. La risposta come ora vedremo ` e negativa, ma richiede luso della teoria delle forme dierenziali. Ammettiamo che esista una sottovariet` a embedded di dimensione 3 ovunque normale a t . Questo signica che la forma covariante di t : (t )a = (dt)a r 2 (d )a deve essere parallelo al covettore normale alla 3-variet` a detta. A meno di un fattore non nullo, dt r 2 d deve dunque coincidere con il dierenziale di una funzione che si annulla esattamente sulla sottovariet` a . In altre parole, nellintorno di ogni punto della sottovariet` a , devono esistere due funzioni dierenziabili = 0 e f tali che: dt r 2 d = df . Conseguentemente, applicando loperatore d e denendo := ln ||: 2r dr d = d(1/) df = d(ln ||) (1/)df = d (dt r 2 d ) .
179
Concludiamo che, nelle ipotesi fatte, deve esistere una funzione dierenziabile , nellintorno di ogni punto della sottovariet` a che assumiamo esistere, che soddis: 2r dr d = d dt r 2 d d . Sviluppando il dierenziale di : d = dt + dr + d + dz t r z (8.46)
inserendo nellidentit` a (8.46) e raccogliendo i vari fattori si ottengono subito le due condizioni, incompatibili se = 0: , 0= . 2r = r 2 r r Concludiamo che ` e impossibile trovare una nozione di spazio di quiete per il riferimento rotante che sia perpendicolare alle curve di universo del riferimento.
180
Appendice A
Uno spazio ane reale n-dimensionale, An ` e una terna (An , V, ) dove An ` e un insieme i cui elementi sono detti punti, V ` e uno spazio vettoriale reale n-dimensionale detto spazio delle traslazioni o spazio dei vettori liberi e : An An V ` e una funzione che gode delle due seguenti propriet` a (i) per ogni coppia di elementi P An , v V c e un unico punto Q An tale che P Q = v . (ii) P Q + QR = P R per ogni terna P, Q, R An . PQ ` e detto vettore con punto iniziale P e punto nale Q. Spesso si usa la notazione Q P per indicare P Q. Unaltra notazione comoda ` e la seguente. Se P An e v V , P + v An indica lunico punto Q in An tale che Q P = v . Una retta uscente da P An con vettore tangente m V ` e lapplicazione R t P + tm An . Un segmento (di retta) si ottiene limitando t ad un intervallo di R. (Dal punto di vista insiemistico due rette uscenti dallo stesso punto con vettori tangenti proporzionali secondo un numero reale non nullo coincidono). Uno spazio ane dotato di un prodotto scalare (vedi Appendice B) denito nello spazio delle traslazioni ` e detto spazio euclideo.
A.2
m e detta trasformazione ane se ` Una funzione : An e invariante per traslazioni (cio e 1 Am ` (P + u) (Q + u) = (P ) (Q) per ogni P, Q An e ogni u V1 spazio delle traslazioni di An 1 ) e L : P Q (P ) (Q) denisce una trasformazione lineare da V1 a V2 spazio delle traslazioni di Am 2 . Le trasformazioni ani conservano la struttura di spazio ane.
181
Ogni spazio ane An ammette una struttura di variet` a topologica e C dierenziabile naturale indotta da una classe di sistemi di coordinate globali naturali tra di loro compatibili detti sistemi di coordinate cartesiane. Un tale sistema di coordinate si costruisce come segue. Si ssi O An ed una base e1 , . . . , en dello spazio delle traslazioni V . Variando P An , le componenti di ogni vettore OP rispetto alla base scelta, deniscono una funzione biettiva f : An Rn . La topologia euclidea di Rn induce tramite f una topologia su An (denendo gli aperti di An come le controimmagini degli aperti di Rn ) che lo rende spazio topologico omeomorfo a Rn e quindi una variet` a topologica di dimensione n. Si verica facilmente che la topologica denita in tal modo non dipende dalla scelta di O e nemmeno dalla scelta della base in V . Ulteriormente la funzione f denisce da sola un atlante C su An e dota tale spazio di una struttura dierenziabile generata da tale atlante. In tal contesto la funzione f ` e detta sistema di coordinate cartesiane (di origine O e assi e1 , . . . , en ). Se g : An Rn ` e unaltro sistema di coordinate cartesiane f g 1 : Rn Rn e g f 1 : Rn Rn sono C in quanto, come si prova subito sono trasformazioni lineari non omogenee. Quindi la struttura dierenziabile individuata da g ` e la stessa individuata da f . m e una trasformazione ane, si prova immediatamente che, scelte coordinate Se : An 1 Am ` n m m cartesiane in entrambi gli spazi ani f : An 1 R , g : A2 R , la funzione rappresentata 1 in tali coordinate, g f , ha la forma di una trasformazione lineare non omogenea da Rn a Rm : n xi 2 = An 1
j =1 Am m,
Li j xj + ci .
Viceversa ogni trasformazione : che per una scelta di sistemi di coordinate cartesiane nei due spazi ani ha la forma lineare omogenea scritta sopra, ` e necessariamente una trasformazione ane. Si vede subito che le trasformazioni ani sono quindi dierenziabili e, se sono biettive, sono dieomorsmi con inversa data ancora da una trasformazione ane.
A.3
Consideriamo un punto p An ed una curva dierenziabile : [0, ) An uscente da p. Il vettore tangente a in p pu` o essere denito in due modi diversi corrispondenti rispettivamente alla nozione elementare di vettore applicato e vettore libero: (i) come un elemento di Tp An , (p), oppure (ii) come un elemento dello spazio delle traslazioni V : (0)(h) (V ) (p) = lim . h0 h Al variare di tutte le curve, lapplicazione (p) (V ) (p) denisce un isomorsmo naturale Lp : Tp An V . In particolare, se e1 , . . . , en ` e una base di V e : An p (x1 (p), . . . , xn (p)) ` e il sistema di coordinate cartesiane generate dalla base detta e centrate in O An , risulta subito che, per i = 1, . . . , n: Lp i |p = ei . x 182
Lesistenza dellisomorsmo detto ha la conseguenza determinante che permette di denire una somma tra vettori appartenenti a due spazi tangenti in punti dierenti p e q : i vettori devono 1 1 essere trasportati in V tramite L p e Lq dove possono essere sommati. Ovviamente il risultato ` e un vettore di V .
A.4
Consideriamo uno spazio ane n-dimensionale An e dotiamolo della struttura di variet` a differenziabile naturale come detto sopra. Se V , spazio delle traslazioni, ` e dotato di uno (pseudo)prodotto scalare (Appendice B) possiamo indurre un analogo (pseudo)prodotto scalare g su ogni spazio tangente Tp An tramite lisomorsmo naturale Lp sopra denito. A tale ne, per ogni p An e u, v Tp An deniamo gp (u|v ) := g (Lp u|Lp v ) . ` immediato provare gp risulta esser uno (pseudo)prodotto scalare della stessa segnatura di g . E n che, al variare di p, le componenti di gp (u|v ) nelle basi di Tp A associate ad un sistema di coordinate cartesiane sono costanti e quindi, in particolare, dierenziabili. Come conseguenza An dotato del campo tensoriale doppio non degenere gg denito in ogni punto dal prodotto scalare gp rende An una variet` a (pseudo)riemanniana (vedi Appendice B). Se e1 , . . . , en ` e una base in V (pseudo)ortonormale per g (vedi Appendice B), il sistema di coordinate cartesiane generato da tale base in un punto O An , ` e detto sistema di coordinate cartesiane (pseudo)ortonormali. ` immediato vericare che gg sopra denito assume forma canonica nelle basi associate a tali E coordinate in ogni punto della variet` a.
183
Appendice B
Una forma quadratica g sullo spazio vettoriale reale V ` e detta non degenere se g (u|v ) = 0 per ogni u V implica v = 0. Si verica subito che, se V ha dimensione nita, g ` e non degenere se e solo se il determinante della matrice simmetrica G che rappresenta la forma quadratica su una base dello spazio V ` e non nullo, cio` e la matrice G ` e non singolare. Mettiamoci preventivamente nel caso V = Rn in cui le forme quadratiche sono matrici simmetriche (espresse nella base canonica) per costruzione. La segnatura di una forma quadratica non degenere g denita su V = Rn , ` e la coppia ordinata (m, p), dove m + p = n, associata a g come segue. Si consideri una trasformazione di similitudine g = Dt gD, dove D ` e una opportuna matrice reale n n non singolare in modo tale che g risulti diagonale e che ammetta sulla diagonale solo i numeri 1. Nella segnatura, m ` e il numero di volte in cui appare 1 mentre p ` e il numero di volte in cui appare +1 su tale diagonale. Il teorema di Sylvester [9] assicura che (i) la matrice D suddetta esiste e (ii) ogni altra matrice reale n n non singolare che trasformi per similitudine g in una matrice diagonale con soli 1 sulla diagonale principale, conserva la segnatura. Quindi la segnatura ` e ben denita ed ` e una propriet` a di g . Si osservi che se V ` e ora un generico spazio vettoriale reale a n dimensioni e g ` e rappresentata ` ik , dalla matrice G nella base e1 , . . . , en , e D e una matrice n n non singolare di componenti D t G = D GD rappresenta la stessa forma quadratica g nella base e k = h Dhk eh . Di conseguenza, il teorema di Sylvester assicura che si possa denire univocamente la segnatura di g anche in questo caso generale: la segnatura di g ` e la segnatura della matrice G che rappresenta g su una base qualsiasi di V . Tale denizione, in virt` u della seconda parte del teorema di Sylvester non dipende dalla base scelta. La segnatura di una forma quadratica g su uno spazio vettoriale reale V di dimensione n ` e detta euclidea (o ellittica) se m = 0 ovvero Lorentziana (o iperbolico normale) se m = 1 e p 1.
184
Una forma quadratica non degenere su uno spazio vettoriale V di dimensione nita n ` e detta prodotto scalare o rispettivamente pseudo prodotto scalare se la sua segnatura ` e (0, p) oppure (m, p) con m > 0, p > 0. Una base di V , {ei }i=1,...,n ` e detta (pseudo) ortonormale se la matrice dei coecienti g (ei |ej ) assume forma canonica, cio e diag (1, . . . , 1, +1, . . . , +1) in cui 1 e +1 compaiono tante volte come prescritto dalla segnatura di g . Lesistenza di (innite) basi (pseudo)ortonormali ` e garantita dallo stesso teorema di Sylvester. Si prova facilmente, usando la diretta generalizzazione della procedura di ortogonalizzazione di Gram-Schmidt, che per ogni ssato vettore u1 V esistono vettori u2 , . . . , un V tale che u1 , . . . , un costituisca una base (pseudo) ortonormale. Se := diag (1, . . . , 1, +1, . . . , +1) ` e la forma canonica della forma quadratica non degenere g su V , linsieme delle matrici reali n n, D, tali che Dt D = ` chiaro forma un gruppo. Tale gruppo ` e detto gruppo di stabilit` a della (pseudo)metrica. E che per segnature ellittiche tale gruppo ` e O(n) dove n ` e la dimensione dello spazio V . Chiaramente, interpretato in senso passivo, il gruppo di stabilit` a della (pseudo)metrica coincide con il gruppo delle trasformazioni da Rn Rn che trasformano le componenti di un vettore da una base (pseudo)ortonormale in un altra base (pseudo)ortonormale di V . Nellinterpretazione attiva, ssata una base (pseudo)ortonormale, il gruppo di stabilit` a della (pseudo)metrica denisce, in tale base, il gruppo di trasformazioni da V in V che preservano lo (pseudo)prodotto scalare. Lassegnazione di uno (pseudo) prodotto scalare g ( | ) sullo spazio vettoriale reale di dimensione nita V determina un isomorsmo naturale tra V ed il suo duale V . Tale isomorsmo ` e denito da #g : V u g (u| ) V . Se e1 , . . . , en ` e una base di V e e1 , . . . , en ` e la base duale associata ed inne g := gij ei ej = i j g (ei |eg )e e ` e la rappresentazione del tensore associato a g in V V detto tensore metrico, allora lazione di #g in componenti delle basi dette ` e data da #g : v i vk := gki v i . Dal teorema di universalit` a #g induce un analogo isomorsmo tra spazi del tipo V n V n e n n V V che in componenti delle basi indotte da e1 , . . . , e2 e dalla sua duale agisce come: ti1 ...in
j1 ...jp
j1 ...jp
Per tale motivo lazione di #g ` e anche detta processo di abbassamento degli indici. Lisomorsmo inverso di g := (#g )1 : V V corrisponde ad un tensore in componenti dato da g ik ei ej dove la matrice dei coecienti g ik ` e linversa della matrice dei coecienti gij
185
che rappresentano #g nella base duale associata alla precedente e1 , . . . , en . Risulta che vale lidentit` a gik gjl g kl = gij (si noti che tale identit` a non ` e evidente a priori perch e il secondo membro non ` e denito dal primo ma gij := g (ei |ej )). Lazione di g si estende a prodotti tensoriali e denisce il processo di innalzamento degli indici. Si osservi inne che se lo spazio vettoriale ` e dotato di un prodotto scalare g propriamente denito (cio` e denito positivo), allora in basi ortonormali la rappresentazione di g ` e data dal delta di Kroneker e pertanto, il processo di alzare ed abbassare gli indici, in tali basi (e nelle duali associate) non ha alcun eetto sui valori delle componenti: vi = ij v j = v i malgrado esse si riferiscano a tensori in spazi diversi.
B.2
Una (pseudo)metrica su una variet` a dierenziabile M di dimensione n ` e data assegnando un campo tensoriale dierenziabile covariante doppio simmetrico e non degenere g, le cui matrici rappresentative abbiano segnatura costante al variare del punto sulla variet` a. A tal proposito, si osservi che la legge di trasformazione delle componenti di g al variare del sistema di coordinate e, punto per punto, proprio una trasformazione di locali g = gij dxi dxj = gpq dx p dx q ` similitudine generata da una matrice non singolare: xi xj | g ( x ) |x . x ij x p x q In tal modo il teorema di Sylvester assicura che la segnatura sia una propriet` a del campo tensoriale g. g ` e detto tensore metrico o metrica e la coppia (M, g) ` e una variet` a riemanniana. Se n, m > 0, g ` e detto tensore pseudo metrico o pseudo metrica e la coppia (M, g) ` e una variet` a pseudo riemanniana. In particolare, una variet` a lorentziana si ha quando n 2 e la segnatura di g ` e lorentziana: (1, n 1) (ossia (1, +1, . . . , +1)), in tal caso il tensore pseudo metrico si dice tensore pseudo metrico lorentziano. gpq (x) =
B.3
Una variet` a (pseudo)riemanniana (M, g) ` e detta globalmente piatta1 quando: (a) ammette una struttura ane, compatibile con la struttura dierenziale, che la rende spazio
1 Precisiamo che, a seconda degli autori, esistono comunque dierenti e non equivalenti denizioni della nozione di globale piattezza.
186
ane, (b) g ` e rappresentato dalla matrice diagonale costante in forma canonica in un sistema di coordinate cartesiano generato dalla struttura ane. (Si osservi che tutti gli altri sistemi di coordinate globali in cui la metrica ha costantemente forma diagonale canonica risultano banalmente essere cartesiani.) Un modo del tutto equivalente di assegnare una variet` a (pseudo) riemanniana globalmente piatn ta ` e quello di partire da uno spazio ane A , di denire uno (pseudo)prodotto scalare nello spazio delle traslazioni V e di indurre un tensore metrico sulla variet` a associata a An tramite lisomorsmo naturale tra V e lo spazio tangente ad ogni punto di An . Come visto in Appendice A, il tensore metrico ha allora componenti costantemente in forma canonica quando espresse in coordinate cartesiane (pseudo) ortonormali. ` chiaro che uno spazio (ane) euclideo identica univocamente una variet` E a riemanniana globalmente piatta e viceversa. Una variet` a (pseudo)riemanniana (M, g) ` e detta localmente piatta se nellintorno U di ogni punto p M c` e una carta locale (U, ), : U q (x1 (q ), . . . , xn (q )) Rn tale che i j g(q ) = gij (q )dx |q dx |q dove la matrice dei coecienti gij (q ) ha costantemente forma canonica per ogni q U . Una variet` a localmente piatta in generale non ` e globalmente piatta: un cilindro in E3 con la 3 metrica indotta da quella di E ` e una variet` a localmente piatta che non ` e globalmente piatta. Condizioni necessarie e sucienti anch` e una variet` a (pseudo) riemanniana sia localmente piatta sono date dallannullarsi ovunque del tensore di curvatura di Riemann [2].
B.4
Se (M, g) ` e una variet` a (pseudo)riemanniana di dimensione n e M ` e una sottovariet` a dierenziabile embedded in M di dimensione s n, la (pseudo)metrica g induce un campo tensoriale dierenziabile covariante doppio simmetrico su che viene detto metrica o pseudo metrica (a seconda dei casi) indotta su quando non ` e degenere in alcun punto di . Si procede nel seguente modo. Dato che la variet` a` e embedded, per ogni punto p , lo spazio tangente Tp ` e incluso canonicamente nello spazio tangente Tp M come un sottospazio. Di conseguenza, se u, v Tp , gp (u|v ) ` e ben denito e, se u, v sono campi vettoriali dierenziabili su , ` e una funzione dierenziabile di p . Ci` o denisce su il campo tensoriale dierenziabile covariante doppio simmetrico di cui sopra. Dal punto di vista delle componenti, notiamo che c` e una carta locale di M , con coordinate x1 , . . . , xn , denita in un intorno U di p in cui U ` e rappresentata dalle funzioni dierenziabili xi (y 1 , . . . , y s ), i = 1, . . . , n, dove y 1 , . . . , y s sono coordinate associate ad una carta locale denita in un intorno V di p in . La matrice jacobiana delle funzioni dierenziabili dette ha rango s in V . Risulta facilmente che, se q V e g = gij dxi dxj in U , (q ) = gij (q ) xi xj |q |q dy a |q dy b |q . y a y b 187
Bibliograa
[1] V. Moretti, Multi-Linear Algebra and Tensor Calculus in Mathematical Physics with Applications to Special Relativity, 2006. http://www.science.unitn.it/moretti/dispense.html [2] V. Moretti, Tensor analysis on dierentiable manifolds with applications to relativistic theories, 2006. http://www.science.unitn.it/moretti/dispense.html [3] E. Sernesi, Geometria 2, Bollati Boringhieri, Torino, 1990 [4] M.P.do Carmo, Riemannian Geometry, Birkh auser, Boston 1992 [5] B. ONeill, Semi-Riemannian Geometry with application to Relativity, Interscience Publishers, New York, 1983 [6] J. K. Beem, P. E. Ehrlich, K. L. Easley, Global Lorentzian Geometry, Academic Press, 1994 [7] B. A. Dubrovin, S. P. Novikov, A. T. Fomenko, Geometria Contemporanea Vol I, Editori Riuniti/Mir, 1987 [8] B. A. Dubrovin, S. P. Novikov, A. T. Fomenko, Geometria Contemporanea Vol II, Editori Riuniti/Mir, 1987 [9] E. Sernesi, Geometria 1, Bollati Boringhieri, Torino, 1990 [10] J.D. Jackson, Elettrodinamica Classica, Zanichelli, Trento, 1988 [11] A. Einstein, Ann. d. Physik, 17, (1905) [12] A.A. Michelson and E.W. Morley, On the Relative Motion of the Earth and the Luminiferous Ether, Am. J.Sci. (3rd series) 34 333-345 (1887). vedi anche R.S. Shankland, Michelson - Morley Experiment, American Journal of Physics 1964, p.16.
188
[13] U. Bottazzini I grandi della scienza: Poincar e, LE SCIENZE n.7 febbraio 1999 e S. Bergia I grandi della scienza: Einstein, LE SCIENZE n.6 agosto 2000 (RISTAMPA). [14] R.S. Shankland et al, Rev. Mod. Phys. 27 no.2, 167-178 (1955) [15] S. Liberati, S.Sonego and Matt Visser, Faster-than-c Signals, Special Relativity and Causality, Ann. Phys., 298, 2002 [16] A. Einstein, B. Podolsky, N. Rosen, Can quantum-mechanical description of the physical reality be considered complete, Phys. Rev. 47, p777, (1935) [17] B. dEspagnat, I fondamenti concettuali della Meccanica quantistica, Bibliopolis, Napoli, 1995. [18] G. Boniolo (a cura di), Filosoa della Fisica, Bruno Mondadori, 1997. [19] M. Sherwin, Some Recent Experimental Tests of the Clock Paradox, Phys. Rev. 129 no. 1, 17 (1960) [20] D. Frisch and J. Smith, Measurement of the Relativistic Time Dilation Using Mesons, Am. J. Phys. 31, 342 (1963). [21] Haefele and Keating Nature 227, 270 (1970),(Proposal); Science Vol. 177, 166 170 (1972) (Experiment) [22] R.F. Streater and A.S. Wightman: P CT , Spin and Statistics, and All That, Princeton University Press, revised version, Princeton, 2000. [23] F.W. Warner: Foundation of Dierentiable Manifolds and Lie Groups, SpringerVerlag, New York, 1975. [24] M.A. Najmark e A.I. Stern: Teoria delle rappresentazioni dei gruppi, Editori Riuniti, Roma, 1984. [25] W. Rudin: Analisi Reale e Complessa, Bollati Boringhieri, Torino, 1974 W. Rudin: Functional Analysis, McGraw-Hill, Boston, 1991 seconda edizione. [26] R.M. Wald: General Relativity; Chicago University Press, Chicago, (1984) [27] C. von Westenholtz: Dierential Forms in Mathematical Physics; North-Holland, Amsterdam, (1978)
189