Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
Publisher
Alberto Maggi
[219,915]
55 via Lopez, 57010 Guasticce (LI)
0586 984 980
Sommario
Prefazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
I
Onde elettromagnetiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
I.1
I.2
I.3
II
Le equazioni di Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
I.1.2
I.1.3
Il teorema di Poynting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
I.1.4
Potenziali elettrodinamici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
I.2.2
Lequazione di DAlembert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
I.2.3
I.3.2
I.3.3
II.2
II.1.2
Pressione di radiazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
II.1.3
La legge di Stefan-Boltzmann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
II.1.4
II.1.5
II.2.2
La formula di Rayleigh-Jeans . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
II.2.3
Sommario
II.2.4
III
IV
41
41
42
42
43
44
III.2
Eetto fotoelettrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
III.3
Eetto Compton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
III.4
I postulati di Bohr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
III.4.1 Spettri atomici e ipotesi di Bohr . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
III.4.2 Livelli energetici dellatomo di idrogeno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
III.4.3 Quantizzazione delloscillatore armonico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
46
46
47
48
III.5
Teoria
III.5.1
III.5.2
III.5.3
48
48
50
52
III.6
Lipotesi di de Broglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
III.6.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
III.6.2 Ipotesi di de Broglie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
III.7
III.8
59
60
64
65
68
Sommario
IV.1.5
IV.2
IV.3
IV.4
IV.5
IV.6
IV.7
IV.9
Commutatore e compatibilit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
IV.2.2
Relazione di indeterminazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
IV.3.2
IV.3.3
Il principio di indeterminazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
IV.3.4
Il caso a pi dimensioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
Postulato di quantizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
IV.4.1
IV.4.2
Alcuni esempi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
IV.4.3
IV.4.4
IV.5.2
Evoluzione temporale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
IV.6.1
IV.6.2
IV.6.3
Schema di Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
IV.8
IV.8.2
IV.8.3
IV.8.4
IV.9.2
IV.9.3
Sommario
IV.9.4
IV.10
V.2
V.3
V.4
V.5
V.1.2
V.2.2
V.3.2
V.3.3
V.3.4
Conclusioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
V.3.5
V.4.2
V.4.3
V.4.4
V.6
V.6.2
V.6.3
Sommario
VI
VI.2
VII
VI.1.2
VI.2.2
VI.2.3
VII.2
VII.3
VII.4
VII.5
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
VII.6
Spin
VII.7
Sommario
VIII
Operatori tensoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
VII.8.1 Ancora su rotazioni e momento angolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
VII.8.2 Tensori cartesiani, tensori irriducibili e tensori sferici . . . . . . . . . . . . . . . . . . . . . . .
VII.8.3 Prodotto di tensori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
VII.8.4 Il teorema di Wigner-Eckart . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
VII.8.5 Operatori vettoriali e teorema di proiezione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
187
187
190
192
193
195
IX
VIII.2 Campo
VIII.2.1
VIII.2.2
VIII.2.3
201
201
204
209
VIII.3 Sistemi
VIII.3.1
VIII.3.2
VIII.3.3
di due particelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hamiltoniana a variabili separate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Autovalori e autovettori dellhamiltoniana nel problema dei due corpi . . . . . . . . .
211
211
213
214
Teoria
IX.1.1
IX.1.2
IX.1.3
217
217
219
220
IX.2
Teoria
IX.2.1
IX.2.2
IX.2.3
IX.2.4
221
221
223
224
228
IX.3
Sommario
IX.3.2
IX.4
Metodo variazionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
IX.4.1 Una propriet dello stato fondamentale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
IX.4.2 Il teorema di Ritz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
IX.4.3 Teorema del viriale e livello fondamentale dellelio . . . . . . . . . . . . . . . . . . . . . . . . . .
235
236
236
237
IX.5
240
240
244
246
248
250
Prefazione
Scrivere un testo rigoroso di meccanica quantistica il sogno che coltivo da quando ho iniziato la stesura di questi
appunti del corso di Istituzioni di Fisica Teorica, tenuto dal professor Pietro Menotti agli studenti del terzo anno
del Corso di Laurea in Fisica dellUniversit di Pisa. Questo la dice lunga sia sulla qualit matematica di queste
note, sia sulla mia pignoleria e sulla mia personale aspirazione alla matematizzazione sistematica della fisica.
Si soliti leggere nelle introduzioni dei testi di Landau e Lifsits che la fisica teorica prevalentemente costruita
su risultati non matematicamente rigorosi, per cui credo che a nessuno dispiacer lutilizzo sconsiderato di
convergenze, scambi di limiti, integrali e serie che qui si fa.
Tuttavia, nel corso dei miei brevi studi ho maturato la convinzione che un sistema di risultati basati su speculazioni
fisiche non corroborate da dimostrazioni corrette in tutti i dettagli, una pericolante costruzione sulla sabbia.
Uno studente del terzo anno , infatti, mathematically oriented, proviene dai corsi di Geometria e Analisi, ma
soprattutto dal corso di Meccanica Analitica, perci abituato a trarre la sicurezza di quanto sa da rigorose
(spesso tediose) e ineccepibili dimostrazioni, destinate a sparire nel corso del suo terzo anno di studi.
Daltra parte un corso di meccanica quantistica in cui le pecche matematiche siano trascurabili, richiede una
preparazione impensabile al terzo anno, occorrerebbe almeno la conoscenza della teoria degli operatori negli
spazi di Hilbert (compreso il teorema spettrale), senza contare che una qualche familiarit con rappresentazioni
e gruppi consentirebbe di allargare non poco il respiro della trattazione.
Allora, limpostazione di questi appunti , nella scia del corso di Menotti, la soluzione a questo problema, o,
quanto meno, un buon compromesso. Il rigore matematico non raggiunto, tuttavia il lettore sempre messo in
guardia ogniqualvolta si eettua un passaggio scorretto. La materia , cio, presentata in modo critico, cosicch
lo studente certo di non essere raggirato. Il lettore curioso deve essere rassicurato dal fatto che esiste una
teoria superiore (esposta nel corso di Meccanica Quantistica, i cui appunti raccoglier nel quaderno Trattazione
matematica della meccanica quantistica) in grado di evitare tutti i problemi che si incontrano a questo livello.
Quello che mi piacerebbe aver comunicato con questi appunti la dicolt e - allo stesso tempo - il fascino dello
studio della meccanica quantistica. Ci che ritengo sia laspetto pi ammaliante della meccanica quantistica
il suo tendere a creare una struttura matematicamente profonda tramite la quale arrivare alla comprensione del
vero legame tra la realt e la fisica (intesa come rappresentazione della realt stessa). Basta pensare a come
vengono sviluppati in ambito quantistico i concetti (che nelle teorie precedenti erano quasi metafisici) di misura
e simmetria.
Due parole su queste pagine: anzitutto non si tratta di una ricopiatura degli appunti presi a lezione, ma di una
loro rielaborazione, basata sui miei gusti e le mie esigenze e su un certo numero di testi cui ho fatto riferimento
e che sono riportati nella bibliografia. Tuttavia, in questa sede, mi piace ricodarne uno, Lezioni di Meccanica
Quantistica, di Luigi E. Picasso. Studiando sui testi del professor Picasso ho attraversato (indenne!) i corsi di
Fisica I e II e spero di poter fare altrettanto con questo. Quello che posso dire che i modi di questo autore
sono assolutamente in linea con la mia idea di fisica (sarebbe forse meglio dire che questa mia idea deriva dalla
assidua frequentazione dei suoi libri): mai un imbroglio e rigore per quanto possibile.
Il materiale qui presentato quello del corso del professor Menotti (pi o meno) e molti sono gli appunti che
provengono dalle esercitazioni tenute dal dottor Emilio dEmilio.
Prefazione
Il primo capitolo un ricettacolo di concetti ereditati dal corso di Fisica II, con qualche sviluppo, in vista della
trattazione ala Planck del corpo nero, che viene svolta nel secondo capitolo, sulla linea del testo di Becker.
Il terzo capitolo presenta una breve rassegna dei principali sviluppi della Old Quantum Mechanics e si colloca in
parallelo al secondo capitolo.
Nel quarto capitolo viene sviluppato lintero formalismo della meccanica quantistica: spazio di Hilbert come spazio
degli stati, osservabili come operatori autoaggiunti, regole canoniche di commutazione, evoluzione temporale,
spazi prodotto, sistemi statistici e, infine, un accenno ai problemi di teoria della misura nella fisica quantistica.
Nel quinto capitolo ci si occupa in dettaglio (ma, ancora, in modo per lo pi qualitativo e assai poco matematico)
dellequazione di Schrdinger unidimensionale.
Dopo loscillatore armonico, la volta del momento angolare. Qui si prende lo spunto per introdurre il concetto
di simmetria ed invarianza in meccanica quantistica.
In seguito sono trattati i campi centrali. Latomo didrogeno studiato tramite il vettore di Lenz: qui, come
sempre quando possibile, tutti i calcoli sono debitamente sviluppati ( un bel guazzabuglio di commutatori).
Successivamente si trattano i metodi di approssimazione, essenziali per introdurre linterazione tra materia e
radiazione e la fisica atomica. Infine, ci si occupa di particelle identiche, principio di Pauli, bosoni e fermioni.
Posso concludere dicendo che, di sicuro, studiare questa materia una gran fatica e forse senza le canzoni di
Frank Sinatra impossibile non farsi prendere dallo sconforto. Daltra parte, per andare avanti c bisogno di
buoni compagni di studio e amici: a questo proposito mi va di ringraziare Giacomo, Antonio, Giacomo, Boris,
Leonardo, Walter, Matteo e il sig. Ivan.
Un doveroso grazie va anche a Giuseppe ed Elia coi quali ho discusso tanti argomenti controversi qui riportati.
Capitolo I
Onde elettromagnetiche
In avvio della trattazione del corso riteniamo utile riportare il seguente capitolo allo scopo di fornire
un breve sommario sulle onde elettromagnetiche. Molte delle considerazioni che faremo in questa
sede saranno riutilizzate nella trattazione semiclassica (ala Planck) del corpo nero.
div E = 4
curl E + 1 B = 0
c t
(M)
div B = 0
1 E
4
J+
curl B =
c
c t
Terzo principio
ed energia
del campo
Il terzo principio della dinamica newtoniana non pu valere in generale: se due corpi A e
B interagiscono di modo che B senta le variazioni di A istantaneamente e viceversa, si deve
supporre lesistenza di un segnale che si propaghi a velocit infinita. Siccome questo non
possibile, lo scambio di quantit di moto ed energia in termini newtoniani ha luogo solo nel caso
di interazioni di contatto. Ci da corpo alla nozione di campo. Ogni particella agisce per
contatto con il campo, trasferondogli energia e quantit di moto, che viene poi - in parte
o del tutto - ceduta (dopo un tempo finito) allaltra particella. Il terzo principio, rivisitato
in termini relativistici, sancisce allora la conservazione dellenergia di un sistema isolato, nel
quale, oltre alle particelle, dovranno essere per inclusi i campi.
Definizione
di energia
elettromagnetica
Si viene ora a creare la necessit di definire in modo consistente lenergia che deve essere
associata al campo elettromagnetico (E, B). Per far questo, supporremo intanto di essere nel
vuoto.
Il sistema che dovremo considerare sar costituito allora da cariche elettriche e correnti, dai
supporti meccanici (fili conduttori, reticoli, . . .) e dal campo elettromagnetico.
Definiamo U energia del campo elettromagnetico, corrispondentemente a una certa
configurazione, il lavoro che si deve fare sulle sorgenti dei campi (le cariche e le correnti)
per ottenere quella prefissata configurazione, cio il lavoro sul sistema sorgenti pi supporti
meccanici diminuito dellaumento dellenergia (cinetica o interna, eetto Joule) dei supporti
meccanici stessi. In altre parole, abbiamo
U = Lext E int ,
I Onde elettromagnetiche
dove Lext il lavoro fatto dallesterno sulle sorgenti (pi i loro supporti), mentre E int
laumento dellenergia interna di supporti meccanici e sorgenti registrato nelloperazione
(ad esempio laumento di energia cinetica degli elettroni per stabilire una certa corrente).
Daltra parte, sul sistema sorgenti pi supporti agiscono le forze esterne (che stanno creando
la configurazione finale) e le forze elettromagnetiche che, in senso newtoniano, sarebbero forze
interne. Se indichiamo con Lem il lavoro di queste ultime abbiamo, dal teorema delle forze
vive generalizzato,
E int = Lext + Lem
la qual cosa implica
U = Lem
cio lenergia del campo definita come lopposto del lavoro fatto sul sistema meccanico dalle
forze elettromagnetiche.
Ora, il lavoro fatto dal campo sulle cariche nellunit di tempo
Z
Z
em
W (t) = E u dV = E J dV
da cui
Z
dU
= E J dV
dt
Se consideriamo ora un sistema cariche pi supporti isolato, abbiamo, ancora dal teorema
delle forze vive, che
dU
dE int
= W em =
dt
dt
da cui
d int
E +U =0
dt
Lequazione scritta ci dice che il sistema sorgenti pi supporti pi campo ha energia costante
se isolato. Questo implica che la definizione adottata di U soddisfa le propriet richieste nel
primo paragrafo.
Notiamo che se invece il sistema cariche pi supporti soggetto a forze esterne a potenza non
nulla W ext , ricaviamo
dE int
= W em + W ext
dt
d int
= W ext
E +U
dt
U come funzione
di stato
4
1
E
B
E curl B B curl E =
EJ+
E
+ B
c
c
t
t
dallidentit vettoriale
1 2
c
E + B2 +
div (E B)
8 t
4
Dal teorema di Green, supponendo che i campi si annullino allinfinito, e perci abbiano flusso
nullo, otteniamo che
Z
2
1
E + B2 dV.
U=
8
E J =
Interpretazione
del teorema
di Poynting
1 2
u (x, t) +
E + B2
8
e vettore di Poynting
c
S+
(E B)
4
allora troviamo
u
+ div S
E J =
t
che rappresenta il bilancio locale dellenergia o teorema di Poynting.
Per capire la portata del teorema di Poynting, immaginiamo di dividere lo spazio in due
zone di volume V1 e V2 , ordinatamente. Il sistema complessivo isolato e perci, in esso, si
conserva lenergia, abbiamo dunque
d
d
U1 + E1int =
U2 + E2int
dt
dt
Vogliamo caraterizzare i due membri in termini del vettore di Poynting. Integriamo nel volume
Vi , i J2 , i due membri del teorema di Poynting:
Z
dUi
EJ=
+ Vi (S)
dt
Vi
dove si usato il teorema di Green e Vi indica il flusso uscente dalla superficie che delimita
Vi . Ora,
Z
E J = Wiem
Vi
perci, se con
da cui
Wiext
Ne deriva che
d
Ui + Eiint = Vi (S) Wiext
dt
d
Ui + Eiint = Wiext Vi (S) ,
dt
dunque, preso un sistema compreso nel volume Vi , laumento di energia totale (di cariche pi
supporti pi campo) per unit di tempo uguale alla somma della potenza esercitata dalle
forze esterne sul sistema e del flusso entrante in Vi del vettore di Poynting.
Lequazione si riduce alla
d
U + E int = W ext
dt
trovata sopra per V che va a comprendere tutto lo spazio fisico.
Infine, sia W ext = 0, allora si ha
d
d
I Onde elettromagnetiche
stabilisca un parallelo tra (, J) e (u, S). S dunque una densit di corrente di energia.
em
Z
1
=
dt
E + J B dV
c
Z
1
dPmec
dP
E + J B dV =
= Fem =
dt
c
dt
da cui
d
(Pmec + P) = 0.
dt
In questa sezione ci occuperemo del problema della propagazione del campo elettromagnetico
(e della sua energia) nel vuoto. In una zona in cui non siano presenti sorgenti le equazioni di
Maxwell, (M), divengono
div E = 0
curl E + 1 B = 0
c t
(M )
div B = 0
1 E
curl B
= 0
c t
e perci rappresentano un sistema lineare omogeneo di equazioni dierenziali alle derivate
parziali. Il problema principale connesso alle equazioni scritte quello di risalire alla soluzione
legata alle condizioni imposte dalla presenza di certe sorgenti nella zona circostante a quella
in cui valgono le (M ).
Noi ci limiteremo ad ottenere la soluzione generale in alcuni semplici casi e a specificare il
modo per ottenere la soluzione poste le condizioni al contorno.
1 A
.
c t
div A = 4
t
1
4
1 2A
A 2 2 grad div A +
= J
c t
c t
c
+
Daltra parte, siccome il rotore del gradiente nullo A definito a meno di aggiunta del
gradiente di una funzione scalare, cio B invariante rispetto alla trasformazione
A 7 A0 = A + grad
e, se vogliamo che E sia ancora definito come sopra dobbiamo porre
1
7 0 =
c t
Linsieme delle due ultime equazioni scritte si dice trasformazione di gauge.
Gauge di
Lorentz
1 0
1 2
2 2
c t
c t
1 2
1 0
0
=
div
A
+
c2 t2
c t
che, come vedremo, essendo noto il secondo membro, ammette sempre soluzione. La
trasformazione trovata in questo modo si dice gauge di Lorentz. In definitiva, sotto gauge
di Lorentz, div A +
Gauge di
Coulomb
I Onde elettromagnetiche
1
= 0, le equazioni di Maxwell divengono
c t
1 2
2 2 = 4
c t
A 1 A = 4 J
c t2
c
La gauge che ci interessa nella soluzione delle (M ) per quella di Coulomb che impone
div A = 0
Essa si ottiene ponendo
A = A0 + grad
0 = div A0 +
che ha sempre soluzione (si tratta dellequazione di Laplace) nota la div A0 . Sotto questa
gauge le equazioni di Maxwell divengono
= 4
1 2A
1
4
= J
A 2 2 grad
c t
c t
c
lequazione per quella dellelettrostatica, perci
Z
(x0 , t) 3 0
(x, t) =
d x
kx x0 k
= 0
, div A = 0
1 2A
A 2 2 = 0
c t
cio A soddisfa allequazione delle onde.
La discussione delle onde nel vuoto dunque ridotta alla risoluzione del sistema disaccoppaiato
A = 0
B = curl A
E = 1 A
c t
dove abbiamo introdotto loperatore lineare
=
1 2
c2 t2
Nelle gauge esaminate sommavamo ad A la funzione scalare di modo che, nella gauge di
Lorentz, fosse
1 0
= div A0 +
,
c t
= div A0
Siccome ambedue le equazioni per sono lineari, resta definito a meno dellaggiunta di 0
soluzione dellequazione omogenea associata, = 0, nella gauge di Lorentz, e = 0, nella
gauge coulombiana. Laggiunuta di 0 prende il nome di gauge ristretta.
(DA)
+ x ct
+ x + ct
da cui ricaviamo
2g
2g
2g
2g
(, ) = 2 + 2
+ 2,
2
x
1 g
g g
(, ) =
+
c t
1 2g
2g
2g
2g
(, ) = 2 2
+ 2
2
2
c t
da cui otteniamo
(
h
g (x, 0) = a (x)
g
(x, 0) = b (x)
t
g+ (x) + g (x)i = a (x)
0
0
(x) + g (x) = b (x)
c g+
Z
1
1 x
(x)
=
b () d
a
(x)
2
2c x0
g (x) =
1
1
a (x) +
2
2c
b () db (x)
x0
Z x+ct
1
1
g (x, t) = [a (x ct) + a (x + ct)] +
b () d
2
2c xct
Soluzione
mediante
trasformata
di Fourier
Purtroppo la tecnica sviluppata nel caso unidmensionale non pu essere trasferita nel caso
I Onde elettromagnetiche
e ritroviamo, grazie alla fattorizzazione degli integrali, soluzioni funzioni xct. La pi generale
soluzione , infine,
Z h
i dk
g (x, t) =
A (k) ei(kx+t) + B (k) ei(kxt)
2
R
dk
= a (x)
2
ZR
dk
g
c |k| [A (k) B (k)] eikx
(x, 0) =
= b (x)
t
2
R
g (x, 0) =
c (k) eikx
dk
= f (x)
2
c (k) =
dx eikx f (x)
A (k) + B (k) =
dx eikx a (x)
dx eikx b (x)
Sia ora g (x, t) una componente del vattore donda G. Separiamo nuovamente le variabili
g (x, t) = X (x) Y (y) Z (z) T (t)
troviamo
X 00
Y 00
Z 00
1 T 00
XY ZT
+
+
2
=0
X
Y
Z
c T
T 00
X 00
Y 00
Z 00
2 T
k12 X
k22 Y
k32 Z
=
=
=
=
q
(c kkk)2 . La soluzione allora del tipo
dove k = (k1 , k2 , k3 ) R3 e =
c (k) eikx
R3
d3 k
(2)
= f (x)
d3 k
R3
(2)
c (k)
ei(kl)x d3 x
R3
i=1
perci
c (l) =
eilx f (x) d3 x,
R3
infine,
A (k) + B (k) =
R3
eikx a (x) d3 x
I Onde elettromagnetiche
eikx b (x) d3 x
R3
perci la terna (E, B, i) ortogonale e destrorsa, si noti che i la direzione (con verso)
della propagazione dellonda. Si noti, ancora, come i moduli di E e B coincidano. Se ne ricava
che il vettore di Poynting ha il verso della propagazione delle onde,
c
S = E2 i = uc
4
inoltre la quantit di moto dellonda vale
Z
c
1
P = 2 S dV = 2 U
c
c
e, per i moduli, si ha U = cP .
Consideriamo una cavit cubica, di spigolo, a, le cui pareti siano perfettamente riflettenti.
Fissiamo gli assi xyz paralleli agli spigoli e sia lorigine coincidente con un vertice del cubo. Il
campo A soddisfa allequazione di DAlembert. Procediamo per separazione di variabili
A (t, x) = a (x) T (t)
allora
A (t, x) = T (t) 4a (x)
1
T (t) a (x) = 0
c2
1
4ai
1 T
(x) = 2 (t)
T (t) ai (x) = 0
2
c
ai
c T
I campi E e B saranno dati dalla sovrapposizione delle onde piane aventi potenziale
T (t) eikx
e. Abbiamo
1
1 A
= T eikx
e
c t
c
per calcolare B, teniamo conto del fatto che
E=
ikx
grad eikx = ke
c
troviamo
Condizioni
al contorno
ki2 = |k|
ki = ni
a
perci,
n 2 n 2 n 2 2
1
2
3
+
+
= 2
2a
2a
2a
c
Ne deriva allora che la parte spaziale del campo B la funzione g (x) data da
gx (x) = sin k1 x cos k2 y cos k3 z;
gy (x) = cos k1 x sin k2 y cos k3 z;
gz (x) = cos k1 x cos k2 y sin k3 z.
Infine, abbiamo
E=
nN3+
X n
1
Tn (t) fn (x) , B =
Tn (t) gn (x)
c
c
3
nN+
1
L=
L d3 x =
E B2 d3 x
8 V
V
I Onde elettromagnetiche
Perci
n1 x
n0 x
cos
cos 1 dx =
a
a
Z
sin
n1 x
n0 x
1
sin 1 dx = a n1 ,n01
a
a
2
n1 x
n0 x
n2 y
n0 y
n3 z
n0 z
cos 1 sin
sin 2 sin
sin 3 d3 x + . . . =
a
a
a
a
a
a
V
Z a
Z a
ZVa
n1 x
n2 y
n3 z
n01 x
n02 y
n03 z
cos
sin
sin
cos
dx
sin
dy
sin
dz + . . . =
=
a
a
a
a
a
a
0
0
0
3
1
V
3
a n1 n01 n2 n02 n3 n03 + . . . = n,n0 + . . . = V n,n0
=
2
8
8
fn fn0 d3 x =
cos
Si ha quindi
E d x=
e, analogamente,
n0
c2
B2 d3 x =
fn fn0 d3 x =
3 V X 2
T (t)
8 c2 n n
3V X 2 2
T (t)
8 c2 n n n
3 V X 1 2
2 2
L=
T (t) n Tn (t)
32 c2 n 2 n
X 1
1 2 2
2
L=
q (t) n qn
2 n
2
n
Ne deriva il seguente
Teorema I.1
Visto che un corpo nero dato da una cavit termalizzata alla temperatura T , abbiamo
che la densit volumica di energia media u (, T ) contenuta nella cavit e dovuta ai modi
normali con frequenze tra e + d, pari allenergia media di un numero N () di oscillatori
armonici lineari allequilibrio termico a temperatura T , divisa per il volume, dove N () il
numero di modi normali del campo elettromagnetico tra e + d.
Infatti, u (, T ) tale che
1 2
u (T ) =
= u (, T ) d
E + B2
8
ma
X 1 2
1
1 2
E + B2 =
qn (t) + 2n qn2
8
2
2
n
dunque
1 2 2
1 X 1 2
u=
q (t) + n qn
V n 2 n
2
1 X 1 2
1 2 2
u (T ) = hui =
q (t) + n qn
V n 2 n
2
e
u (, T ) =
Calcolo del
numero di
modi normali
tra e + dv
1
V
n(+d)
n()
1
1 2
q (t) + 2n qn2
2 n
2
N ()
kT
V
visto che lenergia media di un oscillatore armonico (dalla legge di equipartizione) pari a kT .
Calcoliamo N (). Ogni terna (n1 , n2 , n3 ) fornisce due oscillazioni stazionarie nella cavit a
frequenza tale che
n 2 n 2 n 2 2
1
2
3
+
+
= 2.
2a
2a
2a
c
Se rappresentiamo tali terne come punti di un reticolo in tre dimensioni, si ha che tutte le
terne per cui 0 sono quelle contenute nellottante positivo e in una sfera di raggio
2a 0
r=
c
Siccome la densit dei punti reticolari 1, i punti considerati sono in numero pari a
4a3 30
1 4 8a3 30
=
8 3 c3
3c3
Ne consegue che il numero dei punti del reticolo corrispondente alle oscillazioni di frequenza
compresa tra e + d dato da
12a3 20
3c3
Il numero di oscillazioni proprie contenute nellintervallo , + d pertanto
N () =
Legge di
Rayleigh-Jeans
8a3 2
c3
In definitiva, dunque
u (, T ) =
8V 2 kT
8 2
= 3 kT
3
c
V
c
Capitolo II
Consideriamo una cavit completamente vuota le cui pareti siano portate e mantenute a
una temperatura uniforme T . Si genera, allora, allinterno della cavit, della radiazione
elettromagnetica: allequilibrio le pareti assorbono - nellunit di tempo - una quantit di
energia raggiante pari a quella che emettono.
Lo stato della radiazione descritto dalla densit di energia u che pari a
1 2
u=
E + B2
8
Daltra parte possibile definire la densit spettrale dellenergia u tale che u d la
frazione della densit di energia del campo elettromagnetico la cui frequenza compresa tra
+ d. Ne consegue che, ovviamente,
Z +
u=
u d
0
Legge di
Kirchho
Teorema II.1
(legge di
Kirchho )
La distribuzione di energia spettrale una funzione fondamentale della fisica, perch, come
aerma la legge di Kirchho, universale. Si trova, infatti, basandosi sul solo Secondo
Principio della Termodinamica, che u dipende unicamente dalla temperatura e non dalla
conformazione della cavit o dalla natura delle pareti.
La densit spettrale della radiazione nera, a una determinata frequenza, funzione della sola
temperatura.
Supponiamo di avere due cavit racchiuse da sostanze diverse e aventi forma diversa,
entrambe a temperatura T . Per assurdo, in una qualsiasi regione dello spettro le u risultino
diverse. Allora poniamo in contatto le due scatole tramite un filtro agente nelle vicinanze
della frequenza nellintorno della quale le densit sono diverse. In questo modo, senza che
si compia lavoro dallesterno, si ha che una delle cavit perde lenergia che viene acquistata
dallaltra. Cos, mentre una si raredda, laltra si riscalda. Si realizza cio uno scambio di
calore spontaneo tra due corpi alla stessa temperatura, il che contraddice il Secondo Principio
(c.v.d.) della Termodinamica.
Dimostrazione
Abbiamo perci che u dipende, oltre che da , solo dalla temperatura T , sicch ben definita
la funzione
u = u (, T )
Ovvio allora che parimenti universale lintegrale di u , u che sar funzione di T :
u = u (T ) .
Ammettiamo che la distribuzione della radiazione allinterno della cavit sia isotropa.
Cominciamo col calcolare lenergia radiante che esce in secondi da una finestra di area
dA entro langolo solido d orientato secondo langolo rispetto alla normale a dA. Si tratta
di calcolare il contributo de di energia radiante emessa da tutti gli elementi di volume contenuti
nel cono di apertura d (con lasse orientato lungo ) e di altezza c (dal momento che lenergia
viene trasportata dalle onde elettromagnetiche alla velocit c). Ciascun elemento di volume
dV allinterno del cono emette lenergia u sullangolo solido 4, la frazione che giunge sulla
finestra dA perci data da
dA
udV : de = 4 : 2
r
da cui
dA cos
dA
dV = u
dV
de = u
4r2
4r2
Daltra parte dV = r 2 drd perci lenergia radiante che esce in secondi dalla finestra dA
(sotto langolo entro langolo solido ) vale
Z c
dA cos 2
c
u
r dr d = u dA cos d
2
4r
4
0
Si definisce intensit specifica il fattore
c
4
Lenergia S irradiata nellunit di tempo, in un semispazio, dallunit di superficie vale allora
Z /2
Z /2
Z 2
1
c
d
d cos sin = K
d sin 2 = K (cos 2)|/2
= K = u
S=K
0
2
4
0
0
0
K+u
Pressione di
radiazione
In condizioni di isotropia, per pareti perfettamente riflettenti, dalle equazioni dellelettromagnetismo, si deduce che la pressione della radiazione vale
u
p=
3
La cosa ha una immediata interpretazione quantistica.
Pensiamo la radiazione
elettromagnetica come un gas di fotoni il cui impulso dato dallenergia divisa per la velocit
della luce c. I fotoni si riflettono sulle pareti in modo elastico, talch limpulso ricevuto dalla
parete nellurto con un fotone avente angolo dincidenza dato da due volte limpulso del
fotone moltiplicato per il coseno dellangolo . Nellunit di tempo sullunit di superficie
limpulso ricevuto dalla parete perci
Z /2
Z /2
Z
Z 2
1
c
u
p =
d
d cos2 sin = u
d cos2 sin =
u
cos d 2 cos =
c
4
2 0
0
0
/2 u
u
=
cos3 0 =
3
3
Lequazione p = u/3 valida se la radiazione isotropa e non richiede il fatto che essa si trovi
allequilibrio termico. In questultima condizione, u dipende solo da T e perci p dipender
solo da T . In altre parole se u la u di Kirchho p = p (T ). Mentre se u uniforme, ma non
necessariamente di Kirchho, si ha che p = u/3.
Consideriamo ora una cavit nera una cui parete sia dotata di uno stantuo libero di muoversi
senza attrito. Portiamo la cavit a contatto con un termostato posto alla temperatura T .
Estraiamo lentamente lo stantuo procurando un aumento V del volume. In questo processo
La macchina compie un ciclo di Carnot reversibile il suo rendimento perci il massimo, cio
T /T , daltra parte il rendimento dato dal lavoro totale fornito diviso per il calore assorbito
dal termostato a temperatura maggiore:
T
3 pV
3 p
1 p
=
=
=
=
T
4 uV
4 3p
4 p
da cui si ottiene che
log T 4 = log p
da cui u e p sono direttamente proporzionali alla potenza quarta della temperatura, cio, si
stabilisce la legge di Stefan-Boltzmann
u = aT 4
Ora, la misurazione della legge determinata cos come labbiamo scritta non attuabile, poich
si dovrebbe compiere una misurazione allinterno del corpo nero. Tuttavia possibile praticare
nel corpo nero un piccolo foro e misurare lenergia radiante uscente dal foro (per unit di
superficie e per unit di tempo), per quanto calcolato sopra essa sar
c
c
S = u = a T 4 = T 4
4
4
con
a=4
c
Nel derivare la legge di Stefan-Boltzmann abbiamo incontrato alcune dicolt nel trattare
le trasformazioni adiabatiche del corpo nero. Questo perch non sembra, a priori, garantito
lequilibrio termico, visto che la radiazione non pu essere emanata o assorbita dalle pareti
che sono perfettamente riflettenti. Avevamo allora supposto di immettere nel corpo una
quantit molto piccola di carbone nella cavit, in modo che la materia potesse annerire la
radiazione mantenendo la distribuzione spettrale di Kirchho alle diverse temperature. In
realt dimostreremo (legge di Wien) che la radiazione nera resta nera per trasformazione
adiabatica, anche senza immissione di carbone nella cavit.
Legge delle
adiabatiche
aT 4
dV = 4aT 3 V dT + aT 4 dV +
dV
0 = d aT 4 V +
3
3
1
0 = V dT + T dV V T 3 = const
3
da cui, incidentalmente, si trova che V 4/3 p = const.
Entropia della
radiazione nera
S
T
S
V
= 4aT 3 V dT + aT 4 dV
= aT 4 dV
4
= 4aV T 2
S (V, T ) = aT 3 V + const
= 43 aT 3
3
Compressione
adiabatica di
una radiazione
isotropa
4 3
aT V
3
2v
= 1 1 +
cos
c
Ora, consideriamo un intervallo di ampiezza d dello spettro. Valutiamo che accade allenergia
della radiazione di frequenza nellintervallo prescelto nel tempo dt, in cui, lo ricordiamo, lo
stantuo si sposta verso linterno di vdt. Sia d | 1 | cos lenergia totale V u d,
contenuta in d, diminuisce di una quantit eguale a quella della radiazione che nel tempo dt
raggiunge lo stantuo. Come gi calcolato la diminuzione vale
AK ddt.
Daltra parte si ha anche aumento dellenergia per eetto della radiazione che giunge sullo
stantuo con frequenza contenuta in un intervallo tale che, dopo la riflessione, esso viene a
coincidere col nostro d. In accordo con la formula per leetto Dppler, la frequenza incidente
dovr essere contenuta nellintervallo compreso tra 1 e 1 + d 1 . Lenergia incidente varr
AK 1 cos dd 1 dt,
0
2v
0
cos
E = E 1+
c
Z /2
2v
K 1 sin cos 1 +
cos d 1 d
2A dt
c
0
2
2v
1 = 1
cos
c
perci
d 1
K 1
2v
1
cos d
c
K
K 2v
= K +
( 1 ) = K
cos
c
=
Z /2
K 2v
2A dtd
K
cos sin cos d =
c
0
Z
K 2v /2
sin cos2 d =
AK dtd 2A dtd
c 0
K 2v
AK dtd 2A
dtd
3c
Laumento di energia complessivo per le frequenze nellintervallo d, nel tempo dt vale
4 Avdt K
d
3
c
3 c
3
Analizziamo lespressione ottenuta. Cominciamo col notare che
u dV
du = u +
3
V
d (V u ) =
(1)
Z
Z
Z
u
dV
dV
4p
u
u
p =
u d
u +
d =
d =
d =
dV
3
3V
3
3V
3
3
V
0
0
0
0
da cui si ottiene che in una espansione adiabatica per cui la u sia isotropa, e non
necessariamente di Kirchho, il prodotto
pV 4/3
resta costante (come accadeva nelle adiabatiche passanti per punti di equilibrio del sistema).
Abbiamo cio dimostrato il seguente
Lemma II.1
Invarianza
adiabatica di u
Il risultato preannunciato fa leva sui principi della Termodinamica, oltre che sulle considerazioni di elettromagnetismo gi esposte. Consideriamo una cavit nera allequilibrio termico.
Essa sia caratterizzata dalla temperatura T0 dallenergia u (T0 ) e dal volume V0 . Resta allora
definita p0 = u (T0 ) /3. Ora eseguiamo una espansione adiabatica infinitamente lenta sicch
la radiazione rimanga isotropa. Spaziamo allora la curva
pV 4/3 = p0 V0
fino al volume V1 . Adesso immettiamo una piccola quantit di carbone nella cavit di modo
da annerire la radiazione. Lenergia della radiazione rimarr invariata, cos dunque p1 , mentre
u diverr ora di equilibrio e risulter definita una temperatura T2 . In altre parole, il carbone
cambia u mantenendone il valore integrato u e apportando un aumento finito dellentropia.
Ora sempre in presenza di carbone riportiamo lo stantuo nella posizione iniziale, allora in
virt dellequazione delle adiabatiche, riavremo p0 e di conseguenza T0 e u (T0 ). Abbiamo
dunque compiuto un ciclo irreversibile. Daltra parte il lavoro compiuto dallesterno nullo
poich la forma pdV calcolata sulla curva pV 4/3 = p0 V0 una volta in un senso e una volta
nellaltro (come attesta il lemma precedente). Siamo giunti cos al
Teorema II.2
(di Wien)
Lequazione (1) ci fornisce lultima informazione sulla distribuzione spettrale che possiamo
ricavare a partire dalla termodinamica. Nondimeno il teorema che dimostreremo sar
veramente importante nel seguito della nostra trattazione.
Avevamo ottenuto che, durante una adiabatica
u
d (V u ) =
dV
3
da cui ricaviamo lequazione dierenziale
u
u
+ u =
V
V
3
Eettuiamo allora il seguente cambiamento di coordinate
x + V, y + 3 V
allora
u
V
u
u
u
+ 3
x
y
u
= 3V 2
y
da cui
x
u
u
u
+y
+ u = y
x
y
y
u
x
+ u = 0
x
(xu ) = 0
x
1 3
V
V
3V 3
u =
= 3 3V
3V
ma, siccome la trasformazione adiabatica, V T 3 = const, e perci
u (, T ) = 3 f
T
Teorema II.3
(Legge di Wien)
Teorema II.4
(Legge dello
spostamento)
,T
c
2
1
g (T )
5
ancora, possiamo ritrovare la legge dello spostamento,
T
5
0 = 6 g (T ) + 5 g0 (T )
5g () = g 0 ()
Presa la radice dellequazione, abbiamo
max T = .
Determinazione
della relazione
e u
tra E
2 e2 000
m x
+ 20 x
x = eEx .
3 c3
Scelto un intervallo di tempo molto grande il campo Ex potr essere espresso in serie di
Fourier, se a + 2/,
+
1 X
an einat
Ex =
2 n=
+
1X
=
|an |2
2 n=0
+
3 X
|an |2
8 n=
= na
= dn
perci
u =
3
3
2
|an |2
|an |2 .
=
8
a
4a
+
1 X
ina n einat
2 n=
x
=
x000
+
1 X
einat
2 n= n
+
1 X
(na)2 n einat
2 n=
+
1 X
i (na)3 n einat
2 n=
m (na) n + m 20 n +
2 e2
3
i (na) = an
3 c3
sicch si ricava
n =
perci
ean
m 20 m (na)2 + 23 i ec3 (na)3
2
e2
m2
|an |2
| n | =
2 2
2
2
(na)3
(na) 20 + 23 e mc
3
2
(na) | n | =
(na)2
E=
2 n=0
2 n=0
e2
m2
|an |2
2 2
2
2
(na)3
(na) 20 + 23 e mc
3
Allo scopo di valutare la serie, sostituiamola con un integrale rispetto a = na, nellintervallo
d cadono dn = d/a oscillazioni parziali, perci
Z
m e2
2
|an |2
E=
d
2
2 m2 0 (2 2 )2 + 2 e2 33
a
0
3 mc
Come sappiamo la funzione integranda ha un massimo molto acuto per 0 perci possiamo
eettuare le seguenti approssimazioni:
(i) sostituiamo (tranne che nella dierenza 2 20 ) 0 a ;
2
2
2
(ii) poniamo 2 20 (20 ( 0 )) = 420 ( 0 ) ;
2
d
d =
E=
2 3 2
2
2 + 2
2 m2 2 2
a
2
m
a
4
40 + 23 mc30
2 2
e
dove + 23 mc30 ,
2
2
= m e |an | 1
E
2 m2 a 2
con la sostituzione z +
=
=
1
d
2 2
+1
abbiamo
Z
m e2 |an |2 1
e2 |an |2 1
e2 4 3 mc3
1
=
dz
=
=
u
2 m2 a 2 2 z 2 + 1
4m a
4 m 3 2 e2 20
c3
u c3
=
u
2
20
8 2
Onde stazionarie
ed oscillatori
armonici
c3
u ( 0 , T0 )
8 20
Per quanto visto nellultima sezione del capitolo precedente, il numero di oscillazioni proprie
contenute nellintervallo , + d
8a3 2
d
c3
Se a ogni oscillazione propria compete lenergia media U , lenergia totale contenuta nella
cavit per frequenze in , + d vale
U
8a3 2
d
c3
a3
c3
cio
U =
c3
u = E
8 2
In altre parole,
Teorema II.5
Nella fisica classica, dal principio di equipartizione, si ottiene, per loscillatore lineare,
= kT sicch, dalla relazione tra E
e u abbiamo
lenergia media E
8 2
kT
c3
Tale formula in contrasto coi dati sperimentali, ma, anche teoricamente, appare del tutto
inadeguata, infatti lintegrale di u in , u (T ), diverge.
Questo completo fallimento della fisica classica per lirraggiamento di una cavit isoterma
rappresenta il punto di partenza di tutta la fisica moderna ed questo il motivo per
cui ha meritato tanta attenzione da parte nostra.
Si noti comunque come valga egualmente la legge di Wien:
u (, T ) =
u (, T ) =
8 3 T
k
c3
u (, T ) =
La prima discende dalle leggi dellelettromagnetismo, la seconda dalla fisica statistica classica.
Almeno una delle due certamente inesatta, essendo la loro combinazione palesemente assurda.
Planck decise di mettere mano alla seconda, tenendo ferma la prima.
Lidea di Planck
per loscillatore
armonico
Vediamo quali considerazioni guidarono Planck alla celebre modificazione della seconda delle
equazioni di cui sopra. Per un oscillatore armonico lineare la hamiltoniana vale
p2
m
+ (2)2 q 2
2m
2
Nella fisica classica il valor medio di E dato da
= log Z
E
H (p, q) =
Ora, ci che fece Planck fu di cambiare lespressione per la funzione di partizione. La sua
scelta fu, in un certo senso, naturale. Sostitu, infatti, lintegrale con una serie, discretizzando
i valori ammissibili per lenergia. Scrisse cio
X
Z+
eEn
n
Si tratta ora di fare unipotesi sui valori En , cio sui livelli energetici. La cosa pi semplice
da fare , ovviamente, richiedere eguale spaziatura tra i livelli, cio imporre
En + n0 ,
con 0 da determinare.
Abbiamo
Ricaviamo, infine, E.
Z=
da cui
1
1 e0
0
= log 1 e0 = e
= 0
E
1e
e
1
Legge di Planck
0 /
=
f
T
e0 /kT 1
0 /
0
e /kT 1
8 3
h
3
h/kT
c e
1
Questa legge, basata sullipotesi che un oscillatore armonico possa assumere solo energie pari
a un multiplo intero della quantit h, descrive correttamente il fenomeno ed in ottimo
accordo coi dati sperimentali.
4 Z +
8h kT
8 4 (kT )4
x3
u (T ) = 3
dx
=
c
h
ex 1
c3 15 h3
0
Calcoliamo la posizione del massimo (evidenziato in Figura I.1), a partire dallespressione per
u :
c c
8c
h
u (, T ) = u
,T
2 =
5 hc/kT
e
deriviamo in
8ch hc 2 ehc/kT
u
40c
h
+ 5 kT
0 =
= 6 hc/kT
2
1
e
ehc/kT 1
hc hc/kT
= 5 ehc/kT 1 +
e
kT
posto x + hc/kT troviamo che = max per x pari alla radice dellequazione seguente
5 (ex 1) = xex 5 1 ex = x
8 4 k4
= 3
c
c 15 h3
nota la misura di ricaviamo dalle due espressioni, unite al fatto che R = 8.31J mol1 K1 ,
N = 6.02 1023
a=4
Legge di
Rayleigh-Jeans
Sia
h
1
kT
(approssimazione delle alte temperature, o delle basse frequenze) e calcoliamo quanto
Figura 2. Confronto alle basse frequenze delle distribuzioni di Rayleigh-Jeans (rossa) e Planck (blu).
vale la u :
u (, T )
8 3 h
8 2
kT
=
c3 h/kT
c3
Commento sulla
legge di Planck
La determinazione che abbiamo eettuato della legge di Planck non certo soddisfacente,
perch si usano insieme metodi classici e rudimenti quantistici. Tuttavia essa, non solo
funziona correttamente come evidenziato in questa sottosezione, ma corretta pure nella
migliore versione quantistica.
Capitolo III
Nel capitolo precedente abbiamo visto come per spiegare lo spettro del corpo.nero si sia dovuto
ricorrere alla quantizzazione dei livelli energetici delloscillatore armonico. In questa sede vedremo
gli sviluppi che ebbe lidea di Planck nellinterpretazione di Einstein e Bohr. Introdotto poi il
concetto di onda di de Broglie, concluderemo la descrizione della Old Quantum Mechanics e
ne utilizzeremo i concetti fisici pi rilevanti per introdurre alla moderna teoria quantistica, i cui
postulati saranno esposti nel corso del prossimo capitolo.
Lesistenza degli atomi era gi stata accettata per spiegare le leggi fondamentali della
stechiometria, perci si era capito che a ogni elemento corrispondeva un certo tipo di atomo.
Lelettrolisi, leetto fotoellettrico, leetto termoionico, la conduzione elettrica, avevano
suggerito lesistenza, nellatomo, di particelle cariche negative. Per la neutralit della materia
si era stati costretti ad amettere la presenza di una carica positiva nellatomo. Era inoltre noto
che le particelle cariche negativamente (elettroni) erano eguali per tutti gli atomi, ne erano
infatti note massa e carica:
me = 0.9 1027 g 1027 g
e = 1.6 1019 C = 4.8 1010 ues
Dalla definizione di grammo-atomo si ha che la massa di un atomo di idrogeno vale
1g
= 1.7 1024 g, mH = 1836me
mH =
NA
Per quanto riguarda le dimensioni di un atomo, consideriamo loro, esso ha peso atomico
A = 197, perci in 197g di oro ci sono NA atomi. Siccome la densit delloro 19 g cm3 , un
grammo-atomo occupa circa 10cm3 , dunque, ogni atomo ha a disposizione un volume di circa
1.66cm3 , cio ha un raggio pari a circa 108 cm. Tale grandezza viene definita ngstrom:
1 + 108 cm
Secondo Thomson (il modello il primo presentato nel ventesimo secolo e sar il pi
accreditato almeno fino al 1910) latomo era costituito da una sfera di raggio pari a 1
in cui la carica positiva fosse distribuita uniformemente. Allora, dal teorema di Gau si
ha subito che una carica negativa allinterno risente di una forza attrattiva (diretta verso il
centro) proporzionale alla distanza dal centro della sfera. Questo spiegherebbe lemissione di
radiazione per atomi eccitati (ciascun elettrone sarebbe responsabile di una riga dello spettro).
Inoltre, spiegherebbe la regola dellottetto, infatti si pu dimostrare che anch gli elettroni
occupino posizioni di equilibrio stabile (come necessariamente deve essere) sono costretti a
disporsi su poligoni concentrici con al pi otto vertici.
Dimensioni
atomiche
Un altro successo del modello di Thomson laccordo tra energia di ionizzazione e raggio
atomico. Il potenziale della carica positiva
3 e 1 er2
,ra
2 a 2 a3
e la posizione di equilibrio stabile dellelettrone in r = 0. Allora lenergia di ionizzazione
deve essere
3 e2
EI = e ( () (0)) =
2 a
ma, sperimentalmente, EI 13.6 eV, perci a 1.6 .
(r) =
Secondo Rutherford, la carica positiva era concentrata in un a zona (nucleo) molto ristretta
rispetto alle dimensioni atomiche. Il nucleo, dunque, avrebbe carica positiva, opposta alla
somma di quella degli elettroni e massa praticamente eguale a quella dellatomo intero.Gli
elettroni orbiterebbero (su orbite evidentemente ellittiche a causa del potenziale che adesso
coulombiano) attorno al nucleo a una distanza di 1 . Il modello di paragone dellatomo
diventa il sistema solare, con una dierenza significativa: le forze tra pianeti sono attrattive
e di intensit molto minore di quella esercitata sugli stessi dal Sole, mentre le forze tra gli
elettroni sono repulsive e paragonabili a quelle esercitate dal nucleo.
Raggio atomico
Nel modello di Rutherford per lidrogeno in cui si supponga che lelettrone gira su una
traiettoria circolare, lenergia di ionizzazione vale
1 e2
a 0.53
2 a
perci gli ordini di grandezza per a sono gli stessi per Thomson e Rutherford, tuttavia i valori
di a sono diversi.
EI = E =
Interpretazione
dellesperimento
di Geiger
e Mardsen
In ogni caso, il pregio del modello di Rutherford sta nella corretta esplicazione
dellesperimento di Geiger e Mardsen. Infatti, adesso il campo elettrico della carica positiva
pu raggiungere valori molto alti, essendo il raggio nucleare molto minore di quello atomico.
Anzi, si pu arrivare a giustificare una deviazione di un angolo piatto. Per Rutherford,
al diminuire del parametro durto diminuisce langolo di deflessione, per Thomson accade
il contrario. Il dato sperimentale d ragione a Rutherford. Inoltre, se calcolassimo la
distribuzione (b) ( deviazione e b parametro durto) per lo scattering di particelle da
un nucleo carico Ze, potremmo verificare se, come ci si aspetta dal modello planetario,
essa in accordo con i dati sperimentali solo per b & r0 con r0 stima del raggio nucleare
(r0 1013 cm 1fm). In conclusione riportiamo il risultato della sezione durto per
Ze
2
mv
sin4
Tempo di
collassamento
e2
2r
W =
dE
dt
se poniamo
troviamo
2 2 2 e2 d
e |
x| =
3c3
2 dt
ma m |
x| = e2 /r2 perci otteniamo
4
3c3
e2
mr 2
d
dt
1
r
1
r
da cui
2 2
e
1 1
4
3
= 3
3 x 1/a 3c
m
sicch il tempo che occore allelettrone per cadere sul nucleo vale
3
(ca) m 2
=
4
e2
Introdotto il raggio classico dellelettrone (una lunghezza costruita con le costanti della fisica
classica)
rC +
e2
2.3 1013 cm
mc2
abbiamo
=
c
ca 1
=
4 rC
4
a
rC
a 1010 s,
Necessit
classica del
modello di
Rutherford
i J3
Eccitando gli atomi di gas o vapori (mediante urti, per esempio) si trov che essi emettevano
radiazione secondo certe frequenze precise e discrete. Tali radiazioni, che erano caratteristiche
di ciascun elemento o composto - e perci legate alle caratteristiche dei rispettivi atomi
e molecole, essendo monocromatiche, osservate allo spettroscopio a prisma, avevano forma
di sottili striscie (immegini del collimatore), perci vennero denominate righe spettrali.
Linsieme delle righe emesse dagli atomi di determinati elementi era chiamato spettro. Lo
spettro caratterizzava in modo approfondito i vari elementi, tanto che dallesame dello spettro
della corona solare fu scoperto lelio (1868, Jannsen).
Inadeguatezza
dei modelli
di Thomson
e Rutherford
h > 0;
La superficie sia metallica. Come sappiamo, in un metallo vi sono elettroni liberi e ioni
positivi legati in un reticolo cristallino.Gli elettroni liberi (elettroni di conduzione) possono
essere estratti dalla superficie del metallo se viene fornita loro lenergia di estrazione W che
dellordine di qualche eV. Ora, nelleetto fotoelettrico, lenergia di estrazione fornita
dalla radiazione incidente. Classicamente, ci dobbiamo aspettare che lenergia assorbita dagli
elettroni sia, fissata la frequenza, proporzionale allintensit, sicch ad ogni frequenza, pur
di prendere lintensit sucientemente elevata, dovremmo osservare emissione di elettroni.
Inoltre, lenergia cinetica degli elettroni dovrebbe essere proporzionale allintensit diminuita
dellenergia di estrazione. Prima e seconda legge sono dunque classicamente sbagliate.
C di pi: supponiamo di usare una lampadina da 2W posta a 1m dalla superficie;
ammettiamo che tutta la luce incidente sulla superficie sia assorbita dagli elettroni (ipotesi
in eetti grossolana); siccome c, solitamente, un elettrone di conduzione per atomo e ogni
atomo ha un volume di 1024 cm3 , ogni elettrone assorbir, al pi, lenergia che arriva su un
area di 1016 cm2 . Si ha perci che in un secondo lenergia assorbita da un elettrone dovrebbe
essere
1016 cm2
E = 2 107
erg s1 102 erg s1
4 104 cm2
cio si dovrebbe aspettare un centinaio di secondi per vedere eetto fotoelettrico, laddove il
tempo di attesa sperimentale dellordine di qualche nanosecondo.
Linterpretazione di
Einstein
delleetto
fotoelettrico
Per spiegare le leggi delleetto fotoelettrico, nel 1905, Einstein formul unipotesi del tutto
in contrasto con le idee della fisica classica e in un certo senso in linea con la supposizione di
Planck nella sua teoria del corpo nero. Per Einstein, unonda elettromagnetica di frequenza
trasporta energia in pacchetti di energia proporzionale alla frequenza
E = h,
perci lenergia di unonda elettromagnetica quantizzata. I pacchetti di energia vengono
denominati fotoni e supposti indivisibili. La costante h ovviamente la costante di Planck,
di cui al capitolo II.
Per la radiazione visibile, 4000 , 7000 , perci lenergia di un fotone a 4000 (viola)
vale
c
eV
6.6 1027 3 1010
E = h = h
3eV.
5
4 10
1.6 1012
che ha lordine di grandezza eguale a quello dei potenziali di estrazione per i metalli.
Facciamo lipotesi quantistica che nellinterazione luce-materia ogni elettrone possa assorbire
lenergia di un fotone oppure energia nulla. Sotto questipotesi, siamo in grado di spiegare
il meccanismo delleetto fotoelettrico. Trascuriamo per il momento la possibilit che un
elettrone assorba due fotoni. Allora, esso abbandoner il metallo solo se h maggiore
dellenergia di estrazione W . Lestrazione comincia alla frequenza
W
0 =
h
Se ora > 0 , gli elettroni escono con unenergia cinetica massima (pu essere anche minore
a causa, ad esempio di urti ) pari a
K max = h W = h ( 0 ) .
Possiamo inoltre prevedere che il numero di elettroni estratti sia proporzionale al numero di
fotoni incidenti, perci il numero di elettroni estratti deve essere proporzionale allenergia e in ultima analisi - allintensit della luce usata. Cosa che ha riscontro sperimentale.
Esaminiamo, infine, il problema del tempo di attesa. Riprendendo le considerazioni fatte al
paragrafo precedentemente, supponendo di usare fotoni aventi energia di 1eV, abbiamo che
in ogni secondo ciasun elettrone assorbe un centesimo di fotone o, pi correttamente, in ogni
secondo si ha un fotone incidente per ogni cento atomi. In ogni secondo, solo un elettrone
su cento in grado di sfuggire al metallo. Ora, mentre nella fisica classica lenergia incidente
veniva ripartita in modo uniforme tra tutti gli elettroni, adesso lenergia viene assorbita - tutta
- da un elettrone solo per volta. Cos si spiega che il tempo di attesa, nellinterpretazione
quantistica, sia molto basso, come detto, qualche nanosecondo. La probabilit che in un
nanosecondo lelettrone che ha assorbito un fotone ne assorba anche un altro allora del tutto
trascurabile (in un tempo cos breve si ha un fotone a disposizione ogni 1011 atomi).
Abbiamo visto, nel capitolo I, come unonda piana trasporti impulso p pari a E/c.
naturale chiedersi se ai fotoni associata la quantit di moto p = h/c. La questione si
risolve dallanalisi delleetto Compton: se facciamo incidere un fascio di raggi X di lunghezza
donda 0 < 1 su una sostanza, osserviamo che i raggi X emergenti dalla sostanza a un
angolo rispetto alla direzione di incidenza hanno lunghezza donda () > 0 . Si ottiene
sperimentalmente la seguente legge
() 0 = 0.024 (1 cos )
Interpretazione
delleetto
Compton
ck0 + me c2 = ck + m2e c4 + c2 p2
k0 k = p
dalla seconda otteniamo
k k0
se sostituiamo a k = h/c e a k0 = h 0 /c
0 =
h
(1 cos ) = C (1 cos )
me c
dove C = h/me c la lunghezza donda Compton per lelettrone e vale circa 0.024 .
Come abbiamo detto nella prima sezione, ogni sostanza pu assorbire od emettere soltanto
radiazioni elettromagnetichedi ben detrmintate frequenze. Linsieme delle frequenze che la
sostanza pu assorbire costituiscono lo spettro di assorbimento, analogamente, linsieme
delle frequenze emesse si dice spettro di emissione.
Caratteristiche
sperimentali
degli spettri
Le ipotesi
di Bohr
Il problema degli spettri, come quello delle dimensioni atomiche e della stabilit della materia
erano inspiegabili mediante le leggi della fisica classica, fu, cos, che nel 1913 Bohr formul
alcune ipotesi in grado di interpretare i risultati sperimentali:
(i) un atomo (nello stato legato, cio non ionizzato) pu avere solo un insieme discreto di
energie a partire da unenergia minima (cui corrisponde lo stato fondamentale);
(ii) quando il sistema occupa uno dei livelli energetici ammessi non irraggia, lemissione o
lassorbimento della radiazione elettromagnetica si ha solo nel passaggio di un atomo
dallenergia En alla Em , in tale caso la frequenza in gioco vale
|En Em |
h
se nella transizione si passa a uno stato a energia minore si ha emissione, altrimenti
assorbimento.
nm =
(iii) le orbite ammesse sono quelle per cui il momento angolare un multiplo intero di
~ = h/2.
Interpretazione
degli spettri
secondo Bohr
La seconda legge chiarisce in modo lampante il fatto che gli spettri sono costituita da righe.
La prima aerma poi che ogni sostanza deve avere spettri continui corrispondentemente agli
stati non legati.
Le ipotesi di Bohr sembrano pesantemente ispirate alla legge di Einstein secondo cui lenergia
di un fotone h.
Se ammettiamo che a temperatura ambiente quasi tutti gli atomi si trovino nello stato
fondamentale (cosa che giustificheremo nel corso della sezione seguente) abbiamo che in
assorbimento si trovano solo le frequenze (En E0 ) /h. In emissione invece i salti sono multipli
sicch lo spettro di emissione risulta molto pi ricco.
Principio di
combinazione
di Ritz
En E0 Em E0
= nm
| 0n 0m | =
h
h
che il principio di combinazione di Ritz e che era gi noto a Bohr (risale al 1908).
Stabilit atomica
Chiaramente la teoria di Bohr, che in totale contrasto con la fisica classica, supera il
problema del collassamento della materia, infatti, gli elettroni girano senza irraggiare su
orbite a energia fissata maggiore o eguale di E0 . Le dimensioni dellatomo corrisponderanno,
a temperatura ambiente, con il raggio dellorbita nello stato fondamentale.
tempo di usare la terza ipotesi di Bohr per calcolare le energie En e stimare il raggio atomico.
La terza ipotesi di Bohr pu essere generalizzata (ipotesi di Bohr-Sommerfeld) nel modo che
segue
I
p dq = n~, n = 1, 2, . . .
orbita
Raggio di Bohr
1
1 e2
V =
2
2 r
da cui
1 2 1 e2
n2 ~2
v =
rn =
2
2 r
e2
~2
0.53
me e2
Inoltre si ha che lenergia di ionizzazione vale
a = rB +
1 e2
2 rB
che in ottimo accordo col dato sperimentale (da cui segue che il raggio stimato col modello
di Rutherford coicide con quello di Bohr).
EI =
Sia dato un sistema statistico formato da N particelle. Se denotiamo con u la sua energia
interna totale per mole, definiamo calore specifico a volume costante la quantit
u
CV =
T V
Consideriamo, in primo luogo, un gas perfetto, cio un insieme di N particelle non interagenti
tra loro. Denotiamo con D il numero dei gradi di libert di ciasuna molecola, e con (p, q) le
coordinate nello spazio delle fasi 2D-dimensionale di singola molecola (-raum). Il sistema
regolato, allequilibrio termico, dalla statistica classica di Boltzmann, per cui il numero n (p, q)
di particelle contenute nellelemento di volume di , dpdq, pari a
dn (p, q) = B exp [H (p, q)] dpdq
dove H lhamiltoniana del sistema e + 1/kB T , con kB = 1.38 1016 erg K1 costante di
Boltzmann. B si trova imponendo
Z
Z
N=
dn (p, q) = B exp [H (p, q)] dpdq
R
H (p, q) dn (p, q) = N
u=
exp [H (p, q)] dpdq
Z () +
si ha
u = N
Daltra parte, vale il seguente
Teorema III.1
(dellequipartizione
dellenergia)
log Z ()
Se H della forma
H = H0 + H1
con H0 quadratica definita positiva e dipendente da coordinate canoniche dalle quali H1
indipendente, allora H0 medio allequilibrio termico pari a volte 1/2kB T .
Dimostrazione
Calcoliamo Z ()
1
H0 =
Z ()
diagonalizziamo H0 con una rotazione agente sulle variabili da cui questa dipende e che
lascia invariate le altre. Il determinante di tale operatore banalmente 1. Sia H0 = 2i 2i
e H1 = H1 (), allora
R
R
d exp [H1 ]
d 2i 2i exp 2i 2i
R
R
H0 =
2 2
d exp i i
d exp [H1 ]
R
2 2
0
e definita Z () = d exp i i si ha
H0 =
log Z 0 ()
1/2
(c.v.d.)
kB T
2
CV per
hamiltoniane
quadratiche
u = N kB T
2
1
23
con N = NA = 6.022 10 mol (numero di Avogadro). In definitiva
u = RT
2
da cui
CV = R
2
che indipendente dalla temperatura.
Gas
monoatomico
Se ne ricava che per il gas perfetto monoatomico CV = 3/2R se schematizziamo ciascun atomo
come un punto (e non si capisce bene perch dovremmo trascurare il moto degli elettroni, ad
esempio).
Gas biatomico
Se il gas biatomico e supponiamo che i due atomi siano a distanza fissata (la molecola
perci una sorta di manubrio) abbiamo che i gradi di libert divengono 5 e lhamiltoniana
quadratica
!
p2
p21 + p22 + p23
1
2
H=
+
p +
2m
2I
sin2
allora
CV =
Solidi, modello
di Einstein,
legge di
Dulong e Petit
5
R
2
Se consideriamo i solidi abbiamo che essi consistono di piccoli cristalli in cui gli ioni oscillano
attorno a posizioni di equilibrio fisso e perci possiamo assumere che le oscillazioni siano
armoniche. Ogni ione allora un oscillatore armonico tridimensionale indipendente dagli altri
(gas perfetto di oscillatori). In questo modello, che dovuto ad Einstein, per ogni atomo
abbiamo
CV = 3nR
Per i metalli n = 1 e CV = 3R (legge di Dulong e Petit).
Incongruenze
teoriche e
sperimentali
dove ni indica il numero di particelle aventi energia pari a i (per loscillatore abbiamo visto
che i = ih).
Popolamento
dei livelli
Calore specifico
secondo Einstein
h
log Z () = h
e
1
u = 3NB H
cio
u
CV =
= 3NA kB
T
h
kB T
exp (h/kB T )
[exp (h/kB T ) 1]2
CV 3R, T
e, in accordo a principio di Nernst e dato sperimentale,
CV 0, T 0.
Inadeguatezza
del modello
di Einstein
Modello
di Debye
Fu Debye a fornire completa spiegazione dei fatti rilevati. Egli suppose i vari oscillatori legati
elasticamente, cio consider le piccole oscillazioni degli ioni dalle posizioni di equilibrio del
reticolo nel quale erano fissati dalle mutue interazioni (oscillatori accoppiati).
Se V (x1 , . . . , xN ) il potenziale del sistema degli N ioni, nellapprossimazione delle piccole
oscillazioni
N
1 X 2V
xi x0i xj x0j
V (x1 , . . . , xN ) =
2 i,j=1 xi xj
Come sappiamo il secondo membro una funzione quadratica e perci, tramite una rotazione,
si pu ricondurre il sistema alla sovrapposizione di 3N oscillatori unidimensionali indipendenti
di frequenze i .
Lenergia media delloscillatore i-esimo vale
h i
H i = h i
e
1
e lenergia totale vale
u=
3N
X
H i.
i=1
Congelamento
degli oscillatori
Fissata una temperatura T , poniamo T + kB T /h, allora, supposto min < T < max ,
gli oscillatori a frequenza < T contribuiscono per unenergia Hi kB T (largomento
dellesponenziale sta vicino allo 0, al primordine si ha exp (h/kB T ) 1 + h/kB T ). Al
contrario, gli oscillatori a frequenza maggiore di T contribuiscono per molto poco allenergia.
Gli oscillatori a < T si dicono, di conseguenza, scongelati, gli oscillatori per cui > T
sono invece congelati. La temperatura per cui tutti gli oscillatori sono scongelati si dice
temperatura di Debye:
h max
+
T
per T > il calore specifico si avvicina a quello previsto dalla legge di Dulong e Petit.
Chiaramente nel modello di Einstein tutti gli oscillatori si congelavano e scongeleavano
contemporaneamente, questo comportava una rapida decrecsenza a zero del CV . Si pu
dimostrare (vedi Appunti di Struttura della Materia) che il modello di Debye prevede il corretto
Per i gas monoatomici non avevamo riscontrato palesi discrepanze tra modello classico ed
esperienza. In eetti, essi sono formati da particelle libere alle quali, perci, non si applicano
le condizioni di quantizzazione di Bohr. In realt le particelle sono vincolate a muoversi
allinterno della scatola che racchiude il gas, perci non sono libere. Possiamo discutere questo
aspetto nel modello semplificato di gas unidimensionale. Dunque, le particelle siano costrette
a muoversi entro un segmento di lato a. Allora
I
p dq = nh
da cui
perci
p
2a 2mEn = nh
h2
= n2 E1
8ma2
preso a = 1cm, m = 1024 g si ha E1 1018 eV. Ora, per n 1 En+1 En 2nE1 . I livelli
sucientemente popolati sono quelli per cui En . kB T (energia di agitazione termica), cio
sono quelli per cui
r
kB T
n.
E1
perci le distante tra i livelli che ci interessano sono dellordine
p
E . E1 kB T .
En = n2
per cui il gas non si accorge della quantizzazione a nessuna temperatura, e questo
coerente con il fatto che il calore specifico rimanga costantemente pari a 3/2R.
Gas biatomici
Hrot =
(mvd)
L2
=
2
md
2I
Invece, per temperature molto minori di quella critica definita, ci aspettiamo che CV trovi
un contributo tendente a 0 per T 0. Questo perch, a basse temperature, per calcolare
u, possiamo riferirci a due soli livelli (se il terzo abbastanza lontano). Posto allora
E = E2 E1 , abbiamo
u = NA
EeE
E1 eE1 + E2 eE2
=
N
E
+
N
A
1
E
E
1 + e
2
e
1 + eE
da cui
CVrot = R
E
kB T
eE/kB T , per T
E
kB T
Non occorre addentrarci nei calcoli dei congelamenti o meno degli altri grdi di libert (rotazione
attorno alla congiungente, moto degli elettroni, manubio sostituito da molla), il meccanismo
chiaro: si conteggiano i gradi di libert i cui livelli energetici siano confrontabili con lenergia
di agitazione termica.
La vecchia meccanica quantistica chiarisce perci le incongruenze sui gradi di libert che
comparivano nella teoria classica.
Sia (x) un campo scalare relativistico, dove x = (ct, r), allora, se indica la trasformazione
di Lorentz, troviamo
0 (x0 ) = (x) ,
x0 = x
Lunghezza
donda di
de Broglie
i
exp
(p xEt)
~
Ipotesi di
de Broglie
Si arriva alla formulazione della seguente ipotesi: ad ogni particella associata unonda avente
lunghezza donda pari a /p. Inoltre, de Broglie pens che dato linsieme di tutte le orbite
classiche della particella in un campo, quelle eettivamente percorribili avessero lunghezza
pari a un numero intero di lunghezze donda, anch la particella non andasse a interferire
con se stessa. Questultima idea rende conto dellipotesi di Bohr per le orbite circolari, ad
esempio. Infatti,
h
2r = n
p
da cui
pr = L = n~
Fin qui lipotesi ondulatoria prettamente matematica, per verificarla ci occorrebbe un
esperimento in cui si potesse osservare linterferenza di particelle.
Cominciamo col considerare una particella libera, la sua lunghezza donda risulterebbe
h
=
2mE
per un elettrone
12.4
=p
E [eV]
Esperimento
di Davisson
e Germer
da cui per energia dellordine di 100 eV gli elettroni hanno lunghezza donda dellordine di
quella dei raggi X.
Consideriamo la riflessione dei raggi X da parte di un cristallo (riflessione alla Bragg). In
un cristallo si hanno famiglie di piani paralleli sui quali sono sistemati in maniera regolare gli
atomi.
Sia d la distanza tra i piani, il suo valore tipico di 1 . Sperimentalmente si trova che
osservando raggi X monocromatici riflessi specularmente (a un angolo pari a quello di incidenza
) dal cristallo, si nota che la radiazione riflessa solo per partciolari valori di = 1 , 2 , . . .
La figura che si raccoglie cio una figura di interferenza il che comporta che i raggi X sono
onde. Infatti, se consideriamo i raggi paralleli riflessi da due piani consecutivi, la dierenza di
cammino ottico vale 2d sin : perci si avr un massimo per
2d sin = n
e un minimo per
2n + 1
.
2
La stessa esperienza fu eettuata nel 1927 da Davisson e Germer sostituendo i raggi X con
un fascio di elettroni monoenergetico. Quello che si ottenne fu una figura di interferenza dalla
quale si pot ricavare il valore di per lelettrone, verificando la legge prevista da de Broglie.
Si ha perci che lipotesi di de Broglie va oltre la speculazione matematica, ma riflette una
realt fisica eettiva. Il lavoro di de Broglie costituisce il distacco pi netto dalla fisica classica
e apre lorizzonte alla moderna meccanica quantistica.
Si tratta ora di capire come conciliare il dualismo onda-particella in uno schema teorico che
sicuramente deve andare oltre la giustapposizione di teorie classiche e ipotesi innovative che
hanno caratterizzato la Old Quantum Mechanics, cos come labbiamo attraversata noi: dal
1905 e al 1925.
2d sin =
Interpretazione
corpuscolare
Esperimenti con
un singolo fotone
arrivato), e dovr essere equivalente alla sovrapposizione di due figure di dirazione centrate
sulle proiezioni di A e B. Ma come abbiamo visto questa interpretazione in disaccordo con
lesperienza. Si parla allora di interferenza da un singolo fotone.
Stato di
un sistema
Misura e
perturbazione
dello stato
px
h
= =
p
a
pa
Realt e misure
In entrambi i casi si ottiene che il prodotto degli errori sulle misure simultanee di x e del suo
momento coniugato vale circa h. Si ha perci che impossibile misurare con precisione elevata
quanto si vuole le due grandezze e che meglio si conosce una quantit peggio si conosce laltra,
al limite che se una delle due del tutto nota laltra indeterminata (nellesperimento di
Young sappiamo che i fotoni hanno una certa direzione e ne consociamo la lunghezza donda,
segue che ne conosciamo completamente limpulso, di conseguenza non ne conosciamo aatto
la posizione: passano da entrambe le fenditure!?).
Nei due esperimenti concettuali descritti, si ricava il principio di indeterminazione di
Heisenberg, secondo il quale, appunto, x px & h. Ricaveremo in seguito rigorosamente,
posti alcuni assiomi, questo risultato.
In meccanica quantistica linesistenza della traiettoria qualcosa che va al di l del semplice
fatto che noi non siamo in grado di rilevarla. Infatti, se la traiettoria esistesse in realt,
ma ci fosse solo un problema nel misurarla, nellesperimento di Young a intensit minima, i
fotoni, seguendo un ben preciso percorso, dovrebbero passare da questa o dallaltra fenditura
e perci non si dovrebbe avere interferenza, ma giustapposizione di figure di dirazione. Il
problema non relegato solo alla nostra impossibilit di eettuare una misura con determinata
precisione, ma che realmente non definita una traiettoria (non solo noi non sappiamo dove
sta un elettrone nellesperimento di Davisson e Germer - o un fotone nellesperimento di Young,
ma nemmeno lui lo sa).
Capitolo IV
In questo lungo capitolo viene sviluppato il formalismo della meccanica quantistica attraverso
lesposizione di tutti i suoi postulati. La formulazione matematica a livello di un corso del
terzo anno, si richiede soltanto la conoscenza elementare degli spazi di Hilbert e degli operatori
in tali spazi. Giocoforza, questo limita il rigore matematico dellesposizione (ad esempio nelle
autoaggiunzioni e nel domain problem), nondimeno approfondiremo le questioni matematiche
tralasciate (e non sono poche) nel corso di Meccanica Quantistica (il cui quaderno in lavorazione).
Come per i fotoni, ci necessario introdurre - per la descrizione degli stati - uno spazio
vettoriale complesso. Se lambiente della meccanica classica era lo spazio delle fasi, nella
meccanica quantistica, imposto il concetto di linearit, o, ed lo stesso, di sovrapposizione,
si forzati ad ambientare la nuova fisica in uno spazio vettoriale. Cos, ad ogni stato del
sistema si postula che corrisponda un raggio dello spazio vettoriale, cio un insieme di vettori
proporzionali (secondo una costante complessa).
Nello spazio considerato introduciamo un prodotto scalare hermitiano. Adesso, andiamo a
completare lo spazio indotto nella topologia indotta dal prodotto scalare: in questo modo lo
spazio che occorre alla descrizione degli stati uno spazio di Hilbert, H, nel quale linsieme
dei raggi rappresentanti stati fisicamente realizzabili denso. Assumeremo, inoltre, che H sia
separabile.
In seguito a quanto discusso a proposito del principio di indeterminazione di Heisenberg,
rinunciamo subito ad avere a priori - per tutte le quantit misurabili - valori precisi.
Identificheremo allora gli stati tramite le rispettive statistiche. Due apparati preparano lo
stesso stato se le statistiche su tutte le possibili misure sono le stesse.
La portata pi grande del principio di sovrapposizione, sta nel fatto che due stati diversi
possono interferire tra loro. Perci, nellesperimento di Young per singolo fotone, lo stato
in cui sono aperte entrambe le fenditure (che avevamo chiamato stato C) rappresentato
dalla somma in H dei vettori A e B rappresentanti, ordinatamente, A e B. Cio lo stato
C ha come vettore rappresentativo C = A + B . Nel dire questo abbiamo ammesso che
almeno tutte le combinazioni lineari finite di vettori appartenenti a raggi che rappresentano
stati possibili del sistema siano, esse stesse, stati possibili del sistema.
Osservabili
Data una osservabile, chiamiamo spettro di quellosservabile, linsieme dei valori che pu
assumere su tutte le possibili misure eettuabili (su tutti gli stati del sistema). Gli elementi
dello spettro si chiamano autovalori e verrano indicati con lettere corsive. Per esempio, lo
spettro dellenergia E di un oscillatore armonico costituito da tutti i valori nh, lo spettro
della coordinata q invece compreso in un intervallo reale
Come gi accennato, il risultato della misura di una osservabile A su uno stato qualsiasi di
un sistema non in generale noto a priori, ma regolato semmai da una certa distribuzione
(continua o discreta a seconda dello spettro) di probabilit: perci nellesperimento di Young
con singolo fotone non a priori detto che nello stato con due fenditure aperte si ottenga il
movimento di uno specchietto o dellaltro, ma si trova che i due esiti hanno probabilit 1/2 di
verificarsi.
Autostati e
autovettori
Chiamiamo invece autostati di A quegli stati sui quali il risultato della misura determinato
a priori. I vettori rappresentativi di un autostato si dicono autovettori. Un autostato di
A corrispondente allautovalore ai (per il momento ci limitiamo al caso di spettro discreto
rinviando a dopo ogni discussione in merito a quando questo si verifica, abbiamo comunque
esempi in cui accade) uno stato del sistema per il quale la misura di A sul sistema in quello
stato d come risultato il valore ai . Scriveremo, se rappresentativo di un autostato relativo
ad ai ,
PAi () = 1
cio la probabilit di trovare il risultato i-esimo, cio ai , misurando A su uno stato
rappresentato dal vettore 1.
Autostati a un certo autovalore, cui corrispondano autovettori indipendenti si dicono degeneri;
viceversa, autostati cui corrispondano autovettori il cui spazio generato (autospazio) abbia
dimensione 1 sono detti non degeneri.
Assumeremo che ogni osservabile A ammetta un insieme di autovettori che sia un set completo
in H.
Torniamo un attimo alla Old Quantum Mechanics, Born propose come significato della
funzione donda di de Broglie (x, t) il fatto che il suo modulo quadrato indicasse la probabilit
di trovare la particella al tempo t nellintervallo tra x e x + dx (fatto che sottintenedeva che
lintegrale su R di fosse 1). Cio, presa losservabile Q, posizione, la probabilit di misurare
Q tra x e x + dx vale
PQx () =
che una forma hermitiana.
Usiamo allora il prodotto scalare introdotto in H per porre il seguente assioma
i
PAi () = , KA
i
dove KA
una trasformazione lineare di H. Conveniamo di operare con vettori di norma
unitaria, altrimenti dovremmo porre
, KA
i
PA () =
(, )
Vettore
nullo. Fase
Si deve notare che il vettore nullo non rappresenta alcuno stato fisico del sistema,
poich per ogni osservabile A per ogni suo valore dello spettro
PAi = 0
Inoltre, si presti attenzione al fatto che anche lavorando con vettori di norma 1 a ogni stato
sono associati infiniti vettori, basta infatti moltiplicare per una fase exp (i) qualunque.
Interpretazione
probabilistica
della
sovrapposizione
Indipendenza
lineare degli
autovettori
di autovalori
distinti
Calcolo della
probabilit
i ()
PA
m,l
Aiml = (m , KA l )
che una matrice a uninfinit numerabile di entrate. Vogliamo calcolare Aiml . Cominciamo
con lo scegliere m = l + i, abbiamo
1 = PAi (i ) = Aiii .
Molto semplice anche il caso m = l 6= i, perch si ha
0 = PAi (m ) = Aimm .
0 PAi () =
|bi |
bm Ami bi
bi Aim bm
+
+
N2
N2
N2
da cui
0 |bi |2 + bm Aimi bi + bi Aiim bm
per ogni bi e bm complessi. Sia, allora bi = R, ne ricaviamo
0 2 + bm Aimi + bm Aiim
scegliamo bl = R0 e troviamo
Ailm bm + bm Aiml = 0
PAi () = |ci |
dove ci = (i , ), infine
PAi () = |( i , )|2 .
Adesso calcoliamo
2
0 = PAi (k ) = |(i , k )|
da cui autovettori relativi ad autovalori distinti sono ortogonali (ne avevamo gi dimostrato
lindipendenza).
Ci chiediamo che cosa accade se lautovalore i-esimo degenere. In questo caso, esister
un certo numero, finito o infinito di vettori ij , numerati da j, appartenenti allautospazio
dellautovalore i-esimo. Restano allora i fatti seguenti: Aiml = 0 se m, l 6= i, Aij i j i . Ma che
accade per gli elementi j i 6= ki ?
b Aij i ki c + c Aiki j i b
1 2
2
Corrispondenza
di H con
2
PAi () =
X (i) 2
cj
j
e che
1=
X
i
PAi () =
X (i) 2
cj
i,j
cio che
H 3 7 {ck } D2
dove abbiamo abbandonato lesplicitazione degli autovalori degeneri. Chiamiamo A la
corrispondenza indotta dallosservabile A (nella base {k } indotta, appunto, da A) tra H
e D2 . Ci proponiamo di studiare A .
Linearit e
invertibilit
di A
Cominciamo col notare che si tratta di unapplicazione lineare, poich, per ogni k
ck = (k , )
2
inoltre, limmagine di A tutto D . Infatti, presa una qualunque sequenza {ck } il vettore
X
=
ck k
k
appartiene a H per la completezza del set. Veniamo a calcolare il kernel dellapplicazione, sia
ker A allora
k
(k , ) = 0
X
X
X
X
X
(, ) =
ck k ,
cj j =
ck k ,
cj j =
ck cj k , j =
j
ck cj
k,j
= (A , A )#2
k,j
Continuit e
unitariet di A
(, ) = (A , A )#2 = , +
A A
, +
A A = 0
+
A A = I
!
X
X
X
ck = (k , ) = k ,
(n , ) n =
(k , n ) (n , ) =
(k , n ) bn
n
k k = I.
Definizione di A
Pn
Pn
2
2
2
A k=1 ck k
k k=1 ck ak k k
k=1 ak |ck |
=
=
P
P
P
|ck |2
|ck |2
|ck |2
che limitata se |ak | M per ogni k. un fatto che la limitatezza dello spettro sia in generale
falsa, basti pensare allo spettro dellenergia di un oscillatore armonico unidimensionale, perci
a
di solito si avr DA 6= H e ci si dovr accontentare del fatto che, comunque, (DA ) = H.
Dal punto di vista fisico si dovrebbe anzi osservare che questi aspetti patologici derivano solo
dalla trattazione matematica che , evidentemente, non del tutto adeguata: gli strumenti di
misura (che abbiamo detto coincidono con le osservabili) hanno sempre scala limitata e non
ha alcun senso parlare di grandezze infinite.
Hermiticit di A
!
!
X
X
X
, A
=
,
ak (k , ) k =
ak (k , ) (k , ) =
ak (k , ) k , =
k
=
A,
autovettori di A
Sappiamo che tutti gli autovalori dellosservabile A, cio i valori del suo spettro fisico
autovalori di A agli autovettori k che rappresentano i
{ak } sono, per definizione di A,
corrispondenti autostati. La terminologia usata nelle definizioni di cui alla prima sottosezione
erano giustificate da questo.
Andiamo a calcolare eventuali altri autovalori di A
= b,
A
prendiamo DA e sviluppiamolo in serie
X
X
X
A
bk k =
ck bk k =
ck b k
k
Daltra parte ogni operatore hermitiano F ha autovalori reali, infatti sia b autovalore di F e
6= 0 autovettore relativo a b, allora
(b, ) = (F , ) = (, F ) = (, b)
cio
b (, ) = b (, )
da cui, essendo non nullo, b = b.
Sappiamo che se F ha spettro puramente discreto i suoi autovettori sono un set completo di
H. Perci lecito postulare che ogni operatore autoaggiunto a spettro puramente discreto
associata una osservabile. Comunque, vedremo in seguito che sar lecito elevare al rango di
osservabili anche tutti gli altri operatori autoaggiunti...
Valor medio
e di A
di A
X
X
X
, A
=
ck k ,
aj cj j =
ck aj cj k , j =
ck aj cj kj =
j
X
k
ak |ck | =
j,k
ak PAk
j,k
() = A
cio il valor medio - matematico - di A pari al valor medio - fisico - di A sullo stato .
Abbiamo quindi mostrato lequivalenza di A e A, di conseguenza, spesso e volentieri, tireremo
via il cappuccio dalla A e indicheremo con A anche loperatore autoaggiunto associato (e
abbiamo discusso la profondit di una tale corrispondenza).
Postulati per
il caso di
spettro continuo
Allora poniamo alcuni postulati. In un ambiente esterno a H (in cui ancora definito il
prodotto scalare) esistano elementi q numerati da q nello spettro di Q, tali che per ogni
H
Z
= dq c (q) q
da cui c (q) L2 . Postuliamo infine che per ogni c (q) L2 esista H tale che
Z
= dq c (q) q .
Determinazione
di c (q) .
Relazione di
ortonormalit
Dai postulati ammessi abbiamo che, preso H di norma N , troviamo c (q) tale che
Z
=
= dq c (q) q
N
daltra parte vale in modo ovvio che
Z
Z
1
1
1 = 2 (, ) = dq |c (q)|2 + 2 dq |b (q)|2
N
N
ma
Z
Z
Z
N 2 = (, ) =
dq b (q) q , dq 0 b (q 0 ) q0 = b (q) q , q0 b (q 0 ) dqdq 0
da cui
Si ha perci
dq b (q)
dq 0 b (q 0 ) (q q 0 ) =
dq b (q)
dq 0 b (q 0 ) q , q0
(, A) = (, B)
(IV.1)
(Bb) (q) =
dq 0 b (q 0 ) q , q0
2
b (q) = dq 0 b (q 0 ) q , q0
da cui si conclude
q , q0 = (q q 0 )
q , =
q ,
dq 0 c (q 0 ) q0
q , = dq 0 c (q 0 ) q , q0 = dq 0 c (q 0 ) (q 0 q) = c (q)
da cui, infine,
Corrispondenza
tra H e L2 : q
2
2
p (q) = |c (q)| = q , .
q , = c (q)
essa definisce una corrispondenza, che chiameremo q , tra H e L2 (L2 sullo spettro
dellosservabile). Studiamo q .
q ( + b) = q , + b = q , + b q , = q () + bq ()
R
Come postulato per ogni c (q) L2 il vettore = dq 0 q0 c (q 0 ) H, ma
Z
Z
q = q , dq 0 q0 c (q 0 ) = dq 0 q , q0 c (q 0 ) = c (q) .
Calcoliamo il kernel dellapplicazione. Sia ker q , cio
Z
q 0 = q , = dq 0 q , q0 c (q 0 ) = c (q)
da cui
p (q) = 0
Z
Z
dq 0 q0 c (q 0 ) , q =
(, ) =
dq 0 q0 c (q 0 ) , dq q b (q) = dq b (q)
Z
Z
Z Z
=
dqdq 0 b (q) q0 , q c (q 0 ) = dq b (q) dq 0 c (q 0 ) q0 , q =
Z
=
dq b (q) c (q) = (q , q )L2
Unitariet di q
(q , q )L2 = +
q q , = (, )
+
q q = I
Z
Z
= dq q , q = dq q q
da cui, abbiamo
dq q q = I
Definizione di Q
Associamo allosservabile Q loperatore Q
q = qq
Q
sulla base di H indotta da Q. Abbiamo allora che, supponendo di poter commutare integrale
in un insieme abbastanza ampio,
eQ
Z
Z
Q = Q dq c (q) q = dq qc (q) q
e, come vediamo, deve almeno essere qc (q) L2 .
molto semplice:
Nelle coordinate, la rappresentazione di Q
Z
Z
q Q
= q , dq 0 q 0 c (q 0 ) q0 = dq 0 q 0 c (q 0 ) q , q0 = qc (q)
= q , Q
cio
Hermiticit di Q
= qc (q) .
qc (q) = q Q
calcoliamo
Nel dominio di definizione di Q
Z
Z
, Q
=
, dq q q , q = dq q q , q , =
dq q q , q ,
=
Q,
=Q
+ , cio Q
hermitiano.
da cui Q
Autovalori e
autovettori di Q
= b q Q
= q (b) qc (q) = bc (q)
Q
qc (q) = bc (q)
cio, per ogni q nello spettro,
(q b) c (q) = 0
cio
c (q) = 0
e il suo spettro (matematico) vuoto.
e dunque = 0. Ossia non esistono autovalori di Q
Dato un operatore lineare T avente dominio DT e immagine Im T in H (spazio vettoriale
qualsiasi), per ogni complesso definiamo loperatore T = IT . Se 0 C tale che T0 ha
inversa, diciamo che 0 appartiene al risolvente di T . Il complementare in C del risolvente si
dice spettro. Ovviamente, se T ammette un autovalore esso appartiene allo spettro, poich
vale identicamente I T = T = 0 che non invertibile. La definizione data di spettro
eettivamente unestensione di quella di insieme di autovalori.
perci calcoliamo
Spettro
Siccome q un isomorfismo lo spettro di q coincide con quello di Q,
delloperatore q il primo. Sia I R lo spettro di Q. Allora vogliamo trovare linversa di q nellinsieme
f (q) f (q) , qf (q) L2 (I) . C appartiene al risolvente di q se per ogni b (q) esiste
c (q) L2 (I) tale che ( q) c (q) = b (q). Questo implicherebbe
Estensione
del concetto
di spettro
matematico
c (q) =
b (q)
,
q
funzione che non appartiene nemmeno ad L2 (I) se I. Ne abbiamo perci che lo spettro
coincide con I.
di Q
Con lampliamento della definizione di spettro siamo riusciti a concludere che spettro di Q e
sono lo eguali.
spettro di Q
Valor medio
e di Q
di Q
Come nel caso discreto, interpretiamo fisicamente loperatore osservabile. Calcoliamo il valor
medio (matematico) di Q
Z
Z
Z
Z
, Q
=
dq c (q) q , dq 0 q 0 c (q 0 ) q0 = dq c (q) dq 0 q 0 c (q 0 ) q , q0 =
Z
Z
2
=
dq q |c (q)| = dq qp (q) = Q
Fissiamo, come nel caso di spettro continuo, tre postulati mutuati dal caso di spettro
di spettro discreto che abbiamo arontato sfruttando le considerazione fisiche derivanti
dallintepretazione di Born...
Sia Q unosservabile a spettro misto: lo spettro continuo sia numerato dalletichetta reale
Come ultimo postulato, assumiamo che per ogni c (q) L2 e ck D2 , esista H per cui
Z
X
= c (q) q dq +
ck k .
k
Conseguenze
dei postulati
In primo luogo, per ogni vettore H normalizzato, dal primo e dal secondo postulato,
abbiamo
Z
X
2
2
1 = |c (q)| dq +
|ck |
k
da cui c (q) L e ck D .
Se un vettore di norma N , esistono c (q) e ck tali che
Z
X
= N c (q) q dq +
N ck k
k
Denotiamo adesso con H1 lo spazio generato dai vettori k . H1 un sottospazio chiuso, perci
ammette in H complemento ortogonale H2 = H1 . Chiamiamo adesso H0 linsieme dei vettori
sicch
|b (q)|2 dq = 0
b (q) = q ,
bk = (k , )
Relazione di
completezza
k , q = 0.
= dq q , q +
(k , ) k ,
k
si ha
Rappresentazione in
coordinate
X
dq q q +
( k k ) = I
k
|H1 = (k , )
() = ( k , ) q ,
(q)
|H2 = q ,
Loperatore hermitiano associato allosservabile Q (separatamente negli spazi H1 e H2 )
rappresentato nella base fissata come
q () = Q
= ak ck qc (q)
Rappresentazione di
un operatore
Z
X
q ,
( k , ) T k + q , dq 0 q0 , T q0 =
q , T =
k
Z
X
=
q , T q0 dq 0 q0 , =
q , T k (k , ) +
k
Z
X
=
q , T k ck +
q , T q0 dq 0 c (q 0 )
k
e come si vede si ha il prodotto righe per colonne di una matrice, composta da righe continue
(numerate da q) e con colonne in parte numerabili (numerate da k) e in parte continue
(numerate da q 0 ), e di un vettore a componenti in parte discrete (numerate da k) e in parte
continue (numerate da q 0 ).
Z
X
j , T =
j ,
(k , ) T k + j , dq 0 q 0 , T q0 =
k
Z
X
=
j , T q0 dq 0 q0 , =
j , T k (k , ) +
k
Z
X
=
j , T q0 dq 0 c (q 0 )
j , T k ck +
k
dove stavolta abbiamo il prodotto righe per colonne di una matrice, avente righe discrete
numerate da j e colonne in parte discrete (numerate da k) e in parte continue (numerate
da q 0 ), e di un vettore a componenti in parte discrete (numerate da k) e in parte continue
(numerate da q 0 ).
A suo tempo, abbiamo notato che non tutte le osservabili possono essere note con precisione
arbitraria contemporanea (si veda, per esempio, il principio di Heisenberg). Peraltro, sappiamo
che solo su certi stati del sistema si ha la possibilit di avere un valore preciso per una
osservabile. Ne consegue che, date due osservabili, A e B, e dato autostato di A, B non
ha - in generale - un valore su . Se per accade che sia A che B abbiano un valore preciso
sullo stato del sistema, allora autostato simultaneamente di A e B. In tale autostato le
due osservabili possono essere note con precisione qualsivoglia contemporaneamente. Se ora
gli autostati simultanei costituiscono un set completo di H, allora A e B si dicono osservabili
compatibili.
Osservabile
prodotto.
Commutatore
(AB) = B + A+ = BA 6= AB
cio, AB hermitiano se e solo se A e B commutano, cio se e solo se
[A, B] + AB BA = 0.
La condizione di commutatore nullo implica non solo che AB unosservabile, ma anche che
A e B sono compatibili:
Teorema IV.1
Dimostrazione
B n = bn n
cn n =
cn n =
daltra parte
BA = BA
an bn cn n
bn an cn n
con
(n)
cm
X
X
(n)
(n)
(n)
0 = (A an I)
c(n)
=
c
I)
(A
a
n
m
m
m
m
m
Calcoliamo ora
B (A an I) (n)
= (A an I) B(n)
= bm (A an I) (n)
m
m
m
Osservazione IV.1
Consideriamo il caso in cui A abbia autospazi tutti non degeneri. Sia n set completo di
autovettori di A e valga [A, B] = 0. Allora
An = an n
da cui
BAn
BAn
= Ban n = an Bn
= ABn
Possiamo immaginare di avere tre osservabili i cui commutatori siano tutti nulli:
[A, B] = [B, C] = [C, A] = 0. Allora esiste un sistema completo di autostati di A, B, C
(n)
contemporaneamente. Presi A, B abbiamo dal teorema di sopra, lesistenza di m sistema di
autovettori simultaneamente per A e B. Procedendo esattamente come sopra, sviluppiamo in
(n)
serie degli r(n,m) (ogni r(n,m) autovettore allautovalore cr di C) ciascun m , troviamo
X
(n)
h(n,m)
r(n,m)
m =
r
r
da cui
0 = (A an I)
h(n,m)
r(n,m) =
r
X
r
(A an I) r(n,m)
h(n,m)
r
Calcoliamo ora
(n,m)
C (A an I) r(n,m) = (A an I) C (n,m)
I)
=
c
(A
a
r
n
r
r
sono date le seguenti due possibilit
(i) (A an I) (n,m)
= 0 per ogni m;
r
autovettore allautovalore cr di C.
(ii) (A an I) (n,m)
r
Se valesse la seconda alternativa, avremmo sviluppato lo 0 in serie non nulla di vettori
= an (n,m)
.
ortogonali, perci deve essere, per ogni r, (A an I) r(n,m) = 0, cio A (n,m)
r
r
(n)
(n,m)
Il set degli r
(numerato in N N N da n, m, r) completo perch deriva dal set m
ed inoltre sistema di autovettori simultaneamente per A e C. Ripetendo il ragionamento
(n)
tale e quale, partendo da 0 = (B bm I) m si giunge a concludere che r(n,m) sistema di
autovettori anche per B. Dunque, concludiamo che A, B, C sono compatibili se e solo se i loro
commutatori sono tutti nulli.
[A, B] = B + A+ A+ B + = BA AB = [A, B]
da cui, se passiamo a considerare loperatore i [A, B] abbiamo
(i [A, B])+ = [A, B] (iI) = i [A, B]
cio i [A, B] un operatore hermitiano, o, equivalentemente, esiste un operatore hermitiano C
talch
[A, B] = iC
Usiamo questo risultato come lemma per mostrare il seguente teorema che generalizza il
principio di Heisenberg:
Teorema IV.2
(Relazione di indeterminazione)
Dimostrazione
|(, C)|
2
Sia R, vale certamente, per ogni coppia di operatori A, B hermitiani aventi come
commutatore iC,
0 ((A iB) , (A iB) ) = (, (A + iB) (A iB) )
sviluppiamo il secondo fattore del prodotto scalare
(A iB) (A + iB) = A2 + 2 B 2 iBA + iAB = A2 + 2 B 2 + i [A, B]
perci
0 2 , B 2 + (, C) + , A2
Anch la relazione valga per ogni R il discriminante deve risultare minore o eguale di 0:
2
4 , B 2 , A2 |(, C)|
Ora se A e B sono due osservabili, sostituiamo nella diseguaglianza di sopra
A 7 A AI,
B 7 B BI
daltra parte siccome ogni operatore commuta con qualsiasi multiplo dellidentit,
B BI
= [A, B]
iC = A AI,
da cui
cio
, A2 AI
|(, C)|2
4 , B 2 BI
2
(A)2 (B)2
|(, C)|
4
(A) (B)
|(, C)|
2
e, infine,
(c.v.d.)
Rappresentazione delle
coordinate e
degli impulsi
Cambiamento di
rappresentazione
Z
Z
(q) = q , = q , dp (p) p =
q , p dp (p)
Denotiamo con pq : L2p L2q la trasformazione che associa alla funzione (p) la corrispondente
(q). Allora
(q) = pq (p) = q 1
p
da cui
pq = q 1
p ,
perci pq un isomorfismo tra L2p e L2q .
Aggiunto di pq
R
Cominciamo con lannotare le propriet pi rilevanti della pq =
q , p dp . Anzitutto
calcoliamone laggiunto
p +
+ 1 + + + + +
q = q 1
= p
q = p
q = p 1
p
q
perci
p +
p + p
1
p
,
q q = q 1
p p q = I = q q
p
(q) , q (p) =
dq (q) f (q, p) dp (p) = dp (p) f (q, p) dq (q) =
Z
=
dp (p) h (p)
dove
h (p) =
sicch
f (q, p) dq (q)
p +
q =
Funzione
donda per
stato a impulso
definito: onda
di de Broglie
f (q, p) dq
= qp essendo f (q, p) = p , q .
che appunto pq
dp f (q 0 , p) f (q, p) = (q q 0 )
Z
Z
Z
q , P
=
q , dp p , p p =
q , p dp p p , =
q , p dp pp , =
Z
Z
1
=
dp peiqp/~ p , = i~
q , p dp p , = i~ (q)
2~
q
q
q (q) = q (q)
p (q) = i~ (q)
q
Analogamente a quanto fatto sopra, vogliamo calcolare q nella rappresentazione degli impulsi:
Z
Z
Z
=
p , dq q , q q =
p , q dq q q , =
p , Q
dq qeiqp/~ q , =
2~
Z
= i~
p , q dq q , = i~ (p)
p
p
cio, in L2p
p (p) = p (p)
q (p) = i~ (p)
p
Siamo ora in grado di ricavare il principio di indeterminazione per le q e le p, cos come era
nella enunciazione di Heisenberg. Abbiamo
q p
|(, C)|
|(q , q C)|
=
2
2
si tratta di calcolare q C,
h
i
P = i q , Q
P + i q , P Q
= i (
pq qp) (q) = i [
q , p]
q , i Q,
Perci procediamo al calcolo del commutatore di q e p:
[
q , p] (q) = qp (q) pq (q) .
Abbiamo
qp (q) = q i~
= i~q
q
q
ne segue che
[
q , p] (q) = i~ (q)
da cui
[
q , p] = i~I
Relazione di indeterminazione
per p e q
f (q, p) = q , p + ceipq/~
da cui, otteniamo
Z
0
c2 dp eip(q q)/~
= ~# c2
# Z
#
Y
Y
dpk ipk (qk0 qk )/~
= (2~)# c2
(qk0 qk ) =
e
~
k=1
# 2 (#)
= (2~) c
k=1
(q q)
Rappresentazione degli
k
operatori Pk e Q
1
(2~)#/2
q , Pk = q , dp p , Pk p =
q , p dp pk p , =
pk (q) =
Z
Z
1
ipq/~
p
,
=
i~
dp
e
q , p dp p , =
=
k
p
#/2
qk
(2~)
= i~
(q) .
qk
Ne ricaviamo
q (q) = qk (q)
pk (q) = i~ (q)
qk
p (p) = pk (p)
Commutatori
e analogia con
la meccanica
analitica
qk (p) = i~ (p)
pk
qk , pl ] = i~
[
[
qk , ql ] = 0
[
pk , pl ] = 0
che ricordano le relazioni canoniche sulle parentesi di Poisson della meccanica analitica classica.
Principio di indeterminazione
Come si vede, il principio di indeterminazione interviene (come detto nella trattazione della
Old Quantum Mechanics) solo sulle variabili canoniche coniugate.
1
funzione donda per autostato dellimpulso, q , p =
eipq/~ . Questa assunzione ci
(2~)#
Molte delle osservabili che possiamo decidere di misurare derivano dalla fisica classica:
energia, momento angolare, Sicch un gran numero di osservabili in realt una funzione
delle p e delle q, f (p, q). Il fatto che il commutatore degli operatori associati a q e p
proporzionale alle relative parentesi di Poisson, suggerisce di postulare che loperatore
associato a ogni osservabile della forma f (p, q) sia
f = f (
p, q) .
Ora, lordine di p e q irrilevante in f (p, q) ma non in f (p, q), questo problema si supera
ponendo
1
qp = (qp + pq)
2
1
sicch loperatore associato valga qp
b = qp = (
q p + pq) e, dunque, sia hermitiano.
2
Tutto quello che abbiamo detto deriva dallassunzione di una forma precisa per q , p il
che non corrisponde alla massima generalit che si pu richiedere alla nostra teoria. Perci,
adottando un puno di vista pi ampio, procederemo allintroduzione di un nuovo postulato,
il postulato di quantizzazione, che ci consentir di tornare - tra laltro - allipotesi di
de Broglie.
Facciamo - diventata unabitudine - un passo indietro: abbiamo postulato che allosservabile
f (p, q) corrisponda loperatore (autoaggiunto? dovrebbe esserlo ) f (
p, q). Abbiamo dunque
creato un ponte con la meccanica analitica classica che abbiamo ora intenzione di percorrere
interamente.
Parentesi di
Poisson e
algebre di Lie
Analogo
quantistico
delle parentesi
di Poisson
poniamo
[L] +
i [Ai , Bi ] ,
e troviamo
(L) +
i (Ai , Bi )
~ e postulato di
quantizzazione
Infine,
1
[A, B] .
i~
Il valore ~ qui introdotto viene determinato dallesperienza (ad esempio, diusione degli
elettroni su un cristallo).
(A, B) +
B
= [A, B]
A,
PB
ossia
Commutatori
di p e q
i
B
= i~ [A, B]
A,
PB
Lo spazio L2q
(q)
dk (q) = i
qk
detto questo abbiamo
h
i
qk , dk = iI
da cui ricaviamo subito lesistenza di una combinazione di commutatori (in realt uno solo)
invertibile. Andiamo adesso a calcolare (mediante la regola di derivazione)
h
i
qk2 , dk
= 2i
qk
h
i
qk , d2
= 2idk
k
Lemma IV.1
Dimostrazione
Ne consegue che sia qk che dk appartengono allalgebra dei commutatori. Sia ora C nel
commutante di tale algebra. Allora C dovr commutare anche con qk e con dk , si pu per
dimostrare il seguente
h
i
Q
k = 0 allora C = f (q) I.
Se C,
Abbiamo
C qk = qk C
calcoliamo lelemento di matrice di ciascun membro
q0
q , C qk q0 = q , qk C
qk q0 = qk0 q0
abbiamo
da cui
k q0 = q , C
q0 qk0
q , C qk q0
=
q , Cq
q0 = qk q , C
q0 = qk q , C
q0
q0
q , qk C
=
qk q , C
q0 (qk0 qk ) = 0
q , C
C
= C (q) = q , C = q ,
q0 , dq C q0 =
Z
Z
q0 dq 0 q0 , =
q0 dq 0 (q 0 ) =
=
q , C
q , C
Z
=
f (q) (#) (q q0 ) dq0 (q0 ) = f (q) (q)
(c.v.d.)
Lo spazio H2 uno C-spazio vettoriale di dimensione (su C) pari a 2. Abbiamo allora subito
che i seguenti operatori sono hermitiani
0 1
1 +
1 0
0 i
2 +
i 0
1 0
3 +
0 1
Calcoliamo
i 0
i
[ 1 , 2 ] =
0 i
0
0 i
0
[ 2 , 3 ] =
i 0
i
0 1
0
[ 3 , 1 ] =
1 0
1
0
i
i
0
1
0
= 2i 3
= 2i 1
= 2i 2
(da cui si vede che {~ i /2} rispetta le regole di commutazione del momento angolare).
Dalle regole di commutazione scritte abbiamo che allalgebra dei commutatori appartengono
1 , 2 , 3 . Siccome sono invertibili la prima parte ottenuta.
Vediamo ora che il commutante dellalgebra ridotto a un multiplo dellidentit. Se C
commuta con tutti gli elementi dellalgebra, deve commutare con 1 , 2 , 3 , vediamo che
questo implica C = I.
Se C commuta con 1 e 3 , allora
a b
0 =
,
c d
a b
0 =
,
b a
da cui C = aI.
0 1
1 0
b= c
a= d
1 0
b=0
0 1
pk = i~
+ Fk
qk
dalla regola di commutazione con q# abbiamo
h
i
i~ k# = [
q# , pk ] = i~ k# + q# , Fk
da cui
h
i
q# , Fk = 0
da cui troviamo subito che Fk commuta con ogni q# e per il lemma della precedente sottosezione
si ha
Fk = fk (q) I.
Imponiamo ora la CCR per gli impulsi, abbiamo
h
i h
i h
i h
i h
i
0 = [
pk , p# ] = dk + Fk , d# + F# = dk , d# + dk , F# + Fk , d# + Fk , F#
h
i h
i
ma dk , d# = Fk , F# = 0 da cui
fk (q)
fk (q)
f# (q)
f# (q)
+i
=
qk
q#
q#
qk
e siccome lo spazio reale semplicemente connesso, esiste F tale che
F
.
fk =
qk
In definitiva abbiamo
F
+
pk = i~
qk
qk
cio abbiamo trovato tutta una famiglia di rappresentazioni nella base indotta da q
delloperatore impulso.
0 = i
Tutte le rappresentazioni date determinano la stessa fisica, visto che sono equivalenti per
trasformazioni unitarie. Infatti, dato che i commutatori sono invarianti per trasformazioni
unitarie, possiamo cambiare base q , tramite una trasformazione unitaria, e ottenere pk = dk .
Per dimostrare quanto detto, consideriamo il seguente operatore
q 7 q + exp F (q) q
~
, dq
=
q , dq q =
eiF (q)/~ q , dq eiF (q)/~ q =
q
q
cio
=I
dq
q
q
Z
Z
F (q)
F (q)
F
, Pk
=
exp
i
,
P
=
exp
i
+
(q) =
i~
k
q
q
~
~
qk
qk
F (q)
F
F (q)
= exp i
+
exp i
i~
(q) =
~
qk
qk
~
#
"
F
(q)
F (q)
F
F (q)
+
(q) i~
(q) exp i
=
= exp i
~
qk
qk
qk
~
(q)
(q)
= pk
qk
cio, a meno di una trasformazione unitaria, la rappresentazione dellimpulso in coordinate
.
pk = i~
qk
= i~
Scambiando i con i, si possono ripetere in modo del tutto analogo i ragionamenti per qk
nella rappresentazione degli impulsi.
Determinazione
di q , p
k J#
q , pk p = pk q , p
Tuttavia, nella sottosezione precedente abbiamo dimostrato che il primo membro vale
q , pk p = i~
q , p
qk
perci
i
, = pk q , p , k J#
qk q p
~
La prima delle equazioni scritte reca
i
q , p = f1 (q2 , . . . , q# ) exp
p1 q1
~
i
f1 (q2 , . . . , q# ) = p2 f1 (q2 , . . . , q# )
q2
~
sicch
i
f1 (q2 , . . . , q# ) = f1 (q2 , . . . , q# ) exp
p2 q2
~
iterando si ottiene, infine,
q , p = c exp
i
pq
~
Z
Z
(p p0 ) = p , p0 =
q0 , p0 dq0 q0 =
q , p dq q ,
Z
Z
Z
Z
=
q , p dq q ,
q0 , p0 dq0 q0 =
q , q0 dq0 q0 , p0
q , p dq
0
Z
Z
p p
=
q , p dq q , p0 = |c|2 exp i
dq = |c|2 (2~)# (p p0 )
~
da cui
|c| =
1
(2~)#/2
Trasformata
di Fourier
Resta cos chiarito che londa di de Broglie associata a una particella in realt la sua funzione
donda, cio la sua rappresentazione delle coordinate.
Come abbiamo gi notato in precedenza e come deve essere anch la fisica sia la stessa nelle
due rappresentazioni, la trasformazione tra la rappresentazione delle coordinate e quella degli
impulsi unitaria.
(p) la trasformata di Fourier di (q) allora la funzione
Notiamo che se indichiamo con
corrispondente allo stesso stato in rappresentazione degli impulsi vale
(p/~) ,
(p) = ~#/2
infatti (ripetiamo il calcolo per esercizio)
Z
Z
(q)
exp
i
= ~
=
~
~
~
~# (2)#/2
con il simbolo k + p/~ indicheremo, dora in poi, il vettore donda dellonda di de Broglie.
Relazione di
Heisenberg e
trasformate
di Fourier
dq q 2 q2 | (q)|2
q =
R
dq | (q)|2
allora, la larghezza spettrale della sua trasformata, k, tale che (si veda A. Maggi, Metodi
Matematici della Fisica)
1
qk ,
2
ma
p = ~k p = ~k
Abbiamo visto come sia possibile dare diverse rappresentazioni dellalgebra delle regole
canoniche di commutazione. Tutto lapparato generale edificato finora perde del tutto di
significato se non garantiamo che ogni possibile rappresentazione delle CCR dia luogo alla
stessa fisica. Chiediamo cio che tutte le possibili rappresentazioni portino agli stessi risultati,
cos come in meccanica analitica classica ogni sistema di coordinate lagrangiane o canoniche
equivalente (come si ottiene dai corrispondenti teorema di covarianza).
Teorema di
von Neumann
Nella presente sottosezione dimostreremo che se due rappresentazioni sono legate da una
trasformazione unitaria (cos come lo sono impulso e coordinate) allora portano ai medesimi
risultati. Nella prossima sottosezione enunceremo il teorema di unicit di von Neumann,
secondo il quale, sotto deboli ipotesi, tutte le rappresentazioni sono unitariamente equivalenti.
Trasformazioni
unitarie
Allo scopo di precisare bene i concetti qui presentati, passiamo brevemente in rassegna le
propriet principali delle trsformazioni unitarie.
Siano date le basi ortonormali {en } e {e0n } di due spazi di Hilbert H e H0 . Sia U loperatore
tale che
e0n = U en
Loperatore definito sulle combinazioni finite dei vettore di base di H per linearit
U
N
X
an en =
i=1
N
X
an U en =
i=1
N
X
an e0n
i=1
2
N
N
X
X
2
an en =
|an |
U
i=1
i=1
X
X
(, U )H0 =
bn e0n ,
an U en =
an e0n
bn U en ,
da cui si ottiene che U + definito come
U + e0n = en
ha norma 1 ed ha dominio su tutto H0 . Per ogni vettore di H si ha
X
(U , U )H0 = , U + U H = ,
an U + e0n
= (, )H
H
Conservazione
delle regole di
commutazione
U A = U
A0 U = U
Stando a quanto visto sopra se tra le due rappresentazioni H e H0 esiste una trasformazione
unitaria U , losservabile posizione ha in H0 loperatore associato
q0 = U qU +
[
q , p] = U qU 1 , U pU 1 = U qU 1 U pU 1 U pU 1 U qU 1 = U [q, p] U 1
da cui, per le regole canoniche abbiamo, se qk = U qk U 1 , pj = U pj U 1
[
qk , pj ] = U [qk , pj ] U 1 = i~ kj
[
qk , qj ] = U [qk , qj ] U 1 = [
pk , pj ] = U [pk , pj ] U 1 = 0
Dunque, come in meccanica classica le trasformazioni canoniche lasciano invariate le parentesi
di Poisson, cos in meccanica quantistica i commutatori sono invarianti per trasformazioni
unitarie.
Trasformazioni
unitarie e
osservabili
~2 2
1
(q) + m 2 q 2 (q)
2m q 2
2
f (
q 0 , p0 ) = f U qU + , U pU + = U f (
q , p) U +
Tale risultato facile da dimostrare nel caso di relazioni algebriche (e, se non si bada troppo
per il sottile, per funzioni sviluppabili in serie di potenze) e nel caso di funzioni di una sola
variabile dinamica.
Per quanto riguarda le relazioni algebriche, cominciamo dai polinomi (un esempio quello
dellhamiltoniana delloscillatore armonico):
X
X
f (q, p) =
anm q n pm f (q 0 , p0 ) =
anm q 0n p0m
abbiamo
f (
q 0 , p0 ) =
ora
n
m
anm U qU +
U pU +
a
U AU + = U A U + U A U + U . . . U + U AU + = U Aa U +
perci
f (
q 0 , p0 ) = U
anm qn pm U + = U f (
q , p) U +
Non ci resta che mostrare che vale lo stesso se g (q, p) = 1/f (q, p) con f polinomiale, in questo
caso
1 + 1
1
g (
q 0 , p0 ) = [f (
q 0 , p0 )] = U f (
q , p) U +
= U
[f (
q , p)]1 U 1 = U g (
q , p) U +
daltronde
si conclude
U f (
q ) U + q0 = U f (
q ) U + U q = U f (
q ) q = f (q) U q = f (q) 0q
U f (
q ) U + = f (
q 0 ) = f U qU +
Introduzione
degli operatori
esponenziali
Per poter formulare il teorema di von Neumann conviene riferirsi a operatori limitati. Questo
perch la relazione di commutazione vale su un insieme molto ristretto di vettori di H: per
poter applicare il commutatore a un vettore questo deve appartenere al dominio di p e q, di
modo che la sua immagine rispetto ai due operatori appartenga ancora al dominio di p e q.
Per ovviare a questo problema si introducono gli operatori esponenziali
a
p
exp i
, exp (ib
q)
~
che sono unitari e perci limitati. Lunitariet si mostra come segue: consideriamo il set
completo q e la sua immagine
+ exp (ib
q ) q = eiqb q ,
q
0 = ei(q0 q)b (q 0 q)
,
iqb
iqb
,
= dq q , q = dq e q , e q = dq
q
q
per ogni , la tesi.
Gruppi a un
parametro di
operatori unitari
a
p
A (a) = exp i
~
(b) = exp (ib
B
q)
abbiamo che esse formano un gruppo (ancora lo vediamo per q, ma ovviamente i ragionamenti
sono gli stessi per p): dobbiamo mostrare che
(b1 ) B
(b2 ) = B
(b1 + b2 ) .
B
Sistema di Weyl
(b2 ) q = exp (i
(b1 + b2 ) q
(b1 ) B
q b1 ) eiqb2 q = eiqb2 eiqb1 q = eiq(b1 +b2 ) q = B
B
da cui la tesi essendo q completo.
Veniamo ora a calcolare
a
p
a
p
exp i
exp (ib
q ) exp i
~
~
ma
A (a) f (
q ) A+ (a) = f A (a) qA+ (a)
A (a) qA+ (a) = q + aI
sicch
a
p
a
p
exp i
exp (ib
q ) exp i
= exp [ib (
q + aI)]
~
~
a
p
a
p
exp i
q exp i
= q + aI
~
~
h
i
Calcoliamo il commutatore A (a) , q , esso del tipo [f (
p) , q], ma dal postulato di
quantizzazione si ha
f
[f (
p) , q] = i~ [f (p) , q]PB = i~
p
perci
h
i
a
Ora, siccome lesponenziale eipa/~ si esprime come serie di potenze di una funzione di p si
ha che il passaggio
a
p
eiap/~
exp i
, q = i~
~
p
X 1 a
X
X
p
1 ia
1 ia
n
, q =
[
q , p ] =
ni~
pn1 =
i
n!
~
n! ~
n! ~
n=0
n=0
n=0
n1
X
1
eiap/~
i
pn1 = aeiap/~ = i~
= a
(n 1)! ~
p
n=1
Ne consegue che le regole di commutazione implicano
a
p
a
p
exp i
exp (ib
q ) exp i
= exp [ib (
q + aI)]
~
~
Risulta allora pi facile assumere come postulato, anzich le CCR, questultima espressione
che genera la cosiddetta algebra di Weyl.
Dal sistema di
Weyl alle CCR
a
p
a
p
T (a) = exp i
q exp i
~
~
vogliamo mostrare, stavolta in forza dellespressione di Weyl, che, come avevamo visto prima
T (a) = q + aI
Cominciamo col notare che
(b)
B
b
(b) q q
q = iqeibq q = ieibq qq = iB
da cui
(b)
B
(b) q
= iB
b
e perci
(b) B (b) ,
q = iB
b
analogamente
A (a)
p = i~A (a)
a
Dunque
"
#
(
)
(b)
(b)
B
(b)
(b) A (a) A (a)
T (a) = A (a) iB
A (a) = i A (a) B
A (a) =
b
b
(
)
(b)
B
(b) A (a) A (a)
= i A (a) B
A (a) =
b
= i exp (ib (
q + aI))
exp (ib (
q + aI))
b
ma
da cui
T (a) = i {exp (ib (
q + aI)) i (
q + aI) exp (ib (
q + aI))}
ma siccome [f (
q ) , q] = 0 (infatti , si ha [f (
q ) , q] q
(qf (q) qf (q)) q = 0)
= f (
q ) q q qf (q) q
T (a) = q + aI
Questo implica facilmente che T /a = aI, daltra parte
o A (a)
T
n
A (a)
=
A (a) qA (a) =
qA (a) + A (a) q
=
a
a
a
a
h
i
ia
ia
A (a) pqA (a) A (a) qpA (a) = A (a) [
q , p] A (a)
=
~
~
ne consegue che
i~I = A (a) [
q , p] A (a)
da cui
[
q , p] = i~
Teorema di von
Neumann e
algebra di Weyl
Nota:
loperatore
di traslazione
Il teorema di von Neumann asserisce che tutte le rappresentazioni (con certe deboli
ipotesi) su uno spazio di Hilbert dellalgebra di Weyl sono unitariamente equivalenti. Ci
comporta che tutte le rappresentazioni che preservano le regole canoniche di commutazione
sono unitariamente equivalenti.
Si noti ancora come questo risultato sia la giustificazione fondamentale dellintero formalismo
che abbiamo sviluppato in questo capitolo.
Abbiamo visto come T (a) = A (a) qA (a) = q + aI, vogliamo investigare un attimo sulla
natura di questo operatore. A (a) unitario e come funzione di p commuta con p stesso, perci
A (a) pA (a) = p. Se ne ricava che A (a) implementa la trasformazione canonica che conserva
le CCR
q 7 q + a
p 7 p
Tale trasformazione rappresenta una traslazione di a degli strumenti di misura associati alle
osservabili, se q rappresenta un microscopio di Heisenberg q 0 rappresenta lo stesso strumento
di a. Siccome p0 = p, questo significa che se esistesse uno strumento in grado di misurare
p esso dovrebbe essere invariante per traslazioni, perci dovrebbe avere unestensione infinita.
Ecco che p unosservabile atipico, a questo proposito osserviamo che non lo si pu neppure
considerare tale se si lavora in un laboratorio finito, cio se |q| L. In tal caso infatti gli
autostati dellimpulso se esistessero dovrebbero essere onde piane infinitamente lunghe, il che
assurdo essendo q limitato.
t t0
con U (t, t0 ) operatore lineare. Si noti come il postulato di esistenza delloperatore U (che
fa dipendere lo stato al tempo t0 solo dallo stato iniziale) conferisce alla meccanica quantistica
carattere deterministico, a patto che non si eseguano misure sul sistema.
La linearit di U implica la conservazione nel tempo delle relazioni di sovrapposizione:
t0 = at0 + b t0
allora
II postulato:
Im U = H
III postulato:
U isometrico
t = U at0 + b t0 = at + b t
t0 , t0 = U t0 , U t0 = (t , t )
il che comporta che i prodotti scalari, e quindi le probabilit di transizione, restino invariati
nel tempo.
In particolare la norma di t0 invariata nel tempo.
Limposizione del terzo postulato fa s che loperatore di evoluzione temporale U abbia la
stessa natura delloperatore di traslazione spaziale A (a). In eetti, loperatore di evoluzione
temporale unoperatore di traslazione nel tempo (U (t, t0 ) trasla il tempo di t t0 ).
Unitariet di U
Composizione
degli operatori
di evoluzione
Consideriamo ora un sistema che sia invariante per traslazione temporale, i.e., indipendente
dal tempo. Per esso
U (t2 , t1 ) = U (t2 + t0 , t1 + t0 )
cio levoluzione del sistema avviene allo stesso modo sia che lo stato iniziale sia posto adesso
che in un qualsiasi altro momento (domani, per esempio!).
U come gruppo a
un parametro di
trasformazioni
unitarie
cio lo stato finale dipende solo dalla dierenza tra listante finale e quello iniziale. Si ha,
in termini matematici, che lapplicazione t 7 U (t) definisce una famiglia a un parametro di
operatori unitari.
La legge deterministica diventa allora
U (t3 t1 ) = U (t3 t2 ) U (t2 t1 )
Digressione
sugli operatori
autoaggiunti
Equazione di
Schrdinger
dipendente
dal tempo
d
= Kt
dt t
Sia U che K dipendono dalle specifico problema fisico (dalle forze, o meglio, dalle interazioni
in gioco), in particolare K unosservabile che riassume in s lintera dinamica del sistema.
K sembra essere analoga allhamiltoniana nel caso classico. In meccanica classica il momento
p il generatore delle traslazioni spaziali e in meccanica quantistica abbiamo visto che questo
ruolo assolto dalloperatore exp (ipa/~). Visto che il generatore delle traslazioni temporali
adesso exp (itK), mentre, nel caso classico, lhamiltoniana, si pu pensare che risulti
K=
da cui ricaviamo
H
~
H
U = exp it
~
i~ (q, t) = H q,
(q, t)
t
q
dove, ovviamente,
Stati stazionari
(q, t) = q , t
Cerchiamo adesso eventuali stati che siano indipendenti dal tempo, stati stazionari. Uno
stato stazionario se per ogni t risulta
t = U (t) 0 = 0 ,
i~ (t) = H
(t)
= i~
(t) 0
0
H
Esaminiamo la seconda equazione. Siccome il primo membro non dipende dal tempo, il
secondo membro deve essere costante, questo comporta che 0 autovettore dellhamiltoniana
allautovalore
(t)
i~
=E
(t)
Da questultima, si ricava pure che
E
(t) = (0) exp it
~
E
(t) = exp it
~
e, dunque
E
t = exp it
0
~
Giustamente, t 0 a meno di una fase: questo conferma che 0 rappresenta uno stato
allautovalore
stazionario, ma pure in accordo con il fatto che, siccome 0 autovettore di H
E, per definizione
0 = f (E) 0
f H
dunque
H
E
t = exp it
0 = exp it
0
~
~
Questultima osservazione mostra come valga anche il viceversa di quanto detto sopra: se 0
autovettore allistante 0 dellhamiltoniana allautovalore E, rimane tale (a parte un fattore
di fase ininfluente) nel tempo e perci il rappresentativo di uno stato stazionario.
Proposizione IV.1
Evoluzione di
stati qualunque
0 =
an En , an = En , 0
n
allora
H
t = exp it
~
X
n
an En
X
n
H
an exp it
~
En =
an eitEn /~ En
Quanto scritto mostra come sia fondamentale il ruolo dellosservabile energia in meccanica
quantistica. Determinati i suoi autovalori e i suoi autovettori risulta fissata levoluzione
temporale di ogni stato arbitrario. Questo enfatizza limportanza della risoluzione del
e mostra anche come in meccanica quantistica lo studio degli
problema agli autovalori per H
stati stazionari sia di gran lunga pi rilevante dellanalisi dellevoluzione temporale che tanta
importanza aveva in ambito classico.
Per completezza ripetiamo il calcolo di sopra nel caso di spettro continuo
!
Z
Z
H
t = exp it
dE (E) E = dE eitE/~ (E) E
~
ovvia la generalizzazione al caso misto.
Per concludere, lo sviluppo di uno stato in autostati dellenergia prende il nome di
rappresentazione di Heisenberg.
Evoluzione
degli elementi
di matrice e
dei valori medi
Pu avere un interesse notevole studiare levoluzione nel tempo dei valori medi delle osservabili
o, pi in generale, dei loro elementi di matrice. Dati due stati al tempo t lelemento di matrice
dellosservabile A vale
Costanti
del moto
a
(t) = (t , At ) = 0 , U + (t) AU (t) 0
Se poi 0 = E autostato dellenergia nessun valor medio pu cambiare nel tempo, essendo
E stazionario. La cosa ha il seguente riscontro algebrico
Abbiamo visto come se 0 autostato dellenergia, allora su di esso i valori medi di tutte
le osservabili sono costanti. Ci chiediamo adesso se esistono osservabili A per cui su tutti gli
stati i valori medi sono indipendenti dal tempo. Evidentemente deve essere, per ogni 0
(0 , A0 ) = (t , At ) = 0 , U + (t) AU (t) 0
i
i +
(t)
(t) U + (t) AHU
U (t) HAU
~
~
h
i
A =0
H,
Dimostrazione
Consideriamo ora sistemi dipendenti dal tempo, tali che, cio, lhamiltoniana sia funzione
esplicitadel tempo (per esempi,o una particella in campo oscillante). Sia U (t, t0 ) loperatore
di evoluzione temporale e supponiamo che ne esista la derivata rispetto a t. Siccome unitario
sempre possibile scrivere la derivata come
d
U (t, t0 ) = iK (t, t0 ) U (t, t0 )
dt
daltra parte
U (t, t0 ) = U (t, t) U (t, t0 )
derivando in t
iK (t, t0 ) U (t, t0 ) = iK (t, t) U (t, t) U (t, t0 ) = iK (t, t) U (t, t0 )
siccome U (t, t0 ) invertibile
K (t, t0 ) = K (t, t)
da cui K non dipende dal secondo argomento e si trova
d
U (t, t0 ) = iK (t) U (t, t0 )
dt
+
d +
dU
dU +
U U + = I 0 =
U+
U U =
U = iK + U + U iKU U + = i K + K
dt
dt
dt
da cui K hermitiano. Assumiamo, come prima per il caso indipendente dal tempo, che
K = H/~, allora si trova che U soddisfa lequazione dierenziale
d
H (t)
U (t, t0 ) = i
U (t, t0 )
dt
~
U (t0 , t0 ) = I
Sotto certe ipotesi su H, che noi assumiamo senzaltro soddisfatte nel caso fisico, abbiamo per
U la formula di Trotter
Z
i t 0 0
U (t, t0 ) = T exp
dt H t
~ t0
dove T sta a indicare il prodotto T-ordinato (tempo-ordinato), cio
T (a (t1 ) . . . a (tn )) = a (ti1 ) . . . a (tin )
dove ti1 . . . tin da cui, serie di Dyson,
n Z t
Z tn1
Z t1
Z
X
i t 0 0
i
T exp
dt H t
dt1
dt2 . . .
dtn H (t1 ) . . . H (tn )
=I+
~ t0
~
t0
t0
t0
n=1
(le ipotesi su H garantiscono la convergenza della serie).
Z
Z
i t 0 0
i t 0 0
U (t, t0 ) = T exp
dt H t
dt H t
= exp
.
~ t0
~ t0
Valori medi
ed elementi
di matrice
Possiamo rifare nel caso generale il discorso su valori medi ed elementi di matrice delle varie
osservabili (in generale, dipendenti esse stesse dal tempo): presa una osservabile A (t) si ha
a
(t) = t , A (t) t = U (t, t0 ) 0 , A (t) U (t, t0 ) 0 = 0 , U + (t, t0 ) A (t) U (t, t0 ) 0
si noti come questo signfica che preparato N volte lo stesso stato 0 , aspettato ogni volta
listante t ed eettuata allora la misura di A (ai con i numero della ripetizione dellesperimento)
si ha che
P
ai
a
(t) .
N
Schema di
Heisenberg
e schema di
Schrdinger
a
(t) = t , A (t) t = 0 , U + (t, t0 ) A (t) U (t, t0 ) 0
come si vede nellultima espressione gli stati sono quelli al tempo t = 0, mentre loperatore
associato allosservabile A si evolve nel tempo sia a causa della sua dipendenza esplicita da
t, sia per la coniugazione tramite U (t, t0 ). Veniamo cio a ridefinire loperatore associato
allosservabile A come
AH (t) + U + (t, t0 ) A (t) U (t, t0 )
dove il pedice H sta per Heisenberg. Infatti, il punto di vista secondo cui a variare sono gli
operatori associati alle osservabili (e non gli stati) si dice schema di Heisenberg (Heisenbergs
picture). Si noti come questo schema sia conforme a quello naturale della meccanica classica,
nella quale eettivamente si fanno variare le osservabili f (p, q) essendo (p, q) = (p (t) , q (t)).
Ci aspettiamo di trovare in questo schema nuove analogie con la meccanica classica
Derivazione
H
di A
Equazioni di
Heisenberg
Schema di
Heisenberg
nel caso
indipendente
dal tempo
AH
1 +
(t) U (t, t0 ) U + (t, t0 ) H
(t) A (t) U (t, t0 ) =
=
+
U (t, t0 ) A (t) H
t
i~
A
AH
1 +
1
H
H AH =
U + HU
U + AU
=
=
+
U AU U + HU
+
AH HH H
t
i~
t
i~
i
h
AH
1
=
+
AH , HH
t
i~
H
commuta con U e U + .
poich, in questo caso, H
Sempre nel caso H indipendente dal tempo, abbiamo che se A una costante del moto, allora
h
i
=0
AH , H
t = 0 , AH 0
t , A
indipendente dal tempo, come doveva essere.
Cenni su
simmetrie e leggi
di conservazione
Consideriamo di nuovo il caso di una osservabile G indipendente dal tempo. Possiamo porre
+ G,
allora il sistema evolve tramite loperatore unitario
H
G
UG (a) = exp i a
~
sia eettivamente lhamiltoniana proprio
dove a un parametro reale (che nel caso in cui G
il tempo). Ne consegue che ogni osservabile F , nello schema di Heisenberg, viene mandata in
FH (a) = U + (a) F UG (a)
G
Ora, definiamo la trasformazione infinitesima indotta da G come il termine lineare della serie
esponenziale
ia
G (a)
UG (a) I G
+U
~
Andiamo a vedere come evolve F secondo la U (a)
h
i
+ (a) F U
(a) = I+ ia G
F I ia G
F + ia G
F ia F G
= F + a F , G
+ FH
FH U
G
~
~
~
~
i~
cio, per trasformazioni infinitesime
G (a) = I ia G
U
~
una osservabile F evolve in
a h i
F,G
FH = F +
i~
Ne consegue che F commuta con G se e solo se F invariante per la trasformazione infinitesima
G (a) indotta da G.
U
Vale allora il seguente
Teorema IV.4
(di Poisson)
Una osservabile G indipendente dal tempo una costante del moto se e solo se la hamiltoniana
Sistemi
composti in RS
Prodotto
tensoriale di
spazi di Hilbert
Osservabili per
lintero sistema
Hamiltoniana
di sistemi non
interagenti
Notiamo che se i sottosistemi non interagiscono, gli unici stati possibili dellintero sistema sono
quelli fattorizzabili e in questo caso la hamiltoniana del sistema composto data dalla somma
delle hamiltoniane. Mostriamo quanto detto andando a scrivere lequazione di Schrdinger
dipendente dal tempo
d
()
i~ () = H
dt
daltra parte
d
d
t + t
t+ t+ t t =
t + t t t + o () =
dt
dt
d t
dt
=
+ t
+ o ()
dt t
dt
sicch
1
d
d
d
1
1
H () =
() =
+
=
H1 + H
2 =
i~
dt
dt
dt
i~
i~
1
1
1
2 ()
=
H1 () + H
H1 + H
2 () =
i~
i~
i~
2 su tutti gli stati realizzabili dal sistema (cio quelli fattorizzabili).
=H
1 + H
da cui H
Si noti come in questultimo caso le due hamiltoniane siano costanti del moto per lintero
sistema.
Abbiamo gi notato (fin dalla prima sezione di questo capitolo) che la formulazione della
meccanica quantistica statistica. Abbiamo visto come il carattere statistico si esemplifica
quando si voglia misurare una certa osservabile A su un certo stato del sistema: i risultati
della misura sono regolati da una distribuzione di probabilit, infatti, se per scriviamo lo
sviluppo standard in autostati
X (n) (n)
=
ci i ,
i,n
Esempio di
miscela statistica
Supponiamo allora di ripetere lesperimento di prima N volte avendo uno strumento che ci
prepara il sistema negli stati 1 e 2 , rispettivamente, N1 e N2 volte, con N = N1 + N2 . Ora,
per lo stato j , j J2 , la teoria prevede che, eettuando la misura di A, si trover lautovalore
ak con una probabilit
PkA j
N1 A
N2 A
Pk (1 ) +
P (2 )
N
N k
Il valor medio delle misure sullinsieme statistico {( 1 , N1 /N ) , (2 , N2 /N )} di stati risulta
X
N1 X
N2 X
N1
1 + N2 2 , A
2 =
hAi =
ak PkA =
ak PkA (1 ) +
ak PkA (2 ) =
1 , A
N
N
N
N
PkA =
=
Eetti classici ed
eetti quantistici
N1
N2
A ( 1 ) +
A (2 )
N
N
Possiamo allora dire che hAi un valor medio classico mentre A un valor medio quantistico.
chiaro, adesso, che si ha a che fare con due eetti statistici distinti, quello quantistico
ineliminabile e quello classico che deriva dalla nostra inabilit a conoscere esattamente lo
stato su cui andiamo ad eettuare la misura di unosservabile (vedremo che in certi casi anche
questo secondo aspetto si presenter a priori).
Vogliamo, in primo luogo, dare una definizione generale dei concetti intorodotti prima. Il
nostro apparato preparatore produca gli stati (non necessariamente ortogonali!) 1 , . . . , n
con una distribuzione di probabilit 1 , . . . , n . Diremo allora che il nostro strumento prepara
una miscela statistica {(1 , 1 ) , . . . , (n , n )} anzich uno stato puro. Detto questo, la
probabilit che dalla misura di una osservabile A sulla miscela statistica data si ottenga il
valore ak
n
X
PkA (miscela) =
j PkA j
j=1
da cui
hAi =
Operatore
statistico
perci hAi la media delle medie A j .
n
X
j=1
j
j j , A
Data una miscela statistica che, notiamo, potrebbe essere composta da infiniti stati, definiamo
X
j
j j j
X
kk j j j
j
j j
kW k
j = 1
=
=
kk
kk
kk
j
X
X
X
j j , j =
j j , , j =
j j , j , =
(, W ) = ,
j
=
j j , j , = (W , )
j
X
X
2
X
(, W ) = ,
j j , j =
j j , , j =
j j , 0
j
Per concludere notiamo che cambiando i j per una fase loperatore W resta invariato
X
X
X
j eij j , eij j =
j j , eij eij j =
j j , j = W
j
Traccia di
un operatore
Vogliamo mettere in relazione W con hAi. A questo scopo intorduciamo la nozione di traccia
di un operatore, dato un sistema ortonormale completo {k } si pone
X
Tr B +
(k , B k )
k
ora, per dimostrare che si tratta di una buona definizione dovremmo verificare che per ogni
s.o.n.c. il risultato del secondo
sempre lo stesso. Ora, questo non in generale vero.
membro
da cui la validit della definizione dipende dalla possibilit di scambiare le serie. Ora, facile
vedere che le due serie (quella prima in k e poi n e quella prima in n e poi in k) sono il
riordinamento luna dellaltra: anch abbiano la stessa somma, dal teorema di Dirichlet,
suciente che una delle due abbia convergente la parte positiva o la parte negativa (ad esempio,
basta che una sia a termini positivi). Avvertiamo che nel seguito di questa trattazione, come
di consueto, non approfondiremo il discorso matematico sulla traccia che in realt molto
complicato.
Per quanto ci occore, vogliamo vedere linvarianza per cambiamento di s.o.n.c. per loperatore
AW , per A hermitiano limitato. Cominciamo col calcolare AW :
X
X
X
AW = A
j j j =
j j , Aj =
j Aj j
j
calcoliamone la traccia
Tr (AW ) =
XX
k
un suo riordinamento
XX
j
j j , k k , Aj
j j , k k , Aj =
j j , Aj
j
ma
0<
X
X
j j , Aj kAk
j = kAk
j
Tr (AW ) = hAi
e si tratta di una quantit banalmente invariante per cambiamento di base. Cos come per
A = I, caso che vediamo esplicitamente:
X X
2 X X
X
X
Tr W =
j k , j =
j j , k k , j =
j j , j =
j = 1
k
2
dove le serie si scambiano perch j k , j 0.
Ricapitoliamo le propriet degli operatori statistici
Proposizione IV.3
Propriet ciclica
della traccia
W A =
j j j A =
j j , A j =
j Aj , j =
j j Aj ,
j
inoltre
hAi =
=
X
j
Stati puri
e miscele
statistiche in
termini di W
Proposizione IV.4
X
XX
j j , Aj =
j Aj , j =
j Aj , k k , j =
j
XX
k
k ,
j Aj , k j = Tr (W A) .
Aj , k k , j =
k
X
j
j j j ,
W2 =
X
j
j j j
X
j
2 X
2
j j , =
j j ,
j
2
2
1 = j , = j ,
il che vero se e solo se tutti i j e i j sono pari a a meno di una fase, da cui W1 = W2 = W .
Teorema IV.5
Vale pure il viceversa, sia cio dato un operatore statistico con W 2 = W , siccome W = W + ,
allora W un proiettore ortogonale. Notiamo che se fosse W u = 0 per ogni u Tr W = 0, sicch
esiste un sottospazio non banale sul quale proietta W , ne consegue che esiste u0 normalizzato
per cui
W u0 = u0 ,
completato u0 a una base ortonormale un si ha
1 = Tr W = (u0 , W u0 ) + (u1 , W u1 ) + . . . = 1 + (u1 , W u1 ) + . . .
essendo (un , W un ) 0 si conclude che per n 6= 0
0 = (un , W un ) = un , W 2 un = (W un , W un ) = kW un k W un = 0
Teorema IV.6
Analogia con
la meccanica
classica
D E
f = Tr W f
div (v) +
= 0,
t
daltra parte
div (v) = (v) = () v + v = () v
sicch
0=
+
= [, H]PB +
,
q p
p q
t
t
infine
= [, H]PB
t
Ci aspettiamo, naturalemente, di trovare unequazione analoga nel caso quantistico.
Evoluzione
temporale
delloperatore
statistico
Abbiamo
W (t) =
X
j
da cui
W
X
j
j j (t) j (t)
d
j
j
j (t) , j (t) =
dt
j
!
X
H
H
j j (t) ,
j (t) , j (t) +
(t) =
i~
i~ j
j
per cui
X H
H
j
j (t) +
j (t) , j (t) =
i~
i~
j
j
"
#
X
H
H
=
j
(t) j (t) j (t) j (t)
i~ j
i~
j
=
j (t) ,
i
X
1 h
H
W
j j (t) j (t) =
= ,
W (t) , H
t
i~ j
i~
= [, H]PB .
t
Infine, andiamo a vedere cosa succede per levoluzione dei valori medi sulle miscele: operiamo
nello schema di Heisenberg
Consideriamo ora un sistema composto da due sottosistemi descritti dagli spazi di Hilbert
HA e HB . Il sistema complessivo sar rappresentato su H = HA HB , cos ogni vettore H
si scriver come
!
X
X X
X
=
cij
i j =
cij
i j =
0j j
i,j
poniamo j +
0j / 0j
e j + 0j j troviamo
X
=
j j
j
da cui ogni vettore si sviluppa come sopra con i j HA di norma 1 e con gli j HB
ortogonali:
i , j = 1,
i , j = i ij
Prendiamo ora H di norma 1
X
X
X
X
X
1=
i i ,
j j =
i ij =
i
i , j i , j =
i
Valor medio di
osservabili F di
un sottosistema
i,j
i,j
Sia ora F una osservabile di HA . Andiamo a calcolarne il valor medio sullo stato puro del
sistema intero
X
X
X
(, F ) =
i i , F
j j =
i i , F j = Tr (F W )
i , F j i , j =
i
i,j
con
W =
X
i
HA
i (i i )
dunque stati puri di H sono miscele statistiche di HA o HB per quanto concerne unosservabile
del primo o del secondo sottosistema.
Evoluzione
temporale del
valor medio di F
Consideriamo un sistema composto da due sottosistemi tali da non interagire per tempi
maggiori di 0. Allora, levoluzione a t > 0 sar data dalla somma delle hamiltoniane HA e
!
! !
A + H
A + H
B
B
H
H
(t , F t ) = exp it
0 , F exp it
0
~
~
A e F commutano con H
B . Notiamo che prese le osservabili A, B che commutano si ha
ora, H
[A, B] = 0 exp (A + B) = exp (A) exp (B)
la dimostrazione immediata: prendiamo linsieme completo i degli autostati simultanei di
A e B, su di essi
exp (A + B) i
exp (A) exp (B) i
Allora
! !
A
B
B
A
H
H
H
H
(t , F t ) =
0 , exp it
exp it
F exp it
exp it
0 =
~
~
~
~
! !
A
B
B
A
H
H
H
H
=
0 , exp it
F exp it
exp it
exp it
0 =
~
~
~
~
! !
A
A
H
H
=
0 , exp it
F exp it
0 = (0 , FH (t) 0 ) = Tr (FH (t) W (0))
HA
~
~
Soluzione con
argomento fisico
Abbiamo gi evidenziato come il carattere statistico della teoria che stiamo studiando
ha due origini: quella quantistica, secondo cui ogni misura regolata da un distribuzione
di probabilit, e quella che abbiamo detto classica (perch era presenta pure in meccanica
classica), data dal fatto che non sempre siamo in grado di specificare esattamente lo stato in
cui il sistema prima di eseguire una data misura.
Ci chiediamo ora se i due aspetti statistici possono essere distinti fisicamente (i.e., in termini
pratici, almeno in linea di principio).
Consideriamo due stati ortonormali 1 e 2 . Il sistema si trovi nello stato puro
= c1 1 + c2 2 ,
|c1 |2 + |c2 |2 = 1
che pure un insieme statistico Wp , oppure il sistema sia descritto da una miscela data
dallinsieme statistico seguente
n
o
2
2
Wm +
1 , |c1 | ; 2 , |c2 |
La domanda che ci facciamo se possibile distinguere nella pratica gli insiemi detti, visto che,
2
per entrambi, c una probabilit |ci | di trovare il sistema nello stato i . Sia A una osservabile
qualsiasi e procediamo a misurarla sul sistema nelle due configurazioni date. Sullinsieme Wm
il valor medio di A vale
2
= |c1 | (1 , A1 ) + |c2 | (2 , A2 ) + c1 c2 (2 , A1 ) + c1 c2 (1 , A2 ) =
= hAi + 2 Re [c1 c2 (2 , A1 )]
e la dierenza nelle due medie indica il fatto che nellinsieme Wp gli stati i possono interferire.
Wp una sovrapposizione coerente degli stati di partenza, al contrario di Wm . In un conto
sono rilevanti le fasi dei numeri complessi c1 e c2 , nellaltro compaiono solo i moduli.
Soluzione
rigorosa
Detto questo vediamo come si procede ad eseguire la distinzione (che abbiamo dimostrato
essere possibile) usando un argomento teoricamente rigoroso.
Come detto a suo tempo, i proiettori, essendo autoaggiunti, sono osservabili: in particolare per
!
X
X
X
hAi =
i (i , (, i ) ) =
i (i , ) (, i ) = ,
i (i , ) i = (, W )
i
Sia data una osservabile F con spettro discreto Sp F = {fk }. Dato uno stato sappiamo
(n)
(n)
che possibile svilupparlo in autostati standard di F k dove per ogni n k autovettore
di F relativo allautovalore fk . Allora, se eseguiamo la misura di F sul sistema nello stato
abbiamo la probabilit
X (n) 2
PFk () =
ck
n
da cui
X (n) 2
X (n0 ) (n0 ) X (n) (n)
(, Pk ) =
ck 0 k 0 ,
ck k =
ck = PFk () .
k0 ,n0
Evoluzione
del sistema
in seguito a
una misura
Il problema che ci poniamo adesso di determinare lo stato del sistema subito dopo aver
eettuato la misura. Dobbiamo subito porre una distinzione tra misure ripetibile e
misure non ripetibili. Le misure ripetibili sono tali che se eseguita la misura si trovato
per F il valore fk , ripetendo subito la medesima misura si ottiene di nuovo, stavolta con
sicurezza, F = fk . Abbiamo insistito sul fatto che la seconda misura deve esser eseguita
subito dopo anch il sistema non abbia unevoluzione temporale tra le due misure.
Misura
ripetibile:
esperimento di
Stern e Gerlach
Misura non
ripetibile:
camera
di Wilson
Misure ripetibili
su autovalori
non degeneri
Dora in poi ci occuperemo di misure ripetibili (in alcuni testi solo le misure ripetibili sono
designate come misure).
Eseguiamo allora una misura ripetibile di F sullo stato , trovato il valore fk per F , il nostro
problema quello di determinare lo stato + che assume il sistema subito dopo la misura.
Quello che postuliamo che + dipenda linearmente da (non vogliamo in alcun modo
rinunciare alla linearit). Sia fk non degenere. Siccome se eseguiamo di nuovo la misura
dobbiamo riottenere il valore fk con certezza, + deve appartenere allo spazio generato da k
cio deve essere proporzionale a k . Ci significa che
+ = c () k
con c () funzionale lineare, dunque della forma c () = (, ). Daltra parte se prendiamo
ortognale a k la misura di F non pu avere dato il risultato fk di conseguenza + pu essere
posto eguale a 0. Ne deriva che pu essere preso eguale a k . Concludiamo che loperatore
Ak che allo stato associa lo stato + corrispondente allevoluzione dello stato sul quale sia
stata eettuata la misura di F che abbia fornito il valore fk
k k
se k non degenere. Dunque Ak = Pk .
Il caso in cui fk sia degenere non cos immediato. Infatti, non esistenpi un
o vettore
(n)
privilegiato in E (fk , F ) che ha come base ortonormale il set numerato da n k . Si deve
allora introdurre il concetto di misura fortemente ripetibile: se lo stato iniziale tale che
eettuata la misura di F si ottiene con sicurezza fk allora dopo la misura di F lo stato resta
immutato.
Verifica
sperimentale
della forte
ripetibilit
Evoluzione
per misure
fortemente
ripetibili
Restringiamoci a considerare misure fortemente ripetibili. Come prima sia lo stato iniziale
su cui eettuiamo la misura di F . Ammettiamo di ottenere il valore fk , cerchiamo + stato
evoluto nelle ipotesi dette. Imponiamo
+ = Ak
con Ak lineare. Adesso andiamo a cercare Ak . Comiciamo con lo scegliere autostato per
F allautovalore fk . Per ipotesi + deve rappresentare lo stesso stato di , perci deve
appartenere al raggio per . Ne deriva che
+ = ()
siano ora 1 e 2 vettori indipendenti nellautospazio relativo a fk , per quanto detto sopra,
1+ = (1 ) 1 ,
2+ = (2 ) 2
da cui, preso = c1 1 + c2 2
+ = c1 (c1 1 + c2 2 ) 1 + c2 (c1 1 + c2 2 ) 2
ma, daltra parte,
+ = Ak (c1 1 + c2 2 ) = c1 (1 ) 1 + c2 (2 ) 2
dallindipendenza di 1 e 2 si ottiene
(1 ) = (c1 1 + c2 2 ) = (2 )
da cui () non dipende da E (fk , F ). Scegliamo adesso ortogonale allautospazio
E (fk , F ), allora non essendo possibile ottenere fk dalla misura di F su , levoluto di dovr
essere posto eguale a + = 0, altrimenti cadremmo in una contraddizione ( passa il test di
selezione relativo allautovalore fk , dunque possibile misurare fk su ). Ne abbiamo che
loperatore Ak , a meno di un fattore , il proiettore Pk sullautospazio relativo a fk .
Misura di
minimo disturbo
Ecco che la misura fortemente ripetibile quella che arreca il minimo disturbo al sistema (il
proiettato di un vettore essendo lelemento appartenente allo spazio di proiezione pi vicino
al vettore di partenza). Le misure fortemente ripetibili si dicono anche di minimo disturbo.
Anzich eettuare la misura su uno stato puro, pu essere interessante andare ad eseguire la
misura su un insieme statistico W = {(i , i )}. Ciascuno stato della miscela viene mandato
in +i = Pk i di conseguenza loperatore statistico viene mandato in
X
i (Pk i Pk )
W+ =
i
i (Pk i , ) Pk = Pk
"
X
i (i , Pk ) = Pk W Pk
Si noti che per W+ non pi normalizzato, dato che, in generale, Tr (Pk W Pk ) = Tr Pk2 W =
Tr (Pk W ) < 1. Dimenticandoci delloperazione di misura eettuata, loperatore statistico che
descrive la miscela di stati selezionata da fk perci
Pk W Pk
W0 +
.
Tr (Pk W )
Si noti che la probabilit di trovare fk misurando F su W
X
X
PkF (W ) =
i PkF (i ) =
i (i , Pk i ) = Tr (Pk W )
i
da cui
W0 +
Pk W Pk
PkF (W )
1
P (fi , gj ) = Tr (W Pi ) Tr (W 0 Qj ) = Tr (W Pi )
Tr (Pi W Pi Qj ) = Tr (W Pi Qj Pi )
Tr (Pi W )
dove Pi il proiettore su E (fi , F ) e Qj il proiettore su E (gj , G).
Analogamente
P (gj , fi ) = Tr (W Qj Pi Qj ) ,
in generale accade allora che le due probabilit risultano diverse, contrariamente a quanto
accade nel caso classico. Se invece vale
Pi Qj Pi = Qj Pi Qj
allora le due probabilit risultano eguali. Cominciamo col vedere che questo accade se Pi e
Qj commutano. Infatti, usando ancora lidempotenza dei proiettori
Pi Qj Pi
Qj Pi Qj
= Pi (Pi Qj ) = (Pi Pi ) Qj = Pi Qj
= Qj (Qj Pi ) = Qj Pi = Pi Qj
F =
fi Pi
i
, [F, G] = 0 [Pi , Qj ] = 0 i, j
X
G=
gj Pj
Dimostrazione
X
X
X
[F, G] =
fi Pi ,
gj Pj =
fi gj [Pi , Qj ] = 0
i
i,j
Vediamo il viceversa, siccome F e G commutano, hanno una base comune di autovettori che
chiameremo ijn . Allora
F ijn
Gijn
allora
F
i,j,n
G =
i,j,n
perci
Pi =
= fi ijn
= gj ijn
X X
X
fi ijn ijn =
fi
fi Pi
ijn ijn =
i
j,n
i,n
X X
X
gi ijn ijn =
gj
gj Qj
ijn ijn =
X
ij 0 n ij 0 n ,
Qj =
j 0 ,n
sicch
Pi Qj
i0 jm i0 jm
i0 ,m
X
X
X
X
ij 0 n ,
=
ij 0 n ij 0 n
i0 jm i0 jm =
i0 jm i0 jm ij 0 n =
j 0 ,n
i0 ,m
ij 0 n , i0 jm i0 jm , ij 0 n =
i0 ,j 0 ,n,m
X
X
ijn , ijn =
ijn ijn
=
n
j 0 ,n
i0 ,j 0 ,n,m
i0 ,m
ii0 jj 0 nm i0 jm , ij 0 n =
Qj Pi =
ijn ijn = Pi Qj
n
(c.v.d.)
Fino ad ora abbiamo adottato notazioni comuni ai testi di analisi funzionale, evitando di
traumatizzare il lettore con la notazione di Dirac. Si tratta di una notazione semplificata molto
apprezzata dai fisici e molto poco digerita dai matematici. In eetti, le sue virt matematiche
si riducono a compattezza ed estetica, mentre dal punto di vista teorico limpostazione della
notazione alla Dirac comporta qualche dicolt. Ad ogni modo necessario che un fisico
sappia padroneggiare ambedue gli apparati. Non si pu perci fare a meno di dedicare una
sezione alla notazione di Dirac. Avvertiamo che, in questa sede, avremo modo di chiarire o
approfondire alcuni argomenti gi visti in precedenza.
Ket
Consideriamo il nostro spazio di Hilbert H, chiameremo ciascun elemento di H ket o vettoreket, e lo indicheremo con il simbolo |i, allinterno del quale porremo un segno distintivo. Ad
esempio se un vettore di H nella notazione usuale, potremmo indicarlo in notazione di
Dirac anche come |i.
Bra
Teorema
di Riesz e
prodotto scalare
noto per (teorema di rappresentazione di Riesz, vedi MMF) che ogni spazio di Hilbert
autoduale, cio isometricamente isomorfo al suo duale topologico H . In altre parole esiste
un isomorfismo isometrico, che indicheremo con T , dallo spazio H allo spazio H che il
sottoinsieme del duale algebrico, costituito dai funzionali continui. Ne deriva che a ogni ket
|i, corrisponde uno e un solo bra continuo h| = T |i tale che
h |i = (|i , |i)H , H
In notazione di Dirac il prodotto scalare tra i ket |i e |i si scrive allora h |i.
Osservazione IV.2
Notiamo anzitutto, si veda MMF, che H , duale topologico di H uno spazio di Hilbert,
mentre il duale algebrico semplicemente uno spazio vettoriale (di dimensione infinita).
Inoltre, notiamo che
( |i , |i)H = (|i , |i)H = h |i = h |i
poich per definizione
h| = h|
Il teorema di Riesz garantisce che a ogni ket corrisponde un bra e che a ogni bra continuo
corrisponde un ket. Daltra parte, per come abbiamo definito un bra, evidente che non
a ogni bra corrisponder un ket. Baster considerare un bra h| non continuo: se a esso
corrispondesse un ket |i, tale che per ogni ket in H
h |i = (|i , |i)
allora h| sarebbe continuo, il che assurdo. Un esempio molto semplice dato dalla delta di
Dirac in L2 , essa definita sul denso delle funzioni continue in un punto f , sulle quali si ha
h x0 |f (x)i + f (x0 )
ma su tale denso h x0 | non limitata, perci non pu essere estesa per continuit. Se ci
limitiamo a L2 (1, 1) e consideriamo x0 = 0, ci basta valutare la sulla successione di
funzioni fn a scalino normalizzate a 1 alte n > 0:
|h x0 |fn i| = n .
Nondimeno possibile, uscendo da H, introdurre dei ket generalizzati che corrispondano ai
bra discontinui. quello che abbiamo fatto quando abbiamo incontrato osservabili con spettro
continuo: gli autovettori di tali osservabili non sono vettori di H, ma il loro prodotto scalare
con gli elementi di H ben definito. In questo senso chiameremo | x0 i il vettore che non
appartiene a H ma tale che
h |i = (|i , |i)
Infatti,
Z 1
Z 1/n
Z 1/n
n Z 1/n
n
n
f
(x)
g
(x)
dx
g
(0)
=
g
(x)
dx
g
(0)
dx
|g (x) g (0)| dx
2
2 1/n
2
1
1/n
1/n
fissato esiste N tale che |g (x) g (0)| < se x [1/n, 1/n] con n > , allora, per
n>
Z 1
n 2
<
f
(x)
g
(x)
dx
g
(0)
n
2 n =
1
Un operatore lineare, ovviamente, associa a ogni |i un altro 0 di modo che
0
= A |i
Abbiamo visto prima che semplicemente giustapponendo un bra e un ket si ottiene il prodotto
scalare tra il ket corrispondente al bra e laltro ket. Vogliamo allora dare un significato alla
scrittura
|i h|
siccome un bra agisce linearmente sullo spazio H dando luogo a un numero complesso, |i h|
agir linearmente su H a dare un complesso moltiplicato per |i, cio
|i h| :
H
H
|i 7 (h |i) |i
cio
|i h| (|i) = |i h |i = (h |i) |i
In altre parole |i h| un operatore lineare e precisamente
|i h| =
Ne deriviamo che lordine nel quale vengono scritti ket e bra assolutamente rilevante: solo i
numeri possono essere spostati a piacimento allinterno di unespressione.
A
0
Ha = h| A+
A+ un operatore lineare definito dalla seguente propriet
0
= A |i 0 = h| A+
Sia ora |i un altro ket, abbiamo
h| A+ |i = 0 |i = h 0 = h| A |i
A+ come
aggiunto
Loperatore A+ agisce sul duale di H, daltra parte, siccome esso isomorfo a H, si pu dare
un senso alla scrittura