Sei sulla pagina 1di 25
Ipotesi ergodica Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Fisica Candidato

Ipotesi ergodica

Facoltà di Scienze Matematiche, Fisiche e Naturali

Corso di Laurea in Fisica

Candidato

Matteo Scandi Matricola 1539736

Relatore

Prof. Giorgio Parisi

Anno Accademico 2014/2015

Ipotesi ergodica Tesi di Laurea. Sapienza – Università di Roma

© 2015 Matteo Scandi. Tutti i diritti riservati

Questa tesi è stata composta con L A T E X e la classe Sapthesis.

Versione: 31 agosto 2015

Email dell’autore: scandimatteo@gmail.com

iii

Indice

1 Introduzione

1

1.1 Medie temporali e medie nello spazio delle fasi

 

.

.

.

.

.

.

.

.

.

.

.

.

1

1.2 Tempi di ricorrenza

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

2

2 Trattazione matematica

 

5

2.1 Definizione di sistema dinamico e alcuni esempi

 

5

2.2 Ergodicità .

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

9

3 Necessità dell’ipotesi ergodica

 

15

3.1 L’analisi di Khinchin

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

15

3.2 Conclusioni

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

17

A Alcune dimostrazioni

18

A.1

A.2

. Equivalenza delle diverse definizioni di ergodicità

Teorema di Birkhoff

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

18

20

1

Capitolo 1

Introduzione

Il tentativo della meccanica statistica di ridurre la termodinamica alla dinamica elementare si basa sulla possibilità di calcolare il valore di alcune grandezze fisica- mente rilevanti senza dover integrare esplicitamente le equazioni del moto, ovvero un sistema di 6N equazioni differenziali del primo ordine, potendo invece ricorrere a un metodo generale che consenta di poter considerare solamente le caratteristiche dell’hamiltoniana del sistema. Tale problema, come si vedrà in questo capitolo, è stato risolto da Boltzmann introducendo l’ipotesi ergodica.

1.1 Medie temporali e medie nello spazio delle fasi

Dato un sistema fisico costituito da N particelle nello spazio tridimensionale, de- scritto dall’hamiltoniana H(p, q), dove con p si sono indicati gli impulsi e con q le

posizioni,la sua evoluzione temporale può essere rappresentata come la traiettoria nello spazio delle fasi soluzione delle equazioni di Hamilton:

p˙ h = ∂q H h

q˙ h = ∂p H h

.

(1.1)

Inoltre, idealmente ogni osservabile fisica può essere rappresentata come una funzione f : R 6N R che associ ad ogni coordinata il valore f (p, q). Fisicamente, però, la

misurazione occupa una quantità di tempo finita che, nella maggior parte dei casi, è

molto maggiore dei tempi caratteristici del sistema; quindi l’effettivo valore osservato

¯

corrisponde al valore mediato f:

¯

f = lim

T →∞

T

t

0

1

t 0 +T

f(S t (p, q))dt ,

(1.2)

dove S t corrisponde alla funzione che associa a ogni punto (p, q) le coordinate

(p(t), q(t)) della curva integrale soluzione del problema di Cauchy con condizioni

iniziali (p, q).

¯

Un modo alternativo di definire f è quello utilizzato da Boltzmann 1 : tenendo conto della precisione finita di qualsiasi apparato di misura, si può dividere l’ipersuperficie dello spazio delle fasi definita da H(p, q) = E in N celle {i } 1iN di volume

1 Questa interpretazione è presente nel trattato di Gallavotti [Ga2]

2

1. Introduzione

corrispondente ai minimi valori risolvibili con la strumentazione utilizzata. Inoltre, non sarà apprezzabile nessun cambiamento per tempi inferiori a una costante τ tipica del sistema, tale che ogni punto di ogni cella si sia spostato in uno di un’altra cella; per questo motivo la media potrà essere calcolata limitandosi a tempi multipli interi di τ , ovvero:

¯ 1

f = lim

M →∞

M

M

i=0

f i ,

(1.3)

dove si è indicato con f i la funzione f calcolata nei punti S iτ (p, q) 2 . Quindi, il

problema di calcolare una qualsiasi quantità macroscopica corrisponde a quello

di

risolvere le 6N equazioni del moto, dopo aver determinato sperimentalmente

le

6N condizioni iniziali, e di calcolare infine la media su un intervallo di tempo

T τ . Chiaramente, per i sistemi di cui si occupa la meccanica statistica in cui N

è dell’ordine del numero di Avogadro, il grande numero di gradi di libertà impedisce

un approccio del genere.

Tale problema venne risolto da Boltzmann con l’introduzione dell’ipotesi ergodica,

ovvero l’ipotesi che la media temporale possa essere scambiata con la media nello

spazio delle fasi. In formule, indicando con f (∆ i ) il valore dell’osservabile calcolata

in

un qualsiasi punto 3 all’interno della cella i , si ottiene:

lim

M →∞

1

M

M

i=0

f i = 1

N

N

i=1

f (∆ i ) .

(1.4)

Ci

straordinaria: per prima cosa, consente di evitare di risolvere le equazioni del moto, spostando il problema ad un calcolo puramente geometrico; inoltre, come era auspicabile, si perde ogni dipendenza dalle condizioni iniziali; infine, come si mostrerà nella sezione 2.2 tale ipotesi è equivalente alla distribuzione microcanonica,

e quindi permette di ricavare tutta la termodinamica.

Un modo alternativo per esprimere l’ipotesi ergodica può essere ricavato dalle seguenti considerazioni: dal teorema di Liouville sappiamo che nell’evoluzione temporale

il volume di ogni cella resta invariato; inoltre, grazie ai teoremi sull’unicità della

soluzione del moto, possiamo ricavare che, in prima approssimazione, due diverse celle non possono essere trasformate in una stessa cella. Quindi, si è giustificati a visualizzare l’azione di S τ come un gruppo di permutazioni su {i } 1iN , ovvero si può dire che la dinamica del moto agisce sulle celle dello spazio delle fasi permutandole tra loro. In questo contesto, l’ipotesi ergodica implica che il gruppo generato da S τ sia ciclico: in questo modo, per ogni condizione iniziale 0 la traiettoria visiterà tutte le celle e, dopo N passi, tornerà in se stessa.

sono una serie di caratteristiche che rendono questa equazione di una potenza

1.2 Tempi di ricorrenza

Uno dei problemi maggiori nella fondazione della meccanica statistica è come sia possibile conciliare la descrizione data dalla dinamica microscopica delle particelle

2 Si assume implicitamente che se il sistema è periodico τ non sia un multiplo intero del periodo, altrimenti l’osservabile misurata sarebbe banalmente costante 3 Viene assunto che f non vari sensibilmente all’interno della singola cella.

1.2 Tempi di ricorrenza

3

elementari, simmetrica sotto inversione temporale, con la descrizione termodinamica,

in cui una direzione temporale, quella per cui l’entropia aumenta, sia privilegiata

(paradosso di Loschmidt). Inoltre, a causa del teorema di ricorrenza di Poincaré,

è inevitabile che dopo che un sistema abbia raggiunto l’equilibrio da uno stato di

bassa entropia tramite una trasformazione con S > 0, ritorni prima o poi ad uno stato fortemente fuori dall’equilibrio contraddicendo in questo modo la seconda legge della termodinamica (paradosso di Zermelo). L’eleganza della soluzione di Boltzmann si rintraccia anche nella semplicità con cui

riesce a fondare la meccanica statistica risolvendo allo stesso tempo i paradossi di

Zermelo e di Loschmidt: infatti, la conseguenza paradossale del teorema di ricorrenza

di Poincaré non solo non viene negata, ma viene completamente assorbita dalla

nuova teoria, se è possibile, in una versione più radicale. Infatti, dopo N passi non solo si è in un intorno arbitrariamente piccolo dello stato iniziale, bensì in uno stato

del tutto indiscernibile da quello. A prima vista sembrerebbe impossibile fondare

la termodinamica da questo presupposto se non fosse che, come fu sottolineato da

Boltzmann stesso, N è così grande da rendere di fatto non osservabile tale ritorno. Per dare un’idea degli ordini di grandezza di cui si sta trattando, si può dare una stima grossolana del numero di celle elementari contenute in un 1 cm 3 di gas perfetto.

La misura dell’ipersuperficie ad energia costante può essere stimata come:

Σ =

∂E

H(p,q)<E d 3N qd 3N p =

3 N π 2 N) V N (2mE) 3 N−1 . 2 Γ( 3 2
3 N
π
2
N) V N (2mE) 3 N−1 .
2
Γ( 3
2

(1.5)

Notando che E = 3 N kT e che Γ(N ) = (N 1)!, utilizzando l’approssimazione di Stirling si ottiene:

2

Σ

2e 2π( 3 N 1) 2πe

3

2

3

3

2

N

V

N (3mkT ) 3

2

N1

2e 3πN 2πe

3

3

3

2

N

V

N (3mkT ) 3

2

N1 .

Se si riordinano i termini in questo modo:

Σ

1

2e mπKT N N

2

1

V

N 3mKT 3N 2πe

3

N N − 2 1 V N √ 3 mKT 3 N 2 π e 3

3

3

2

N

 

(1.6)

,

(1.7)

e si divide per h 3N N !, dove il fattore N ! tiene conto dell’indistinguibilità delle particelle identiche, si ottiene il numero di celle:

N =

Σ

h 3N N!

3N 5 1 1 V 3 3 N √ 3mKT 2πe 2eN √ mπKT h
3N
5
1
1
V
3
3
N √ 3mKT 2πe
2eN √ mπKT
h
3

.

(1.8)

A questo punto si può stimare il tempo di ricorrenza utilizzando come tempo

caratteristico τ il tempo medio tra due collisioni, ottenendo così 4 :

T ric = τ N ∼ O(10 15 ) · (O(10)) 10 19 s .

(1.9)

4 I calcoli sono stati fatti scegliendo l’idrogeno, quindi m = 3.34·10 24 g, N = 2.7·10 19 , T=300 K.

4

1. Introduzione

Per comprendere l’enormità di tale tempo basti pensare che le ultime stime sull’età dell’universo 5 danno risultati dell’ordine di 10 81 s. In questo modo può essere giustificata la non osservazione di una diminuzione macroscopica dell’entropia 6 . Infatti, seppur il paradosso di Zermelo metta in luce la periodicità della funzione S, che quindi comporta periodi di tempo in cui l’entropia tenda a diminuire con la stessa frequenza di quelli in cui l’entropia aumenta, la lunghezza del ciclo nello spazio delle fasi impedisce che tale inversione possa essere concepibilmente osservata. In questo modo si risolve anche il paradosso di Loschmidt sulla direzione del tempo: infatti, l’apparente mancanza di simmetria della dinamica macroscopica viene recuperata per tempi molto maggiori dell’età dell’universo. Questa stima, però, apre anche un altro problema: se il periodo del ciclo è così grande, cosa assicura che la media temporale eguagli la media nello spazio delle fasi in tempi fisicamente sensati, come possono essere i tempi tipici di un apparato di misura, dell’ordine di 10 3 10 1 s? A questo problema Boltzmann risponde facendo notare come le osservabili di interesse fisico sono poche funzioni per le quali dovrebbe valere una sostanziale costanza su tutta l’ipersuperficie a energia costante. Questa idea è quella adottata in seguito da Khinchin in [Khi] e che verrà esposta nel capitolo 3.

5 Come si riporta in [Pl]. 6 Inoltre rendono la scelta del prefattore τ , che poteva essere accusata di una certa arbitrarietà, del tutto inessenziale.

5

Capitolo 2

Trattazione matematica

Dopo aver espresso i punti generali dell’ipotesi ergodica, passiamo alla trattazione matematica del problema in modo da poter esporre con maggiore precisione alcune caratteristiche più sottili della questione.

2.1 Definizione di sistema dinamico e alcuni esempi

Una definizione di fondamentale importanza è quella di sistema dinamico.

Definizione 1. Sia (Ω, µ) uno spazio di misura normalizzato, ovvero un insieme

su cui sia definita una σ-algebra e una funzione µ numerabilmente additiva dalla σ-

algebra a R tale che µ(Ω) = 1. Sia, inoltre, Φ : = {Φ t } un insieme di trasformazioni

di

in se stesso, ovvero una trasformazione Φ funzione di t. Φ viene definito gruppo

di

automorfismi (discreto se t Z, continuo se t R) se le seguenti proprietà sono

soddisfatte:

1.

s, t Φ s Φ t = Φ s+t .

2. Φ 0 = 1 .

3. t

µt (A)) = µ(A) .

Si può notare come le proprietà necessarie perché l’insieme sia un gruppo (chiusu- ra, associatività, esistenza dell’elemento neutro e dell’inverso) siano automaticamente soddisfatte una volta che la proprietà 1. sia valida: le proprietà gruppali sono in questo modo trasferite dagli indici agli elementi dell’insieme 1 . Questo implica l’abelianetà del gruppo.

Definizione 2. La terna (, µ, Φ) viene chiamata sistema dinamico astratto.

Visto che nessuna struttura aggiuntiva a quella di σ-algebra viene richiesta su , tale definizione gode di un enorme generalità, come viene messo in luce dal seguente esempio di notevole importanza.

1 Si consideri la funzione π che agisce su Φ come πt ) t. Tale funzione è un isomorfismo tra gruppi.

6

2. Trattazione matematica

, dove Z N =

, N 1} indica l’insieme dei primi N interi non negativi (gli elementi di tale

spazio sono le sequenze doppiamente infinite di N simboli) e si prenda come σ-algebra

{0,

Esempio 1 (Schema di Bernoulli). Si prenda lo spazio M = Z

Z

N

l’algebra di Borel sulla topologia generata dagli aperti della forma:

m

k

C

= {x M|x k = m}

k Z

m Z N ,

(2.1)

ovvero l’insieme di sequenze tali che la k-esima componente sia fissata. Si definisce preliminarmente una misura sullo spazio Z N scegliendo N numeri reali positivi

{p 0 ,

(2.2)

, p N1 } tali che:

p i = 1 ,

1iN

e attribuendo agli insiemi generatori la misura:

µ(C

m

k

) = p m .

(2.3)

La misura su M sarà, quindi, la misura prodotto che agisce associando all’intersezione

di una serie di insiemi generatori il prodotto delle rispettive misure, ovvero:

m

k

µ(C

1

1

m

k

C

i

i

) = p m 1

p m i .

(2.4)

Definiamo, infine, l’automorfismo φ che trasforma ogni elemento della sequenza x k nell’elemento x k = x k1 . Si nota facilmente che la misura viene preservata notando che vale la seguente catena di uguaglianze:

µ(φ(C

m

k

)) = µ(C k+1 ) = p m = µ(C

m

m

k

)

.

(2.5)

Il sistema dinamico astratto così generato (M, µ, φ) è chiamato schema di Bernoulli

, p N1 ). Esso può essere utilizzato per descrivere una

successione di eventi aleatori indipendenti mutuamente esclusivi che possano dare

N esiti diversi con probabilità a priori p 0 ,

B(

2 , non truccata, e l’azione di φ è quella di passare da un lancio a quello successivo.

e viene indicato come B(p 0 ,

, p N1 . Per esempio, gli elementi di

1

1

2 ) possono rappresentare tutte le successioni infinite di lanci di una moneta

Se ad associamo anche una struttura di varietà differenziabile la terna (, µ, Φ) viene chiamata sistema dinamico classico.

Esempio 2 (Flusso hamiltoniano). Data un’hamiltoniana di un sistema isolato H(p, q), consideriamo il sistema dinamico formato dall’ipersuperficie nello spazio

delle fasi a energia costante Σ E : {(p, q) R 6N |H(p, q) = E} e dalla trasformazione

Φ t che associa a ogni coordinata la sua evoluta secondo le equazioni:

p˙ h = ∂q H h

q˙ h = ∂p H h .

(2.6)

Si potrebbe pensare di utilizzare come misura dello spazio quella definita come:

µ(D) = dΣ ,

D

(2.7)

2.1 Definizione di sistema dinamico e alcuni esempi

7

ma in generale tale misura non risulta invariante sotto l’azione del flusso hamiltoniano, come si può notare considerando anche esempi semplci come quello dell’oscillatore

armonico. Infatti, considerando la superficie

p

2

2m +

1

2

kq 2 = E si ha:

D

θ 2 +ωt

θ 1 +ωt

dΣ =

θ

θ

1

2

2Em sin 2 θ + 2E cos 2 θ dθ =

k

2Em sin 2 θ + 2E cos 2 θ dθ =

k

Φ t (D)

dΣ ,

(2.8)

dove ω indica la pulsazione m . Sfruttando il teorema di Liouville che impone che il volume nello spazio delle fasi risulti invariato sotto l’azione del flusso hamiltoniano, ovvero che:

k

d

dt

dp dq = 0 ,

(2.9)

Φ t (E)

è naturale pensare di poter costruire una misura invariante anche su Σ E . Proviamo inizialmente l’uguaglianza:

d

dE

V

E

dp dq =

Σ

E

dΣ E ,

(2.10)

dove si indica con V E l’insieme V E =: {(p, q) R 6N |H(p, q) E}. Per sempli-

ficare ulteriormente la notazione indichiamo (p, q) col vettore a 2N componenti

(x 1 ,

indicato l’incremento infinitesimo nella direzione normale a Σ E , l’incremento di

energia può essere scritto come:

, x 2N ). Visto che vale la relazione dx i = dn cos(n · x i ), dove con dn si è

dE =

N

i=1

∂E

∂x i

dx i = dn

N

i=1

∂E

∂x i

cos(n · x i ) .

(2.11)

Dato che Σ E è definita da una equazione cartesiana, e quindi la direzione del vettore gradiente, si ha inoltre che:

cos(n · x i ) =

1

∂E

E

∂x i

.

Unendo i due risultati si ottiene la relazione:

dE = dn

N

i=1

i 2

∂E

∂x

E

= dn E .

(2.12)

(2.13)

A questo punto si può riscrivere l’integrale sullo spazio delle fasi come:

V

E

dp dq = dΣdn =

V

E

E

0

d E

Σ E

dΣ E .

(2.14)

8

2. Trattazione matematica

Definendo l’integrale in dΣ come una funzione ψ(E), si può derivare l’integrale ottenendo:

d

dE

V E

d

dp dq =

dE

E

0

ψ( E)d E = ψ(E) =

Σ E

dΣ

E .

(2.15)

Avendo dimostrato la relazione (2.10), si può costruire una misura su Σ E invariante sotto l’azione di Φ. Per far ciò si può pensare di esprimere la misura di un insieme D come il valore medio:

µ(D) =

lim

x0

x

1

D

D+∆x·nˆ dV

dV

x

1

V

E+∆x

dV

V E dV

=

1

D

dΣ

Ω(E)

E ,

(2.16)

dove con Ω(E) si è indicato l’integrale nell’equazione (2.10). Tale misura è banalmente invariante, essendo la derivata di una quantità invariante. In questo modo (Σ E , µ, Φ) è un sistema dinamico classico.

Prima di proseguire chiarifichiamo le seguenti notazioni. Indichiamo come media temporale l’integrale:

L’integrale

¯

f = lim

T →∞

1

T

t 0 +T

t

0

f(S t (p, q))dt .

f = f dµ

(2.17)

(2.18)

viene chiamato media in fase. A questo punto possiamo enunciare uno dei teoremi fondamentali per i sistemi dinamici nel caso discreto 2 .

Teorema 1 (di Birkhoff). Sia (, µ, Φ) un sistema dinamico discreto e sia f : Ω R una funzione assolutamente sommabile. Allora esiste quasi ovunque su il limite:

¯ 1

f = lim

N →∞

N

N

i=0

f

i (x)) ,

(2.19)

¯

e tale funzione appartiene a L 1 (Ω). Inoltre si ha che f è invariante per evoluzione

temporale e che:

f = f .

¯

(2.20)

La dimostrazione di questo teorema è data in appendice A.1. Tale teorema garantisce quindi l’esistenza della media temporale per quasi ogni punto

2 Il caso continuo ne è una generalizzazione banale.

2.2 Ergodicità

9

dello spazio sotto condizioni generalissime 3 . Per notare una delle conseguenze più interessanti di questo teorema consideriamo la funzione caratteristica di un insieme

misurabile E: χ E (x) =

(2.21)

0

1

x E

se se x / E

e definiamo il tempo medio di soggiorno come:

τ E (x) = lim

T →∞

1

T

T

0

χ E t (x))dt .

(2.22)

Il teorema di Birkhoff allora afferma che per quasi tutti i punti iniziali tutte le traiettorie avranno un tempo di soggiorno caratteristico in ogni insieme misurabile. Avendo introdotto il teorema di Birkhoff si può passare ad affrontare il problema vero e proprio dell’ergodicità.

2.2 Ergodicità

Le molte conseguenze che comporta la proprietà di un sistema di essere ergodico si riflettono nella molteplicità di modi in cui è possibile definire tale proprietà.

Definizione 3. Un sistema dinamico (, µ, Φ) si dice ergodico se per ogni funzione f L 1 (Ω) la media temporale e la media in fase coincidono:

¯

f (x) = f quasi ovunque.

(2.23)

La condizione di ergodicità può essere riformulata nei seguenti modi.

Teorema 2. Dato un sistema dinamico (, µ, Φ) le seguenti condizioni sono equi- valenti:

(i) (, µ, Φ) è ergodico.

(ii) Per ogni insieme misurabile E il tempo di soggiorno è uguale alla misura di E:

τ E (x) = µ(E) quasi ovunque.

(2.24)

(iii) Non esistono integrali primi del moto non banali, ovvero si ha che:

f t (x)) = f (x) t, per quasi ogni x =f è costante quasi ovunque.

(2.25)

3 Chiaramente la condizione sull’esistenza quasi ovunque non può essere indebolita: a scopo di

esempio si consideri il sistema B(

1

2 ,

2 1 ) e si consideri la sequenza

x =

x k = 0

se k 0

x k =

1

se log 2 |k|

pari

x k = 0

se log 2 |k|

dispari

ovvero la sequenza

la sua componente 0-esima. In questo caso f oscillerà tra valori sempre più prossimi a 3 e a 3 , ma

non raggiungerà mai un limite.

si consideri la funzione f che associa a x

, 0, 1, 1, 1, 1, 0, 0, 1, 0, 0, 0,

¯

) e

1

2

10

2. Trattazione matematica

(iv) Il sistema è metricamente transitivo, il che significa che gli unici insiemi invarianti per evoluzione temporale hanno misura massima o minima:

Φ t (E) = E =µ(E) = 0

oppure 1.

(2.26)

Analizziamo ora le proprietà messe in luce da ogni definizione, mentre la dimo- strazione dell’equivalenza viene posticipata all’appendice A.2.

Il significato fisico della proprietà (ii) è abbastanza chiaro: non essendo presente a

priori nessuna configurazione privilegiata nello spazio delle fasi, il tempo trascorso

dal sistema è equidistribuito per quasi tutte le condizioni iniziali. Se si considera che per un sistema dinamico la probabilità di trovarsi in un dato stato è proporzionale

al tempo trascorso in quello stato, questa condizione è fondativa per la distribuzione

microcanonica, che per un sistema hamiltoniano può essere scritta proprio come:

ρ(p, q) =

   V E dp dq 1 se H(p, q)

d

dE

dE

0

altrimenti

= E

(2.27)

Tale condizione si riflette anche nella proprietà (iii): infatti, se esistesse un integrale primo del moto non banale I lo spazio delle fasi potrebbe essere diviso in porzioni mutuamente esclusive definite dall’equazione del moto I = a, rendendo così il tempo

di soggiorno enormemente dipendente dalle condizioni iniziali (addirittura si ottiene

che τ I =a = 0). Ovviamente, restringendo lo spazio preso in esame a quello definito da tutti gli integrali primi, la condizione di ergodicità può essere recuperata; se si considera come spesso, però, tali integrali siano privi di qualsiasi significato fisico, si

nota come sia di fatto impossibile limitare lo studio del sistema a tali spazi ridotti. La condizione (iv) è un ulteriore formulazione della proprietà (iii): e anzi si può mostrare che se esistessero insiemi misurabili e invarianti di misura non nulla allora

si potrebbe costruire un integrale del moto non banale, come viene descritto in

appendice A.2. La forza dell’ipotesi ergodica sta nella quantità di implicazioni che essa comporta, che la rendono uno strumento estremamente potente per studiare problemi anche non strettamente inerenti alla meccanica statistica, in particolare in teoria dei numeri e in geometria differenziale. Nella sua generalità, però, sta anche la sua debolezza: è infatti spesso difficile mostrare l’ergodicità di sistemi fisicamente rilevanti, e anzi spesso ci si ritrova nella situazione di dimostrare il contrario, fatto che può essere interpretato in due modi: da una parte potrebbe essere causato da un’inadeguatezza del modello utilizzato per schematizzare il sistema, dall’altro potrebbe essere un sintomo di un risultato più profondo. Come vedremo nel seguito quest’ultima interpretazione sarà quella corretta nel limite di un numero finito di gradi di libertà. Passiamo, quindi, allo studio di semplici sistemi dinamici.

Esempio 3 (Sistemi hamiltoniani unidimensionali). Consideriamo un’hamiltoniana del tipo H(p, q) = 2m + V (q) con l’assunzione che il moto sia limitato (V (q) → ∞ per |q| → ∞). Consideriamo una funzione f, diversa dall’energia, che sia invariante sotto evoluzione temporale. Allora per ogni condizione iniziale il moto si svolgerà sulla varietà:

2

p

H(p(t), q(t)) = E

f (p(t), q(t)) = f (p(0), q(0)) .

0

(2.28)

2.2 Ergodicità

11

Dato che lo spazio delle fasi è bidimensionale o f è costante, e quindi la seconda equazione è banalmente soddisfatta, o la traiettoria degenera ad un punto. Ma questo è assurdo, da cui la non esistenza di integrali primi non banali e quindi l’ergodicità del sistema.

Il seguente esempio, di carattere del tutto astratto, verrà utilizzato nel seguito per spiegare il carattere quasi periodico di sistemi hamiltoniani abbastanza generali.

Esempio 4 (Moti sui tori). Consideriamo il sistema dinamico costituito dal to- ro piatto T = R/Z equipaggiato con la misura ereditata da R, su cui agisca l’automorfismo:

(2.29)

Per dimostrare l’ergodicità di tale sistema consideriamo la sua rappresentazione come circonferenza unitaria nel piano complesso. In questo contesto la trasformazione φ può essere scritta come:

(2.30)

Visto che una base di generatori per le funzioni di L 1 (T) è costituita dalle funzioni trigonometriche, che sulla circonferenza unitaria si possono scrivere come f p (θ) = e ipθ = f p (z) = z p con p Z, basta dimostrare l’ergodicità di tali funzioni per ottenere il risultato voluto. Esaminiamo quindi il comportamento di tali funzioni sotto media temporale:

φ(x) = x + ω

mod 1.

φ(z) = z · θ

θ = e 2πiω

ω R.

1

N

N1

i=0

f p (φ i (z)) = 1

N

N1

i=0

(θ i z) p = 1

N

z p θ Np 1

θ p 1

p = 0

se p = 0

se

.

(2.31)

Se ω non è razionale θ p 1 = 0 per ogni p; inoltre visto che il numeratore è limitato

(|θ Np 1| ≤ 2) si ha che:

(2.32)

¯

f

=

=

1

0

se

se

p = 0

p

= 0

,

che quindi corrisponde esattamente alla media in fase. Questo dimostra che se ω è

irrazionale il moto sul toro è ergodico. Tale risultato va sotto il nome di teorema

di equipartizione modulo 1. D’altronde se ω è razionale le orbite sono costituite da

un numero finito di punti e quindi si può facilmente costruire un integrale primo non banale. Inoltre, una volta dimostrata l’ergodicità per T, l’estensione a T N non comporta sostanziali complicazioni. In particolare, una base di L 1 (T N ) è l’insieme delle funzioni del tipo:

ψ k 1 ,

,k

N =

N

i=1

z

k

i

i

(k

1 ,

, k N ) Z N .

(2.33)

In questo caso l’evoluzione temporale verrà data dalla funzione:

(2.34)

dove ω R N viene definito vettore di spostamento. Ricalcando la prova precedente

si ottiene che il moto sui tori è ergodico per vettori di spostamento razionalmente

indipendenti, ovvero tali che la seguente condizione sia soddisfatta:

(2.35)

φ(x) = x + ω

mod 1,

ω · k

= 0

k Z N .

12

2. Trattazione matematica

In questo caso si può dimostrare che le traiettorie compiono un moto quasi periodico ricoprendo densamente la superficie del N -toro.

Trattiamo ora un sistema fisico di grande importanza, che risulta essere uno dei più semplici sistemi rilevanti per la meccanica statistica per cui il problema ergodico appaia interessante, ovvero la catena di oscillatori 4 .

Esempio 5 (Catena di oscillatori con condizioni periodiche al bordo). Consideriamo il sistema descritto dall’hamiltoniana:

H(p, q) =

N

i=1

2

2m + m2

p

i

2

N

i=1

(q i+1 q i ) 2

,

(2.36)

con la condizione di periodicità q i+1 = q 1 . Notando che il secondo termine può essere scritto come:

(2.37)

N N

q

2

i

2

V (q) = 2

q i q i+1 = q T Vq ,

i=1 i=1

dove si è rappresentata V nella forma matriciale come:

V =

2 1

2

1

.

.

.

1

0

.

.

.

1

.

0

1

2

.

.

.

.

0

0

1

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

.

0

.

.

.

1

.

.

.

.

1

.

.

.

.

.

.

.

2

(2.38)

Risolviamo, quindi, il problema agli autovalori per V. Tale problema è equivalente alla coppia di equazioni:

(2.39)

ξ i ξ i+1 = λξ i ξ N ξ 1 = λξ N

.

Agendo ricorsivamente si arriva alla relazione:

ξ 1 = (1 λ) N ξ 1 .

(2.40)

Quindi, affinché il moto abbia soluzioni non banali si deve avere la condizione su λ:

λ k = 2(1 e

2πik

N

)

.

(2.41)

Tramite un cambio di variabili (p, q) (η, ξ) è quindi possibile scrivere il sistema

come N oscillatori disaccoppiati con frequenze proprie λ k . Quindi le energie di ogni singolo moto normale rimangono invariate. In particolare, è possibile realizzare un ulteriore cambio di variabili tramite una trasformazione canonica da R N × R N R N × T N alle nuove variabili:

A k = E k

ω k

φ k = arctan p k

q

k

,

(2.42)

4 Esso può essere utilizzato come modello per una molecola particolarmente lunga, come un polimero.

2.2 Ergodicità

13

dove con E k si intende l’energia associata al k-esimo moto normale. Le equazioni del moto in queste coordinate sono della forma:

˙

˙

A k = 0,

φ k = ω k

mod 2π.

(2.43)

Come si nota quindi, a causa dell’esistenza di N moti normali esistono altrettanti

integrali primi del moto che rendono il moto non ergodico sull’ipersuperficie di energia. Si dice che la superficie Σ E è foliata analiticamente in tori N -dimensionali: questo

significa che si può scrivere la relazione Σ E = eR

analiticamente da N parametri. In particolare se le velocità angolari soddisfano la condizione:

dipende

T

N

e

, dove il toro T

N

e

N

+

N

ω i k i = 0

k i 2πZ

(2.44)

i=1

il moto mostrerà caratteristiche quasi periodiche. Se, invece, tale condizione non è sod- disfatta il moto viene definito risonante ed è completamente periodico (tali risultati ricalcano precisamente quelli ottenuti per i tori piatti nell’esempio precedente).

Il problema a questo punto potrebbe spostarsi quindi su quando sia possibi- le risolvere le equazioni del moto tramite una trasformazione canonica del tipo azione-angolo, e in particolare su quanto queste soluzioni siano stabili sotto piccole perturbazioni. Infatti, si potrebbe pensare che introducendo un debole accoppiamen- to non lineare tra i vari gradi di libertà si possa portare ad interagire le diverse azioni, in modo da ristabilire l’ergodicità. Questa fu esattamente l’idea dell’esperimento numerico realizzato da Fermi, Pasta e Ulam nel 1954, che studiarono il problema sopra espresso aggiungendo un termine del tipo:

H(p, q) =

N

i=1

p

2

2m + m2

i

N

i=1

1 2 (q i q i1 ) 2 + µ (q i q i1 ) r

r

(2.45)

con r=3 oppure r=4. Se si passa alle variabili normali (η, ξ) tramite una serie di

passaggi algebrici si può riscrivere l’hamiltoniana come:

K(η, ξ) =

N

i=1

H k + V (ξ),

H k =

2

2m + k

η

k

2

ξ k

(2.46)

dove V è un polinomio di grado r nelle variabili ξ. Lo studio fu realizzato per

verificare la presenza di termalizzazione per sistemi accoppiati non linearmente, ma

i risultati furono sorprendenti. Per piccoli valori di (< 0.1) anche dopo un grande

numero di cicli l’energia risultava tutt’altro che equidistribuita, come si può notare in figura [2.1]. Questo risultato, del tutto inaspettato, generò i primi dubbi sulla

validità dell’ipotesi ergodica stessa per sistemi di interesse fisico. Nello stesso periodo una serie di articoli di Kolmogorov, Arnold e Moser fonda quello che diventerà il teorema KAM. Tale teorema afferma che preso un sistema completamente integrabile, la cui hamiltoniana possa essere quindi riscritta come funzione delle sole azioni A, aggiungendo una piccola perturbazione h dipendente in modo generico dalle azioni e dalle variabili angolari, ovvero in formule:

H(A) + h(A, θ)

(2.47)

14

2. Trattazione matematica

14 2. Trattazione matematica Figura 2.1. Grafico dell’energia di ogni moto normale in funzione del tempo

Figura 2.1. Grafico dell’energia di ogni moto normale in funzione del tempo per una con- dizione iniziale fortemente fuori dall’equilibrio (tutta l’energia sul primo moto normale), e un debole accoppiamento ( 0.026). Tale grafico è presente in [Be].

la non ergodicità dei moti quasi-periodici non viene compromessa dalla perturbazione e anzi, per ogni numero di gradi di libertà finito, l’insieme di condizioni iniziali per cui il sistema mostri caratteristiche non ergodiche ha misura positiva decrescente con 5 . Questi due risultati mettono in dubbio la validità dell’ipotesi ergodica per sistemi fisicamente rilevanti. D’altronde il risultato sull’ergodicità di un gas di particelle rigide interagenti tramite urti perfettamente elastici dimostrato da Sinai in [Si] potrebbe far sperare che nei casi in cui l’approssimazione di piccole perturbazioni non sia applicabile l’ergodicità possa essere recuperata 6 ; d’altra parte il risultato sul teorema KAM secondo cui al crescere del numero di gradi di libertà i tori invarianti si concentrino su un insieme di tipo Cantor (e quindi di misura nulla) può servire a salvare i casi di limite termodinamico (tale risultato è riportato in [Pö]). Nonostante, quindi, il caso reale possa soddisfare in linea teorica la condizione di ergodicità, comunque la necessità di esaminare caso per caso e le difficoltà che tipicamente si incontrano nello studio di sistemi anche semplici portano a domandarsi se tale ipotesi sia realmente necessaria. Tale questione verrà analizzata nel prossimo capitolo.

5 Esistono, inoltre, alcuni tipi di perturbazioni non lineari che non modificano l’integrabilità del sistema per ogni valore di , come nel caso dei sistemi di Calogero-Moser, ovvero di una catena di oscillatori unidimensionali sottoposti ad interazione gravitazionale. 6 Sinai dimostrò una condizione più forte dell’ergodicità, quella di miscelamento, che permette di giustificare i tempi rapidi con cui le medie temporali raggiungono il loro valore asintotico.

15

Capitolo 3

Necessità dell’ipotesi ergodica

Le

difficoltà nel verificare l’ergodicità per sistemi di reale interesse fisico e, d’altronde,

le

difficoltà messe in luce dagli esperimenti numerici realizzati dal gruppo di Fermi,

fanno sorgere dubbi sulla reale necessità di un’ipotesi così forte, e se non si debba indebolire sfruttando il grande numero di gradi di libertà caratteristico dei sistemi

termodinamici. Questo punto di vista, già sottolineato da Boltzmann, spiegherebbe

anche perché, a priori dell’ergodicità del sistema, le osservabili macroscopiche rag- giungano il loro valore medio in tempi rapidissimi, enormemente differenti dai tempi

di ricorrenza del sistema. Questa idea viene sviluppata da Khinchin in [Khi].

3.1 L’analisi di Khinchin

Nel suo trattato Khinchin presenta un teorema ergodico la cui validità è indipendente dalla transitività metrica. L’idea generale su cui questo approccio è basato è che

la classe di applicazione della teoria ergodica è di molto più grande del necessario:

da una parte rientrano nella trattazione anche sistemi a pochi gradi di libertà, come nel caso dei biliardi dinamici o di moti sui tori in cui una sola particella è

analizzata; dall’altra, la classe di funzioni per cui si richiede l’uguaglianza tra la media temporale e la media nello spazio delle fasi comprende tutte le funzioni di L 1 (Ω), mentre le funzioni di reale rilevanza sono di un tipo molto specifico, ovvero

le funzioni esprimibili come somma di funzioni di singola particella. In formule tale

condizione si può esprimere come:

F(p, q) =

N

i=1

f(p i , q i ) .

(3.1)

Prima di procedere con la dimostrazione del teorema ergodico vero e proprio, passiamo alla dimostrazione del seguente lemma fondamentale, sotto ipotesi generali sia su F che sul numero di gradi di libertà:

µ({x | F (x) F | > kσ}) < 4σ .

¯

k

(3.2)

Cominciamo con alcune definizioni. Indichiamo con F T la funzione:

F T =

1

T

0

T

F t (x))dt .

(3.3)

16

3. Necessità dell’ipotesi ergodica

¯

Chiaramente si ha che lim T F T = F . Definiamo, poi con I l’integrale:

I = |F (x) F |dµ .

(3.4)

¯

Inoltre, definiamo M α l’insieme di punti iniziali per cui | F(x) F | > α e M

α

T

¯

l’insieme per cui valga |F T (x) F | > α . Data la convergenza di F T a F si può

2

facilmente mostrare che, per T opportuno, vale la disuguaglianza 1 :

T

µ(M

α

)

> 1 2 µ(M α ) ,

(3.5)

quindi si può scrivere la catene di disuguaglianze 2 :

αµ(M α )

4

<

αµ(M T )

α

2

< M

T

α

|F T (x)|

1

T

T

0

1

T

dt M

T

T

α

|F t (x))|

dt |F (x)|= I .

0

Quindi si ottiene la condizione:

µ({x | F(x) F | > α}) < 4I .

¯

α

Definiamo con σ 2 l’integrale:

σ 2 = |F(x) F | 2 dµ .

(3.6)

(3.7)

(3.8)

Dalla disuguaglianza di Schwartz si ha che I σ, e quindi tramite un’opportuna sostituzione si ottiene la disuguaglianza cercata. A questo punto per stimare l’ordine di grandezza di σ Khinchin fa l’ipotesi aggiuntiva che l’hamiltoniana sia della forma:

H(p, q) =

N

i=1

h(p i , q i ) ,

(3.9)

ovvero sia la somma di hamiltoniane di singola particella. Questa assunzione è dovuta al particolare approccio del fisico russo, che fonda la meccanica statistica sul teorema del limite centrale. Per far ciò passa allo spazio coniugato sotto trasformata di Laplace, trattando così le energie di singola particella (che altrimenti sarebbero

state variabili correlate, e quindi fuori dal dominio di applicazione del teorema) come

¯

parametri liberi della distribuzione. Con questo metodo riesce a dimostrare che F è

1 Per dimostrare questa relazione consideriamo M

¯

T

α

T

(l’insieme complementare a M ) e prendiamo

α

¯

un punto P tale che P M α e P M . Chiaramente si ha che |F T (P) F(P)| > α . Grazie al

α

2

¯

T

¯

teorema di Birkhoff si ha la convergenza in misura di F T a F per T → ∞, che corrisponde alle

due relazioni µ(M α M ) 0 e µ(M α M ) µ(M α ). Da questo segue che per T abbastanza

α

α

¯

T

T

grande vale la relazione µ(M α M ) > 2 µ(M α ), e quindi anche µ(M ) > 2 µ(M α ). 2 Per semplificare la notazione verrà assunto che f = 0, senza perdita di generalità

α

α

T

1

T

1

3.2 Conclusioni

17

una grandezza dell’ordine di O(N ) e di conseguenza che σ 2 sia dello stesso ordine. Quindi per funzioni somma si ha che:

µ({x |

¯

F(x)

F

1| >

K 1 4 }) <

1

N

K 2 4 .

1

N

(3.10)

In questo modo, nel limite di N → ∞ si ottiene l’ergodicità delle funzioni fisicamente

interessanti. Inoltre, grazie all’utilizzo del teorema del limite centrale si ha l’ulteriore condizione:

(3.11)

µ({x