Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
I principi variazionali
3.1 Introduzione
Lo scopo centrale di questo capitolo è di discutere il principio variazionale
di Hamilton per i movimenti di un sistema meccanico (Principio di minima
azione, o dell’azione stazionaria), e della sua variante che va sotto il nome
di Principio di Maupertuis–Jacobi, e riguarda solo le corrispondenti traiet-
torie.1 Risulterà che il principio di Hamilton è sostanzialmente un sostituto
del familiare principio della meccanica che caratterizza i movimenti “fisici”
come quelli soddisfacenti le equazioni di Newton o le equazioni di Lagrange
o di Hamilton. Ma, come sempre avviene quando si formula un principio
in una forma “sostanzialmente equivalente”, accade anche che il nuovo pun-
to di vista può essere più conveniente a scopi “euristici”, ovvero ai fini di
estendere le vecchie teorie a nuovi campi.
Questo fatto è descritto in maniera mirabile da Feynman, nella conferenza che egli
tenne in occasione del conferimento del premio Nobel, dove egli dice (pag. 177):
“ Theories of the known (cioè le teorie dei fatti conosciuti) which are described
by different physical ideas may be equivalent in all their predictions and are hence
scientifically indistinguishable. However, they are not psychologically identical when
trying to move from that base into the unknown. For different views suggest different
kinds of modifications which might be made and hence are not equivalent in the
hypotheses one generates from them in one’s attempt to understand what is not yet
understood.2
1
Ad esempio, per un punto nello spazio un movimento è definito dalla legge x = x(t),
cioè dalla funzione da R in R3 che ad ogni tempo t ∈ R associa il corrispondente punto
x = x(t) in R3 . La corrispondente traiettoria (o curva) è invece il sottoinsieme dei punti
di R3 ottenuti in tal modo, ovvero, come anche si dice in matematica, è l’immagine della
funzione definente il movimento.
2
In questa conferenza vi è (nella penultima pagina) una parte mirabile che dovrebbe
essere importante per chi intenda dedicarsi alla ricerca scientifica. Si tratta di quando egli
parla del sacrificio richiesto allo studioso che osi dedicarsi a punti di vista che non siano
fashionable (alla moda). Feynman comunque aggiunge poi che tale sacrificio potrebbe
anche rivelarsi remunerativo.
167
168 Andrea Carati e Luigi Galgani
È proprio per questo motivo che la forma del principio di Hamilton è quel-
la preferita nel determinare i movimenti ad esempio in relatività generale3 e
già anche in relatività speciale (metodo delle geodetiche); ne faremo uso noi
stessi per determinare la corretta forma della lagrangiana della particella
libera relativistica, giustificando in tal modo la celebre relazione E = mc2 .
Ma l’importanza del principio di Hamilton venne particolarmente esalta-
ta in epoca recente (poco dopo il 1945) dall’uso che ne fece Feynman per
riformulare la dinamica nell’ambito della meccanica quantistica in un mo-
do formalmente nuovo rispetto a quello tradizionale introdotto da Heisen-
berg, Schrödinger e Dirac attorno all’anno 1925. Si tratta del cosiddetto
metodo dei “cammini di Feynman” (“Feynman paths”), invero ispirato a un
precedente lavoro di Dirac.4
Storicamente,5 i principi variazionali divennero un argomento centrale
di ricerca nella comunità scientifica, con una considerevole attenzione anche
ai suoi risvolti filosofici,6 un secolo prima di Hamilton, e se si vuole se ne
potrebbe assegnare un anno ufficiale di nascita, il 1744. Qualche tempo pri-
ma, aveva suscitato grandi discussioni la formulazione che Maupertuis aveva
dato del principio di Fermat per i raggi dell’ottica geometrica, e la traspo-
sizione che egli ne aveva fatto in ambito puramente meccanico. Toccò al
grande Eulero di ricondurre il problema entro ambiti puramente matemati-
ci. Stimolato dalla discussione che Jean Bernoulli aveva dato del problema
della brachistocrona, Eulero aveva formulato il problema di caratterizzare
analiticamente le geodetiche, cioè le curve di lunghezza minima su una
assegnata superficie, e aveva risolto questo problema in un fondamentale
lavoro del 1744 dal titolo “Methodus inveniendi lineas curvas maximi min-
imive proprietates gaudentes”. Tale lavoro, in effetti, contiene la soluzione
di un problema alquanto più generale che costituisce il cuore del presente
capitolo, ovvero caratterizzare come soluzioni di equazioni differenziali le
funzioni che hanno la proprietà di essere punti stazionari per un assegnato
funzionale di tipo integrale (il significato di queste parole verrà spiegato più
avanti).
3
Ma anche nella “teoria dei campi”.
4
Si vedano gli articoli di Dirac e di Feynman riprodotti nel volume J. Schwinger. Quan-
tum electrodynamics, Dover (New York, 1958), pag. 312 e pag. 321. Si tratta di R.P.
Feynman, Space–time approach to nonrelativistic quantum mechanics, Rev. Mod. Physics
20, 267(1948); P.A.M. Dirac, The lagrangian in quantum mechanics, Phys. Zeits. Sovje-
tunion 3, 1 (1933). Vedi anche P.A.M. Dirac, Rev. Mod. Phys. 17, 195 (1945), e anche
il libro R.P.Feynman, A.R. Hibbs, Quantum mechanics and path integrals, Mc Graw–Hill
(New York, 1965).
5
Si veda U. Bottazzini, La meccanica razionale, in P. Rossi Storia della scienza, Unione
Tipografica Editrice Torinese (Torino 1988) e Gruppo Editoriale L’espresso (2006), Vol.
II.; R. Dugas, Histoire del la Mécanique, Éditions du Griffon (Neuchatel, 1950), Trad.
inglese Dover (New York).
6
Fece scalpore lo scritto di Voltaire dal titolo La diatribe du Dr. Akakia médecin du
Pape.
Meccanica Razionale 1: I principi variazionali 169
Figura 3.1: La retta passante per due punti come curva di lunghezza minima
B
C
B B
A A
C r C r
B’
incidono sulla retta r, ma non nell’insieme più ampio UAB di tutte le curve
che congiungono A e B; infatti il minimo “assoluto” (cioè in UAB ) è rag-
giunto dal segmento che unisce A e B direttamente senza toccare la retta
r. Ovviamente, questa è una situazione analoga a quella che si ha per una
funzione F : U → R (dove U è un insieme arbitrario) quando la funzione F
presenta più di un minimo, e si hanno dei minimi locali ed eventualmente
Meccanica Razionale 1: I principi variazionali 173
IR
F :U →R,
θ1
v1
r
v2
θ2
B
cosa vuol dire che un numero reale è maggiore di un altro), possiamo con-
frontare i valori di F al variare dell’elemento in U, e stabilire l’eventuale
esistenza di minimi locali.
nonlineari. Questo in effetti è proprio l’analogo del procedimento che si tiene nel familiare
calcolo differenziale in Rn , quando si definisce il differenziale (un funzionale lineare!) come
approssimante lineare di una funzione in generale nonlineare. Facciamo osservare tuttavia
che il funzionale F di cui qui discutiamo è assolutamente generico, e non si richiede affatto
che sia lineare.
14
O legge del bagnino: un bagnino in A sulla spiaggia (regione 1 in cui può correre
con velocità v1 ) vuole salvare una bagnante in B nel mare (regione 2, dove può nuotare
con velocità v2 < v1 ). La curva di lunghezza minima è il segmento AB, ma la curva con
il tempo minimo di percorrenza (la più conveniente) è la spezzata soddisfacente la legge
della rifrazione. In questo esempio, come sottolineato anche da Feynman nel suo manuale,
l’aspetto finalistico dei principi variazionali è particolarmente evidente.
Meccanica Razionale 1: I principi variazionali 175
Descartes)15 (figura (3.5)): sono dati due mezzi omogenei 1,2, separati dalla
retta r, nei quali la luce si propaga rispettivamente con velocità v1 , v2 , e ci si
domanda quale è la curva che congiunge A e B, per la quale il tempo di per-
correnza sia minimo; risulta che tale curva è la spezzata ACB soddisfacente
la legge della rifrazione, cioè tale che
sin θ1 v1
= . (3.2.1)
sin θ2 v2
l1 l2
+ ,
v1 v2
l1 l2
F (x) = +
v1 v2
√ p (3.2.2)
a 2 + x2 b2 + (l − x)2
= + ,
v1 v2
1 x 1 l−x
F 0 (x) = − ,
v1 l1 v2 l2
ovvero
sin θ1 sin θ2
F 0 (x) = − , (3.2.3)
v1 v2
sicché si conclude che la legge di rifrazione (3.2.1) è equivalente al principio di
stazionarietà (o estremalità o criticità) F 0 (x) = 0; ovvero, il raggio soddisfacente la
legge della rifrazione è quello per cui il tempo di percorrenza è stazionario.
θ1
a
l1
l−x
O x l2
b
θ2 B
c
n(x) = ,
v(x)
É evidente che il funzionale T (γ) è, per curve generiche, l’analogo del tempo
di percorrenza F (x) definito dalla (3.2.2) nel caso di curve spezzate ACB
individuate dalla sola ascissa x del punto C sulla linea di separazione tra
i due mezzi. È spontaneo pertanto generalizzare le note leggi dell’ottica
geometrica (cammino rettilineo nei mezzi omogenei illimitati, legge della
riflessione, legge della rifrazione) compendiandole nel
Principio di Fermat: In un mezzo individuato otticamente da un in-
dice di rifrazione n = n(x), il raggio luminoso γ tra due punti A e B che
si realizza in natura è caratterizzato, fra tutte le curve γ congiungenti tali
punti, come la curva per cui è minimo (più precisamente, stazionario, o es-
tremale o critico) il tempo di percorrenza, o equivalentemente è minimo il
funzionale Z
F (γ) = n(x)dl , (3.2.5)
γ
(detto cammino ottico).
Evidentemente la precisazione di questo principio richiede che si definisca
cosa si intende per punto stazionario (o critico) nel caso di funzionali aventi
per dominio un insieme U di funzioni (cioè, come si dice, un sottoinsieme
di uno spazio funzionale) anziché un sottoinsieme di Rn . Si deve dunque
procedere a dare un cenno al calcolo differenziale in spazi di dimensione
infinita, cosa che faremo nella maniera più semplice possibile nel prossimo
paragrafo. Vedremo che, come nel caso dei funzionali (funzioni a valori reali)
F definiti in Rn i punti di stazionarietà sono caratterizzati dalla proprietà
dF = 0, cosı̀ anche per i funzionali F aventi dominio in uno spazio di
funzioni i punti di stazionarietà sono caratterizzati dalla proprietà δF = 0,
dove δF è l’analogo del differenziale in Rn . Dunque il principio di Fermat
viene compendiato nella formula
Z
δ n(x) dl = 0 . (3.2.6)
γ
dove la notazione cc indica che sono assegnate delle ben definite condizioni
al contorno (boundary conditions) ai tempi estremi t0 , t1 . Un esempio tipi-
co (figura (3.7) é quello di valori fissati agli estremi, ovvero le 2n condizioni
q(t0 ) = q(0) , q(t1 ) = q(1) , ma le 2n condizioni piú generali appariranno
piú sotto in maniera naturale. Un esempio significativo in una situazione
che riguarda le traiettorie (in cui la cosiddetta legge oraria – legge di per-
correnza temporale delle traiettorie – è irrilevante) è quello di determinare
la traiettotria più breve che congiunge un punto fissato da una retta. In
tal caso è fissato il punto iniziale, ma del punto finale si sa solo che giace
su una retta assegnata. Allora già sappimao che la traiettoria deve essere
una retta passante per il punto assegnato, e vedremo che la seconnda con-
dizione (il secondo punto deve giacere su una assegnata retta) si traduce
nella condizione che nel punto di arrivo il segmento uscente dal primo punto
deve cadere in maniera ortogonale alla assegnata retta (sicché il segmento
uscente dal primo punto deve essere ortogonale alla assegnata retta).
Si definisce poi il funzionale azione hamiltoniana S : U → R nel modo
seguente:
Z t1
S= L(q(t), q̇(t), t)dt , (3.2.11)
t0
e si formula il
Principio di Hamilton: Per un sistema lagrangiano con lagrangiana L(q, q̇, t),
i moti naturali sono i punti–funzione stazionari (o estremali, o critici) del-
l’azione hamiltoniana S, ovvero sono i movimenti q = q(t) per cui
Z
δ Ldt = 0 . (3.2.12)
q1
q0
t0 t1
0 π t
1 2
L(x, ẋ, t) = ẋ , (con m = 1) .
2
Consideriamo ora i moti x = x(t) nell’intervallo temporale [t0 , t1 ] = [0, 1] con certe
condizioni al contorno, ad esempio x(0) = 0, x(1) = 1. In questo dominio di
funzioni x = x(t), diciamolo U, esiste anzitutto il moto x(t) = t, che è la soluzione
dell’equazione di Newton ẍ = 0 per la particella libera. Ma ne esistono infiniti altri,
n
come ad esempio R x(t) = t per n = 2 oppure per n = 3, 4, · · · . In connessione con il
funzionale S = Ldt avente dominio in U, fissare uno di questi moti è l’equivalente
di fissare il valore della variabile indipendente x quando si considera il funzionale
(con dominio in R) y(x) = sin x. Fissiamo dunque un “punto”, un elemento di U, ad
esempio la funzione x(t) = t2 . Poiché il funzionale azione hamiltoniana S : U → R
R1
è definito da S = Ldt = (1/2) 0 ẋ2 dt, allora avremo in questo caso (essendo
R
ẋ(t) = 2t)
1 1 2
Z
2
S[x(t) = t2 ] = 4t dt =
2 0 3
(leggi: il valore di S corrispondente al punto–funzione [x(t) = t2 ] è 2/3). Allo stesso
modo si calcola
1 n2
S[x(t) = tn ] = ,
2 2n − 1
e in particolare S[x(t) = t] = 1/2. Si verifica facilmente che tra tutti i punti–
funzione del tipo x(t) = tn , n = 1, 2, · · · , la funzione x(t) = t, che è proprio la
soluzione dell’equazione di Newton ẍ = 0 per la particella libera, è anche quella in
cui il funzionale S assume il valore minimo. Risulta in effetti che tale funzione è
quella per cui S assume il valore minimo rispetto a qualunque elemento (funzione
rappresentante un movimento) del dominio U.
funzioni, e a tal fine cominciamo col richiamare nozioni note per funzioni di
una o più variabili.
Cominciamo con il caso di funzioni di una sola variabile reale F = F (x). Ricor-
diamo anzitutto come in tal caso l’esistenza del differenziale risulta essere equiv-
alente all’esistenza della derivata definita nel modo familiare, come limite di un
rapporto incrementale. Infatti si dice che (per un fissato x) esiste la derivata di F
se esiste il limite
F (x + h) − F (x)
a = lim .
h→0 h
In tal caso il numero a = a(x) viene detto derivata prima di F nel punto x e viene
denotato con F 0 (x):
a(x) ≡ F 0 (x) .
D’altra parte è evidente che l’esistenza di tale limite è equivalente al fatto che esista
un numero a = a(x) tale che si abbia
F (x + h) = F (x) + ah + R (3.3.1)
(in tal caso si scrive anche R = O(h2 ).) Allora la parte principale (cioè la parte lin-
eare rispetto all’incremento h)22 dell’incremento di F viene chiamata “differenziale
di F ” e denotata con dF :
dF = F 0 (x) h . (3.3.2)
Si noti che, prendendo come caso particolare la funzione F (x) = x si trova proprio
dx = h, e per questo motivo, coerentemente, la (3.3.2) si scrive anche
dF = F 0 (x) dx . (3.3.3)
∂L t1
Z t1
∂L d ∂L
S[(q+h)(t)]−S[q(t)] = − ·h(t) dt+ · h +R (3.3.8)
t0 ∂q dt ∂ q̇ ∂ q̇ t0
dove, per ogni punto x fissato, A = A(x) agisce lineamente su h, ovvero è un certo
funzionale lineare da Rn in R, mentre il resto R è di ordine superiore al primo
nell’incremento h, allora il differenziale dF di F viene definito come la parte lineare
(nello spostamento h) dell’incremento di F , ovveroPdF := A · h, e si scrive anche,
∂F
coerentemente,27 dF = A · dx. Si trova poi dF = i ∂x i
dxi , sicché il funzionale
lineare dF viene espresso in termini delle derivate parziali del funzionale F .
allora si ha
|R| < C2
con una costante C > 0. Nel nostro caso, questa proprietà del resto R segue dal fatto che:
i) per ogni t, il resto R (che figura nello sviluppo di Taylor della lagrangiana) è quadratico
in khk, kḣk, ii) la funzione h = h(t) è stata assunta liscia (sicché le sue derivate seconde
hanno modulo limitato in un compatto), e iii) t varia in un dominio compatto.
27
Cioè si ha h = dx. Infatti, prendiamo come funzionale F proprio la i–esima compo-
nente del vettore x, ovvero F (x) ≡ F (x1 , · · · , xn ) = xi . Allora si ha F (x + h) − F (x) =
(xi + hi ) − xi = hi , ovvero dF ≡ dxi = hi .
Meccanica Razionale 1: I principi variazionali 187
d ∂L ∂L
− =0; (3.3.12)
dt ∂ q̇ ∂q
Non può accadere infatti che i due termini abbiano un valore eguale ed opposto
in modo che la loro somma si annulli. Ammettiamo infatti per assurdo che per
t
un certo δq(t) sia p(t) · δq(t)|t10 6= 0. Allora deve essere pure differente da zero
l’integrale (per poterlo bilanciare), e di conseguenza non deve essere identicamente
nullo l’integrando. Ma ora possiamo scegliere una nuova funzione δq0 (t) che ha i
medesimi valori al bordo (cioè in t0 ed in t1 ) di δq(t) ma differisca in un sottoinsieme
interno all’intervallo. Dunque il valore dell’integrale cambia, mentre il termine di
bordo no, e dunque la variazione di S non è nulla per quella scelta di δq0 (t), che è
l’assurdo cercato.
Ora, dal fatto che deve essere
Z t1
∂L d ∂L
− · δq(t) dt = 0 per ogni δq(t) (3.3.15)
t0 ∂q dt ∂ q̇
∂L d ∂L
− =0 per i = 1, . . . , n . (3.3.16)
∂qi dt ∂ q̇i
Meccanica Razionale 1: I principi variazionali 189
Questo si mostra in due passi. Il primo passo utilizza l’arbitrarietà di δq(t) per
dimostrare che allora deve annullarsi la analoga espressione per ogni i = 1, · · · , n,
ovvero deve essere
Z t1
∂L d ∂L
− δqi (t) dt = 0 , i = 1, · · · , n . (3.3.17)
t0 ∂qi dt ∂ q˙i
sicché si resta con il solo primo termine della somma, e cosı̀ via. Il secondo passo,
fa uso poi di quello che talvolta viene chiamato il Lemma fondamentale del calcolo
delle variazioni (la dimostrazione è riportata qui sotto), che si applica al nostro
caso, e quindi il teorema è dimostrato. Q.E.D.
f (t) = 0 ∀ t.
Si noti che, come in tutte queste note, sottintendiamo che tutte le funzioni
considerate sono lisce, e quindi continue.
n
Osservazione. Si osservi la seguente analogia P con il caso di vettori in R : Se un
vettore x ha la proprietà x · y = 0 (ovvero i xi yi = 0) per ogni vettore y ∈ Rn
(cioè x è ortogonale a tutti i vettori dello spazio considerato), allora si ha x = 0.
La dimostrazione di questo fatto è banale e consiste nel prendere proprio y = x,
perché allora deve valere x · x = 0, ovvero x ha lunghezza nulla, e d’altra parte in
Rn l’unico vettore di lunghezza nulla è il vettore nullo.
Nel nostro caso la situazione è diversa, non soltanto perché ora siamo
in uno spazio di dimensione infinita anziché in Rn , ma soprattutto perché,
mentre di x sappiamo che è ortogonale a tutti gli y, ora invece della nostra
assegnata funzione f (analoga del vettore x) sappiamo soltanto che è ortog-
onale a un sottoinsieme di tutte le funzioni (cioè solo alle g con le assegnate
condizioni al contorno e non anche a tutte le funzioni g). In altri termini,
per concludere che f è nulla basta sapere che essa è ortogonale alle funzioni
g che soddisfano le assegnate condizioni agli estremi.30
30
Questo non è affatto ovvio. Ad esempio, nel caso di R3 con base i, j, k, se sappiamo
un vettore x ha la proprietà che x · y = 0 per tutti i vettori y nel piano individuato dai
vettori base i, j, possiamo solo concludere che x è proporzionale al vettore k, e non che è
nullo.
190 Andrea Carati e Luigi Galgani
Qui denotiamo con v(t) = ẋ(t) la velocità del movimento considerato x = x(t)
e con v := kvk è il modulo (euclideo) del vettore v. Se x = (x, y), dove x e y
sono coordinate cartesiane ortogonali, allora si ha v 2 = ẋ2 + ẏ 2 . La definizione
(3.3.20) è del tutto spontanea, perchè è per tutti ovvio che nel caso di moto retti-
lineo uniforme la lunghezza percorsa sia il prodotto della velocità (costante) per il
tempo impiegato a percorrere la traiettoria. Quindi, assegnato un certo movimento
generico, è spontaneo approssimarlo con una successione di moti rettilinei uniformi
a tratti, definendo la lunghezza dell’approssimante come somma delle lunghezze
dei vari tratti rettilinei uniformi, e passare poi al limite come nel caso delle somme
di Riemann approssimanti un integrale. In conclusione, per una curva γ descrit-
ta parametricamente nella forma x = x(t), y = y(t), dove x e y sono coordinate
cartesiane ortogonali nel piano, e t sta nell’intervallo t0 ≤ t ≤ t1 , la lunghezza della
curva è definita da Z t1 p
l(γ) = ẋ2 + ẏ 2 dt . (3.3.21)
t0
dl p 2
= ẋ + ẏ 2 , (3.3.22)
dt
ovvero
dl
= v(t) (3.3.23)
dt
(che doveva essere ovvia a priori). Ma allora, poiché l è una funzione cres-
cente di t, è chiaro che per la rappresentazione parametrica dell’assegnata
curva γ si può scegliere proprio la lunghezza l stessa: si dice che in tal caso si
compie la scelta del parametro naturale. In vista della relazione (3.3.23) si
ha dunque che, quando viene parametrizzata con il parametro naturale (cioè
la lunghezza calcolata lungo la curva), la curva viene percorsa con velocità
34
Si noti che l è funzione di t, l = l(t), solo se è assegnata una curva γ. Dunque l non
è una funzione del posto. Non stiamo parlando del differenziale di una funzione F (x),
F : R3 → R.
194 Andrea Carati e Luigi Galgani
o equivalentemente p
dl = (dx)2 + (dy)2 .
Questa scrittura (e la sua analoga in relatività e in relatività generale) viene usata
ancor oggi da tutti, addirittura nella forma più sintetica
Questa è la forma cui faremo riferimento nel capitolo sulla relatività. Naturalmente,
si deve stare attenti a non fare confusione, credendo ad esempio di stare parlando
del differenziale di l2 , o di x2 o di y 2 !
Per quanto riguarda l’uso di scrivere ad esempio dx2 invece di (dx)2 , osserviamo
che non si tratta affatto di una novità, ma di un fatto del tutto tradizionale, cui
siamo abituati fin da quando abbiamo appreso le prime nozioni di calcolo differen-
ziale. Infatti, per la derivata seconda di f (x) rispetto ad x, oltre alla notazione
d df d2 f
f 00 (x), usiamo anche la notazione dx dx , che abbreviamo con dx2 invece che con la
2
d f
notazione (dx) 2 , che sarebbe quella immediatamente suggerita dalla scrittura del
y0
p =c (3.3.26)
1 + y 02
ovvero (si quadri, e si raccolga y 02 ) y 0 = costante (o equivalentemente y 00 =
0). La curva che è un punto di stazionarietà della lunghezza ha dunque pen-
denza costante (o curvatura nulla), cioè è una retta. Per stabilire la propri-
età di minimo, occorrerebbe passare a valutare, per i funzionali con domini
infinito–dimensionali, l’analogo della derivata seconda, Per una discussione
rimandiamo ai manuali sul calcolo delle variazioni.35
Nell’esempio appena discusso delle curve di lunghezza minima, si osserva
che la “lagrangiana non dipende dalla variabile indipendente” x (analogo del
tempo). e si ha pertanto l’analogo della legge di conservazione dell’energia.
Esercizio 1. Si mostri che anche usando l’analogo del teorema dell’energia
si perviene alla equazione y 0 = costante.
q2(0) q+ δ q2 q2(1)
2
q2
q+
1
δ q1
q1 q1(1)
q1(0)
q1 (t∗ ) = q2 (t∗ )
(q1 + δq1 )(t∗ + δt) = (q2 + δq2 )(t∗ + δt) ;
che esprimono le condizioni di urto, e che permettono di trovare una relazione tra
δt e δqi . Infatti, almeno formalmente, se si sviluppa in serie di Taylor qi nella
seconda riga, ed si usa la prima si trova, a meno di termini del secondo ordine, le
le sequenti relazioni
q̇1 δt + δq1 = q̇2 δt + δq2
t∗ ∗
t (3.3.27)
q̇1 δt + δq1 ∗ = q̇2 δt + δq2 ∗ ,
t +δt t +δt
in cui δL indica la differenza tra la lagrangiana calcolata sul movimento variato e sul
movimento scelto qi . Per semplicità abbiamo qui supposto che δt sia positivo. Nel
primo e nel terzo integrale le funzioni sono regolari, per cui si puó procedere come
fatto nei paragrafi precedenti ottenendo, a meno di un resto di ordine superiore,
Z t∗ Z t∗
∂L d ∂L X
δLdt = − δqi dt + pi δqi t∗
t0 t0 ∂qi dt ∂ q̇i i
Z t1 Z t1
∂L d ∂L X
δLdt = − δqi dt − pi δqi t∗ +δt .
t∗ +δt t∗ +δt ∂qi dt ∂ q̇i i
che mostra come l’azione sia differenziabile anche nel dominio esteso. Ora, quando
vado a cercare i punti stazionari dell’azione, dovrò imporre che siano nulli sepa-
ratamente l’integrale ed il contributo di bordo: l’annullarsi dell’integrale mi impone
come prima che i movimenti devono essere soluzioni delle equazioni di Lagrange a
tutti i tempi tranne che per t = t∗ (ricordiamo che δt può essere reso arbitrari-
amente piccolo); l’annullarsi della parte di bordo dà le leggi dell’urto come ora
vedremo subito.
Infatti riscriviamo il termine di bordo al modo seguente
!
X t∗ +δt X X t∗ +δt
pi δqi + Lδt ∗
t
= pi (q̇i δt + δqi ) − ( pi q̇i − L)δt ∗
t
i i i
P
dove a secondo membro si è aggiunto e tolto il termine i pi q̇i δt. Ricordando ora
le relazioni (3.3.27) abbiamo infine
!
X t∗ +δt X t∗ +δt X t∗ +δt
pi δqi + Lδt ∗
t
=( pi ) ∗ (q̇1 δt + δq1 ) − (
t
pi q̇i − L) ∗ δt .
t
i i
Meccanica Razionale 1: I principi variazionali 199
p · q̇ = 2T .
perché allora si ha
S = A − E · (t1 − t0 ) ,
e sembrerebbe che gli estremali di S coincidano con quelli di A. Questo è
vero, se si aggiunge qualche precisazione, come ora mostriamo. Si noti che
l’azione ridotta A, come integrale di una forma differenziale nello spazio delle
configurazioni, non dipende dalla parametrizzione q(t) del nostro moto, ma
solo dalla corrispondente della traiettoria γ. Mostreremo tuttavia che esiste
un procedimento generale (che fa uso della conservazione dell’energia) per
assegnare a ogni traiettoria un unico ben definito movimento, sicché potremo
fare sempre riferimento a movimenti.
Per semplicità di notazione consideriamo il caso di una sola particella
nello spazio. La trattazione del caso generale si otterrà poi banalmente per
analogia. Nel caso di un punto nello spazio, il fatto significativo da met-
tere in luce è che il movimento q(t) nel dominio UE è individuato comple-
tamente dalla corrispondente traiettoria (orientata) γ (leggi gamma) nello
spazio delle configurazioni C = R3 . Infatti, in ogni punto q della traiettoria
γ, il corrispondente vettore velocità q̇, dovendo essere tangente a γ, è indi-
viduato in direzione e verso, e resta indeterminata soltanto la sua lunghezza
(o modulo) v ≡ ||q̇||. Ma questa è determinata dall’assegnato valore E
dell’energia, perché si ha
1
mv 2 + V (q) = E ,
2
e dunque
2√
r r
2p
v= T = E − V (q) .
m m
Meccanica Razionale 1: I principi variazionali 201
t1 = t1 (γ) .
dove
Z t1 Z t1 Z
∂L
A(γ, E) = 2T dt = p · q̇ dt = p · dq , p= . (3.3.28)
t0 t0 γ ∂ q̇
da cui segue
δA = δS + Eδt1 .
dove
L̃ x, ẋ, t = p · q̇ − H(p, q, t) .
Si ha il
Teorema 5 Si denoti x ≡ (q, p) ∈ R2n . Sia assegnata una funzione H =
H(x, t) = H(q, p, t) (hamiltoniana), e si consideri il funzionale (azione
hamiltoniana generalizzata) S̃, definito da
Z t1
S̃[x(t)] = L̃ x(t), ẋ(t), t dt , (3.4.2)
t0
dove
L̃ x, ẋ, t = p · q̇ − H(q, p, t) . (3.4.3)
Allora le corrispondenti equazioni di Eulero–Lagrange sono proprio le equazioni
di Hamilton
∂H ∂H
q̇ = , ṗ = − . (3.4.4)
∂p ∂q
∂ L̃ d ∂ L̃
− =0, con x = (q, p) .
∂x dt ∂ ẋ
Meccanica Razionale 1: I principi variazionali 205
∂ L̃ d ∂ L̃ ∂ L̃ d ∂ L̃
− =0, − =0.
∂q dt ∂ q̇ ∂p dt ∂ ṗ
Infine, tenendo presente la forma (3.4.3) di L̃, tali equazioni risultano essere
∂H d ∂H
− − p=0, q̇ − =0,
∂q dt ∂p
∂H ∂H
q̇ = , ṗ = − , (3.5.1)
∂p ∂q
p · dq − H dt . (3.5.5)
Questa è una forma differenziale di primo ordine (o. come si usa dire, una
1–forma differenziale), allo stesso modo in cui, in R3 , è una 1–forma dif-
ferenziale il lavoro (anzi il lavoro “infinitesimo o elementare”) F · dx ≡
F1 dx + F2 dy + F3 dz dove Fi = Fi (x), i = 1, 2, 3, sono le componenti carte-
siane di un assegnato campo di forze. Nel nostro caso, abbiamo a che fare
con una 1–forma in uno spazio che viene chiamato spazio nello spazio delle
fasi “esteso”, di dimensione 2n + 1, nel quale anche il tempo figura come
coordinata, e dunque le coordinate sono q, p, t.
Intermezzo: Lo spazio delle fasi esteso: analogia con lo spaziotempo.
L’energia come momento associato al tempo. Nella teoria della relatività
(sia in quella speciale, sia in quella generale) svolge un ruolo essenziale la nozione
di spaziotempo. In relatività speciale si tratta semplicemente dello spazio quadridi-
mensionale con coordinate (t, x) dove x = (x, y, z) sono le consuete coordinate
cartesiane ortogonali nello spazio ordinario. Un movimento x = x(t) (legge che ad
ogni tempo t associa una posizione x(t)) appare allora nello spaziotempo come un
ente geometrico, un particolare sottoinsieme dello spaziotempo che è monodimen-
sionale, cioè, come si dice, una curva.40 Come fa osservare ripetutamente Einstein
stesso, per quanto riguarda questo fatto la relatività non aggiunge nulla di nuovo (la
novità consisterà invece nel fatto che nello spaziotempo essa introduce un prodotto
40
Si veda il bellissimo slogan di Einstein riportato nel capitolo di relatività, secondo cui
il divenire nello spazio si manifesta come un essere nello spaziotempo: vengono riconciliati
Talete ed Eraclito.
Meccanica Razionale 1: I principi variazionali 207
scalare – o, come si dice, una metrica – come traduzione geometrica del principio
di costanza della velocità della luce).
Qui, passando dallo spazio delle fasi F allo spazio delle fasi esteso F̃ = F × R,
stiamo facendo una cosa del tutto analoga. Un movimento nello spazio delle fasi
è una funzione x = x(t) che ad ogni tempo (numero reale) t associa un punto
x = x(t) dello spazio delle fasi (naturalmente, le coordinate sono ora x = (q, p)).
e un movimento appare come un ente geometrico in F̃, che è un sottoinsieme
monodimensionale, cioè una curva.
La considerazione dello spazio delle fasi esteso F̃ con coordinate (q, p, t) e della
corrispondente 1–forma di Poincaré–Cartan ω = pdq−Hdt induce spontaneamente
ad una ulteriore interessantissima osservazione. Come nello spazio delle fasi F
il momento p è associato a q, allo stesso modo nello spazio delle fasi esteso F̃
l’hamiltoniana H (o piuttosto −H) appare com il momento associato al tempo.
Questo fatto può essere messo in luce in una maniera ancora più stringente, che
non abbiamo qui il tempo di illustrare.
Si noti bene che una generica 1–forma nello spazio delle fasi esteso si
esprime come
ω := p · dq − Hdt .
È evidente che la nostra 1–forma prenderà nelle nuove variabili un altro as-
petto, che si otterrà semplicemente per sostituzione di variabili, esprimendo
208 Andrea Carati e Luigi Galgani
p · dq − H dt = P · dQ − K dt + dF (3.5.10)
attraverso Z t1
dF = F (x(1) ) − F (x(0) ) ,
t0
F = F (q, p, t) ,
p · dq − P · dQ − (H − K) dt = dF , (3.5.11)
∂F ∂F ∂F
p= , P=− , K=H+ . (3.5.12)
∂q ∂Q ∂t
d ∂K d ∂K
Q= , P=− .
dT ∂P dT ∂Q
∂L ∂L
p0 = (q0 , q̇0 , t0 ) , p1 = (q1 , q̇1 , t1 ) , (3.6.1)
∂ q̇ ∂ q̇
43
Ricordiamo che ΦtH denota la trasformazione che invia ogni punto (q0 , p0 ) dello spazio
delle fasi nel suo evoluto (q(t), p(t) lungo la corrispondente soluzione, al tempo t, delle
equazioni di Hamilton con hamiltoniana H e dati iniziali q0 , p0 .
Meccanica Razionale 1: I principi variazionali 211
Denotiamo con
S ∗ (q0 , t0 , q1 , t1 )
−S(q0 , t0 , q1 , t1 )
∂(−S) ∂(−S)
p0 = , p1 = − . (3.6.3)
∂q0 ∂q1
∂(−S) ∂(−S)
p0 = , p1 = − .
∂q0 ∂q1
dS = Ldt1 .
dS ∂S ∂S ∂S
= + · q̇ = + p · q̇ ,
dt ∂t ∂q ∂t
∂S
= L − p · q̇ = −H .
∂t
Q.E.D.
ΦtH0 ,t1 : F → F ,
lagrangiana L come
Z l Z l
E= dx , L = L dx (3.7.1)
0 0
dove
1 1
= ρ(u2t + c2 u2x ) , L = ρ(u2t − c2 u2x ) . (3.7.2)
2 2
Per analogia con la meccanica dei punti è spontaneo definire l’azione
hamiltoniana S mediante un’ulteriore integrazione temporale su L, ovvero
Z Z Z
S= Ldt = L dxdt . (3.7.3)
D = {(x, t); 0 ≤ x ≤ l, t0 ≤ t ≤ t1 } ,
∂L ∂L ∂L
− ∂x − ∂t =0. (3.7.5)
∂u ∂ux ∂ut
u = u(x, t), perché solo allora si può eseguire la richiesta integrazione spaziale, e si resta
con una funzione del solo tempo t.
216 Andrea Carati e Luigi Galgani
219
220 Andrea Carati e Luigi Galgani
Si ha il seguente
∂
aµν = ∂µ aν − ∂ν aµ , µ, ν = 0, 1, . . . , m (∂µ ≡ ). (A.1.3)
∂xµ
Allora gli estremali per l’azione S definita da (A.1.2) sono le soluzioni del
sistema di equazioni differenziali (analoghe delle equazioni di Hamilton)46
X
aik ẋk + ai0 = 0 , i = 1, . . . , m . (A.1.4)
k
R
S = p · dq − Hdt ha per estremali le soluzioni delle equazioni di Hamilton.
Basta osservare che si ha ora S = L̃dt, dove47
R
X
L̃ = ak ẋk + a0 ,
k
Infine, la (A.1.6) è una espressione del fatto che una relazione del tipo αdx+βdt = 0
è equivalente alla relazione αẋ + β = 0. Q.E.D.
d ∂ L̃ ∂ ∂
− ∂i L̃ = 0 (∂i ≡ , ∂t ≡ ∂0 ≡ ).
dt ∂ ẋi ∂xi ∂t
D’altra parte si ha
X ∂ L̃
∂i L̃ = (∂i ak )ẋk + ∂i a0 , = ai ,
∂ ẋi
k
Risulta allora che in tali coordinate la matrice dei coefficienti aµν è data,
per la parte non temporale, da
aik = Eik , (A.1.7)
dove E è la matrice simplettica introdotta nel capitolo sulle equazioni di
Hamilton. Invece, gli altri coefficienti non nulli sono dati da
∂H
ak0 = ,
∂xk
e, corrispondentemente, le equazioni associate sono le equazioni di Hamilton.
con opportune nuove componenti a0i , e ci chiediamo come esse sono connesse
alle componenti originali ai .
Un analogo problema si pone per le componenti dei vettori. Ricordiamo
che un vettore è definito, in una maniera tra le più profonde, attraverso la
velocità di un movimento. Sia dunque un movimento xi = xi (t) e
dxi
v i (t) = ẋi =
dt
la corrispondente velocità. Si ha il
X ∂x0 i
v0 i = vk . (A.1.11)
∂xk
k
∂xk
= δlk .
∂xl
∂
a0ik = ∂i0 a0k − ∂k0 a0i (∂i0 ≡ ).
∂x0 i
Allora si ha
X ∂xl ∂xm
a0ik = alm
∂x0 i ∂x0 k
lm
Questa proprietà spiega il fatto che la matrice aik viene detta “co-
variante”: gli elementi della matrice si trasformano come il prodotto ai ak
Meccanica Razionale 1: I principi variazionali 225
Si parte dalla osservazione fatta nel testo che l’assegnazione delle coppie
(q0 , t0 ) e (q1 , t1 ) determina un unico movimento q = q(t) e quindi anche
p = p(t). Pertanto resta determinato il movimento x = x(t) ≡ (q(t), p(t))
nello spazio delle fasi F, e anche la corrispondente traiettoria nello spazio
delle fasi esteso F̃, che denoteremo con γ. Siano A0 = (q0 , p0 , t0 ) e A1 =
49
NOTA PER GLI AUTORI. Da aggiungere quanto segue. Forme bilineari. Rego-
la mnemonica per il i cambiamenti. Dare la forma standard aik = Eik per i sistemi
hamiltoniani, e la corrispondente forma orlata.
226 Andrea Carati e Luigi Galgani
(q0 ,p+
0
δp0 ,t 0 )
∆ 0 (q0 ,p0 ,t0 )
p
Figura A.10: Il circuito nello spazio delle fasi estese per il calcolo del
differenziale dell’azione.
(q1 , p1 , t1 ) i corrispondenti punti iniziale e finale nello spazio delle fasi esteso
F̃. Poiché lungo le soluzioni si ha
L dt = p · dq − Hdt ,
si ha anche
Z t1 Z
S(q0 , t0 , q1 , t1 ) = L dt = p · dq − H dt .
t0 γ
dS = p1 · dq1 − H1 dt1 ,
cioè la tesi, per quanto riguarda la variazione della coppia finale (q1 , t1 ). Per
quanto riguarda la variazione della coppia iniziale, la dimostrazione procede
in maniera del tutto analoga, scegliendo adeguatamente i cammini.
Dunque la dimostrazione di tipo geometrico appena data riposa sul fat-
to che la circuitazione della forma di Poincaré–Cartan p · dq − Hdt sul
circuito Γ scelto risulta nulla. Notiamo che invece la circuitazione lungo un
circuito generico nello spazio delle fasi esteso non è nulla, perché la forma
di Poincaré–Cartan non ammette potenziale (non è il differenziale di nes-
suna funzione). Questa è la differenza che sussiste tra il caso che qui stiamo
trattando e il caso ad esempio delle forze conservative.
50
Nello spazio delle fasi esteso, le analoghe delle equazioni di Hamilton sono le equazioni
∂H ∂H
q̇ = , ṗ = − , ṫ = 1 .
∂p ∂q
228 Andrea Carati e Luigi Galgani
3
RRicordiamo che un campo di forze F(x)in R si dice conservativo se il lavoro
Γ
F(x) · dx lungo un qualunque circuito (cammino chiuso) Γ è nullo. In tal caso
l’energia potenziale V (x) viene definita come il lavoro (cambiato di segno) compiuto
lungo un qualunque cammino che porta da un punto fissato ad x. La relazione
F = −grad V viene poi dimostrata proprio con un procedimento analogo a quello
seguito sopra. La differenza sta nel fatto che, nel caso delle forze conservative,
sono arbitrari i due cammini scelti per andare dal punto iniziale fissato A0 al punto
finale A1 . Nel caso presente, (oltre alla complicazione di dovere considerare due
diversi punti iniziali A0 ed A0 0 ) la differenza sostanziale consiste nel fatto di dovere
considerano cammini non generici, bensı̀ aventi la speciale proprietà di minimizzare
l’azione.
Lemma 5 Nello spazio delle fasi esteso F̃, sia Γ un circuito (curva chiusa)
che è bordo di una superficie bidimensionale avente la speciale proprietà di
essere unione di curve soluzioni delle equazioni di Hamilton. Allora è nulla
la circuitazione lungo Γ della forma di Poincaré–Cartan:
Z
p · dq − H dt = 0 .
Γ
51
Per consistenza con le notazioni tensoriali (che noi useremo ad esempio nel secondo
capitolo di relatività), denoremo qui con xi anziché con xi le componenti dei vettori; le
componenti di una forma, come le quantità Fi , hanno invece, coerentemente indici in
basso.
230 Andrea Carati e Luigi Galgani
dove Fi ≡ Fi x è la i–esima componente di F valutata nel punto x = x(t). Questa
espressione viene anche riscritta nella forma
Z Z t1
ω= ω(v(t)x(t) dt .
γ t0
In altri termini, X
Fi x v i .
ω(v)x = Fx · v =
i
In tal modo si mette in luce che ω dipende dal posto (cioè da x) e poi che essa
viene applicata a un vettore (nel nostro caso, il vettore velocità v)), che è un vet-
tore tangente al cammino γ proprio nel punto x occupato al tempo t. Nella formula
(A.2.2), si ha appunto una scrittura di questo tipo, relativa a una approssimazone
dell’integrale mediante una somma di Riemann, e alla considerazione di un solo
termine della somma di Riemann (relativo a ciascuno dei quattro lati del rettan-
golino considerato). Più precisamente, si deve pensare che la forma ω nel punto x
sia applicata al vettore v∆t. Ma, poiché la forma è lineare, per definizione si ha
ω(v∆t) = ∆t ω(v).
M3
v∆ s
M2
M4
M1
u∆t
bilineare definito sullo spazio tangente, in un certo modo simile alla met-
rica, la quale anche agisce su ogni coppia di vettori, associando ad essa il
corrispondente prodotto scalare. Ma mentre il prodotto scalare è simmetri-
co, abbiamo ora a che fare con un funzionale lineare antisimmetrico, il cui
valore cioè cambia di segno scambiando u con v. Si dice in tal caso che si
è in presenza di una forma bilineare. La forma dω, viene detta derivata
esterna della forma ω o anche rotore di ω.
Per calcolare l’espressione concreta che dω assume in un fissato sistema
di coordinate, procediamo nel Pmodoi seguente: jsiano Fi le componenti della
forma ω, nel senso che ω = Fi dx , e siano u le componenti di u, e v i le
componenti di v. Allora si ha
X X ∂Fi X X ∂Fi
u · ∇ω(v) = ( uj j )v i , v · ∇ω(u) = ( v j j )ui ,
∂x ∂x
i j i j
da cui segue
X X ∂Fi
dω = (uj v i − v j ui ) . (A.2.5)
∂xj
i j
e poi il calcolo del differenziale di una funzione viene eseguito nel modo
consueto, sicché
X ∂Fi
dFi = j
dxj .
j
∂x
Osservazione. I lettori più attenti avranno notato che la (A.2.4) era stata scrit-
ta con i termini scambiati (cioè la circuitazione di ω eguale al flusso del rotore).
Avevamo supposto cioè che dato γ esistesse sempre una superficie Σ di cui questa
fosse il bordo: γ = ∂Σ. Questo non è sempre vero. Un esempio viene fornito (vedi
figura A.13) dai meridiani del toro. Può dunque capitare che il rotore di una forma
sia nulla ma la sua circuitazione no. La forma costante sul toro ω = dϕ + dϑ (ϕ, ϑ
sono le coordinate introdotte nell’esercizio 3 del capitolo 1), ha ovviamente rotore
nullo, ma sua la circuitazione lungo una curva chiusa γ vale 2(m + n)π, dove m è il
numero di giri lungo i meridiani ed n è il numero di giri lungo i paralleli compiuti nel
percorrere γ. La formulazione da noi data del teorema di Stokes, sebbene corretta,
nasconde un po’ questa interessantissima problematica di topologia delle varietà.
Il lettore interessato è rimandato al testo Dubrovin, Novikov, Fomenko, Geometria
contemporanea.
che mostra come il rotore di ω non sia affatto nullo. L’annullarsi della
circuitazione non proviene dunque dall’annullarsi del rotore ma da un’altra
proprietà, che è l’analogo di un noto teorema di Helmholtz dell’idrodinamica.
Per spiegare questa proprietà cominciamo col definire il campo nullo per
il rotore dω come quel campo v = v(x) tale che in ogni punto x vale
dω(v, u)x = 0 per ogni vettore u dello spazio tangente in x. Diciamo anche
che una superficie Σ è una superficie nulla per ω se essa ammette un
campo di vettori tangenti nullo per dω.
L’interesse di queste nozioni sta nel fatto che si ha il
dove si è fatto uso della definizione (A.2.6) per il calcolo del valore delle varie
forme dpi ∧ dq i , dq i ∧ dt, dpi ∧ dt sui vettori X, u. Ne segue l’importantissi-
mo fatto che le superfici interamente solcate da soluzioni delle equazioni di
Hamilton sono superfici nulle. Si capisce dunque come debba effettuarsi la
dimostrazione.
54
Nello spazio delle fasi esteso le equazioni di Hamilton si scrivono
∂H ∂H
q̇ = , ṗ = − , ṫ = 1 .
∂p ∂q
Meccanica Razionale 1: I principi variazionali 237
Dimostrazione. [del Lemma 5.] Per ogni punto P := (q, p, t) sull’arco ∆γ,
consideriamo una curva minimizzante l’azione che abbia punto iniziale (q0 , p0 , t0 )
e punto finale P . Costruirò in questo modo una superficie Σ che ha come bordo il
circuito γ ∪ (−dγ) ∪ (−γ),Red è interamente solcata da soluzioni delle equazioni di
Hamilton. Si ha pertanto R Σ dω = 0, ed applicando il Teorema di Stokes segue che
la circuitazione è nulla, ∂Σ ω = 0. Q.E.D.
238 Andrea Carati e Luigi Galgani