Sei sulla pagina 1di 72

Capitolo 3

I principi variazionali

3.1

Introduzione

Lo scopo centrale di questo capitolo `e di discutere il principio variazionale di Hamilton per i movimenti di un sistema meccanico (Principio di minima azione, o dell’azione stazionaria ), e della sua variante che va sotto il nome

di Principio di Maupertuis–Jacobi, e riguarda solo le corrispondenti traiet-

torie. 1 Risulter`a che il principio di Hamilton `e sostanzialmente un sostituto del familiare principio della meccanica che caratterizza i movimenti “fisici” come quelli soddisfacenti le equazioni di Newton o le equazioni di Lagrange o di Hamilton. Ma, come sempre avviene quando si formula un principio

in

una forma “sostanzialmente equivalente”, accade anche che il nuovo pun-

to

di vista pu`o essere pi`u conveniente a scopi “euristici”, ovvero ai fini di

estendere le vecchie teorie a nuovi campi.

Questo fatto `e descritto in maniera mirabile da Feynman, nella conferenza che egli tenne in occasione del conferimento del premio Nobel, dove egli dice (pag. 177):

“ Theories of the known (cio`e le teorie dei fatti conosciuti) which are described by different physical ideas may be equivalent in all their predictions and are hence scientifically indistinguishable. However, they are not psychologically identical when trying to move from that base into the unknown. For different views suggest different kinds of modifications which might be made and hence are not equivalent in the hypotheses one generates from them in one’s attempt to understand what is not yet understood. 2

1 Ad esempio, per un punto nello spazio un movimento `e definito dalla legge x = x(t), cio`e dalla funzione da R in R 3 che ad ogni tempo t R associa il corrispondente punto x = x(t) in R 3 . La corrispondente traiettoria (o curva) `e invece il sottoinsieme dei punti di R 3 ottenuti in tal modo, ovvero, come anche si dice in matematica, `e l’immagine della funzione definente il movimento. 2 In questa conferenza vi `e (nella penultima pagina) una parte mirabile che dovrebbe essere importante per chi intenda dedicarsi alla ricerca scientifica. Si tratta di quando egli parla del sacrificio richiesto allo studioso che osi dedicarsi a punti di vista che non siano fashionable (alla moda). Feynman comunque aggiunge poi che tale sacrificio potrebbe anche rivelarsi remunerativo.

167

168

Andrea Carati e Luigi Galgani

`

E proprio per questo motivo che la forma del principio di Hamilton `e quel-

la preferita nel determinare i movimenti ad esempio in relativit`a generale 3 e

gi`a anche in relativit`a speciale (metodo delle geodetiche); ne faremo uso noi stessi per determinare la corretta forma della lagrangiana della particella libera relativistica, giustificando in tal modo la celebre relazione E = mc 2 .

Ma l’importanza del principio di Hamilton venne particolarmente esalta-

ta in epoca recente (poco dopo il 1945) dall’uso che ne fece Feynman per

riformulare la dinamica nell’ambito della meccanica quantistica in un mo- do formalmente nuovo rispetto a quello tradizionale introdotto da Heisen- berg, Schr¨odinger e Dirac attorno all’anno 1925. Si tratta del cosiddetto metodo dei “cammini di Feynman” (“Feynman paths”), invero ispirato a un

precedente lavoro di Dirac. 4

Storicamente, 5 i principi variazionali divennero un argomento centrale

di

ricerca nella comunit`a scientifica, con una considerevole attenzione anche

ai

suoi risvolti filosofici, 6 un secolo prima di Hamilton, e se si vuole se ne

potrebbe assegnare un anno ufficiale di nascita, il 1744. Qualche tempo pri- ma, aveva suscitato grandi discussioni la formulazione che Maupertuis aveva dato del principio di Fermat per i raggi dell’ottica geometrica, e la traspo-

sizione che egli ne aveva fatto in ambito puramente meccanico. Tocc`o al grande Eulero di ricondurre il problema entro ambiti puramente matemati- ci. Stimolato dalla discussione che Jean Bernoulli aveva dato del problema della brachistocrona, Eulero aveva formulato il problema di caratterizzare analiticamente le geodetiche, cio`e le curve di lunghezza minima su una assegnata superficie, e aveva risolto questo problema in un fondamentale lavoro del 1744 dal titolo “Methodus inveniendi lineas curvas maximi min-

imive proprietates gaudentes”. Tale lavoro, in effetti, contiene la soluzione

di un problema alquanto pi`u generale che costituisce il cuore del presente

capitolo, ovvero caratterizzare come soluzioni di equazioni differenziali le funzioni che hanno la propriet`a di essere punti stazionari per un assegnato funzionale di tipo integrale (il significato di queste parole verr`a spiegato pi`u avanti).

3 Ma anche nella “teoria dei campi”. 4 Si vedano gli articoli di Dirac e di Feynman riprodotti nel volume J. Schwinger. Quan- tum electrodynamics, Dover (New York, 1958), pag. 312 e pag. 321. Si tratta di R.P. Feynman, Space–time approach to nonrelativistic quantum mechanics, Rev. Mod. Physics 20, 267(1948); P.A.M. Dirac, The lagrangian in quantum mechanics, Phys. Zeits. Sovje- tunion 3, 1 (1933). Vedi anche P.A.M. Dirac, Rev. Mod. Phys. 17, 195 (1945), e anche il libro R.P.Feynman, A.R. Hibbs, Quantum mechanics and path integrals, Mc Graw–Hill (New York, 1965).

5 Si veda U. Bottazzini, La meccanica razionale, in P. Rossi Storia della scienza, Unione Tipografica Editrice Torinese (Torino 1988) e Gruppo Editoriale L’espresso (2006), Vol.

II.; R. Dugas, Histoire del la M´ecanique,

Editions du Griffon (Neuchatel, 1950), Trad.

inglese Dover (New York). 6 Fece scalpore lo scritto di Voltaire dal titolo La diatribe du Dr. Akakia m´edecin du Pape.

´

Meccanica Razionale 1: I principi variazionali

169

Il metodo attualmente usato per discutere i principi variazionali, che verr`a illustrato in questo capitolo, `e sostanzialmente quello introdotto da Lagrange (1736–1813) nel suo primo lavoro, che lo rese celebre. Il contrib- uto di Hamilton fu esposto in tre lavori (del 1833, 1834, 1835) dai titoli:

“On a general method of expressing the paths of light, and of the planets, 7 by the coefficients of a characteristic function”;, “On a general method in dynamics”; “Second essay on a general method in dynamics”. Una trattazione compatta e forte dei principi variazionali rilevanti per

la meccanica si trova nella fondamentale opera di Poincar´e “Les m´ethodes

nouvelles de la mecanique c´eleste”, riprodotta da A. Blanchard (Paris, 1987).

Si veda il capitolo 29, “Diverses formes du principe de moindre action”, in

Tomo III, pag. 249. e anche il capitolo 1 del Tomo I, “G´en´eralit´es et methode de Jacobi”. 8 Si veda anche C. Carath´eodory, “Calculus of variations and partial differential equations of the first order”, Holden–Day (San Francisco, 1965). Si tratta di opere di tipo avanzato, anche se quella di Poincar´e `e abbastanza ben leggibile. Per gli aspetti analitici del calcolo delle variazioni, una bellissima introduzione, molto conveniente dal punto di vista didattico, `e invece quella di A. Kolmogorov, S. Fomin, “Elementi della teoria delle funzioni e di analisi funzionale”. Si veda il Cap. 10: “Elementi di calcolo differenziale in uno spazio vettoriale”. Infine, non possiamo non citare i lavori di Vito Volterra. 9

Molto bella `e anche la trattazione data in appendice al classico libro di M. Born e E. Wolf, “Principles of optics”, Pergamon (Londra, 1959). Inter-

essante `e anche il libro J. Kijowski, V.M. Tulczyjew, A symplectiv framework for field theories, Lecture Notes in Physics n. 107, Springer–Verlag (Nerli- no, 1979). Infine, come per quasi tutti gli argomenti di meccanica, risulta didatticamente molto efficace la trattazione data nel libro qui spesso citato

di Dubrovin, Novikov, Fomenko, Geometria contemporanea, in cui la trat-

tazione dei principi variazionali `e svolta nel Volume I, capitolo 5, con una

estensione al caso della teoria dei campi nel capitolo 6.

3.2 Formulazione del problema

L’idea fondamentale che sta alla base dei principi variazionali consiste nel cercare di caratterizzare un movimento o una traiettoria non attraverso un’e-

7 Si noti bene: luce e pianeti. Questa corrispondenza tra onde e corpuscoli, divenne poi, nelle mani di De Broglie e di Schroedinger, il perno per il passaggio dalla meccanica classica a quella quantistica (con il procedimento di Schroedinger). Si veda ad esempio E. Fermi, Notes on quantum mechanics. 8 Si veda anche H. Poincar´e, Lecons de M´ecanique C´eleste. 9 V. Volterra, Opere matematiche: memorie e note, Accademia Nazionale dei Lincei (Roma, 1954); V. Volterra, J. Peres, Th´orie g´en´erale des fonctionnelles. Gauthier-Villars )Paris, 1936); V. Volterra, J. Peres, Lecons sur les fonctions de lignes. Gauthier-Villars )Paris, 1913).

170

Andrea Carati e Luigi Galgani

A

170 Andrea Carati e Luigi Galgani A B Figura 3.1: La retta passante per due punti

B

Figura 3.1: La retta passante per due punti come curva di lunghezza minima

quazione differenziale, ma mediante una propriet`a di minimo o di massimo rispetto ad una famiglia di movimenti o traiettorie. L’esempio pi`u ovvio, riferendosi al caso delle traiettorie, `e quello delle rette in un piano: da una parte esse sono caratterizzate dall’avere una pendenza costante (ovvero curvatura nulla), e dunque dal soddisfare l’equazione differenziale y = 0 (l’apice denota derivazione rispetto all’argomento) se sono espresse nella forma analitica y = y(x); d’altra parte esse sono caratterizzate dal fatto di essere curve di lunghezza minima. Per precisare quest’ultima propriet`a `e necessario mettere in luce un as- petto caratteristico dei principi variazionali, cio`e il loro carattere in un certo modo finalistico, ovvero globale (in contrapposizione a locale). Infatti per parlare di propriet`a di minimo della lunghezza, si fissano due punti A e B del piano e si considera l’insieme U AB di tutte le curve che “vanno” da A a

B; risulta allora che, tra gli elementi di questo insieme 10 , il segmento AB

In

´e caratterizzato come quello avente lunghezza minima 11 (figura (3.1).

10 Pi`u precisamente, tra gli elementi del sottoinsieme di U AB costituito da curve “rettificabili”, per le quali cio´e `e definita la lunghezza. 11 Sostanzialmente la dimostrazione di questo fatto riposa sulla diseguaglianza triango- lare, per cui in un triangolo la lunghezza di un lato `e minore della somma della lunghezza

degli altri due. In tal modo, per induzione, si pu`o concludere che il segmento rettilineo con- giungente due punti ha lunghezza minima rispetto alle curve congiungenti tali punti, che siano unione di segmenti rettilinei. Se si volesse dedurre da questa propriet`a anche la pro- priet`a di minimo nella classe di tutte le curve congiungenti i due punti si commetterebbe

un

errore logico di “petitio principi”, ed occorrerebbe restringere opportunamente la classe

di

curve considerate. Questo problema `e discusso da Galileo nella seconga giornata dei

Dialoghi sopra i massimi sistemi, e l’argomento sopra ricordato, che vorrebbe dedurre la propriet`a di minimo rispetto a tutte le curve utilizzando la disuguaglianza triangolare, viene messo in bocca a Simplicio. A questo argomento ribatte Salviati, che ricorda come il grande Archimede, che ovviamente non metteva in dubbio la disuguaglianza triangolare (in quanto dedotta dai postulati di Euclide), avessa ritenuto di non poterne fare uso, e aveva addirittura introdotto questa propriet`a di minimo come un postulato indipendente (da aggiungersi, assieme ad altri quattro, ai postulati di Euclide). Ringraziamo Massimo

Meccanica Razionale 1: I principi variazionali

171

questo senso la caratterizzazione della retta come minimizzante la distanza

`e di tipo globale, perch´e coinvolge una nozione come la lunghezza, che `e

una propriet`a che riguarda tutta una curva γ (si tratta di un certo integrale definito, che dunque coinvolge tutta la curva – si veda pi`u avanti). Invece,

`e

locale la propriet`a che la derivata seconda y (x) si annulli in un punto x,

o

ivi abbia un valore determinato. Dunque la caratterizzazione mediante la

proriet`a y = 0 (ovvero y (x) = 0 per ogni x) `e una unione (su tutti gli x) di propriet`a locali, mentre la caratterizzazione mediante la propriet`a di minimo della lunghezza `e globale.

Un altro aspetto molto rilevante di questa differenza tra le due carat- terizzazioni riguarda una propriet`a di invarianza. Infatti una curva γ pu`o essere descritta analiticamente in infiniti modi, a seconda delle coordinate

che si scelgono: si pensi alla retta descritta in coordinate cartesiane (espres- sione banalissima) oppure in coordinate polari (espressione alquanto pi`u complicata). Dunque la caratterizzazione mediante propriet`a locali (an- nullarsi della curvatura, nel caso della retta) viene descritta analiticamente

in forma diversa al variare elle coordinate scelte. Invece le propriet`a globali,

come la lunghezza, espresse tipicamente mediante degli integrali definiti,

sono indipendenti dalle coordinate scelte, e quindi le caratterizzazioni di tipo globale sono le pi`u significative. 12 Corrispondentemente avviene che

i movimenti naturali, definiti come soluzioni delle equazioni di Newton (o

equivalentemente di Lagrange o di Hamilton), hanno forma analitica dipen-

dente dalle coordinate scelte, mentre la loro caratterizzazione globale che ne daremo un questo capitolo mediante il principio variazionale di Hamilton,

di tipo globale, risulter`a indipendente dalle coordinate. Si pu`o dunque dire

che le equazioni di Newton o di Lagrange o di Hamilton costituiscono la

forma locale di un principio variazionale (di tipo globale), che `e il principio

variazionale di Hamilton.

E chiaro dunque che questo principio costituisce

la forma pi`u profonda delle leggi naturali, e non meraviglia che esso venga

utilizzato sistematicamente a livello euristico, cio`e quando si devono formu- lare nuove teorie. Noi ne vedremo un esempio nella formulazione delle leggi

di moto nell’ambito della relativit`a speciale.

`

 

`

Esercizio: la legge della riflessione, con metodi variazionali.

E un

in-

teressante esercizio mostrare come la propriet`a di minimo sopra ricordata per le

rette permetta di ottenere la legge della riflessione dell’ottica geometrica in ambito variazionale (figura (3.3). Dati due punti A, B nel semipiano al di sopra della retta

si consideri l’insieme U AB delle curve che li giungono, aventi almeno un punto

su r. In tale insieme, la curva di lunghezza minima, `e quella per cui l’angolo di

riflessione `e uguale all’angolo d’incidenza.

E questo un caso felice, in cui “la di-

C

r,

r

´

mostrazione viene ridotta al caso precedente”. Infatti, se B `e il punto simmetrico

Bertini per una discussione su questo argomento. 12 La lunghezza di una curva (un certo sottoinsieme del piano) `e un numero, che viene calcolato come un certo integrale, e il numero che si ottiene non dipende dalle coordinate scelte per definire analiticamente la curva.

172

Andrea Carati e Luigi Galgani

A

C
C

B

Figura 3.2: La disuguaglianza triangolare

B

A A C r
A
A
C
r
B C r
B
C
r

B’

Figura 3.3: La legge della riflessione.

(o riflesso) rispetto alla retta r di B si ha che (lunghezza di ACB) = (lunghezza di ACB ), sicch´e la spezzata soddisfacente la legge della riflessione ha lunghezza uguale a quella del segmento AB .

Per inciso, l’esempio della legge della riflessione consente di mettere in luce un altro aspetto caratteristico dei principi variazionali, cio`e quello di non presentare necessariamente unicit`a delle soluzioni (ammesso che ne es- istano). Infatti, il raggio soddisfacente la legge della riflessione realizza un minimo locale perch´e ha lunghezza minima nell’insieme U AB delle curve che incidono sulla retta r, ma non nell’insieme pi`u ampio U AB di tutte le curve che congiungono A e B; infatti il minimo “assoluto” (cio`e in U AB ) `e rag- giunto dal segmento che unisce A e B direttamente senza toccare la retta r. Ovviamente, questa `e una situazione analoga a quella che si ha per una funzione F : U → R (dove U `e un insieme arbitrario) quando la funzione F presenta pi`u di un minimo, e si hanno dei minimi locali ed eventualmente

r

Meccanica Razionale 1: I principi variazionali

173

IR
IR

Figura 3.4: Minimi locali e minimo globale.

un minimo globale (figura (3.4)).

Esercizio: distanza da un punto ad una retta. Un altro esercizio interessante consiste nel trovare la distanza tra un punto P ed una retta r. Sappiamo dalla geometria elementare che questo problema si risolve tracciando la perpendicolare s ad r passante per P , e porre la distanza eguale alla lunghezza del segmento PK, dove K `e il punto di intersezione tra la perpendicolare ed r. Il medesimo problema si pu`o porre sotto forma variazionale, cercando la curva di lunghezza minima nell’insieme U P delle curve con un estremo in P e l’altro sulla retta r. Il problema si risolve in due passi: prima si fissa un punto K su r, e si trova la curva di minima lunghezza (ovvero il segmento PK); si cerca quindi il minimo

nella classe di curve cos`ı determinate (cio`e i segmenti con un estremo su r) facendo

Se sposto l’estremo K in K , allora in prima approssimazione

r

variare l’estremo.

−−−→ la lunghezza l del segmento varia della quantit`a δl = PK −−→ · KK . Il minimo della

lunghezza si ottiene quando δl = 0, cio`e PK `e ortogonale a KK e dunque alla retta r.

L’ambiente matematico in cui ci si muove `e dunque quello in cui `e dato un insieme U di curve (ciascuna rappresentata analiticamente in maniera opportuna), e ad ogni elemento dell’insieme si associa un numero reale. Si ha quindi una funzione a valori reali

F : U → R ,

o, come spesso si dice, un funzionale 13 (nel nostro caso la lunghezza della curva considerata); poich´e in R `e definita una relazione d’ordine (sappiamo

13 Ricordiamo dunque che per funzionale si intende semplicemente “funzione a valori reali”. Se in particolare U `e uno spazio vettoriale, allora tra tutti i funzionali esiste il sottoinsieme dei funzionali lineari, che vengono studiati nei corsi di geometria e di metodi matematici della fisica. Nella seguente discussione, al fine di definire la derivata di un funzionale avremo a che fare con funzionali lineari visti come linearizzazione di funzionali

174

Andrea Carati e Luigi Galgani

2

A

1 v 2
1
v 2

v 1

r

B

Figura 3.5: La legge della rifrazione.

cosa vuol dire che un numero reale `e maggiore di un altro), possiamo con- frontare i valori di F al variare dell’elemento in U , e stabilire l’eventuale esistenza di minimi locali.

3.2.1 Excursus sul principio di Fermat dell’ottica geometri- ca.

Prima di addentrarci in un approfondimento degli aspetti matematici rile- vanti, vogliamo qui illustrare il principio di Fermat (1601–1655), che fu il primo fondamentale principio variazionale dell’epoca moderna. Tra l’altro esso fu il primo in cui si associ`o ad una curva un numero reale diverso dalla familiare lunghezza euclidea. Il principio di Fermat `e strettamente associ- ato alla legge della rifrazione 14 (la cui formulazione pare sia dovuta a

nonlineari. Questo in effetti `e proprio l’analogo del procedimento che si tiene nel familiare calcolo differenziale in R n , quando si definisce il differenziale (un funzionale lineare!) come approssimante lineare di una funzione in generale nonlineare. Facciamo osservare tuttavia che il funzionale F di cui qui discutiamo `e assolutamente generico, e non si richiede affatto che sia lineare. 14 O legge del bagnino: un bagnino in A sulla spiaggia (regione 1 in cui pu`o correre con velocit`a v 1 ) vuole salvare una bagnante in B nel mare (regione 2, dove pu`o nuotare con velocit`a v 2 < v 1 ). La curva di lunghezza minima `e il segmento AB, ma la curva con il tempo minimo di percorrenza (la pi`u conveniente) `e la spezzata soddisfacente la legge della rifrazione. In questo esempio, come sottolineato anche da Feynman nel suo manuale, l’aspetto finalistico dei principi variazionali `e particolarmente evidente.

Meccanica Razionale 1: I principi variazionali

175

Descartes) 15 (figura (3.5)): sono dati due mezzi omogenei 1,2, separati dalla retta r, nei quali la luce si propaga rispettivamente con velocit`a v 1 , v 2 , e ci si domanda quale `e la curva che congiunge A e B, per la quale il tempo di per-

correnza sia minimo; risulta che tale curva `e la spezzata ACB soddisfacente la legge della rifrazione, cio`e tale che

sin θ 1

sin θ 2

= v 2

1

v

.

(3.2.1)

Esempio: la legge della rifrazione (o del bagnino), con metodi vari- azionali. La dimostrazione di questo fatto `e particolarmente illuminante (figura (3.6)). Anzitutto, gi`a sappiamo che, in ciascuno dei due mezzi, le curve aventi tem- po di percorrenza minimo sono le rette, perch´e hanno lunghezza minima. Dunque cercheremo la curva di tempo minimo nell’insieme U AB delle spezzate che hanno vertice C su r, sicch´e ogni elemento di U AB `e individuato da un numero reale x, ovvero l’ascissa di C: U = {x R : 0 x l}, dove l `e la distanza tra le proiezioni ortogonali di A e B sulla retta r. Il funzionale che consideriamo (tempo di percorrenza della curva ACB) `e dunque

r

r

l

v

1

1

+

l 2

v 2

,

ovvero la funzione reale di variabile reale F : [0, l] R con

F(x) =

l 1

v

1

+ l 2

v

2

= a 2 + x 2 + b 2 + (l x) 2

v

1

v

2

,

(3.2.2)

e vogliamo determinare il punto x in cui F ha valore minimo. Ci`o richiede anzitutto

che x sia un punto di stazionariet`a (o estremale o critico), ovvero tale che sia

F (x) = 0. D’altra parte si ha

ovvero

F

(x) =

1

x

1

l x

v

1

l

1

v

2

l 2

F

(x) = sin θ 1

v

1

sin θ 2

v 2

,

,

(3.2.3)

sicch´e si conclude che la legge di rifrazione (3.2.1) `e equivalente al principio di

stazionariet`a (o estremalit`a o criticit`a) F (x) = 0; ovvero, il raggio soddisfacente la legge della rifrazione `e quello per cui il tempo di percorrenza `e stazionario.

Dunque le curve significative per l’ottica geometrica sono sufficiente-

mente caratterizzate da una propriet`a di stazionariet`a del funzionale “tem-

si

po di percorrenza”.

`

E questo pertanto il principio cui ci si attiene:

15 Si veda U. Bottazzini, Curve ed equazioni, in P. Rossi, Storia delle scienze, Vol I.; R. Dugas, Histoire de la m´ecanique.

176

Andrea Carati e Luigi Galgani

A a 1 l 1 l−x x O b l 2 B 2
A
a
1
l
1
l−x
x
O
b
l
2
B
2

Figura 3.6: Dimostrazione della legge della rifrazione.

caratterizzano delle curve mediante la stazionariet`a di un assegnato fun- zionale, riservandosi poi di controllare se un certo punto di stazionariet`a sia eventualmente un minimo. 16 Possiamo ora venire alla formulazione del Principio di Fermat dell’ot- tica geometrica. Si considera un mezzo arbitrario, 17 in ogni punto x del quale `e assegnata una velocit`a locale di propagazione v(x); equivantemente `e assegnato il cosidetto “indice di rifrazione”

n(x) =

c

v(x) ,

dove c `e la velocit`a di propagazione della luce nel vuoto. Denotiamo con dl il consueto “elemento di linea” ovvero la lunghezza “infinitesima” secondo la metrica euclidea, dl 2 = dx 2 + dy 2 + dz 2 (dove dl 2 (dl) 2 e cos`ı via) se x, y, z sono le consuete coordinate cartesiane ortogonali. 18 Pertanto un

16 Ad esempio, nel capitolo sulla relativit`a vedremo che i movimenti hanno pseudol- unghezza massima (anzich´e lunghezza minima). Questo fatto costituisce in effetti la controparte matematica del famoso paradosso dei gemelli. 17 In effetti, ci limitiamo qui al caso di mezzi isotropi, in cui cio`e le propriet`a di interesse possono variare da punto a punto (mezzi disomogenei), ma in ogni punto non dipendono dalla direzione. 18 Facciamo qui riferimento a una nozione intuitiva, nella quale la relazione sopra scritta per dl 2 `e la “versione infinitesima” della relazione finita l 2 = x 2 +y 2 +z 2 per la lunghezza di un vettore di componenti cartesiane ortogonali x, y, z. La nozione “rigorosa” verr`a ricordata pi`u sotto.

Meccanica Razionale 1: I principi variazionali

177

elemento di linea dl viene percorso in un tempo

dt =

dl

v(x) ,

ovvero si ha cdt = n(x)dl, e per una curva γ il tempo di percorrenza T (γ)

`e

dl

dato da T (γ) = γ dt = γ v(x) , ovvero da

c T(γ) = γ n(x)dl .

(3.2.4)

´

E

di

individuate dalla sola ascissa x del punto C sulla linea di separazione tra

i due mezzi.

geometrica (cammino rettilineo nei mezzi omogenei illimitati, legge della

riflessione, legge della rifrazione) compendiandole nel

Principio di Fermat: In un mezzo individuato otticamente da un in-

dice di rifrazione n = n(x), il raggio luminoso γ tra due punti A e B che

si realizza in natura `e caratterizzato, fra tutte le curve γ congiungenti tali

punti, come la curva per cui `e minimo (pi`u precisamente, stazionario, o es-

tremale o critico) il tempo di percorrenza, o equivalentemente `e minimo il funzionale

F(γ) = γ n(x)dl ,

(3.2.5)

E spontaneo pertanto generalizzare le note leggi dell’ottica

evidente che il funzionale T (γ) `e, per curve generiche, l’analogo del tempo

percorrenza F (x) definito dalla (3.2.2) nel caso di curve spezzate ACB

`

(detto cammino ottico).

Evidentemente la precisazione di questo principio richiede che si definisca

cosa si intende per punto stazionario (o critico) nel caso di funzionali aventi per dominio un insieme U di funzioni (cio`e, come si dice, un sottoinsieme

di uno spazio funzionale) anzich´e un sottoinsieme di R n . Si deve dunque

procedere a dare un cenno al calcolo differenziale in spazi di dimensione infinita, cosa che faremo nella maniera pi`u semplice possibile nel prossimo paragrafo. Vedremo che, come nel caso dei funzionali (funzioni a valori reali) F definiti in R n i punti di stazionariet`a sono caratterizzati dalla propriet`a dF = 0, cos`ı anche per i funzionali F aventi dominio in uno spazio di funzioni i punti di stazionariet`a sono caratterizzati dalla propriet`a δF = 0, dove δF `e l’analogo del differenziale in R n . Dunque il principio di Fermat

viene compendiato nella formula

δ γ

n(x) dl = 0 .

(3.2.6)

3.2.2 Formulazione variazionale della meccanica lagrangiana.

Quanto detto finora riguarda l’ottica geometrica. Risulta tuttavia che si

ha una profonda analogia tra ottica geometrica e meccanica. Consideriamo

178

Andrea Carati e Luigi Galgani

infatti il caso pi`u semplice possibile, del moto di un punto soggetto ad un campo di forze F (x) derivanti da energia potenziale V (x), ovvero soddis- facente la legge di Newton mx¨ = grad V (x). In tal caso, siamo interessati sia al moto del punto, ovvero alla legge x = x(t), sia alla corrispondente traiettoria (curva in R 3 ), e allora risulta che la analogia pi`u immediata si ha fra curve dell’ottica geometrica e traiettorie del punto. Infatti si trova che le traiettorie γ corrispondenti ai moti x = x(t) soddisfacenti l’equazione di Newton soddisfano ad un principio variazionale profondamente analogo al principio di Fermat: si tratta del

Principio di Maupertuis–Jacobi: Le traiettorie di un punto materiale soggetto ad una energia potenziale V (x), ad una fissata energia E, sono caratterizzate dalla propriet`a di stazionariet`a

δ γ

E V (x) dl = 0 .

(3.2.7)

In altri termini, la traiettoria di un punto materiale in un potenziale V ad energia E coincide con il cammino di un raggio luminoso in un mezzo ottico avente indice di rifrazione

(3.2.8)

n(x) = E V (x) .

Osservazione diversa dipendenza dalla velocit`a nel principio di Fermat e in quello di Maupertuis–Jacobi. Si ricordi che per un punto si ha E = (1/2)mv 2 + V (x), sicch´e si ha

v = (2/m) E V (x) .

Dunque il principio di Maupertuis–Jacobi si formula come

δ

v dl = 0 ,

mentre quello di Fermat si formula come

δ

dl

v

= 0 .

Questa differenza viene tuttavia eliminata se, per l’ottica geometrica, si viene a distinguere tra velocit`a di fase e velocit`a di gruppo. Questo fatto venne particolar- mente sottolineato da Schroedinger. Si veda E. Schroedinger, An undulatory theory of the mechanics of atoms and molecules, Phys. Rev. 28, 1049–1070 (1926).

`

E questo un primo esempio di analogia tra ottica geometrica e meccanica del punto. Tale analogia fu utilizzata nel 1925 da Schroedinger per inventare la meccanica ondulatoria (o meccanica quantistica) 19 . Ma essa era gi`a sta- ta messa in luce da Hamilton, che giunse, nel 1833, alla sua formulazione (hamiltoniana) della meccanica proprio partendo dall’analogia con l’ottica.

19 Si veda ad esempio E. Fermi, Notes on quantum mechanics, The University of Chicago Press (Chicago, 1961), pag. 1.

Meccanica Razionale 1: I principi variazionali

179

Illustriamo ora, indipendentemente dall’analogia con l’ottica geometrica, come viene data la formulazione variazionale della dinamica. Consideriamo un sistema lagrangiano. Ci`o significa che `e assegnata una variet`a C (spazio delle configurazioni) di dimensione n ed una funzione lagrangiana. In una carta locale, un punto su C `e allora individuato da coordinate libere q =

(q 1 ,

, q n ) R n , e la Lagrangiana `e una funzione

L(q, q˙ , t) .

(3.2.9)

Si considerano allora tutti i movimenti q = q(t) che si svolgono in un fissato intervallo di tempo [t 0 , t 1 ] e che soddisfano certe fissate condzioni al contorno (cio`e agli estremi dell’intervallo). Si considera dunque l’insieme U di funzioni q = q(t) definito da

U = {q = q(t) : t 0 t t 1 ; cc} ,

(3.2.10)

dove la notazione cc indica che sono assegnate delle ben definite condizioni al contorno (boundary conditions) ai tempi estremi t 0 , t 1 . Un esempio tipi- co (figura (3.7) ´e quello di valori fissati agli estremi, ovvero le 2n condizioni q(t 0 ) = q (0) , q(t 1 ) = q (1) , ma le 2n condizioni pi´u generali appariranno pi´u sotto in maniera naturale. Un esempio significativo in una situazione che riguarda le traiettorie (in cui la cosiddetta legge oraria – legge di per- correnza temporale delle traiettorie – `e irrilevante) `e quello di determinare la traiettotria pi`u breve che congiunge un punto fissato da una retta. In tal caso `e fissato il punto iniziale, ma del punto finale si sa solo che giace su una retta assegnata. Allora gi`a sappimao che la traiettoria deve essere una retta passante per il punto assegnato, e vedremo che la seconnda con- dizione (il secondo punto deve giacere su una assegnata retta) si traduce nella condizione che nel punto di arrivo il segmento uscente dal primo punto deve cadere in maniera ortogonale alla assegnata retta (sicch´e il segmento uscente dal primo punto deve essere ortogonale alla assegnata retta). Si definisce poi il funzionale azione hamiltoniana S : U → R nel modo

seguente:

t

S =

t

0

1

L(q(t), q˙ (t), t)dt ,

(3.2.11)

e si formula il

Principio di Hamilton: Per un sistema lagrangiano con lagrangiana L(q, q˙ , t),

i moti naturali sono i punti–funzione stazionari (o estremali, o critici) del- l’azione hamiltoniana S, ovvero sono i movimenti q = q(t) per cui

δ

Ldt = 0 .

(3.2.12)

La rilevanza di questo principio riposa sul fatto che si dimostra poi il

180

Andrea Carati e Luigi Galgani

q 1 q 0 t t 0 1
q
1
q
0
t
t
0
1

Figura 3.7: Il dominio delle funzioni q = q(t) ammissibili.

Teorema 1 I movimenti q = q(t) nel dominio (3.2.10) che sono punti

stazionari dell’azione hamiltoniana S[q(·)] = che soddisfano le equazioni di Lagrange

Ldt sono tutti e soli quelli

t 1

t

0

d ∂L ∂L

dt ∂q˙

q

= 0

(3.2.13)

e le assegnate condizioni al contorno.

In virt`u di questo teorema si pu`o prendere l’atteggiamento di assumere

il principio di Hamilton, e la sua naturale generalizzazione ai sistemi con-

tinui, come principio fondamentale della meccanica, ed `e questo appunto l’atteggiamento che si tiene di consueto. Nei prossimi paragrafi verranno dati i necessari cenni di calcolo delle variazioni e verr`a dimostrato il teorema sopra enunciato. Verr`a poi mostra-

to come segue il principio di Maupertuis–Jacobi. Verr`a poi data la versione

del principio di Hamilton in relazione alle equazioni di Hamilton (anzich´e di Lagrange). Poi verr`a mostrato come tale formulazione permetta di dare una caratterizzazione delle trasformazioni canoniche mediante una funzione gen- eratrice (peocedimento che avevamo anticipato nel capitolo sulle equazioni

di Hamilton). Si mostrer`a anche come il flusso generato dalle soluzioni delle

equazioni di Hamilton sia una famiglia di trasformazioni canoniche, e la fun- zione generatrice sia la azione hamiltoniana stessa. Quest’ultimo argomento `e l’elemento centrale che fa da cardine per l’introduzione del metodo dei

Meccanica Razionale 1: I principi variazionali

181

Meccanica Razionale 1: I principi variazionali 181 x 0 t Figura 3.8: Nonunicit`a nei problemi variazionali.

x

Meccanica Razionale 1: I principi variazionali 181 x 0 t Figura 3.8: Nonunicit`a nei problemi variazionali.
Meccanica Razionale 1: I principi variazionali 181 x 0 t Figura 3.8: Nonunicit`a nei problemi variazionali.

0

Meccanica Razionale 1: I principi variazionali 181 x 0 t Figura 3.8: Nonunicit`a nei problemi variazionali.

t

Figura 3.8: Nonunicit`a nei problemi variazionali.

cammini di Feynman, che non abbiamo qui il tempo di illustrare. Da ulti-

mo, verr`a indicata l’estensione del principio di Hamilton a semplici esempi

di

corpi continui, come la corda vibrante.

 

`

Concludiamo ora questa introduzione con una osservazione.

E gi`a sta-

to

osservato che i principi variazionali vengono posti in un ambito globale

anzich´e locale, nel senso che si ricercano traiettorie o movimenti in cui ven- gono assegnate delle “condizioni al contorno”: curve che vanno da A a B

o movimenti che, in un certo intervallo di tempo [t 0 , t 1 ], vanno da q (0) a q (1) . Ora, tali problemi al contorno non sempre hanno soluzione, e inoltre

la soluzione pu`o non essere unica. Esempi di questo tipo sono ben noti nella

meccanica del punto e in ottica (punti focali).

Esempio di nonesistenza e di nonunicit`a. Consideriamo un oscillatore armon- ico. Allora sappiamo che secondo i principi della meccanica (equazione di Newton)

i corrispodenti movimenti x = x(t) sono quelli che soddisfano l‘equazione differen-

ziale x¨+x = 0 (consideriamo, per semplicit`a di notazione, il caso in cui la pulsazione

`e unitaria, ω = 1), ovvero sono le funzioni

x(t) = a cos t + b sin t

con parametri a, b reali arbitrari. Ma ricerchiamo ora se, tra tutti questi, esistano dei movimenti definiti nell’intervallo chiuso [0, t 1 ] che soddisfino le condizioni al contorno (problema globale)

x(0) = 0 ,

x(t 1 ) = x (1)

per un fissato x (1) R. Ora, la prima delle due condizioni, ovvero x(0) = 0, implica a = 0 e dunque si resta con

x(t) = b sin t .

= (con n intero nonnullo), la seconda condizione determina uni-

Allora, se t 1

vocamente il moto, ovvero b = x (1) 1 , e si ha dunque esistenza e unicit`a. Ma se

sin t

182

Andrea Carati e Luigi Galgani

invece ad esempio si `e nel caso in cui t 1 = π (figura (3.8), allora si ha x(t 1 ) = 0 qualunque sia b, e dunque si hanno infinite soluzioni (b arbitrario) se x (1) = 0, e

nessuna soluzione se x (1)

= 0.

3.3 Cenni di calcolo delle variazioni: i punti stazio- nari di un funzionale, e le equazioni di Eule- ro–Lagrange.

Lo scopo principale della prima parte di questo paragrafo `e di illustrare come la nozione di differenziale o di derivata viene estesa al caso di fun- zioni il cui dominio `e esso stesso uno spazio di funzioni, anzich´e R n . Si tratta di uno degli argomenti classici dell‘Analisi funzionale 20 . Cercheremo qui di darne una introduzione in una maniera allo stesso tempo semplice e matematicamente coerente. Preliminarmente, forniamo anzitutto un esempio concreto in cui si tocchi con mano che, nel caso dell’azione hamiltoniana S introdotta sopra, abbi- amo effettivamente a che fare con una funzione (a valori reali, e perci`o detta funzionale), definita su un dominio che `e esso stesso uno spazio di funzioni (come in figura (3.7). Da un punto di vista didattico, si verifica che questo `e un punto niente affatto banale, che molti studenti faticano a comprendere. Vogliamo illustrare quanto segue: allo stesso modo in cui, se vogliamo sapere quanto vale sin x, dobbiamo prima dichiarare quale valore di x stiamo con- siderando, analogamente qui, se vogliamo sapere quanto vale Ldt, dobbi- amo prima dichiarare quale `e il movimento q = q(t) che stiamo consideran- do. Per questo motivo introduciamo la notazione Ldt = S[q = q(t)] o pi`u semplicemente la notazione

Ldt = S[q(t)] .

Ambiguit`a della notazione. Si spera che la notazione con la parentesi quadra (invece della parentesi tonda) sia sufficiente per mettere in evidenza il fatto che qui non stiamo considerando una funzione composta (o funzione di fun-

zione!). Ad esempio, per funzioni reali di variabile reale, se f (x) = x 2 e x(t) = t 3 ,

˜

˜

allora la funzione composta f (t) = f (x(t)) risulta essere la funzione f(t) = t 6 . Nel

nostro caso, invece, l’azione S[q(t)] non dipende dal tempo, non `e una funzione del tempo !

L’azione `e funzione del movimento: esempio. Consideriamo il caso della particella libera (cio`e in assenza di forze attive), vincolata a una retta (asse delle

20 Uno tra i pi`u bei libri `e: A. Kolmogorov, S. Fomin, Elementi della teoria delle funzioni e di analisi funzionale. Si veda il Cap. 10: Elementi di calcolo differenziale in uno spazio vettoriale.

Meccanica Razionale 1: I principi variazionali

183

x). Allora la lagrangiana si riduce all’energia cinetica ed `e quindi data, prendendo

la massa unitaria, da

L(x, x,˙ t) =

2 1 x˙ 2 ,

(con m = 1)

.

Consideriamo ora i moti x = x(t) nell’intervallo temporale [t 0 , t 1 ] = [0, 1] con certe condizioni al contorno, ad esempio x(0) = 0, x(1) = 1. In questo dominio di funzioni x = x(t), diciamolo U , esiste anzitutto il moto x(t) = t, che `e la soluzione dell’equazione di Newton x¨ = 0 per la particella libera. Ma ne esistono infiniti altri, come ad esempio x(t) = t n per n = 2 oppure per n = 3, 4, · · · . In connessione con il funzionale S = Ldt avente dominio in U , fissare uno di questi moti `e l’equivalente

di fissare il valore della variabile indipendente x quando si considera il funzionale

(con dominio in R) y(x) = sin x. Fissiamo dunque un “punto”, un elemento di U , ad

esempio la funzione x(t) = t 2 . Poich´e il funzionale azione hamiltoniana S : U → R

1 x˙ 2 dt, allora avremo in questo caso (essendo

`e definito da S = Ldt = (1/2) x˙(t) = 2t)

0

S[x(t) = t 2 ] = 1 2 1 4t 2 dt = 2

3

(leggi: il valore di S corrispondente al punto–funzione [x(t) = t 2 ] `e 2/3). Allo stesso modo si calcola

0

S[x(t) = t n ] = 1

2

n

2

2n 1

,

e in particolare S[x(t) = t] = 1/2. Si verifica facilmente che tra tutti i punti–

funzione del tipo x(t) = t n , n = 1, 2, · · · , la funzione x(t) = t, che `e proprio la soluzione dell’equazione di Newton x¨ = 0 per la particella libera, `e anche quella in cui il funzionale S assume il valore minimo. Risulta in effetti che tale funzione `e

quella per cui S assume il valore minimo rispetto a qualunque elemento (funzione rappresentante un movimento) del dominio U .

3.3.1 Il differenziale (o la variazione) di un funzionale

Nel caso di funzionali F (funzioni a valori reali) con dominio in R, ovvero F = F (x), x R, ben sappiamo 21 che i punti di estremo, ovvero di minimo

o di massimo (se esistono, e se non sono situati sul bordo del dominio di

definizione di F ) devono essere anzitutto punti di stazionariet`a (o estremali,

o

critici), cio`e sono punti x in cui si annulla la derivata prima, F (x) =

0,

o equivalentemente si annulla il differenziale dF = F dx. Nel caso di

funzionali con dominio in R n , F = F (x), x = (x 1 ,

che condizione necessaria per l’esistenza di un estremo (minimo o massimo)

`e che si abbia stazionariet`a, condizione che ora si esprime nell’annullarsi

, x n ) R n , si ha ancora

del differenziale, dF = 0, a sua volta equivalente all’annullarsi di tutte le

derivate parziali,

i = 0, i = 1. · · · , n. Vogliamo ora estendere la nozione

di differenziale al caso di un funzionale avente per dominio uno spazio di

∂F

∂x

21 Qui e nel seguito non ci poniamo problemi di regolarit`a, e consideriamo di trattare con funzioni lisce (smooth), ovvero infinitamente differenziabili.

184

Andrea Carati e Luigi Galgani

funzioni, e a tal fine cominciamo col richiamare nozioni note per funzioni di una o pi`u variabili.

Cominciamo con il caso di funzioni di una sola variabile reale F = F (x). Ricor- diamo anzitutto come in tal caso l’esistenza del differenziale risulta essere equiv- alente all’esistenza della derivata definita nel modo familiare, come limite di un

rapporto incrementale. Infatti si dice che (per un fissato x) esiste la derivata di F

se esiste il limite

a = lim

h0

F(x + h) F(x)

h

.

In

denotato con F (x):

a(x) F (x) .

D’altra parte `e evidente che l’esistenza di tale limite `e equivalente al fatto che esista un numero a = a(x) tale che si abbia

tal caso il numero a = a(x) viene detto derivata prima di F nel punto x e viene

F (x + h) = F (x) + ah + R

dove R `e un “resto di ordine 2”, tale cio`e che

lim

h0

R

|h| = 0

(3.3.1)

(in tal caso si scrive anche R = O(h 2 ).) Allora la parte principale (cio`e la parte lin- eare rispetto all’incremento h) 22 dell’incremento di F viene chiamata “differenziale

di

F ” e denotata con dF :

 

dF = F (x) h

.

(3.3.2)

Si

noti che, prendendo come caso particolare la funzione F (x) = x si trova proprio

dx = h, e per questo motivo, coerentemente, la (3.3.2) si scrive anche

dF = F (x) dx .

(3.3.3)

La definizione di differenziale appena data si estende spontaneamente al caso di

funzioni (diremo anche funzionali, se vogliamo sottolineare che si tratta di funzioni a

, x n ), x R n . Basta, nelle relazioni

(3.3.1), (3.3.3) sostituire al numero a = F (x) un operatore lineare A = A(x). Si ammetter`a cio`e che valga

valori reali) di n variabili, F = F (x) F (x 1 ,

F (x + h) = F (x) + A(x)h + R,

(3.3.4)

dove A `e un operatore lineare in R n (una matrice, in una assegnata base), 23 e R un resto di ordine 2. 24 Ribadiamo questo fatto. Nel caso in cui il dominio `e

R n , per definire il differenziale si considera l’incremento che il funzionale F subisce quando ci si sposta da un punto x a un punto x + h, e si studia come l’incremento

di F dipende dallo spostamento h. Se si trova che tale l’incremento di F risulta

22 E ovvio che questa definizione `e significativa. Infatti per incrementi h piccoli `e evidente

che la parte lineare dell’incremento `e la parte dominante. 23 Geometricamente questo significa che, nell’intorno di x, si approssima la funzione F (x) mediante un iperpiano tangente alla superficie z = F (x). 24 Si intende, rispetto alla norma del vettore h.

`

Meccanica Razionale 1: I principi variazionali

185

decomposto in una parte lineare nell’incremento h, pi`u un resto di ordine superiore

al primo, allora si definisce il differenziale di F come la parte dell’incremento che `e

lineare nello spostamento h. Ora, questo procedimento `e dal punto di vista formale facilmente estendibile al caso in cui il dominio `e uno spazio funzionale (cio`e, i cui elementi sono funzioni). A

tal fine, basta avere presente l’idea–guida secondo la quale gli spazi funzionali pos- sono essere pensati immediatamente come spazi vettoriali, solo che i vettori hanno ora dimensione infinita. Infatti, ad esempio, una funzione y = y(x) `e un “vettore

le

cui componenti hanno un indice continuo” x. Come un vettore y = (y 1 , ··· , y n )

di

R n `e individuato dalle componenti y i , i = 1, · · · , n, e si parla di i–esima com-

ponente, cos`ı nel caso della funzione y = f (x) si pu`o pensare alla funzione stessa

come individuata da tutte le x–esime componenti f (x), dove l’indice di componente

x varia in un dominio continuo anzich´e in un dominio discreto (addirittura finito).

La somma di due vettori e il prodotto di un vettore per un numero sono poi definite

come in R n , ovvero “per componenti” (componentwise): date due funzioni f , g, la somma (f + g) `e definita da (f + g)(x) = f (x) + g(x) per tutti gli x, e cos`ı via. Si noti come distinguiamo tra i simboli f ed f (x). Qui f denota la funzione (analoga

del vettore y), mentre f (x) denota il valore che la funzione f assume in x; si tratta della x–esima componente di f , analoga della i–esima componente y i del vettore y. Nel seguito, spesso denoteremmo la funzione f con f = f (x), oppure talvolta con f (·), o anche, per abuso di notazione, addirittura con f (x).

Vediamo dunque in quale modo si estende formalmente la nozione di differenziale al caso in cui il dominio `e uno spazio di funzioni, prendendo come esempio proprio l’azione hamiltoniana S = Ldt definita nello spazio funzionale U (3.2.10), di moti che si svolgono in un fissato intervallo di tempo e soddisfano certe assegnate condizioni al contorno. Valutiamo l’incremento del funzionale S quando si passa da un punto–funzione q(t) a un altro punto– funzione (q + h)(t) = q(t) + h(t). Ora, data la definizione del funzionale S, l’incremento risulta essere dato da

S[(q+h)(t)]S[q(t)] =

(3.3.5)

D’altra parte, per il noto sviluppo di Taylor al primo ordine di una funzione, si ha

t

t 1

0

L q(t)+h(t), q˙ (t)+ h(t), t L q(t), q˙ (t), t dt .

˙

L q(t)+h(t), q˙ (t)+ h(t), t L q(t), q˙ (t), t = L ·h+ L

˙

q

q˙ ·

˙

h + R , (3.3.6)

con un resto R che `e quadratico nella norma dei vettori h e

usando la nota formula di Leibniz per la derivata di un prodotto (che conduce alla nota formula di integrazione per parti), si ha

h. ˙ 25 Inoltre,

∂L

q˙

·

h L

q˙

˙

d

· dt h =

d

dt ∂L

q˙

· h

d

∂L

dt ∂q˙

· h

.

(3.3.7)

˙

25 Questo significa che, se h < , h < , allora si ha |R| < C 2 con una costante C > 0. Qui, come di consueto, dato un vettore h R n , con h ne denotiamo la norma (o lunghezza), ad esempio euclidea.

186

Andrea Carati e Luigi Galgani

Introduciamo ora le (3.3.6) e (3.3.7) nella (3.3.5). Ricordando che l’integrale

di una somma `e uguale alla somma dei corrispondenti integrali, troviamo che

il valore del funzionale S nel punto–funzione spostato risulta essere

t

S[(q+h)(t)]S[q(t)] =

t

0

1

∂L

q

d

∂L

dt ∂q˙

·h(t) dt+ L · h

q˙

t

t

1

0

+R

(3.3.8)

con un opportuno resto R, che `e evidentemente di ordine superiore al pri- mo. 26 Vediamo cos`ı che l’incremento del funzionale S nel passaggio dal punto–funzione q(t) al punto–funzione (q + h)(t) risulta decomposto nella somma di una parte lineare nell’incremento h(t) e di un resto R di ordine superiore al primo. La parte lineare (in h) dell’incremento risulta essere la somma di due pezzi: un termine integrale, ed una parte “di bordo”, cio`e un

termine il cui valore dipende solo dai valori di h(t) al bordo dell’intervallo

di integrazione.

A questo punto ci comportiamo in perfetta analogia con il caso di un funzionale F da R n in R. In quel caso, se si trova che, passando da un punto x a un punto spostato x + h, l’incremento di F si decompone nella somma

F (x + h) F (x) = A · h + R(x, h) ,

(3.3.9)

dove, per ogni punto x fissato, A = A(x) agisce lineamente su h, ovvero `e un certo funzionale lineare da R n in R, mentre il resto R `e di ordine superiore al primo nell’incremento h, allora il differenziale dF di F viene definito come la parte lineare (nello spostamento h) dell’incremento di F , ovvero dF := A · h, e si scrive anche,

coerentemente, 27 dF = A · dx. Si trova poi dF = i

lineare dF viene espresso in termini delle derivate parziali del funzionale F .

i dx i , sicch´e il funzionale

∂F

∂x

Cos`ı ora, analogamente, si definisce il differenziale di S come la parte principale dell’incremento del funzionale S, cio`e quella parte che `e lineare nell’incremento h(t). Tradizionalmente, quando il dominio `e uno spazio di funzioni, il differenziale di un funzionale viene denotato con il simbolo δ anzich´e d, e chiamato variazione, e dunque parleremo di variazione δS del funzionale S; coerentemente, anche l’incremento h = h(t) del punto– funzione verr`a denotato con il simbolo δq(t) e chiamato variazione di q(t).

26 Con questo si intende che, se

sup h(t) < ,

t

˙

sup h(t) < ,

t

allora si ha

|R| < C 2

con una costante C > 0. Nel nostro caso, questa propriet`a del resto R segue dal fatto che:

i) per ogni t, il resto R (che figura nello sviluppo di Taylor della lagrangiana) `e quadratico

˙

in h , h , ii) la funzione h = h(t) `e stata assunta liscia (sicch´e le sue derivate seconde hanno modulo limitato in un compatto), e iii) t varia in un dominio compatto. 27 Cio`e si ha h = dx. Infatti, prendiamo come funzionale F proprio la i–esima compo- nente del vettore x, ovvero F (x) F (x 1 , ··· , x n ) = x i . Allora si ha F (x + h) F (x) = (x i + h i ) x i = h i , ovvero dF dx i = h i .

Meccanica Razionale 1: I principi variazionali

187

Dunque abbiamo dimostrato che il funzionale azione hamiltoniana S, definito da

t

S =

t

0

1

Ldt ,

ammette differenziale (termine classico: variazione) δS, e abbiamo calcolato l’e- spressione di tale variazione, che risulta essere data da 28

t 1

δS =

t

0

∂L

q

d

∂L

dt ∂q˙

· δq(t) dt +

p(t) · δq(t)| t t 0 ,

1

(3.3.10)

dove si ´e usato la definizione di momento p = L . Si osservi che, poich´e per ogni

q˙

valore di t le quantit`a q(t) e δq(t) sono dei vettori in R n , ovviamente l’integrale nelll’espressione (3.3.10) per δS deve essere inteso come

t 1

t

0

∂L

q

d

∂L

dt ∂q˙

t 1

· δq(t) dt

t

0

n

i=1

∂L

d

∂L

∂q i

dt ∂q˙ i

δq i (t) dt .

(3.3.11)

Nota. Abbiamo qui considerato il caso di movimenti definiti in un fis- sato intervallo di tempo. Vi sono situazioni (come nel caso del principio di Maupertuis) in cui i moti variati si svolgono in un intervallo con estremi variati anche essi. E’ questo il cosiddetto caso dei moti variati asincroni.

3.3.2 Stazionariet`a di un funzionale; le equazioni di Eulero– Lagrange

La nozione di stazionariet`a viene ora introdotta in analogia con il caso finito– dimensionale.

Definizione 1 . Si consideri il funzionale S = Ldt definito nel dominio (3.2.10). Una funzione q = q(t) `e un punto stazionario (o estremale, o critico) 29 del funzionale S se ivi si annulla il differenziale (la variazione) di S, ovvero si ha δS = 0.

Si dimostra allora il seguente teorema, che `e nient’altro che quello an- nunciato nel precedente paragrafo:

28 Si osservi la analogia con il caso in cui il dominio `e R n . In quel caso si ha, per

il differenziale dF , una formula che lo esprime in termini delle derivate parziali di F ,

i dx i . Nel nostro caso, l’indice discreto i viene rimpiazzato dall’indice

continuo t. Corrispondentemente, la somma su i viene rimpiazzata da un integrale su t,

possiamo dire di avere trovato l’analogo della derivata parziale rispetto a x i , in questo caso la derivata parziale rispetto alla t–esima componennte q(t). Questo analogo della derivata parziale viene tradizionalmente denotato con il simbolo δS , e abbiamo dunque

e

ovvero dF = i

∂F

∂x

δq

trovato

δS

δq

= ∂L

q

d

∂L

dt ∂q˙

.

29 Ad esempio, Arnol’d usa sempre il termine estremale.

188

Andrea Carati e Luigi Galgani

Teorema 2 I movimenti q(t) che sono punti stazionari (o estremali, o crit-

ici) del funzionale S[q(t)] =

dalle propriet`a indipendenti:

Ldt nel dominio (3.2.10) sono caratterizzati

t 1

t

0

i) soddisfano l’equazione differenziale (detta di Eulero–Lagrange)

d ∂L ∂L

dt ∂q˙

q

= 0 ;

(3.3.12)

ii) agli estremi t 0 , t 1 dell’intervallo considerato soddisfano le condizioni

p(t 1 ) · δq(t 1 ) = p(t 0 ) · δq(t 0 )

(3.3.13)

per tutte le variazioni δq(t 0 ) , δq(t 1 ) compatibili con le condizioni al con- torno assegnate ai tempi estremi.

Dimostrazione. Ricordiamo che, nel caso finito–dimensionale, la condizione di

anullamento di un differenziale dF deve essere intesa nel senso che l’espressione

i dx i deve annullarsi per ogni scelta dell’ “incremento” dx. Allo stesso modo,

i

nel presente caso in cui δS `e dato dalla (3.3.11), l’annullarsi della variazione δS deve essere intesa nel senso che il secondo membro della (3.3.10) deve annullarsi per ogni scelta dell’ “incremento”, cio`e della funzione δq(t). Questo porta come immediata conseguenza che devono essere separatamente nulli i due addendi che figurano nell’ espressione di δS , cio`e deve essere contempo- raneamente

∂F

∂x

t

t

0

1

∂L

q

d

∂L

dt ∂q˙

· δq(t) dt = 0

p(t) · δq(t)| t t 0 = 0

1

δq(t)

δq(t) .

(3.3.14)

Non pu`o accadere infatti che i due termini abbiano un valore eguale ed opposto in modo che la loro somma si annulli. Ammettiamo infatti per assurdo che per

un certo δq(t) sia p(t) · δq(t)| t 1

0. Allora deve essere pure differente da zero

l’integrale (per poterlo bilanciare), e di conseguenza non deve essere identicamente nullo l’integrando. Ma ora possiamo scegliere una nuova funzione δq (t) che ha i medesimi valori al bordo (cio`e in t 0 ed in t 1 ) di δq(t) ma differisca in un sottoinsieme interno all’intervallo. Dunque il valore dell’integrale cambia, mentre il termine di bordo no, e dunque la variazione di S non `e nulla per quella scelta di δq (t), che `e l’assurdo cercato.

t

0

=

Ora, dal fatto che deve essere

t

t

0

1

∂L

q

d

∂L

dt ∂q˙

· δq(t) dt = 0

segue che deve essere

∂L

d

∂L

∂q i

dt ∂q˙ i

= 0

per

per ogni

δq(t)

(3.3.15)

i = 1,

, n

.

(3.3.16)

Meccanica Razionale 1: I principi variazionali

189

Questo si mostra in due passi. Il primo passo utilizza l’arbitrariet`a di δq(t) per dimostrare che allora deve annullarsi la analoga espressione per ogni i = 1, · · · , n, ovvero deve essere

t

t

0

1

∂L

d

∂L

∂q i

dt ∂q˙ i

δq i (t) dt = 0 ,

Infatti, basta prendere inizialmente

i = 1, · · ·

, n .

δq(t) = δq 1 (t), 0, ··· , 0 ,

(3.3.17)

sicch´e si resta con il solo primo termine della somma, e cos`ı via. Il secondo passo, fa uso poi di quello che talvolta viene chiamato il Lemma fondamentale del calcolo delle variazioni (la dimostrazione `e riportata qui sotto), che si applica al nostro caso, e quindi il teorema `e dimostrato. Q.E.D.

Lemma 1 (Lemma fondamentale del calcolo delle variazioni) Se una funzione f : [t 0 , t 1 ] R ha la propriet`a che

t

t

0

1

f (t)g(t) dt = 0

per ogni funzione g ,

(3.3.18)

dove la funzione g pu`o soddisfare arbitrarie condizioni agli estremi dell’in- tervallo, allora si ha f = 0, ovvero

f (t) = 0

t.

Si noti che, come in tutte queste note, sottintendiamo che tutte le funzioni considerate sono lisce, e quindi continue.

Osservazione. Si osservi la seguente analogia con il caso di vettori in R n : Se un vettore x ha la propriet`a x · y = 0 (ovvero i x i y i = 0) per ogni vettore y R n (cio`e x `e ortogonale a tutti i vettori dello spazio considerato), allora si ha x = 0. La dimostrazione di questo fatto `e banale e consiste nel prendere proprio y = x, perch´e allora deve valere x · x = 0, ovvero x ha lunghezza nulla, e d’altra parte in R n l’unico vettore di lunghezza nulla `e il vettore nullo.

Nel nostro caso la situazione `e diversa, non soltanto perch´e ora siamo in uno spazio di dimensione infinita anzich´e in R n , ma soprattutto perch´e, mentre di x sappiamo che `e ortogonale a tutti gli y, ora invece della nostra assegnata funzione f (analoga del vettore x) sappiamo soltanto che `e ortog- onale a un sottoinsieme di tutte le funzioni (cio`e solo alle g con le assegnate condizioni al contorno e non anche a tutte le funzioni g). In altri termini, per concludere che f `e nulla basta sapere che essa `e ortogonale alle funzioni g che soddisfano le assegnate condizioni agli estremi. 30

30 Questo non `e affatto ovvio. Ad esempio, nel caso di R 3 con base i, j, k, se sappiamo un vettore x ha la propriet`a