Sei sulla pagina 1di 229

Franco Cardin

SISTEMI DINAMICI MECCANICI


Introduzione alla Meccanica Razionale

per il corso di Fisica Matematica


Laurea triennale in Matematica 2016/17

J.L.Lagrange, Mécanique Analytique

Hamilton’s variation principle can be shown to correspond to Fermat’s Principle


for a wave propagation in configuration space (q-space), and the Hamilton-Jacobi
equation expresses Huygens’ Principle for this wave propagation. Unfortunately
this powerful and momentous conception of Hamilton is deprived, in most modern
reproductions, of its beautiful raiment as a superfluous accessory, in favour of a
more colourless representation of the analytical correspondence.

E. Schrödinger, Quantization as a problem of eigenvalues, II

E. Schroedinger, Quantization as a problem of eigenvalues, II


Avvertenza per il Lettore

Queste dispense sono solo una traccia per un corso di Meccanica, non certo un trattato
di Meccanica.
I manuali di Meccanica sono altri: il lettore che s’appassionasse e desiderasse appro-
fondire la materia è invitato a rivolgersi, esplorare le pagine dei bellissimi trattati di Levi-
Civita & Amaldi, di Whittaker, di Wintner, di Landau & Lifshitz, di Gantmacher, di Arno-
l’d, e poi ancora i più recenti volumi di Benenti, Cercignani, Dell’Antonio, Fasano & Marmi,
Gallavotti, ecc.
Queste note sono invece semplicemente un modo di raccontare alcuni, pochi, capitoli
della Meccanica Classica, modo legato intimamente alla maturazione di tali argomenti,
usufruendo dell’esperienza dell’insegnamento e della conseguente ‘risposta’ degli studenti,
via via nel tempo.

Franco Cardin
Dipartimento di Matematica Tullio Levi-Civita
Università degli Studi di Padova

2
Indice

1 Sistemi Meccanici Vincolati 7


1.1 Fondamenti della Meccanica . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.1 Spazi Inerziali, Riferimenti Inerziali, Tempo Assoluto . . . . . . . . . 8
1.1.2 Punti materiali e masse . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.3 Spazio delle Configurazioni e Spazio degli Atti di Moto per un sistema
di punti materiali liberi . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.1.4 Forze . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.1.5 Vincoli e loro descrizione geometrica . . . . . . . . . . . . . . . . . . 10
1.1.6 Vincoli e loro descrizione dinamica . . . . . . . . . . . . . . . . . . . 14
1.1.7 Moti Dinamicamente Possibili . . . . . . . . . . . . . . . . . . . . . 15
1.2 Quiete ed Equilibrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3 Vincoli privi d’attrito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.4 Un sistema meccanico la cui dinamica è retta dall’equazione differenziale
ẍ = f (x), con x ∈ R1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.4.1 Diagramma di Fase per ẍ = f (x) . . . . . . . . . . . . . . . . . . . . 24
1.5 Metodo di Lagrange per la determinazione delle Reazioni Vincolari . . . . 27
1.6 Il modello di Coulomb dell’attrito . . . . . . . . . . . . . . . . . . . . . . . 30
1.7 Vincoli Lisci o Ideali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.8 Cinematica e dinamica elementare dei sistemi particellari . . . . . . . . . . 33
1.8.1 Equazioni Cardinali . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
1.8.2 Cinematica dei sistemi particellari rigidi . . . . . . . . . . . . . . . . 36
1.9 Teorema di Conservazione dell’Energia . . . . . . . . . . . . . . . . . . . . . 40
1.10 La restrizione di un sistema di forze conservativo è conservativa . . . . . . 41
1.11 Sistemi continui (di infinite particelle) a finiti gradi di libertà . . . . . . . . 42
1.12 Appendice: Il Principio di Gauss . . . . . . . . . . . . . . . . . . . . . . . 45

2 Il Problema dei Due Corpi e la Meccanica Celeste 49


2.1 Premessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.2 Moti Piani . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.3 Moti Centrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3
2.4 Formule di Binet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5 Sulle Coniche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.6 Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.7 Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.8 Massa Ridotta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.9 Soluzione del Problema Ridotto ad un Corpo, il Problema di Kepler . . . . 61
2.10 L’equazione di Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.11 Il Vettore di Runge-Lenz per il Problema di Kepler Spaziale . . . . . . . . . 67
2.12 Circonferenza di Hamilton delle velocità nel Problema di Kepler piano . . . 67
2.13 Teorema di Bohlin (nella versione di Faure-Arnol’d): Equivalenza orbitale
dei potenziali elastico e Kepleriano . . . . . . . . . . . . . . . . . . . . . . . 68
2.14 Sulle soluzioni esatte del Problema a Tre Corpi ed N Corpi . . . . . . . . . 70

3 Teoria della Stabilità 75


3.1 Lyapunov Stabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.2 Stabilità Asintotica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
3.3 Teorema di Lagrange-Dirichlet . . . . . . . . . . . . . . . . . . . . . . . . . 81
3.4 Stabilizzazione Giroscopica . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
3.5 Equazioni Differenziali Lineari (richiamo) . . . . . . . . . . . . . . . . . . . 87
3.6 Linearizzazione attorno ad Equilibri Stabili . . . . . . . . . . . . . . . . . . 88
3.7 Primo Metodo di Lyapunov . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
3.8 Stabilità per Sistemi Dinamici infinito-dimensionali . . . . . . . . . . . . . . 91
3.9 La Teoria di Floquet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92

4 Meccanica di Lagrange 95
4.1 Dinamica dei Sistemi Olonomi Lisci: Equazioni di Lagrange . . . . . . . . . 95
4.2 Sugli Integrali Primi delle Equazioni di Lagrange . . . . . . . . . . . . . . . 101
4.3 Teoria di Routh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.4 Teoria di Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104

5 Piccole Oscillazioni nei Sistemi Lagrangiani 109

6 Il Pendolo di Foucault: Appunti per lo studio del problema linearizzato113

7 Meccanica Elementare del Corpo Rigido 119


7.1 Il Corpo Rigido è un sistema vincolato a vincoli olonomi . . . . . . . . . . . 119
7.2 Il Corpo Rigido è un sistema vincolato a vincoli lisci . . . . . . . . . . . . . 120
7.3 Dinamica del Corpo Rigido . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.4 Equazioni di Euler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

4
8 Calcolo delle Variazioni 131
8.1 Principio Variazionale di Hamilton . . . . . . . . . . . . . . . . . . . . . . . 131
8.2 Minimo nel Calcolo delle Variazioni: il Principio della Minima Azione . . . 134
8.3 Sinossi di Teoria Variazionale in H 1 . . . . . . . . . . . . . . . . . . . . . . 139
8.4 Minimo Forte e Minimo Debole . . . . . . . . . . . . . . . . . . . . . . . . . 141
8.5 Moti spontanei e geodetiche su varietà . . . . . . . . . . . . . . . . . . . . . 142
8.6 Metrica di Jacobi. Formulazione non variazionale del Principio di Maupertuis146
8.7 Riduzione Isoenergetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
8.8 Problema di Plateau dell’area minima (o delle bolle di sapone). . . . . . . . 149
8.9 Problema inverso nel Calcolo delle Variazioni: Teorema di Volterra-Vainberg 151

9 Meccanica di Hamilton 155


9.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
9.2 Fibrato cotangente o spazio delle fasi . . . . . . . . . . . . . . . . . . . . . . 156
9.3 Trasformazione di Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . 157
9.4 Globalizzazione della trasformazione di Legendre . . . . . . . . . . . . . . . 158
9.4.1 Appendice: Diffeomorfismi globali di Rn in sè . . . . . . . . . . . . . 159
9.5 Equazioni di Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
9.6 Principio Var. di Hamilton-Helmholtz . . . . . . . . . . . . . . . . . . . . . 161
9.6.1 Interpretazione delle Equazioni di Hamilton come opportune equa-
zioni di Lagrange . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
9.6.2 Cenno sul problema delle Lagrangiane equivalenti . . . . . . . . . . . 162
9.7 Coniugazione di Campi Vettoriali . . . . . . . . . . . . . . . . . . . . . . . 164
9.8 Trasformazioni Canoniche . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165
9.9 Condizione di Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
9.9.1 La Condizione di Lie è N & S caratterizzante le Trasformazioni Ca-
noniche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
9.10 Metodo d’integrazione di Hamilton-Jacobi . . . . . . . . . . . . . . . . . . . 174
9.10.1 Metodo d’integrazione di H-J: Hamiltoniana con n − 1 variabili cicliche176
9.10.2 Metodo d’integrazione di H-J: Hamiltoniana separabile . . . . . . . . 177
9.10.3 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 178

10 Algebra dei Campi Vettoriali 183


10.1 Morfismi d’Algebra, Parentesi di Lie e di Poisson . . . . . . . . . . . . . . . 183
10.2 Algebra di Lie e Trasformazioni Canoniche . . . . . . . . . . . . . . . . . . . 185
10.3 Significato dinamico delle parentesi di Lie . . . . . . . . . . . . . . . . . . . 187
10.4 Formula di Lie-Trotter-Chernov . . . . . . . . . . . . . . . . . . . . . . . . . 190
10.5 Derivata di Lie di Campi Vettoriali . . . . . . . . . . . . . . . . . . . . . . . 190
10.6 Cenni sulla Teoria delle Perturbazioni dei Sistemi Hamiltoniani . . . . . . . 192
10.6.1 Sistemi Hamiltoniani integrabili . . . . . . . . . . . . . . . . . . . . 192
10.6.2 Perturbazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193

5
10.6.3 Frequenze Diofantee: Convergenza del primo passo perturbativo . . 194

11 Cenno sull’analisi qualitativa dello spazio delle fasi 199


11.1 Teoremi del Trasporto e di Liouville . . . . . . . . . . . . . . . . . . . . . . 199
11.2 Teorema del Ritorno di Poincaré . . . . . . . . . . . . . . . . . . . . . . . . 202

12 Metodo di Newton e Sistemi Dinamici 205


12.1 Metodo di Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 205
12.2 Equazioni alle differenze finite, campo vettoriale di Newton e stabilità asin-
totica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
12.3 Coniugazione del campo vettoriale di Newton . . . . . . . . . . . . . . . . . 209
12.4 Un (altro) teorema di inversione globale . . . . . . . . . . . . . . . . . . . . 209

13 Vettori Applicati, Velocità Angolare, Cinematica Relativa 211


13.1 Vettori Applicati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211
13.1.1 Asse Centrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
13.1.2 Centro di un sistema di vettori applicati paralleli a con R 6= 0 . . . . 213
13.2 Richiami sulle trasformazioni lineari . . . . . . . . . . . . . . . . . . . . . . 215
13.3 Cinematica rigida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
13.3.1 Velocità angolare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216
13.4 Cinematica relativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221

14 Derivata di determinante 225

15 Test 227
15.1 Alcune domande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
15.2 Altre domande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228

6
Capitolo 1

Sistemi Meccanici Vincolati

“Vi sono anzitutto le difficoltà che si incontrano quando


si vogliano definire le nozioni fondamentali.
Che cos’è la massa? E’ –risponde Newton– il
prodotto del volume per la densità.
Sarebbe meglio –replicano Thomson e Tait– dire
che la densità è il quoziente della massa per il volume.
Che cos’è la forza? E’ –risponde Lagrange– una
causa che produce il movimento o che tende a produrlo.
E’ –affermerà invece Kirchhoff– il
prodotto della massa per l’accelerazione. Ma allora
perché non dire che la massa è il quoziente della
forza per l’accelerazione? Queste difficoltà
sono inestricabili.”
Henri Poincaré, Le idee di Hertz sulla Meccanica, 1897. 1

1.1 Fondamenti della Meccanica


Introduciamo una elenco di oggetti matematici necessari per lo studio della Meccanica dei
Sistemi Vincolati. La presentazione di tale elenco, almeno per i primi punti, è di tipo
1
Il pessimismo che traspare dalle parole di Poincaré sull’edificazione rigorosa dei fondamenti della Mec-
canica Classica è decisamente superato: le costruzioni di Mach e Painlevé sui principi della Meccanica sono
state in tempi relativamente recenti riprese rigorosamente in un’opera poderosa e originale a cui il lettore
interessato ai fondamenti dovrà rivolgersi —naturalmente non da principiante, ma dopo essersi addentrato
nel corpo vasto della meccanica:
Aldo Bressan, Metodo di assiomatizzazione in senso stretto della meccanica classica. Applicazione di
esso ad alcuni problemi di assiomatizzazione non ancora completamente risolti, Rendiconti del Seminario
Matematico, Università di Padova, 32 (1962):55-212.

7
gerarchico, nel senso che ogni oggetto via via introdotto ha un carattere più generale ed
indipendente dal successivo. Non cureremo la costruzione completa dei fondamenti, bensı́
richiameremo rapidamente quei concetti utili per entrare concretamente nel cuore dello
studio dei problemi dinamici meccanici.

1.1.1 Spazi Inerziali, Riferimenti Inerziali, Tempo Assoluto


Nell’ambito della Meccanica Classica consideriamo uno Spazio Inerziale Σ. Questo è mo-
dellato matematicamente da uno spazio affine 3-dimensionale, del quale scegliamo un punto
O (origine) e tre vettori ortonormali ad O applicati: lo spazio vettoriale generato sarà detto
Riferimento Inerziale RΣ associato: denoteremo con vettori di R3 i punti geometrici rap-
presentati in tale riferimento. Mentre il ruolo operativo di tali spazi inerziali emergerà tra
breve nella costruzione della dinamica e dei moti dinamicamente possibili2 la loro esistenza
è un fatto assiomatico. Più precisamente, si postula l’esistenza di uno spazio cinematico
inerziale. A volte, ciò è detto Prima Legge della Meccanica Classica. Ogni altro spazio
inerziale trasla uniformemente rispetto a questo.
Ancora in tale ambito classico, l’Insieme degli Istanti, che ha la struttura di uno spazio
affine 1-dimensionale, viene rappresentato, una volta scelto l’origine e l’unità di misura,
dallo spazio vettoriale R1 , indipendentemente (“tempo assoluto”) dalla scelta di Σ e del
riferimento inerziale.

1.1.2 Punti materiali e masse


Nel nostro modello in costruzione l’universo contenga solamente n punti materiali M1 , ..., Mi ,
..., Mn , di massa rispettivamente m1 , ..., mn e mi > 0. Lo schema di punto materiale, quale
modello di particella adimensionale senza struttura interna, e il concetto di massa, sono
ritenuti di tipo primitivo, senza necessità quindi di ulteriori specificazioni.

1.1.3 Spazio delle Configurazioni e Spazio degli Atti di Moto per un


sistema di punti materiali liberi
Nel riferimento inerziale scelto le configurazioni possibili per il nostri sistema di punti
materiali M1 , ..., Mi , ..., Mn , attualmente non vincolato, sono tutti e soli i vettori di R3n e
scriveremo
(OP1 , ..., OPi , ..., OPn ) ∈ R3 × ... × R3 = R3n .
Lo spazio R3n × R3n formato dalle configurazioni e corrispondenti velocità consentite al
nostro sistema M1 , ..., Mi , ..., Mn ,

(OP1 , ..., OPi , ..., OPn ; v1 , ...vj , ...vn ) ∈ R3n × R3n ,


2
vedremo che in essi, e solo relativamente ad essi, i ‘moti dinamicamente possibili’ sono caratterizzati
dalla ‘legge di Newton’ nella versione del punto 7.

8
è detto spazio degli atti di moto 3 .

1.1.4 Forze
Relativamente alle scelte sopra operate sul sistema in studio, sono assegnate delle leggi
forza mediante delle funzioni che rappresentano per ogni i = 1, ..., n la risultante delle
azioni delle restanti n − 1 particelle sulla particella Mi . In tutta generalità, tali forze
potranno dipendere dalle configurazioni di tutte le particelle, dalle loro velocità, e dal
tempo,
Fi : R3n × R3n × R → R3

(..., OPj , ..., vk , ..., t) 7→ Fi (..., OPj , ..., vk , ..., t).

Il significato operativo di tali azioni sarà precisato tra breve, nella definizione di moti
dinamicamente possibili.
Esempio 1. Per n = 2, le due particelle (punti materiali) M1 , M2 siano mutuamente
interagenti mediante forze elastiche attrattive lineari (p.e. è tesa una molla tra loro), in tal
caso, per qualche costante strutturale h > 0,

Fi : R6 × R6 × R → R3 , i = 1, 2

(OP1 , OP2 , v1 , v2 , t) 7→ F1 (OP1 , OP2 , v1 , v2 , t) := h(OP2 − OP1 ) = hP1 P2 ∈ R3

(OP1 , OP2 , v1 , v2 , t) 7→ F2 (OP1 , OP2 , v1 , v2 , t) := h(OP1 − OP2 ) = hP2 P1 ∈ R3

Si noti che tale assegnazione di legge forza non dipende nè dalle velocità nè dal tempo, in
tal caso diremo che il sistema di forze (F1 , F2 ) è, appunto, posizionale.
Esempio 2. Sia n = 1, supponiamo di voler schematizzare con una legge forza l’azione di
resistenza che un mezzo (es., un liquido) agisce sulla particella in studio M ; tale forza è
(dall’esperienza) tanto più intensa tanto più è intensa la velocità, inoltre si oppone al moto;
schematizziamo tutto ciò cosı̀: per qualche costante strutturale k > 0

F : R3 × R3 × R −→ R3

(OP, v, t) 7−→ F(OP, v, t) := −kv

Questo è evidentemente una assegnazione di legge forza non posizionale.

3
Detto anche spazio delle fasi, sebbene tale nome, a rigore, sia attribuito da molti autori al solo ambiente
della Meccanica Hamiltoniana.

9
1.1.5 Vincoli e loro descrizione geometrica
Supponiamo ora di introdurre mediante dei meccanismi ideali delle restrizioni alle confi-
gurazioni fin qui ammissibili per il nostro sistema. Diremo che il nostro sistema di punti
materiali è vincolato in maniera olonoma se, per ogni t ∈ R, le configurazioni possibili a
quell’istante, sono rappresentate da una sottovarietà N -dimensionale St ⊂ R3n , N < 3n.
Diremo che il nostro sistema è vincolato in maniera anolonoma se le restrizioni coinvolgono
anche le velocità, asserendo che, per ogni t ∈ R, le configurazioni e velocità possibili sono
date da una sottovarietà At dello spazio degli atti di moto del sistema libero, At ⊂ R3n ×R3n .
Ci occuperemo del seguito fondamentalmente di vincoli olonomi.
Allo stato attuale, iniziale, di costruzione della teoria non ci preoccuperemo della defi-
nizione rigorosa della nozione di ‘sottovarietà’ e più in generale di ‘varietà’; tentereremo di
introdurla in modo operativo e cureremo in modo rigoroso solamente il suo aspetto locale.
Supponiamo che il nostro sistema di n particelle, che in assenza di vincoli avrebbe a dispo-
sizione tutto R3n quale spazio di configurazione, sia appunto vincolato in un sottoinsieme
di R3n . Tale sottoinsieme sia dato dagli zeri di qualche funzione f abbastanza regolare,
almeno di classe C 1 per poter applicare il teorema della funzione implicita che qui sotto
richiamiamo a nostro uso, ma anche di più (C 3 ) per i nostri scopi legati alla meccanica.
Daremo inizialmente, per tentativo di chiarezza, un esempio di vincolo indipendente dal
tempo. Dunque, sia data
f : R3n −→ Rk
 
(OP1 , ...., OPn ) 7−→ fα (OP1 , ...., OPn )

α=1,...,k

e affermiamo di aver realizzato un meccanismo che vincola il sistema in


n o
S = f −1 (0) = (OP1 , ...., OPn ) : f (OP1 , ...., OPn ) = 0 ⊂ R3n ,

f1 (OP1 , ...., OPn ) = 0


....
fα (OP1 , ...., OPn ) = 0
....
fk (OP1 , ...., OPn ) = 0
In tutta generalità, se f non è lineare, l’insieme S non ha proprietà algebriche interessan-
ti, in altre parole, non è un sottospazio vettoriale di R3n : tale fatto genera una prima
grande difficoltà4 : il problema della ‘descrizione geometrica’, della parametrizzazione di
tale insieme S. Il teorema della ‘funzione implicita’ (detto t. del Dini) ci aiuterà, almeno
(i) (i) (i) (i)
localmente. Useremo la seguente notazione OPi = (x1 , x2 , x3 ) = (xΓ )Γ=1,2,3 .
4
sono difficoltà legate a vari aspetti di non-linearità che spesso incontreremo nello studio dei sistemi
dinamici.

10
(Una versione del) Teorema della Funzione Implicita: Sia data una funzione f di classe
C 1 come sopra, k < 3n,
f : R3n −→ Rk
OP 7−→ f (OP )
Sia
i) OP = (OP 1 , ...., OP i , ..., OP n ) un punto di R3n appartenente a
S = f −1 (0): f (OP ) = 0;
ii) valga la seguente ipotesi ‘algebrica’:
il rango del differenziale di f valutato in OP ¯ sia massimo 5 , cioè k,
 ∂f ∂f1

1
(1) ... (n)
 ∂x1 ∂x3 
 .... ... ... 
 ∂f

rk df (OP ) = k, in dettaglio : rk  .... ∂x(i) ... 
α
 (OP ) = k.

 Γ 
 .... ... ... 
 
∂fk ∂fk
(1) ... (n)
∂x1 ∂x3

Esiste allora un intorno aperto U in R3n−k ed una mappa C 1 su di esso definita, e a valori
in R3n , scriveremo N := 3n − k,

U ⊂ RN −→ R3n

q = (q1 , ..., qh , ..., qN ) 7−→ OP


g (q)

tale che
(1) f (OP
g (q)) = 0 ∀q ∈ U, (2) OP g (U) è un insieme aperto di S nella sua topologia
indotta, OP ∈ OP (U), e OP (·) stabilisce un omeomorfismo di U nell’immagine OP
g g g (U) ⊂ S.

Osservazione 1. Tale teorema ci dice che possiamo utilizzare le variabili q come parametri
descriventi localmente S, infatti per (1) siamo sicuri OP = OPg (q) ∈ S, inoltre, per (2),
con tale mappa descriviamo ‘localmente ma completamente’ S perché OP g (U) è un insieme
N
aperto di S, nella sua topologia indotta. Tali variabili q ∈ U ⊂ R si dicono coordinate
Lagrangiane (locali) per S.
Osservazione 2. La mappa inversa dell’omeomorfismo sopra descritto,
g (U) 3 OP 7−→ q = q(OP ) ∈ U ⊂ RN ,
S ⊃ OP

si dice carta locale per S: descrive un pezzo dell’oggetto non lineare S con un pezzo dello
spazio vettoriale RN , proprio come le carte geografiche.
5
si richiama che al differenziale di f valutato in un punto, che è una mappa lineare, resta associata una
matrice di k righe e 3n colonne.

11
Osservazione 3. Un’attenta ispezione della dimostrazione (e di enunciati non necessaria-
mente legati all’applicazione in meccanica) del teorema del Dini mostra che le coordinate
(1) (n)
Lagrangiane q1 , ..., qN , N = 3n − k, sono selezionabili tra le 3n variabili x1 , ...., x3
complementari rispetto alle k colonne rispetto alle quali leggiamo il rango massimo nella
matrice del differenziale sopra introdotta. Consideriamo il seguente esempio: Superficie
sferica di raggio R > 0.
Sia n = 1, k = 1 e sia f data:
f : R3 −→ R
(x1 , x2 , x3 ) 7−→ f (x1 , x2 , x3 ) = (x1 )2 + (x2 )2 + (x3 )2 − R2
n o
S = f −1 (0) = (x1 , x2 , x3 ) : (x1 )2 + (x2 )2 + (x3 )2 − R2 = 0

Consideriamo per esempio il punto OP = (x̄1 , x̄2 , x̄3 ) = (0, 0, R), il ‘polo nord’ di S.
 
∂f ∂f ∂f  
rk df (OP ) = rk ∂x 1 ∂x2 ∂x3

OP
= rk 2x1 2x2 2x3 OP = rk 0 0 2R = 1 = k.

Le variabili q1 , q2 sono identificabili con x1 , x2 , la mappa OP


g è data da (N = 3 − 1 = 2)

 x1 = q1
U := {x2 + y 2 < R2 } 3 (q1 , q2 ) 7→ OP
g (q1 , q2 ) = x2 = qp
2
x3 = R2 − (q1 )2 − (q2 )2

Dunque, la mappa stabilisce l’omeomorfsmo tra la calotta ‘boreale’ (senza equatore) e il


disco aperto di R2 di raggio R. Se ora consideriamo, per esempio, il ‘polo sud’ OP ¯ =
(0, 0, −R), allora la nuova mappa è data da

 x 1 = q1
U := {x2 + y 2 < R2 } 3 (q1 , q2 ) 7→ OP
g (q1 , q2 ) = x2 = q2p
g
x3 = − R2 − (q1 )2 − (q2 )2

Osservazione 4. (Non ci si curi di approfondire i concetti qui di seguito velocemente accen-


nati, almeno strettamente in relazione a questo primo corso di Fisica Matematica) Diremo
Sottovarietà Differenziale di R3n un sottoinsieme S di R3n , con la topologia indotta, che
ammetta un ricoprimento aperto {Uρ }ρ∈I , (Uρ )◦ = Uρ , S = ∪ρ∈I Uρ , tale che su ogni Uρ sia
definita una mappa ‘carta locale’ come sopra, a valori in opportuni aperti di uno stesso RN ,
ed inoltre tale che relativamente agli aperti per cui Uρ ∩ Uρ0 6= ∅ esista un diffeomorfismo
locale6 q 0 = q 0 (q) —e l’inverso q = q(q 0 )— rappresentante il ‘cambio di coordinate’ dalle q
alle q 0 , —con qualche altra precisazione topologica su cui ora non entriamo in merito (Hau-
sdorff, paracompattezza). L’insieme di tali carte locali si chiama, chiaramente, Atlante. Il
6
per esempio, sulla sfera prima descritta, q potrebbero essere due coordinate cartesiane nel disco aperto di
raggio R privato del segmento-raggio dei punti dall’origine (0, 0) al punto (0, R), mentre q 0 delle coordinate
polari, angolo θ e raggio r, (θ, r) appartenenti al rettangolo aperto ]0, 2π[×]0, R[.

12
numero N è detto Dimensione di S. Benché non ogni sottovarietà si descriva globalmente
come zeri di funzione, localmente questo è sempre possibile.
Osservazione 5. Spazi Tangenti ad una varietà vincolare S. Formalmente, pensando alle
sottovarietà immerse in R3n , lo spazio tangente in OP a S,

TOP S

è la varietà affine immersa in R3n che contiene OP , che ha la stessa dimensione di S, e che
‘approssima al primo ordine’ S. (Primo esempio semplice a cui pensare: curva differenziale
e retta tangente in un suo punto.) Definizione alternativa equivalente: è l’insieme delle
classi di equivalenza delle locali curve differenziali ] − , [ 3 λ 7→ OP (λ) ∈ S a valori in S
e transitanti per λ = 0 per il punto OP , ove la relazione di equivalenza è:

d d
OP (·) ∼ OP 0 (·) se e solo se OP (0) = OP 0 (0)
dλ dλ
• La varietà vincolare S sia localmente descritta come zeri di una funzione f : in tal caso,
le curve sopra descritte, tra le quali abbiamo definito la relazione d’equivalenza ∼, hanno
la proprietà
f (OP (λ)) = 0 ∀λ ∈ ] − , [,
differenziando rispetto a λ e valutando in λ = 0, denotando con il simbolo (è un uso antico
in meccanica)
d d
δP := OP (0) = ... = OP 0 (0)
dλ dλ
il vettore ‘velocità’ caratterizzante la classe, osserviamo che

d
0= [f (OP (λ))]|λ=0 = df (OP (0))δP

Dunque:
TOP S = ker [df (OP )] (ker : nucleo) (∗)
•• La varietà vincolare S sia localmente descritta con una mappa d’immersione vincolare
U 3 q 7→ OPg (q) ∈ R3n : in tal caso costruiremo l’insieme delle curve componendo la
mappa d’immersione OP g (·) con tutte le arbitrarie curve differenziali λ 7→ q(λ) a valori in
U e transitanti per il medesimo q̄ per cui OP = OPg (q̄),

d g g (q̄) d q(0),
δP = [OP (q(λ))]|λ=0 = dOP
dλ dλ
d
ove i vettori dλ q(0) percorrono tutto RN . Dunque:

TOP S = im [dOP
g (q̄)] (im : immagine) (∗∗)

13
Osservazione 6. Spostamenti Virtuali. A volte il vincolo è rappresentato da una varietà
mobile, dipendente dal tempo. Si pensi per esempio ad una particella (n = 1) vincolata
sopra una superficie sferica con raggio ‘pulsante’ R(t) = 2 + sin t. Ad ogni t ∈ R, tale
varietà sarà descritta dagli zeri di una funzione che ora dipenderà dal tempo:
f : R3n × R −→ Rk
 
(OP1 , ...., OPn , t) 7−→ fα (OP1 , ...., OPn , t)

α=1,...,k
n o
St = OP ∈ R3n : f (OP, t) = 0
Si ripercorrono, parametricamente per ogni t fissato, le costruzioni di prima: in sostanza,
per t fissato, si ‘congela’ temporalmente la varietà mobile e si costruiscono, per esempio,
gli spazi tangenti TOP St , naturalmente se OP ∈ St ; è uso classico in meccanica chiamare
spostamenti virtuali i vettori δP degli spazi TOP St .

1.1.6 Vincoli e loro descrizione dinamica


Il modo, l’azione, con cui il vincolo fa sentire la sua presenza sulle particelle, vincolandole
su di sé, è rappresentato da forze, che chiameremo Reazioni Vincolari. Tale affermazione a
volte è chiamata nei manuali classici, come il Levi Civita-Amaldi, Postulato delle Reazioni
Vincolari. Accanto dunque alla descrizione geometrica del vincolo, dovremo dichiarare
la classe ΥOP,v,t delle reazioni vincolari esplicabili da tale vincolo. Dunque il vincolo è
completamente descritto quando accanto alla sua definizione geometrica (p.e., sottovarietà
di R3n ) si dichiara anche l’insieme ΥOP,v,t , che rappresenta, per ogni (OP, v) —atto di moto
consentito geometricamente dal vincolo al tempo t— , l’insieme delle reazioni vincolari, o
forze vincolari, che a quel dato istante e in quel dato atto di moto il vincolo può esplicare
per mantenere il sistema, appunto, vincolato su di sè. Si noti che a differenza delle leggi
forza, per le reazioni vincolari non c’è una legge costitutiva, una funzione, che ad ogni
(OP, v) ad un dato istante t associa un ben preciso vettore Φ = (Φ1 ..., Φi , ..., Φn ) ∈ R3n ;
la situazione nuova è la seguente: ad ogni (OP, v), ad un dato istante t, si associa un ben
preciso insieme di vettori reazioni vincolari esplicabili, ΥOP,v,t .
Per esempio, per n = 1, nel caso olonomo indipendente dal tempo, il vincolo sia dato
geometricamente da una superficie 2-dim S in R3 ; diciamo ora che tale vincolo sia privo
di attrito, cioè il vincolo sia in grado di esplicare tutte e sole le reazioni vincolari con
componente tangenziale a S nulla: pertanto, per ogni configurazione geometricamente
consentita OP ∈ S, l’insieme ΥOP,v,t = ΥOP è rappresentato da tutti e soli i vettori che
appartengono alla retta passante per OP e ortogonale a S. Rappresentano casi di forte
interesse fisico la classe dei vincoli privi d’attrito, la classe dei vincoli con attrito nel modello
di Coulomb e la classe dei vincoli lisci (o ideali), che, come vedremo tra breve, contiene
propriamente la classe dei vincoli privi d’ attrito.

14
1.1.7 Moti Dinamicamente Possibili
Nel sistema di riferimento inerziale scelto, in cui abbiamo costruito gli oggetti descriventi
il sistema materiale vincolato, ed in ogni altro sistema di riferimento inerziale (lo studio di
quest’ultimo aspetto necessita di un accurato sviluppo della cinematica relativa), vale la
seguente costruzione dei moti dinamicamente possibili. Questo è in sostanza il contenuto
della Seconda Legge della Meccanica Classica.
Diremo che la curva due volte differenziabile

R ⊇ I 3 t 7→ OP (t) = (OP1 (t), ..., OPi (t), ..., OPn (t)) ∈ R3n

è un moto dinamicamente possibile se, per ogni istante t in cui il moto è definito,
i) il vincolo è capace di esplicare delle reazioni vincolari

t 7→ (..., Φi (t), ...) ∈ ΥOP (t), d OP (t),t


dt

tali che valgano, ∀t ∈ I,


d2 d
mi 2
OPi (t) = Fi (..., OPj (t), ..., OPk (t), ..., t) + Φi (t), i = 1, ..., n
dt dt
ii) il moto soddisfa geometricamente al vincolo: (..., OPi (t), ...) ∈ St ⊂ R3n , ∀t ∈ I.
Notiamo che a questo stadio di generalità le incognite del nostro problema dinamico sono
date sia dal moto, sia dalle reazioni vincolari lungo quel moto: le equazioni dinamiche
sopra scritte non sono dunque necessariamente interpretabili come equazioni differenziali e
non sono quindi, in prima misura, trattabili direttamente con i metodi usuali dell’analisi.
Un caso in cui la legge fondamentale della meccanica sopra introdotta è subito interpretabile
come equazione differenziale è il caso dell’assenza di vincolo: S = R3n , ΥOP,v,t = {0}. In
tal caso i moti dinamicamente possibili sono dati da tutte e sole le soluzioni della seguente
equazione differenziale del secondo ordine in R3n , eventualmente dipendente dal tempo (se
le forze lo sono)
d2 d
mi 2 OPi (t) = Fi (..., OPj (t), ..., OPk (t), ..., t)
dt dt
Molto spesso i teoremi sulle equazioni differenziali che si trovano nei manuali di analisi
matematica sono per equ. diff. nel formato del primo ordine, eventualmente dipendenti
dal tempo. Questo non è un grave problema perché rapidamente traduciamo le nostre eq.
diff. del secondo ordine (nello spazio delle configurazioni) in eq. diff. del primo ordine
(nello spazio degli atti di moto), basta opportunamente raddoppiare le incognite, cosı́:
...
   
...
OPj   vj 
6n  , Z : R6n × R → R6n
   
 ...  ∈ R , Z(z, t) :=  1
z :=    ... 
 vi   Fi (OP, v, t)
mi
... ...

15
Pertanto il problema fondamentale della ricerca dei moti dinamicamente possibili (solo per
il momento ristretto al caso di assenza di vincolo) diventa: determinare curve R ⊇ I 3 t 7→
z(t) ∈ R6n per cui, ∀t ∈ I,
ż(t) = Z(z(t), t) (†)
La funzione Z(z, t) si chiama campo vettoriale; pensiamo al caso, per semplicità, indipen-
dente dal tempo, z 7→ Z(z), essa va cosı́ interpretata geometricamente:
in ogni punto z dello spazio7 (pensiamolo pure ‘affine’) attacchiamo il vettore Z(z), e in
questa ‘selva di frecce’ le curve risolventi sono quelle curve differenziabili le cui velocità
sono, punto per punto z(t) ove transitano, esattamente le frecce-vettori assegnate Z(z(t)).
Un teorema fondamentale di Cauchy, riportato qui sotto, ci dice sostanzialmente che un po’
di regolarità analitica per Z permette di affermare l’esistenza di una ed un’unica soluzione
locale di (†) che transita ad un dato istante prefissato t0 per il punto(=posizione+velocità)
z0 . Quando questo teorema funziona in meccanica, si parla spesso di ‘determinismo
classico’.
(Una versione del) Teorema di esistenza e unicità locale per i problemi di Cauchy
delle equazioni differenziali ordinarie : Sia il campo vettoriale dipendente dal tempo
Z,
Z : U (⊆ R6n ) × I(⊆ R) −→ R6n , z0 ∈ U = U ◦ , t0 ∈ I = I ◦
continuo e, uniformemente in t ∈ I, Lipschitziano in z,

|Z(z1 , t) − Z(z2 , t)| ≤ L|z1 − z2 |, ∀z1 , z2 ∈ U, per qualche L > 0.

Allora esiste un sottointervallo aperto I¯ ⊆ I contenente t0 su cui è definita una ed un’unica


curva I¯ 3 t 7→ z(t) ∈ U soddisfacente l’equazione differenziale (†) e transitante per il ‘dato
iniziale’ z(t0 ) = z0 .
Osservazione importante: Vedremo che tale schema deterministico, consistente nella teoria
elementare delle equazioni differenziali, sarà utilizzabile anche in una importante classe di
sistemi vincolati: i sistemi olonomi lisci.

1.2 Quiete ed Equilibrio


Un moto si dice di quiete se è costante:

t 7→ OPi (t) ≡ OPi∗ .

Diremo che una configurazione consentita dai vincoli

(OPi∗ )i=1,...,n = (..., OPi∗ , ...) ∈ St


7
in questo caso, spazio degli atti di moto o spazio delle fasi.

16
è di equilibrio per il nostro sistema meccanico se il moto di quiete in tale configurazione è
dinamicamente possibile; più in dettaglio, (OPi∗ )i=1,...,n è di equilibrio se il vincolo è capace
di esplicare delle reazioni vincolari t 7→ (..., Φi (t), ...) ∈ ΥOP ∗ ,0,t tali che, per ogni t,

0 = Fi (..., OPj∗ , ..., 0, ..., t) + Φi (t), (..., OPi∗ , ...) ∈ St .

Si noti con attenzione che mentre l’equilibrio è una configurazione, la quiete è un moto.
E’ pure importante la seguente osservazione: Il fatto che una certa configurazione sia
d’equilibrio non implica necessariamente che il moto conseguente al porre il sistema in
quella configurazione con atto di moto nullo
√ sia la quiete. Esempio. Una particella di
3
massa m soggetta alla forza F(OP ) = OP · u u è vincolata senza attrito su di un
asse X parallelo al versore u e contenente l’origine. E’ facile mostrare (farlo) che i moti
dinamicamente possibili sono dati da tutte e sole le soluzioni di

mẍ = 3 x,

ove x è l’ascissa sull’asse X; x∗ = 0 è configurazione d’equilibrio, ed il Problema di Cauchy


x(0) = 0, ẋ(0) = 0 è soddisfatto, oltre da x(t) ≡ 0, da altre infinite soluzioni (trovarle, e
meditare sulla Lipschitzianità assente).

1.3 Vincoli privi d’attrito


E’ di importanza cruciale la ricerca e la definizione di modelli di vincolo, che da un lato
siano fisicamente interessanti, utili, dall’altro porgano una descrizione dei moti dinamica-
mente possibili trattabile matematicamente, riuscendo, tra l’altro, a scindere la difficoltà
della determinazione del moto (teoria delle equazioni differenziali, problema di Cauchy
ed eventuale determinismo-unicità) da quella della determinazione delle reazioni vincolari.
Consideriamo a tal scopo i sistemi cosiddetti privi d’attrito, già precedentemente accennati.
Per fissare le idee, consideriamo una particella vincolata su una varietà S 1-dimensionale
(curva) o 2-dimensionale (superficie). Diciamo che tale vincolo è privo di attrito, se non
sono ammissibili componenti tangenziali di reazione vincolare al piano tangente locale alla
configurazione: pertanto, nel caso 1-dimensionale per ogni configurazione geometricamente
consentita OP ∈ S, l’insieme ΥOP è rappresentato da tutti e soli i vettori che appartengono
al piano ortogonale alla retta tangente a S in OP ; nel caso 2-dimensionale per ogni confi-
gurazione geometricamente consentita OP ∈ S, l’insieme ΥOP è rappresentato da tutti e
soli i vettori che appartengono alla retta ortogonale al piano tangente locale a S in OP .

17
1.4 Un sistema meccanico la cui dinamica è retta dall’equa-
zione differenziale ẍ = f (x), con x ∈ R1
(Attenzione: all’interno di questo lungo esempio è introdotta la nozione di Integrale Primo.)

Studiamo in dettaglio il sistema dinamico composto da una particella P di massa m > 0,


che è soggetta alla (legge) forza posizionale, indipendente dal tempo, data da:
F : R3 −→ R3 , OP 7−→ F(OP ).
La forza F = (F1 , F2 , F3 ) non sia necessariamente conservativa, cioè l’associata 1-forma
differenziale “Lavoro” δL in R3 , i cui coefficienti sono dati proprio dalle componenti della
funzione F,
δL : R3 −→ (R3 )∗ , OP 7−→ δL(OP ) = F(OP ) · δOP, ∀δOP ∈ R3
non sia necessariamente chiusa (qui, in R3 , la condizione di chiusura si scrive: rot F = 0), e
dunque, visto che l’ambiente R3 è semplicemente connesso, non sia necessariamente esatta
(ma su tali aspetti si insisterà altrove).
Introduciamo il vincolo geometrico olonomo 1-dimensionale (una “guida”), di cui una
generica immersione vincolare, regolare (almeno C 2 ), sia data da:
R 3 λ 7−→ OP (λ) ∈ R3 .
A questa generica parametrizzazione della curva chiederemo, oltre alla regolarità, che non
ammetta punti λ∗ tali che dOP ∗
dλ (λ ) = 0, ciò è un fatto puramente tecnico. La particella
ora è vincolata su tale guida: preliminarmente, studieremo in dettaglio la geometria della
curva, mediante il

Triedro di Frênet: ‘Rettifichiamo’ la curva, cioè misuriamone la lunghezza, il che è


equivalente all’introduzione del parametro (lunghezza) d’arco s = s(λ):
Z λ
dOP 0
q
0
s(λ) := (λ ) dλ , ove W := W12 + W22 + W32 .


3 3
0 R R

ds(λ)
L’ipotesi che dOP
dOP
=
6 0 mostra che = (λ) 3 > 0 e dunque la mappa λ 7→

dλ dλ dλ R
s(λ) è un diffeomorfismo di R in R. E’ cosı́ ben definita l’inversa s 7→ λ̄(s), e con essa
riparametrizziamo la curva col parametro d’arco s:
g (s) := OP (λ̄(s)) ∈ R3 .
R 3 s 7−→ OP

Notiamo subito che la funzione vettoriale tangente dOP


ds (s) ha identicamente norma euclidea
g

unitaria:
dOP dOP dλ̄
g
(s) 3 = (λ) λ=λ̄(s) (s) 3 ≡ 1.

ds dλ ds

R R

18
Tale derivata la chiameremo versore (=vettore unitario) tangente:

dOP
g
t(s) := (s).
ds

dt
Studiamo la derivata di t. Indichiamo con n, laddove è definito ( ds (s) 6= 0), il seguente
versore:
dt
ds (s)
n(s) :=

.
dt
ds (s)

Per esempio, per una retta t è costante, dunque n non è (ovunque) definito. Anzi,
quest’esempio ci suggerisce di definire come curvatura k della curva in s la quantità scalare:
dt
k(s) := (s) .

ds
Introduciamo pure la definizione
1
ρ(s) := .
k(s)
Si noti che i versori t e n sono tra loro ortogonali, infatti (t · t ≡ 1):
d n(s)
0= (t(s) · t(s)) = 2 t(s) · .
ds ρ(s)

Teorema. Per ogni s tale che k(s) 6= 0,


i) il versore n(s) punta verso il centro del locale cerchio osculatore di cui
ii) ρ(s) ne è il raggio.
Prova. Mentre la retta tangente in s∗ è l’approssimazione di primo ordine (lineare in s)
alla curva, il cerchio osculatore in s∗ è, per definizione, l’approssimazione di secondo ordine
(quadratica in s) alla curva in un punto s∗ . Infatti, sia (non è restrittivo) s∗ = 0, allora
localmente

OP g (0) + t(0) s + 1 dt (0) s2 + O(s3 ) = OP


g (s) = OP g (0) + t(0) s + 1 n(0) s2 + O(s3 )
2! ds 2! ρ(0)

Notiamo che, al secondo ordine in s (cioè a meno di O(s3 )), la curva è descritta nel piano π
passante per il punto OP
g (0) e generato dai vettori t(0) e n(0). In tale piano consideriamo
il cerchio che passa per OP
g (0), ha raggio ρ(0), e centro in OC = OP ˜ (0) + ρ(0)n(0). (Si
abbozzi in un disegno un piano cartesiano in cui il versore x̂ è n(0) e il versore ŷ è t(0)).
Scriviamo l’equazione parametrica di tale cerchio nel parametro lunghezza d’arco s:
 
s s
OQ(s) = OP (0) + ρ(0) sin
g t(0) + ρ(0) 1 − cos n(0).
ρ(0) ρ(0)

19
Calcoliamo derivate prime e seconde di OQ(s) in s = 0:
d  s s 
OQ(s) s=0 = cos t(0) + sin n(0) s=0 = t(0),
ds ρ(0) ρ(0)
d2  1 s 1 s  n(0)
2
OQ(s)
s=0
= − sin t(0) + cos n(0)
s=0
= .
ds ρ(0) ρ(0) ρ(0) ρ(0) ρ(0)
Dunque, effettivamente tale cerchio cosı̀ costruito approssima la curva, localmente in s∗ = 0,
al secondo ordine.

Definiamo infine il versore binormale


b(s) := t(s) ∧ n(s).

Infine: in ogni punto OP


g (s) della curva, con curvatura non nulla, resta definito il triedro

ortonormale levogiro t(s), n(s), b(s) , detto triedro di Frênet.
Sia ora t 7→ s(t) un moto geometrico, cinematico, non necessariamente dinamicamente
possibile, per P . Determiniamo le associate grandezze cinematiche: velocità ed accele-
razione.
d hg i
v(t) = OP (s(t)) = t(s(t)) ṡ(t),
dt
d2 h g i dh i d
a(t) = 2 OP (s(t)) = t(s(t)) ṡ(t) = t(s(t)) ṡ2 (t) + t(s(t)) s̈(t),
dt dt ds
n(s(t)) 2
a(t) = t(s(t)) s̈(t) + ṡ (t).
ρ(s(t))

(Si veda pure: G. De Marco, Analisi Due/1, cap. 3, Par. 9 e 10, oppure G. De Marco,
Analisi Due (seconda edizione) alla fine del cap. 3.)
Riprendiamo ora la descrizione del nostro sistema dinamico. Sia t 7→ s(t) un generica
evoluzione di P sulla guida. Supponiamo che la particella sia vincolata senza attrito sulla
guida: ciò è equivalente a dire che la classe delle reazioni vincolari esplicabili, quando l’atto
di moto vale
g (s(t)), d OP
 h i
OP g (s(t)) ,
dt
 
è data da tutti e soli i vettori del piano di origine OP g (s), e generato da n(s), b(s) ; in
altre parole, le possibili reazioni vincolari non hanno componente tangente al vincolo.
Ora possiamo dire che un moto t 7→ s(t), e dunque t 7→ OP g (s(t)), è dinamicamente possibile
se e solo se il vincolo è capace di esplicare una reazione vincolare t 7→ Φ(t) con Φ · t ≡ 0
tale che, per ogni tempo t in cui è definito il moto, valga:
d2 h g i  
m 2 OP (s(t)) = F OP g s(t) + Φ(t),
dt

20
proiettando sul triedro mobile di Frênet, risulta:
 
ms̈(t) = F OP g s(t) · t(s(t)),
2
m ṡ% = F · n + Φ · n,
0 = F · b + Φ · b.

Notiamo due fatti fondamentali.


Primo, il problema della determinazione del moto e della reazione vincolare si disac-
coppia: la prima equazione, la t-componente (indipendente da Φ), è interpretabile come
equazione differenziale, da cui determiniamo t 7→ s(t), mentre dalle altre due determine-
remo successivamente Φ = Φ · n n + Φ · b b. La possibilità sistematica della rimozione del
problema vincolare risulterà chiara per una classe di sistemi generalizzanti quello appena
analizzato: i sistemi a vincoli lisci, olonomi e bilaterali (varietà senza bordo).
Secondo, questa equazione differenziale è di tipo cosiddetto integrabile, cioè i problemi
di Cauchy

s̈(t) = f (s(t)),
(∗) s(0) = s0 ,
ṡ(0) = ṡ0 ,

ove la funzione f è ben definita mediante m, F(·), OP


g (·) e le sue derivate:

1  g 
f (s) := F OP s · t(s),
m
si risolvono a meno del calcolo di primitive di integrali e di inversioni di funzioni. Questa
proprietà, goduta dai sistemi differenziali lineari, è rarissima nel caso non lineare, come
appunto quello che stiamo trattando. Qui nel seguito realizzeremo questo programma.
Nelle ipotesi di regolarità scelte per F e per la curva-guida (C 2 ), segue che f è C 1 , in
particolare Lipschitziana, dunque il teorema di esistenza ed unicità per i problemi di Cauchy
vale: (∗) ammette una ed un unica soluzione locale (nel tempo, per t in un intervallo
aperto contenente lo zero). Mostriamo che (∗) ammette il seguente integrale primo, di tipo
‘energia’ Z s
2 1 2
R 3 (s, ṡ) 7−→ E(s, ṡ) := ṡ − f (λ) dλ ∈ R,
2 s0

infatti lungo le soluzioni s(t) di s̈ = f (s) la funzione E(s, ṡ) s(t) è costante:

d  
E(s(t), ṡ(t)) = ṡ s̈ − f (s) ṡ = s̈ − f (s) ṡ = 0.
dt

Digressione-richiamo sugli integrali primi: data l’equazione differenziale

ẋ = X(x), X : Rm −→ Rm

21
la funzione scalare Rm 3 x 7→ φ(x) ∈ R è un suo integrale primo se lungo ogni sua soluzione
t 7→ x(t) la funzione composta t 7→ φ(x(t)) è costante (naturalmente, la costante varia da
soluzione a soluzione). Utilizzazione geometrica degli integrali primi: abbassamento della
dimensionalità del problema. Infatti, se si conosce l’integrale primo φ, e si vuol indagare
sulla regione di Rm ‘invasa’ dall’orbita soluzione del problema di Cauchy

ẋ = X(x), x(0) = x0 ,

possiamo senz’altro restringerci alla regione (m − 1)−dimensionale φ−1 (φ(x0 )) ⊂ Rm ; in


effetti, lungo l’orbita x = x(t, x0 ), x(0, x0 ) = x0 , si ha che per ogni t: φ(x(t, x0 )) = φ(x0 ),
cioè l’orbita sta sul luogo φ−1 (φ(x0 )). Se si conosce Tun altro integrale primo, diciamo
ψ(x), allora si è sicuri che l’orbita sta su φ−1 (φ(x0 )) ψ −1 (ψ(x0 )), un sottoinsieme ora
(m − 2)−dimensionale (almeno genericamente, certe condizioni di rango devono essere
soddisfatte, vedi sotto). Infine: la conoscenza di m − 1 integrali primi per ẋ = X(x),

φ1 (x), ..., φα (x), ..., φm−1 (x),

‘funzionalmente indipendenti’, cioè:


 
∂φ1 ∂φ1
∂x1 (x) ... ∂xm (x)


rk  ... ... ... = max = m − 1,
 

∂φm−1 ∂φm−1 −1
(x) ... x∈ m−1
∂xm (x)
T
∂x1 α=1 φα (φα (x0 ))

ci permette geometricamente di determinare il luogo 1−dimensionale sostegno della curva


soluzione del suddetto problema di Cauchy.

Si tratta ora di mostrare l’equivalenza del problema (∗) con il seguente problema

1
Rs
2 ṡ2 − s0 f (λ) dλ = 12 ṡ20 ,
(∗∗) s(0) = s0 ,
ṡ(0) = ṡ0 .

Quest’ultimo infatti coinvolge la derivata prima della funzione incognita s(t), in realtà,
invece di un abbassamento dimensionale abbiamo realizzato un abbassamento dell’ordine
di differenziazione della primitiva equazione differenziale che coinvolge la derivata seconda.
Le due procedure sono equivalenti: nel seguente senso, ogni equazione differenziale di ordine
k,

dk d k−1
d k−2
(#) dtk
x = X( dtk−1 x, dtk−2 x, ..., x)

22
si può ridurre al primo ordine aumentando opportunamente le variabili e dunque la dimen-
sionalità:
ẋ0 = x1 ,
ẋ1 = x2 ,
ẋ2 = x3 ,
(##)
.... .......
ẋk−2 = xk−1
ẋk−1 = X(xk−1 , xk−2 , ..., x1 , x0 )

Se x in (#) è in Rm , ora la nuova incognita (x0 , x1 , ..., xk−1 ) ∈ Rkm .

Torniamo al problema dell’equivalenza. Il fatto che (∗) implica (∗∗) è banale, un po’
più delicato è il viceversa. Si noti che in (∗∗) la derivata d’ordine massimo, la prima,
non compare esplicitata rispetto al resto, cioè quell’equazione differenziale non è in forma
normale, questo creerà qualche (superabile) complicazione.
Per fissare le idee, sia ṡ0 6= 0. Supponiamo dunque che t 7→ s(t) risolva (∗∗). Sia t1
il primo istante d’arresto per tale moto, cioè ṡ(t) 6= 0 ∀t ∈ [0, t1 ) e ṡ(t1 ) = 0. Derivando
rispetto al tempo la (∗∗)1 otteniamo
 
s̈(t) − f (s(t)) ṡ(t) = 0,

che per t ∈ [0, t1 ), dunque ṡ(t) 6= 0, implica la (∗)1 . Cosa accade per t ≥ t1 ? Per t = t1
può capitare una delle due seguenti situazioni:
1) s1 = s(t1 ) è d’equilibrio: f (s1 ) = 0,
2) s1 = s(t1 ) non è d’equilibrio: f (s1 ) 6= 0.
Il primo caso non può accadere per t1 finito: infatti se cosı́ fosse il sistema arrivato lı́ con
velocità nulla dovrebbe ivi restarci per sempre, per il teorema di esistenza e unicità, per
ogni t, nel futuro e nel passato di t1 . Dunque sarebbe proprio il teorema di unicità ad
essere violato perché avremmo trovato due soluzioni al problema di Cauchy

s̈(t) = f (s(t)),
s(t1 ) = s1 ,
ṡ(t1 ) = 0,

assurdo, abbiamo supposto f regolare (Lipschitziana). Questa considerazione è generale:


non è possibile raggiungere un equilibrio, in tempi finiti, con velocità nulla.
Resta quindi la seconda possibilità, s1 non è d’equilibrio, e in un intorno ‘forato’ di t1
si ha che f (s(t)) 6= 0, dunque t1 è un istante d’arresto. Per quanto riguarda il nostro
problema dell’equivalenza, in tale intorno forato, dalla s̈(t) − f (s(t)) ṡ(t) = 0 otteniamo
s̈(t) = f (s(t)), e, per continuità, quest’ultima è soddisfatta pure in t = t1 . Per tempi
maggiori di t1 si itera questo procedimento di studio. L’equivalenza di (∗) con (∗∗) è cosı̀
dimostrata.

23
Più precisamente, t1 è un istante di inversione del moto, infatti (Taylor):
1
s(t) = s(t1 ) + 2! f (s1 )(t − t1 )2 + O(|t − t1 |3 ),

ṡ(t) = f (s1 )(t − t1 ) + O(|t − t1 |2 ),

l’ultima di queste relazioni mostra chiaramente che la velocità ṡ(t) cambia segno in t1 .
Procediamo quindi con il problema (∗∗). Dato che abbiamo supposto che ṡ0 6= 0, in un

intorno destro di t = 0, [0, t1 ), la (∗∗) si scrive:


q 2 Rs  
ṡ(t) = sign ṡ0 ṡ0 + 2 s0 f (λ) dλ =: Ψ(s)
s(0) = s0 .

Si risolve per ‘separazione di variabili’. Dato che in [0, t1 ) si ha che Ψs(t)) 6= 0, scriviamo
ṡ(t)
Ψ(s(t)) = 1, e integriamo membro a membro tra 0 e t:

t
ṡ(t0 )
Z
dt0 = t.
0 Ψ(s(t0 ))
Sempre in [0, t1 ) sicuramente il moto soluzione t 7→ s(t) è un diffeomorfismo con l’immagine,
usiamolo per operare un cambio di variabile d’integrazione
Z s
1
0)
ds0 = t.
s0 Ψ(s

Indichiamo con G(s) la primitiva del primo membro: l’inversione di G(s) = t è esattamente
la soluzione cercata t 7→ s(t).

1.4.1 Diagramma di Fase per ẍ = f (x)

Le anti-immagini, le ‘fibre’, della funzione


x
1 2
Z
R2 3 (x, ẋ) 7−→ E(x, ẋ) := ẋ − f (λ) dλ ∈ R, (a : fissato)
2 a

rappresentano il sostegno delle curve soluzione dei problemi di Cauchy per l’equazione
ẍ = f (x):
E −1 (e) = {(x, ẋ) : E(x, ẋ) = e}.
Studiamone la geometria globalmente.
• il grafico di E −1 (e) in R2 è simmetrico rispetto all’asse x: in effetti, E è funzione pari in
ẋ.

24
• Il teorema della funzione implicita ci assicura che E −1 (e) è regolare (una ‘varietà’ 1-
dimensionale in R2 ) se il rango
 
rk ∂E∂x
∂E
∂ ẋ E −1 (e)
= −f (x) ẋ E −1 (e) = max = 1.

Studiamo gli eventuali punti singolari, questi sono i punti (x∗ , ẋ∗ ) che annullano i due
elementi della matrice: f (x∗ ) = 0, ẋ∗ = 0. Dunque questi punti sono esattamente le
configurazioni d’equilibrio per ẍ = f (x), assieme a ẋ∗ = 0, dato che stiamo leggendo la
nostra equazione nello spazio degli atti di moto o delle fasi. Tali punti singolari sono tutti
e soli sull’asse x.
• Possono esistere rami di E −1 (e) con punti (x, ẋ), ẋ 6= 0, nei quali la tangente sia verticale,
parallela all’asse ẋ? No, le locali funzioni x 7→ ẋ(x) —i cui grafici sono in {(x, ẋ) ∈ R2 :
ẋ > 0} e {(x, ẋ) ∈ R2 : ẋ < 0}, e definite negli intervalli aperti (x1 , x2 ) tra consecutivi punti
di intersezione con l’asse x, (x1 , 0), (x2 , 0)— sono differenziabili, quindi la fenomenologia
sopra descritta non può accadere.
• Sui rami di E −1 (e) possiamo agevolmente stabilire il verso di percorrenza: questo sarà
inequivocabilmente stabilito dal locale segno di ẋ: per esempio, se E −1 (e) è una curva
chiusa (naturalmente, simmetrica rispetto all’asse x) allora essa è percorsa in senso orario.
• Proseguendo con l’esempio di E −1 (e) curva chiusa, se essa è regolare allora necessaria-
mente interseca l’asse x due volte e con tangente, diciamo in (x1 , 0) e (x2 , 0), verticale, cioè
parallela all’asse delle ẋ. Curve E −1 (e) che intersecano l’asse x in x̄ con angoli diversi da
π/2 sono necessariamente ivi singolari, e danno luogo a rami intersecantesi in x̄: esempio,
le separatrici del pendolo in x(= θ) = π.
• Ancora con l’esempio di E −1 (e) curva chiusa. Il moto è periodico, e il periodo si calcola
(verificarlo): Z x2
dx
T =2 r  .
x1 R x
2 e + a f (λ)dλ

E’ interessante notare la relazione Periodo-Energia: Sia A(e) l’area racchiusa dalla curva
chiusa E −1 (e), essa vale
Z x2 Z x2 s  Z x 
A(e) = 2 ẋ(x; e)dx = 2 2 e+ f (λ)dλ dx,
x1 x1 a

dove x 7→ ẋ(x; e) è l’esplicitazione nel semipiano ẋ > 0 di E(x, ẋ) = e; si osserva che:
dA
T = (e).
de

25
Grafico della funzione Energia Totale per il Pendolo

26
Altri esempi a questo stadio facilmente risolubili. Consideriamo una particella vincolata
senza attrito su di un piano π e una legge forza F(OP, v) (eventualmente lineare: in tal
caso infatti le soluzioni sono rappresentabili mediante funzioni elementari). Introdotto un
riferimento (O, x1 , x2 , x3 ) con (O, x1 , x2 ) coincidente con π, con un procedimento analogo al
precedente (ora si proietta l’equazione fondamentale della Meccanica sui tre assi xi ) si nota
ancora il disaccoppiamento della determinazione del moto dalla reazione vincolare. Tale
moto sarà governato da un’ equazione differenziale del secondo ordine nel piano, fornente
t 7→ (x1 (t), x2 (t)).

Prima di procedere ulteriormente, estendiamo la nozione di lavoro virtuale al caso di n par-


ticelle. Sia F = (F1 , ..., Fn ) ∈ R3n un insieme di vettori applicati in OP = (OP1 , ..., OPn ),
configurazione ammissibile ad un vincolo (eventuamente dipendente dal tempo) St ⊂
R3n , t ∈ R. Si consideri lo spazio tangente a St per t fissato (vincolo ‘congelato’). In-
dichiamo con δP = (δP1 , ..., δPn ) ∈ TOP St il generico vettore tangente locale. Allora
diremo lavoro virtuale della distribuzione di forze F in OP la ‘forma lineare’, o ‘1-forma’,
elemento del duale TOP ∗ S di T
t OP St , che essa individua:
n
X
F
δL := Fi · δPi (· : prodotto scalare in R3 ).
i=1

1.5 Metodo di Lagrange per la determinazione delle Rea-


zioni Vincolari
Consideriamo un sistema di n particelle vincolate senza attrito in maniera olonoma su di
una varietà S definita mediante zeri di k funzioni regolari (differenziabili con continuità un
giusto numero di volte):
fα (OPi ) = 0, α = 1, ..., k f : R3n → Rk .
Supponiamo che siano funzionalmente indipendenti su S:
rango(df )|S = k.
Dire che il vincolo è privo d’attrito significa equivalentemente che, per ogni configurazione
prefissata OP ∗ del nostro vincolo olonomo (indipendente dal tempo) S, le n-uple di reazioni
vincolari esplicabili Φ = (Φ1 , ..., Φn ) sono tutte e sole quelle che fanno lavoro nullo per
ogni spostamente virtuale (vettore tangente) δP = (δP1 , ..., δPn ) consentito dal vincolo:
n
X
df (OP ∗ )δP = 0 ⇒ dLΦ := Φ · δP = Φi δPi = 0.
i=1

Dunque, il nucleo dell’applicazione lineare differenziale df (OP ∗ ) : R3n → Rk è contenuto


nel nucleo dell’applicazione lineare 1-forma lavoro delle reazioni vincolari dLΦ : R3n → R.

27
Usando il classico teorema di omomorfismo (per spazi vettoriali) (vedi: De Marco, Analisi
Due/1, p.331) concludiamo che esiste una mappa lineare Λ : Rk → R tale che

k
X
dLΦ = Λ ◦ df (OP ∗ ), o, equivalentemente : Φi = λα ∇OPi fα (OP ∗ )
α=1

dLΦ
R3n −→ R

df (OP ∗ ) ↓ % Λ

Rk

Le componenti di Λ = (λ1 , ..., λk ) sono i ben noti Moltiplicatori di Lagrange. Infine, i moti
dinamicamente possibili consistono nelle soluzioni del sistema algebrico-differenziale
d2
OPl (t), t) + kα=1 λα (t)∇OPi fα (OPj (t)),
 d P
 mi dt 2 OPi (t) = Fi (OPj (t), dt

fα (OPj (t)) = 0

nelle incognite t 7→ (OPi (t), λα (t)).

Esercizio (importante). Verificare che il sistema algebrico-differenziale sopra scritto porge


in modo univoco le λα e dunque le reazioni vincolari. (Suggerimento: derivare due volte
rispetto al tempo le fα composte con le soluzioni, con l’espressione cosı̀ ottenuta eliminare
le accelerazioni dalle equazioni dinamiche, quindi, usando l’indipendenza funzionale delle
fα , esplicitare le λα rispetto all’atto di moto).
Soluzione: Sia fβ (OP ) = 0, β = 1, ..., k ≤ 3n, (OP ) ∈ R3n . Un moto t 7→ OPi (t),
t ∈ I è dinamicamente possibile se e solo se fβ (OP (t)) = 0 ∀t ∈ I e vale:

k
d2 d X
mi OPi (t) = F i (OP (t), OP (t), t) + λα (t)∇OPi fα (OP (t)) (1)
dt2 dt
α=1

Le incognite del problema sono sia i moti che i moltiplicatori cioè t 7→ (OPi (t), λα (t)).
Deriviamo rispetto al tempo fβ (OP (t)) = 0 e otteniamo:
n
X d
∇OPi fβ (OP ) · OPi (t) = 0
dt
i=1

28
Derivando di nuovo si ottiene:
* +
X d d X d2
∇2OPk OPi fβ · OPk (t), OPi (t) + ∇OPi fβ · 2 OPi (t) = 0. (2)
dt dt dt
k,i i

Ora dividiamo (1) per mi ottenendo:

k
d2 Fi d X ∇OPi
OPi (t) = (OP (t), OP (t), t) + λα (t) fα (OP (t)),
dt2 mi dt mi
α=1

da cui si ha:

k
!
X d2 X Fi X X ∇OP fβ (OP ) · ∇OP fα (OP )
i i
∇OPi fβ (OP )· 2 OPi = ∇OPi fβ (OP )+ λα
dt mi mi
i i α=1 i
(3)

Definiamo
X 1
Λβ,α := ∇OPi fβ (OP ) · ∇OPi fα (OP )
mi
i

e confrontiamo (2) e (3) ottenendo:

k
* +
X d d X Fi X
− ∇2OPk OPi fβ · OPk (t), OPi (t) = ∇OPi fβ (OP ) + Λβ,α λα (4)
dt dt mi
k,i i α=1

Osserviamo che Λα,β è non degenere, ciò discende dal fatto che il rango di df è massimo
cioè: rango(df )|f =0 = k, questo implica che la forma quadratica associata a Λα,β è definita
positiva, infatti:

k
!
X X X ∇OP fα X ∇OP fβ
Λα,β ξα ξβ = √ i ξα · √ i ξβ = |v|2R3n .
α
m i α
mi
α,β=1 i

P P ∇OPn fα 
∇OP1 fα
dove v = α

m1 ξ α , ..., α

mn ξα . Poiché si ha v = 0 ⇐⇒ (ξ)α=1,...,k = 0
ne segue che è una forma quadratica definita positiva. Quindi det Λα,β 6= 0 e dalla (4)
possiamo infine esplicitare:
˙ , t).
λα = λ̃α (OP, OP

29
1.6 Il modello di Coulomb dell’attrito
Consideriamo una particella vincolata su una varietà 1-dimensionale (curva) o 2-dimensionale
(superficie). Vogliamo definire la classe ΥOP,v,t delle reazioni vincolari nel caso che il vincolo
sia con attrito. Scriveremo
Φ = ΦT + ΦN ,
ove ΦT è la componente vettoriale di Φ sul piano tangente al vincolo, la cosiddetta forza
d’attrito, e ΦN è la componente vettoriale ortogonale al piano tangente. v 6= 0: in tal caso
diremo che il vincolo esplica tutte e sole le reazioni vincolari tali che
v
ΦT = − fd |ΦN |,
|v|
ove 0 ≤ fd è detto coefficiente di attrito dinamico e i moti dinamicamente possibili sono
caratterizzati da
ma(t) = F(OP (t), v(t), t) + Φ(t).
v(t∗ ) = 0, primo caso: se accade che, detto fs il coefficiente di attrito statico, 0 ≤ fd ≤
fs , e in un opportuno intorno destro I di t∗ ,

0 = F(OP (t∗ ), 0, t) + Φ, |ΦT | ≤ fs |ΦN |,

il sistema restera ivi in quiete; diremo che la configurazione OP (t∗ ) è d’equilibrio se il


suddetto intervallo I è superiormente illimitato.
v(t∗ ) = 0, secondo caso: se accade che la precedente disuaglianza non sia soddisfatta,
allora, per t in un opportuno intorno destro di t∗ e fino ad un successivo istante d’arresto,
il sistema evolve e vale la precedente descrizione per v 6= 0.
Si noti però che nell’ultimo caso la reazione vincolare non è definita per v(t∗ ) = 0, più
precisamente, c’è una discontinuità della forza d’attrito in t∗ . Il sistema evolve comunque
nella direzione della forza attiva tangenziale, infatti, si ha

v(t) = a(t∗ )(t − t∗ ) + o(t − t∗ ),

(ove o(t − t∗ ) significa “o piccolo di (t − t∗ )”) ma anche

v(t) = aT (t∗ )(t − t∗ ) + o(t − t∗ ),

dato che v è tangente al vincolo. Ora consideriamo l’equazione dinamica (per v(t) 6= 0),
proiettiamola sul vincolo, e valutiamo il seguente limite
aT (t∗ )(t − t∗ ) + o(t − t∗ )
lim maT (t) = lim (FT (OP (t), v(t), t) − fd |ΦN (t)|),
t→(t∗ )+ t→(t∗ )+ |aT (t∗ )(t − t∗ ) + o(t − t∗ )|
otteniamo che
versaT (t∗ ) = versFT (OP (t∗ ), 0, t∗ ).

30
(Quest’ultimo risultato è detto talvolta teorema del moto incipiente, per esempio, nel Levi
Civita-Amaldi). Infine:

v(t)||FT (OP (t∗ ), 0, t∗ )(t − t∗ ) + o(t − t∗ ).

Alcune osservazioni. Notiamo che l’insieme delle reazioni esplicabili dipende dall’atto
di moto (configurazione e velocità) della particella. Consideriamo per esempio il caso del
vincolo di superficie: in situazione di quiete le reazioni vincolari possibili appartengono
alla chiusura del cono a due falde di semi-apertura arctan(fs ), in situazione dinamica le
reazioni vincolari possibili appartengono alla superficie conica a due falde di semi-apertura
arctan(fd ) e con la forza d’attrito che si oppone al moto. (Compiere l’analoga analisi per il
vincolo 1-dimensionale). Si noti che il modello di Coulomb dell’attrito non consiste in una
mera definizione della classe delle reazioni vincolari sviluppabili: pure la seconda legge della
meccanica ne risulta modificata. I coefficienti d’attrito sono di determinazione empirico-
sperimentale e sono costitutivi del nostro sistema vincolato; la relazione fd ≤ fs esprime il
fatto (euristico, ma fisicamente attendibile) che, a parità di forza attiva F, la forza d’attrito
può essere maggiore (in intensità) nelle situazioni statiche rispetto a situazioni dinamiche,
in altre parole, è più difficile mettere in moto un sistema con attrito che mantenere il moto
stesso.
Esercizi.
1) Su un piano inclinato π rispetto alla verticale di un angolo α è vincolata con attrito
una particella di massa m. Oltre la gravità, agisce sulla particella una forza elastica di
costante h > 0 di centro un punto fisso O sul piano π. Detto fs il coefficiente di attrito
statico, determinare tutte le configurazioni d’equilibrio.
2) Su di un asse orizzontale X è vincolata con attrito una particella di massa m. Oltre
alla gravità, agisce sulla particella una forza elastica di costante h > 0 di centro un punto
fisso O sull’asse X. Detti fd ≤ fs i coefficienti di attrito, i) determinare tutte le configura-
zioni d’equilibrio, ii) studiare la dinamica di tale sistema, in particolare, determinare dopo
quanto tempo il sistema si arresta se l’atto di moto iniziale consiste di una configurazioni
di non equilibrio e di velocità nulla, iii) dimostrare che O è una configurazione d’equilibrio
Lyapunov stabile, iv) confrontare questo sistema dinamico con quello che si ottiene da
quest’ultimo supponendo privo d’attrito l’asse X, fd = fs = 0, e supponendo agisca, oltre
la gravità e la forza elastica, una forza di resistenza di mezzo di tipo viscoso Fv = −kv,
ove k > 0 e v è la velocità.

1.7 Vincoli Lisci o Ideali


(Definizione di) Vincolo Liscio. Un vincolo si dice liscio se riesce ad esplicare tutte e
sole le reazioni vincolari che fanno lavoro virtuale nullo per ogni spostamento virtuale:

δL(v) = 0, per ogni δP virtuale.

31
Come accennato precedentemente nel punto 6, mostriamo che effettivamente la classe
dei vincoli lisci contiene propriamente la classe dei vincoli privi di attrito. Consideriamo un
disco materiale di raggio R vincolato senza attrito a stare in un piano π, ed a ruotare senza
strisciare su di un asse x (retta) di tale piano. Dal punto di vista geometrico tale vincolo si
propone come vincolo anolonomo: infatti il puro rotolamento significa che (l’unica) velocità
consentita dal vincolo al punto materiale P del disco che localmente transita per il punto
geometrico C di contatto con la retta x è la velocità nulla. Un conto geometrico-cinematico
molto semplice mostra che tale vincolo anolonomo (vP = 0) è equivalente ad una famiglia
1-parametrica di vincoli olonomi (fare, xG = Rθ + x0G , ove G è il baricentro del disco, θ
è un angolo tra un raggio del disco e una retta del piano π, e x0G scandisce la suddetta
famiglia 1-parametrica). Veniamo alla parte dinamica del vincolo. Le reazioni vincolari che
mantengono il disco nel piano fanno senz’altro lavoro virtuale nullo (assenza di attrito). Il
puro rotolamento si esplica, volta per volta, sui punti materiali P che localmente transitano
per il punto geometrico C di contatto con la retta x. Evidentemente il vincolo esplicherà, in
tutta generalità, una componente ΦT parallela a x non nulla: in caso contrario (ΦT = 0)
ci dovremo aspettare slittamento, come un pneumatico sul ghiaccio. Ma la classe degli
spostamenti virtuali δP (che coincidono con i possibili, dato che sono indipendenti dal
tempo) per i suddetti punti materiali P coincide con lo spazio banale nullo {0}. Dunque:
δL(v) = Φ · δP ≡ 0, che mostra che il vincolo è liscio, nonostante una componente d’attrito
non necessariamente nulla.
Consideriamo ora il fondamentale teorema caratterizzante i moti dinamicamente pos-
sibili nel caso liscio mediante una ‘condizione variazionale’; questo è classicamente noto
come
Principio di D’Alembert. Sia dato un sistema particellare vincolato St soggetto ad un
generale sistema di leggi-forza come sopra considerato. Allora [t0 , t1 ] 3 t 7→ OP (t) ∈ St è
dinamicamente possibile se e soltanto se per ogni t ∈ [t0 , t1 ] e per ogni vettore appartenente
al piano tangente (spostamento virtuale) δP = (δP1 , ..., δPn ) ∈ TOP (t) St vale la seguente
‘condizione variazionale’:
n
X d2 d
[mi OPi (t) − Fi (OP1 (t), ..., OPn (t), t)] · δPi = 0.
dt2 dt
i=1

Osservazione importante. Tale teorema, quando utilizzato per la determinazione degli


equilibri, e dunque dei moti ivi di quiete, si dice
Principio dei Lavori Virtuali: La configurazione OP ∗ , compatibile col vincolo, è d’e-
quilibrio se e solo se
n
X
Fi (OP1∗ , ..., OPn∗ , 0...., 0, t) · δPi = 0, ∀δP ∈ TOP ∗ St .
i=1

32
Dimostrazione (del Principio di D’Alembert). Supponiamo che [t0 , t1 ] 3 t 7→ OP (t) ∈ St
sia dinamicamente possibile, allora il vincolo esplica delle reazioni vincolari tali che
d2 d
mi OPi (t) = Fi (OP1 (t), ..., OPn (t), t) + Φi (t)
dt2 dt
con
n
X
Φi (t) · δPi = 0, ∀δP ∈ TOP (t) St ,
i=1
dato che il vincolo è liscio; dunque, vale la condizione variazionale.
Viceversa, la curva [t0 , t1 ] 3 t 7→ OP (t) ∈ St sia compatibile col vincolo e per essa valga
la condizione variazionale. Definiamo le seguenti funzioni del tempo
d2 d
Ψi (t) := mi OPi (t) − Fi (OP1 (t), ..., OPn (t), t).
dt2 dt
La condizione variazionale ci dice che per ogni istante t ∈ [t0 , t1 ] vale
n
X
Ψi (t) · δPi = 0, ∀δP ∈ TOP (t) St .
i=1

Dato che tale vincolo esplica tutte e sole le reazioni vincolari soddisfacenti a ni=1 Φi ·δPi =
P
0, in particolare esplicherà pure le Ψi (t), e ciò è quanto ci basta per dire che il moto è
dinamicamente possibile.
Si noti che uno degli aspetti operativi più importanti di tale teorema è che i moti
din. poss. si caratterizzano senza introdurre (e calcolarle) le reazioni vincolari. Questo
consentirà, nel caso liscio olonomo bilaterale (eventualmente dipendente dal tempo), la
costruzione della dinamica mediante le equazioni di Lagrange.

1.8 Cinematica e dinamica elementare dei sistemi particel-


lari
Sia dato un sistema di riferimento inerziale (O, ei ), i = 1, 2, 3 e consideriamo un sistema
di punti materiali (sistema particellare) S = {(OPi , mi )}, i = 1, . . . , n, ove mi > 0 è la
massa del punto Pi e OPi il raggio vettore dall’origine. Cominciamo introducendo alcune
definizioni elementari. Il baricentro di S è il vettore
P P
i mi OPi mi OPi
OG := P = i .
i mi m
Una conseguenza immediata della definizione di baricentro è che
dOG X
mvG = m = m i vi = P
dt
i

33
ove P indica la quantità di moto di S. Definito il baricentro G, ha senso introdurre il
sistema (non inerziale) (G, ei ), detto sistema del baricentro, con origine coincidente con
G ed assi sempre paralleli a quelli di (O, ei ), per cui si ha (formula di composizione delle
velocità)
(τ ) (r) (r)
ω (τ ) = 0, v (τ ) = vG , vi = vi + vi = vG + vi .
Si dimostrano facilmente le seguenti relazioni
X X
mi GPi = mi (OPi − OG) = mOG − mOG = 0
i i

da cui, derivando rispetto a t,

d X X (r)
0= mi GPi = mi vi = P (r) .
dt
i i

Inoltre si ha per l’energia cinetica

(r) (r)2
X X X
2T = mi vi2 = mi (vi + vG )2 = mi vi 2
+ mvG + 2vG · P (r) ,
i i i

da cui segue il Teorema di König

1 2
TS = mvG + T (r) .
2
Sia A un punto (fisso o mobile) nel riferimento inerziale; il momento angolare o momento
della quantità di moto di S rispetto al polo A è
X
MA = APi ∧ mi vi
i

Usando la formula di variazione del momento di un sistema di vettori applicati al variare


del polo si ha subito
MA = AG ∧ P + MG
ed essendo inoltre
(r) (r) (r)
X X X
MG = GPi ∧ mi vi = GPi ∧ mi (vi + vG ) = GPi ∧ mi vi = MG
i i i

si ha l’analogo del Teorema di König per il momento angolare


(r)
MA = AG ∧ P + MG

34
1.8.1 Equazioni Cardinali
Sia S un sistema di n punti materiali di masse mi , i = 1, . . . , n. Suddividiamo le forze
agenti sull’ i-esimo punto del sistema in due classi: le forze interne Fiint , ovvero dovute
all’azione degli altri punti del sistema sul punto i-esimo, per le quali possiamo dare la
rappresentazione
Xn
int
Fi = fij , fii = 0, i = 1, . . . , n,
j=1

ove fij ∈ R3 indica la forza agente su i dovuta all’azione di j; e le forze esterne Fiext che
descrivono l’effetto sul punto i di corpi non appartenenti al sistema S. Questa distinzione
tra forze esterne e interne è complementare a quella di uso frequente tra forze attive e forze
vincolari; la sua utilità sta nel fatto che per le forze interne si fa l’ipotesi, importantissima
per gli sviluppi che vogliamo trarre, che esse siano un sistema equilibrato di forze (si veda
il Capitolo sui Vettori Applicati):
Rint = 0, NOint = 0.
Da tale ipotesi si ricavano le equazioni cardinali per il sistema particellare S, ovvero un
sistema di 3 più 3 equazioni differenziali scalari che sono necessariamente soddisfatte lungo
i moti OPi (t) dinamicamente possibili per il sistema ovvero soddisfacenti a
mi OP¨ i = F ext + F int , i = 1, . . . , n.
i i
Sommando sull’indice di particella i troviamo infatti che necessariamente
n
¨ i = Rext + Rint = Rext
X
maG = mi OP (P rima Equazione Cardinale)
i=1
Sia ora OA(t) la traiettoria del polo A rispetto al sistema inerziale di origine O usato per
descrivere il moto di S, di modo che si ha immediatamente che
d
OPi = OA + APi , e vi = vA + (APi ).
dt
Indichiamo con
Xn
MA = mi APi ∧ vi
i=1
il momento della quantità di moto rispetto al polo A; la sua derivata lungo un moto
dinamicamente possibile vale
Xn n
X
ṀA = mi (vi − vA ) ∧ vi + mi APi ∧ ai =
i=1 i=1
n
X
= −vA ∧ P + APi ∧ (Fiext + Fiint ) =
i=1
= −vA ∧ P + NAext + NAint = −vA ∧ P + NAext

35
ṀA = −vA ∧ P + NAext (Seconda Equazione Cardinale)
Osservazione. Le equazioni cardinali costituiscono un sistema di 6 equazioni che de-
vono essere necessariamente soddisfatte lungo il moto. E’ chiaro intuitivamente che, se il
sistema S ha più di 6 gradi di libertà, le equazioni cardinali non possono essere sufficienti a
determinare completamente il moto del sistema. Infatti, esse sono sufficienti a determinare
solo il moto del baricentro G, attraverso la prima equazione cardinale, e l’evoluzione del
momento della quantità di moto MA . Per una particolare classe di sistemi, i corpi rigidi
privi di ulteriori vincoli, le equazioni cardinali risultano essere esattamente equivalenti al
sistema delle equazioni descrivente i moti dinamicamente possibili.

1.8.2 Cinematica dei sistemi particellari rigidi


Sia ora S sistema rigido e denotiamo con ω la velocità angolare assoluta di S. Mostriamo
preliminarmente che:
Proposizione 1.8.1 Se S è rigido, allora G è solidale a S, ovvero

vG = vi + ω ∧ Pi G, ∀ i = 1, . . . , n.

Infatti, fissato j ∈ {1, . . . , n},


X X X
mvG = m i vi = mi (vj + ω ∧ Pj Pi ) = mvj + ω ∧ mi Pj Pi ,
i i i

ed essendo Pj Pi = GPi − GPj , si ha


X
mvG = mvj + ω ∧ mi (GPi − GPj ) = m(vj + ω ∧ Pj G).
i

Ne segue che il sistema S 0 = S ∪ {(OG, 0)} è ancora un sistema rigido e in (G, ei ) il


moto di S 0 ha un punto fisso G. Inoltre, da ω (τ ) = 0, usando la formula di composizione
delle velocità angolari nei moti rigidi si ha che

ω = ω (τ ) + ω (r) = ω (r) .

Per un generico sistema rigido con un punto fisso A, il momento angolare e l’energia cinetica
ammettono l’espressione seguente (si usa la formula del doppio prodotto vettore)
X X
MA = APi ∧ mi vi = mi APi ∧ (ω ∧ APi ) =
i i
X X
= mi (APi2 ω − (APi · ω)APi ) = mi (APi2 I − APi ⊗ APi )ω = IA ω
i i

36
ove a ⊗ b ∈ M (n) indica la matrice prodotto tensore dei due vettori a, b ∈ Rn

(a ⊗ b)u := a(b · u) ∀u ∈ Rn

e X
IA = mi (APi I − APi ⊗ APi ) ∈ M (n)
i

è il tensore d’inerzia del sistema (rigido) di punti materiali. Si tratta di un oggetto che
dipende dalla sola geometria della distribuzione delle masse del sistema rigido.
Prima di studiare le proprietà del tensore d’inerzia, ricaviamo l’espressione dell’energia
cinetica per un generico sistema rigido con un punto fisso
X X X
2TS = mi vi2 = mi (ω ∧ APi )2 = mi ω ∧ AP ii · ω ∧ AP ii =
i i i
X X
= mi ω · APi ∧ (ω ∧ APi ) = ω · mi APi ∧ (ω ∧ APi ) = ω · IA ω.
i i

Nel caso particolare di G punto fisso nel sistema del baricentro e ω (r) velocità angolare del
sistema rispetto al riferimento del baricentro, otteniamo l’analogo delle formule di König
per un sistema rigido
1 2 1
TS = mvG + ω · IG ω, (1)
2 2
MA = AG ∧ P + IG ω. (2)

Proprietà del tensore d’inerzia


1) IA è operatore simmetrico (e quindi diagonalizzabile). Rispetto alla base (O, ei ) si
ha infatti
X
(IA )ij = ei · IA ej = mk (APk2 ei · ej − APk · ei APk · ej ) = (IA )ji
k

2) Sia ω = |ω|u, ove u= vers ω. Allora

1 ω2 ω2
T = ω · IA ω = u · IA u = Iu (3)
2 2 2
ove X X
Iu := u · IA u = mi (u ∧ APi )2 = mi d2i ≥ 0
i i
è il momento d’inerzia del sistema rispetto alla retta per A e parallela al versore u.
Esso coincide con la somma delle masse per le distanze al quadrato dei punti Pi dalla
retta per A. Come si vede subito, Iu non varia se si considera un altro punto A0 sulla

37
retta definita da (A, u). Dalla (3) si deduce che IA , simmetrico è definito positivo
ovvero
ω · IA ω ≥ 0, ω · IA ω = 0 ⇔ ω = |ω|u = 0,
tranne che nel caso in cui esista u∗ tale che Iu∗ = 0. In tal caso i punti di S sono
disposti tutti lungo una retta parallela a u∗ e S è solido degenere (asta).

3) Formula di variazione del momento d’inerzia (Teorema di Huygens–Steiner). Con-


sideriamo le rette parallele al versore u per i punti A e G, baricentro di S; non è
restrittivo supporre che sia d = |AG| la distanza tra le rette. Allora (vedi figura)

P
. i
 KAA
A
d A
A
A G

X X
Iu(A) = mi (u ∧ APi )2 = mi [(u ∧ AG) + (u ∧ GPi )]2 =
i i
X
= mi [(u ∧ AG) + (u ∧ GPi )2 + 2(u ∧ AG) · (u ∧ GPi )],
2

da cui
Iu(A) = md2 + Iu(G)
Esercizio. Mostrare che la relazione precedente è un caso particolare della formula

IO = IG + mOG ⊗ OG.

4) Momenti principali d’inerzia. Supponiamo per semplicità A coincidente con l’origine


del riferimento inerziale, per cui OPi = (xi , yi , zi ). I termini sulla diagonale di IO
sono detti momenti principali d’inerzia. Si ha ad esempio per e3
X
(IO )33 = e3 · IO e3 = Ie(O)
3
= mi (OPi ∧ e3 )2 =
i
X X
= mi (OPi2 − (OPi · e3 )2 ) = mi (x2i + yi2 + zi2 − zi2 )
i i
X
= mi (x2i + yi2 ).
i

38
I termini extra–diagonali sono detti momenti deviatori
X
(IO )23 = e2 · IO e3 = mi (−yi zi )
i

5) Solidi piani (lamine). Sia e3 perpendicolare al piano che contiene il sistema. Allora
zi = 0 per ogni i = 1, . . . n e
X X X
I1 = mi (x2i + yi2 + 0 − x2i ) = mi yi2 , I2 = mi x2i
i i i

e si ha
(O) (O) (O)
I3 = I2 + I1 .

39
1.9 Teorema di Conservazione dell’Energia
Consideriamo un sistema vincolato di n particelle di masso mi > 0, i = 1, ..., n con vin-
colo liscio S ⊂ R3n , indipendente dal tempo (fisso), bilaterale (senza bordo), e soggetto
ad un sistema di forze (interne e/o esterne) di tipo conservativo di Energia Potenziale
U (OP1 , ..., OPn ), quindi: Fi (OP1 , ..., OPn ) = −gradOPi U (OP1 , ..., OPn ). Allora l’Energia
Totale:
E : R6n −→ R
n
˙ ˙ 1X ˙ i |2 + U (OP1 , ..., OPn )
E(OP1 , ..., OPn , OP 1 , ..., OP n ) := mi |OP
2
i=1

è costante lungo i moti dinamicamente possibili.


Prova. I moti dinamicamente possibili per tale sistema sono tutte e sole le curve t 7→ OP (t)
tali che il vincolo è capace di esplicare reazioni vincolari t 7→ Φi (t), i = 1, ..., n per cui, per
ogni i = 1, ..., n
mi OP¨ i (t) = Fi (OP1 , ..., OPn ) + Φi (t),

ed il vincolo è geometricamente soddisfatto: OP i (t) ∈ S. Lungo tali curve

d  ˙ 1 (t), ..., OP

˙ n (t) =
E OP1 (t), ..., OPn (t), OP
dt
n n
¨ i (t) · OP
˙ i (t) + ˙ i (t) =
X X
= mi OP gradOPi U (OP1 (t), ..., OPn (t)) · OP
i=1 i=1
n
˙ i (t).
X
= Φi (t) · OP
i=1

Dobbiamo considerare ora due fatti: primo, il vincolo è liscio bilaterale, dunque può
sviluppare tutte e sole le reazioni vincolari che fanno lavoro virtuale identicamente nullo
n
X
δLΦ = Φi · δPi = 0,
i=1

per ogni spostamento virtuale (δPi )i=1,...,n ∈ TOP S; secondo, il vincolo è fisso, dunque i
vettori velocità lungo i moti sono spostamenti virtuali (affermazione che non è vera nel
caso di vincolo mobile, dipendente dal tempo), pertanto:
n
d  ˙ 1 (t), ..., OP

˙ n (t) = ... =
X
˙ i (t) = 0.
E OP1 (t), ..., OPn (t), OP Φi (t) · OP
dt
i=1

40
1.10 La restrizione di un sistema di forze conservativo è
conservativa
Consideriamo un sistema di n particelle libere, soggette ad un sistema conservativo di forze;
cioè, esiste una funzione energia potenziale

U : R3n −→ R, (OP1 , ..., OPn ) 7−→ U(OP )

tale che la forza esercitata sulla particella i−esima dovuta alla presenza di tutte le altre
nelle configurazioni OP1 , ... è data da

Fi : R3 × ... × R3 −→ R3 , Fi (OP ) := −gradOPi U(OP1 , ..., OPi , ..., OPn )

In altri termini, l’insieme delle n funzioni 3-vettori forze Fi si può interpretare come l’in-
sieme delle componenti di una forma differenziale esatta (la forma ‘lavoro’ δLF ) in R3n di
cui −U è la primitiva:
n
X
F
δL = Fi (OP1 , ..., OPn ) · dOPi =
i=1

n
X
=− gradOPi U(OP1 , ..., OPi , ..., OPn ) · dOPi = −dU
i=1
Supponiamo ora di vincolare il nostro sistema in maniera olonoma, cioè mediante un vincolo
sulle configurazioni S ⊂ R3n , dimS = N < 3n di cui RN 3 q = (q h )h=1,...,N 7→ OP =
g (q) ∈ R3n sia la generica immersione/rappresentazione locale del vincolo. Ha dunque
OP
geometricamente senso definire la forma differenziale lavoro ristretta alla varietà vincolare
S; tale operazione è ben definita per ogni forma differenziale: (i) le componenti si valutano
non più in generici OP di R3n ma solo sui punti appartenenti a S, cioè su OP g (q) con q
N
arbitrario nel suo dominio di definizione (un aperto di R ) e (ii) tale forma ristretta non
la si valuta più su generici vettori di R3n bensı́ sui soli vettori tangenti ad S nei punti
OP
g (q) ove si sono valutate le componenti della forma. Ricordando che i vettori tangenti
si ottengono come immagine del differenziale dell’immersione vincolare, possiamo scrivere
la nuona forma differenziale ristretta:
n N
X X ∂ OP
g i (q)
δLF |S = Fi (OP
g (q)) · dq h (∗)
∂q h
i=1 h=1

Ricordiamo che δLF è esatta,


n N
F
X X ∂ OP
g i (q)
δL |S = − gradOPi U(OP1 , ..., OPi , ..., OPn ) · dq h

OP =OP
g (q) ∂q h
i=1 h=1

41
ricordando il teorema di differenziazione delle funzioni composte
N
X ∂
δLF |S = − g ](q) dq h = −dU,
[U ◦ OP
∂q h
h=1

dove
U : RN −→ R, q 7→ U(q) := U(OP
g (q))

Abbiamo ottenuto il seguente risultato: in generale, la restrizione di una forma esatta è


esatta, e la sua primitiva è la restrizione della originale primitiva. Nel nostro caso (della
meccanica): la restrizione di una forma lavoro conservativa è conservativa e la energia
potenziale del sistema ristretto è data dall’energia potenziale originale composta con la
rappresentazione vincolare.

˙ )):
Ritorniamo sulla (∗) e nel caso non necessariamente conservativo (Fi = Fi (OP, OP
n N N
F
X  X ∂ OP
g (q)
k
 X ∂ OP
g i (q)
δL |S = Fi OP
g (q), q̇ · dq h (∗)
∂q k ∂q h
i=1 k=1 h=1

riorganizzando le sommatorie (possiamo scambiarle come meglio crediamo):


N hX
n N N
X  X g (q)  ∂ OP
∂ OP g i (q) i X
δLF |S = Fi OP
g (q), q̇ k
· dq h
= Qh (q, q̇)dq h
∂q k ∂q h
h=1 i=1 k=1 h=1
h i
le Qh (q, q̇) = ... sono dette le Componenti Lagrangiane della Sollecitazione; solo nel
caso di forze posizionali (Fi = Fi (OP )) sono interpretabili come componenti di forme
differenziali nel senso standard dell’Analisi e della Geometria.

1.11 Sistemi continui (di infinite particelle) a finiti gradi di


libertà
Per semplicità, nel caso olonomo, ci siamo limitati in questi appunti a sistemi materiali di
n particelle. Se per ogni t la varietà vincolare St è senza bordo (non ci sono configura-
zioni di “confine”), allora, localmente, possiamo rappresentare tale varietà mediante delle
immersioni locali
RN × R 3 (qh , t) 7−→ OPi (qh , t) ∈ St ⊂ R3n .
Molto spesso in meccanica finito-dimensionale dobbiamo trattare con sistemi composti
da infinite particelle vincolate tra loro in maniera tale che il sistema risultante è a finiti
gradi di libertà; basti pensare, per esempio, ai sistemi articolati di corpi rigidi. Da un
punto di vista non solo formale è estremamente utile pensare anche per questi sistemi a

42
delle rappresentazioni vincolari mediante delle immersioni locali analoghe alle precedenti.
Il punto qualitativamente diverso consiste nel fatto che ora, invece dell’indice discreto di
particella i ∈ 1, ..., n, avremo un indice continuo y = (y1 , ..., yd ) ∈ C ∗ ⊂ Rd , ove d vale
1, 2, oppure 3, in relazione al fatto che il nostro corpo materiale di infinite particelle sia
rispettivamente 1- , 2- , oppure 3-dimensionale. Dunque:

Rd × RN × R 3 (yα , qh , t) 7−→ OP (yα , qh , t) ∈ R3

rappresenta la configurazione assunta dalla particella y ∈ C ∗ , quando, al tempo t, i para-


metri lagrangiani valgono q ∈ RN . Esempio: corpo rigido. Si consideri una terna solidale al
rigido e sia C ∗ l’insieme dei punti di R3 rappresentanti il rigido; in questo caso N = 6: tre
parametri per il baricentro (oppure, se vogliamo, l’origine della terna), tre altri parametri
per la rotazione (cioè tre parametri descriventi localmente SO(3), per esempio gli angoli
di Euler).
Un’applicazione di tali rappresentazioni. Supponiamo esista un campo di forze ta-
le che se poniamo una particella di massa m in OP questa sia soggetta alla forza f =
−mgradR3 U(OP ), ove R3 3 OP 7→ U(OP ) ∈ R è una densità per unità di massa di energia
potenziale. Si consideri ora un sistema di infinite particelle come sopra, con vincoli indipen-
denti dal tempo. Dimostriamo che il lavoro (virtuale, possibile) di tale campo di forze sul
sistema è (ancora) conservativo e calcoliamo l’ energia potenziale lagrangiana U(qh ) il cui
gradiente in RN (col segno meno) esprime le componenti lagrangiane della sollecitazione
(vedi p.e. (3.38) di AMR). Scriviamo dunque il lavoro di tali forze sul sistema e sia µ(y)
la densità di massa in C ∗ .
R
δL = − y∈C ∗ µ(y)gradR3 U(OP (y, q)) · gradRN OP (y, q)δqdy,
R P3 ∂ PN ∂
= − y∈C ∗ µ(y) l=1 ∂xl U(OP (y, q)) h=1 ∂qh xl (y, q)δqh dy,

PN ∂
R
= − h=1 ∂qh [ y∈C ∗ µ(y)U(OP (y, q))dy]δqh .

L’energia potenziale è pertanto data da


Z
U(q) = µ(y)U(OP (y, q))dy.
y∈C ∗

Esercizio. La terna cartesiana Oxyz ruota uniformemente rispetto agli spazi inerziali con
velocità angolare di trascinamento ω = ωẑ. Una lamina materiale C ∗ omogenea di massa
m è vincolata senza attrito sul piano Oxz. L’accelerazione di gravità è g = −g ẑ, cioè l’asse
z si dice ‘verticale ascendente’. Determinare l’energia potenziale lagrangiana U(q) dovuta
alla forza gravitazionale e a quella centrifuga.
Il generico punto materiale della lamina è indicato con y = (X, Z) ∈ C ∗ , mentre la
generica configurazione assunta dalla lamina è caratterizzata dai parametri Lagrangiani

43
q = (x, z, θ) ∈ R2 × S1 dove G = (x, z) è la posizione del baricentro e θ è l’ angolo formato
con una direzione invariante del sistema, infine µ : C ∗ → R+ è la densità (superficiale) di
massa della lamina.

Gravità:
Fg = mg = −∇OP (−mg · OP )
Allora per unità di massa si ha:
U (OP ) = −g · OP
δL(F ) = mg · dP = −d(−mg · OP )
Quindi:
Z Z
g
U (q) = µ(y)U (OP (y, q)) dy = − µ(y)g · OP (y, q) dy =
y∈C ∗ y∈C ∗
Z
= −g µ(y) · OP (y, q) dy
y∈C ∗
R
Ora usando la definizione di baricentro e il fatto che y∈C ∗ µ(y)dy = m si ha:

U g (q) = −mg · OG(q) = mgz

Centrifuga:
Per unità di massa si ha:
2
U (OP ) = − ω2 |P 0 P |2 ,
dove P 0 è il punto proiezione ortogonale di P sull’asse di rotazione z. Quindi:

ω 2 0
Z Z  
centr
2
U (q) = µ(y)U (OP (y, q)) dy = µ(y) − P P (y, q) dy =
y∈C ∗ y∈C ∗ 2

ω2 ω2
Z
2
µ(y) P 0 P (y, q) dy = − Iz (q)

=−
2 y∈C ∗ 2
Per il teorema di Huygens-Steiner si ha:

ω2 ω2 ω2
mx2 + Iz 0 (θ) = − mx2 + nT (θ) I G n(θ)
 
− Iz (q) = −
2 2 2
Dove n(θ) è il versore dell’asse z 0 , parallelo a z e passante per il baricentro della lamina,
rappresentato nella base (G; X, Y, Z) solidale alla lamina in cui si costruisce la matrice
d’inerzia I G .

44
1.12 Appendice: Il Principio di Gauss
Si consideri un sistema di n particelle soggette al vincolo olonomo Σ, localmente descritto
da

Σ =loc. {OP ∈ R3n : f (OP ) = 0}, dove f : U ⊂ R3n → Rk , rk df Σ = k.



(4)

Il luogo Σ è pertanto una varietà N = 3n − k dimensionale, dato che considereremo senza


restrizioni buona regolarità per f ∈ C r , r ≥ 1. Il nucleo del differenziale di f in un punto8

x = OP = (OP1 , OP2 , ..., OPn )

risolvente f (OP ) = 0 rappresenta i vettori del locale piano tangente Tx Σ, gli ‘spostamenti
virtuali’ δP :
df (OP )δP = 0 (5)
Consideriamo una generica curva γ : I −→ R3n a valori in Σ e γ(0) = OP ; dunque:

f (γ(t)) ≡ 0. (6)

Derivando rispetto al parametro d’evoluzione e valutando in t = 0 otteniamo esattamente


la relazione ( 5) caratterizzante le velocità cinematicamente compatibili col vincolo Σ:

df (OP )γ̇(0) = 0 (7)

Derivando due volte e valutando in t = 0 otteniamo:

hd2 f (OP )γ̇(0), γ̇(0)i + df (OP )γ̈(0) = 0. (8)

Da un punto di vista un po’ più formale possiamo richiamare il seguente fatto: se da un lato
gli elementi del fibrato tangente T Σ sono del tipo (γ(0); γ̇(0)) risolventi ( 7), gli elementi
del ‘secondo’ fibrato tangente T 2 Σ sono del tipo (γ(0); γ̇(0), γ̈(0)), naturalmente al variare
arbitrario di curve γ a valori in Σ, dunque risolventi le relazioni ( 7) e ( 8). Consideriamo
la mappa di proiezione
τ2,1 : T 2 Σ −→ T Σ, (9)
(x; v, a) 7→ (x; v), dove df (x)v = 0 e hd2 f (x)v, vi + df (x)a = 0 (10)
Si definiscono i vettori di T 2 Σ verticali rispetto a τ2,1 tutti e soli del tipo (x; 0, a), cioè

df (x)a = 0, (11)

e dal punto di vista cinematico rappresentano, per un assegnato ‘atto di moto’ (x; v) di
T Σ, le variazioni possibili in accelerazione compatibili col vincolo Σ a partire da (x; v). In
8 ˙ , a = OP
Scriveremo: x = OP, v = OP ¨ .

45
altri termini: se un vettore di T 2 Σ è dato da (x; v, a), allora ogni altro vettore di T 2 Σ,
compatibile con un prefissato atto di moto (x; v) ∈ T Σ, si ottiene sommando (solo sulle
fibre vettoriali, sopra lo stesso punto x) a (x; v, a) tutti e soli i vettori verticali (x; 0, δa)
con df (x)δa = 0, ottenendo cosı̀: (x; v, a + δa).
Naturalmente alla stessa conclusione giungiamo se, invece di rappresentazioni implicite
(f = 0) del vincolo, lavoriamo con immersioni vincolari del tipo (N = 3n − k):

g : V ⊂ RN
OP −→ R3n
(12)
(q 1 , ..., q N ) = q 7−→ OP
g (q).

v = dOP
g (q)q̇, a = hd2 OP
g (q)q̇, q̇i + dOP
g (q)q̈. (13)
Le variazioni di accelerazione δa, per fissato atto di moto, dunque per δ q̇ = 0, si ottengono
per
δa = dOPg (q)δ q̈ (14)
per arbitrari δ q̈. Quest’ultima relazione è la stessa caratterizzante gli spostamenti virtuali

δP = dOP
g (q)δq, (15)

per arbitrari δq.

È nodo cruciale nel Principio di Gauss il fatto che la relazione caratterizzante i vettori
verticali ( 14) sia esattamente la relazione caratterizzante gli ‘spostamenti virtuali’ ( 15).
Assegnate delle generiche funzioni-forza F (OP, OP ˙ ), consideriamo la funzione di Gauss:

G: T 2Σ −→ R
(16)
2
Pn mi ¨ i −Fi
OP
(q; q̇, q̈) 7→ G(q; q̇, q̈) := i=1 2mi ,
 
¨ = hd2 OP
ove s’intende OP g (q)q̇, q̇i + dOP
g (q)q̈ e F = F OP
g (q), dOP
g (q)q̇ .

Principio di Gauss: Un moto compatibile col vincolo olonomo e liscio Σ, dunque del tipo

OP (t) = OP
g (q(t)), I 3 t 7→ q(t) ∈ RN , (17)

è dinamicamente possibile se e solo se, per ogni istante in cui è definito, la funzione di
Gauss ivi valutata è minima per ogni variazione verticale dell’accelerazione, ovvero:
  
δv G := dG q(t); q̇(t), q̈(t) q(t); 0, δ q̈ = 0, ∀ δ q̈,
D     E (18)
δv2 G := d2 G q(t); q̇(t), q̈(t) q(t); 0, δ q̈ , q(t); 0, δ q̈ > 0, ∀ δ q̈ 6= 0.

46
Osservazione. Si noti il significato della funzione di Gauss: per ogni configurazione OP ,
˙ , e distribuzione di accelerazioni OP
distribuzione di velocità OP ¨ , consentite dal vincolo, G
misura la somma su tutte le particelle della norma quadrato delle deviazioni di mi OP ¨ i da
Fi , quantità quest’ultima candidata ad essere la reazione vincolare, a quell’istante lungo
quel moto, sulla particella i-esima. La distribuzione dinamicamente possibile di accelera-
zioni è appunto, nel caso dei vincoli lisci, quella in corrispondenza della deviazione minima,
a parità d’atto di moto (OP (t), OP˙ (t)).

Prova. Calcoliamo   
δv G = dG q(t); q̇(t), q̈(t) q(t); 0, δ q̈ =
n  
¨ i (t) − Fi (OP (t), OP
˙ (t)) · dOP
X
= mi OP g i (q(t))δ q̈,
i=1

e per le ( 14) e ( 15),


n  
¨ i (t) − Fi (OP (t), OP
˙ (t)) · δPi ,
X
δv G = mi OP (19)
i=1

dunque δv G è zero se e solo se vale il Principio di D’Alembert ( 19), caratterizzante appunto i


moti dinamicamente possibili nel caso liscio. Tali punti stazionari sono in effetti dei minimi:
n
X
δv2 G = mi δPi · δPi > 0.
i=1

47
48
Capitolo 2

Il Problema dei Due Corpi e la


Meccanica Celeste

2.1 Premessa

Non si può dire che la descrizione antica e medioevale della meccanica celeste non fosse
efficiente.
Il punto più alto di quel mondo pre-newtoniano fu l’opera monumentale in 13 volumi di
Claudio Tolomeo (II secolo d.C.), la Grande Sintassi Matematica, più nota col nome arabo
di Almagesto, in cui fu esposto il suo sistema geocentrico: il complesso delle stelle fisse e
del sistema solare fu rappresentato mediante 52 moti circolari uniformi, deferenti e epicicli,
utilizzandone al più 5 (Marte) per corpo celeste. La sovrapposizione di pochi moti circolari
uniformi era – è, diciamo– sufficiente per descrivere i corpi celesti con un’approssimazione
fine confrontabile con le osservazioni astronomiche. Al moderno lettore con cultura mate-
matica –lo studente di fisica, di matematica, di ingegneria– non è molto difficile riconoscere
l’analogia tra tale sviluppo in epicicli e la decomposizione in serie di Fourier di moti perio-
dici. Quest’analogia fu indicata espressamente per la prima volta da Schiaparelli (1926), e
come mette in evidenza Lucio Russo ne “La rivoluzione dimenticata”, Feltrinelli 1996, si
può sospettare che fosse chiara anche ai pionieri di tali sviluppi in serie, e cioè a Daniel
Bernoulli e allo stesso Joseph Fourier, i quali furono pure cultori l’uno di meccanica celeste,
l’altro di cultura egizia ed alessandrina. Una ricostruzione tecnica di tale analogia si trova
nella nota di Giovanni Gallavotti “I moti quasi periodici da Ipparco a Kolmogorov” (Note
dell’Accademia Naz. dei Lincei). Ma il già citato moderno lettore matematico troverà
tutto ciò deliziosamente descritto nel saggio di Donald G. Saari “A Visit to the Newtonian
N-body Problem via Elementary Complex Variables”, American Mathematical Monthly
pp.105-119, February 1990.

49
Perché dunque abbandonare tale descrizione potente ed efficiente? Perché sostituire
quella descrizione pragmatica con una “legge fisica”?
Clifford A. Truesdell, in un ormai famoso (e provocatorio) pamphlet “Il calcolatore:
rovina della scienza e minaccia per il genere umano”, La nuova ragione, Scientia/Il Mulino
1981, giunge addirittura al seguente scenario. Se nel XVII secolo fossero esistiti i calcola-
tori, non ci sarebbe stata alcuna forte pulsione per tentare una ricostruzione matematica
unitaria quale quella formidabile di Isaac Newton, non sarebbe servita, forse sarebbe stata
controproducente: la “macchina” epicicloidale esistente, e sempre eventualmente perfetti-
bile mediante l’aggiunta di nuovi epicicli, sarebbe apparsa più che adeguata per il calcolo
computerizzato.
Tale pessimismo va naturalmente rimeditato. Ma va pure detto che lo sviluppo scien-
tifico mediante il paradigma delle “leggi” fu una peculiarità di quella scienza che nacque
e si sviluppò attorno al bacino mediterraneo; presso altre civiltà in evoluzione presero il
soppravvento differenti itinerari di pensiero: la scienza cinese, benché tecnologicamente
più avanzata nell’antichità, mai si sviluppò in termini di leggi (si veda per esempio Joseph
Needham, Scienza e Civiltà in Cina, Einaudi 1983).
I motivi della decadenza dell’antica teoria tolemaica e del nascere della nuova scienza
sono indissolubilmente legati alla storia e allo sviluppo di tutto il pensiero scientifico di
quel periodo, marcato da Copernicus, Kepler e Galilei. Non furono neppure estranee mo-
tivazioni estetiche e mistico-religiose. Ma fu fondamentalmente la necessità di organizzare
unitariamente i dati astronomici e di predire i moti, che portò alla enunciazione Kepleria-
na, le tre leggi, e successivamente alla potente sintesi Newtoniana, la legge di gravitazione
universale assieme ad un solido formato teorico di equazioni differenziali caratterizzanti i
moti dinamicamente possibili.

Come in altri capitoli, i primi paragrafi sono di lettura consequenziale; negli ultimi
(teorema di Bohlin ed altri) a volte è necessario il formalismo Lagrangiano-Hamiltoniano

50
della Meccanica Analitica e il Calcolo delle Variazioni. Nonostante questi siano sviluppati
in capitoli successivi, si è ritenuto, per un senso unitario dell’esposizione, di proporre
ugualmente in questo capitolo questi argomenti non didatticamente ordinati, ma coerenti
col problema dei due corpi.

2.2 Moti Piani


Indichiamo (come al solito) con E3 uno spazio euclideo, cioè uno spazio affine 3-dimensionale
dotato del prodotto scalare pitagorico: x · y := 3i,j=1 δij xi yj = 3i=1 xi yi . Identificheremo
P P

sempre lo spazio vettoriale associato con R3 .


Una curva P = P (t) in E3 di classe C 2 è un moto piano se esiste un piano π, cioè una
sottovarietà affine 2-dimensionale π di E3 , che contenga il sostegno di tale curva.
Dato un moto piano, attacchiamo un opportuno riferimento ad E3 , cioè una scelta di
un punto O di E3 e di tre vettori (di base) orto-normali ei ∈ R3 in modo tale che

π = {P ∈ E3 : OP = P − O = x1 e1 + x2 e2 , ∀(x1 , x2 ) ∈ R2 }.

Dunque il nostro moto si rappresenterà cosı́: t 7→ x1 (t)e1 + x2 (t)e2 , ma anche, qualora non
susciti ambiguità: t 7→ (x1 (t), x2 (t)). Descriviamolo pure in coordinate polari su π:

t 7→ r(t)er (t).

Qui r := |OP |, e θ è l’angolo dalla semiretta orientata O + R+ e1 al vettore posizione


OP , orientato in senso antiorario, come osservato dal semi-spazio x3 > 0. Il vettore
er := OP/|OP | è il versore radiale, il versore eθ , versore trasverso, è ortogonale a er ed è
tale per cui la coppia (er , eθ ) è congruente alla coppia (e1 , e2 ),

er = cos θe1 + sin θe2 , eθ = − sin θe1 + cos θe2 .

Si calcolano facilmente le derivate dei versori mobili di base associati ad un moto:

ėr = (− sin θe1 + cos θe2 )θ̇ = θ̇eθ , ėθ = −(cos θe1 + sin θe2 )θ̇ = −θ̇er .

Abbiamo gli ingredienti per rappresentare nella base mobile (er , eθ ) velocità ed accelera-
zione:
v = OP ˙ = d (rer ) = ṙer + re˙r = ṙer + rθ̇eθ .
dt
2
¨ = d (rer ) = r̈er + ṙėr + ṙθ̇eθ + rθ̈eθ + rθ̇ėθ = (r̈ − rθ̇2 )er + (rθ̈ + 2ṙθ̇)eθ .
a = OP
dt2
Diremo dunque accelerazione radiale:

ar = r̈ − rθ̇2

51
ed accelerazione trasversa:
aθ = rθ̈ + 2ṙθ̇.
Interpretiamo quest’ultimo termine. Si vede che, per r 6= 0,

d 2
raθ = r2 θ̈ + 2rṙθ̇ = (r θ̇).
dt
Mostriamo che
1
Ȧ := r2 θ̇
2
è la velocità areolare dell’area spazzata dal vettore posizione OP = rer lungo il moto in
studio. L’area spazzata in un intervallo di tempo [t, t + ∆t] è, a meno di o(∆t), l’area di un
triangolo, ove |v|∆t è la “base” e |OP ∧ vers v| è l’“altezza”, entrambe valutate al tempo
t.
1 1 1
∆A = |rer ∧ vers v| |v|∆t + o(∆t) = |rer ∧ v| ∆t + o(∆t) = r2 θ̇∆t + o(∆t),
2 2 2
da cui rapidamente la conclusione:

∆A 1 1
Ȧ = lim = |OP ∧ v| = r2 θ̇.
∆t→0 ∆t 2 2

2.3 Moti Centrali


Una curva OP = OP (t) in R3 di classe C 2 è un moto centrale di centro il punto fisso O se
per ogni istante t in cui è definito vale

¨ ∧ OP = 0,
OP

cioè, l’accelerazione è parallela al vettore posizione OP .

Teorema. Ogni moto centrale è piano con velocità areolare costante.


Prova. Se il moto è centrale vale
d ˙ ) = OP
˙ ∧ OP
˙ + OP ∧ OP
¨ = 0,
(OP ∧ OP
dt

dunque si conserva la quantità vettoriale MO = OP ∧ OP ˙ , il cui significato è di Momento


della Quantità di moto, o Momento angolare, rispetto al polo O, per una particella di massa
m = 1 che evolva lungo il moto in studio.
Supponiamo MO 6= 0. Consideriamo il riferimento con origine in O e versore e3 =
vers MO = MO /|MO |. Evidentemente il moto evolve nel piano (O, e1 , e2 ) poiché OP e
˙ rimangono definitivamente ortogonali a e3 .
OP

52
Supponiamo ora MO = 0. Abbiamo che OP || OP ¨ perché il moto è centrale e abbiamo
che OP || OP ˙ perché MO = 0. Quindi: OP ˙ || OP
¨ . Usando la rappresentazione di Frênet
˙ ¨ 2
abbiamo OP = ṡt, OP = s̈t + ṡ /ρ n, pertanto dev’essere definitivamente 1/ρ ≡ 0, cioè,
il moto è rettilineo e di collisione con O.
Andiamo a vedere il significato della parte scalare di MO . Otteniamo facilmente
˙ = rer ∧ (ṙer + rθ̇eθ ) = r2 θ̇e3 = 2Ȧe3 .
MO = OP ∧ OP

Dunque in un moto centrale la velocità areolare è costante:


1 1
Ȧ = r2 θ̇ = c.
2 2

Osservazione. Notiamo che in ogni altro caso diverso dal moto di collisione rettilinea, cioè
per c 6= 0, si ha r 6= 0 e θ̇ 6= 0, la prima ci garantisce l’assenza di collisioni diverse da quella
rettilinea, l’ultima ci dice che t 7→ θ(t) è un diffeomorfismo.

2.4 Formule di Binet


Mostriamo che in un moto centrale la conoscenza di
i) traiettoria geometrica r = r(θ),
ii) costante delle aree c = 2Ȧ = r2 θ̇,
è sufficiente per la ricostruzione delle grandezze cinematiche, velocità e accelerazione,
associate a quel moto.
dr dr c d 1r
vr = ṙ = θ̇ = = −c ,
dθ dθ r2 dθ
c
vθ = rθ̇ = .
r
Sarà utile nel seguito:
h d 1 2 1i
|v|2 = c2 r
+ 2 .
dθ r
Per l’accelerazione, a = ar er ,

d d1  c2
ar = r̈ − rθ̇2 = − c r θ̇ − 3 ,
dθ dθ r
infine:
c2  d2 1r 1
ar = − + .
r2 dθ2 r
Nel seguito, quest’ultima formula sarà cruciale nello studio della geometria delle orbite nel
problema dei due corpi.

53
2.5 Sulle Coniche
Le curve coniche sono tutte e sole le curve piane che si ottengono sezionando coni con piani.
Un’ulteriore caratterizzazione è la seguente.
Una curva è conica se e solo se per ogni suo punto P è costante il rapporto della distanza
di P da un punto fisso F , detto fuoco, con la distanza di P da una retta detta direttrice,

|P F | r
e := = = costante, eccentricit à.
|P Q| |P Q|

r
Posto d := |F D|, vale |P Q| = d − r cos θ, cosı̀ e = d−r cos θ ,

ed
r= .
1 + e cos θ

Avremo
Ellisse : e < 1, Parabola : e = 1, Iperbole : e > 1.

Studiamo un po’ più in dettaglio l’ellisse.

K
P Q

J D
F1 C F

54
a: semi-asse maggiore
b: semi-asse minore
f : semi-distanza focale, f = |CF | = |F1 C|

Una nota proprietà caratterizzante un’ellisse è la seguente: vale |F1 P | + |F P | =costante


(indipendente da P ). Tale costante vale evidentemente 2a, inoltre, pensando il punto
rappresentativo P nel perigeo (θ = 0),
ed ed ed
2a = r(0) + r(π) = + =2 ,
1+e 1−e 1 − e2
resta determinato il semi-asse maggiore a in funzione dei due parametri e ed d caratteriz-
zanti una generica conica:
ed
a= .
1 − e2
La distanza focale |F1 F | = 2f si determina

ed ed e2 d
2f = r(π) − r(0) = − =2 ,
1−e 1+e 1 − e2
dunque
e2 d
f= ,
1 − e2
ma anche
f = ea.
Il parametro dell’ellisse è definito come il prodotto di e e d:

p := ed.

Mediante il parametro p riscriviamo l’equazione θ-parametrica dell’ellisse,


1 1 + e cos θ
= ,
r p
e determiniamo alcune relazioni coinvolgenti i due semi-assi: quando P è in K (vedi figura)
1
2a = 2(f 2 + b2 ) 2 ,

cosı̀
ed
a2 = f 2 + b2 , b2 = a2 − e2 a2 = a2 (1 − e2 ) = a2 ,
a
infine
b2
p= .
a

55
2.6 Kepler
Nonostante la forte spinta rivoluzionaria della sua proposta eliocentrica, Copernicus, De
revolutionibus orbium coelestium (1543), non riuscı́ ad abbandonare l’idea dei moti circolari
uniformi e delle loro composizioni. A più riprese, collezionando risultati di anni, ciò riuscı́
a Kepler. Inizialmente egli pensò addirittura a moti ovoidali (un’estremità dell’orbita più
stretta dell’altra, si veda per es. a pag. 65 di Giovanni Godoli, “Sfere armoniche. Storia
dell’astronomia”, UTET 1993), in seguito rapidamente abbandonò tali idee, giungendo alla
formulazione delle tre leggi che portano il suo nome. Tali leggi sono di natura puramente
descrittiva e cinematica.

Johannes Kepler

Prima Legge. Le orbite dei pianeti sono ellissi e il Sole è in uno dei fuochi.

Seconda Legge. La velocità areolare è costante.

Terza Legge. Il rapporto del quadrato del periodo con il cubo del semi-asse maggiore,
T2
a3
, è una costante universale.

La prima legge ci dice, in particolare, che i moti sono piani; assieme alla seconda, deduciamo
facilmente che per tali moti si conserva il Momento della quantità di moto (qui riferito ad
una massa unitaria)
MO = OP ∧ OP ˙ = cost.,

dunque, traiamo che i moti sono centrali. Si può facilmente andare un po’ piú avanti con
questa ricognizione puramente cinematica: Nel riferimento associato al piano dell’orbita
ellittica di un pianeta descriviamo con Binet l’accelerazione radiale ar , vale

1 1 + e cos θ
(θ) = ,
r p

56
d2 1 1
dunque dθ2 r
= p − 1r , cosicché
c2 1
ar = − ,
p r2
ove c e p sono costanti per l’orbita in studio. Nel caso ellittico

2πab b2
c= , T = periodo, p= .
T a

4π 2 a2 b2 a 1 2a
3 1
ar = − = −4π ,
T 2 b2 r2 T 2 r2
e per la terza legge a3 /T 2 è indipendente dal pianeta in studio. Emerge forte il segnale
della legge 1/r2 . Una interpretazione dinamica dovrà tener conto di tale fondamentale
fatto. Tutto ciò sarà accolto nella sintesi Newtoniana.

2.7 Newton
Va detto che l’esposizione del pensiero Newtoniano che si addotta ai nostri giorni è quella di
Euler e Lagrange, ed è quella che qui sostanzialmente seguiremo: benché Newton conosces-
se il livello più elevato dell’analisi matematica del suo periodo, sembra in profondo rispetto
ed ammirazione del pensiero matematico ellenistico (ma sembra anche per una profonda
avversione nei confronti del suo collega Robert Hooke al quale intendeva cripticamente
celare la sua opera), non la usò affatto, e nei suoi Philosophiae Naturalis Principia Mathe-
matica (1687), tradusse i calcoli analitici in complessi ragionamenti puramente geometrici,
si veda di V. I. Arnol’d, “Huygens e Barrow, Newton e Hooke”, Bollati Boringhieri.

Isaac Newton

57
In un sistema di riferimento associato ad uno spazio euclideo inerziale consideriamo il
sistema meccanico composto da due punti materiali S e P , Sole e Pianeta, di massa mS e
mP . Su tale sistema agisce un sistema di tipo interno di forze, le cui leggi-forza soddisfano al
Principio di Azione e Reazione, in forma forte, cioè, sia rispetto alla Risultante sia rispetto
al Momento. Quest’ultimo, come già detto, è semplicente un requisito sulle leggi-forza.
Posto h > 0 : costante gravitazionale di Cavendish,
h mS mP h mP mS
FP = vers P S, FS = vers SP,
|P S|2 |SP |2
FP + FS = 0, SP ∧ FP = 0.
I moti dinamicamente possibili sono tutti e soli dati dalle curve t 7→ (OP (t), OS(t))
soddisfacenti al sistema dinamico definito dalla seguente equazione differenziale del se-
condo ordine in R3 × R3 r ∆, dove ∆ := {(x, y) ∈ R3 × R3 : x = y}, che è lo spazio delle
configurazioni di due particelle libere senza collisioni:

¨ = h mS mP vers P S,
mP OP
|P S|2

¨ = h mP mS vers SP.
mS OS
|SP |2
Tale sistema ammette sette integrali primi funzionalmente indipendenti (lo si verifichi): due
vettoriali, quantità di moto e momento della quantità di moto, ed uno scalare, l’energia.
˙ , OS)
p(OP, OS, OP ˙ ˙ + mS OS,
= mP OP ˙

˙ , OS)
MO (OP, OS, OP ˙ ˙ + mS OS ∧ OS,
= mP OP ∧ OP ˙

˙ , OS)
E(OP, OS, OP ˙ = 1 ˙ |2 + mS |OS|
˙ 2) − h mS mP
2 (mP |OP |P S| .

Possiamo pensare il nostro sistema al primo ordine, nella forma ẋ = X(x), ove ora il
campo vettoriale X è definito nello spazio degli atti di moto (R3 × R3 − ∆) × R6 , la cui
chiusura è naturalmente R12 . Un semplice bilancio sul numero (sette) degli integrali primi
porterebbe a supporre che il sistema non sia integrabile, cioè non sembra sia possibile
abbattere geometricamente la dimensione (dodici) del sistema al primo ordine. Ma lo
stato delle cose è meno pessimistico: la motivazione è profonda, risiede nella struttura
Lagrangiana ed Hamiltoniana del sistema; un sintomo di tale fatto sarà evidenziato nella
teoria di Routh dove ogni integrale primo di ciclicità per un sistema Lagrangiano abbatterà
di un grado di libertà il sistema, quindi con un guadagno di due unità nello spazio degli
atti di moto. Ma la materia sarà completamente chiarita nel teorema di Liouville-Arnol’d,
che caratterizza i sistemi Hamiltoniani integrabili.
Per il momento procederemo senza utilizzare la struttura Lagrangiana del sistema.

58
Un primo passo consisterà nell’uso geometrico dell’integrale vettoriale della quantità
di moto p: evidentemente esso sussiste perché il sistema di forze soddisfa al principio di
azione e reazione rispetto alla risultante: FP + FS = 0.
Vale la pena generalizzare questo primo passo verso l’integrazione del sistema dinamico
di Newton pensando ad un più generale sistema di interazione tra due corpi.

2.8 Massa Ridotta


In un sistema di riferimento inerziale I consideriamo un sistema meccanico di interazione
tra due corpi P e S, della seguente generale struttura:

¨ = FP (SP, OP
mP OP ˙ − OS),
˙

(I)
¨ = FS (SP, OP
mS OS ˙ − OS),
˙

dove le leggi forza sono delle generali funzioni

FP , FS : R3 × R3 −→ R3 ,

dipendenti dal vettore differenza delle posizioni ed eventualmente dal vettore differenza
delle velocità (questa dipendenza ulteriore qui si è messa per generalità: naturalmente, il
caso in studio dei due-corpi non la coinvolge). Inoltre valga:

˙ − OS)
FP (P S, OP ˙ + FS (P S, OP
˙ − OS)
˙ = 0.

Consideriamo ora un nuovo sistema non inerziale N I adatto alla descrizione relativa di P
rispetto ad S. L’origine di tale nuovo sistema sarà posto solidale ad S con assi coordinati
invarianti rispetto a quelli del sistema inerziale I, in altri termini, il nuovo riferimento N I
trasla e non ruota, ωtrascinamento = 0, rispetto ad I. Indichiamo in N I con

x := P − S = SP,

il vettore posizione del punto-pianeta P , conseguentemente

˙ − OS.
ẋ = OP ˙

Utilizziamo il teorema di Coriolis per i moti relativi e descrivente la relazione tra le acce-
lerazioni,
aassoluta = arelativa + atrascinamento + aCoriolis ,

59
pensiamo I: sistema assoluto e N I: sistema relativo, e notiamo che

arelativa = ẍ, ¨
atrascinamento = OS, aCoriolis = 0.

Vale la pena ricordare che l’accelerazione di trascinamento è l’accelerazione, rispetto al


sistema-spazio assoluto, di quel punto geometrico del sistema-spazio relativo per il quale
sta transitando il punto materiale P : dato che il nostro sistema puramente trasla, l’ac-
¨ Il nostro sistema
celerazione di trascinamento è uguale in ogni punto e vale appunto OS.
meccanico sarà ora cosı̀ descritto in N I (naturalmente rispetto ad esso il moto di S è
banale)
¨
mP ẍ = FP (x, ẋ) − mP OS.
Più in dettaglio,
1
mP ẍ = FP (x, ẋ) − mP FS (x, ẋ),
mS
utilizzando ora FP + FS = 0,
mP
mP ẍ = (1 + )FP (x, ẋ),
mS
posto
mP mS
µ := : massa ridotta di P,
mP + mS
l’equazione differenziale per P è infine data da

µẍ = FP (x, ẋ). (N I)

Il motivo del nome ‘massa ridotta’ è chiaro:


mP mS mP
µ= = mP < mP .
mP + mS mS +1

Noto dunque il moto t 7→ x(t) risolvente il sistema della massa ridotta in N I del
secondo ordine in R3 con dato iniziale x(0) = OP (0) − OS(0), ẋ(0) = OP ˙ (0) − OS(0),
˙
come ricostruire la soluzione t 7→ (OP (t), OS(t)) in I?
La risposta risiede naturamente nell’uso dell’integrale vettoriale quantità di moto p.
Infatti, assegnati i dati iniziali, il moto del baricentro G in I è subito determinato:

¨ = 0,
(mP + mS )OG

˙ (0) + mS OS(0)
mP OP (0) + mS OS(0) mP OP ˙
˙
OG(t) = OG(0) + OG(0)t = + t,
mP + mS mP + mS

60
dunque è nota la seguente combinazione lineare di OP (t) e di OS(t):

mP OP (t) + mS OS(t)
OG(t) = .
mP + mS
D’altra parte abbiamo determinato differenza di OP (t) con OS(t):

x(t) = OP (t) − OS(t).

La soluzione di tale sistema lineare offre il moto t 7→ (OP (t), OS(t)) in I.

2.9 Soluzione del Problema Ridotto ad un Corpo, il Proble-


ma di Kepler
L’utilizzo dell’integrale primo vettoriale p, e della dipendenza di FP da OP e da OS
mediante il vettore differenza, ha permesso la riduzione ad un sistema differenziale del
secondo ordine in R3 r {0},
hmP mS
µẍ = − vers x.
|x|2
Associati a tale equazione differenziale valgono i seguenti integrali primi del momento della
quantità di moto dell’energia (O ≡ S):

MO (x, ẋ) = µx ∧ ẋ,


E0 (x, ẋ) = 2 µ|ẋ|2 − hm|x|
1 P mS
.

In N I i moti dinamicamente possibili per tale sistema con forza centrale e dunque acce-
lerazione centrale sono tutti piani e con velocità areolare costante. Considereremo il piano
π su cui evolve il moto per una data assegnazione di Cauchy con un sistema di coordinate
cartesiane con origine O ≡ S e asse di versore e3 = vers M0 . Costruiremo quindi il sistema
di coordinate polari coerentemente a quanto sopra fatto.
Il primo passo sarà quello della determinazione delle traiettorie geometriche dei moti in
studio.
Utilizzando la formula di Binet per l’accelerazione, la componente radiale (la trasversa
è identicamente nulla) dell’equazione differenziale si scrive (r = |x|, er = vers x):

c2  d2 1r 1 hmP mS
−µ 2 2
+ =− .
r dθ r r2
Per |MO | = µc 6= 0 si ha che r 6= 0, e dunque è sensata la semplificazione dei due termini
1
r2
: ciò che resta è banalmente integrabile. Infatti

d2 1r 1 h(mP + mS )
+ = (> 0)
dθ2 r c2

61
è l’equazione differenziale lineare del secondo ordine in R, nell’incognita 1r (θ), di un oscil-
latore armonico di pulsazione ω = 1, non omogeneo e di funzione di disomogeneità da-
ta dalla costante h(mPc+m 2
S)
. L’integrale generale dell’equazione completa è dato dalla
somma dell’integrale generale dell’omogenea con un integrale particolare della completa;
quest’ultimo, cercandolo tra le funzioni di θ costanti è dato da r1p (θ) = h(mPc+m
2
S)
. Infine

1 h(mP + mS )
(θ, C1 , C2 ) = C1 sin θ + C2 cos θ + .
r c2
Rileggiamo C1 , C2 in termini di ampiezza e fase iniziale:
1 C1 C2 h(mP + mS )
q
(θ, C1 , C2 ) = C12 + C22 ( p 2 sin θ + p 2 cos θ) + =
r C1 + C22 2
C1 + C2 c2
h(mP + mS )
q
= C12 + C22 (sin θ0 sin θ + cos θ0 cos θ) + ,
c2
1 h(mP + mS )
(θ, A, θ0 ) = A cos(θ − θ0 ) + ,
r c2
ove abbiamo posto A = C12 + C22 e θ0 = arcsin √ C21 2 . Definiamo ora e e p tali che
p
C1 +C2

h(mP + mS ) 1 e
2
= , A= ,
c p p
ne segue che le traiettorie geometriche sono tutte e sole delle sezioni coniche:
1 e cos(θ − θ0 ) + 1
(θ, e, p) = .
r p

Occupiamoci ora della determinazione della legge oraria. Possiamo indifferentemente


usare l’integrale dell’energia o la conservazione della velocità areolare, che corrisponde alla
costanza della parte scalare del momento della quantità di moto. Iniziamo con quest’ultimo
integrale, indagheremo subito dopo le implicazione dell’integrale dell’energia.
Da c = r2 θ̇ segue
Z t Z θ(t) 2
r (θ, e, p)
dt = dθ,
0 θ0 c
p2 θ(t) dθ
Z
t= .
c θ0 (1 + e cos(θ − θ0 ))2
Quest’ultimo integrale si esprime in termini di funzioni elementari. La sua primitiva è
abbastanza complessa —forse questo è uno dei motivi per cui raramente si legge nei manuali
di Meccanica. Per l’ellisse introduciamo cos α = e < 1, una primitiva si scrive:
c a2 c dθ
Z
2
t= 4 t= =
p b (1 + cos α cos θ)2

62
n cos α−θ o 1 cos α sin θ 1
2
= 2 arctan − .
cos α+θ
2
sin α 1 + cos α cos θ sin2 α
3

Dovremmo infine invertirla per ottenere θ = θ(t). Nonostante tale difficoltà, il problema di
Kepler è un prototipo di “sistema integrabile”, cioè di un sistema dinamico le cui soluzioni
sono determinabili mediante le due operazioni sopra descritte: calcolo di primitive (le
cosiddette ‘quadrature’) e inversione di funzioni.
L’uso alternativo dell’integrale dell’energia non porta lontano nel problema dell’integra-
zione, ma risulta geometricamente ben interpretabile. Da
1 hmP mS 1 hmP mS
E0 = µ|v|2 − = µ(ṙ2 + r2 θ̇2 ) − ,
2 r 2 r
1 µc2 hmP mS
E0 = µṙ2 + 2 − .
2 2r r
Se interpretiamo la funzione

µc2 hmP mS
Vcef f (r) := −
2r2 r
quale energia ‘potenziale efficace’, vediamo che il nostro problema si interpreta come un
problema 1–dimensionale del tipo ẍ = f (x). Tale interpretazione non è accidentale: giun-
giamo canonicamente ad essa considerando la formulazione Lagrangiana del problema di
Kepler, dove L(r, θ, ṙ, θ̇) con la ‘ciclicità’ ∂L
∂θ = 0: il metodo di Routh fornisce la Lagrangia-
ef f
na ridotta Lc (r, ṙ) di cui Vc (r) rappresenta il termine dell’energia potenziale (si consiglia,
per esercizio, di completare i dettagli tecnici).
L’analisi dei livelli ad energia fissata E0 nel diagramma cartesiano x = r, y = Vef f (r)
mette ben in evidenza le orbite chiuse (le ellissi) per E0 < 0, l’orbita circolare corrispon-
dente al minimo assoluto di Vcef f (r), e le orbite illimitate, le iperboli per E0 > 0, e la
parabola per E0 = 0.
Dunque
Z r(t)
dr
t= q .
r0 2E c 2 2h(mP +mS )
µ − r2 +
0
r

Utilizziamo nell’espressione dell’energia la formula di Binet per |v|2 ,

1 h d 1 2 1 i hmP mS
E0 = µc2 r
+ 2 − ,
2 dθ r r
e la formula delle coniche
1  e2 1 + e2 cos2 θ + 2e cos θ  1 + e cos θ
E0 = µc2 2 sin2 θ + 2
− hmP mS ,
2 p p p

63
ricordando che
1 h(mP + mS ) hmP mS
= 2
= ,
p c µc2
abbiamo
e2 − 1
E0 = µc2 ,
2p2
e nel caso di orbite ellittiche otteniamo che l’informazione energetica è completamente
contenuta nel semiasse maggiore dell’orbita:

2E0 e2 − 1 1
= =− , a : semiasse maggiore.
hmP mS p a

Vale la pena mettere in evidenza la portata della concordanza della legge di Newton con
quelle di Kepler. Da un lato, la legge di Newton implica, nel sistema della massa ridotta
N I, la completa validità delle due prime leggi di Kepler. Per quanto riguarda la terza
legge, abbiamo che
πab
c = 2Ȧ = 2 ,
T
e c2 è pure cosı̀ esprimibile
c2 = p h (mP + mS ),
b2
confrontiamo queste due espressioni per c, ricordando pure che p = a,

4π 2 a2 b2 b2
= p h(mP + mS ) = h(mP + mS ),
T2 a

a3 h(mP + mS )
= ,
T2 4π 2
dunque, la terza legge di Kepler è valida solo nell’approssimazione:

mP + mS ∼ mS .

2.10 L’equazione di Kepler


Abbiamo precedentemente messo in evidenza le difficoltà nell’integrazione della legge oraria
del problema dei due corpi. Si deve effettuare un’integrazione ed un’inversione. Tale
difficoltà è parzialmente rimossa ricorrendo alla seguente costruzione. Considereremo il caso
delle orbite ellittiche, energia negativa. Consideriamo la circonferenza avente raggio pari al
semi-asse maggiore a e circoscritta all’ellisse in studio. Il centro di questa circonferenza è
l’origine di un sistema di coordinate cartesiane (O, X, Y ), mentre nel fuoco F c’è l’origine

64
del sistema cartesiano (F, x, y) con l’asse x coincidente con l’asse X. Accanto alle usuali
coordinate polari r e θ, dove diremo

θ : anomalia vera,

consideriamo l’angolo u,
u : anomalia eccentrica,
centrato in O, dal semi-asse positivo X al punto H sulla circonferenza, il quale si ottiene
intercettando la circonferenza con la retta passante per il punto rappresentativo P e pa-
rallela all’asse Y . L’area spazzata dal raggio vettore F P è una funzione lineare del tempo,
A = 2c t. In accordo con la tradizione, indicheremo con
c
ζ := t : anomalia media,
ab
rapresentante, essenzialmente, la variabile temporale.

Dall’equazione dell’ellisse
XP2 YP2
+ = 1,
a2 b2
abbiamo che
a2 cos2 u YP2
+ 2 = 1,
a2 b
e dunque:
XP = XH = a cos u = r cos θ + ea, (rem : f = ea)
YP = b sin u = r sin θ.

65
Ancora, dall’equazione dell’ellisse abbiamo (trascuriamo l’apice P )

bp 2
Y = a − X 2.
a
Calcoliamo l’area dei settori F LH e F LP ,
F K·KH
Ra √
area (F LH) = + XK a2 − X 2 dX,
2
F K·KP
Ra √
area (F LP ) = 2 + ab XK a2 − X 2 dX.

Ora
KH = a sin u,
KP = r sin θ = b sin u,
pertanto
b
KP = KH.
a
Usando quest’ultima relazione le aree dei due settori risultano
b
area (F LP ) = area (F LH).
a
Ma queste due aree si calcolano anche in un altro modo:
ua2 a sin u 2 ea2 sin u
area (F LH) = 2 −f 2 = ua2 − 2 ,
c
area (F LP ) = 2 t,
c
otteniamo cosı́ infine u − e sin u = ab t,

u − e sin u = ζ (equazione di Kepler)

La sola inversione di tale funzione fornisce la legge oraria dell’anomalia eccentrica,

u = u(ζ).

Per e < 1, il caso ellittico che stiamo trattando, l’equazione di Kepler, pensata come una
funzione ζ = ζ(u), induce un diffeomorfismo globale:


= 1 − e cos u > 0.
du
L’equazione di Kepler è da decenni un ambiente di prova per la teoria della rap-
presentazione delle funzioni inverse mediante sviluppi in serie, si veda per esempio Aurel
Wintner, The analytical foundations of celestial mechanics, 1941, ma anche letteratura
più recente, Peter Colwell, Solving Kepler’s equation over three centuries, Willmann-Bell,
1993.

66
2.11 Il Vettore di Runge-Lenz per il Problema di Kepler
Spaziale
Riconsideriamo il problema di Kepler, dato dal sistema differenziale del secondo ordine in
R3 ,
α
µẍ = − 2 vers x (α := hmP mS ).
|x|
Indichiamo con
MO (x, ẋ) := µ x ∧ ẋ
il momento della quantità di moto, integrale primo vettoriale relativo a tale sistema. Di-
mostriamo che la seguente funzione vettoriale, detta “vettore di Runge-Lenz” o “vettore
di Laplace”,
x
W(x, ẋ) := ẋ ∧ MO (x, ẋ) − α
|x|
d
è un integrale primo per il problema di Kepler. È un conto diretto (rem: dt MO = 0):
d ẋ x d
W = ẍ ∧ MO − α − α(− 2 |x|),
dt |x| |x| dt
ora, un rapido conto mostra che
d d√ 2x · ẋ x · ẋ
|x| = x·x= √ = ,
dt dt 2 x·x |x|
dunque:
d
dt W = − αµ |x|x3 ∧ (µx ∧ ẋ) − α( |x|
ẋ x·ẋ
− x |x| 3 ),

 
x·ẋ x·x ẋ x·ẋ
= α − x |x| 3 + ẋ |x|3 − |x| + x |x| 3 = 0.
Tale vettore W, benché non sia indipendente da MO , ha nel caso ellittico un’interessante
interpretazione geometrica: calcoliamo W nell’atto di moto che compete al transito per
un punto apsidale dell’orbita, per esempio il perielio, ivi i vettori x∗ , ẋ∗ e MO sono tra
loro ortogonali, in particolare il vettore ẋ∗ ∧ MO appare parallelo e orientato come il
vettore posizione x∗ , dunque, dalla definizione di W, segue che quest’ultimo è diretto come
il vettore posizione x∗ , indicante appunto la posizione nella spazio del punto apsidale,
dunque la direzione in cui giace il semi-asse maggiore dell’orbita ellittica.

2.12 Circonferenza di Hamilton delle velocità nel Problema


di Kepler piano
Hamilton (1846) dimostrò il seguente fatto (per maggior dettagli vedere p.e. l’articolo di
John Milnor, On the Geometry of the Kepler Problem, American Math. Monthly, 90,
(1983) 353-364):

67
Lungo ogni moto Kepleriano, ẍ = −k |x|x3 , il vettore velocità descrive una circonferenza
nel piano dell’orbita.
Nel piano in cui evolve l’orbita conica, nelle usuali coordinate polari, si ha
1 e cos θ + 1
= , c = r2 θ̇, v = ṙer + rθ̇eθ .
r p
Derivando rispetto al tempo l’equazione delle coniche e usando l’integrale delle aree,
1 sin θ sin θ 2 sin θ
− 2
ṙ = −e θ̇, ṙ = e r θ̇ = e c,
r p p p
quindi
sin θ c
v=e cer + eθ =
p r
sin θ e cos θ + 1
= c(e er + eθ ),
p p
otteniamo
c ce
v= eθ + (sin θer + cos θeθ ),
p p
infine
ce c
v(θ) = c2 + eθ (θ),
p p
che è evidentemente l’equazione parametrica della circonferenza di centro (0, ce
p ) e di raggio
ρ = pc .

2.13 Teorema di Bohlin (nella versione di Faure-Arnol’d):


Equivalenza orbitale dei potenziali elastico e Kepleria-
no
Pensiamo al piano R2 come al piano complesso C, z = x+iy. Sia U (z) un’energia potenziale
assegnata per una particella di massa m, dunque
1
L(z, ż) = m|ż|2 − U (z).
2
Fissato il valore dell’energia totale e = 12 m|ż|2 +U (z) =: E(z, ż), le orbite, per quell’energia
e, sono tutte e sole le orbite associate alla Lagrangiana
1
Le (z, ż) = m(e − U (z))|ż|2
2
sulla ipersuperficie energetica che ora è descritta da Ee (z, ż) := 12 m(e − U (z))|ż|2 = 1.
Queste due ipersuperfici sono distinte nello spazio degli atti di moto T R2 3 (z, ż), ma le

68
superfici di livello delle rispettive funzioni Hamiltoniane (costruite con due ben distinte
trasformazioni di Legendre), relative ai rispettivi valori e e 1, coincidono nello spazio delle
fasi T ∗ R2 3 (z, p) (vedere la teoria della metrica di Jacobi).
Teorema. Sia f : C → C, z 7→ w = f (z) una funzione analitica con derivata complessa
0
f non nulla.
Supponiamo che
dw
U (z) = |f 0 (z)|2 = | (z)|2 .
dz
Allora f muta Le (z, ż) in

1  
eLe0 (w, ẇ) := me e0 − V (w) |ẇ|2 = Le (z, ż)

2 z=z(w), dz
ż= dw (w)ẇ

−1
ove ee0 = −1, e V (w) = −| dw
dz
(w)|2 = −| dfdw (w)|2 .
Osservazione. Si noti che f genera sia la trasformazione puntuale sia le rispettive energie
potenziali.
Prova. Dettagliamo
Le (z, ż) =

dz
z=z(w), ż= dw (w)ẇ

1  dw  dz
= m e − | (z)|2 | (w)|2 |ẇ|2 =

2 dz z=z(w) dw

1  dz 
= m e| (w)|2 − 1 |ẇ|2 =
2 dw
1  1 dz 
= me − − (−| (w)|2 |ẇ|2 =
2 e dw
n1 o
=e m(e0 − V (w))|ẇ|2 .
2

Dunque non solo le orbite di Le (z, ż) ma le sue leggi orarie (le soluzioni) coincidono
con quelle di Le0 (w, ẇ) (il fattore e è irrilevante): consideriamo quelle ad energia uguale ad
1. Allora (teoria della metrica di Jacobi, principio di Maupertuis) esistono due rispettive
riparametrizzazioni del tempo che ci segnalano che le orbite (il loro supporto) di

1 1
L(z, ż) = m|ż|2 − U (z), e = m|ż|2 + U (z)
2 2
sono tutte e sole le orbite di
1 1
L(w, ẇ) = m|ẇ|2 − V (w), e0 = m|ẇ|2 + V (w).
2 2

69
Consideriamo un esempio: w(z) = z 2 . Allora

U (z) = 4|z|2 energia potenziale elastica,

d √ 2 1 1
V (w) = −| w| = − energia potenziale Kepleriana.
dw 4 |w|
Quest’ultimo risultato, relativo all’equivalenza orbitale del caso elastico con quello Ke-
pleriano è di K. Bohlin (1911); un’ulteriore versione di tale teorema di equivalenza fu
introdotta da Tullio Levi-Civita (1920). La versione generale del teorema qui cosı̀ ripor-
tato è di Arnol’d (vedi V.I. Arnol’d “Huygens & Barrow, Newton & Hooke”, Birkhäuser,
1990, purtroppo nella traduzione italiana Bollati-Boringhieri il teorema è sparito) il quale
avverte che la sua prima apparizione è stata in ambiente quantistico per opera di R. Faure
(1953).
Va infine segnalato un notevole teorema di Bertrand (1873) che lega indissolubilmente
potenziale elastico e Kepleriano (vedi V. Arnol’d, Metodi matematici della meccanica clas-
sica, Ed. Riuniti, p.42): In un campo centrale tutte le orbite limitate sono chiuse se e solo
se l’energia potenziale V (r) ha una delle seguenti forme:
α2
V1 (r) = α1 r2 , V2 (r) = − , α1 , α2 > 0.
r

2.14 Sulle soluzioni esatte del Problema a Tre Corpi ed N


Corpi
Siano m1 , m2 , m3 le masse di P1 , P2 , P3 , mutuamente interagenti con gravitazione Newto-
niana. L’equazione dinamica per il punto P1 è

¨ 1 = hm1 (m2 P1 P2 P1 P3
m1 OP + m3 ),
|P1 P2 |3 |P1 P3 |3

e cosı̀ analogamente per P2 e P3 . Nelle Proposizioni 65 e 66 dei Principia Newton dette un


rapido sguardo al problema dei tre corpi. Tuttavia in seguito disse che un’esatta soluzione
per i tre corpi
exceeds, if I am not mistaken, the force of any human mind.
Ciò non scoraggiò Joseph Louis Lagrange: nel 1772 dimostrò che
(Soluzioni triangolari del problema a tre corpi, J. L. Lagrange) Comunque
siano scelte le masse m1 , m2 , m3 > 0, e comunque sia fissato l > 0, esiste una soluzione
piana, con P1 , P2 , P3 ai vertici di un triangolo equilatero di lato l e ruotante uniformemente
con velocità angolare ±|ω| attorno al suo baricentro, dove

h(m1 + m2 + m3 )
ω2 = .
l3

70
La dimostrazione si fa per verifica diretta. Consideriamo un riferimento inerziale con
origine nel baricentro O, sicuramente questa è una scelta lecita perché il baricentro del siste-
ma evolve con moto rettilineo uniforme. All’istante t = 0 poniamo i tre punti Pj , j = 1, 2, 3,
nei vertici del triangolo equilatero di lato l e di baricentro O. Pensando, per comodità, all’o-
meomorfismo R2 ∼ C, siano z̄j ∈ C (al tempo t = 0) i vettori posizione di Pj . Verifichiamo
quindi che la rotazione del triangolo

OPj (t) = zj (t) = z̄j eiωt


¨ j = −ω 2 OP j , quindi l’equa-
è la soluzione esatta cercata. La derivata seconda risulta OP
zione dinamica per P1 è soddisfatta se per ogni istante t

P1 P2 P1 P3
−m1 ω 2 OP 1 = hm1 (m2 3
+ m3 3 ),
l l
3
mettendo a fattore 1/l e dalla definizione del baricentro O,
hm1
−m1 ω 2 OP 1 = (m1 + m2 + m3 )P1 O,
l3
pertanto
OP1 (t) = z̄1 eiωt
se
h(m1 + m2 + m3 )
ω2 =
l3
Otteniamo cosı̀ la tesi osservando che le stesse considerazioni, e per la stessa ω, valgono
per P2 e P3 .
Lagrange reputò queste soluzioni fisicamente non interessanti, delle curiosità matema-
tiche. Solo nel 1906 si scoprirono gli asteroidi Greci e nel 1908 i Troiani, che, grosso modo,
evolvono nei due punti triangolari con il Sole e Giove —vedi, p.e., a pag. 409 del E. T.
Whittaker, A Treatise on the Analytical Dynamics of Particles & Rigid Bodies. Lo studio
della stabilità di tali soluzioni è una lunga storia che inizia con Lagrange stesso: mentre le
condizioni per la stabilità del problema linerizzato si raggiungono abbastanza facilmente
(è un conto noioso, ma diretto), informazioni sulla Lyapunov stabilità sono state ottenute
solo negli ultimi decenni mediante la teoria delle perturbazioni dei sistemi Hamiltoniani, e
solo per il problema ristretto.
Alcuni tecnici dell’astronautica pensano di utilizzare i punti triangolari con Terra e
Luna, che a conti fatti risultano stabili, per “parcheggiare” satelliti artificiali o astronavi;
attualmente in tali punti sono stati osservati degli ammassi di polvere cosmica (K. Kor-
dylewski, 1961) responsabili della luce zodiacale, “una diffusa luminescenza che si osserva
nel cielo durante notti limpide e serene e che si estende lungo le dodici costellazioni dello
zodiaco”, vedi Alessandra Celletti e Ettore Perozzi, Meccanica Celeste, Cuen, 1996.

71
Altra classica famosa famiglia di soluzioni “rigide” del problema a tre corpi è data
dalle soluzioni collineari di Euler, quest’ultime risultano tutte instabili, quindi difficilmente
osservabili.
Proviamo, per esercizio, a costruire qualche semplice famiglia di soluzioni per il pro-
blema a N -corpi, con masse tutte uguali, e, naturalmente, con molta simmetria semplifi-
catrice. Dimostriamo che
Esistono famiglie piane a simmetria assiale di soluzioni non rigide tali che ad ogni istante
le particelle sono uniformemente distribuite su di una circonferenza di raggio dipendente
dal tempo, ed inoltre ciascuna particella evolve di moto Kepleriano lungo una conica con
fuoco nel centro della circonferenza, uguale per tutte le particelle, ma ruotata, da particella
a particella, dell’angolo 2πN.
Anche qui la prova è un conto diretto. Consideriamo una circonferenza di raggio r e
l’N -poligono regolare inscritto; la distanza di un prefissato vertice P dal vertice p-esimo,
p = 1, ..., N − 1, è data da (geometria elementare) p = 1, ..., N − 1
π
lp := |P Pp | = 2r sin(p ).
N
Scriviamo l’equazione vettoriale di Newton per la particella P ,

¨ = hm(m P P1 + ... + m P Pp + ... + m P PN −1 ),


mOP
|P P1 |3 |P Pp |3 |P PN −1 |3

usiamo per il primo membro la formula di Binet (è lecito, perché la risultante delle forze su
P è centrale con polo il centro O della circonferenza) e riorganizziamo il secondo membro,

c2 d2 1r 1  OP
−m 2 2
+ =
r dθ r |OP |

1 1 1 PO
= hm2 ( 2 P1 P̄1 ) + ... + 2 sin(P\
sin(P\ \
Pp P̄p ) + ... + 2 sin(P PN/2 P̄N/2 )) ,
l1 lp lN/2 |P O|

ove P̄p è la proiezione ortogonale di Pp sull’asse per OP . (Conviene schizzare una figura.)
Si osservi che (anche qui, geometria elementare)
π
sin(P\
Pp P̄p ) = sin(p ).
N

\
(Si verifichi la formula, per es., nel caso N pari, per p = N/2 essa dà: sin(P PN/2 P̄N/2 ) = 1,
come ci si deve aspettare.)

c2 d2 1r 1 OP 1 PO
−m 2
( 2 + ) = hm2 2 k(N ) ,
r dθ r |OP | r |P O|

72
dove, supponendo per es. il caso N pari,
N
−1
2
X 1 1
k(N ) = π + .
2 sin(p N ) 4
p=1

Infine, per la particella P ,


d2 1r 1 hmk(N )
+ = ,
dθ2 r c2
le cui soluzioni sono le note coniche come nel classico problema dei due corpi. Fissata la
costante delle aree c, uguale per tutte le particelle, otteniamo rapidamente la tesi. Tutto
funziona ancora, con ovvie modifiche, se poniamo al centro O una particella di massa
arbitraria M .
Nel caso ellittico otteniamo delle soluzioni di “anello pulsante” (tra ipogeo e apogeo) su
cui si equidistribuiscono le particelle, le quali, tra l’altro, compiono un moto di rotazione
attorno ad O.
Quando la conica è una circonferenza tale soluzione esatta potrebbe essere pensata
come un modello esatto per la “fascia degli asteroidi”, in effetti, essa fu invece proposta
dal giovane Clerk Maxwell nel 1856 come modello per l’anello di Saturno: gli valse un
premio all’università di Cambridge. Queste particolari soluzione esatte del problema ad
N corpi sono ben catalogate nel fondamentale manuale di Aurel Wintner, The analytical
foundations of celestial mechanics, 1941, e per Maxwell si veda la citazione a p. 306.

Il problema generale dei tre corpi è attualmente oggetto di ricerca avanzata. Si è lontani
da una comprensione esauriente. E il punto obbligato d’inizio della studio resta comunque
l’opera poderosa di Henri Poincaré: i tre volumi de Les Méthodes Nouvelles de la Mécanique
Céleste, 1892.

73
74
Capitolo 3

Teoria della Stabilità

3.1 Lyapunov Stabilità

Consideriamo l’equazione differenziale associata ad un campo vettoriale (non lineare) X :


Rm → Rm ,

ẋ = X(x),

e sia x = x∗ un equilibrio, cioè una configurazione in cui il campo X si annulla, X(x∗ ) = 0,


e dunque il problema di Cauchy con dato iniziale al tempo t = 0 nell’equilibrio, x(0) = x∗ ,
è risolto (almeno) dalla curva banale x(t) = x∗ . Il concetto di stabilità di un equilibrio
x∗ di un’equazione differenziale di prim’ordine —che ora enunceremo qui di seguito— è
puramente topologico.

Definizione (Lyapunov stabilità): un punto x∗ è di equilibrio stabile se ∀ε > 0 ∃δ =


δ(ε) > 0 e δ ≤ ε, tale che, ∀ dato iniziale x0 ∈ B(x∗ , δ), la soluzione x(t, x0 ) del problema:

ẋ = X(x), x(0) = x0 ,

non esce mai dalla palla B(x∗ , ε), cioè x(t, x0 ) ∈ B(x∗ , ε), ∀t ≥ 0.

75

?
X

X0 δ

Diremo instabile una configurazione d’equilibrio che non è stabile (è abolito l’equilibrio
indifferente).
Lo spazio di evoluzione del sistema dinamico retto dall’equazione differenziale ẋ = X(x)
è Rm , e la definizione ora data usa la base di intorni aperti formata dalle palle generate
con la norma (e dunque con la metrica) euclidea: B(x∗ , r) := {x ∈ Rm : |x − x∗ | < r}.
Nel caso dimensionalmente finito, in cui stiamo lavorando, è noto che tutte le norme sono
topologicamente equivalenti, e questo giustifica l’affermazione iniziale.
Se il sistema dinamico è di tipo meccanico —per esempio, equazioni di Lagrange poste
in forma normale—, q̈ = f (q, q̇), q ∈ RN , allora lo spazio in cui il sistema evolve al primo
ordine è lo spazio degli atti di moto, Rm = R2N , x = (q, v) ∈ R2N ,
   
q̇ v
ẋ = = = X(x),
v̇ f (q, v)
   
2N 2N q v
X:R →R , → .
v f (q, v)
L’equilibrio di un sistema dinamico di tipo meccanico è ancora dato da un punto x∗ =
(q ∗ , v ∗ )
che annulla il campo vettoriale X:

v∗
   
∗ 0
X(x ) = 0 se e solo se = ;
f (q ∗ , v ∗ ) 0

76
ritroviamo quindi la ben nota definizione meccanica di equilibrio, letta ora nello spazio
degli atti di moto:
q ∗ è un punto d’ equilibrio per q̈ = f (q, q̇) se e solo se l’atto di moto x∗ = (q ∗ , 0) è tale
per cui f (q ∗ , 0).
Nel 1892 Lyapunov enunciò il seguente teorema, di carattere topologico, che offre delle
condizioni sufficienti per la stabilità di un equilibrio x∗ per una generica equazione ẋ =
X(x).
Teorema 1 (T. topologico sulla stabilità semplice). Sia x∗ un punto di equilibrio per
il sistema dinamico, X(x∗ ) = 0. Supponiamo che esista una funzione continua
o
W : U ⊆ Rm → R, x∗ ∈ U ,

tale che
1) W (x∗ ) = 0, W (x) > 0 ∀x ∈ U \ {x∗ }, cioè W è def inita positiva in x∗ , localmente
o
in U ;
2) per ogni soluzione t 7→ x(t) e per ogni t per cui x(t) ∈ U , la funzione composta
t 7→ W (x(t))
sia monotona non crescente:

t1 < t2 ⇒ W (x(t1 )) ≥ W (x(t2 )).


Allora x∗ è un equilibrio stabile.
Prova: dobbiamo verificare la definizione di stabilità. Fissiamo dunque ε > 0 ad arbitrio.
Non è certamente restrittivo prenderlo tale che B(x∗ , ε) ⊂ U.
W è una funzione continua e quindi è continua anche la sua restrizione sulla buccia della
palla B(x∗ , ε), che è compatta. Per il teorema di Weierstrass, esiste

a := min|x−x∗ |=ε W (x),

inoltre, per la condizione 1), a > 0.


Scriviamo ora in dettaglio la condizione di continuità di W in x∗ , utilizzando come “epsilon”
il numero positivo a appena definito. Dunque, in corrispondenza di a esiste un δ > 0 tale
che, ∀x0 ∈ B(x∗ , δ), vale : |W (x0 ) − W (x∗ )| < a, cioè

W (x0 ) < a ∀x0 ∈ B(x∗ , δ).

Si osserva ora che la soluzione x(t, x0 ), con dato iniziale x(0) = x0 , ove
x0 ∈ B(x∗ , δ), rimane definitivamente in B(x∗ , ε); infatti, usando la condizione 2), ∀t > 0
si ha
W (x(t, x0 )) ≤ W (x0 ) < a;

77
dunque x(t, x0 ) non raggiunge la buccia di B(x∗ , ε) per alcun t̄ > 0, perché in tal caso
—essendo a := min|x−x∗ |=ε W (x)— si avrebbe che

W (x(t̄, x0 )) ≥ a,

in contrasto con quanto appena mostrato, W (x(t̄, x0 )) < a.

Lo studio della stabilità degli equilibri mediante le funzioni W , dette (appunto) “fun-
zioni di Lyapunov”, è universalmente noto come Secondo Metodo di Lyapunov.
L’ambiente puramente topologico in cui abbiamo finora operato, che è quello naturale
in cui si pone il problema della stabilità, risulta però scarsamente utile dal punto di vista
pratico: infatti per verificare la condizione 2) di non crescenza delle candidate funzioni
di Lyapunov W lungo le soluzioni dell’equazione differenziale, dovremmo conoscere tutte
le soluzioni di tale equazione, ma a quel punto sarebbe inutile procedere col teorema di
Lyapunov, dato che la presunta conoscenza di tutte le soluzioni t 7→ x(t) con immagine
in U basterebbe ampiamente per analizzare l’andamento qualitativo dinamico locale in
x∗ . È ben noto, invece, che non è possibile conoscere, esibire le soluzioni delle equazioni
differenziali ordinarie. Tale difficoltà è ben più seria della difficoltà del calcolo di primitive
di integrali o dell’inversione di funzioni.
Il pessimismo che emerge rimanendo nella categoria topologica è in parte rimovibile
nella categoria differenziale; richiederemo, cioè, che W sia differenziabile, e, invece della
condizione 2), richiederemo:

2)0 (gradRm W (x)) · X(x) ≤ 0, x ∈ U,

ove · rappresenta il prodotto scalare in Rm .


Chiaramente, se vale 2)0 , allora per ogni t 7→ x(t), soluzione con supporto in U ,
d dx
[W (x(t))] = (gradRm W ((x))|x=x(t) · (t) =
dt dt
= (gradRm W (x))|x=x(t) · X(x(t)) ≤ 0,
e dunque vale la condizione 2) nei sottoinsiemi connessi. Il primo membro della condizione
2)0 , condizione che si verifica naturalmente senza risolvere l’equazione differenziale, è detto
derivata di Lie di W lungo il campo vettoriale X:

(LX W )(x) := gradRm W (x) · X(x).

Riassumendo:
Teorema 2 (T. differenziale sulla stabilità semplice). Sia x∗ un punto di equilibrio per
il sistema dinamico, X(x∗ ) = 0. Supponiamo che esista una funzione differenziabile:
o
W : U ⊆ Rm → R, x∗ ∈ U ,

78
tale che
1) W (x∗ ) = 0, W (x) > 0 ∀x ∈ U \ {x∗ }, cioè W è definita positiva in x∗ , localmente
o
in U ;
2)0 (LX W )(x) ≤ 0, ∀x ∈ U .Allora x∗ è un equilibrio stabile.

Esercizio. A volte, nei vecchi manuali classici di Meccanica Razionale, si trova la


seguente definizione di stabilità di un equilibrio q ∗ per q̈ = f (q, q̇):sia f (q ∗ , 0) = 0; si dice
che q ∗ è stabile se, ∀ε > 0, si determina δ > 0 tale che ∀q0 ∈ B(q ∗ , δ) e ∀q̇0 per cui
1
T (q̇0 ) := 2 | q̇0 |2 < δ, si ha che la soluzione
 
 
∗ dq  
q t, q0 , q̇0 ∈ B(q , ε) e T t, q0 , q̇0 < ε, ∀t ≥ 0.
dt

Dimostrare che tale definizione è equivalente a quella precedentemente data, dimostrando


che gli insiemi n o
(q, q̇) : q ∈ B(q ∗ , ε), T (q̇) < ε

formano, per ε > 0, una base di intorni di (q ∗ , 0). (Si provi ad estendere queste argomen-
tazioni al caso di energia cinetica dipendente da q.)

3.2 Stabilità Asintotica


Definizione. Sia x∗ un punto d’equilibrio per ẋ = X(x): X(x∗ ) = 0. Diremo che x∗ è
asintoticamente stabile se ∀ε > 0 ∃δ > 0 tale che ∀x0 ∈ B(x∗ , δ) si ha :
i) ∀t > 0 : x(t, x0 ) ∈ B(x∗ , ε), cioè x∗ è d’equilibrio stabile,
ed inoltre
ii) lim x(t, x0 ) = x∗ .
t→+∞
Vale il seguente teorema di Lyapunov.
Teorema 3 (T. sulla stabilità asintotica). Sia x∗ un punto d’equilibrio per il sistema
dinamico associato al campo vettoriale continuo X ∈ C 0 (Rm ; Rm ). Supponiamo che esista
una funzione W di classe C 1 (U ; R) (differenziabile con continuità):
o
W : U ⊆ Rm → R, x∗ ∈ U ,

tale che:
1) W (x∗ ) = 0, W (x) > 0 ∀x ∈ U \ {x∗ }, cioè W è definita positiva in x∗ , localmente
in U ,
2)00 LX W (x∗ ) = 0, LX W (x) < 0 ∀x ∈ U \ {x∗ }, cioè LX W è definita negativa in x∗ ,
localmente in U .
Allora x∗ è un equilibrio asintoticamente stabile.

79
Prova: la condizione 2)00 implica la condizione 2)0 del teorema 2, dunque: ∀ε > 0 ∃δ > 0

tale che ∀x0 ∈ B(x∗ , δ): x(t, x0 ) ∈ B(x∗ , ε) ∀t ≥ 0,


cioè la stabilità di x∗ è subito accertata.
Fissiamo ora l’attenzione, per un ε > 0 scelto e un conseguente δ, su un ben determinato
dato iniziale x0 ∈ B(x∗ , δ); indagaremo sull’andamento asintotico della soluzione x(t, x0 ).
La convergenza lim x(t, x0 ) = x∗ sarà provata verificando che, comunque si scelga ε1 > 0
t→+∞
esiste un istante t̄ tale che, per ogni t > t̄, la soluzione x(t, x0 ) resta definitivamente
confinata in B(x∗ , ε1 ).
In effetti la stabilità implica che, in corrispondenza di ε1 > 0, esiste δ1 > 0 tale che se a
qualche istante t̄

x(t̄, x0 ) ∈ B(x∗ , δ1 ) allora x(t, x0 ) ∈ B(x∗ , ε1 ) ∀t ≥ t̄.

Se, per assurdo, fosse sempre |x(t, x0 ) − x∗ | ≥ δ1 ∀t ≥ 0, poiché nel chiuso

B(x∗ , ε) \ B(x∗ , δ1 )

LX W è continua ed ha un massimo negativo −µ, allora ∀t ≥ 0 avremmo

d
W (x(t, x0 )) = LX W (x(t, x0 )) ≤ −µ < 0
dt

e quindi, integrando tra t = 0 e t > 0,

W (x(t, x0 )) ≤ W (x0 ) − µt.

Ma, al crescere di t, W (x(t, x0 )) diventerebbe negativa in alcuni punti di U , contro l’ipo-


tesi 1). Quindi deve esistere un istante t̄ in cui x(t̄, x0 ) ∈ B(x∗ , δ1 ), e quindi x(t, x0 ) ∈
B(x∗ , ε1 ) ∀t ≥ t̄.

80

x0

δ
x?
1
δ1

3.3 Teorema di Lagrange-Dirichlet


Nel caso di sistemi dinamici meccanici a vincoli olonomi bilaterali, fissi, lisci vale il se-
guente teorema di Lagrange-Dirichlet, che qui deduciamo come applicazione del teorema
(il secondo, nell’esposizione fatta) di Lyapunov.
Teorema (Lagrange-Dirichlet). Si consideri un sistema a vincoli olonomi bilaterali,
lisci, fissi. Supponiamo che sia soggetto alle sollecitazioni
(1) (2)
Qh (q, q̇) = Qh (q) + Qh (q, q̇),

ove

(1) ∂U
i) Qh (q) = − (q) (conservative)
∂qh

N
(2) (2) (2)
X
ii) Qh (q, q̇) : Qh (q ∗ , 0) = 0, Qh (q, q̇)q̇h ≤ 0.
h=1

∂U ∗
Supponiamo che in q ∗ , (q ) = 0, cioè q ∗ sia d’equilibrio. Se q ∗ è un minimo stretto
∂q h
(1)
locale per U, l’energia potenziale di Qh (q), allora q ∗ è stabile.

81
Prova: mostriamo che la funzione

E(q, q̇) = T (q, q̇) + U(q) − U(q ∗ )

è una funzione di Lyapunov in (q ∗ , 0) per la dinamica associata al nostro sistema. Sappiamo


che q̇ 6= 0 ⇒ T (q, q̇) > 0, inoltre q ∗ è un minimo stretto locale, dunque esiste un intorno di
(q ∗ , 0) in R2N in cui E(q, q̇) è definita positiva.
Lungo le soluzioni:
dE dT dU
= + ,
dt dt dt
dT
per il teorema delle “forze vive”, è la potenza di tutte le forze applicate, attive e
dt
vincolari, quest’ultime, essendo liscio il sistema, fanno lavoro nullo. Dunque:
dE (1) (2) (1) (2)
= Qh q˙h + Qh q˙h − Qh q˙h = Qh (q, q̇)q˙h ≤ 0,
dt
pertanto E(q, q̇) è una funzione di Lyapunov.
(2)
Forze o sollecitazioni del tipo Qh (q, q̇) si dicono:
(2)
giroscopiche se Qh (q, q̇)q˙h = 0,
(2)
dissipative se Qh (q, q̇)q˙h < 0 per q̇ 6= 0.

Esempi, per q ∈ R3 :
1) la forza di Coriolis, −mac = −2m ω∧ q̇, di tipo giroscopico;2) la forza viscosa, F v = −k q̇,
di tipo dissipativo.
Esercizio 1: mostrare che in presenza di forze dissipative le funzioni di Lyapunov cosı́ ot-
tenute non mostrano la stabilità asintotica, bensı́ la sola stabilità semplice. Questo non
significa che l’equilibrio in studio non possa essere asintoticamente stabile, come giusta-
mente si potrebbe sospettare, ma questo lo si può rilevare o con una funzione di Lyapunov
ad hoc (vedi l’esercizio 2), o col Primo Metodo di Lyapunov (vedi più avanti), o con un op-
portuno teorema (vedi, per esempio, la Sect. 35 del F. Gantmacher “Lectures in Analytical
Mechanics”, Mir 1975).
Esercizio 2: si consideri l’oscillatore armonico con viscosità:

mq̈ = −hq − k q̇,

mostrare che la funzione


1 h 1 k
W (q, q̇) = m|q̇|2 + |q|2 + (m|q̇ + q|2 + h|q|2 )
2 2 2 m

82
è una funzione di Lyapunov per l’asintotica stabilità di (q, q̇) = (0, 0). Si provi ad estendere
tale costruzione di funzione di Lyapunov per sistemi più generali.
Esercizio 3: sembrerebbe ragionevole che un equilibrio di un sistema meccanico conservativo
in cui l’energia potenziale non è un minimo sia instabile. L’inversione del teorema di
Lagrange-Dirichlet (che offre solo condizioni sufficienti per la stabilità) non è però materia
completamente chiarita; mostrare che per l’energia potenziale C ∞ ma non analitica (q ∈
R1 ),
1 −1
U(q) = cos( ) e q2 , q 6= 0, U(0) = 0,
q
q = 0 è stabile benché il punto stazionario q = 0 non sia un minimo (questo è noto come
“esempio di Painlevé-Wintner”). Il teorema enunciato più sotto (e non dimostrato) è un
esempio di parziale inversione del teorema di Lagrange-Dirichlet.
Esercizio 4: per i sistemi meccanici conservativi a vincoli lisci e fissi ha senso aspettarsi
l’asintotica stabilità?
Esercizio 5: mostrare che per i generali sistemi dinamici ẋ = X(x) la stabilità di un
equilibrio x∗ implica l’unicità della soluzione quiete x(t) = x∗ per il problema di Cauchy
con dato iniziale x0 = x∗ , senza nulla richiedere sulla regolarità di X.
Esercizio 6: ad una prima lettura della definizione di asintotica stabilità la condizione i)
sembrerebbe rindondante, cioè implicata dalla ii): perché tale argomento è falso? Nelle
applicazioni è utile il seguente teorema, che non dimostreremo:
Teorema (THND) Sia dato un sistema olonomo, bilaterale, liscio. Le sollecitazioni siano
tutte conservative, vale a dire:
∂U
Qh (q) = − (q).
∂qh
∂U ∗
Sia q ∗ un punto stazionario per U: (q ) = 0. Sia la matrice hessiana non degenere:
∂qh

∂2U
det (q ∗ ) 6= 0.
∂qh ∂qk
Allora l’equilibrio q ∗ è stabile se e solo se la forma quadratica

∂2U
(q ∗ )λh λk > 0, ∀λ 6= (0, . . . , 0)
∂qh ∂qk
cioè, è definita positiva.
Mettiamo in evidenza con esempi concreti il carattere essenziale dell’ipotesi di sole forze
conservative.
Esempio 1: si consideri una particella di massa m vincolata senza attrito su di un piano
orizzontale rotante (O, x, y) con velocità angolare di trascinamento rispetto agli spazi iner-
ziali ω, un vettore costante diretto lungo l’asse z. La particella sia soggetta ad una forza

83
elastica di centro O. Gravità e reazione vincolare fanno lavoro nullo e un semplice conto
mostra che O è d’equilibrio nel sistema rotante e l’energia potenziale della forza elastica e
di quella centrifuga vale
1
U(x, y) = (h − mω 2 )(x2 + y 2 ).
2
Sulla particella agisce la forza di Coriolis F = −2mω ∧ v, v = (ẋ, ẏ), che ha un ovvio
carattere giroscopico, F · v = 0. Lagrange-Dirichlet ci dice (condizione solo sufficiente)
che c’è stabilità se h − mω 2 > 0. E un’applicazione frettolosa del teorema di cui sopra ci
porterebbe a concludere che c’è stabilità se e solo se h − mω 2 > 0. Ma questa conclusione
è troppo pessimistica: l’analisi diretta delle soluzioni (non è difficile determinarle, è un
semplice sistema lineare) mostra che in effetti la stabilità sussiste per ogni valore della
costante elastica h > 0.

3.4 Stabilizzazione Giroscopica


(Un particolare caso lineare della stabilizzazione giroscopica) Una particella di massa m è
vincolata senza attrito su di un piano (O, x, y), solidale ad un sistema inerziale. E’ soggetta
ad una forza conservativa di energia potenziale quadratica

1
U(x, y) = (ax2 + by 2 ).
2
Se almeno uno dei due coefficienti è nullo, è facile vedere che l’origine è instabile (farlo).
Dal precedente teorema l’origine è stabile se e solo se a > 0 e b > 0. Supponiamo dunque
una situazione di instabilità, e per semplicità porremo a = b = −µ < 0. La particella ha
carica elettrica e; ci si chiede se sia possibile introdurre un campo magnetico costante H e
ortogonale al piano (O, x, y) tale da stabilizzare, mediante la conseguente forza di Lorentz,
l’equilibrio (x,y)=(0,0). Le equazioni dinamiche sono
e
mẍ = µx + H ẏ,
c
e
mÿ = µy − H ẋ.
c

L’omeomorfismo R2 ∼ C —si moltiplica la seconda per i = −1 e si somma membro a
membro— ci dà (ζ = x + iy)
eH
mζ̈ = µζ − i ζ̇.
c
Con le soluzioni test della forma ζ(t) = eλt costruiamo l’equazione caratteristica

eH
mλ2 + i λ−µ=0
c

84
le cui radici sono q
−i eH
c ± −( eH 2
c ) + 4mµ
λ1,2 = .
2m
Se il campo magnetico è sufficientemente intenso, cioè se
eH 2
−ω 2 := −( ) + 4mµ < 0,
c
allora l’integrale generale è dato dalle combinazioni complesse
eH iω iω
ζ(t, c1 , c2 ) = c1 eλ1 t + c2 eλ2 t = e−i 2mc t (c1 e 2m t + c2 e− 2m t ).

Esiste una abbastanza ovvia (determinarla) relazione lineare non singolare tra i dati iniziali
(x, y, ẋ, ẏ) ∈ R4 e le coppie (c1 , c2 ) ∈ C2 . Si tratta infine di verificare che per ogni ε > 0
esiste un δ > 0 tale che comunque si scelga

|(c1 , c2 )|C2 < δ

accade che
|(ζ(t, c1 , c2 ), ζ̇(t, c1 , c2 ))|C2 < ε
per ogni t > 0. (E’ un conto facile: le curve t 7→ (ζ(t, c1 , c2 ), ζ̇(t, c1 , c2 )) sono uniformemente
limitate da una costante che va a zero con |(c1 , c2 )|C2 ).
Sfortunatamente tale stabilizzazione è molto fragile. Basta la presenza di una piccola
forza di resistenza di mezza di tipo viscoso come F = −ν(ẋ, ẏ) con un arbitrariamente
piccolo ν > 0 perché la stabilità sia distrutta. Le nuove equazioni dinamiche nel campo
complesso ora diventano
eH
mζ̈ + (ν + i )ζ̇ − µζ = 0.
c
Se ora studiamo le radici dell’equazione caratteristica, notiamo che il loro prodotto è
µ
λ1 λ2 = − ,
m
quindi
µ
Re(λ1 λ2 ) = − , Im(λ1 λ2 ) = 0,
m
da quest’ultima:

Reλ1 Imλ1
=− .
Reλ2 Imλ2
Ma, per piccoli valori ν > 0, mediante argomento di continuità, abbiamo che
Imλ1 Imλ1
sgn = sgn = +1,
Imλ2 ν>0 Imλ2 ν=0

85
cosicché
Reλ1
< 0,
Reλ2
e dunque c’è ora una radice con parte reale positiva: è l’instabilità. Si noti, un meccanismo
questo, in un certo senso contro l’intuizione, qualitativamente opposto a quanto accade
nel caso di sistema dinamico con equilibrio stabile la cui stabilità è deducibile mediante
funzione di Lyapunov di tipo energia totale e al quale aggiungiamo viscosità.

Esiste un modo più semplice e geometrico per rendersi conto della distruzione della
stabilità giroscopica da parte della viscosità. Si consideri in R3 il grafico (concavo) della
funzione energia potenziale. Nonostante la presenza della forza giroscopica, l’integrale di
Jacobi, dato dall’energia cinetica più l’en. potenziale, si conserva. Si fissi, con un piano
ortogonale all’asse z ed intersecante il grafico, il valore dell’integrale di Jacobi. La positività
dell’energia cinetica ci avverte che la regione consentita alla particella, letta su tale piano,
è quella esterna all’intersezione col grafico dell’en. pot. Aggiungiamo ora la viscosità: il
piano scende, verso valori di z via via minori, la regione consentita viene via via spinta
all’infinito: è l’instabilità.

86
3.5 Equazioni Differenziali Lineari (richiamo)
L’equazione differenziale lineare in Rm :

ẋ = Ax, x(0) = x0 ,

si risolve formalmente mediante l’esponenziale di matrice:

x(t, x0 ) = eAt x0 ,

ove
+∞ k
A
X A
e := .
k!
k=0
Indaghiamo sulla struttura più generale di tale risolvente. In questa analisi è cruciale il
seguente
Teorema (Jordan). Per ogni matrice A ∈ L(m, K), ove K = R oppure C, esiste
P ∈ GL(m, C), cioè una matrice a detP 6= 0 ed ad elementi complessi, tale che, mediante
P , A sia simile alla somma di due matrici D, N ∈ L(m, C): P −1 AP = D + N delle quali
si sa che:  
λ1 0
D è diagonale : A = 
 .. ,

.
0 λm
N è ν − nilpotente : N ν+1 = O,
D commuta con N : DN = N D.
Si verifica facilmente che lo spettro di A, Spect(A), è lo spettro di P −1 AP , che è anche lo
spettro di D, cioè gli elementi diagonali di D. Dunque:
−1 AtP
eAt = P eP P −1 = P eDt+N t P −1 = P eDt eN t P −1 =
 
..
. 0 ν
 λ t
X (N t)k −1
=P
 e i  P ,
..
 k!
k=0
0 .
ove si sono utilizzati i risultati contenuti in: De Marco, Analisi Due/Uno, pp.150-153, e si
è tenuto conto che l’esponenziale di una matrice diagonale è diagonale e

{λ1 , . . . , λi , . . . , λm } = Spect(A) ⊂ C

La sup-norma di eAt (la solita, sulla palla dei vettori unitari), per t ≥ 0, si può stimare
facilmente, usando la struttura di algebra di Banach,

keAt k ≤ Cemaxi=1,...,m {<e(λi )}t (1 + tν ).

87
Osservazione. Se <e(SpectA) < 0, è immediato vedere che x = 0 è un equilibrio asinto-
ticamente stabile per ẋ = Ax. Sia infatti α = maxi=1,...,m {<e(λi )} < 0 e sia, per

t ≥ 0, a = Ce−|α|t (1 + t∗ν ) il massimo della funzione C e−|α|t (1 + tν ). Fissato un ε > 0
arbitrariamente, sia δ = ε/a. Per ogni x0 ∈ B(0, δ):

|x(t, x0 )| = |eAt x0 | ≤ keAt k |x0 | ≤

≤ C e−|α|t (1 + tν )|x0 | ≤
≤ a|x0 | < ε;
inoltre: lim x(t, x0 ) = 0.
t→+∞

3.6 Linearizzazione attorno ad Equilibri Stabili


Consideriamo ora il campo vettoriale non lineare X ∈ C 2 (Rm ; Rm ) e l’equazione differen-
ziale associata
ẋ = X(x)
abbia in x = 0 un equilibrio (X(0) = 0) stabile.
Sia X(x) = X 0 (0)x + R(x), ove |R(x)| ≤ k|x|2 , lo sviluppo di Taylor di X, arrestato al
primo ordine.
Fissato arbitrariamente ε > 0, troviamo δ > 0 tale che, ∀x0 ∈ B(0, δ) si abbia: x(t, x0 ) ∈
B(0, ε); inoltre, lungo tali soluzioni, il resto R(x(t, x0 )) ha il seguente comportamento:

|R(x(t, x0 ))| ≤ k |x(t, x0 )|2 < k ε2 ,

cioè le soluzioni ε-dominate nel senso della stabilità rendono il resto del campo vetto-
riale, R(x(t, x0 )), dell’ordine di ε2 . Questo induce a pensare che lo studio del problema
linearizzato
ẏ = X 0 (0)y, y(0) = x0 ,
a parità di dato iniziale, sia una buona approssimazione del problema, non lineare

ẋ = X(x), x(0) = x0 .

Mentre la soluzione del problema linearizzato è


0 (0)t
y(t, x0 ) = eX x0 ,

la soluzione del problema originale non lineare si può implicitamente rappresentare nel
seguente modo: Z t
X 0 (0)t 0
x(t, x0 ) = e x0 + eX (0)(t−s) R(x(s, x0 ))ds.
0

88
Accettiamo, senza dimostrarlo, il seguente teorema (da un punto di vista intuitivo è molto
ragionevole):
“ Se x = 0 è d’equilibrio stabile per ẋ = X(x) allora <e{Spect(X 0 (0))} ≤ 0 ”.
(Più avanti stabiliremo che se <e{Spect(X 0 (0))} < 0 allora x = 0 è asintoticamente stabile.)
In intervalli compatti di tempo [0, T ] stimiamo il divario tra le due soluzioni.
0
supt∈[0,T ] x(t, x0 ) − y(t, x0 ) = supt∈[0,T ] x(t, x0 ) − eX (0)t x0 =

Z t
X 0 (0)(t−s)

= supt∈[0,T ] e
R(x(s, x0 ))ds ≤
0
0
≤ supt∈[0,T ] t sups∈[0,t] eX (0)(t−s) R(x(s, x0 )) ≤

≤ supt∈[0,T ] t sups∈[0,t] C e{maxi <e(λi )}(t−s) 1 + (t − s)ν k ε2 ,




dato che maxi <e(λi ) ≤ 0 , il sups∈[0,t] e{maxi <e(λi )}(t−s) è realizzato per s = t,mentre il
sups∈[0,t] 1 + (t − s)ν k ε2 è realizzato per s = 0.


Infine:
supt∈[0,T ] |x(t, x0 ) − y(t, x0 )| ≤ T C (1 + T ν ) k ε2 .
Nel caso delle Piccole Oscillazioni dei Sistemi Lagrangiani, X 0 (0) è diagonalizzabile, cioè

N = O (quali sono le ragioni per cui ciò accade?), e quindi la stima diventa:

supt∈[0,T ] |x(t, x0 ) − y(t, x0 )| ≤ C k T ε2 .

Come usare questa stima? Dire che in intervalli di tempo dell’ordine di T = 1/ε il divario
è dell’ordine di ε, come si verifica facilmente, è completamente inutile: x = 0 è d’equilibrio
stabile sia per il sistema linearizzato, sia per il sistema non lineare e già sappiamo che,
se prendiamo x0 in una δ-palla opportunamente piccola, sia x(t, x0 ) sia y(t, x0 ) sono ε-
dominate e per sempre (∀t ≥ 0). La stima di cui sopra ci dice invece che, per esempio, per
√ 3
intervalli dell’ordine di T = 1/ ε (< 1/ε), il divario è dell’ordine di ε 2 :
3
supt∈[0,1/√ε] |x(t, x0 ) − y(t, x0 )| ≤ C k ε 2 ,

che (per piccoli ε  1) risulta ben più piccolo di ε.

3.7 Primo Metodo di Lyapunov


A differenza del Secondo, il Primo Metodo di Lyapunov è costruttivo, dà delle informazioni
sulla stabilità di un equilibrio dalla conoscenza della parte lineare del campo vettoriale, più
precisamente, dall’osservazione del suo spettro. Dimostriamo il seguente

89
Teorema. Sia X(0) = 0. Se <e Spect(X 0 (0)) < 0 allora x = 0 è un equilibrio


asintoticamente stabile per ẋ = X(x).


Osservazione 1. Questo teorema non esaurisce il primo metodo, si potrebbe dimostrare che
se qualche autovalore ha parte reale strettamente positiva allora l’equilibrio
 è instabile.
Osservazione 2. Si può dimostrare che dalla condizione <e Spect(X 0 (0)) = 0 non possia-
mo dedurre nulla: i termini non lineari in X determinano l’eventuale stabilità o instabilità
dell’equilibrio. Il caso meccanico puramente posizionale conservativo autonomo, quando
l’energia totale èfunzione di Lyapunov per la stabilità di un equilibrio, comporta sempre
<e Spect(X 0 (0)) = 0 (verificarlo); dunque, in un certo senso, il secondo metodo è più
fine del primo. Il primo metodo non è però sempre inapplicabile nel caso meccanico con-
servativo, è infatti utile nella determinazione dell’instabilità, usando quanto annunciato
nell’osservazione 1; esempio: la posizione ‘superiore’ del pendolo, notoriamente instabile,
è matematicamente rilevabile col primo metodo (fare l’esercizio, notare che il sistema al
primo ordine linearizzato ha un autovalore strettamente positivo).
Prova. Dimostreremo tale asserto utilizzando il Secondo Metodo, quello della funzione di
Lyapunov: ancora una volta (si pensi anche alla dimostrazione di Lagrange-Dirichlet) per
economia di pensiero non rispetteremo la costruzione storica dei concetti in studio.
Definiamo inizialmente la matrice:
Z +∞
0 T 0
B= eX (0) s eX (0)s ds.
0

La condizione sullo spettro rende convergente tale integrale improprio, come si può verifi-
care (esercizio).
Calcoliamo
X 0 (0)T B + BX 0 (0) =
Z +∞  
0 T 0 0 T 0
X 0 (0)T eX (0) s eX (0)s + eX (0) s eX (0)s X 0 (0) ds =
0
+∞
d  X 0 (0)T s X 0 (0)s 
Z
e e ds = −I.
0 ds
Verifichiamo, poi, che V (x) := (x, Bx) è una funzione di Lyapunov, (x, y) := x · y.
i): è definita positiva in x = 0:
V (0) = 0;
R +∞  T X 0 (0)T s X 0 (0)s  R +∞ 0 2
V (x) = 0 x e e x ds = 0 eX (0)s x ds > 0 per x 6= 0, infatti
l’esponenziale è sempre non singolare, det eB = etrB > 0, ∀B ∈ L(m, R).
ii): LX V (x) = (ẋ, Bx) + (x, B ẋ) =
= X 0 (0)x, Bx + x, BX 0 (0) x + O |x|3 =
  

= (x, (X 0 (0)T B + BX 0 (0)) x) + O |x|3 =




90
= x, (−I) x + O |x|3 = −|x|2 + O |x|3 , esiste pertanto un intorno I di x = 0 in cui
  

LX V (x) < 0, ∀x ∈ I \ { 0 }. Ne segue che x = 0 è asintoticamente stabile.

Altre e più approfondite informazioni sul Primo Metodo di Lyapunov si trovano, per
esempio, nell’ultima edizione di Jack Hale: “Ordinary Differential Equations”.

3.8 Stabilità per Sistemi Dinamici infinito-dimensionali


Consideriamo un sistema dinamico infinito-dimensionale. Sia

Q := C ∞ (R; R)

lo spazio degli stati ove evolve il sistema. Il campo vettoriale (da un altro punto di vista, è
un operatore differenziale) sia
X : Q −→ Q
dv
v(·) 7→ X(v(·))(x) := x (x).
dx
Studiare la dinamica associata ad X significa ricercare le curve R 3 t 7→ v(t, ·) ∈ Q tali che

v̇ = X(v)

con generico dato iniziale (problema di Cauchy)

v|t=0 = ϕ ∈ Q.

In dettaglio,
∂ ∂
v(t, x) = x v(t, x), v(0, x) = ϕ(x).
∂t ∂x
Si tratta quindi di studiare un problema di Cauchy per un’equazione alle derivate parziali,
e la semplice struttura scelta ci permette di scriverne esplicitamente la soluzione:

v(t, x) = ϕ(et x).

Si nota subito che la soluzione identicamente nulla v = 0 è un equilibrio per tale sistema
dinamico: X(0) = 0. Per analizzarne l’eventuale Lyapunov stabilità, doteremo dunque di
topologia lo spazio Q := C ∞ (R; R) mediante opportune norme: vedremo che la non equi-
valenza topologica delle norme negli spazi infinito-dimensionali implicherà radicali differen-
ze qualitative intorno alla stabilità. i) Consideriamo ||v||∞ = supx∈R |v(x)|. Ci chiediamo
se per ogni ε > 0 esiste δ > 0 tale che per ogni dato iniziale ||ϕ||∞ < δ la soluzione v(t, ·)
sia tale che ||v(t, ·)||∞ < ε per ogni t ≥ 0; questo è banalmente vero per δ = ε:

||v(t, ·)||∞ = sup |ϕ(et x)| = sup |ϕ(x)| = ||ϕ||∞ ,


x∈R x∈R

91
dunque v = 0 è un equilibrio stabile nella L∞ -topologia. ii) Consideriamo ora le norme Lp :
Z
1/p
||v||Lp = |v(x)|p dx .
x∈R

Consideriamo quindi la stima della soluzione


Z
1/p
||v(t, ·)||Lp = |ϕ(et x)|p dx ,
x∈R

facciamo il cambio di variabile d’integrazione τ (x) = et x, otteniamo


Z
1/p
||v(t, ·)||Lp = |ϕ(τ )|p e−t dτ = e−t/p ||ϕ||Lp .
x∈R

Otteniamo pertanto l’asintotica stabilità nella Lp -topologia. iii) Infine la norma C 1 ,

d
||v||C 1 = sup |v(x)| + sup | v(x)|.
x∈R x∈R dx
Ora accade che
d d
||v(t, ·)||C 1 = sup |ϕ(et x)| + sup | ϕ(et x)| = sup |ϕ(x)| + et sup | ϕ(x)|.
x∈R x∈R dx x∈R x∈R dx

Dunque, comunque scegliamo ϕ, l’andamento esponenziale ci mostra che la soluzione esce, a


qualche istante t, da qualunque palla di raggio ε > 0: v = 0 è instabile nella C 1 -topologia.
In questa linea di pensiero, e per ulteriori sviluppi applicativi, si veda per esempio V.
I. Yudovich “The Linearization Method in Hydrodynamical Stability Theory”, American
Mathematical Society - Translations of Mathemat. Monographs, Vol. 74, 1980.

3.9 La Teoria di Floquet


Consideriamo l’equazione differenziale lineare a coefficienti T -periodici in Rm ,

ẋ = A(t)x, A(t + T ) = A(t).

Sia Φ(t) la matrice risolvente che in t = 0 vale l’identità, Φ(0) = I. Ogni altra risolvente
Ψ(t) è del tipo Ψ(t) = Φ(t)K per arbitrarie matrici non singolari K:

Ψ0 (t) = Φ(t)0 K = A(t)Φ(t)K = A(t)Ψ(t).

Per esempio, si verifica direttamente che la risolvente che al tempo t = t0 vale l’identità
è Φ(t)K con K = Φ(t0 )−1 ; in effetti, tale matrice inversa è definita poiché il teorema di
esistenza e unicità ci avverte che det Φ(t) 6= 0.

92
In particolare, la matrice Φ(T ) è non-singolare. Inoltre la funzione matriciale Φ̄(t) :=
Φ(t + T ) è anch’essa una risolvente (lo si verifica direttamente) e dunque si otterrà da Φ(t)
mediante il prodotto a destra con una opportuna matrice costante K,

Φ(t + T ) = Φ(t)K,

ove ora K è la matrice che, come si nota subito, vale K = Φ(T ). Dunque:

Φ(t + T ) = Φ(t)Φ(T ).

Dal fatto che Φ(T ) è non-singolare segue che esiste qualche sua matrice logaritmo B, tale
cioè che
eB = Φ(T )
(è un teorema standard in teoria delle matrici). Abbiamo ora tutti gli elementi per
enunciare e dimostrare il seguente:
Teorema di Floquet.
B
Φ(t) = P (t)e T t ,
ove P (t) è una funzione matriciale T -periodica.
Prova.
B
P (t) = Φ(t)e− T t .
B B B
P (t + T ) = Φ(t + T )e− T (t+T ) = Φ(t)Φ(T )e−B e− T t = Φ(t)e− T t = P (t).

Applicazione importante. Supponiamo che la curva chiusa [0, T ] 3 t 7→ x(t) sia solu-
zione di un’equazione non lineare ẋ = X(x). Proviamo a studiare i moti vicini al primo
ordine al moto periodico x(t),

d
(x(t) + ∆x(t)) = X(x(t) + ∆x(t)) =
dt
= X(x(t)) + X 0 (x(t))∆x(t) + O(t, |∆x(t)|2 ),
siamo dunque condotti allo studio dell’equazione lineare a coefficienti T -periodici:
d
∆x(t) = X 0 (x(t))∆x(t).
dt
Quindi, posto A(t) := X 0 (x(t)), lo spettro di B ci fornisce una indicazione al primo ordine
sull’andamento qualitativo delle soluzioni vicine al moto periodico x(t); per esempio, se lo
spettro è a parte reale negativa, allora l’orbita periodica x(t) possiede una ovvia proprietà
attrattiva: partendo da ∆x(0) 6= 0 per t → +∞ si tende a zero, cioè all’orbita x(t).

93
94
Capitolo 4

Meccanica di Lagrange

La Meccanica Lagrangiana codifica sistematicamente la separazione della determinazione del moto dalla determi-
nazione delle reazioni vincolari per i sistemi a vincoli lisci. E’ il trionfo delle ‘geometrizzazione’ della meccanica:
determinare moti è, in un certo senso –lo vedremo in dettaglio nel capitolo del Calcolo delle Variazioni–, equivalente
alla soluzione del problema geometrico della ricerca di curve di lunghezza stazionaria (minima). La filosofia della
Relatività Generale di Einstein –la teoria moderna della gravitazione– porta alle estreme conseguenze questo punto
di vista. La citazione in copertina a queste dispense è una frase –riportata dai caratteri originali– della “Mécanique
Analitique” di J.L. Lagrange del 1788, in cui apparvero per la prima volta le equazioni, appunto, di Lagrange.

4.1 Dinamica dei Sistemi Olonomi Lisci: Equazioni di La-


grange
Consideriamo un sistema particellare di n di punti materiali Mi di massa mi > 0, i = 1, ..., n
soggetto alle forze:
Fi = Fi (OP1 , ..., OPn , v1 , ..., vn , t)
Sia U(⊂ RN ) × R 3 (q, t) 7→ OPi = OP ˘ i (q1 , . . . , qN , t), N ≤ 3n, una rappresentazione
locale di una varietà vincolare (vincolo olonomo) St , eventualmente dipendente dal tempo
(vincolo mobile).
Notiamo che se intendiamo rappresentare la velocità dei punti materiali Mi , transitanti
per i punti geometrici OPi , lungo un moto descritto in coordinate Lagrangiane da t 7→
qh (t), h = 1, ..., N , scriveremo

N
d ˘ X ∂
˘ i (q, t)|q=q(t) dqh (t) + ∂ OP
˘ i (q, t)|q=q(t)
vi (t) = OPi (q1 (t), . . . , qN (t), t) = OP
dt ∂qh dt ∂t
h=1

d
Ne deriva in modo naturale la seguente definizione di derivata totale dt dell’immersione
N
vincolare, la quale, ad ogni dato istante t, prende un vettore q̇ ∈ R , che è lo spazio

95
tangente a (ogni) q di U, RN = Tq U, e lo manda, allo stesso istante t, nel vettore v =
d ˘ 3n , più in dettaglio:
dt OP ∈ TŎP (q,t) R

U × RN × R −→ R3n × R3n × R
N
 d ˘  X ∂ ˘ ∂ ˘ 
(q, q̇, t) 7−→ ŎP (q, t), OPi (q, q̇, t) := OPi (q, t)q̇h + OP i (q, t), t
dt ∂qh ∂t
h=1
Una definizione analoga si realizza pure (la useremo) per la derivata totale seconda:

d2 ˘ 
OPi (q, q̇, q̈, t) =
dt2
N N N
X ∂ ˘ X ∂2 ˘ i (q, t)q̇h q̇k + 2
X ∂2 2
˘ i (q, t)q̇h + ∂ OP˘ i (q, t)
OPi (q, t)q̈h + OP OP
∂qh ∂qk ∂qh ∂t∂qh ∂t2
h=1 h,k=1 h

I moti dinamicamente possibili per il nostro sistema [t0 , t1 ] 3 t 7→ OP (t) = ŎP (q(t), t),
sono tutti e soli quelli che soddisfano al principio di D’Alembert:
n
X  d2 d 
mi 2
OPi (t) − Fi (OP (t), OP (t), t) · δPi = 0,
dt dt
i=1

∀t ∈ [t0 , t1 ], ∀(δPi )i=1,...,n ∈ TOP (t) St .


Si tratta ora di dettagliare tale relazione usando la rappresentazione vincolare. Gli sposta-
menti virtuali si rappresentano:
N
X ∂ ˘
δPi = OPi (q(t), t) δqh
∂qh
h=1

per arbitrari (δqh )h=1,...,N ∈ RN . Otteniamo:


N hX
n n
X d2 ∂ ˘ X d ∂ ˘ i
mi 2 OPi (t) · OPi (q, t) − Fi (OP (t), OP (t), t) · OPi (q, t) δqh = 0
dt ∂qh dt ∂qh
h=1 i=1 i=1

Già introdotte, le componenti Lagrangiane della Sollecitazione sono:


n
X d ∂ ˘
Qh (q, q̇, t) := Fi (ŎP (q, t), ŎP (q, q̇, t) · OPi (q, t)
dt ∂qh
i=1

Infine definiamo
n
X d2 ˘ ∂ ˘
τh (q, q̇, q̈, t) := mi 2
OP i (q, q̇, q̈, t) · OPi (q, t)
dt ∂qh
i=1

96
Il pr. di D’Alembert diventa
N
X
(τh (q, q̇, q̈, t) − Qh (q, q̇, t))δqh = 0 ∀ (δqh )h=1,...,N arbitrari in RN ,
h=1

dunque t 7→ q(t) è dinamicamente possibile se e solo se

τh (q, q̇, q̈, t) = Qh (q, q̇, t).

Dobbiamo dettagliare le τh (q, q̇, q̈, t). Questo sarà effettuato usando la funzione Energia
Cinetica nelle variabili Lagrangiane libere T (q, q̇, t):
n 2
1X d
˘

T (q, q̇, t) = mi OP i (q, q̇, t)

2 dt
i=1

(Un po’ di dettagli di facile algebra mostrano che T è un polinomio quadratico nelle q̇ e a
coeff. dipendenti da q e t. Si ritornerà su ciò). Calcoliamo
n
∂ X d ˘ ∂ d ˘
(i) T (q, q̇, t) = mi OP i (q, q̇, t) · OP i (q, q̇, t) =
∂ q̇h dt ∂ q̇h dt
i=1

n
X ∂ ˘
(si veda def. sopra di derivata totale) = mi vi · OP i
∂qh
i=1

n n
d ∂ X ∂ ˘ X d ∂ ˘
(ii) T (q, q̇, t) = mi ai · OP i + m i vi · OP i =
dt ∂ q̇h ∂qh dt ∂qh
i=1 i=1

n
X d ∂ ˘
= τh + mi vi · OP i
dt ∂qh
i=1

Inoltre vale la commutazione (nel caso C 2 ):


N
X ∂2 2 X ∂2 N 2
d ∂ ˘ ˘ i q̇k + ∂ OP ˘ i= ˘ i q̇k + ∂ OP ˘ i=
OP i = OP OP
dt ∂qh ∂qk ∂qh ∂t∂qh ∂qh ∂qk ∂qh ∂t
k=1 k=1

∂ d ˘ ∂
= OP i = vi ,
∂qh dt ∂qh
cosicché
n n
X d ∂ ˘ X ∂ ∂T
mi vi · OP i = m i vi · vi =
dt ∂qh ∂qh ∂qh
i=1 i=1

97
Giungiamo alla conclusione che la conoscenza della funzione Energia Cinetica T (q, q̇, t) e
delle Comp. Lagr. della Sollecitazione Qh (q, q̇, t) sono sufficienti per costruire le equazioni
differenziali determinanti i moti del sistema, le equazioni di Lagrange:

d ∂T ∂T
− = Qh h = 1, ..., N
dt ∂ q̇h ∂qh

Queste rappresentano un sistema di equazioni differenziali del 20 ordine in RN nelle inco-


gnite t 7→ q(t) ∈ RN . Condizione necessaria per l’applicabilità del teorema di esistenza
e unicità di Cauchy è che che tale sistema si possa porre in forma normale cioè nella
forma q̈ = A(q, q̇, t). A tal scopo, dettagliamo la struttura della funzione Energia Cinetica
T (q, q̇, t):
n 2
1X d
T (q, q̇, t) = mi ŎPi (q, q̇, t) =

2 dt
i=1
n N N
1X X ∂ ˘ ∂ ˘ X ∂ ˘ ∂ ˘
= mi ( OPi (q, t)q̇h + OPi (q, t)) · ( OPi (q, t)q̇k + OP i (q, t)),
2 ∂qh ∂t ∂qk ∂t
i=1 h=1 k=1
N N
1 X X
T (q, q̇, t) = ahk (q, t)q̇h q̇k + bh (q, t)q̇h + d(q, t),
2
h,k=1 h

dove
n
X ∂ ˘ ∂ ˘
ahk (q, t) := mi OPi (q, t) · OPi (q, t),
∂qh ∂qk
i=1
n n
X ∂ ˘ ∂ ˘ 1X ∂ ˘ ∂ ˘
bh (q, t) := mi OPi (q, t) · OP i (q, t), d(q, t) := mi OP i (q, t) · OPi (q, t).
∂qh ∂t 2 ∂t ∂t
i=1 i=1

Nel caso di vincoli fissi:


N
1 X
T (q, q̇) = ahk (q)q̇h q̇k
2
h,k=1

In entrambi i casi (v. fissi o mobili), la funzione ahk (q, t) è a valori nelle matrici simmetriche
definite positive. Infatti, per ogni q e t fissato, la mappa lineare
N ˘ 1 N ˘ n
N
X ∂ OP X ∂ OP 
R 3 λ = (λ1 , ..., λN ) 7→ V(λ) = λh , ..., λh ∈ R3n
∂qh ∂qh
h=1 h=1

è a rango massimo, ha dunque nucleo banale, vale zero solo per λ = (λ1 , ..., λN ) = 0.
Indichiamo con • il seguente prodotto scalare non degenere in R3n :

V = (V 1 , ..., V i , ..., V n ) ∈ R3n

98
n
X
V • W := mi V i · W i
i=1

Pertanto, la seguente quantità, che è la norma in RN definita come immagine inversa (o


restrizione, pull-back) della norma associata al prodotto scalare non degenere • in R3n ,
risulta in effetti definita positiva:
N
X
|V(λ)|2• := V(λ) • V(λ) = ahk (q)λh λk ≥ 0, e vale 0 sse λ = (λ1 , ..., λN ) = 0.
h,k=1

Infatti, ovviamente |V(λ)|2• ≥ 0, e dato che • è non degenere, |V(λ)|2• = 0 se e solo se


V(λ) = 0, se e solo se (V ha nucleo banale) λ = 0. Scriviamo ora in dettaglio le equazioni

di Lagrange, si tratta di indagare inizialmente sul termine cinematico τh (q, q̇, q̈, t).:
N N
d ∂T ∂T d X  ∂T X
− = ahk (q, t)q̇k + bh (q, t) − = ahk (q, t)q̈k + (termini in q, q̇, t)
dt ∂ q̇h ∂qh dt ∂qh
k=1 k=1

Dunque le equazioni sono della forma


N
X
ahk (q, t)q̈k + (termini in q, q̇, t) = Qh (q, q̇, t),
k=1

la matrice ahk (q, t) è invertibile e quindi otteniamo infine la struttura q̈k = Ak (q, q̇, t), k =
1, ..., N . Si ottiene cosı́ la forma normale delle equazioni di Lagrange:
      
q 2N 2N q v
x := , ẋ = X(x, t), X : R × R → R , X : , t 7→
v v A(q, v, t)

Si può dunque applicare il teorema di esistenza e unicità di Cauchy per i problemi di


Cauchy: al tempo t = t0 si cerca la soluzione per cui q(t0 ) = q0 , q̇(t0 ) = q̇0 , e vale quindi
il cosiddetto determinismo classico.
Si noti che la funzione A(q, q̇, t) è di classe C 1 se l’immersione vincolare è di classe C 3 .
Esercizio (importante): Si verifichi che nel caso OP ˘ (q ∗ , t) ≡ OP ∗ e Qh (q ∗ , 0, t) ≡ 0 per
ogni t, allora q(t) ≡ q ∗ è soluzione delle equazioni di Lagrange.

CASO CONSERVATIVO. In tal caso


∂U
Qh (q) = − (q),
∂qh
si definisce la funzione Lagrangiana

L(q, q̇, t) := T (q, q̇, t) − U(q)

99
e si verifica facilmente che le equazioni di Lagrange si scrivono unicamente usando tale
funzione Lagrangiana L : RN × RN × R → R:
d ∂L ∂L
− =0 h = 1, . . . N.
dt ∂ q̇h ∂qh

INVARIANZA GEOMETRICA DELLE EQUAZIONI DI LAGRANGE. Sia L(q, q̇, t)


la funzione Lagrangiana di un sistema meccanico a vincoli lisci, olonomi, bilaterali, per
esempio un sistema particellare di n punti materiali.
Sia OPi = OP˘ i (q1 , . . . , qN , t), N ≤ 3n, una rappresentazione locale della varietà vin-
colare. I moti dinamicamente possibili qh (t), h = 1, . . . , N , sono tutti e soli quelli che
risolvono:
d ∂L ∂L
(1) − = 0, h = 1, . . . , N
dt ∂ q̇h ∂qh
Mostriamo che le equazioni di Lagrange (1) sono invarianti (in forma) rispetto al cambio
dei parametri lagrangiani q1 , . . . , qN , cioè hanno una struttura geometricamente invariante
rispetto al gruppo dei diffeomorfismi locali Qh = Qh (q1 , . . . , qN )
 
∂Qh
(2) det (q) 6= 0;
∂qk

naturalmente OP i (Q1 , . . . , QN , t) := OP ˘ i (q(Q), t), ove q(Q) è l’inversa di Q(q), sarà


una nuova rappresentazione locale della varietà vincolare. Più precisamente sia Qh =
Qh (q1 , . . . , qN ) un diffeomorfismo locale da un aperto di RN nella sua immagine di RN e
sia
 
∂qk
(3) L(Q, Q̇, t) := L q(Q), (Q)Q̇h , t ,
∂Qh
La sopraccennata invarianza si traduce nella seguente affermazione:
Il moto, la curva individuata dall’N -upla t 7→ qh (t), risolve (1) se e solo se, per ogni
diffeomorfismo locale Q = Q(q), l’N -upla

(4) t 7→ Qh (t) := Qh (q(t))

risolve
d ∂L ∂L
(5) − = 0, h = 1, . . . , N,
dt ∂ Q̇h ∂Qh

ove L è definita in (3).

100
∂qk
Prova. Preliminarmente osserviamo che q̇k = ∂Q h
(Q)Q̇h , cosicché ∂∂Q̇q̇k = ∂qk
∂Qh . Detta-
h
gliamo il primo membro di (5):
 
d ∂L ∂qk ∂L ∂qk ∂L ∂ 2 qk
dt ∂ q̇k ∂Qh − ∂qk ∂Qh − ∂ q̇k ∂Qh ∂Qj Q̇j =
d ∂L ∂qk ∂L ∂ 2 qk ∂L ∂qk ∂L ∂ 2 qk
dt ∂ q̇k ∂Qh + ∂ q̇k ∂Qj ∂Qh Q̇j − ∂qk ∂Qh − ∂ q̇k ∂Qh ∂Qj Q̇j =
∂ 2 qk ∂ 2 qk
(restringendosi a diffeomorfismi di classe C ρ con ρ ≥ 2 , onde: ∂Qj ∂Qh = ∂Qh ∂Qj )
 
d ∂L ∂L ∂qk
= − , cioè
dt ∂ q̇k ∂qk ∂Qh

 
d ∂L ∂L d ∂L ∂L ∂qk
(6) − = −
dt ∂ Q̇h ∂Qh dt ∂ q̇k ∂qk ∂Qh

e l’affermazione di cui sopra è vera per (2).

4.2 Sugli Integrali Primi delle Equazioni di Lagrange


1) Sia data L : RN × RN × R → R tale che

∂L
= 0, cioè L = L(q1 , . . . , qh0 −1 , qh0 +1 , . . . , q̇1 , . . . , q̇N , t)
∂qh0
0
In tal caso, scrivendo semplicemente l’equazione di Lagrange relativa all’indice h , ottenia-
mo
d ∂L
=0
dt ∂ q̇h0
cioè la funzione scalare
∂L
(q1 , . . . , qh0 −1 , qh0 +1 , . . . , q̇1 , . . . , q̇N , t)
∂ q̇h0

è un integrale primo, detto integrale di ciclicità. 2) Sia data L : RN × RN × R → R tale


che
∂L
= 0, cioè L = L(q, q̇)
∂t
In tal caso, la seguente funzione E(q, q̇) è un integrale primo, detto integrale primo di
Jacobi,
N
X ∂L
E(q, q̇) := q̇h − L.
∂ q̇h
h=1

101
Infatti, la derivata di Lie di E rispetto al campo vettoriale Lagrangiano vale:
N N N N
d X d ∂L X ∂L X ∂L X ∂L
E(q, q̇) = q̇h + q̈h − q̇h − q̈h =
dt dt ∂ q̇h ∂ q̇h ∂qh ∂ q̇h
h=1 h=1 h=1 h=1

N 
X d ∂L ∂L 
= − q̇h = 0.
dt ∂ q̇h ∂qh
h=1
Osservazione Questi due semplici esempi di integrali primi mostrano un aspetto algebrico-
geometrico in un certo senso inatteso: in entrambi i casi notiamo che la Lagrangiana in
studio è invariante rispetto ad un gruppo di trasformazioni; nel primo caso, c’è un gruppo
(λ-parametrico) di trasformazioni delle coordinate
R × RN 3 (λ, q) 7→ q̄ = q̄(λ, q) := (q1 , . . . , qh0 −1 , qh0 + λ, qh0 +1 , . . . , qN ) ∈ RN ,
nel secondo caso, la Lagrangiana in studio è invariante rispetto al seguente gruppo (λ-
parametrico) di trasformazioni del tempo:
R × R 3 (λ, t) 7→ t̄ = t̄(λ, t) := t + λ ∈ R.
Esiste una teoria generale (si veda più avanti), elaborata nel 1918 da Emmy Nöther, che
cataloga gli integrali primi (gli invarianti dinamici) generati da più generali gruppi di tra-
sformazioni che lasciano invariata la funzione di Lagrange; tali gruppi si dicono simmetrie
per la funzione di Lagrange in studio.

4.3 Teoria di Routh


E’ noto che per un generico sistema dinamico ẋ = X(x), X : Rm → Rm , la conoscenza di
un integrale primo ϕ : Rm → R abbassa la ‘dimensionalità’ del nostro problema dinami-
co di un’unità, da Rm a S m−1 = ϕ−1 (ϕ(x0 )). Mostreremo che nel caso Lagrangiano la
conoscenza di un integrale primo di ciclicità comporta invece una riduzione di due unità:
da 2N a 2N −2. Inoltre, si riesce a operare una riduzione del sistema dinamico Lagrangiano
iniziale L : R2N → R ad un nuovo sistema Lagrangiano ridotto (di Routh) L : R2N −2 → R.
Supponiamo che le prime k coordinate non siano presenti in L,
∂L
= 0,
∂qM
cioè L = L(qk+1 , . . . , qα , . . . , qN , q̇1 , . . . , q̇N , t), M = 1, . . . , k α = k + 1, . . . , N.
L’unica ipotesi tecnica su L è la seguente, banalmente soddisfatta nel caso Lagrangiano
meccanico (L = T − U):
∂2
L(q, q̇, t) sia definita positiva.
∂ q̇k ∂ q̇h

102
∂L
Consideriamo i k integrali primi generati da ∂qM = 0:

∂L
(∗) fM = (qk+1 , . . . , qα , . . . , qN , q̇1 , . . . , q̇N , t), M = 1, . . . , k.
∂ q̇M

Supponiamo di essere interessati a dei (o ad un) problemi(a) di Cauchy q0 , q̇0 tali(e) che gli
integrali primi fM valgano cM = fM (q0 , q̇0 , t0 ). L’ipotesi tecnica sopra fatta ci garantisce
che pure la funzione matriciale

∂2
(∗∗) L(q, q̇, t) è definita positiva.

∂ q̇M ∂ q̇P M,P =1,...,k

Questo ci permette di applicare il teorema della funzione inversa in (∗) ed esprimere le q̇M
in funzione delle fM parametricamente per ogni qα , q̇β , α, β = k + 1, . . . , N :

q̇M = SM (. . . , cP , . . . ; . . . , qα , . . . , q̇β , . . . , t)
 2

In effetti, basterebbe che det ∂ q̇M∂ ∂ q̇P L(q, q̇, t) 6= 0, il fatto che invece valga (molto di
più) (∗∗) ci dice che tale inversione è globale, e questo in virtù di un generale teorema
di inversione globale, riportato (e dimostrato) per esempio nel capitolo della meccanica
Hamiltoniana e trasf. canoniche. Definiamo la Lagrangiana Ridotta:

L : RN −k × RN −k × R → R,

k
X
(qα , q̇β , t) 7→ L := L(qα , SM (cP ; qα , q̇β , t), q̇β , t) − cM SM (cP ; qα , q̇β , t)
M =1

Enunciamo infine il
Teorema di Routh La soluzione dei pr. di Cauchy che rendono fM = cM si ottengono
risolvendo le equazioni di Lagrange ridotte per L, ottenendo cosı́ t 7→ qα (t), ed effettuando
le seguenti integrazioni dirette per ottenere le rimanenti t 7→ qM (t):
Z t
(?) qM (t) = qM (t0 ) + SM (cP ; qα (t0 ), q̇β (t0 ), t0 )dt0 .
t0

Prova. Scriviamo la generica γ-esima equazione di Lagrange per L, per γ = k + 1, . . . , N ,

d ∂L ∂L
0= − =
dt ∂ q̇γ ∂qγ

k k
d  ∂L X ∂L ∂SM X ∂ 
= + − cM SM (cP ; qα , q̇β , t) −
dt ∂ q̇γ ∂ q̇M ∂ q̇γ ∂ q̇γ
M =1 M =1

103
k k
∂L X ∂L ∂SM X ∂
− − + cM SM (cP ; qα , q̇β , t) =
∂qγ ∂ q̇M ∂qγ ∂qγ
M =1 M =1

d ∂L ∂L ∂L
= − (si è utilizzato il fatto che = cM )
dt ∂ q̇γ ∂qγ ∂ q̇M
In altre parole, se in RN −k la curva t 7→ qα (t) risolve le equ. di Lagrange per L, allora la
curva t 7→ (qM (t), qα (t)), dove le qM (t) sono ottenute mediante l’integrazione diretta (?),
risolve pure le originali equ. di Lagrange per L in RN .

Esercizio: Si consideri la Lagrangiana del problema di Kepler piano: L(r, θ, ṙ, θ̇). Si
osservi che esiste un integrale di ciclicità e che corrisponde alla conservazione della vel.
areolare. Si costruisca, per ogni fissati valore c di tale integrale primo, il Lagrangiano
ridotto L(r, ṙ) e se ne discutano le soluzioni qualitativamente, osservando che è del tipo
L = 12 µ − Ucef f (r) (ellissi, parabola, iperboli.)

4.4 Teoria di Noether


Mettiamo in evidenza come simmetrie della funzione Lagrangiana inducano integrali primi.

Teorema di Emmy Noether 1 Sia Qh = Qh (λ, q), λ ∈ I = I ◦ (intervallo aperto reale),


0 ∈ I, una famiglia mono–parametrica di diffeomorfismi locali (cioè, cambi di coordinate
locali nella varietà vincolare) tale che:

(i) Qh (0, q) = qh ,
 
L Qh (λ, q), N ∂Qh
P
(ii) k=1 ∂qk (λ, q)q̇k , t = L(q, q̇, t) ∀λ ∈ I ,

allora la funzione:
N
X ∂L ∂Qh
(6) f (q, q̇, t) := (q, q̇, t) (0, q)
∂ q̇h ∂λ
h=1

è un integrale primo di (1).


Osservazione. In realtà, la corretta completa ipotesi è che Q(λ, q) sia un’azione del gruppo
additivo dei reali sulla varietà vincolare; detto in altre parole, Q(λ, q) sia un flusso, in
1
E. Noether, Invariant variation problems. Translated from the German (Invariante Variationsprobleme,
Nachr. Akad. Wiss. Göttingen Math.-Phys. Kl. II 1918, 235-257). Transport Theory Statist. Phys. 1
(1971), no. 3, 186-207.

104
tal caso il campo vettoriale che lo genera è X(q) = ∂Q

∂λ (λ, q) λ=0 e l’espressione (6) è uno

scalare invariante, in quanto valutazione di una forma su un vettore.
Prova. Supposta la condizione (i), la (ii) vale per ogni sistema Lagrangiano solo per
λ = 0 , la validità della (ii) per la nostra particolare funzione Lagrangiana L dice in
sostanza che il primo membro di quell’uguaglianza è indipendente da λ in I.
Sia qh (t) un moto risolvente (1), allora, dalle (ii):
N
" #
∂ X ∂Qh
L(Q(λ, q(t)), (λ, q(t))q̇k (t), t) =0
∂λ ∂qk λ=0
k=1

(nelle formule che seguono omettiamo il simbolo della sommatoria sugli indici doppi)
∂L ∂Qh ∂L ∂ 2 Qh
0 = ∂qh (q(t), q̇(t), t) ∂λ (0, q(t)) + ∂ q̇h (q(t), q̇(t), t) ∂λ∂qk (0, q(t))q̇k (t) =

∂L ∂Qh ∂L d ∂Qh
= ∂qh (q(t), q̇(t), t) ∂λ (0, q(t)) + ∂ q̇h (q(t), q̇(t), t) dt ∂λ (0, q(t)) =
 
∂L ∂Qh d ∂L ∂Qh
= ∂qh (q(t), q̇(t), t) ∂λ (0, q(t)) + dt ∂ q̇h (q(t), q̇(t), t) ∂λ (0, q(t)) +
 
d ∂L ∂Qh
− dt ∂ q̇h (q(t), q̇(t), t) ∂λ (0, q(t)) =
   
d ∂L ∂L ∂Qh d ∂L ∂Qh
=− dt ∂ q̇h − ∂qh ∂λ + dt ∂ q̇h ∂λ ,

q(t) risolve (1) , onde:


"N #
d X ∂L ∂Qh
(7) (q(t), q̇(t), t) (0, q(t)) = 0
dt ∂ q̇h ∂λ
h=1

Esempio: sistema di n particelle materiali di massa m1 , . . . , mn , non vincolate, inte-


ragenti con forze interne generate da energia potenziale dipendente dai mutui vettori
(1) (n)
differenza, N = 3n−gradi di libertà : q1 = x1 , . . . , qN = x3 ,
n 3
1X X
L=T −U = mi (ẋ(i) 2
α ) − U (. . . , x
(i)
− x(j) , . . . i < j)
2
i=1 α=1

Sia a un arbitrario vettore di R3 , allora una famiglia mono-parametrica di trasforma-


zioni che lasciano L inalterata è la seguente famiglia di traslazioni indotte da a :

(8) Xα(i) (λ, x, . . . ) = x(i)


α + λaα ,

105
infatti:
Ẋα(i) = ẋ(i)
α e X (i) − X (j) = x(i) − x(j) .
Otteniamo dalla (6) il seguente integrale primo:
n X
3 n
!
X X
I= mi ẋ(i)
α aα = mi v (i)
·a ,
i=1 α=1 i=1

data l’arbitrarietà di a , concludiamo con il risultato (ben noto): il vettore quantità di moto
n
X
(9) P = mi v (i)
i=1

si conserva lungo i moti dinamicamente possibili.

Rafforziamo le ipotesi: ora le forze interne siano generate da un’energia potenziale


(1) (n)
dipendente dalle mutue distanze, N = 3n−gradi di libertà : q1 = x1 , . . . , qN = x3 .
n 3
1X X
L=T −U = mi (ẋ(i) 2
α ) − U (. . . , | x
(i)
− x(j) |R3 , . . . i < j)
2
i=1 α=1

b2 , b3 ) un arbitrariovettore di R3 . Possiamo definire una matrice


Sia ora b = (b1 , 
0 w12 w13
emisimmetrica W = −w12 0 w23  tale che ∀x ∈ R3 :
−w13 −w23 0

(10) Wx = b ∧ x ; ∧ : pr. vettoriale di R3


 
b2 x3 − b3 x2
b ∧ x = b3 x1 − b1 x3  ,
b1 x2 − b2 x1
    
0 w12 w13 x1 w12 x2 + w13 x3
W x = −w12 0 w23  x2  = −w12 x1 + w23 x3  ,
−w13 −w23 0 x3 −w13 x1 − w23 x2
onde: w12 = −b3 , w13 = b2 , w23 = −b1 .
Consideriamo ora la matrice esponenziale:

(11) R = eλW (λ ∈ R) .

Si verifica facilmente che R(λ) è una rotazione:


T  2 3

2W 3W

eλW
= I − λW + λ −λ + . . . = e−λW ,
2! 3!

106
e dunque RT R = e−λW +λW = I ; inoltre : det R = det eλW = etr(λW ) = e0 = 1 .


Ritorniamo al nostro sistema particellare. Consideriamo la seguente famiglia mono–


parametrica, di trasformazioni che lasciano inalterata L , cioè le rotazioni:

(12) X (i) (λ, x) = R(λ)x(i) .

Vale: (i) 2
Ẋ =| ẋ(i) |2 e X (i) − X (j) =| x(i) − x(i) | .

Dalla (6) otteniamo il seguente integrale primo:


PN
I = ∂L
h=1 ∂ q̇ (q, q̇, t) ∂Q
∂λ (0, q)
h

Pn P3h (i) ∂ 
(i)
= i=1 m ẋ
α=1 i α ∂λ R(λ)x α λ=0
Pn P3 (i) ∂ λW x(i)

= i=1 α=1 mi ẋα ∂λ e α λ=0
Pn P3 (i) λW x(i)

= i=1 α=1 mi ẋα W e α λ=0
Pn P3 (i)
mi ẋα W x(i) α

=
Pni=1 P3α=1 (i) (i)
= α=1 mi ẋα (b ∧ x )α
Pi=1
n
= mi ẋ(i) · (b ∧ x(i) )
Pi=1
n
= i=1 b · x(i) ∧ mi ẋ(i)
Pn
= b · i=1 x(i) ∧ mi ẋ(i)

cioè I = b · M 0 , ove M 0 è il momento della quantità di moto (rispetto all’origine del


sistema cartesiano). Data l’arbitrarietà del vettore b otteniamo il risultato (ben noto): per
tali sistemi meccanici il vettore momento della quantità di moto
n
X
(13) M0 = x(i) ∧ mi ẋ(i)
i=1

si conserva lungo i moti dinamicamente possibili.

Riassumendo: omogeneità (invarianza per traslazioni) e isotropia (invarianza per rota-


zioni) della funzione Lagrangiana implicano rispettivamente conservazione della quantità
di moto e del momento della quantità di moto.

107
108
Capitolo 5

Piccole Oscillazioni nei Sistemi


Lagrangiani

Supponiamo che x∗ = (q ∗ , 0) = (0, 0) = 0 ∈ R2N sia d’equilibrio stabile per un sistema


Lagrangiano a vincoli fissi e forze puramente conservative. Supponiamo inoltre che tale
stabilità sia riconoscibile dallo studio delle derivate seconde dell’energia potenziale U in
2U
q ∗ = 0, cioè ∂q
∂U
h
(0) = 0 e ∂q∂h ∂qk
(0)λh λk > 0 ∀λ 6= 0. Studiamo la linearizzazione delle
equazioni di Lagrange nell’intorno di x∗ = 0. Mediante le funzioni energia cinetica e
potenziale
1
T (q, q̇) = ahk (q)q̇h q̇k , U = U (q),
2
le equazioni di Lagrange sono:

d ∂T ∂T ∂U
(1) − =− (h = 1, . . . , N )
dt ∂ q̇h ∂qh ∂qh

∂ahk
più in dettaglio (ove con la virgola si intende la derivata parziale ahk,l := ∂ql ):

d 1
[ahk (q)q̇k ] − alm,h (q)q̇l q̇m = −U,h (q),
dt 2

1
ahk,m q̇m q̇k + ahk q̈k − alm,h q̇l q̇m = −U,h ,
2
moltiplico per a−1
jh (è noto che det(a) > 0):

 
1
(2) q̈j = a−1
jh akm,h − ahk,m q̇m q̇k − a−1
jh U,h .
2

109
Le equazioni di Lagrange (2) in RN si scrivono come un sistema del primo ordine in R2N ,
q

x= ζ ,
(
q̇i = ζi ,
(3) −1 1
 −1 .
ζ̇j = [ajh 2 akm,h − ahk,m ]ζ m ζk − a jh U,h

Il sistema (3) è del tipo: ẋ(t) = X(x(t)). Scriviamo il sistema linearizzato: ẋ(t) =
X 0 (0)x(t), con polo in x = (q, ζ) = (0, 0).
Si ottiene:
(
q̇i = ζi
(4) .
ζ̇j = −a−1
jh (0)U,hk (0)qk

Ritorniamo al secondo ordine e otteniamo cosı̀ le equazioni di Lagrange linearizzate:


(5) aij (0)q̈j = −U,ij (0)qj .
Verificare (importante!) che tali equazioni (5) si ottengono, tra l’altro, scrivendo le equa-
zioni di Lagrange relative ad “un” sistema con
energia cinetica : T (0) = 21 aij (0)q̇i q̇j
ed energia potenziale : U (0) = 21 U,ij (0)qi qj ,
cioè utilizzando lo(sviluppo di Taylor di T e U arrestato al secondo ordine in x = (q, q̇).
aij (0) è (simmetrica) definita positiva,
Notiamo che :
U,ij (0) è (simmetrica) definita positiva.
Operiamo un cambio delle coordinate lagrangiane in modo da semplificare la rappre-
sentazione delle soluzioni di (5).
Facciamo un PRIMO cambio q 7→ q 0 che diagonalizza aij (0) (è simmetrica, onde esiste
una opportuna rotazione q 0 = Rq) e lascia invariati T (0) e U (0) :

N N
 1 X 1X
T (0)
= a (0) q̇ q̇ = ai (q̇i0 )2 (ai > 0), i = 1, . . . , N,


 ij i j

 2 2
i,j=1 i=1
N N

(0) 1 X 1 X 0 0 0
U = U (0)q q = Uij qi qj ,


 ,ij i j

 2 2
i,j=1 i,j=1

ove Uij0 è ancora simmetrica.



Operiamo un SECONDO cambio: qi00 := ai qi0 , ora T (0) e U (0) sono:
N

 (0) 1 X 00 2
T = (q̇i )


2

i=1
N
1 X Uij0
(0)
q 00 q 00 .

U = √


2 ai aj i j


i,j=1

110
U0
Con un TERZO cambio diagonalizziamo Uij00 = √aiji aj ; come nel primo cambio, tale tra-
sformazione è una rotazione; otteniamo, in queste ultime coordinate (dette coordinate
normali):
N

 (0) 1X 2
T = q̇i


2

(6) i=1
N

(0) 1X 2 2
U = ωi qi .



 2
i=1

d ∂T (0) ∂T (0) ∂U (0)


Infine le equazioni − =− risultano:
dt ∂ q̇i ∂qi ∂qi

(7) q̈i = −ωi2 qi (i = 1, . . . , N ).

Le N equazioni (7) sono risolvibili elementarmente, si tratta di N oscillatori armonici


ciascuno con periodo Ti = 2πωi ; diremo le ωi frequenze caratteristiche. Si osservi che abbia-
mo usato le proprietà di invarianza delle equazioni di Lagrange per cambio di coordinate
Lagrangiane.

Supponiamo ora che il nostro problema sia quello di determinare le frequenze caratteri-
stiche ωi (e non già la trasformazione S, q = Sq, che muta le originali coordinate q nelle
coordinate normali q). Vettorialmente le (5) si scrivono:

(8) a(0)q̈ + ∇2 U (0)q = 0,

ove a(0) = (ahk (0))h,k=1,...,N , ∇2 U (0) = (U,hk (0))h,k=1,...,N . Denotiamo, come anticipato,
con S la composizione delle tre trasformazioni

(9) q = Sq (det S 6= 0).

Sostituendo in (8) otteniamo:

(10) a(0)S −1 q̈ + ∇2 U (0)S −1 q = 0.

D’altra parte affermare che S diagonalizza la matrice cinetica a(0) nella matrice identica I
significa

2T (0) = ahk (0)q̇h q̇k = (a(0)q̇, q̇) = (a(0)S −1 q̇, S −1 q̇) = (S −T a(0)S −1 q̇, q̇) = (q̇, q̇),

cioè

(11) S −T a(0)S −1 = I.

111
Analogamente

(12) S −T ∇2 U (0)S −1 = Ω2 , ove

 2 
ω1 0 ... 0
 0 ω2 0 . . . 0 
2
(13) Ω2 :=  . .. ..  .
 
 .. ..
. . . 
0 . . . . . . 0 ωN2

Moltiplicando a sinistra la (10) per S −T otteniamo la (7), cioè:

(14) q̈ + Ω2 q = 0.

E’ banale osservare che ω è una frequenza caratteristica se e solo se ω 2 è un autovalore di


Ω2 , cioè se e solo se:

0 = det Ω2 − ω 2 I ,


0 = det S −T ∇2 U (0)S −1 − ω 2 S −T a(0)S −1 ,




0 = det S −T det ∇2 U (0) − ω 2 a(0) det S −1 ,




onde ω è frequenza caratteristica se e solo se:

det ∇2 U (0) − ω 2 a(0) = 0.



(15)

112
Capitolo 6

Il Pendolo di Foucault: Appunti


per lo studio del problema
linearizzato

Indichiamo con R ≈ 6 · 106 metri il raggio della Terra, e con G il suo centro. In un punto
O sulla superficie terrestre, ad una latitudine α (questo è l’angolo del vettore GO col piano
equatoriale, vedi la figura qui sotto) consideriamo una superficie sferica, di raggio l e di
centro Q, tangente alla sfera terrestre.

Una particella P di massa m è vincolata senza attrito su questa sfera ed è soggetta alla
forza di gravità Newtoniana. Dato che l << R (per esempio, l ≈ 15 metri, e R ≈ 6 · 106
metri), considereremo l’usuale approssimazione di forza-peso.
NOTA STORICA (da: Alessandro Bettini, “Meccanica e Termodinamica” Decibel-Zanichelli,
1995) L’esperimento fu fatto per la prima volta da un allievo di Galileo, Vincenzio Viviani
nel 1661 a Firenze, fu successivamente ripetuto da diversi cultori della Meccanica, fino a J.

113
B. L. Foucault, di cui il pendolo ha preso il nome, che sperimentò prima in una cantina con
un pendolo lungo due metri e poi nel Panthéon di Parigi nel 1851 con un pendolo lungo 67
m e 28 Kg di massa.

Vedremo come la velocità angolare di precessione dei punti apsidali dell’orbita ellittica
(sul locale piano tangente in O) delle piccole oscillazioni di tale pendolo sferico di raggio l
dipenda solo dalla latitudine a cui è posto il sistema e non dalle condizioni iniziali.
Consideriamo le usuali ipotesi semplificatrici per tale problema.
(i) Il baricentro della terra G evolve secondo un moto rettilineo uniforme.
Questo è estremamente ragionevole, se ci limiteremo allo studio dinamico per poche ore, o
giorni. Inoltre, il sistema di riferimento di origine O, e di asse (di versore) x̂ tangente al
meridiano locale, di asse ŷ tangente al locale parallelo, e di asse ẑ orientato come la locale
verticale, ẑ = vers(GO), è non-inerziale a causa della rotazione uniforme, rispetto agli spazi
inerziali, della terra con velocità angolare costante Ω, |Ω| ≈ 24·3600 2π
≈ 7, 26 · 10−5 sec−1 .
Dovremo pertanto considerare le forze apparenti, la forza centrifuga e quella di Coriolis.
(ii) La forza centrifuga è trascurabile.
In effetti, quest’ultima, per unità di massa, è dell’ordine |RΩ2 | ≈ 6 · 106 · (7, 26 · 10−5 )2 ≈
316, 24 · 10−4 m sec−1 . L’accelerazione centrifuga (all’equatore) è quindi più piccola di un
fattore 3, 2 · 10−3 dell’accelerazione di gravità e si può dunque trascurare.
Perciò, oltre alla gravità e alla reazione vincolare (quest’ultima non comparirà nell’
impostazione Lagrangiana della dinamica) dovremo solo considerare la forza di Coriolis.
Sia vP la velocità della particella P nel sistema (O, x̂, ŷ, ẑ), allora dalle ipotesi fatte F C =
−2mΩ ∧ vP è l’unica forza apparente di cui dovremo tener conto.
Per il sistema meccanico 2-dimensionale che stiamo delineando la configurazione data
dal punto geometrico di tangenza O è di equilibrio stabile (secondo Lyapunov). In tal caso
la teoria di linearizzazione delle equazioni dinamiche attorno a tale configurazione e sulla
locale varietà tangente, cioè il piano (O, x̂, ŷ), ci garantisce una buona approssimazione
rispetto alla genuina originale descrizione non lineare del sistema. Infine dunque,
(iii) Accettiamo la descrizione linearizzata data dalle Piccole Oscillazioni.

114
A questo punto il conto non è difficile, potremo per esempio procedere cosı̀: consi-
deriamo inizialmente le equazioni linearizzate del pendolo sferico rispetto ad un sistema
inerziale, queste sono ben note
g g
mẍ = −m x, mÿ = −m y,
l l
dove x e y sono coordinate cartesiane nel locale piano tangente (in O). Mettendo in
evidenza le frequenze (coincidenti) di questo oscillatore armonico 2-dimensionale,
g
mẍ = −mω 2 x, mÿ = −mω 2 y, ω 2 := .
l
Teniamo conto ora della forza di Coriolis nella teoria linearizzata in costruzione. Questo non
è del tutto banale (anche se le formule a cui arriveremo saranno relativamente semplici).
La formula che rappresenta la forza di Coriolis sopra scritta è a valori in R3 , dovremo
prima di tutto introdurre l’informazione che il sistema è vincolato sulla sfera di raggio l, e
poi procedere nella linearizzazione. La velocità angolare terrestre si decompone nella base
(O, x̂, ŷ, ẑ)
Ω = (Ωx , 0, Ωz ), Ωz = |Ω|cosβ = |Ω|sinα.
Teniamo presente che nell’emisfero boreale, in cui abbiamo posto O, si ha Ωz > 0; inoltre,
per α ≈ 45o (circa la nostra latitudine) il suo ordine di grandezza è
1
Ωz ≈ 7, 26 · 10−5 √ ≈ 5, 13 · 10−5 ,
2
mentre l’ordine di grandezza di ω, per l ≈ 15 metri, è
r
9, 8
ω≈ ≈ 0, 8.
15
Tornando al nostro conto, la strategia è la seguente: scriviamo il lavoro della forza di
Coriolis per arbitrari vettori tangenti (= “spostamenti virtuali”) alla superficie sferica,
usando localmente, vicino ad O, coordinate lagrangiane x, y, otterremo un’espressione del
tipo
dL = Qx (x, y, ẋ, ẏ)dx + Qy (x, y, ẋ, ẏ)dy,
le Qx e Qy sono le “Componenti Lagrangiane della Sollecitazione” e sono le forze ge-
neralizzate che dobbiamo inserire nelle equazioni (non linearizzate) di Lagrange; ora, l’ul-
timo passo consiste nel considerare solo i termini lineari di tali quantità a partire dall’equi-
librio (e velocità nulle) (x, y; ẋ, ẏ) = (0, 0; 0, 0). L’immersione 3
p della sfera in R , localmente
2 2 2
in O, è data da (x, y) 7→ (x, y, z̆(x, y)), ove z̆(x, y) = l − l − x − y , il generico vettore
tangente è dP = (dx, dy, dz̆(x, y)), e la componente z della velocità è rappresentata da
dz̆ ∂ z̆ ∂ z̆
dt = ∂x (x, y)ẋ + ∂y (x, y)ẏ. Dunque:
 
dx dy dz̆(x, y)
dL = −2mΩ ∧ vP · dP = det −2mΩx 0 −2mΩz  ,
dz̆
ẋ ẏ dt

115
riscrivendo,
dz̆
dL = (2mΩz ẏ)dx + (−2mΩz ẋ + 2mΩx )dy + (−2mΩx ẏ)dz̆(x, y) =
dt
∂ z̆ ∂ z̆ ∂ z̆ ∂ z̆
= (2mΩz ẏ − 2mΩx ẏ )dx + [−2mΩz ẋ − 2mΩx ẏ + 2mΩx ( ẋ + ẏ)]dy.
∂x ∂y ∂x ∂y
∂ z̆ x y
Osservando che ∂x (x, y) = √2 , ∂ z̆ (x, y) = √2 , possiamo infine scrivere
l −x2 −y 2 ∂y l −x2 −y 2

dL = (2mΩz ẏ + o(|(x, y, ẋ, ẏ)|)dx + (−2mΩz ẋ + o(|(x, y, ẋ, ẏ)|)dy,

dove o(|v|) significa che lim|v|→0 o(|v|)


|v| = 0, cioè termini “d’ordine superiore”. Da quest’ul-
tima relazione individuiamo i termini che andranno ad aggiustare le equazioni del pendolo
sferico linearizzato (inerziale) che abbiamo scritto sopra; otteniamo:

mẍ = −mω 2 x + 2mΩz ẏ, mÿ = −mω 2 y − 2mΩz ẋ.

D’ora in poi il nostro lavoro consisterà nello studio di tale sistema di equazioni differenziali
lineari del secondo ordine in R2 . Semplifichiamo la massa
√ m, moltiplichiamo ambo i membri
della seconda equazione per l’unità immaginaria i = −1 e sommiamo membro a membro
con la prima, posto ζ := x + iy, otteniamo:

ζ̈ + 2iΩz ζ̇ + ω 2 ζ = 0.

I dati iniziali al tempo t = 0 (Problema di Cauchy) sono del tipo

x(0) = x0 , y(0) = y0 , ẋ(0) = ẋ0 , ẏ(0) = ẏ0 ,

che si possono scrivere

ζ(0) = x0 + iy0 , ζ̇(0) = ẋ0 + iẏ0 .

Dobbiamo preliminarmente determinare la struttura dello spazio vettoriale delle soluzioni


dell’equazione differenziale. Come al solito, si cerca una base per tale spazio tra le funzioni
del tipo ζ(t) = eλt ; inserendo nell’equazione differenziale otteniamo l’equazione caratteri-
stica per λ:
λ2 + 2iΩz λ + ω 2 = 0,
le cui radici sono
q q
λ1,2 = −iΩz ± −Ωz − ω = i(−Ωz ± Ωz 2 + ω 2 ).
2 2

La generica soluzione è data dalla combinazione complessa di eλ1 t e eλ2 t , ovvero,


√ 2 √ 2
2 2
ζ(t, c1 , c2 ) = e−iΩz t (c1 ei Ωz +ω t + c2 e−i Ωz +ω t ).

116
Notiamo a questo punto che la rappresentazione complessa del nostro sistema di equazioni
differenziali, si rivela molto utile, perché la formula generale per ζ(t, c1 , c2 ) mette subito in
chiaro la geometria delle soluzioni: il termine entro parentesi,
√ √
i Ωz 2 +ω 2 t −i Ωz 2 +ω 2 t
(c1 e + c2 e ),

rappresenta un’ellisse nel piano (O, x, y) ∼ C —vedi sotto— mentre il termine

e−iΩz t ,

che è indipendente dai dati iniziali, rappresenta la precessione dei punti apsidali dell’ellisse
con velocità angolare −Ωz < 0, dunque in senso orario.
Un esempio istruttivo è il seguente. Abbandoniamo il sistema dal punto (x(0), y(0)) =
(x0 , 0) con velocità nulla e calcoliamo la struttura dell’ellisse. Si ha:

ζ(0) = x0 + i0 = x0 , ζ̇(0) = 0 + i0 = 0.

ζ(0, c1 , c2 ) = c1 + c2 = x0 ,
q
ζ̇(0, c1 , c2 ) = −iΩz (c1 + c2 ) + i Ωz 2 + ω 2 (c1 − c2 ) = 0.
Otteniamo:
x0 Ωz
c1 = (1 + p ),
2 Ω2z + ω 2
x0 Ωz
c2 = (1 − p ).
2 Ω2z + ω 2
Dunque la soluzione nel piano complesso è
√ 2 √ 2
x0 Ωz 2 x0 Ωz 2
ζ(t) = e−iΩz t [ (1 + p )ei Ωz +ω t + (1 − p )e−i Ωz +ω t ];
2 2
Ωz + ω 2 2 2
Ωz + ω 2

iϑ −iϑ iϑ −iϑ
utilizzando le formule di Euler, sin ϑ = e −e
2i , cos ϑ = e +e 2 , si ha infine:

x0 Ωz
q q
−iΩz t 2
ζ(t) = e 2
[x0 cos Ωz + ω t + i p sin Ωz 2 + ω 2 t ].
Ωz 2 + ω 2
Il semi-asse maggiore vale: a = x0 ,
il semi-asse minore vale: b = √ x0 Ω
2
z
.
Ωz +ω 2
5,13·10−5 5,13·10−5
Nel caso x0 = 1 metro, b ≈ √ ≈ 0,8 ≈ 6, 4·10−5 metri, si noti che è una
(5,13·10−5 )2 +0,82
ellisse “molto stretta”, ed è per questo che spesso si parla, impropriamente, di precessione
del “piano di oscillazione”.

117
L’angolo di precessione (in gradi), nell’intervallo di tempo di un’ora, vale: φ = Ωz ·
360
3600 · 6,28 ≈ 5, 13 · 10−5 · 3, 6 · 103 · 6,28
360
≈ 10, 40 .

—————————————

Verifichiamo che la curva

R 3 t 7→ z(t) = c1 eiω̄t + c2 e−iω̄t ∈ C, c1 = ρ1 eiα1 , c2 = ρ2 eiα2 ,

ha per immagine un’ellisse di semi-asse maggiore a := ρ1 + ρ2 e di di semi-asse minore


b := |ρ1 − ρ2 | con l’asse maggiore ruotato in senso antiorario rispetto all’asse x (parte
reale) dell’angolo α1 +α
2
2
, e che se ρ1 − ρ2 > 0 [< 0] l’ellisse è percorsa in senso antiorario
[orario].
Prova. Si ha
z(t) = c1 eiω̄t + c2 e−iω̄t ∈ C,
α1 +α2 α1 −α2 α1 −α2
z(t) = ei 2 (ρ1 ei(ω̄t+ 2
)
+ ρ2 e−i(ω̄t+ 2
)
);
dunque, posto
α1 − α2
ϑ := ω̄t +
2
e usando le formule di Euler,
α1 +α2
z̄(ϑ) = ei 2 ((ρ1 + ρ2 ) cos ϑ + i(ρ1 − ρ2 ) sin ϑ);

La quantità entro parentesi si riscrive

X + iY = a cos ϑ + isgn(ρ1 − ρ2 )b sin ϑ,

ove X e Y forniscono le ben note equazioni parametriche dell’ellisse, dato che soddisfano
all’equazione:
 X 2  Y 2
+ = 1.
a b

118
Capitolo 7

Meccanica Elementare del Corpo


Rigido

7.1 Il Corpo Rigido è un sistema vincolato a vincoli olonomi


Consideriamo il sistema di n particelle, di massa m1 , ..., mn , soggette geometricamente al
vincolo di rigidità, cioè, il sottoinsieme delle configurazioni possibili per le n particelle è
dato dalle n-uple di 3-vettori (x1 , ..., xi , ..., xn ) ∈ R3n tali che

|xi − xj | = cij , i < j = 1, ..., n, | · |:= norma euclidea in R3 ,

per n(n−1)
2 costanti positive cij (= cji , e, ovviamente, cii =0). Chiaramente tale vincolo è di
natura olonoma (coinvolge configurazioni, ma non velocità). Sia C ∗ = (x∗1 , ..., x∗i , ..., x∗n ) una
configurazione ammissibile. Vogliamo indagare sul sottoinsieme connesso S delle soluzioni
della relazione sopra scritta contenente C ∗ . Ogni altra configurazione C in tale insieme è
connessa a C ∗ mediante qualche curva continua

[0, 1] 3 λ 7→ C(λ) ∈ R3n , C(0) = C ∗ , C(1) = C.

Fissate C ∗ e C, indichiamo con f la mappa di R3 in R3 tale che (i)

(f (x∗1 ), ..., f (x∗n )) = (x1 , ..., xn ),

cioè manda C ∗ in C, ed inoltre (ii) per ogni coppia di punti x∗ , y ∗ di R3 , siano o meno in
C ∗,
|f (x∗ ) − f (y ∗ )| = |x∗ − y ∗ |,
cioè, è un’isometria, più precisamente f è un’estensione isometrica della mappa che manda
C ∗ in C. Un generale teorema di geometria (si veda per esempio De Marco, Analisi
Due/uno, pag. 117) ci permette di affermare che f , isometrica, è affine. Se le particelle

119
sono almeno tre, non allineate, allora tale mappa f è univocamente determinata da una
coppia in R3 ×SO(3). Infatti, scrivendo ora f affine, f (x) = Ax+b, dove A è una matrice e
b è un vettore, si ha che |f (x2 )−f (x1 )|2 = |x2 −x1 |2 implica che (AT A(x2 −x1 ), (x2 −x1 )) =
((x2 − x1 ), (x2 − x1 )) per ogni x2 − x1 ∈ R3 , dunque: A ∈ O(3), gruppo ortogonale; e dato
che le nostre configurazioni C sono connesse alla configurazione C ∗ , dunque le A sono
connensse all’identità I, det I = +1, segue che A ∈ SO(3).
L’insieme S è dunque isomorficamente identificato da

R3 × SO(3) : {traslazioni, rotazioni proprie},

che è la varietà delle configurazioni del sistema meccanico vincolato olonomo detto corpo
rigido. La dimensione di R3 × SO(3) è sei: questi sono dunque i gradi di libertà del corpo
rigido. Per quanto riguarda la dimensione di SO(3), la relazione RT R = I può essere pen-
sata come a sei equazioni funzionalmente indipendenti (sono sei perché tali relazioni sono
simmetriche) implicitamente definenti SO(3) nello spazio nove-dimensionale delle matrici
reali tre per tre; dunque, nove meno sei: tre. Una carta locale famosa per SO(3) è data
dagli angoli (tre, naturalmente) di Euler; il lettore è invitato a familiarizzare con tale carta
locale in qualche classico manuale di Meccanica.

7.2 Il Corpo Rigido è un sistema vincolato a vincoli lisci


Vogliamo introdurre nella teoria che stiamo sviluppando delle ipotesi (matematiche, ma
fortemente suggerite dalla fisica) sulla classe Υ delle reazioni vincolari esplicabili da tale
vincolo di rigidità:
Le reazioni vincolari esplicabili sono date da tutte e sole le distribuzioni di forze di tipo
interno d’interazione di coppia soddisfacenti al Principio di Azione e Reazione (Risultante
e Momento risultante nulli).
Indichiamo con φij il generico 3-vettore (forza) reazione vincolare agente sulla particella
i-esima dovuta alla presenza della particella j-esima. Indicheremo con
n
X
Φi = φij
j(6=i)=1

la reazione vincolare risultante sulla particella i-esima.


Diremo che (Φ1 , ..., Φn ) è una possibile distribuzione di reazioni vincolari se e solo se ∀i 6= j
(Principio di Azione e Reazione):

(∗) φij + φji = 0, (xi − xj ) ∧ φij = 0,

Calcoliamo il lavoro virtuale della generica distribuzione vincolare Φ = (Φ1 , ..., Φn ) a partire
da una configurazione (OΩ, R) ∈ R3 × SO(3) dove O è l’origine di un sistema di riferimento

120
e Ω è un punto del (oppure, solidale al) rigido.
n
X n
X
δLΦ = Φi · δPi = Φi · (δΩ + δψ ∧ ΩPi ),
i=1 i=1

ove con (δΩ, δψ) si intende il generico vettore tangente (o spostamento virtuale) a R3 ×
SO(3) in una configurazione (OΩ, R):
(δΩ, δψ) ∈ R3 × R3 ∼ T(OΩ,R) (R3 × SO(3)), in altri termini, δΩ è il generico (in R3 ) vettore
spostamento di Ω, mentre δψ rappresenta il generico (in R3 ) vettore velocità angolare del
rigido; a volte i δψ si dicono vettori infinitesimi di rotazione. Si verifica che

Xn n
X
δLΦ = ( Φi ) · δΩ + ( ΩPi ∧ Φi ) · δψ = 0,
i=1 i=1

poiché, dalle ipotesi (∗) sulle forze di reazione vincolare sopra fatte, segue che
n
X n
X
Φi = 0, ΩPi ∧ Φi = 0.
i=1 i=1

(Verificarlo per esercizio). Dunque, il vincolo di rigidità è liscio.

7.3 Dinamica del Corpo Rigido


Mostriamo che per il corpo rigido libero il Principio di D’Alembert, che sussiste dato
che il corpo rigido è liscio, è equivalente alle Equazioni Cardinali. In effetti, un moto
t 7→ xi (t), i = 1, ..., n è dinamicamente possibile se e solo se, per ogni δx appartenente allo
spazio locale tangente alla varietà vincolare corpo rigido nel punto x(t), vale
n
X
(mi ẍi (t) − Fi (t, x(t), ẋ(t)) · δxi = 0,
i=1

dove le Fi sono le forze attive. Più in dettaglio, e usando la proprietà di permutazione


ciclica del prodotto misto: a · b ∧ c = c · a ∧ b = b · c ∧ a,
n
X
(mi ẍi (t) − Fi (t, ..., xj (t), ..., ẋk (t), ...)) · (δΩ + δψ ∧ ΩPi ) =
i=1

n n
d X n n
X X d X 
= (mi ẍi − Fi ) · δΩ + ΩPi ∧ mi ẋi − ΩPi ∧ mi ẋi − ΩPi ∧ Fi · δψ =
dt dt
i=1 i=1 i=1 i=1

121
n n n n n
d X X d X X X 
=( mi ẋi − Fi )·δΩ+ ΩPi ∧mi ẋi − (ẋi − ẋΩ )∧mi ẋi − ΩPi ∧Fi ·δψ =
dt dt
i=1 i=1 i=1 i=1 i=1
n n n n n
d X X d X X X 
=( mi ẋi − Fi ) · δΩ + ΩPi ∧ mi ẋi + ẋΩ ∧ ( mi )ẋG − ΩPi ∧ Fi · δψ,
dt dt
i=1 i=1 i=1 i=1 i=1

osservando che δΩ e δψ sono entrambi completamente arbitrari in la condizione va- R3 ,


riazionale data dal Pr. di D’Alembert per il corpo rigido è equivalente alle Equazioni
Cardinali:
n n
d X X
mi ẋi = Fi ,
dt
i=1 i=1
n n n
d X X X
ΩPi ∧ mi ẋi = ΩPi ∧ Fi − ẋΩ ∧ ( mi )ẋG .
dt
i=1 i=1 i=1
Il primo gruppo Pdi Equazioni Cardinali pilota l’evoluzione del centro di massa del corpo
rigido, mẍG = i Fi .
Il dettaglio del secondo gruppo delle Equazioni Cardinali, rispetto ad un riferimento solidale
al corpo rigido, conduce alle Equazioni di Euler.

7.4 Equazioni di Euler


Per il corpo rigido, come per un qualsiasi sistema ad n corpi, vale dunque l’equazione
cardinale (vedi l’ultima formula sopra)
d (ext)
M = N Ω − v Ω ∧ mtot v G
dt Ω
(ext)
ove, nel nostro caso, N Ω è la risultante dei momenti delle sole forze esterne attive; se ci
limitiamo al caso Ω ≡ G, diventa
d (ext)
M = NG .
dt G
Il nostro corpo rigido in studio è libero. Il suo baricentro si muoverà come un corpo di
massa mtot soggetto alla risultante delle forze agenti sul sistema. In tale situazione, è
conveniente introdurre, accanto al sistema di riferimento inerziale (O, c1 , c2 , c3 ), un sistema
di riferimento (non inerziale) (G, J 1 (t), J 2 (t), J 3 (t)) mobile e solidale al corpo, rispetto al
quale l’Operatore d’Inerzia, assume una struttura matriciale IG di forma diagonale (diremo
che è un sistema principale d’Inerzia):
 
I1 0 0
IG =  0 I2 0  , Ii > 0.
0 0 I3

122
L’esistenza dei sistemi principali d’Inerzia è sempre garantita dalla proprietà algebrica
seguente: fissato il punto Ω, l’operatore d’Inerzia è autoaggiunto, simmetrico, rispetto alla
metrica euclidea, dunque esiste sempre una base in cui la sua rappresentazione matriciale
è diagonale e gli elementi diagonali sono esattamente gli autovalori dell’operatore stesso,
che sono positivi, dato che l’operatore d’Inerzia individua una forma quadratica definita
positiva. Sotto le ipotesi introdotte, valgono le relazioni
X X X
MG = GPi ∧ mi v i = GPi ∧ mi (v G + ω ∧ GPi ) = mi GPi ∧ (ω ∧ GPi ) = IG ω,
i i i

quest’ultima è esattamente la definizione di operatore d’Inerzia, inoltre per l’energia cine-


tica vale1 :
1 2 (G) 1 2 1  X 
T = m|v G | + T = m|v G | + (IG ω, ω) m := mi
2 2 2
i

Esprimiamo ora l’equazione scritta sopra nel sistema rigido solidale al corpo
!
X X X
MG = Mi J i = IG ω = Ii ωi J i ω= ωi J i
i i i
!
d d X X X dJ i
MG = Ii ωi (t)J i (t) = Ii ω̇i J i + Ii ωi =
dt dt dt
i i i
X X
= Ii ω̇i J i + Ii ωi ω ∧ J i =
i i
(ext)
X X X
= Ii ω̇i J i + ω ∧ ( Ii ωi J i ) = Ii ω̇i J i + ω ∧ M G = N G .
i i i

Riscrivendo,
d (ext)
IG ω = IG ω̇ + ω ∧ IG ω = N G , (#)
dt
P
ove si è posto ω̇ := i ω̇i (t)J i (t). Per esercizio, si provi a dedurre le equazione (#) in un
generico sistema solidale al corpo rigido, non necessariamente principale d’inerzia.
(ext)
In assenza di forze attive esterne, ovviamente, N G = 0, ma quest’ultima relazione
vale anche in situazioni meno banali, p.e. in presenza dell’azione delle forza gravitazionale
(ext) (g)
(nell’approssimazione usuale di superficie terrestre), infatti si ha: N G = N G =
Z Z 
= GP ∧ µ(Y )gd3 Y = µ(Y )GP d3 Y ∧ g = mtot GG ∧ g = 0.
Y ∈S Y ∈S
1
ω si intende espressa nel sistema rigido solidale al corpo.

123
In tali casi dunque otteniamo l’equazione vettoriale
X X X
IG ω̇ + ω ∧ IG ω = 0, cioè Ii ω̇i J i + ωj J j ∧ Ii ωi J i = 0,
i j i

da cui, svolgendo il prodotto vettoriale, si ottengono le tre equazioni scalari:



 J 1 : I1 ω̇1 − (I2 − I3 )ω2 ω3 = 0
J : I2 ω̇2 − (I3 − I1 )ω3 ω1 = 0 (equazioni di Euler)
 2
J 3 : I3 ω̇3 − (I1 − I2 )ω1 ω2 = 0

Si tratta di un sistema di equazioni differenziali del primo ordine nelle ωi . Una volta
determinata la soluzione ω(t) di un problema di Cauchy ω(0) = ω 0 , si studia il sistema di
equazioni differenziali lineare a coefficienti variabili (in t), le relazioni di Poisson:

dJ i (t)
= ω(t) ∧ J i (t),
dt

infine, t 7→ J i (t), i = 1, 2, 3, dà l’evoluzione rispetto ad un sistema inerziale esterno del


corpo rigido in studio.
Osserviamo che se la velocità angolare è P costante nel corpo, cioè se le ωi sono costanti,
allora ω è costante nello spazio, cioè ω(t) = i ω i Ji (t) è costante. Infatti:

dω d X X X
= ( ωi J i ) = ω̇ i J i + ω ∧ ω = ω̇i J i =: ω̇.
dt dt
i i i

Da questo fatto segue che per trovare le soluzioni stazionarie (moti rigidi con velocità
angolare costante) nel sistema assoluto possiamo studiare le soluzioni stazionarie ω(t) ≡
(ω1 , ω2 , ω3 ) = ω ∗ nel sistema solidale, cioè gli equilibri delle equazioni di Euler.
Sia ora ω 0 = (ω10 , ω20 , ω30 ) un equilibrio delle equazioni di Euler, cioè una velocità an-
golare costante ω(t) ≡ ω 0 soluzione di tali equazioni. Dall’equazione di Euler in forma
vettoriale IG ω̇ + ω ∧ IG ω = 0, segue che

ω 0 ∧ IG ω 0 = 0 =⇒ IG ω 0 = λω 0 .

Quindi ω 0 può essere una soluzione stazionaria se e solo se ω 0 è un autovettore di IG , cioè


se rappresenta una rotazione attorno ad un asse principale d’inerzia. Perciò le soluzioni
(1) (2) (3)
stazionarie sono collezionabili in tre famiglie ω 0 = (ω, 0, 0), ω 0 = (0, ω, 0), ω 0 =
(0, 0, ω), con ω arbitrario in R.
Importanti informazioni qualitative sul sistema possiamo trarle dall’esistenza di even-
dM
tuali integrali primi. Dall’equazione dtG = 0, traiamo che le tre componenti del momento

124
angolare nello spazio si conservano; queste tre componenti però non rappresentano tre in-
tegrali primi per le equazioni di Euler; evidentemente, le tre componenti di M G evolvono
nel corpo, resta però sicuramente costante la norma quadrato |M G |2 ,
3
X 3
X
MG = Ii ωi J i = cost. ⇒ |M G |2 = Ii2 ωi2 = cost.
i=1 i=1

Un altro integrale primo è dato dall’energia totale:


1 1
E = T + U g = mtot |v G |2 + (IG ω, ω) + U g = cost, U g = mtot g zG .
2 2
E facile verificare che 12 mtot |v G |2 + U g è integrale primo per il primo gruppo delle equazioni
cardinali, dunque
3
G 1 1X
T = (IG ω, ω) = Ii ωi2
2 2
i=1
è un ulteriore integrale primo, che, d’altro canto, era possibile dedurlo verificandolo diret-
tamente con il solo uso delle equazioni di Euler, senza le considerazioni energetiche globali
appena fatte sul sistema meccanico. I due integrali primi “importanti” del sistema sono
quindi:
X3
2
|M G | = Mi2 = M 2 ≥ 0,
i=1
3 3 3 2
(Ii ωi )2 X

1 1 M
√ i
X X
TG = Ii ωi2 = = = e ≥ 0,
2 2 Ii 2Ii
i=1 i=1 i=1
dove
P con Mi si sono indicate le componenti di M G nel sistema solidale al rigido, M G =
i Mi J i .
I moti del sistema si svolgono su superfici di livello di |M G |2 e TG , lungo i moti queste
due quantità mantengono un valore costante. Una volta assegnate delle condizioni iniziali,
quindi una volta fissati M 2 ed e, il sistema evolve lungo l’intersezione di due superfici
bidimensionali in R3 , sui cui assi rappresentiamo le componenti del momento M G cioè
lungo una varietà unidimensionale
3
X
Mi2 = M 2 sfera del momento angolare
i=1

3  2
M
√ i
X
=1 ellissoide dell’energia (6= dall’ellissoide d’inerzia)
i=1
2eIi

Si osserva che i tre assi dell’ellissoide sono in generale diversi. Cerchiamo ora di studiare dal
punto di vista qualitativo la forma delle traiettorie del sistema nello spazio (M1 , M2 , M3 ).

125
Vediamo innanzi tutto che il raggio M della sfera deve essere maggiore del semiasse
minore e minore del semiasse maggiore dell’ellissoide, altrimenti le due superfici non si
intersecano. Nonè difficile notare che, per ogni dato iniziale in ω, M ed e sono compatibili
con questa necessità; si vede che le intersezioni tra le due superfici vicino agli assi estremali
d’inerzia (l’asse maggiore e minore) sono, topologicamente, dei circoli. Questo intuitiva-
mente ci basta per dire che gli equilibri M G = (M1 , 0, 0), M G = (0, 0, M3 ), dove gli assi
x1 ed x3 sono gli assi estremali, sono stabili. L’asse mediano x2 crea dei problemi, anzi
dimostreremo che le rotazioni uniformi attorno a tale asse sono degli equilibri instabili, lo
vedremo più avanti con il primo metodo di Lyapunov. Se un semiasse coincide con il raggio
della sfera, l’intersezione si limita a due punti opposti lungo tale asse, cioè la soluzione è
stazionaria. Se si varia di poco e ed M si vede che le intersezioni lungo gli assi x1 ed x3
sono delle piccole curve chiuse, mentre quelle lungo l’asse mediano assumono forme più
complesse (simili alla separatrice del pendolo matematico).
Ora cercheremo di studiare il moto del corpo rigido attraverso il moto nello spazio del
suo (solidale) ellissoide d’inerzia: tale procedimento si dice descrizione del moto secondo
Poinsot. Tale descrizione si riassume nel:
Teorema di Poinsot. L’ellissoide d’inerzia nel sistema del baricentro rotola senza stri-
sciare su di un piano fisso perpendicolare a M G .
Prova. Studiamo il moto di un corpo rigido libero soggetto, eventualmente, al solo campo
dM
gravitazionale g. M G è costante nello spazio (infatti dtG = 0 ) e quindi individua una
giacitura. Il nostro ellissoide avrà la forma (IG x, x) = 1 e sarà tangente a due piani di tale
giacitura. Sia xp il punto di tangenza tra l’ellissoide ed uno di tali piani: per la geometria
del problema la normale all’ellissoide in xp è parallela a M G : sull’ellissoide 3i=1 Ii x2i è
P
costante, quindi:
∇x ((IG x, x))|xp k M G
∇x (IG x, x) = 2IG x ⇒ 2IG xp k M G = IG ω

126
da cui si trae xp kω ⇒ xp = Kω, per un K che ora calcoliamo,

(IG xp , xp ) = 1
1
2 (IG ω, ω) = e

1 1 ω
K2 = K=√⇒ xp = √
2e 2e 2e
Valutiamo la proiezione di xp sulla normale al piano:
MG
xp · = {componente di xp lungo la direzione di M G } =
|M G |

ω IG ω IG ω · ω 2e
√ · =√ =
2e |M G | 2e|M G | |M G |
Dalle relazioni trovate deduciamo che il punto di tangenza tra piano ed ellissoide giace
sull’asse istantaneo di rotazione dell’ellissoide, cioè l’ellissoide ruota senza strisciare su tale
piano, e che la distanza del piano da G è costante, cioè il piano è fisso nello spazio (nel
sistema relativo del baricentro, in generale mobile).

(ext)
Studiando il moto di un corpo rigido libero con N G = 0 , nel sistema del baricentro G,
si sono trovate le equazioni di Euler (A = I1 , B = I2 , C = I3 ):

Aω̇1 − (B − C)ω2 ω3 = 0
B ω̇2 − (C − A)ω3 ω1 = 0
C ω̇3 − (A − B)ω1 ω2 = 0
che possiamo pensare come ad un sistema differenziale del tipo

ẋ = X(x) X : R3 → R3

Le ωi sono le componenti della velocità angolare del corpo espressa rispetto a una terna
principale d’inerzia solidale al corpo. Abbiamo visto che gli equilibri del sistema sono tutti
e soli della forma (ω10 , 0, 0), (0, ω20 , 0) e (0, 0, ω30 ). Vogliamo studiare la stabilità di tali
equilibri, nello spazio R3 delle velocità angolari, nel caso I1 > I2 > I3 , A > B > C.
Dimostreremo che le rotazioni attorno agli assi estremali x e z sono stabili: lo faremo solo
per le rotazioni attorno all’asse maggiore d’inerzia, l’asse x. Il vettore ω ∗ = (ω10 , 0, 0),
comunque fissato ω10 in R3 , è un equilibrio dell’equazione differenziale scritta sopra, infatti
è X(ω ∗ ) = 0. Dimostreremo che è stabile usando la seguente funzione di Lyapunov:

W (ω) := (T (ω) − T0 )2 − |M G |2 + 2AT (ω),


2
ove T0 = 12 A(ω10 ) e T (ω) = 12 (Aω12 + Bω22 + Cω32 ).

W (ω) = (T (ω) − T0 )2 − A2 ω12 − B 2 ω22 − Cω32 + A2 ω12 + ABω22 + ACω32 =

127
= (T (ω) − T0 )2 + B (A − B) ω22 + C (A − C) ω32
| {z } | {z }
>0 >0

Pertanto: W (ω) ≥ 0, ∀ω. Ci chiediamo se W , localmente a ω ∗ , sia strettamente


definita positiva. In altri termini, per qualche ω 6= ω ∗ , può essere che W (ω) = 0?
2
W (ω) = 0 ⇒ ω2 = 0 ω3 = 0 oltre a T (ω) = T0 ⇒ 12 Aω12 = 12 A(ω10 ) ⇐⇒ ω1 = ±ω10 ,
quindi W (ω) è localmente definita positiva attorno a (ω10 , 0, 0). Inoltre W = f (T, |M G |) ⇒
∂f d ∂f d
Ẇ = ∂T dt T + ∂|M | dt |M G | = 0. Allora W è funzione di Lyapunov per l’equilibrio
G
(0)
(ω1 , 0, 0).

(0)
Un analogo risultato di stabilità si ottiene per le rotazioni uniformi ω ∗ = (0, 0, ω3 )
attorno all’asse principale d’inerzia di momento d’inerzia minore I3 = C, A > B > C: si
verifica che ora una funzione di Lyapunov è

W (ω) := (T (ω) − T0 )2 + |M G |2 − 2CT (ω).

(0)
Verifichiamo infine che le rotazioni uniformi ω ∗ = (0, ω2 , 0) attorno all’asse mediano
di momento d’inerzia I2 = B, A > B > C, sono instabili. La matrice associata al sistema
linearizzato di Euler
ω̇1 = B−C
A ω2 ω3
ω̇2 = C−A
B ω3 ω1
A−B
ω̇3 = C ω1 ω2
(0)
attorno a tale equilibrio ω ∗ = (0, ω2 , 0) risulta essere:
 
(0)
0 0 B−CA ω2
A = X 0 (ω ∗ ) =  0 0 0 .
 
A−B (0)
C ω2 0 0
 
B−C (0)
−λ 0 A ω2
0 = det(A − λI) = det  0 −λ 0 =
 
A−B (0)
C ω2 0 −λ
 (A − B)(B − C) (0) 2 
= −λ λ2 − (ω2 ) ,
AC
r
(A − B)(B − C) (0)
λ1 = 0, λ2,3 = ± |ω2 |,
AC
si noti che il radicando è positivo; esiste un autovalore reale positivo: c’è instabilità per il
primo metodo di Lyapunov.

128
La risoluzione in tutta generalità delle equazioni di Euler rende necessario l’uso di
particolari funzioni speciali: le Funzioni Ellittiche di Jacobi.
Qui le risolveremo in un caso particolare, limitandoci a studiare il moto di un giroscopio,
ossia di un corpo in cui i momenti principali d’inerzia rispetto al baricentro sono del tipo
I1 = I2 6= I3 (A = B 6= C). In tal caso le equazioni di Euler si scrivono:
(0)
ω̇1 = A−C
A ω2 ω3
ω3 = cost. = ω3
(0)
ω̇2 = − A−C
A ω3 ω1 ω̇1 = A−C
A ω3 ω2
ω̇3 = 0 ω̇2 = − A−C
(0)
A ω3 ω1

(A−C) (0)
Se poniamo K := A ω3 > 0 le equazioni rimaste si scrivono

ω̇1 = Kω2
ω̇2 = −Kω1

Sia z := ω1 + iω2 la nostra nuova variabile

ż = ω̇1 + iω̇2 = Kω2 − iKω1 = K(ω2 − iω1 ) = −iKz, ⇒


(
(0) (0)
C = z(0) = ω1 + iω2
ż = −iKz ⇒ z = C · eλt ove
λ = −iK
(0)
Quindi, mentre ω3 (t) ≡ ω3 , le velocità angolari descrivono dei moti armonici di pulsazione
K. Si dice che il corpo effettua una precessione attorno all’asse z, cioè che il vettore ω(t),
considerato applicato al baricentro, descrive un moto circolare uniforme con il suo estremo
attorno all’asse z. Il moto del corpo rigido giroscopico è quindi detto di precessione, dove
il significato di precessione è qui sotto precisato.

Precessione. Un moto di un corpo rigido si dice di precessione se esistono due assi, l’asse
di precessione p nello spazio e l’asse di figura f nel corpo, tali che lungo il moto l’angolo
fra di essi è costante e la velocità angolare istantanea giace nel piano da essi individuato;
cioè, se lungo i moti:

p̂ · fˆ ≡ cost. ω(t) = α(t)p̂ + β(t)fˆ α, β ∈ R

Se α(t) ≡ α ∈ R e β(t) ≡ β ∈ R , la precessione si dice regolare.

Dimostriamo che i moti del giroscopio sono delle precessioni regolari.


M
p̂ = |M G |
Se si scelgono G si ha:
fˆ = J 3

(0)
( 3i=1 Ii ω i J i ) · J 3
P
ˆ MG · J3 IG ω · J 3 Cω3
p̂ · f = = = = = cost.
|M G | |M G | |M G | |M G |

129
(0)
M G = |M G |p̂ = IG ω = A (ω1 J 1 + ω2 J 2 ) +Cω3 J 3
| {z }
(0)
=ω−ω3 J 3

(0) (0)
Aω − Aω3 J 3 + Cω3 J 3 = |M G |p̂
|M G | A − C (0) ˆ
ω= p̂ + ω3 f .
A A

130
Capitolo 8

Calcolo delle Variazioni

8.1 Principio Variazionale di Hamilton


Sia Q una varietà vincolare N -dimensionale e, per semplicità, siano q0 e q1 due sue confi-
gurazioni nel dominio di definizione di un’unica carta locale. Identificheremo dunque, fino
a diverso N 1
S avviso, la varietà vincolare Q con R ; analogamente, la varietà fibrato tangente
T Q = q∈Q Tq Q, che ha come sostegno insiemistico l’unione di tutti gli spazi tangenti,
sarà identificata con R2N . Consideriamo, inizialmente, l’insieme delle curve di classe C 2 ,
definite nell’intervallo [t0 , t1 ], a valori in RN , tra due configurazioni prefissate,

Γqt00,t,q11 = {q(·) ∈ C 2 ([t0 , t1 ]; RN ) : q(t0 ) = q0 , q(t1 ) = q1 }.

Questo sottoinsieme Γqt00,t,q11 di C 2 ([t0 , t1 ]; RN ) non è linearmente chiuso; è invece linearmente


chiuso, ha struttura di R-spazio, il seguente sottoinsieme

Γ0,0 2 N
t0 ,t1 = {q(·) ∈ C ([t0 , t1 ]; R ) : q(t0 ) = 0, q(t1 ) = 0}.

Tale spazio è talvolta detto spazio direttore poichè, scelta una curva q(·) ∈ Γtq00,t,q11 , si genera
tutto Γqt00,t,q11 , che risulta chiaramente uno spazio affine:

Γqt00,t,q11 = q(·) + Γ0,0


t0 ,t1 .

Da un punto di vista prettamente geometrico Γt0,0 0 ,t1


si atteggia pure a spazio tangente a
Γqt00,t,q11
nel generico punto q(·); infatti, pensiamo alla costruzione dei vettori tangenti come
derivate (‘velocità’) di curve che passano per q(·) e a valori in Γqt00,t,q11 : tali curve sono del
tipo
[−ε, +ε] × [t0 , t1 ] 3 (λ, t) 7→ γ(λ, t) ∈ RN , γ(0, ·) = q(·);
1
lo ‘spazio delle fasi’, più propriamente, nel linguaggio italiano di Levi Civita, ‘spazio degli atti di moto’.

131
dunque, per ogni λ ∈ [−ε, +ε], γ(λ, t0 ) = q(t0 ), γ(λ, t1 ) = q(t1 ), cosicchè la curva
vettore tangente,
d
h(·) := γ(λ, ·)|λ=0 ,

valutata in t0 e in t1 , è il vettore nullo. Quindi h(·) ∈ Γ0,0
t0 ,t1 .

Sia assegnata una funzione Lagrangiana di classe C 2

L : T Q × R → R, (q, q̇, t) 7→ L(q, q̇, t).

Si noti che L a questo stadio è estremamente generale, quindi di tipo non necessariamente
meccanico L = T − V , energia cinetica ‘meno’ energia potenziale. Mediante L costruiamo
il seguente funzionale reale J, detto funzionale d’Azione,

J : Γqt00,t,q11 −→ R
Z t1
q(·) 7→ J[q(·)] := L(q(t), q̇(t), t)dt.
t0

Si chiama variazione di J, costruita a partire dal punto (curva) q(·) ∈ Γqt00,t,q11 , e di incremento
h(·) ∈ Γ0,0
t0 ,t1 , la seguente derivata direzionale o di Gateaux, nella direzione del vettore h(·):

d
dJ[q(·)]h(·) := J[q(·) + λh(·)]|λ=0 .

Diremo infine che il punto q(·) ∈ Γqt00,t,q11 rende stazionario J se

dJ[q(·)]h(·) = 0, ∀h(·) ∈ Γt0,0


0 ,t1
.

Il seguente teorema caratterizza le soluzioni delle equazioni di Lagrange di Lagrangia-


na L tra le configurazioni q0 e q1 e nell’intervallo di tempo [t0 , t1 ]. In ambito analitico-
variazionale le equazioni di Lagrange sono spesso citate come equazioni di Euler-Lagrange.
Teorema - Principio Variazionale di Hamilton in C 2 : La curva q(·) ∈ Γqt00,t,q11 ren-
de stazionario il funzionale J se e solo se q(·) risolve le equazioni di Euler-Lagrange di
Lagrangiana L.
Prova. Si tratta di esplicitare dJ[q(·)]h(·) –c’è la sommatoria, sottintesa, per i = 1, ..., N –
d
R t1
dJ[q(·)]h(·) = dλ t0 L(q(t) + λh(t), q̇(t) + λḣ(t), t)dt|λ=0 =
R t1
= t0 [ ∂q∂ i L(q(t), q̇(t), t)hi (t) + ∂
∂ q̇ i
L(q(t), q̇(t), t)ḣi (t)]dt =
R t1
= [ ∂∂q̇i L(q(t), q̇(t), t)hi (t)]|tt10 − t0
d ∂L
[ dt ∂ q̇ i
− ∂L
∂q i
](t)hi (t)dt,

132
il primo termine è nullo per la proprietà caratteristica di Γ0,0
t0 ,t1 , dunque:

t1  
d ∂L ∂L
Z
dJ[q(·)]h(·) = − − (t)hi (t)dt
t0 dt ∂ q̇ i ∂q i

Se la curva q(·) risolve le equazioni di Lagrange allora tutte le N funzioni C 0 del tem-
d ∂L ∂L
po [ dt ∂ q̇ i
− ∂q i ](t) sono identicamente nulle in [t0 , t1 ] e dunque q(·) rende stazionario J.

Viceversa, q(·) renda stazionario J, cioè,


Z t1  
d ∂L ∂L
i
− i (t)hi (t)dt = 0, ∀h(·) ∈ Γ0,0
t0 ,t1 .
t0 dt ∂ q̇ ∂q

Supponiamo, ragionando per assurdo, che q(·) non soddisfi alle equazioni di Lagrange in
[t0 , t1 ], quindi, negando la tesi, per qualche indice i0 e a qualche istante t∗ , supponiamo che
 
d ∂L ∂L
− i0 (t∗ ) 6= 0.
dt ∂ q̇ i0 ∂q
d ∂L ∂L
Dato che L e q(·) sono di classe C 2 , le funzioni [ dt ∂ q̇ i
− ∂q i ](t) sono, come già appena
richiamato, continue in t, ed esiste –teorema della permanenza del segno– un intervallo
[α, β], che contiene internamente t∗ , in cui [ dt
d ∂L
∂ q̇ i0
− ∂q ∂L
i0 ](t) assume lo stesso segno di
d ∂L
[ dt ∂ q̇ i0
− ∂L
∂q i0
](t∗ ). Scegliamo ora una particolare h(·) ∈ Γt0,0
0 ,t1
:

h (t) ≡ 0, i 6= i0 ,
 i





i 0
h (t) : hi (t) ≡ 0, t ∈ [t0 , t1 ] \ [α, β],



 i0
 0
h (t) 6= 0, t ∈ [α, β], per esempio: hi (t) = (t − α)3 (β − t)3

Si osservi che l’esponente ‘3’ qui sopra è scelto affinché h(·) sia effettivamente di classe
C 2 in [t0 , t1 ]. Con tale scelta di h(·) otteniamo –qui non c’è naturalmente la sommatoria
sottintesa sull’indice i0 –
Z β 
d ∂L ∂L 0
dJ[q(·)]h(·) = i 0 − i 0 (t)hi (t)dt 6= 0,
α dt ∂ q̇ ∂q

contro l’ipotesi: assurdo; quindi q(·) risolve le equazioni di Lagrange in [t0 , t1 ].

Emergono dalla trattazione appena richiamata delle osservazioni e delle domande:


(i) Perché operare fin dall’inizio in una classe C 2 di curve?
Per scrivere il funzionale J basterebbe p.e. una classe di curve C 1 , se non meno. E’ qui
chiaro infatti che la classe C 2 è legata alla possibilità di poter realizzare quell’‘integrazione

133
per parti’ che porta all’espresssione di dJ coinvolgente i primi membri delle equazioni di
Lagrange. Un tentativo dunque di riduzione, in un senso naturale, della regolarità delle
curve appare ragionevole e doveroso, e lo metteremo in atto, in W 1,2 = H 1 , in un modo
sufficientemente semplice nella Sezione 8.3.
(ii) La definizione di ‘stazionarietà’ del funzionale J: è veramente ragionevole introdurre
questa nozione fondata sulla semplice derivata direzionale?
A differenza del precedente punto (i), possiamo invece qui sottolineare la ragionevolezza
di tale scelta: un’introduzione, apparentemente più naturale, di stazionarizzazione fondata
sulla nozione standard di derivata (di Fréchet) richiede infatti la scelta di una norma in
Γqt00,t,q11 . Ma questa induce una metrica, e dunque una topologia nello spazio delle curve, e, nel
caso infinito-dimensionale in studio, norme diverse inducono in genere topologie diverse.
Sarà la nozione successiva, di qualità di una curva stazionaria per J (localmente minimo,
massimo, sella,...) che richiederà inevitabilmente una topologia; ma il nostro originale
problema non necessita affatto di topologie: l’equivalenza della stazionarizzazione, della
criticità di J, con le equazioni di Lagrange è perfettamente ben calibrata dalla scelta della
semplice derivata di Gâteaux.
(iii) La classe dei sistemi meccanici la cui dinamica si pone in forma variazionale è stretta-
mente più ampia della classe dei sistemi meccanici olonomi lisci e conservativi. Si consideri
per esempio una particella libera di massa m e soggetta ad una forza conservativa di ener-
gia potenziale V (q), q ∈ R3 , e alla resistenza di mezzo di tipo viscoso F = −k q̇. Si verifica
direttamente che le equazioni dinamiche per tale sistema, cioè mq̈ = −∇V (q) − k q̇, sono le
k
equazioni di Euler-Lagrange con Lagrangiana L(q, q̇, t) = e m t ( 12 m|q̇|2 − V (q)).

8.2 Minimo nel Calcolo delle Variazioni: il Principio della


Minima Azione
Talvolta, il Principio Variazionale di Hamilton è detto Principio della Minima Azione.
In realtà, almeno nel caso puramente meccanico per semplicità, e per una particella,
L(q, q̇) = 12 m|q̇|2 − V (q), q ∈ R3 , V : en. potenziale, verificheremo che la curva q(·) ∈ Γtq00,t,q11
stazionarizzante J, se t1 è sufficientemente vicino a t0 , è un minimo stretto locale per J.
A differenza del modo di operare nel Principio di Hamilton, dobbiamo ora introdurre una
topologia in Γqt00,t,q11 per poter chiarire cosa significa locale. Inoltre, tale minimo locale lo vo-
gliamo rilevare mediante un conto diretto, un adattamento agli spazi infinito dimensionali
del “test delle derivate seconde”. Notiamo però che un adattamento ingenuo di tale criterio
al caso infinito dimensionale è destinato al fallimento: per esempio, la naturale richiesta
J 00 [q](h, h) > 0
per ogni non nullo h(·) ∈ Γ0,0
t0 ,t1 , in qualche palla centrata nello zero e per qualche norma,
non implica in tutta generalità che q(·) sia un minimo locale: dovremo rafforzare tale

134
condizione di positività sulle derivate seconde (di Fréchet) p.e. con la coercività locale; a
tal scopo si veda un contro-esempio nell’Osservazione 4 alla fine della Sezione.
Riportiamo 2 nei dettagli (che sono semplici) il seguente fatto generale, valido negli
spazi normati, adattato al nostro ambiente del calcolo delle variazioni elementare.
Proposizione (Coercività locale induce minimo locale):
(i) Sia (X, k · k), uno spazio normato affine di curve tra due configurazioni fissate, X =
Xtq00,t,q11 = q + Xt0,0
0 ,t1
per una prefissata arbitraria q ∈ X,
(ii) sia J : (X, k · k) → R un funzionale C 2 (X; R),
(iii) sia q ∈ X stazionario 3 per J:

J 0 (q)h = 0, ∀h ∈ Xt0,0
0 ,t1
,

(iv) supponiamo esista una costante positiva α > 0 tale che (coercività locale):

J 00 [q](h, h) ≥ αkhk2 per ogni h ∈ Xt0,0


0 ,t1

Allora q è un minimo stretto locale per J nella topologia indotta da k · k.


Prova. Dalla formula di Taylor,
1 00
J[q + h] − J[q] = J [q](h, h) + khk2 g(q, h),
2!
ove g(q, h) è una funzione infinitesima per khk → 0. Dunque,

1
α + g(q, h) khk2

J[q + h] − J[q] ≥
2
e per h piccolo (nella norma scelta k · k) e diverso da zero (cioè, la curva h(t) ≡ 0),
sicuramente ( 21 α + g(q, h)) > 0 e dunque

J[q + h] > J[q].

Osservazione 1. Nella norma della convergenza uniforme,

k · k∞ = sup |q(t)|,
t∈[t0 ,t1 ]

il funzionale J, nel caso meccanico, non è neppure continuo. Si pensi p.e. a q ∈ R, t0 = 0


2
e t1 = π, q0 = 0 = q1 , L = |q̇|2 − V (q) e si consideri la curva q(t) ≡ 0. Construiamo la
2
Per semplicità, in questa Sezione scriveremo talvolta per esempio q e non q(·).
3
Si noti che J 0 (q)h e J 00 [q](h, h) sono le derivate prime e seconde di Fréchet secondo la norma k · k.

135
sin(nt)
successione hn (t) = n compatibile con il problema al bordo scelto. Si vede subito che
vale4
lim khn k∞ = 0,
n→+∞
ciononostante
π
cos2 (nt)
  
sin(nt)
Z
J[hn ] − J[0] = −V dt + π V (0)
0 2 n
non tende a zero. Rt
Osservazione 2. Si può facilmente dimostrare che J = t01 L(q(t), q̇(t))dt è invece continuo
nella norma kq(·)kC 1 , in effetti, risulta C 2 nella norma C 1 per qualunque Lagrangiana C 2 .
Osservazione 3. Vedremo di seguito che per una conveniente applicazione della prece-
dente proposizione potremo scegliere la norma nello spazio di Sobolev W 1,2 , dove per W r,s
si intende lo spazio delle funzioni che assieme a tutte le derivate fino all’ordine r sono
in Ls . Più precisamente, Per W 1,2 si intende lo spazio funzionale che si ottiene conside-
rando il completamento
R t1 delle
R t1 funzioni C ∞ ([t0 , t1 ]; RN ) nella metrica indotta dalla norma:
kqkW 1,2 := t0 |q(t)| dt + t0 |q̇(t)| dt; si dimostra che vale l’immersione: W 1,2 ⊂ C 0 . Tale
2 2 2

spazio spesso lo si denota 1


R t1come H , ed Rè t1pure Hilbertiano, dotato del naturale prodotto
scalare: hf (·), g(·)iH 1 = t0 f (t)g(t)dt + t0 f˙(t)ġ(t)dt.
È stato solo recentemente mostrato che il funzionale J è C 2 in H 1 se e solo se per la
Lagrangiana in studio la restrizione q̇ 7→ L(t, q, q̇) è polinomiale al più di grado due5 –come
esattamente accade nel caso meccanico e geodetico!
Per generali Lagrangiane con q̇ 7→ L(t, q, q̇) convessa e a crescita quadratica all’infinito
possiamo solo aspettarci che J sia C 1,1 in H 1 , cioè C 1 con derivata prima Lipschitziana6 .

Di seguito, usando la Proposizione sopra discussa, pur rinviando alla Sezione 8.3 l’intro-
duzione del calcolo variazionale in H 1 , mostriamo delle locali (sia nell’ambiente funzionale,
sia nel tempo)
CondizioniR di minimo nel Calcolo delle Variazioni in H 1 (per il caso meccanico):
t
Sia J(q) = t01 [ 21 m|q̇(t)|2 − V (q(t))]dt. Valga 7

J 0 [q]h = 0 ∀h ∈ H01 ([t0 , t1 ], Rn )


Sotto l’ipotesi che l’intervallo [t0 , t1 ] sia convenientemente piccolo:
s  −1
t1 − t0 < 2m max (max|spec∇ V (q(t)) |) 2 ,
t∈[t0 ,t1 ]

4
ma non p.e. nella norma kq(·)kC 1 = kq(·)k∞ + kq̇(·)k∞ .
5
Si veda proposition 2.3 in Abbondandolo A., Schwarz M., A smooth pseudo-gradient for the Lagrangian
action functional, Adv. Nonlinear Stud. 9 (2009) 597-623.
6
Si veda p.e. in Mazzucchelli M., The Lagrangian Conley conjecture, Commentarii Mathematici Helvetici
86 (2011), no. 1, 189-246.
7
h ∈ H01 ([t0 , t1 ], Rn ) ⇐⇒ h ∈ H 1 ([t0 , t1 ], Rn ) e h(t0 ) = 0 = h(t1 ).

136
esiste un opportuna costante α > 0 tale che

d2
J 00 [q](h, h) = J[q + λh]|λ=0 ≥ αkhk2H 1 , ∀h ∈ H01 ,
dλ2
per cui q è un minimo locale 8 per J in H 1 .
Prova.
d2 d d
dλ2
J[q + λh]|λ=0 = dλ { dλ J[q + λh]}|λ=0

d
R t1
= dλ { t0 [m(q̇ + λḣ) · ḣ − ∇V (q + λh)] · h dt}|λ=0
R t1 R t1
= t0 m|ḣ|2 dt − t0 ∇2ij V (q)hi hj dt
R t1 R t1
≥ t0 m|ḣ(t)|2 dt − t0 max|spec∇2 V (q(t))| · |h(t)|2 dt,

d2
R t1 R t1
dλ2
J[q + λh]|λ=0 ≥ |h|2 dt, t0 m|ḣ|2 dt − c
(1) t0
Rt
ove c := maxt∈[t0 ,t1 ] (max|spec∇2 V (q(t))|). Allo scopo di stimare t01 |ḣ|2 dt relativamente a
R t1 2
t0 |h| dt richiamiamo la disuguaglianza di Cauchy-Schwarz:
Z b 2 Z b Z b
2
f gdt ≤ f dt g 2 dt.
a a a

Usando il fatto che h(t0 ) = 0, abbiamo che


Z t1 Z t1 3
X Z t1 3 Z
X t 2
2
|h(t)| dt = (hi (t))2 dt = i
ḣ (τ )dτ dt.
t0 t0 i=1 t0 i=1 t0

Stimiamo quest’ultimo membro con Cauchy-Schwarz,


3 Z
X t 2 3 Z
X t Z t 2 Z t
i i
1 · ḣ (τ )dτ ≤ dτ ḣ (τ ) dτ = (t − t0 ) |ḣ(τ )|2 dτ.
i=1 t0 i=1 t0 t0 t0

Dunque Z t1 Z t1 Z t 
2 2
|h(t)| dt ≤ (t − t0 ) |ḣ(τ )| dτ dt
t0 t0 t0
t1 t1 t1
1
Z Z Z
≤ (t − t0 )dt |ḣ(τ )|2 dτ = (t1 − t0 )2 |ḣ|2 dt.
t0 t0 2 t0
8
Non dimostreremo qui che J è due volte differenziabile secondo Fréchet, si rinvia alle considerazioni
e note appena svolte; useremo il fatto che in tal caso le derivate direzionali esistono e coincidono con le
derivate di Fréchet.

137
Abbiamo pertanto che
1
khk2L2 ≤ (t1 − t0 )2 kḣk2L2 . (2)
2
Otteniamo per ( 1):

d2
J 00 [q](h, h) = J[q + λh]|λ=0 ≥ mkḣk2L2 − ckhk2L2
dλ2
 
2m
≥ − c khk2L2 .
(t1 − t0 )2
q
Ora α1 := (t12m
−t0 )2
− c > 0 se e solo se t1 − t0 < 2m c . D’altra parte, ancora con ( 2), vale
pure la stima
 
00 1
J [q](h, h) ≥ mkḣk2L2
− ≥ m − c (t1 − t0 ) kḣk2L2
ckhk2L2 2
2
q
ove α2 := m − 21 c(t1 − t0 )2 > 0 se e solo se (come prima) t1 − t0 < 2m c . Infine otteniamo
una stima9 nella norma di Sobolev H 1 :
1 1
J 00 [q](h, h) ≥ min{α1 , α2 }(khk2L2 + kḣk2L2 ) = min{α1 , α2 }khk2H 1 = αkhk2H 1
2 2

Osservazione 4.
Il seguente esempio mostra che in ambiente infinito dimensionale il test ‘ingenuo’ del-
le derivate seconde sui punti critici, cioè, derivata seconda definita positiva (ma non
uniformemente), possa talvolta fallire.

Consideriamo lo spazio X = l2 (N, R) 3 ξ = (ξj )j=0,1,...,+∞ , con kξkl2 = ( 2 1/2 .


P
j∈N ξj ) Sia
f : X → R data da
+∞ +∞
X ξj2 X
f (ξ) = − ξj3 .
j+1
j=0 j=0

Le derivate di Fréchet prime e seconde sono date da


+∞ +∞
0
X ξj hj X
f (ξ)h = 2 −3 ξj2 hj ,
j+1
j=0 j=0

+∞ +∞
X hj kj X
f 00 (ξ)[h, k] = 2 −6 ξj hj kj .
j+1
j=0 j=0
2
9
Nota che α2 = α1 (t1 −t
2
0)
.

138
2ξj 2
f 0 (ξ)h = 0 : − 3ξj2 = 0, ξj ( − 3ξj ) = 0
j+1 j+1
2 1
ξj∗ = 0 oppure ξj∗∗ =
3j+1
4
0 = f (ξ ∗ ) < f (ξ ∗∗ ) = ζ(3)
27
In particolare
+∞
d2 X h2j
f 00 (0)[h, h] = f (λh)| λ=0 = 2 > 0,
dλ2 j+1
j=0

se h = (hj ) 6= 0. In ogni palla centrata in ξ ∗ = 0 e di raggio ρ ci sono tutti i vettori del


tipo rej , ove r ∈ (0, ρ] e ej = (0, ..., 0, 1, 0, ...) e si ha che, se j è abbastanza grande,

r2
f (rej ) = − r3 < 0
j+1

Dunque, benché ξ ∗ = 0 sia un punto critico per f con f 00 (0)[h, h] > 0, ξ ∗ = 0 non è minimo
locale.

8.3 Sinossi di Teoria Variazionale in H 1


Vediamo con qualche dettaglio cosa significa che una curva

q(·) ∈ Γqt00,t,q11 = q(·) ∈ H 1 ([t0 , t1 ], Rn ) : q(t0 ) = q0 , q(t1 ) = q1




rende stazionario il funzionale di Hamilton. Useremo le notazioni: Lq = ∂L


∂q e Lq̇ =
∂L
∂ q̇ .
Introduciamo inizialmente il seguente
Lemma di DuBois-Reymond Sia ϕ ∈ L2 ([t0 , t1 ], Rn ) e supponiamo che
Z t1
ϕ(t)ḣ(t)dt = 0 ∀h ∈ H01 ([t0 , t1 ], Rn )
t0

Allora, quasi ovunque,


ϕ(t) ≡ costante.

1
R t1
Prova. Valga la condizione integrale variazionale e definiamo µ := t1 −t0 t0 ϕ(t)dt ∈ R,
2 1
Rt
questo è possibile poiché ϕ ∈ L ⊂ L . Prendiamo h(t) := t0 (ϕ(s) − µ)ds e osserviamo
che questa scelta di h è effettivamente in H01 :

h(t0 ) = 0 = h(t1 ), ḣ = ϕ − µ ∈ L2

139
e Z t1 Z t  Z t 
||h||2L2 = (ϕ(s) − µ) ds · (ϕ(s) − µ) ds dt ≤
t0 t0 t0
Z t 2

≤ (t1 − t0 ) sup (ϕ(s) − µ)ds < +∞
t∈[t0 ,t1 ] t0

dato che ϕ ∈ L1 . Infine


Z t1 Z t1 Z t1
0= ϕ(t)ḣ(t)dt = ϕ(t)(ϕ(t) − µ)dt = (ϕ(t) − µ)2 dt,
t0 t0 t0

poiché ϕ − µ ∈ L2 ne segue che quasi ovunque ϕ(t) ≡ µ.

Proponiamo ora una versione del teorema variazionale fondamentale in tale nuovo ambiente
funzionale, l’analogo in H 1 del Principio di Hamilton sopra visto in C 2 .
Teorema - Principio Variazionale di Hamilton in H 1 : Supponiamo che la Lagran-
giana
L : Rn × Rn → R
sia tale che per il funzionale di Hamilton, ora definito nel seguente sotto-spazio affine di
H 1,
J : Γqt00,t,q11 = q(·) ∈ H 1 ([t0 , t1 ], Rn ) : q(t0 ) = q0 , q(t1 ) = q1 −→ R


valga la condizione variazionale


t1
d
Z
dJ(q)h = J(q + λh)|λ=0 = [Lq (q(t), q̇(t))h(t) + Lq̇ (q(t), q̇(t))ḣ(t)]dt = 0
dλ t0

∀h ∈ H01 ([t0 , t1 ], Rn ) = Γ0,0


t0 ,t1 . Se
Rt
(i) P (t) := t0 Lq (q(s), q̇(s))ds ∈ L2 ,
(ii) Lq̇ (q(t), q̇(t)) ∈ L2 ,
allora per quasi ogni t ∈ [t0 , t1 ]:

P − Lq̇ = cost. (3)

Osservazione Si noti che quest’ultima relazione ( 3) è precisamente la versione integrale


delle equazioni di Euler-Lagrange: se q ∈ C 2 , allora
d d
(P − Lq̇ ) = Lq − Lq̇ = 0.
dt dt
Prova. Z t1
0= [Lq (q(t), q̇(t))h(t) + Lq̇ (q(t), q̇(t))ḣ(t)]dt =
t0

140
Z t1
= P (t)h(t)|tt10 − (P − Lq̇ )ḣdt,
t0

il precedente Lemma ci conduce direttamente alla tesi.


Il caso meccanico In tal caso, le ipotesi sono facilmente soddisfatte: sia L = 12 |q̇|2 − U (q),
Lq̇ = q̇ e se q ∈ H 1 allora q̇ ∈ L2 . Se U : Rn → R è in C 1 , allora
Z t
P (t) = − ∇U (q(s))ds,
t0

è una funzione continua sull’insieme compatto [t0 , t1 ], pertanto P ∈ L2 .

8.4 Minimo Forte e Minimo Debole


Riconsideriamo l’insieme
R T tipico di curve del Calcolo delle Variazioni relative al funzionale
di Hamilton J[q(·)] = 0 L(q(t), q̇(t), t)dt,

Γ = q(·) ∈ W 1,2 ([0, T ]; RN ) = H 1 ([0, T ]; RN ) :



q(0) = q0 , q(T ) = qT
  R 1/2  R 1/2
1 T 1 T
||q(·)||H 1 := |q(t)|2 dt + |q̇(t)|2 dt




 T 0 T 0


 ||q(·)||C 1 := supt∈[0,T ] |q(t)| + supt∈[0,T ] |q̇(t)|,





 ||q(·)|| 0
C := supt∈[0,T ] |q(t)|.

La definizione di norma H 1 qui appena sopra assegnata appare diversa da quella introdotta
qualche pagina indietro: è un semplice esercizio mostrare che sono definizioni equivalenti10 .

Per ogni curva q(·) ∈ Γ ∩ C 1 si ha che

||q(·)||C 0 ≤ ||q(·)||C 1

e quindi la curva q(·) ∈ Γ ∩ C 1 tale che ||q(·)||C 1 ≤ r, cioè appartenente alla palla B1 (r) in
C 1 centrata in q = 0, è pure in B0 (r):

B1 (r) ⊂ B0 (r)

questo, com’è noto, significa che la topologia C 1 è più fine (o più forte) della topologia
C 0.
10
vedi p.e. Capitolo 9 di Brezis H., Analisi funzionale. Teoria e applicazioni: Matematica e fisica ‘testi’
ed.: 1986.

141
Nonostante questa nomenclatura,
i) se q ∗ (·) è tale che per qualche ε > 0:

J[q ∗ (·)] ≤ J[q(·)], ∀q(·) − q ∗ (·) ∈ B0 (ε) (?)

diremo che q ∗ (·) è un minimo forte,


ii) se q ∗ (·) è tale che per qualche ε > 0:

J[q ∗ (·)] ≤ J[q(·)], ∀q(·) − q ∗ (·) ∈ B1 (ε) (??)

diremo che q ∗ (·) è un minimo debole.


Osserviamo che se q ∗ (·) è un minimo forte, allora esso è pure un minimo debole:
ovviamente, discende da B1 (ε) ⊂ B0 (ε). Più precisamente, se ‘una certa proprietà’ vale
per ogni q(·) − q ∗ (·) ∈ B0 (ε), allora ‘la stessa proprietà’ vale per ogni q(·) − q ∗ (·) ∈ B1 (ε).

8.5 Moti spontanei e geodetiche su varietà


Sia S ⊂ R3 , dimS = 2, una superficie su cui vincoliamo senza attrito una particella di
massa m > 0,
S ,→ R3 , q = (q h )h=1,2 7→ x(q) ∈ R3 .
Supponiamo assenti le forze attive; ne segue che i moti dinamicamente possibili tra due
configurazioni q0 e q1 e nell’intervallo di tempo [t0 , t1 ] sono tutte e sole le curve che stazio-
narizzano il funzionale Z t1
J[q(·)] := T (q(t), q̇(t))dt,
t0
P3 P2 ∂xi ∂xi
ove T (q, q̇) = m
2 i=1
h k
h,k=1 ∂q h (q) ∂q k (q)q̇ q̇ .
Consideriamo ora un altro problema, di natura propriamente geometrica. Data la stessa
S ,→ R3 , i medesimi punti q0 e q1 e l’intervallo [t0 , t1 ], ora non interpretabile necessaria-
mente come “tempo”, consideriamo il funzionale, definito (come J) in

Γqt00,t,q11 = {q(·) ∈ C 2 ([t0 , t1 ]; RN ) : q(t0 ) = q0 , q(t1 ) = q1 },

ed individuante la lunghezza della curva q(·):

t1 t1 3 X2 2
dx ∂xi ∂xi
Z Z X X 1
h
l[q(·)] := | (q(t))|R3 dt = [ ( h
(q(t))q̇ )( k
(q(t))q̇ k )] 2 dt =
t0 dt t0 ∂q ∂q
i=1 h=1 k=1

t1
r
2
Z
= T (q(t), q̇(t))dt.
t0 m

142
Il problema geometrico è il seguente: determinare le curve che stazionarizzano il funzionale
lunghezza l[q(·)]. Diremo geodetiche le curve che risolvono tale problema. Che relazione
intercorre tra i due problemi variazionali? Iniziamo con un’indagine sulle equazioni di
Euler-Lagrange dei due problemi variazionali. Supporremo ovviamente q0 6= q1 e t0 < t1 .
Lemma 1 Se q(·) ∈ Γqt00,t,q11 risolve le equazioni di Lagrange con L = T , allora q(·) risolve
q
2
le equazioni di Lagrange con L = m T.
Prova. Lungo il moto q(·) la funzione L = T è costante —T è l’integrale dell’energia—, ed
inoltre, dato che q0 6= q1 , T > 0. Il lemma segue per verifica diretta.
q q
2 2
d ∂ m T ∂ mT
− =
dt ∂ q̇ i ∂q i

d 1 2 ∂T 1 2 ∂T 1 d ∂T ∂T
= ( q i
)− q i
=√ ( i
− i ) = 0.
dt 2 2 T m ∂ q̇ 2 m2
T m ∂q 2mT dt ∂ q̇ ∂q
m

Dunque, i moti spontanei (V = 0) su di una superficie liscia sono geodetiche.


q Ma
2
data una geodetica, intesa come risolvente le equazioni di Lagrange per L = m T , resta
associato ad essa qualche
q moto spontaneo? Indaghiamo sulla struttura delle equazioni di
2
Lagrange per L = mT.
q
2
Lemma 2 Se t 7→ q(t) risolve le equazioni di Lagrange per L = mT, allora, per ogni
arbitraria riparametrizzazione del tempo t = t(τ q
), > 0, t(·) ∈ t0
la curva τ →
7 q(t(τ )) C 2,
2
risolve ancora le equazioni di Lagrange per L = m T.
q
2
Prova. Ciò deriva dal fatto che m T è positivamente 1−omogenea in q̇: ∀λ ≥ 0,
q q
2 2
m T (q, λq̇) = λ m T (q, q̇).
R τ (t1 ) d
R τ (t1 ) d dt
(∗) l[q(t(·))] = τ (t0 ) L(q(t(τ )), dτ q(t(τ )))dτ = τ (t0 ) L(q(t(τ )), dt q(t)|t=t(τ ) ) dτ (τ )dτ =

t1
d
Z
= L(q(t), q(t))dt = l[q(·)].
t0 dt
Benché il funzionale lunghezza in (∗) sia ora definito in Γqτ0(t,q01),τ (t1 ) 6= Γqt00,t,q11 (il supporto
delle due famiglie di curve è però lo stesso), le equazioni di Lagrange per l[·] in (∗) sono le
stesse di quelle associate all’originale l[·].
Osservazione: Potevamo facilmente restare nella stessa classe Γqt00,t,q11 prendendo non
arbitrari τ (t), ma solo le riparametrizzazioni date dai diffeomorfismi di [t0 , t1 ] in sé.

143
q
2
In effetti, se t 7→ q(t) risolve le equazioni di Lagrange per L = mT con

q(t0 ) = q0 , q̇(t0 ) = q̇0 ,

possiamo trovare infinite riparametrizzazioni t = t(τ ) con t(τ0 ) = t0 e t0 (τ0 ) = 1, cosicché

d
q(t(τ0 )) = q0 , q(t(τ ))|τ =τ0 = q̇0 ,

cioè τ 7→ q(t(τ )) risolve lo stesso problema di Cauchy. Tale
q degenerazione del problema di
2
Cauchy per le equazioni di Lagrange associate a L = m T era però annunciata: infatti
tali equazioni non si lasciano porre in forma normale. Infatti:
X ∂L
L(q, λq̇) = λL(q, q̇) implica (t. di Euler sulle f. omogenee) : L(q, q̇) = q̇ i ,
∂ q̇ i
i

∂L ∂L X i ∂ 2 L
= + q̇ ,
∂ q̇ j ∂ q̇ j ∂ q̇ j ∂ q̇ i
i

onde
∂2L
det = 0.
∂ q̇ j ∂ q̇ i
Tale caduta dell’unicità nel problema di Cauchy, legata alla non esistenza della forma nor-
male, è la sola degenerazione consentita. Non è possibile trovare soluzioni di un medesimo
problemaqdi Cauchy q(t0 ) = q0 , q̇(t0 ) = q̇0 con supporti (immagini) diversi, biforcantesi,
2
per L = mT. Per chiarire ciò, mostriamo preliminarmente il seguente
q
2
Lemma 3 Per ogni t 7→ q(t) risolvente le equazioni di Lagrange per L = m T esiste
q
2
sempre qualche riparametrizzazione t(τ ) che rende L = m T costante lungo la nuova
curva τ 7→ q(t(τ )). q
2
Prova. Sia [t0 , t1 ] 3 t 7→ q(t) risolvente le equazioni di Lagrange per L = m T , cerchiamo
t(τ ) tale che
r
d 2
L(q(t(τ )), q(t(τ ))) = T (q0 , q̇0 ) : cost., t(τ0 ) = t0 ,
dτ m

ove q(t0 ) = q0 , dq
dt (t0 ) = q̇0 . Si ottiene una semplice equazione differenziale del primo ordine
in R per t(τ ),
q
2
dt m T (q0 , q̇0 )
(τ ) = d
(= X(t(τ ))), t(τ0 ) = t0 .
dτ L(q(t(τ )), dt q(t)|t=t(τ ) )

144
dt
Si noti che risulta: dτ (τ0 ) = 1.
A questo punto, con un argomento analogo a quello del lemma 1 (a ritroso), è faci-
le vedere che τ 7→ q(t(τ )) risolve Euler-Lagrange per L = T e per tali equazioni vale il
teorema di esistenza e unicità
q per il problema di Cauchy. Se esistesse un’altra soluzione
2
delle equazioni per L = m T del medesimo problema di Cauchy ma con supporto di-
verso, allora, procedendo ancora con una riparametrizzazione come quella del lemma 3,
giungeremmo a due distinte soluzioni di uno stesso problema di Cauchy per le equazioni di
Euler-Lagrange relative a L = T : assurdo.Qualche commento per generalizzare. Abbiamo

visto che il problema di “rettificazione” delle curve su superfici 2-dimensionali S ha fatto


ereditare in maniera naturale una metrica Riemanniana g su S dalla metrica euclidea di
R3 .
g : S −→ L(T S ×S T S, R)
 
q = (q 1 , q 2 ) 7−→ g(q) = ghk (q) ,
h,k=1,2
cioè, non appena fissiamo q ∈ S, g(q) è un’applicazione bi-lineare definita positiva
dalle coppie di vettori dello spazio tangente a S nel punto q, Tq S, e a valori in R, un
‘prodotto scalare’ dunque, tale che il quadrato della ‘norma’ (indotta da g) di un vettore
v = (v 1 , v 2 ) ∈ Tq S è dato da:
2
X
||v||2q := ghk (q)v h v k .
h,k=1

Perché diciamo che tale 3


 mappa g è una metrica? In R la metrica euclidea è data dalla
matrice identità I = δij e la rettificazione (il calcolo della lunghezza) di una curva
i,j=1,2,3
[a, b] 3 t 7→ x(t) in R3 è data da
v
Z bu 3
uX
lI (x(·)) = t δij ẋi (t)ẋj (t) dt,
a i,j=1

invece, la rettificazione di una curva [a, b] 3 t 7→ q h (t), h = 1, 2, su di una superficie dotata


di una metrica Riemanniana, è data da
v
Z bu 2
uX 
lg (q(·)) = t ghk q(t) q̇ h (t)q̇ k (t) dt.
a h,k=1

Queste formule giustificano la scrittura usuale di metrica Riemanniana:


2
X
dl2 = ghk (q)dq h dq k .
h,k=1

145
ESEMPI:

le geodetiche sul
1) piano euclideo: ds2 = dx2 + dy 2 ,
2) sulla sfera,
dx2 +dy 2
3) sul piano di Lobačevskij-Klein-Poincaré: ds2 = y2
(y > 0).

8.6 Metrica di Jacobi. Formulazione non variazionale del


Principio di Maupertuis
Il seguente teorema, che in generale nei manuali classici si ritrova in forma variazionale
—tranne nel libro di Godbillon “Géométrie Différentielle et Mécanique Analytique” e nel
manuale di Abraham-Marsden “Foundations of Mechanics”, il lettore li consulti, sono molto
belli—, permette di utilizzare la (ben sviluppata e trattata nella letteratura matematica)
teoria delle geodetiche per i sistemi meccanici vincolati con energia potenziale non banale.
Più precisamente, tale teoria permette, come vedremo, di ricondurre la determinazione dei
supporti delle curve dinamicamente possibili per sistemi meccanici conservativi allo studio
di opportuni problemi geodetici.
Teorema La curva t 7→ q(t) sia un moto dinamicamente possibile per il sistema di La-
grangiana
1X
L(q, q̇) = aij (q)q̇ i q̇ j − V (q)
2
i,j

e appartenente all’ipersuperficie di energia costante


1X
E(q, q̇) = aij (q)q̇ i q̇ j + V (q) = e.
2
i,j

Allora esiste una riparametrizzazione del tempo τ = τ (t), τ 0 > 0, tale che la curva τ 7→
q(t(τ )) sia un moto dinamicamente possibile per il sistema di Lagrangiana
1X  
L(q, q̇) = [e − V (q)]aij (q)q̇ i q̇ j , [e − V (q)]aij (q) : metrica di Jacobi
2
i,j

e appartenente all’ipersuperficie di energia costante

E(q, q̇) = L(q, q̇) = 1.

Osservazione. Si noti che nell’ambiente Lagrangiano, in T Q, gli insiemi di livello dei due
rispettivi integrali di Jacobi E = e e E = 1 sono diversi, mentre, operate le due distinte

146
trasformazioni di Legendre generate rispettivamente da L e L, gli insiemi di livello dei due
Hamiltoniani H e H, H = e e H = 1, rappresentano in T ∗ Q lo stesso luogo geometrico.

Prova. Consideriamo la formulazione Hamiltoniana per L,


1 X −1
H(q, p) = aij (q)pi pj + V (q),
2
i,j

(nel seguito, come spesso si usa, considereremo sottintesa la sommatoria sugli indici ripe-
tuti)
∂H
q̇ k = = a−1
kj (q)pj ,
∂pk

(∗)
−1
∂H 1 ∂aij ∂V
ṗk = − k
=− k
(q)pi pj − k (q).
∂q 2 ∂q ∂q
D’altra parte, la funzione Hamiltoniana associata a L è:
−1
1 aij (q)
H= pi pj .
2 e − V (q)
Il sistema canonico generato da H è
∂H 1
q̇ k = = a−1 (q)pj ,
∂pk e − V (q) kj

(∗∗)
−1 1 −1
∂H 1 1 ∂aij 2 aij (q)pi pj ∂V
ṗk = − k
= {− k
(q)p i p j − [ ] (q)}.
∂q e − V (q) 2 ∂q e − V (q) ∂q k
Il campo vettoriale generante l’equazione differenziale (∗) è proporzionale al campo gene-
rante l’equazione differenziale (∗∗) con funzione scalare di proporzionalità
1
ϕ(q, p) = > 0,
e − V (q)
se ci limitiamo a confrontare le soluzioni di (∗) che stanno sull’ipersuperficie H = e, cioè
1 −1
2 aij (q)pi pj + V (q) = e, con le soluzioni di (∗∗) che stanno sull’ipersuperficie H = 1. In
tal caso la funzione [...] in (∗∗)2 assume sempre il valore 1 lungo le soluzioni.
La tesi è raggiunta ricordando che le soluzioni di ẋ = X(x) si ottengono tutte e sole da
quelle di ẋ = ϕ(x)X(x), ove ϕ : Rm → R∗+ , mediante riparametrizzazione del tempo.

147
8.7 Riduzione Isoenergetica
Il precedente teorema sulla metrica di Jacobi può essere pensato come un caso particolare
del seguente teorema (Aurel Wintner, The analytical foundations of celestial mechanics,
1941, Sect.180). Teorema. Consideriamo una generica funzione Hamiltoniana

H1 : T ∗ Q −→ R,

una generica funzione positiva f : T ∗ Q −→ R, f (q, p) > 0, e un generico numero reale e1


appartente al codominio di H1 .
Siano in T ∗ Q definiti i due seguenti campi vettoriali Hamiltoniani e ristretti alle due se-
guenti superfici di livello delle due rispettive Hamiltoniane H1 e H2 , alle quali essi risultano
ovviamente tangenti:

XH1 := E∇H1 , su H1 = e1 ,

XH2 := E∇H2 , ove H2 := (H1 − e1 )f, su H2 = 0.


Allora le curve integrali di XH2 su H2 = 0 si ottengono tutte e sole mediante riparametriz-
zazione temporale dalle curve integrali di XH1 su H1 = e1 .

Prova. La dimostrazione consiste nell’accertare i seguenti due fatti:


i) {H1 = e1 } ≡ {H2 = 0}: ovvio,
ii) i due campi vettoriali XH1 e XH2 , entrambi tangenti all’ipersuperficie appena de-
scritta, risultano paralleli qualora ristretti su tale ipersuperficie S := {H1 = e1 } ≡ {H2 =
0}:

XH2 |S = E∇H2 |S = E∇[(H1 − e1 )f ]|S = f E∇H1 |S + (H1 − e1 )E∇f |S = f E∇H1 |S .

Si conclude quindi come nel precedente teorema sulla metrica di Jacobi.

Esempio (Maupertuis-Jacobi). Sia K = 12 (a−1 (q)p, p) un’energia cinetica in forma Hamilto-


niana, V un’energia potenziale, e un numero reale tale che il luogo {q ∈ Q : e − V > 0}
non sia vuoto. Definiamo
K
H1 := , su H1 = e1 = 1,
e−V
e, per f = e − V ,
K
H2 := (H1 − e1 )f = ( − 1)(e − V ) = K + V − e, su H2 = 0,
e−V
L’applicazione del teorema della riduzione isoenergetica porta alla conclusione del teorema
della metrica di Jacobi.

148
8.8 Problema di Plateau dell’area minima (o delle bolle di
sapone).
Consideriamo due circonferenze di ugual raggio R e poste co-assialmente (asse x) a distanza
2`. Le equazioni dei due cerchi siano:

y 2 + z 2 = R2 , x ≡ `, y 2 + z 2 = R2 , x ≡ −`

La situazione fenomenologica è la seguente: se si prendono due cerchi di ferro dello stesso


raggio R come indicato, dopo averli immersi in acqua saponata si forma una membrana che
è una superficie di rotazione generata da arco di catenaria, e si osserva che allontanandoli
la membrana ad una distanza critica scompare, formando invece due superfici piatte sui
cerchi stessi.
Scriviamo il generico punto OP (x, y, z) sulla superfici in studio in coordinate cilindriche:

x = x

OP (x, ϕ) = y = r(x) cos ϕ

z = r(x) sin ϕ

La nostra incognita è dunque r = r(x),

r(−`) = R, r(`) = R

L’elemento di misura dell’area è:



x̂ ŷ ẑ
∂OP ∂OP 0 0

dA =
∧ dxdϕ = 1 r (x) cos ϕ r (x) sin ϕ dxdϕ =

∂x ∂ϕ
0 −r(x) sin ϕ r(x) cos ϕ
q p
= r(x)2 r0 (x)2 + r(x)2 cos2 ϕ + r(x)2 sin2 ϕ dxdϕ = r(x)2 r0 (x)2 + r(x)2 dxdϕ
p
dA = r(x) r0 (x)2 + 1 dxdϕ
Cerchiamo l’area minimizzante, in realtà qui di seguito studieremo soltanto le superfici
critiche, tra i due bordi:
Z 2π Z l p Z x=` p
A= 0 2
r(x) r (x) + 1 dxdϕ = 2π r(x) r0 (x)2 + 1 dx
0 −l x=−`

Abbiamo dunque un problema variazionale con Lagrangiana (notare che x ha il ruolo che
in dinamica ha il tempo t): p
L(r, r0 , x) = r r02 + 1

149
Sussiste l’integrale di Jacobi:
∂L ∂L
= 0 =⇒ E = 0 r0 − L è integrale primo.
∂x ∂r
2r02 p p
E =r √ − r r02 + 1 = c , rr02 − r(r02 + 1) = c r02 + 1,
2 r02 + 1
p
scrivendo − c invece di c : r = c r02 + 1
Si nota che r(x) ≡ R è una soluzione, è la superficie cilindrica e vale per c = R.
Risolviamo l’equazione differenziale del primo ordine per separazione di variabili:

sgn(r0 )d rc sgn(r0 )d rc
Z Z
c q  = dx =⇒ c q  = dx
r 2 r 2
c − 1 c − 1
r
c sgn(r0 ) cosh−1 =x+k
c
 
r x+k
= cosh sgn(r0 )
c c
Possiamo subito trascurare il termine sgn(r0 ) data la parità della funzione cosh, inoltre:
 
R `+k
r(`) = R : = cosh
c c
 
R −` + k
r(−`) = R : = cosh
c c
−`+k −`+k
La parità di cosh forza `+k
c =− c oppure `+k
c = c : nel primo caso si deduce k = 0,
il secondo caso è assurdo (` = 0).
Infine:
r x
= cosh
c c
e dunque dobbiamo calibrare R, `, c tali che c = cosh c` sia significante; poniamo ξ := c` ,
R


R
ξ = cosh ξ
`

Confrontando i grafici si vede che:


R
• ` grande, cioè ` piccolo: la retta interseca in due punti il grafico di cosh, ci sono due
soluzioni;

• se la retta è tangente al grafico di cosh: esiste un’unica soluzione;

150
R
• ` piccolo, cioè ` grande, cerchi molto distanti tra loro: i due grafici non si intersecano,
non ci sono soluzioni.

Nel primo caso, si può verificare che la soluzione meno vicina all’asse è un minimo locale
ed è l’unica stabile, si veda p.e. a p. 178 del volume: S. Hildebrandt, A. Tromba, “The
parsimonious universe. Shape and form in the natural world.” Copernicus, New York,
1996. xiv+330 pp. (o a p. 164 dell’edizione italiana). La distanza critica del secondo caso
è d∗ = 2`∗ = 1, 325487 R; quando i due cerchi sono tra loro ad una distanza maggiore di
d∗ , compaiono come superfici critiche le due superfici (piatte) dei due cerchi.

8.9 Problema inverso nel Calcolo delle Variazioni: Teorema


di Volterra-Vainberg
Sia B uno spazio vettoriale di funzioni (non necessariamente normato) e sia

N : B −→ B

q(·) 7→ N [q(·)]
un operatore non lineare. Vogliamo indagare sull’eventuale struttura variazionale dell’equa-
zione:
N [q(·)] = 0 & cond. iniziali e/o cond. al bordo.

151
Sia Γ un sottoinsieme di B tale che se q(·) ∈ Γ, allora le condizioni iniziali e/o al bordo
sono automaticamente soddisfatte. Si pensi per esempio a

B = C ∞ ([t0 , t1 ]; Rn ), Γ = Γqt00tq11 = {q(·) ∈ C ∞ ([t0 , t1 ]; Rn ) : q(t0 ) = q0 , q(t1 ) = q1 }.

In B introduciamo un prodotto scalare h·, ·i,

h·, ·i : B × B −→ R,

proseguendo con il precedente esempio,

h·, ·i : C ∞ ([t0 , t1 ]; Rn ) × C ∞ ([t0 , t1 ]; Rn ) −→ R,


Z t1
(q(·), p(·)) 7→ hq(·), p(·)i = q(t) · p(t)dt.
t0

Ipotesi:
(i) L’operatore N sia Gâteaux-differenziabile in ogni q(·) ∈ Γ e per ogni direzione h(·)
appartenente allo spazio tangente Tq(·) Γ,

d
dN [q(·)]h(·) := N [q(·) + λh(·)]|λ=0 .

(ii) Gli spazi tangenti Tq(·) Γ siano tutti identificabili con un medesimo spazio vettoriale
V detto spazio direttore, tale cioè che, scelto un arbitrario elemento q̄(·) di Γ, si abbia

Γ = q̄(·) + V.

Ancora continuando il precedente esempio, si nota che Tq(·) Γqt00tq11 = Γ00 t0 t1 che è uno
spazio vettoriale, come ci dovevamo aspettare.
Supporremo infine che, per la scelta operata di Γ e di h·, ·i, sussista il “Lemma fonda-
mentale del Calcolo delle Variazioni”:

∀q(·) ∈ Γ : hf (·), h(·)i = 0, ∀h(·) ∈ Tq Γ ⇐⇒ f (·) = 0.

Il seguente teorema di Volterra, che compare in

V. Volterra, Leçons sue les Fonctions de Ligne, Gauthier-Villars, Paris, 1913,


fu in tempi relativamente recenti “riscoperto” da Vainberg,
M. M. Vainberg, Variational Methods for the Study of Nonlinear Operators, Holden-Day,
San Francisco, 1964.

152
Teorema Stanti le sopra elencate ipotesi su Γ, N, h·, ·i, supponiamo che

hdN [q(·)]h(·), k(·)i = hdN [q(·)]k(·), h(·)i, ∀q(·) ∈ Γ, ∀h(·), k(·) ∈ Tq(·) Γ,

cioè, il differenziale di Gâteaux di N sia simmetrico. Allora e solo allora l’equazione

N [q(·)] = 0, q(·) ∈ Γ, (∗)

ammette formulazione variazionale, cioè le soluzioni di (*) sono tutti e soli i punti stazio-
nari del funzionale
J : Γ −→ R,
Z λ=1
q(·) 7→ J[q(·)] = hN [q̄(·) + λ(q(·) − q̄(·))], q(·) − q̄(·)i dλ,
λ=0
cioè:
dJ[q(·)]h(·) = 0, q(·) ∈ Γ, ∀h(·) ∈ Tq(·) Γ (∗∗)
ove q̄(·) è un arbitrario prefissato elemento di Γ.

Prova. Calcoliamo, scrivendo semplicemente q invece di q(·),


Z λ=1 Z λ=1
dJ[q]h = hdN [q̄ + λ(q − q̄)]λh, q − q̄i dλ + hN [q̄ + λ(q − q̄)], hi dλ,
λ=0 λ=0

usiamo la condizione di simmetria di dN ,


Z λ=1 Z λ=1
dJ[q]h = hdN [q̄ + λ(q − q̄)](q − q̄), λhi dλ + hN [q̄ + λ(q − q̄)], hi dλ =
λ=0 λ=0

λ=1
d
Z
= ( N [q̄ + λ(q − q̄)], λhi + hN [q̄ + λ(q − q̄)], hi) dλ =
λ=0 dλ
= hN [q̄ + λ(q − q̄)], λhi|λ=1
λ=0 = hN [q], hi.

Si conclude con il Lemma fondamentale del Calcolo delle Variazioni.

Riprendendo l’esempio in corso, sia

N [q] = A(q) − q̈,

da cui
d
{dN [q]h}i = (Ai (q + λh) − q̈i − λḧi )|λ=0 =

= Ai,j (q)hj − ḧi .

153
Allora la condizione che dN sia simmetrico (auto-aggiunto) risulta
Z t1 Z t1
[Ai,j (q(t))hj (t) − ḧi (t)]ki (t) dt = [Ai,j (q(t))kj (t) − k̈i ]hi (t) dt,
t0 t0
Z t1 Z t1
Ai,j (q(t))hj (t)ki (t)dt − ḣ · k|tt10 + ḣ · k̇ dt =
t0 t0
Z t1 Z t1
= Ai,j (q(t))kj (t)hi (t)dt − k̇ · h|tt10 + k̇ · ḣ dt,
t0 t0

ritroviamo la ben nota condizione di “chiusura” della 1-forma lavoro Ai (q)dqi ,

Ai,j = Aj,i .

Dunque (nei semplicemente connessi): A = −∇q V . Calcoliamone infine il funzionale.


Z λ=1
J= hN [q̄(·) + λ(q(·) − q̄(·))], q(·) − q̄(·)i dλ =
λ=0
Z λ=1 Z t1
= { [A(q̄(t) + λ(q(t) − q̄(t))) − q̄¨(t) − λ(q̈(t) − q̄¨(t))] · (q(t) − q̄(t)) dt}dλ =
λ=0 t0
Z λ=1 Z t1
= { [−∇q V (q̄(t) + λ(q(t) − q̄(t))) − q̄¨(t) − λ(q̈(t) − q̄¨(t))] · (q(t) − q̄(t)) dt}dλ =
λ=0 t0
t1 λ=1
d
Z Z
= [−V (q̄(t) + λ(q(t) − q̄(t)))]dλ dt−
t0 λ=0 dλ
Z λ=1
− ˙ + λ(q̇(t) − q̄(t))
[q̄(t) ˙ · (q(t) − q̄(t))]|tt10 dλ+
λ=0
Z t1 Z λ=1
+ ˙ + λ(q̇(t) − q̄(t))]
[q̄(t) ˙ ˙
· (q̇(t) − q̄(t))dλdt =
t0 λ=0
t1 t1 λ=1
1 d
Z Z Z
˙ + λ(q̇(t) − q̄(t))|
˙ 2
= [−V (q(t)) + V (q̄(t))] dt + |q̄(t) dλdt =
t0 t0 λ=0 2 dλ
t1
1
Z
[ |q̇(t)|2 − V (q(t))] dt + cost.
=
t0 2
——————
Cosa succede per N [q] = A(q, q̇) − q̈ ?
——————
Interessanti applicazioni di tale teorema in teoria dei campi sono realizzate per esempio in:
E. Tonti, Acad. R. Belg. Bull.Classe de Sci.55, 262-278 (1969).
F. Bampi, A. Morro, J. Math.Phys. 23, 2312-2321 (1982).

154
Capitolo 9

Meccanica di Hamilton

Le motivazioni per lo studio della formulazione Hamiltoniana della Meccanica Analitica sono apparentemente dispa-
rate e disgiunte: (i) gli studiosi della teoria delle perturbazioni, gli specialisti della meccanica celeste, fin da Poincaré
e Weierstrass, riconoscono che l’ambiente Hamiltoniano è ben più ricco di quello Lagrangiano ed in esso si edifica la
cosiddetta teoria delle Trasformazioni Canoniche o Simplettiche, pilastro portante per quelle ricerche, d’altra parte
(ii) i teorici delle Equazioni alle Derivate Parziali (PDE) individuano nell’ambiente Hamiltoniano l’habitat globa-
le e naturale per le formulazioni variazionali di molte equazioni non lineari, le equazioni di Hamilton-Jacobi, che
incredibilmente emergono in contesti assolutamente lontani dalla meccanica analitica, quali per esempio, la teoria
della propagazione ondosa dei corpi elastici continui, infine (iii) la Meccanica Quantistica: è la moderna teoria della
tecnologia avanzata, delle ‘nano-tecnologie’ per esempio. Sebbene della Meccanica Classica essa rappresenti un’evo-
luzione rivoluzionaria –molto più radicale della stessa T. della Relatività– essa poggia interamente sulla pre-esistente
descrizione Hamiltoniana classica del sistema fisico in studio. Non sappiamo quale sia la motivazione più profonda,
la citazione di Schrödinger in copertina a queste dispense certamente mette in risalto questi ultimi due aspetti.

9.1 Introduzione

La meccanica Lagrangiana è una particolare teoria di sistemi dinamici —di interesse fisico,
ma non solo— del secondo ordine su di una varietà vincolare, Q. L’ambiente naturale
per l’evoluzione al primo ordine in tale teoria è il fibrato tangente T Q, anch’esso dotato
di struttura di varietà differenziale. Alcuni risultati classici della meccanica Lagrangiana
—per esempio, la proprietà di invarianza della struttura delle equazioni di Lagrange per
cambi di carte in Q; il teorema di Noether— mettono tuttavia in evidenza che le proprietà
trasformazionali naturali di tale teoria sono legate alla struttura di varietà di Q, e non alla
completa struttura differenziale di T Q. Più precisamente, di T Q si usa —per gli esempi
sopra citati— la sola struttura di ‘atlante fibrato’; in tale atlante fibrato per T Q, ereditato

155
da quello di Q, le mappe di transizione (cambio di carte) si esprimono cosı̀:

∂ q̃ i
q̃ i = q̃ i (q), ṽ i = (q)v j .
∂q j

L’utilità di un’indagine accurata degli aspetti dei sistemi dinamici meccanici legati alle
trasformazioni (di coordinate) è ben esemplificata nella teoria delle Piccole Oscillazioni dei
sistemi Lagrangiani: la risoluzione delle equazioni linearizzate procede attraverso l’indivi-
duazione di opportune successive trasformazioni (lineari, in quel caso) di coordinate in Q.
Anche in quest’ultimo esempio sono utilizzate solo proprietà differenziali (carte) di Q.
Vogliamo costruire una meccanica del primo ordine, equivalente alla meccanica La-
grangiana, adeguata all’utilizzo effettivo, completo, delle proprietà differenziali e di tra-
sformazione (o di coniugazione) dell’ambiente in cui evolve, ambiente che naturalmente è
di dimensione doppia a quella di Q. Vedremo che tale nuovo ambiente è il fibrato cotan-
gente T ∗ Q; la nuova meccanica è detta Hamiltoniana, e la teoria di trasformazioni utile
per la ricerca delle soluzioni, o, più realisticamente, utile al loro studio qualitativo, prende
il nome di teoria delle trasformazioni canoniche o simplettiche.

9.2 Fibrato cotangente o spazio delle fasi


Data una varietà vincolare Q e un suo atlante si dimostra che l’unione di tutti i suoi piani
tangenti è una varietà che è detta fibrato tangente T Q, ha dimensione doppia di Q, e
rappresenta lo spazio degli atti di moto (configurazione e velocità) consentiti dal vincolo.
La dimostrazione procede nel seguente modo: mediante l’atlante di Q si costruisce un’a-
tlante per T Q, detto atlante fibrato, utilizzando le formule sopra scritte nell’introduzione.
Notiamo che la legge di trasformazione delle velocità è del tutto naturale. Sia t 7→ q i (t) la
rappresentazione di una curva che in t = 0 passa per un punto P di Q, che in quelle stesse
d i
coordinate si rappresenta con una N -upla reale q0 , cioè q(0) = q0 , e sia dunque v i = dt q (0)
la rappresentazione del vettore tangente alla curva in P, pertanto appartenente allo spazio
tangente TP Q. Consideriamo il cambio di coordinate q̃ i = q̃ i (q). La stessa curva è ora
rappresentata da t 7→ q̃ i (t) = q̃ i (q(t)), e lo stesso vettore tangente è ora rappresentato
d i ∂ q̃ i ∂ q̃
da ṽ i = dt q̃ (0) = ∂q j
j (q0 )v . Indicando con J := ∂q la matrice Jacobiana, sinteticamente
scriviamo:
ṽ = Jv.

Usualmente si denotano con ∂q i
, i = 1, ..., N, i vettori tangenti coordinati ad una carta
∂ d
di Q: ∂q i
=dt γ(0), ove γ(t) := (q 1 , q 2 , ..., q i−1 , q i
+ t, q i+1 , ..., q N ). Accanto allo spazio
vettoriale tangente TP Q consideriamo il suo duale spazio di forme lineari TP∗ Q e denotiamo
con dq i , i = 1, ..., N la base di TP∗ Q duale alla base ∂q∂ i , dq i ( ∂q∂ j ) = δji .

156
Le forze generalizzate fi , cioè le componenti Lagrangiane della sollecitazione, sono
tipici esempi di forme: il lavoro delle forze attive associate alle componenti fi è dato da
dL = fi dq i .
Riassumendo, scelta una carta locale per Q, un generico vettore si rappresenta con
v = v i ∂q∂ i , mentre una generica forma lineare è data da θ = Aj dq j , e l’applicazione di
θ ∈ TP∗ Q su v ∈ TP Q è data da

θ(v) = hA, vi = Ai v i .

Consideriamo l’unione insiemistica T ∗ Q := ∪P∈Q TP∗ Q. Come per T Q, si dimostra che


T ∗Q è una varietà introducendo un atlante fibrato ereditato da un atlante per Q. Come si
trasformano le rappresentazioni delle forme? La risposta ha un profondo significato fisico
e geometrico: le (rappresentazioni delle) forme si trasformano in modo che la valutazio-
ne sui vettori (il lavoro) sia scalare invariante, cioè indipendente (come dev’essere) dalla
rappresentazione locale. Dunque,

θ(v) = hÃ, ṽi = hÃ, Jvi = hJ T Ã, vi = hA, vi,

per ogni v, pertanto


à = J −T A.
Analogamente ai campi di vettori, si definiscono campi di forme lineari, che comu-
nemente si dicono forme differenziali: Q 3 q 7→ (q, A(q)) ∈ T ∗ Q. Esempio: cam-
po di forze generalizzate (o Componenti Lagrangiane della Sollecitazione) conservative,

Q 3 q 7→ (q, − ∂q V (q)) ∈ T ∗ Q; in questo caso tale forma differenziale è esatta, e −V è la
funzione generatrice.

9.3 Trasformazione di Legendre


Sia assegnata una funzione Lagrangiana

L : T Q × R → R, (q, q̇, t) 7→ L(q, q̇, t),

e definiamo le seguenti funzioni


∂L
pi = pi (q, q̇, t) = (q, q̇, t).
∂ q̇ i
Notiamo che tali funzioni pi , definite come componenti del differenziale di L rispetto al-
le q̇, si atteggiano in maniera naturale ad essere interpretate quali componenti di forme
differenziali.
Supponiamo che, per ogni fissata coppia (q, t) ∈ Q × R, la mappa q̇ 7→ p sia, almeno
localmente, invertibile; quest’ultima richiesta è senz’altro soddisfatta se per esempio vale la

157
condizione algebrica del teorema del Dini (le funzioni in studio sono C ∞ ), rk ( ∂p
∂ q̇ ) = max =
N:
∂2L
det i j (q, q̇, t) 6= 0
∂ q̇ ∂ q̇
Indicheremo con q̇ i = S i (q, p, t) tale inversa. Definiamo ora la trasformazione di Legendre:

T Q × R −→ T ∗ Q × R

(q, q̇, t) 7−→ (q, p(q, q̇, t), t),


la quale, nelle ipotesi di lavoro scelte, stabilisce un diffeomorfismo (almeno locale) tra T Q
e T ∗ Q.

9.4 Globalizzazione della trasformazione di Legendre


Indagheremo ora su qualche ipotesi atte a globalizzare la costruzione locale ora stabilita. Per
semplicità, sia Q = RN . Premettiamo il seguente generale teorema fortemente interessante
anche al di fuori del contesto in cui stiamo lavorando, poiché risulta essere il più semplice
(dal punto di vista della dimostrazione) teorema di invertibilità globale.
Teorema (vedi per es. a pag. 137 di M. Berger e M. Berger, Perspectives in nonlinearity,
ed: W. A. Benjamin, 1968) Sia Ω un aperto convesso di RN e sia f ∈ C 1 (Ω; RN ). Suppo-
niamo che la (parte simmetrica della) matrice Jacobiana di f sia, per ogni x ∈ Ω, definita
positiva,
∂fi
(x)λi λj > 0, ∀λ 6= 0.
∂xj
Allora f è iniettiva.
Prova. Dato che, evidentemente, det(∇f ) 6= 0, f è sicuramente localmente invertibile: il
fatto che sia, inoltre, un diffeomorfismo con l’immagine sarà garantito dalle sopra enunciate
ipotesi di convessità. Dobbiamo dunque mostrare che comunque scegliamo a, b ∈ Ω, a 6= b,
allora f (a) 6= f (b). Sia Φ : [0, 1] 3 t 7→ Φ(t) ∈ R cosı̀ definita:

Φ(t) = f (tb + (1 − t)a) · (b − a).

Osserviamo che Φ è ben definita data la struttura convessa di Ω. Si vede che

Φ(0) = f (a) · (b − a), Φ(1) = f (b) · (b − a).

Per raggiungere la tesi ci basta mostrare che Φ(0) 6= Φ(1): in tal caso allora f (a) 6= f (b).
Calcoliamo Φ̇(t):
∂fi
Φ̇(t) = (tb + (1 − t)a)(bi − ai )(bj − aj );
∂xj
dall’ipotesi sullo Jacobiano di f , Φ̇(t) > 0, ∀t ∈ [0, 1], ed il teorema segue.

158
L’applicazione del teorema funziona nel seguente modo: per ogni fissati (q, t) ∈ Q × R
si identifica f con la mappa q̇ 7→ p; se ora per ogni q̇ ∈ RN

∂2L
(q, q̇, t)λi λj > 0, ∀λ 6= 0,
∂ q̇ i ∂ q̇ j
allora ne segue che la trasformazione di Legendre è globale. In effetti, la trasformazione è
solo iniettiva con l’ipotesi appena introdotta.
Ricordiamo che almeno nel caso Lagrangiano Meccanico (cioè L = T − V ) quest’ipotesi
di convessità è sempre soddisfatta.

9.4.1 Appendice: Diffeomorfismi globali di Rn in sè


In realtà, abbiamo bisogno di qualcosa in più rispetto al teorema ora visto: dobbiamo
garantirci la suriettività su Rn .
Teorema di inversione globale (di Rn in sè) Sia f : Rn −→ Rn di classe C 1 con la
proprietà1
n
X ∂fi
∃α > 0 : (x)λi λj ≥ α|λ|2 , ∀x ∈ Rn , ∀λ ∈ Rn
∂xj
i,j=1

Allora f è un diffeomorfismo globale di Rn in sè.

Prova. L’iniettività è standard (teorema precedente). Dimostriamo la suriettività. Dall’i-


potesi si verifica che
|f (x) − f (0)| ≥ α|x|, (∗)
infatti: Z 1 
d
|f (x) − f (0)| |x| ≥ x · (f (x) − f (0)) = f (tx)dt · x =
0 dt
1 n 1
∂fi
Z X Z
= (tx)xi xj dt ≥ α|x|2 dt,
0 i,j=1 ∂xj 0

ne segue che
lim |f (x)| = +∞. (∗∗)
|x|→+∞

Per proseguire richiamiamo alcune nozioni di topologia elementare e qualche lemma.


Definizione: Una funzione continua si dice propria se le antimmagini dei compatti sono
compatte.
Lemma 1 Una mappa continua f : Rn → Rn è propria se e solo se vale (∗∗).
Prova Lemma 1. Supponiamo che f sia propria. Per assurdo, (∗∗) non sia valida, allora
per ogni successione {xk } divergente, p.e. del tipo |xk | > k, esiste M > 0 tale che, ∀k > 0,
1
In altri termini, ∇f sia uniformemente definito positivo.

159
|f (xk )| ≤ M . Ciò significa che per la palla chiusa B di centro 0 e raggio M , la sua
antimmagine f −1 (B) è illimitata, assurdo perché f è propria.
Viceversa, si suppone valga (∗∗) e sia K un compatto in Rn (Rn , come codominio di f ).
Esiste dunque, un M > 0 tale che K sia contenuto nella palla B di centro 0 e raggio M .
Dalla continuità di f , f −1 (K) è chiuso. D’altra parte, da (∗∗), f −1 (K) è limitato: se fosse
illimitato esisterebbe una successione {xn }n∈N contenuta in f −1 (K) tale che per n → +∞,
|xn | → +∞ e quindi
|f (xn )| ≤ M, ∀n ∈ N,
si arriva ad un assurdo perchè si è supposta vera la (∗∗).
Fine prova Lemma 1.
Lemma 2 Le mappe proprie sono chiuse, cioè mandano chiusi in chiusi.
Prova Lemma 2. Sia F chiuso in Rn (Rn , come dominio di f ). Si vuole dimostrare che
f (F ) è chiuso. Sia y ∈ f (F ), allora esiste una successione in f (F ), yn = f (xn ), con
xn ∈ F , tale che yn → y. Poiché {yn }n∈N ∪ y è compatto, tale è pure f −1 ({yn }n∈N ∪ y).
Di conseguenza {xn }n∈N è limitato. Allora esiste una sottosuccessione {xnj } convergente
ad un x̄ ∈ F̄ = F . Per la continuità di f si ha che f (xnj ) → f (x̄) ∈ f (F ). D’altra parte si
ha anche che f (xnj ) → y, da cui f (x̄) = y e quindi y ∈ f (F ).
Fine prova Lemma 2.
Il Teorema di Inversione Locale offre subito il seguente
Lemma 3 Se f : Rn → Rn è un diffeomorfismo locale, allora f è una mappa aperta.
Ritornando alla dimostrazione del Teorema, si può dire che la funzione f è propria e quindi
manda chiusi in chiusi, ma essendo anche un diffeomorfismo locale è aperta, allora f (Rn )
è sia chiuso che aperto, per connessione è necessariamente Rn . La suriettività è quindi
dimostrata. Fine prova Teorema.

9.5 Equazioni di Hamilton


Ricordiamo che la costruzione in atto dipende da una Lagrangiana inizialmente assegnata,
L. Definiamo la funzione di Hamilton, o Hamiltoniana H,

H : T ∗ Q × R −→ R,

(q, p, t) 7→ H(q, p, t) := [pj q̇ j − L(q, q̇, t)]|q̇=S(q,p,t) .


Stabiliamo qualche relazione tra le derivate parziali delle funzioni L(q, q̇, t) e H(q, p, t):
calcoliamo
∂H ∂S j ∂L ∂L ∂S j
(q, p, t) = p j − − ,
∂q i ∂q i ∂q i ∂ q̇ j ∂q i
dunque
∂H ∂L
i
(q, p, t) = − i (q, S(q, p, t), t).
∂q ∂q

160
Analogamente, si vede che
∂H
(q, p, t) = S i (q, p, t).
∂pi
e
∂H ∂L
(q, p, t) = − (q, S(q, p, t), t).
∂t ∂t
Il seguente teorema stabilisce l’equivalenza tra le equazioni di Lagrange e le cosidette
equazione canoniche, o di Hamilton.
Teorema La curva R 3 t 7→ q(t) ∈ Q, o più precisamente R 3 t 7→ (q(t), q̇(t)) ∈ T Q,
risolve le equazioni di Lagrange
d ∂L ∂L
i
− i =0
dt ∂ q̇ ∂q
se e solo se, stabilite le definizioni di pi (q, q̇, t) e di H(q, p, t), la curva R 3 t 7→ (q(t), p(t)) ∈
T ∗ Q risolve le equazioni (Canoniche o) di Hamilton:
d i ∂H d ∂H
q (t) = (q(t), p(t), t), pi (t) = − i (q(t), p(t), t).
dt ∂pi dt ∂q
Prova. R 3 t 7→ q(t) ∈ Q risolva le equazioni di Lagrange, cioè
d ∂L d ∂L ∂H
i
= pi = i = − i ,
dt ∂ q̇ dt ∂q ∂q
che corrispondono al secondo gruppo di equazioni canoniche. Anche il primo gruppo è
soddisfatto, utilizzando l’inversione della trasf. di Legendre e una delle relazioni tra derivate
di L e H appena sopra scritte,
∂H
q̇ i (t) = S i (q(t), p(t), t) = (q(t), p(t), t).
∂pi
In maniera analoga si dimostra il viceversa.
Esercizi importanti:
1) Dimostrare che la funzione H è un integrale primo per il sistema canonico se e solo se
H è indipendente dal tempo.
2) Mostrare che nel caso Lagrangiano meccanico, L = T (q, q̇) − V (q), l’Hamiltoniana è
proprio l’energia totale H = T + V .

9.6 Principio Var. di Hamilton-Helmholtz


Sia data una Hamiltoniana H. Consideriamo la seguente Lagrangiana

L : T (T ∗ Q) × R −→ R

161
(q, p, q̇, ṗ, t) 7→ L(q, p, q̇, ṗ, t) := p · q̇ − H(q, p, t).
Consideriamo il differenziale direzionale (la variazione) del funzionale (detto d’azione):
Z t1
A[q(·), p(·)] = L(q, p, q̇, ṗ, t)dt
t0

nella classe delle curve Γ:

Γ := {γ : [t0 , t1 ] 3 t 7→ (q(t), p(t)) ∈ T ∗ Q, q(t0 ) = q0 , q(t1 ) = q1

e nessuna restrizione sulle p(·)}


Se γ ∈ Γ, allora ogni altra curva di Γ si ottiene sommando a γ una generica δγ appartenente
alla classe di curve Γ0 (è uno spazio vettoriale, mentre Γ non lo è) tali che δq(t0 ) = 0 =
δq(t1 ) e nessuna restrizione sulle δp(·): Γ = γ + Γ0 .
d
dA[γ]δγ = A[γ + λδγ]|λ=0 ,

Z t1
dA[γ]δγ = [(q̇ − ∇p H) · δp − (ṗ + ∇q H))δq]dt + p · δq|tt10 .
t0
Dunque: la curva γ ∈ Γ rende stazionario il funzionale A nella classe di variazioni Γ0 se
e solo se γ risolve le equazioni canoniche tra le medesime configurazioni.

9.6.1 Interpretazione delle Equazioni di Hamilton come opportune equa-


zioni di Lagrange
Si noti che potevamo dedurre le equazioni di Hamilton equivalenti al principio di Hamilton-
Helmholtz scrivendo direttamente le ‘equazioni di Lagrange’ per la Lagrangiana L,

L(x, ẋ, t) = L(q, p, q̇, ṗ, t) = p · q̇ − H(q, p, t), x = (xα ) α=1,...,2N = (q, p) ∈ T (T ∗ Q) :

d ∂L ∂L d ∂L ∂L ∂H
α = 1, . . . , N : 0 = dt ∂ ẋα − ∂xα ⇒ 0= dt ∂ q̇ i − ∂q i
= ṗi + ∂q i

d ∂L ∂L d ∂L ∂L ∂H
α = N + 1, . . . , 2N : 0 = dt ∂ ẋα − ∂xα ⇒ 0= dt ∂ ṗi − ∂pi = −q̇ i + ∂pi

9.6.2 Cenno sul problema delle Lagrangiane equivalenti


Diciamo che due Lagrangiane L e L̄ di T Q×R in R sono equivalenti se ammettono le stesse
equazioni di Lagrange. È semplice verificare che data una Lagrangiana L(q, q̇, t) una larga
classe di Lagrangiane equivalenti L̄ si ottiene scegliendo ad arbitrio
(i) una costante c 6= 0 e

162
(ii) una funzione differenziabile F (q, t) tali che
N
dF dF X ∂F ∂F
L̄(q, q̇, t) = cL(q, q̇, t) − (q, q̇, t), (q, q̇, t) := i
(q, t)q̇ i + (q, t)
dt dt ∂q ∂t
i=1

Tale equivalenza si può constatare in due modi:


¯ definiti
(a) Si osservano i funzionali della formulazione variazionale: i due funzionali J e J,
q0 ,q1
nella stessa classe di curve Γt0 ,t1 , sono:

t1 t1 t1 N
∂F ∂F
Z Z Z
J¯ =
X
L̄(q(t), q̇(t), t)dt = c L(q(t), q̇(t), t)dt− [ (q(t), t)q̇ i (t)+ (q(t), t)]dt,
t0 t0 t0 ∂q i ∂t
i=1

J¯ = cJ − [F (q0 , t0 ) − F (q1 , t1 )] = cJ + k (k : costante in Γtq00,t,q11 )


pertanto i punti-curve critici per J¯ sono tutti e soli quelli per J.
(b) Si osservano le equazioni di Lagrange:

d ∂ L̄ ∂ L̄
− =
dt ∂ q̇ i ∂q i

N N
d ∂F X ∂ 2 F j X ∂ 2 F
 
d ∂L ∂L
=c − − + q̇ + =
dt ∂ q̇ i ∂q i dt ∂q i ∂q i ∂q j ∂q i ∂t
j=1 j=1

N N N N
∂2F j X ∂2F ∂2F j X ∂2F
  X
d ∂L ∂L X
=c − − q̇ − + q̇ + =
dt ∂ q̇ i ∂q i ∂q j ∂q i ∂t∂q i ∂q i ∂q j ∂q i ∂t
j=1 j=1 j=1 j=1
 
d ∂L ∂L
=c i
− i .
dt ∂ q̇ ∂q
Si è sopra precisato che per tale strada si ottiene una larga classe di Lagrangiane equiva-
lenti, proprio perché tale classificazione non è esaustiva: p.e. per la seguente Lagrangiana
con q ∈ R1 ,
Z q̇
−q 2 −q̇ 2 −q 2 2
L(q, q̇) = e + 2 q̇ e e−λ dλ,
0
1 2 1 2
si osserva (verificarlo) che è equivalente a L̄ = 2 q̇ − 2 q ,
un oscillatore armonico con ω = 1,
non riconducibile alla classificazione sopra proposta.
Notiamo infine che se la topologia dell’ambiente ‘varietà vincolare’ Q è abbastanza
semplice, cioè Q è semplicemente connessa, allora la classificazione di cui sopra si può
allargare (per semplicità, abbandoniamo le dipendenze eventuali dal tempo):
scegliendo ad arbitrio
(i) una costante c 6= 0 e

163
(ii) una 1-forma differenziabile chiusa θ : Q → T ∗ Q tali che
N
X
L̄(q, q̇) = cL(q, q̇) − hθ(q), q̇i = cL(q, q̇) − θj (q)q̇ j
i=1

  X N    
d ∂ L̄ ∂ L̄ d ∂L ∂L ∂θi ∂θj j d ∂L ∂L
− =c − − − i q̇ = c −
dt ∂ q̇ i ∂q i dt ∂ q̇ i ∂q i ∂q j ∂q dt ∂ q̇ i ∂q i
j=1

Osservazione: Tale allargamento (alle forme chiuse) diventa però problematico quando
la topologia dell’ambiente ‘varietà vincolare’ Q è più complessa, p.e. Q = Tn : in tal
caso le equazioni di Lagrange continuano ad essere equivalenti, ma i due funzionali J e
J¯ differiscono per delle k che sono ora costanti solo all’interno delle classi di omotopia
delle curve di Γqt00,t,q11 . Questa osservazione diventa interessante quando il problema non è
semplicemente trovare curve critiche ma anche minimizzanti 2 .

9.7 Coniugazione di Campi Vettoriali


Si consideri un’equazione differenziale in Rm con campo vettoriale possibilmente dipendente
dal tempo t,
ẋ(t) = X(x(t), t).
La famiglia di t-diffeomorfismi

Rm × R −→ Rm × R

(x, t) 7→ (y(x, t), t)


si dice che coniuga l’equazione differenziale di cui sopra all’equazione

ẏ(t) = Y (y(t), t)

se e solo se trasforma, mediante composizione, tutte le soluzioni dell’una in tutte e sole


le soluzioni dell’altra. Più precisamente, x̄(t) è soluzione della prima se e solo se ȳ(t) :=
y(x̄(t), t) è soluzione della seconda equazione differenziale.
Tale definizione può essere naturalmente estesa ad equazioni su varietà, e nel caso
Hamiltoniano penseremo a equazioni differenziali su T ∗ Q.
Occupiamoci per il momento dell’aspetto locale della coniugazione, e ritorniamo al caso
di Rm . Stante una famiglia di t-diffeomorfismi y(x, t), che relazione intercorre tra i campi
2
Questo fenomeno potrebbe essere interpretabile come una manifestazione classica dell’effetto quantistico
detto di ‘Aharonov-Bohm’, ove la forma chiusa è un potenziale vettore magnetico, si veda p.e. l’articolo di
A. Tonomura e F. Nori, Disturbance without the force, Nature, Vol. 452, 20 March 2008.

164
vettoriali coniugati? Se x̄(t) è soluzione della prima, allora ȳ(t) := y(x̄(t), t) è soluzione
della seconda equazione differenziale se e solo se

Y (ȳ(t), t) =
d ∂y d ∂y ∂y ∂y
ȳ(t) = (x̄(t), t) x̄(t) + (x̄(t), t) = (x̄(t), t)X(x̄(t), t) + (x̄(t), t),
dt ∂x dt ∂t ∂x ∂t
infine, pensando che per ogni punto x possiamo far transitare una soluzione, otteniamo la
relazione cercata, indipendente dalle soluzioni,
∂y
Y (y, t)|y=y(x,t) = J(x, t)X(x, t) + (x, t), (?)
∂t
ove
∂y
J(x, t) = (x, t)
∂x
è la matrice jacobiana della trasformazione.

9.8 Trasformazioni Canoniche


Definizione: Una famiglia di t-diffeomorfismi,

T ∗ Q × R −→ T ∗ Q × R

(x, t) 7−→ (y(x, t), t),


che coniuga ogni sistema Hamiltoniano in un sistema di equazioni differenziali ancora di
tipo Hamiltoniano, si dice Trasformazione Canonica.

Talvolta, come appena ∗


  fatto, rappresenteremo localmente i vettori x ∈ T Q come
q
“vettori colonna”, x = ; definita inoltre la matrice 2N × 2N ,
p
 
O I
E= , E−1 = ET = −E, E2 = −I,
−I O
le equazioni di Hamilton si scrivono:
!

d ∂q
x(t) = E∇x H(x(t)), ∇x := ∂
dt ∂p

Consideriamo il seguente lemma.


Lemma tecnico. Sia A(x), x ∈ Rm , una funzione C 1 a valori nelle matrici m × m tale
che per ogni funzione reale f (x) esista g(x) per cui

Aij ∇j f = ∇i g.

165
In altri termini, A è una mappa lineare che trasforma differenziali in differenziali. Allora

A(x) = cI

ove c è una costante reale.


Prova. ∀f (x), A∇f , pensata come forma, è esatta, quindi chiusa:

∇k (Aij ∇j f ) − ∇i (Akj ∇j f ) = 0.

Comunque scegliamo ad arbitrio un numero, un vettore e una matrice simmetrica, a, Gi ,


Sij , in corrispondenza resta definita la funzione f ,

1
f (x) = a + Gi (xi − x̄i ) + Sij (xi − x̄i )(xj − x̄j )
2
che in x̄ ha esattamente valore, gradiente primo, e gradiente secondo pari alle quantità
scelte. Dettagliando le condizioni di chiusura sopra scritte per A∇f ed usando l’arbitrarietà
nell’assegnazione di Gi e Sij otteniamo le condizioni (in x̄)

(i) (prendendo G = 0) AS − SAT = O, ∀S = S T ,

(ii) (prendendo S = 0) ∇k Aij = ∇i Akj .

La (i) mostra che (scegliendo S = I) A è simmetrica, inoltre, mettendosi nella base in cui
A è diagonale si vede che (i) necessariamente implica che A è scalare, cioè A(x) = c(x)I.
La (ii) mostra che, per i = j 6= k, vale ∇k c = 0.

La caratterizzazione delle trasformazioni canoniche si sviluppa ora in una serie di


risultati parziali, articolata in Lemmi.
Lemma 1. Sia y(x, t) una tr. canonica. Allora identicamente vale

JEJ T = cE, c = c(t) ∈ R \ {0}.

In corrispondenza a y(x, t) esiste una funzione K0 (y, t), definita a meno di costanti additive
e dipendente solo da y(x, t), tale che, per ogni funzione Hamiltoniana H(x, t) nelle vecchie
variabili x, la nuova Hamiltoniana K(y, t) sia data da

K(y, t) = cH̃(y, t) + K0 (y, t).

Lo scalare c è detto la valenza della trasformazione, e H̃(y, t) := H(x(y, t), t).


Prova. La trasformazione y(x, t) coniuga ogni campo vettoriale Hamiltoniano

E∇x H(x, t)

166
in un nuovo campo vettoriale Hamiltoniano (si veda la formula (?) nella sezione delle
coniugazioni) E∇y K(y, t):

E∇y K(y, t)|y=y(x,t) = J(x, t)E∇x H(x, t) + ∇t y(x, t), (∗)

e dato che H(x, t) = H̃(y(x, t), t), possiamo scrivere

E∇y K(y, t)|y=y(x,t) = J(x, t)EJ T (x, t)∇y H̃(y, t)|y=y(x,t) + ∇t y(x, t) (#)

Scegliamo ora H = 0 (o, più in generale, costante), ne segue che per qualche K0 (y, t) si ha
che per l’ultimo termine in (∗) vale:

∇t y(x, t) = E∇y K0 (y, t)|y=y(x,t) ,

cioè y(x, t), per ogni x fissato, è soluzione di un sistema differenziale Hamiltoniano: si usa
allora dire che y = y(x, t) è risolvente del sistema differenziale (se inoltre per un t0 vale
y(x, t0 ) = x allora diremo che y = y(x, t) = Φt,t0 (x) è il flusso associato a quell’equazione
differenziale. Si notino i due tempi, dato che il c. vettoriale non è autonomo).
Dunque Y (y, t) := −E∇t y(x, t)|x=x(y,t) è un gradiente, e una primitiva cercata K0 (y, t)
è per esempio data da:
Z λ=1
K0 (y, t) = Y (λy, t) · y dλ
λ=0

Vediamo quindi che per ogni H(x, t) esiste K(y, t) (a meno di costanti additive) tale che

∇y (K(y, t) − K0 (y, t)) = −EJEJ T ∇y H̃(y, t)

(naturalmente qui J = J(x(y, t), t)). Il lemma tecnico ci assicura che

A(y, t) := −EJEJ T = c(t)I,

per qualche funzione scalare c(t) 6= 0 (poiché det E 6= 0 e det J 6= 0).


Riassumendo, data una trasformazione canonica, ad essa resta associato un Hamiltonia-
no K0 e la valenza c per cui, per ogni Hamiltoniano H, il suo campo vettoriale Hamiltoniano
coniugato è dato da

E∇K = cE∇H̃ + E∇K0 (K = cH̃ + K0 )

Vedremo tra breve nei prossimi lemmi che effettivamente c è una costante indipendente
da t.
Sia ora K(y, t) una determinata funzione Hamiltoniana.

167
Lemma 2. Il flusso risolvente le equazioni canoniche associate alla funzione Hamiltoniana
K(y, t), y 0 7→ y(t, y 0 ), y 0 = y(t0 , y 0 ) soddisfa alla condizione algebrica sopra scritta con
c = 1:
∂y
JEJ T = E, ove J = 0 .
∂y
Inoltre, y 0 7→ y(t, y 0 ) è tr. canonica.
Prova. Per ogni fissato y 0 , calcoliamo

∇t (JEJ T )(t, y 0 ) = ∇t JEJ T + JE∇t J T ,

inoltre, dato che t 7→ y(t, y 0 ) risolve le equazioni di Hamilton di Hamiltoniana K, ẏ =


E∇y K, differenziando ambo i membri rispetto a y 0 , si ottiene:

∇t J = E∇2y KJ

pertanto
∇t (JEJ T ) = E∇2y KJEJ T + JE(E∇2y KJ)T =

rem : ET = −E & (∇2y K)T = ∇2y K

= E∇2y KJEJ T − JEJ T ∇2y KE,


per ogni y 0 fissato, la relazione appena determinata si interpreta affermando che la funzione
t 7→ W := JEJ T risolve l’equazione differenziale lineare con coefficienti dipendenti dal
tempo:
Ẇ = E∇2y KW − W ∇2y KE

W (t0 ) = E (infatti : J(t0 ) = I)


Si osserva che W (t) ≡ E risolve il problema di Cauchy, che naturamente ammette esistenza
e unicità, abbiamo cosı̀ ottenuto:
JEJ T = E
Il fatto che y 0 7→ y(t, y 0 ) sia canonica si verifica direttamente: Il campo vettoriale coniugato
di un generico campo vettoriale Hamiltoniano di Hamiltoniana H è (da (#))

Y (y, t) = JEJ T ∇y H̃ + ∇t y = E∇y (H̃ + K).

Lemma 3. Date due trasformazioni canoniche, (x, t) 7→ y(x, t) e (y, t) 7→ z(y, t), la loro
composizione (x, t) 7→ z(x, t) := z(y(x, t), t) è canonica e la valenza è il prodotto delle
valenze.
Prova. Indichiamo con J1 e J2 le matrici jacobiane delle due rispettive trasformazioni. Vale
Ji EJiT = ci E, i = 1, 2 e siano K01 (y, t) e K02 (z, t) le due rispettive funzioni Hamiltoniane

168
introdotte nel lemma 1. Operando come nel lemma 1, si osserva che (x, t) 7→ z(y(x, t), t)
è canonica se, per ogni H(x, t), il campo vettoriale XH = E∇x H viene coniugato in un
nuovo campo vettoriale Hamiltoniano. Il coniugato di XH è dato da

Z = J2 J1 EJ1T J2T ∇z H̄(z, t) + J2 EJ2T ∇y K̄01 + E∇z K02 .

Quindi Z è un campo vettoriale Hamiltoniano ZK e, posto J = J2 J1 , si ha

K(z, t) = c1 c2 H̄(z, t) + K0 (z, t), K0 (z, t) = c2 K̄01 (z, t) + K02 (z, t),

JEJ T = c1 c2 E.

Lemma 4. Ogni trasformazione canonica (x, t) 7→ y(x, t) è la composizione di un


flusso Hamiltoniano con una trasformazione canonica indipendente dal tempo. Pertanto la
valenza è costante.
Prova. Abbiamo visto nel lemma 1 che il campo vettoriale Y (y, t) := ∇t y(x, t)|x=x(y,t)
è Hamiltoniano e quindi y(x, t) è una risolvente. Indichiamo con y0 = y(x, t0 ), e con x =
x̃(y0 ) l’inversa. E’ semplice osservare che y(x, t) è la composizione di ȳ(y0 , t) := y(x̃(y0 ), t)
con y0 = y(x, t0 ). Ora ȳ(y0 , t) è un flusso Hamiltoniano dato che in t0 è l’identità. Per il
lemma 2 è una trasformazione canonica di valenza costante c = 1. Inoltre y0 = y(x, t0 )
è canonica di valenza costante c(t0 ) e K0 = 0. Dunque, per il lemma 3, c(t) = 1 · c(t0 ):
costante.
Abbiamo visto finora che se y(x, t) è canonica allora soddisfa a JEJ T = cE per qualche
c ∈ R. Dimostriamo infine che tale condizione algebrica è caratterizzante le trasformazioni
canoniche.
Teorema. La t-famiglia di diffeomorfismi y(x, t) è canonica se e solo se, per ogni x e t in
cui è definita, è soddisfatta la condizione algebrica JEJ T = cE, per qualche c ∈ R \ {0}.
Prova. L’insieme delle t-famiglie di diffeomorfismi y = y(x, t) soddisfacenti alla condizione
algebrica si atteggia in modo naturale a gruppo rispetto all’operazione di composizione di
funzioni. Infatti l’elemento neutro è la trasformazione identica y = y(x, t) = x, natural-
mente di valenza c = 1. L’inversa di y(x, t) appartiene al gruppo e ha valenza cy−1 (·) pari
al reciproco della valenza cy(·) di y(x, t):

1 1
J −1 EJ −T = cy−1 (·) E, onde E = JEJ T , cosicchè cy−1 (·) = .
cy−1 (·) cy(·)

Da quanto appena visto per l’inversa vale J −1 EJ −T = 1c E, valutando l’inverso algebrico di


quest’ultima relazione notiamo che vale

J T EJ = cE,

169
equivalente dunque alla JEJ T = cE. Nel seguito, e non solo nella presente dimostrazione,
sarà utile usare quest’ultima versione.
Sia ora y(x, t) appartenente al sopra descritto gruppo di trasformazioni. Sia inoltre
H(x, t) una arbitraria funzione Hamiltoniana definente il campo vettoriale Hamiltoniano
XH = E∇x H. Consideriamone il campo coniugato

JEJ T ∇y H̃(y, t) + ∇t y(x, t)|x=x(y,t) .

Evidentemente y(x, t) è canonica se Y (y, t) := ∇t y(x, t)|x=x(y,t) è un campo vettoriale


Hamiltoniano. Cioè se il campo vettoriale −E∇t y(x, t)|x=x(y,t) è un gradiente, o, equiva-
lentemente in un semplicemente connesso, se la matrice

∇y (−E∇t y(x, t)|x=x(y,t) )

è simmetrica. Il dettaglio mostra che questa matrice vale: −E∇t JJ −1 . Dunque è simme-
trica se e solo se (−E∇t JJ −1 )T = −E∇t JJ −1 , cioè

J −T ∇t J T E = −E∇t JJ −1 ,

moltiplicando a destra per J e a sinistra per J T , tale relazione è equivalente a

∇t J T EJ + J T E∇t J = 0.

Quest’ultima è certamente vera dato che vale J T EJ = cE, e c è una costante.

9.9 Condizione di Lie


Riconsideriamo il principio variazionale di Hamilton-Helmholtz. Nel seguito, come già
operato, useremo la notazione:

x := (q, p), y := (q̃, p̃).

Prendiamo ad arbitrio una Hamiltoniana H(q, p, t) e consideriamo la Lagrangiana

L : T (T ∗ Q) × R −→ R

(x, ẋ, t) 7−→ L(x, ẋ, t) = p · q̇ − H(q, p, t)


si noti che tale definizione è sempre significativa, per qualunque H; infatti, L non3 è da
confondersi con la Lagrangiana associata a H mediante la trasformazione di Legendre, per
3
La funzione di Lagrange correlata mediante la tr. di Legendre a H è, nell’ipotesi di convessità accennata,
L(q, q̇, t) = supp∈RN p · q̇ − H(q, p, t)

170
la validità di quest’ultima è invece necessaria p.e. un’ipotesi di convessità sulle derivate
2H
seconde ∂p∂ i ∂p j
.
A tale L resta associato il funzionale d’azione A[q(·), p(·)]. Ora, comunque noi operiamo
cambi di coordinate nello spazio delle configurazioni in cui è definita la Lagrangiana L (che
è T ∗ Q), cioè diffeomorfismi (x, t) 7→ (y(x, t), t) non necessariamente canonici, otterremo
un nuovo funzionale Ã[q̃(·), p̃(·)] equivalente a A[q(·), p(·)] nel seguente senso: tutti e soli i
punti-curve stazionari dell’uno si otterranno mediante composizione con la trasformazione
x 7→ y(x, t) dai punti-curve stazionari dell’altro. Si osserva che la nuova Lagrangiana
generalizzata cosı̀ ottenuta, L̃(y, ẏ, t) non sarà della forma della originaria L, pertanto le
sue equazioni di Lagrange non saranno delle equazioni di tipo Hamiltoniano. Tale generale
operazione equivale dunque ad una generica coniugazione.
Un’ispezione più attenta dell’aspetto variazionale mette in evidenza che l’integrale
d’azione A valutato lungo una generica curva [t0 , t1 ] 3 t 7→ γ(t) = (q(t), p(t), t) si può
interpretare come l’integrazione di γ lungo la seguente 1-forma differenziale su T ∗ Q × R,

N
X Z
j
ΘH := pj dq − H(q, p, t)dt A[γ(·)] = ΘH
j=1 γ

Ora, una condizione sufficiente4 affinché il diffeomorfismo (x, t) 7→ (y(x, t), t) trasformi
sistemi H(x, t)-Hamiltoniani in sistemi K(y, t)-Hamiltoniani è che esista
(i) una costante reale c 6= 0,
(ii) una funzione a valori reali F (x, t),
per cui,

ΘK y(x,t) = c ΘH − dF (condizione di Lie)

Tale scelta, suggerita dalla teoria delle Lagrangiane equivalenti accennata in 9.6.2, opera
in dettaglio cosı̀

∂y d
LK (y(x, t), (x, t)ẋ, t) = cLH (x, ẋ, t) − [ F ](x, ẋ, t) (•)
∂x dt
d d P2N ∂F
dove con [ dt F ](x, ẋ, t) si intende la “derivata totale formale” [ dt F ](x, ẋ, t) := j=1 ∂xj (x, t)ẋj +
∂F
R t1 R t1
∂t (x, t) e si ha: t0 LK dt = c t0 LH dt + F |t1 − F |t0 .
La condizione di Lie si dettaglia:

∂F ∂F ∂F
p̃dq̃ − Kdt = c (pdq − Hdt) − dq − dp − dt
∂q ∂p ∂t
4
Vedremo nella prossima sezione che tale condizione è pure necessaria.

171
da cui deduciamo:  ∂ q̃j ∂F

 p̃j ∂qi = c pi − ∂q i




j

 p̃j ∂∂pq̃ ∂F


i
= − ∂p i


∂F ∂ q̃ j


K = cH + + p̃j



|∂t {z ∂t}




K0

Dalla condizione di Lie, eliminando i termini in dt coinvolgenti le funzioni Hamiltoniane,


si ottiene
p̃δ q̃ = c pdq − δF (Cond. di Lie ridotta)
(δ: differenziale ‘virtuale’, differenzia rispetto a q e p, ma non rispetto a t).
La presenza dei termini in dq̃ e in dq nella condizione di Lie induce a rileggere tale
condizioni in variabili miste q, q̃, t con F1 = F1 (q, q̃, t):

∂F1 ∂F1 ∂F1


p̃dq̃ − Kdt = c (pdq − Hdt) − dq − dq̃ − dt
∂q ∂ q̃ ∂t

∂F1 ∂F1
p̃dq̃ = c pdq − dq − dq̃ (∗)
∂q ∂ q̃
da cui:


 p̃ = − ∂F
∂ q̃ (q, q̃, t)
1





 c p = ∂F
∂q (q, q̃, t)
1


(Trasformazioni F1 )
∂F1




 K = cH +
∂t



 |{z}

K0

Condizione essenziale affinché queste funzioni generatrici F1 (q, q̃, t) inducano una trasfor-
mazione canonica, è che, almeno per il p.to di vista locale,
 2 
∂ F1
det (q, q̃, t) 6= 0
∂q∂ q̃

In tal caso infatti, dalle seconde delle (F1 ) si esprimono le q̃ = q̃(q, p, t) che, inserite nel
primo gruppo, danno pure p̃ = p̃(q, p, t) ottenendo cosı̀ la tr. cercata.
• Si osservi che valenza c e funzione generatrice F definiscono completamente la tr. cano-
nica.

172
Tra i molti altri modi in cui possiamo scegliere 2N +1 variabili indipendenti, introducia-
mo le tr. canoniche indotte da funzioni generatrici di tipo F2 = F2 (q, p̃, t); riconsideriamo
la condizione di Lie esprimendo p̃dq̃ con un’ovvia identità ‘per parti’:

d(p̃ · q̃) − q̃dp̃ − Kdt = c (pdq − Hdt) − dF

dove ora consideriamo tale relazione tra 1-forme nelle variabili indipendenti q, p̃, t,

−q̃dp̃ − Kdt = cpdq − cHdt − d (F + p̃ · q̃)


| {z }
F2 (q,p̃,t)

pertanto:


∂F2

 q̃ = ∂ p̃ (q, p̃, t)





∂F2
 cp = ∂q (q, p̃, t)


(Trasformazioni F2 )
∂F2




 K = cH +
∂t



 |{z}

K0

L’analoga condizione da richiedere è ora


 2 
∂ F2
det (q, p̃, t) 6= 0
∂q∂ p̃

Tali trasformazioni canoniche F2 sono importanti: in tale ambito si descrive agevolmente


la trasformazione identica con (valenza c = 1)

Fid (q, p̃) = p̃ · q

specialmente, per la teoria delle perturbazioni.

9.9.1 La Condizione di Lie è N & S caratterizzante le Trasformazioni


Canoniche
Mostriamo che ogni diffeomorfismo di (aperti semplicemente connessi di) T ∗ Q × R in sè è
una tr. canonica, cioè soddisfacente5

J T EJ = cE
5
Abbiamo precedentemente visto che J T EJ = cE e JEJ T = cE sono equivalenti.

173
se e solo se è soddisfatta la Condizione di Lie ridotta. A tal fine, ricordando che
   
q q̃
x= y= ,
p p̃
PN P2N
riconsideriamo la forma, in T ∗ Q, data da A = i=1 pi dq
i = α=1 Aα (x)dx
α; la condizione
di integrabilità per essa è si scrive
     T  
∂Aα O I ∂Aβ O O
= =
∂xβ O O ∂xα I O
 
∂Aα ∂Aβ O I
− = =E
∂xβ ∂xα −I O
ed essendo E 6= O, non è chiusa.
D’altra parte, per ogni fissato t ∈ R, per la 1-forma
N
X 2N
X
p̃i dq̃ i y=y(x,t) = Aα (y)dy α y=y(x,t) = A(y(x, t))J(x, t)dx

A y=y(x,t) =
i=1 α=1

descriviamone la condizione di chiusura (rem: J = ∇x y):

[∇x (A(y(x, t))J(x, t))] − [∇x (A(y(x, t))J(x, t))]T =

= J T ∇x AJ − [J T ∇x AJ]T = J T EJ,
dove termini coinvolgenti le derivate seconde di y(x, t) si elidono per il teorema di Schwarz.
Infine, notiamo che la condizione caratterizzante le trasformazioni J T EJ −
canoniche P
cE = O è esattamente la condizione di chiusura della 1-forma i=1 p̃i dq̃ y=y(x,t) −c N
PN i i
i=1 pi dq :
ne segue che localmente è esatta e dunque esiste una funzione generatrice F (x, t) soddisfa-
cente la condizione di Lie ridotta.

9.10 Metodo d’integrazione di Hamilton-Jacobi


Tra i progetti originali dei matematici che coltivavano la meccanica nell’800 –Lagrange,
Hamilton, Jacobi, Weierstrass, Poisson, Poincaré, e altri– era inizialmente centrale il
seguente:
Data una funzione Hamiltoniana H(q, p, t) le cui equazioni canoniche (p.e. degli n-
corpi) risultavano di difficile integrazione, determinare una trasformazione canonica co-
niugante tali equazioni differenziali in altre equazioni differenziali, ancora naturalmente
canoniche, ma di facile, palese, integrazione.

174
Utilizzando lo schema6 delle F2 , si è dunque condotti a cercare una funzione generatrice,
nel caso univalente c = 1, la Hamiltoniana trasformata sia la ‘più’ semplice possibile:
K = 0. Pertanto, determinare S(q, p̃, t) tale che
∂S ∂S
(q, p̃, t) + H(q, (q, p̃, t), t) = 0 (equazione di H-J)
∂t ∂q
con la condizione (si veda la teoria del paragrafo precedente):
 2 
∂ S
det (q, p̃, t) 6= 0 (cond. di ‘radrizzabilità’)
∂q∂ p̃
Da un punto di vista strettamente matematico, notiamo dunque che la conoscenza di
una qualunque soluzione (globale) S(q, p̃, t) dell’equazione alle derivate parziali (PDE) di
Hamilton-Jacobi, detta Integrale Completo, soddisfacentealla condizione  di radrizza-
∂2S
bilità (globale, che solo localmente si scrive come sopra: det ∂q∂ p̃ (q, p̃, t) 6= 0) consente
di determinare il flusso associato alle equazioni canoniche per H. Infatti, quest’ultimo
si deduce mediante coniugazione dal flusso (banale, q̃ ≡ cost. e p̃ ≡ cost. ) relativo alle
equazioni canoniche per K = 0: ΦtK,q̃ (t, q̃, p̃) ≡ q̃, ΦtK,p̃ (t, q̃, p̃) ≡ p̃. La trasformazione
canonica indotta da S(q, p̃, t) è
∂S ∂S
p= (q, p̃, t), q̃ = (q, p̃, t)
∂q ∂ p̃
che una volta messa in forma ‘diretta’ dà
q = q(t, q̃, p̃), p = p(t, q̃, p̃)
La composizione della trasformazione col flusso di XK produce il flusso di XH , precisamen-
te, per ogni arbitraria scelta delle 2N costanti (q̃, p̃), dalle formule appena scritte otteniamo
una soluzione del sistema canonico originale.
In tutta generalità, tale progetto d’integrazione fallisce nel suo obiettivo primario,
ciononostante è stato, ed è, di primaria importanza, per vari motivi:
1) i (pochi) sistemi Hamiltoniani che si lasciano risolvere con questo metodo sono ora
chiamati sistemi integrabili, fisicamente sono moto significativi (p.e. generali oscillato-
ri lineari a N gradi di libertà, 2-corpi Newtoniano, corpo rigido con momento nullo) e
rappresentano il punto di partenza della moderna teoria perturbativa,
2) l’equazione di Hamilton-Jacobi emerge in contesti molto lontani dalla meccanica
analitica, p.e. in ottica geometrica, propagazione delle onde nei materiali continui, in
meccanica quantistica con l’equazione di Schrödinger, in teoria del controllo ottimo, e la
tecnica qui raccontata viene usata in senso inverso, cioè, l’equazione PDE di H-J viene
studiata/risolta ricorrendo alle associate ODE date da XH .
6
coinvolgente variabili miste (cioè, vecchie e nuove), ma interessante perché permette facilmente di
individuare trasformazioni ‘vicine’ all’identità: F2 (q, p̃, t) = p̃ · q + ...

175
9.10.1 Metodo d’integrazione di H-J: Hamiltoniana con n − 1 variabili
cicliche
Si consideri in R2n una funzione Hamiltoniana H(q1 , p1 , . . . , pn ) dove le variabili qα , α =
2, . . . , n, sono cicliche, inoltre H è pure indipendente dal tempo.
∂H
Si supponga che ∂p 1
6= 0.
Scrivere in dettaglio il metodo di integrazione di Hamilton-Jacobi per questa Hamilto-
niana, nella ricerca di una opportuna funzione generatrice:

S(q1 , . . . , qn , p̃1 , . . . , p̃n , t).


Si tratta di determinare una funzione generatrice S(q1 , . . . , qn , p̃1 , . . . , p̃n , t), di tipo F2 ,
in variabili miste e (necessariamente) dipendente dal tempo, che generi una trasformazione
canonica che muta l’Hamiltoniana assegnata H nell’Hamiltoniana identicamente nulla K ≡
0. La struttura dell’Hamiltoniana data, H(q1 , p1 , . . . , pn ), dove tutte le variabili base sono
cicliche tranne una, suggerisce di ricercare S nella seguente forma:
n
X
S(q1 , . . . , qn , p̃1 , . . . , p̃n , t) = p̃α qα + W (q1 , p̃1 , . . . , p̃n ) − p̃1 t
α=2

∂S
Impostando per questa S proposta l’equazione di H-J, ∂t + H(q1 , ∂S
∂q ) = 0, otteniamo:

∂W
H(q1 , , p̃2 , . . . , p̃n ) = p̃1 (∗)
∂q1
∂H
Grazie all’ipotesi tecnica ∂p1 6= 0 possiamo esprimere:

∂W
= F(q1 , p̃1 , . . . , p̃n )
∂q1
e dunque Z q1
W (q1 , p̃1 , . . . , p̃n ) = F(λ, p̃1 , . . . , p̃n )dλ

La trasformazione, in forma mista, generata da S è la seguente:


∂S ∂W ∂S ∂W
p1 = ∂q1 : p1 = ∂q1 q̃1 = ∂ p̃1 : q̃1 = ∂ p̃1 −t

∂S ∂S ∂W
pα = ∂qα : pα = p̃α q̃α = ∂ p̃α : q̃α = qα + ∂ p̃α

Infine ci chiediamo se la S cosı̀ costruita sia effettivamente una ‘buona’ f. generatrice,


cioè, dobbiamo verificare la condizione di ‘raddrizzamento’ della tr. canonica,

∂2S
6= 0 :
∂qi ∂ p̃j

176
 
∂2W ∂2W
∂q1 ∂ p̃1 ... ∂q1 ∂ p̃α ...
1
 
 
∂2S 
1

= ,
 
∂qi ∂ p̃j  1 
 
 ... ... ... ... . . .
1
dalla (∗) vediamo che
∂H ∂ 2 W
= 1,
∂p1 ∂q1 ∂ p̃1
∂H
da cui, per ∂p1 6= 0, la tesi.

9.10.2 Metodo d’integrazione di H-J: Hamiltoniana separabile


Sia data l’Hamiltoniana

H(p, q) = f (H1 (p1 , q1 ), . . . , Hn (pn , qn )).

con l’ipotesi
∂Hi
(pi , qi ) 6= 0, ∀i.
∂pi
Osserviamo preliminarmente che ogni funzione Hi (pi , qi ) è un integrale primo del moto.
Infatti
dHi ∂Hi ∂Hi
= q̇i + ṗi =
dt ∂qi ∂pi
∂Hi ∂H ∂Hi ∂H
= + (− )=
∂qi ∂pi ∂pi ∂qi
∂Hi ∂f ∂Hi ∂Hi ∂f ∂Hi
= − = 0.
∂qi ∂ai ∂pi ∂pi ∂ai ∂qi
Scegliamo una funzione generatrice del tipo
X
S(q, p̃, t) = −f (p̃1 , . . . , p̃n )t + Wi (qi , p̃i ).
i

L’equazione di Hamilton-Jacobi associata

∂S ∂S
H(q, )+ =0
∂q ∂t

si scrive
∂W1 ∂Wn
f (H1 (q1 , ), . . . , Hn (qn , )) = f (p̃1 , . . . , p̃n )
∂q1 ∂qn

177
ed è soddisfatta se e solo se le Wi risolvono le n equazioni di H-J “separate”

∂Wi
Hi (qi , (qi , p̃i )) = p̃i , i = 1, . . . , n;
∂qi

per l’ipotesi ∂Hi /∂pi 6= 0, le n equazioni ammettono forma normale

qi
∂Wi
Z
= ϕi (qi , p̃i ), Wi (qi , p̃i ) = ϕi (λ, p̃i )dλ.
∂qi qi (0)

Controlliamo che S sia un integrale completo di H-J ovvero

∂2S
rk( ) = max = n
∂qi ∂ p̃i

Si ha facilmente

∂S ∂Wi ∂2S ∂ϕi ∂ϕi


= = ϕi , = = Diag[ ].
∂qi ∂qi ∂qi ∂ p̃i ∂ p̃i ∂ p̃i

Ma essendo
Hi (qi , ϕi (qi , p̃i )) = p̃i , ∀i

si ha che (∂Hi /∂pi 6= 0)

∂Hi ∂ϕi ∂ p̃i ∂ϕi


= = 1, ⇒ 6= 0 ∀i
∂pi ∂ p̃i ∂ p̃i ∂ p̃i

e quindi il rango è massimo.

9.10.3 Esercizi

Nei manuali:
“Meccanica Analitica” di Fasano e Marmi, Bollati-Boringhieri
“Meccanica” di Landau e Lifsic, Editori Riuniti
“Lezioni di meccanica analitica” di Gantmacher, Editori Riuniti
si trovano molti esercizi svolti in dettaglio.
Qui di seguito alcuni esempi ed esercizi tratti dalle dispense di Benettin-Galgani-Giorgilli:

178
179
Infine, generalizzare al caso N -dimensionale l’esempio qui di seguito:

180
181
182
Capitolo 10

Algebra dei Campi Vettoriali

10.1 Morfismi d’Algebra, Parentesi di Lie e di Poisson


L’insieme dei Campi Vettoriali C ∞ su Rm , che denoteremo con
V ett(Rm ) := C ∞ (Rm ; Rm ),
si atteggia naturalmente a R-spazio vettoriale. Se indichiamo con F := C ∞ (Rm ; R) l’anello
delle funzioni (somma e prodotto puntuale), allora V ett(Rm ) si atteggia pure a F-modulo:

∀f, g ∈ F ∀X, Y ∈ V ett(Rm ) : f X + gY ∈ V ett(Rm ).

Isomorfo a V ett(Rm ), resta definito lo spazio degli Operatori Differenziali Lineari del
primo ordine, Der(m), su C ∞ (Rm ; R):
D ∈ Der(m) ⇐⇒
D : C ∞ (Rm ; R) −→ C ∞ (Rm; R) 
7 → D(f )(x) = m ∂
P
f (x) − i=1 Xi ∂xi f (x).
Con altri simboli (derivata di Lie), Df = LX f . Un motivo per cui si introduce tale spazio
consiste nella naturale definizione in esso di un prodotto che lo dota di P
struttura d’Algebra.
Cominciamo con l’osservare che dati due operatori differenziali DX = m ∂
i=1 Xi ∂xi , DY =
Pm ∂
i=1 Yi ∂xi , ha senso valutare

DY , DX f := (DY ◦ DX − DX ◦ DY )f.
Si vede facilmente che quest’ultimo operatore è ancora lineare e del primo ordine, infatti:
m m m m
X ∂ X ∂ X ∂Xi ∂ X ∂2
(DY ◦ DX )f = Yj Xi f= Yj f+ Yj Xi f,
∂xj ∂xi ∂xj ∂xi ∂xj ∂xi
j=1 i=1 i,j=1 i,j=1

183
vale un analogo sviluppo per (DX ◦ DY )f , e dal teorema di Schwarz (commutazione delle
derivate seconde) si ottiene
m X
m m
 X ∂Xi X ∂Yi  ∂
DX , DY f = (DY ◦ DX − DX ◦ DY )f = Yj − Xj f.
∂xj ∂xj ∂xi
i=1 j=1 j=1

Se ora definiamo in V ett(Rm ) il seguente prodotto, detto Parentesi di Lie,


m m
X ∂Xi X ∂Yi
[Y, X]i := Yj − Xj ,
∂xj ∂xj
j=1 j=1

allora la biiezione
   
V ett(Rm ), +, [., .] −→ Der(m), +, ., .
7−→ D = m ∂
P
X i=1 Xi ∂xi

è un isomorfismo d’algebra (il prodotto del trasformato è il trasformato del prodotto).

Sia ora m = 2N . Consideriamo in V ett(R2N ) il sottospazio dei campi vettoriali


Hamiltoniani Ham(R2N )

XH ∈ Ham(R2N ) ⇐⇒ XH = E∇x H, per qualche funzione H ∈ C ∞ (R2N ; R).

Qui sopra E è la matrice simplettica base –vedi il capitolo della meccanica Hamiltoniana e
trasformazioni canoniche–  
O I
E= .
−I O
Inoltre: !
  ∂
q
x= ∈ R2N , ∇x = ∂q
∂ .
p ∂p

Dotiamo ora lo spazio delle funzioni Hamiltoniane C ∞ (R2N , R) di struttura di prodotto


mediante le seguenti Parentesi di Poisson,
N 
X ∂H ∂K ∂H ∂K   
{H, K} := − = ∇x H, E∇x K ,
∂qi ∂pi ∂pi ∂qi
i=1

e dunque di struttura d’algebra. La definizione data è tale per cui la mappa


   
C ∞ (R2N , R), +, {., .} −→ V ett(R2N ), +, [., .]
H 7−→ XH = E∇x H

184
è, pure questa, un anti-morfismo d’algebra:

E∇x {H, K} = −[E∇x H, E∇x K] (∗)

In conclusione: le strutture algebriche in V ett(Rm ) ed in C ∞ (R2N ) sono strutture


ereditate dalla “naturale” struttura algebrica degli operatori differenziali del primo ordine.

10.2 Algebra di Lie e Trasformazioni Canoniche


Qui mettiamo in evidenza che lo spazio delle funzioni Hamiltoniane
 
C ∞ (R2N , R), +, {., .}

dotato delle due operazioni somma + e prodotto {., .}, è un’algebra di Lie, che, in tutta
generalità, sono caratterizzate dalle seguenti proprietà:
(i) {., .} è bilineare: {f, g + h} = {f, g} + {f, h} e
{g + h, f } = {g, f } + {h, f },
(ii) {f, f } = 0, ∀f ∈ C ∞ ,
(iii) vale l’identità di jacobi: {f, {g, h}} + {g, {h, f }} + {h, {f, g}} = 0

Si noti che (i) e (ii) implicano1 l’asimmetria: {f, g} = −{g, f }, come è nel nostro caso.

Ulteriori importanti proprietà:


• Le parentesi di Poisson sono invarianti per trasformazioni canoniche x = x(y) (qui
∂y
al solito scriviamo: J = ∂x ):

1
p.e., basta fare: 0 = {f + g, f + g} = {g, f } + {f, g}

185
   
{H̃, K̃}(y) y(x) = ∇y H̃, E∇y K̃ (y) y(x) = ET E∇y H̃ , E∇y K̃ (y) y(x) =

| {z } | {z }
XH̃ XK̃
   
= ET JE∇x H , JE∇x K (x) = −J T
EJ
| {z } E∇ x H, E∇x K (x) =
| {z } | {z }
JXH JXK cE
 
= c ∇x H, E∇x K (x) = c{H, K}(x)

• L’insieme degli integrali primi di un sistema Hamiltoniano è una sotto-algebra (chiu-


sa) di Lie: infatti, f è integrale primo per XH := E∇x H se

LXH f = ∇x f · XH = ∇x f · E∇x H = {f, H} = 0

Ora, se f e g sono integrali primi per XH , allora lo è pure ogni loro combinazione
R-lineare e, per (iii), cosı̀ pure {f, g}:

LXH {f, g} = {{f, g}, H} = −{{g, H}, f } − {{H, f }, g} = 0

• Mostriamo l’anti-morfismo d’algebra (∗) utilizzando l’isomorfismo vettori-derivazioni:

E∇x {H, K} = −[E∇x H, E∇x K].

Ricordiamo che, per ogni funzione a valori reali h, si ha che LXH (h) = −{H, h},

[E∇x H, E∇x K](h) = [XH , XK ](h) = LXH (LXK (h)) − LXK (LXH (h)) =

= {{h, K}, H} − {{h, H}, K} =


utilizzando l’identità di Jacobi,

= {{h, K}, H} + {{H, K}, h} + {{K, h}, H} =

= {{H, K}, h} = −X{H,K} (h).

• (Un aspetto del) Teorema di Nöther in ambiente Hamiltoniano:


Supponiamo che l’Hamiltonano H sia invariante rispetto al flusso generato da una
funzione (Hamiltoniana) f , cioè,

0 = LXf H = {H, f } = −LXH f

dunque tale simmetria implica l’esistenza di un integrale primo, che è esattamente la


funzione Hamiltoniana f .

186
10.3 Significato dinamico delle parentesi di Lie
Ad ogni campo vettoriale X ∈ V ett(Rm ) resta associato un operatore differenziale del
primo ordine D, e cosı́ pure un’equazione differenziale autonoma in Rm ,

ẋ = X(x).

In relazione a quest’ultima interpretazione dei campi vettoriali il seguente teorema


mette in evidenza un significato dinamico della struttura d’algebra assegnata dalle Parentesi
di Lie [., .] in V ett(Rm ).

Teorema. I flussi di due campi vettoriali X e Y siano definiti ∀t ∈ R,

ΦtX : Rm −→ Rm , ΦtY : Rm −→ Rm ,
d t d t
Φ (x) = X(ΦtX (x)), Φ (x) = Y (ΦtY (x)).
dt X dt Y
Allora ∀t, s ∈ R, i flussi commutano se e solo se le Parentesi di Lie sono identicamente
nulle,
ΦtX ◦ ΦsY − ΦsY ◦ ΦtX ≡ 0 ⇐⇒ [X, Y ] ≡ 0.

Prova. La traccia di dimostrazione che segue è tratta sostanzialmente da Arnol’d, Metodi


Matematici della Meccanica Classica, p.208. Fissiamo un arbitrario x ∈ Rm e calcoliamo
lo sviluppo di Taylor arrestato al second’ordine di
 
φ(t, s) := ΦtX ◦ ΦsY − ΦsY ◦ ΦtX (x).

∂ ∂
φ(t, s) = φ(0, 0) + φ(t, s)|(0,0) t + φ(t, s)|(0,0) s+
∂t ∂s
1∂ 2 1 ∂ 2 ∂ 2
2 32
+ 2 φ(t, s)|(0,0) t2 + 2 2

φ(t, s)| (0,0) s + φ(t, s)| (0,0) ts + O (t + s ) .
2∂ t 2 ∂2s ∂t∂s
Dalla definizione di φ(t, s) segue subito che φ(0, s) = 0 = φ(t, 0), ∀t, s, cosicché
φ(0, 0) = 0,

∂t φ(t, s)|(0,0)
= 0,

∂s φ(t, s)|(0,0)
= 0,
∂2
∂2t
φ(t, s)|(0,0)
= 0,
∂2
∂2s
φ(t, s)|(0,0)
= 0.
Dettagliamo il termine contenente le derivate seconde miste.
∂2 ∂ ∂
ΦtX ◦ ΦsY − ΦsY ◦ ΦtX (x)|(t,s)=(0,0) =

φ(t, s)|(0,0) =
∂t∂s ∂t ∂s

187
∂ ∂  ∂∂ 
ΦtX ◦ ΦsY (x) |t=0 |s=0 − ΦsY ◦ ΦtX (x) |s=0 |t=0 =
 
=
∂s ∂t ∂t ∂s
∂   ∂ 
X ΦsY (x) |s=0 − Y ΦtX (x) |t=0 ,

=
∂s ∂t
La componente i-esima risulta:
∂2
φi (t, s)|(0,0) =
∂t∂s
m m
X ∂Xi X ∂Yi
= Yj − Xj = [Y, X]i (x).
∂xj ∂xj
j=1 j=1

Lo sviluppo di Taylor risulta infine:


   3

φ(t, s) = ΦtX ◦ ΦsY − ΦsY ◦ ΦtX (x) = [Y, X](x) ts + O (t2 + s2 ) 2 .

Questa formula ci dice che se i flussi commutano allora necessariamente le parentesi sono
nulle. Viceversa, osserviamo che se le parentesi sono nulle, allora localmente (cioè, a meno
di O(3) ) i flussi commutano. Il prossimo passo consisterà nel mostrare che effettivamente
tale commutazione dei flussi è globale, cioè vale per tempi finiti t e s. Nel piano dei tempi,
asse-t × asse-s, fissiamo un arbitrario punto (t, s), scegliamo un numero (grande) intero
N ∈ N, e consideriamo il seguente reticolo di N 2 rettangolini di lati Nt e Ns ,

(t,s)
s

B
s/N
A

O t/N t
A partire da x, dal percorso ΦtX ◦ ΦsY (prima si evolve in “verticale” col flusso di Y
per un tempo s, poi in “orizzontale” col flusso di X per un tempo t) al percorso ΦsY ◦ ΦtX ,
ci sono esattamente N 2 percorsi che differiscono, l’uno dall’altro, contiguamente, per un
rettangolino come in figura.
Consideriamo due generici percorsi contigui come quelli anneriti in figura. Da O ad
A i due percorsi sono equivalenti. Dal punto x evolviamo in un punto y. All’uscita dal

188
rettangolino, in B, i due percorsi dovrebbero portare, in tutta generalità, a due distinti
punti in Rm , diciamoli x1 e x2 . Poi, da B a (t, s), i due percorsi di flusso sono ancora
uguali, però, partendo da due punti x1 e x2 possibilmente distinti, arriveremo alla fine dei
due percorsi in due punti y1 e y2 .
Per questi due percorsi contigui in Rm avremo un andamento del tipo:
y1 y2

x1
x2

x
Qual è la differenza tra i due percorsi all’uscita del rettangolo? Se vale [X, Y ] ≡ 0, lo
sviluppo di Taylor di cui sopra, a partire dal punto y e per tempi Nt , Ns , ci dice che l’errore
sarà dell’ordine
3
(t2 + s2 ) 2 C1 (y, t, s)
∆ = |x1 − x2 | ≤ C(y) 3
= .
N N3
Consideriamo un compatto K di Rm nel cui interno evolvono gli N 2 percorsi. Sia dunque
3
C la peggiore (il sup in K) delle costanti C(y), e dunque C1 (t, s) := C(t2 + s2 ) 2 . Per com-
pletare i percorsi, a partire dai due punti x1 e x2 applichiamo due identiche composizioni
di flussi, arrivando cosı́ a y1 e y2 . Ora i nostri flussi sono differenziabili nel dato iniziale,
dunque lo sono le composizioni di cui appena parlato, e quindi Lipschitziane. Indichiamo
con t̄ e s̄ i tempi residui per completare i percorsi, avremo

|y1 − y2 | = |Φs̄Y ◦ Φt̄X (x1 ) − Φs̄Y ◦ Φt̄X (x2 )| ≤ L(t̄, s̄)|x1 − x2 |.

Come prima, prendiamoci la peggior costante di Lipschitz, L(t, s), per (t̄, s̄) ∈ [0, t] × [0, s].
In definitiva, il peggior errore che possiamo fare partendo da uno stesso y e facendo due
percorsi adiacenti, è
1
C1 (t, s)L(t, s) 3 .
N

189
Dunque l’errore complessivo di commutazione dei due flussi sarà stimato come N 2 volte
(perché N 2 sono i percorsi a due a due contigui) l’errore appena valutato:
1 2 1
∆T otale ≤ C1 (t, s)L(t, s) 3
N = C1 (t, s)L(t, s) ,
N N
e questa costruzione vale per qualunque N grande ad arbitrio: l’errore è nullo.

10.4 Formula di Lie-Trotter-Chernov


Consideriamo il campo vettoriale
X +Y
e l’equazione differenziale associata:

ẋ = X(x) + Y (x).

E’ possibile calcolare il flusso relativo a X + Y conoscendo i flussi associati a X e Y ?


La seguente formula, tra l’altro molto utile nella teoria dei cammini di Feynman (il
“path integral”), è vera non appena i vari oggetti matematici che la compongono siano ben
definiti:  t t n
ΦtX+Y (x) = lim ΦX n
◦ ΦYn (x).
n→+∞

Nel caso in cui i due campi vettoriali X e Y commutino, [X, Y ] = 0, allora la formula si
semplifica in  
ΦtX+Y (x) = ΦtX ◦ ΦtY (x).

Nel caso lineare, ẋ = Ax + Bx, ritroviamo un risultato noto: [X, Y ] = 0 è equivalente alla
commutazione delle matrici AB = BA, e vale il morfismo tra la struttura additiva e la
moltiplicativa dell’algebra delle matrici data dall’esponenziale di matrice. Dunque:
 
ΦtX+Y (x) = e(A+B)t x = eAt eBt x = ΦtX ◦ ΦtY (x).

10.5 Derivata di Lie di Campi Vettoriali


In questo e nel prossimo paragrafo penseremo i nostri oggetti geometrici definiti su una
varietà m−dimensionale M , generalizzando cosı́ l’ambiente in cui ci siamo finora mossi,
Rm .
Appare subito chiara e di immediata interpretazione geometrica la derivata di Lie di
una funzione scalare f : M → R rispetto ad un campo vettoriale
 
X : M → T M, in carte locali : xi 7→ (xi , Xj (x)) .

190
Questa è la funzione scalare

(LX f )(x) := (Xi f )(x).
∂xi
Il significato è appunto quello di derivata di f lungo il flusso di X.
Dato un campo vettoriale
Y : M → T M,
qualè una corretta definizione di derivata di Lie di Y rispetto a X? Se andiamo a
rianalizzare LX f notiamo che
d d
(LX f )(x) = [f (ΦλX (x))]|λ=0 = {[(ΦλX )∗ f ](x)}|λ=0 .
dλ dλ
Questo richiamo del pull-back è essenziale per la definizione di derivata di un campo vet-
toriale Y rispetto al flusso del campo vettoriale X; infatti, le operazioni vettoriale di
“rapporto incrementale”, e poi di limite per λ → 0, devono essere fatte tutte nello stesso
spazio vettoriale tangente.
Definiamo:
[(ΦλX )∗ Y ](x) − Y (x) d
(LX Y )(x) := lim = {[(ΦλX )∗ Y ](x)}|λ=0 .
λ→0 λ dλ
Consideriamo il dettaglio in carte locali di tale espressione.

d ∂ΦλX −1
(LX Y )i (x) = {( ) Y (ΦλX (x))}i |λ=0 ,
dλ ∂x
richiamiamo ora che

ΦλX (x) = x + X(x)λ + O(λ2 ), (ΦλX )−1 (x) = x − X(x)λ + O(λ2 ),

quindi il precedente conto continua cosı̀:


d ∂X
{(I − (x)λ + ...)Y (x + X(x)λ + ...)}i |λ=0 =
dλ ∂x
∂Xi ∂Yi
=− (x)Yj (x) + (x)Xj (x) = [X, Y ]i (x),
∂xj ∂xj
ove [X, Y ] sono le parentesi di Lie dei campi vettoriali X e Y . Riassumendo:

LX Y = [X, Y ].

191
10.6 Cenni sulla Teoria delle Perturbazioni dei Sistemi Ha-
miltoniani
10.6.1 Sistemi Hamiltoniani integrabili
Supponiamo che il sistema Hamiltoniano definito dall’Hamiltoniana

h : T ∗ RN (∼ R2N ) → R

sia dinamicamente risolubile, cioè il suo diagramma di fase sia completamente noto, il
flusso associato sia esplicitamente calcolabile a meno di operazioni analitiche elementari:
inversioni di funzioni e calcolo di primitive di integrali. Questa situazione non è certo
la norma nei sistemi differenziali, anzi, è l’eccezionalità. In meccanica Hamiltoniana tali
sistemi speciali si catalogano con il teorema di Liouville-Arnol’d –vedi Metodi Mat.
della Meccanica Classica, cap. X–, si dicono integrabili, e si caratterizzano dal fatto di
possedere N integrali primi fi , i = 1, ..., N in involuzione, cioè {fi , fj } = 0, e tali per cui gli
insiemi di livello di T ∗ RN dati da fi (x) = ci sono delle sottovarietà connesse e compatte N -
dimensionali di T ∗ RN . (Una situazione un po’ più generale del caso compatto è trattata in
MMMC). Ne risulta (tesi del teorema di Liouville-Arnol’d): per fissati c1 , . . . , ci , . . . , cN , le
varietà {fi (x) = ci , i = 1, . . . , N } sono diffeomorfe a tori N -dimensionali TN = S1 ×...×S1 ;
più precisamente, esiste una trasformazione canonica uni-valente che fibra localmente T ∗ RN
in tori, più precisamente, per qualche aperto B ⊂ RN e per qualche U ⊂ T ∗ RN esiste una
trasformazione canonica y = y(x),

T ∗ RN ⊃ U 3 x 7→ y(x) = (ϑ1 , ..., ϑN , I1 , ..., IN ) ∈ TN × B,

ed è tale che la nuova Hamiltoniana k(y) = h(x(y)) dipende (al più) dalle azioni I1 , ..., IN ,

k(y) = h(x(y)) = k(I1 , ..., IN ).

In tali nuove coordinate simplettiche, dette di Angolo-Azione, y = (q̃, p̃) = (ϑ, I) in U ⊂


T ∗ RN l’integrazione è banale:
∂k ∂k
ϑ̇i = (I) =: ωi (I), I˙i = − = 0,
∂Ii ∂ϑi
onde
Ii (t) = I¯i , ¯
ϑi (t) = ϑ̄i + ωi (I)t,
si tratta dunque di rotazioni uniformi nel toro individuato da I = I¯ ∈ B, con pulsazioni
¯ Si noti come gli originali integrali primi fi siano ora rappresentati dalle
(frequenze) ωi (I).
azioni Ii .
Tutti i sistemi che si lasciano integrare col metodo di Hamilton-Jacobi cadono in questa
classificazione: per esempio, oscillatori armonici N -dimensionali, problema newtoniano a
due-corpi.

192
10.6.2 Perturbazioni
E’ di cruciale interesse fisico conoscere, saper esplorare, cosa accade vicino ai sistemi in-
tegrabili. Si pensi al classico problema di meccanica celeste del sistema planetario solare.
Ogni sotto-sistema sole-pianeta è un problema a due-corpi, dunque integrabile, con una
costante di accoppiamento nella forza gravitazionale proporzionale a (massa-sole)×(massa-
pianeta). Se si trascurano le interazioni pianeta-pianeta il sistema planetario è la com-
posizione priva di accoppiamento di n problemi a due corpi, dunque integrabile. E nel
caso compatto, quale quello che apparentemente stiamo vivendo, l’integrazione è ben nota.
Sembra lecito chiederci se le trascurate interazioni pianeta-pianeta non possano, in tempi
lunghi, distruggere, o, meno catastroficamente, mutare l’attuale struttura topologica delle
orbite del sistema planetario cosı̀ descritto. Le costanti di accoppiamento per tali perturba-
zioni sono dell’ordine (massa-pianeta)×(massa-pianeta), cosicché le costanti perturbative
relative sono dell’ordine di ε ≈ (massa-pianeta)/(massa-sole)(=10−3 per Giove).
Ancora, consideriamo un cristallo la cui dinamica più o meno ordinata delle molecole
nei nodi di un reticolo cristallino può essere descritta mediante delle forze elastiche, magari
in prima approssimazione, e questo genererà un sistema Hamiltoniano, a molti gradi di
libertà, di tipo oscillatori armonici disaccoppiati e dunque integrabile, h(I) = ω · I. Alcune
teorie di calore specifico nei solidi usano modelli descrittivi di questo tipo. Anche qui
è decisamente lecito chiederci se i termini non lineari e le eventuali impurità cristalline
possano distruggere o modificare sensibilmente la forte stabilità del modello integrabile.
In entrambi i (macro- e micro-) casi accennati la situazione è del seguente tipo, nelle
coordinate angolo-azione ottenute dall’iniziale imperturbato sistema integrabile,

H(ϑ, I) = h(I) + εf (ϑ, I),

dove ε misura l’ordine, l’intensità della perturbazione e in generale poco o nulla si sa


intorno a f (ϑ, I) (naturalmente nei casi generali diversi da quelli sopra descritti). Finché
non ci serviranno strettamente le coordinate angolo-azione, useremo coordinate generali
x ∈ T ∗ RN e considereremo tutta la regolarità che ci serve per le funzioni in gioco h, f ,
eventualmente anche C ω , cioè l’analiticità. Le orbite del sistema perturbato

ẋ = E∇(h + εf )(x)

sono topologicamente equivalenti a quelle del sistema imperturbato ẋ = E∇h(x), alme-


no per piccoli ε vicini a zero, se esiste una trasformazione canonica, vicina all’identità
per ε vicino a zero, tale da mutare l’Hamitoniana perturbata h + εf nell’Hamiltoniana
imperturbata h. Se questo accadesse per ogni ε vicino a zero, |ε| << 1, allora il siste-
ma perturbato sarebbe esso stesso integrabile e avremmo cosı̀ mostrato l’equivalenza del
sistema perturbato col sistema imperturbato, anzi ne avremmo dimostrato una sorta di
stabilità strutturale per l’originario sistema ẋ = E∇h(x) (non ci addentreremo nell’uso di
quest’ultima terminologia perché richiederebbe troppe nozioni ausiliarie per la sua forma-
lizzazione). Questa ε-famiglia di trasformazioni canoniche la cercheremo tra i flussi dei

193
sistemi Hamiltoniani autonomi ove ε assumerà il ruolo del parametro di evoluzione: questo
è un punto fondamentale della costruzione, che utilizza e motiva ulteriormente la teoria for-
male delle trasformazioni canoniche. Va pure messo in evidenza che questo è in ogni caso un
particolare, tra i tanti disponibili in letteratura, approccio alla teoria delle perturbazioni.
Cercheremo dunque x = x(ε, y) tale che x(0, y) = y e
∂x
(ε, y) = E∇g(x(ε, y)),
∂ε
per qualche funzione Hamiltoniana g da determinarsi. Dunque il nostro programma sarebbe
risolto se risultasse
(h + εf )(x(ε, y)) = h(y).
In generale, ciò non sarà ovviamente possibile. Ci accontenteremo di procedere per passi
perturbativi nel seguente senso: sviluppiamo nel parametro ε, in ε = 0, il primo membro
della precedente equazione,
∂x
(h + εf )(x(ε, y)) = h(y) + ∇h(y) (ε, y)|ε=0 ε + f (y)ε +o(ε).
| ∂ε {z }
=0: equazione di H-J

Notiamo che se la funzione Hamiltoniana g(y) risolve l’equazione lineare alle derivate par-
ziale del primo ordine (è di tipo Hamilton-Jacobi, compare solo il gradiente della funzione
incognita):
∇h(y)E∇g(y) + f (y) = 0,
allora la trasformazione canonica data dal flusso del sistema Hamiltoniano associato all’Ha-
miltoniana g muta h(y)+εf (y) in h(y)+R(ε, y), ove R(ε, y) = o(ε). Se dunque l’equazione
di cui sopra fosse risolubile, allora avremmo spostato la perturbazione dall’ordine ε1 ad un
ordine strettamente maggiore di uno. Più precisamente, vedremo tra breve –vedi più sotto–
che il guadagno sarà senz’altro ad un ordine maggiore di 1, ma, nelle particolari scelte dei
3
ε2
parametri in gioco qui fatte, strettamente minore di 2: cioè, da ε a √ ε
= ε2 .

10.6.3 Frequenze Diofantee: Convergenza del primo passo perturbativo


Condizione necessaria per compiere almeno un numero finito di passi perturbativi è la
risolubilità [l’inversione] dell’equazione [dell’operatore] di cui sopra. Riscriviamo in angolo-
azione. La nostra equazione ∇hE∇g + f = 0, cioè {h, g} + f = 0 diventa (ωl (I) =
∂h
∂Il (I)):
∂g
ωl (I) (ϑ, I) = f (ϑ, I).
∂ϑl
Supponendo l’analiticità per f ,
X
f (ϑ, I) = fk (I)eik·ϑ ,
k∈ZN

194
vale allora per i coefficienti di Fourier una stima (accettiamola, è standard) del tipo

|fk (I)| ≤ c e−σ|k| , c, σ > 0, ∀I ∈ B.

Cercheremo g pure tra le funzioni analitiche della stessa forma di f ; l’equazione diventa,
componente per componente (di Fourier),

iω(I) · k gk (I) = fk (I).


R
Per ovvi motivi di compatibilità supporremo f0 (I) := TN f (ϑ, I)dϑ = 0, cioè perturbazioni
a media nulla sui tori.
Occupiamoci della perturbazione di oscillatori armonici: in questo caso h(I) = ω · I, le
frequenze sono indipendenti dalle azione. La nostra equazione è dunque risolta da
fk (I)
gk (I) = −i
ω·k
se le frequenze non sono risonanti, cioè se sono Z−indipendenti:

ω · k 6= 0 ∀k ∈ ZN \ {0}.

Non è affatto detto che questa sola condizione di non risonanza garantisca la convergenza
della serie di Fourier per X
g(ϑ, I) = gk (I)eik·ϑ
k∈ZN

per qualche sottosuccessione N 3 m 7→ km ∈ ZN il prodotto scalare ω · km potrebbe tendere


a zero molto velocemente: è il cosiddetto problema dei piccoli divisori. Abbiamo bisogno di
un’ipotesi più forte della non risonanza sulle ωl , e che sia realistica, fisicamente utilizzabile.
Tale nuova ipotesi consiste nella richiesta che il vettore frequenze ω ∈ RN sia diofanteo,
più precisamente, per qualche α, β > 0, ω sia tale per cui
α
|ω · k| ≥ ∀k ∈ ZN − {0}.
|k|β
In tal caso
|fk | c |k|β e−σ|k|
|gk | ≤ ≤ ≤ c̄ e−σ̄|k| ,
|ω · k| α
per qualche c̄, σ̄ > 0, σ̄ ≤ σ. Stima questa che ci garantisce la convergenza della serie
formale di Fourier per g e quindi di aver realizzato un passo perturbativo.
Ma quali sono le ragionevoli α e β che si possono fisicamente richiedere nella teoria?
La condizione diofantea è tanto meno severa sulle ω quanto più α è piccolo e β è grande.
Inoltre, è sempre meno significativa all’aumentare della norma |k|.
Dovremo scegliere α piccolo, ma non “troppo”, visto che compare a denominatore nella
serie per g, e β? Consideriamo in RN la palla di centro ω = 0 e di raggio L fissato,

195
indichiamola con BL . Indichiamo con BL,α,β l’insieme delle ω (α, β)−diofantee che stanno
in BL .
Si dimostra (per esempio in P. Lochak, C. Meunier: Multiphase averaging for classical
systems, Applied Math. Sciences 72, Springer) che:

la misura di Lebesgue in RN di BL \ BL,α,β va a zero con α se β > N − 1.

Cosı̀, scegliendo β = N , la misura (il “volume” N -dimensionale) delle frequenze che “non
vanno bene” in BL è piccola con α, parametro che però non posso schiacciare a zero,
pena la non convergenza della serie. Naturalmente non è neppure possibile aumentare
indiscriminatamente β dato l’ovvio conseguente peggioramento della convergenza.
{Si dimostra anche che tale insieme “cattivo” BL \ BL,α,β è denso in BL . Tale comporta-
mento non deve stupire: si pensi per esempio ai razionali presenti nell’intervallo reale [0, 1],
questi sono un’infinità numerabile (n = 1, 2, ...) e possono essere ricoperti da intervallini di
α
ampiezza αn , la somma di tali ampiezze vale 1−α ; questo è il procedimento standard per
mostrare che i razionali sono di misura nulla in [0, 1]: ciononostante i razionali (l’analogo
delle frequenze risonanti), e dunque l’unione di tali intervallini (che in questo ragionamento
modellizzano l’insieme BL \ BL,α,β ), sono un insieme denso in [0, 1]} .
Da quanto delineato, una scelta ragionevole per α e β, ma limitatamente ad un passo
perturbativo, potrebbe essere:

α = ε, β = N.
Pensando alla stima sulle gk si deduce che anche il resto R dipenderà dal reciproco di α,
dunque un passo perturbativo sposterà la perturbazione d’ordine ε ad una perturbazione
ε2 √
d’ordine √ ε
= ε ε.
Il significato operativo di tale passo perturbativo è il seguente: nelle nuove coordinate
angolo-azione si ha subito che |I| ˙ ≤ cε√ε, dunque le azioni I restano √ε-limitate in un
intervallo di tempo dell’ordine di 1ε : se non avessimo operato la trasformazione avrem-

mo riconosciuto dalle equazioni di Hamilton che le azioni I restavano ε-limitate per un
intervallo molto più breve, dell’ordine di √1ε .
A questo punto si potrebbe pensare di iterare il procedimento. L’aspetto fondamentale
di tale tentativo è che, ancora una volta, abbiamo da risolvere un’equazione di alle derivate
parziale H-J del precedente tipo, con lo stesso operatore principale g 7→ ∇hE∇g. E’
centrale il problema della stima dei resti Rk (ε, y): in generale le stime note portano alla
non convergenza dello schema, una situazione ben nota fin da Poincaré. Il teorema di
Kolmogorov-Arnol’d-Moser (K.A.M.) risponde alla questione riguardanti la convergenza
degli schemi perturbativi del tipo sopra brevemente descritto e più generali. Ma la non-
convergenza non è sempre drammatica: una stima abbastanza ragionevole mostra che
(qui qualche coefficiente è semplificato per esigenze didattiche) il resto all’n−esimo passo
perturbativo è dell’ordine di
|Rn (I, ϑ)| ≤ c n! εn .

196
Naturalmente la crescita fattoriale depone a favore della non convergenza della successione
dei passi perturbativi. Ciononostante una stima Stirling del fattoriale, n! ≈ nn e−n , ci
suggerisce di operare fino ad un numero n∗ = [ 1ε ] di passi ([...]:=“parte intera”); in tal
caso:
∗ ∗ 1 1
|Rn | ≤ c n∗ ! εn ≈ c (n∗ ε)n e− ε ≈ c e− ε .
Otteniamo un risultato formidabile: una stima esponenziale, del tipo trattato nel teorema
di Nekhoroshev, dell’andamento delle azioni: abbiamo che |I| ˙ ≤ c̄ e− 1ε , e dunque le azioni I
√ √ 1
restano ε-limitate in un intervallo di tempo esponenzialmente lungo, dell’ordine di ε e ε .
L’utilità pratica è evidente: tale risultato ci dice che le azioni sono degli integrali primi

ε-approssimati per intervalli di tempo T , che per ragionevolmente piccoli ε facilmente
raggiungono (e ben superano) l’età dell’Universo; per esempio, per ε dell’ordine di 10−5 , si
5
ha T ≈ 10−5/2 e10 sec.

197
198
Capitolo 11

Cenno sull’analisi qualitativa dello


spazio delle fasi

11.1 Teoremi del Trasporto e di Liouville


Sia

(1) ẋ(t) = X(x(t))

l’equazione differenziale di un sistema meccanico; per esempio: la riduzione al primo ordine


di un sistema Lagrangiano, in tal caso x = (q, q̇) ∈ R2N , oppure possiamo pensare ẋ(t) =
X(x(t)) come ad un sistema Hamiltoniano e in tal caso x = (q, p) ∈ R2N (spazio delle
fasi). Supponiamo che l’equazione differenziale in studio ammetta flusso con estensione
massimale su tutta la retta reale dei tempi. Indichiamo tale operatore flusso con:

Φ : R × R2N → R2N

(2) (t, y) 7→ Φt y := x(t, y),


d
ove x(t, y) = X(x(t, y)) e x(0, y) = y.
dt
Vale Φt2 ◦Φt1 = Φt1 +t2 , e (Φt )−1 = Φ−t (teorema di unicità); è chiaro che Φt : R2N → R2N è
noto se, equivalentemente, sappiamo risolvere i problemi di Cauchy: ẋ(t) = X(x(t)), ẋ(0) = y,
∀y ∈ R2N , che è estremamente difficile, e, in un certo senso, non significativo: l’insieme
dei sistemo dinamici che si lasciano integrare mediante tecniche standard, quali calcolo di
primitive e inversioni di funzioni (si parla, appunto, di ‘sistemi integrabili’, il cui prototipo
non lineare è ẍ = f (x)) è estremamente ‘piccolo’ in ogni ragionevole topologia.
Sia Ω ⊂ R2N un sottoinsieme misurabile ed interpretiamolo come un insieme di pos-
sibili “dati iniziali” per la nostra equazione differenziale. Cerchiamo allora di indagare

199
su un aspetto meno forte ma, ciononostante, sufficientemente significativo e interessante.
Studiamo l’evoluzione della misura (in R2N ) di Ω tramite Φt :
Z
mis (Φt (Ω)) := dx
Φt (Ω)

d
Calcoliamo dt mis (Φt (Ω)) :

d d ∂(x1 , . . . , x2N )
Z Z
dx = (t, y) dy

dt dt Ω ∂(y1 , . . . , y2N )

Φt (Ω)

Se, come supponiamo, vale per (1) un teorema di esistenza e unicità, allora Φt è iniettivo
e posto1
2N
∂(x1 , . . . , x2N ) X ∂xi
J(t, y) = (t, y) = Aih (t, y) (t, y)
∂(y1 , . . . , y2N ) ∂yh
h=1

si ha che: J(0, y) = 1 e J(t, y) > 0 ∀t ∈ R. Dunque:


d ∂
Z Z
dx = J(t, y)dy =
dt Φt (Ω) Ω ∂t

2N
∂ 2 xi
Z X
= Aij (t, y) (t, y)dy =
Ω i,j=1 ∂t∂yj

2N
∂ ∂xi
Z X
= Aij (t, y) (t, y)dy =
Ω i,j=1 ∂yj ∂t
2N

Z X
= Aij (t, y) Xi (x(t, y))dy =
Ω i,j=1 ∂yj

2N 2N
∂Xi ∂xk
Z X X
= Aij (t, y) (x(t, y)) (t, y)dy,
Ω i,j=1 ∂xk ∂yj
k=1
1
Aih : complemento algebrico della matrice Jacobiana

200
P2N ∂xk
ricordando che j=1 Aij ∂yj = δik J, si ottiene:
2N
d ∂X i
Z Z X
(3) dx = J(t, y) (x(t, y))dy.
dt Φt (Ω) Ω ∂xi
i=1

∂X i
Com’è noto: divX := 2N
P
i=1 ∂xi (operatore “divergenza”).
Infine ritornando alle variabili x, otteniamo:
d
Z Z
(4) dx = divX(x)dx (Teorema del Trasporto).
dt Φt (Ω) Φt (Ω)

Supponiamo ora che l’equazione (1) sia lineare,

2N
X
(5) Xi (x) = Aij xj (Aij : matrice reale costante 2N × 2N )
j=1
P2N i
In tal caso divX = i=1 Ai = trA (tr: traccia), allora la (4) diviene:
d
Z Z
(6) dx = trA dx.
dt Φt (Ω) Φt (Ω)

La (6) si integra facilmente:


(7) mis(Φt (Ω)) = mis(Ω)et(trA) .
Dunque il segno della traccia di A ci dà una indicazione sul modo con cui le traiettorie
uscenti da Ω “invadono” (trA > 0) o meno (trA < 0) lo spazio delle fasi R2N .
Dalla (7) si può dedurre, come corollario,
(8) det(eA ) = etrA .
Infatti Z Z
mis(Φt (Ω)) = dx = dx =
Φt (Ω) etA Ω
Z Z Z
tA tA
= J dy = det(e )dy = det(e ) dy = det(etA ) mis(Ω),
Ω Ω Ω
confrontando con (7) e per t = 1 otteniamo (8).

Consideriamo ora la (4) nel caso che ẋ(t) = X(x(t)) sia un sistema Hamiltoniano
x = (q1 , . . . , qN , p1 , . . . , pN ) :
∂H
q̇i = ∂pi (q(t), p(t))
(9)
ṗi = − ∂H
∂qi (q(t), p(t)), i = 1, . . . , N.

201
Calcoliamo la divergenza del campo vettoriale:
2N N N
X ∂Xh X ∂ X ∂
div X = = Xi + XN +i =
∂xh ∂qi ∂pi
h=1 i=1 i=1

N   XN  
X ∂ ∂H ∂ ∂H
= + − =
∂qi ∂pi ∂pi ∂qi
i=1 i=1
N N
X ∂2H X ∂2H
= − ,
∂qi ∂pi ∂pi ∂qi
i=1 i=1

se H ∈ C2, vale divX ≡ 0, dunque nel caso Hamiltoniano dalla (4) si ha:
d
Z
(10) dx ≡ 0,
dt Φt w(Ω)

cioè:
Teorema di Liouville Il flusso associato alle equazioni canoniche di Hamilton mappa
nello spazio delle fasi R2N misurabili Ω in misurabili Φt (Ω) di ugual misura.

11.2 Teorema del Ritorno di Poincaré


Consideriamo un sistema Hamiltoniano con H(q, p) indipendente dal tempo. Sappiamo
che la funzione Hamiltoniana H è un integrale primo del moto: H(q(t), p(t)) = E = cost.
se (q(t), p(t)) risolve (9). Supponiamo che le superfici di livello (nello spazio delle fasi R2N )
ΣE ,

(1) ΣE := {x = (q, p) ∈ R2N : H(x) = E}

per E : E0 ≤ E ≤ E1 , siano limitate, dunque compatte. Quest’ipotesi è certamente


soddisfatta se la funzione Hamiltoniana è una mappa propria. In questa ipotesi, fissati
E0 < E1 , l’insieme (detto energy shell)2

(2) ΩE0 ,E1 := {x ∈ R2N : E0 ≤ H(x) ≤ E1 }

è un sottoinsieme compatto di R2N , e quindi di misura (il “volume” 2N –dimensionale)


finita:

(3) mis(ΩE0 ,E1 ) < +∞.


2
possiamo pensare a E0 , E1 molto vicini tra loro, ma non coincidenti: in questo modo teniamo in conto
l’indeterminazione, numerica, sperimentale, nel precisare ‘esattamente’ il livello energetico su cui studiamo
il sistema dinamico.

202
Sotto queste ipotesi il flusso Φt rappresenta un diffeomorfismo di ΩE0 ,E1 in sè, ∀t ∈ R (le
soluzioni restano definitivamente intrappolate in ΩE0 ,E1 ).
Teorema del Ritorno (H. Poincaré).
Consideriamo un sistema Hamiltoniano come appena descritto. Per quasi tutti (nel senso
della misura) i punti x ∈ ΩE0 ,E1 , sottoinsieme invariante (cioè: Φt ΩE0 ,E1 = ΩE0 ,E1 ) e
compatto dello spazio delle fasi R2N , fissato ad arbitrio ε > 0 e T > 0 esiste un tempo
t(y, ε, T ) ≥ T tale che
kΦt x − xkR2N < ε
cioè, il moto dei sistemi Hamiltoniani, indipendenti dal tempo, sui sottoinsiemi invarianti
e compatti dello spazio delle fasi, è quasi–periodico.

Prova. Sia y ∈ ΩE0 ,E1 e sia B = B(y, 2ε ) la palla di centro y e raggio 2ε , ε > 0. Con
semplice argomento di compattezza, ricopriamo ΩE0 ,E1 con un numero finito di tali palle.
Sia T > 0 reale arbitrario e sia N ⊆ B

(4) N := {x ∈ B ∩ ΩE0 ,E1 : ΦnT x ∩ B = ∅ , n = 1, 2, . . . }

l’insieme dei punti x di B che, sotto l’azione del flusso Φt con tempo discretizzato t =
T, 2T, 3T, . . . , non ritornano in B. Per la tesi basta dimostrare che, comunque scegliamo
T > 0, misN = 0. Dalla (4) si ha

∀x ∈ N : ΦnT x 6∈ B n = 1, 2, 3, . . . ,

in particolare, dato che N ⊆ B ,

(5) ∀x ∈ N : ΦnT x 6∈ N n = 1, 2, 3, . . . ;

questo significa che

(6) ΦnT N ∩ N = ∅ n = 1, 2, 3, . . . .

Mostriamo che gli iterati

ΦT N, Φ2T N, Φ3T N, . . . , ΦnT N, . . .

sono tutti tra loro disgiunti. Prima ricordiamo che la proprietà che Φt : ΩE0 ,E1 → ΩE0 ,E1
sia un diffeomorfismo ∀t ∈ R si traduce per ΦnT nella seguente affermazione:

ΦnT x = ΦnT y ⇐⇒ x = y, ∀n ∈ N,

inoltre dalla proprietà di flusso


(ΦnT )−1 = Φ−nT .

203
Supponiamo, per assurdo, che x ∈ ΦmT N ∩ ΦnT N 6= ∅ con 1 ≤ m < n; allora

∃! y ∈ N : ΦmT y = x e
∃! z ∈ N : ΦnT z = x dunque

ΦnT z = ΦmT y, Φ−mT (ΦnT z) = y, Φ(n−m)T z = y,


abbiamo cosı̀ trovato un punto z ∈ N tale Φ(n−m)T z ∈ N : assurdo.
Notiamo che ΦnT N sono (∀n ≥ 1) contenuti in ΩE0 ,E1 e, dal teorema di Liouville,
mis(ΦnT N ) = misN . Dato che mis(ΩE0 ,E1 ) < +∞ segue che mis(N ) = 0:
S+∞ P+∞ P+∞
mis( n=1 ΦnT N ) = n=1 mis(ΦnT N ) = n=1 mis(N ) =

= limn→+∞ n mis(N ) ≤ mis(ΩE0 ,E1 ) < +∞.

Osservazione. Questo teorema crea profondi problemi nella costruzione statistico termodi-
namica dei sistemi a molte particelle. Un gas in un serbatoio è in effetti un sistema di
molte particelle (una ‘mole’: circa 1023 particelle) interagenti con interazioni che soddisfa-
no azione-e-reazione e che dipendono dalla sola mutua distanza (e dunque conservative),
inoltre le pareti del serbatoio possono essere modellizzate da un’ulteriore energia potenziale
con grafico ‘molto ripido’: il sistema è Hamiltoniano e l’Hamiltoniana è propria. Dunque,
il sistema è quasi-periodico, come si spiega allora il comportamento termodinamico della
‘termalizzazione’, della tendenza all’equilibrio termodinamico?

204
Capitolo 12

Metodo di Newton e Sistemi


Dinamici

12.1 Metodo di Newton


Sia f : Rm −→ Rm una funzione C ∞ , con det f 0 6= 0, essa induce pertanto locali diffeomor-
fismi. Un classico problema computazionale consiste nella determinazione degli zeri di f .
Uno storico metodo algoritmico, famoso per la sua straordinaria velocità di convergenza
(quando, naturalmente, converge), è il metodo di Newton.
Sia x0 il punto iniziale della sucessione. Naturalmente supponiamo che f (x0 ) 6= 0,
altrimenti avremmo già concluso. Costruiamo il termine x1 . A tal fine consideriamo la
funzione affine x 7→ y(x) (la “tangente”) approssimante f al primo ordine in x = x0 ,

y = f (x0 ) + f 0 (x0 )(x − x0 ).

Determiniamo lo zero di questa funzione: lo denoteremo con x1 ,

0 = f (x0 ) + f 0 (x0 )(x1 − x0 ), onde : x1 = x0 − [f 0 (x0 )]−1 f (x0 ).

Iteriamo questo procedimento e otteniamo la sucessione:

xn+1 = xn − [f 0 (xn )]−1 f (xn ). (Newton)

Dato che abbiamo richiesto det f 0 6= 0, se la sucessione converge, essa convergerà sicura-
mente ad uno zero di f . Se si prova ad abbozzare un disegno per questo procedimento
nel caso 1−dimensionale, appare subito ben chiaro perché questo metodo si dica pure delle
tangenti.
Discutiamo qualche dettaglio sulla convergenza. Più in generale, si veda per esempio
N. S. Bachvalov: Metodi Numerici, Editori Riuniti, pag. 405. Mettiamoci pure nel caso

205
1−dimensionale, m = 1: delle cose che diremo la generalizzazione al caso m−dimensionale
sarà pura routine tecnica. Definiamo

Φ(x) := x − [f 0 (x)]−1 f (x).

È chiaro che x∗ è uno zero per f se e solo se x∗ è un punto fisso di Φ(x). Si tratta dunque di
ricondurci al lemma del contrazioni (vedi De Marco: Analisi Due/1, pag.153). Supponiamo
che per un certo intervallo reale I ⊂ R valga

Φ(I) ⊂ I, (a1 )

ed inoltre in I si abbia che


sup |Φ0 (x)| < 1. (a2 )
x∈I

Queste condizioni ci garantiscono che in I esiste uno ed un unico punto fisso per Φ. È
facile vedere come la condizione (a2 ) si scrive in termini di f e delle sue derivate prima e
seconda:
f 00 f
sup |Φ0 (x)| = sup | 02 (x)| < 1.
x∈I x∈I f

Sempre rimanendo nell’ambito 1−dimensionale, andiamo a constatare la velocità di


convergenza in I delle sucessioni di Newton. Dal teorema di Taylor si ha che esiste un
M > 0 tale che in I vale

|f (y) − f (x) − f 0 (x)(y − x)| ≤ M |y − x|2 .

Usiamola con y = xn+1 e x = xn ; ricordando la relazione definente la sucessione di Newton:

|f (xn+1 )| ≤ M |xn+1 − xn |2 ,

ricordando ancora la relazione di Newton (al passo successivo) otteniamo:

|f 0 (xn+1 )(xn+2 − xn+1 )| ≤ M |xn+1 − xn |2 ,

pertanto, indicando con K = supx∈I 1/|f 0 (x)|, e scrivendo C = KM , otteniamo:

|(xn+2 − xn+1 )| ≤ C|xn+1 − xn |2 .

È appunto quest’ultima stima responsabile della super-convergenza delle successioni di


Newton. In effetti,
2 +23 +...+2n−1 ) n
|xn+1 − xn | ≤ C|xn − xn−1 |2 ≤ C (1+2+2 |x1 − x0 |2 =
n
n −1 n (C|x1 − x0 |)2
= C2 |x1 − x0 |2 = .
C

206
Allora, posto ε := C|x1 − x0 |, e supposto ε < 1 (se non lo fosse, basta aspettare qualche
passo e cominciar a numerare da lı́), si ha

|xn+k − xn | ≤ |xn+k − xn+k−1 | + |xn+k−1 − xn+k−2 | + ... + |xn+1 − xn | ≤


1 2n+k−1 n+k−2 n+1 n
≤ (ε + ε2 + ... + ε2 + ε2 ) =
C
1  2n n n 2 n 3 n 4 n k−1 
= ε + (ε2 )2 + (ε2 )2 + (ε2 )2 + (ε2 )2 + ... + (ε2 )2 ,
C
per k → +∞ e maggiorando quest’ultima serie “super-geometrica” con la serie geometrica
(ε < 1),
n
∗ ε2 n n n
|x − xn | ≤ (1 + ε2 + (ε2 )2 + (ε2 )3 + ...),
C
n n
∗ ε2 1 ε2
|x − xn | ≤ ' .
C 1 − ε2n C

L’algoritmo di Newton, e sue varianti (per esempio il metodo di Kantorovič), è molto


usato, per l’ovvio motivo della rapida convergenza, nel calcolo numerico assistito da com-
puter. Da un punto di vista teorico, è abbastanza ragionevole pure l’estensione al caso
infinito dimensionale negli spazi di Banach: è talvolta usato per la determinazione di solu-
zioni di equazioni differenziali e per inversione di funzioni; pionieristico fu l’uso che ne fece
Kolmogorov nella sua (prima) versione del teorema centrale della teoria delle perturbazioni
dei sistemi Hamiltoniani, il teorema KAM.

Fin qui abbiamo discusso intorno all’uso diretto, naturale, del metodo di Newton. Da-
remo nel seguito una interessante interpretazione “dinamica” di tale metodo, con risultati
(ormai classici) in un certo senso sorprendenti.

12.2 Equazioni alle differenze finite, campo vettoriale di New-


ton e stabilità asintotica
Consideriamo l’equazione differenziale associata al campo vettoriale X : Rm −→ Rm ,

ẋ = X(x), x(0) = x̄. (continuo)

Decidiamo di voler calcolare le sue soluzioni in maniera approssimata, sostituendo alla


variabile continua indipendente (il “tempo”) t ∈ R con la variabile discreta n ∈ Z; per
fissato h > 0 sufficentemente piccolo, la seguente successione iterativamente definita
xn+1 − xn
= X(xn ), x0 = x̄,
h

207
approssima la soluzione del problema di Cauchy sopra scritto. Le traiettorie (il supporto
delle soluzioni) di ẋ = X(x) sono tutte e sole quelle di ẋ = αX(x), α > 0. Se siamo dunque
interessati solamente alle traiettorie, potremo considerare la seguente versione discreta (con
h = 1) del sistema dinamico soprascritto:

xn+1 = xn + X(xn ), x0 = x̄. (discreto)

Torniamo ora alla successione di Newton. Ragioniamo in senso inverso a quanto ora
fatto. Data una funzione f : Rm −→ Rm , det f 0 6= 0, della quale abbiamo scritto la
successione di Newton, individuiamo facilmente il campo vettoriale X : Rm −→ Rm di cui
la successione ne è la riduzione discreta: XNEWTON (x) := −[f 0 (x)]−1 f (x). L’equazione
differenziale associata si scrive:

ẋ = −[f 0 (x)]−1 f (x).

Ora, si vede che x∗ è uno zero di f se e solo se x∗ è un equilibrio per XNEWTON .


L’uso di tale equazione differenziale e della sua correlazione col metodo di Newton si
ritrova spesso in letteratura: si veda per esempio in teoria dinamica dei processi economici,
S. Smale:“Dynamics in General Equilibrium”, American Economic Review, Vol.66, pp.284-
294, (1976).
Come dobbiamo aspettarci sia l’andamento topologico delle curve di tale equazione
differenziale vicino all’equilibrio x∗ ?
La congettura più naturale, data la rapida convergenza sopra descritta delle successioni
di Newton, è che l’equilibrio x∗ sia asintoticamente stabile (si veda per esempio N. S.
Bachvalov, op. cit., pag. 429). Verifichiamolo. Consideriamo la seguente funzione reale
W,
W (x) := |f (x)|2 .
Dimostriamo che, localmente allo zero x∗ di f , W è una funzione di Lyapunov per l’asinto-
tica stabilità. In effetti, dato che f è un diffeomorfismo locale, esiste un intorno aperto
di x∗ in cui f si annulla solo in x∗ , dunque W è definita positiva in tale intorno di x∗ .
Calcoliamo la derivata di Lie di W rispetto al campo vettoriale XNEWTON :

Ẇ (x) = LXNEWTON W (x) = gradRm W (x) · (−[f 0 (x)]−1 f (x)) =

= −2f (x)f 0 (x) · [f 0 (x)]−1 f (x) = −2W (x),


dunque è localmente definita negativa. Questo è appunto quanto serve per la stabilità
asintotica.
Aspetti dinamici delle successioni di Newton sono studiati in maniera molto stimolante,
specialmente per le ottime illustrazioni ottenute con tecniche di computer-graphic, nel
volume: H.-O. Peitgen, P.H. Richter, La bellezza dei Frattali, Bollati Boringhieri, cap.7.

208
12.3 Coniugazione del campo vettoriale di Newton
Propedeuticamente alle Trasformazioni Canoniche, l’argomento delle coniugazioni qui bre-
vemente rchiamato, è trattato in maggior dettaglio.
Si consideri un’equazione differenziale in Rm con campo vettoriale

ẋ(t) = X(x(t)).

Il diffeomorfismo
Rm −→ Rm
(x) 7→ y(x)
si dice che coniuga l’equazione differenziale di cui sopra nell’equazione

ẏ(t) = Y (y(t))

se e solo se trasforma, mediante composizione, tutte le soluzioni dell’una in tutte e sole


le soluzioni dell’altra. Più precisamente, x̄(t) è soluzione della prima se e solo se ȳ(t) :=
y(x̄(t)) è soluzione della seconda equazione differenziale.
Dunque:
d ∂y d ∂y
Y (ȳ(t)) = ȳ(t) = (x̄(t)) x̄(t) = (x̄(t)X(x̄(t)),
dt ∂x dt ∂x
infine:

Y (y)|y=y(x) = y 0 (x)X(x), oppure Y (y) = {y 0 (x)X(x)]}x=x(y) . (Coniugazione)

È quindi facile ora vedere che la funzione x 7→ f (x), diffeomorfismo locale attorno a x∗ ,
coniuga il campo vettoriale di Newton XNEWTON nel campo Y (y) = −y:

Y (y) = {f 0 (x)XNEWTON (x)}|x=f −1 (y) = −{f 0 (x)[f 0 (x)]−1 f (x)}|x=f −1 (y) = −y.

(Se nel precedente paragrafo avessimo tenuto il passo h diverso da 1, ora il campo vettoriale
coniugato sarebbe: Y (y) = −hy, h > 0.)

12.4 Un (altro) teorema di inversione globale


Vediamo ora un’ulteriore applicazione della dinamica associata al campo di Newton co-
struito con una funzione f che induce diffeomorfismi locali (det f 0 6= 0). Supponiamo di
aver individuato in x∗ uno zero per f . Vogliamo dare una stima costruttiva dell’intorno
aperto Ω di x∗ , su cui ristretta f sia un diffeomorfismo; in altre parole, f |Ω sia iniettiva (e
dunque, per le altre proprietà di f , un diffeomorfismo sull’immagine). Il seguente risultato
è nell’articolo di Gaetano Zampieri, Finding domains of invertibility for smooth functions
by means of attraction basins, J. Differential Equations 104 (1993).

209
Teorema Sia Ω il bacino di attrazione di x∗ per il campo vettoriale

XNEWTON (x) = −[f 0 (x)]−1 f (x)

Allora f |Ω è iniettiva.
Prova. Dire che Ω è il bacino di attrazione di x∗ per −[f 0 (x)]−1 f (x) significa che, per
ogni x0 ∈ Ω, limt→+∞ x(t, x0 ) = x∗ , ove naturalmente x(t, x0 ) è il flusso, la soluzione di
ẋ = −[f 0 (x)]−1 f (x), con x(0, x0 ) = (x0 ). La continuità del flusso implica che Ω è aperto.
Consideriamo ora due arbitrari distinti punti x1 e x2 di Ω. Mostriamo che f (x1 ) 6= f (x2 ).
Abbiamo che
lim x(t, x1 ) = x∗ , lim x(t, x2 ) = x∗ .
t→+∞ t→+∞

Inoltre, per i = 1, 2,
d
f (x(t, xi )) = f 0 (x(t, xi )){−[f 0 (x(t, xi ))]−1 f (x(t, xi ))} = −f (x(t, xi )),
dt
onde:
f (x(t, xi )) = e−t f (xi ).
Ora per un tempo t̄ sufficentemente grande x(t, xi )), i = 1, 2, sono entrambi in un
(“piccolo”) aperto I (in Rm ) di x∗ relativo al diffeomorfismo locale indotto dal teorema
della funzione inversa, usando semplicemente det f 0 (x∗ ) 6= 0. Il teorema di esistenza e
unicità ci dice che da x1 6= x2 segue che x(t̄, x1 ) 6= x(t̄, x2 ). Il teorema locale della
funzione inversa in I ci dice inoltre che

f (x(t̄, x1 )) 6= f (x(t̄, x2 )).

Dunque, l’evoluzione dinamica sopra scritta per f lungo le due soluzioni ci mostra che
e−t̄ f (x1 ) 6= e−t̄ f (x2 ) ed infine quindi

f (x1 ) 6= f (x2 ).

210
Capitolo 13

Vettori Applicati, Velocità


Angolare, Cinematica Relativa

13.1 Vettori Applicati


A, B, ... punti di uno spazio 3-dimensionale A. AB segmento orientato (di origine A ed
estremo B) detto anche vettore applicato (in A).
AB e CD sono detti equipollenti se (i) sono paralleli, (ii) hanno verso concorde e
(iii) hanno ugual lunghezza. Tale relazione è un’equivalenza e le sue classi d’equivalenza
sono dette vettori (liberi). Li indicheremo con v, u, w, ... . Talvolta useremo la notazione
(A, v) per indicare il vettore applicato in A appartenente alla classe v. (Nell’ambito della
geometria affine, se la terna (A, V, +), V spazio vettoriale, denota uno spazio affine, allora
gli elementi di A × V sono i vettori applicati, mentre gli elementi di V sono i vettori liberi).
Inoltre spesso si indica con AB anche il vettore libero associato al segmento AB. Ciò è vero
in particolare quando AB figura in operazioni quali: addizione, prodotto per uno scalare,
prodotto scalare, che denoteremo con un puntino ·, prodotto vettoriale, che denoteremo
con ∧; la crocetta × è usata in alcuni testi per il prodotto scalare, in altri per il prodotto
vettoriale: non usandola si evita ogni confusione.
Formule importanti.

v1 ∧ v2 · v3 = v2 ∧ v3 · v1 = v3 ∧ v1 · v2 (1)

v1 ∧ (v2 ∧ v3 ) = (v1 · v3 )v2 − (v1 · v2 )v3 (2)

Esercizio. Dati u e v ortogonali (con v 6= 0) trovare un w ortogonale a v tale che u = w ∧ v.


Tale w è unico?
Soluzione. w = v ∧ u/|v|2 . Si.

211
Introduciamo i seguenti concetti.
Retta d’applicazione di (P, v) è la retta per P diretta come v.
Momento (polare) di (P, v) rispetto al punto (polo) O è il vettore libero mO = OP ∧ v.
Se ora variamo il polo

mA = AP ∧ v = (AO + OP ) ∧ v = AO ∧ v + mO

Consideriamo ora una retta orientata r di versore u. Se O, A ∈ r allora

mA · u = mO · u + AO ∧ v · u = mO · u.

Ha allora senso parlare di mr := mO · u come momento (assiale) di (P, v) rispetto alla retta
orientata r (u è il versore di r e O ∈ r).
Consideriamo un insieme (o sistema)PS di n vettori applicati (Pi , vi ), i = 1, ..., n. Si
n
dice loro risultante il vettore libero R = Pi=1 vi . Si dice momento (polare risultante) di S
rispetto al polo O il vettore libero MO = ni=1 OPi ∧ vi .
Se variamo il polo
n
X n
X
MA = APi ∧ vi = (AO + OPi ) ∧ vi ,
i=1 i=1

MA = MO + AO ∧ R. (3)
MO non dipende da O se e solo se R = 0. Vediamo anche che MO · R non dipende da O:
tale quantità è detta trinomio invariante. Abbiamo cosi’ MO = µ + NO con µ parallelo ad
R ed indipendente da O e NO ortogonale ad R.
La quantità
Xn X n
Mr = mir = OPi ∧ vi · u = MO · u,
i=1 i=1

indipendente dalla scelta del punto O sulla retta r di versore u, è detta momento (assiale
risultante) del sistema S) rispetto alla retta orientata r.

13.1.1 Asse Centrale


Consideriamo il sistema {(Pi , vi )}i=1,...,n con R 6= 0. Sottraendo alla (3) µ ambo i membri
si ha NA = NO + AO ∧ R. Da questa relazione si ha che se esiste un punto Q tale che
NQ = 0, allora NA = 0 per ogni punto A della retta passante per Q e parallela ad R e
solo per tali punti. Ora vediamo se un tale punto Q esiste. Abbiamo cosi’ l’equazione
NO + QO ∧ R = 0, cioè NO = OQ ∧ R (con NO · R = 0). Come visto nell’esercizio,
OQ = R ∧ NO /|R|2 soddisfa tale equazione. Pertanto l’applicazione
R ∧ NO R ∧ MO
λ 7→ OQ(λ) = + λR = + λR (4)
R2 R2

212
definita sull’asse reale, ci dà la retta luogo dei punti rispetto ai quali si ha momento uguale
a µ (e quindi momento di minimo modulo). Tale retta si dice asse centrale del sistema di
vettori applicati (a risultante diversa da zero).
Consideriamo ora il caso particolare in cui µ = 0. Per la (3) con A ∈ a –asse centrale–,
si ha
0 = µ = MA = MO + AO ∧ R, MO = OA ∧ R.
Da ciò vediamo che se R 6= 0 e µ = 0 allora il solo vettore risultante applicato in un punto
qualsiasi dell’asse centrale equivale (ai fini del calcolo del risultante e del momento) al
sistema di partenza, cioè ha uguale risultante e uguale momento rispetto ad un qualunque
polo. In tal caso si usa dire (con abuso di linguaggio) che “il risultante ammette retta
d’applicazione”. Notiamo che solo sull’asse centrale vale la suddetta proprietà (verificarlo)
e che per un sistema a risultante R 6= 0 la condizione µ = 0 è non solo sufficiente ma anche
necessaria perché il risultante ammetta retta di applicazione (verificarlo).
Casi particolari della situazione R 6= 0 e µ = 0 si hanno quando (i) R 6= 0 e i vettori
sono complanari, (ii) R 6= 0 e le rette di applicazione dei vettori sono concorrenti in un
punto. Un altro caso è il seguente.

13.1.2 Centro di un sistema di vettori applicati paralleli a con R 6= 0


Sia {(Pi , vi )}i=1,...,n con vi paralleli e con R 6= 0. Allora vi = ai k con ai reali e k versore.

Xn n
X n
X
R=( ai )k, MO = OPi ∧ vi = ai OPi ∧ k,
i=1 i=1 i=1

Xn n
X
MO · R = ( ai OPi ) ∧ k · ( ai )k = 0.
i=1 i=1

Abbiamo cosi’ verificato che µ = 0. Usando la (2) si ha


n
( ni=1 ai )k
P
R ∧ MO X
+ λR = ∧ [( ai OPi ) ∧ k] + λR =
R2 ( ni=1 ai )2
P
i=1
Pn
ai OPi ( ni=1 ai OPi · k)k
P
i=1
= Pn − Pn + λR =
i=1 ai i=1 ai
Pn
i=1 ai OPi
= P n + ξR,
i=1 ai
Pn
dove ξ = λ − P ai OPi2·k .
i=1
L’asse centrale è quindi
( ni=1 ai )
Pn
i=1 ai OPi
ξ 7→ P n + ξR.
i=1 ai

213
Pn
a OP
i=1 i i
Il punto C dato da OC = P n si dice centro del sistema di vettori paralleli a
i=1 ai
R 6= 0 e gode della proprietà di appartenere all’asse centrale qualunque sia il versore k.

214
13.2 Richiami sulle trasformazioni lineari
Sia V spazio vettoriale di dimensione n. Ove necessario, distingueremo il vettore u di V
dall’n-upla u delle sue componenti rispetto ad una base data di V . Vale allora
Proposizione 13.2.1 Siano e∗i , ei due basi di V , dette rispettivamente base fissa e base
mobile. Allora esiste unica un’applicazione lineare A ∈ End(V ) tale che
ei = Ae∗i , i = 1, . . . , n. (1)
Nel seguito supporremo sempre che e∗i e ei siano basi ortonormali, ovvero ei ·ej = e∗i ·e∗j = δij ;
sia
Aij = e∗i · ej = e∗i · Ae∗j
la matrice le cui colonne sono le componenti dei vettori ei nella base e∗i . Sia AT la trasposta
di A. Vale allora
Proposizione 13.2.2 Se u ha componenti u∗ = (u∗1 , . . . , u∗n ) nella base fissa, allora
i) le componenti di u nella base mobile ei sono
u = AT u∗ ,

ii) le componenti del vettore trasformato v = Au nella base fissa e∗i sono
v ∗ = Au∗ .

iii) la matrice A è ortogonale, ovvero A−1 = AT .


Dimostrazione. Dimostriamo i)
X X
ui = u · ei = u∗j e∗j · ei = Aji u∗j = (AT u∗ )i
j j

dimostriamo ii)
X X X
vi∗ = Au · e∗i = A( u∗j e∗j ) · e∗i = u∗j Ae∗j · e∗i = Aij u∗j = (Au∗ )i .
j j j

dimostraimo iii)
n
X n
X n
X
T
(A A)ij = T
(A )ik Akj = Aki Akj = (e∗k · ei )(e∗k · ej ) = ei · ej = δij .
k=1 k=1 k=1

Da AT A = I, segue che det(AT A) = (det A)2 = 1 ⇒ | det A | = 1. Come è noto, il gruppo


delle matrici ortogonali O(n) si divide in due componenti (topologicamente sconnesse); la
componente connessa all’identità costituisce il sottogruppo speciale ortogonale (delle rota-
zioni proprie se n = 3) SO(n), l’altra individua le riflessioni (non formano un sottogruppo)
caratterizzati da:
A ∈ SO(n) ⇒ det A = 1, A ∈ O(n) \ SO(n) ⇒ det A = −1.

215
13.3 Cinematica rigida
13.3.1 Velocità angolare
Ci specializziamo ora al caso dello spazio euclideo tridimensionale. Indichiamo con E3 lo
spazio vettoriale tridimensionale dotato di un prodotto scalare definito positivo. Sia (O, e∗i ),
i = 1, 2, 3, base ortonormale di E3 , detta terna fissa. Data un’altra base ortonormale (O, ei )
di E3 , detta terna mobile,

t 7−→ {ei (t)}i=1,2,3 , ei (0) = e∗i ,

indichiamo con R(t) la matrice delle componenti dei versori ei (t) rispetto a e∗i :

Rij := e∗i · ej (t) = cos(e∗i , ej ).

Pertanto, dal teorema di rappresentazione di vettori in una base,

e∗j = e∗j · ei ei = Rji ei (somma muta sulla coppia di indici i)

ei = e∗j · ei e∗j = RTij e∗j (somma muta sulla coppia di indici j)

Chiaramente, da ei = RTij Rjk ek si ha RTij Rjk = δik ,

RT R = I

Sia u un vettore un vettore solidale alla base mobile. Allora,

u(t) = ui ei (t), ui : costanti.

Le componenti di u(t) nella base fissa sono

u(t) = ui ei (t) = ui RTij e∗j = (Rji ui )e∗j = u∗j e∗j : u∗j (t) = Rji (t)ui , u∗ (t) = R(t)u,

queste relazioni mostrano che la matrice ortogonale R rappresenta l’endomorfismo A del-


la (1) nella base fissa. La derivata temporale delle componenti u∗ (t), nella base fissa,
esprimono la velocità u̇ di u rispetto alla base fissa,

u̇ = u̇∗i (t)e∗i , u̇∗ (t) = Ṙ(t)u = ṘR−1 u∗ (t) = ṘRT u∗ (t) (2)

Le componenti di u̇ nella base mobile si ottengono

u̇ = u̇∗i (t)Rij ej (t) =: u̇j (t)ej (t),

u̇(t) = RT u̇∗ = RT ṘR−1 u∗ (t) = RT ṘRT u∗ (t) = RT Ṙu(t). (3)

216
Derivando la relazione RRT = RT R = I rispetto al tempo, ad esempio

ṘT R + RT Ṙ = (RT Ṙ)T + RT Ṙ = 0,

si vede subito che le matrici

Ωf = ṘRT , Ωm = RT Ṙ

sono antisimmetriche: ΩT = −Ω. Le relazioni (2) e (3) permettono di esprimere, nella base
fissa o nella base mobile, le componenti del vettore velocità (ovviamente velocità rispetto
alla base fissa) di un vettore solidale alla base mobile

(u̇)∗ = Ωf u∗ , u̇ = Ωm u.

In dimensione 3, esse costituiscono la rappresentazione, rispettivamente nella base fissa e


mobile di un vettore ω, detto velocità angolare. Vale infatti

Ωf = R Ωm RT .

Teorema 13.3.1 (di rappresentazione degli operatori antisimmetrici di E3 ) Per ogni


matrice A antisimmetrica esiste un unico vettore ω ∈ E3 tale che

Av = ω ∧ v, ∀ v ∈ E3 :

Dimostrazione. L’operatore
ω(v) := ω ∧ v
è lineare e antisimmetrico poichè la matrice Ωij ad esso associata è antisimmetrica:

Ωij := ei · ω(ej ) = ei · ω ∧ ej = ej · ei ∧ ω = −ej · ω ∧ ei = −Ωji .

Al variare di ω in E3 , gli operatori lineari ω(·) definiscono un sottospazio S di dimensione


3 dello spazio vettoriale Skw(3) degli operatori antisimmetrici di E3 . Ora, Skw(3) è sot-
tospazio (varietà lineare) di M (3, R), spazio vettoriale delle matrici 3 × 3 su R, isomorfo a
E3 , definito dalle 6 equazioni (vincoli)

Skw(3) = {A ∈ M (3, R) : Aij + Aji = 0, i, j = 1, 2, 3}.

Ma allora dim Skw(3) = dim M (3, R) − 6 = 9 − 6 = 3 = dim S, pertanto S ≡ Skw(3).


L’unico vettore ω ∗ (risp. ω) associato ad Ωf (risp. Ωm ) in modo che

ω ∗ ∧ u = Ωf u, ω ∧ u = Ωm u ∀ u ∈ E3

è detto rappresentazione della velocità angolare del moto t 7→ R(t) nella terna fissa (risp.
terna mobile): X X
ω= ωi∗ e∗i = ωi e i .
i i

217
Si osservi che ω è vettore libero, cioè non è definito il suo punto di applicazione; la di-
stinzione tra la rappresentazione della velocità angolare del moto nella terna fissa (velocità
angolare nello spazio) e nella terna mobile (velocità angolare nel corpo) può offrire ulteriori
indicazioni nella teoria del corpo rigido, si veda p.e. la trattazione di V. Arnol’d in “Metodi
matematici della meccanica classica”.
Nel seguito si indicherà semplicemente con Ω la matrice Ωm .

Formule di Poisson
Dalla (3) per v = ei si hanno subito le Formule di Poisson:

ėi = Ωei = ω ∧ ei , i = 1, 2, 3.

Talvolta è utile esprimere ω in funzione degli ei e delle loro derivate temporali: da

ei ∧ ėi = ei ∧ (ω ∧ ei ) = ω − (ei · ω)ei ,

sommando su i
3
X 3
X
ei ∧ ėi = 3ω − (ei · ω)ei = 2ω
i=1 i=1
si ha
3
1X
ω= ei ∧ ėi .
2
i=1

Esempio 1 (Rotazioni piane). Supponiamo che nel moto della terna (O, ei ) rispetto a
(O, e∗i ) risulti e∗3 ≡ e3 per ogni t. Allora, detto ϑ = ϑ(t) l’angolo tra e∗1 ed e1 (t), valutato
in senso antiorario, la matrice R ∈ SO(3) è data da
 
cos ϑ − sin ϑ 0
R(ϑ) =  sin ϑ cos ϑ 0 .
0 0 1

La matrice Ω = RT Ṙ risulta essere


 
0 −ϑ̇ 0
Ω = ϑ̇ 0 0 .
0 0 0

antisimmetrica, come richiesto. Il vettore ω ad essa univocamente associato imponendo la


condizione ω ∧ v = Av, ∀v ∈ E3 risulta essere ω = ϑ̇e3 = ϑ̇e∗3 (la facile verifica è lasciata
allo studente), ovvero la velocità angolare è un vettore libero ortogonale al piano per
(e2 , e1 ). Si noti che in questo caso particolare, le rappresentazione della velocità angolare
nella terna fissa e mobile sono uguali.

218
Moti Rigidi
Sia S un sistema di n punti materiali. Il moto di S è descritto, rispetto ad una terna
(O∗ , e∗l ) di E3 dalle n funzioni t 7→ O∗ Pi (t) a valori in R3 ; O∗ Pi è detto vettore posizione
del punto Pi .

Definizione 13.3.1 Il moto di S è rigido se la distanza tra ogni coppia di punti di S non
varia nel tempo.

Se in S, sistema in moto rigido, è possibile individuare almeno tre punti non allineati, è
anche possibile associare ad S una terna (O, el ) solidale ad S, nel senso che le componenti
dei vettori posizione rispetto alla terna solidale OPi sono costanti nella terna solidale.
Risulta allora, per i, j = 1, . . . n
3
X
Pi Pj = O ∗ Pj − O ∗ Pi = uk ek .
k=1

Possiamo ora applicare le formule precedenti che esprimono la derivata temporale dei vettori
solidali ottenendo
d d d
u̇ = Pi Pj = O∗ Pj − O∗ Pi = vj − vi = ω ∧ u = ω ∧ Pi Pj
dt dt dt
ove ora le vi , vj hanno il significato di velocità dei punti Pi rispetto alla terna (O∗ , e∗l ) e
ω è la velocità angolare del moto di (O, el ) rispetto a (O∗ , e∗l ). La relazione precedente è
nota come Formula fondamentale dei moti rigidi :

(4) vj = vi + ω ∧ Pi Pj , i, j = 1, . . . n

ove tutte le quantità che vi compaiono sono espresse nel riferimento (O, el ). Scambiando il
ruolo delle due terne si deduce subito che la forma della (4) è indipendente dal riferimento.

Atti di moto
Consideriamo, ad esempio, in un istante t fissato, l’insieme dei vettori velocità degli (infiniti)
punti OP della terna (O, ei ) solidale ad un sistema S in moto rigido. Tale distribuzione
di vettori applicati OP 7→ (OP, vP ), che possiamo anche pensare come assegnata, e quindi
svincolata dal moto di un certo sistema S, è detta Atto di Moto.
L’atto di moto A è detto rigido se esiste ω tale che vale la formula fondamentale dei
moti rigidi
vP = vQ + ω ∧ QP, ∀P, Q
I seguenti sono casi particolari di Atti di Moto rigido:
• elicoidale, se esiste una retta r i cui punti hanno velocità parallela alla retta,

219
• rotatorio, se esiste un punto Q tale che vQ = 0 (e allora vP = ω ∧ QP ),

• traslatorio, se per ogni coppia di punti P, Q si ha vP = vQ (e allora ω = 0),

• piano, se esiste un piano π solidale al moto che si muove mantenendosi parallelo ad


un piano π0 fisso (e allora vP ∈ π ∀P ).

Teorema 13.3.2 (di Mozzi) Ogni Atto di Moto rigido è elicoidale

Dimostrazione. Sia A Atto di Moto rigido. Se moltiplichiamo scalarmente per ω entrambi


i membri della formula fondamentale dei moti rigidi si ha vP · ω = vQ · ω ∀P, Q. Rimane
cosı̀ univocamente determinato il vettore componente della velocità di A lungo ω:
(vP · ω)
τ= ω
ω2
mentre, sempre dalla formula fondamentale dei moti rigidi, i vettori componente della
velocità perpendicolare ad ω verificano

τ + vP⊥ = τ + vQ

+ ω ∧ QP ⇒ vP⊥ = vQ

+ ω ∧ QP

Supponiamo esista un punto Q tale che vQ ⊥ = 0. La relazione appena trovata dice che tutti

i punti P della retta per Q e parallela ad ω hanno vP⊥ = 0 + ω ∧ QP = 0, ovvero che esiste
una retta r i cui punti hanno velocità, uguale a τ in questo caso, parallela alla retta, quindi
l’Atto di Moto rigido è elicoidale.
Cerchiamo Q. Esso è individuato dal vettore OQ soddisfacente alla condizione
⊥ ⊥ ⊥
0 = vQ = vO + ω ∧ OQ, i.e. vO = ω ∧ QO
⊥ , ω dati. Tale problema è già stato risolto nel Cap. Vettori Applicati delle
con ω 6= 0 e vO
Dispense. Si ha OQ = (ω ∧ vO )/ω 2 . L’equazione dell’asse istantaneo di rotazione (retta r)
è quindi
ω ∧ vO ω · vP
λ 7→ OQ + λτ = + λ 2 ω,
ω2 ω
luogo di punti aventi velocità minima (pari a τ ).

Osservazioni.
1. Sia A Atto di Moto rigido piano. Siano P 0 ,Q0 le proiezioni di P, Q su π. Da
vP 0 = vQ0 + ω ∧ P 0 Q0 , essendo P 0 Q0 ∈ π, vP 0 − vQ0 ∈ π, si ha che ω ⊥ π. L’asse istantaneo
di rotazione incontra π in un punto Q∗ detto centro istantaneo di rotazione.
2. Verificare che se A è (rigido) rotatorio si ha τ = 0, se A è (rigido) traslatorio risulta
ω = 0.

Esempio 2 (Moto di puro rotolamento di un disco rigido su di una guida rettilinea).

220
Un disco omogeneo D di raggio R e centro G rotola sull’asse per e∗1 di un riferimento
(O∗ , e∗1 , e∗2 , e∗3 )
mantenendosi nel piano (e∗1 , e∗2 ). Il disco (sistema rigido) definisce il moto
(rigido piano) di una terna (G, e1 , e2 , e3 ) solidale al disco.
Il moto del disco è di puro rotolamento se la velocità del punto c ∈ D che all’istante
t coincide con il punto di contatto C ∗ tra il disco e la guida è nulla per ogni t. Questo
equivale a dire che l’atto di moto (rigido piano) definito dal moto della terna solidale è
rotatorio attorno al punto C ∗ , centro istantaneo di rotazione. Abbiamo visto (Esercizio
1) che la velocità angolare associata al moto piano della terna solidale è ω = ϑ̇e3 = ϑ̇e∗3 .
Usando la formula fondamentale dei moti rigidi, ricaviamo la velocità del centro G del disco

vG = vC + ω ∧ CG = 0 + ϑ̇e∗3 ∧ Re∗2 = −Rϑ̇e∗1 ,

parallela ad e∗1 . Di solito l’angolo tra e∗1 e e1 è valutato in senso orario, pe cui vG = Rϑe∗1 .
Integrando quest’ultima relazione si ottiene lo spazio percorso dal centro G lungo la guida

s(t) = xG (t) = Rϑ(t) + Rϑ(t0 ).

13.4 Cinematica relativa


Nello studio della forma delle equazioni del moto di un sistema in relazione alla terna di
versori scelta come base di E3 , le terne via via introdotte sono dette sistemi di riferimento
o osservatori. Sia T a = (O∗ , e∗i ) sistema di riferimento (solidale ad uno spazio) inerziale
e T r = (O, ei ) sistema di riferimento relativo. Sia ω τ la velocità angolare del moto di T r
rispetto a T a ; ω τ è detta velocità angolare di trascinamento.
Ricaviamo l’espressione delle grandezze cinematiche (velocità, accelerazione) del moto
di un sistema S di n punti materiali Pi nelle terne T a e T r . Iniziamo scrivendo la relazione,
valida per ogni Pi

(1) O∗ Pi (t) = O∗ O(t) + OPi (t)

ovvero (indici ripetuti qui e nel seguito sottintendono una sommatoria da 1 a 3)

x∗i (t)e∗i = x∗Oi (t)e∗i + xi (t)ei (t).

Tale relazione e la sua derivazione rispetto al tempo si basano su di un’ipotesi che suppor-
remo sempre verificata
Postulato (in Meccanica Classica) Lunghezze dei vettori ed intervalli di tempo sono
indipendenti dall’osservatore.
Derivando la (1) rispetto a t

vPa = ẋ∗i e∗i = ẋ∗Oi e∗i + ẋi ei + xi ėi

221
e ricordando le formule di Poisson ėi = ω ∧ ei , ricaviamo la relazione (Formula di Galileo)
tra la velocità assoluta v a e relativa v r = ẋi ei

(2) vPa = vPr + vPτ

ove
vPτ = vO
a
+ ω τ ∧ OP
è detta velocità di trascinamento. Essa è la velocità del punto P 0 sovrapposto a P e solidale
al moto di T r .
Deriviamo la (2) per ottenere la relazione tra le accelerazioni, usando ancora le formule
di Poisson
d r
v = arP + ω τ ∧ vPr
dt P
d τ d a
v = (vO + ω τ ∧ OP ) = aaO + ω̇ τ ∧ OP + ω τ ∧ (vPr + ω τ ∧ OP )
dt P dt
Pertanto
d
aaP = vPa = aaO + ω̇ τ ∧ OP + 2ω τ ∧ vPr + ω τ ∧ (ω τ ∧ OP )
dt
che si compendia nella Formula di Coriolis

aaP = arP + aτP + acP

ove i termini al secondo membro sono detti rispettivamente accelerazione relativa, di


trascinamento e complementare o di Coriolis e valgono

arP = ẍi ei , aτP = aaO + ω̇ τ ∧ OP + ω τ ∧ (ω τ ∧ OP ), acP = 2ω τ ∧ vPr

Anche ora aτP ha il significato di accelerazione del punto P 0 sovrapposto a P e solidale al


moto di T r .
Osservazione. La velocità angolare ω τ del moto (di trascinamento) di T r rispetto a
a
T è un vettore libero. La sua derivata temporale gode della proprietà seguente: da

ω τ = ωi∗ e∗i = ωi ei ,

usando ancora le formule di Poisson, si trova


d τ
ω = ω̇i∗ e∗i = ω̇i ei + ωi ėi = ω̇ + ω ∧ ω = ω̇i ei .
dt
Proposizione 13.4.1 Se il moto di S è rigido rispetto a T a , ovvero esiste un vettore ω a
tale che
vPa j = vPa i + ω a ∧ Pi Pj , ∀i, j = . . . n,
allora il moto di S è rigido rispetto ad ogni T r .

222
Dimostrazione. Applichiamo la formula di Galileo al moto di Pi , Pj

vPa i = vPτ i + vPr i = vO


a
+ ω τ ∧ OPi + vPr i
vPa j = vPτ j + vPr j = vO
a
+ ω τ ∧ OPj + vPr j

e sottraiamo membro a membro le relazioni precedenti

vPr j − vPr i = vPa j − vPa i + ω τ ∧ (OPj − OPi ) = ω a ∧ Pi Pj + ω τ ∧ Pj Pi = (ω a − ω τ ) ∧ Pi Pj

ovvero, il moto di S rispetto a T r è rigido con ω r = ω a − ω τ

La Proposizione dimostrata si enuncia anche dicendo che la proprietà di rigidità del


moto di S è indipendente dall’osservatore. La (4) fornisce anche la legge di composizione
delle velocità angolari di moti rigidi

ωa = ωτ + ωr .

223
224
Capitolo 14

Derivata di determinante

Consideriamo la matrice quadrata (N × N ) :


 
 a11 ... a1N 
..
 
 


 . 


.. ..
 
 
. aij .
 
 
 
 

.. 
.
 
 
 
 
aN 1 ... aN N
 

i cui elementi aij sono i valori assunti dalle N 2 funzioni aij = ãij (λ) di R in R. Sia
J = det(aij ) . Com’è noto J = N
P
j=1 Aij aij (“sviluppo del determinante rispetto alla i-
esima riga”), dove Aij sono i complementi algebrici relativi agli elementi aij ; valgono pure
le relazioni:
N
X N
X
(1) J= Aih aih = Akj akj ∀i, j = 1, . . . , N.
h=1 k=1

Inoltre sappiamo che:

N
(
X J se i = j
(2) Aih ajh =
h=1
0 se i 6= j ,

onde si può scrivere:

N
X
(3) Jδij = Aih ajh .
h=1

225
Calcoliamo la derivata di J pensato come funzione di R in R tramite le N 2 ãij (λ) :
˘
J(λ) = J (ã11 (λ), . . . , ãij (λ), . . . , ãN N (λ)).
N
d ˘ X ∂J d
(4) J(λ) = (. . . , ãhk (λ), . . . ) ãhk (λ).
dλ ∂aij dλ
i,j=1

∂J
Restano da esprimere le derivate parziali ∂aij .
A tale scopo sviluppiamo J rispetto alla
i-esima riga (oppure rispetto alla j-esima colonna, è lo stesso): J = N
P
h=1 Aih aih ; dato
che, per i fissato e per h = 1, . . . , N, Aih non dipendono da aij , si ottiene subito:

∂J
(5) = Aij .
∂aij

Ritorniamo alla (4), si ha infine:


N
dJ˘ X d
(6) (λ) = Aij ãij (λ).
dλ dλ
i,j=1

226
Capitolo 15

Test

15.1 Alcune domande

• Cosa dobbiamo prima di tutto elencare, assegnare, prima di definire i moti dinamicamente
possibili per un sistema vincolato?
• Quali sono i moti dinamicamente possibili?
• Cosa sono le reazioni vincolari?
• Cos’è un vincolo olonomo?
• Cosa sono le coordinate libere o Lagrangiane per un vincolo olonomo?
• Cos’è la dimensione di un sistema olonomo?
• In cosa consiste il metodo del Moltiplicatori di Lagrange per la determinazione dei moti
e delle reazioni vincolari?
• Un moto rigido si può pensare come all’assegnazione del moto dell’origine di una terna
mobile t 7→ OΩ(t) e all’assegnazione del moto della terna di versori ortonormale associata,
t 7→ e∗i (t), i = 1, 2, 3. Con questi oggetti, scrivere chi è il moto della matrice ortogonale
associata: t 7→ R(t) e la correlata velocità angolare t 7→ ω(t).
• Cosa sono i vincoli lisci o ideali? in cosa differiscono dai vincoli “privi d’attrito”?
• Il disco che rotola senza strisciare è un vincolo anolonomo però integrabile, cosa significa?
• Perché il disco che rotola senza strisciare è un sistema a vincoli lisci?
• Teorema di Conservazione dell’Energia: Enunciato e dimostrazione.
• Teorema di Lagrange-Dirichlet: Enunciato e dimostrazione.
• Principio di D’Alembert: Enunciato e dimostrazione.
• La restrizione di sistemi conservativi su vincoli olonomi è conservativa: mostrarlo in
dettaglio.
• Deduzione delle equazioni di Lagrange.
• Perché la ‘matrice cinetica’ è definita positiva?

227
• Linearizzazione delle equazioni di Lagrange attorno a equilibri stabili: che ipotesi di
lavoro si fanno? affinché si ottengano delle frequenze di “piccola oscillazione” non banali
(6= 0), che ipotesi si deve proporre? come si calcolano le frequenze di “piccola oscillazione”?
• Dare un esempio di stabilizzazione giroscopica e mostrare la sua fragilità qualora si
introducano delle forze viscose.
• Dimostrare il Teorema dell’Hessiano Non Degenere nel caso 1-dimensionale, più precisa-
mente, ricondurlo al primo e secondo metodo di Lyapunov.
• Deduzione delle equazioni di evoluzione del corpo rigido dal Pr. di D’Alembert.
• Equilibri e stabilità delle equazioni di Euler per il c. rigido scarico (cioè, con momento
baricentrale delle forze nullo).
• Descrizione alla Poinsot del corpo rigido scarico.
• Mostrare che i moti del c. rigido con ellissoide a simmetria assiale sono delle precessioni
regolari.

15.2 Altre domande


• In cosa consiste l’invarianza in forma delle equazioni di Lagrange? invarianza rispetto a
cosa?
• L’integrale primo che si deduce dopo aver osservato che p.e. la funzione di Lagrange
0 ∂L j 0 si dice ciclica) si può interpretare nello schema del
è indipendente da q j , ∂q j 0 = 0, (q

teorema di Nöther?
• Enunciare e dimostrare il principio-teorema variazionale di Hamilton.
• Solamente i sistemi meccanici olonomi conservativi si possono porre in forma variazionale?
e se esistesse pure una forza del tipo viscoso −k q̇?
• Enunciare e dimostrare il teorema di Nöther.
• Enunciare e dimostrare il teorema di Routh.
• Che relazioni intercorrono tra i moti spontanei di una particella di massa m senza for-
ze attive vincolata senza attrito su di una superficie e le geodetiche (curve di lunghezza
stazionaria) sulla stessa superficie?
• Geodetiche sulle superfici di rotazione (cioè, a simmetria assiale), teorema di Clairaut
(vedi p.e. Arnol’d, Metodi matematici della meccanica classica, p. 87).
• Brachistocrona (vedi p.e. De Marco, Analisi Due/2, vecchia edizione).
• Bolle di sapone: superfici di rotazione di area minima (estremale) tra due circonferenze
di ugual raggio R e poste coassialmente a distanza 2`.
• Cosa sono le trasformazioni canoniche? E’ vero che sono un sottogruppo proprio del
gruppo dei diffeomorfismi di T ∗ S in sè (detti coniugazioni)? spiegare in dettaglio.
• Le trasformazioni puntuali (diffeomorfismo locali dei cambi di carta nella varietà vincolare
base S) q̃ = q̃(q) inducono delle trasformazioni canoniche in T ∗ S?
• In cosa consiste la condizione algebrica caratterizzante le tr. canoniche? come ci si arriva?

228
• (...) Condizione di Lie e condizione algebrica caratterizzante le tr. canoniche. Trasfor-
mazioni F1 e F2 .
• (...) Metodo di integrazione di Hamilton-Jacobi. Dettagli del caso separabile: H(q, p) =
∂fi
G(f1 (q1 , p1 ), f2 (q2 , p2 ), ..., fN (qN , pN )) con l’ipotesi ∂p i
6= 0.
•(...) Metodo di integrazione di Hamilton-Jacobi. Dettagli del caso di n − 1 variabili
∂H
cicliche: H(q, p) = H(q1 , p1 , . . . , pn ) con l’ipotesi ∂p 1
6= 0.
• Descrizione del problema dei due corpi nel sistema della massa ridotta. Mettere in
evidenza l’uso degli integrali primi.
• Per il problema di Kepler (cioè nel sistema della massa ridotta) le orbite sono tutte e
sole delle (sezioni) coniche. Mostrare in dettaglio.
• Uso del teorema di Routh nel problema di Kepler.

229

Potrebbero piacerti anche