Queste dispense sono solo una traccia per un corso di Meccanica, non certo un trattato
di Meccanica.
I manuali di Meccanica sono altri: il lettore che s’appassionasse e desiderasse appro-
fondire la materia è invitato a rivolgersi, esplorare le pagine dei bellissimi trattati di Levi-
Civita & Amaldi, di Whittaker, di Wintner, di Landau & Lifshitz, di Gantmacher, di Arno-
l’d, e poi ancora i più recenti volumi di Benenti, Cercignani, Dell’Antonio, Fasano & Marmi,
Gallavotti, ecc.
Queste note sono invece semplicemente un modo di raccontare alcuni, pochi, capitoli
della Meccanica Classica, modo legato intimamente alla maturazione di tali argomenti,
usufruendo dell’esperienza dell’insegnamento e della conseguente ‘risposta’ degli studenti,
via via nel tempo.
Franco Cardin
Dipartimento di Matematica Tullio Levi-Civita
Università degli Studi di Padova
2
Indice
3
2.4 Formule di Binet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.5 Sulle Coniche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.6 Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.7 Newton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
2.8 Massa Ridotta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.9 Soluzione del Problema Ridotto ad un Corpo, il Problema di Kepler . . . . 61
2.10 L’equazione di Kepler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
2.11 Il Vettore di Runge-Lenz per il Problema di Kepler Spaziale . . . . . . . . . 67
2.12 Circonferenza di Hamilton delle velocità nel Problema di Kepler piano . . . 67
2.13 Teorema di Bohlin (nella versione di Faure-Arnol’d): Equivalenza orbitale
dei potenziali elastico e Kepleriano . . . . . . . . . . . . . . . . . . . . . . . 68
2.14 Sulle soluzioni esatte del Problema a Tre Corpi ed N Corpi . . . . . . . . . 70
4 Meccanica di Lagrange 95
4.1 Dinamica dei Sistemi Olonomi Lisci: Equazioni di Lagrange . . . . . . . . . 95
4.2 Sugli Integrali Primi delle Equazioni di Lagrange . . . . . . . . . . . . . . . 101
4.3 Teoria di Routh . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
4.4 Teoria di Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 104
4
8 Calcolo delle Variazioni 131
8.1 Principio Variazionale di Hamilton . . . . . . . . . . . . . . . . . . . . . . . 131
8.2 Minimo nel Calcolo delle Variazioni: il Principio della Minima Azione . . . 134
8.3 Sinossi di Teoria Variazionale in H 1 . . . . . . . . . . . . . . . . . . . . . . 139
8.4 Minimo Forte e Minimo Debole . . . . . . . . . . . . . . . . . . . . . . . . . 141
8.5 Moti spontanei e geodetiche su varietà . . . . . . . . . . . . . . . . . . . . . 142
8.6 Metrica di Jacobi. Formulazione non variazionale del Principio di Maupertuis146
8.7 Riduzione Isoenergetica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 148
8.8 Problema di Plateau dell’area minima (o delle bolle di sapone). . . . . . . . 149
8.9 Problema inverso nel Calcolo delle Variazioni: Teorema di Volterra-Vainberg 151
5
10.6.3 Frequenze Diofantee: Convergenza del primo passo perturbativo . . 194
15 Test 227
15.1 Alcune domande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 227
15.2 Altre domande . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
6
Capitolo 1
7
gerarchico, nel senso che ogni oggetto via via introdotto ha un carattere più generale ed
indipendente dal successivo. Non cureremo la costruzione completa dei fondamenti, bensı́
richiameremo rapidamente quei concetti utili per entrare concretamente nel cuore dello
studio dei problemi dinamici meccanici.
8
è detto spazio degli atti di moto 3 .
1.1.4 Forze
Relativamente alle scelte sopra operate sul sistema in studio, sono assegnate delle leggi
forza mediante delle funzioni che rappresentano per ogni i = 1, ..., n la risultante delle
azioni delle restanti n − 1 particelle sulla particella Mi . In tutta generalità, tali forze
potranno dipendere dalle configurazioni di tutte le particelle, dalle loro velocità, e dal
tempo,
Fi : R3n × R3n × R → R3
Il significato operativo di tali azioni sarà precisato tra breve, nella definizione di moti
dinamicamente possibili.
Esempio 1. Per n = 2, le due particelle (punti materiali) M1 , M2 siano mutuamente
interagenti mediante forze elastiche attrattive lineari (p.e. è tesa una molla tra loro), in tal
caso, per qualche costante strutturale h > 0,
Fi : R6 × R6 × R → R3 , i = 1, 2
Si noti che tale assegnazione di legge forza non dipende nè dalle velocità nè dal tempo, in
tal caso diremo che il sistema di forze (F1 , F2 ) è, appunto, posizionale.
Esempio 2. Sia n = 1, supponiamo di voler schematizzare con una legge forza l’azione di
resistenza che un mezzo (es., un liquido) agisce sulla particella in studio M ; tale forza è
(dall’esperienza) tanto più intensa tanto più è intensa la velocità, inoltre si oppone al moto;
schematizziamo tutto ciò cosı̀: per qualche costante strutturale k > 0
F : R3 × R3 × R −→ R3
3
Detto anche spazio delle fasi, sebbene tale nome, a rigore, sia attribuito da molti autori al solo ambiente
della Meccanica Hamiltoniana.
9
1.1.5 Vincoli e loro descrizione geometrica
Supponiamo ora di introdurre mediante dei meccanismi ideali delle restrizioni alle confi-
gurazioni fin qui ammissibili per il nostro sistema. Diremo che il nostro sistema di punti
materiali è vincolato in maniera olonoma se, per ogni t ∈ R, le configurazioni possibili a
quell’istante, sono rappresentate da una sottovarietà N -dimensionale St ⊂ R3n , N < 3n.
Diremo che il nostro sistema è vincolato in maniera anolonoma se le restrizioni coinvolgono
anche le velocità, asserendo che, per ogni t ∈ R, le configurazioni e velocità possibili sono
date da una sottovarietà At dello spazio degli atti di moto del sistema libero, At ⊂ R3n ×R3n .
Ci occuperemo del seguito fondamentalmente di vincoli olonomi.
Allo stato attuale, iniziale, di costruzione della teoria non ci preoccuperemo della defi-
nizione rigorosa della nozione di ‘sottovarietà’ e più in generale di ‘varietà’; tentereremo di
introdurla in modo operativo e cureremo in modo rigoroso solamente il suo aspetto locale.
Supponiamo che il nostro sistema di n particelle, che in assenza di vincoli avrebbe a dispo-
sizione tutto R3n quale spazio di configurazione, sia appunto vincolato in un sottoinsieme
di R3n . Tale sottoinsieme sia dato dagli zeri di qualche funzione f abbastanza regolare,
almeno di classe C 1 per poter applicare il teorema della funzione implicita che qui sotto
richiamiamo a nostro uso, ma anche di più (C 3 ) per i nostri scopi legati alla meccanica.
Daremo inizialmente, per tentativo di chiarezza, un esempio di vincolo indipendente dal
tempo. Dunque, sia data
f : R3n −→ Rk
(OP1 , ...., OPn ) 7−→ fα (OP1 , ...., OPn )
α=1,...,k
10
(Una versione del) Teorema della Funzione Implicita: Sia data una funzione f di classe
C 1 come sopra, k < 3n,
f : R3n −→ Rk
OP 7−→ f (OP )
Sia
i) OP = (OP 1 , ...., OP i , ..., OP n ) un punto di R3n appartenente a
S = f −1 (0): f (OP ) = 0;
ii) valga la seguente ipotesi ‘algebrica’:
il rango del differenziale di f valutato in OP ¯ sia massimo 5 , cioè k,
∂f ∂f1
1
(1) ... (n)
∂x1 ∂x3
.... ... ...
∂f
rk df (OP ) = k, in dettaglio : rk .... ∂x(i) ...
α
(OP ) = k.
Γ
.... ... ...
∂fk ∂fk
(1) ... (n)
∂x1 ∂x3
Esiste allora un intorno aperto U in R3n−k ed una mappa C 1 su di esso definita, e a valori
in R3n , scriveremo N := 3n − k,
U ⊂ RN −→ R3n
tale che
(1) f (OP
g (q)) = 0 ∀q ∈ U, (2) OP g (U) è un insieme aperto di S nella sua topologia
indotta, OP ∈ OP (U), e OP (·) stabilisce un omeomorfismo di U nell’immagine OP
g g g (U) ⊂ S.
Osservazione 1. Tale teorema ci dice che possiamo utilizzare le variabili q come parametri
descriventi localmente S, infatti per (1) siamo sicuri OP = OPg (q) ∈ S, inoltre, per (2),
con tale mappa descriviamo ‘localmente ma completamente’ S perché OP g (U) è un insieme
N
aperto di S, nella sua topologia indotta. Tali variabili q ∈ U ⊂ R si dicono coordinate
Lagrangiane (locali) per S.
Osservazione 2. La mappa inversa dell’omeomorfismo sopra descritto,
g (U) 3 OP 7−→ q = q(OP ) ∈ U ⊂ RN ,
S ⊃ OP
si dice carta locale per S: descrive un pezzo dell’oggetto non lineare S con un pezzo dello
spazio vettoriale RN , proprio come le carte geografiche.
5
si richiama che al differenziale di f valutato in un punto, che è una mappa lineare, resta associata una
matrice di k righe e 3n colonne.
11
Osservazione 3. Un’attenta ispezione della dimostrazione (e di enunciati non necessaria-
mente legati all’applicazione in meccanica) del teorema del Dini mostra che le coordinate
(1) (n)
Lagrangiane q1 , ..., qN , N = 3n − k, sono selezionabili tra le 3n variabili x1 , ...., x3
complementari rispetto alle k colonne rispetto alle quali leggiamo il rango massimo nella
matrice del differenziale sopra introdotta. Consideriamo il seguente esempio: Superficie
sferica di raggio R > 0.
Sia n = 1, k = 1 e sia f data:
f : R3 −→ R
(x1 , x2 , x3 ) 7−→ f (x1 , x2 , x3 ) = (x1 )2 + (x2 )2 + (x3 )2 − R2
n o
S = f −1 (0) = (x1 , x2 , x3 ) : (x1 )2 + (x2 )2 + (x3 )2 − R2 = 0
Consideriamo per esempio il punto OP = (x̄1 , x̄2 , x̄3 ) = (0, 0, R), il ‘polo nord’ di S.
∂f ∂f ∂f
rk df (OP ) = rk ∂x 1 ∂x2 ∂x3
OP
= rk 2x1 2x2 2x3 OP = rk 0 0 2R = 1 = k.
12
numero N è detto Dimensione di S. Benché non ogni sottovarietà si descriva globalmente
come zeri di funzione, localmente questo è sempre possibile.
Osservazione 5. Spazi Tangenti ad una varietà vincolare S. Formalmente, pensando alle
sottovarietà immerse in R3n , lo spazio tangente in OP a S,
TOP S
è la varietà affine immersa in R3n che contiene OP , che ha la stessa dimensione di S, e che
‘approssima al primo ordine’ S. (Primo esempio semplice a cui pensare: curva differenziale
e retta tangente in un suo punto.) Definizione alternativa equivalente: è l’insieme delle
classi di equivalenza delle locali curve differenziali ] − , [ 3 λ 7→ OP (λ) ∈ S a valori in S
e transitanti per λ = 0 per il punto OP , ove la relazione di equivalenza è:
d d
OP (·) ∼ OP 0 (·) se e solo se OP (0) = OP 0 (0)
dλ dλ
• La varietà vincolare S sia localmente descritta come zeri di una funzione f : in tal caso,
le curve sopra descritte, tra le quali abbiamo definito la relazione d’equivalenza ∼, hanno
la proprietà
f (OP (λ)) = 0 ∀λ ∈ ] − , [,
differenziando rispetto a λ e valutando in λ = 0, denotando con il simbolo (è un uso antico
in meccanica)
d d
δP := OP (0) = ... = OP 0 (0)
dλ dλ
il vettore ‘velocità’ caratterizzante la classe, osserviamo che
d
0= [f (OP (λ))]|λ=0 = df (OP (0))δP
dλ
Dunque:
TOP S = ker [df (OP )] (ker : nucleo) (∗)
•• La varietà vincolare S sia localmente descritta con una mappa d’immersione vincolare
U 3 q 7→ OPg (q) ∈ R3n : in tal caso costruiremo l’insieme delle curve componendo la
mappa d’immersione OP g (·) con tutte le arbitrarie curve differenziali λ 7→ q(λ) a valori in
U e transitanti per il medesimo q̄ per cui OP = OPg (q̄),
d g g (q̄) d q(0),
δP = [OP (q(λ))]|λ=0 = dOP
dλ dλ
d
ove i vettori dλ q(0) percorrono tutto RN . Dunque:
TOP S = im [dOP
g (q̄)] (im : immagine) (∗∗)
13
Osservazione 6. Spostamenti Virtuali. A volte il vincolo è rappresentato da una varietà
mobile, dipendente dal tempo. Si pensi per esempio ad una particella (n = 1) vincolata
sopra una superficie sferica con raggio ‘pulsante’ R(t) = 2 + sin t. Ad ogni t ∈ R, tale
varietà sarà descritta dagli zeri di una funzione che ora dipenderà dal tempo:
f : R3n × R −→ Rk
(OP1 , ...., OPn , t) 7−→ fα (OP1 , ...., OPn , t)
α=1,...,k
n o
St = OP ∈ R3n : f (OP, t) = 0
Si ripercorrono, parametricamente per ogni t fissato, le costruzioni di prima: in sostanza,
per t fissato, si ‘congela’ temporalmente la varietà mobile e si costruiscono, per esempio,
gli spazi tangenti TOP St , naturalmente se OP ∈ St ; è uso classico in meccanica chiamare
spostamenti virtuali i vettori δP degli spazi TOP St .
14
1.1.7 Moti Dinamicamente Possibili
Nel sistema di riferimento inerziale scelto, in cui abbiamo costruito gli oggetti descriventi
il sistema materiale vincolato, ed in ogni altro sistema di riferimento inerziale (lo studio di
quest’ultimo aspetto necessita di un accurato sviluppo della cinematica relativa), vale la
seguente costruzione dei moti dinamicamente possibili. Questo è in sostanza il contenuto
della Seconda Legge della Meccanica Classica.
Diremo che la curva due volte differenziabile
R ⊇ I 3 t 7→ OP (t) = (OP1 (t), ..., OPi (t), ..., OPn (t)) ∈ R3n
è un moto dinamicamente possibile se, per ogni istante t in cui il moto è definito,
i) il vincolo è capace di esplicare delle reazioni vincolari
15
Pertanto il problema fondamentale della ricerca dei moti dinamicamente possibili (solo per
il momento ristretto al caso di assenza di vincolo) diventa: determinare curve R ⊇ I 3 t 7→
z(t) ∈ R6n per cui, ∀t ∈ I,
ż(t) = Z(z(t), t) (†)
La funzione Z(z, t) si chiama campo vettoriale; pensiamo al caso, per semplicità, indipen-
dente dal tempo, z 7→ Z(z), essa va cosı́ interpretata geometricamente:
in ogni punto z dello spazio7 (pensiamolo pure ‘affine’) attacchiamo il vettore Z(z), e in
questa ‘selva di frecce’ le curve risolventi sono quelle curve differenziabili le cui velocità
sono, punto per punto z(t) ove transitano, esattamente le frecce-vettori assegnate Z(z(t)).
Un teorema fondamentale di Cauchy, riportato qui sotto, ci dice sostanzialmente che un po’
di regolarità analitica per Z permette di affermare l’esistenza di una ed un’unica soluzione
locale di (†) che transita ad un dato istante prefissato t0 per il punto(=posizione+velocità)
z0 . Quando questo teorema funziona in meccanica, si parla spesso di ‘determinismo
classico’.
(Una versione del) Teorema di esistenza e unicità locale per i problemi di Cauchy
delle equazioni differenziali ordinarie : Sia il campo vettoriale dipendente dal tempo
Z,
Z : U (⊆ R6n ) × I(⊆ R) −→ R6n , z0 ∈ U = U ◦ , t0 ∈ I = I ◦
continuo e, uniformemente in t ∈ I, Lipschitziano in z,
16
è di equilibrio per il nostro sistema meccanico se il moto di quiete in tale configurazione è
dinamicamente possibile; più in dettaglio, (OPi∗ )i=1,...,n è di equilibrio se il vincolo è capace
di esplicare delle reazioni vincolari t 7→ (..., Φi (t), ...) ∈ ΥOP ∗ ,0,t tali che, per ogni t,
Si noti con attenzione che mentre l’equilibrio è una configurazione, la quiete è un moto.
E’ pure importante la seguente osservazione: Il fatto che una certa configurazione sia
d’equilibrio non implica necessariamente che il moto conseguente al porre il sistema in
quella configurazione con atto di moto nullo
√ sia la quiete. Esempio. Una particella di
3
massa m soggetta alla forza F(OP ) = OP · u u è vincolata senza attrito su di un
asse X parallelo al versore u e contenente l’origine. E’ facile mostrare (farlo) che i moti
dinamicamente possibili sono dati da tutte e sole le soluzioni di
√
mẍ = 3 x,
17
1.4 Un sistema meccanico la cui dinamica è retta dall’equa-
zione differenziale ẍ = f (x), con x ∈ R1
(Attenzione: all’interno di questo lungo esempio è introdotta la nozione di Integrale Primo.)
unitaria:
dOP dOP dλ̄
g
(s) 3 = (λ)λ=λ̄(s) (s) 3 ≡ 1.
ds dλ ds
R R
18
Tale derivata la chiameremo versore (=vettore unitario) tangente:
dOP
g
t(s) := (s).
ds
dt
Studiamo la derivata di t. Indichiamo con n, laddove è definito ( ds (s) 6= 0), il seguente
versore:
dt
ds (s)
n(s) :=
.
dt
ds (s)
Per esempio, per una retta t è costante, dunque n non è (ovunque) definito. Anzi,
quest’esempio ci suggerisce di definire come curvatura k della curva in s la quantità scalare:
dt
k(s) := (s).
ds
Introduciamo pure la definizione
1
ρ(s) := .
k(s)
Si noti che i versori t e n sono tra loro ortogonali, infatti (t · t ≡ 1):
d n(s)
0= (t(s) · t(s)) = 2 t(s) · .
ds ρ(s)
Notiamo che, al secondo ordine in s (cioè a meno di O(s3 )), la curva è descritta nel piano π
passante per il punto OP
g (0) e generato dai vettori t(0) e n(0). In tale piano consideriamo
il cerchio che passa per OP
g (0), ha raggio ρ(0), e centro in OC = OP ˜ (0) + ρ(0)n(0). (Si
abbozzi in un disegno un piano cartesiano in cui il versore x̂ è n(0) e il versore ŷ è t(0)).
Scriviamo l’equazione parametrica di tale cerchio nel parametro lunghezza d’arco s:
s s
OQ(s) = OP (0) + ρ(0) sin
g t(0) + ρ(0) 1 − cos n(0).
ρ(0) ρ(0)
19
Calcoliamo derivate prime e seconde di OQ(s) in s = 0:
d s s
OQ(s)s=0 = cos t(0) + sin n(0) s=0 = t(0),
ds ρ(0) ρ(0)
d2 1 s 1 s n(0)
2
OQ(s)
s=0
= − sin t(0) + cos n(0)
s=0
= .
ds ρ(0) ρ(0) ρ(0) ρ(0) ρ(0)
Dunque, effettivamente tale cerchio cosı̀ costruito approssima la curva, localmente in s∗ = 0,
al secondo ordine.
(Si veda pure: G. De Marco, Analisi Due/1, cap. 3, Par. 9 e 10, oppure G. De Marco,
Analisi Due (seconda edizione) alla fine del cap. 3.)
Riprendiamo ora la descrizione del nostro sistema dinamico. Sia t 7→ s(t) un generica
evoluzione di P sulla guida. Supponiamo che la particella sia vincolata senza attrito sulla
guida: ciò è equivalente a dire che la classe delle reazioni vincolari esplicabili, quando l’atto
di moto vale
g (s(t)), d OP
h i
OP g (s(t)) ,
dt
è data da tutti e soli i vettori del piano di origine OP g (s), e generato da n(s), b(s) ; in
altre parole, le possibili reazioni vincolari non hanno componente tangente al vincolo.
Ora possiamo dire che un moto t 7→ s(t), e dunque t 7→ OP g (s(t)), è dinamicamente possibile
se e solo se il vincolo è capace di esplicare una reazione vincolare t 7→ Φ(t) con Φ · t ≡ 0
tale che, per ogni tempo t in cui è definito il moto, valga:
d2 h g i
m 2 OP (s(t)) = F OP g s(t) + Φ(t),
dt
20
proiettando sul triedro mobile di Frênet, risulta:
ms̈(t) = F OP g s(t) · t(s(t)),
2
m ṡ% = F · n + Φ · n,
0 = F · b + Φ · b.
s̈(t) = f (s(t)),
(∗) s(0) = s0 ,
ṡ(0) = ṡ0 ,
1 g
f (s) := F OP s · t(s),
m
si risolvono a meno del calcolo di primitive di integrali e di inversioni di funzioni. Questa
proprietà, goduta dai sistemi differenziali lineari, è rarissima nel caso non lineare, come
appunto quello che stiamo trattando. Qui nel seguito realizzeremo questo programma.
Nelle ipotesi di regolarità scelte per F e per la curva-guida (C 2 ), segue che f è C 1 , in
particolare Lipschitziana, dunque il teorema di esistenza ed unicità per i problemi di Cauchy
vale: (∗) ammette una ed un unica soluzione locale (nel tempo, per t in un intervallo
aperto contenente lo zero). Mostriamo che (∗) ammette il seguente integrale primo, di tipo
‘energia’ Z s
2 1 2
R 3 (s, ṡ) 7−→ E(s, ṡ) := ṡ − f (λ) dλ ∈ R,
2 s0
infatti lungo le soluzioni s(t) di s̈ = f (s) la funzione E(s, ṡ)s(t) è costante:
d
E(s(t), ṡ(t)) = ṡ s̈ − f (s) ṡ = s̈ − f (s) ṡ = 0.
dt
Digressione-richiamo sugli integrali primi: data l’equazione differenziale
ẋ = X(x), X : Rm −→ Rm
21
la funzione scalare Rm 3 x 7→ φ(x) ∈ R è un suo integrale primo se lungo ogni sua soluzione
t 7→ x(t) la funzione composta t 7→ φ(x(t)) è costante (naturalmente, la costante varia da
soluzione a soluzione). Utilizzazione geometrica degli integrali primi: abbassamento della
dimensionalità del problema. Infatti, se si conosce l’integrale primo φ, e si vuol indagare
sulla regione di Rm ‘invasa’ dall’orbita soluzione del problema di Cauchy
ẋ = X(x), x(0) = x0 ,
Si tratta ora di mostrare l’equivalenza del problema (∗) con il seguente problema
1
Rs
2 ṡ2 − s0 f (λ) dλ = 12 ṡ20 ,
(∗∗) s(0) = s0 ,
ṡ(0) = ṡ0 .
Quest’ultimo infatti coinvolge la derivata prima della funzione incognita s(t), in realtà,
invece di un abbassamento dimensionale abbiamo realizzato un abbassamento dell’ordine
di differenziazione della primitiva equazione differenziale che coinvolge la derivata seconda.
Le due procedure sono equivalenti: nel seguente senso, ogni equazione differenziale di ordine
k,
dk d k−1
d k−2
(#) dtk
x = X( dtk−1 x, dtk−2 x, ..., x)
22
si può ridurre al primo ordine aumentando opportunamente le variabili e dunque la dimen-
sionalità:
ẋ0 = x1 ,
ẋ1 = x2 ,
ẋ2 = x3 ,
(##)
.... .......
ẋk−2 = xk−1
ẋk−1 = X(xk−1 , xk−2 , ..., x1 , x0 )
Torniamo al problema dell’equivalenza. Il fatto che (∗) implica (∗∗) è banale, un po’
più delicato è il viceversa. Si noti che in (∗∗) la derivata d’ordine massimo, la prima,
non compare esplicitata rispetto al resto, cioè quell’equazione differenziale non è in forma
normale, questo creerà qualche (superabile) complicazione.
Per fissare le idee, sia ṡ0 6= 0. Supponiamo dunque che t 7→ s(t) risolva (∗∗). Sia t1
il primo istante d’arresto per tale moto, cioè ṡ(t) 6= 0 ∀t ∈ [0, t1 ) e ṡ(t1 ) = 0. Derivando
rispetto al tempo la (∗∗)1 otteniamo
s̈(t) − f (s(t)) ṡ(t) = 0,
che per t ∈ [0, t1 ), dunque ṡ(t) 6= 0, implica la (∗)1 . Cosa accade per t ≥ t1 ? Per t = t1
può capitare una delle due seguenti situazioni:
1) s1 = s(t1 ) è d’equilibrio: f (s1 ) = 0,
2) s1 = s(t1 ) non è d’equilibrio: f (s1 ) 6= 0.
Il primo caso non può accadere per t1 finito: infatti se cosı́ fosse il sistema arrivato lı́ con
velocità nulla dovrebbe ivi restarci per sempre, per il teorema di esistenza e unicità, per
ogni t, nel futuro e nel passato di t1 . Dunque sarebbe proprio il teorema di unicità ad
essere violato perché avremmo trovato due soluzioni al problema di Cauchy
s̈(t) = f (s(t)),
s(t1 ) = s1 ,
ṡ(t1 ) = 0,
23
Più precisamente, t1 è un istante di inversione del moto, infatti (Taylor):
1
s(t) = s(t1 ) + 2! f (s1 )(t − t1 )2 + O(|t − t1 |3 ),
l’ultima di queste relazioni mostra chiaramente che la velocità ṡ(t) cambia segno in t1 .
Procediamo quindi con il problema (∗∗). Dato che abbiamo supposto che ṡ0 6= 0, in un
Si risolve per ‘separazione di variabili’. Dato che in [0, t1 ) si ha che Ψs(t)) 6= 0, scriviamo
ṡ(t)
Ψ(s(t)) = 1, e integriamo membro a membro tra 0 e t:
t
ṡ(t0 )
Z
dt0 = t.
0 Ψ(s(t0 ))
Sempre in [0, t1 ) sicuramente il moto soluzione t 7→ s(t) è un diffeomorfismo con l’immagine,
usiamolo per operare un cambio di variabile d’integrazione
Z s
1
0)
ds0 = t.
s0 Ψ(s
Indichiamo con G(s) la primitiva del primo membro: l’inversione di G(s) = t è esattamente
la soluzione cercata t 7→ s(t).
rappresentano il sostegno delle curve soluzione dei problemi di Cauchy per l’equazione
ẍ = f (x):
E −1 (e) = {(x, ẋ) : E(x, ẋ) = e}.
Studiamone la geometria globalmente.
• il grafico di E −1 (e) in R2 è simmetrico rispetto all’asse x: in effetti, E è funzione pari in
ẋ.
24
• Il teorema della funzione implicita ci assicura che E −1 (e) è regolare (una ‘varietà’ 1-
dimensionale in R2 ) se il rango
rk ∂E∂x
∂E
∂ ẋ E −1 (e)
= −f (x) ẋ E −1 (e) = max = 1.
Studiamo gli eventuali punti singolari, questi sono i punti (x∗ , ẋ∗ ) che annullano i due
elementi della matrice: f (x∗ ) = 0, ẋ∗ = 0. Dunque questi punti sono esattamente le
configurazioni d’equilibrio per ẍ = f (x), assieme a ẋ∗ = 0, dato che stiamo leggendo la
nostra equazione nello spazio degli atti di moto o delle fasi. Tali punti singolari sono tutti
e soli sull’asse x.
• Possono esistere rami di E −1 (e) con punti (x, ẋ), ẋ 6= 0, nei quali la tangente sia verticale,
parallela all’asse ẋ? No, le locali funzioni x 7→ ẋ(x) —i cui grafici sono in {(x, ẋ) ∈ R2 :
ẋ > 0} e {(x, ẋ) ∈ R2 : ẋ < 0}, e definite negli intervalli aperti (x1 , x2 ) tra consecutivi punti
di intersezione con l’asse x, (x1 , 0), (x2 , 0)— sono differenziabili, quindi la fenomenologia
sopra descritta non può accadere.
• Sui rami di E −1 (e) possiamo agevolmente stabilire il verso di percorrenza: questo sarà
inequivocabilmente stabilito dal locale segno di ẋ: per esempio, se E −1 (e) è una curva
chiusa (naturalmente, simmetrica rispetto all’asse x) allora essa è percorsa in senso orario.
• Proseguendo con l’esempio di E −1 (e) curva chiusa, se essa è regolare allora necessaria-
mente interseca l’asse x due volte e con tangente, diciamo in (x1 , 0) e (x2 , 0), verticale, cioè
parallela all’asse delle ẋ. Curve E −1 (e) che intersecano l’asse x in x̄ con angoli diversi da
π/2 sono necessariamente ivi singolari, e danno luogo a rami intersecantesi in x̄: esempio,
le separatrici del pendolo in x(= θ) = π.
• Ancora con l’esempio di E −1 (e) curva chiusa. Il moto è periodico, e il periodo si calcola
(verificarlo): Z x2
dx
T =2 r .
x1 R x
2 e + a f (λ)dλ
E’ interessante notare la relazione Periodo-Energia: Sia A(e) l’area racchiusa dalla curva
chiusa E −1 (e), essa vale
Z x2 Z x2 s Z x
A(e) = 2 ẋ(x; e)dx = 2 2 e+ f (λ)dλ dx,
x1 x1 a
dove x 7→ ẋ(x; e) è l’esplicitazione nel semipiano ẋ > 0 di E(x, ẋ) = e; si osserva che:
dA
T = (e).
de
25
Grafico della funzione Energia Totale per il Pendolo
26
Altri esempi a questo stadio facilmente risolubili. Consideriamo una particella vincolata
senza attrito su di un piano π e una legge forza F(OP, v) (eventualmente lineare: in tal
caso infatti le soluzioni sono rappresentabili mediante funzioni elementari). Introdotto un
riferimento (O, x1 , x2 , x3 ) con (O, x1 , x2 ) coincidente con π, con un procedimento analogo al
precedente (ora si proietta l’equazione fondamentale della Meccanica sui tre assi xi ) si nota
ancora il disaccoppiamento della determinazione del moto dalla reazione vincolare. Tale
moto sarà governato da un’ equazione differenziale del secondo ordine nel piano, fornente
t 7→ (x1 (t), x2 (t)).
27
Usando il classico teorema di omomorfismo (per spazi vettoriali) (vedi: De Marco, Analisi
Due/1, p.331) concludiamo che esiste una mappa lineare Λ : Rk → R tale che
k
X
dLΦ = Λ ◦ df (OP ∗ ), o, equivalentemente : Φi = λα ∇OPi fα (OP ∗ )
α=1
dLΦ
R3n −→ R
df (OP ∗ ) ↓ % Λ
Rk
Le componenti di Λ = (λ1 , ..., λk ) sono i ben noti Moltiplicatori di Lagrange. Infine, i moti
dinamicamente possibili consistono nelle soluzioni del sistema algebrico-differenziale
d2
OPl (t), t) + kα=1 λα (t)∇OPi fα (OPj (t)),
d P
mi dt 2 OPi (t) = Fi (OPj (t), dt
fα (OPj (t)) = 0
k
d2 d X
mi OPi (t) = F i (OP (t), OP (t), t) + λα (t)∇OPi fα (OP (t)) (1)
dt2 dt
α=1
Le incognite del problema sono sia i moti che i moltiplicatori cioè t 7→ (OPi (t), λα (t)).
Deriviamo rispetto al tempo fβ (OP (t)) = 0 e otteniamo:
n
X d
∇OPi fβ (OP ) · OPi (t) = 0
dt
i=1
28
Derivando di nuovo si ottiene:
* +
X d d X d2
∇2OPk OPi fβ · OPk (t), OPi (t) + ∇OPi fβ · 2 OPi (t) = 0. (2)
dt dt dt
k,i i
k
d2 Fi d X ∇OPi
OPi (t) = (OP (t), OP (t), t) + λα (t) fα (OP (t)),
dt2 mi dt mi
α=1
da cui si ha:
k
!
X d2 X Fi X X ∇OP fβ (OP ) · ∇OP fα (OP )
i i
∇OPi fβ (OP )· 2 OPi = ∇OPi fβ (OP )+ λα
dt mi mi
i i α=1 i
(3)
Definiamo
X 1
Λβ,α := ∇OPi fβ (OP ) · ∇OPi fα (OP )
mi
i
k
* +
X d d X Fi X
− ∇2OPk OPi fβ · OPk (t), OPi (t) = ∇OPi fβ (OP ) + Λβ,α λα (4)
dt dt mi
k,i i α=1
Osserviamo che Λα,β è non degenere, ciò discende dal fatto che il rango di df è massimo
cioè: rango(df )|f =0 = k, questo implica che la forma quadratica associata a Λα,β è definita
positiva, infatti:
k
!
X X X ∇OP fα X ∇OP fβ
Λα,β ξα ξβ = √ i ξα · √ i ξβ = |v|2R3n .
α
m i α
mi
α,β=1 i
P P ∇OPn fα
∇OP1 fα
dove v = α
√
m1 ξ α , ..., α
√
mn ξα . Poiché si ha v = 0 ⇐⇒ (ξ)α=1,...,k = 0
ne segue che è una forma quadratica definita positiva. Quindi det Λα,β 6= 0 e dalla (4)
possiamo infine esplicitare:
˙ , t).
λα = λ̃α (OP, OP
29
1.6 Il modello di Coulomb dell’attrito
Consideriamo una particella vincolata su una varietà 1-dimensionale (curva) o 2-dimensionale
(superficie). Vogliamo definire la classe ΥOP,v,t delle reazioni vincolari nel caso che il vincolo
sia con attrito. Scriveremo
Φ = ΦT + ΦN ,
ove ΦT è la componente vettoriale di Φ sul piano tangente al vincolo, la cosiddetta forza
d’attrito, e ΦN è la componente vettoriale ortogonale al piano tangente. v 6= 0: in tal caso
diremo che il vincolo esplica tutte e sole le reazioni vincolari tali che
v
ΦT = − fd |ΦN |,
|v|
ove 0 ≤ fd è detto coefficiente di attrito dinamico e i moti dinamicamente possibili sono
caratterizzati da
ma(t) = F(OP (t), v(t), t) + Φ(t).
v(t∗ ) = 0, primo caso: se accade che, detto fs il coefficiente di attrito statico, 0 ≤ fd ≤
fs , e in un opportuno intorno destro I di t∗ ,
dato che v è tangente al vincolo. Ora consideriamo l’equazione dinamica (per v(t) 6= 0),
proiettiamola sul vincolo, e valutiamo il seguente limite
aT (t∗ )(t − t∗ ) + o(t − t∗ )
lim maT (t) = lim (FT (OP (t), v(t), t) − fd |ΦN (t)|),
t→(t∗ )+ t→(t∗ )+ |aT (t∗ )(t − t∗ ) + o(t − t∗ )|
otteniamo che
versaT (t∗ ) = versFT (OP (t∗ ), 0, t∗ ).
30
(Quest’ultimo risultato è detto talvolta teorema del moto incipiente, per esempio, nel Levi
Civita-Amaldi). Infine:
Alcune osservazioni. Notiamo che l’insieme delle reazioni esplicabili dipende dall’atto
di moto (configurazione e velocità) della particella. Consideriamo per esempio il caso del
vincolo di superficie: in situazione di quiete le reazioni vincolari possibili appartengono
alla chiusura del cono a due falde di semi-apertura arctan(fs ), in situazione dinamica le
reazioni vincolari possibili appartengono alla superficie conica a due falde di semi-apertura
arctan(fd ) e con la forza d’attrito che si oppone al moto. (Compiere l’analoga analisi per il
vincolo 1-dimensionale). Si noti che il modello di Coulomb dell’attrito non consiste in una
mera definizione della classe delle reazioni vincolari sviluppabili: pure la seconda legge della
meccanica ne risulta modificata. I coefficienti d’attrito sono di determinazione empirico-
sperimentale e sono costitutivi del nostro sistema vincolato; la relazione fd ≤ fs esprime il
fatto (euristico, ma fisicamente attendibile) che, a parità di forza attiva F, la forza d’attrito
può essere maggiore (in intensità) nelle situazioni statiche rispetto a situazioni dinamiche,
in altre parole, è più difficile mettere in moto un sistema con attrito che mantenere il moto
stesso.
Esercizi.
1) Su un piano inclinato π rispetto alla verticale di un angolo α è vincolata con attrito
una particella di massa m. Oltre la gravità, agisce sulla particella una forza elastica di
costante h > 0 di centro un punto fisso O sul piano π. Detto fs il coefficiente di attrito
statico, determinare tutte le configurazioni d’equilibrio.
2) Su di un asse orizzontale X è vincolata con attrito una particella di massa m. Oltre
alla gravità, agisce sulla particella una forza elastica di costante h > 0 di centro un punto
fisso O sull’asse X. Detti fd ≤ fs i coefficienti di attrito, i) determinare tutte le configura-
zioni d’equilibrio, ii) studiare la dinamica di tale sistema, in particolare, determinare dopo
quanto tempo il sistema si arresta se l’atto di moto iniziale consiste di una configurazioni
di non equilibrio e di velocità nulla, iii) dimostrare che O è una configurazione d’equilibrio
Lyapunov stabile, iv) confrontare questo sistema dinamico con quello che si ottiene da
quest’ultimo supponendo privo d’attrito l’asse X, fd = fs = 0, e supponendo agisca, oltre
la gravità e la forza elastica, una forza di resistenza di mezzo di tipo viscoso Fv = −kv,
ove k > 0 e v è la velocità.
31
Come accennato precedentemente nel punto 6, mostriamo che effettivamente la classe
dei vincoli lisci contiene propriamente la classe dei vincoli privi di attrito. Consideriamo un
disco materiale di raggio R vincolato senza attrito a stare in un piano π, ed a ruotare senza
strisciare su di un asse x (retta) di tale piano. Dal punto di vista geometrico tale vincolo si
propone come vincolo anolonomo: infatti il puro rotolamento significa che (l’unica) velocità
consentita dal vincolo al punto materiale P del disco che localmente transita per il punto
geometrico C di contatto con la retta x è la velocità nulla. Un conto geometrico-cinematico
molto semplice mostra che tale vincolo anolonomo (vP = 0) è equivalente ad una famiglia
1-parametrica di vincoli olonomi (fare, xG = Rθ + x0G , ove G è il baricentro del disco, θ
è un angolo tra un raggio del disco e una retta del piano π, e x0G scandisce la suddetta
famiglia 1-parametrica). Veniamo alla parte dinamica del vincolo. Le reazioni vincolari che
mantengono il disco nel piano fanno senz’altro lavoro virtuale nullo (assenza di attrito). Il
puro rotolamento si esplica, volta per volta, sui punti materiali P che localmente transitano
per il punto geometrico C di contatto con la retta x. Evidentemente il vincolo esplicherà, in
tutta generalità, una componente ΦT parallela a x non nulla: in caso contrario (ΦT = 0)
ci dovremo aspettare slittamento, come un pneumatico sul ghiaccio. Ma la classe degli
spostamenti virtuali δP (che coincidono con i possibili, dato che sono indipendenti dal
tempo) per i suddetti punti materiali P coincide con lo spazio banale nullo {0}. Dunque:
δL(v) = Φ · δP ≡ 0, che mostra che il vincolo è liscio, nonostante una componente d’attrito
non necessariamente nulla.
Consideriamo ora il fondamentale teorema caratterizzante i moti dinamicamente pos-
sibili nel caso liscio mediante una ‘condizione variazionale’; questo è classicamente noto
come
Principio di D’Alembert. Sia dato un sistema particellare vincolato St soggetto ad un
generale sistema di leggi-forza come sopra considerato. Allora [t0 , t1 ] 3 t 7→ OP (t) ∈ St è
dinamicamente possibile se e soltanto se per ogni t ∈ [t0 , t1 ] e per ogni vettore appartenente
al piano tangente (spostamento virtuale) δP = (δP1 , ..., δPn ) ∈ TOP (t) St vale la seguente
‘condizione variazionale’:
n
X d2 d
[mi OPi (t) − Fi (OP1 (t), ..., OPn (t), t)] · δPi = 0.
dt2 dt
i=1
32
Dimostrazione (del Principio di D’Alembert). Supponiamo che [t0 , t1 ] 3 t 7→ OP (t) ∈ St
sia dinamicamente possibile, allora il vincolo esplica delle reazioni vincolari tali che
d2 d
mi OPi (t) = Fi (OP1 (t), ..., OPn (t), t) + Φi (t)
dt2 dt
con
n
X
Φi (t) · δPi = 0, ∀δP ∈ TOP (t) St ,
i=1
dato che il vincolo è liscio; dunque, vale la condizione variazionale.
Viceversa, la curva [t0 , t1 ] 3 t 7→ OP (t) ∈ St sia compatibile col vincolo e per essa valga
la condizione variazionale. Definiamo le seguenti funzioni del tempo
d2 d
Ψi (t) := mi OPi (t) − Fi (OP1 (t), ..., OPn (t), t).
dt2 dt
La condizione variazionale ci dice che per ogni istante t ∈ [t0 , t1 ] vale
n
X
Ψi (t) · δPi = 0, ∀δP ∈ TOP (t) St .
i=1
Dato che tale vincolo esplica tutte e sole le reazioni vincolari soddisfacenti a ni=1 Φi ·δPi =
P
0, in particolare esplicherà pure le Ψi (t), e ciò è quanto ci basta per dire che il moto è
dinamicamente possibile.
Si noti che uno degli aspetti operativi più importanti di tale teorema è che i moti
din. poss. si caratterizzano senza introdurre (e calcolarle) le reazioni vincolari. Questo
consentirà, nel caso liscio olonomo bilaterale (eventualmente dipendente dal tempo), la
costruzione della dinamica mediante le equazioni di Lagrange.
33
ove P indica la quantità di moto di S. Definito il baricentro G, ha senso introdurre il
sistema (non inerziale) (G, ei ), detto sistema del baricentro, con origine coincidente con
G ed assi sempre paralleli a quelli di (O, ei ), per cui si ha (formula di composizione delle
velocità)
(τ ) (r) (r)
ω (τ ) = 0, v (τ ) = vG , vi = vi + vi = vG + vi .
Si dimostrano facilmente le seguenti relazioni
X X
mi GPi = mi (OPi − OG) = mOG − mOG = 0
i i
d X X (r)
0= mi GPi = mi vi = P (r) .
dt
i i
(r) (r)2
X X X
2T = mi vi2 = mi (vi + vG )2 = mi vi 2
+ mvG + 2vG · P (r) ,
i i i
1 2
TS = mvG + T (r) .
2
Sia A un punto (fisso o mobile) nel riferimento inerziale; il momento angolare o momento
della quantità di moto di S rispetto al polo A è
X
MA = APi ∧ mi vi
i
34
1.8.1 Equazioni Cardinali
Sia S un sistema di n punti materiali di masse mi , i = 1, . . . , n. Suddividiamo le forze
agenti sull’ i-esimo punto del sistema in due classi: le forze interne Fiint , ovvero dovute
all’azione degli altri punti del sistema sul punto i-esimo, per le quali possiamo dare la
rappresentazione
Xn
int
Fi = fij , fii = 0, i = 1, . . . , n,
j=1
ove fij ∈ R3 indica la forza agente su i dovuta all’azione di j; e le forze esterne Fiext che
descrivono l’effetto sul punto i di corpi non appartenenti al sistema S. Questa distinzione
tra forze esterne e interne è complementare a quella di uso frequente tra forze attive e forze
vincolari; la sua utilità sta nel fatto che per le forze interne si fa l’ipotesi, importantissima
per gli sviluppi che vogliamo trarre, che esse siano un sistema equilibrato di forze (si veda
il Capitolo sui Vettori Applicati):
Rint = 0, NOint = 0.
Da tale ipotesi si ricavano le equazioni cardinali per il sistema particellare S, ovvero un
sistema di 3 più 3 equazioni differenziali scalari che sono necessariamente soddisfatte lungo
i moti OPi (t) dinamicamente possibili per il sistema ovvero soddisfacenti a
mi OP¨ i = F ext + F int , i = 1, . . . , n.
i i
Sommando sull’indice di particella i troviamo infatti che necessariamente
n
¨ i = Rext + Rint = Rext
X
maG = mi OP (P rima Equazione Cardinale)
i=1
Sia ora OA(t) la traiettoria del polo A rispetto al sistema inerziale di origine O usato per
descrivere il moto di S, di modo che si ha immediatamente che
d
OPi = OA + APi , e vi = vA + (APi ).
dt
Indichiamo con
Xn
MA = mi APi ∧ vi
i=1
il momento della quantità di moto rispetto al polo A; la sua derivata lungo un moto
dinamicamente possibile vale
Xn n
X
ṀA = mi (vi − vA ) ∧ vi + mi APi ∧ ai =
i=1 i=1
n
X
= −vA ∧ P + APi ∧ (Fiext + Fiint ) =
i=1
= −vA ∧ P + NAext + NAint = −vA ∧ P + NAext
35
ṀA = −vA ∧ P + NAext (Seconda Equazione Cardinale)
Osservazione. Le equazioni cardinali costituiscono un sistema di 6 equazioni che de-
vono essere necessariamente soddisfatte lungo il moto. E’ chiaro intuitivamente che, se il
sistema S ha più di 6 gradi di libertà, le equazioni cardinali non possono essere sufficienti a
determinare completamente il moto del sistema. Infatti, esse sono sufficienti a determinare
solo il moto del baricentro G, attraverso la prima equazione cardinale, e l’evoluzione del
momento della quantità di moto MA . Per una particolare classe di sistemi, i corpi rigidi
privi di ulteriori vincoli, le equazioni cardinali risultano essere esattamente equivalenti al
sistema delle equazioni descrivente i moti dinamicamente possibili.
vG = vi + ω ∧ Pi G, ∀ i = 1, . . . , n.
ω = ω (τ ) + ω (r) = ω (r) .
Per un generico sistema rigido con un punto fisso A, il momento angolare e l’energia cinetica
ammettono l’espressione seguente (si usa la formula del doppio prodotto vettore)
X X
MA = APi ∧ mi vi = mi APi ∧ (ω ∧ APi ) =
i i
X X
= mi (APi2 ω − (APi · ω)APi ) = mi (APi2 I − APi ⊗ APi )ω = IA ω
i i
36
ove a ⊗ b ∈ M (n) indica la matrice prodotto tensore dei due vettori a, b ∈ Rn
(a ⊗ b)u := a(b · u) ∀u ∈ Rn
e X
IA = mi (APi I − APi ⊗ APi ) ∈ M (n)
i
è il tensore d’inerzia del sistema (rigido) di punti materiali. Si tratta di un oggetto che
dipende dalla sola geometria della distribuzione delle masse del sistema rigido.
Prima di studiare le proprietà del tensore d’inerzia, ricaviamo l’espressione dell’energia
cinetica per un generico sistema rigido con un punto fisso
X X X
2TS = mi vi2 = mi (ω ∧ APi )2 = mi ω ∧ AP ii · ω ∧ AP ii =
i i i
X X
= mi ω · APi ∧ (ω ∧ APi ) = ω · mi APi ∧ (ω ∧ APi ) = ω · IA ω.
i i
Nel caso particolare di G punto fisso nel sistema del baricentro e ω (r) velocità angolare del
sistema rispetto al riferimento del baricentro, otteniamo l’analogo delle formule di König
per un sistema rigido
1 2 1
TS = mvG + ω · IG ω, (1)
2 2
MA = AG ∧ P + IG ω. (2)
1 ω2 ω2
T = ω · IA ω = u · IA u = Iu (3)
2 2 2
ove X X
Iu := u · IA u = mi (u ∧ APi )2 = mi d2i ≥ 0
i i
è il momento d’inerzia del sistema rispetto alla retta per A e parallela al versore u.
Esso coincide con la somma delle masse per le distanze al quadrato dei punti Pi dalla
retta per A. Come si vede subito, Iu non varia se si considera un altro punto A0 sulla
37
retta definita da (A, u). Dalla (3) si deduce che IA , simmetrico è definito positivo
ovvero
ω · IA ω ≥ 0, ω · IA ω = 0 ⇔ ω = |ω|u = 0,
tranne che nel caso in cui esista u∗ tale che Iu∗ = 0. In tal caso i punti di S sono
disposti tutti lungo una retta parallela a u∗ e S è solido degenere (asta).
P
. i
KAA
A
d A
A
A G
X X
Iu(A) = mi (u ∧ APi )2 = mi [(u ∧ AG) + (u ∧ GPi )]2 =
i i
X
= mi [(u ∧ AG) + (u ∧ GPi )2 + 2(u ∧ AG) · (u ∧ GPi )],
2
da cui
Iu(A) = md2 + Iu(G)
Esercizio. Mostrare che la relazione precedente è un caso particolare della formula
IO = IG + mOG ⊗ OG.
38
I termini extra–diagonali sono detti momenti deviatori
X
(IO )23 = e2 · IO e3 = mi (−yi zi )
i
5) Solidi piani (lamine). Sia e3 perpendicolare al piano che contiene il sistema. Allora
zi = 0 per ogni i = 1, . . . n e
X X X
I1 = mi (x2i + yi2 + 0 − x2i ) = mi yi2 , I2 = mi x2i
i i i
e si ha
(O) (O) (O)
I3 = I2 + I1 .
39
1.9 Teorema di Conservazione dell’Energia
Consideriamo un sistema vincolato di n particelle di masso mi > 0, i = 1, ..., n con vin-
colo liscio S ⊂ R3n , indipendente dal tempo (fisso), bilaterale (senza bordo), e soggetto
ad un sistema di forze (interne e/o esterne) di tipo conservativo di Energia Potenziale
U (OP1 , ..., OPn ), quindi: Fi (OP1 , ..., OPn ) = −gradOPi U (OP1 , ..., OPn ). Allora l’Energia
Totale:
E : R6n −→ R
n
˙ ˙ 1X ˙ i |2 + U (OP1 , ..., OPn )
E(OP1 , ..., OPn , OP 1 , ..., OP n ) := mi |OP
2
i=1
d ˙ 1 (t), ..., OP
˙ n (t) =
E OP1 (t), ..., OPn (t), OP
dt
n n
¨ i (t) · OP
˙ i (t) + ˙ i (t) =
X X
= mi OP gradOPi U (OP1 (t), ..., OPn (t)) · OP
i=1 i=1
n
˙ i (t).
X
= Φi (t) · OP
i=1
Dobbiamo considerare ora due fatti: primo, il vincolo è liscio bilaterale, dunque può
sviluppare tutte e sole le reazioni vincolari che fanno lavoro virtuale identicamente nullo
n
X
δLΦ = Φi · δPi = 0,
i=1
per ogni spostamento virtuale (δPi )i=1,...,n ∈ TOP S; secondo, il vincolo è fisso, dunque i
vettori velocità lungo i moti sono spostamenti virtuali (affermazione che non è vera nel
caso di vincolo mobile, dipendente dal tempo), pertanto:
n
d ˙ 1 (t), ..., OP
˙ n (t) = ... =
X
˙ i (t) = 0.
E OP1 (t), ..., OPn (t), OP Φi (t) · OP
dt
i=1
40
1.10 La restrizione di un sistema di forze conservativo è
conservativa
Consideriamo un sistema di n particelle libere, soggette ad un sistema conservativo di forze;
cioè, esiste una funzione energia potenziale
tale che la forza esercitata sulla particella i−esima dovuta alla presenza di tutte le altre
nelle configurazioni OP1 , ... è data da
In altri termini, l’insieme delle n funzioni 3-vettori forze Fi si può interpretare come l’in-
sieme delle componenti di una forma differenziale esatta (la forma ‘lavoro’ δLF ) in R3n di
cui −U è la primitiva:
n
X
F
δL = Fi (OP1 , ..., OPn ) · dOPi =
i=1
n
X
=− gradOPi U(OP1 , ..., OPi , ..., OPn ) · dOPi = −dU
i=1
Supponiamo ora di vincolare il nostro sistema in maniera olonoma, cioè mediante un vincolo
sulle configurazioni S ⊂ R3n , dimS = N < 3n di cui RN 3 q = (q h )h=1,...,N 7→ OP =
g (q) ∈ R3n sia la generica immersione/rappresentazione locale del vincolo. Ha dunque
OP
geometricamente senso definire la forma differenziale lavoro ristretta alla varietà vincolare
S; tale operazione è ben definita per ogni forma differenziale: (i) le componenti si valutano
non più in generici OP di R3n ma solo sui punti appartenenti a S, cioè su OP g (q) con q
N
arbitrario nel suo dominio di definizione (un aperto di R ) e (ii) tale forma ristretta non
la si valuta più su generici vettori di R3n bensı́ sui soli vettori tangenti ad S nei punti
OP
g (q) ove si sono valutate le componenti della forma. Ricordando che i vettori tangenti
si ottengono come immagine del differenziale dell’immersione vincolare, possiamo scrivere
la nuona forma differenziale ristretta:
n N
X X ∂ OP
g i (q)
δLF |S = Fi (OP
g (q)) · dq h (∗)
∂q h
i=1 h=1
41
ricordando il teorema di differenziazione delle funzioni composte
N
X ∂
δLF |S = − g ](q) dq h = −dU,
[U ◦ OP
∂q h
h=1
dove
U : RN −→ R, q 7→ U(q) := U(OP
g (q))
˙ )):
Ritorniamo sulla (∗) e nel caso non necessariamente conservativo (Fi = Fi (OP, OP
n N N
F
X X ∂ OP
g (q)
k
X ∂ OP
g i (q)
δL |S = Fi OP
g (q), q̇ · dq h (∗)
∂q k ∂q h
i=1 k=1 h=1
42
delle rappresentazioni vincolari mediante delle immersioni locali analoghe alle precedenti.
Il punto qualitativamente diverso consiste nel fatto che ora, invece dell’indice discreto di
particella i ∈ 1, ..., n, avremo un indice continuo y = (y1 , ..., yd ) ∈ C ∗ ⊂ Rd , ove d vale
1, 2, oppure 3, in relazione al fatto che il nostro corpo materiale di infinite particelle sia
rispettivamente 1- , 2- , oppure 3-dimensionale. Dunque:
PN ∂
R
= − h=1 ∂qh [ y∈C ∗ µ(y)U(OP (y, q))dy]δqh .
Esercizio. La terna cartesiana Oxyz ruota uniformemente rispetto agli spazi inerziali con
velocità angolare di trascinamento ω = ωẑ. Una lamina materiale C ∗ omogenea di massa
m è vincolata senza attrito sul piano Oxz. L’accelerazione di gravità è g = −g ẑ, cioè l’asse
z si dice ‘verticale ascendente’. Determinare l’energia potenziale lagrangiana U(q) dovuta
alla forza gravitazionale e a quella centrifuga.
Il generico punto materiale della lamina è indicato con y = (X, Z) ∈ C ∗ , mentre la
generica configurazione assunta dalla lamina è caratterizzata dai parametri Lagrangiani
43
q = (x, z, θ) ∈ R2 × S1 dove G = (x, z) è la posizione del baricentro e θ è l’ angolo formato
con una direzione invariante del sistema, infine µ : C ∗ → R+ è la densità (superficiale) di
massa della lamina.
Gravità:
Fg = mg = −∇OP (−mg · OP )
Allora per unità di massa si ha:
U (OP ) = −g · OP
δL(F ) = mg · dP = −d(−mg · OP )
Quindi:
Z Z
g
U (q) = µ(y)U (OP (y, q)) dy = − µ(y)g · OP (y, q) dy =
y∈C ∗ y∈C ∗
Z
= −g µ(y) · OP (y, q) dy
y∈C ∗
R
Ora usando la definizione di baricentro e il fatto che y∈C ∗ µ(y)dy = m si ha:
Centrifuga:
Per unità di massa si ha:
2
U (OP ) = − ω2 |P 0 P |2 ,
dove P 0 è il punto proiezione ortogonale di P sull’asse di rotazione z. Quindi:
ω 2 0
Z Z
centr
2
U (q) = µ(y)U (OP (y, q)) dy = µ(y) − P P (y, q) dy =
y∈C ∗ y∈C ∗ 2
ω2 ω2
Z
2
µ(y) P 0 P (y, q) dy = − Iz (q)
=−
2 y∈C ∗ 2
Per il teorema di Huygens-Steiner si ha:
ω2 ω2 ω2
mx2 + Iz 0 (θ) = − mx2 + nT (θ) I G n(θ)
− Iz (q) = −
2 2 2
Dove n(θ) è il versore dell’asse z 0 , parallelo a z e passante per il baricentro della lamina,
rappresentato nella base (G; X, Y, Z) solidale alla lamina in cui si costruisce la matrice
d’inerzia I G .
44
1.12 Appendice: Il Principio di Gauss
Si consideri un sistema di n particelle soggette al vincolo olonomo Σ, localmente descritto
da
risolvente f (OP ) = 0 rappresenta i vettori del locale piano tangente Tx Σ, gli ‘spostamenti
virtuali’ δP :
df (OP )δP = 0 (5)
Consideriamo una generica curva γ : I −→ R3n a valori in Σ e γ(0) = OP ; dunque:
f (γ(t)) ≡ 0. (6)
Da un punto di vista un po’ più formale possiamo richiamare il seguente fatto: se da un lato
gli elementi del fibrato tangente T Σ sono del tipo (γ(0); γ̇(0)) risolventi ( 7), gli elementi
del ‘secondo’ fibrato tangente T 2 Σ sono del tipo (γ(0); γ̇(0), γ̈(0)), naturalmente al variare
arbitrario di curve γ a valori in Σ, dunque risolventi le relazioni ( 7) e ( 8). Consideriamo
la mappa di proiezione
τ2,1 : T 2 Σ −→ T Σ, (9)
(x; v, a) 7→ (x; v), dove df (x)v = 0 e hd2 f (x)v, vi + df (x)a = 0 (10)
Si definiscono i vettori di T 2 Σ verticali rispetto a τ2,1 tutti e soli del tipo (x; 0, a), cioè
df (x)a = 0, (11)
e dal punto di vista cinematico rappresentano, per un assegnato ‘atto di moto’ (x; v) di
T Σ, le variazioni possibili in accelerazione compatibili col vincolo Σ a partire da (x; v). In
8 ˙ , a = OP
Scriveremo: x = OP, v = OP ¨ .
45
altri termini: se un vettore di T 2 Σ è dato da (x; v, a), allora ogni altro vettore di T 2 Σ,
compatibile con un prefissato atto di moto (x; v) ∈ T Σ, si ottiene sommando (solo sulle
fibre vettoriali, sopra lo stesso punto x) a (x; v, a) tutti e soli i vettori verticali (x; 0, δa)
con df (x)δa = 0, ottenendo cosı̀: (x; v, a + δa).
Naturalmente alla stessa conclusione giungiamo se, invece di rappresentazioni implicite
(f = 0) del vincolo, lavoriamo con immersioni vincolari del tipo (N = 3n − k):
g : V ⊂ RN
OP −→ R3n
(12)
(q 1 , ..., q N ) = q 7−→ OP
g (q).
v = dOP
g (q)q̇, a = hd2 OP
g (q)q̇, q̇i + dOP
g (q)q̈. (13)
Le variazioni di accelerazione δa, per fissato atto di moto, dunque per δ q̇ = 0, si ottengono
per
δa = dOPg (q)δ q̈ (14)
per arbitrari δ q̈. Quest’ultima relazione è la stessa caratterizzante gli spostamenti virtuali
δP = dOP
g (q)δq, (15)
È nodo cruciale nel Principio di Gauss il fatto che la relazione caratterizzante i vettori
verticali ( 14) sia esattamente la relazione caratterizzante gli ‘spostamenti virtuali’ ( 15).
Assegnate delle generiche funzioni-forza F (OP, OP ˙ ), consideriamo la funzione di Gauss:
G: T 2Σ −→ R
(16)
2
Pn mi ¨ i −Fi
OP
(q; q̇, q̈) 7→ G(q; q̇, q̈) := i=1 2mi ,
¨ = hd2 OP
ove s’intende OP g (q)q̇, q̇i + dOP
g (q)q̈ e F = F OP
g (q), dOP
g (q)q̇ .
Principio di Gauss: Un moto compatibile col vincolo olonomo e liscio Σ, dunque del tipo
OP (t) = OP
g (q(t)), I 3 t 7→ q(t) ∈ RN , (17)
è dinamicamente possibile se e solo se, per ogni istante in cui è definito, la funzione di
Gauss ivi valutata è minima per ogni variazione verticale dell’accelerazione, ovvero:
δv G := dG q(t); q̇(t), q̈(t) q(t); 0, δ q̈ = 0, ∀ δ q̈,
D E (18)
δv2 G := d2 G q(t); q̇(t), q̈(t) q(t); 0, δ q̈ , q(t); 0, δ q̈ > 0, ∀ δ q̈ 6= 0.
46
Osservazione. Si noti il significato della funzione di Gauss: per ogni configurazione OP ,
˙ , e distribuzione di accelerazioni OP
distribuzione di velocità OP ¨ , consentite dal vincolo, G
misura la somma su tutte le particelle della norma quadrato delle deviazioni di mi OP ¨ i da
Fi , quantità quest’ultima candidata ad essere la reazione vincolare, a quell’istante lungo
quel moto, sulla particella i-esima. La distribuzione dinamicamente possibile di accelera-
zioni è appunto, nel caso dei vincoli lisci, quella in corrispondenza della deviazione minima,
a parità d’atto di moto (OP (t), OP˙ (t)).
Prova. Calcoliamo
δv G = dG q(t); q̇(t), q̈(t) q(t); 0, δ q̈ =
n
¨ i (t) − Fi (OP (t), OP
˙ (t)) · dOP
X
= mi OP g i (q(t))δ q̈,
i=1
47
48
Capitolo 2
2.1 Premessa
Non si può dire che la descrizione antica e medioevale della meccanica celeste non fosse
efficiente.
Il punto più alto di quel mondo pre-newtoniano fu l’opera monumentale in 13 volumi di
Claudio Tolomeo (II secolo d.C.), la Grande Sintassi Matematica, più nota col nome arabo
di Almagesto, in cui fu esposto il suo sistema geocentrico: il complesso delle stelle fisse e
del sistema solare fu rappresentato mediante 52 moti circolari uniformi, deferenti e epicicli,
utilizzandone al più 5 (Marte) per corpo celeste. La sovrapposizione di pochi moti circolari
uniformi era – è, diciamo– sufficiente per descrivere i corpi celesti con un’approssimazione
fine confrontabile con le osservazioni astronomiche. Al moderno lettore con cultura mate-
matica –lo studente di fisica, di matematica, di ingegneria– non è molto difficile riconoscere
l’analogia tra tale sviluppo in epicicli e la decomposizione in serie di Fourier di moti perio-
dici. Quest’analogia fu indicata espressamente per la prima volta da Schiaparelli (1926), e
come mette in evidenza Lucio Russo ne “La rivoluzione dimenticata”, Feltrinelli 1996, si
può sospettare che fosse chiara anche ai pionieri di tali sviluppi in serie, e cioè a Daniel
Bernoulli e allo stesso Joseph Fourier, i quali furono pure cultori l’uno di meccanica celeste,
l’altro di cultura egizia ed alessandrina. Una ricostruzione tecnica di tale analogia si trova
nella nota di Giovanni Gallavotti “I moti quasi periodici da Ipparco a Kolmogorov” (Note
dell’Accademia Naz. dei Lincei). Ma il già citato moderno lettore matematico troverà
tutto ciò deliziosamente descritto nel saggio di Donald G. Saari “A Visit to the Newtonian
N-body Problem via Elementary Complex Variables”, American Mathematical Monthly
pp.105-119, February 1990.
49
Perché dunque abbandonare tale descrizione potente ed efficiente? Perché sostituire
quella descrizione pragmatica con una “legge fisica”?
Clifford A. Truesdell, in un ormai famoso (e provocatorio) pamphlet “Il calcolatore:
rovina della scienza e minaccia per il genere umano”, La nuova ragione, Scientia/Il Mulino
1981, giunge addirittura al seguente scenario. Se nel XVII secolo fossero esistiti i calcola-
tori, non ci sarebbe stata alcuna forte pulsione per tentare una ricostruzione matematica
unitaria quale quella formidabile di Isaac Newton, non sarebbe servita, forse sarebbe stata
controproducente: la “macchina” epicicloidale esistente, e sempre eventualmente perfetti-
bile mediante l’aggiunta di nuovi epicicli, sarebbe apparsa più che adeguata per il calcolo
computerizzato.
Tale pessimismo va naturalmente rimeditato. Ma va pure detto che lo sviluppo scien-
tifico mediante il paradigma delle “leggi” fu una peculiarità di quella scienza che nacque
e si sviluppò attorno al bacino mediterraneo; presso altre civiltà in evoluzione presero il
soppravvento differenti itinerari di pensiero: la scienza cinese, benché tecnologicamente
più avanzata nell’antichità, mai si sviluppò in termini di leggi (si veda per esempio Joseph
Needham, Scienza e Civiltà in Cina, Einaudi 1983).
I motivi della decadenza dell’antica teoria tolemaica e del nascere della nuova scienza
sono indissolubilmente legati alla storia e allo sviluppo di tutto il pensiero scientifico di
quel periodo, marcato da Copernicus, Kepler e Galilei. Non furono neppure estranee mo-
tivazioni estetiche e mistico-religiose. Ma fu fondamentalmente la necessità di organizzare
unitariamente i dati astronomici e di predire i moti, che portò alla enunciazione Kepleria-
na, le tre leggi, e successivamente alla potente sintesi Newtoniana, la legge di gravitazione
universale assieme ad un solido formato teorico di equazioni differenziali caratterizzanti i
moti dinamicamente possibili.
Come in altri capitoli, i primi paragrafi sono di lettura consequenziale; negli ultimi
(teorema di Bohlin ed altri) a volte è necessario il formalismo Lagrangiano-Hamiltoniano
50
della Meccanica Analitica e il Calcolo delle Variazioni. Nonostante questi siano sviluppati
in capitoli successivi, si è ritenuto, per un senso unitario dell’esposizione, di proporre
ugualmente in questo capitolo questi argomenti non didatticamente ordinati, ma coerenti
col problema dei due corpi.
π = {P ∈ E3 : OP = P − O = x1 e1 + x2 e2 , ∀(x1 , x2 ) ∈ R2 }.
Dunque il nostro moto si rappresenterà cosı́: t 7→ x1 (t)e1 + x2 (t)e2 , ma anche, qualora non
susciti ambiguità: t 7→ (x1 (t), x2 (t)). Descriviamolo pure in coordinate polari su π:
t 7→ r(t)er (t).
ėr = (− sin θe1 + cos θe2 )θ̇ = θ̇eθ , ėθ = −(cos θe1 + sin θe2 )θ̇ = −θ̇er .
Abbiamo gli ingredienti per rappresentare nella base mobile (er , eθ ) velocità ed accelera-
zione:
v = OP ˙ = d (rer ) = ṙer + re˙r = ṙer + rθ̇eθ .
dt
2
¨ = d (rer ) = r̈er + ṙėr + ṙθ̇eθ + rθ̈eθ + rθ̇ėθ = (r̈ − rθ̇2 )er + (rθ̈ + 2ṙθ̇)eθ .
a = OP
dt2
Diremo dunque accelerazione radiale:
ar = r̈ − rθ̇2
51
ed accelerazione trasversa:
aθ = rθ̈ + 2ṙθ̇.
Interpretiamo quest’ultimo termine. Si vede che, per r 6= 0,
d 2
raθ = r2 θ̈ + 2rṙθ̇ = (r θ̇).
dt
Mostriamo che
1
Ȧ := r2 θ̇
2
è la velocità areolare dell’area spazzata dal vettore posizione OP = rer lungo il moto in
studio. L’area spazzata in un intervallo di tempo [t, t + ∆t] è, a meno di o(∆t), l’area di un
triangolo, ove |v|∆t è la “base” e |OP ∧ vers v| è l’“altezza”, entrambe valutate al tempo
t.
1 1 1
∆A = |rer ∧ vers v| |v|∆t + o(∆t) = |rer ∧ v| ∆t + o(∆t) = r2 θ̇∆t + o(∆t),
2 2 2
da cui rapidamente la conclusione:
∆A 1 1
Ȧ = lim = |OP ∧ v| = r2 θ̇.
∆t→0 ∆t 2 2
¨ ∧ OP = 0,
OP
52
Supponiamo ora MO = 0. Abbiamo che OP || OP ¨ perché il moto è centrale e abbiamo
che OP || OP ˙ perché MO = 0. Quindi: OP ˙ || OP
¨ . Usando la rappresentazione di Frênet
˙ ¨ 2
abbiamo OP = ṡt, OP = s̈t + ṡ /ρ n, pertanto dev’essere definitivamente 1/ρ ≡ 0, cioè,
il moto è rettilineo e di collisione con O.
Andiamo a vedere il significato della parte scalare di MO . Otteniamo facilmente
˙ = rer ∧ (ṙer + rθ̇eθ ) = r2 θ̇e3 = 2Ȧe3 .
MO = OP ∧ OP
Osservazione. Notiamo che in ogni altro caso diverso dal moto di collisione rettilinea, cioè
per c 6= 0, si ha r 6= 0 e θ̇ 6= 0, la prima ci garantisce l’assenza di collisioni diverse da quella
rettilinea, l’ultima ci dice che t 7→ θ(t) è un diffeomorfismo.
d d1 c2
ar = r̈ − rθ̇2 = − c r θ̇ − 3 ,
dθ dθ r
infine:
c2 d2 1r 1
ar = − + .
r2 dθ2 r
Nel seguito, quest’ultima formula sarà cruciale nello studio della geometria delle orbite nel
problema dei due corpi.
53
2.5 Sulle Coniche
Le curve coniche sono tutte e sole le curve piane che si ottengono sezionando coni con piani.
Un’ulteriore caratterizzazione è la seguente.
Una curva è conica se e solo se per ogni suo punto P è costante il rapporto della distanza
di P da un punto fisso F , detto fuoco, con la distanza di P da una retta detta direttrice,
|P F | r
e := = = costante, eccentricit à.
|P Q| |P Q|
r
Posto d := |F D|, vale |P Q| = d − r cos θ, cosı̀ e = d−r cos θ ,
ed
r= .
1 + e cos θ
Avremo
Ellisse : e < 1, Parabola : e = 1, Iperbole : e > 1.
K
P Q
J D
F1 C F
54
a: semi-asse maggiore
b: semi-asse minore
f : semi-distanza focale, f = |CF | = |F1 C|
ed ed e2 d
2f = r(π) − r(0) = − =2 ,
1−e 1+e 1 − e2
dunque
e2 d
f= ,
1 − e2
ma anche
f = ea.
Il parametro dell’ellisse è definito come il prodotto di e e d:
p := ed.
cosı̀
ed
a2 = f 2 + b2 , b2 = a2 − e2 a2 = a2 (1 − e2 ) = a2 ,
a
infine
b2
p= .
a
55
2.6 Kepler
Nonostante la forte spinta rivoluzionaria della sua proposta eliocentrica, Copernicus, De
revolutionibus orbium coelestium (1543), non riuscı́ ad abbandonare l’idea dei moti circolari
uniformi e delle loro composizioni. A più riprese, collezionando risultati di anni, ciò riuscı́
a Kepler. Inizialmente egli pensò addirittura a moti ovoidali (un’estremità dell’orbita più
stretta dell’altra, si veda per es. a pag. 65 di Giovanni Godoli, “Sfere armoniche. Storia
dell’astronomia”, UTET 1993), in seguito rapidamente abbandonò tali idee, giungendo alla
formulazione delle tre leggi che portano il suo nome. Tali leggi sono di natura puramente
descrittiva e cinematica.
Johannes Kepler
Prima Legge. Le orbite dei pianeti sono ellissi e il Sole è in uno dei fuochi.
Terza Legge. Il rapporto del quadrato del periodo con il cubo del semi-asse maggiore,
T2
a3
, è una costante universale.
La prima legge ci dice, in particolare, che i moti sono piani; assieme alla seconda, deduciamo
facilmente che per tali moti si conserva il Momento della quantità di moto (qui riferito ad
una massa unitaria)
MO = OP ∧ OP ˙ = cost.,
dunque, traiamo che i moti sono centrali. Si può facilmente andare un po’ piú avanti con
questa ricognizione puramente cinematica: Nel riferimento associato al piano dell’orbita
ellittica di un pianeta descriviamo con Binet l’accelerazione radiale ar , vale
1 1 + e cos θ
(θ) = ,
r p
56
d2 1 1
dunque dθ2 r
= p − 1r , cosicché
c2 1
ar = − ,
p r2
ove c e p sono costanti per l’orbita in studio. Nel caso ellittico
2πab b2
c= , T = periodo, p= .
T a
4π 2 a2 b2 a 1 2a
3 1
ar = − = −4π ,
T 2 b2 r2 T 2 r2
e per la terza legge a3 /T 2 è indipendente dal pianeta in studio. Emerge forte il segnale
della legge 1/r2 . Una interpretazione dinamica dovrà tener conto di tale fondamentale
fatto. Tutto ciò sarà accolto nella sintesi Newtoniana.
2.7 Newton
Va detto che l’esposizione del pensiero Newtoniano che si addotta ai nostri giorni è quella di
Euler e Lagrange, ed è quella che qui sostanzialmente seguiremo: benché Newton conosces-
se il livello più elevato dell’analisi matematica del suo periodo, sembra in profondo rispetto
ed ammirazione del pensiero matematico ellenistico (ma sembra anche per una profonda
avversione nei confronti del suo collega Robert Hooke al quale intendeva cripticamente
celare la sua opera), non la usò affatto, e nei suoi Philosophiae Naturalis Principia Mathe-
matica (1687), tradusse i calcoli analitici in complessi ragionamenti puramente geometrici,
si veda di V. I. Arnol’d, “Huygens e Barrow, Newton e Hooke”, Bollati Boringhieri.
Isaac Newton
57
In un sistema di riferimento associato ad uno spazio euclideo inerziale consideriamo il
sistema meccanico composto da due punti materiali S e P , Sole e Pianeta, di massa mS e
mP . Su tale sistema agisce un sistema di tipo interno di forze, le cui leggi-forza soddisfano al
Principio di Azione e Reazione, in forma forte, cioè, sia rispetto alla Risultante sia rispetto
al Momento. Quest’ultimo, come già detto, è semplicente un requisito sulle leggi-forza.
Posto h > 0 : costante gravitazionale di Cavendish,
h mS mP h mP mS
FP = vers P S, FS = vers SP,
|P S|2 |SP |2
FP + FS = 0, SP ∧ FP = 0.
I moti dinamicamente possibili sono tutti e soli dati dalle curve t 7→ (OP (t), OS(t))
soddisfacenti al sistema dinamico definito dalla seguente equazione differenziale del se-
condo ordine in R3 × R3 r ∆, dove ∆ := {(x, y) ∈ R3 × R3 : x = y}, che è lo spazio delle
configurazioni di due particelle libere senza collisioni:
¨ = h mS mP vers P S,
mP OP
|P S|2
¨ = h mP mS vers SP.
mS OS
|SP |2
Tale sistema ammette sette integrali primi funzionalmente indipendenti (lo si verifichi): due
vettoriali, quantità di moto e momento della quantità di moto, ed uno scalare, l’energia.
˙ , OS)
p(OP, OS, OP ˙ ˙ + mS OS,
= mP OP ˙
˙ , OS)
MO (OP, OS, OP ˙ ˙ + mS OS ∧ OS,
= mP OP ∧ OP ˙
˙ , OS)
E(OP, OS, OP ˙ = 1 ˙ |2 + mS |OS|
˙ 2) − h mS mP
2 (mP |OP |P S| .
Possiamo pensare il nostro sistema al primo ordine, nella forma ẋ = X(x), ove ora il
campo vettoriale X è definito nello spazio degli atti di moto (R3 × R3 − ∆) × R6 , la cui
chiusura è naturalmente R12 . Un semplice bilancio sul numero (sette) degli integrali primi
porterebbe a supporre che il sistema non sia integrabile, cioè non sembra sia possibile
abbattere geometricamente la dimensione (dodici) del sistema al primo ordine. Ma lo
stato delle cose è meno pessimistico: la motivazione è profonda, risiede nella struttura
Lagrangiana ed Hamiltoniana del sistema; un sintomo di tale fatto sarà evidenziato nella
teoria di Routh dove ogni integrale primo di ciclicità per un sistema Lagrangiano abbatterà
di un grado di libertà il sistema, quindi con un guadagno di due unità nello spazio degli
atti di moto. Ma la materia sarà completamente chiarita nel teorema di Liouville-Arnol’d,
che caratterizza i sistemi Hamiltoniani integrabili.
Per il momento procederemo senza utilizzare la struttura Lagrangiana del sistema.
58
Un primo passo consisterà nell’uso geometrico dell’integrale vettoriale della quantità
di moto p: evidentemente esso sussiste perché il sistema di forze soddisfa al principio di
azione e reazione rispetto alla risultante: FP + FS = 0.
Vale la pena generalizzare questo primo passo verso l’integrazione del sistema dinamico
di Newton pensando ad un più generale sistema di interazione tra due corpi.
¨ = FP (SP, OP
mP OP ˙ − OS),
˙
(I)
¨ = FS (SP, OP
mS OS ˙ − OS),
˙
FP , FS : R3 × R3 −→ R3 ,
dipendenti dal vettore differenza delle posizioni ed eventualmente dal vettore differenza
delle velocità (questa dipendenza ulteriore qui si è messa per generalità: naturalmente, il
caso in studio dei due-corpi non la coinvolge). Inoltre valga:
˙ − OS)
FP (P S, OP ˙ + FS (P S, OP
˙ − OS)
˙ = 0.
Consideriamo ora un nuovo sistema non inerziale N I adatto alla descrizione relativa di P
rispetto ad S. L’origine di tale nuovo sistema sarà posto solidale ad S con assi coordinati
invarianti rispetto a quelli del sistema inerziale I, in altri termini, il nuovo riferimento N I
trasla e non ruota, ωtrascinamento = 0, rispetto ad I. Indichiamo in N I con
x := P − S = SP,
˙ − OS.
ẋ = OP ˙
Utilizziamo il teorema di Coriolis per i moti relativi e descrivente la relazione tra le acce-
lerazioni,
aassoluta = arelativa + atrascinamento + aCoriolis ,
59
pensiamo I: sistema assoluto e N I: sistema relativo, e notiamo che
arelativa = ẍ, ¨
atrascinamento = OS, aCoriolis = 0.
Noto dunque il moto t 7→ x(t) risolvente il sistema della massa ridotta in N I del
secondo ordine in R3 con dato iniziale x(0) = OP (0) − OS(0), ẋ(0) = OP ˙ (0) − OS(0),
˙
come ricostruire la soluzione t 7→ (OP (t), OS(t)) in I?
La risposta risiede naturamente nell’uso dell’integrale vettoriale quantità di moto p.
Infatti, assegnati i dati iniziali, il moto del baricentro G in I è subito determinato:
¨ = 0,
(mP + mS )OG
˙ (0) + mS OS(0)
mP OP (0) + mS OS(0) mP OP ˙
˙
OG(t) = OG(0) + OG(0)t = + t,
mP + mS mP + mS
60
dunque è nota la seguente combinazione lineare di OP (t) e di OS(t):
mP OP (t) + mS OS(t)
OG(t) = .
mP + mS
D’altra parte abbiamo determinato differenza di OP (t) con OS(t):
In N I i moti dinamicamente possibili per tale sistema con forza centrale e dunque acce-
lerazione centrale sono tutti piani e con velocità areolare costante. Considereremo il piano
π su cui evolve il moto per una data assegnazione di Cauchy con un sistema di coordinate
cartesiane con origine O ≡ S e asse di versore e3 = vers M0 . Costruiremo quindi il sistema
di coordinate polari coerentemente a quanto sopra fatto.
Il primo passo sarà quello della determinazione delle traiettorie geometriche dei moti in
studio.
Utilizzando la formula di Binet per l’accelerazione, la componente radiale (la trasversa
è identicamente nulla) dell’equazione differenziale si scrive (r = |x|, er = vers x):
c2 d2 1r 1 hmP mS
−µ 2 2
+ =− .
r dθ r r2
Per |MO | = µc 6= 0 si ha che r 6= 0, e dunque è sensata la semplificazione dei due termini
1
r2
: ciò che resta è banalmente integrabile. Infatti
d2 1r 1 h(mP + mS )
+ = (> 0)
dθ2 r c2
61
è l’equazione differenziale lineare del secondo ordine in R, nell’incognita 1r (θ), di un oscil-
latore armonico di pulsazione ω = 1, non omogeneo e di funzione di disomogeneità da-
ta dalla costante h(mPc+m 2
S)
. L’integrale generale dell’equazione completa è dato dalla
somma dell’integrale generale dell’omogenea con un integrale particolare della completa;
quest’ultimo, cercandolo tra le funzioni di θ costanti è dato da r1p (θ) = h(mPc+m
2
S)
. Infine
1 h(mP + mS )
(θ, C1 , C2 ) = C1 sin θ + C2 cos θ + .
r c2
Rileggiamo C1 , C2 in termini di ampiezza e fase iniziale:
1 C1 C2 h(mP + mS )
q
(θ, C1 , C2 ) = C12 + C22 ( p 2 sin θ + p 2 cos θ) + =
r C1 + C22 2
C1 + C2 c2
h(mP + mS )
q
= C12 + C22 (sin θ0 sin θ + cos θ0 cos θ) + ,
c2
1 h(mP + mS )
(θ, A, θ0 ) = A cos(θ − θ0 ) + ,
r c2
ove abbiamo posto A = C12 + C22 e θ0 = arcsin √ C21 2 . Definiamo ora e e p tali che
p
C1 +C2
h(mP + mS ) 1 e
2
= , A= ,
c p p
ne segue che le traiettorie geometriche sono tutte e sole delle sezioni coniche:
1 e cos(θ − θ0 ) + 1
(θ, e, p) = .
r p
62
n cos α−θ o 1 cos α sin θ 1
2
= 2 arctan − .
cos α+θ
2
sin α 1 + cos α cos θ sin2 α
3
Dovremmo infine invertirla per ottenere θ = θ(t). Nonostante tale difficoltà, il problema di
Kepler è un prototipo di “sistema integrabile”, cioè di un sistema dinamico le cui soluzioni
sono determinabili mediante le due operazioni sopra descritte: calcolo di primitive (le
cosiddette ‘quadrature’) e inversione di funzioni.
L’uso alternativo dell’integrale dell’energia non porta lontano nel problema dell’integra-
zione, ma risulta geometricamente ben interpretabile. Da
1 hmP mS 1 hmP mS
E0 = µ|v|2 − = µ(ṙ2 + r2 θ̇2 ) − ,
2 r 2 r
1 µc2 hmP mS
E0 = µṙ2 + 2 − .
2 2r r
Se interpretiamo la funzione
µc2 hmP mS
Vcef f (r) := −
2r2 r
quale energia ‘potenziale efficace’, vediamo che il nostro problema si interpreta come un
problema 1–dimensionale del tipo ẍ = f (x). Tale interpretazione non è accidentale: giun-
giamo canonicamente ad essa considerando la formulazione Lagrangiana del problema di
Kepler, dove L(r, θ, ṙ, θ̇) con la ‘ciclicità’ ∂L
∂θ = 0: il metodo di Routh fornisce la Lagrangia-
ef f
na ridotta Lc (r, ṙ) di cui Vc (r) rappresenta il termine dell’energia potenziale (si consiglia,
per esercizio, di completare i dettagli tecnici).
L’analisi dei livelli ad energia fissata E0 nel diagramma cartesiano x = r, y = Vef f (r)
mette ben in evidenza le orbite chiuse (le ellissi) per E0 < 0, l’orbita circolare corrispon-
dente al minimo assoluto di Vcef f (r), e le orbite illimitate, le iperboli per E0 > 0, e la
parabola per E0 = 0.
Dunque
Z r(t)
dr
t= q .
r0 2E c 2 2h(mP +mS )
µ − r2 +
0
r
1 h d 1 2 1 i hmP mS
E0 = µc2 r
+ 2 − ,
2 dθ r r
e la formula delle coniche
1 e2 1 + e2 cos2 θ + 2e cos θ 1 + e cos θ
E0 = µc2 2 sin2 θ + 2
− hmP mS ,
2 p p p
63
ricordando che
1 h(mP + mS ) hmP mS
= 2
= ,
p c µc2
abbiamo
e2 − 1
E0 = µc2 ,
2p2
e nel caso di orbite ellittiche otteniamo che l’informazione energetica è completamente
contenuta nel semiasse maggiore dell’orbita:
2E0 e2 − 1 1
= =− , a : semiasse maggiore.
hmP mS p a
Vale la pena mettere in evidenza la portata della concordanza della legge di Newton con
quelle di Kepler. Da un lato, la legge di Newton implica, nel sistema della massa ridotta
N I, la completa validità delle due prime leggi di Kepler. Per quanto riguarda la terza
legge, abbiamo che
πab
c = 2Ȧ = 2 ,
T
e c2 è pure cosı̀ esprimibile
c2 = p h (mP + mS ),
b2
confrontiamo queste due espressioni per c, ricordando pure che p = a,
4π 2 a2 b2 b2
= p h(mP + mS ) = h(mP + mS ),
T2 a
a3 h(mP + mS )
= ,
T2 4π 2
dunque, la terza legge di Kepler è valida solo nell’approssimazione:
mP + mS ∼ mS .
64
del sistema cartesiano (F, x, y) con l’asse x coincidente con l’asse X. Accanto alle usuali
coordinate polari r e θ, dove diremo
θ : anomalia vera,
consideriamo l’angolo u,
u : anomalia eccentrica,
centrato in O, dal semi-asse positivo X al punto H sulla circonferenza, il quale si ottiene
intercettando la circonferenza con la retta passante per il punto rappresentativo P e pa-
rallela all’asse Y . L’area spazzata dal raggio vettore F P è una funzione lineare del tempo,
A = 2c t. In accordo con la tradizione, indicheremo con
c
ζ := t : anomalia media,
ab
rapresentante, essenzialmente, la variabile temporale.
Dall’equazione dell’ellisse
XP2 YP2
+ = 1,
a2 b2
abbiamo che
a2 cos2 u YP2
+ 2 = 1,
a2 b
e dunque:
XP = XH = a cos u = r cos θ + ea, (rem : f = ea)
YP = b sin u = r sin θ.
65
Ancora, dall’equazione dell’ellisse abbiamo (trascuriamo l’apice P )
bp 2
Y = a − X 2.
a
Calcoliamo l’area dei settori F LH e F LP ,
F K·KH
Ra √
area (F LH) = + XK a2 − X 2 dX,
2
F K·KP
Ra √
area (F LP ) = 2 + ab XK a2 − X 2 dX.
Ora
KH = a sin u,
KP = r sin θ = b sin u,
pertanto
b
KP = KH.
a
Usando quest’ultima relazione le aree dei due settori risultano
b
area (F LP ) = area (F LH).
a
Ma queste due aree si calcolano anche in un altro modo:
ua2 a sin u 2 ea2 sin u
area (F LH) = 2 −f 2 = ua2 − 2 ,
c
area (F LP ) = 2 t,
c
otteniamo cosı́ infine u − e sin u = ab t,
u = u(ζ).
Per e < 1, il caso ellittico che stiamo trattando, l’equazione di Kepler, pensata come una
funzione ζ = ζ(u), induce un diffeomorfismo globale:
dζ
= 1 − e cos u > 0.
du
L’equazione di Kepler è da decenni un ambiente di prova per la teoria della rap-
presentazione delle funzioni inverse mediante sviluppi in serie, si veda per esempio Aurel
Wintner, The analytical foundations of celestial mechanics, 1941, ma anche letteratura
più recente, Peter Colwell, Solving Kepler’s equation over three centuries, Willmann-Bell,
1993.
66
2.11 Il Vettore di Runge-Lenz per il Problema di Kepler
Spaziale
Riconsideriamo il problema di Kepler, dato dal sistema differenziale del secondo ordine in
R3 ,
α
µẍ = − 2 vers x (α := hmP mS ).
|x|
Indichiamo con
MO (x, ẋ) := µ x ∧ ẋ
il momento della quantità di moto, integrale primo vettoriale relativo a tale sistema. Di-
mostriamo che la seguente funzione vettoriale, detta “vettore di Runge-Lenz” o “vettore
di Laplace”,
x
W(x, ẋ) := ẋ ∧ MO (x, ẋ) − α
|x|
d
è un integrale primo per il problema di Kepler. È un conto diretto (rem: dt MO = 0):
d ẋ x d
W = ẍ ∧ MO − α − α(− 2 |x|),
dt |x| |x| dt
ora, un rapido conto mostra che
d d√ 2x · ẋ x · ẋ
|x| = x·x= √ = ,
dt dt 2 x·x |x|
dunque:
d
dt W = − αµ |x|x3 ∧ (µx ∧ ẋ) − α( |x|
ẋ x·ẋ
− x |x| 3 ),
x·ẋ x·x ẋ x·ẋ
= α − x |x| 3 + ẋ |x|3 − |x| + x |x| 3 = 0.
Tale vettore W, benché non sia indipendente da MO , ha nel caso ellittico un’interessante
interpretazione geometrica: calcoliamo W nell’atto di moto che compete al transito per
un punto apsidale dell’orbita, per esempio il perielio, ivi i vettori x∗ , ẋ∗ e MO sono tra
loro ortogonali, in particolare il vettore ẋ∗ ∧ MO appare parallelo e orientato come il
vettore posizione x∗ , dunque, dalla definizione di W, segue che quest’ultimo è diretto come
il vettore posizione x∗ , indicante appunto la posizione nella spazio del punto apsidale,
dunque la direzione in cui giace il semi-asse maggiore dell’orbita ellittica.
67
Lungo ogni moto Kepleriano, ẍ = −k |x|x3 , il vettore velocità descrive una circonferenza
nel piano dell’orbita.
Nel piano in cui evolve l’orbita conica, nelle usuali coordinate polari, si ha
1 e cos θ + 1
= , c = r2 θ̇, v = ṙer + rθ̇eθ .
r p
Derivando rispetto al tempo l’equazione delle coniche e usando l’integrale delle aree,
1 sin θ sin θ 2 sin θ
− 2
ṙ = −e θ̇, ṙ = e r θ̇ = e c,
r p p p
quindi
sin θ c
v=e cer + eθ =
p r
sin θ e cos θ + 1
= c(e er + eθ ),
p p
otteniamo
c ce
v= eθ + (sin θer + cos θeθ ),
p p
infine
ce c
v(θ) = c2 + eθ (θ),
p p
che è evidentemente l’equazione parametrica della circonferenza di centro (0, ce
p ) e di raggio
ρ = pc .
68
superfici di livello delle rispettive funzioni Hamiltoniane (costruite con due ben distinte
trasformazioni di Legendre), relative ai rispettivi valori e e 1, coincidono nello spazio delle
fasi T ∗ R2 3 (z, p) (vedere la teoria della metrica di Jacobi).
Teorema. Sia f : C → C, z 7→ w = f (z) una funzione analitica con derivata complessa
0
f non nulla.
Supponiamo che
dw
U (z) = |f 0 (z)|2 = | (z)|2 .
dz
Allora f muta Le (z, ż) in
1
eLe0 (w, ẇ) := me e0 − V (w) |ẇ|2 = Le (z, ż)
2 z=z(w), dz
ż= dw (w)ẇ
−1
ove ee0 = −1, e V (w) = −| dw
dz
(w)|2 = −| dfdw (w)|2 .
Osservazione. Si noti che f genera sia la trasformazione puntuale sia le rispettive energie
potenziali.
Prova. Dettagliamo
Le (z, ż) =
dz
z=z(w), ż= dw (w)ẇ
1 dw dz
= m e − | (z)|2 | (w)|2 |ẇ|2 =
2 dz z=z(w) dw
1 dz
= m e| (w)|2 − 1 |ẇ|2 =
2 dw
1 1 dz
= me − − (−| (w)|2 |ẇ|2 =
2 e dw
n1 o
=e m(e0 − V (w))|ẇ|2 .
2
Dunque non solo le orbite di Le (z, ż) ma le sue leggi orarie (le soluzioni) coincidono
con quelle di Le0 (w, ẇ) (il fattore e è irrilevante): consideriamo quelle ad energia uguale ad
1. Allora (teoria della metrica di Jacobi, principio di Maupertuis) esistono due rispettive
riparametrizzazioni del tempo che ci segnalano che le orbite (il loro supporto) di
1 1
L(z, ż) = m|ż|2 − U (z), e = m|ż|2 + U (z)
2 2
sono tutte e sole le orbite di
1 1
L(w, ẇ) = m|ẇ|2 − V (w), e0 = m|ẇ|2 + V (w).
2 2
69
Consideriamo un esempio: w(z) = z 2 . Allora
d √ 2 1 1
V (w) = −| w| = − energia potenziale Kepleriana.
dw 4 |w|
Quest’ultimo risultato, relativo all’equivalenza orbitale del caso elastico con quello Ke-
pleriano è di K. Bohlin (1911); un’ulteriore versione di tale teorema di equivalenza fu
introdotta da Tullio Levi-Civita (1920). La versione generale del teorema qui cosı̀ ripor-
tato è di Arnol’d (vedi V.I. Arnol’d “Huygens & Barrow, Newton & Hooke”, Birkhäuser,
1990, purtroppo nella traduzione italiana Bollati-Boringhieri il teorema è sparito) il quale
avverte che la sua prima apparizione è stata in ambiente quantistico per opera di R. Faure
(1953).
Va infine segnalato un notevole teorema di Bertrand (1873) che lega indissolubilmente
potenziale elastico e Kepleriano (vedi V. Arnol’d, Metodi matematici della meccanica clas-
sica, Ed. Riuniti, p.42): In un campo centrale tutte le orbite limitate sono chiuse se e solo
se l’energia potenziale V (r) ha una delle seguenti forme:
α2
V1 (r) = α1 r2 , V2 (r) = − , α1 , α2 > 0.
r
¨ 1 = hm1 (m2 P1 P2 P1 P3
m1 OP + m3 ),
|P1 P2 |3 |P1 P3 |3
h(m1 + m2 + m3 )
ω2 = .
l3
70
La dimostrazione si fa per verifica diretta. Consideriamo un riferimento inerziale con
origine nel baricentro O, sicuramente questa è una scelta lecita perché il baricentro del siste-
ma evolve con moto rettilineo uniforme. All’istante t = 0 poniamo i tre punti Pj , j = 1, 2, 3,
nei vertici del triangolo equilatero di lato l e di baricentro O. Pensando, per comodità, all’o-
meomorfismo R2 ∼ C, siano z̄j ∈ C (al tempo t = 0) i vettori posizione di Pj . Verifichiamo
quindi che la rotazione del triangolo
P1 P2 P1 P3
−m1 ω 2 OP 1 = hm1 (m2 3
+ m3 3 ),
l l
3
mettendo a fattore 1/l e dalla definizione del baricentro O,
hm1
−m1 ω 2 OP 1 = (m1 + m2 + m3 )P1 O,
l3
pertanto
OP1 (t) = z̄1 eiωt
se
h(m1 + m2 + m3 )
ω2 =
l3
Otteniamo cosı̀ la tesi osservando che le stesse considerazioni, e per la stessa ω, valgono
per P2 e P3 .
Lagrange reputò queste soluzioni fisicamente non interessanti, delle curiosità matema-
tiche. Solo nel 1906 si scoprirono gli asteroidi Greci e nel 1908 i Troiani, che, grosso modo,
evolvono nei due punti triangolari con il Sole e Giove —vedi, p.e., a pag. 409 del E. T.
Whittaker, A Treatise on the Analytical Dynamics of Particles & Rigid Bodies. Lo studio
della stabilità di tali soluzioni è una lunga storia che inizia con Lagrange stesso: mentre le
condizioni per la stabilità del problema linerizzato si raggiungono abbastanza facilmente
(è un conto noioso, ma diretto), informazioni sulla Lyapunov stabilità sono state ottenute
solo negli ultimi decenni mediante la teoria delle perturbazioni dei sistemi Hamiltoniani, e
solo per il problema ristretto.
Alcuni tecnici dell’astronautica pensano di utilizzare i punti triangolari con Terra e
Luna, che a conti fatti risultano stabili, per “parcheggiare” satelliti artificiali o astronavi;
attualmente in tali punti sono stati osservati degli ammassi di polvere cosmica (K. Kor-
dylewski, 1961) responsabili della luce zodiacale, “una diffusa luminescenza che si osserva
nel cielo durante notti limpide e serene e che si estende lungo le dodici costellazioni dello
zodiaco”, vedi Alessandra Celletti e Ettore Perozzi, Meccanica Celeste, Cuen, 1996.
71
Altra classica famosa famiglia di soluzioni “rigide” del problema a tre corpi è data
dalle soluzioni collineari di Euler, quest’ultime risultano tutte instabili, quindi difficilmente
osservabili.
Proviamo, per esercizio, a costruire qualche semplice famiglia di soluzioni per il pro-
blema a N -corpi, con masse tutte uguali, e, naturalmente, con molta simmetria semplifi-
catrice. Dimostriamo che
Esistono famiglie piane a simmetria assiale di soluzioni non rigide tali che ad ogni istante
le particelle sono uniformemente distribuite su di una circonferenza di raggio dipendente
dal tempo, ed inoltre ciascuna particella evolve di moto Kepleriano lungo una conica con
fuoco nel centro della circonferenza, uguale per tutte le particelle, ma ruotata, da particella
a particella, dell’angolo 2πN.
Anche qui la prova è un conto diretto. Consideriamo una circonferenza di raggio r e
l’N -poligono regolare inscritto; la distanza di un prefissato vertice P dal vertice p-esimo,
p = 1, ..., N − 1, è data da (geometria elementare) p = 1, ..., N − 1
π
lp := |P Pp | = 2r sin(p ).
N
Scriviamo l’equazione vettoriale di Newton per la particella P ,
usiamo per il primo membro la formula di Binet (è lecito, perché la risultante delle forze su
P è centrale con polo il centro O della circonferenza) e riorganizziamo il secondo membro,
c2 d2 1r 1 OP
−m 2 2
+ =
r dθ r |OP |
1 1 1 PO
= hm2 ( 2 P1 P̄1 ) + ... + 2 sin(P\
sin(P\ \
Pp P̄p ) + ... + 2 sin(P PN/2 P̄N/2 )) ,
l1 lp lN/2 |P O|
ove P̄p è la proiezione ortogonale di Pp sull’asse per OP . (Conviene schizzare una figura.)
Si osservi che (anche qui, geometria elementare)
π
sin(P\
Pp P̄p ) = sin(p ).
N
\
(Si verifichi la formula, per es., nel caso N pari, per p = N/2 essa dà: sin(P PN/2 P̄N/2 ) = 1,
come ci si deve aspettare.)
c2 d2 1r 1 OP 1 PO
−m 2
( 2 + ) = hm2 2 k(N ) ,
r dθ r |OP | r |P O|
72
dove, supponendo per es. il caso N pari,
N
−1
2
X 1 1
k(N ) = π + .
2 sin(p N ) 4
p=1
Il problema generale dei tre corpi è attualmente oggetto di ricerca avanzata. Si è lontani
da una comprensione esauriente. E il punto obbligato d’inizio della studio resta comunque
l’opera poderosa di Henri Poincaré: i tre volumi de Les Méthodes Nouvelles de la Mécanique
Céleste, 1892.
73
74
Capitolo 3
ẋ = X(x),
ẋ = X(x), x(0) = x0 ,
non esce mai dalla palla B(x∗ , ε), cioè x(t, x0 ) ∈ B(x∗ , ε), ∀t ≥ 0.
75
?
X
X0 δ
Diremo instabile una configurazione d’equilibrio che non è stabile (è abolito l’equilibrio
indifferente).
Lo spazio di evoluzione del sistema dinamico retto dall’equazione differenziale ẋ = X(x)
è Rm , e la definizione ora data usa la base di intorni aperti formata dalle palle generate
con la norma (e dunque con la metrica) euclidea: B(x∗ , r) := {x ∈ Rm : |x − x∗ | < r}.
Nel caso dimensionalmente finito, in cui stiamo lavorando, è noto che tutte le norme sono
topologicamente equivalenti, e questo giustifica l’affermazione iniziale.
Se il sistema dinamico è di tipo meccanico —per esempio, equazioni di Lagrange poste
in forma normale—, q̈ = f (q, q̇), q ∈ RN , allora lo spazio in cui il sistema evolve al primo
ordine è lo spazio degli atti di moto, Rm = R2N , x = (q, v) ∈ R2N ,
q̇ v
ẋ = = = X(x),
v̇ f (q, v)
2N 2N q v
X:R →R , → .
v f (q, v)
L’equilibrio di un sistema dinamico di tipo meccanico è ancora dato da un punto x∗ =
(q ∗ , v ∗ )
che annulla il campo vettoriale X:
v∗
∗ 0
X(x ) = 0 se e solo se = ;
f (q ∗ , v ∗ ) 0
76
ritroviamo quindi la ben nota definizione meccanica di equilibrio, letta ora nello spazio
degli atti di moto:
q ∗ è un punto d’ equilibrio per q̈ = f (q, q̇) se e solo se l’atto di moto x∗ = (q ∗ , 0) è tale
per cui f (q ∗ , 0).
Nel 1892 Lyapunov enunciò il seguente teorema, di carattere topologico, che offre delle
condizioni sufficienti per la stabilità di un equilibrio x∗ per una generica equazione ẋ =
X(x).
Teorema 1 (T. topologico sulla stabilità semplice). Sia x∗ un punto di equilibrio per
il sistema dinamico, X(x∗ ) = 0. Supponiamo che esista una funzione continua
o
W : U ⊆ Rm → R, x∗ ∈ U ,
tale che
1) W (x∗ ) = 0, W (x) > 0 ∀x ∈ U \ {x∗ }, cioè W è def inita positiva in x∗ , localmente
o
in U ;
2) per ogni soluzione t 7→ x(t) e per ogni t per cui x(t) ∈ U , la funzione composta
t 7→ W (x(t))
sia monotona non crescente:
Si osserva ora che la soluzione x(t, x0 ), con dato iniziale x(0) = x0 , ove
x0 ∈ B(x∗ , δ), rimane definitivamente in B(x∗ , ε); infatti, usando la condizione 2), ∀t > 0
si ha
W (x(t, x0 )) ≤ W (x0 ) < a;
77
dunque x(t, x0 ) non raggiunge la buccia di B(x∗ , ε) per alcun t̄ > 0, perché in tal caso
—essendo a := min|x−x∗ |=ε W (x)— si avrebbe che
W (x(t̄, x0 )) ≥ a,
Lo studio della stabilità degli equilibri mediante le funzioni W , dette (appunto) “fun-
zioni di Lyapunov”, è universalmente noto come Secondo Metodo di Lyapunov.
L’ambiente puramente topologico in cui abbiamo finora operato, che è quello naturale
in cui si pone il problema della stabilità, risulta però scarsamente utile dal punto di vista
pratico: infatti per verificare la condizione 2) di non crescenza delle candidate funzioni
di Lyapunov W lungo le soluzioni dell’equazione differenziale, dovremmo conoscere tutte
le soluzioni di tale equazione, ma a quel punto sarebbe inutile procedere col teorema di
Lyapunov, dato che la presunta conoscenza di tutte le soluzioni t 7→ x(t) con immagine
in U basterebbe ampiamente per analizzare l’andamento qualitativo dinamico locale in
x∗ . È ben noto, invece, che non è possibile conoscere, esibire le soluzioni delle equazioni
differenziali ordinarie. Tale difficoltà è ben più seria della difficoltà del calcolo di primitive
di integrali o dell’inversione di funzioni.
Il pessimismo che emerge rimanendo nella categoria topologica è in parte rimovibile
nella categoria differenziale; richiederemo, cioè, che W sia differenziabile, e, invece della
condizione 2), richiederemo:
Riassumendo:
Teorema 2 (T. differenziale sulla stabilità semplice). Sia x∗ un punto di equilibrio per
il sistema dinamico, X(x∗ ) = 0. Supponiamo che esista una funzione differenziabile:
o
W : U ⊆ Rm → R, x∗ ∈ U ,
78
tale che
1) W (x∗ ) = 0, W (x) > 0 ∀x ∈ U \ {x∗ }, cioè W è definita positiva in x∗ , localmente
o
in U ;
2)0 (LX W )(x) ≤ 0, ∀x ∈ U .Allora x∗ è un equilibrio stabile.
formano, per ε > 0, una base di intorni di (q ∗ , 0). (Si provi ad estendere queste argomen-
tazioni al caso di energia cinetica dipendente da q.)
tale che:
1) W (x∗ ) = 0, W (x) > 0 ∀x ∈ U \ {x∗ }, cioè W è definita positiva in x∗ , localmente
in U ,
2)00 LX W (x∗ ) = 0, LX W (x) < 0 ∀x ∈ U \ {x∗ }, cioè LX W è definita negativa in x∗ ,
localmente in U .
Allora x∗ è un equilibrio asintoticamente stabile.
79
Prova: la condizione 2)00 implica la condizione 2)0 del teorema 2, dunque: ∀ε > 0 ∃δ > 0
B(x∗ , ε) \ B(x∗ , δ1 )
d
W (x(t, x0 )) = LX W (x(t, x0 )) ≤ −µ < 0
dt
80
x0
δ
x?
1
δ1
ove
(1) ∂U
i) Qh (q) = − (q) (conservative)
∂qh
N
(2) (2) (2)
X
ii) Qh (q, q̇) : Qh (q ∗ , 0) = 0, Qh (q, q̇)q̇h ≤ 0.
h=1
∂U ∗
Supponiamo che in q ∗ , (q ) = 0, cioè q ∗ sia d’equilibrio. Se q ∗ è un minimo stretto
∂q h
(1)
locale per U, l’energia potenziale di Qh (q), allora q ∗ è stabile.
81
Prova: mostriamo che la funzione
Esempi, per q ∈ R3 :
1) la forza di Coriolis, −mac = −2m ω∧ q̇, di tipo giroscopico;2) la forza viscosa, F v = −k q̇,
di tipo dissipativo.
Esercizio 1: mostrare che in presenza di forze dissipative le funzioni di Lyapunov cosı́ ot-
tenute non mostrano la stabilità asintotica, bensı́ la sola stabilità semplice. Questo non
significa che l’equilibrio in studio non possa essere asintoticamente stabile, come giusta-
mente si potrebbe sospettare, ma questo lo si può rilevare o con una funzione di Lyapunov
ad hoc (vedi l’esercizio 2), o col Primo Metodo di Lyapunov (vedi più avanti), o con un op-
portuno teorema (vedi, per esempio, la Sect. 35 del F. Gantmacher “Lectures in Analytical
Mechanics”, Mir 1975).
Esercizio 2: si consideri l’oscillatore armonico con viscosità:
82
è una funzione di Lyapunov per l’asintotica stabilità di (q, q̇) = (0, 0). Si provi ad estendere
tale costruzione di funzione di Lyapunov per sistemi più generali.
Esercizio 3: sembrerebbe ragionevole che un equilibrio di un sistema meccanico conservativo
in cui l’energia potenziale non è un minimo sia instabile. L’inversione del teorema di
Lagrange-Dirichlet (che offre solo condizioni sufficienti per la stabilità) non è però materia
completamente chiarita; mostrare che per l’energia potenziale C ∞ ma non analitica (q ∈
R1 ),
1 −1
U(q) = cos( ) e q2 , q 6= 0, U(0) = 0,
q
q = 0 è stabile benché il punto stazionario q = 0 non sia un minimo (questo è noto come
“esempio di Painlevé-Wintner”). Il teorema enunciato più sotto (e non dimostrato) è un
esempio di parziale inversione del teorema di Lagrange-Dirichlet.
Esercizio 4: per i sistemi meccanici conservativi a vincoli lisci e fissi ha senso aspettarsi
l’asintotica stabilità?
Esercizio 5: mostrare che per i generali sistemi dinamici ẋ = X(x) la stabilità di un
equilibrio x∗ implica l’unicità della soluzione quiete x(t) = x∗ per il problema di Cauchy
con dato iniziale x0 = x∗ , senza nulla richiedere sulla regolarità di X.
Esercizio 6: ad una prima lettura della definizione di asintotica stabilità la condizione i)
sembrerebbe rindondante, cioè implicata dalla ii): perché tale argomento è falso? Nelle
applicazioni è utile il seguente teorema, che non dimostreremo:
Teorema (THND) Sia dato un sistema olonomo, bilaterale, liscio. Le sollecitazioni siano
tutte conservative, vale a dire:
∂U
Qh (q) = − (q).
∂qh
∂U ∗
Sia q ∗ un punto stazionario per U: (q ) = 0. Sia la matrice hessiana non degenere:
∂qh
∂2U
det (q ∗ ) 6= 0.
∂qh ∂qk
Allora l’equilibrio q ∗ è stabile se e solo se la forma quadratica
∂2U
(q ∗ )λh λk > 0, ∀λ 6= (0, . . . , 0)
∂qh ∂qk
cioè, è definita positiva.
Mettiamo in evidenza con esempi concreti il carattere essenziale dell’ipotesi di sole forze
conservative.
Esempio 1: si consideri una particella di massa m vincolata senza attrito su di un piano
orizzontale rotante (O, x, y) con velocità angolare di trascinamento rispetto agli spazi iner-
ziali ω, un vettore costante diretto lungo l’asse z. La particella sia soggetta ad una forza
83
elastica di centro O. Gravità e reazione vincolare fanno lavoro nullo e un semplice conto
mostra che O è d’equilibrio nel sistema rotante e l’energia potenziale della forza elastica e
di quella centrifuga vale
1
U(x, y) = (h − mω 2 )(x2 + y 2 ).
2
Sulla particella agisce la forza di Coriolis F = −2mω ∧ v, v = (ẋ, ẏ), che ha un ovvio
carattere giroscopico, F · v = 0. Lagrange-Dirichlet ci dice (condizione solo sufficiente)
che c’è stabilità se h − mω 2 > 0. E un’applicazione frettolosa del teorema di cui sopra ci
porterebbe a concludere che c’è stabilità se e solo se h − mω 2 > 0. Ma questa conclusione
è troppo pessimistica: l’analisi diretta delle soluzioni (non è difficile determinarle, è un
semplice sistema lineare) mostra che in effetti la stabilità sussiste per ogni valore della
costante elastica h > 0.
1
U(x, y) = (ax2 + by 2 ).
2
Se almeno uno dei due coefficienti è nullo, è facile vedere che l’origine è instabile (farlo).
Dal precedente teorema l’origine è stabile se e solo se a > 0 e b > 0. Supponiamo dunque
una situazione di instabilità, e per semplicità porremo a = b = −µ < 0. La particella ha
carica elettrica e; ci si chiede se sia possibile introdurre un campo magnetico costante H e
ortogonale al piano (O, x, y) tale da stabilizzare, mediante la conseguente forza di Lorentz,
l’equilibrio (x,y)=(0,0). Le equazioni dinamiche sono
e
mẍ = µx + H ẏ,
c
e
mÿ = µy − H ẋ.
c
√
L’omeomorfismo R2 ∼ C —si moltiplica la seconda per i = −1 e si somma membro a
membro— ci dà (ζ = x + iy)
eH
mζ̈ = µζ − i ζ̇.
c
Con le soluzioni test della forma ζ(t) = eλt costruiamo l’equazione caratteristica
eH
mλ2 + i λ−µ=0
c
84
le cui radici sono q
−i eH
c ± −( eH 2
c ) + 4mµ
λ1,2 = .
2m
Se il campo magnetico è sufficientemente intenso, cioè se
eH 2
−ω 2 := −( ) + 4mµ < 0,
c
allora l’integrale generale è dato dalle combinazioni complesse
eH iω iω
ζ(t, c1 , c2 ) = c1 eλ1 t + c2 eλ2 t = e−i 2mc t (c1 e 2m t + c2 e− 2m t ).
Esiste una abbastanza ovvia (determinarla) relazione lineare non singolare tra i dati iniziali
(x, y, ẋ, ẏ) ∈ R4 e le coppie (c1 , c2 ) ∈ C2 . Si tratta infine di verificare che per ogni ε > 0
esiste un δ > 0 tale che comunque si scelga
accade che
|(ζ(t, c1 , c2 ), ζ̇(t, c1 , c2 ))|C2 < ε
per ogni t > 0. (E’ un conto facile: le curve t 7→ (ζ(t, c1 , c2 ), ζ̇(t, c1 , c2 )) sono uniformemente
limitate da una costante che va a zero con |(c1 , c2 )|C2 ).
Sfortunatamente tale stabilizzazione è molto fragile. Basta la presenza di una piccola
forza di resistenza di mezza di tipo viscoso come F = −ν(ẋ, ẏ) con un arbitrariamente
piccolo ν > 0 perché la stabilità sia distrutta. Le nuove equazioni dinamiche nel campo
complesso ora diventano
eH
mζ̈ + (ν + i )ζ̇ − µζ = 0.
c
Se ora studiamo le radici dell’equazione caratteristica, notiamo che il loro prodotto è
µ
λ1 λ2 = − ,
m
quindi
µ
Re(λ1 λ2 ) = − , Im(λ1 λ2 ) = 0,
m
da quest’ultima:
Reλ1 Imλ1
=− .
Reλ2 Imλ2
Ma, per piccoli valori ν > 0, mediante argomento di continuità, abbiamo che
Imλ1 Imλ1
sgn = sgn = +1,
Imλ2 ν>0 Imλ2 ν=0
85
cosicché
Reλ1
< 0,
Reλ2
e dunque c’è ora una radice con parte reale positiva: è l’instabilità. Si noti, un meccanismo
questo, in un certo senso contro l’intuizione, qualitativamente opposto a quanto accade
nel caso di sistema dinamico con equilibrio stabile la cui stabilità è deducibile mediante
funzione di Lyapunov di tipo energia totale e al quale aggiungiamo viscosità.
Esiste un modo più semplice e geometrico per rendersi conto della distruzione della
stabilità giroscopica da parte della viscosità. Si consideri in R3 il grafico (concavo) della
funzione energia potenziale. Nonostante la presenza della forza giroscopica, l’integrale di
Jacobi, dato dall’energia cinetica più l’en. potenziale, si conserva. Si fissi, con un piano
ortogonale all’asse z ed intersecante il grafico, il valore dell’integrale di Jacobi. La positività
dell’energia cinetica ci avverte che la regione consentita alla particella, letta su tale piano,
è quella esterna all’intersezione col grafico dell’en. pot. Aggiungiamo ora la viscosità: il
piano scende, verso valori di z via via minori, la regione consentita viene via via spinta
all’infinito: è l’instabilità.
86
3.5 Equazioni Differenziali Lineari (richiamo)
L’equazione differenziale lineare in Rm :
ẋ = Ax, x(0) = x0 ,
x(t, x0 ) = eAt x0 ,
ove
+∞ k
A
X A
e := .
k!
k=0
Indaghiamo sulla struttura più generale di tale risolvente. In questa analisi è cruciale il
seguente
Teorema (Jordan). Per ogni matrice A ∈ L(m, K), ove K = R oppure C, esiste
P ∈ GL(m, C), cioè una matrice a detP 6= 0 ed ad elementi complessi, tale che, mediante
P , A sia simile alla somma di due matrici D, N ∈ L(m, C): P −1 AP = D + N delle quali
si sa che:
λ1 0
D è diagonale : A =
.. ,
.
0 λm
N è ν − nilpotente : N ν+1 = O,
D commuta con N : DN = N D.
Si verifica facilmente che lo spettro di A, Spect(A), è lo spettro di P −1 AP , che è anche lo
spettro di D, cioè gli elementi diagonali di D. Dunque:
−1 AtP
eAt = P eP P −1 = P eDt+N t P −1 = P eDt eN t P −1 =
..
. 0 ν
λ t
X (N t)k −1
=P
e i P ,
..
k!
k=0
0 .
ove si sono utilizzati i risultati contenuti in: De Marco, Analisi Due/Uno, pp.150-153, e si
è tenuto conto che l’esponenziale di una matrice diagonale è diagonale e
{λ1 , . . . , λi , . . . , λm } = Spect(A) ⊂ C
La sup-norma di eAt (la solita, sulla palla dei vettori unitari), per t ≥ 0, si può stimare
facilmente, usando la struttura di algebra di Banach,
87
Osservazione. Se <e(SpectA) < 0, è immediato vedere che x = 0 è un equilibrio asinto-
ticamente stabile per ẋ = Ax. Sia infatti α = maxi=1,...,m {<e(λi )} < 0 e sia, per
∗
t ≥ 0, a = Ce−|α|t (1 + t∗ν ) il massimo della funzione C e−|α|t (1 + tν ). Fissato un ε > 0
arbitrariamente, sia δ = ε/a. Per ogni x0 ∈ B(0, δ):
≤ C e−|α|t (1 + tν )|x0 | ≤
≤ a|x0 | < ε;
inoltre: lim x(t, x0 ) = 0.
t→+∞
cioè le soluzioni ε-dominate nel senso della stabilità rendono il resto del campo vetto-
riale, R(x(t, x0 )), dell’ordine di ε2 . Questo induce a pensare che lo studio del problema
linearizzato
ẏ = X 0 (0)y, y(0) = x0 ,
a parità di dato iniziale, sia una buona approssimazione del problema, non lineare
ẋ = X(x), x(0) = x0 .
la soluzione del problema originale non lineare si può implicitamente rappresentare nel
seguente modo: Z t
X 0 (0)t 0
x(t, x0 ) = e x0 + eX (0)(t−s) R(x(s, x0 ))ds.
0
88
Accettiamo, senza dimostrarlo, il seguente teorema (da un punto di vista intuitivo è molto
ragionevole):
“ Se x = 0 è d’equilibrio stabile per ẋ = X(x) allora <e{Spect(X 0 (0))} ≤ 0 ”.
(Più avanti stabiliremo che se <e{Spect(X 0 (0))} < 0 allora x = 0 è asintoticamente stabile.)
In intervalli compatti di tempo [0, T ] stimiamo il divario tra le due soluzioni.
0
supt∈[0,T ] x(t, x0 ) − y(t, x0 ) = supt∈[0,T ] x(t, x0 ) − eX (0)t x0 =
Z t
X 0 (0)(t−s)
= supt∈[0,T ] e
R(x(s, x0 ))ds ≤
0
0
≤ supt∈[0,T ] t sups∈[0,t]
eX (0)(t−s)
R(x(s, x0 )) ≤
dato che maxi <e(λi ) ≤ 0 , il sups∈[0,t] e{maxi <e(λi )}(t−s) è realizzato per s = t,mentre il
sups∈[0,t] 1 + (t − s)ν k ε2 è realizzato per s = 0.
Infine:
supt∈[0,T ] |x(t, x0 ) − y(t, x0 )| ≤ T C (1 + T ν ) k ε2 .
Nel caso delle Piccole Oscillazioni dei Sistemi Lagrangiani, X 0 (0) è diagonalizzabile, cioè
N = O (quali sono le ragioni per cui ciò accade?), e quindi la stima diventa:
Come usare questa stima? Dire che in intervalli di tempo dell’ordine di T = 1/ε il divario
è dell’ordine di ε, come si verifica facilmente, è completamente inutile: x = 0 è d’equilibrio
stabile sia per il sistema linearizzato, sia per il sistema non lineare e già sappiamo che,
se prendiamo x0 in una δ-palla opportunamente piccola, sia x(t, x0 ) sia y(t, x0 ) sono ε-
dominate e per sempre (∀t ≥ 0). La stima di cui sopra ci dice invece che, per esempio, per
√ 3
intervalli dell’ordine di T = 1/ ε (< 1/ε), il divario è dell’ordine di ε 2 :
3
supt∈[0,1/√ε] |x(t, x0 ) − y(t, x0 )| ≤ C k ε 2 ,
89
Teorema. Sia X(0) = 0. Se <e Spect(X 0 (0)) < 0 allora x = 0 è un equilibrio
La condizione sullo spettro rende convergente tale integrale improprio, come si può verifi-
care (esercizio).
Calcoliamo
X 0 (0)T B + BX 0 (0) =
Z +∞
0 T 0 0 T 0
X 0 (0)T eX (0) s eX (0)s + eX (0) s eX (0)s X 0 (0) ds =
0
+∞
d X 0 (0)T s X 0 (0)s
Z
e e ds = −I.
0 ds
Verifichiamo, poi, che V (x) := (x, Bx) è una funzione di Lyapunov, (x, y) := x · y.
i): è definita positiva in x = 0:
V (0) = 0;
R +∞ T X 0 (0)T s X 0 (0)s R +∞ 0 2
V (x) = 0 x e e x ds = 0 eX (0)s x ds > 0 per x 6= 0, infatti
l’esponenziale è sempre non singolare, det eB = etrB > 0, ∀B ∈ L(m, R).
ii): LX V (x) = (ẋ, Bx) + (x, B ẋ) =
= X 0 (0)x, Bx + x, BX 0 (0) x + O |x|3 =
90
= x, (−I) x + O |x|3 = −|x|2 + O |x|3 , esiste pertanto un intorno I di x = 0 in cui
Altre e più approfondite informazioni sul Primo Metodo di Lyapunov si trovano, per
esempio, nell’ultima edizione di Jack Hale: “Ordinary Differential Equations”.
Q := C ∞ (R; R)
lo spazio degli stati ove evolve il sistema. Il campo vettoriale (da un altro punto di vista, è
un operatore differenziale) sia
X : Q −→ Q
dv
v(·) 7→ X(v(·))(x) := x (x).
dx
Studiare la dinamica associata ad X significa ricercare le curve R 3 t 7→ v(t, ·) ∈ Q tali che
v̇ = X(v)
v|t=0 = ϕ ∈ Q.
In dettaglio,
∂ ∂
v(t, x) = x v(t, x), v(0, x) = ϕ(x).
∂t ∂x
Si tratta quindi di studiare un problema di Cauchy per un’equazione alle derivate parziali,
e la semplice struttura scelta ci permette di scriverne esplicitamente la soluzione:
Si nota subito che la soluzione identicamente nulla v = 0 è un equilibrio per tale sistema
dinamico: X(0) = 0. Per analizzarne l’eventuale Lyapunov stabilità, doteremo dunque di
topologia lo spazio Q := C ∞ (R; R) mediante opportune norme: vedremo che la non equi-
valenza topologica delle norme negli spazi infinito-dimensionali implicherà radicali differen-
ze qualitative intorno alla stabilità. i) Consideriamo ||v||∞ = supx∈R |v(x)|. Ci chiediamo
se per ogni ε > 0 esiste δ > 0 tale che per ogni dato iniziale ||ϕ||∞ < δ la soluzione v(t, ·)
sia tale che ||v(t, ·)||∞ < ε per ogni t ≥ 0; questo è banalmente vero per δ = ε:
91
dunque v = 0 è un equilibrio stabile nella L∞ -topologia. ii) Consideriamo ora le norme Lp :
Z
1/p
||v||Lp = |v(x)|p dx .
x∈R
d
||v||C 1 = sup |v(x)| + sup | v(x)|.
x∈R x∈R dx
Ora accade che
d d
||v(t, ·)||C 1 = sup |ϕ(et x)| + sup | ϕ(et x)| = sup |ϕ(x)| + et sup | ϕ(x)|.
x∈R x∈R dx x∈R x∈R dx
Sia Φ(t) la matrice risolvente che in t = 0 vale l’identità, Φ(0) = I. Ogni altra risolvente
Ψ(t) è del tipo Ψ(t) = Φ(t)K per arbitrarie matrici non singolari K:
Per esempio, si verifica direttamente che la risolvente che al tempo t = t0 vale l’identità
è Φ(t)K con K = Φ(t0 )−1 ; in effetti, tale matrice inversa è definita poiché il teorema di
esistenza e unicità ci avverte che det Φ(t) 6= 0.
92
In particolare, la matrice Φ(T ) è non-singolare. Inoltre la funzione matriciale Φ̄(t) :=
Φ(t + T ) è anch’essa una risolvente (lo si verifica direttamente) e dunque si otterrà da Φ(t)
mediante il prodotto a destra con una opportuna matrice costante K,
Φ(t + T ) = Φ(t)K,
ove ora K è la matrice che, come si nota subito, vale K = Φ(T ). Dunque:
Φ(t + T ) = Φ(t)Φ(T ).
Dal fatto che Φ(T ) è non-singolare segue che esiste qualche sua matrice logaritmo B, tale
cioè che
eB = Φ(T )
(è un teorema standard in teoria delle matrici). Abbiamo ora tutti gli elementi per
enunciare e dimostrare il seguente:
Teorema di Floquet.
B
Φ(t) = P (t)e T t ,
ove P (t) è una funzione matriciale T -periodica.
Prova.
B
P (t) = Φ(t)e− T t .
B B B
P (t + T ) = Φ(t + T )e− T (t+T ) = Φ(t)Φ(T )e−B e− T t = Φ(t)e− T t = P (t).
Applicazione importante. Supponiamo che la curva chiusa [0, T ] 3 t 7→ x(t) sia solu-
zione di un’equazione non lineare ẋ = X(x). Proviamo a studiare i moti vicini al primo
ordine al moto periodico x(t),
d
(x(t) + ∆x(t)) = X(x(t) + ∆x(t)) =
dt
= X(x(t)) + X 0 (x(t))∆x(t) + O(t, |∆x(t)|2 ),
siamo dunque condotti allo studio dell’equazione lineare a coefficienti T -periodici:
d
∆x(t) = X 0 (x(t))∆x(t).
dt
Quindi, posto A(t) := X 0 (x(t)), lo spettro di B ci fornisce una indicazione al primo ordine
sull’andamento qualitativo delle soluzioni vicine al moto periodico x(t); per esempio, se lo
spettro è a parte reale negativa, allora l’orbita periodica x(t) possiede una ovvia proprietà
attrattiva: partendo da ∆x(0) 6= 0 per t → +∞ si tende a zero, cioè all’orbita x(t).
93
94
Capitolo 4
Meccanica di Lagrange
La Meccanica Lagrangiana codifica sistematicamente la separazione della determinazione del moto dalla determi-
nazione delle reazioni vincolari per i sistemi a vincoli lisci. E’ il trionfo delle ‘geometrizzazione’ della meccanica:
determinare moti è, in un certo senso –lo vedremo in dettaglio nel capitolo del Calcolo delle Variazioni–, equivalente
alla soluzione del problema geometrico della ricerca di curve di lunghezza stazionaria (minima). La filosofia della
Relatività Generale di Einstein –la teoria moderna della gravitazione– porta alle estreme conseguenze questo punto
di vista. La citazione in copertina a queste dispense è una frase –riportata dai caratteri originali– della “Mécanique
Analitique” di J.L. Lagrange del 1788, in cui apparvero per la prima volta le equazioni, appunto, di Lagrange.
N
d ˘ X ∂
˘ i (q, t)|q=q(t) dqh (t) + ∂ OP
˘ i (q, t)|q=q(t)
vi (t) = OPi (q1 (t), . . . , qN (t), t) = OP
dt ∂qh dt ∂t
h=1
d
Ne deriva in modo naturale la seguente definizione di derivata totale dt dell’immersione
N
vincolare, la quale, ad ogni dato istante t, prende un vettore q̇ ∈ R , che è lo spazio
95
tangente a (ogni) q di U, RN = Tq U, e lo manda, allo stesso istante t, nel vettore v =
d ˘ 3n , più in dettaglio:
dt OP ∈ TŎP (q,t) R
U × RN × R −→ R3n × R3n × R
N
d ˘ X ∂ ˘ ∂ ˘
(q, q̇, t) 7−→ ŎP (q, t), OPi (q, q̇, t) := OPi (q, t)q̇h + OP i (q, t), t
dt ∂qh ∂t
h=1
Una definizione analoga si realizza pure (la useremo) per la derivata totale seconda:
d2 ˘
OPi (q, q̇, q̈, t) =
dt2
N N N
X ∂ ˘ X ∂2 ˘ i (q, t)q̇h q̇k + 2
X ∂2 2
˘ i (q, t)q̇h + ∂ OP˘ i (q, t)
OPi (q, t)q̈h + OP OP
∂qh ∂qk ∂qh ∂t∂qh ∂t2
h=1 h,k=1 h
I moti dinamicamente possibili per il nostro sistema [t0 , t1 ] 3 t 7→ OP (t) = ŎP (q(t), t),
sono tutti e soli quelli che soddisfano al principio di D’Alembert:
n
X d2 d
mi 2
OPi (t) − Fi (OP (t), OP (t), t) · δPi = 0,
dt dt
i=1
Infine definiamo
n
X d2 ˘ ∂ ˘
τh (q, q̇, q̈, t) := mi 2
OP i (q, q̇, q̈, t) · OPi (q, t)
dt ∂qh
i=1
96
Il pr. di D’Alembert diventa
N
X
(τh (q, q̇, q̈, t) − Qh (q, q̇, t))δqh = 0 ∀ (δqh )h=1,...,N arbitrari in RN ,
h=1
Dobbiamo dettagliare le τh (q, q̇, q̈, t). Questo sarà effettuato usando la funzione Energia
Cinetica nelle variabili Lagrangiane libere T (q, q̇, t):
n 2
1X d
˘
T (q, q̇, t) = mi OP i (q, q̇, t)
2 dt
i=1
(Un po’ di dettagli di facile algebra mostrano che T è un polinomio quadratico nelle q̇ e a
coeff. dipendenti da q e t. Si ritornerà su ciò). Calcoliamo
n
∂ X d ˘ ∂ d ˘
(i) T (q, q̇, t) = mi OP i (q, q̇, t) · OP i (q, q̇, t) =
∂ q̇h dt ∂ q̇h dt
i=1
n
X ∂ ˘
(si veda def. sopra di derivata totale) = mi vi · OP i
∂qh
i=1
n n
d ∂ X ∂ ˘ X d ∂ ˘
(ii) T (q, q̇, t) = mi ai · OP i + m i vi · OP i =
dt ∂ q̇h ∂qh dt ∂qh
i=1 i=1
n
X d ∂ ˘
= τh + mi vi · OP i
dt ∂qh
i=1
∂ d ˘ ∂
= OP i = vi ,
∂qh dt ∂qh
cosicché
n n
X d ∂ ˘ X ∂ ∂T
mi vi · OP i = m i vi · vi =
dt ∂qh ∂qh ∂qh
i=1 i=1
97
Giungiamo alla conclusione che la conoscenza della funzione Energia Cinetica T (q, q̇, t) e
delle Comp. Lagr. della Sollecitazione Qh (q, q̇, t) sono sufficienti per costruire le equazioni
differenziali determinanti i moti del sistema, le equazioni di Lagrange:
d ∂T ∂T
− = Qh h = 1, ..., N
dt ∂ q̇h ∂qh
dove
n
X ∂ ˘ ∂ ˘
ahk (q, t) := mi OPi (q, t) · OPi (q, t),
∂qh ∂qk
i=1
n n
X ∂ ˘ ∂ ˘ 1X ∂ ˘ ∂ ˘
bh (q, t) := mi OPi (q, t) · OP i (q, t), d(q, t) := mi OP i (q, t) · OPi (q, t).
∂qh ∂t 2 ∂t ∂t
i=1 i=1
In entrambi i casi (v. fissi o mobili), la funzione ahk (q, t) è a valori nelle matrici simmetriche
definite positive. Infatti, per ogni q e t fissato, la mappa lineare
N ˘ 1 N ˘ n
N
X ∂ OP X ∂ OP
R 3 λ = (λ1 , ..., λN ) 7→ V(λ) = λh , ..., λh ∈ R3n
∂qh ∂qh
h=1 h=1
è a rango massimo, ha dunque nucleo banale, vale zero solo per λ = (λ1 , ..., λN ) = 0.
Indichiamo con • il seguente prodotto scalare non degenere in R3n :
98
n
X
V • W := mi V i · W i
i=1
di Lagrange, si tratta di indagare inizialmente sul termine cinematico τh (q, q̇, q̈, t).:
N N
d ∂T ∂T d X ∂T X
− = ahk (q, t)q̇k + bh (q, t) − = ahk (q, t)q̈k + (termini in q, q̇, t)
dt ∂ q̇h ∂qh dt ∂qh
k=1 k=1
la matrice ahk (q, t) è invertibile e quindi otteniamo infine la struttura q̈k = Ak (q, q̇, t), k =
1, ..., N . Si ottiene cosı́ la forma normale delle equazioni di Lagrange:
q 2N 2N q v
x := , ẋ = X(x, t), X : R × R → R , X : , t 7→
v v A(q, v, t)
99
e si verifica facilmente che le equazioni di Lagrange si scrivono unicamente usando tale
funzione Lagrangiana L : RN × RN × R → R:
d ∂L ∂L
− =0 h = 1, . . . N.
dt ∂ q̇h ∂qh
risolve
d ∂L ∂L
(5) − = 0, h = 1, . . . , N,
dt ∂ Q̇h ∂Qh
100
∂qk
Prova. Preliminarmente osserviamo che q̇k = ∂Q h
(Q)Q̇h , cosicché ∂∂Q̇q̇k = ∂qk
∂Qh . Detta-
h
gliamo il primo membro di (5):
d ∂L ∂qk ∂L ∂qk ∂L ∂ 2 qk
dt ∂ q̇k ∂Qh − ∂qk ∂Qh − ∂ q̇k ∂Qh ∂Qj Q̇j =
d ∂L ∂qk ∂L ∂ 2 qk ∂L ∂qk ∂L ∂ 2 qk
dt ∂ q̇k ∂Qh + ∂ q̇k ∂Qj ∂Qh Q̇j − ∂qk ∂Qh − ∂ q̇k ∂Qh ∂Qj Q̇j =
∂ 2 qk ∂ 2 qk
(restringendosi a diffeomorfismi di classe C ρ con ρ ≥ 2 , onde: ∂Qj ∂Qh = ∂Qh ∂Qj )
d ∂L ∂L ∂qk
= − , cioè
dt ∂ q̇k ∂qk ∂Qh
d ∂L ∂L d ∂L ∂L ∂qk
(6) − = −
dt ∂ Q̇h ∂Qh dt ∂ q̇k ∂qk ∂Qh
∂L
= 0, cioè L = L(q1 , . . . , qh0 −1 , qh0 +1 , . . . , q̇1 , . . . , q̇N , t)
∂qh0
0
In tal caso, scrivendo semplicemente l’equazione di Lagrange relativa all’indice h , ottenia-
mo
d ∂L
=0
dt ∂ q̇h0
cioè la funzione scalare
∂L
(q1 , . . . , qh0 −1 , qh0 +1 , . . . , q̇1 , . . . , q̇N , t)
∂ q̇h0
101
Infatti, la derivata di Lie di E rispetto al campo vettoriale Lagrangiano vale:
N N N N
d X d ∂L X ∂L X ∂L X ∂L
E(q, q̇) = q̇h + q̈h − q̇h − q̈h =
dt dt ∂ q̇h ∂ q̇h ∂qh ∂ q̇h
h=1 h=1 h=1 h=1
N
X d ∂L ∂L
= − q̇h = 0.
dt ∂ q̇h ∂qh
h=1
Osservazione Questi due semplici esempi di integrali primi mostrano un aspetto algebrico-
geometrico in un certo senso inatteso: in entrambi i casi notiamo che la Lagrangiana in
studio è invariante rispetto ad un gruppo di trasformazioni; nel primo caso, c’è un gruppo
(λ-parametrico) di trasformazioni delle coordinate
R × RN 3 (λ, q) 7→ q̄ = q̄(λ, q) := (q1 , . . . , qh0 −1 , qh0 + λ, qh0 +1 , . . . , qN ) ∈ RN ,
nel secondo caso, la Lagrangiana in studio è invariante rispetto al seguente gruppo (λ-
parametrico) di trasformazioni del tempo:
R × R 3 (λ, t) 7→ t̄ = t̄(λ, t) := t + λ ∈ R.
Esiste una teoria generale (si veda più avanti), elaborata nel 1918 da Emmy Nöther, che
cataloga gli integrali primi (gli invarianti dinamici) generati da più generali gruppi di tra-
sformazioni che lasciano invariata la funzione di Lagrange; tali gruppi si dicono simmetrie
per la funzione di Lagrange in studio.
102
∂L
Consideriamo i k integrali primi generati da ∂qM = 0:
∂L
(∗) fM = (qk+1 , . . . , qα , . . . , qN , q̇1 , . . . , q̇N , t), M = 1, . . . , k.
∂ q̇M
Supponiamo di essere interessati a dei (o ad un) problemi(a) di Cauchy q0 , q̇0 tali(e) che gli
integrali primi fM valgano cM = fM (q0 , q̇0 , t0 ). L’ipotesi tecnica sopra fatta ci garantisce
che pure la funzione matriciale
∂2
(∗∗) L(q, q̇, t) è definita positiva.
∂ q̇M ∂ q̇P M,P =1,...,k
Questo ci permette di applicare il teorema della funzione inversa in (∗) ed esprimere le q̇M
in funzione delle fM parametricamente per ogni qα , q̇β , α, β = k + 1, . . . , N :
q̇M = SM (. . . , cP , . . . ; . . . , qα , . . . , q̇β , . . . , t)
2
In effetti, basterebbe che det ∂ q̇M∂ ∂ q̇P L(q, q̇, t) 6= 0, il fatto che invece valga (molto di
più) (∗∗) ci dice che tale inversione è globale, e questo in virtù di un generale teorema
di inversione globale, riportato (e dimostrato) per esempio nel capitolo della meccanica
Hamiltoniana e trasf. canoniche. Definiamo la Lagrangiana Ridotta:
L : RN −k × RN −k × R → R,
k
X
(qα , q̇β , t) 7→ L := L(qα , SM (cP ; qα , q̇β , t), q̇β , t) − cM SM (cP ; qα , q̇β , t)
M =1
Enunciamo infine il
Teorema di Routh La soluzione dei pr. di Cauchy che rendono fM = cM si ottengono
risolvendo le equazioni di Lagrange ridotte per L, ottenendo cosı́ t 7→ qα (t), ed effettuando
le seguenti integrazioni dirette per ottenere le rimanenti t 7→ qM (t):
Z t
(?) qM (t) = qM (t0 ) + SM (cP ; qα (t0 ), q̇β (t0 ), t0 )dt0 .
t0
d ∂L ∂L
0= − =
dt ∂ q̇γ ∂qγ
k k
d ∂L X ∂L ∂SM X ∂
= + − cM SM (cP ; qα , q̇β , t) −
dt ∂ q̇γ ∂ q̇M ∂ q̇γ ∂ q̇γ
M =1 M =1
103
k k
∂L X ∂L ∂SM X ∂
− − + cM SM (cP ; qα , q̇β , t) =
∂qγ ∂ q̇M ∂qγ ∂qγ
M =1 M =1
d ∂L ∂L ∂L
= − (si è utilizzato il fatto che = cM )
dt ∂ q̇γ ∂qγ ∂ q̇M
In altre parole, se in RN −k la curva t 7→ qα (t) risolve le equ. di Lagrange per L, allora la
curva t 7→ (qM (t), qα (t)), dove le qM (t) sono ottenute mediante l’integrazione diretta (?),
risolve pure le originali equ. di Lagrange per L in RN .
Esercizio: Si consideri la Lagrangiana del problema di Kepler piano: L(r, θ, ṙ, θ̇). Si
osservi che esiste un integrale di ciclicità e che corrisponde alla conservazione della vel.
areolare. Si costruisca, per ogni fissati valore c di tale integrale primo, il Lagrangiano
ridotto L(r, ṙ) e se ne discutano le soluzioni qualitativamente, osservando che è del tipo
L = 12 µ − Ucef f (r) (ellissi, parabola, iperboli.)
(i) Qh (0, q) = qh ,
L Qh (λ, q), N ∂Qh
P
(ii) k=1 ∂qk (λ, q)q̇k , t = L(q, q̇, t) ∀λ ∈ I ,
allora la funzione:
N
X ∂L ∂Qh
(6) f (q, q̇, t) := (q, q̇, t) (0, q)
∂ q̇h ∂λ
h=1
104
tal caso il campo vettoriale che lo genera è X(q) = ∂Q
∂λ (λ, q) λ=0 e l’espressione (6) è uno
scalare invariante, in quanto valutazione di una forma su un vettore.
Prova. Supposta la condizione (i), la (ii) vale per ogni sistema Lagrangiano solo per
λ = 0 , la validità della (ii) per la nostra particolare funzione Lagrangiana L dice in
sostanza che il primo membro di quell’uguaglianza è indipendente da λ in I.
Sia qh (t) un moto risolvente (1), allora, dalle (ii):
N
" #
∂ X ∂Qh
L(Q(λ, q(t)), (λ, q(t))q̇k (t), t) =0
∂λ ∂qk λ=0
k=1
(nelle formule che seguono omettiamo il simbolo della sommatoria sugli indici doppi)
∂L ∂Qh ∂L ∂ 2 Qh
0 = ∂qh (q(t), q̇(t), t) ∂λ (0, q(t)) + ∂ q̇h (q(t), q̇(t), t) ∂λ∂qk (0, q(t))q̇k (t) =
∂L ∂Qh ∂L d ∂Qh
= ∂qh (q(t), q̇(t), t) ∂λ (0, q(t)) + ∂ q̇h (q(t), q̇(t), t) dt ∂λ (0, q(t)) =
∂L ∂Qh d ∂L ∂Qh
= ∂qh (q(t), q̇(t), t) ∂λ (0, q(t)) + dt ∂ q̇h (q(t), q̇(t), t) ∂λ (0, q(t)) +
d ∂L ∂Qh
− dt ∂ q̇h (q(t), q̇(t), t) ∂λ (0, q(t)) =
d ∂L ∂L ∂Qh d ∂L ∂Qh
=− dt ∂ q̇h − ∂qh ∂λ + dt ∂ q̇h ∂λ ,
105
infatti:
Ẋα(i) = ẋ(i)
α e X (i) − X (j) = x(i) − x(j) .
Otteniamo dalla (6) il seguente integrale primo:
n X
3 n
!
X X
I= mi ẋ(i)
α aα = mi v (i)
·a ,
i=1 α=1 i=1
data l’arbitrarietà di a , concludiamo con il risultato (ben noto): il vettore quantità di moto
n
X
(9) P = mi v (i)
i=1
(11) R = eλW (λ ∈ R) .
106
e dunque RT R = e−λW +λW = I ; inoltre : det R = det eλW = etr(λW ) = e0 = 1 .
Vale: (i) 2
Ẋ =| ẋ(i) |2 e X (i) − X (j) =| x(i) − x(i) | .
Pn P3h (i) ∂
(i)
= i=1 m ẋ
α=1 i α ∂λ R(λ)x αλ=0
Pn P3 (i) ∂ λW x(i)
= i=1 α=1 mi ẋα ∂λ e αλ=0
Pn P3 (i) λW x(i)
= i=1 α=1 mi ẋα W e α λ=0
Pn P3 (i)
mi ẋα W x(i) α
=
Pni=1 P3α=1 (i) (i)
= α=1 mi ẋα (b ∧ x )α
Pi=1
n
= mi ẋ(i) · (b ∧ x(i) )
Pi=1
n
= i=1 b · x(i) ∧ mi ẋ(i)
Pn
= b · i=1 x(i) ∧ mi ẋ(i)
107
108
Capitolo 5
d ∂T ∂T ∂U
(1) − =− (h = 1, . . . , N )
dt ∂ q̇h ∂qh ∂qh
∂ahk
più in dettaglio (ove con la virgola si intende la derivata parziale ahk,l := ∂ql ):
d 1
[ahk (q)q̇k ] − alm,h (q)q̇l q̇m = −U,h (q),
dt 2
1
ahk,m q̇m q̇k + ahk q̈k − alm,h q̇l q̇m = −U,h ,
2
moltiplico per a−1
jh (è noto che det(a) > 0):
1
(2) q̈j = a−1
jh akm,h − ahk,m q̇m q̇k − a−1
jh U,h .
2
109
Le equazioni di Lagrange (2) in RN si scrivono come un sistema del primo ordine in R2N ,
q
x= ζ ,
(
q̇i = ζi ,
(3) −1 1
−1 .
ζ̇j = [ajh 2 akm,h − ahk,m ]ζ m ζk − a jh U,h
Il sistema (3) è del tipo: ẋ(t) = X(x(t)). Scriviamo il sistema linearizzato: ẋ(t) =
X 0 (0)x(t), con polo in x = (q, ζ) = (0, 0).
Si ottiene:
(
q̇i = ζi
(4) .
ζ̇j = −a−1
jh (0)U,hk (0)qk
110
U0
Con un TERZO cambio diagonalizziamo Uij00 = √aiji aj ; come nel primo cambio, tale tra-
sformazione è una rotazione; otteniamo, in queste ultime coordinate (dette coordinate
normali):
N
(0) 1X 2
T = q̇i
2
(6) i=1
N
(0) 1X 2 2
U = ωi qi .
2
i=1
Supponiamo ora che il nostro problema sia quello di determinare le frequenze caratteri-
stiche ωi (e non già la trasformazione S, q = Sq, che muta le originali coordinate q nelle
coordinate normali q). Vettorialmente le (5) si scrivono:
ove a(0) = (ahk (0))h,k=1,...,N , ∇2 U (0) = (U,hk (0))h,k=1,...,N . Denotiamo, come anticipato,
con S la composizione delle tre trasformazioni
D’altra parte affermare che S diagonalizza la matrice cinetica a(0) nella matrice identica I
significa
2T (0) = ahk (0)q̇h q̇k = (a(0)q̇, q̇) = (a(0)S −1 q̇, S −1 q̇) = (S −T a(0)S −1 q̇, q̇) = (q̇, q̇),
cioè
(11) S −T a(0)S −1 = I.
111
Analogamente
2
ω1 0 ... 0
0 ω2 0 . . . 0
2
(13) Ω2 := . .. .. .
.. ..
. . .
0 . . . . . . 0 ωN2
(14) q̈ + Ω2 q = 0.
0 = det Ω2 − ω 2 I ,
112
Capitolo 6
Indichiamo con R ≈ 6 · 106 metri il raggio della Terra, e con G il suo centro. In un punto
O sulla superficie terrestre, ad una latitudine α (questo è l’angolo del vettore GO col piano
equatoriale, vedi la figura qui sotto) consideriamo una superficie sferica, di raggio l e di
centro Q, tangente alla sfera terrestre.
Una particella P di massa m è vincolata senza attrito su questa sfera ed è soggetta alla
forza di gravità Newtoniana. Dato che l << R (per esempio, l ≈ 15 metri, e R ≈ 6 · 106
metri), considereremo l’usuale approssimazione di forza-peso.
NOTA STORICA (da: Alessandro Bettini, “Meccanica e Termodinamica” Decibel-Zanichelli,
1995) L’esperimento fu fatto per la prima volta da un allievo di Galileo, Vincenzio Viviani
nel 1661 a Firenze, fu successivamente ripetuto da diversi cultori della Meccanica, fino a J.
113
B. L. Foucault, di cui il pendolo ha preso il nome, che sperimentò prima in una cantina con
un pendolo lungo due metri e poi nel Panthéon di Parigi nel 1851 con un pendolo lungo 67
m e 28 Kg di massa.
Vedremo come la velocità angolare di precessione dei punti apsidali dell’orbita ellittica
(sul locale piano tangente in O) delle piccole oscillazioni di tale pendolo sferico di raggio l
dipenda solo dalla latitudine a cui è posto il sistema e non dalle condizioni iniziali.
Consideriamo le usuali ipotesi semplificatrici per tale problema.
(i) Il baricentro della terra G evolve secondo un moto rettilineo uniforme.
Questo è estremamente ragionevole, se ci limiteremo allo studio dinamico per poche ore, o
giorni. Inoltre, il sistema di riferimento di origine O, e di asse (di versore) x̂ tangente al
meridiano locale, di asse ŷ tangente al locale parallelo, e di asse ẑ orientato come la locale
verticale, ẑ = vers(GO), è non-inerziale a causa della rotazione uniforme, rispetto agli spazi
inerziali, della terra con velocità angolare costante Ω, |Ω| ≈ 24·3600 2π
≈ 7, 26 · 10−5 sec−1 .
Dovremo pertanto considerare le forze apparenti, la forza centrifuga e quella di Coriolis.
(ii) La forza centrifuga è trascurabile.
In effetti, quest’ultima, per unità di massa, è dell’ordine |RΩ2 | ≈ 6 · 106 · (7, 26 · 10−5 )2 ≈
316, 24 · 10−4 m sec−1 . L’accelerazione centrifuga (all’equatore) è quindi più piccola di un
fattore 3, 2 · 10−3 dell’accelerazione di gravità e si può dunque trascurare.
Perciò, oltre alla gravità e alla reazione vincolare (quest’ultima non comparirà nell’
impostazione Lagrangiana della dinamica) dovremo solo considerare la forza di Coriolis.
Sia vP la velocità della particella P nel sistema (O, x̂, ŷ, ẑ), allora dalle ipotesi fatte F C =
−2mΩ ∧ vP è l’unica forza apparente di cui dovremo tener conto.
Per il sistema meccanico 2-dimensionale che stiamo delineando la configurazione data
dal punto geometrico di tangenza O è di equilibrio stabile (secondo Lyapunov). In tal caso
la teoria di linearizzazione delle equazioni dinamiche attorno a tale configurazione e sulla
locale varietà tangente, cioè il piano (O, x̂, ŷ), ci garantisce una buona approssimazione
rispetto alla genuina originale descrizione non lineare del sistema. Infine dunque,
(iii) Accettiamo la descrizione linearizzata data dalle Piccole Oscillazioni.
114
A questo punto il conto non è difficile, potremo per esempio procedere cosı̀: consi-
deriamo inizialmente le equazioni linearizzate del pendolo sferico rispetto ad un sistema
inerziale, queste sono ben note
g g
mẍ = −m x, mÿ = −m y,
l l
dove x e y sono coordinate cartesiane nel locale piano tangente (in O). Mettendo in
evidenza le frequenze (coincidenti) di questo oscillatore armonico 2-dimensionale,
g
mẍ = −mω 2 x, mÿ = −mω 2 y, ω 2 := .
l
Teniamo conto ora della forza di Coriolis nella teoria linearizzata in costruzione. Questo non
è del tutto banale (anche se le formule a cui arriveremo saranno relativamente semplici).
La formula che rappresenta la forza di Coriolis sopra scritta è a valori in R3 , dovremo
prima di tutto introdurre l’informazione che il sistema è vincolato sulla sfera di raggio l, e
poi procedere nella linearizzazione. La velocità angolare terrestre si decompone nella base
(O, x̂, ŷ, ẑ)
Ω = (Ωx , 0, Ωz ), Ωz = |Ω|cosβ = |Ω|sinα.
Teniamo presente che nell’emisfero boreale, in cui abbiamo posto O, si ha Ωz > 0; inoltre,
per α ≈ 45o (circa la nostra latitudine) il suo ordine di grandezza è
1
Ωz ≈ 7, 26 · 10−5 √ ≈ 5, 13 · 10−5 ,
2
mentre l’ordine di grandezza di ω, per l ≈ 15 metri, è
r
9, 8
ω≈ ≈ 0, 8.
15
Tornando al nostro conto, la strategia è la seguente: scriviamo il lavoro della forza di
Coriolis per arbitrari vettori tangenti (= “spostamenti virtuali”) alla superficie sferica,
usando localmente, vicino ad O, coordinate lagrangiane x, y, otterremo un’espressione del
tipo
dL = Qx (x, y, ẋ, ẏ)dx + Qy (x, y, ẋ, ẏ)dy,
le Qx e Qy sono le “Componenti Lagrangiane della Sollecitazione” e sono le forze ge-
neralizzate che dobbiamo inserire nelle equazioni (non linearizzate) di Lagrange; ora, l’ul-
timo passo consiste nel considerare solo i termini lineari di tali quantità a partire dall’equi-
librio (e velocità nulle) (x, y; ẋ, ẏ) = (0, 0; 0, 0). L’immersione 3
p della sfera in R , localmente
2 2 2
in O, è data da (x, y) 7→ (x, y, z̆(x, y)), ove z̆(x, y) = l − l − x − y , il generico vettore
tangente è dP = (dx, dy, dz̆(x, y)), e la componente z della velocità è rappresentata da
dz̆ ∂ z̆ ∂ z̆
dt = ∂x (x, y)ẋ + ∂y (x, y)ẏ. Dunque:
dx dy dz̆(x, y)
dL = −2mΩ ∧ vP · dP = det −2mΩx 0 −2mΩz ,
dz̆
ẋ ẏ dt
115
riscrivendo,
dz̆
dL = (2mΩz ẏ)dx + (−2mΩz ẋ + 2mΩx )dy + (−2mΩx ẏ)dz̆(x, y) =
dt
∂ z̆ ∂ z̆ ∂ z̆ ∂ z̆
= (2mΩz ẏ − 2mΩx ẏ )dx + [−2mΩz ẋ − 2mΩx ẏ + 2mΩx ( ẋ + ẏ)]dy.
∂x ∂y ∂x ∂y
∂ z̆ x y
Osservando che ∂x (x, y) = √2 , ∂ z̆ (x, y) = √2 , possiamo infine scrivere
l −x2 −y 2 ∂y l −x2 −y 2
D’ora in poi il nostro lavoro consisterà nello studio di tale sistema di equazioni differenziali
lineari del secondo ordine in R2 . Semplifichiamo la massa
√ m, moltiplichiamo ambo i membri
della seconda equazione per l’unità immaginaria i = −1 e sommiamo membro a membro
con la prima, posto ζ := x + iy, otteniamo:
ζ̈ + 2iΩz ζ̇ + ω 2 ζ = 0.
116
Notiamo a questo punto che la rappresentazione complessa del nostro sistema di equazioni
differenziali, si rivela molto utile, perché la formula generale per ζ(t, c1 , c2 ) mette subito in
chiaro la geometria delle soluzioni: il termine entro parentesi,
√ √
i Ωz 2 +ω 2 t −i Ωz 2 +ω 2 t
(c1 e + c2 e ),
e−iΩz t ,
che è indipendente dai dati iniziali, rappresenta la precessione dei punti apsidali dell’ellisse
con velocità angolare −Ωz < 0, dunque in senso orario.
Un esempio istruttivo è il seguente. Abbandoniamo il sistema dal punto (x(0), y(0)) =
(x0 , 0) con velocità nulla e calcoliamo la struttura dell’ellisse. Si ha:
ζ(0) = x0 + i0 = x0 , ζ̇(0) = 0 + i0 = 0.
ζ(0, c1 , c2 ) = c1 + c2 = x0 ,
q
ζ̇(0, c1 , c2 ) = −iΩz (c1 + c2 ) + i Ωz 2 + ω 2 (c1 − c2 ) = 0.
Otteniamo:
x0 Ωz
c1 = (1 + p ),
2 Ω2z + ω 2
x0 Ωz
c2 = (1 − p ).
2 Ω2z + ω 2
Dunque la soluzione nel piano complesso è
√ 2 √ 2
x0 Ωz 2 x0 Ωz 2
ζ(t) = e−iΩz t [ (1 + p )ei Ωz +ω t + (1 − p )e−i Ωz +ω t ];
2 2
Ωz + ω 2 2 2
Ωz + ω 2
iϑ −iϑ iϑ −iϑ
utilizzando le formule di Euler, sin ϑ = e −e
2i , cos ϑ = e +e 2 , si ha infine:
x0 Ωz
q q
−iΩz t 2
ζ(t) = e 2
[x0 cos Ωz + ω t + i p sin Ωz 2 + ω 2 t ].
Ωz 2 + ω 2
Il semi-asse maggiore vale: a = x0 ,
il semi-asse minore vale: b = √ x0 Ω
2
z
.
Ωz +ω 2
5,13·10−5 5,13·10−5
Nel caso x0 = 1 metro, b ≈ √ ≈ 0,8 ≈ 6, 4·10−5 metri, si noti che è una
(5,13·10−5 )2 +0,82
ellisse “molto stretta”, ed è per questo che spesso si parla, impropriamente, di precessione
del “piano di oscillazione”.
117
L’angolo di precessione (in gradi), nell’intervallo di tempo di un’ora, vale: φ = Ωz ·
360
3600 · 6,28 ≈ 5, 13 · 10−5 · 3, 6 · 103 · 6,28
360
≈ 10, 40 .
—————————————
ove X e Y forniscono le ben note equazioni parametriche dell’ellisse, dato che soddisfano
all’equazione:
X 2 Y 2
+ = 1.
a b
118
Capitolo 7
per n(n−1)
2 costanti positive cij (= cji , e, ovviamente, cii =0). Chiaramente tale vincolo è di
natura olonoma (coinvolge configurazioni, ma non velocità). Sia C ∗ = (x∗1 , ..., x∗i , ..., x∗n ) una
configurazione ammissibile. Vogliamo indagare sul sottoinsieme connesso S delle soluzioni
della relazione sopra scritta contenente C ∗ . Ogni altra configurazione C in tale insieme è
connessa a C ∗ mediante qualche curva continua
cioè manda C ∗ in C, ed inoltre (ii) per ogni coppia di punti x∗ , y ∗ di R3 , siano o meno in
C ∗,
|f (x∗ ) − f (y ∗ )| = |x∗ − y ∗ |,
cioè, è un’isometria, più precisamente f è un’estensione isometrica della mappa che manda
C ∗ in C. Un generale teorema di geometria (si veda per esempio De Marco, Analisi
Due/uno, pag. 117) ci permette di affermare che f , isometrica, è affine. Se le particelle
119
sono almeno tre, non allineate, allora tale mappa f è univocamente determinata da una
coppia in R3 ×SO(3). Infatti, scrivendo ora f affine, f (x) = Ax+b, dove A è una matrice e
b è un vettore, si ha che |f (x2 )−f (x1 )|2 = |x2 −x1 |2 implica che (AT A(x2 −x1 ), (x2 −x1 )) =
((x2 − x1 ), (x2 − x1 )) per ogni x2 − x1 ∈ R3 , dunque: A ∈ O(3), gruppo ortogonale; e dato
che le nostre configurazioni C sono connesse alla configurazione C ∗ , dunque le A sono
connensse all’identità I, det I = +1, segue che A ∈ SO(3).
L’insieme S è dunque isomorficamente identificato da
che è la varietà delle configurazioni del sistema meccanico vincolato olonomo detto corpo
rigido. La dimensione di R3 × SO(3) è sei: questi sono dunque i gradi di libertà del corpo
rigido. Per quanto riguarda la dimensione di SO(3), la relazione RT R = I può essere pen-
sata come a sei equazioni funzionalmente indipendenti (sono sei perché tali relazioni sono
simmetriche) implicitamente definenti SO(3) nello spazio nove-dimensionale delle matrici
reali tre per tre; dunque, nove meno sei: tre. Una carta locale famosa per SO(3) è data
dagli angoli (tre, naturalmente) di Euler; il lettore è invitato a familiarizzare con tale carta
locale in qualche classico manuale di Meccanica.
Calcoliamo il lavoro virtuale della generica distribuzione vincolare Φ = (Φ1 , ..., Φn ) a partire
da una configurazione (OΩ, R) ∈ R3 × SO(3) dove O è l’origine di un sistema di riferimento
120
e Ω è un punto del (oppure, solidale al) rigido.
n
X n
X
δLΦ = Φi · δPi = Φi · (δΩ + δψ ∧ ΩPi ),
i=1 i=1
ove con (δΩ, δψ) si intende il generico vettore tangente (o spostamento virtuale) a R3 ×
SO(3) in una configurazione (OΩ, R):
(δΩ, δψ) ∈ R3 × R3 ∼ T(OΩ,R) (R3 × SO(3)), in altri termini, δΩ è il generico (in R3 ) vettore
spostamento di Ω, mentre δψ rappresenta il generico (in R3 ) vettore velocità angolare del
rigido; a volte i δψ si dicono vettori infinitesimi di rotazione. Si verifica che
Xn n
X
δLΦ = ( Φi ) · δΩ + ( ΩPi ∧ Φi ) · δψ = 0,
i=1 i=1
poiché, dalle ipotesi (∗) sulle forze di reazione vincolare sopra fatte, segue che
n
X n
X
Φi = 0, ΩPi ∧ Φi = 0.
i=1 i=1
n n
d X n n
X X d X
= (mi ẍi − Fi ) · δΩ + ΩPi ∧ mi ẋi − ΩPi ∧ mi ẋi − ΩPi ∧ Fi · δψ =
dt dt
i=1 i=1 i=1 i=1
121
n n n n n
d X X d X X X
=( mi ẋi − Fi )·δΩ+ ΩPi ∧mi ẋi − (ẋi − ẋΩ )∧mi ẋi − ΩPi ∧Fi ·δψ =
dt dt
i=1 i=1 i=1 i=1 i=1
n n n n n
d X X d X X X
=( mi ẋi − Fi ) · δΩ + ΩPi ∧ mi ẋi + ẋΩ ∧ ( mi )ẋG − ΩPi ∧ Fi · δψ,
dt dt
i=1 i=1 i=1 i=1 i=1
122
L’esistenza dei sistemi principali d’Inerzia è sempre garantita dalla proprietà algebrica
seguente: fissato il punto Ω, l’operatore d’Inerzia è autoaggiunto, simmetrico, rispetto alla
metrica euclidea, dunque esiste sempre una base in cui la sua rappresentazione matriciale
è diagonale e gli elementi diagonali sono esattamente gli autovalori dell’operatore stesso,
che sono positivi, dato che l’operatore d’Inerzia individua una forma quadratica definita
positiva. Sotto le ipotesi introdotte, valgono le relazioni
X X X
MG = GPi ∧ mi v i = GPi ∧ mi (v G + ω ∧ GPi ) = mi GPi ∧ (ω ∧ GPi ) = IG ω,
i i i
Esprimiamo ora l’equazione scritta sopra nel sistema rigido solidale al corpo
!
X X X
MG = Mi J i = IG ω = Ii ωi J i ω= ωi J i
i i i
!
d d X X X dJ i
MG = Ii ωi (t)J i (t) = Ii ω̇i J i + Ii ωi =
dt dt dt
i i i
X X
= Ii ω̇i J i + Ii ωi ω ∧ J i =
i i
(ext)
X X X
= Ii ω̇i J i + ω ∧ ( Ii ωi J i ) = Ii ω̇i J i + ω ∧ M G = N G .
i i i
Riscrivendo,
d (ext)
IG ω = IG ω̇ + ω ∧ IG ω = N G , (#)
dt
P
ove si è posto ω̇ := i ω̇i (t)J i (t). Per esercizio, si provi a dedurre le equazione (#) in un
generico sistema solidale al corpo rigido, non necessariamente principale d’inerzia.
(ext)
In assenza di forze attive esterne, ovviamente, N G = 0, ma quest’ultima relazione
vale anche in situazioni meno banali, p.e. in presenza dell’azione delle forza gravitazionale
(ext) (g)
(nell’approssimazione usuale di superficie terrestre), infatti si ha: N G = N G =
Z Z
= GP ∧ µ(Y )gd3 Y = µ(Y )GP d3 Y ∧ g = mtot GG ∧ g = 0.
Y ∈S Y ∈S
1
ω si intende espressa nel sistema rigido solidale al corpo.
123
In tali casi dunque otteniamo l’equazione vettoriale
X X X
IG ω̇ + ω ∧ IG ω = 0, cioè Ii ω̇i J i + ωj J j ∧ Ii ωi J i = 0,
i j i
Si tratta di un sistema di equazioni differenziali del primo ordine nelle ωi . Una volta
determinata la soluzione ω(t) di un problema di Cauchy ω(0) = ω 0 , si studia il sistema di
equazioni differenziali lineare a coefficienti variabili (in t), le relazioni di Poisson:
dJ i (t)
= ω(t) ∧ J i (t),
dt
dω d X X X
= ( ωi J i ) = ω̇ i J i + ω ∧ ω = ω̇i J i =: ω̇.
dt dt
i i i
Da questo fatto segue che per trovare le soluzioni stazionarie (moti rigidi con velocità
angolare costante) nel sistema assoluto possiamo studiare le soluzioni stazionarie ω(t) ≡
(ω1 , ω2 , ω3 ) = ω ∗ nel sistema solidale, cioè gli equilibri delle equazioni di Euler.
Sia ora ω 0 = (ω10 , ω20 , ω30 ) un equilibrio delle equazioni di Euler, cioè una velocità an-
golare costante ω(t) ≡ ω 0 soluzione di tali equazioni. Dall’equazione di Euler in forma
vettoriale IG ω̇ + ω ∧ IG ω = 0, segue che
ω 0 ∧ IG ω 0 = 0 =⇒ IG ω 0 = λω 0 .
124
angolare nello spazio si conservano; queste tre componenti però non rappresentano tre in-
tegrali primi per le equazioni di Euler; evidentemente, le tre componenti di M G evolvono
nel corpo, resta però sicuramente costante la norma quadrato |M G |2 ,
3
X 3
X
MG = Ii ωi J i = cost. ⇒ |M G |2 = Ii2 ωi2 = cost.
i=1 i=1
3 2
M
√ i
X
=1 ellissoide dell’energia (6= dall’ellissoide d’inerzia)
i=1
2eIi
Si osserva che i tre assi dell’ellissoide sono in generale diversi. Cerchiamo ora di studiare dal
punto di vista qualitativo la forma delle traiettorie del sistema nello spazio (M1 , M2 , M3 ).
125
Vediamo innanzi tutto che il raggio M della sfera deve essere maggiore del semiasse
minore e minore del semiasse maggiore dell’ellissoide, altrimenti le due superfici non si
intersecano. Nonè difficile notare che, per ogni dato iniziale in ω, M ed e sono compatibili
con questa necessità; si vede che le intersezioni tra le due superfici vicino agli assi estremali
d’inerzia (l’asse maggiore e minore) sono, topologicamente, dei circoli. Questo intuitiva-
mente ci basta per dire che gli equilibri M G = (M1 , 0, 0), M G = (0, 0, M3 ), dove gli assi
x1 ed x3 sono gli assi estremali, sono stabili. L’asse mediano x2 crea dei problemi, anzi
dimostreremo che le rotazioni uniformi attorno a tale asse sono degli equilibri instabili, lo
vedremo più avanti con il primo metodo di Lyapunov. Se un semiasse coincide con il raggio
della sfera, l’intersezione si limita a due punti opposti lungo tale asse, cioè la soluzione è
stazionaria. Se si varia di poco e ed M si vede che le intersezioni lungo gli assi x1 ed x3
sono delle piccole curve chiuse, mentre quelle lungo l’asse mediano assumono forme più
complesse (simili alla separatrice del pendolo matematico).
Ora cercheremo di studiare il moto del corpo rigido attraverso il moto nello spazio del
suo (solidale) ellissoide d’inerzia: tale procedimento si dice descrizione del moto secondo
Poinsot. Tale descrizione si riassume nel:
Teorema di Poinsot. L’ellissoide d’inerzia nel sistema del baricentro rotola senza stri-
sciare su di un piano fisso perpendicolare a M G .
Prova. Studiamo il moto di un corpo rigido libero soggetto, eventualmente, al solo campo
dM
gravitazionale g. M G è costante nello spazio (infatti dtG = 0 ) e quindi individua una
giacitura. Il nostro ellissoide avrà la forma (IG x, x) = 1 e sarà tangente a due piani di tale
giacitura. Sia xp il punto di tangenza tra l’ellissoide ed uno di tali piani: per la geometria
del problema la normale all’ellissoide in xp è parallela a M G : sull’ellissoide 3i=1 Ii x2i è
P
costante, quindi:
∇x ((IG x, x))|xp k M G
∇x (IG x, x) = 2IG x ⇒ 2IG xp k M G = IG ω
126
da cui si trae xp kω ⇒ xp = Kω, per un K che ora calcoliamo,
(IG xp , xp ) = 1
1
2 (IG ω, ω) = e
1 1 ω
K2 = K=√⇒ xp = √
2e 2e 2e
Valutiamo la proiezione di xp sulla normale al piano:
MG
xp · = {componente di xp lungo la direzione di M G } =
|M G |
√
ω IG ω IG ω · ω 2e
√ · =√ =
2e |M G | 2e|M G | |M G |
Dalle relazioni trovate deduciamo che il punto di tangenza tra piano ed ellissoide giace
sull’asse istantaneo di rotazione dell’ellissoide, cioè l’ellissoide ruota senza strisciare su tale
piano, e che la distanza del piano da G è costante, cioè il piano è fisso nello spazio (nel
sistema relativo del baricentro, in generale mobile).
(ext)
Studiando il moto di un corpo rigido libero con N G = 0 , nel sistema del baricentro G,
si sono trovate le equazioni di Euler (A = I1 , B = I2 , C = I3 ):
Aω̇1 − (B − C)ω2 ω3 = 0
B ω̇2 − (C − A)ω3 ω1 = 0
C ω̇3 − (A − B)ω1 ω2 = 0
che possiamo pensare come ad un sistema differenziale del tipo
ẋ = X(x) X : R3 → R3
Le ωi sono le componenti della velocità angolare del corpo espressa rispetto a una terna
principale d’inerzia solidale al corpo. Abbiamo visto che gli equilibri del sistema sono tutti
e soli della forma (ω10 , 0, 0), (0, ω20 , 0) e (0, 0, ω30 ). Vogliamo studiare la stabilità di tali
equilibri, nello spazio R3 delle velocità angolari, nel caso I1 > I2 > I3 , A > B > C.
Dimostreremo che le rotazioni attorno agli assi estremali x e z sono stabili: lo faremo solo
per le rotazioni attorno all’asse maggiore d’inerzia, l’asse x. Il vettore ω ∗ = (ω10 , 0, 0),
comunque fissato ω10 in R3 , è un equilibrio dell’equazione differenziale scritta sopra, infatti
è X(ω ∗ ) = 0. Dimostreremo che è stabile usando la seguente funzione di Lyapunov:
127
= (T (ω) − T0 )2 + B (A − B) ω22 + C (A − C) ω32
| {z } | {z }
>0 >0
(0)
Un analogo risultato di stabilità si ottiene per le rotazioni uniformi ω ∗ = (0, 0, ω3 )
attorno all’asse principale d’inerzia di momento d’inerzia minore I3 = C, A > B > C: si
verifica che ora una funzione di Lyapunov è
(0)
Verifichiamo infine che le rotazioni uniformi ω ∗ = (0, ω2 , 0) attorno all’asse mediano
di momento d’inerzia I2 = B, A > B > C, sono instabili. La matrice associata al sistema
linearizzato di Euler
ω̇1 = B−C
A ω2 ω3
ω̇2 = C−A
B ω3 ω1
A−B
ω̇3 = C ω1 ω2
(0)
attorno a tale equilibrio ω ∗ = (0, ω2 , 0) risulta essere:
(0)
0 0 B−CA ω2
A = X 0 (ω ∗ ) = 0 0 0 .
A−B (0)
C ω2 0 0
B−C (0)
−λ 0 A ω2
0 = det(A − λI) = det 0 −λ 0 =
A−B (0)
C ω2 0 −λ
(A − B)(B − C) (0) 2
= −λ λ2 − (ω2 ) ,
AC
r
(A − B)(B − C) (0)
λ1 = 0, λ2,3 = ± |ω2 |,
AC
si noti che il radicando è positivo; esiste un autovalore reale positivo: c’è instabilità per il
primo metodo di Lyapunov.
128
La risoluzione in tutta generalità delle equazioni di Euler rende necessario l’uso di
particolari funzioni speciali: le Funzioni Ellittiche di Jacobi.
Qui le risolveremo in un caso particolare, limitandoci a studiare il moto di un giroscopio,
ossia di un corpo in cui i momenti principali d’inerzia rispetto al baricentro sono del tipo
I1 = I2 6= I3 (A = B 6= C). In tal caso le equazioni di Euler si scrivono:
(0)
ω̇1 = A−C
A ω2 ω3
ω3 = cost. = ω3
(0)
ω̇2 = − A−C
A ω3 ω1 ω̇1 = A−C
A ω3 ω2
ω̇3 = 0 ω̇2 = − A−C
(0)
A ω3 ω1
(A−C) (0)
Se poniamo K := A ω3 > 0 le equazioni rimaste si scrivono
ω̇1 = Kω2
ω̇2 = −Kω1
Precessione. Un moto di un corpo rigido si dice di precessione se esistono due assi, l’asse
di precessione p nello spazio e l’asse di figura f nel corpo, tali che lungo il moto l’angolo
fra di essi è costante e la velocità angolare istantanea giace nel piano da essi individuato;
cioè, se lungo i moti:
(0)
( 3i=1 Ii ω i J i ) · J 3
P
ˆ MG · J3 IG ω · J 3 Cω3
p̂ · f = = = = = cost.
|M G | |M G | |M G | |M G |
129
(0)
M G = |M G |p̂ = IG ω = A (ω1 J 1 + ω2 J 2 ) +Cω3 J 3
| {z }
(0)
=ω−ω3 J 3
(0) (0)
Aω − Aω3 J 3 + Cω3 J 3 = |M G |p̂
|M G | A − C (0) ˆ
ω= p̂ + ω3 f .
A A
130
Capitolo 8
Γ0,0 2 N
t0 ,t1 = {q(·) ∈ C ([t0 , t1 ]; R ) : q(t0 ) = 0, q(t1 ) = 0}.
Tale spazio è talvolta detto spazio direttore poichè, scelta una curva q(·) ∈ Γtq00,t,q11 , si genera
tutto Γqt00,t,q11 , che risulta chiaramente uno spazio affine:
131
dunque, per ogni λ ∈ [−ε, +ε], γ(λ, t0 ) = q(t0 ), γ(λ, t1 ) = q(t1 ), cosicchè la curva
vettore tangente,
d
h(·) := γ(λ, ·)|λ=0 ,
dλ
valutata in t0 e in t1 , è il vettore nullo. Quindi h(·) ∈ Γ0,0
t0 ,t1 .
Si noti che L a questo stadio è estremamente generale, quindi di tipo non necessariamente
meccanico L = T − V , energia cinetica ‘meno’ energia potenziale. Mediante L costruiamo
il seguente funzionale reale J, detto funzionale d’Azione,
J : Γqt00,t,q11 −→ R
Z t1
q(·) 7→ J[q(·)] := L(q(t), q̇(t), t)dt.
t0
Si chiama variazione di J, costruita a partire dal punto (curva) q(·) ∈ Γqt00,t,q11 , e di incremento
h(·) ∈ Γ0,0
t0 ,t1 , la seguente derivata direzionale o di Gateaux, nella direzione del vettore h(·):
d
dJ[q(·)]h(·) := J[q(·) + λh(·)]|λ=0 .
dλ
Diremo infine che il punto q(·) ∈ Γqt00,t,q11 rende stazionario J se
132
il primo termine è nullo per la proprietà caratteristica di Γ0,0
t0 ,t1 , dunque:
t1
d ∂L ∂L
Z
dJ[q(·)]h(·) = − − (t)hi (t)dt
t0 dt ∂ q̇ i ∂q i
Se la curva q(·) risolve le equazioni di Lagrange allora tutte le N funzioni C 0 del tem-
d ∂L ∂L
po [ dt ∂ q̇ i
− ∂q i ](t) sono identicamente nulle in [t0 , t1 ] e dunque q(·) rende stazionario J.
Supponiamo, ragionando per assurdo, che q(·) non soddisfi alle equazioni di Lagrange in
[t0 , t1 ], quindi, negando la tesi, per qualche indice i0 e a qualche istante t∗ , supponiamo che
d ∂L ∂L
− i0 (t∗ ) 6= 0.
dt ∂ q̇ i0 ∂q
d ∂L ∂L
Dato che L e q(·) sono di classe C 2 , le funzioni [ dt ∂ q̇ i
− ∂q i ](t) sono, come già appena
richiamato, continue in t, ed esiste –teorema della permanenza del segno– un intervallo
[α, β], che contiene internamente t∗ , in cui [ dt
d ∂L
∂ q̇ i0
− ∂q ∂L
i0 ](t) assume lo stesso segno di
d ∂L
[ dt ∂ q̇ i0
− ∂L
∂q i0
](t∗ ). Scegliamo ora una particolare h(·) ∈ Γt0,0
0 ,t1
:
h (t) ≡ 0, i 6= i0 ,
i
i 0
h (t) : hi (t) ≡ 0, t ∈ [t0 , t1 ] \ [α, β],
i0
0
h (t) 6= 0, t ∈ [α, β], per esempio: hi (t) = (t − α)3 (β − t)3
Si osservi che l’esponente ‘3’ qui sopra è scelto affinché h(·) sia effettivamente di classe
C 2 in [t0 , t1 ]. Con tale scelta di h(·) otteniamo –qui non c’è naturalmente la sommatoria
sottintesa sull’indice i0 –
Z β
d ∂L ∂L 0
dJ[q(·)]h(·) = i 0 − i 0 (t)hi (t)dt 6= 0,
α dt ∂ q̇ ∂q
133
per parti’ che porta all’espresssione di dJ coinvolgente i primi membri delle equazioni di
Lagrange. Un tentativo dunque di riduzione, in un senso naturale, della regolarità delle
curve appare ragionevole e doveroso, e lo metteremo in atto, in W 1,2 = H 1 , in un modo
sufficientemente semplice nella Sezione 8.3.
(ii) La definizione di ‘stazionarietà’ del funzionale J: è veramente ragionevole introdurre
questa nozione fondata sulla semplice derivata direzionale?
A differenza del precedente punto (i), possiamo invece qui sottolineare la ragionevolezza
di tale scelta: un’introduzione, apparentemente più naturale, di stazionarizzazione fondata
sulla nozione standard di derivata (di Fréchet) richiede infatti la scelta di una norma in
Γqt00,t,q11 . Ma questa induce una metrica, e dunque una topologia nello spazio delle curve, e, nel
caso infinito-dimensionale in studio, norme diverse inducono in genere topologie diverse.
Sarà la nozione successiva, di qualità di una curva stazionaria per J (localmente minimo,
massimo, sella,...) che richiederà inevitabilmente una topologia; ma il nostro originale
problema non necessita affatto di topologie: l’equivalenza della stazionarizzazione, della
criticità di J, con le equazioni di Lagrange è perfettamente ben calibrata dalla scelta della
semplice derivata di Gâteaux.
(iii) La classe dei sistemi meccanici la cui dinamica si pone in forma variazionale è stretta-
mente più ampia della classe dei sistemi meccanici olonomi lisci e conservativi. Si consideri
per esempio una particella libera di massa m e soggetta ad una forza conservativa di ener-
gia potenziale V (q), q ∈ R3 , e alla resistenza di mezzo di tipo viscoso F = −k q̇. Si verifica
direttamente che le equazioni dinamiche per tale sistema, cioè mq̈ = −∇V (q) − k q̇, sono le
k
equazioni di Euler-Lagrange con Lagrangiana L(q, q̇, t) = e m t ( 12 m|q̇|2 − V (q)).
134
condizione di positività sulle derivate seconde (di Fréchet) p.e. con la coercività locale; a
tal scopo si veda un contro-esempio nell’Osservazione 4 alla fine della Sezione.
Riportiamo 2 nei dettagli (che sono semplici) il seguente fatto generale, valido negli
spazi normati, adattato al nostro ambiente del calcolo delle variazioni elementare.
Proposizione (Coercività locale induce minimo locale):
(i) Sia (X, k · k), uno spazio normato affine di curve tra due configurazioni fissate, X =
Xtq00,t,q11 = q + Xt0,0
0 ,t1
per una prefissata arbitraria q ∈ X,
(ii) sia J : (X, k · k) → R un funzionale C 2 (X; R),
(iii) sia q ∈ X stazionario 3 per J:
J 0 (q)h = 0, ∀h ∈ Xt0,0
0 ,t1
,
(iv) supponiamo esista una costante positiva α > 0 tale che (coercività locale):
1
α + g(q, h) khk2
J[q + h] − J[q] ≥
2
e per h piccolo (nella norma scelta k · k) e diverso da zero (cioè, la curva h(t) ≡ 0),
sicuramente ( 21 α + g(q, h)) > 0 e dunque
k · k∞ = sup |q(t)|,
t∈[t0 ,t1 ]
135
sin(nt)
successione hn (t) = n compatibile con il problema al bordo scelto. Si vede subito che
vale4
lim khn k∞ = 0,
n→+∞
ciononostante
π
cos2 (nt)
sin(nt)
Z
J[hn ] − J[0] = −V dt + π V (0)
0 2 n
non tende a zero. Rt
Osservazione 2. Si può facilmente dimostrare che J = t01 L(q(t), q̇(t))dt è invece continuo
nella norma kq(·)kC 1 , in effetti, risulta C 2 nella norma C 1 per qualunque Lagrangiana C 2 .
Osservazione 3. Vedremo di seguito che per una conveniente applicazione della prece-
dente proposizione potremo scegliere la norma nello spazio di Sobolev W 1,2 , dove per W r,s
si intende lo spazio delle funzioni che assieme a tutte le derivate fino all’ordine r sono
in Ls . Più precisamente, Per W 1,2 si intende lo spazio funzionale che si ottiene conside-
rando il completamento
R t1 delle
R t1 funzioni C ∞ ([t0 , t1 ]; RN ) nella metrica indotta dalla norma:
kqkW 1,2 := t0 |q(t)| dt + t0 |q̇(t)| dt; si dimostra che vale l’immersione: W 1,2 ⊂ C 0 . Tale
2 2 2
Di seguito, usando la Proposizione sopra discussa, pur rinviando alla Sezione 8.3 l’intro-
duzione del calcolo variazionale in H 1 , mostriamo delle locali (sia nell’ambiente funzionale,
sia nel tempo)
CondizioniR di minimo nel Calcolo delle Variazioni in H 1 (per il caso meccanico):
t
Sia J(q) = t01 [ 21 m|q̇(t)|2 − V (q(t))]dt. Valga 7
4
ma non p.e. nella norma kq(·)kC 1 = kq(·)k∞ + kq̇(·)k∞ .
5
Si veda proposition 2.3 in Abbondandolo A., Schwarz M., A smooth pseudo-gradient for the Lagrangian
action functional, Adv. Nonlinear Stud. 9 (2009) 597-623.
6
Si veda p.e. in Mazzucchelli M., The Lagrangian Conley conjecture, Commentarii Mathematici Helvetici
86 (2011), no. 1, 189-246.
7
h ∈ H01 ([t0 , t1 ], Rn ) ⇐⇒ h ∈ H 1 ([t0 , t1 ], Rn ) e h(t0 ) = 0 = h(t1 ).
136
esiste un opportuna costante α > 0 tale che
d2
J 00 [q](h, h) = J[q + λh]|λ=0 ≥ αkhk2H 1 , ∀h ∈ H01 ,
dλ2
per cui q è un minimo locale 8 per J in H 1 .
Prova.
d2 d d
dλ2
J[q + λh]|λ=0 = dλ { dλ J[q + λh]}|λ=0
d
R t1
= dλ { t0 [m(q̇ + λḣ) · ḣ − ∇V (q + λh)] · h dt}|λ=0
R t1 R t1
= t0 m|ḣ|2 dt − t0 ∇2ij V (q)hi hj dt
R t1 R t1
≥ t0 m|ḣ(t)|2 dt − t0 max|spec∇2 V (q(t))| · |h(t)|2 dt,
d2
R t1 R t1
dλ2
J[q + λh]|λ=0 ≥ |h|2 dt, t0 m|ḣ|2 dt − c
(1) t0
Rt
ove c := maxt∈[t0 ,t1 ] (max|spec∇2 V (q(t))|). Allo scopo di stimare t01 |ḣ|2 dt relativamente a
R t1 2
t0 |h| dt richiamiamo la disuguaglianza di Cauchy-Schwarz:
Z b 2 Z b Z b
2
f gdt ≤ f dt g 2 dt.
a a a
Dunque Z t1 Z t1 Z t
2 2
|h(t)| dt ≤ (t − t0 ) |ḣ(τ )| dτ dt
t0 t0 t0
t1 t1 t1
1
Z Z Z
≤ (t − t0 )dt |ḣ(τ )|2 dτ = (t1 − t0 )2 |ḣ|2 dt.
t0 t0 2 t0
8
Non dimostreremo qui che J è due volte differenziabile secondo Fréchet, si rinvia alle considerazioni
e note appena svolte; useremo il fatto che in tal caso le derivate direzionali esistono e coincidono con le
derivate di Fréchet.
137
Abbiamo pertanto che
1
khk2L2 ≤ (t1 − t0 )2 kḣk2L2 . (2)
2
Otteniamo per ( 1):
d2
J 00 [q](h, h) = J[q + λh]|λ=0 ≥ mkḣk2L2 − ckhk2L2
dλ2
2m
≥ − c khk2L2 .
(t1 − t0 )2
q
Ora α1 := (t12m
−t0 )2
− c > 0 se e solo se t1 − t0 < 2m c . D’altra parte, ancora con ( 2), vale
pure la stima
00 1
J [q](h, h) ≥ mkḣk2L2
− ≥ m − c (t1 − t0 ) kḣk2L2
ckhk2L2 2
2
q
ove α2 := m − 21 c(t1 − t0 )2 > 0 se e solo se (come prima) t1 − t0 < 2m c . Infine otteniamo
una stima9 nella norma di Sobolev H 1 :
1 1
J 00 [q](h, h) ≥ min{α1 , α2 }(khk2L2 + kḣk2L2 ) = min{α1 , α2 }khk2H 1 = αkhk2H 1
2 2
Osservazione 4.
Il seguente esempio mostra che in ambiente infinito dimensionale il test ‘ingenuo’ del-
le derivate seconde sui punti critici, cioè, derivata seconda definita positiva (ma non
uniformemente), possa talvolta fallire.
+∞ +∞
X hj kj X
f 00 (ξ)[h, k] = 2 −6 ξj hj kj .
j+1
j=0 j=0
2
9
Nota che α2 = α1 (t1 −t
2
0)
.
138
2ξj 2
f 0 (ξ)h = 0 : − 3ξj2 = 0, ξj ( − 3ξj ) = 0
j+1 j+1
2 1
ξj∗ = 0 oppure ξj∗∗ =
3j+1
4
0 = f (ξ ∗ ) < f (ξ ∗∗ ) = ζ(3)
27
In particolare
+∞
d2 X h2j
f 00 (0)[h, h] = f (λh)| λ=0 = 2 > 0,
dλ2 j+1
j=0
r2
f (rej ) = − r3 < 0
j+1
Dunque, benché ξ ∗ = 0 sia un punto critico per f con f 00 (0)[h, h] > 0, ξ ∗ = 0 non è minimo
locale.
1
R t1
Prova. Valga la condizione integrale variazionale e definiamo µ := t1 −t0 t0 ϕ(t)dt ∈ R,
2 1
Rt
questo è possibile poiché ϕ ∈ L ⊂ L . Prendiamo h(t) := t0 (ϕ(s) − µ)ds e osserviamo
che questa scelta di h è effettivamente in H01 :
h(t0 ) = 0 = h(t1 ), ḣ = ϕ − µ ∈ L2
139
e Z t1 Z t Z t
||h||2L2 = (ϕ(s) − µ) ds · (ϕ(s) − µ) ds dt ≤
t0 t0 t0
Z t 2
≤ (t1 − t0 ) sup (ϕ(s) − µ)ds < +∞
t∈[t0 ,t1 ] t0
Proponiamo ora una versione del teorema variazionale fondamentale in tale nuovo ambiente
funzionale, l’analogo in H 1 del Principio di Hamilton sopra visto in C 2 .
Teorema - Principio Variazionale di Hamilton in H 1 : Supponiamo che la Lagran-
giana
L : Rn × Rn → R
sia tale che per il funzionale di Hamilton, ora definito nel seguente sotto-spazio affine di
H 1,
J : Γqt00,t,q11 = q(·) ∈ H 1 ([t0 , t1 ], Rn ) : q(t0 ) = q0 , q(t1 ) = q1 −→ R
140
Z t1
= P (t)h(t)|tt10 − (P − Lq̇ )ḣdt,
t0
La definizione di norma H 1 qui appena sopra assegnata appare diversa da quella introdotta
qualche pagina indietro: è un semplice esercizio mostrare che sono definizioni equivalenti10 .
||q(·)||C 0 ≤ ||q(·)||C 1
e quindi la curva q(·) ∈ Γ ∩ C 1 tale che ||q(·)||C 1 ≤ r, cioè appartenente alla palla B1 (r) in
C 1 centrata in q = 0, è pure in B0 (r):
B1 (r) ⊂ B0 (r)
questo, com’è noto, significa che la topologia C 1 è più fine (o più forte) della topologia
C 0.
10
vedi p.e. Capitolo 9 di Brezis H., Analisi funzionale. Teoria e applicazioni: Matematica e fisica ‘testi’
ed.: 1986.
141
Nonostante questa nomenclatura,
i) se q ∗ (·) è tale che per qualche ε > 0:
t1 t1 3 X2 2
dx ∂xi ∂xi
Z Z X X 1
h
l[q(·)] := | (q(t))|R3 dt = [ ( h
(q(t))q̇ )( k
(q(t))q̇ k )] 2 dt =
t0 dt t0 ∂q ∂q
i=1 h=1 k=1
t1
r
2
Z
= T (q(t), q̇(t))dt.
t0 m
142
Il problema geometrico è il seguente: determinare le curve che stazionarizzano il funzionale
lunghezza l[q(·)]. Diremo geodetiche le curve che risolvono tale problema. Che relazione
intercorre tra i due problemi variazionali? Iniziamo con un’indagine sulle equazioni di
Euler-Lagrange dei due problemi variazionali. Supporremo ovviamente q0 6= q1 e t0 < t1 .
Lemma 1 Se q(·) ∈ Γqt00,t,q11 risolve le equazioni di Lagrange con L = T , allora q(·) risolve
q
2
le equazioni di Lagrange con L = m T.
Prova. Lungo il moto q(·) la funzione L = T è costante —T è l’integrale dell’energia—, ed
inoltre, dato che q0 6= q1 , T > 0. Il lemma segue per verifica diretta.
q q
2 2
d ∂ m T ∂ mT
− =
dt ∂ q̇ i ∂q i
d 1 2 ∂T 1 2 ∂T 1 d ∂T ∂T
= ( q i
)− q i
=√ ( i
− i ) = 0.
dt 2 2 T m ∂ q̇ 2 m2
T m ∂q 2mT dt ∂ q̇ ∂q
m
t1
d
Z
= L(q(t), q(t))dt = l[q(·)].
t0 dt
Benché il funzionale lunghezza in (∗) sia ora definito in Γqτ0(t,q01),τ (t1 ) 6= Γqt00,t,q11 (il supporto
delle due famiglie di curve è però lo stesso), le equazioni di Lagrange per l[·] in (∗) sono le
stesse di quelle associate all’originale l[·].
Osservazione: Potevamo facilmente restare nella stessa classe Γqt00,t,q11 prendendo non
arbitrari τ (t), ma solo le riparametrizzazioni date dai diffeomorfismi di [t0 , t1 ] in sé.
143
q
2
In effetti, se t 7→ q(t) risolve le equazioni di Lagrange per L = mT con
d
q(t(τ0 )) = q0 , q(t(τ ))|τ =τ0 = q̇0 ,
dτ
cioè τ 7→ q(t(τ )) risolve lo stesso problema di Cauchy. Tale
q degenerazione del problema di
2
Cauchy per le equazioni di Lagrange associate a L = m T era però annunciata: infatti
tali equazioni non si lasciano porre in forma normale. Infatti:
X ∂L
L(q, λq̇) = λL(q, q̇) implica (t. di Euler sulle f. omogenee) : L(q, q̇) = q̇ i ,
∂ q̇ i
i
∂L ∂L X i ∂ 2 L
= + q̇ ,
∂ q̇ j ∂ q̇ j ∂ q̇ j ∂ q̇ i
i
onde
∂2L
det = 0.
∂ q̇ j ∂ q̇ i
Tale caduta dell’unicità nel problema di Cauchy, legata alla non esistenza della forma nor-
male, è la sola degenerazione consentita. Non è possibile trovare soluzioni di un medesimo
problemaqdi Cauchy q(t0 ) = q0 , q̇(t0 ) = q̇0 con supporti (immagini) diversi, biforcantesi,
2
per L = mT. Per chiarire ciò, mostriamo preliminarmente il seguente
q
2
Lemma 3 Per ogni t 7→ q(t) risolvente le equazioni di Lagrange per L = m T esiste
q
2
sempre qualche riparametrizzazione t(τ ) che rende L = m T costante lungo la nuova
curva τ 7→ q(t(τ )). q
2
Prova. Sia [t0 , t1 ] 3 t 7→ q(t) risolvente le equazioni di Lagrange per L = m T , cerchiamo
t(τ ) tale che
r
d 2
L(q(t(τ )), q(t(τ ))) = T (q0 , q̇0 ) : cost., t(τ0 ) = t0 ,
dτ m
ove q(t0 ) = q0 , dq
dt (t0 ) = q̇0 . Si ottiene una semplice equazione differenziale del primo ordine
in R per t(τ ),
q
2
dt m T (q0 , q̇0 )
(τ ) = d
(= X(t(τ ))), t(τ0 ) = t0 .
dτ L(q(t(τ )), dt q(t)|t=t(τ ) )
144
dt
Si noti che risulta: dτ (τ0 ) = 1.
A questo punto, con un argomento analogo a quello del lemma 1 (a ritroso), è faci-
le vedere che τ 7→ q(t(τ )) risolve Euler-Lagrange per L = T e per tali equazioni vale il
teorema di esistenza e unicità
q per il problema di Cauchy. Se esistesse un’altra soluzione
2
delle equazioni per L = m T del medesimo problema di Cauchy ma con supporto di-
verso, allora, procedendo ancora con una riparametrizzazione come quella del lemma 3,
giungeremmo a due distinte soluzioni di uno stesso problema di Cauchy per le equazioni di
Euler-Lagrange relative a L = T : assurdo.Qualche commento per generalizzare. Abbiamo
145
ESEMPI:
le geodetiche sul
1) piano euclideo: ds2 = dx2 + dy 2 ,
2) sulla sfera,
dx2 +dy 2
3) sul piano di Lobačevskij-Klein-Poincaré: ds2 = y2
(y > 0).
Allora esiste una riparametrizzazione del tempo τ = τ (t), τ 0 > 0, tale che la curva τ 7→
q(t(τ )) sia un moto dinamicamente possibile per il sistema di Lagrangiana
1X
L(q, q̇) = [e − V (q)]aij (q)q̇ i q̇ j , [e − V (q)]aij (q) : metrica di Jacobi
2
i,j
Osservazione. Si noti che nell’ambiente Lagrangiano, in T Q, gli insiemi di livello dei due
rispettivi integrali di Jacobi E = e e E = 1 sono diversi, mentre, operate le due distinte
146
trasformazioni di Legendre generate rispettivamente da L e L, gli insiemi di livello dei due
Hamiltoniani H e H, H = e e H = 1, rappresentano in T ∗ Q lo stesso luogo geometrico.
(nel seguito, come spesso si usa, considereremo sottintesa la sommatoria sugli indici ripe-
tuti)
∂H
q̇ k = = a−1
kj (q)pj ,
∂pk
(∗)
−1
∂H 1 ∂aij ∂V
ṗk = − k
=− k
(q)pi pj − k (q).
∂q 2 ∂q ∂q
D’altra parte, la funzione Hamiltoniana associata a L è:
−1
1 aij (q)
H= pi pj .
2 e − V (q)
Il sistema canonico generato da H è
∂H 1
q̇ k = = a−1 (q)pj ,
∂pk e − V (q) kj
(∗∗)
−1 1 −1
∂H 1 1 ∂aij 2 aij (q)pi pj ∂V
ṗk = − k
= {− k
(q)p i p j − [ ] (q)}.
∂q e − V (q) 2 ∂q e − V (q) ∂q k
Il campo vettoriale generante l’equazione differenziale (∗) è proporzionale al campo gene-
rante l’equazione differenziale (∗∗) con funzione scalare di proporzionalità
1
ϕ(q, p) = > 0,
e − V (q)
se ci limitiamo a confrontare le soluzioni di (∗) che stanno sull’ipersuperficie H = e, cioè
1 −1
2 aij (q)pi pj + V (q) = e, con le soluzioni di (∗∗) che stanno sull’ipersuperficie H = 1. In
tal caso la funzione [...] in (∗∗)2 assume sempre il valore 1 lungo le soluzioni.
La tesi è raggiunta ricordando che le soluzioni di ẋ = X(x) si ottengono tutte e sole da
quelle di ẋ = ϕ(x)X(x), ove ϕ : Rm → R∗+ , mediante riparametrizzazione del tempo.
147
8.7 Riduzione Isoenergetica
Il precedente teorema sulla metrica di Jacobi può essere pensato come un caso particolare
del seguente teorema (Aurel Wintner, The analytical foundations of celestial mechanics,
1941, Sect.180). Teorema. Consideriamo una generica funzione Hamiltoniana
H1 : T ∗ Q −→ R,
XH1 := E∇H1 , su H1 = e1 ,
148
8.8 Problema di Plateau dell’area minima (o delle bolle di
sapone).
Consideriamo due circonferenze di ugual raggio R e poste co-assialmente (asse x) a distanza
2`. Le equazioni dei due cerchi siano:
y 2 + z 2 = R2 , x ≡ `, y 2 + z 2 = R2 , x ≡ −`
r(−`) = R, r(`) = R
Abbiamo dunque un problema variazionale con Lagrangiana (notare che x ha il ruolo che
in dinamica ha il tempo t): p
L(r, r0 , x) = r r02 + 1
149
Sussiste l’integrale di Jacobi:
∂L ∂L
= 0 =⇒ E = 0 r0 − L è integrale primo.
∂x ∂r
2r02 p p
E =r √ − r r02 + 1 = c , rr02 − r(r02 + 1) = c r02 + 1,
2 r02 + 1
p
scrivendo − c invece di c : r = c r02 + 1
Si nota che r(x) ≡ R è una soluzione, è la superficie cilindrica e vale per c = R.
Risolviamo l’equazione differenziale del primo ordine per separazione di variabili:
sgn(r0 )d rc sgn(r0 )d rc
Z Z
c q = dx =⇒ c q = dx
r 2 r 2
c − 1 c − 1
r
c sgn(r0 ) cosh−1 =x+k
c
r x+k
= cosh sgn(r0 )
c c
Possiamo subito trascurare il termine sgn(r0 ) data la parità della funzione cosh, inoltre:
R `+k
r(`) = R : = cosh
c c
R −` + k
r(−`) = R : = cosh
c c
−`+k −`+k
La parità di cosh forza `+k
c =− c oppure `+k
c = c : nel primo caso si deduce k = 0,
il secondo caso è assurdo (` = 0).
Infine:
r x
= cosh
c c
e dunque dobbiamo calibrare R, `, c tali che c = cosh c` sia significante; poniamo ξ := c` ,
R
R
ξ = cosh ξ
`
150
R
• ` piccolo, cioè ` grande, cerchi molto distanti tra loro: i due grafici non si intersecano,
non ci sono soluzioni.
Nel primo caso, si può verificare che la soluzione meno vicina all’asse è un minimo locale
ed è l’unica stabile, si veda p.e. a p. 178 del volume: S. Hildebrandt, A. Tromba, “The
parsimonious universe. Shape and form in the natural world.” Copernicus, New York,
1996. xiv+330 pp. (o a p. 164 dell’edizione italiana). La distanza critica del secondo caso
è d∗ = 2`∗ = 1, 325487 R; quando i due cerchi sono tra loro ad una distanza maggiore di
d∗ , compaiono come superfici critiche le due superfici (piatte) dei due cerchi.
N : B −→ B
q(·) 7→ N [q(·)]
un operatore non lineare. Vogliamo indagare sull’eventuale struttura variazionale dell’equa-
zione:
N [q(·)] = 0 & cond. iniziali e/o cond. al bordo.
151
Sia Γ un sottoinsieme di B tale che se q(·) ∈ Γ, allora le condizioni iniziali e/o al bordo
sono automaticamente soddisfatte. Si pensi per esempio a
h·, ·i : B × B −→ R,
Ipotesi:
(i) L’operatore N sia Gâteaux-differenziabile in ogni q(·) ∈ Γ e per ogni direzione h(·)
appartenente allo spazio tangente Tq(·) Γ,
d
dN [q(·)]h(·) := N [q(·) + λh(·)]|λ=0 .
dλ
(ii) Gli spazi tangenti Tq(·) Γ siano tutti identificabili con un medesimo spazio vettoriale
V detto spazio direttore, tale cioè che, scelto un arbitrario elemento q̄(·) di Γ, si abbia
Γ = q̄(·) + V.
Ancora continuando il precedente esempio, si nota che Tq(·) Γqt00tq11 = Γ00 t0 t1 che è uno
spazio vettoriale, come ci dovevamo aspettare.
Supporremo infine che, per la scelta operata di Γ e di h·, ·i, sussista il “Lemma fonda-
mentale del Calcolo delle Variazioni”:
152
Teorema Stanti le sopra elencate ipotesi su Γ, N, h·, ·i, supponiamo che
hdN [q(·)]h(·), k(·)i = hdN [q(·)]k(·), h(·)i, ∀q(·) ∈ Γ, ∀h(·), k(·) ∈ Tq(·) Γ,
ammette formulazione variazionale, cioè le soluzioni di (*) sono tutti e soli i punti stazio-
nari del funzionale
J : Γ −→ R,
Z λ=1
q(·) 7→ J[q(·)] = hN [q̄(·) + λ(q(·) − q̄(·))], q(·) − q̄(·)i dλ,
λ=0
cioè:
dJ[q(·)]h(·) = 0, q(·) ∈ Γ, ∀h(·) ∈ Tq(·) Γ (∗∗)
ove q̄(·) è un arbitrario prefissato elemento di Γ.
λ=1
d
Z
= ( N [q̄ + λ(q − q̄)], λhi + hN [q̄ + λ(q − q̄)], hi) dλ =
λ=0 dλ
= hN [q̄ + λ(q − q̄)], λhi|λ=1
λ=0 = hN [q], hi.
da cui
d
{dN [q]h}i = (Ai (q + λh) − q̈i − λḧi )|λ=0 =
dλ
= Ai,j (q)hj − ḧi .
153
Allora la condizione che dN sia simmetrico (auto-aggiunto) risulta
Z t1 Z t1
[Ai,j (q(t))hj (t) − ḧi (t)]ki (t) dt = [Ai,j (q(t))kj (t) − k̈i ]hi (t) dt,
t0 t0
Z t1 Z t1
Ai,j (q(t))hj (t)ki (t)dt − ḣ · k|tt10 + ḣ · k̇ dt =
t0 t0
Z t1 Z t1
= Ai,j (q(t))kj (t)hi (t)dt − k̇ · h|tt10 + k̇ · ḣ dt,
t0 t0
Ai,j = Aj,i .
154
Capitolo 9
Meccanica di Hamilton
Le motivazioni per lo studio della formulazione Hamiltoniana della Meccanica Analitica sono apparentemente dispa-
rate e disgiunte: (i) gli studiosi della teoria delle perturbazioni, gli specialisti della meccanica celeste, fin da Poincaré
e Weierstrass, riconoscono che l’ambiente Hamiltoniano è ben più ricco di quello Lagrangiano ed in esso si edifica la
cosiddetta teoria delle Trasformazioni Canoniche o Simplettiche, pilastro portante per quelle ricerche, d’altra parte
(ii) i teorici delle Equazioni alle Derivate Parziali (PDE) individuano nell’ambiente Hamiltoniano l’habitat globa-
le e naturale per le formulazioni variazionali di molte equazioni non lineari, le equazioni di Hamilton-Jacobi, che
incredibilmente emergono in contesti assolutamente lontani dalla meccanica analitica, quali per esempio, la teoria
della propagazione ondosa dei corpi elastici continui, infine (iii) la Meccanica Quantistica: è la moderna teoria della
tecnologia avanzata, delle ‘nano-tecnologie’ per esempio. Sebbene della Meccanica Classica essa rappresenti un’evo-
luzione rivoluzionaria –molto più radicale della stessa T. della Relatività– essa poggia interamente sulla pre-esistente
descrizione Hamiltoniana classica del sistema fisico in studio. Non sappiamo quale sia la motivazione più profonda,
la citazione di Schrödinger in copertina a queste dispense certamente mette in risalto questi ultimi due aspetti.
9.1 Introduzione
La meccanica Lagrangiana è una particolare teoria di sistemi dinamici —di interesse fisico,
ma non solo— del secondo ordine su di una varietà vincolare, Q. L’ambiente naturale
per l’evoluzione al primo ordine in tale teoria è il fibrato tangente T Q, anch’esso dotato
di struttura di varietà differenziale. Alcuni risultati classici della meccanica Lagrangiana
—per esempio, la proprietà di invarianza della struttura delle equazioni di Lagrange per
cambi di carte in Q; il teorema di Noether— mettono tuttavia in evidenza che le proprietà
trasformazionali naturali di tale teoria sono legate alla struttura di varietà di Q, e non alla
completa struttura differenziale di T Q. Più precisamente, di T Q si usa —per gli esempi
sopra citati— la sola struttura di ‘atlante fibrato’; in tale atlante fibrato per T Q, ereditato
155
da quello di Q, le mappe di transizione (cambio di carte) si esprimono cosı̀:
∂ q̃ i
q̃ i = q̃ i (q), ṽ i = (q)v j .
∂q j
L’utilità di un’indagine accurata degli aspetti dei sistemi dinamici meccanici legati alle
trasformazioni (di coordinate) è ben esemplificata nella teoria delle Piccole Oscillazioni dei
sistemi Lagrangiani: la risoluzione delle equazioni linearizzate procede attraverso l’indivi-
duazione di opportune successive trasformazioni (lineari, in quel caso) di coordinate in Q.
Anche in quest’ultimo esempio sono utilizzate solo proprietà differenziali (carte) di Q.
Vogliamo costruire una meccanica del primo ordine, equivalente alla meccanica La-
grangiana, adeguata all’utilizzo effettivo, completo, delle proprietà differenziali e di tra-
sformazione (o di coniugazione) dell’ambiente in cui evolve, ambiente che naturalmente è
di dimensione doppia a quella di Q. Vedremo che tale nuovo ambiente è il fibrato cotan-
gente T ∗ Q; la nuova meccanica è detta Hamiltoniana, e la teoria di trasformazioni utile
per la ricerca delle soluzioni, o, più realisticamente, utile al loro studio qualitativo, prende
il nome di teoria delle trasformazioni canoniche o simplettiche.
156
Le forze generalizzate fi , cioè le componenti Lagrangiane della sollecitazione, sono
tipici esempi di forme: il lavoro delle forze attive associate alle componenti fi è dato da
dL = fi dq i .
Riassumendo, scelta una carta locale per Q, un generico vettore si rappresenta con
v = v i ∂q∂ i , mentre una generica forma lineare è data da θ = Aj dq j , e l’applicazione di
θ ∈ TP∗ Q su v ∈ TP Q è data da
θ(v) = hA, vi = Ai v i .
157
condizione algebrica del teorema del Dini (le funzioni in studio sono C ∞ ), rk ( ∂p
∂ q̇ ) = max =
N:
∂2L
det i j (q, q̇, t) 6= 0
∂ q̇ ∂ q̇
Indicheremo con q̇ i = S i (q, p, t) tale inversa. Definiamo ora la trasformazione di Legendre:
T Q × R −→ T ∗ Q × R
Per raggiungere la tesi ci basta mostrare che Φ(0) 6= Φ(1): in tal caso allora f (a) 6= f (b).
Calcoliamo Φ̇(t):
∂fi
Φ̇(t) = (tb + (1 − t)a)(bi − ai )(bj − aj );
∂xj
dall’ipotesi sullo Jacobiano di f , Φ̇(t) > 0, ∀t ∈ [0, 1], ed il teorema segue.
158
L’applicazione del teorema funziona nel seguente modo: per ogni fissati (q, t) ∈ Q × R
si identifica f con la mappa q̇ 7→ p; se ora per ogni q̇ ∈ RN
∂2L
(q, q̇, t)λi λj > 0, ∀λ 6= 0,
∂ q̇ i ∂ q̇ j
allora ne segue che la trasformazione di Legendre è globale. In effetti, la trasformazione è
solo iniettiva con l’ipotesi appena introdotta.
Ricordiamo che almeno nel caso Lagrangiano Meccanico (cioè L = T − V ) quest’ipotesi
di convessità è sempre soddisfatta.
ne segue che
lim |f (x)| = +∞. (∗∗)
|x|→+∞
159
|f (xk )| ≤ M . Ciò significa che per la palla chiusa B di centro 0 e raggio M , la sua
antimmagine f −1 (B) è illimitata, assurdo perché f è propria.
Viceversa, si suppone valga (∗∗) e sia K un compatto in Rn (Rn , come codominio di f ).
Esiste dunque, un M > 0 tale che K sia contenuto nella palla B di centro 0 e raggio M .
Dalla continuità di f , f −1 (K) è chiuso. D’altra parte, da (∗∗), f −1 (K) è limitato: se fosse
illimitato esisterebbe una successione {xn }n∈N contenuta in f −1 (K) tale che per n → +∞,
|xn | → +∞ e quindi
|f (xn )| ≤ M, ∀n ∈ N,
si arriva ad un assurdo perchè si è supposta vera la (∗∗).
Fine prova Lemma 1.
Lemma 2 Le mappe proprie sono chiuse, cioè mandano chiusi in chiusi.
Prova Lemma 2. Sia F chiuso in Rn (Rn , come dominio di f ). Si vuole dimostrare che
f (F ) è chiuso. Sia y ∈ f (F ), allora esiste una successione in f (F ), yn = f (xn ), con
xn ∈ F , tale che yn → y. Poiché {yn }n∈N ∪ y è compatto, tale è pure f −1 ({yn }n∈N ∪ y).
Di conseguenza {xn }n∈N è limitato. Allora esiste una sottosuccessione {xnj } convergente
ad un x̄ ∈ F̄ = F . Per la continuità di f si ha che f (xnj ) → f (x̄) ∈ f (F ). D’altra parte si
ha anche che f (xnj ) → y, da cui f (x̄) = y e quindi y ∈ f (F ).
Fine prova Lemma 2.
Il Teorema di Inversione Locale offre subito il seguente
Lemma 3 Se f : Rn → Rn è un diffeomorfismo locale, allora f è una mappa aperta.
Ritornando alla dimostrazione del Teorema, si può dire che la funzione f è propria e quindi
manda chiusi in chiusi, ma essendo anche un diffeomorfismo locale è aperta, allora f (Rn )
è sia chiuso che aperto, per connessione è necessariamente Rn . La suriettività è quindi
dimostrata. Fine prova Teorema.
H : T ∗ Q × R −→ R,
160
Analogamente, si vede che
∂H
(q, p, t) = S i (q, p, t).
∂pi
e
∂H ∂L
(q, p, t) = − (q, S(q, p, t), t).
∂t ∂t
Il seguente teorema stabilisce l’equivalenza tra le equazioni di Lagrange e le cosidette
equazione canoniche, o di Hamilton.
Teorema La curva R 3 t 7→ q(t) ∈ Q, o più precisamente R 3 t 7→ (q(t), q̇(t)) ∈ T Q,
risolve le equazioni di Lagrange
d ∂L ∂L
i
− i =0
dt ∂ q̇ ∂q
se e solo se, stabilite le definizioni di pi (q, q̇, t) e di H(q, p, t), la curva R 3 t 7→ (q(t), p(t)) ∈
T ∗ Q risolve le equazioni (Canoniche o) di Hamilton:
d i ∂H d ∂H
q (t) = (q(t), p(t), t), pi (t) = − i (q(t), p(t), t).
dt ∂pi dt ∂q
Prova. R 3 t 7→ q(t) ∈ Q risolva le equazioni di Lagrange, cioè
d ∂L d ∂L ∂H
i
= pi = i = − i ,
dt ∂ q̇ dt ∂q ∂q
che corrispondono al secondo gruppo di equazioni canoniche. Anche il primo gruppo è
soddisfatto, utilizzando l’inversione della trasf. di Legendre e una delle relazioni tra derivate
di L e H appena sopra scritte,
∂H
q̇ i (t) = S i (q(t), p(t), t) = (q(t), p(t), t).
∂pi
In maniera analoga si dimostra il viceversa.
Esercizi importanti:
1) Dimostrare che la funzione H è un integrale primo per il sistema canonico se e solo se
H è indipendente dal tempo.
2) Mostrare che nel caso Lagrangiano meccanico, L = T (q, q̇) − V (q), l’Hamiltoniana è
proprio l’energia totale H = T + V .
L : T (T ∗ Q) × R −→ R
161
(q, p, q̇, ṗ, t) 7→ L(q, p, q̇, ṗ, t) := p · q̇ − H(q, p, t).
Consideriamo il differenziale direzionale (la variazione) del funzionale (detto d’azione):
Z t1
A[q(·), p(·)] = L(q, p, q̇, ṗ, t)dt
t0
L(x, ẋ, t) = L(q, p, q̇, ṗ, t) = p · q̇ − H(q, p, t), x = (xα )α=1,...,2N = (q, p) ∈ T (T ∗ Q) :
d ∂L ∂L d ∂L ∂L ∂H
α = 1, . . . , N : 0 = dt ∂ ẋα − ∂xα ⇒ 0= dt ∂ q̇ i − ∂q i
= ṗi + ∂q i
d ∂L ∂L d ∂L ∂L ∂H
α = N + 1, . . . , 2N : 0 = dt ∂ ẋα − ∂xα ⇒ 0= dt ∂ ṗi − ∂pi = −q̇ i + ∂pi
162
(ii) una funzione differenziabile F (q, t) tali che
N
dF dF X ∂F ∂F
L̄(q, q̇, t) = cL(q, q̇, t) − (q, q̇, t), (q, q̇, t) := i
(q, t)q̇ i + (q, t)
dt dt ∂q ∂t
i=1
t1 t1 t1 N
∂F ∂F
Z Z Z
J¯ =
X
L̄(q(t), q̇(t), t)dt = c L(q(t), q̇(t), t)dt− [ (q(t), t)q̇ i (t)+ (q(t), t)]dt,
t0 t0 t0 ∂q i ∂t
i=1
d ∂ L̄ ∂ L̄
− =
dt ∂ q̇ i ∂q i
N N
d ∂F X ∂ 2 F j X ∂ 2 F
d ∂L ∂L
=c − − + q̇ + =
dt ∂ q̇ i ∂q i dt ∂q i ∂q i ∂q j ∂q i ∂t
j=1 j=1
N N N N
∂2F j X ∂2F ∂2F j X ∂2F
X
d ∂L ∂L X
=c − − q̇ − + q̇ + =
dt ∂ q̇ i ∂q i ∂q j ∂q i ∂t∂q i ∂q i ∂q j ∂q i ∂t
j=1 j=1 j=1 j=1
d ∂L ∂L
=c i
− i .
dt ∂ q̇ ∂q
Si è sopra precisato che per tale strada si ottiene una larga classe di Lagrangiane equiva-
lenti, proprio perché tale classificazione non è esaustiva: p.e. per la seguente Lagrangiana
con q ∈ R1 ,
Z q̇
−q 2 −q̇ 2 −q 2 2
L(q, q̇) = e + 2 q̇ e e−λ dλ,
0
1 2 1 2
si osserva (verificarlo) che è equivalente a L̄ = 2 q̇ − 2 q ,
un oscillatore armonico con ω = 1,
non riconducibile alla classificazione sopra proposta.
Notiamo infine che se la topologia dell’ambiente ‘varietà vincolare’ Q è abbastanza
semplice, cioè Q è semplicemente connessa, allora la classificazione di cui sopra si può
allargare (per semplicità, abbandoniamo le dipendenze eventuali dal tempo):
scegliendo ad arbitrio
(i) una costante c 6= 0 e
163
(ii) una 1-forma differenziabile chiusa θ : Q → T ∗ Q tali che
N
X
L̄(q, q̇) = cL(q, q̇) − hθ(q), q̇i = cL(q, q̇) − θj (q)q̇ j
i=1
X N
d ∂ L̄ ∂ L̄ d ∂L ∂L ∂θi ∂θj j d ∂L ∂L
− =c − − − i q̇ = c −
dt ∂ q̇ i ∂q i dt ∂ q̇ i ∂q i ∂q j ∂q dt ∂ q̇ i ∂q i
j=1
Osservazione: Tale allargamento (alle forme chiuse) diventa però problematico quando
la topologia dell’ambiente ‘varietà vincolare’ Q è più complessa, p.e. Q = Tn : in tal
caso le equazioni di Lagrange continuano ad essere equivalenti, ma i due funzionali J e
J¯ differiscono per delle k che sono ora costanti solo all’interno delle classi di omotopia
delle curve di Γqt00,t,q11 . Questa osservazione diventa interessante quando il problema non è
semplicemente trovare curve critiche ma anche minimizzanti 2 .
Rm × R −→ Rm × R
ẏ(t) = Y (y(t), t)
164
vettoriali coniugati? Se x̄(t) è soluzione della prima, allora ȳ(t) := y(x̄(t), t) è soluzione
della seconda equazione differenziale se e solo se
Y (ȳ(t), t) =
d ∂y d ∂y ∂y ∂y
ȳ(t) = (x̄(t), t) x̄(t) + (x̄(t), t) = (x̄(t), t)X(x̄(t), t) + (x̄(t), t),
dt ∂x dt ∂t ∂x ∂t
infine, pensando che per ogni punto x possiamo far transitare una soluzione, otteniamo la
relazione cercata, indipendente dalle soluzioni,
∂y
Y (y, t)|y=y(x,t) = J(x, t)X(x, t) + (x, t), (?)
∂t
ove
∂y
J(x, t) = (x, t)
∂x
è la matrice jacobiana della trasformazione.
T ∗ Q × R −→ T ∗ Q × R
Aij ∇j f = ∇i g.
165
In altri termini, A è una mappa lineare che trasforma differenziali in differenziali. Allora
A(x) = cI
∇k (Aij ∇j f ) − ∇i (Akj ∇j f ) = 0.
1
f (x) = a + Gi (xi − x̄i ) + Sij (xi − x̄i )(xj − x̄j )
2
che in x̄ ha esattamente valore, gradiente primo, e gradiente secondo pari alle quantità
scelte. Dettagliando le condizioni di chiusura sopra scritte per A∇f ed usando l’arbitrarietà
nell’assegnazione di Gi e Sij otteniamo le condizioni (in x̄)
La (i) mostra che (scegliendo S = I) A è simmetrica, inoltre, mettendosi nella base in cui
A è diagonale si vede che (i) necessariamente implica che A è scalare, cioè A(x) = c(x)I.
La (ii) mostra che, per i = j 6= k, vale ∇k c = 0.
In corrispondenza a y(x, t) esiste una funzione K0 (y, t), definita a meno di costanti additive
e dipendente solo da y(x, t), tale che, per ogni funzione Hamiltoniana H(x, t) nelle vecchie
variabili x, la nuova Hamiltoniana K(y, t) sia data da
E∇x H(x, t)
166
in un nuovo campo vettoriale Hamiltoniano (si veda la formula (?) nella sezione delle
coniugazioni) E∇y K(y, t):
E∇y K(y, t)|y=y(x,t) = J(x, t)EJ T (x, t)∇y H̃(y, t)|y=y(x,t) + ∇t y(x, t) (#)
Scegliamo ora H = 0 (o, più in generale, costante), ne segue che per qualche K0 (y, t) si ha
che per l’ultimo termine in (∗) vale:
cioè y(x, t), per ogni x fissato, è soluzione di un sistema differenziale Hamiltoniano: si usa
allora dire che y = y(x, t) è risolvente del sistema differenziale (se inoltre per un t0 vale
y(x, t0 ) = x allora diremo che y = y(x, t) = Φt,t0 (x) è il flusso associato a quell’equazione
differenziale. Si notino i due tempi, dato che il c. vettoriale non è autonomo).
Dunque Y (y, t) := −E∇t y(x, t)|x=x(y,t) è un gradiente, e una primitiva cercata K0 (y, t)
è per esempio data da:
Z λ=1
K0 (y, t) = Y (λy, t) · y dλ
λ=0
Vediamo quindi che per ogni H(x, t) esiste K(y, t) (a meno di costanti additive) tale che
Vedremo tra breve nei prossimi lemmi che effettivamente c è una costante indipendente
da t.
Sia ora K(y, t) una determinata funzione Hamiltoniana.
167
Lemma 2. Il flusso risolvente le equazioni canoniche associate alla funzione Hamiltoniana
K(y, t), y 0 7→ y(t, y 0 ), y 0 = y(t0 , y 0 ) soddisfa alla condizione algebrica sopra scritta con
c = 1:
∂y
JEJ T = E, ove J = 0 .
∂y
Inoltre, y 0 7→ y(t, y 0 ) è tr. canonica.
Prova. Per ogni fissato y 0 , calcoliamo
∇t J = E∇2y KJ
pertanto
∇t (JEJ T ) = E∇2y KJEJ T + JE(E∇2y KJ)T =
Si osserva che W (t) ≡ E risolve il problema di Cauchy, che naturamente ammette esistenza
e unicità, abbiamo cosı̀ ottenuto:
JEJ T = E
Il fatto che y 0 7→ y(t, y 0 ) sia canonica si verifica direttamente: Il campo vettoriale coniugato
di un generico campo vettoriale Hamiltoniano di Hamiltoniana H è (da (#))
Lemma 3. Date due trasformazioni canoniche, (x, t) 7→ y(x, t) e (y, t) 7→ z(y, t), la loro
composizione (x, t) 7→ z(x, t) := z(y(x, t), t) è canonica e la valenza è il prodotto delle
valenze.
Prova. Indichiamo con J1 e J2 le matrici jacobiane delle due rispettive trasformazioni. Vale
Ji EJiT = ci E, i = 1, 2 e siano K01 (y, t) e K02 (z, t) le due rispettive funzioni Hamiltoniane
168
introdotte nel lemma 1. Operando come nel lemma 1, si osserva che (x, t) 7→ z(y(x, t), t)
è canonica se, per ogni H(x, t), il campo vettoriale XH = E∇x H viene coniugato in un
nuovo campo vettoriale Hamiltoniano. Il coniugato di XH è dato da
K(z, t) = c1 c2 H̄(z, t) + K0 (z, t), K0 (z, t) = c2 K̄01 (z, t) + K02 (z, t),
JEJ T = c1 c2 E.
1 1
J −1 EJ −T = cy−1 (·) E, onde E = JEJ T , cosicchè cy−1 (·) = .
cy−1 (·) cy(·)
J T EJ = cE,
169
equivalente dunque alla JEJ T = cE. Nel seguito, e non solo nella presente dimostrazione,
sarà utile usare quest’ultima versione.
Sia ora y(x, t) appartenente al sopra descritto gruppo di trasformazioni. Sia inoltre
H(x, t) una arbitraria funzione Hamiltoniana definente il campo vettoriale Hamiltoniano
XH = E∇x H. Consideriamone il campo coniugato
è simmetrica. Il dettaglio mostra che questa matrice vale: −E∇t JJ −1 . Dunque è simme-
trica se e solo se (−E∇t JJ −1 )T = −E∇t JJ −1 , cioè
J −T ∇t J T E = −E∇t JJ −1 ,
∇t J T EJ + J T E∇t J = 0.
L : T (T ∗ Q) × R −→ R
170
la validità di quest’ultima è invece necessaria p.e. un’ipotesi di convessità sulle derivate
2H
seconde ∂p∂ i ∂p j
.
A tale L resta associato il funzionale d’azione A[q(·), p(·)]. Ora, comunque noi operiamo
cambi di coordinate nello spazio delle configurazioni in cui è definita la Lagrangiana L (che
è T ∗ Q), cioè diffeomorfismi (x, t) 7→ (y(x, t), t) non necessariamente canonici, otterremo
un nuovo funzionale Ã[q̃(·), p̃(·)] equivalente a A[q(·), p(·)] nel seguente senso: tutti e soli i
punti-curve stazionari dell’uno si otterranno mediante composizione con la trasformazione
x 7→ y(x, t) dai punti-curve stazionari dell’altro. Si osserva che la nuova Lagrangiana
generalizzata cosı̀ ottenuta, L̃(y, ẏ, t) non sarà della forma della originaria L, pertanto le
sue equazioni di Lagrange non saranno delle equazioni di tipo Hamiltoniano. Tale generale
operazione equivale dunque ad una generica coniugazione.
Un’ispezione più attenta dell’aspetto variazionale mette in evidenza che l’integrale
d’azione A valutato lungo una generica curva [t0 , t1 ] 3 t 7→ γ(t) = (q(t), p(t), t) si può
interpretare come l’integrazione di γ lungo la seguente 1-forma differenziale su T ∗ Q × R,
N
X Z
j
ΘH := pj dq − H(q, p, t)dt A[γ(·)] = ΘH
j=1 γ
Ora, una condizione sufficiente4 affinché il diffeomorfismo (x, t) 7→ (y(x, t), t) trasformi
sistemi H(x, t)-Hamiltoniani in sistemi K(y, t)-Hamiltoniani è che esista
(i) una costante reale c 6= 0,
(ii) una funzione a valori reali F (x, t),
per cui,
ΘK y(x,t) = c ΘH − dF (condizione di Lie)
Tale scelta, suggerita dalla teoria delle Lagrangiane equivalenti accennata in 9.6.2, opera
in dettaglio cosı̀
∂y d
LK (y(x, t), (x, t)ẋ, t) = cLH (x, ẋ, t) − [ F ](x, ẋ, t) (•)
∂x dt
d d P2N ∂F
dove con [ dt F ](x, ẋ, t) si intende la “derivata totale formale” [ dt F ](x, ẋ, t) := j=1 ∂xj (x, t)ẋj +
∂F
R t1 R t1
∂t (x, t) e si ha: t0 LK dt = c t0 LH dt + F |t1 − F |t0 .
La condizione di Lie si dettaglia:
∂F ∂F ∂F
p̃dq̃ − Kdt = c (pdq − Hdt) − dq − dp − dt
∂q ∂p ∂t
4
Vedremo nella prossima sezione che tale condizione è pure necessaria.
171
da cui deduciamo: ∂ q̃j ∂F
p̃j ∂qi = c pi − ∂q i
j
p̃j ∂∂pq̃ ∂F
i
= − ∂p i
∂F ∂ q̃ j
K = cH + + p̃j
|∂t {z ∂t}
K0
∂F1 ∂F1
p̃dq̃ = c pdq − dq − dq̃ (∗)
∂q ∂ q̃
da cui:
p̃ = − ∂F
∂ q̃ (q, q̃, t)
1
c p = ∂F
∂q (q, q̃, t)
1
(Trasformazioni F1 )
∂F1
K = cH +
∂t
|{z}
K0
Condizione essenziale affinché queste funzioni generatrici F1 (q, q̃, t) inducano una trasfor-
mazione canonica, è che, almeno per il p.to di vista locale,
2
∂ F1
det (q, q̃, t) 6= 0
∂q∂ q̃
In tal caso infatti, dalle seconde delle (F1 ) si esprimono le q̃ = q̃(q, p, t) che, inserite nel
primo gruppo, danno pure p̃ = p̃(q, p, t) ottenendo cosı̀ la tr. cercata.
• Si osservi che valenza c e funzione generatrice F definiscono completamente la tr. cano-
nica.
172
Tra i molti altri modi in cui possiamo scegliere 2N +1 variabili indipendenti, introducia-
mo le tr. canoniche indotte da funzioni generatrici di tipo F2 = F2 (q, p̃, t); riconsideriamo
la condizione di Lie esprimendo p̃dq̃ con un’ovvia identità ‘per parti’:
dove ora consideriamo tale relazione tra 1-forme nelle variabili indipendenti q, p̃, t,
pertanto:
∂F2
q̃ = ∂ p̃ (q, p̃, t)
∂F2
cp = ∂q (q, p̃, t)
(Trasformazioni F2 )
∂F2
K = cH +
∂t
|{z}
K0
J T EJ = cE
5
Abbiamo precedentemente visto che J T EJ = cE e JEJ T = cE sono equivalenti.
173
se e solo se è soddisfatta la Condizione di Lie ridotta. A tal fine, ricordando che
q q̃
x= y= ,
p p̃
PN P2N
riconsideriamo la forma, in T ∗ Q, data da A = i=1 pi dq
i = α=1 Aα (x)dx
α; la condizione
di integrabilità per essa è si scrive
T
∂Aα O I ∂Aβ O O
= =
∂xβ O O ∂xα I O
∂Aα ∂Aβ O I
− = =E
∂xβ ∂xα −I O
ed essendo E 6= O, non è chiusa.
D’altra parte, per ogni fissato t ∈ R, per la 1-forma
N
X 2N
X
p̃i dq̃ i y=y(x,t) = Aα (y)dy α y=y(x,t) = A(y(x, t))J(x, t)dx
Ay=y(x,t) =
i=1 α=1
= J T ∇x AJ − [J T ∇x AJ]T = J T EJ,
dove termini coinvolgenti le derivate seconde di y(x, t) si elidono per il teorema di Schwarz.
Infine, notiamo che la condizione caratterizzante le trasformazioni J T EJ −
canoniche P
cE = O è esattamente la condizione di chiusura della 1-forma i=1 p̃i dq̃ y=y(x,t) −c N
PN i i
i=1 pi dq :
ne segue che localmente è esatta e dunque esiste una funzione generatrice F (x, t) soddisfa-
cente la condizione di Lie ridotta.
174
Utilizzando lo schema6 delle F2 , si è dunque condotti a cercare una funzione generatrice,
nel caso univalente c = 1, la Hamiltoniana trasformata sia la ‘più’ semplice possibile:
K = 0. Pertanto, determinare S(q, p̃, t) tale che
∂S ∂S
(q, p̃, t) + H(q, (q, p̃, t), t) = 0 (equazione di H-J)
∂t ∂q
con la condizione (si veda la teoria del paragrafo precedente):
2
∂ S
det (q, p̃, t) 6= 0 (cond. di ‘radrizzabilità’)
∂q∂ p̃
Da un punto di vista strettamente matematico, notiamo dunque che la conoscenza di
una qualunque soluzione (globale) S(q, p̃, t) dell’equazione alle derivate parziali (PDE) di
Hamilton-Jacobi, detta Integrale Completo, soddisfacentealla condizione di radrizza-
∂2S
bilità (globale, che solo localmente si scrive come sopra: det ∂q∂ p̃ (q, p̃, t) 6= 0) consente
di determinare il flusso associato alle equazioni canoniche per H. Infatti, quest’ultimo
si deduce mediante coniugazione dal flusso (banale, q̃ ≡ cost. e p̃ ≡ cost. ) relativo alle
equazioni canoniche per K = 0: ΦtK,q̃ (t, q̃, p̃) ≡ q̃, ΦtK,p̃ (t, q̃, p̃) ≡ p̃. La trasformazione
canonica indotta da S(q, p̃, t) è
∂S ∂S
p= (q, p̃, t), q̃ = (q, p̃, t)
∂q ∂ p̃
che una volta messa in forma ‘diretta’ dà
q = q(t, q̃, p̃), p = p(t, q̃, p̃)
La composizione della trasformazione col flusso di XK produce il flusso di XH , precisamen-
te, per ogni arbitraria scelta delle 2N costanti (q̃, p̃), dalle formule appena scritte otteniamo
una soluzione del sistema canonico originale.
In tutta generalità, tale progetto d’integrazione fallisce nel suo obiettivo primario,
ciononostante è stato, ed è, di primaria importanza, per vari motivi:
1) i (pochi) sistemi Hamiltoniani che si lasciano risolvere con questo metodo sono ora
chiamati sistemi integrabili, fisicamente sono moto significativi (p.e. generali oscillato-
ri lineari a N gradi di libertà, 2-corpi Newtoniano, corpo rigido con momento nullo) e
rappresentano il punto di partenza della moderna teoria perturbativa,
2) l’equazione di Hamilton-Jacobi emerge in contesti molto lontani dalla meccanica
analitica, p.e. in ottica geometrica, propagazione delle onde nei materiali continui, in
meccanica quantistica con l’equazione di Schrödinger, in teoria del controllo ottimo, e la
tecnica qui raccontata viene usata in senso inverso, cioè, l’equazione PDE di H-J viene
studiata/risolta ricorrendo alle associate ODE date da XH .
6
coinvolgente variabili miste (cioè, vecchie e nuove), ma interessante perché permette facilmente di
individuare trasformazioni ‘vicine’ all’identità: F2 (q, p̃, t) = p̃ · q + ...
175
9.10.1 Metodo d’integrazione di H-J: Hamiltoniana con n − 1 variabili
cicliche
Si consideri in R2n una funzione Hamiltoniana H(q1 , p1 , . . . , pn ) dove le variabili qα , α =
2, . . . , n, sono cicliche, inoltre H è pure indipendente dal tempo.
∂H
Si supponga che ∂p 1
6= 0.
Scrivere in dettaglio il metodo di integrazione di Hamilton-Jacobi per questa Hamilto-
niana, nella ricerca di una opportuna funzione generatrice:
∂S
Impostando per questa S proposta l’equazione di H-J, ∂t + H(q1 , ∂S
∂q ) = 0, otteniamo:
∂W
H(q1 , , p̃2 , . . . , p̃n ) = p̃1 (∗)
∂q1
∂H
Grazie all’ipotesi tecnica ∂p1 6= 0 possiamo esprimere:
∂W
= F(q1 , p̃1 , . . . , p̃n )
∂q1
e dunque Z q1
W (q1 , p̃1 , . . . , p̃n ) = F(λ, p̃1 , . . . , p̃n )dλ
∂S ∂S ∂W
pα = ∂qα : pα = p̃α q̃α = ∂ p̃α : q̃α = qα + ∂ p̃α
∂2S
6= 0 :
∂qi ∂ p̃j
176
∂2W ∂2W
∂q1 ∂ p̃1 ... ∂q1 ∂ p̃α ...
1
∂2S
1
= ,
∂qi ∂ p̃j 1
... ... ... ... . . .
1
dalla (∗) vediamo che
∂H ∂ 2 W
= 1,
∂p1 ∂q1 ∂ p̃1
∂H
da cui, per ∂p1 6= 0, la tesi.
con l’ipotesi
∂Hi
(pi , qi ) 6= 0, ∀i.
∂pi
Osserviamo preliminarmente che ogni funzione Hi (pi , qi ) è un integrale primo del moto.
Infatti
dHi ∂Hi ∂Hi
= q̇i + ṗi =
dt ∂qi ∂pi
∂Hi ∂H ∂Hi ∂H
= + (− )=
∂qi ∂pi ∂pi ∂qi
∂Hi ∂f ∂Hi ∂Hi ∂f ∂Hi
= − = 0.
∂qi ∂ai ∂pi ∂pi ∂ai ∂qi
Scegliamo una funzione generatrice del tipo
X
S(q, p̃, t) = −f (p̃1 , . . . , p̃n )t + Wi (qi , p̃i ).
i
∂S ∂S
H(q, )+ =0
∂q ∂t
si scrive
∂W1 ∂Wn
f (H1 (q1 , ), . . . , Hn (qn , )) = f (p̃1 , . . . , p̃n )
∂q1 ∂qn
177
ed è soddisfatta se e solo se le Wi risolvono le n equazioni di H-J “separate”
∂Wi
Hi (qi , (qi , p̃i )) = p̃i , i = 1, . . . , n;
∂qi
qi
∂Wi
Z
= ϕi (qi , p̃i ), Wi (qi , p̃i ) = ϕi (λ, p̃i )dλ.
∂qi qi (0)
∂2S
rk( ) = max = n
∂qi ∂ p̃i
Si ha facilmente
Ma essendo
Hi (qi , ϕi (qi , p̃i )) = p̃i , ∀i
9.10.3 Esercizi
Nei manuali:
“Meccanica Analitica” di Fasano e Marmi, Bollati-Boringhieri
“Meccanica” di Landau e Lifsic, Editori Riuniti
“Lezioni di meccanica analitica” di Gantmacher, Editori Riuniti
si trovano molti esercizi svolti in dettaglio.
Qui di seguito alcuni esempi ed esercizi tratti dalle dispense di Benettin-Galgani-Giorgilli:
178
179
Infine, generalizzare al caso N -dimensionale l’esempio qui di seguito:
180
181
182
Capitolo 10
Isomorfo a V ett(Rm ), resta definito lo spazio degli Operatori Differenziali Lineari del
primo ordine, Der(m), su C ∞ (Rm ; R):
D ∈ Der(m) ⇐⇒
D : C ∞ (Rm ; R) −→ C ∞ (Rm; R)
7 → D(f )(x) = m ∂
P
f (x) − i=1 Xi ∂xi f (x).
Con altri simboli (derivata di Lie), Df = LX f . Un motivo per cui si introduce tale spazio
consiste nella naturale definizione in esso di un prodotto che lo dota di P
struttura d’Algebra.
Cominciamo con l’osservare che dati due operatori differenziali DX = m ∂
i=1 Xi ∂xi , DY =
Pm ∂
i=1 Yi ∂xi , ha senso valutare
DY , DX f := (DY ◦ DX − DX ◦ DY )f.
Si vede facilmente che quest’ultimo operatore è ancora lineare e del primo ordine, infatti:
m m m m
X ∂ X ∂ X ∂Xi ∂ X ∂2
(DY ◦ DX )f = Yj Xi f= Yj f+ Yj Xi f,
∂xj ∂xi ∂xj ∂xi ∂xj ∂xi
j=1 i=1 i,j=1 i,j=1
183
vale un analogo sviluppo per (DX ◦ DY )f , e dal teorema di Schwarz (commutazione delle
derivate seconde) si ottiene
m X
m m
X ∂Xi X ∂Yi ∂
DX , DY f = (DY ◦ DX − DX ◦ DY )f = Yj − Xj f.
∂xj ∂xj ∂xi
i=1 j=1 j=1
allora la biiezione
V ett(Rm ), +, [., .] −→ Der(m), +, ., .
7−→ D = m ∂
P
X i=1 Xi ∂xi
Qui sopra E è la matrice simplettica base –vedi il capitolo della meccanica Hamiltoniana e
trasformazioni canoniche–
O I
E= .
−I O
Inoltre: !
∂
q
x= ∈ R2N , ∇x = ∂q
∂ .
p ∂p
184
è, pure questa, un anti-morfismo d’algebra:
dotato delle due operazioni somma + e prodotto {., .}, è un’algebra di Lie, che, in tutta
generalità, sono caratterizzate dalle seguenti proprietà:
(i) {., .} è bilineare: {f, g + h} = {f, g} + {f, h} e
{g + h, f } = {g, f } + {h, f },
(ii) {f, f } = 0, ∀f ∈ C ∞ ,
(iii) vale l’identità di jacobi: {f, {g, h}} + {g, {h, f }} + {h, {f, g}} = 0
Si noti che (i) e (ii) implicano1 l’asimmetria: {f, g} = −{g, f }, come è nel nostro caso.
1
p.e., basta fare: 0 = {f + g, f + g} = {g, f } + {f, g}
185
{H̃, K̃}(y)y(x) = ∇y H̃, E∇y K̃ (y)y(x) = ET E∇y H̃ , E∇y K̃ (y)y(x) =
| {z } | {z }
XH̃ XK̃
= ET JE∇x H , JE∇x K (x) = −J T
EJ
| {z } E∇ x H, E∇x K (x) =
| {z } | {z }
JXH JXK cE
= c ∇x H, E∇x K (x) = c{H, K}(x)
Ora, se f e g sono integrali primi per XH , allora lo è pure ogni loro combinazione
R-lineare e, per (iii), cosı̀ pure {f, g}:
Ricordiamo che, per ogni funzione a valori reali h, si ha che LXH (h) = −{H, h},
[E∇x H, E∇x K](h) = [XH , XK ](h) = LXH (LXK (h)) − LXK (LXH (h)) =
186
10.3 Significato dinamico delle parentesi di Lie
Ad ogni campo vettoriale X ∈ V ett(Rm ) resta associato un operatore differenziale del
primo ordine D, e cosı́ pure un’equazione differenziale autonoma in Rm ,
ẋ = X(x).
ΦtX : Rm −→ Rm , ΦtY : Rm −→ Rm ,
d t d t
Φ (x) = X(ΦtX (x)), Φ (x) = Y (ΦtY (x)).
dt X dt Y
Allora ∀t, s ∈ R, i flussi commutano se e solo se le Parentesi di Lie sono identicamente
nulle,
ΦtX ◦ ΦsY − ΦsY ◦ ΦtX ≡ 0 ⇐⇒ [X, Y ] ≡ 0.
∂ ∂
φ(t, s) = φ(0, 0) + φ(t, s)|(0,0) t + φ(t, s)|(0,0) s+
∂t ∂s
1∂ 2 1 ∂ 2 ∂ 2
2 32
+ 2 φ(t, s)|(0,0) t2 + 2 2
φ(t, s)| (0,0) s + φ(t, s)| (0,0) ts + O (t + s ) .
2∂ t 2 ∂2s ∂t∂s
Dalla definizione di φ(t, s) segue subito che φ(0, s) = 0 = φ(t, 0), ∀t, s, cosicché
φ(0, 0) = 0,
∂
∂t φ(t, s)|(0,0)
= 0,
∂
∂s φ(t, s)|(0,0)
= 0,
∂2
∂2t
φ(t, s)|(0,0)
= 0,
∂2
∂2s
φ(t, s)|(0,0)
= 0.
Dettagliamo il termine contenente le derivate seconde miste.
∂2 ∂ ∂
ΦtX ◦ ΦsY − ΦsY ◦ ΦtX (x)|(t,s)=(0,0) =
φ(t, s)|(0,0) =
∂t∂s ∂t ∂s
187
∂ ∂ ∂∂
ΦtX ◦ ΦsY (x) |t=0 |s=0 − ΦsY ◦ ΦtX (x) |s=0 |t=0 =
=
∂s ∂t ∂t ∂s
∂ ∂
X ΦsY (x) |s=0 − Y ΦtX (x) |t=0 ,
=
∂s ∂t
La componente i-esima risulta:
∂2
φi (t, s)|(0,0) =
∂t∂s
m m
X ∂Xi X ∂Yi
= Yj − Xj = [Y, X]i (x).
∂xj ∂xj
j=1 j=1
Questa formula ci dice che se i flussi commutano allora necessariamente le parentesi sono
nulle. Viceversa, osserviamo che se le parentesi sono nulle, allora localmente (cioè, a meno
di O(3) ) i flussi commutano. Il prossimo passo consisterà nel mostrare che effettivamente
tale commutazione dei flussi è globale, cioè vale per tempi finiti t e s. Nel piano dei tempi,
asse-t × asse-s, fissiamo un arbitrario punto (t, s), scegliamo un numero (grande) intero
N ∈ N, e consideriamo il seguente reticolo di N 2 rettangolini di lati Nt e Ns ,
(t,s)
s
B
s/N
A
O t/N t
A partire da x, dal percorso ΦtX ◦ ΦsY (prima si evolve in “verticale” col flusso di Y
per un tempo s, poi in “orizzontale” col flusso di X per un tempo t) al percorso ΦsY ◦ ΦtX ,
ci sono esattamente N 2 percorsi che differiscono, l’uno dall’altro, contiguamente, per un
rettangolino come in figura.
Consideriamo due generici percorsi contigui come quelli anneriti in figura. Da O ad
A i due percorsi sono equivalenti. Dal punto x evolviamo in un punto y. All’uscita dal
188
rettangolino, in B, i due percorsi dovrebbero portare, in tutta generalità, a due distinti
punti in Rm , diciamoli x1 e x2 . Poi, da B a (t, s), i due percorsi di flusso sono ancora
uguali, però, partendo da due punti x1 e x2 possibilmente distinti, arriveremo alla fine dei
due percorsi in due punti y1 e y2 .
Per questi due percorsi contigui in Rm avremo un andamento del tipo:
y1 y2
x1
x2
x
Qual è la differenza tra i due percorsi all’uscita del rettangolo? Se vale [X, Y ] ≡ 0, lo
sviluppo di Taylor di cui sopra, a partire dal punto y e per tempi Nt , Ns , ci dice che l’errore
sarà dell’ordine
3
(t2 + s2 ) 2 C1 (y, t, s)
∆ = |x1 − x2 | ≤ C(y) 3
= .
N N3
Consideriamo un compatto K di Rm nel cui interno evolvono gli N 2 percorsi. Sia dunque
3
C la peggiore (il sup in K) delle costanti C(y), e dunque C1 (t, s) := C(t2 + s2 ) 2 . Per com-
pletare i percorsi, a partire dai due punti x1 e x2 applichiamo due identiche composizioni
di flussi, arrivando cosı́ a y1 e y2 . Ora i nostri flussi sono differenziabili nel dato iniziale,
dunque lo sono le composizioni di cui appena parlato, e quindi Lipschitziane. Indichiamo
con t̄ e s̄ i tempi residui per completare i percorsi, avremo
Come prima, prendiamoci la peggior costante di Lipschitz, L(t, s), per (t̄, s̄) ∈ [0, t] × [0, s].
In definitiva, il peggior errore che possiamo fare partendo da uno stesso y e facendo due
percorsi adiacenti, è
1
C1 (t, s)L(t, s) 3 .
N
189
Dunque l’errore complessivo di commutazione dei due flussi sarà stimato come N 2 volte
(perché N 2 sono i percorsi a due a due contigui) l’errore appena valutato:
1 2 1
∆T otale ≤ C1 (t, s)L(t, s) 3
N = C1 (t, s)L(t, s) ,
N N
e questa costruzione vale per qualunque N grande ad arbitrio: l’errore è nullo.
ẋ = X(x) + Y (x).
Nel caso in cui i due campi vettoriali X e Y commutino, [X, Y ] = 0, allora la formula si
semplifica in
ΦtX+Y (x) = ΦtX ◦ ΦtY (x).
Nel caso lineare, ẋ = Ax + Bx, ritroviamo un risultato noto: [X, Y ] = 0 è equivalente alla
commutazione delle matrici AB = BA, e vale il morfismo tra la struttura additiva e la
moltiplicativa dell’algebra delle matrici data dall’esponenziale di matrice. Dunque:
ΦtX+Y (x) = e(A+B)t x = eAt eBt x = ΦtX ◦ ΦtY (x).
190
Questa è la funzione scalare
∂
(LX f )(x) := (Xi f )(x).
∂xi
Il significato è appunto quello di derivata di f lungo il flusso di X.
Dato un campo vettoriale
Y : M → T M,
qualè una corretta definizione di derivata di Lie di Y rispetto a X? Se andiamo a
rianalizzare LX f notiamo che
d d
(LX f )(x) = [f (ΦλX (x))]|λ=0 = {[(ΦλX )∗ f ](x)}|λ=0 .
dλ dλ
Questo richiamo del pull-back è essenziale per la definizione di derivata di un campo vet-
toriale Y rispetto al flusso del campo vettoriale X; infatti, le operazioni vettoriale di
“rapporto incrementale”, e poi di limite per λ → 0, devono essere fatte tutte nello stesso
spazio vettoriale tangente.
Definiamo:
[(ΦλX )∗ Y ](x) − Y (x) d
(LX Y )(x) := lim = {[(ΦλX )∗ Y ](x)}|λ=0 .
λ→0 λ dλ
Consideriamo il dettaglio in carte locali di tale espressione.
d ∂ΦλX −1
(LX Y )i (x) = {( ) Y (ΦλX (x))}i |λ=0 ,
dλ ∂x
richiamiamo ora che
LX Y = [X, Y ].
191
10.6 Cenni sulla Teoria delle Perturbazioni dei Sistemi Ha-
miltoniani
10.6.1 Sistemi Hamiltoniani integrabili
Supponiamo che il sistema Hamiltoniano definito dall’Hamiltoniana
h : T ∗ RN (∼ R2N ) → R
sia dinamicamente risolubile, cioè il suo diagramma di fase sia completamente noto, il
flusso associato sia esplicitamente calcolabile a meno di operazioni analitiche elementari:
inversioni di funzioni e calcolo di primitive di integrali. Questa situazione non è certo
la norma nei sistemi differenziali, anzi, è l’eccezionalità. In meccanica Hamiltoniana tali
sistemi speciali si catalogano con il teorema di Liouville-Arnol’d –vedi Metodi Mat.
della Meccanica Classica, cap. X–, si dicono integrabili, e si caratterizzano dal fatto di
possedere N integrali primi fi , i = 1, ..., N in involuzione, cioè {fi , fj } = 0, e tali per cui gli
insiemi di livello di T ∗ RN dati da fi (x) = ci sono delle sottovarietà connesse e compatte N -
dimensionali di T ∗ RN . (Una situazione un po’ più generale del caso compatto è trattata in
MMMC). Ne risulta (tesi del teorema di Liouville-Arnol’d): per fissati c1 , . . . , ci , . . . , cN , le
varietà {fi (x) = ci , i = 1, . . . , N } sono diffeomorfe a tori N -dimensionali TN = S1 ×...×S1 ;
più precisamente, esiste una trasformazione canonica uni-valente che fibra localmente T ∗ RN
in tori, più precisamente, per qualche aperto B ⊂ RN e per qualche U ⊂ T ∗ RN esiste una
trasformazione canonica y = y(x),
ed è tale che la nuova Hamiltoniana k(y) = h(x(y)) dipende (al più) dalle azioni I1 , ..., IN ,
192
10.6.2 Perturbazioni
E’ di cruciale interesse fisico conoscere, saper esplorare, cosa accade vicino ai sistemi in-
tegrabili. Si pensi al classico problema di meccanica celeste del sistema planetario solare.
Ogni sotto-sistema sole-pianeta è un problema a due-corpi, dunque integrabile, con una
costante di accoppiamento nella forza gravitazionale proporzionale a (massa-sole)×(massa-
pianeta). Se si trascurano le interazioni pianeta-pianeta il sistema planetario è la com-
posizione priva di accoppiamento di n problemi a due corpi, dunque integrabile. E nel
caso compatto, quale quello che apparentemente stiamo vivendo, l’integrazione è ben nota.
Sembra lecito chiederci se le trascurate interazioni pianeta-pianeta non possano, in tempi
lunghi, distruggere, o, meno catastroficamente, mutare l’attuale struttura topologica delle
orbite del sistema planetario cosı̀ descritto. Le costanti di accoppiamento per tali perturba-
zioni sono dell’ordine (massa-pianeta)×(massa-pianeta), cosicché le costanti perturbative
relative sono dell’ordine di ε ≈ (massa-pianeta)/(massa-sole)(=10−3 per Giove).
Ancora, consideriamo un cristallo la cui dinamica più o meno ordinata delle molecole
nei nodi di un reticolo cristallino può essere descritta mediante delle forze elastiche, magari
in prima approssimazione, e questo genererà un sistema Hamiltoniano, a molti gradi di
libertà, di tipo oscillatori armonici disaccoppiati e dunque integrabile, h(I) = ω · I. Alcune
teorie di calore specifico nei solidi usano modelli descrittivi di questo tipo. Anche qui
è decisamente lecito chiederci se i termini non lineari e le eventuali impurità cristalline
possano distruggere o modificare sensibilmente la forte stabilità del modello integrabile.
In entrambi i (macro- e micro-) casi accennati la situazione è del seguente tipo, nelle
coordinate angolo-azione ottenute dall’iniziale imperturbato sistema integrabile,
ẋ = E∇(h + εf )(x)
193
sistemi Hamiltoniani autonomi ove ε assumerà il ruolo del parametro di evoluzione: questo
è un punto fondamentale della costruzione, che utilizza e motiva ulteriormente la teoria for-
male delle trasformazioni canoniche. Va pure messo in evidenza che questo è in ogni caso un
particolare, tra i tanti disponibili in letteratura, approccio alla teoria delle perturbazioni.
Cercheremo dunque x = x(ε, y) tale che x(0, y) = y e
∂x
(ε, y) = E∇g(x(ε, y)),
∂ε
per qualche funzione Hamiltoniana g da determinarsi. Dunque il nostro programma sarebbe
risolto se risultasse
(h + εf )(x(ε, y)) = h(y).
In generale, ciò non sarà ovviamente possibile. Ci accontenteremo di procedere per passi
perturbativi nel seguente senso: sviluppiamo nel parametro ε, in ε = 0, il primo membro
della precedente equazione,
∂x
(h + εf )(x(ε, y)) = h(y) + ∇h(y) (ε, y)|ε=0 ε + f (y)ε +o(ε).
| ∂ε {z }
=0: equazione di H-J
Notiamo che se la funzione Hamiltoniana g(y) risolve l’equazione lineare alle derivate par-
ziale del primo ordine (è di tipo Hamilton-Jacobi, compare solo il gradiente della funzione
incognita):
∇h(y)E∇g(y) + f (y) = 0,
allora la trasformazione canonica data dal flusso del sistema Hamiltoniano associato all’Ha-
miltoniana g muta h(y)+εf (y) in h(y)+R(ε, y), ove R(ε, y) = o(ε). Se dunque l’equazione
di cui sopra fosse risolubile, allora avremmo spostato la perturbazione dall’ordine ε1 ad un
ordine strettamente maggiore di uno. Più precisamente, vedremo tra breve –vedi più sotto–
che il guadagno sarà senz’altro ad un ordine maggiore di 1, ma, nelle particolari scelte dei
3
ε2
parametri in gioco qui fatte, strettamente minore di 2: cioè, da ε a √ ε
= ε2 .
194
vale allora per i coefficienti di Fourier una stima (accettiamola, è standard) del tipo
Cercheremo g pure tra le funzioni analitiche della stessa forma di f ; l’equazione diventa,
componente per componente (di Fourier),
ω · k 6= 0 ∀k ∈ ZN \ {0}.
Non è affatto detto che questa sola condizione di non risonanza garantisca la convergenza
della serie di Fourier per X
g(ϑ, I) = gk (I)eik·ϑ
k∈ZN
195
indichiamola con BL . Indichiamo con BL,α,β l’insieme delle ω (α, β)−diofantee che stanno
in BL .
Si dimostra (per esempio in P. Lochak, C. Meunier: Multiphase averaging for classical
systems, Applied Math. Sciences 72, Springer) che:
Cosı̀, scegliendo β = N , la misura (il “volume” N -dimensionale) delle frequenze che “non
vanno bene” in BL è piccola con α, parametro che però non posso schiacciare a zero,
pena la non convergenza della serie. Naturalmente non è neppure possibile aumentare
indiscriminatamente β dato l’ovvio conseguente peggioramento della convergenza.
{Si dimostra anche che tale insieme “cattivo” BL \ BL,α,β è denso in BL . Tale comporta-
mento non deve stupire: si pensi per esempio ai razionali presenti nell’intervallo reale [0, 1],
questi sono un’infinità numerabile (n = 1, 2, ...) e possono essere ricoperti da intervallini di
α
ampiezza αn , la somma di tali ampiezze vale 1−α ; questo è il procedimento standard per
mostrare che i razionali sono di misura nulla in [0, 1]: ciononostante i razionali (l’analogo
delle frequenze risonanti), e dunque l’unione di tali intervallini (che in questo ragionamento
modellizzano l’insieme BL \ BL,α,β ), sono un insieme denso in [0, 1]} .
Da quanto delineato, una scelta ragionevole per α e β, ma limitatamente ad un passo
perturbativo, potrebbe essere:
√
α = ε, β = N.
Pensando alla stima sulle gk si deduce che anche il resto R dipenderà dal reciproco di α,
dunque un passo perturbativo sposterà la perturbazione d’ordine ε ad una perturbazione
ε2 √
d’ordine √ ε
= ε ε.
Il significato operativo di tale passo perturbativo è il seguente: nelle nuove coordinate
angolo-azione si ha subito che |I| ˙ ≤ cε√ε, dunque le azioni I restano √ε-limitate in un
intervallo di tempo dell’ordine di 1ε : se non avessimo operato la trasformazione avrem-
√
mo riconosciuto dalle equazioni di Hamilton che le azioni I restavano ε-limitate per un
intervallo molto più breve, dell’ordine di √1ε .
A questo punto si potrebbe pensare di iterare il procedimento. L’aspetto fondamentale
di tale tentativo è che, ancora una volta, abbiamo da risolvere un’equazione di alle derivate
parziale H-J del precedente tipo, con lo stesso operatore principale g 7→ ∇hE∇g. E’
centrale il problema della stima dei resti Rk (ε, y): in generale le stime note portano alla
non convergenza dello schema, una situazione ben nota fin da Poincaré. Il teorema di
Kolmogorov-Arnol’d-Moser (K.A.M.) risponde alla questione riguardanti la convergenza
degli schemi perturbativi del tipo sopra brevemente descritto e più generali. Ma la non-
convergenza non è sempre drammatica: una stima abbastanza ragionevole mostra che
(qui qualche coefficiente è semplificato per esigenze didattiche) il resto all’n−esimo passo
perturbativo è dell’ordine di
|Rn (I, ϑ)| ≤ c n! εn .
196
Naturalmente la crescita fattoriale depone a favore della non convergenza della successione
dei passi perturbativi. Ciononostante una stima Stirling del fattoriale, n! ≈ nn e−n , ci
suggerisce di operare fino ad un numero n∗ = [ 1ε ] di passi ([...]:=“parte intera”); in tal
caso:
∗ ∗ 1 1
|Rn | ≤ c n∗ ! εn ≈ c (n∗ ε)n e− ε ≈ c e− ε .
Otteniamo un risultato formidabile: una stima esponenziale, del tipo trattato nel teorema
di Nekhoroshev, dell’andamento delle azioni: abbiamo che |I| ˙ ≤ c̄ e− 1ε , e dunque le azioni I
√ √ 1
restano ε-limitate in un intervallo di tempo esponenzialmente lungo, dell’ordine di ε e ε .
L’utilità pratica è evidente: tale risultato ci dice che le azioni sono degli integrali primi
√
ε-approssimati per intervalli di tempo T , che per ragionevolmente piccoli ε facilmente
raggiungono (e ben superano) l’età dell’Universo; per esempio, per ε dell’ordine di 10−5 , si
5
ha T ≈ 10−5/2 e10 sec.
197
198
Capitolo 11
Φ : R × R2N → R2N
199
su un aspetto meno forte ma, ciononostante, sufficientemente significativo e interessante.
Studiamo l’evoluzione della misura (in R2N ) di Ω tramite Φt :
Z
mis (Φt (Ω)) := dx
Φt (Ω)
d
Calcoliamo dt mis (Φt (Ω)) :
d d ∂(x1 , . . . , x2N )
Z Z
dx = (t, y)dy
dt dt Ω ∂(y1 , . . . , y2N )
Φt (Ω)
Se, come supponiamo, vale per (1) un teorema di esistenza e unicità, allora Φt è iniettivo
e posto1
2N
∂(x1 , . . . , x2N ) X ∂xi
J(t, y) = (t, y) = Aih (t, y) (t, y)
∂(y1 , . . . , y2N ) ∂yh
h=1
2N
∂ 2 xi
Z X
= Aij (t, y) (t, y)dy =
Ω i,j=1 ∂t∂yj
2N
∂ ∂xi
Z X
= Aij (t, y) (t, y)dy =
Ω i,j=1 ∂yj ∂t
2N
∂
Z X
= Aij (t, y) Xi (x(t, y))dy =
Ω i,j=1 ∂yj
2N 2N
∂Xi ∂xk
Z X X
= Aij (t, y) (x(t, y)) (t, y)dy,
Ω i,j=1 ∂xk ∂yj
k=1
1
Aih : complemento algebrico della matrice Jacobiana
200
P2N ∂xk
ricordando che j=1 Aij ∂yj = δik J, si ottiene:
2N
d ∂X i
Z Z X
(3) dx = J(t, y) (x(t, y))dy.
dt Φt (Ω) Ω ∂xi
i=1
∂X i
Com’è noto: divX := 2N
P
i=1 ∂xi (operatore “divergenza”).
Infine ritornando alle variabili x, otteniamo:
d
Z Z
(4) dx = divX(x)dx (Teorema del Trasporto).
dt Φt (Ω) Φt (Ω)
2N
X
(5) Xi (x) = Aij xj (Aij : matrice reale costante 2N × 2N )
j=1
P2N i
In tal caso divX = i=1 Ai = trA (tr: traccia), allora la (4) diviene:
d
Z Z
(6) dx = trA dx.
dt Φt (Ω) Φt (Ω)
Consideriamo ora la (4) nel caso che ẋ(t) = X(x(t)) sia un sistema Hamiltoniano
x = (q1 , . . . , qN , p1 , . . . , pN ) :
∂H
q̇i = ∂pi (q(t), p(t))
(9)
ṗi = − ∂H
∂qi (q(t), p(t)), i = 1, . . . , N.
201
Calcoliamo la divergenza del campo vettoriale:
2N N N
X ∂Xh X ∂ X ∂
div X = = Xi + XN +i =
∂xh ∂qi ∂pi
h=1 i=1 i=1
N XN
X ∂ ∂H ∂ ∂H
= + − =
∂qi ∂pi ∂pi ∂qi
i=1 i=1
N N
X ∂2H X ∂2H
= − ,
∂qi ∂pi ∂pi ∂qi
i=1 i=1
se H ∈ C2, vale divX ≡ 0, dunque nel caso Hamiltoniano dalla (4) si ha:
d
Z
(10) dx ≡ 0,
dt Φt w(Ω)
cioè:
Teorema di Liouville Il flusso associato alle equazioni canoniche di Hamilton mappa
nello spazio delle fasi R2N misurabili Ω in misurabili Φt (Ω) di ugual misura.
202
Sotto queste ipotesi il flusso Φt rappresenta un diffeomorfismo di ΩE0 ,E1 in sè, ∀t ∈ R (le
soluzioni restano definitivamente intrappolate in ΩE0 ,E1 ).
Teorema del Ritorno (H. Poincaré).
Consideriamo un sistema Hamiltoniano come appena descritto. Per quasi tutti (nel senso
della misura) i punti x ∈ ΩE0 ,E1 , sottoinsieme invariante (cioè: Φt ΩE0 ,E1 = ΩE0 ,E1 ) e
compatto dello spazio delle fasi R2N , fissato ad arbitrio ε > 0 e T > 0 esiste un tempo
t(y, ε, T ) ≥ T tale che
kΦt x − xkR2N < ε
cioè, il moto dei sistemi Hamiltoniani, indipendenti dal tempo, sui sottoinsiemi invarianti
e compatti dello spazio delle fasi, è quasi–periodico.
◦
Prova. Sia y ∈ ΩE0 ,E1 e sia B = B(y, 2ε ) la palla di centro y e raggio 2ε , ε > 0. Con
semplice argomento di compattezza, ricopriamo ΩE0 ,E1 con un numero finito di tali palle.
Sia T > 0 reale arbitrario e sia N ⊆ B
l’insieme dei punti x di B che, sotto l’azione del flusso Φt con tempo discretizzato t =
T, 2T, 3T, . . . , non ritornano in B. Per la tesi basta dimostrare che, comunque scegliamo
T > 0, misN = 0. Dalla (4) si ha
∀x ∈ N : ΦnT x 6∈ B n = 1, 2, 3, . . . ,
(5) ∀x ∈ N : ΦnT x 6∈ N n = 1, 2, 3, . . . ;
(6) ΦnT N ∩ N = ∅ n = 1, 2, 3, . . . .
sono tutti tra loro disgiunti. Prima ricordiamo che la proprietà che Φt : ΩE0 ,E1 → ΩE0 ,E1
sia un diffeomorfismo ∀t ∈ R si traduce per ΦnT nella seguente affermazione:
ΦnT x = ΦnT y ⇐⇒ x = y, ∀n ∈ N,
203
Supponiamo, per assurdo, che x ∈ ΦmT N ∩ ΦnT N 6= ∅ con 1 ≤ m < n; allora
∃! y ∈ N : ΦmT y = x e
∃! z ∈ N : ΦnT z = x dunque
Osservazione. Questo teorema crea profondi problemi nella costruzione statistico termodi-
namica dei sistemi a molte particelle. Un gas in un serbatoio è in effetti un sistema di
molte particelle (una ‘mole’: circa 1023 particelle) interagenti con interazioni che soddisfa-
no azione-e-reazione e che dipendono dalla sola mutua distanza (e dunque conservative),
inoltre le pareti del serbatoio possono essere modellizzate da un’ulteriore energia potenziale
con grafico ‘molto ripido’: il sistema è Hamiltoniano e l’Hamiltoniana è propria. Dunque,
il sistema è quasi-periodico, come si spiega allora il comportamento termodinamico della
‘termalizzazione’, della tendenza all’equilibrio termodinamico?
204
Capitolo 12
Dato che abbiamo richiesto det f 0 6= 0, se la sucessione converge, essa convergerà sicura-
mente ad uno zero di f . Se si prova ad abbozzare un disegno per questo procedimento
nel caso 1−dimensionale, appare subito ben chiaro perché questo metodo si dica pure delle
tangenti.
Discutiamo qualche dettaglio sulla convergenza. Più in generale, si veda per esempio
N. S. Bachvalov: Metodi Numerici, Editori Riuniti, pag. 405. Mettiamoci pure nel caso
205
1−dimensionale, m = 1: delle cose che diremo la generalizzazione al caso m−dimensionale
sarà pura routine tecnica. Definiamo
È chiaro che x∗ è uno zero per f se e solo se x∗ è un punto fisso di Φ(x). Si tratta dunque di
ricondurci al lemma del contrazioni (vedi De Marco: Analisi Due/1, pag.153). Supponiamo
che per un certo intervallo reale I ⊂ R valga
Φ(I) ⊂ I, (a1 )
Queste condizioni ci garantiscono che in I esiste uno ed un unico punto fisso per Φ. È
facile vedere come la condizione (a2 ) si scrive in termini di f e delle sue derivate prima e
seconda:
f 00 f
sup |Φ0 (x)| = sup | 02 (x)| < 1.
x∈I x∈I f
|f (xn+1 )| ≤ M |xn+1 − xn |2 ,
206
Allora, posto ε := C|x1 − x0 |, e supposto ε < 1 (se non lo fosse, basta aspettare qualche
passo e cominciar a numerare da lı́), si ha
Fin qui abbiamo discusso intorno all’uso diretto, naturale, del metodo di Newton. Da-
remo nel seguito una interessante interpretazione “dinamica” di tale metodo, con risultati
(ormai classici) in un certo senso sorprendenti.
207
approssima la soluzione del problema di Cauchy sopra scritto. Le traiettorie (il supporto
delle soluzioni) di ẋ = X(x) sono tutte e sole quelle di ẋ = αX(x), α > 0. Se siamo dunque
interessati solamente alle traiettorie, potremo considerare la seguente versione discreta (con
h = 1) del sistema dinamico soprascritto:
Torniamo ora alla successione di Newton. Ragioniamo in senso inverso a quanto ora
fatto. Data una funzione f : Rm −→ Rm , det f 0 6= 0, della quale abbiamo scritto la
successione di Newton, individuiamo facilmente il campo vettoriale X : Rm −→ Rm di cui
la successione ne è la riduzione discreta: XNEWTON (x) := −[f 0 (x)]−1 f (x). L’equazione
differenziale associata si scrive:
208
12.3 Coniugazione del campo vettoriale di Newton
Propedeuticamente alle Trasformazioni Canoniche, l’argomento delle coniugazioni qui bre-
vemente rchiamato, è trattato in maggior dettaglio.
Si consideri un’equazione differenziale in Rm con campo vettoriale
ẋ(t) = X(x(t)).
Il diffeomorfismo
Rm −→ Rm
(x) 7→ y(x)
si dice che coniuga l’equazione differenziale di cui sopra nell’equazione
ẏ(t) = Y (y(t))
È quindi facile ora vedere che la funzione x 7→ f (x), diffeomorfismo locale attorno a x∗ ,
coniuga il campo vettoriale di Newton XNEWTON nel campo Y (y) = −y:
Y (y) = {f 0 (x)XNEWTON (x)}|x=f −1 (y) = −{f 0 (x)[f 0 (x)]−1 f (x)}|x=f −1 (y) = −y.
(Se nel precedente paragrafo avessimo tenuto il passo h diverso da 1, ora il campo vettoriale
coniugato sarebbe: Y (y) = −hy, h > 0.)
209
Teorema Sia Ω il bacino di attrazione di x∗ per il campo vettoriale
Allora f |Ω è iniettiva.
Prova. Dire che Ω è il bacino di attrazione di x∗ per −[f 0 (x)]−1 f (x) significa che, per
ogni x0 ∈ Ω, limt→+∞ x(t, x0 ) = x∗ , ove naturalmente x(t, x0 ) è il flusso, la soluzione di
ẋ = −[f 0 (x)]−1 f (x), con x(0, x0 ) = (x0 ). La continuità del flusso implica che Ω è aperto.
Consideriamo ora due arbitrari distinti punti x1 e x2 di Ω. Mostriamo che f (x1 ) 6= f (x2 ).
Abbiamo che
lim x(t, x1 ) = x∗ , lim x(t, x2 ) = x∗ .
t→+∞ t→+∞
Inoltre, per i = 1, 2,
d
f (x(t, xi )) = f 0 (x(t, xi )){−[f 0 (x(t, xi ))]−1 f (x(t, xi ))} = −f (x(t, xi )),
dt
onde:
f (x(t, xi )) = e−t f (xi ).
Ora per un tempo t̄ sufficentemente grande x(t, xi )), i = 1, 2, sono entrambi in un
(“piccolo”) aperto I (in Rm ) di x∗ relativo al diffeomorfismo locale indotto dal teorema
della funzione inversa, usando semplicemente det f 0 (x∗ ) 6= 0. Il teorema di esistenza e
unicità ci dice che da x1 6= x2 segue che x(t̄, x1 ) 6= x(t̄, x2 ). Il teorema locale della
funzione inversa in I ci dice inoltre che
Dunque, l’evoluzione dinamica sopra scritta per f lungo le due soluzioni ci mostra che
e−t̄ f (x1 ) 6= e−t̄ f (x2 ) ed infine quindi
f (x1 ) 6= f (x2 ).
210
Capitolo 13
v1 ∧ v2 · v3 = v2 ∧ v3 · v1 = v3 ∧ v1 · v2 (1)
211
Introduciamo i seguenti concetti.
Retta d’applicazione di (P, v) è la retta per P diretta come v.
Momento (polare) di (P, v) rispetto al punto (polo) O è il vettore libero mO = OP ∧ v.
Se ora variamo il polo
mA = AP ∧ v = (AO + OP ) ∧ v = AO ∧ v + mO
mA · u = mO · u + AO ∧ v · u = mO · u.
Ha allora senso parlare di mr := mO · u come momento (assiale) di (P, v) rispetto alla retta
orientata r (u è il versore di r e O ∈ r).
Consideriamo un insieme (o sistema)PS di n vettori applicati (Pi , vi ), i = 1, ..., n. Si
n
dice loro risultante il vettore libero R = Pi=1 vi . Si dice momento (polare risultante) di S
rispetto al polo O il vettore libero MO = ni=1 OPi ∧ vi .
Se variamo il polo
n
X n
X
MA = APi ∧ vi = (AO + OPi ) ∧ vi ,
i=1 i=1
MA = MO + AO ∧ R. (3)
MO non dipende da O se e solo se R = 0. Vediamo anche che MO · R non dipende da O:
tale quantità è detta trinomio invariante. Abbiamo cosi’ MO = µ + NO con µ parallelo ad
R ed indipendente da O e NO ortogonale ad R.
La quantità
Xn X n
Mr = mir = OPi ∧ vi · u = MO · u,
i=1 i=1
indipendente dalla scelta del punto O sulla retta r di versore u, è detta momento (assiale
risultante) del sistema S) rispetto alla retta orientata r.
212
definita sull’asse reale, ci dà la retta luogo dei punti rispetto ai quali si ha momento uguale
a µ (e quindi momento di minimo modulo). Tale retta si dice asse centrale del sistema di
vettori applicati (a risultante diversa da zero).
Consideriamo ora il caso particolare in cui µ = 0. Per la (3) con A ∈ a –asse centrale–,
si ha
0 = µ = MA = MO + AO ∧ R, MO = OA ∧ R.
Da ciò vediamo che se R 6= 0 e µ = 0 allora il solo vettore risultante applicato in un punto
qualsiasi dell’asse centrale equivale (ai fini del calcolo del risultante e del momento) al
sistema di partenza, cioè ha uguale risultante e uguale momento rispetto ad un qualunque
polo. In tal caso si usa dire (con abuso di linguaggio) che “il risultante ammette retta
d’applicazione”. Notiamo che solo sull’asse centrale vale la suddetta proprietà (verificarlo)
e che per un sistema a risultante R 6= 0 la condizione µ = 0 è non solo sufficiente ma anche
necessaria perché il risultante ammetta retta di applicazione (verificarlo).
Casi particolari della situazione R 6= 0 e µ = 0 si hanno quando (i) R 6= 0 e i vettori
sono complanari, (ii) R 6= 0 e le rette di applicazione dei vettori sono concorrenti in un
punto. Un altro caso è il seguente.
Xn n
X n
X
R=( ai )k, MO = OPi ∧ vi = ai OPi ∧ k,
i=1 i=1 i=1
Xn n
X
MO · R = ( ai OPi ) ∧ k · ( ai )k = 0.
i=1 i=1
213
Pn
a OP
i=1 i i
Il punto C dato da OC = P n si dice centro del sistema di vettori paralleli a
i=1 ai
R 6= 0 e gode della proprietà di appartenere all’asse centrale qualunque sia il versore k.
214
13.2 Richiami sulle trasformazioni lineari
Sia V spazio vettoriale di dimensione n. Ove necessario, distingueremo il vettore u di V
dall’n-upla u delle sue componenti rispetto ad una base data di V . Vale allora
Proposizione 13.2.1 Siano e∗i , ei due basi di V , dette rispettivamente base fissa e base
mobile. Allora esiste unica un’applicazione lineare A ∈ End(V ) tale che
ei = Ae∗i , i = 1, . . . , n. (1)
Nel seguito supporremo sempre che e∗i e ei siano basi ortonormali, ovvero ei ·ej = e∗i ·e∗j = δij ;
sia
Aij = e∗i · ej = e∗i · Ae∗j
la matrice le cui colonne sono le componenti dei vettori ei nella base e∗i . Sia AT la trasposta
di A. Vale allora
Proposizione 13.2.2 Se u ha componenti u∗ = (u∗1 , . . . , u∗n ) nella base fissa, allora
i) le componenti di u nella base mobile ei sono
u = AT u∗ ,
ii) le componenti del vettore trasformato v = Au nella base fissa e∗i sono
v ∗ = Au∗ .
dimostriamo ii)
X X X
vi∗ = Au · e∗i = A( u∗j e∗j ) · e∗i = u∗j Ae∗j · e∗i = Aij u∗j = (Au∗ )i .
j j j
dimostraimo iii)
n
X n
X n
X
T
(A A)ij = T
(A )ik Akj = Aki Akj = (e∗k · ei )(e∗k · ej ) = ei · ej = δij .
k=1 k=1 k=1
215
13.3 Cinematica rigida
13.3.1 Velocità angolare
Ci specializziamo ora al caso dello spazio euclideo tridimensionale. Indichiamo con E3 lo
spazio vettoriale tridimensionale dotato di un prodotto scalare definito positivo. Sia (O, e∗i ),
i = 1, 2, 3, base ortonormale di E3 , detta terna fissa. Data un’altra base ortonormale (O, ei )
di E3 , detta terna mobile,
indichiamo con R(t) la matrice delle componenti dei versori ei (t) rispetto a e∗i :
RT R = I
u(t) = ui ei (t) = ui RTij e∗j = (Rji ui )e∗j = u∗j e∗j : u∗j (t) = Rji (t)ui , u∗ (t) = R(t)u,
u̇ = u̇∗i (t)e∗i , u̇∗ (t) = Ṙ(t)u = ṘR−1 u∗ (t) = ṘRT u∗ (t) (2)
216
Derivando la relazione RRT = RT R = I rispetto al tempo, ad esempio
Ωf = ṘRT , Ωm = RT Ṙ
sono antisimmetriche: ΩT = −Ω. Le relazioni (2) e (3) permettono di esprimere, nella base
fissa o nella base mobile, le componenti del vettore velocità (ovviamente velocità rispetto
alla base fissa) di un vettore solidale alla base mobile
(u̇)∗ = Ωf u∗ , u̇ = Ωm u.
Ωf = R Ωm RT .
Av = ω ∧ v, ∀ v ∈ E3 :
Dimostrazione. L’operatore
ω(v) := ω ∧ v
è lineare e antisimmetrico poichè la matrice Ωij ad esso associata è antisimmetrica:
ω ∗ ∧ u = Ωf u, ω ∧ u = Ωm u ∀ u ∈ E3
è detto rappresentazione della velocità angolare del moto t 7→ R(t) nella terna fissa (risp.
terna mobile): X X
ω= ωi∗ e∗i = ωi e i .
i i
217
Si osservi che ω è vettore libero, cioè non è definito il suo punto di applicazione; la di-
stinzione tra la rappresentazione della velocità angolare del moto nella terna fissa (velocità
angolare nello spazio) e nella terna mobile (velocità angolare nel corpo) può offrire ulteriori
indicazioni nella teoria del corpo rigido, si veda p.e. la trattazione di V. Arnol’d in “Metodi
matematici della meccanica classica”.
Nel seguito si indicherà semplicemente con Ω la matrice Ωm .
Formule di Poisson
Dalla (3) per v = ei si hanno subito le Formule di Poisson:
ėi = Ωei = ω ∧ ei , i = 1, 2, 3.
sommando su i
3
X 3
X
ei ∧ ėi = 3ω − (ei · ω)ei = 2ω
i=1 i=1
si ha
3
1X
ω= ei ∧ ėi .
2
i=1
Esempio 1 (Rotazioni piane). Supponiamo che nel moto della terna (O, ei ) rispetto a
(O, e∗i ) risulti e∗3 ≡ e3 per ogni t. Allora, detto ϑ = ϑ(t) l’angolo tra e∗1 ed e1 (t), valutato
in senso antiorario, la matrice R ∈ SO(3) è data da
cos ϑ − sin ϑ 0
R(ϑ) = sin ϑ cos ϑ 0 .
0 0 1
218
Moti Rigidi
Sia S un sistema di n punti materiali. Il moto di S è descritto, rispetto ad una terna
(O∗ , e∗l ) di E3 dalle n funzioni t 7→ O∗ Pi (t) a valori in R3 ; O∗ Pi è detto vettore posizione
del punto Pi .
Definizione 13.3.1 Il moto di S è rigido se la distanza tra ogni coppia di punti di S non
varia nel tempo.
Se in S, sistema in moto rigido, è possibile individuare almeno tre punti non allineati, è
anche possibile associare ad S una terna (O, el ) solidale ad S, nel senso che le componenti
dei vettori posizione rispetto alla terna solidale OPi sono costanti nella terna solidale.
Risulta allora, per i, j = 1, . . . n
3
X
Pi Pj = O ∗ Pj − O ∗ Pi = uk ek .
k=1
Possiamo ora applicare le formule precedenti che esprimono la derivata temporale dei vettori
solidali ottenendo
d d d
u̇ = Pi Pj = O∗ Pj − O∗ Pi = vj − vi = ω ∧ u = ω ∧ Pi Pj
dt dt dt
ove ora le vi , vj hanno il significato di velocità dei punti Pi rispetto alla terna (O∗ , e∗l ) e
ω è la velocità angolare del moto di (O, el ) rispetto a (O∗ , e∗l ). La relazione precedente è
nota come Formula fondamentale dei moti rigidi :
(4) vj = vi + ω ∧ Pi Pj , i, j = 1, . . . n
ove tutte le quantità che vi compaiono sono espresse nel riferimento (O, el ). Scambiando il
ruolo delle due terne si deduce subito che la forma della (4) è indipendente dal riferimento.
Atti di moto
Consideriamo, ad esempio, in un istante t fissato, l’insieme dei vettori velocità degli (infiniti)
punti OP della terna (O, ei ) solidale ad un sistema S in moto rigido. Tale distribuzione
di vettori applicati OP 7→ (OP, vP ), che possiamo anche pensare come assegnata, e quindi
svincolata dal moto di un certo sistema S, è detta Atto di Moto.
L’atto di moto A è detto rigido se esiste ω tale che vale la formula fondamentale dei
moti rigidi
vP = vQ + ω ∧ QP, ∀P, Q
I seguenti sono casi particolari di Atti di Moto rigido:
• elicoidale, se esiste una retta r i cui punti hanno velocità parallela alla retta,
219
• rotatorio, se esiste un punto Q tale che vQ = 0 (e allora vP = ω ∧ QP ),
τ + vP⊥ = τ + vQ
⊥
+ ω ∧ QP ⇒ vP⊥ = vQ
⊥
+ ω ∧ QP
Supponiamo esista un punto Q tale che vQ ⊥ = 0. La relazione appena trovata dice che tutti
i punti P della retta per Q e parallela ad ω hanno vP⊥ = 0 + ω ∧ QP = 0, ovvero che esiste
una retta r i cui punti hanno velocità, uguale a τ in questo caso, parallela alla retta, quindi
l’Atto di Moto rigido è elicoidale.
Cerchiamo Q. Esso è individuato dal vettore OQ soddisfacente alla condizione
⊥ ⊥ ⊥
0 = vQ = vO + ω ∧ OQ, i.e. vO = ω ∧ QO
⊥ , ω dati. Tale problema è già stato risolto nel Cap. Vettori Applicati delle
con ω 6= 0 e vO
Dispense. Si ha OQ = (ω ∧ vO )/ω 2 . L’equazione dell’asse istantaneo di rotazione (retta r)
è quindi
ω ∧ vO ω · vP
λ 7→ OQ + λτ = + λ 2 ω,
ω2 ω
luogo di punti aventi velocità minima (pari a τ ).
Osservazioni.
1. Sia A Atto di Moto rigido piano. Siano P 0 ,Q0 le proiezioni di P, Q su π. Da
vP 0 = vQ0 + ω ∧ P 0 Q0 , essendo P 0 Q0 ∈ π, vP 0 − vQ0 ∈ π, si ha che ω ⊥ π. L’asse istantaneo
di rotazione incontra π in un punto Q∗ detto centro istantaneo di rotazione.
2. Verificare che se A è (rigido) rotatorio si ha τ = 0, se A è (rigido) traslatorio risulta
ω = 0.
220
Un disco omogeneo D di raggio R e centro G rotola sull’asse per e∗1 di un riferimento
(O∗ , e∗1 , e∗2 , e∗3 )
mantenendosi nel piano (e∗1 , e∗2 ). Il disco (sistema rigido) definisce il moto
(rigido piano) di una terna (G, e1 , e2 , e3 ) solidale al disco.
Il moto del disco è di puro rotolamento se la velocità del punto c ∈ D che all’istante
t coincide con il punto di contatto C ∗ tra il disco e la guida è nulla per ogni t. Questo
equivale a dire che l’atto di moto (rigido piano) definito dal moto della terna solidale è
rotatorio attorno al punto C ∗ , centro istantaneo di rotazione. Abbiamo visto (Esercizio
1) che la velocità angolare associata al moto piano della terna solidale è ω = ϑ̇e3 = ϑ̇e∗3 .
Usando la formula fondamentale dei moti rigidi, ricaviamo la velocità del centro G del disco
parallela ad e∗1 . Di solito l’angolo tra e∗1 e e1 è valutato in senso orario, pe cui vG = Rϑe∗1 .
Integrando quest’ultima relazione si ottiene lo spazio percorso dal centro G lungo la guida
Tale relazione e la sua derivazione rispetto al tempo si basano su di un’ipotesi che suppor-
remo sempre verificata
Postulato (in Meccanica Classica) Lunghezze dei vettori ed intervalli di tempo sono
indipendenti dall’osservatore.
Derivando la (1) rispetto a t
221
e ricordando le formule di Poisson ėi = ω ∧ ei , ricaviamo la relazione (Formula di Galileo)
tra la velocità assoluta v a e relativa v r = ẋi ei
ove
vPτ = vO
a
+ ω τ ∧ OP
è detta velocità di trascinamento. Essa è la velocità del punto P 0 sovrapposto a P e solidale
al moto di T r .
Deriviamo la (2) per ottenere la relazione tra le accelerazioni, usando ancora le formule
di Poisson
d r
v = arP + ω τ ∧ vPr
dt P
d τ d a
v = (vO + ω τ ∧ OP ) = aaO + ω̇ τ ∧ OP + ω τ ∧ (vPr + ω τ ∧ OP )
dt P dt
Pertanto
d
aaP = vPa = aaO + ω̇ τ ∧ OP + 2ω τ ∧ vPr + ω τ ∧ (ω τ ∧ OP )
dt
che si compendia nella Formula di Coriolis
ω τ = ωi∗ e∗i = ωi ei ,
222
Dimostrazione. Applichiamo la formula di Galileo al moto di Pi , Pj
ωa = ωτ + ωr .
223
224
Capitolo 14
Derivata di determinante
i cui elementi aij sono i valori assunti dalle N 2 funzioni aij = ãij (λ) di R in R. Sia
J = det(aij ) . Com’è noto J = N
P
j=1 Aij aij (“sviluppo del determinante rispetto alla i-
esima riga”), dove Aij sono i complementi algebrici relativi agli elementi aij ; valgono pure
le relazioni:
N
X N
X
(1) J= Aih aih = Akj akj ∀i, j = 1, . . . , N.
h=1 k=1
N
(
X J se i = j
(2) Aih ajh =
h=1
0 se i 6= j ,
N
X
(3) Jδij = Aih ajh .
h=1
225
Calcoliamo la derivata di J pensato come funzione di R in R tramite le N 2 ãij (λ) :
˘
J(λ) = J (ã11 (λ), . . . , ãij (λ), . . . , ãN N (λ)).
N
d ˘ X ∂J d
(4) J(λ) = (. . . , ãhk (λ), . . . ) ãhk (λ).
dλ ∂aij dλ
i,j=1
∂J
Restano da esprimere le derivate parziali ∂aij .
A tale scopo sviluppiamo J rispetto alla
i-esima riga (oppure rispetto alla j-esima colonna, è lo stesso): J = N
P
h=1 Aih aih ; dato
che, per i fissato e per h = 1, . . . , N, Aih non dipendono da aij , si ottiene subito:
∂J
(5) = Aij .
∂aij
226
Capitolo 15
Test
• Cosa dobbiamo prima di tutto elencare, assegnare, prima di definire i moti dinamicamente
possibili per un sistema vincolato?
• Quali sono i moti dinamicamente possibili?
• Cosa sono le reazioni vincolari?
• Cos’è un vincolo olonomo?
• Cosa sono le coordinate libere o Lagrangiane per un vincolo olonomo?
• Cos’è la dimensione di un sistema olonomo?
• In cosa consiste il metodo del Moltiplicatori di Lagrange per la determinazione dei moti
e delle reazioni vincolari?
• Un moto rigido si può pensare come all’assegnazione del moto dell’origine di una terna
mobile t 7→ OΩ(t) e all’assegnazione del moto della terna di versori ortonormale associata,
t 7→ e∗i (t), i = 1, 2, 3. Con questi oggetti, scrivere chi è il moto della matrice ortogonale
associata: t 7→ R(t) e la correlata velocità angolare t 7→ ω(t).
• Cosa sono i vincoli lisci o ideali? in cosa differiscono dai vincoli “privi d’attrito”?
• Il disco che rotola senza strisciare è un vincolo anolonomo però integrabile, cosa significa?
• Perché il disco che rotola senza strisciare è un sistema a vincoli lisci?
• Teorema di Conservazione dell’Energia: Enunciato e dimostrazione.
• Teorema di Lagrange-Dirichlet: Enunciato e dimostrazione.
• Principio di D’Alembert: Enunciato e dimostrazione.
• La restrizione di sistemi conservativi su vincoli olonomi è conservativa: mostrarlo in
dettaglio.
• Deduzione delle equazioni di Lagrange.
• Perché la ‘matrice cinetica’ è definita positiva?
227
• Linearizzazione delle equazioni di Lagrange attorno a equilibri stabili: che ipotesi di
lavoro si fanno? affinché si ottengano delle frequenze di “piccola oscillazione” non banali
(6= 0), che ipotesi si deve proporre? come si calcolano le frequenze di “piccola oscillazione”?
• Dare un esempio di stabilizzazione giroscopica e mostrare la sua fragilità qualora si
introducano delle forze viscose.
• Dimostrare il Teorema dell’Hessiano Non Degenere nel caso 1-dimensionale, più precisa-
mente, ricondurlo al primo e secondo metodo di Lyapunov.
• Deduzione delle equazioni di evoluzione del corpo rigido dal Pr. di D’Alembert.
• Equilibri e stabilità delle equazioni di Euler per il c. rigido scarico (cioè, con momento
baricentrale delle forze nullo).
• Descrizione alla Poinsot del corpo rigido scarico.
• Mostrare che i moti del c. rigido con ellissoide a simmetria assiale sono delle precessioni
regolari.
teorema di Nöther?
• Enunciare e dimostrare il principio-teorema variazionale di Hamilton.
• Solamente i sistemi meccanici olonomi conservativi si possono porre in forma variazionale?
e se esistesse pure una forza del tipo viscoso −k q̇?
• Enunciare e dimostrare il teorema di Nöther.
• Enunciare e dimostrare il teorema di Routh.
• Che relazioni intercorrono tra i moti spontanei di una particella di massa m senza for-
ze attive vincolata senza attrito su di una superficie e le geodetiche (curve di lunghezza
stazionaria) sulla stessa superficie?
• Geodetiche sulle superfici di rotazione (cioè, a simmetria assiale), teorema di Clairaut
(vedi p.e. Arnol’d, Metodi matematici della meccanica classica, p. 87).
• Brachistocrona (vedi p.e. De Marco, Analisi Due/2, vecchia edizione).
• Bolle di sapone: superfici di rotazione di area minima (estremale) tra due circonferenze
di ugual raggio R e poste coassialmente a distanza 2`.
• Cosa sono le trasformazioni canoniche? E’ vero che sono un sottogruppo proprio del
gruppo dei diffeomorfismi di T ∗ S in sè (detti coniugazioni)? spiegare in dettaglio.
• Le trasformazioni puntuali (diffeomorfismo locali dei cambi di carta nella varietà vincolare
base S) q̃ = q̃(q) inducono delle trasformazioni canoniche in T ∗ S?
• In cosa consiste la condizione algebrica caratterizzante le tr. canoniche? come ci si arriva?
228
• (...) Condizione di Lie e condizione algebrica caratterizzante le tr. canoniche. Trasfor-
mazioni F1 e F2 .
• (...) Metodo di integrazione di Hamilton-Jacobi. Dettagli del caso separabile: H(q, p) =
∂fi
G(f1 (q1 , p1 ), f2 (q2 , p2 ), ..., fN (qN , pN )) con l’ipotesi ∂p i
6= 0.
•(...) Metodo di integrazione di Hamilton-Jacobi. Dettagli del caso di n − 1 variabili
∂H
cicliche: H(q, p) = H(q1 , p1 , . . . , pn ) con l’ipotesi ∂p 1
6= 0.
• Descrizione del problema dei due corpi nel sistema della massa ridotta. Mettere in
evidenza l’uso degli integrali primi.
• Per il problema di Kepler (cioè nel sistema della massa ridotta) le orbite sono tutte e
sole delle (sezioni) coniche. Mostrare in dettaglio.
• Uso del teorema di Routh nel problema di Kepler.
229