Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Calcolo Differ RN 2
Calcolo Differ RN 2
Calcolo Differ RN 2
(6 maggio 2024)
LIBOR VESELY
Indice
1. Spazi euclidei 2
1.1. Norma euclidea, prodotto scalare 2
1.2. Altre norme su Rn 3
1.3. Applicazioni lineari tra spazi euclidei 6
2. Ripasso: limiti e funzioni continue 7
2.1. Il punto all’infinito. 9
2.2. Sull’uso delle coordinate polari nel calcolo di limiti 9
3. Derivate direzionali, derivate parziali, vettore gradiente 10
4. Differenziabilità 12
4.1. Differenziabilità di funzioni scalari 13
4.2. Differenziabilità di funzioni vettoriali 17
4.3. Differenziabilità di funzioni composte 18
4.4. Cenni ai diffeomorfismi 20
4.5. Stime dell’incremento e applicazioni 21
4.6. Un approfondimento (per gli studenti interessati) 26
5. Derivate parziali seconde, la matrice Hessiana 28
6. Derivate di ordine superiore, le classi C k e C ∞ 30
7. Sviluppi di Taylor 31
7.1. Differenziabilità di ordine successivo 31
7.2. Sviluppi con il resto secondo Lagrange 32
7.3. Sviluppi con il resto secondo Peano 34
7.4. Unicità dello sviluppo 36
8. Ottimizzazione libera 37
8.1. Punti stazionari, estremanti, punti di sella 37
8.2. Applicazioni della compattezza 38
8.3. Forme quadratiche e matrici simmetriche – cenni 40
8.4. Condizioni sufficienti per estremanti 43
1
2 LIBOR VESELY
1. Spazi euclidei
Sia n ≥ 1 un numero intero. Lo spazio euclideo (reale) di dimensione n è il
prodotto cartesiano
Rn := R
| × ·{z
· · × R}
n volte
di cui gli elementi (chiamati punti o vettori) sono le n-uple ordinate
x = (x1 , . . . , xn )
di numeri reali.
Bisogna tener presente che, nelle varie formule algebriche (coinvolgenti matrici), gli
elementi di Rn vanno considerati come dei vettori colonna
x1
..
x = . .
xn
Un approfondimento.
A proposito delle disuguaglianze (1), in realtà vale il semplice ma importante
teorema generale, Teorema 1.5. Prima di enunciarlo introduciamo la nozione di
equivalenza di due norme. Diciamo che due norme | · | e ||| · ||| su uno spazio vettoriale
V sono equivalenti se esistono due costanti α, β > 0 tali che
α|x| ≤ |||x||| ≤ β|x| per ogni x ∈ V .
È facile vedere che se due norme sono equivalenti, allora le corrispondenti metriche
generano gli stessi insiemi aperti/chiusi e quindi anche le stesse successioni conver-
genti e di Cauchy. Quindi dal punto di vista dei limiti, di continuità e simili (le
cosiddette proprietà topologiche), è indifferente quale delle due norme utilizziamo.
Si vede facilmente che l’equivalenza di norme è davvero una relazione di equivalenza
sull’insieme di tutte le norme su V (cioè, è una relazione riflessiva, simmetrica e
transitiva). Dalla (1) quindi segue che le le norme ∥ · ∥1 , ∥ · ∥2 e ∥ · ∥∞ su Rn sono
tra loro equivalenti. Ecco il teorema generale promesso.
Commento 1.6. In realtà, è noto il seguente risultato ancora più generale. Sia V uno
spazio vettoriale (reale o complesso). Se V ha dimensione finita, allora tutte le norme su V
sono tra loro equivalenti. Se invece V ha dimensione infinita, esistono su V due norme non
equivalenti tra loro.
Lo studente motivato può provare a dedurre il risultato generale finito-dimensionale dal
Teorema 1.5.
• Lo spazio C[a, b] delle funzioni continue su un intervallo [a, b], con una delle
norme
Z b Z b 1/2
2
∥f ∥1 := |f (x)| dx , ∥f ∥2 := [f (x)] dx .
a a
(Lo studente motivato può provare a dimostrare che queste due norme non
sono tra loro equivalenti.)
• Lo
P spazio vettoriale ℓ2 delle successioni di numeri reali (xk )k tali che la serie
(x )2 converga, con la norma
k k
+∞
!1/2
X
(xk )k = (xk )2 .
k=1
Osservazione 1.9. È utile osservare che, per ogni norma ||| · ||| su Rn , le seguenti
affermazioni sono equivalenti:
(i) xk → x in (Rn , ||| · |||);
(ii) xk − x → 0 in (Rn , ||| · |||);
(iii) |||xk − x||| → 0;
6 LIBOR VESELY
k
(iv) ∀i = 1, . . . , n (fissato), (xk )i −→ xi (in R) (cioè, i vettori xk convergono al
vettore x per coordinate).
Dimostrazione. Le equivalenze (i) ⇔ (ii) ⇔ (iii) sono ovvie. Grazie al Teorema 1.5,
la norma ||| · ||| è equivalente alla norma euclidea ∥ · ∥, perciò è sufficiente [perché?]
dimostrare il caso euclideo. L’implicazione (iv) ⇒ (iii) segue dalle proprietà generali
dei limiti. Per vedere l’implicazione (iii) ⇒ (iv), fissiamo 1 ≤ i ≤ n e osserviamo
che |(xk )i − xi | ≤ ∥xk − x∥∞ ≤ ∥xk − x∥ → 0. □
Lemma 1.10. Data una matrice L = (ai,j ) del tipo m × n (ovvero un’applicazione
lineare L : Rn → Rm ), sia
1/2
m X
X n
∥L∥2 := a2i,j ,
i=1 j=1
cioè, la norma euclidea della matrice L vista come un elemento di Rmn . Allora
(3) ∥Lx∥ ≤ ∥L∥2 ∥x∥ per ogni x ∈ Rn .
Dimostrate che f è continua per rette nell’origine (cioè, per ogni versore (u, v) ∈ R2
la funzione R ∋ t 7→ f (tu, tv) è continua in 0), ma f non è continua in (0, 0) e
addirittura non ammete limite per (x, y) → (0, 0) (a tal fine, considerate il limite
lungo uno degli assi e lungo la parabola y = x2 ).
sin x
p
Infatti, sin x = |x|·ω(x, y) dove ω(x, y) := √ per x ̸= 0, e ω(0, y) := 0, e inoltre,
|x|
lim(x,y)→(0,0) ω(x, y) = 0 [perché?].
Analogamente, mentre log(1 + t) ∼ t per t → 0, la scrittura “ log(1 + x + y) ∼ x + y
per (x, y) → (0, 0) ” è problematica. Possiamo, però, scrivere:
log(1 + x + y) = (x + y)(1 + o(1)) per (x, y) → (0, 0).
∗Notiamo che il simbolo o(1) denota semplicemente qualche quantità che tende a zero.
CALCOLO DIFFERENZIALE IN PIÙ VARIABILI 9
2.1. Il punto all’infinito. A volte vengono utilizzati anche dei limiti nel “punto
all’infinito” che è un punto aggiunto a Rn , e denotato con ∞, tale che d(x, ∞) = +∞
per ogni x ∈ Rn . Gli intorni (più precisamente, una base degli intorni) di ∞ sono
definiti come gli insiemi
Br (∞) := Rn \ Br (0) = {x ∈ Rn : ∥x∥ > r} con r > 0.
In questo modo,
lim f (x) = ℓ ∈ R
x→∞
significa che
∀ε > 0, ∃r > 0, ∥x∥ > r ⇒ |f (x) − ℓ| < ε ,
2.2. Sull’uso delle coordinate polari nel calcolo di limiti. Come già saprete,
ogni punto (x, y) ∈ Rn tale che (x, y) ̸= (0, 0) è univocamente determinato dalle sue
cosiddette coordinate polari (ρ, θ). Geometricamente, ρ > 0 è la distanza del punto
(x, y) dall’origine, mentre θ ∈ R è l’angolo orientato misurato in senso antiorario dal
semi-assep positivo delle x alla semiretta dall’origine passante per (x, y). In partico-
lare, ρ = x2 + y 2 . Inoltre, l’angolo θ ∈ R è unico soltanto a meno di multipli interi
di 2π. Per avere l’unicità di θ, dobbiamo limitarci a considerare gli angoli θ appar-
tenenti ad un intervallo semi-aperto di lunghezza 2π. Vi sono due scelte “standard”:
[0, 2π) oppure (−π, π].
Le coordinate polari sono date da:
(
x = ρ cos θ,
y = ρ sin θ.
def.
Nella teoria dei numeri complessi, x+iy = ρeiθ = ρ(cos θ +i sin θ) che sono la forma
esponenziale e trigonometrica del numero complesso x + iy ̸= 0.
10 LIBOR VESELY
Siccome la definizione di limite dipende solo dalle distanze (e non dalle direzioni),
nelle coordinate polari dobbiamo assicurarci che il limite di f (ρ cos θ, ρ sin θ) per
ρ → 0+ sia uniforme rispetto a θ. (Non è sufficiente che tale limite sia ℓ per ogni θ
fissato!)
Dal punto di vista pratico, dimostrare che vale (4), equivale a trovare una funzione
φ = φ(ρ) ≥ 0 tale che
|f (ρ cos θ, ρ sin θ) − ℓ| ≤ φ(ρ) → 0 per ρ → 0+ e ogni θ.
Analogamente, dimostrare che
(5) lim f (x, y) = ℓ ∈ R,
(x,y)→∞
Esempio 3.4. Sia f = f (x, y, z) una funzione a valori reali definita in un aperto
contenente il punto (x0 , y0 , z0 ). Allora
∂f f (x0 , y0 + t, z0 ) − f (x0 , y0 , z0 )
(x0 , y0 , z0 ) = lim
∂y t→0 t
f (x0 , y, z0 ) − f (x0 , y0 , z0 )
= lim
y→y0 y − y0
′
= f (x0 , ·, z0 ) (y0 ).
Quindi, derivare f rispetto a y significa “tenere fissi x, z (come se fossero dei para-
metri) e derivare la funzione di una sola variabile y”. Ad esempio, se
f (x, y, z) = xy 2 z 3 − log(1 + y 2 + x4 z 4 )
allora
2y
fy (x, y, z) = 2xyz 3 − .
1 + y 2 + x4 z 4
12 LIBOR VESELY
4. Differenziabilità
Perché le derivate direzionali non sono sufficienti per un soddisfacente calcolo dif-
ferenziale? Il loro svantaggio consiste nel descrivere il comportamento locale della
funzione lungo ogni singola retta passante per il punto, senza descrivere il “compor-
tamento globale” nel punto. Esistono esempi in cui la derivabilità direzionale di due
funzioni non implica la derivabilità direzionale della loro composizione.
Come motivazione per la definizione della differenziabilità, ricordiamo che una
funzione reale φ di una sola variabile reale (definita in un intorno di a ∈ R) è
derivabile nel punto a se e solo se esiste un numero reale λ (che sarà poi la derivata
φ′ (a)) tale che
(7) φ(a + h) − φ(a) = λh + o(h) per h → 0.
Ovvero, l’incremento φ(a + h) − φ(a) coincide con l’applicazione lineare
ℓ : R → R, ℓ(h) = λh,
a meno di un errore trascurabile rispetto ad h quando h → 0. E questa è una
formulazione di derivabilità che può essere generalizzata anche al caso di funzioni di
più variabili.
Corollario 4.5 (Significato del gradiente). Sia f una funzione (scalare) differenzia-
bile in a. Allora:
(a) ∥∇f (a)∥ è il massimo valore di una derivata direzionale nel punto a;
∇f (a)
(b) e, se ∇f (a) ̸= 0, tale valore viene assunto per il versore v̄ = ∥∇f (a)∥ .
14 LIBOR VESELY
In parole povere, il vettore gradiente nel punto a determina la direzione della massima
crescita di f e la sua norma è “la velocità di crescita” in tale direzione.
Ciò segue direttamente dal Teorema 4.4(c) e dalla Osservazione 1.3.
Esempio 4.6. Il seguente esempio mostra che le condizioni necessarie (a)-(c) del
Teorema 4.4 non sono sufficienti per la differenziabilità:
( 3
x y
x 4 +y 2 per (x, y) ̸= (0, 0);
f (x, y) =
0 per (x, y) = (0, 0).
Ricordando la disuguaglianza† |αβ|
α2 +β 2
≤ 21 , possiamo maggiorare‡
x2 |y| 1
|f (x, y)| = x4 +y 2
|x| ≤ 2 |x| → 0 per (x, y) → (0, 0),
e quindi f è continua nell’origine.
Sia ora (u, v) un qualsiasi versore. Allora
f (tu, tv) − f (0, 0) t4 u3 v tu3 v
D(u,v) f (0, 0) = lim = lim 4 4 = lim .
t→0 t t→0 (t u + t2 v 2 )t t→0 t2 u4 + v 2
Per dimostrare (12), scriviamo i punti u ∈ T nella forma (x, h(x)). Osserviamo che
(a, f (a)) = (a, h(a)) ∈ T e quindi: (x, h(x)) ̸= (a, f (a)) se e solo se x ̸= a; (x, h(x)) →
(a, f (a)) se e solo se x → a. Ora,
dist (x, h(x)), gr(f ) dist (x, h(x)), gr(f ) (x, h(x)) − (x, f (x))
0≤ ≤ ≤
(x, h(x)) − (a, f (a)) ∥x − a∥ ∥x − a∥
f (x) − h(x) f (x) − f (a) − ∇f (a) · (x − a)
= = →0 per x → a.
∥x − a∥ ∥x − a∥
Possiamo anche vedere l’iperpiano tangente al grafico di f nel punto (a, f (a))
(dove f è differenziabile in a) come l’iperpiano T ⊂ Rn × R composto dalle rette
tangenti al grafico delle restrizioni f |K nel punto (a, f (a)) al variare di tutte le rette
K ⊂ Rn passanti per il punto a. (Cioè, per ogni retta K contenente a, la retta
T ∩ (K × R) è la retta tangente al grafico di f |K nel punto di ascissa a.)
– – –
Dal punto di vista pratico, sarà importante conoscere delle condizioni sufficienti
per la differenziabilità di una funzione f in un punto a. Il Teorema del differen-
ziale totale (v. Corollario 4.9) afferma che se tutte le derivate parziali di f esistono
in un intorno di a e sono continue nel punto a, allora f è differenziabile in a.
§Ricordiamo che un iperpiano di uno spazio vettoriale V è un traslato di un sottospazio massimale
proprio di V , cioè, un traslato di un sottospazio di codimensione 1 in V . Ad esempio, ogni iperpiano
nello spazio euclideo Rd è della forma T = M + w dove M ⊂ Rd è un sottospazio di dimensione
d − 1 e w ∈ Rd .
16 LIBOR VESELY
Questo teorema seguirà direttamente dal seguente teorema più generale in cui è
sufficiente supporre che soltanto n − 1 delle n derivate parziali di f siano continue
in a (e la rimanente esista in a).
per un opportuno 0 < θu < 1. Infatti, nella prima parentesi quadra della seconda
riga abbiamo usato soltanto la definizione della derivata (cfr. il testo prima della
Definizione 4.1), mentre nella seconda abbiamo applicato, con u fissato, il teorema
di Lagrange alla funzione t 7→ f (a+u, t) sull’intervallo [b, b+v]. [Come mai funziona
anche per v < 0?] Di conseguenza,
(Infatti, |u·o(1)+v·o(1)|
∥(u,v)∥ ≤ |u| |v|
∥(u,v)∥ ·o(1)+ ∥(u,v)∥ ·o(1) ≤ o(1)+o(1) = o(1).) Ciò completa
la dimostrazione. □
¶In parole povere, il teorema dice: se tutte le derivate parziali, tranne eventualmente una, sono
definite in un intorno di a e continue in a e se la rimanente derivata parziale esiste in a, allora f è
differenziabile in a.
CALCOLO DIFFERENZIALE IN PIÙ VARIABILI 17
‖Carl Gustav Jacob Jacobi, 1804–1851, matematico tedesco. La pronuncia corretta del suo
cognome è [iacobi] (non alla inglese).
CALCOLO DIFFERENZIALE IN PIÙ VARIABILI 19
dove R(h) = ∥h∥ JG(F (b)) om (1) + JF (a) h + ∥h∥ om (1) op (1). Usando la di-
suguaglianza triangolare e Lemma 1.10, possiamo maggiorare il “resto” R come
segue:
∥R(h)∥ ≤ ∥h∥ · ∥JG(F (b))∥2 ∥om (1)∥ + ∥JF (a)∥2 ∥op (1)∥ + ∥om (1)∥∥op (1)∥
= ∥h∥ o(1).
Abbiamo quindi dimostrato che
(17) H(a + h) − H(a) = JG(F (a)) JF (a) h + o(∥h∥) per h → 0.
Di conseguenza, H è differenziabile in a e, per Teorema 4.10, la matrice
JG(F (a)) JF (a) coincide con la matrice jacobiana JH(a). □
20 LIBOR VESELY
(b) Nel caso particolare in cui A ⊂ Rn e B ⊂ Rm sono insiemi aperti, diciamo che
F è un diffeomorfismo se F e F −1 sono differenziabili rispettivamente in A e in
B.
Il corollario precedente quindi implica che se due aperti non vuoti in due spazi
euclidei sono diffeomorfi, allora i due spazi hanno la stessa dimensione. Inoltre, il
diffeomorfismo F : A → B soddisfa det JF (x) ̸= 0 per ogni x ∈ A.
Per gli interessati riportiamo qui due risultati noti. Il primo verrà dimostrato nei suc-
cessivi corsi di Analisi Matematica. Il secondo, semplicissimo da enunciare, è un teorema
molto profondo con una dimostrazione non banale.
Teorema 4.18. Siano A, B due insiemi aperti in due spazi euclidei e sia F : A → B
un’applicazione biunivoca.
1. Se F è di classe C 1 su A allora: F è un diffeomorfismo tra A e B se e solo se det JF (x) ̸=
0 per ogni x ∈ A. Inoltre, in tal caso anche F −1 è di classe C 1 su B e i due spazi euclidei
sono della stessa dimensione.
2. Se F è un omeomorfismo tra A e B, allora i due spazi euclidei sono della stessa dimen-
sione.
Dati due punti distinti a, b ∈ Rn definiamo il segmento dato dai punti a, b come
l’insieme
[a, b] := {a + t(b − a) : 0 ≤ t ≤ 1} = {(1 − t)a + tb : 0 ≤ t ≤ 1}.
Denotiamo invece con (a, b) il segmento [a, b] privato dei punti estremi a, b, cioè,
(a, b) := [a, b] \ {a, b} = {a + t(b − a) : 0 < t < 1}.
(Si noti che il massimo nella formula esiste per il teorema di Weierstrass.)
Esercizio 4.21. Dimostrate la seguente variante del teorema di Lagrange nella qua-
le supponiamo (al posto della differenziabilità) la sola derivabilità direzionale in
direzione della retta determinata dai punti a, b.
Supponiamo (18). Sia f : A → R tale che f sia continua su [a, b] e, ponendo v :=
b−a
∥b−a∥ , f sia derivabile lungo v in ogni punto di (a, b). Allora esiste x0 ∈ (a, b) tale
che
f (b) − f (a) = Dv f (x0 ) ∥b − a∥ .
(Suggerimento: considerate di nuovo la funzione φ definita nella dimostrazione del
Teorema 4.19.)
Esempio 4.22. Il teorema di Lagrange non vale per funzioni a valori vettoriali. Il
motivo è abbastanza semplice: anche se per ogni componente esiste un punto come
nel Teorema 4.19, non è detto che esista un tale punto che vada bene per tutte le
componenti contemporaneamente.
Ecco un semplice esempio. Sia
F : R → R2 , F (t) = (cos t, sin t).
F è di classe C1 differenziabile) dappertutto. Abbiamo F (2π) − F (0) =
(e quindi
(0, 0), ma F ′ (t) 2π − 0 = 2π(− sin t, cos t) ̸= (0, 0) per ogni t ∈ [0, 2π].
CALCOLO DIFFERENZIALE IN PIÙ VARIABILI 23
Per il teorema di Lagrange in una variabile, applicato alla funzione φ, esiste t0 ∈ (0, 1)
tale che
∥F (b) − F (a)∥ = F (b) − F (a) • w = φ(1) − φ(0) = φ′ (t0 ).
• A è detto un aperto connesso se esso non può essere scritto come unione
di due insiemi aperti disgiunti non vuoti. (Più formalmente, A è un aperto
connesso se vale l’implicazione: U, V aperti, A = U ∪ V , U ∩ V = ∅ ⇒
U = A o V = A.)
• A è detto connesso per poligonali se per ogni coppia di punti distinti a, b ∈ A
esistono un numero finito di punti x0 , x1 , . . . , xN (di A) tali che
x0 = a, xN = b e [xk−1 , xk ] ⊂ A per ogni k = 1, . . . , N .
(Cioè, esiste un percorso continuo da a a b, tutto contenuto in A e consistente
di un numero finito di segmenti.)
• A è detto conneso per curve se per ogni due punti distinti a, b ∈ A esistono
un intervallo [α, β] (con α < β) e una funzione continua γ : [α, β] → A (detta
curva) tale che γ(α) = a e γ(β) = b.
(Cioè, esiste un percorso continuo da a a b tutto contenuto in A.)
prolungata con il segmento [x, z], ottenendo una poligonale in A collegante a e z. Perciò
z ∈ U ma questa è una contraddizione. Abbiamo quindi mostrato che V è aperto. Essendo
A connesso e U ̸= ∅, deve essere V = ∅ e quindi A = U . In altre parole, A è connesso per
poligonali. □
|f (x + tv) − f (x)|
∥∇f (x)∥ = ∇f (x) • v = Dv f (x) = |Dv f (x)| = lim ≤L
t→0 |t|
in quanto |f (x + tv) − f (x)| ≤ L∥tv∥ = L|t|.
∗∗Rudolph O. S. Lipschitz (1832–1903) è stato un matematico tedesco.
26 LIBOR VESELY
(a) Dimostrate che ∥ · ∥op è una norma (detta norma operatoriale) sullo spazio vettoriale
delle matrici m × n.
(b) Mostrate che
∥M ∥op = max (M v) • w : v ∈ Rn , ∥v∥ = 1 w ∈ Rm , ∥w∥ = 1 .
(c) Mostrate che ∥M ∥op ≤ ∥M ∥2 e che la disuguaglianza può essere stretta se min{m, n} > 1
(suggerimento: nel caso m = n > 1 considerate la matrice identità). Mostrate che se
min{m, n} = 1 allora le due norme coincidono.
(d) Dimostrate che per una funzione differenziabile F : Rn ⊃ A → Rm su un insieme aperto
A si ha l’equivalenza:
F è L-lipschitziana su A ⇔ ∀x ∈ A, ∥JF (x)∥op ≤ L.
Teorema 4.29. Sia, come sopra, f una funzione reale definita in un insieme aperto A ⊂ Rn
e sia a ∈ A. Supponiamo che f sia lipschitziana in un intorno di a e valga (G). Allora f è
differenziabile in a.
CALCOLO DIFFERENZIALE IN PIÙ VARIABILI 27
S = {v ∈ Rn : ∥v∥ = 1}.
∂2f
Commento 5.2. Per essere precisi, per poter definire ∂xj ∂xi (a) sarebbe sufficiente
∂f
supporre che la derivata ∂xi (x)
fosse definita per ogni punto del tipo x = a + tej con
t sufficientemente piccolo, per poterla derivare.
Passando al limite per (x, y) → (0, 0) con x, y > 0, otteniamo l’uguaglianza deside-
rata, visto che (ξ, η) → (0, 0), (ξ,
e ηe) → (0, 0) e le due derivate parziali seconde miste
sono continue in (0, 0). □
Esercizio 5.5 (di approfondimento). Sia f una funzione (scalare) definita in un aperto
A ⊂ Rn . Siano v, w ∈ Rn due versori.
2
(a) Formulate la definizione della derivata direzionale seconda Dv,w (prima lungo v, poi
lungo w).
(b) Dimostrate che anche per le derivate direzionali seconde vale un teorema analogo al
teorema di Schwarz.
7. Sviluppi di Taylor
In questo capitolo cercheremo dei risultati simili agli sviluppi di Taylor noti per
funzioni di una variabile. Di tali sviluppi ricordiamo qui quelli di II ordine, con il
resto di Peano e quello di Lagrange.
Siano I ⊂ R un intervallo aperto, a ∈ I, f : I → R.
(a) [Resto di Peano.] Se f è due volte derivabile in a, allora
f (a + h) = f (a) + f ′ (a)h + 21 f ′′ (a)h2 + o(h2 ) per h → 0.
(b) [Resto di Lagrange.] Se f è tre volte derivabile in I allora per ogni h ∈ I esiste
θ ∈ (0, 1) tale che
1 1
f (a + h) = f (a) + f ′ (a)h + f ′′ (a)h2 + f ′′′ (a + θh)h3 .
2 3!
Notiamo la differenza sostanziale tra (a) e (b). Nella prima (Peano), il resto è espresso
in forma di limite, mentre il resto nella seconda (Lagrange) è espresso “punto per
punto”.
Ora, il Teorema del differenziale totale (Teorema 4.8 e Corollario 4.9) ci fornisce
il seguente
Corollario 7.2. Se f è di classe C k (A), allora f è k volte differenziabile in ogni
punto di A.
Dovrebbe essere chiaro che questo teorema può essere generalizzato per ottenere
sviluppi di Taylor di qualsiasi ordine k ∈ N per funzioni k + 1 volte differenziabili in
un intorno di a. Il corrispondente polinomio di Taylor Pk avrebbe però una scrittura
un po’ complicata:
k
X 1 X
(25) Pk (h) = f (a) + fxi1 ...xis (a) hi1 . . . his .
s!
s=1 i1 ,...,is
Tale scrittura può essere notevolmente semplificata sotto l’ipotesi che f sia di classe
C k+1 in Bδ (a) in quanto, in tal caso, le derivate parziali di ordini superiori al primo
don dipendono dall’ordine in cui si deriva (Osservazione 6.2). In queste situazioni,
diventa comoda la seguente simbologia di multiindici.
Multiindici. Un multiindice (di n componenti) è ogni n-upla ordinata
α = (α1 , . . . , αn ) dove αi ∈ N ∪ {0} per ogni i.
Definiamo inoltre
(26) |α| := α1 + · · · + αn e α! := α1 ! . . . αn ! .
(Il numero intero non negativo |α| viene detto l’altezza del multiindice α.)
Ora, se |α| = k ≥ 2 e f è una funzione (di n variabili) di classe C k in un intorno di
a, sappiamo che le derivate parziali di ordine k di f in a non dipendono dall’ordine
in cui si deriva (Osservazione 6.2). In tal caso, denotiamo
∂kf
(27) Dα f (a) = (a),
∂xα1 1 . . . ∂xαnn
cioè, la derivata parziale k-esima in cui si deriva αi volte rispetto alla variabile xi
(i = 1, . . . , n).
Ad esempio, per una funzione f = f (x, y, z) di classe C 5 ,
∂5f
D(2,0,3) f = .
∂x2 ∂z 3
Sotto queste ipotesi, ogni derivata mista di ordine superiore al primo compare
più di una volta nella formula (25). Più precisamente, usando la nota formula per
il numero delle permutazioni con ripetizioni, la derivata Dα f compare esattamente
|α|!
α! volte in (25). Denotando
(28) hα := hα1 1 . . . hαnn (h ∈ Rn ),
possiamo quindi scrivere
X 1
Pk (h) = f (a) + Dα f (a) hα
α!
1≤|α|≤k
34 LIBOR VESELY
(dove si somma rispetto ai multiindici α), che è una formula decisamente simile a
quella ben nota per una sola variabile.
In tal caso, la versione generale del Teorema 7.3 diventa come segue.
Teorema 7.6 (Taylor, II ordine, resto di Peano). Sotto le ipotesi base (9), suppo-
niamo che f sia due volte differenziabile nel punto a. Allora
1
f (a + h) = f (a) + ∇f (a) • h + [Hf (a) h] • h + o(∥h∥2 ), h → 0.
2
Dimostrazione. Consideriamo il resto (come funzione dell’incremento h = (h1 , . . . , hn ))
X 1X
R(h) := f (a + h) − P2 (h) = f (a + h) − f (a) − fxi (a)hi − fx x (a)hi hj
i
2 i,j i j
Per ogni h ∈ Bδ (0) possiamo applicare il teorema di Lagrange in più variabili (Teorema 4.19):
esiste 0 < θh < 1 tale che
L.
R(h) = R(h) − R(0) = ∇R(θh h) • h
1X
= ∇f (a + θh h) • h − ∇f (a) • h − fx x (a)(θh hj hi + θh hi hj )
2 i,j i j
X
= ∇f (a + θh h) • h − ∇f (a) • h − θh fxi xj (a)hi hj
i,j
X
= fxi (a + θh h) − fxi (a) − ∇(fxi )(a) • (θh h) hi .
i
Teorema 7.7 (Taylor, resto di Peano). Sotto le ipotesi (9), sia k ∈ N e sia f di
classe C k in un intorno Bδ (a) ⊂ A. Allora
X 1
f (a + h) = f (a) + Dα f (a) hα + o(∥h∥k ) per h → 0.
α!
1≤|α|≤k
36 LIBOR VESELY
Teorema 7.10 (Unicità dello sviluppo). Sia k ∈ N. Sotto le ipotesi (9), sia f di
classe C k (A) (o almeno k volte differenziabile in a). Se P : Rn → R è un polinomio
di grado ≤ k tale che
f (a + h) = P (h) + o(∥h∥k ) per h → 0
allora P coincide con il polinomio di Taylor Pk di f di ordine k in a.
Dimostrazione. Sotto le nostre ipotesi abbiamo anche lo sviluppo di Taylor
f (a + h) = Pk (h) + o(∥h∥k ) per h → 0.
Essendo Q(h) := P (h) − Pk (h) un polinomio di grado ≤ k che sia o(∥h∥k ) per h → 0,
il resto segue dal precedente lemma. □
8. Ottimizzazione libera
L’espressione “ottimizzazione libera” si riferisce alla ricerca di estremanti di una
funzione a valori reali definita in un insieme aperto. (Esiste anche la “ottimizzazione
vincolata” che si svolge su insiemi dati da equazioni o sistemi di equazioni, come
superfici o curve. Incontrerete tale ottimizzazione nei corsi successivi di Analisi
Matematica.)
Le ipotesi base di questo capitolo saranno
(29) f : A → R dove A ⊂ Rn è un insieme aperto.
Quindi, sotto le ipotesi (29), l’insieme dei punti sospetti di essere estremanti di f
in A si riduce a:
• i punti stazionari in A;
• i punti di non derivabilità rispetto ad alcune delle variabili e aventi le
eventuali derivate parziali esistenti tutte nulle.
(Nel caso in cui A non fosse aperto si aggiungerebbero anche i punti della sua frontiera
appartenenti ad A.)
Si vede facilmente che aii = cii per ogni i, e aij = aji = 21 cij per i ̸= j.
Per esempio, la forma quadratica q(x, y, z) = x2 −z 2 +xy−6xz viene rappresentata
dalla matrice simmetrica
1 12 −3
H = 12 0 0 .
−3 0 −1
Per noi sarà importante il segno di una forma quadratica. Sia H una matrice
simmetrica n × n e qH la corrispondente forma quadratica. Diciamo che la matrice
H è:
• definita positiva [definita negativa] se qH (x) > 0 [qH (x) < 0] per ogni x ̸= 0;
• semidefinita positiva [semidefinita negativa] se qH (x) ≥ 0 [qH (x) ≤ 0] per
ogni x ̸= 0 ed esiste x̄ ̸= 0 con qH (x̄) = 0;
• indefinita se esistono x̄, ȳ tali che qH (x̄) < 0 < qH (ȳ).
Dimostrazione.
(a) Queste affermazioni dovrebbero esservi già note dai corsi di Geometria. (Si
dimostra che esiste una base ortonormale di Rn composta da n autovettori v1 , . . . , vn
di H, e rispetto a tale base, la mappa lineare data dalla matrice H è rappresentata
da una matrice diagonale reale avente sulla diagonale i corrispondenti autovalori.)
(b) qH è un polinomio (in n variabili) e quindi ∞ n
n
P P di classe C (R ).
ovviamente
Inoltre, per ogni x, y ∈ R si ha che [Hx]•y = i,j aij xj yi = i,j aji yi xj = [Hy]•x.
Siccome
[Hh] • h ≤ ∥Hh∥ ∥h∥ ≤ ∥H∥2 ∥h∥2 , h ∈ Rn ,
per ogni x ∈ Rn fissato possiamo scrivere
qH (x + h) − qH (x) = [Hx + Hh] • (x + h) − [Hx] • x
= [Hx] • h + [Hh] • x + [Hh] • h
= 2[Hx] • h + o(∥h∥), h → 0.
Ne segue che ∇qH (x) = 2Hx.
(c) segue dal teorema di Weierstrass in quanto S è compatto.
(d) Sia λ ∈ σ(H) e sia v ∈ S tale che Hv = λv. Allora qH (v) = (λv) • v = λ, e
quindi (c) implica che m ≤ λ ≤ M .
(e) Da (d) segue che basta dimostrare che m, M ∈ σ(H). Consideriamo la funzione
qH (x)
f : Rn \ {0}, f (x) := .
∥x∥2
Notiamo che f = qH su S e che
f (tx) = f (x) per ogni x ̸= 0, t > 0.
Ciò significa che f è costante su ogni semiretta dall’origine. Sia v̄ ∈ S tale che
m = qH (v̄) = f (v̄), e si noti che v̄ è un punto di minimo assoluto anche per f .
Per il lemma di Fermat, v̄ è un punto stazionario per f . Derivando il rapporto
e considerando che ∇(∥ · ∥2 )(x) = 2x per ogni x ∈ Rn e che ∥v̄∥ = 1, possiamo
calcolare:
∇qH (v̄) · ∥v̄∥2 − qH (v̄) · ∇(∥ · ∥2 )(v̄)
0 = ∇f (v̄) = = 2H v̄ − m · 2v̄ = 2 H v̄ − mv̄ .
∥v̄∥4
Ciò dimostra che m è un autovalore per H. Il caso di M si dimostra allo stesso
modo. □
Corollario 8.9. Sia H una matrice simmetrica (reale) del tipo n × n e siano
m := min σ(H) , M := max σ(H) .
Allora valgono le seguenti equivalenze.
(a) H è definita positiva [definita negativa] se e solo se m > 0 [M < 0].
(b) H è semidefinita positiva [semidefinita negativa] se e solo se m = 0 [M = 0].
(c) H è indefinita se e solo se m < 0 < M .
Dimostrazione. La forma quadratica qH è omogenea di grado 2, e quindi per ogni
x ∈ Rn \ {0},
x x
qH (x) = qH ∥x∥ · ∥x∥ = ∥x∥2 · qH ∥x∥ .
42 LIBOR VESELY
x
In altre parole, il segno di qH (x) è uguale al segno di qH (v) nel versore v := ∥x∥ . Il
resto segue facilmente dal Teorema 8.8. [Scrivete i dettagli!] □
Commento 8.10 (Un approfondimento). Dalla ben nota teoria delle matrici autoaggiunte
(tra le quali cadono tutte le matrici reali simmetriche) segue che che: se H è una matrice
simmetrica reale e u, v ∈ Rn sono due autovettori corrispondenti a due autovalori distinti
di H, allora u • v = 0 ovvero u, v sono ortogonali tra loro.
Dalla formula nella dimostrazione del Corollario 8.9 (insieme al Teorema 8.8)
otteniamo il seguente
Corollario 8.11. Sia H una matrice simmetrica (reale) del tipo n × n e siano
Allora
m∥x∥2 ≤ qH (x) ≤ M ∥x∥2 per ogni x ∈ Rn .
In particolare valgono le seguenti affermazioni.
(a) |qH | ≤ C∥ · ∥2 dove C = max{|m|, |M |}.
(b) Se H è definita positiva allora m > 0 e qH ≥ m∥ · ∥2 .
(c) Se H è definita negativa allora M < 0 e qH ≤ M ∥ · ∥2 .
Teorema 8.12 (Criterio di Sylvester). Sia H = (aij )ni,j=1 una matrice simmetrica
reale. Per ogni 1 ≤ k ≤ n consideriamo la sottomatrice
Allora:
(a) H è definita positiva se e solo se det Hk > 0 per ogni k = 1, . . . , n.
(b) H è definita negativa se e solo se (−1)k det Hk > 0 per ogni k = 1, . . . , n.
Attenzione: questo criterio vale solo per matrici 2 × 2 e non per quelle di dimensioni
maggiori!
CALCOLO DIFFERENZIALE IN PIÙ VARIABILI 43
Commento 8.15. Le ipotesi del Teorema 8.14 non sono le minime possibili. Po-
tremmo ad esempio supporre solo che f sia due volte differenziabile in un intorno di
a con le derivate parziali seconde continue in a.
E se il criterio di sopra non può essere applicato? Che cosa possiamo fare se in
un punto stazionario a la matrice hessiana è solo semidefinita (positiva o negativa)?
In questo caso, se la funzione f è sufficientemente regolare, possiamo sviluppare f
in a fino a qualche ordine successivo che, se siamo fortunati, ci dà informazioni sul
segno dell’incremento f (a + h) − f (a).
Osserviamo che f è definita in tutto il piano e vi è di classe C ∞ . Per (x, y) → (0, 0),
f (x, y) = (x + y)2 − 21 (x + y)4 + o(∥(x, y)∥4 ) − axy
= x2 + y 2 + (2 − a)xy − 12 (x + y)4 + o(∥(x, y)∥4 ).
Dallo sviluppo deduciamo che (0, 0) è un punto stazionario e che la matrice hessiana
Hf (0, 0) è la matrice simmetrica
2 2−a
H= .
2−a 2
Utilizzeremo il criterio dell’Esercizio 8.13. Siccome
< 0 se a < 0 o a > 4,
det H = −a(a − 4) > 0 se a ∈ (0, 4),
= 0 se a = 0 o a = 4,
otteniamo che:
• se a ∈ (−∞, 0) ∪ (4, +∞) l’origine non è estremante per f ;
• se a ∈ (0, 4) l’origine è un punto di minimo (almeno relativo).
CALCOLO DIFFERENZIALE IN PIÙ VARIABILI 45
The End.