Sei sulla pagina 1di 157

Annamaria Mazzia

Note di Analisi Matematica 2

Università degli Studi di Padova


corso di laurea in Ingegneria Edile-Architettura
a.a. 2012-2013

Questo lavoro è pubblicato sotto una Creative Commons Attribution-Noncommercial-No


Derivative Works 2.5 Italy License,
(http://creativecommons.org/licenses/by-nc-nd/2.5/it/)
Indice

Indice iii

1 Brevi richiami di analisi 1 1


1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . 2
1.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.5 Altri teoremi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

2 Funzioni reali di più variabili 7


2.1 Lo spazio Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Definizioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Come determinare il dominio di una funzione di due variabili? . . . . . . 9
2.2.2 Sui vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.3 Intorno di un punto, insieme aperto, chiuso, frontiera... . . . . . . . . . . 13

3 Limiti, continuità, differenziabilità di funzioni di più variabili 17


3.1 Limite di una funzione di più variabili . . . . . . . . . . . . . . . . . . . . . . . . 17
3.2 Continuità di una funzione di più variabili . . . . . . . . . . . . . . . . . . . . . . 21
3.3 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.4 Interpretazione delle derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5 Derivate parziali di ordine più elevato . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.6 Differenziabilità di una funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.7 Differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.8 Derivata direzionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.9 Derivazione nelle funzioni composte . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.10 Piano tangente ad una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.11 Formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

4 Massimi e minimi 35
4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3 Ricerca di massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4 Sui massimi e minimi assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5.1 Equazione di una retta e vettore normale alla retta . . . . . . . . . . . . . 47
4.6 Curve di livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.6.1 Significato del vettore gradiente . . . . . . . . . . . . . . . . . . . . . . . . 50

iii
I NDICE

4.7 Estremi vincolati e moltiplicatori di Lagrange . . . . . . . . . . . . . . . . . . . . 52

5 Le curve 57
5.1 Equazioni parametriche di una curva . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.2 Grafico di una curva parametrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.3 Parametrizzare una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.4 Tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.5 Lunghezza di un arco di funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.6 Lunghezza di una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.7 La curva cicloide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.8 Sistema di coordinate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.9 Curve in coordinate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.9.1 La curva cardioide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.10 Lunghezza di una curva polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.10.1Lunghezze di alcune curve . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.11 Funzioni a valori vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.12 Le curve riviste come funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . 79
5.13 Retta tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.14 Curve orientate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.15 Di nuovo sulla lunghezza di una curva . . . . . . . . . . . . . . . . . . . . . . . . 80
5.16 L’ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

6 Superfici parametriche 83
6.1 Superfici parametriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.1.1 Sistema di coordinate sferiche . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.2 Piano tangente a una superficie parametrica . . . . . . . . . . . . . . . . . . . . 87
6.2.1 Equazione di un piano e vettore normale al piano . . . . . . . . . . . . . . 87

7 Integrali 91
7.1 Integrali dipendenti da parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
7.1.1 Integrali dipendenti da parametri per funzioni di una sola variabile . . . 91
7.1.2 Integrali dipendenti da parametri per funzioni di due variabili . . . . . . 92
7.2 Richiamo sugli integrali semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.3 Integrali doppi su domini rettangolari . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.4 Integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.5 Integrali doppi su domini generali . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.6 Proprietà degli integrali doppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.7 Cambiamento di variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.7.1 Significato dello jacobiano . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
7.8 Area di un dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
7.9 Cenni su integrali tripli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
7.10 Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.11 Integrali di superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.11.1Area di una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.11.2Integrale di una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.12 Solidi e superfici di rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

8 Equazioni differenziali ordinarie 119


8.1 Cosa è un’equazione differenziale? . . . . . . . . . . . . . . . . . . . . . . . . . . 119
8.2 Il problema di Cauchy in locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
8.3 Teorema di Cauchy (esistenza e unicità globale) . . . . . . . . . . . . . . . . . . . 122
8.4 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.5 Equazioni differenziali lineari del primo ordine . . . . . . . . . . . . . . . . . . . 123

iv
Indice

8.6 Metodo di separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . 125


8.7 Risoluzione di alcuni tipi di equazioni differenziali . . . . . . . . . . . . . . . . . 126
8.8 Le equazioni differenziali lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.8.1 Cosa è uno spazio vettoriale? . . . . . . . . . . . . . . . . . . . . . . . . . . 129
8.9 L’equazione omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.10 L’equazione non omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.11 Equazioni lineari a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . . . . 132
8.12 Metodo dei coefficienti indeterminati . . . . . . . . . . . . . . . . . . . . . . . . . 135

9 Forme differenziali 139


9.1 Introduzione alle forme differenziali . . . . . . . . . . . . . . . . . . . . . . . . . . 139
9.2 Integrali delle forme differenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
9.3 Applicazione delle forme differenziali . . . . . . . . . . . . . . . . . . . . . . . . . 143
9.4 Teorema fondamentale per gli integrali curvilinei . . . . . . . . . . . . . . . . . . 144
9.5 Forme differenziali lineari esatte . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
9.6 Le forme differenziali lineari chiuse . . . . . . . . . . . . . . . . . . . . . . . . . . 149

Bibliografia 151

v
C APITOLO 1
Brevi richiami di analisi 1

La teoria attrae la pratica


come il magnete attrae il ferro.

Carl Friedrich Gauss

1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . . 2
1.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.5 Altri teoremi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

1.1 Introduzione
Quando si descrivono teoremi, si danno definizioni o, semplicemente, si discute di
matematica, è abbastanza usuale prendere in prestito lettere dell’alfabeto greco.
È importante, quindi, saperle riconoscere e chiamarle in maniera corretta:

A α Alfa N ν Nu
B β Beta Ξ ξ Xi
Γ γ Gamma O o Omicron
∆ δ Delta Π π Pi
E  Epsilon P ρ Rho
Z ζ Zeta Σ σ Sigma
H η Eta T τ Tau
Θ θ Theta Υ υ Upsilon
I ι Iota Φ φ Fi
K κ Kappa X χ Chi
Λ λ Lambda Ψ ψ Psi
M µ Mu Ω ω Omega

1.2 Identità trigonometriche


Nel seguito introduciamo alcune formule trigonometriche, con la notazione:
G sin (x) ≡ seno(x), cos (x) ≡ coseno(x),
G tan (x) ≡ tangente(x) =
sin (x)
cos (x)
, sec (x) ≡ secante(x) =
1
cos (x)
,

1
1. B REVI RICHIAMI DI ANALISI 1

cos (−θ) = cos (θ) sin (−θ) = − sin (θ)


cos ( π2 − θ) = sin (θ) sin ( π2 − θ) = cos (θ)
cos ( π2 + θ) = − sin (θ) sin ( π2 + θ) = cos (θ)
cos (π − θ) = − cos (θ) sin (π − θ) = sin (θ)
cos (π + θ) = − cos (θ) sin (π + θ) = − sin (θ)
cos (θ + φ) = cos (θ) cos (φ) − sin (θ) sin (φ) sin (θ + φ) = sin (θ) cos (φ) + cos (θ) sin (φ)
sin (2θ) = 2 sin (θ) cos (θ) cos (2θ) = cos2 (θ) − sin2 (θ)
sin2 (θ) + cos2 (θ) = 1 tan2 (θ) + 1 = sec2 (θ)

1.3 Regole su funzione esponenziale e logaritmica


Assumiano a, b ∈ R, con a > 0 e b > 0. Si ha:

1x = 1
ax+y = ax ay axy = (ax )y
aloga (x) = x a0 = 1
ax−y = ax /ay ax bx = (ab)x
loga (xy) = loga (x) + loga (y) loga (x/y) = loga (x) − loga (y)
loga (xy ) = y loga (x) loga (ax ) = x
loga (x)
logb (x) = bx = ax loga (b)
loga (b)

1.4 Derivate e integrali


Siano f e g due funzioni dipendenti dalla variabile reale x mentre c ∈ R sia una costante.
df
Indichiamo la derivata di f con il simbolo o mediante f 0 . Si ha:
dx

d (cf )
= cf 0 regola della costante
dx
d (f + g) df dg
= + regola della somma
dx dx dx
d (f /g) f 0 g − f g0
= regola del quoziente
dx g2
d (f g)
= f g0 + f 0 g regola del prodotto
d rx
df
= rf r−1 f 0 regola della potenza
dx
Tra le regole di integrazione, invece, ricordiamo quella di integrazione per parti:
Z Z
f g dx = f g − f 0 g dx
0

Diamo ora una tabella delle derivate e degli integrali delle funzioni più note (per gli inte-
grali lasciamo fuori la costante di integrazione), e con la simbologia arcsin(x) ≡ arcoseno(x),
arccos(x) ≡ arcocoseno(x), cot(x) ≡ cotangente (x), arctan(x) ≡ arcotangente(x), arccot(x) ≡,
arcocotangente(x).

2
1.5. Altri teoremi

f f0 f f0
1
ln(x) ex ex
x
sin (x) cos (x) cos (x) − sin (x)
1 1
tan (x) (= sec2 (x)) cot (x) − 2
cos2 (x) sin (x)
1 1 1 1
tan (x) − cot (x)
cos (x) cos (x) sin (x) sin (x)
1 1
arcsin (x) √ arccos (x) −√
1 − x2 1 − x2
1 1
arctan (x) arccot(x) −
1 + x2 1 + x2

R R
f fd x f fd x
xr+1
xr (r 6= 1) x−1 ln |x|
r+1

ex ex ln |x| x ln |x| − x
sin (x) − cos (x) cos (x) sin (x)
1
tan (x) ln | | cot (x) ln | sin (x)|
cos (x)

1 1 1 1
ln | + tan (x)| ln | + cot (x)|
cos (x) cos (x) sin (x) sin (x)

1 1
tan (x) − cot (x)
cos2 (x) sin2 (x)

tan (x) 1 cot (x) 1



cos (x) cos (x) sin (x) sin (x)
√ √
arcsin (x) x arcsin (x) + 1 − x2 arccos (x) x arccos (x) −1 − x2
1 1
arctan (x) x arctan (x) − ln (1 + x2 ) arccot(x) xarccot(x) − ln (1 + x2 )
2 2
1 1
√ arcsin (x) arctan (x)
1 − x2 1 + x2

1.5 Altri teoremi


Richiamiamo, nel seguito, alcuni teoremi.
Utilizzeremo, inoltre, le seguenti notazioni per funzioni di una sola variabile definite in un
insieme X ⊂ R. L’insieme delle funzioni continue in X verrà denotato con il simbolo C(X).
L’insieme delle funzioni continue in X, che hanno le prime n derivate pure esse continue,
sarà indicato con C n (X).

3
1. B REVI RICHIAMI DI ANALISI 1

Teorema 1.5.1 (di Rolle) a


Sia f ∈ C([a, b]) e differenziabile in ]a, b[.
Se f (a) = f (b) = 0, allora esiste un punto
ξ ∈]a, b[ tale che f 0 (ξ) = 0
a Michel Rolle (1652- 1719) fu un matematico

francese. È conosciuto per il teorema che porta il


suo nome. Si deve a lui la notazione
√ della radice
n-sima per mezzo del simbolo n x.

Teorema 1.5.2 (del Valor Medio) Sia


f ∈ C([a, b]) e differenziabile in ]a, b[,
allora esiste un punto ξ ∈]a, b[ tale che
f (b) − f (a)
f 0 (ξ) =
b−a

Teorema 1.5.3 (del Valore Intermedio)


Sia f ∈ C([a, b]) e sia K un valore compre-
so tra f (a) e f (b). Allora esiste almeno un
punto ξ ∈]a, b[ tale che f (ξ) = K.

Quindi per funzioni continue, un valore compreso tra i due estremi dell’insieme di
definizione, è un valore assunto dalla funzione stessa (in uno o più punti).
Come conseguenza di questo teorema, se f (a)f (b) < 0 (la funzione assume segno opposto
agli estremi dell’intervallo [a, b]) allora esiste almeno un punto ξ tale che f (ξ) = 0, cioè esiste
almeno una radice dell’equazione f (x) = 0 nell’intervallo [a, b].

Teorema 1.5.4 (Esistenza del punto fisso) Data una funzione g definita in [a, b], continua e
tale che a ≤ g(x) ≤ b per ogni x ∈ [a, b], allora g ammette almeno un punto fisso.
Dimostrazione. Dire che una funzione g ammette almeno un punto fisso, vuol dire che
esiste almeno un punto ξ nel suo insieme di definizione, tale che g(ξ) = ξ.
Dalle ipotesi del teorema, i valori della funzione g sono contenuti nell’intervallo [a, b] e, in
particolare a ≤ g(a) ≤ b e a ≤ g(b) ≤ b. Definiamo, perciò, la funzione continua Φ(x) mediante
la relazione

Φ(x) = g(x) − x

Allora Φ(a) = g(a) − a > 0 e Φ(b) = g(b) − b < 0. Per il Teorema del Valore Intermedio esiste
almeno un punto ξ ∈]a, b[ tale che Φ(ξ) = 0, vale a dire g(ξ) − ξ = 0, cioè g(ξ) = ξ. Esiste
almeno un punto fisso per la funzione g. 4

4
1.5. Altri teoremi

Teorema 1.5.5 (Esistenza e unicità del punto fisso) Data una funzione g di classe C 1 in
[a, b], con a ≤ g(x) ≤ b per ogni x ∈ [a, b], e con |g 0 (x)| ≤ m < 1 per ogni x ∈ [a, b] allora esiste ed è
unico il punto fisso della g in tale intervallo.
Dimostrazione. L’esistenza di almeno un punto fisso è assicurata dal teorema prece-
dente (le ipotesi del teorema precedente ci sono tutte). Supponiamo, allora, che esistano due
punti fissi ξ e η, con ξ 6= η, per la funzione g. Si ha
|ξ − η| = |g(ξ) − g(η)|
Applicando il teorema del Valor Medio, esiste un punto c compreso tra ξ e η per cui
|g(ξ) − g(η)| = |g 0 (c)(ξ − η)| ≤ |g 0 (c)||ξ − η|
Ma per ipotesi |g 0 (c)| ≤ m < 1 da cui
|ξ − η| ≤ m|ξ − η| < |ξ − η|
Si arriva ad una contraddizione. L’assurdo deriva dall’aver supposto ξ 6= η. Quindi ξ = η e il
punto fisso è unico. 4

Teorema 1.5.6 (del Valor Medio del Calcolo Integrale) Se f ∈ C([a, b]) e g è integrabile in
[a, b] e g(x) non cambia segno in [a, b], allora esiste un punto ξ ∈]a, b[ tale che
Z b Z b
f (x)g(x) d x = f (ξ) g(x) d x
a a

Per g ≡ 1, questo teorema ci dà il valore medio della funzione f sull’intervallo [a, b], dato
1 Rb
da f (ξ) = f (x) d x
b−a a
Teorema 1.5.7 (di Rolle generalizzato) Sia f ∈ C([a, b]) n volte differenziabile in ]a, b[. Se f
si annulla in n + 1 punti distinti x0 , x1 , . . . , xn in ]a, b[, allora esiste un punto ξ ∈]a, b[ in cui la
derivata n-sima della f si annulla: f (n) (ξ) = 0.

Teorema 1.5.8 (Formula di Taylor) 1


Sia f ∈ C 2 ([a, b]) e sia x0 un punto dell’intervallo [a, b]. Allora, per qualunque x ∈ [a, b] si può
scrivere:
(x − x0 )2 00
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + f (ξx )
2
dove ξx è un opportuno punto di [a, b] che si trova sul segmento individuato da x0 e x.
La formula appena scritta si dice formula di Taylor di centro x0 nel punto x.
La formula di Taylor appena scritta si può generalizzare se la funzione f è derivabile n + 1
volte. Si ha così la formula polinomiale di Taylor di centro x0 :
f 00 (x0 ) f (n) (x0 )
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + (x − x0 )2 + . . . + (x − x0 )n + Rn
2! n!
dove
f (n+1) (ξx )
Rn (x) = (x − x0 )n+1
(n + 1)!
con ξx un opportuno punto di [a, b] che si trova sul segmento individuato da x0 e x.
1 Brook Taylor (1685 - 1731) fu un matematico inglese che sviluppò quello che oggi è chiamato calcolo delle

differenze finite. L’importanza del suo lavoro e, soprattutto, della formula conosciuta oggi con il suo nome, venne
riconosciuta solo nel 1772 da Lagrange.

5
C APITOLO 2
Funzioni reali di più variabili

La facoltà che mette in moto


l’invenzione matematica non è
il ragionamento, bensì
l’immaginazione.

Augustus De Morgan
(1806-1871)

2.1 Lo spazio Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Definizioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Come determinare il dominio di una funzione di due variabili? . . . . . . . 9
2.2.2 Sui vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.3 Intorno di un punto, insieme aperto, chiuso, frontiera... . . . . . . . . . . . 13

2.1 Lo spazio Rn
Dallo studio di funzioni reali di variabili reali f : R −→ R che alla variabile x ∈ R associa
il valore f (x) ∈ R, passiamo a studiare funzioni reali di più variabili: non c’è più una sola
variabile x come variabile di input della nostra funzione, ma possiamo avere due o più
variabili di input mentre il valore che assume la funzione rimane un valore reale (detto
anche scalare).
Se (x, y) è la coppia di variabili, ciascuna delle quali varia in R, possiamo definire una
funzione f che alla coppia (x, y) associa il valore f (x, y).
Analogamente, data la terna di variabili reali (x, y, z), si può definire una funzione f che,
in corrispondenza di (x, y, z), assume il valore reale f (x, y, z),
Il discorso si può generalizzare con una n−nupla di valori (x1 , x2 , . . . , xn ) introducendo
una funzione f che, per ogni n−nupla (x1 , x2 , . . . , xn ) associa il valore reale f (x1 , x2 , . . . , xn ).
Introduciamo, dunque, lo spazio Rn , dove n è un intero naturale, per definire lo spazio a
n dimensioni.
Un punto P ∈ Rn è definito da una n−nupla ordinata di numeri reali (x1 , x2 , . . . , xn ).
Ciascun valore xi , i = 1, 2, . . . , n, prende il nome di coordinata i−sima del punto P . Data
una funzione f definita in Rn , possiamo scrivere f (x1 , x2 , . . . , xn ) o f (P ) per dire che stiamo
valutando la funzione nel punto P .
G Per n = 1 si ha lo spazio reale R. I punti che vi appartengono prendono anche il nome
di scalari.
G Per n = 2 si ha lo spazio R e il generico punto è indicato mediante la coppia (x, y) (x
2

prende il nome di ascissa del punto, mentre y è l’ordinata del punto).

7
2. F UNZIONI REALI DI PIÙ VARIABILI

Figura 2.1: Grafici delle tre funzioni f1 , f2 e f3 .

G Per n = 3 si ha lo spazio R 3
e il generico punto è indicato mediante la coppia (x, y, z),
rispettivamente ascissa, ordinata e quota del punto.
Esempi di funzioni di più variabili in R2 sono:
Gf1 (x, y) = x + y
Gf2 (x, y) = |x| + |y|
Gf3 (x, y) = (x + y) cos (x + y)
Di queste funzioni è possibile fare il grafico: così come una funzione reale di una variabile
reale genera una curva nello spazio R2 una funzione reale di due variabili reali genera una
superficie nello spazio R3 .
Per il grafico di funzioni reali di tre o più variabili reali il discorso si complica perchè
va fatto in uno spazio che ha una dimensione in più rispetto a quello di partenza (che non
riusciamo quindi a visualizzare). In tal caso il grafico genera un’ipersuperficie. Esempi di
funzioni reali in R3 sono:
Gf1 (x, y, z) = x3 + xyz + y 2 + z
Gf2 (x, y, z) = sin (xyz)
Gf3 (x, y, z) = ex+y+z

2.2 Definizioni preliminari


Come per le funzioni di una sola variabile reale (funzioni scalari) sono stati definiti e
analizzati i concetti di continuità, differenziabilità, limite, integrale e derivata, anche per le
funzioni di più variabili possono essere fatti gli analoghi studi.
A tale scopo, dobbiamo introdurre alcune definizioni (che valgono in generale per uno
spazio Rn ma che noi vedremo poi in particolare per gli spazi R2 e R3 )

Definizione 2.2.1 Si definisce funzione di n variabili reali una legge che assegna un unico
numero reale f (x1 , x2 , . . . , xn ) ∈ R a ciascun punto (x1 , x2 , . . . , xn ) contenuto in un sottoinsieme
D(f ) di Rn . L’insieme dei punti D(f ) prende il nome di insieme di definizione o dominio della
funzione f . L’insieme di tutti i numeri reali f (x1 , x2 , . . . , xn ) al variare dei punti nel dominio
prende il nome di insieme dei valori o codominio della f (o range, per usare il termine matema-
tico inglese) e si denota con R(f ) oppure con f (A) se il dominio della funzione è stato indicato
con l’insieme A.
Per indicare una funzione f si possono usare le seguenti scritture:

f : D(f ) −→ R(f ) dove D(f ) ⊂ Rn , R(f ) ⊂ R

f : A −→ B dove A ⊂ Rn , B ⊂ R, f (A) ⊂ B
Per funzioni di una variabile reale, è usuale indicare la funzione con la notazione y = f (x),
dal momento che il valore della funzione viene rappresentato sull’asse delle y nel piano

8
2.2. Definizioni preliminari

Figura 2.2: Rappresentazione grafica di una generica funzione di due variabili reali f (x, y).

cartesiano xy. Alla stessa maniera, è usuale indicare funzioni reali di due variabili reali
mediante la notazione z = f (x, y), visto che il valore di questa funzione viene rappresentato
sull’asse delle z. Per quanto riguarda il grafico di una funzione f in R2 , si può dare la
seguente definizione:

Definizione 2.2.2 Data una funzione f : D(f ) −→ R(f ) in R2 , il grafico ad essa associato è
dato dall’insieme
n o
G(f ) = (x, y, z) ∈ R3 : (x, y) ∈ D(f ), z = f (x, y)

In Figura 2.2 è rappresentato il grafico di una generica funzione di due variabili reali, nello
spazio R2 . I valori della funzione sono rappresentati sull’asse delle z, dove in rosso è rappre-
sentato l’insieme dei valori della funzione R(f ), mentre sul piano xy, in blu, è rappresentato
l’insieme di definizione D(f ). Generalmente, il dominio di una funzione di due variabili può
essere o l’intero spazio R2 o un suo sottoinsieme (come nella Figura 2.2).
A volte, il dominio di una funzione non è specificato. Come capire qual è l’insieme dei
punti per i quali la funzione f esiste? Ci soffermiamo sul caso di una funzione definita in
R2 .

2.2.1 Come determinare il dominio di una funzione di due variabili?


Come regola generale, se è data una funzione f (x, y) ma non vi è nessuna informazione sul
dominio, allora il dominio sarà dato da tutti i punti del piano xy ad eccezione (o escludendo)
quei punti (se ce ne sono) nei quali la funzione non può essere definita. Sono due le situazioni
in cui una funzione f non può essere definita in un punto (x0 , y0 ): se il valore f (x0 , y0 ) non è
un numero reale o se la funzione in (x0 , y0 ) assumerebbe valori ±∞.
Vediamo degli esempi.

9
2. F UNZIONI REALI DI PIÙ VARIABILI

 x y
Figura 2.3: Grafico della funzione z = f (x, y) = 5 1 − − .
4 8

Esempio
Es. 2.2.1 Sia data la funzione z = f (x, y) = x3 + x2 y. Questa funzione è ben definita per
tutti i valori di x e y perchè qualunque sia la coppia (x, y), la funzione assume sempre
valori reali. Quindi f è definita in tutto R2 .

Esempio
 x y
Es. 2.2.2 Sia ora z = f (x, y) = 5 1 − − per 0 ≤ x ≤ 2 e per 0 ≤ y ≤ 8 − 4x.
4 8
In tal caso la funzione è assegnata su uno specifico dominio, quindi, anche se la funzione
è ben definita per tutti i valori di x e di y, il dominio in cui va studiata, in questo esempio,
è quello dato, vale a dire per x ∈ [0, 2], e per y che varia nell’intervallo [0, 8] quando x = 0,
mentre y = 0 quando x = 2. Ciò significa che l’insieme di definizione è dato dal triangolo
di estremi (0, 0), (0, 8) e (2, 0) (si veda Figura 2.3).

Esempio
p
Es. 2.2.3 Vediamo ora la funzione z = f (x, y) = 16 − x2 − y 2 .
Questa funzione è ben definita solo quando l’espressione sotto radice è non negativa.
Perciò il suo dominio è dato dai punti (x,y) che soddisfano la condizione

16 − x2 − y 2 ≥ 0 ⇐⇒ x2 + y 2 ≤ 16

Questa condizione definisce


p il dominio: si tratta del cerchio di centro l’origine e raggio 4
nel piano xy. Infatti x2 + y 2 è la definizione di distanza p di un punto (x, y) dall’origine
del piano, da cui la condizione x2 + y 2 ≤ 16 è equivalente a x2 + y 2 ≤ 4 ovvero l’insieme
dei punti la cui distanza dall’origine è minore o uguale a 4, vale a dire il cerchio di centro
l’origine e raggio 4. Il grafico di questa funzione è una semisfera nel semipiano per z ≥ 0.

10
2.2. Definizioni preliminari

Esempio
10
Es. 2.2.4 Sia z = f (x, y) = . In tal caso, il dominio non è specificato ma ci accor-
x−y
giamo subito che la funzione, per essere definita, deve avere il denominatore diverso da
zero. Quindi la funzione non è definita per x = y. Il dominio della f è dunque tutto il
piano xy privato della retta x = y.
Per poter andare avanti nello studio delle funzioni, dobbiamo riprendere o generalizzare
altri concetti di base. Incominciamo dai vettori.

2.2.2 Sui vettori


Un punto P ∈ Rn può essere visto anche come vettore di Rn . Abbiamo infatti la seguente
definizione

Definizione 2.2.3 Un vettore di Rn è un’n−nupla ordinata di numeri reali.

Un vettore lo si indica mediante il simbolo ~x. Quindi ~x è definito mediante (x1 , x2 , . . . , xn ).


Una funzione che generalizza ai vettori il valore assoluto di un numero reale prende il
nome di norma. Esistono diversi tipi di norme. Noi consideriamo la norma euclidea e la
chiameremo brevemente norma o modulo. Abbiamo la seguente definizione.

Definizione 2.2.4 Dato un vettore ~x ∈ Rn , si definisce modulo (o norma euclidea di ~x) la


quantità scalare data da
v
u n
uX
|~x| = t (xi )2
i=1

Pn 2
(con il simbolo i=1 (xi ) indichiamo la somma (x1 )2 + (x2 )2 + . . . (xn )2 ).

Definizione 2.2.5 Dati due vettori ~x e ~y in Rn si definisce distanza tra i due vettori la quantità
|~x − ~y |.
Geometricamente, la distanza tra due vettori non è altro che la distanza euclidea tra due
punti.

Esempio
Es. 2.2.5 Siano dati i due vettori p~ = (7, 1) e ~q = (3, 4). La distanza tra i due vettori è
data da
p √ √
p − ~q| = (7 − 3)2 + (1 − 4)2 = 16 + 9 = 25 = 5
|~

Se vediamo i due vettori come i punti del piano P e Q che hanno coordinate rispettiva-
mente (7, 1) e (3, 4) e vogliamo calcolare la distanza tra i due punti, dobbiamo applicare
esattamente la stessa formula (si veda Figura 2.4).
Quindi due punti nello spazio Rn possono essere visti come vettori e viceversa. Di con-
seguenza, in R2 o R3 , quella che per noi è la distanza tra due punti P e Q, e che ricaviamo
applicando il teorema di Pitagora, può essere vista come la distanza tra i due vettori.
Presi due punti P e Q in Rn possiamo fare P + Q o P − Q considerandoli come vettori e
quindi sommando o facendo la differenza delle componenti omonime dei punti-vettori. Tutte
le operazioni che possiamo fare tra vettori si ripetono tra punti.

11
2. F UNZIONI REALI DI PIÙ VARIABILI

Figura 2.4: Distanza tra due vettori p~ e ~q o distanza tra due punti P e Q.

Figura 2.5: A sinistra: somma e differenza tra punti in R2 . A destra: prodotto di uno scalare
per un punto. I vettori αQ, βQ, γQ e δQ sono messi sfalsati per ragioni pratiche di visibilità
ma sono sulla stessa linea.

Esempio
Es. 2.2.6 Siano dati i due punti di Rn , P (p1 , p2 , . . . , pn ) e Q(q1 , q2 , . . . , qn ) (usiamo questa
notazione per rappresentare il punto P (o Q) di coordinate (p1 , p2 , . . . , pn ) (o (q1 , q2 , . . . , qn )).
Allora il punto P + Q ha componenti (p1 + q1 , p2 + q2 , . . . , pn + qn ), mentre il punto P − Q è
dato da (p1 − q1 , p2 − q2 , . . . , pn − qn ).
Dato uno scalare α, il punto αP è dato da (αp1 , αp2 , . . . , αpn ).
Si veda Figura 2.5 per vedere l’interpretazione geometrica lavorando tra vettori.

Definizione 2.2.6 Dati due vettori ~x e ~y , si definisce prodotto scalare tra i due vettori il numero
reale indicato con il simbolo ~x · ~y dato da
n
X
~x · ~y = xi yi
i=1

12
2.2. Definizioni preliminari

Figura 2.6: Intervallo aperto ]a1 , a2 ]×]b1 , b2 [

Figura 2.7: Esempio di insieme limitato in R2 .

2.2.3 Intorno di un punto, insieme aperto, chiuso, frontiera...


Definizione 2.2.7 Dati due punti di Rn , A (a1 , a2 , . . . , an ) e B (b1 , b2 , . . . , bn ), con ai < bi (per
i = 1, 2, . . . , n), si definisce intervallo aperto di Rn di vertici A e B l’insieme dato da
T = {P ∈ Rn di coordinate (x1 , x2 , . . . , xn ) t. c. ai < xi < bi , i = 1, 2, . . . , n}
In R2 un intervallo aperto di vertici A e B è dato dal rettangolo i cui punti (x, y) sono
presi, rispettivamente, negli intervalli aperti ]a1 , a2 [ e ]b1 , b2 [, che possiamo indicare come
]a1 , a2 ]×]b1 , b2 [ (si veda Figura 2.6)

Definizione 2.2.8 I ⊂ Rn si definisce insieme limitato di Rn se esiste un intervallo aperto che


lo contiene.
Passiamo ora a considerare l’intorno di un punto. In R sappiamo che vale la seguente
definizione.

Definizione 2.2.9 Dato x0 ∈ R e  > 0, l’insieme dei punti x sull’asse reale che hanno distanza
da x0 minore di  è un intervallo aperto di centro x0 e raggio  che prende il nome di intorno di

13
2. F UNZIONI REALI DI PIÙ VARIABILI

x0 . Se indichiamo con A (x0 ) questo insieme, possiamo dire che

A (x0 ) = {x ∈ R : |x − x0 | < }

Generalizziamo questa definizione in Rn .

Definizione 2.2.10 Dato P0 ∈ Rn e  > 0, l’insieme dei punti P di Rn che hanno distanza da
P0 minore di  prende il nome di intorno circolare di centro P0 e raggio .
Indichiamo con A (P0 ) questo insieme, possiamo dire che

A (P0 ) = {P ∈ Rn : |P − P0 | < }

G In R , considerando P (x , y ), e il generico punto P (x, y) si ha


2
0 0 0
n o
A (P0 ) = P (x, y) ∈ R2 : (x − x0 )2 + (y − y0 )2 < 
p

Osserviamo che l’equazione

(x − x0 )2 + (y − y0 )2 = 2

rappresenta l’equazione di una circonferenza di centro il punto (x0 , y0 ) e raggio . Quindi


l’intorno di (x0 , y0 ) è dato da tutti i punti contenuti all’interno della circonferenza (nel
cerchio), ma non i punti che si trovano sulla circonferenza.
G In R3 , preso P0 (x0 , y0 , z0 ) e considerato P (x, y, z) il generico punto di R3 , si ha
n o
A (P0 ) = P (x, y, z) ∈ R3 : (x − x0 )2 + (y − y0 )2 + (z − z0 )2 < 
p

Dal momento che l’equazione

(x − x0 )2 + (y − y0 )2 + (−z0 )2 = 2

rappresenta l’equazione della sfera di centro P0 e raggio , l’intorno di P0 è dato da tutti


i punti che si trovano all’interno della sfera ma non sulla superficie della sfera.
Vediamo ora altre definizioni che saranno utili nel seguito.

Definizione 2.2.11 Dato I ⊂ Rn :


G Diremo che un punto P0 ∈ Rn è un punto di frontiera di I se ogni intorno di P0 contiene
almeno un punto di I e un punto che non appartiene a I.
G Diremo che un punto P0 ∈ Rn è un punto interno di I se esiste un intorno di P0 tutto
contenuto in I.
G Diremo che I è un insieme chiuso se ciascun punto di frontiera di I appartiene a I.
G Diremo che I è un insieme aperto se nessun punto di frontiera di I appartiene a I.
G L’insieme interno di I è l’insieme dei punti interni di I che non sono di frontiera di I.
G L’insieme di frontiera di I è l’insieme di tutti i punti di frontiera di I.
G L’insieme esterno di I è l’insieme dei punti che non sono di I e che non sono di frontiera
di I.

Definizione 2.2.12 Dato I ⊂ Rn :


G Diremo che P0 ∈ Rn è punto di accumulazione di I se per ogni intorno di P0 ci sono infiniti
punti che appartengono a I.
G Diremo che P0 ∈ I è punto isolato di I se non è punto di accumulazione per I.
Esempi:
G L’intorno circolare di un punto P , A (P ) è un insieme aperto perchè nessun punto
0  0
della frontiera appartiene ad esso.

14
2.2. Definizioni preliminari

Figura 2.8: Esempio in R2 di punti interni, di frontiera, di intorno di un punto.

G L’insieme che denotiamo con il simbolo C (P ), dato da


 0

C (P0 ) = {P ∈ Rn : |P − P0 | ≤ }

è un insieme chiuso perchè ciascun punto della frontiera appartiene ad esso.


G Gli insiemi Rn e ∅ sono sia insiemi chiusi sia insiemi aperti per convenzione.

Definizione 2.2.13 Dato un insieme I ⊂ Rn si definisce chiusura di I l’insieme formato


dall’unione di I e della sua frontiera.

Ad esempio, l’insieme C (P0 ) rappresenta la chiusura di A (P0 ).

Definizione 2.2.14 Se I ⊂ Rn è chiuso e limitato, esso si dice compatto.

15
C APITOLO 3
Limiti, continuità, differenziabilità di funzioni
di più variabili

La mente che si apre ad una


nuova idea non torna mai alla
dimensione precedente.

Albert Einstein (1879-1955)

3.1 Limite di una funzione di più variabili . . . . . . . . . . . . . . . . . . . . . . . . . 17


3.2 Continuità di una funzione di più variabili . . . . . . . . . . . . . . . . . . . . . . . 21
3.3 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3.4 Interpretazione delle derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.5 Derivate parziali di ordine più elevato . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3.6 Differenziabilità di una funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
3.7 Differenziale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3.8 Derivata direzionale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.9 Derivazione nelle funzioni composte . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.10 Piano tangente ad una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.11 Formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32

3.1 Limite di una funzione di più variabili


Il concetto di limite di una funzione di più variabili è molto simile a quello per funzioni di
una sola variabile.
Consideriamo una funzione di due variabili, f (x, y). Diciamo che il limite della funzione
f (x, y) è L per (x, y) che tende a (x0 , y0 ) e scriviamo
lim f (x, y) = L
(x,y)→(x0 ,y0 )

se tutti i punti di un qualunque intorno di (x0 , y0 ) (senza considerare il punto (x0 , y0 )) ap-
partengono al dominio della funzione e se f (x, y) tende a L quando (x, y) tende a (x0 , y0 ). Più
vicino è il punto (x, y) a (x0 , y0 ), più il valore della funzione tende al valore del limite.
Formalmente, la definizione è la seguente.

Definizione 3.1.1 Siano dati una funzione f : I −→ R, con I ⊂ R2 , il punto P0 (x0 , y0 ), punto di
accumulazione per I, e L ∈ R, allora diciamo che
lim f (x, y) = L
(x,y)→(x0 ,y0 )

17
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI

se:
G ciascun intorno di P contiene punti del dominio di definizione della f (unica eccezione
0
può essere data dal punto P )
G e solo se, per ogni numero  > 0, esiste un altro numero δ > 0 tale che
0
se
p
se 0 < (x − x0 )2 + (y − y0 )2 < δ allora |f (x, y) − L| < 

qualunque sia il punto P (x, y) ∈ I.


Dalla definizione segue che, qualunque sia il valore di  piccolo a piacere, è possibi-
le trovare
p un intorno Aδ (P0 ) tale che per ogni punto in questo intorno diverso da P0
(0 < (x − x0 )2 + (y − y0 )2 < δ), vale la relazione |f (x, y) − L| < , cioè il valore f (x, y) si
trova in un intorno di L di raggio .
La definizione di limite per funzioni di due variabili si estende facilmente a funzioni di più
variabili.

Definizione 3.1.2 Siano dati una funzione f : I −→ R, con I ⊂ Rn , il punto P0 (x1 , x2 , . . . , xn ),


punto di accumulazione per I, e L ∈ R, allora diciamo che

lim f (P ) = L
P →P0

se:
G ciascun intorno di P contiene punti del dominio di definizione della f (unica eccezione
0
può essere data dal punto P )
G se e solo se, per ogni numero  > 0, esiste un altro numero δ > 0 tale che
0

se 0 < |P − P0 | < δ allora |f (P ) − L| < 

qualunque sia il punto P ∈ I.

Il limite di una funzione può valere anche ±∞ e si può anche parlare di limite per P che
tende a infinito.

Definizione 3.1.3 Data f : I −→ R, con I ⊂ Rn e dato il punto P0 di accumulazione per I si ha


G limP →P0 f (P ) = +∞ se per ogni valore M > 0, esiste δ > 0 tale che

se 0 < |P − P0 | < δ allora f (P ) > M

G lim P →P0 f (P ) = −∞ se per ogni valore M > 0, esiste δ > 0 tale che

se 0 < |P − P0 | < δ allora f (P ) < −M

G lim P →∞ f (P ) = L se per ogni valore  > 0, esiste M > 0 tale che

se |P | > M allora |f (P ) − L| < 

Alcune regole sui limiti che già conosciamo dalle funzioni scalari si estendono facilmente
ai limiti di funzioni di più variabili. Ad esempio, date due funzioni f e g, se limP →P0 f (P ) = L
e limP →P0 g(P ) = M con L, M ∈ R, si ha
G limP →P0 f (P ) ± limP →P0 g(P ) = L ± M
G limP →P0 f (P )g(P ) = LM
G limP →P0
f (P )
g(P )
=
L
M
(questo si ha se M 6= 0).
Anche per funzioni di più variabili vale il teorema del confronto (noto anche come teorema
dei carabinieri in italiano o squeeze theorem in inglese)

18
3.1. Limite di una funzione di più variabili

Figura 3.1: Percorsi che possono essere fatti da (x, y) per tendere a (x0 , y0 ).

Teorema 3.1.1 Se f (x, y) ≤ g(x, y) ≤ h(x, y) per (x, y) in un intorno di (x0 , y0 ) e se vale

lim f (x, y) = lim g(x, y) = L


(x,y)→(x0 ,y0 ) (x,y)→(x0 ,y0 )

allora anche

lim g(x, y) = L.
(x,y)→(x0 ,y0 )

Osserviamo adesso alcuni punti importanti:


G Se esiste il limite di una funzione per P che tende a un punto P , questo limite è unico.
G Per funzioni di una sola variabile f (x), l’esistenza del limite lim f (x) implica che la
0
x→x0
funzione si avvicina allo stesso numero finito per x che si avvicina a x0 sia da sinistra
sia da destra.
G Per funzioni di due variabili (e il discorso vale in maniera del tutto analogo anche per
funzioni di tre e più variabili), il limite lim(x,y)→(x0 ,y0 ) f (x, y) = L esiste solo se f (x, y)
tende allo stesso numero L qualunque sia il percorso che fa (x, y) per avvicinarsi a
(x0 , y0 ) nel piano cartesiano. Ciò significa che (x, y) può avvicinarsi a (x0 , y0 ) lungo
qualunque curva che possiamo individuare nel piano xy e il limite deve valere sempre
L (si veda Figura 3.1).
Abbiamo perciò la seguente proposizione

Proposizione 3.1.1 Data f : I −→ R, I ⊂ R2 , e dato P0 punto di accumulazione per I, se


esiste il limite lim(x,y)→(x0 ,y0 ) f (x, y) e tale limite vale L numero reale, allora lo stesso limite si
deve avere per P che tende a P0 su qualunque sottoinsieme di I che ha P0 come punto di
accumulazione.
Al contrario, se esistono anche solo due sottoinsiemi di I in cui esiste il limite della f per P
che tende a P0 , ma il valore del limite nei due sottoinsiemi non è lo stesso, allora non può
esistere il limite della funzione sull’insieme I di partenza (proprio in virtù della proposizione
precedente).
Vediamo degli esempi di calcolo del limite di funzioni di due variabili.

19
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI

Esempio
Es. 3.1.1 Consideriamo i seguenti limiti:

lim 3x − y 2 =?
(x,y)→(2,2)

lim xy 2 + x2 y =?
(x,y)→(3,4)

In tutti questi esempi il limite esiste e coincide con il valore della funzione nel punto di
limite:

lim 3x − y 2 = 6 − 4 = 2
(x,y)→(2,2)

lim xy 2 + x2 y = 48 + 36 = 84
(x,y)→(3,4)

Per la prima funzione il risultato è banale perchè la funzione la possiamo vedere come
somma di due funzioni scalari per le quali sappiamo calcolare facilmente il limite. La
seconda funzione è data dalla somma di due funzioni, ciascuna delle quali può essere
vista come il prodotto di una funzione nella sola variabile x e di una funzione nella sola
variabile y. Quindi calcoliamo il limite di queste funzioni, applichiamo la regola sul limite
di prodotto di funzioni e otteniamo il risultato.

Esempio
3xy
Es. 3.1.2 Consideriamo ora lim(x,y)→(0,0) .
x2 + y 2
Questo limite non esiste perchè si trovano facilmente due strade diverse per fare tendere
il punto (x, y) a (0, 0) attraverso le quali otteniamo due valori diversi del limite.
Prendiamo il punto (x, y) sulla retta y = kx con k numero reale arbritrario, diverso da
zero. Facciamo tendere dunque (x, kx) al punto (0, 0). Il limite diventa

3xkx 3kx2 2k
lim 2 2
= lim 2 2 2
=
(x,kx)→(0,0) x + (kx) (x,kx)→(0,0) x + k x 1 + k2

Questo valore del limite, che abbiamo ottenuto facilmente in quanto la funzione si è ridotta
a funzione della sola variabile x, dipende da k, e quindi cambia al cambiare di k. Ciò
significa che la funzione non può avere limite per (x, y) → 0.
Osserviamo che la funzione data è un esempio di funzione che non è definita nel punto
(0, 0) in quanto f (0, 0) = 0/0 è una forma indeterminata.

Esempio
8xy 2
Es. 3.1.3 Studiamo ora lim(x,y)→(0,0) .
x2
+ y4
Anche questa funzione è indeterminata in (0, 0).
Proviamo a calcolare il limite sulle rette y = kx con k ∈ R, k 6= 0. Otteniamo

8k 2 x3 8k 2 x
lim = lim =0
(x,kx)→(0,0) x2 +k x 4 4 x→0 1 + k 2 x2

Questo limite non dipende dunque dalla retta, in quanto non dipende da k.

20
3.2. Continuità di una funzione di più variabili

Ci verrebbe da concludere che allora il limite esiste e vale 0. Ma la risposta non sarebbe
corretta perchè con le rette non abbiamo esaurito tutti i percorsi che può fare il punto
per avvicinarsi a (0, 0).
Proviamo ad avvicinarci a (0, 0) lungo la parabola x = ky 2 In tal caso abbiamo

8ky 4 8k
lim 2 4 4
= 2
(ky 2 ,y)→(0,0) k y + y k +1

In questo caso, il limite dipende dalla curva x = ky 2 e il valore non è più 0 ma cambia
al cambiare di k. Quindi il limite non esiste.

Esempio
Es. 3.1.4 Proviamo invece che
4x2 y
lim =0
(x,y)→(0,0) x2 + y 2

In tal caso, non conviene scegliere particolari curve per mostrare che il limite vale 0 perchè
dovremmo dimostrare che qualunque sia il cammino per avvicinarsi a (0, 0) il limite è
sempre quello e, quindi, dovremmo lavorare su infiniti percorsi! In tal caso, dobbiamo
applicare la definizione di limite.
x2 p
Ora, poichè x2 ≤ x2 +y 2 si ha 2 2
≤ 1, mentre da y 2 ≤ x2 +y 2 , ricaviamo |y| ≤ x2 + y 2 .
x +y
Possiamo dunque dire che

4x2 y 4x2 y p
| − 0| = | 2 | ≤ |4y| ≤ 4 x2 + y 2
x2+y 2 x +y 2

Dalla definizione di limite, preso  > 0, dobbiamo provare che esiste δ > 0 tale che per
p 4x2 y
0 < x2 + y 2 < δ, risulta | 2 − 0| < .
x + y2
Se scegliamo δ = /4, abbiamo:

4x2 y p 
| 2 2
− 0| ≤ 4 x2 + y 2 < 4 = 
x +y 4

4x2 y
Quindi abbiamo provato che | − 0| < , cioè il limite della nostra funzione per
x2 + y 2
(x, y) → (0, 0) vale esattamente 0.

3.2 Continuità di una funzione di più variabili


Definizione 3.2.1 Una funzione f : I −→ R, con I ⊂ Rn è continua in P0 (P0 ∈ I e punto di
accumulazione per I), se
lim f (P ) = f (P0 )
P →P0

Nel caso di funzioni di due variabili, si ha:

Definizione 3.2.2 Una funzione f : I −→ R, con I ⊂ R2 è continua in P0 (x0 , y0 ) (P0 ∈ I e punto


di accumulazione per I), se
lim f (x, y) = f (x0 , y0 )
(x,y)→(x0 ,y0 )

21
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI

Definizione 3.2.3 Una funzione si dice continua se è continua in ogni punto del suo insieme
di definizione.

Proposizione 3.2.1 Date due funzioni f e g continue in I ⊂ R2 , allora


G f + g è continua;
G f g è continua;
G f
g
è continua in tutti quei punti in g non si annulla;
G f ◦ g è continua (f ◦ g(x, y) = f (g(x, y)) funzione composta)

Esempio
Es. 3.2.1 lim(x,y)→(x0 ,y0 ) x sin (xy) = x0 sin (x0 y0 )
La funzione f (x, y) = x sin (xy) è una funzione continua. Infatti la possiamo vedere come il
prodotto della funzione x e della funzione sin (xy). La funzione sin (xy) la vediamo come la
funzione composta della funzione seno applicata al prodotto delle funzioni x e y. Poichè
x e y sono funzioni continue anche il loro prodotto è una funzione continua. La funzione
composta di funzioni continue è continua (quindi sin (xy) è continua) e il prodotto di x per
sin (xy) dà ancora una funzione continua.
Osserviamo che il concetto di continuità non è ovvio! Ci sono funzioni che ammettono
limite per (x, y) che tende a (x0 , y0 ) ma il valore del limite non necessariamente è uguale al
valore della funzione in (x0 , y0 ).

Esempio
Es. 3.2.2 La funzione definita come
(
0 se (x, y) 6= (0, 0)
f (x, y) =
1 se (x, y) = (0, 0)

ammette limite per (x, y) → (0, 0) ma il limite non è il valore della funzione in (0, 0). Questa
funzione non è continua in (0, 0). Difatti lim(x,y)→(0,0) f (x, y) = 0 6= f (0, 0) dal momento che
la funzione è di costante valore 0 ad eccezione del punto (0, 0) in cui vale 1. Questa
funzione è discontinua in (0, 0).

3.3 Derivate parziali


Estendiamo ora il concetto di derivata che abbiamo visto per funzioni di una sola
variabile, introducendo le derivate parziali.
Data una funzione di una sola variabile, f (x), la derivata prima f 0 (x) rappresenta la
velocità di variazione della funzione al variare di x.
Con le funzioni di più variabili, ci sono due casi da considerare: cosa fare se varia solo
una variabile mentre le altre non variano? cosa fare se varia più di una variabile?
Concentriamo ora la nostra attenzione facendo cambiare una variabile alla volta e
lasciando le altre fisse.
Partiamo con un esempio, lavorando con una funzione di due variabili.

Esempio
Es. 3.3.1 Sia data f (x, y) = 4x3 y 5 . Determiniamo la velocità con cui la funzione cambia
in un punto fissato (x0 , y0 ), se non facciamo variare la y mentre facciamo variare la x,
e viceversa, determiniamo la velocità con cui cambia la funzione in (x0 , y0 ) fissando x e
variando y.

22
3.3. Derivate parziali

Nel primo caso, in cui lasciamo y fissato mentre x varia, dal momento che siamo inte-
ressati alla velocità della funzione nel punto (x0 , y0 ), per y fissato, vuol dire che dobbia-
mo considerare la funzione per y = y0 . Consideriamo quindi f (x, y0 ) = 4x3 (y0 )5 . Adesso
abbiamo una funzione di una sola variabile, la x. Possiamo quindi considerare la fun-
zione g(x) = f (x, y0 ) = 4x3 (y0 )5 . Di questa funzione in una sola variabile, sappiamo
cosa dobbiamo fare se vogliamo determinare la velocità di cambiamento della funzio-
ne per x = x0 : dobbiamo calcolare la derivata prima g 0 (x0 ). Nell’esempio, abbiamo
g 0 (x0 ) = 12(x0 )2 (y0 )5 .
Quello che abbiamo ottenuto prende il nome di derivata parziale di f (x, y) rispetto a x,
nel punto (x0 , y0 ). Denotiamo questa derivata parziale con uno dei seguenti simboli:

∂f
fx (x0 , y0 ) (x0 , y0 ) Dx f (x0 , y0 )
∂x
Al posto di (x0 , y0 ) si può scrivere anche P0 intendendo per P0 il punto di coordinate
(x0 , y0 ).
Quindi, nel nostro esempio, fx (x0 , y0 ) = 12(x0 )2 (y0 )5 .
Vediamo ora cosa succede se lasciamo fissa la variabile x e variamo y. In tal caso,
dobbiamo considerare la funzione h(y) = f (x0 , y) = 4(x0 )3 y 5 e calcolare la derivata prima
di questa funzione che dipende dalla sola variabile y nel punto y0 . Abbiamo h0 (y0 ) =
20(x0 )3 (y0 )4 .
Ciò che abbiamo ottenuto è la derivata parziale della f rispetto alla variabile y, nel
punto (x0 , y0 ). Indichiamo questa derivata parziale con uno dei seguenti simboli:

∂f
fy (x0 , y0 ) (x0 , y0 ) Dy f (x0 , y0 )
∂y

Quindi, per l’esempio considerato, fy (x0 , y0 ) = 20(x0 )3 (y0 )4 .


Passiamo dunque alla definizione generale delle derivate parziali prime di una funzione
di due variabili (considerando le derivate non più in (x0 , y0 ) ma nel generico punto (x, y)).

Definizione 3.3.1 Data una funzione f (x, y), le derivate parziali prime rispetto alle variabili x
e y sono date da:

∂f f (x + h, y) − f (x, y)
(x, y) = lim
∂x h→0 h
∂f f (x, y + h) − f (x, y)
(x, y) = lim
∂y h→0 h

Derivate per funzioni scalari e derivate per funzioni di due variabili


df
f (x) =⇒ f 0 (x) =
dx
∂f ∂f
f (x, y) =⇒ fx (x, y) = & fy (x, y) =
∂x ∂y
Per calcolare le derivate parziali prime di una funzione bisogna fare questo ragionamento:
se dobbiamo calcolare fx (x, y) dobbiamo trattare la variabile y come una costante e trattare la
funzione come se dipendesse dalla sola x; se dobbiamo calcolare fy (x, y), dobbiamo trattare
x come una costante e calcolare la derivata rispetto a y come se la funzione fosse dipendente
dalla sola variabile y.

23
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI

Esempio

Es. 3.3.2 Calcolare le derivate parziali prime della funzione f (x, y) = 3x5 + 2 y − 10xy.
Per calcolare la derivata fx (x, y) trattiamo la y come una costante, da cui fx (x, y) = 15x4 −

10y. Notiamo che la derivata rispetto a x di 2 y vale zero perchè la y è una costante.
Al contrario, per calcolare fy (x, y) dobbiamo ora trattare x come una costante, da cui
1
fy (x, y) = √ − 10x.
y

3.4 Interpretazione delle derivate parziali


Sono possibili due interpretazioni sul significato delle derivate parziali prime.
G Se consideriamo la derivata parziale come la velocità di cambiamento della funzione
allora fx (x, y) rappresenta la velocità di cambiamento della funzione al variare di x
per y fissato, mentre fy (x, y) rappresenta la velocità di cambiamento della funzione al
variare di y per x fissato. Quindi se fx (x0 , y0 ) > 0 vuol dire che la funzione è crescente
in quel punto al variare di x, per y0 fissato, mentre se fx (x0 , y0 ) < 0 vuol dire che la
funzione è decrescente in quel punto al variare di x, per y0 fissato. Stesso discorso vale
su fy (x0 , y0 ): se fy (x0 , y0 ) > 0 allora la funzione è crescente in quel punto al variare di y,
per x0 fissato, mentre se fy (x0 , y0 ) < 0 la funzione è decrescente in quel punto al variare
di y, per x0 fissato. È possibile che una funzione sia crescente fissato y e decrescente
fissato x o viceversa.
G L’altra interpretazione, geometrica, estende il concetto di pendenza della retta tangente
che abbiamo per funzioni di una sola variabile, per cui f 0 (x0 ) rappresenta la pendenza
della retta tangente alla funzione f (x) nel punto x0 . Nel caso di funzioni di due variabili,
fx (x0 , y0 ) rappresenta la pendenza della traccia della funzione f (x, y) nel piano y = y0 nel
punto (x0 , y0 ) (in altre parole è la pendenza della retta tangente alla curva che si ottiene
intersecando la superficie che rappresenta la funzione f (x, y), cioè il grafico della f , con
il piano verticale y = y0 ), mentre fy (x0 , y0 ) rappresenta la pendenza della traccia della
funzione f (x, y) con il piano x = x0 nel punto (x0 , y0 ).

3.5 Derivate parziali di ordine più elevato


Così come per le funzioni di una sola variabile è possibile definire le derivate di ordine
più elevato (derivata seconda, terza, quarta, n-sima), anche per le funzioni di più variabili è
possibile definire le derivate di ordine più elevato. Ci soffermiamo al caso di funzioni di due
variabili.
Data una funzione f (x, y), dal momento che abbiamo due derivate parziali prime fx e
fy , su ciascuna di queste funzioni possiamo pensare di applicare ancora la definizione
di derivata parziale rispetto a x e rispetto a y, ottenendo, in tal modo, quattro possibili
combinazioni.
Abbiamo le seguenti scritture:

∂2f
 
∂ ∂f
(fx )x = fxx = =
∂x ∂x ∂x2
∂2f
 
∂ ∂f
(fx )y = fxy = =
∂y ∂x ∂y∂x

24
3.6. Differenziabilità di una funzione

∂2f
 
∂ ∂f
(fy )x = fyx = =
∂x ∂y ∂x∂y
∂2f
 
∂ ∂f
(fy )y = fyy = =
∂y ∂y ∂y 2

Le derivate fxy e fyx sono dette anche derivate parziali miste perchè le derivate sono fatte
rispetto a più di una variabile.
Osserviamo che, dal punto di vista della notazione usata, quando l’indice della derivata
parziale è posta in basso della funzione, per esempio fxy , dobbiamo derivare da sinistra verso
destra: in questo caso prima facciamo la derivata rispetto a x e poi rispetto a y. Quando
∂2f
invece usiamo la notazione frazionale ( ) la notazione è opposta: si va da destra verso
∂y∂x
sinistra. Nell’esempio, il risultato è lo stesso, prima si deriva rispetto a x e poi rispetto a y.

Esempio
Es. 3.5.1 Calcolare le derivate seconde di f (x, y) = sin (xy) − x3 e4y + 4y 2 .
Prima di tutto calcoliamo le derivate parziali prime:

fx (x, y) = y cos (xy) − 3x2 e4y


fy (x, y) = x cos (xy) − 4x3 e4y + 8y

Passiamo ora alle derivate seconde:

fxx (x, y) = −y 2 sin (xy) − 6xe4y


fxy (x, y) = cos (xy) − xy sin (xy) − 12x2 e4y
fyx (x, y) = cos (xy) − xy sin (xy) − 12x2 e4y
fyy (x, y) = −x2 sin (xy) − 16x3 e4y + 8

Nell’esempio appena visto, le derivate parziali miste sono coincidenti. Si tratta di una
“coincidenza” o no? In realtà la funzione data gode di una proprietà importante che ci
permette di avere questo risultato.

Teorema 3.5.1 (di Clairaut-Schwarz) Data la funzione f definita in un insieme aperto A che
contiene il punto (x0 , y0 ), se le funzioni fxy e fyx sono continue in A, allora

fxy (x0 , y0 ) = fyx (x0 , y0 ).

3.6 Differenziabilità di una funzione


Prima di entrare a parlare di differenziabilità di una funzione, introduciamo una
notazione per degli spazi di funzioni definite in un insieme aperto I ⊂ R2 .
G Si indica con C 0 (I) l’insieme delle funzioni continue in I (si dice anche che la funzione
è di classe C 0 ).
G Si indica con C 1 (I) l’insieme delle funzioni definite in I le cui derivate parziali prime
sono continue in I (si dice anche che la funzione è di classe C 1 ).
G Si indica con C 2 (I) l’insieme delle funzioni definite in I le cui derivate parziali prime e
seconde sono continue in I (si dice anche che la funzione è di classe C 2 ).

25
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI

Definizione 3.6.1 Sia data una funzione f : A −→ R con A ⊂ R2 , A aperto, e un punto


P0 (x0 , y0 ) ∈ A. Diremo che f è differenziabile in P0 se esistono due numeri reali λ e µ tali che

f (x, y) − f (x0 , y0 ) − [λ(x − x0 ) + µ(y − y0 )]


lim p =0
(x,y)→(x0 ,y0 ) (x − x0 )2 + (y − y0 )2

In maniera del tutto equivalente si può dire che f è differenziabile se

f (x, y) − f (x0 , y0 ) − [λ(x − x0 ) + µ(y − y0 )]


p
è infinitesima di ordine superiore rispetto all’infinitesimo (x − x0 )2 + (y − y0 )2 .
Applicando la definizione di limite, dire che f è differenziabile in p P0 , vuol dire che, qua-
lunque sia  > 0 esiste δ > 0 tale che per ogni (x, y) ∈ A, con 0 < (x − x0 )2 + (y − y0 )2 < δ
risulta
p
|f (x, y) − f (x0 , y0 ) − [λ(x − x0 ) + µ(y − y0 )] | <  (x − x0 )2 + (y − y0 )2

In modo equivalente, possiamo anche dire che f è differenziabile in P0 se esistono due


numeri λ e µ e una funzione σ(x, y) definita in un intorno T di P0 e infinitesima per (x, y) →
(x0 , y0 ) tale che, per ogni (x, y) ∈ T , vale:
p
f (x, y) − f (x0 , y0 ) = λ(x − x0 ) + µ(y − y0 ) + σ(x, y) (x − x0 )2 + (y − y0 )2 .

Vale la seguente proposizione.

Proposizione 3.6.1 Se f : A −→ R, con A ⊂ R2 , A aperto, è differenziabile in P0 ∈ A, allora


esistono le derivate parziali prime di f in P0 e vale: fx (P0 ) = λ e fy (P0 ) = µ.
Dimostrazione. Sappiamo che la f è differenziabile, dobbiamo provare che fx (P0 ) = λ e
fy (P0 ) = µ.
Fissiamo la variabile y, prendendo y = y0 . Dalla definizione di differenziabilità si ha:

f (x, y0 ) − f (x0 , y0 ) = λ(x − x0 ) + |x − x0 |σ(x, y0 )

con σ la funzione infinitesima


p definita prima. Il termine che moltiplica µ si annulla (abbiamo
y0 − y0 ) come pure (x − x0 )2 + (y − y0 )2 si riduce a |x − x0 | per y = y0 .
Dividiamo la relazione trovata per x − x0 , ricavando
f (x, y0 ) − f (x0 , y0 ) |x − x0 |
=λ+ σ(x, y0 )
x − x0 x − x0
|x − x0 |
Passando al limite per x → x0 , poichè σ(x, y0 ) è infinitesima e è limitata (vale ±1), la
x − x0
|x − x0 |
funzione σ(x, y0 ) è ancora infinitesima. Quindi si ha
x − x0
f (x, y0 ) − f (x0 , y0 )
lim =λ
x→x0 x − x0
Il limite che abbiamo calcolato rappresenta la derivata prima della funzione f (x, y0 ) che
dipende dalla sola variabile x, nel punto x0 : essa è, quindi, la derivata parziale prima della f
rispetto a x. Abbiamo ottenuto che fx (x0 , y0 ) = λ.
Con lo stesso ragionamento, si prova che fy (x0 , y0 ) = µ. Si deve far variare il punto (x, y)
su una retta parallela all’asse y, per x = x0 . In tal caso, la definizione di differenziabilità di
dà:

f (x0 , y) − f (x0 , y0 ) = µ(y − y0 ) + |y − y0 |σ(x0 , y)

26
3.7. Differenziale

Dividendo per y − y0 si ha

f (x0 , y) − f (x0 , y0 ) |y − y0 |
=µ+ σ(x0 , y)
y − y0 y − y0

|y − y0 |
Passando al limite per y → y0 si ha che σ(x0 , y) → 0 e quindi
y − y0

f (x0 , y) − f (x0 , y0 )
lim =µ
y→y0 y − y0

vale a dire fy (x0 , y0 ) = µ.


Quindi se f è differenziabile in P0 , la f ammette le derivate parziali prime in P0 e vale
p
f (x, y) − f (x0 , y0 ) = fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) + σ(x, y) (x − x0 )2 + (y − y0 )2 .

4
Come conseguenza, una funzione differenziabile in P0 è continua in P0 .

Proposizione 3.6.2 Sia f : A −→ R, con A aperto di R2 . Sia f differenziabile in P0 ∈ A, allora


f è continua in P0 .
Dimostrazione. Poichè f è differenziabile in P0 , esiste una funzione infinitesima per
(x, y) → (x0 , y0 ) , σ(x, y) , tale che
p
f (x, y) − f (x0 , y0 ) = fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) + σ(x, y) (x − x0 )2 + (y − y0 )2 .

Per (x, y) → (x0 , y0 ) il secondo membro della relazione appena scritta tende a zero, quindi

lim f (x, y) − f (x0 , y0 ) = 0


(x,y)→(x0 ,y0 )

cioè

lim f (x, y) = f (x0 , y0 )


(x,y)→(x0 ,y0 )

La f è continua in P0 . 4

Teorema 3.6.1 Se f ∈ C 1 (A), con A aperto di R2 , allora f è differenziabile in A.

3.7 Differenziale
Ricordiamo ora il concetto di differenziale di una funzione di una sola variabile.
df
Definizione 3.7.1 Data una funzione f (x) e assumendo che la derivata f 0 (x) = esiste in
dx
un punto x, il differenziale totale df della funzione è dato da
 
df
df = dx = f 0 (x)dx.
dx

La quantità df può essere interpretata come il cambiamento infinitesimale del valore della
funzione f (x) quando x cambia di una quantità infinitesima dx. Per esprimere questo da un
punto di vista formale, consideriamo l’incremento ∆f = f (x + ∆x) − f (x) che rappresenta
l’incremento sulla f quando x è incrementato di una quantità finita ∆x.

27
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI

Applicando il teorema del valor medio, possiamo riscrivere

∆f = f 0 (x + θ∆x)∆x, dove θ ∈ (0, 1).

Ora passando al limite per ∆x → dx, ∆f → df , essendo df un incremento infinitesimale.


Dal momento che dx è molto piccolo, possiamo dire che dx  x e quindi x + θdx ≈ x da cui

df = f 0 (x)dx.

Ritroviamo la formula data per il differenziale df .


Qualcosa di simile si ritrova nelle funzioni di due variabili.

Definizione 3.7.2 Data f (x, y) funzione di due variabili, con derivate parziali prime continue,
si definisce differenziale totale della f
   
∂f ∂f
df = dx + dy = fx dx + fy dy.
∂x ∂y

Il differenziale df rappresenta la variazione della f quando le variabili x e y cambiano di una


quantità infinitesima dx e dy.
Per arrivare a questa formula, definiamo ∆f la variazione che si ha variando x e y di una
quantità ∆x e ∆y rispettivamente.

∆f = f (x + ∆x, y + ∆y) − f (x, y)


aggiungiamo e sottraiamo f (x, y + ∆y)
f (x + ∆x, y + ∆y) − f (x, y + ∆y) + f (x, y + ∆y) − f (x, y)
| {z } | {z }
incremento con y+∆y f issato incremento con x f issato

Abbiamo suddiviso ∆f in due pezzi, il primo contenente una variazione solo in x e l’altro
contenente una variazione solo in y. Applicando il teorema del valor medio come prima,
otteniamo

∆f = fx (x + θ1 ∆x, y + ∆y)∆x + fy (x, y + θ2 ∆y)∆y con θ1 , θ2 ∈ (0, 1).

Per ∆x → dx e per ∆y → dy, con dx e dy incrementi infinitesimali (da cui dx  x e dy  y),


risulta che ∆f → f , ricavando l’espressione df = fx dx + fy dy.

3.8 Derivata direzionale


La derivata direzionale di una funzione permette di calcolare la velocità di variazione
della funzione in una assegnata direzione. Le derivate parziali rispetto a x e rispetto a y
rappresentano la velocità di variazione lungo le direzioni x e y rispettivamente. Supponiamo
ora di voler calcolare come cambia una funzione f (x, y) nel punto (x0 , y0 ), lungo la direzione
di un arbitrario vettore unitario ~v di componenti α1 e α2 . Dire che ~v è unitario, significa che
la norma euclidea del vettore vale uno, cioè (α1 )2 + (α2 )2 = 1.
Geometricamente, se consideriamo la superficie di equazione z = f (x, y) (il grafico della
f ), il piano verticale che passa attraverso il punto (x0 , y0 , f (x0 , y0 )), nella direzione data da
~v , interseca la superficie in una curva. La pendenza della tangente alla curva nel punto
(x0 , y0 , f (x0 , y0 )) rappresenta la velocità di variazione della f nella direzione ~v , cioè la derivata
direzionale della f lungo ~v .
Al fine di calcolare questa derivata direzionale, consideriamo un punto P (x, y) che si trova
sul piano xy lungo la retta passante per P0 (x0 , y0 ) e avente direzione data da ~v . La retta si

28
3.8. Derivata direzionale

può scrivere come P = P0 + h~v con h scalare. Ciò significa che le coordinate del punto P si
possono scrivere come

x = x0 + hα1 y = y0 + hα2

La variazione della f tra il punto P e il punto P0 è data da f (x0 + hα1 , y0 + hα2 ) − f (x0 , y0 ).

Definizione 3.8.1 Definiamo derivata direzionale della f lungo la direzione ~v il limite, se


esiste ed è finito,
f (x0 + hα1 , y0 + hα2 ) − f (x0 , y0 )
lim
h→0 h
∂f
Questo limite si indica in modo equivalente tramite la scrittura (x0 , y0 ) o D~v f (P0 ).
∂~v
Dalla definizione data, risulta evidente che se ~v = i indicando con ~i il versore unitario
~
dell’asse x, di componenti (1, 0), allora D~v f (P0 ) = fx (P0 ), mentre se ~v = ~j il versore unitario
dell’asse y, di componenti (0, 1), allora D~v f (P0 ) = fy (P0 ). Quindi le derivate parziali rispetto
a x e rispetto a y sono un caso particolare di derivate direzionali.
Vale il seguente teorema, detto formula del gradiente perchè la derivata direzionale, sotto
determinate condizioni, è legata al gradiente della funzione assegnata.

Definizione 3.8.2 Data una funzione f che ammette derivate parziali in P0 , il vettore indicato
~ (P0 ) o grad f (P0 ) prende il nome di gradiente della funzione in P0 e ha come
con il simbolo ∇f
componenti le derivate parziali prime della f in P0 :
~ (P0 ) = (fx (P0 ), fy (P0 )).
∇f

Teorema 3.8.1 (Formula del gradiente) Data f : A −→ R con A ⊂ R2 , se f è differenzia-


bile in P0 (x0 , y0 ) allora f ammette derivata direzionale lungo una qualsiasi direzione unitaria
~v (α1 , α2 ) e risulta
∂f
(P0 ) = fx (P0 )α1 + fy (P0 )α2
∂~v
Quindi la derivata direzionale si può vedere come il prodotto scalare tra il gradiente della
funzione in P0 e il vettore ~v .
∂f ~ (P0 ) · ~v
(P0 ) = ∇f
∂~v
Dimostrazione. Poichè f è differenziabile, vale
p
f (x, y) − f (x0 , y0 ) = fx (P0 )(x − x0 ) + fy (P0 )(y − y0 ) + σ(x, y) (x − x0 )2 + (y − y0 )2

dove σ è una funzione infinitesima per (x, y) → (x0 , y0 ).


Poichè devo calcolare la derivata direzionale, considero come punto (x, y) il punto che si
trova sulla retta passante per (x0 , y0 ) e avente direzione data dal vettore ~v . Quindi, come
prima, x = x0 + hα1 e y = y0 + hα2 .
Sostituendo nella formula della differenziabilità si ricava:
p
f (x0 +hα1 , y0 +hα2 )−f (x0 , y0 ) = fx (P0 )(hα1 )+fy (P0 )(hα2 )+σ(x0 +hα1 , y0 +hα2 ) h2 (α1 )2 + h2 (α2 )2

Dividiamo
p ambo i membri p per h, ricordando anche che, poichè il vettore è unitario, si ha
h2 (α1 )2 + h2 (α2 )2 = |h| (α1 )2 + (α2 )2 = |h|. Quindi si ottiene:

f (x0 + hα1 , y0 + hα2 ) − f (x0 , y0 ) |h|


= fx (P0 )α1 + fy (P0 )α2 + σ(x0 + hα1 , y0 + hα2 )
h h
29
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI

Passando al limite per h → 0, a primo membro si ha proprio il limite della definizione di


derivata direzionale lungo ~v , mentre a secondo membro si ottiene fx (P0 )α1 + fy (P0 )α2 in
|h|
quanto la quantità σ(x0 + hα1 , y0 + hα2 ) tende a 0 poichè è prodotto di un infinitesimo (la
h
|h|
funzione σ) per la costante = ±1).
h
Si ricava quindi l’asserto. 4

3.9 Derivazione nelle funzioni composte


Per funzioni scalari, è frequente avere a che fare con funzioni del tipo y = f (x) dove però
x è a sua volta funzione di un’altra variabile t, x = g(t).
Se scriviamo F (t) = f (g(t)), sappiamo che F 0 (t) = f 0 (g(t))g 0 (t): applichiamo la regola di
derivazione sulle funzioni composte.
C’è una notazione alternativa a questa: da y = f (x) con x = g(t), abbiamo
dy dy dx
= .
dt dx dt
Per funzioni di più variabili, abbiamo diversi casi da considerare. Ne consideriamo i
principali.
G Primo caso: Sia z = f (x, y) con x = g(t) e y = h(t). Supponiamo che la f sia una
funzione differenziabile di (x, y) e che g e h siano funzioni differenziabili di t. Allora z è
una funzione differenziabile di t e si ha
dz ∂f dx ∂f dy
= +
dt ∂x dt ∂y dt
Osserviamo che la derivata di z rispetto a t è una derivata totale.

Esempio
dz
Es. 3.9.1 Sia z = f (x, y) = x3 y + 3xy 2 con x = sin (2t) e y = cos (t). Calcoliamo
dt
∂f ∂f dx
applicando la formula. Poichè = 3x2 y + 3y 2 , = x3 + 6xy, = 2 cos (2t) e
∂x ∂y dt
dy
= − sin (t), ricaviamo:
dt
dz
= (3x2 y + 3y 2 )2 cos (2t) + (x3 + 6xy)(− sin (t))
dt
A questo punto abbiamo calcolato la derivata. Per completare, dobbiamo scrivere x
e y in funzione di t:

dz
= (3 sin2 (2t) cos (t) + 3 cos2 (t))2 cos (2t) + (sin3 (2t) + 6 sin (2t) cos (t)(− sin (t))
dt
e sistemando meglio i termini a destra ricaviamo

dz
= 6(sin2 (2t) cos (2t) cos (t)+cos2 (t) cos (2t))−(sin2 (2t) sin (t)+6 sin (2t) sin (t) cos (t)).
dt
G Secondo caso: : z = f (x, y) con x = g(s, t) e y = h(s, t). Le funzioni f , g e h siano
differenziabili. In questo caso possiamo calcolare le derivate parziali della f rispetto a s
e t. Otteniamo
∂z ∂f ∂x ∂f ∂y ∂z ∂f ∂x ∂f ∂y
= + = +
∂s ∂x ∂s ∂y ∂s ∂t ∂x ∂t ∂y ∂t

30
3.10. Piano tangente ad una superficie

Esempio
Es. 3.9.2 Sia z = f (x, y) = e2x sin (y) con x = st e y = s2 t.
In tal caso, applicando la formula abbiamo:

∂z
= 2e2x sin (y)t + e2x cos (y)(2s) = 2e2st (t sin (s2 t) + s cos (s2 t))
∂s

∂z
= 2e2x sin (y)s + e2x cos (y)s2 = se2st (2 sin (s2 t) + s cos (s2 t))
∂t

3.10 Piano tangente ad una superficie


Per funzioni di una variabile, se facciamo uno zoom intorno ad un punto del grafico di
una funzione differenziabile, il grafico si discosta di poco dalla sua retta tangente in quel
punto e possiamo approssimare la funzione, in un intorno del punto, tramite l’equazione di
una retta.
Un discorso simile si può sviluppare per funzioni di due variabili. Qui lo zoom si deve
fare intorno ad un punto della superficie che rappresenta il grafico di una funzione diffe-
renziabile. E il grafico si discosterà poco da un piano (il suo piano tangente in quel punto),
così che potremo approssimare la funzione, in un intorno del punto, tramite l’equazione del
piano tangente.
Sia S la superficie dell’equazione z = f (x, y), con f differenziabile e di classe C 1 . Sia
P0 (x0 , y0 , f (x0 , y0 ) un punto di S. Consideriamo le curve che intersecano i piani verticali
y = y0 e x = x0 sulla superficie S. Il punto di intersezione della due curve è proprio il punto
P0 . Siano T1 e T2 le rette tangenti alle due curve nel punto P0 (le pendenze di queste rette
sono date dalle derivate parziali rispetto a x e y). Allora il piano tangente alla superficie
S nel punto P0 è definito come il piano che contiente entrambe le rette tangenti T1 e T2 .
Possiamo pensare a questo piano tangente come il piano in cui ci sono tutte le possibili
rette tangenti per P0 alle curve che giacciono su S e passano attraverso P0 (considerando le
derivate direzionali). Il piano tangente è quindi il piano che più approssima la superficie S
intorno al punto P0 .
Un piano passante per il punto P0 ha equazione nella forma
a(x − x0 ) + b(y − y0 ) + c(z − f (x0 , y0 )) = 0
Dividendo per c e ponendo A = −a/c e B = −b/c, possiamo scrivere
z − f (x0 , y0 ) = A(x − x0 ) + B(y − y0 )
Se questa equazione deve rappresentare l’equazione del piano tangente a P0 sulla superficie,
vuol dire che l’intersezione con il piano y = y0 deve essere la retta tangente T1 . Ponendo
y = y0 , l’equazione si riduce a
z − f (x0 , y0 ) = A(x − x0 ), y = y0
Ora questa è l’equazione di una retta che ha pendenza A. Ma la pendenza della tangente T1
è fx (x0 , y0 ). Perciò A = fx (x0 , y0 ).
Allo stesso modo, considerando il piano x = x0 , il piano tangente si riduce a
z − f (x0 , y0 ) = B(y − y0 ), x = x0
che rappresenta la retta tangente T2 con pendenza B = fy (x0 , y0 ).
Quindi l’equazione del piano tangente è data da
z − f (x0 , y0 ) = fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ).

31
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI

3.11 Formula di Taylor


Quando si considerano funzioni scalari differenziabili e continue, la formula di Taylor è
utile per approssimare la funzione in un intorno di un punto. Data la funzione f (x) e x0 un
punto che appartiene all’insieme di definizione della f , possiamo scrivere:

(x − x0 )2 00
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + f (ξx )
2
dove ξx è un punto che si trova nell’insieme di definizione della f ed è compreso tra x e x0 .
La formula appena scritta prende il nome di formula di Taylor di centro x0 e permette di
approssimare la funzione f (x) in un intorno di x0 utlizzando i valori della funzione in x0 . Il
polinomio T1 (x) = f (x0 ) + f 0 (x0 )(x − x0 ) è il polinomio di Taylor di primo grado. In questo caso
rappresenta la retta tangente alla funzione f nel punto x0 . Se noi approssiamo f (x) mediante
(x − x0 )2 00
il polinomio di Taylor di primo grado, commettiamo un errore dato da R1 (x) = f (ξx ),
2
che possiamo maggiorare, in valore assoluto, considerando M = max |f 00 (x)| per x che varia
(x − x0 )2 00 (x − x0 )2
nell’insieme di definizione della f , ottenendo | f (ξx )| ≤ |M |, un errore del
2 2
secondo ordine.
In generale, il polinomio di Taylor di grado n è dato da

f 00 (x0 ) f (3) (x0 ) f (n) (x0 )


Tn (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + (x − x0 )2 + (x − x0 )3 + . . . + (x − x0 )n
2! 3! n!
Se approssimiamo f (x) con il polinomio di Taylor Tn (x), l’errore che si commette è di ordine
f (n+1) (ξx )
n + 1, poichè vale Rn (x) = (x − x0 )n+1 .
(n + 1)!
Nel caso di funzioni di più variabili, il polinomio di Taylor deve considerare le derivate
parziali della funzioni.

Teorema 3.11.1 Consideriamo una funzione f (x, y) di classe C 2 . Allora per ogni punto P0
nell’insieme di definizione della f , vale la formula di Taylor data da

f (x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 )


1 1
+ fxx (ξx , ηy )(x − x0 )2 + fxy (ξx , ηy )(x − x0 )(y − y0 ) + fyy (ξx , ηy )(y − y0 )2
2 2
dove Q(ξx , ηy ) è un opportuno punto che si trova sul segmento di estremi P e P0 .
Se approssimiamo la funzione f (x, y) con il polinomio di Taylor di primo grado dato da

T1 (x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 )

commettiamo un errore dato da


1 1
R1 (x) = fxx (ξx , ηy )(x − x0 )2 +xy (ξx , ηy )(x − x0 )(y − y0 ) + fyy (ξx , ηy )(y − y0 )2
2 2
che è un errore del secondo ordine (abbiamo infatti le potenze (x − x0 )2 , (x − x0 )(y − y0 ),
(y − y0 )2 ).
Osserviamo che il polinomio di Taylor T1 (x, y) altro non è che l’equazione del piano
tangente alla superficie della funzione f (x, y) nel punto (x0 , y0 , f (x0 , y0 )).
Se consideriamo il polinomio di Taylor di ordine zero per approssimare la funzione f (x, y),
abbiamo il cosidetto teorema di Lagrange.

32
3.11. Formula di Taylor

Teorema 3.11.2 (di Lagrange) Data f : A −→ R con A ⊂ R2 , f di classe C 1 , e dato P0 (x0 , y0 ) ∈


A, si ha

f (x, y) = f (x0 , y0 ) + fx (ξx , ηy )(x − x0 ) + fy (ξx , ηy )(y − y0 )

dove Q(ξx , ηy ) è un opportuno punto che si trova sul segmento di estremi P e P0 .

33
C APITOLO 4
Massimi e minimi

La maggior parte delle idee


fondamentali della scienza
sono essenzialmente semplici,
e possono, come una regola,
essere espresse in un
linguaggio comprensibile a
tutti.

Albert Einstein (1879-1955)

4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35


4.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3 Ricerca di massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4 Sui massimi e minimi assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5.1 Equazione di una retta e vettore normale alla retta . . . . . . . . . . . . . . 47
4.6 Curve di livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.6.1 Significato del vettore gradiente . . . . . . . . . . . . . . . . . . . . . . . . . 50
4.7 Estremi vincolati e moltiplicatori di Lagrange . . . . . . . . . . . . . . . . . . . . . 52

4.1 Forme quadratiche


Prima di passare a definire i massimi e minimi di una funzione di più variabili, ci conviene
introdurre il concetto di forma quadratica perchè ci servirà per poter calcolare i massimi e i
minimi.
Nello spazio R2 , una forma quadratica è un polinomio omogeneo di secondo grado nelle
variabili x e y. Ad esempio, F (x, y) = 3x2 + 5xy + 2y 2 o F (x, y) = x2 + 10xy − 7y 2 sono forme
quadratiche.
Una forma quadratica si può scrivere utilizzando prodotti di matrici e vettori come
  
 a11 a12 x
F (x, y) = x y
a21 a22 y
dove il vettore di componenti
  è scritto prima come vettore riga e poi come vettore
(x, y)
a11 a12
colonna. La matrice A = è la matrice dei coefficienti della forma quadratica.
a21 a22
Eseguendo il prodotto di A con il vettore colonna (x, y) otteniamo:
    
a11 a12 x a11 x + a12 y
=
a21 a22 y a21 x + a22 y

35
4. M ASSIMI E MINIMI

Dobbiamo poi moltiplicare il vettore riga (x, y) per il vettore colonna appena ottenuto (facendo
un prodotto scalare tra vettori) ricavando:
 
 a11 x + a12 y
x y = x(a11 x + a12 y) + y(a21 x + a22 y) = a11 x2 + a12 xy + a21 xy + a22 y 2
a21 x + a22 y

In definitiva, abbiamo F (x, y) = a11 x2 + (a12 + a21 )xy + a22 y 2 .


La matrice dei coefficienti della forma quadratica si può scrivere come una matrice sim-
metrica (con a12 = a21 ). Se così non fosse, la si può rendere simmetrica prendendo come
coefficiente di riga 1 e colonna 2 (e di riga 2 e colonna1) la semisomma dei valori a12 e a21
a12 + a21
della matrice non simmetrica: vale infatti a12 + a21 = 2 .
2

Esempio
Es. 4.1.1 Sia F (x, y) = x2 + 10xy − 7y 2 . Possiamo scrivere questa forma quadratica in
forma matriciale ponendo A in forma non simmetrica:
  
 1 2 x
F (x, y) = x y
8 −7 y

oppure possiamo scrivere A in forma simmetrica prendendo come valore per gli elementi
extra diagonali la semisomma dei corrispondenti elementi della matrice non simmetrica
  
 1 5 x
F (x, y) = x y
5 −7 y

In entrambi i casi, il risultato è sempre lo stesso, la forma quadratica F (x, y) = x2 + 10xy −


7y 2 .
In generale, una forma quadratica in R2 viene rappresentata utilizzando una matrice
simmetrica nella forma
  
 a b x
F (x, y) = x y
b c y

da cui

F (x, y) = ax2 + 2bxy + cy 2 .

Nel caso dello spazio Rn si generalizza la definizione di forma quadratica nel modo
seguente.

Definizione 4.1.1 Una forma quadratica in Rn è un polinomio omogeneo di secondo grado


nelle n variabili x1 , x2 , . . . , xn , a coefficienti reali. Una forma quadratica si può scrivere come
n
X
F (x1 , x2 , . . . , xn ) = aij xi xj
i,j=1

In forma matriciale si può scrivere come


 
a11 a12 ... a1n  x1 
  a21
 a22 ... a2n 
  x2 
F (x1 , x2 , . . . , xn ) = x1 x2 ... xn  . .. ..   
 .. . ... .  ...
 
an1 an2 ... ann xn

36
4.1. Forme quadratiche

Se la matrice della forma quadratica non è simmetrica la si può rendere simmetrica come
abbiamo visto in R2 .
Torniamo ora a considerare forme quadratiche in R2 visto che lavoreremo soprattutto in
questo spazio.

Definizione 4.1.2 Una forma quadratica F (x, y) si dice


G definita positiva se, per ogni (x, y) 6= (0, 0), F (x, y) > 0;
G semidefinita positiva se, per ogni (x, y) 6= (0, 0), F (x, y) ≥ 0;
G definita negativa se, per ogni (x, y) 6= (0, 0), F (x, y) < 0;
G semidefinita negativa se, per ogni (x, y) 6= (0, 0), F (x, y) ≤ 0;
G indefinita se esistono almeno due punti (x1 , y1 ) e (x2 , y2 ) tali che F (x1 , y1 ) > 0 e F (x2 , y2 ) <
0.
Come fare a capire se una forma quadratica è definita positiva, negativa o indefinita?
Abbiamo il seguente teorema.

Teorema 4.1.1 Data la forma quadrata F (x, y) = ax2 + 2bxy + cy 2 :


G se det(A) = ac − b2 > 0 e a > 0 allora F (x, y) è definita positiva;
G se det(A) = ac − b2 > 0 e a < 0 allora F (x, y) è definita negativa;
G se det(A) = ac − b2 < 0 allora F (x, y) è indefinita.
Vale anche il viceversa:
G se F (x, y) è definita positiva allora det(A) = ac − b2 > 0 e a > 0;
G se F (x, y) è definita negativa allora det(A) = ac − b2 > 0 e a < 0;
G se F (x, y) è indefinita allora det(A) = ac − b2 < 0.
Dimostrazione. Ricordiamo innanzitutto che det(A) rappresenta il determinante della
matrice A che caratterizza la forma quadratica e che vale det(A) = ac − b2 .
Scriviamo ora la forma quadratica mettendo in evidenza il coefficiente a e aggiungendo e
b2
sottraendo 2 y 2 , otteniamo:
a
F (x, y) = ax2 + 2bxy + cy 2
 
b c
= a x2 + 2 xy + y 2
a a
b2 b2
 
b c
= a x2 + 2 xy + 2 y 2 − 2 y 2 + y 2
a a a a

b b2 b b2 c ac − b2 2
Osserviamo che x2 + 2 xy + 2 y 2 = (x + y)2 . Inoltre − 2 y 2 + y 2 = y .
a a a a a a2
Abbiamo dunque

ac − b2 2
 
b
F (x, y) = a (x + y)2 + y
a a2

La forma quadratica è dunque data dal prodotto di a per la somma di due termini: il termine
b ac − b2 2
(x + y)2 è il quadrato di un binomio ed è sempre positivo; il termine y può essere
a a2
2
positivo o negativo a seconda del segno di ac − b .
Se a > 0 e ac − b2 > 0 allora la forma quadratica è sempre maggiore di zero e quindi è
definita positiva.
Se a < 0 e ac − b2 > 0, la forma quadratica è definita negativa.
Se invece ac − b2 < 0 possiamo avere valori di (x, y) per cui la forma quadratica è positiva
e altri valori per cui la forma quadratica è negativa.

37
4. M ASSIMI E MINIMI

Viceversa, supponiamo che la F sia definita positiva, negativa o indefinita. Mettiamo in


evidenza il termine y 2 nella forma quadratica. Si ha
 2 
x x
F (x, y) = y 2 a 2 + 2b + c
y y
x
Poniamo t = in modo da poter scrivere
y

F (x, y) = y 2 (at2 + 2bt + c)

Supponiamo che la forma quadratica sia definita positiva: vuol dire che y 2 (at2 + 2bt + c) > 0
per ogni coppia (x, y) 6= (0, 0), quindi deve essere at2 + 2bt + c > 0 per ogni t: questo si ha con
a > 0 e con il discriminante dell’equazione di secondo grado in t negativo, cioè 4b2 − 4ac < 0,
vale a dire ac − b2 > 0.
Se invece la forma quadratica è definita negativa, vuol dire che at2 + 2bt + c < 0 per ogni
valore di t, quindi deve essere a < 0 e il discriminante negativo, quindi ancora ac − b2 > 0.
Se invece la forma quadratica è indefinita, possiamo avere sia valori positivi che valori
negativi, perciò il discriminante dell’equazione di secondo grado in t deve essere positivo,
cioè ac − b2 < 0.1 4
Nel caso di forme quadratiche in Rn , l’analogo teorema per vedere se una forma quadra-
tica è definita positiva, negativa o indefinita è dato dal teorema di Sylvester, che considera i
determinanti di tutti i minori principali delle matrice A che definisce la forma quadratica.

Definizione 4.1.3 Data A matrice di n righe e n colonne, si definisce minore principale di


ordine k e si indica con Ak la matrice che si forma dalla matrice A prendendo le prime k righe
e k colonne della matrice stessa.
 
a11 a12 . . . a1k
  a21 a22 . . . a2k 
a11 a12
Quindi A1 = (a11 ), A2 = , Ak =  . .. .. .
 
a21 a22  .. . ... . 
ak1 ak2 ... akk

Teorema
Pn 4.1.2 (di Sylvester) Data una forma quadratica in Rn , F (x1 , x2 , . . . , xn ) =
i,j=1 aij xi xj , allora
G F è definita positiva se e solo se det(Ak ) > 0 per ogni k = 1, 2, . . . , n;
G F è definita negativa se e solo se (−1)k det(Ak ) > 0 per ogni k = 1, 2, . . . , n.
1 Per la seconda parte di questo teorema ci siamo rifatti alle note proprietà:
G ax2 + bx + c = 0
– se ∆ = b2 − 4ac < 0 ⇒ non esistono radici reali all’equazione;
−b
– se ∆ = 0 ⇒ le radici sono coincidenti x1 = x2 = ;
2a √
−b ± ∆
– se ∆ > 0 ⇒ esistono due radici reali e distinte date da .
2a
G ax2 + bx + c > 0, a > 0
– se ∆ = b2 − 4ac < 0 ⇒ l’insieme delle soluzioni che soddisfano la disequazione data è tutto R
– se ∆ = 0 ⇒ l’insieme delle soluzioni è tutto R privato della radice dell’equazione ax2 + bx + c = 0
– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori esterni all’intervallo delle due radici dell’equazione
di secondo grado.
G ax2 + bx + c < 0, a > 0
– se ∆ ≤ 0 ⇒ non ci sono soluzioni per questa disequazione;
– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori interni all’intervallo delle due radici dell’equazione.

38
4.2. Massimi e minimi

4.2 Massimi e minimi


Per funzioni scalari, le derivate della funzione aiutano a capire e a trovare i suoi valori
massimi e minimi e i punti in cui la funzione assume tali valori. Per funzioni di due variabili,
sono di aiuto le derivate parziali.

Definizione 4.2.1 Sia data una funzione di due variabili f (x, y) definita in un sottoinsieme
I ⊂ R2 .
G Se esiste un punto P0 (x0 , y0 ) tale che per ogni P (x, y) ∈ I, risulta

f (x, y) ≤ f (x0 , y0 )

allora P0 si dice punto di massimo assoluto per la funzione f e il valore f (x0 , y0 ) si dice
massimo assoluto della funzione.
G Se esiste un punto P0 (x0 , y0 ) tale che per ogni P (x, y) ∈ I, P 6= P0 risulta

f (x, y) < f (x0 , y0 )

allora P0 si dice punto di massimo assoluto proprio per la funzione f e il valore f (x0 , y0 )
si dice massimo assoluto proprio della funzione.
Cambiando il segno alle diseguaglianze abbiamo la definizione di minimo assoluto e minimo
assoluto proprio.
G Se esiste un punto P0 (x0 , y0 ) tale che per ogni P (x, y) ∈ I, risulta

f (x, y) ≥ f (x0 , y0 )

allora P0 si dice punto di minimo assoluto per la funzione f e il valore f (x0 , y0 ) si dice
minimo assoluto della funzione.
G Se esiste un punto P0 (x0 , y0 ) tale che per ogni P (x, y) ∈ I, P 6= P0 risulta

f (x, y) > f (x0 , y0 )

allora P0 si dice punto di minimo assoluto proprio per la funzione f e il valore f (x0 , y0 ) si
dice minimo assoluto proprio della funzione.
Se queste definizioni valgono non in tutto l’insieme di definizione della funzione f ma local-
mente, in un intorno di P0 , allora si ottengono le definizioni di punto di massimo (o minimo)
relativo (o relativo proprio).

Definizione 4.2.2 Sia data una funzione di due variabili f (x, y) definita in un sottoinsieme
I ⊂ R2 .
G Se esiste un punto P0 (x0 , y0 ) e un intorno di centro P0 e opportuno raggio r tale che per
ogni P (x, y) ∈ Ar (P0 ), risulta

f (x, y) ≤ f (x0 , y0 )

allora P0 si dice punto di massimo relativo per la funzione f e il valore f (x0 , y0 ) si dice
massimo relativo della funzione.
G Se esiste un punto P0 (x0 , y0 ) e un intorno di centro P0 e opportuno raggio r tale che per
ogni P (x, y) ∈ Ar (P0 ), P 6= P0 , risulta

f (x, y) < f (x0 , y0 )

allora P0 si dice punto di massimo relativo proprio per la funzione f e il valore f (x0 , y0 ) si
dice massimo relativo della funzione.

39
4. M ASSIMI E MINIMI

Cambiando il segno alle diseguaglianze abbiamo la definizione di minimo relativo e minimo


relativo proprio.

Definizione 4.2.3 I valori massimo e minimo (assoluti o relativi) assunti dalla funzione si
chiamano anche estremi (assoluti e relativi) della funzione.
Un punto di estremo relativo interno all’insieme di definizione della funzione f si chiama
punto di estremo relativo interno.

Teorema 4.2.1 Se una funzione f : I −→ R, con I ⊂ R2 , I aperto, f ∈ C 1 (I), ammette un


punto di massimo o minimo relativo interno nel punto P0 (x0 , y0 ) allora esistono le derivate
parziali della f in P0 e vale fx (P0 ) = fy (P0 ) = 0

Dimostrazione. Sia P0 (x0 , y0 ) un punto di massimo (o minimo) relativo interno. Poniamo


g(x) = f (x, y0 ). Come conseguenza la funzione g ammette in x = x0 un punto di massimo (o
minimo) relativo interno e, quindi, g 0 (x0 ) = 0. Ma g 0 (x0 ) = fx (x0 , y0 ). Perciò vale fx (x0 , y0 ) = 0.
Allo stesso modo, posto h(y) = f (x0 , y), si ha che y0 è punto di massimo (o minimo) relativo
interno per la funzione h, da cui h0 (y0 ) = 0. Ma h0 (y0 ) = fy (x0 , y0 ) e quindi fy (x0 , y0 ) = 0. 4
Perciò, se P0 è un punto di estremo relativo interno per la funzione f , necessariamente il
gradiente della f in P0 è il vettore nullo:

~ )(P0 ) = (00).
∇(f

Non vale il viceversa, tuttavia se dobbiamo cercare i punti di massimo e minimo relativo
interni all’insieme di definizione di una funzione, dobbiamo analizzare quei punti che hanno
il gradiente nullo perchè tra questi ci saranno i punti di massimo e minimo relativi. Se
l’insieme di definizione della funzione è un insieme aperto, i punti di massimo e minimo
relativo sono tutti punti interni all’insieme di definizione.
Vale la seguente definizione.

~ )(P0 ) = (00) si dice punto critico (o


Definizione 4.2.4 Un punto P0 (x0 , y0 ) tale che ∇(f
stazionario) della funzione f .

4.3 Ricerca di massimi e minimi relativi


Per capire se una funzione ha un punto di massimo o minimo relativo in un suo punto
critico, viene in aiuto il cosiddetto test sulle derivate seconde. A tale scopo introduciamo la
seguente definizione.

Definizione 4.3.1 Data una funzione f ∈ C 2 (I), con I ⊂ R2 , I aperto, e dato un punto P0 ∈ I,
si definisce hessiano della f in P0 il determinante Hf (P0 ) della matrice
 
fxx (P0 ) fxy (P0 )
fxy (P0 ) fyy (P0 )

Poichè la funzione è di classe C 2 , vale fxy = fyx .


Quindi

f (P ) fxy (P0 )
Hf (P0 ) = xx 0 = fxx (P0 )fyy (P0 ) − (fxy (P0 ))2
fxy (P0 ) fyy (P0 )

Teorema 4.3.1 (Test sulle derivate seconde) Data una funzione f ∈ C 2 (I), con I ⊂ R2 , I
aperto, e dato P0 punto critico per f , avente come hessiano Hf (P0 ) = fxx (P0 )fyy (P0 )−(fxy (P0 ))2 ,
si ha:

40
4.3. Ricerca di massimi e minimi relativi

G se H (P ) > 0 e f (P ) > 0, allora P è un punto di minimo relativo interno proprio e f (P )


f 0 xx 0 0 0
è un valore di minimo relativo;
G se H (P ) > 0 e f (P ) < 0, allora P è un punto di massimo relativo interno proprio e
f 0 xx 0 0
f (P ) è un valore di massimo relativo;
G se H (P ) < 0 allora P non è nè punto di massimo nè punto di minimo relativo e si chiama
0
f 0 0
punto di sella.
Osserviamo che se vale Hf (P0 ) = 0, P0 può essere punto di minimo, massimo o di sella: bisogna
indagare caso per caso.
Dimostrazione. Per dimostrare questo teorema, applichiamo la formula di Taylor di
centro P0 alla funzione f :

f (x, y) = f (x0 , y0 ) + fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 )


1 1
+ fxx (ξx , ηy )(x − x0 )2 + fxy (ξx , ηy )(x − x0 )(y − y0 ) + fyy (ξx , ηy )(y − y0 )2
2 2
Considerando x = x0 + h e y = y0 + k, poichè P0 è un punto critico, la formula si riduce a
1 1
f (x0 + h, y0 + k) = f (x0 , y0 ) + fxx (ξx , ηy )h2 + fxy (ξx , ηy )hk + fyy (ξx , ηy )k 2
2 2
1
fxx (ξx , ηy )h + 2fxy (ξx , ηy )hk + fyy (ξx , ηy )k 2
2

= f (x0 , y0 ) +
2

dove (ξx , ηy ) è un punto che non conosciamo, sul segmento di estremi P e P0 .


In un opportuno intorno di P0 , per il teorema della permanenza del segno, se vale
fxx (x0 , y0 ) > 0 vale anche fxx (x, y) > 0 nell’intorno di P0 . Alla stessa maniera, sempre per
lo stesso teorema sulla permanenza del segno, se Hf (P0 ) > 0 anche Hf (P ) > 0 nell’intorno di
P0 .
Supponiamo, allora di trovarci nelle ipotesi in cui Hf (P0 ) > 0 e fxx (P0 ) > 0. Allora la forma
quadratica data da

F0 (h, k) = fxx (P0 )h2 + 2fxy (P0 )hk + fyy (P0 )k 2

ha il determinante della matrice ad essa associata che vale det(A) = fxx (P0 )fyy (P0 )−(fxy (P0 ))2
cioè det(A) = Hf (P0 ). Poichè per ipotesi, Hf (P0 ) > 0 e fxx (P0 ) > 0, allora la forma quadratica
è definita positiva. La stessa cosa vale per la forma quadratica definita in un opportuno
intorno di P0 , considerando il punto (ξx , ηx ) della formula di Taylor: la forma quadratica
data da Fξ,η (h, k) = fxx (ξx , ηy )h2 + 2fxy (ξx , ηy )hk + fyy (ξx , ηy )k 2 è una forma quadratica positiva,
cioè Fξ,η (h, k) > 0. Riprendendo la formula di Taylor, in un intorno di P0 risulta quindi
1
f (x, y) = f (x0 , y0 ) + Fξ,η (h, k)
2
da cui
1
f (x, y) − f (x0 , y0 ) = Fξ,η (h, k) > 0
2
cioè

f (x, y) > f (x0 , y0 ).

Il punto P0 è perciò un punto di minimo relativo proprio.


Analogamente si provano gli altri due casi: se l’hessiano in P0 è positivo e fxx (P0 ) < 0
allora la forma quadratica associata è definita negativa e, dalla formula di Taylor, risulta
che P0 è un punto di massimo relativo. Se invece l’hessiano è negativo, la forma quadratica

41
4. M ASSIMI E MINIMI

Figura 4.1: Grafico della funzione f (x, y) = x4 + y 4 − 4xy + 2.

associata è indefinita e quindi P0 non può essere nè di massimo nè di minimo, ma è un


punto di sella. 4

Esempio
Es. 4.3.1 Calcolare i punti di massimo e minimo relativo e i corrispondenti valori di
massimo e minimo della funzione f (x, y) = x4 + y 4 − 4xy + 2.
Calcoliamo i punti critici della funzione calcolando le derivate parziali prime e ponendole
uguali a zero:
(
fx (x, y) = 4x3 − 4y = 0
fy (x, y) = 4y 3 − 4x = 0

Dalla prima equazione abbiamo y = x3 e sostituendo nella seconda equazione ricaviamo

0 = 4(x9 −x) = 4x(x8 −1) = 4x(x4 −1)(x4 +1) = 4x(x2 −1)(x2 +1)(x4 +1) = 4x(x−1)(x+1)(x2 +1)(x4 +1)

Le radici reali sono tre x = 0, x = 1, x = −1, che, insieme alla relazione y = x3 , ci danno i
tre punti critici P0 (0, 0), P1 (1, 1) e P2 (−1, −1).
Per ciascuno di questi punti critici applichiamo il teorema del test sulle derivate seconde.
In questo caso le derivate parziali seconde sono:

fxx = 12x2 , fxy = −4, fyy = 12y 2

Per il punto P0 abbiamo Hf (P0 ) = −16 < 0, quindi possiamo dire subito che P0 è un punto
di sella.
Per P1 si ha Hf (P1 ) = 128 > 0, fxx (P1 ) = 12 > 0, quindi P1 è un punto di minimo relativo
interno proprio con valore minimo f (P1 ) = 0.
Per P2 vale Hf (P2 ) = 128 > 0, fxx (P2 ) = 12 > 0, quindi P2 è un altro punto di minimo
relativo interno proprio con valore minimo f (P2 ) = 0.
In Figura 4.1 possiamo osservare come P1 e P2 siano punti di minimo mentre P0 è un
punto di sella.

42
4.4. Sui massimi e minimi assoluti

Figura 4.2: Grafico della funzione f (x, y) = 2y 2 .

Esempio
Es. 4.3.2 Consideriamo ora la funzione f (x, y) = 2y 2 e cerchiamo i punti di massimo e
minimo relativo. Per i punti critici, imponiamo che il gradiente della funzione sia uguale
a zero, quindi
(
fx = 0
fy = 4y = 0

La fx vale sempre zero perchè la f non dipende da x, Dalla seconda equazione ricaviamo
y = 0, da cui i punti critici della funzione sono tutti i punti di coordinate (x, 0), cioè tutti i
punti dell’asse delle x.
Andiamo a calcolare l’Hessiano in questi punti. Poichè fxx = 0, fxy = 0, e fyy = 4, segue
che Hf (x, 0) = 0. Quindi il teorema sul test delle derivate seconde non ci può dire nulla.
In tal caso, dobbiamo vedere come è fatta la funzione e cercare di capire cosa succede in
un intorno di questi punti critici.
Fissato x = x0 , per il punto (x0 , 0), in un suo qualunque intorno vale f (x, y) = 2y 2 ≥ 0 =
f (x0 , 0) (posso prendere anche un punto che ha y = 0 ma x 6= x0 ). Si conclude quindi
che (x0 , 0) è un punto di minimo relativo. Questo vale per tutti i punti (x, 0), che sono,
dunque, tutti punti di minimo relativo (non proprio). Si veda la Figura 4.2 per confrontare
i risultati.

4.4 Sui massimi e minimi assoluti


Per funzioni scalari, il teorema di Weierstrass assicura che se una funzione è continua in
un intervallo chiuso e limitato allora essa ammette massimo e minimo (assoluti).
Lo stesso teorema vale anche per funzioni di più variabili.

Teorema 4.4.1 (di Weierstrass) Data una funzione continua f : I −→ R, con I ⊂ R2 , I


insieme chiuso e limitato (quindi compatto), la f ammette massimo e minimo (assoluti) in I.

43
4. M ASSIMI E MINIMI

Questo teorema è utile per trovare massimi e minimi assoluti di una funzione continua
in un insieme compatto I. Si può applicare questo metodo:
1. si calcola il valore della f nei punti critici della f che si trovano all’interno di I;
2. si studia la funzione sulla frontiera di I e si cercano i valori estremi della f sulla
frontiera;
3. il più grande dei valori trovati ai passi 1 e 2 rappresenta il valore assoluto massimo della
funzione; il più piccolo dei valori trovati rappresenta il valore minimo assoluto della
funzione. I corrispondenti punti sono rispettivamente i punti di massimo e minimo
assoluti della funzione.
Osserviamo, quindi, che la procedura per trovare i valori estremi assoluti di una funzione,
in un insieme compatto, è diversa dalla procedura per trovare gli estremi relativi di una
funzione mediante il test delle derivate seconde.
A volte, si cercano sia gli estremi assoluti sia gli estremi relativi di una funzione e, in
questo caso, vanno seguite entrambe le strade.

Esempio
Es. 4.4.1 Si devono trovare gli estremi assoluti della funzione f (x, y) = x2 − 4xy + 4y sul
rettangolo D = {(x, y) : 0 ≤ x ≤ 2, 0 ≤ y ≤ 4}.
L’insieme D è un insieme chiuso e limitato (il rettangolo di vertici A(0, 0), B(2, 0), C(2, 4),
D(0, 4)), la funzione è polinomiale, perciò continua. Ci troviamo nelle ipotesi del teorema
di Weierstrass, quindi esistono il massimo e il minimo assoluti della funzione in D.
Cerchiamo i punti critici interni: da fx = 2x − 4y e fy = −4x + 4, ponendo queste derivate
uguali a zero abbiamo il sistema di equazioni
(
2x − 4y = 0
4 − 4x = 0

1
Dalla seconda equazione ricaviamo x = 1, da cui, nella prima, 4y = 2, cioè y = . Ottenia-
2
1
mo il punto critico P0 (1, ). Il punto P0 si trova all’interno dell’insieme D (se così non fosse
2
non lo dovremmo prendere in considerazione). Calcoliamo f (P0 ) = 1. Non dobbiamo vede-
re se questo è un punto di massimo o minimo relativo (non è richiesto), quindi passiamo
a vedere cosa succede alla funzione sulla frontiera (se invece dovessimo calcolare anche
gli estremi relativi, a questo punto dovremmo applicare il test della derivata seconda). La
frontiera dell’insieme I è dato dall’unione dei segmenti AB, BC, CD e DA.
Il segmento AB ha equazione y = 0 con 0 ≤ x ≤ 2. Su questo segmento la funzione f si
riduce ad una funzione della sola variabile x, g(x) = f (x, 0) = x2 , con 0 ≤ x ≤ 2. Si vede
facilmente (poichè g 0 (x) = 2x ≥ 0 nell’intervallo dato) che la g è una funzione crescente
in [0, 2]: il suo valore minimo si ha per x = 0 (g(0) = 0) e il suo valore massimo per x = 2
(g(2) = 4). Quindi dal segmento AB dobbiamo ricordare i punti A e B dove la funzione
vale 0 e 4 rispettivamente.
Il segmento BC ha equazione x = 2 con 0 ≤ y ≤ 4. Qui la funzione si riduce a h(y) =
f (2, y) = 4 − 8y + 4y = 4 − 4y nell’intervallo [0, 4]. La funzione è decrescente (h0 (y) = −4 < 0),
quindi assume valore massimo in 0 (h(0) = 4) e minimo in 4 (h(4) = −12). Per y = 0
ritroviamo il punto B, per y = 4 troviamo il vertice C.
Sul segmento CD, di equazione y = 4, con 0 ≤ x ≤ 2, la funzione diventa g(x) = f (x, 4) =
x2 − 16x + 16 per x ∈ [0, 2]. La derivata g 0 (x) = 2x − 16 si annulla per x = 8 che è un punto
all’esterno dell’intervallo in cui deve variare la x (se fosse all’interno avremmo trovato
un punto critico da considerare ai fini del calcolo degli estremi della f ). Si ha g 0 (x) < 0
per 2x − 16 < 0 cioè x < 8: quindi nell’intervallo [0, 2] la g è decrescente e assume valore
massimo in 0 (g(0) = 16) e valore minimo in 2 (g(2) = −12). Per x = 0 abbiamo il vertice D,
per x = 2 ritroviamo C.

44
4.5. Funzioni implicite

Figura 4.3: Grafico della funzione f (x, y) = x2 − 4xy + 4y nell’insieme compatto [0, 2] × [0, 4].

Arriviamo infine al segmento AD dato dall’equazione x = 0, per 0 ≤ y ≤ 4. La funzione


diventa h(y) = f (0, y) = 4y. La funzione è crescente e assume valore minimo e massimo
rispettivamente agli estremi 0 e 4. Ritroviamo i punti A e D.
1
Quindi i valori da confrontare sono: P1 (1, ) dove f (P1 ) = 1, A dove f (A) = 0, B con
2
f (B) = 4, C dove f (C) = −12, e D con f (D) = 16.
Dal confronto segue che il massimo assoluto vale 16 e punto di massimo assoluto è D,
mentre il minimo assoluto è −12 con punto di minimo assoluto C.

4.5 Funzioni implicite


Nello studiare funzioni scalari, abbiamo visto funzioni del tipo y = f (x): la variabile y è
funzione esplicita della variabile y:
p
y = sin (x), y = x3 + 2, y = ln x + 4, . . . . . .

Ma ci sono anche funzioni che sono definite implicitamente da una relazione tra x e y
come, ad esempio,
2
x2 + y 2 = 9 o x3 + y 3 = 12xy o xyexy + 3ye−x = 0 o ...

In alcuni casi è possibile risolvere questo tipo di equazioni scrivendo y come una funzione
esplicita (o più funzioni esplicite) di x. √
2
√ Nel caso di x + √ y 2 = 9, si ottiene y = ± 9 − x2 , quindi due troviamo due funzioni f (x) =
9 − x2 e g(x) = − 9 − x2 . I grafici della f e della g sono rispettivamente il semicerchio
superiore e inferiore della circonferenza x2 + y 2 = 9 e, insieme, ci danno il grafico di tutta la
circonferenza.
Non è altrettanto facile trovare un’espressione esplicita di y come funzione di x nel caso
di x3 + y 3 = 12xy: potremmo usare la formula per trovare le radici di un polinomio di terzo

45
4. M ASSIMI E MINIMI

grado (supponendo x costante). Ma le formule sono talmente complicate che non le scriviamo
neanche! Ci accontentiamo di sapere che è possibile risolvere il problema.
2
Per la funzione xyexy + 3ye−x = 0 non riusciamo a trovare una formula esplicita che ci
permetta di scrivere y in funzione di x o viceversa x come funzione di y.
Si ha quindi questo problema: data un’equazione f (x, y) = 0 è possibile scrivere y = g(x)
tale che f (x, g(x)) = 0? In tal caso diremo che la y = g(x) è definita implicitamente dalla f . Si
ha la seguente definizione.

Definizione 4.5.1 Data una funzione f (x, y) definita in un sottoinsieme di R2 , diciamo che
la funzione y = g(x) definita in un intervallo di R è definita implicitamente dall’equazione
f (x, y) = 0 se, per ogni x che appartiene all’intervallo di definizione della g, si ha che
G il punto (x, g(x)) appartiene all’insieme di definizione della f ;
G f (x, g(x)) = 0.
Dire f (x, y) = 0 vuol dire intersecare il grafico della superficie della funzione f con il piano
z = 0, cioè con il piano xy, ricavandone quindi una curva. Per tutti quei punti per cui
(x, g(x)) ∈ I e f (x, g(x)) = 0 il grafico della g coincide con il grafico della curva f (x, y) = 0.
Per capire se esiste una funzione g definita implicitamente dalla f e se è unica, si ha il
seguente teorema.

Teorema 4.5.1 (delle funzioni implicite o teorema di Dini) Sia data una funzione f :
I −→ R con I ⊂ R2 , I aperto, f ∈ C 1 (I). Sia P0 (x0 , y0 ) ∈ I tale che f (x0 , y0 ) = 0 e fy (x0 , y0 ) 6= 0.
Allora esiste un’unica funzione y = g(x) definita in un opportuno intorno di x0 (]x0 − , x0 + [),
di classe C 1 , tale che, per ogni x ∈]x0 − , x0 + [ risulta
G y0 = g(x0 )
G (x, g(x)) ∈ I
G f (x, g(x)) = 0
G g 0 (x) = −
fx (x, g(x))
fy (x, g(x))
.

La formula della derivata prima di g si ottiene applicando le regole di derivazione per le


funzioni composte. Poichè fy (x0 , y0 ) 6= 0, per il teorema della permanenza del segno si ha
fy (x, g(x)) 6= 0 in un intorno di (x0 , y0 ). Deriviamo ambo i membri dell’equazione f (x, g(x)) = 0
rispetto alla variabile x (è come se avessimo x = t, y = g(x) = g(t) ma continuiamo a chiamare
la variabile t con x). Abbiamo
df
=0
dx
dx
Ma (considerando che = 1)
dx
df
= fx (x, g(x)) + fy (x, g(x))g 0 (x).
dx
Dunque

fx (x, g(x)) + fy (x, g(x))g 0 (x) = 0

Poichè, per l’ipotesi fy (x0 , y0 ) 6= 0 (quindi anche fy (x, g(x)) 6= 0) possiamo dividere tutto per fy
ricavando
fx (x, g(x))
g 0 (x) = −
fy (x, g(x))

Osserviamo che il teorema di Dini dà una condizione sufficiente ma non necessaria per
l’esistenza e unicità delle funzioni implicite.

46
4.5. Funzioni implicite

Come conseguenza del teorema, possiamo ricavare l’equazione della retta tangente alla
funzione y = g(x) definita implicitamente dalla f nel punto x0 . Infatti l’equazione della retta
tangente in x0 per la funzione g è data da

fx (x0 , y0 )
y − g(x0 ) = g 0 (x0 )(x − x0 ) cioè y − y0 = − (x − x0 )
fy (x0 , y0 )

Moltiplicando ambo i membri per fy (x0 , y0 ) troviamo

fy (x0 , y0 )(y − y0 ) = −fx (x0 , y0 )(x − x0 ) da cui fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) = 0

Quest’ultima relazione dice che il gradiente della f in (x0 , y0 ) è ortogonale alla retta
tangente alla curva f (x, y) = 0 in P0 .

4.5.1 Equazione di una retta e vettore normale alla retta


Facciamo un breve richiamo di geometria analitica per comprendere meglio che la
relazione

fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) = 0

scritta prima significa dire che il gradiente della f in (x0 , y0 ) è ortogonale alla retta tangente
a f (x, y) = 0 in P0 .
Sia assegnata una retta nello spazio R2 e sia P0 = (x0 , y0 ) un punto che giace sulla retta.
Sia ~n = (a, b) (n sta per normale) un vettore ortogonale (normale, perpendicolare) alla
retta: il vettore è detto vettore normale.
Sia dato un altro generico punto P = (x, y) sulla retta.
Indichiamo con ~r e r~0 i vettori che ci indicano i due punti P e P0 rispettivamente (si veda
figura 4.4). Il segmento P P0 è dato dal vettore ~r − r~0 .

Figura 4.4: retta nel piano

Ora, poichè ~n è ortogonale alla retta, esso è ortogonale al vettore ~r − r~0 , cioè il prodotto
scalare tra i due vettori è nullo:

~n · (~r − r~0 ) = 0

Poichè ~r − r~0 = (x − x0 , y − y0 ), il prodotto scalare diventa

a(x − x0 ) + b(y − y0 ) = 0

47
4. M ASSIMI E MINIMI

Questa che abbiamo scritto rappresenta l’equazione della retta passante2 per P e P0 .
Quindi, data l’equazione di una retta nella forma a(x − x0 ) + b(y − y0 ) = 0 il vettore che ha
come componenti i due coefficienti a e b, rappresenta il vettore normale alla retta: ~n = (a, b).
3

Riprendendo la retta fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) = 0, questa retta rappresenta la


retta tangente a y = g(x) nel punto x0 . Poichè il grafico della g coincide con il grafico della
curva f (x, y) = 0 nell’intorno di x0 , vuole dire che la retta è tangente alla curva f (x, g(x)) = 0
in (x0 , y0 ). Il gradiente della f in (x0 , y0 ) è dunque ortogonale alla tangente a questa curva.
Dallo studio di g 0 e, eventualmente di g 00 (che si ottiene applicando nuovamente la formula
di derivazione delle funzioni composte) possiamo ottenere informazioni sulla funzione g e,
quindi, anche su f (x, y) = 0 nell’intorno di un punto (x0 , y0 ). Lo vediamo con un esempio.

Esempio
Es. 4.5.1 Sia data la funzione f (x, y) = xe4y + 3y − 1. Si vuol vedere se nel punto
1
P0 (x0 , y0 ) = (0, ) sono verificate le ipotesi del teorema di Dini e, in caso affermativo,
3
se la funzione y = g(x) definita implicitamente da f (x, y) = 0 è una funzione crescente o
decrescente, concava o convessa in un intorno di x0 .
1 1
Calcoliamo f (0, ) = 0 + 1 − 1 = 0. Inoltre fy (x, y) = 4xe4y + 3 e fy (0, ) = 3 6= 0.
3 3
L’altra derivata parziale è fx = e4y . Le derivate parziali sono continue, quindi f ∈ C 1 .
Siamo nelle ipotesi del teorema di Dini, quindi esiste un’unica funzione y = g(x) definita
in un intorno di x0 = 0 tale che (x, g(x)) appartiente all’insieme di definizione della f ,
fx (x, g(x))
f (x, g(x)) = 0 e g 0 (x) = − .
fy (x, g(x))
1
Per vedere se la funzione è crescente o decrescente, calcoliamo g 0 (0). Poichè fx (0, ) = e4/3
3
1 e4/3
e fy (0, ) = 3, risulta g 0 (0) = − < 0. Quindi la g è decrescente in un intorno di 0.
3 3
Per calcolare g 00 (0) (e capire quindi se la g è convessa o concava) torniamo all’equazione

fx (x, g(x)) + fy (x, g(x))g 0 (x) = 0

e deriviamo ancora rispetto a x, ottenendo

fxx (x, g(x)) + fxy (x, g(x))g 0 (x) + fyx (x, g(x))g 0 (x) + fyy (x, g(x))(g 0 (x))2 + fy (x, g(x))g 00 (x) = 0

Nelle ipotesi (verificate in questo esempio) di derivate parziali seconde continue, vale
fxy = fyx . Inoltre, fy (x, g(x)) 6= 0 quindi

fxx (x, g(x)) + 2fxy (x, g(x))g 0 (x) + fyy (x, g(x))(g 0 (x))2
g 00 (x) = −
fy (x, g(x))

2 Spesso troviamo l’equazione scritta nella forma


ax + by = d dove d = ax0 + by0
o ancora
a a
y = mx + d dove m = − , d = x0 + y0
b b

3 n = (−m, 1), se usiamo la rappresentazione della retta mediante y = mx + d.


~

48
4.6. Curve di livello

Adesso possiamo calcolare g 00 (0). Abbiamo fxx = 0, fxy = 4e4y , fyy = 16xe4y , da cui
fxx (P0 ) = 0, fxy (P0 ) = 4e4/3 , fyy = 0, quindi

e4/3
8e4/3 (− )
g 00 (0) = − 3 >0
3
La funzione è convessa in un intorno di 0.
Osserviamo che, se f (x0 , y0 ) = 0 e fy (x0 , y0 ) = 0, non possiamo applicare il teorema di
Dini. Tuttavia, se, oltre a f (x0 , y0 ) = 0, si ha fx (x0 , y0 ) 6= 0, si può applicare il teorema di Dini,
scambiando il ruolo di x e y. Si ha la seguente formulazione

Teorema 4.5.2 (di Dini, scambiando il ruolo di x e y) Sia data una funzione f : I −→ R
con I ⊂ R2 , I aperto, f ∈ C 1 (I). Sia P0 (x0 , y0 ) ∈ I tale che f (x0 , y0 ) = 0 e fx (x0 , y0 ) 6= 0. Allora
esiste un’unica funzione x = h(y) definita in un opportuno intorno di y0 (]y0 − , y0 + [), di classe
C 1 , tale che, per ogni y ∈]y0 − , y0 + [ risulta
G x0 = h(y0 )
G (h(y), y) ∈ I
G f (h(y), y) = 0
G h0 (y) = −
fy (h(y), y)
fx (h(y), y)
.

Possiamo lavorare sulla funzione h così come abbiamo fatto per la funzione g per calcolare
l’equazione della retta tangente o la sua derivata seconda.

4.6 Curve di livello


Un metodo per visualizzare una funzione di due variabili è quello usato per disegnare le
mappe geografiche, dove i punti che hanno la stessa altezza sono uniti insieme in modo da
formare le cosiddette curve di livello o linee isometriche (contour lines).

Definizione 4.6.1 Si definiscono curve di livello di una funzione f di due variabili, tutte le
curve di equazioni f (x, y) = c con c costante che appartiene all’insieme dei valori della f .

La curva di livello f (x, y) = c è quindi l’insieme di tutti i punti del dominio della f in cui la
funzione assume il valore assegnato c. Mostra, quindi, dove il grafico della f ha altezza c.
In Figura 4.5 troviamo un esempio di applicazione delle curve di livello per rappresentare
la temperatura in Europa. Ciascuna curva rappresenta un valore diverso di temperatura.
Per funzioni matematiche, un p esempio di curve di livello si vede in Figura 4.6 dove, a sinistra,
vi è la superficie data da z = x2 + y 2 mentre, a destra, sono rappresentate le sue curve di
livello.

Proposizione 4.6.1 Dato un valore c e P0 = (x0 , y0 ) tale che f (x0 , y0 ) = c nell’ipotesi che P0
~ )(P0 ) è ortogonale alla curva di livello f (x, y) = c
non sia critico per la f , allora il gradiente ∇(f
in P0 .
Dimostrazione. Per la dimostrazione, ci riconduciamo al teorema di Dini delle funzioni
implicite, considerando F (x, y) = f (x, y) − c.
Per ipotesi P0 non è punto critico, quindi almeno una delle due derivate parziali è non
nulla in P0 . Consideriamo il caso in cui fy (x0 , y0 ) 6= 0.
Allora F (x0 , y0 ) = 0, mentre Fy (x, y) = fy (x, y) da cui Fy (x0 , y0 ) = fy (x0 , y0 )

49
4. M ASSIMI E MINIMI

Figura 4.5: Curve di livello nelle mappe di meteorologia.

p
Figura 4.6: Superficie f (x, y) = x2 + y 2 (a sinistra) e le sue curve di livello (a destra).

Essendo soddisfatte le ipotesi del teorema di Dini, esiste un’unica funzione definita im-
plicitamente dalla F , y = g(x). Allora l’equazione della retta tangente alla F in P0 ha
equazione
Fx (x0 , y0 )(x − x0 ) + Fy (x0 , y0 )(y − y0 ) = 0
Con lo stesso ragionamento fatto prima Fx (x, y) = fx (x, y) da cui ricaviamo
fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) = 0

Quindi il vettore ∇f ~ (P0 ) è un vettore perpendicolare (normale) alla retta tangente alla
curva f (x, y) = c nel punto P0 . 4

4.6.1 Significato del vettore gradiente


Consideriamo una funzione f differenziabile. Da quanto abbiamo appena visto, il vettore
~ (P0 ), è perpendicolare alla retta tangente alla curva f (x, y) =
gradiente nel punto P0 (x0 , y0 ), ∇f

50
4.6. Curve di livello

Figura 4.7: Sul prodotto scalare.

c che passa per P0 . Più brevemente, possiamo dire che è perpendicolare alla curva di livello.
Il vettore gradiente fornisce anche informazioni sulla direzione di massima crescita della
funzione f . Infatti, dal momento che la derivata direzionale dice la velocità di cambiamento
della f in quella direzione, noi possiamo calcolare la derivata direzionale della f in P0 lungo
tutte le possibili direzioni e vedere qual è il valore massimo e per quale direzione si ottiene.
Per la formula del gradiente, si ha (considerando ~v vettore unitario)

∂f (P0 ) ~ (P0 ) · ~v = |∇f


~ (P0 )||~v | cos θ = |∇f
~ (P0 )| cos θ
= ∇f
∂~v

dove θ è l’angolo individuato dai vettori ∇f~ (P0 ) e ~v . Osserviamo che il prodotto scalare
scritto in questa maniera è del tutto equivalente alla formula che abbiamo dato utilizzando
le componenti dei vettori. 4 Poichè il massimo valore di cos θ è 1 e questo si ha quando θ = 0,
∂f (P0 ) ~ (P0 )| e si ha quando
vuol dire che il valore massimo della derivata direzionale vale |∇f
∂~v
~ (P0 ).
θ = 0 cioè quando ~v ha la stessa direzione di ∇f
4 Proviamo che, dati due vettori ~ a = (a1 , a2 ) e ~b = (b1 , b2 ), il prodotto scalare ~a · ~b = a1 b1 + a2 b2 si può scrivere,
in modo del tutto equivalente come ~a · ~b = |~a||~b| cos θ con θ l’angolo individuato dai due vettori ~a e ~b.
A tal proposito ricordiamo il teorema di Carnot (o del coseno) per cui dato un triangolo qualsiasi e dati due lati
(che scriviamo come vettori) ~a e ~b che formano un angolo θ, per il terzo lato ~c vale

|~c|2 = |~a|2 + |~b|2 − 2|~a||~b| cos θ

dove |~a|, |~b|, |~c| sono i moduli dei tre vettori (cioè le lunghezze dei lati del triangolo).
Se consideriamo il vettore ~a + ~b, applicando sia la regola del parallelogramma sia il teorema di Carnot, tenendo
conto che adesso l’angolo compreso tra i due lati è π − θ (si veda Figura 4.7) e che cos (π − θ) = − cos θ, si ha

|~a + ~b|2 = |~a|2 + |~b|2 − 2|~a||~b| cos (π − θ) = |~a|2 + |~b|2 + 2|~a||~b| cos θ
Da questa relazione ricaviamo
1“ ”
|~a||~b| cos θ = |~a + ~b|2 − |~a|2 − |~b|2
2
Scrivendo in modo esplicito i moduli dei vettori, |~a+~b|2 = (a1 +b1 )2 +(a2 +b2 )2 , |~a|2 = (a1 )2 +(a2 )2 e |~b|2 = (b1 )2 +(b2 )2 ,
e sostituendo, si ha proprio

|~a||~b| cos θ = a1 b1 + a2 b2
Quindi il prodotto scalare può essere scritto sia in un modo che nell’altro.

51
4. M ASSIMI E MINIMI

4.7 Estremi vincolati e moltiplicatori di Lagrange


In molti problemi che discendono da applicazioni pratiche, si cerca il massimo o il minimo
di una funzione soggetta ad una particolare condizione che viene chiamata vincolo. Si dice,
allora, che si cercano gli estremi vincolati.

Esempio
Es. 4.7.1 Si deve costruire una scatola di cartone, priva di coperchio, utilizzando 12m2
(metri quadrati) di cartone. Si vuole costruire una scatola con il massimo volume
possibile.
Il volume della scatola è dato da V = xyz (dove x, y, e z rappresentano lunghezza,
larghezza e altezza della scatola).
La superficie della scatola (che non ha coperchio) è data da 2xz + 2yz + xy = 12 (12 dai
12m2 di cartone a disposizione).
La superficie rappresenta il vincolo per la funzione volume di cui vogliamo calcolare il
massimo. Questo esempio può essere risolto in modo semplice andando a scrivere z in
funzione di x e y dalla relazione 2xz + 2yz + xy = 12:
12 − xy
z=
2(x + y)

La funzione V diventa una funzione di due variabili

12 − xy 12xy − x2 y 2
V = xyz = xy =
2(x + y) 2(x + y)

Cerchiamo, di questa funzione, gli estremi relativi e tra questi vediamo se c’è una so-
luzione fisicamente accettabile (x e y rappresentano delle lunghezze e devono essere
positive).
Troveremo (lo si faccia per esercizio) che V ha il suo valore massimo per x = y = 2, da cui
z = 1.
Tuttavia, questa strada non è sempre percorribile. Perciò vediamo cosa si deve fare, in
generale, quando si cercano punti di massimo o minimo di una funzione soggetta a un
vincolo.
Vediamo il caso in cui dobbiamo cercare i valori estremi di una funzione f (x, y) soggetta
al vincolo espresso dall’equazione g(x, y) = c. In maniera del tutto equivalente, possiamo dire
che dobbiamo cercare i valori estremi della f (x, y) quando il punto (x, y) deve appartenere
alla curva di livello g(x, y) = c. In Figura 4.8 vediamo la curva g(x, y) = c e delle curve di livello
della funzione f (x, y). Queste curve di livello hanno equazione f (x, y) = k con k = 7, 8, 9, 10, 11.
Se vogliamo cercare il massimo della f (x, y) soggetta al vincolo g(x, y) = c, dobbiamo cercare il
più grande valore di k tale che la curva di livello f (x, y) = k interseca g(x, y) = c. Dalla Figura,
si può vedere che questo accade quando le due curve si toccano appena l’una con l’altra,
cioè quando hanno in comune una retta tangente. Ciò significa che le normali alle rette
tangenti sia a g(x, y) = c sia a f (x, y) = k, nel punto (x0 , y0 ), che è il punto in cui g(x, y) = c
e f (x, y) = k si incontrano, sono identiche. Ricordando che il vettore normale alla retta
tangente ad una funzione f (x, y) è il gradiente della f , vuol dire che ∇f ~ (x0 , y0 ) e ∇g(x
~ 0 , y0 )
sono vettori paralleli, cioè le loro componenti differiscono di una costante. Seguiremo questo
approccio per il metodo dei moltiplicatori di Lagrange.

Teorema 4.7.1 Data una funzione f ∈ C 1 (I), con I ⊂ R2 aperto, condizione necessaria af-
finchè P0 (x0 , y0 ) ∈ I sia un punto di massimo o minimo relativo della f soggetta al vincolo
g(x, y) = c è che
G g(x0 , y0 ) = c

52
4.7. Estremi vincolati e moltiplicatori di Lagrange

Figura 4.8: Sul prodotto scalare.

G la matrice
 
fx (P0 ) fy (P0 )
gx (P0 ) gy (P0 )

abbia determinante nullo: fx (P0 )gy (P0 ) − gx (P0 )fy (P0 ) = 0

Proposizione 4.7.1 Se P0 (x0 , y0 ) è un estremo vincolato della funzione f soggetta al vincolo


g(x, y) = c e se P0 è punto interno all’insieme di definizione della f e non è punto critico nè per
la f nè per la g, allora g(x, y) = c e f (x, y) = f (x0 , y0 ) hanno in P0 la stessa retta tangente.
Dimostrazione. Se scriviamo le equazioni delle rette tangenti a f (x, y) = f (x0 , y0 ) e
alla curva g(x, y) = c nel punto P0 , abbiamo fx (P0 )(x − x0 ) + fy (P0 )(y − y0 ) = 0 e gx (P0 )(x −
x0 ) + gy (P0 )(y − y0 ) = 0. Poichè P0 è un estemo vincolato, vale la condizione fx (P0 )gy (P0 ) −
gx (P0 )fy (P0 ) = 0, ma questa relazione rappresenta una condizione di parallelismo tra le due
rette tangenti.5 4
Il vincolo si può anche rappresentare come una funzione Φ(x, y) = 0 (caso particolare:
Φ(x, y) = g(x, y) − c). Il teorema si riscrive in maniera del tutto analoga.
La matrice
 
fx (P0 ) fy (P0 )
gx (P0 ) gy (P0 )

prende il nome di matrice jacobiana della f e della g. Vale infatti la seguente definizione.

Definizione 4.7.1 Date le due funzioni f1 (x, y) e f2 (x, y) si definisce matrice jacobiana, la
matrice
∂f1 ∂f1
 
∂(f1 , f2 )  ∂x ∂y 
=  ∂f ∂f2 
∂(x, y) 2
∂x ∂y
Si definisce jacobiano, il determinante della matrice jacobiana.
Osserviamo che il teorema che abbiamo enunciato prima è un teorema che ci dà una
condizione necessaria ma non sufficiente.
a b
5 Ricordiamo che, date due rette ax + by + c = 0 e a0 x + b0 y + c0 = 0 la condizione di parallelismo è = 0 ovvero
a0 b
ab0 − a0 b = 0.

53
4. M ASSIMI E MINIMI

Figura 4.9: Curve di livello della funzione f (x, y) = x2 + 4y 2 e il vincolo x2 + y 2 = 1.

Il metodo dei moltiplicatori di Lagrange ci permette di trovare gli estremi di una funzio-
ne f (x, y) soggetta al vincolo Φ(x, y) = 0 (sempre che il problema ammetta soluzione). Per
~
applicare questo metodo deve essere ∇Φ(x, y) 6= 0.
Abbiamo detto che, se P0 è un punto di estremo vincolato, il gradiente della f e del-
la funzione di vincolo sono tra loro paralleli, cioè le componenti dei due vettori gradiente
differiscono per una costante. Introduciamo questa costante mediante la variabile λ detta
moltiplicatore di Lagrange: vuol dire che fx (x0 , y0 ) = λΦx (x0 , y0 ) e fy (x0 , y0 ) = λΦy (x0 , y0 ).
Ora, per capire chi possa essere (x0 , y0 ), definiamo la funzione H(x, y, λ) = f (x, y)+λΦ(x, y),
che dipende dalle variabili x, y e λ. Il metodo dei moltiplicatori di Lagrange consiste dei
seguenti passi:
1. risolviamo il sistema di equazioni dato da
~
∇H(x, y, λ) = 0

vale a dire:

fx (x, y) + λΦx (x, y) = 0

fy (x, y) + λΦy (x, y) = 0

Φ(x, y) = 0

(a meno del segno ritroviamo la condizione di parallelismo detta prima);


2. valutiamo la funzione f nella/e soluzione/i trovate e identifichiamo i valori di massimo
e minimo, (se esistono).
Esempio
Es. 4.7.2 Si devono cercare i valori estremi della funzione f (x, y) = x2 + 4y 2 sul cerchio
x2 + y 2 = 1.
In questo caso il vincolo è dato dall’equazione della circonferenza. Applichiamo il metodo
dei moltiplicatori di Lagrange, introducendo la funzione H(x, y, λ) = x2 +4y 2 +λ(x2 +y 2 −1)

54
4.7. Estremi vincolati e moltiplicatori di Lagrange

Il sistema da risolvere è

2x + 2λx = 0

8y + 2λy = 0

 2
x + y2 = 1

Dalla prima equazione ricaviamo x = 0 e λ = −1 mentre dalla seconda otteniano y = 0


e λ = −4. Sostituendo x = 0 nella terza equazione (il vincolo) abbiamo y 2 = 1 da cui y =
±1. Sostituendo y = 0 nel vincolo ricaviamo x = ±1. Il valore di λ non ci interessa perchè
abbiamo trovato tutti i punti (x, y) che verificano il sistema di equazioni. Abbiamo
P0 (0, 1), P1 (0, −1), P2 (1, 0) e P3 (−1, 0). Calcoliamo la f in questi punti: f (P0 ) = f (P1 ) = 4,
f (P2 ) = f (P3 ) = 1. Il valore massimo sul vincolo è dato da 4, nei punti P0 e P1 . Il
valore minimo sul vincolo è dato da 1 nei punti P2 e P3 . Controllando la Figura 4.9
dove ci sono le curve di livello della f e la circonferenza, si può vedere come i valori
trovati applicando il metodo dei moltiplicatori di Lagrange siano effettivamente quelli
che corrispondono a punti di massimo e minimo della f sul vincolo, in quanto le rette
tangenti alla curva di livello e alla circonferenza, nei punti trovati, coincidono.

55
C APITOLO 5
Le curve

A quelli che non conoscono la


matematica è difficile
percepire, come una
sensazione reale, la bellezza, la
profonda bellezza della Natura.
Se volete conoscere la Natura,
apprezzarla, è necessario
comprendere il linguaggio che
essa parla.

Richard Phillips Feynman


(1919-1988)

5.1 Equazioni parametriche di una curva . . . . . . . . . . . . . . . . . . . . . . . . . . 57


5.2 Grafico di una curva parametrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.3 Parametrizzare una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.4 Tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.5 Lunghezza di un arco di funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.6 Lunghezza di una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.7 La curva cicloide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.8 Sistema di coordinate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.9 Curve in coordinate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.9.1 La curva cardioide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.10 Lunghezza di una curva polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.10.1Lunghezze di alcune curve . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.11 Funzioni a valori vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.12 Le curve riviste come funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . . 79
5.13 Retta tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.14 Curve orientate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.15 Di nuovo sulla lunghezza di una curva . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.16 L’ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

5.1 Equazioni parametriche di una curva


Supponiamo che una particella si muova lungo una curva γ come quella mostrata in Fi-
gura 5.1. Non riusciamo a descrivere la curva mediante un’equazione della forma y = f (x)
(cioè attraverso il grafico di una funzione) perchè ci sono diverse rette verticali che interse-
cano la curva più di una volta (mentre per una funzione del tipo y = f (x), ad ogni valore di

57
5. L E CURVE

Figura 5.1: Una particella che si muove su una curva γ.

x deve corrispondere un solo valore f (x)). Tuttavia, possiamo pensare alle coordinate (x, y)
della particella che si muove lungo la curva come funzioni del tempo t in modo da poter
scrivere x = f (t) e y = g(t). Questa coppia di funzioni ci permette di descrivere la curva e di
dare la definizione di curva sotto forma di equazioni parametriche.

Definizione 5.1.1 Se x e y sono entrambe funzioni di una terza variabile t (t è detto


parametro), le equazioni

x = f (t), y = g(t)

sono dette equazioni parametriche.


Ogni valore di t determina un punto (x, y): al variare di t varia il punto (x, y) che, sul piano
cartesiano, descrive una curva γ, che chiamiamo curva parametrica.
Il parametro t non rappresenta necessariamente il tempo e quindi si può anche utilizzare
un’altra lettera per rappresentare il parametro. Poichè, in molte applicazioni, t denota il
tempo, ci è più facile vedere (x, y) = (f (t), g(t)) come la posizione della particella al tempo t.

Esempio
Es. 5.1.1 Proviamo a fare il grafico per capire quale curva è rappresentata mediante le
equazioni parametriche
(
x = t2 + t
y = 2t − 1

Ciascun valore di t dà un punto della curva. Perciò consideriamo diversi valori di t e i


corrispondenti punti che si ottengono:
t x y
-2 2 -5
-1 0 -3
-1/2 -1/4 -2
0 0 -1
1 2 1

In Figura 5.2 abbiamo messo su un piano cartesiano i punti (x, y) che si ottengono per
molti valori del parametro t e li abbiamo uniti in modo da ottenere il grafico di una curva.

58
5.1. Equazioni parametriche di una curva

Figura 5.2: Curva data da x = t2 + t, y = 2t − 1

Osserviamo che una particella, la cui posizione è data dalle equazioni parametriche
x = f (t), y = g(t), si muove lungo la curva nella direzione di t crescente. Ciò significa che
una curva parametrica ha una direzione, un orientamento dato da valori crescenti
di t. Sul grafico la direzione del movimento della curva è indicata mediante freccette.
Inoltre, osserviamo che a valori di t equidistanti non corrispondono, sulla curva, punti
equidistanti: ciò è dovuto al fatto che la particella rallenta o aumenta la sua velocità al
variare di t.
Dalla Figura 5.2, appare evidente che la curva tracciata dalla particella è una parabola.
In effetti, se eliminiamo il parametro t dalle due equazioni parametriche, ricaviamo proprio
l’equazione di una parabola. Per far ciò, dalla seconda equazione y = 2t − 1 ricaviamo
1
t = (y + 1) e sostituiamo il valore trovato per t nell’equazione in x. Troviamo
2
 2
1 1 1 3
x= (y + 1) + (y + 1) = y 2 + y +
2 2 4 4

Riconosciamo l’equazione di una parabola.


Nell’esempio, t può variare in tutto R. Se invece t deve variare in un intervallo finito,
allora anche la curva risente degli effetti del parametro.

Esempio
Es. 5.1.2 Consideriamo le equazioni parametriche della curva precedente, ma con t ∈
[−1, 1]:

x = t2 + t y = 2t − 1 −1≤t≤1

Abbiamo solo una porzione della curva che abbiamo disegnata prima (si veda Figura 5.3).

59
5. L E CURVE

Figura 5.3: Curva data da x = t2 + t, y = 2t − 1, con −1

Definizione 5.1.2 La curva di equazioni parametriche

x = f (t), y = g(t), t0 ≤ t ≤ tf

ha punto iniziale (f (t0 , g(t0 )) e punto finale (f (tf ), g(tf )).

Esempio
Es. 5.1.3 Cerchiamo di capire qual è la curva rappresentata dalle equazioni
parametriche x = cos t, y = sin t, con 0 ≤ t ≤ 2π.
Se facciamo un grafico con le coppie di punti (x, y) al variare di t, otteniamo il grafico
di una circonferenza. Ne abbiamo conferma eliminando il parametro t. Questa volta
sfruttiamo le relazioni trigonometriche osservando che

x2 + y 2 = cos2 t + sin2 t = 1

Quindi la circonferenza ha centro nell’origine e raggio 1.


In questo esempio il parametro t può essere interpretato come l’angolo in radianti. Al
variare di t in [0, 2π], il punto (x, y) = (cos t, sin t) si muove sulla circonferenza in direzione
antioraria partendo dal punto (1, 0) e ritornando allo stesso punto.

Esempio
Es. 5.1.4 Vediamo ora la curva rappresentata dalle equazioni parametriche x = sin 4t ,
y = cos 4t, con 0 ≤ t ≤ 2π.
Di nuovo, da x2 + y 2 = sin2 4t + cos2 4t = 1 ritroviamo l’equazione della circonferenza di
centro l’origine e raggio 1.
Questa volta, però, il punto iniziale della curva si ha in (sin 0, cos 0) = (0, 1). Per valori di t
crescenti, la particella si muove in direzione oraria lungo la circonferenza e la percorre 4
volte (il punto (0, 1) si ha per t = 0, π/2, π, 3π/2, 2π.

60
5.2. Grafico di una curva parametrica

Quindi la stessa curva può essere rappresentata in modi diversi. Conviene perciò fare la
distinzione tra curva, come insieme di punti, da curva parametrica, come insieme di punti
tracciati in modo particolare.

5.2 Grafico di una curva parametrica


Per fare il grafico di un’equazione della forma x = g(y) possiamo usare le equazioni
parametriche

x = g(t), y = t.

Alla stessa maniera le curve di equazioni y = f (x) (le familiari funzioni di una variabile reale),
possono essere viste come curve di equazioni parametriche

x = t, y = f (t).

In generale, data una curva parametrica di equazioni x = f (t), y = g(t), con t0 ≤ t ≤ tf , per
farne il grafico possiamo far variare t nell’intervallo assegnato (o per valori crescenti in R) e
vedere dove giacciono, sul piano cartesiano, i corrispondenti punti (x, y), in modo da avere
l’orientamento della curva.
A volte conviene eliminare il parametro t per capire di che curva si tratta.
Altre volte la curva è talmente complicata che conviene affidarsi a programmi di grafica
al calcolatore per poterla visualizzare.

Esempio
Es. 5.2.1 Consideriamo il caso di una curva data da

x = a cos (αt) y = b cos (αt) 0 ≤ t ≤ 2π

dove a, b, α sono delle costanti.


Visto che le funzioni sono trigonometriche, conviene sfruttare relazioni della trigonometria
per capire di che curva si tratta.
Facciamo un cambio di variabile ponendo u = αt. Allora le equazioni diventano

x = a cos u y = b sin u 0 ≤ u ≤ 2απ

Possiamo scrivere
x2 y2
1 = cos2 u + sin2 u = 2
+ 2
a b
trovando l’equazione di un’ellisse avente come centro l’origine (se a > b l’ellisse è oriz-
zontale con l’asse maggiore sull’asse delle x, viceversa se a < b l’ellisse è verticale con
l’asse maggiore sull’asse delle y, se invece a = b l’ellisse si riduce ad una circonferenza
di raggio a).
L’ellisse, per u ∈ [0, 2π] viene percorsa tutta. Ma adesso u varia fino a 2απ, il che vuol dire
che la curva viene percorsa α volte dal parametro u: è come un circuito di formula 1 da
ripetere per un numero α di giri.

61
5. L E CURVE

Figura 5.4: curva x = 4 cos (3t) y = 1 + cos2 (3t)

Esempio
Es. 5.2.2 Il cammino di una particella è dato da

x = 4 cos (3t) y = 1 + cos2 (3t)

Proviamo a descrivere questo cammino cercando di capire dove variano x e y e indivi-


duando l’intervallo in cui varia t per percorrere la curva solo una volta (nel caso in cui
possa percorrerla più di una volta).
Per eliminare il parametro t, sfruttiamo il fatto che le due equazioni parametriche hanno
solo coseni, ricavando cos (3t) dalla prima equazione e sostituendo nella seconda:

x  x 2 x2
cos (3t) = y =1+ =1+
4 4 16
Ricaviamo una parabola. Inoltre

−1 ≤ cos (3t) ≤ 1 =⇒ −4 ≤ 4 cos (3t) ≤ 4 =⇒ −4 ≤ x ≤ 4

0 ≤ cos2 (3t) ≤ 1 =⇒ 1 ≤ 1 + cos2 (3t) ≤ 2 =⇒ 1 ≤ y ≤ 2


Proviamo ora per alcuni valori di t cosa si ricava per x e y:
t x y
0 4 2
π/2 0 1
π -4 2
3π/2 0 1
2π 4 2
L’arco di parabola viene ripetuto più volte come un pendolo.
Dagli esempi visti possiamo osservare che ci sono curve i cui punti (x, y) sono dati da un

62
5.3. Parametrizzare una curva

solo valore del parametro t, in altri casi lo stesso punto viene ripetuto per diversi valori di t.
Abbiamo le seguenti definizioni

Definizione 5.2.1 Data una curva di equazioni parametriche x = f (t), y = g(t),


G se un punto (x, y) si ottiene mediante un solo valore del parametro t, allora il punto è detto
semplice;
G se un punto (x, y) si ottiene mediante più valori del parametro t, allora il punto è detto
multiplo.

Definizione 5.2.2 Una curva è chiusa se è definita per t ∈ [t0 , tf ] e (x(t0 ), y(t0 )) = (x(tf ), y(tf )):
il punto sulla curva che si ha per il valore iniziale del parametro t coincide con il punto sulla
curva che si ha per il valore finale di t.

5.3 Parametrizzare una curva


A volte, data una curva come equazione in x e y, vogliamo parametrizzarla.
Il caso più interessante è quello di un’ellisse (e quindi, come caso particolare, un cerchio):

x2 y2
+ =1
a2 b2
Come equazioni parametriche, possiamo considerare

x = a cos (t) y = b sin (t) 0 ≤ t ≤ 2π

In tal caso l’ellisse parte dal punto (a, 0) e vi termina dopo aver percorso l’ellisse in senso
antiorario.
Una curva può essere parametrizzata in vari modi, comunque. L’ellisse precedente, ad
esempio, può essere parametrizzata come

x = a cos (αt) y = b sin (αt)


x = a sin (αt) y = b cos (αt)
x = a cos (αt) y = −b sin (αt)

La presenza della costante α ci dice quante volte viene percorsa l’ellisse. Le ultime due
equazioni parametriche ci danno la curva percorsa in senso orario (sempre partendo da
t = 0).

5.4 Tangente ad una curva


Assegnate le equazioni parametriche di una curva

x = x(t) y = y(t) t0 ≤ t ≤ tf

vogliamo ricavare una formula per la pendenza delle rette tangenti alla curva in ciascun suo
punto.
Nel caso di una funzione y = F (x), la retta tangente a F per x = a è data dall’equazione

dy
p(x) = m(x − a) + F (a), dove m = F 0 (a) = |x=a
dx
Per la curva parametrica, se riusciamo a calcolare la derivata della y in funzione di x,
possiamo utilizzare la formula appena scritta per ricavare l’equazione della tangente alla

63
5. L E CURVE

curva in un generico punto (x, y) della curva. Noi però abbiamo y in funzione del parametro
t e non di x.
Supponiamo di avere (ma non abbiamo) una funzione y = F (x) che ci permetta di scrivere
la curva non più in forma parametrica, eliminando cioè il parametro t. In realtà noi sappiamo
che y = y(t) e x = x(t), quindi sostituendo abbiamo

y(t) = y = F (x) = F (x(t)) =⇒ y(t) = F (x(t))

Deriviamo rispetto a t:

dy dF (x(t)) dx
=
dt dx dt
dy dF (x)
A noi serve una formula per ovvero per per avere la retta tangente. Dalla relazione
dx dx
dx
precedente, nell’ipotesi in cui 6= 0 ricaviamo
dt
dy
dy dF (x(t))
= = dt
dx dx dx
dt
Abbiamo trovato, in questo modo, la pendenza della retta tangente alla curva scritta
come y = F (x). Se vogliamo avere la tangente alla curva scritta invece come x = H(y), basta
scambiare il ruolo della x con la y. L’equazione della retta tangente nel punto f (a) è del tipo

p(y) = m(y − f (a)) + H 0 (f (a))

dx
con m = H 0 (f (a)) = |y=f (a) . In maniera del tutto analoga a quanto visto prima, si ricava
dy
dx
dx dy
= dt per 6= 0
dy dy dt
dt

Esempio
Es. 5.4.1 Troviamo la tangente alla curva parametrica data dalle equazioni

x = t5 − 4t3 y = t2

nel punto (0, 4).


Vedremo, in questo caso, che troveremo più di una retta tangente al punto assegnato (e
ne capiremo presto il motivo).
Per prima cosa applichiamo la formula data prima:

dy
dy 2t 2
= dt = 4 = 3
dx dx 5t − 12t2 5t − 12t
dt

64
5.4. Tangente ad una curva

Figura 5.5: rette tangenti al punto (0.4) della curva x = t5 − 4t3 y = t2

Attenzione, adesso, perchè la derivata è in termini di t ma noi dobbiamo calcolare la


tangente in un punto assegnato individuato dalle coordinate (x, y) = (0, 4). Dobbiamo
quindi determinare per quale/i valore/i di t si ottiene questo punto.
Per la curva e il punto dati, deve quindi valere
( (
x = t5 − 4t3 = 0 t3 (t2 − 4) = 0 → t = 0, t = ±2
2
=⇒ 2
y=t =4 t = 4 → t = ±2

Le soluzioni accettabili per le due equazioni sono t = ±2.


Per t = −2 la pendenza della retta tangente risulta

dy 1
m= |t=−2 = −
dx 8
e quindi la retta tangente è
1
y =4− x
8
Per t = 2 invece si ha
dy 1
m= |t=2 =
dx 8
e la retta tangente è
1
y =4+ x
8
Perchè due rette tangenti nel punto (0, 4)? Perchè la curva ”gira“ attorno al punto (0, 4)
e quindi abbiamo due rette tangenti (si veda Figura 5.5).

65
5. L E CURVE

Possiamo avere anche tangenti orizzontali o verticali, in un determinato punto di una


curva, a seconda che la derivata di y o x rispetto a t sia nulla:
G si ha una tangente orizzontale quando
dy
dt
=0e
dx
dt
6= 0

G si ha una tangente verticale quando


dx
dt
=0e
dy
dt
6= 0.
Possiamo anche scrivere le equazioni della retta tangente ad una curva parametrica in
dx(t0 )
forma parametrica. Dato il punto P0 = (x0 , y0 ) = (x(t0 ), y(t0 ), i valori delle derivate ,
dt
dy(t0 )
rappresentano i valori delle tangenti alla curva, componente per componente. L’e-
dt
quazione della retta tangente a P0 , scritta in forma parametrica, deve passare per P0 e
avere come direzione quella data dal vettore ~v che ha come componenti le due derivate
dx(t0 ) dy(t0 )
~v = ( , ). Scritta in forma vettoriale, la retta tangente deve essere della forma
dt dt
r~t = P0 + t~v

dove P0 è inteso come un vettore, t è il parametro al variare del quale abbiamo i punti della
retta, ~v è il vettore che dà la direzione della retta. In forma parametrica abbiamo
dx(t0 ) dy(t0 )
r~t = (x0 + t , y0 + t )
dt dt
dx(t0 ) dy(t0 )
Osserviamo che, dalle equazioni della tangente x = x0 + t , y = y0 t , se dalla
dt dt
prima equazione ricaviamo t in funzione di x e sostituiamo nella seconda equazione, troviamo
l’equazione della retta tangente che abbiamo ricavato prima.

5.5 Lunghezza di un arco di funzione


Prima di capire come si calcola la lunghezza di una curva parametrica, partiamo dal voler
calcolare la lunghezza di un arco di funzione: data una funzione continua y = f (x) vogliamo
determinare la lunghezza dell’arco della curva data dalla funzione nell’intervallo [a, b].
Per prima cosa, diamo una stima approssimata della lunghezza di questa curva: divi-
diamo l’intervallo [a, b] in n parti uguali di ampiezza ∆x ottenendo sulla curva n + 1 punti
Pi , i = 0, 1, 2, . . . , n. Possiamo quindi approssimare la curva mediante una serie di segmenti
congiungenti questi punti. Vediamo in figura 5.6 un esempio con n = 9. Poichè la lunghezza
di ciascuno dei segmenti congiungenti Pi−1 e Pi altro non è che la distanza euclidea tra i due
punti |Pi − Pi−1 |, la curva sarà dunque approssimata da
n
X
L≈ |Pi−1 − Pi |
i=1

Prendendo valori di n sempre più grandi noi avremo valori via via più accurati. Passando al
limite per n → ∞ avremo la lunghezza dell’arco di curva:
n
X
L = lim |Pi−1 − Pi |
n→∞
i=1

Ora, ciascuno punto Pi ha coordinate del tipo (xi , f (xi )), da cui
p
|Pi−1 − Pi | = (xi − xi−1 )2 + (f (xi ) − f (xi−1 ))2

Dal teorema del valor medio sappiamo che f (xi ) − f (xi−1 ) = f 0 (ξi )(xi − xi−1 ) dove ξi è un
punto che non conosciamo all’interno dell’intervallo [xi−1 , xi ]. Ricordando che abbiamo diviso

66
5.6. Lunghezza di una curva

Figura 5.6: Approssimazione della lunghezza di un arco di funzione mediante segmenti di


retta

l’intervallo [a, b] di partenza in n parti uguali, si ha xi − xi−1 = ∆x da cui, f (xi ) − f (xi−1 ) =


f 0 (ξi )∆x da cui la lunghezza del segmento si può anche scrivere come
p p p
|Pi−1 − Pi | = ∆x2 + (f 0 (ξi )∆x)2 = (1 + f 0 (ξi )2 )∆x2 = (1 + f 0 (ξi )2 )∆x

Inserendo questa formula nel limite che fornisce la lunghezza dell’arco di curva si ha
n p
X
L = lim 1 + f 0 (ξi )2 ∆x
n→∞
i=1

Usando la definizione dell’integrale definito, questo limite non è nient’altro che un


integrale e, precisamente,
Z bp
L= 1 + f 0 (x)2 dx
a

In maniera equivalente, poichè y = f (x) possiamo riscrivere


s  2
Z b
dy
L= 1+ dx
a dx

Se, invece, abbiamo una funzione scritta in funzione di y, vale a dire x = h(y) con c ≤ y ≤ d,
la stessa formula diventa:
s  2
Z d
dx
L= 1+ dy
c dy

5.6 Lunghezza di una curva


Così come abbiamo trovato una formula per calcolare la lunghezza di un arco di una
funzione y = f (x) o x = h(y), in maniera del tutto analoga, possiamo misurare la lunghezza
di una curva.
Sia data una curva in forma parametrica come

x = x(t) y = y(t) t0 ≤ t ≤ tf

67
5. L E CURVE

dx
Assumiamo che ≥ 0: ciò significa che la curva è attraversata solo una volta, da sinistra
dt
verso destra, per t che aumenta nell’intervallo [t0 , tf ]. La curva, quindi, è semplice.
Supponiamo, come per la tangente, di poter scrivere y = F (x) o x = H(y) anche se, in
realtà, x = x(t) e y = y(t). Applicando le formule viste per l’arco di una funzione alla curva
scritta non in forma parametrica noi dobbiamo applicare una delle due formule:

s 2
Z b 
dy
L= 1+ dx se y = f (x), a ≤ x ≤ b
a dx

s 2
Z d 
dx
L= 1+ dy se x = h(y), c ≤ y ≤ d
c dy

Se lavoriamo considerando y = F (x), poichè x = x(t), operiamo un cambio di variabile


dx(t)
per calcolare l’integrale: si ha dx = dt (o equivalentemente, se consideriamo x = H(y),
dt
dy dy dx
dy = dt), mentre per le derivate (o ) ci riconduciamo alle formule viste per la tangente.
dt dx dy
Quindi la formula per trovare la lunghezza dell’arco di una curva o, più semplicemente, la
lunghezza di una curva, diventa:
v
v u  2
u
u

dy
2 u dy
Z tf u Z tf u
u
u1 +  dt  dx u1 +  dt  dx dt
L=  dx  dt = 2 dt
dt
t
dx
u
t0 t0 t
dt dt

Semplificando l’espressione sotto radice otteniamo


s 
Z tf 2  2
1 dx dy dx
L= + dt
t0
dx
dt dt dt
dt

dx
Nell’ipotesi fatta per cui è positiva possiamo semplificare ancora ottenendo
dt
s 2 2
Z tf 
dx dy
L= + dt
t0 dt dt

dy
Osserviamo che, nel caso in cui è ≥ 0, usando la formula per x in funzione di y, si
dt
ottiene
v
dx 2
u  
Z tf u
u1 +  dt  dy dt
u
L=  dy 
dt
t
t0
dt
da cui si arriva alla stessa formula.
Se invece non rappresentiamo la curva mediante la forma y = F (x) o x = H(y), arriviamo
allo stesso risultato utilizzando un’approssimazione poligonale. Dividiamo l’intervall [t0 , tf ] in
n sottointervalli di stessa ampiezza ∆t. Chiamiamo t0 , t1 , t2 , . . . , tn = tf i punti finali di questi

68
5.6. Lunghezza di una curva

sottointervalli e indichiamo con (xi , yi ) i punti che si ottengono sulla curva con il parametro
ti . Quindi xi = x(ti ) e yi = y(ti ). Indichiamo con Pi i punti sul piano cartesiano che hanno
coordinate date da (xi , yi ).
I punti Pi si trovano sulla curva γ e possiamo tracciare una poligonale con vertici dati da
Pi , che approssima la curva γ. Con lo stesso discorso fatto per trovare la lunghezza di un
arco di funzione, la lunghezza della curva γ è data dal limite delle lunghezze dei segmenti
Pi−1 Pi = |Pi−1 − Pi |

n
X
L≈ |Pi−1 − Pi |
i=1

Ora
p p
|Pi−1 − Pi | = (xi − xi−1 )2 + (yi − yi−1 )2 = (x(ti ) − x(ti−1 ))2 + (yti ) − y(ti−1 ))2

Applichiamo il teorema del Valor Medio alla funzione x(t) nell’intervallo [ti−1 , ti ]:

x(ti ) − x(ti−1 ) = x0 (t∗i )∆t

dove t∗i è un punto opportuno che si trova all’interno dell’intervallo [ti−1 , ti ]. Analogamente,
applicando lo stesso teorema alla funzione y(t) si ha

y(ti ) − y(ti−1 ) = y 0 (t∗∗


i )∆t

con t∗∗
i punto opportuno che si trova all’interno dell’intervallo [ti−1 , ti ]. Di conseguenza
q q
2 2 2 2
|Pi−1 − Pi | = [x0 (t∗i )∆t] + [y 0 (t∗∗
i )∆t] = [x0 (t∗i )] + [y 0 (t∗∗
i )] ∆t

Sostituendo nell’espressione data per L e passando al limite per n → +∞ si ha


n
X n q
X 2 2
L = lim |Pi−1 − Pi | = lim [x0 (t∗i )] + [y 0 (t∗∗
i )] ∆t
n→+∞ n→+∞
i=1 i=1

Questo limite ci ricorda un integrale (così come abbiamo fatto per la lunghezza dell’arco di
una funzione) anche se non è esattamente lo stesso in quanto abbiamo due punti t∗i e t∗∗ i
che sono diversi. Si può provare, tuttavia, che se x(t) e y(t) sono funzioni continue, il limite
scritto prima è lo stesso che si avrebbe con i due punti t∗i e t∗∗
i coincidenti. Quindi si può
passare all’integrale
Z tf q
2 2
L= [x0 (t)] + [y 0 (t)] dt
t0

dx dy
Se, al posto di x0 (t) scriviamo e, al posto di y 0 (t) scriviamo otteniamo la formula vista
dt dt
prima per la lunghezza di una curva.
Riassumiamo questo risultato nel teorema.

Teorema 5.6.1 Se una curva γ è descritta tramite equazioni parametriche x = x(t) e y = y(t),
con t0 ≤ t ≤ tf , e x0 (t) e y 0 (t) sono funzioni continue e γ è una curva semplice (percorsa solo
una volta per t crescente da t0 a tf ), allora la lunghezza della curva è data da:
s
Z tf  2  2
dx dy
L= + dt
t0 dt dt

69
5. L E CURVE

Figura 5.7: cicloide

Esempio
Es. 5.6.1 Vogliamo determinare la lunghezza della curva

x = 3 sin (t) y = 3 cos (t) 0 ≤ t ≤ 2π

Riconosciamo un cerchio di centro l’origine e raggio 3.


dx dy
Per applicare la formula ci serve calcolare e :
dt dt

dx dy
= 3 cos (t) = −3 sin (t)
dt dt
Dobbiamo quindi calcolare l’integrale
Z 2π q Z 2π q
L= 9 cos2 (t) + 9 sin2 (t)dt = 3 cos2 (t) + sin2 (t)dt =
0 0
Z 2π √ Z 2π
=3 1dt = 3 dt = 3 · 2π = 6π
0 0

La lunghezza della curva è esattamente la lunghezza della circonferenza! In questo caso


abbiamo una verifica immediata del risultato che abbiamo ottenuto.

5.7 La curva cicloide


La curva tracciata da un punto P sulla circonferenza di un cerchio quando il cerchio
rotola su una linea retta è detta cicloide (si veda Figura 5.7). Per rappresentare questa curva
scegliamo come parametro l’angolo di rotazione θ con cui si muove il cerchio. Per θ = 0 il
punto P si trova all’origine degli assi cartesiani. Se il cerchio rotola di un angolo θ, poichè la
circonferenza rimane sempre in contatto con la linea retta data dall’asse delle x, la distanza
del punto di contatto tra circonferenza e asse delle x (punto che chiamiamo T ) dall’origine
coincide con la lunghezza dell’arco P T dove P è il punto che osserviamo quando il cerchio
rotola (si veda la Figura 5.8):

OT = arc(P T )

L’angolo di rotazione θ è sotteso all’arco di estremi P e T . Poichè la lunghezza di


un arco è proporzionale all’ampiezza dell’angolo, considerando che all’angolo centrale 2π
corrispondenza la lunghezza della circonferenza 2πr, possiamo scrivere

θ arc(P T )
=
2π 2πr
Da questa relazione otteniamo arc(P T ) = rθ, da cui OT = rθ.

70
5.8. Sistema di coordinate polari

Figura 5.8: Considerazioni geometriche sul punto P della circonferenza quando il cerchio
rotola lungo l’asse x.

Figura 5.9: Rappresentazione grafica della curva cicloide per r = 2 e 0 ≤ θ ≤ 2π (a sinistra) e


0 ≤ θ ≤ 8π (a destra).

Questo risultato ci serve per trovare le coordinate del punto P . Si ha infatti (aiutandoci
con la Figura 5.8):

x = OT − P Q
y = CT − CQ

Considerando il triangolo rettangolo di vertici P , Q e il centro della circonferenza C, il lato


CP = r mentre i lati P Q e CQ sono dati dalle formule trigonometriche

P Q = CP sin θ = r sin θ, CQ = CP cos θ = r cos θ

. Il lato CT vale r. Inserendo queste relazioni nelle espressioni precedenti troviamo

x = OT − P Q = rθ − r sin θ = r(θ − sin θ)


y = CT − CQ = r − r cos θ = r(1 − cos θ)

Abbiamo trovato, dunque, che le equazioni parametriche della curva cicloide sono date da

x = r(θ − sin θ), y = r(1 − cos θ)

Osserviamo che, sebbene queste equazioni le abbiamo ricavate considerando 0 < θ < π/2,
esse sono valide anche per altri valori di θ. Un arco completo della curva cicloide è dato dalla
rotazione completa della circonferenza e si ha, quindi, per θ ∈ [0, 2π].

5.8 Sistema di coordinate polari


Siamo abituati a rappresentare un punto nel piano utilizzando le coordinate cartesiane.
Vi è tuttavia un altro sistema di coordinate (introdotto da Newton) che può essere conve-

71
5. L E CURVE

Figura 5.10: Coordinate polari.

Figura 5.11: Passaggio da coordinate polari a coordinate cartesiane.

niente per molti scopi, tra cui quello di rappresentare alcune curve parametriche. Questo
sistema prende il nome di sistema di coordinate polari.
Scegliamo un punto nel piano che chiamiamo polo o origine (lo indichiamo con O). Dal-
l’origine tracciamo una semiretta chiamata asse polare (in genere questo asse è tracciato
orizzontalmente, a destra del punto O e corrisponde al semiasse positivo dell’asse delle x
del sistema cartesiano). Se P è un qualunque altro punto in questo piano, tracciamo il seg-
mento, di lunghezza r, che unisce P all’origine e consideriamo l’angolo θ (di solito espresso
in radianti) tra l’asse polare e il segmento OP . Il punto P viene rappresentato dalla coppia
ordinata (r, θ) e r, θ sono le coordinate polari del punto P (si veda Figura 5.10). Si usa la
convenzione che un angolo è positivo se misurato in senso antiorario rispetto all’asse polare.
Inoltre il punto (0, θ) rappresenta l’origine, qualunque sia θ.
Si estende il sistema di coordinate polari a valori di r negativi, con la convenzione che il
punto del tipo (−r, θ) giace sulla stessa linea del punto (r, θ) e alla stessa distanza |r| da O,
ma sul lato opposto rispetto a (r, θ). Dire (−r, θ) è la stessa cosa di (r, θ + π). Come conse-
guenza, un punto nel sistema di coordinate polari può avere più di una rappresentazione.
Dal momento che una completa rotazione antioraria è data dall’angolo 2π, si ha che il punto
(r, θ) può essere rappresentato anche come (r, θ + 2nπ), e (−r, θ + (2n + 1)π) con n intero.
Per passare dalla rappresentazione in coordinate polari al sistema di coordinate cartesia-
ne, basta osservare che l’origine del sistema polare corrisponde all’origine del sistema carte-
siano, l’asse polare corrisponde all’asse delle x e, di conseguenza, il punto P di coordinate
polari (r, θ), ha coordinate cartesiane x e y date da

x = r cos θ, y = r sin θ

(si veda Figura 5.11: abbiamo applicato le relazioni trigonometriche che legano i lati di
un triangolo rettangolo all’angolo compreso tra ipotenusa e uno dei due cateti). Viceversa,
dato un punto P in coordinate cartesiane, per trovare i valori di r e θ delle corrispondenti

72
5.9. Curve in coordinate polari

Figura 5.12: Punto (1, −1) in coordinate polari e cartesiane.

coordinate polari, possiamo sfruttare le relazioni


y
r2 = x2 + y 2 , e tan θ =
x
che ricaviamo dalle relazioni precedenti. Poichè tan θ = tan (θ + π), dobbiamo prestare atten-
zione a scegliere il valore di θ che permette di avere, nel piano polare, lo stesso punto del
piano cartesiano.

Esempio
Es. 5.8.1 Convertiamo il punto (2, π/4) da coordinate polari a coordinate cartesiane. Da
2 √
x = r cos θ e y = r sin θ, sostituendo i valori di r e θ otteniamo x = 2 cos (π/4) = √ = 2 e
2
2 √ √ √
y = 2 sin (π/4) = √ = 2. In coordinate cartesiane abbiamo il punto ( 2, 2).
2

Esempio
Es. 5.8.2 Rappresentiamo in coordinate polari il punto dato in coordinate cartesiane
(1, −1).
Scegliamo la rappresentazione
√ √ con r > 0 andando a considerare la radice positiva di
x2 + y 2 . Quindi r = 1 + 1 = 2.
y
Abbiamo da risolvere l’equazione tan θ = = −1.
x
3π π
Sia θ = + 2nπ sia θ = − + 2nπ con n intero (n = 0, 1, . . .) hanno come tangente il
4 4 √
valore −1. Scegliamo il valore di θ che ci permette (insieme a r = 2) di avere il punto
π
P posizionato nel corretto quadrante: dobbiamo scegliere θ = − + 2nπ. Prendiamo
√ 4
π π
θ = − . Il punto in coordinate polari dato da ( 2, − ) corrisponde a (1, −1) in coordinate
4 4
√ 3π
cartesiane. Se considerassimo il punto ( 2, ) avremmo, in coordinate cartesiane (−1, 1)
4
(si veda Figura 5.12 per un confronto).

5.9 Curve in coordinate polari


Un’equazione polare del tipo r = f (θ) o, più in generale, F (r, θ) = 0 ha come grafico
l’insieme di tutti i punti P di coordinate polari (r, θ), che soddisfano l’equazione. Possiamo
dunque avere delle curve rappresentate mediante coordinate polari.

73
5. L E CURVE

Esempio
Es. 5.9.1 La curva di equazione polare r = 4 è data da tutti i punti (r, θ) con r = 4. Dal
momento che r rappresenta la distanza dei punti dal polo (l’origine del piano polare), la
curva data rappresenta il cerchio di centro il polo O e raggio 4.

Esempio
Es. 5.9.2 La curva polare θ = π/5 consiste di tutti i punti (r, θ) con θ = π/5 radianti.
Abbiamo quindi una retta che passa per O e che forma un angolo di π/5 radianti con
l’asse polare.

Esempio
Es. 5.9.3 Troviamo le equazioni cartesiane della curva polare r = 2 cos θ.
Se proviamo a fare il grafico della curva sul piano polare, al variare di θ, ci accorgiamo
che il grafico rappresenta una circonferenza.
Per passare a coordinate cartesiane, da x = r cos θ abbiamo cos θ = x/r quindi r = 2 cos θ =
2x/r, cioè r2 = 2x ma r2 = x2 +y 2 , da cui x2 +y 2 = 2x o ancora x2 +y 2 −2x = 0. Aggiungendo
e sottraendo 1 abbiamo

x2 + y 2 − 2x + 1 − 1 = 0 cioè (x − 1)2 + y 2 = 1

Abbiamo l’equazione della circonferenza di centro (1, 0) e raggio 1.

5.9.1 La curva cardioide


Studiamo ora la curva cardioide, chiamata in questo modo perchè a forma di cuore, data
dall’equazione r = 1 + sin θ.
Per farne il grafico, facciamo prima di tutto il grafico, in coordinate cartesiane, della
funzione r = 1 + sin θ (si veda Figura 5.13, a sinistra), che altro non è che la funzione sin a
cui è aggiunta un’unità. Per θ che varia da 0 a π/2, r cresce da 1 a 2. Ma r rappresenta
la distanza dal polo in coordinate polari, perció nel grafico in coordinate polari dobbiamo
far variare r da 1 a 2 (indichiamo con À questa porzione di curva). Per θ che varia da π/2
a π, r decresce da 2 a 1 perciò nella corrispondente curva polare dobbiamo rappresentare
questa decrescita (indicata nella regione Á). Per θ ∈ [π, 3π/2] r decresce da 1 a 0 e si ha la
corrispondente portione  della curva polare. Infine, per θ ∈ [3π/2, 2π] r aumenta da 0 a 1,
come mostrato nella porzione Ã.
Se θ dovesse andare oltre 2π, la curva ripercorrebbe lo stesso percorso.

5.10 Lunghezza di una curva polare


Se vogliamo calcolare la lunghezza di una curva in coordinate polari, la formula che
abbiamo dato per la lunghezza di una curva parametrica si semplifica. Infatti, se passiamo a
coordinate cartesiane, le equazioni che caratterizzano la curva polare r = f (θ) con θ0 ≤ θ ≤ θf
sono date da

x = r cos θ = f (θ) cos θ, y = r sin θ = f (θ) sin θ

Quindi x e y sono funzioni di θ. Assumendo che f 0 sia una funzione continua, la lunghezza
della curva è data dalla formula
s
Z θf  2  2
dx dy
L= + dθ
θ0 dθ dθ

74
5.10. Lunghezza di una curva polare

Figura 5.13: Cardioide.

Si ha (considerando che x e y sono date dal prodotto di due funzioni):


dx dr
= f 0 (θ) cos θ − f (θ) sin θ = cos θ − r sin θ
dθ dθ
dy dr
= f 0 (θ) sin θ + f (θ) cos θ = sin θ + r cos θ
dθ dθ
Sfruttando il fatto che cos2 θ + sin2 θ = 1 si ha
 2  2  2
dx dy dr dr
+ = cos2 θ + r2 sin2 θ − 2r cos θ sin θ+
dθ dθ dθ dθ
 2
dr dr
+ sin2 θ + r2 cos2 θ + 2r cos θ sin θ
dθ dθ
 2
dr
= (cos2 θ + sin2 θ) + r2 (cos2 θ + sin2 θ)+

dr dr
− 2r cos θ sin θ + 2r cos θ sin θ
dθ dθ
 2
dr
= + r2

Andando a sostituire nell’integrale che dà la lunghezza della curva si ha
s  2
Z θf
2
dr
L= r + dθ
θ0 dθ
Abbiamo trovato una formula semplificata per la lunghezza della curva polare.

5.10.1 Lunghezze di alcune curve


La curva cardioide
Calcoliamo la lunghezza della curva cardioide r = 1 + sin θ con θ ∈ [0, 2π].
dr
Poichè = cos θ la lunghezza della curva è data dall’integrale

Z 2π p Z 2π p
L= (1 + sin θ)2 + cos2 θdθ = 1 + sin2 θ + 2 sin θ + cos2 θdθ
0 0
Z 2π √
Z 2π √ √
= 2 + 2 sin θdθ = 2 1 + sin θdθ
0 0

75
5. L E CURVE


Per calcolare questo integrale moltiplichiamo e dividiamo per 1 − sin θ ricavando
√ p
√ Z 2π √ 1 − sin θ √ Z 2π 1 − sin2 θ
L= 2 1 + sin θ √ dθ = 2 √ dθ
0 1 − sin θ 0 1 − sin θ

√ Z 2π cos2 θ √ Z 2π | cos θ|
= 2 √ dθ = 2 √ dθ
0 1 − sin θ 0 1 − sin θ
Abbiamo un integrale che dipende dal valore assoluto di cos θ: poichè cos θ è positivo per
0 ≤ θ ≤ π/2 e per 3π/2 ≤ θ ≤ 2π, mentre è negativo per π/2 ≤ θ ≤ 3π/2, l’integrale si spezza nei
tre integrali

√ Z 2π
| cos θ|
L= 2 √ dθ =
0 1 − sin θ
√ Z π/2
cos θ √ Z 3π/2
cos θ √ Z 2π
cos θ
= 2 √ dθ − 2 √ dθ + 2 √ dθ
0 1 − sin θ π/2 1 − sin θ 3π/2 1 − sin θ

Osserviamo che
Z
cos θ
√ dθ
1 − sin θ
si può risolvere facendo il cambiamento di variabile u = sin θ da cui du = cos θdθ ricavando

−1 D(1 − u) √
Z Z Z
1
√ du = − √ du = − √ du = −2 1 − u + costante
1−u 1−u 1−u

Abbiamo considerato che la derivata di 1 − u vale −1 (l’abbiamo indicata con D(1 − u) e che
R n xn+1
x dx = + costante.
n+1
Ritornando a L e sostituendo quanto abbiamo trovato nei tre integrali, abbiamo
√ √ θ=π/2 √ θ=3π/2 √
 θ=2π 
L = 2 −2 1 − sin θ − −2 1 − sin θ + −2 1 − sin θ

θ=0 θ=π/2 θ=3π/2
√  √ √  √ √  √ √ 
= 2 −2 1 − 1 + 2 1 − 0 − −2 1 + 1 + 2 1 − 1 + −2 1 − 0 + 2 1 + 1
√  √ √ 
= 2 2+2 2−2+2 2
√  √ 
= 2 4 2 =8

La lunghezza della curva cardioide vale 8.

La spirale di Archimede
La spirale di Archimede è una curva la cui equazione polare è ρ(θ) = kθ con k parametro
assegnato, positivo e θ che varia nell’intervallo [0, θf ] (si veda figura 5.14 per vedere cosa
succede aumentando θf ).

Per calcolare la lunghezza di questa curva, poichè = k si ha

Z θf p Z θf p
L= k 2 + (kθ)2 dθ = k 1 + θ2 dθ
0 0

L’integrale da risolvere non è immediato nè semplice.

76
5.10. Lunghezza di una curva polare

Figura 5.14: Spirale di Archimede con k = 2 e θf = 2π (a sinistra) e θf = 10π (a destra)

Per capire come si arriva al risultato, vediamo nei dettagli la sua risoluzione (specie perchè
1
si tratta di un integrale che può capitare R √ di incontrare anche in altre occasioni).
Calcoliamo quindi l’integrale 2
1 + x dx (per semplicità consideriamo l’integrale
indefinito e usiamo x al posto di θ).
Facciamo un cambiamento di variabile ponendo x = tan u. Sappiamo che D(tan u) =
1 1
. La funzione viene chiamiata anche secante (trigonometrica) e indicata con il
cos2 u cos u
1
simbolo sec u (sec u = ). Per semplicità useremo anche noi questa terminologia.
cos u
Consideriamo, inoltre, queste relazioni che useremo nel seguito:
G 1 + tan2 u = 1 +
sin2 u
cos2 u
=
cos2 u + sin2 u
cos2 u
=
1
cos2 u
= sec2 u

G D(sec u) = D(
1
cos u
)=
sin u
cos2 u
=
tan u
cos u
= tan u sec u
1
Tornando all’integrale, da x = tan u si ha dx = D(tan u)du = du = sec2 udu.
cos2 u
Sostituendo si ha
Z p Z p
I= 2
1 + x dx = 1 + tan2 u sec2 udu

Per la relazione 1 + tan2 u = sec2 u si ha


Z √
I= sec2 u sec2 udu

u = arctan x, si ha −π/2 ≤ u ≤ π/2 e in questo intervallo cos u ≥ 0 da cui sec u ≥ 0,


Poichè √
quindi sec u = sec u. Allora
Z √ Z
I= sec u sec udu = sec3 udu
2 2

L’integrale in sec3 u si risolve riconducendosi all’integrale di sec u. Risolviamo prima que-


st’ultimo integrale (usando degli accorgimenti: come vedete, la strada per risolvere l’integrale
di partenza è molto lunga).
Z Z
sec u + tan u
sec udu = sec u du
sec u + tan u
sec2 u + sec u tan u
Z
= du
sec u + tan u
1 Se ci dovesse capitare di risolvere un esercizio arrivando ad un integrale del genere, dovremo ricordarci che

esiste tutta questa lunga procedura che ci apprestiamo a descrivere per giungere alla formula finale (e quindi
torneremo su questi appunti per ricordarci quale sia il risultato dell’integrale).

77
5. L E CURVE

A questo punto si fa un cambiamento di variabile (ancora!), ponendo w = sec u + tan u (l’e-


spressione al denominatore della funzione integranda), da cui dw = D(sec u + tan u)du =
(sec u tan u + sec2 u)du (ritroviamo l’espressione al numeratore della funzione integranda), da
cui
sec2 u + sec u tan u
Z Z
1
du = dw = ln |w| + costante
sec u + tan u w
= ln | sec u + tan u| + costante
Torniamo ora all’integrale di sec3 u riscrivendo diversamente la funzione integranda:
sec3 u sec3 u
sec3 u = +
2 2
3
sec u sec2 u sec u
= +
2 2
sec3 u (tan2 u + 1) sec u
= +
2 2
sec3 u tan2 u sec u sec u
= + +
2 2 2
sec3 + tan2 u sec u sec u
= +
2 2
Per calcolare l’integrale di sec3 u dobbiamo integrare i due termini della somma in cui
abbiamo scomposto sec3 u. Del secondo termine sappiamo già quanto vale l’integrale. Per il
primo, basta osservare che
D(sec u tan u) = D(sec u) tan u + sec uD(tan u)
= sec u tan u tan u + sec u sec2 u
= sec u tan2 u + sec3 u
Ma allora
sec u tan2 u + sec3 u
Z Z
1 1
du = D(sec u tan u)du = sec u tan u + costante
2 2 2
Ritornando all’integrale di prima e mettendo insieme i vari pezzi si ha
Z
1
sec3 udu = (sec u tan u + ln | sec u + tan u|) + costante
2
Quindi (finalmente siamo arrivati alla conclusione!!!!):
Z p Z
1
1 + x dx = sec3 udu = (sec u tan u + ln | sec u + tan u|) + costante
2
2
Per tornare alla variabile originale x, da x √ = tan u si ha√u = arctan x, da cui (sfruttando le
proprietà viste prima di sec u e tan u) sec u = 1 + tan2 u = 1 + x2 . Perciò, sostituendo
Z p
1 p p 
1 + x2 dx = x 1 + x2 + ln | 1 + x2 + x| + costante
2
Sappiamo ora calcolare la lunghezza della spirale di Archimede.
Tornando alla formula
Z θf p
L=k 1 + θ2 dθ
0
abbiamo
  p
1 p θf k
 q q 
L=k θ 1 + θ2 + ln | 1 + θ2 + θ| = θf 1 + (θf )2 + ln | 1 + (θf )2 + θf |
2 0 2

78
5.11. Funzioni a valori vettoriali

5.11 Funzioni a valori vettoriali


Abbiamo visto che una curva può essere rappresentata mediante due equazioni parame-
triche che individuano l’ascissa e l’ordinata di ogni suo punto (se avessimo una curva nello
spazio 3D avremmo tre equazioni, una per x, una per y, una per z).
Queste equazioni sono un esempio di funzione a valori vettoriali. Nel caso della curva in
2D possiamo definire una funzione f definita nell’insieme [t0 , tf ] e a valori in R2 : f : [t0 , tf ] →
R2 tale che f = (x(t), y(t)) Al parametro t è associato il punto (x(t), y(t)), che possiamo vedere
anche come un vettore di R2 .
Più in generale

Definizione 5.11.1 f : I → Rn con I ⊂ Rk , (k, n interi) è una funzione vettoriale.


Se la funzione vettoriale è data da f (t) = (f1 (t), f2 (t), . . . , fn (t)), possiamo calcolare la sua
derivata, che è il vettore che ha come componenti le derivate delle componenti della funzio-
ne: f 0 (t) = (f10 (t), f20 (t), .p , fn0 (t)). Di questo vettore possiamo calcolare il modulo (che è una
. .P
0 n 0 2
funzione di t): |f (t)| = i=1 (fi (t)) . s 
2  2
dx dy dx dy
Nel caso 2D, se f (t) = (x(t), y(t)), si ha f 0 (t) = ( , ) e |f 0 (t)| = +
dt dt dt dt

5.12 Le curve riviste come funzioni vettoriali


Definizione 5.12.1 G Si dice curva di R n
ogni applicazione

f : [a, b] → Rn

G Si dice sostegno (oppure traccia o traiettoria) della curva l’insieme f ([a, b]) (il codominio
della funzione).
G Un curva f si dice di classe C se f è di classe C ([a, b]) (cioè se ogni sua componente è di
k k

classe C k ).
La curva rappresentata dalla f viene detta anche curva γ.

Definizione 5.12.2 Una curva γ si dice regolare se


1. la f è di classe C 1 ([a, b])
2. ∀t ∈]a, b[: |f 0 (t)| > 0
3. Se la f è una corrispondenza biunivoca tra [a, b] e f ([a, b]) (si può avere una sola eccezione
se la curva è chiusa, per cui f (a) = f (b))

Definizione 5.12.3 Due funzioni vettoriali f : [a, b] → Rn e g : [α, β] → Rn rappresentanto la


stessa curva γ se esiste una funzione Φ : [α, β] → [a, b], di classe C 1 e Φ0 (u) > 0 ∀u ∈ [α, β], tale
che
G Φ(α) = a Φ(β) = b
G ∀u ∈ [α, β] : g(u) = (f ◦ Φ)(u) = f (Φ(u))

Definizione 5.12.4 Una curva si dice generalmente regolare o regolare a tratti se


1. f è continua
2. esiste un numero finito di punti a = t0 < t1 < . . . < tr = b tali che la f ristretta a ciascun
sottointervallo [ti−1 , ti ], i = 1, 2, . . . , r rappresenti una curva regolare

79
5. L E CURVE

Esempio
Es. 5.12.1 La curva data da

x=t y = |t| −1≤t≤1

non è regolare perchè non è derivabile per t = 0, ma la curva è generalmente regolare


perchè ristretta a [−1, 0] e [0, 1] è regolare.

5.13 Retta tangente ad una curva


Definizione 5.13.1 Data una curva γ di classe C 1 , data dalla funzione vettoriale

f : [a, b] → Rn

sia tp ∈]a, b[, con f 0 (tp ) 6= 0.


Si definisce retta tangente alla curva γ nel punto f (tp ) la retta passante per f (tp ) e avente
come direzione quella del vettore f 0 (tp ):

r~t = f (tp ) + tf 0 (tp ) t∈R

Nel caso 2D ritroviamo la retta che avevamo introdotto a pag. 66:

dx(tp ) dy(tp )
r~t = (x(tp ) + t, y(tp ) + t)
dt dt

Definizione 5.13.2 Il vettore f 0 (tp ) si dice vettore tangente alla curva γ in f (tp ).

In R2 il vettore tangente si indica anche come

f 0 (tp ) = x0 (t)~i + y 0 (t)~j

5.14 Curve orientate


L’orientamento naturale di una curva è quello dato da valori crescenti di t. Per dire che
la curva ha l’orientamento naturale la si indica come +γ.
L’orientamento di una curva può essere data dal versore

f 0 (t)
τ (t) =
|f 0 (t)|

Definizione 5.14.1 Data una curva γ di classe C 1 , data da f : [a, b] → Rn si chiama curva
opposta la curva Γ data da F : [−b, −a] → Rn per la quale F(u) = f (−u)
La curva orientata +Γ ha orientamento naturale opposto a quello della curva +γ. Proprio
per questo motivo, si può indicare con −γ la curva opposta +Γ.

5.15 Di nuovo sulla lunghezza di una curva


Diamo qualche cenno su come si arriva alla lunghezza di una curva.
Data una curva γ di classe C 0 , sia data una suddivisione dell’intervallo [a, b] mediante i
punti a = t0 < t1 < . . . < tr = b. Si consideri la poligonale che congiunge i punti f (ti ). Si
dice lunghezza della curva γ l’estremo superiore dell’insieme costituito dalle lunghezze delle

80
5.16. L’ascissa curvilinea

poligonali così create, considerando tutte le possibili suddivisioni dell’intervallo [a, b] fatte
con un numero finito di punti.
Una curva che ha lunghezza finita si dice rettificabile.
Una curva regolare è rettificabile e la sua lunghezza è data da
Z b
L= |f 0 (t)|dt
a

Osserviamo che questa formula è esattamente quella che abbiamo ricavato in precedenza.
Per una curva regolare a tratti si ha un’analoga definizione, considerando la somma delle
lunghezze delle curve regolari di cui è composta.

Proposizione 5.15.1 L’integrale che fornisce la lunghezza di una curva non cambia se si
considera la curva opposta a quella data o se si considera la curva mediante rappresentazioni
equivalenti.

5.16 L’ascissa curvilinea


Data una curva regolare orientata +γ data da f : [a, b] → Rn si definisca la funzione reale
s(t) data da
(R t
a
|f 0 (u)|du per t 6= a
s(t) =
0 per t = a

Questa funzione rappresenta la lunghezza dell’arco di curva tra f (a) e f (t) ed è detta ascissa
curvilinea. È una funzione crescente poichè s0 (t) = |f 0 (t)| > 0 (essendo la curva regolare).
La sua inversa è una funzione Φ(s) tale che Φ(s) = t e tale che ∀s ∈ [0, L] (dove L è la
lunghezza della curva γ) si ha Φ(0) = a, Φ(L) = b e Φ0 (s) > 0.
Ma, allora, f è equivalente alla funzione g = f ◦ Φ. La funzione g dipende dall’ascissa
curvilinea s.
La rappresentazione di una curva mediante l’ascissa curvilinea non dipende dalla
rappresentazione parametrica da cui si è partiti.

Proposizione 5.16.1 La derivata di g ha modulo unitario (o norma unitaria).


Dimostrazione.

|g0 (s)| = |(f ◦ Φ)0 (s)| = |f 0 (Φ(s))Φ0 (s)| = |f 0 (Φ(s))|Φ0 (s)

Non abbiamo considerato il modulo di Φ0 (s) essendo questa funzione positiva e scalare.
1
Poichè Φ è la funzione inversa di s, per la derivata vale Φ0 (s) = 0 (la derivata della
s (Φ(s))
inversa di una funzione è uguale al reciproco della derivata della funzione stessa), andando
a sostituire, si trova:

|g0 (s)| = 1

4
Considerando il differenziale dell’ascissa curvilinea si ha la cosiddetta lunghezza dell’arco
elementare:

ds = |f 0 (t)|dt

81
C APITOLO 6
Superfici parametriche

Secondo alcuni autorevoli testi


di tecnica aeronautica, il
calabrone non può volare, a
causa della forma e del peso
del proprio corpo in rapporto
alla superficie alare. Ma il
calabrone non lo sa e perciò
continua a volare.

Igor Ivanovich Sikorsky


(1889-1972)

6.1 Superfici parametriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83


6.1.1 Sistema di coordinate sferiche . . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.2 Piano tangente a una superficie parametrica . . . . . . . . . . . . . . . . . . . . . 87
6.2.1 Equazione di un piano e vettore normale al piano . . . . . . . . . . . . . . . 87

6.1 Superfici parametriche


Così come una curva è stata rappresentata in forma parametrica, anche una superficie
può essere rappresentata in forma parametrica mediante tre funzioni (una per x, una per y,
una per z) dipendenti da due parametri, dette equazioni parametriche della superficie

x = x(u, v) y = y(u, v) z = z(u, v).

Alla stessa maniera con cui abbiamo visto le equazioni di una curva parametrica co-
me una funzione vettoriale, anche una superficie parametrica può essere vista come una
funzione vettoriale che dipende da due variabili ~r : R2 −→ R3 , tale che

~r(u, v) = (x(u, v), y(u, v), z(u, v))

La funzione vettoriale è definita su una regione D del piano uv e l’insieme dei pun-
ti (x, y, z) ∈ R3 , che sono i valori della funzione vettoriale, prende il nome di superficie
parametrica S.

83
6. S UPERFICI PARAMETRICHE

Figura 6.1: Cilindro di equazioni x = 4 cos u, y = v, z = 4 sin u.

Figura 6.2: Cilindro di equazioni x = 4 cos u, y = v, z = 4 sin u con 0 ≤ u ≤ π/4, 0 ≤ v ≤ 1.

Esempio
Es. 6.1.1 Sia data la superficie di equazioni parametriche

x = 4 cos u, y = v, z = 4 sin u

Cerchiamo di capire di quale superficie si tratta.


Da x2 + z 2 = 16 cos2 u + 16 sin2 u = 16 deduciamo che sezioni verticali parallele al piano
xz, vale a dire per y costante, sono tutte circonferenze di raggio 4. Dal momento che
l’equazione parametrica per y è proprio y = v, e v ∈ R, la superficie è un cilindro circolare
di raggio 4 il cui asse è l’asse delle y (si veda Figura 6.1).

Esempio
Es. 6.1.2 Nell’esempio di prima, non c’erano limitazioni ai parametri u e v. Se invece
poniamo delle limitazioni avremo una porzione di cilindro. Facciamo variare u in [0, π/4]
e v in [0, 1]. In Figura 6.2 possiamo osservare la superficie che otteniamo.

84
6.1. Superfici parametriche

Figura 6.3: Rappresentazione delle coordinate sferiche.

Se una superficie parametrica S è data dalla funzione vettoriale ~r(u, v), è utile definire due
famiglie di curve che si trovano sulla superficie: una famiglia di curve che si ha considerando
u costante e l’altra che si ha considerando v costante. Queste due famiglie corrispondono a
linee verticali e orizzontali nel piano uv.
Prendendo u = u0 , la funzione vettoriale ~r(u0 , v) diventa una funzione vettoriale dipenden-
te dal solo parametro v e definisce una curva γ1 che giace sulla superficie S. Analogamente,
per v = v0 , si ha la curva γ2 data da ~r(u, v0 ) sulla superficie S.
Le due curve prendono il nome di curve coordinate o curve di griglia. I grafici che abbiamo
fatto per visualizzare le superfici degli esempi precedenti mostrano queste curve coordinate.

6.1.1 Sistema di coordinate sferiche


Per visualizzare il grafico delle superfici, a volte è utile rappresentare le superfici in un
sistema di coordinate che non è quello cartesiano. Vediamo nel dettaglio il sistema di coor-
dinate sferiche, dove un punto P che ha coordinate (x, y, z) nello spazio cartesiano viene
rappresentato in coordinate sferiche mediante (ρ, θ, φ) (si veda p Figura 6.3): ρ rappresenta la
distanza del punto P dall’origine dello spazio cartesiano (ρ = x2 + y 2 + z 2 ), θ rappresenta
l’angolo che si ha tra la proiezione del punto P sul piano xy e l’asse positivo dell’asse x (in
altri termini, è la coordinata polare θ della proiezione di P sul piano xy), mentre φ è l’angolo
tra l’asse positivo dell’asse z e il segmento OP . Quindi ρ ≥ 0 e 0 ≤ φ ≤ π. Questo sistema di
coordinate è utile in presenza di simmetrie intorno all’origine.
La relazione tra coordinate cartesiane e coordinate sferiche, tiene conto delle relazioni
trigonometriche. In Figura 6.4 vediamo i due triangoli rettangoli OP Q e OP P 0 . Il triangolo
OP Q ha i lati OQ e OP di lunghezza z e ρ rispettivamente, e, per le relazioni sui lati e angoli
di un triangolo rettangolo vale z = ρ cos φ. Il triangolo OP P 0 ha uno dei suoi cateti, indicato
con r, che è dato dalla proiezione di OP sul piano xy. Vale r = ρ sin φ. Le coordinate x e y
sono cateti del triangolo che si forma sul piano xy e che ha come ipotenusa proprio r, da cui
x = r cos θ e y = r sin θ, vale a dire x = ρ sin φcosθ e y = ρ sin φ sin θ.
Riassumendo, le coordinate sferiche di P sono date da

x = ρ sin φ cos θ, y = ρ sin φ sin θ, z = ρ cos φ

Viceversa, considerando la formula della distanza di un punto P dall’origine e sosituendo i

85
6. S UPERFICI PARAMETRICHE

Figura 6.4: Relazione tra coordinate cartesiane e sferiche.

Figura 6.5: Superficie sferica. Il grafico è fatto usando coordinate cartesiane (a sinistra) e
coordinate sferiche (a destra).

valori appena trovati si ricava:


p q
x2 + y 2 + z 2 = ρ2 sin2 φ cos2 θ + ρ2 sin2 φ sin2 θ + ρ2 cos2 φ = ρ

Esempio
Es. 6.1.3 L’equazione di una sfera di centro l’origine e raggio r è data da x2 +y 2 +z 2 = r2 .
Possiamo descrivere la sfera usando equazioni parametriche del tipo
p
x = x, y = y, z = ± r 2 − x2 − y 2

Osserviamo che abbiamo due funzioni per z. Usando queste equazioni e unendo i grafici,
otteniamo la sfera che si vede in Figura 6.5 a sinistra: parti della sfera non sono rappre-
sentate ma ci sono dei buchi, perchè x e y sono fatti variare in un dominio rettangolare e,
in corrispondenza dei buchi abbiamo delle radici quadrate di valori negativi! Se usiamo
invece coordinate sferiche, i punti hanno coordinate con ρ = r, da cui,

x = r sin φ cos θ, y = r sin φ sin θ, z = r cos φ, 0 ≤ φ ≤ π, 0 ≤ θ ≤ 2π

86
6.2. Piano tangente a una superficie parametrica

Il grafico della sfera usando le coordinate sferiche è in Figura 6.5 a destra. Osser-
viamo come la superficie sia ben rappresentata. In questo caso le curve coordinate
per φ costante sono delle circonferenze di valore costante (che corrispondono ai no-
ti paralleli che si studiano in geografia). Per θ costante abbiamo invece i meridiani
(semicirconferenze perchè 0 ≤ φ ≤ π) che collegano polo nord e polo sud.

6.2 Piano tangente a una superficie parametrica


Data una superficie parametrica S di equazione ~r(u, v) = (x(u, v), y(u, v), z(u, v)), voglia-
mo calcolare l’equazione del piano tangente alla superficie in un punto P0 (x0 , y0 , z0 ) che vi
appartiene. Esiste quindi una coppia di valori (u0 , v0 ) tale che P0 = ~r(u0 , v0 ).
Per calcolare il piano tangente, facciamo questo tipo di ragionamento. Fissando u =
u0 , le equazioni parametriche della superficie diventano ~r(u0 , v) = (x(u0 , v), y(u0 , v), z(u0 , v)):
abbiamo una funzione vettoriale che dipende dalla sola variabile v e che definisce una curva
parametrica γ1 nello spazio R3 . Questa curva giace sulla superficie S.
Scriviamo le equazioni parametriche della retta tangente a questa curva (si veda pag. 80),
considerando che quella che è la derivata della funzione x(u0 , v) rispetto a v nel punto v = v0
altro non è che la derivata parziale della funzione x(u, v) rispetto a v nel punto (u0 , v0 ) (stesso
discorso vale per y e per z). Otteniamo

~ tv = (x0 + t ∂x(u0 , v0 ) , y0 + t ∂y(u0 , v0 ) , z0 + t ∂z(u0 , v0 ) )


retta
∂v ∂v ∂v
Abbiamo chiamato questa retta con retta~ tv perchè è la retta tangente alla curva che dipende
dalla variabile v poichè u = u0 costante. Di conseguenza, la pendenza di questa retta, vale a
dire, la tangente alla curva γ1 nel punto x(u0 , v0 ), y(u0 , v0 ) è data dal vettore

∂x(u0 , v0 ) ∂y(u0 , v0 ) ∂z(u0 , v0 )


r~tv = ( , , )
∂v ∂v ∂v
Allo stesso modo, possiamo fissare v = v0 e considerare che le equazioni parametriche del-
la superficie, in questo caso, si riducono alle equazioni parametriche di una curva nello
spazio R3 che dipendono dalla variabile u. Analogamente, possiamo scrivere le equazioni
parametriche della retta tangente a questa curva nel punto P0 , ottenendo

~ tu = (x0 + t ∂x(u0 , v0 ) , y0 + t ∂y(u0 , v0 ) , z0 + t ∂z(u0 , v0 ) )


retta
∂u ∂u ∂u
La pendenza di questa retta è data dal vettore
∂x(u0 , v0 ) ∂y(u0 , v0 ) ∂z(u0 , v0 )
r~tu = ( , , )
∂u ∂u ∂u
Una volta ottenute queste due rette, il piano tangente alla superficie è il piano individuato
dalle direzioni di queste due rette, cioè dai due vettori r~tu e r~tv . Consideriamo dei brevi
richiami sulle equazioni di un piano in R3 .

6.2.1 Equazione di un piano e vettore normale al piano


Supponiamo di avere un punto P0 = (x0 , y0 , z0 ) su un piano nello spazio R3 . Supponiamo
di avere anche un vettore ~n che è normale a questo piano:
Assumiamo di conoscere un altro generico punto P = (x, y, z) che giace sul piano.
Indichiamo con ~r e r~0 i vettori che ci indicano i due punti P e P0 rispettivamente (si
veda figura 6.6). Possiamo costruire il vettore ~r − r~0 che giace interamente nel piano. Per

87
6. S UPERFICI PARAMETRICHE

Figura 6.6: piano nello spazio

semplicità, nella figura 6.6 abbiamo messo sul piano il vettore ~n (anche se esso potrebbe
stare da tutt’altra parte). Ora, poichè ~n è ortogonale al piano, esso è ortogonale ad ogni
vettore che giace nel piano. In particolare esso è ortogonale al vettore ~r − r~0 . Vale dunque:
~n · (~r − r~0 ) = 0
Se ~n è un vettore di componenti (a, b, c), poichè ~r − r~0 = (x − x0 , y − y0 , z − z0 ), il prodotto
scalare diventa
a(x − x0 ) + b(y − y0 ) + c(z − z0 ) = 0
Questa è l’equazione scalare del piano. Spesso troviamo l’equazione scritta nella forma
ax + by + cz = d dove d = ax0 + by0 + cz0
Osserviamo quindi che, data l’equazione di un piano possiamo ricavare facilmente un vettore
normale al piano: esso è dato da ~n = (a, b, c).
Ora, dati due vettori ~a e ~b in R3 , il prodotto vettoriale ~a × ~b è un vettore che punta nella
direzione perpendicolare al piano individuato dai due vettori ~a e ~b, mentre la sua lunghezza
è data da
|~a × ~b| = |~a||~b| sin θ
dove θ è l’angolo compreso dai due vettori (0 ≤ θ ≤ π). Da questa formula deduciamo che
se i due vettori sono paralleli allora il loro prodotto vettoriale è nullo e viceversa. Come
interpretazione geometrica si ha che la lunghezza del prodotto vettoriale rappresenta l’area
del parallelogramma individuato dai vettori ~a e ~b. Per trovare le componenti del prodotto
vettoriale si ha la formula legata al determinante della matrice che ha sulla prima riga i
versori dell’asse delle x, delle y e delle z rispettivamente, sulla seconda riga le componenti
del vettore ~a e sulla terza riga le componenti del vettore ~b. Si calcola il determinante della
matrice rispetto alla prima riga in modo da avere come risultato un vettore. Sia ~a = (a1 , a2 , a3 )
e ~b = (b1 , b2 , b3 ). I versori unitari dei tre assi siano dati da ~i, ~j, ~k. Il prodotto vettoriale ~a × ~b è
dato da
~i ~j ~k


a2 a3 a1 a3 a1 a2
~ ~ ~ ~

~a × b = a1 a2 a3 = i
−j +k
b1 b2 b3 b2 b3 b1 b3 b1 b2

= ~i(a2 b3 − b2 a3 ) − ~j(a1 b3 − b1 a3 ) + ~k(a1 b2 − b1 a2 )


= (a2 b3 − b2 a3 , b1 a3 − a1 b3 , a1 b2 − b1 a2 )

88
6.2. Piano tangente a una superficie parametrica

Quindi se abbiamo due vettori ~a e ~b che si trovano sul piano di cui vogliamo scrivere l’e-
quazione, il loro prodotto vettoriale è il vettore normale al piano e può essere utilizzato per
scrivere l’equazione del piano tangente.
Tornando al piano tangente ad una superficie parametrica in un punto P0 , poichè abbia-
mo trovato i due vettori tangenti r~tu e r~tv che si trovano sul piano tangente alla superficie,
allora il piano tangente è individuato dal vettore ~n = r~tu × r~tv (i due vettori non devono essere
tangenti tra loro).

Esempio
Es. 6.2.1 Sia data la superficie di equazioni parametriche

x = 2u2 , y = 3v 2 , z = 3u + 5v

Vogliamo trovare l’equazione del piano tangente alla superficie nel punto P0 (2, 3, 8).
Notiamo che questo punto si ha per u = v = 1.
Calcoliamo i due vettori tangenti r~tu e r~tv .
Poichè
∂x ∂y ∂z
= 4u, = 0, =3
∂u ∂u ∂u
valutando queste derivate in (1, 1) abbiamo

r~tu = (4, 0, 3)

Analogamente, poichè

∂x ∂y ∂z
= 0, = 6v, =5
∂v ∂v ∂v
valutando queste derivate in (1, 1) abbiamo

r~tv = (0, 6, 5)

Il prodotto vettoriale è
~i ~j ~k

r~tu × r~tv = 4 0 3 = (−18)~i − (12)~j + (24)~k = (−18, −12, 24)



0 6 5

Quindi il piano tangente è dato da

a(x − x0 ) + b(y − y0 ) + c(z − z0 ) = 0

dove (a, b, c) = (−18, −12, 24) e (x0 , y0 , z0 ) = (2, 3, 8) = P0 , da cui

−18(x − 2) − 12(y − 3) + 24(z − 8) = 0

o ancora

−18x + 36 − 12y + 36 + 24z − 192 = 0 =⇒ 24z − 12y − 18x − 120 = 0 =⇒ 2z − y − 1.5x − 10 = 0

89
C APITOLO 7
Integrali

Compito della scienza non è


aprire una porta all’infinito
sapere, ma porre una barriera
all’infinita ignoranza.

Galileo Galilei (1564-1642)

7.1 Integrali dipendenti da parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91


7.1.1 Integrali dipendenti da parametri per funzioni di una sola variabile . . . . 91
7.1.2 Integrali dipendenti da parametri per funzioni di due variabili . . . . . . . 92
7.2 Richiamo sugli integrali semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.3 Integrali doppi su domini rettangolari . . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.4 Integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.5 Integrali doppi su domini generali . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.6 Proprietà degli integrali doppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.7 Cambiamento di variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.7.1 Significato dello jacobiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
7.8 Area di un dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
7.9 Cenni su integrali tripli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
7.10 Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.11 Integrali di superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.11.1Area di una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.11.2Integrale di una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.12 Solidi e superfici di rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113

7.1 Integrali dipendenti da parametri


Analizziamo brevemente gli integrali dipendenti da parametri, vedendo il caso in cui la
funzione integranda dipende da una sola variabile e il caso in cui dipende da due variabili.

7.1.1 Integrali dipendenti da parametri per funzioni di una sola variabile


Se f : I −→ R con I ⊂ R è una funzione continua, fissato x0 ∈ I si può definire la funzione
Z x
F (x) = f (t)dt
x0

Questa funzione prende il nome di funzione integrale della f di punto iniziale x0 .

91
7. I NTEGRALI

Proposizione 7.1.1 Se G è una primitiva della f (quindi G0 = f ) si ha


Z x
F (x) = f (t)dt = G(x) − G(x0 )
x0

La funzione F è a sua volta una primitiva di f .


d R x  d(G(x) − g(x ))
0
Dimostrazione. Infatti F 0 (x) = x
f (t)dt = = f (x). 4
dx 0 dx

7.1.2 Integrali dipendenti da parametri per funzioni di due variabili


Se f : I −→ R con I ⊂ R2 è una funzione continua, si può definire la funzione
Z y1
F (y0 , y1 , x) = f (x, y)dy
y0

Quindi, fissato un certo valore di x, calcoliamo l’integrale della funzione f (x, y), come funzio-
ne che dipende solo da y, per y0 ≤ y ≤ y1 . Al variare di x varia l’integrale. E l’integrale varia
anche al variare di y0 e y1 , perciò è una funzione che dipende da tre variabili, y0 , y1 e x.
La F è una funzione continua.

Proposizione 7.1.2 Se f è continua, la F è derivabile rispetto a y0 e y1 e vale

∂F ∂F
= f (x, y1 ) = −f (x, y0 )
∂y1 ∂y0
Dimostrazione.
La prima relazione segue dal fatto che, poichè stiamo facendo la derivata rispetto a y1 (che
è il secondo estremo dell’intervallo di integrazione), posso considerare la F come funzione
integrale di una funzione dipendente da una sola variabile. In particolare, fissati x e y0 ,
considero la funzione g(y) = f (x, y) e
Z y1
F1 (y1 ) = F (y0 , y1 , x) = g(y)dy
y0

Mi riconduco dunque al caso visto prima, da cui F10 (y1 ) = g(y1 ). Ma g(y1 ) = f (x, y1 ) e F10 (y1 )
∂F (y0 , y1 , x)
altro non è che la derivata della funzione F per y0 e x fissati, quindi F10 (y1 ) =
∂y1
Ricaviamo dunque

∂F (y0 , y1 , x)
= f (x, y1 )
∂y1

Per trovare la seconda formula che abbiamo scritto nella proposizione, basta ricordare
Rb Ra
che a g(x)dx = − b g(x)dx da cui
Z y1 Z y0
f (x, y)dy = − f (x, y)dy
y0 y1

92
7.2. Richiamo sugli integrali semplici

Utilizzando questa formula e il risultato precendente, e scambiando il ruolo di y0 e y1


troviamo che vale1
∂F (y0 , y1 , x)
= −f (x, y0 )
∂y0
4
Si può pensare, della F di voler calcolare anche la derivata parziale rispetto alla x. In tal
caso vale la relazione
Z y1
∂F ∂f (x, y)
= dy
∂x y0 ∂x

Valgono inoltre le seguenti proposizioni

Proposizione 7.1.3 Se f è di classe C 1 anche F è di classe C 1 .


Se si fa variare y in un certo intervallo definito da due funzioni dipendenti da x: α(x) ≤
y ≤ β(x), con α e β funzioni di classe C 0 , possiamo definire la funzione
Z β(x)
F (x) = f (x, y)dy
α(x)

Proposizione 7.1.4 Se le funzioni f , α e β sono di classe C 1 allora anche la funzione F (x) =


R β(x)
α(x)
f (x, y)dy è di classe C 1 e vale
Z β(x)
0 0 0 ∂f (x, y)
F (x) = f (x, β(x))β (x) − f (x, α(x))α (x) + dy
α(x) ∂x

Dimostrazione. Vediamo F (x) = F (α(x), β(x), x).


Allora, per la derivazione delle funzioni composte:
∂F ∂F 0 ∂F
F 0 (x) = α0 (x) + β (x) +
∂α(x) ∂β(x) ∂x
Applicando i risultati già visti per ciascuna di queste derivate parziali, ritroviamo l’asserto.
4

7.2 Richiamo sugli integrali semplici


Prima di vedere cosa sono gli integrali multipli (doppi o tripli), rivediamo brevemente cosa
è un integrale definito di una funzione che dipende da una sola variabile:
Z b
f (x)dx
a
1 Possiamo pensare di riscrivere la F come F (y0 , y1 , x) = yy1 f (x, y)dy = − yy0 f (x, y)dy = −G(y1 , y0 , x) dove
R R
R y0 0 1
G(y1 , y0 , x) = y f (x, y)dy
1
Di G (avendo scambiato il ruolo di y0 e y1 ) sappiamo qual è la derivata rispetto a y0 (secondo estremo di
integrazione):
∂G
= f (x, y0 )
∂y0
Allora
∂F (y0 , y1 , x) ∂G
=− = −f (x, y0 )
∂y0 ∂y0
Ritroviamo dunque l’asserto.

93
7. I NTEGRALI

Rb
Figura 7.1: Come si arriva alla definizione di a
f (x)dx.

dove a ≤ x ≤ b. Per integrali di questo tipo, diciamo che stiamo integrando la funzione f (x)
nell’intervallo [a, b]. I punti a e b si dicono estremi dell’intervallo di integrazione.
Il concetto di integrale di una funzione si deriva considerando l’area che si trova sotto la
curva definita da y = f (x) nell’intervallo [a, b] (supponiamo per semplicità che la funzione f
sia positiva, ma il concetto si generalizza a funzioni negative o che hanno valori sia positivi
che negativi... il valore di un integrale può essere sia positivo che negativo, a seconda della
funzione da integrare).
Per calcolare l’area sottesa dalla funzione y = f (x) possiamo pensare di dividere l’inter-
vallo [a, b] in n parti uguali, in modo da avere n sottointervalli di ampiezza ∆x. In ciascuno
di questi sottointervalli scegliamo un punto x∗i (ad esempio il punto medio di ciascuno dei
sottointervalli) e consideriamo il rettangolo di ampiezza ∆x e altezza f (x∗i ) (si veda Figu-
ra 7.1). Ciascuno di questi rettangoli ha area pari a f (x∗i )∆x, quindi l’integrale può essere
approssimato mediante la somma delle aree di ciascun rettangolo:
Z b
f (x)dx ≈ f (x∗1 )∆x + f (x∗2 )∆x + . . . + f (x∗n )∆x)
a

Per ottenere l’area esatta della nostra funzione, facciamo il limite per n che tende
all’infinito.
Z b n
X
f (x)dx = lim f (x∗i )∆x
a n→∞
i=1

7.3 Integrali doppi su domini rettangolari


Vediamo ora cosa accade se abbiamo una funzione di due variabili f (x, y). Se per funzioni
di una sola variabile integriamo su un intervallo (un sottoinsieme di R), per funzioni di due
variabili ha senso integrare su una regione di R2 .
Assumiamo di avere una regione di R2 data dal rettangolo D = [a, b] × [c, d]. Ciò vuol dire
che a ≤ x ≤ b mentre c ≤ y ≤ d.
Sia, inoltre, f (x, y) ≥ 0 per ogni coppia di punti (x, y) ∈ D, anche se quanto diremo ora si
può estendere al caso più generale di funzioni che assumono valori sia positivi che negativi.
La domanda che ci poniamo è la seguente: qual è il volume della regione che si trova
sotto il grafico della funzione f (x, y) e sopra il piano xy? (si veda Figura 7.2)
Per prima cosa cerchiamo di approssimare il volume (in maniera analoga a quanto abbia-
mo fatto per l’area nel caso di funzioni di una sola variabile). Per far ciò dividiamo l’intervallo
[a, b] in n parti uguali e l’intervallo [c, d] in m parti uguali, in modo da dividere D in tanti

94
7.3. Integrali doppi su domini rettangolari

Figura 7.2: Grafico di una funzione f (x, y) sul rettangolo D.

Figura 7.3: Suddivisione del rettangolo D in tanti rettangolini.

rettangolini (ne abbiamo n × m) e, in ciascuno di questi, scegliamo un punto di coordinate


(x∗i , yj∗ ) (si veda Figura 7.3).
Su ciascuno di questi rettangolini, costruiamo una colonnina (un parallelogramma) di
altezza data da f (x∗i , yj∗ ). Ciascuno dei parallelogrammi ha un volume dato da f (x∗i , yj∗ )∆x∆y.
Approssiamo il volume V che si trova sotto il grafico della funzione f (x, y) sommando i
volumi di ciascun parallelogramma
n X
X m
V ≈ f (x∗i , yj∗ )∆x∆y
i=1 j=1

Prendendo suddivisioni lungo l’asse x e y via via più raffinate, facendo cioè tendere
all’infinito n e m noi avremo una stima via via più accurata del volume V , vale a dire

n X
X m
V = lim f (x∗i , yj∗ )∆x∆y
n,m→∞
i=1 j=1

A questo punto abbiamo la definizione di integrale doppio (si noti la somiglianza con la
definizione data per integrale definito per funzioni di una singola variabile).

95
7. I NTEGRALI

Indichiamo, infatti come integrale doppio della funzione f sul dominio dato dal rettangolo
D proprio il volume V :
ZZ n X
X m
f (x, y)dA = lim f (x∗i , yj∗ )∆x∆y.
D n,m→∞
i=1 j=1

7.4 Integrali iterati


Supponiamo che f sia una funzione continua nel rettangolo D = [a, b]×[c, d]. Utilizziamo la
Rd
notazione c f (x, y)dy per dire che x è costante e si integra la funzione rispetto alla variabile y
per y che varia da c a d. Una volta che abbiamo calcolato questo integrale, avremo un valore
che dipende dal valore di x, quindi questo integrale definisce una funzione di x:
Z d
A(x) = f (x, y)dy
c

Adesso integriamo A rispetto a x, per x che varia in [a, b], ottenendo


Z b Z "Z #
b d
A(x)dx = f (x, y)dy dx
a a c

L’integrale scritto a destra dell’equazione precedente prende il nome di integrale iterato. Di


RbRd
solito non si mettono le parentesi ma si scrive direttamente a c f (x, y)dydx: quindi prima
integriamo rispetto a y da c a d e poi integriamo rispetto a x da a a b.
Alla stessa maniera si può definire l’integrale iterato dato da
Z Z d b Z "Z #
d b
f (x, y)dxdy = f (x, y)dx dy
c a c a

In questo caso, prima integriamo rispetto alla variabile x da a a b e poi integriamo rispetto a
y da c a d.

Esempio
R4R3
Es. 7.4.1 Valutiamo 0 2 xy 2 dydx.
Dobbiamo prima integrare rispetto alla variabile y, considerando x costante, ottenendo
Z 3  3 3
2 y
xy dy = x
2 3 2
33 23 19
=x −x = x
3 3 3
Il valore che abbiamo ottenuto corrisponde alla funzione A(x) introdotta prima.
Integriamo questa funzione per x che varia da 0 a 4. Otteniamo
Z 4Z 3 Z 4 Z 3 
xy 2 dydx = xy 2 dy dx
0 2 0 2
4 4
19 x2
Z 
19 19 152
= xdx = = 8=
0 3 3 2 0 3 3

96
7.5. Integrali doppi su domini generali

Esempio
R3R4
Es. 7.4.2 Proviamo ora a calcolare 2 0 xy 2 dxdy.
Questa volta dobbiamo integrare prima rispetto a x e poi rispetto a y. Abbiamo
Z 3Z 4 Z 3 Z 4 
2 2
xy dxdy = xy dx dy
2 0 2 0
3 4
x2 2
Z 
= y dy
2 2 0
Z 3  3 3
y
= 8y 2 dy = 8
2 3 2
33 23 152
= 8( − )=
3 3 3
Osserviamo come abbiamo ottenuto lo stesso risultato scambiando l’ordine di
integrazione. Si ha infatti il seguente teorema.

Teorema 7.4.1 (di Fubini) Se f (x, y) è una funzione continua su D = [a, b] × [c, d] allora:

ZZ Z b Z d Z d Z b
f (x, y)dA = f (x, y)dydx = f (x, y)dxdy
D a c c a

o,
! !
ZZ Z b Z d Z d Z b
f (x, y)dA = f (x, y)dy dx = f (x, y)dx dy
D a c c a

Quindi abbiamo due strade equivalenti per calcolare un integrale doppio di una funzione
continua su un dominio rettangolare, riconducendoci a integrali di una sola variabile che
sappiamo calcolare. Riassumendo:
G
nel primo caso
!
ZZ Z Z Z Z b d b d
f (x, y)dA = f (x, y)dydx = f (x, y)dy dx
D a c a c

noi prima calcoliamo l’integrale che sta all’interno (tra parentesi tonde), vale a dire,
Rd
c
f (x, y)dy considerando x come una costante e integrando rispetto alla variabile y. Co-
me risultato avremo una funzione che dipende solo da x e sarà questa che poi andremo
a integrare tra a e b rispetto alla variabile x;
G nel secondo caso
!
ZZ Z Z Z d Z b d b
f (x, y)dA = f (x, y)dxdy = f (x, y)dx dy
D c a c a

Rb
andiamo prima a calcolare l’integrale a f (x, y)dx rispetto a x, considerando y come una
costante e poi andremo a integrare il risultato ottenuto rispetto a y nell’intervallo [c, d].

7.5 Integrali doppi su domini generali


A differenza degli integrali di funzioni di una sola variabile, in cui il dominio di integrazio-
ne è sempre un intervallo, per integrali di funzioni di due variabili, il dominio di integrazione

97
7. I NTEGRALI

Figura 7.4: Dominio normale rispetto all’asse x (sinistra) e rispetto all’asse y (destra).

non si riduce ad un rettangolo ma può avere una forma più generale. Consideriamo il caso
in cui il dominio di integrazione sia un insieme limitato D (perciò esiste un rettangolo R che
lo contiene).
In tal caso l’integrale di una funzione f (x, y) sul dominio R si può ricondurre all’integrale
di una funzione F (x, y) sul rettangolo R così definita:
(
f (x, y) se (x, y) appartiene a D
F (x, y) =
0 se (x, y) appartiene a R ma non a D

Allora
ZZ ZZ
f (x, y)dA = F (x, y)dA
D R

Da un punto di vista pratico, come calcolare questo integrale? La frontiera dell’insie-


me D deve potersi esprimere mediante funzioni continue di x o di y. Ci sono due casi da
considerare (si vedano Figure 7.4 e 7.5 per degli esempi)
1. Caso 1: l’insieme D è dato da
n o
D = (x, y) ∈ R2 t. c. a ≤ x ≤ b, g1 (x) ≤ y ≤ g2 (x)

Si dice che il dominio è normale rispetto all’asse x.


2. Caso 2: l’insieme D è dato da
n o
D = (x, y) ∈ R2 t. c. h1 (y) ≤ x ≤ h2 (y), c ≤ y ≤ d

Si dice che il dominio è normale rispetto all’asse y.


Se il dominio è normale rispetto all’asse x, vuol dire che prendendo una retta x = x0
con a ≤ x0 ≤ b, (normale dunque all’asse x), i valori di y che sono compresi tra g1 (x0 ) e
g2 (x0 ) giacciono tutti all’interno del dominio di integrazione. Analogamente, nel caso in cui
il dominio sia normale rispetto all’asse y, prendendo la retta y = y0 normale all’asse y, con
c ≤ y0 ≤ d, si ha che tutti i punti di ordinata y0 e di ascissa compresa tra h1 (y0 ) e h2 (y0 ) sono
all’interno del dominio di integrazione.
In questi casi, il teorema di Fubini applicato al rettangolo R in cui uno dei due lati
corrisponde con l’intervallo [a, b] o [c, d] a seconda che il dominio sia normale rispetto all’asse
x o y, si riduce ad un integrale iterato in cui gli estremi dell’integrale interno (da calcolare
per primo) sono dati proprio dalle due funzioni g1 , g2 , o h1 , h2 che delimitano la frontiera di
D, in quanto all’esterno la funzione F è nulla. Si ha il seguente teorema.

Teorema 7.5.1 (di Fubini) Data una funzione f (x, y) da integrare su un dominio D,

98
7.5. Integrali doppi su domini generali

n o
Figura 7.5: A sinitra: D = (x, y) ∈ R2 : 1 ≤ y ≤ 2, y ≤ x ≤ y 3 . Il dominio è normale rispetto
n √ o
all’asse y. A destra: D = (x, y) ∈ R2 : 0 ≤ x ≤ 1, x3 ≤ y ≤ x . Il dominio è normale rispetto
all’asse x.

Figura 7.6: Dominio dato dal triangolo di vertici (0, 3), (1, 1) e (5, 3)

G nel caso in cui il dominio di integrazione è normale rispetto all’asse x (Caso 1) si ha:
ZZ Z b Z g2 (x)
f (x, y)dA = f (x, y)dydx
D a g1 (x)

G nel caso in cui il dominio di integrazione è normale rispetto all’asse y (Caso 2) si ha:
ZZ Z d Z h2 (y)
f (x, y)dA = f (x, y)dxdy
D c h1 (y)

Esaminiamo il Caso 1 (il discorso si ripete analogo per il Caso 2). Noi calcoliamo prima
R g (x)
l’integrale interno g12(x) f (x, y)dy considerando x come costante, rispetto alla variabile y. Il
risultato ora dipende da x in quanto gli estremi di integrazione sono funzioni di x. Una volta
ottenuto questo integrale, integriamo il risultato rispetto alla variabile x con estremi a e b.
A volte, un dominio può essere considerato normale sia rispetto all’asse x sia rispetto
all’asse y. Altre volte può essere visto come unione di due domini. A seconda dell’integrale
che si deve fare, conviene scegliere di vederlo in un modo piuttosto che in un altro.

99
7. I NTEGRALI

Esempio
Es. 7.5.1 Nel caso del triangolo mostrato in Figura 7.6, il dominio può essere visto co-
me l’unione di due domini normali rispetto all’asse x, oppure come un dominio normale
rispetto all’asse y.
Nel primo caso, D = D1 ∪ D2 , in quanto la funzione g1 (x) varia a seconda di dove si trovi
x:

D1 = {(x, y) t.c. 0 ≤ x ≤ 1, −2x + 3 ≤ y ≤ 3}


 
1 1
D2 = (x, y) t.c. 1 ≤ x ≤ 5, x + ≤ y ≤ 3
2 2
1 1
Se riscriviamo le equazioni delle due rette y = −2x + 3 e y = x + in funzione di x
2 2
1 3
otteniamo, dalla prima, x = − y + , e dalla seconda x = 2y − 1, e possiamo scrivere
2 2
l’insieme D come
 
1 3
D = (x, y) t.c. − y + ≤ x ≤ 2y − 1, 1 ≤ y ≤ 3
2 2

Esempio
Es. 7.5.2 Calcoliamo D x2 dA dove D è l’insieme delimitato dalle parabole y = 3x2 e
RR

y = x2 + 2. Prima di tutta facciamo un grafico dell’insieme D (si veda Figura 7.7). I punti
di intersezione delle due parabole si hanno per 3x2 = x2 + 2 cioè 2x2 − 2 = vale a dire per
x = ±1. Si vede facilmente che il dominio è normale rispetto all’asse x: basta considerare
−1 ≤ x ≤ 1 e 3x2 ≤ y ≤ x2 + 2. Infatti la curva che delimita la porzione inferiore della
frontiera dell’insieme è data da y = 3x2 mentre la porzione superiore della frontiera è
y = x2 + 2. L’integrale diventa
ZZ Z 1 Z x2 +2
x2 ydA = x2 dydx
D −1 3x2
Z 1
 2 y=x2 +2
= x y y=3x2
−1
Z 1
= x2 (x2 + 2 − 3x2 )dx
−1
1  3 1
x5
Z
x 2 2 8
= 2x2 − 2x4 dx = 2 − 2 =2 −2 =
−1 3 5 −1 3 5 15

Esempio
R1R1
Es. 7.5.3 Sia da calcolare l’integrale 0 y sin x2 dxdy. Se cerchiamo di valutare l’inte-
grale così come ci è stato presentato, abbiamo la difficoltà di dover valutare sin x2 dx.
R

Si tratta, infatti, di uno di quegli integrali impossibili da valutare mediante funzioni ele-
mentari! Ci conviene allora cambiare l’ordine di integrazione. Cerchiamo allora di ca-
pire come
n è fatto il dominio di integrazione
o D. Da come è scritto l’integrale, risulta
2
D = (x, y) ∈ R : 0 ≤ y ≤ 1, y ≤ x ≤ 1 . Facciamo il grafico (si veda Figura 7.8). Que-
sto dominio lo possiamo vedere come normale rispetto all’asse x prendendo 0 ≤ x ≤ 1 e
0 ≤ y ≤ x.

100
7.6. Proprietà degli integrali doppi

Figura 7.7: Dominio di integrazione delimitato dalle parabole y = 3x2 e y = x ∗ 2 + 2.

R1R1
Figura 7.8: Dominio di integrazione dell’integrale 0 y
sin x2 dxdy.

Quindi
Z 1Z 1 ZZ
sin x2 dxdy = sin x2 dA
0 y D
Z 1Z x Z 1 y=x
2
y sin x2 y=0 dx

= sin x dydx =
0 0 0
Z 1 Z 1
1
= x sin x2 dx = 2x sin x2 dx
0 2 0
1
d(x2 )
Z
1 1 1 1
= sin x2 dx = − cos x2 0 = (1 − cos 1)
2 0 dx 2 2

7.6 Proprietà degli integrali doppi


Assumendo che i seguenti integrali esistano,
RR vediamone brevemente alcune proprietà:
G RRD
RR
(f (x, y) + g(x, y)) dA = D f (x, y)dA + D g(x, y)dA

101
7. I NTEGRALI

Figura 7.9: Esempio di trasformazione globalmente invertibile dall’insieme S del piano uv


all’insieme R del piano xy.

G RR cf (x, y)dA = c RR f (x, y)dA, essendo c una costante.


G Se f (x, y) ≥ g(x, y) per tutti i punti (x, y) in D, allora RR f (x, y)dA ≥ RR g(x, y)dA.
D D

G Se D = D ∪ D , dove D e D sono domini che non si sovrappongono ma possono avere


D D
1 2 1 2
al più solo punti della frontiera in comune, allora
ZZ ZZ ZZ
f (x, y)dA = f (x, y)dA + f (x, y)dA
D D1 D2

G Considerando la funzione di valore costante 1 si ha


ZZ
1dA = area(D)
D

dove area(D) è l’area dell’insieme D (torneremo su questo punto più avanti).


G Se m ≤ f (x, y) ≤ M per tutti i punti (x, y) in D, allora
ZZ
m area(D) ≤ f (x, y)dA ≤ M area(D)
D

7.7 Cambiamento di variabili


A volte, il calcolo di un integrale si può semplificare operando un cambiamento di va-
riabili. A tale scopo, per il calcolo di integrali doppi, consideriamo un cambiamento di
variabili dato da una trasformazione T che permette di passare dal piano uv al piano xy:
T (u, v) = (x, y) dove x e y sono legate a u e v mediante equazioni del tipo

x = x(u, v), y = y(u, v)

Questa trasformazione può essere vista come una funzione vettoriale ~r = (x(u, v), y(u, v)).
L’ipotesi fondamentale, allo scopo di calcolare un integrale doppio, è che la trasformazione
ci permetta di ottenere tutti i punti del dominio di integrazione.
Una trasformazione T è dunque una funzione in cui sia il dominio che il codominio sono
sottoinsiemi di R2 . Se T (u1 , v1 ) = (x1 , y1 ) allora il punto (x1 , y1 ) è l’immagine del punto (u1 , v1 )
mediante la trasformazione. Se la trasformazione è una corrispondenza biunivoca tra l’insie-
me di definizione e il codominio della trasformazione, allora si può definire la trasformazione
inversa T −1 e si dice che la trasformazione è globalmente invertibile (si veda Figura 7.9).

Definizione 7.7.1 Una trasformazione x = x(u, v) y = y(u, v) definita in un insieme aperto di


R2 si dice regolare se
1. è di classe C 1
2. è globalmente invertibile

102
7.7. Cambiamento di variabili

Figura 7.10: Trasformazione dell’elemento S nel piano uv nell’elemento R nel piano xy.

3. in ogni punto (u, v) lo jacobiano risulta diverso da zero 2



∂x ∂x

∂(x, y) ∂u ∂v ∂x ∂y

∂y ∂x
∂(u, v) =
= − 6= 0
∂y ∂y ∂u ∂v
∂u ∂v
∂u ∂v

Un esempio di trasformazione regolare è dato dalle coordinate polari

x = x(ρ, θ) = ρ cos (θ) y = y(ρ, θ) = ρ sin (θ) con ρ > 0 e 0 ≤ θ ≤ 2π.

Cerchiamo di capire, ora, come un cambiamento di variabili agisca sul calcolo di un


integrale doppio. Ricordiamo che, nel caso di un integrale di una funzione scalare il cambia-
mento di variabile porta alla tecnica della sostituzione: data una funzione f (x) da integrare
in [a, b] si ha
Z b Z d
f (x)dx = f (g(u))g 0 (u)du
a c

dove x = g(u), a = g(c), b = g(d). Nel caso di funzioni di due variabili, cosa si fa e per quale
motivo?

7.7.1 Significato dello jacobiano


Consideriamo un rettangolino S nel piano uv il cui angolo in basso a sinistra è dato dal
punto (u0 , v0 ), e di dimensioni ∆u e ∆v. L’immagine della regione S attraverso la trasfor-
mazione regolare T sia la regione R del piano xy. Uno dei punti della frontiera sia proprio
l’immagine del punto (u0 , v0 ), cioè (x0 , y0 ) = T (u0 , v0 ). Si veda la Figura 7.10.
La trasformazione T sia data mediante due equazioni parametriche del tipo x = x(u, v) e
y = y(u, v) che possiamo vedere come una funzione vettoriale ~r(u, v) = (x(u, v), y(u, v)). Il lato
del rettangolino di S che si ha per v = v0 viene trasformato in R mediante la curva ~r(u, v0 )
(che dipende ora solo dal parametro u). Di questa curva il vettore tangente in u = u0 (quindi
∂x(u0 , v0 ) ∂y(u0 , v0 )
al punto (x0 , y0 )) è dato da r~tu = ( , ).
∂u ∂u
Alla stessa maniera, troviamo che il vettore tangente alla curva ~r(u0 , v) nel punto v = v0 è
∂x(u0 , v0 ) ∂y(u0 , v0 )
dato da r~tv = ( , ).
∂v ∂v
2 Si rimanda alla definizione 4.7.1 per ricordare cosa è lo jacobiano.

103
7. I NTEGRALI

Figura 7.11: Approssimazione di R mediante i vettori secanti.

La regione R = T (S) può essere approssimata dal parallelogramma dato dai vettori secanti
(si veda Figura 7.11) dati da

~a = ~r(u0 + ∆u, v0 ) − ~r(u0 , v0 ) ~b = ~r(u0 , v0 + ∆v) − ~r(u0 , v0 )

∂~r(u0 , v0 ) ~r(u0 + ∆u, v0 ) − ~r(u0 , v0 )


Ricordando che = lim∆u→0 , e ricordando che la derivata
∂u ∆u
parziale di una funzione vettoriale è data dalle derivate parziali delle singole componenti
della funzione vettoriale, ricaviamo l’approssimazione
∂~r
~a = ~r(u0 + ∆u, v0 ) − ~r(u0 , v0 ) ≈ ∆u
∂u
∂~r
ma, per quanto detto prima, = r~tu , da cui
∂u
~a = ~r(u0 + ∆u, v0 ) − ~r(u0 , v0 ) ≈ ∆u~
rtu .
Con analogo ragionamento arriviamo all’approssimazione
~b = ~r(u0 , v0 + ∆v) − ~r(u0 , v0 ) ≈ ∆v r~tv .

Quindi l’area della regione R può essere approssimata attraverso dall’area del parallelogram-
ma di lati ~a e ~b cioè ∆u~
rtu e ∆v r~tv . L’area del parallelogramma determinato da due vettori
è dato dal modulo del prodotto vettoriale dei due vettori stessi. Quindi l’area di R si può
approssimare tramite |(∆u~ rtu ) × (∆v r~tv )|. Si ha, quindi,

area(R) ≈ |~a × ~b| = |(∆u~


rtu ) × (∆v r~tv )| = |~
rtu × r~tv |∆u∆v
Calcoliamo il prodotto vettoriale
~j ~k

~i

∂x ∂y
∂u ∂u 0

r~tu × r~tv =

∂x ∂y

0


∂v ∂v
I sottodeterminanti delle componenti rispetto a x e a y sono nulli, da cui

∂x ∂y

∂u ∂u
~ ~ ∂x ∂y ∂x ∂y
r~tu × r~tv = k = k( − )

∂x ∂y ∂u ∂v ∂v ∂u

∂v ∂v

104
7.7. Cambiamento di variabili

Figura 7.12: Cambio di variabili per il calcolo di integrali doppi: trasformazione della regione
S nella regione R mediante la trasformazione regolare T .


∂(x, y)
Ritroviamo lo jacobiano delle due funzioni x e y rispetto a u e v: . Perciò, area(R) ≈
∂(u, v)
∂(x, y)
∂(u, v) ∆u∆v.

RR Supponiamo, ora, di dover calcolare l’integrale di una funzione f (x, y) su un dominio R


R
f (x, y)dA. Sia data una trasformazione regolare che trasforma un insieme S del piano uv
nella regione R. Suddividiamo il dominio R in elementini Rij , ciascuno dei quali è immagine
di un rettangolino Sij di S. Su ciascuno di questi elementini Rij consideriamo un punto di
coordinate (xi , yj ) che è immagine, mediante la trasformazione T , del punto (ui , vj ) che si
trova sull’angolo in basso a sinistra del rettangolino Sij (si veda la Figura 7.12). Allora l’area
∆Rij può essere approssimata mediante la relazione

∂(x, y)
∆Rij ≈ ∆u∆v
∂(u, v)
dove ∆u e ∆v sono i lati del rettangolino Sij , mentre lo jacobiano è valutato in (ui , vj ). Allora
ZZ m X
X n
f (x, y)dA ≈ f (xi , yj )∆Rij
R i=1 j=1
m X
n
X ∂(x, y)
≈ f (x(ui , vj ), y(ui , vj ))
∆u∆v
i=1 j=1
∂(u, v)

A questo punto osserviamo che


m X n ZZ
X ∂(x, y) ∂(x, y)
f (x(ui , vj ), y(ui , vj ))
∆u∆v ≈ f (x(u, v), y(u, v)
dudv
i=1 j=1
∂(u, v) S ∂(u, v)

Si arriva perciò al seguente teorema (che non dimostriamo, però tutti i discorsi appena
fatti ci portano a intuire che il risultato non può che essere così!).

Teorema 7.7.1 Sia data una trasformazione regolare T della regione S del piano uv alla re-
gione R del piano xy. Inoltre sia assegnata una funzione f continua in R. Supponiamo che le
regioni R e S siano domini normali rispetto all’asse x o y. Allora
ZZ ZZ
∂(x, y)
f (x, y)dA = f (x(u, v), y(u, v) dudv
R S ∂(u, v)

105
7. I NTEGRALI

Figura 7.13: Aree corrispondenti nel piano θρ e nel piano xy.

RR
Figura 7.14: Insiemi S e R per il calcolo dell’integrale R
4x + 8ydA.

Esempio
Es. 7.7.1 Consideriamo il caso della trasformazione data dalle coordinate polari, per cui
x(ρ, θ) = ρ cos (θ) e y(ρ, θ) = ρ sin (θ).
Il rettangolino ∆θ∆ρ viene trasformato in una specie di rettangolino con i lati curvi.
Il disegno mostrato in figura 7.13 è stato realizzato facendo variare θ nell’intervallino
2π 2π
[ , + 0.5] e ρ in [0.5, 0.75].
3 3
Lo jacobiano di questa trasformazione è dato da

∂(x, y) cos (θ) −ρ sin (θ) 2 2
∂(ρ, θ) sin (θ) ρ cos (θ) = ρ cos (θ) + ρ sin (θ) = ρ
=

Perciò, se facciamo un cambiamento di variabili utilizzando coordinate polari si ha:


ZZ ZZ
f (x, y)dA = f (ρ cos (θ), ρ sin (θ))ρ dρdθ
R S

106
7.8. Area di un dominio

Esempio
RR
Es. 7.7.2 Sia da calcolare 4x + 8ydA dove R è il parallelogramma di vertici A(−1, 3),
R
1 1
B(1, −3), C(3, −1) e D(1, 5). Si applichi la trasformazione x = (u + v), y = (v − 4u).
4 4
Il parallelogramma R è rappresentato in Figura 7.14. Se scriviamo le equazioni dei lati del
parallelogramma si trova facilmente che la retta per AB è data dall’equazione y + 3x = 0,
la retta per CD è data da y + 3x = 8, la retta per BC è x − y = 4 e infine quella per AD è
x − y = −4.
Da queste relazioni, si vede che ponendo u = x−y e v = y +3x, si ricava la trasformazione
1 1
assegnata x = (u + v), y = (v − 4u). Inoltre si vede che R è l’immagine del rettangolo S
4 4
delimitato dalle linee u = 4, u = −4, v = 0 e v = 8.
Se calcoliamo lo jacobiano delle funzioni x e y rispetto a u e v otteniamo
1
−3
∂(x, y) 4 4 1

∂(u, v) =
=
1 4

1

4 4
Allora
ZZ ZZ   ZZ
1 1 1 1
4x + 8ydA = 4 (u + v) + 8 (v − 3u) dudv = (u + v + 2v − 6u) dudv
R S 4 4 4 S 4
v=8
1 4 8 1 4 3 2
Z Z Z 
= (3v − 5u)dvdu = v − 5uv du
4 −4 0 4 −4 2 v=0
1 4
Z
1 u=4
= (96 − 40u)du = 96u − 20u2 u=−4 = 192
4 −4 4

7.8 Area di un dominio


Dagli integrali doppi si può ricavare un’altra considerazione geometrica, sull’area del
dominio di integrazione. Come abbiamo già visto tra le proprietà degli integrali doppi, si ha
ZZ
area(D) = dA
D

Proviamo a dimostrare questo risultato, supponendo che D sia un dominio normale ri-
spetto all’asse x, da cui a ≤ x ≤ b e g1 (x) ≤ y ≤ g2 (y). L’area compresa tra le curve g2 (x) e
g1 (x), vale a dire l’area di D, può essere calcolata proprio come la differenze degli integrali
delle due funzioni, tramite l’integrale
Z b
area(D) = (g2 (x) − g1 (x))dx
a

D’altra parte, dalla definizione di integrale doppio, considerando la funzione f (x, y) = 1,

107
7. I NTEGRALI

Figura 7.15: Area di D come integrale doppio

abbiamo
ZZ Z b Z g2 (x)
dxdy = ( dy)dx
D a g1 (x)
Z b
= (g2 (x) − g1 (x))dx
a
e, per quanto abbiamo appena visto
= area(D)

7.9 Cenni su integrali tripli


L’estensione del concetto di integrale di una funzione dipendente da RRRdue variabili ad una
funzione dipendente da tre variabili porta al cosiddetto integrale triplo: E
f (x, y, z)dV .
Il caso più semplice si ha quando il dominio di integrazione E è rappresentato da un
parallelepipedo [a, b] × [c, d] × [r, s].
Allora si ha:
ZZZ Z sZ dZ b
f (x, y, z)dV = f (x, y, z)dxdydz
E r c a
Z b Z d Z s
= f (x, y, z)dzdydx
a c r
Z d Z s Z b
= f (x, y, z)dxdzdy
c r a
.
= ..

Abbiamo 6 diverse possibilità di integrazione, prima rispetto a x, poi rispetto a y, poi rispetto
a z, oppure lungo y, x, z, o ancora... (tutte le possibili combinazioni che si hanno scambiando
l’ordine delle tre variabili). Il risultato che si ottiene non cambia (consideriamo l’integrale di
funzioni continue, in modo da estendere il teorema di Fubini).

108
7.10. Integrali curvilinei

Si ha, inoltre, che il volume di una regione tridimensionale E è dato da un integrale triplo
e, precisamente
ZZZ
volume(E) = dV
E

Se la regione di integrazione E è più generale, le tecniche di integrazione sono estese su


tre possibili tipi di dominio:
1. Primo caso: E = {(x, y, z) t.c. (x, y) ∈ D, u1 (x, y) ≤ z ≤ u2 (x, y)}, dove D è un regione nel
piano xy (che a sua volta può essere visto come un dominio normale rispetto all’asse x o
rispetto all’asse y). La regione E viene detta normale rispetto al piano xy e l’integrazione
per fili.
ZZZ Z Z "Z u2 (x,y)
#
f (x, y, z)dV = f (x, y, z)dz dA
E D u1 (x,y)

2. Secondo caso: E = {(x, y, z) t.c. (y, z) ∈ D, u1 (y, z) ≤ x ≤ u2 (y, z)}, dove D è un regione
nel piano yz (che a sua volta può essere visto come un dominio normale rispetto all’asse
y o rispetto all’asse z). La regione E viene detta normale rispetto al piano yz. Se si riesce
a vedere l’insieme D come normale rispetto all’asse z allora si parla di integrazione per
strati o per sezione.
ZZZ Z Z "Z u2 (y,z)
#
f (x, y, z)dV = f (x, y, z)dx dA
E D u1 (y,z)

3. Secondo caso: E = {(x, y, z) t.c. (x, z) ∈ D, u1 (x, z) ≤ y ≤ u2 (x, z)}, dove D è un regione
nel piano xz (che a sua volta può essere visto come un dominio normale rispetto all’asse
x o rispetto all’asse z). La regione E viene detta normale rispetto al piano xz. Se l’in-
sieme D lo si può vedere come normale rispetto all’asse z allora si parla di integrazione
per strati o per sezione.
ZZZ Z Z "Z u2 (x,z)
#
f (x, y, z)dV = f (x, y, z)dy dA
E D u1 (x,z)

7.10 Integrali curvilinei


Un integrale curvilineo (o di linea) ha lo scopo di integrare una funzione di due (o tre)
variabili su un insieme di integrazione dato da una curva γ.
Ci soffermiamo al caso bidimensionale (quindi funzioni di due variabili e curve nel piano
xy).
Consideriamo una curva γ regolare (la funzione vettoriale f che la rappresenta è continua
e la sua derivata è diversa da zero per ogni valore del parametro t.) Quindi f (t) = (x(t), y(t))
con a ≤ t ≤ b.
R L’integrale curvilineo di una funzione g(x, y) lungo la curva γ si denota con il simbolo
γ
g(x, y)ds dove ds rappresenta il differenziale dell’ascissa curvilinea, dovuto al fatto che ci
stiamo muovendo lungo la curva esnon su l’asse delle x o delle y.
 2  2
0 dx dy
Ricordiamo che ds = |f (t)|dt = + dt
dt dt
Allora, andando a sostituire nell’integrale curvilineo e considerando la curva scritta in
forma parametrica si ha:
s 
Z Z b 2  2
dx dy
g(x, y)ds = g(x(t), y(t)) + dt
γ a dt dt

109
7. I NTEGRALI

Per g(x, y) = 1 si ottiene la lunghezza della curva.

Esempio
Es. 7.10.1 Vogliamo calcolare γ (4+xy 2 )ds dove γ è la porzione di circonferenza di centro
R

nell’origine e raggio unitario che si ha −1 ≤ x ≤ 0.


Scriviamo le equazioni parametriche della curva γ:
π 3
x = cos t, y = sin t, ≤t≤ π
2 2
L’integrale da calcolare diventa
Z Z 3π/2 p
(4 + xy 3 )ds = (4 + cos t sin2 t) sin2 t + cos2 tdt
γ π/2
3π/2 3π/2
sin3 t
Z 
2
= (4 + D(sin t) sin2 t)dt = 4t + = 4π −
π/2 3 π/2 3

Se la curva è regolare a tratti, l’integrale curvilineo si scrive come somma degli integrali
curvilinei su ciascun tratto di curva regolare di cui è composta. In pratica se γ = γ1 ∪γ2 . . .∪γn
con n numero intero, allora
Z Z Z Z
g(x, y)ds = g(x, y)ds + g(x, y)ds + . . . + g(x, y)ds.
γ γ1 γ2 γn

Ogni curva ha un suo orientamento. Se cambiamo la direzione di moto della curva,


cambia l’integrale curvilineo?

Proposizione 7.10.1 Se si cambia l’orientamento di una curva, passando dalla curva +γ alla
curva −γ l’integrale curvilineo non cambia:
Z Z
g(x, y)ds = g(x, y)ds
γ −γ

Se +γ è data dalle equazioni parametriche (x(t), y(t)) con a ≤ t ≤ b, (primo punto A =


(x(a), y(a)), ultimo punto B = (x(b), y(b))), la curva −γ ha equazioni (x(−t), y(−t)) con t che
varia in [−b, −a], (primo punto (x(b), y(b)) = B, ultimo punto (x(a), y(a)) = A). Le curve sono le
stesse a parte l’orientamento, ma questo non influisce sul risultato dell’integrale curvilineo.

7.11 Integrali di superficie


Cerchiamo ora di integrare una funzione su una superficie S nello spazio tridimensionale.

7.11.1 Area di una superficie


Per capire le formule che scriveremo nel seguito, deriviamo la formula che permet-
te di calcolare l’area di una superficie data da equazioni parametriche x = x(u, v), y =
y(u, v), z = z(u, v), equazioni che possiamo scrivere tramite la funzione vettoriale ~r(u, v) =
(x(u, v), y(u, v), z(u, v)).
Con un discorso del tutto simile a quanto abbiamo visto nella sezione 7.7 sul cambiamen-
to di variabile, chiamando però adesso D come l’insieme in cui varia (u, v) e S la superficie pa-
rametrica, suddividendo D in rettangolini Dij , in S si hanno i corrispondenti elementini Sij .
Inoltre, se (ui , vj ) è il vertice in basso a sinistra di Dij , il punto Pij (x(ui , vj ), y(ui , vj ), z(ui , vj ))
è il corrispondente punto su Sij . L’area dell’elementino Sij può essere approssimata me-
diante il parallelogramma di lati ∆u~ru (ui , vj ) e ∆v~rv (ui , vj ) dove ~ru e ~rv rappresentano la

110
7.11. Integrali di superficie

derivata di ~r rispetto alle variabili u e v, rispettivamente. Il discorso da fare è del tutto ana-
logo a quanto abbiamo visto nella sezione 7.7. L’area del parallelogramma, che approssima
l’area dell’elementino, è dunque uguale al modulo del prodotto vettoriale di ∆u~ru (ui , vj ) e
∆v~rv (ui , vj ).
L’area della superficie sarà dunque data dalla somma di tutte queste aree, facendo ten-
dere a infinito il numero degli elementini in cui suddividiamo la superficie. Si ha infatti la
definizione

Definizione 7.11.1 Data una superficie S di equazione ~r(u, v) = (x(u, v), y(u, v), z(u, v)), con
(u, v) ∈ D, allora l’area della superficie è data da
ZZ
area(S) = |~ru × ~rv |dA
D

∂x ∂y ∂z ∂x ∂y ∂z
dove ~ru = ( , , ) e ~rv = ( , , ).
∂u ∂u ∂u ∂v ∂v ∂v
Nel caso in cui la superficie è data da una funzione z = f (x, y), possiamo ricondurci al
caso precedente considerando ~r(u, v) = ~r(x, y) = (x, y, f (x, y)).
In tal caso
~i ~j ~k


∂f
1 0
∂x = (− ∂f , − ∂f , 1)

~ru × ~rv =

∂x ∂y
0 1 ∂f

∂y

s 
2  2
∂f ∂f
Perciò |~ru × ~rv | = + + 1 e l’area della superficie è
∂x ∂y
s 2  2
ZZ
∂f ∂f
A(S) = + + 1dA
D ∂x ∂y

7.11.2 Integrale di una superficie


Siamo ora in grado di capire la formula da applicare nel caso in cui bisogna calcolare
l’integrale di una funzione g su una superficie S.
L’area dell’elementino dS si riconduce alla formula dell’area di una superficie che abbiamo
appena visto. Perciò, se la superficie S è data mediante una funzione z = f (x, y), con (x, y) ∈
D ⊂ R2 , l’integrale di superficie di una funzione g(x, y, z) sulla superficie S è dato da
s 
ZZ ZZ 2  2
∂f ∂f
g(x, y, z)dS = g(x, y, f (x, y)) + + 1dA
S D ∂x ∂y

Dobbiamo prestare molta attenzione a questo tipo di integrali perchè l’integrale a destra è
un integrale doppio mentre l’integrale a sinistra è un integrale di superficie. Quindi il calcolo
di un integrale di superficie si riconduce ad un integrale doppio.
La superficie potrebbe essere scritta come y = f (x, z) o x = f (y, z). La definizione di
integrale di superficie è analoga (con le dovute sostituzioni) a quella appena scritta.
Se la superficie, invece, è scritta in forma parametrica :

x = x(u, v) y = y(u, v) z = z(u, v) (u, v) ∈ I

111
7. I NTEGRALI

allora si ha
ZZ ZZ
g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|~ru × ~rv |dA
S I

dove |~ru × ~rv | rappresenta il modulo del prodotto vettoriale dei vettori che si hanno derivando
parzialmente rispetto a u e rispetto a v le equazioni parametriche della superficie, in modo
da poter avere l’area dell’elementino di superficie dS.
Quindi

~i ~j ~k


∂y ∂z ∂x ∂z ∂x ∂y

∂x ∂y ∂z
~ ∂u ∂u ~ ∂u ∂u ~ ∂u ∂u

~n = ~ru × ~rv = ∂u ∂u ∂u = i −j +k


∂y ∂z ∂x ∂z ∂x ∂y

∂x ∂y ∂z ∂v ∂v ∂v ∂v ∂v ∂v


∂v ∂v ∂v
scambiamo le colonne del sottodeterminante relativo a ~j

∂y ∂z ∂z ∂x ∂x ∂y

∂u ∂u ∂u ∂u ∂u ∂u
= ~i

+ ~j

+k
~

∂y ∂z ∂z ∂x ∂x ∂y

∂v ∂v ∂v ∂v ∂v ∂v

osserviamo che i sottodeterminanti sono degli jacobiani

∂(y, z) ∂(z, x) ∂(x, y)
~
= i ~
+j ~
+k
∂(u, v) ∂(u, v) ∂(u, v)

Chiamando
con n1 , n2 e n 3 le componenti
del vettore normale appena ottenuto, n1 =
∂(y, z)
, n2 = ∂(z, x) e n3 = ∂(x, y) , il modulo di ~n è dato da |~n| = (n1 )2 + (n2 )2 + (n3 )2 .
p

∂(u, v) ∂(u, v) ∂(u, v)
Quindi
ZZ ZZ
g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|~ru × ~rv |dA
S
Z ZD p
= g(x(u, v), y(u, v), z(u, v)) (n1 )2 + (n2 )2 + (n3 )2 dA
D

Se g(x, y, z) = 1 l’integrale di superficie ci fa ritrovare l’area della superficie.

Esempio
RR
Es. 7.11.1 Calcoliamo l’integrale di superficie I = S
yzdS dove S è la superficie di
equazioni parametriche x = u2 , y = u sin (v), z = u cos (v), con 0 ≤ u ≤ 1 e 0 ≤ v ≤ π/2.
L’integrale da calcolare diventa l’integrale doppio
ZZ Z 1 Z π/2
I= u sin (v)u cos (v)|~ru × ~rv |dudv = u2 sin (v) cos (v)|~ru × ~rv |dvdu
D 0 0

Calcoliamo il modulo del prodotto vettoriale. Abbiamo

~k

~i ~j
cos (v) = . . . = ~i(−u) + ~j(2u2 sin (v)) + ~k(2u2 cos (v))

~ru × ~rv = 2u sin (v)

0 u cos (v) −u sin (v)

112
7.12. Solidi e superfici di rotazione

Perciò, quando calcoliamo il modulo, abbiamo (consideriamo anche 0 ≤ u ≤ 1):


q p
|~ru × ~rv | = u2 + 4u4 sin2 (v) + 4u4 cos2 (v) = u 1 + 4u2

L’integrale è
Z 1 Z π/2 p Z 1 Z π/2 p
I= u2 sin (v) cos (v)u 1 + 4u2 dvdu = u3 1 + 4u2 sin (v) cos (v)dvdu
0 0 0 0

Osserviamo che abbiamo funzioni che dipendono solo da v e funzioni che dipendo-
no solo da u, perciò le funzioni che dipendono solo da u, le possiamo portare fuori
dall’integrale in v, ricavando
Z 1 p Z π/2
3
I= u 1+ 4u2 sin (v) cos (v)dvdu
0 0

Ora
π/2 π/2 π/2
sin2 (v)
Z Z
1
sin (v) cos (v)dv = sin (v)D(sin (v))dv = =
0 0 2
0 2

Andando a sostituire nell’integrale doppio abbiamo


Z 1
1 p
I= u3 1 + 4u2 du
2 0

t−1 dt
Facciamo un cambiamento di variabili ponendo t = 1+4u2 da cui u2 = e 2udu = ,
4 4
dt
ovvero udu = . Inoltre, per u = 0 si ha t = 1 e per u = 1 si ha t = 5. Quindi
8
1 5 t − 1 √ dt
Z 1 p Z
1
I= u2 1 + 4u2 udu = t
2 0 2 1 4 8
Z 5 √ √ Z 5
1 1
= (t t − t)dt = (t3/2 − t1/2 )dt
64 1 64 1
5 √
1 2 5/2 2 3/2 5 5 1
= t − t = ... = +
64 5 3 1 48 240

7.12 Solidi e superfici di rotazione


Vediamo da un punto di vista matematico i concetti di massa e baricentro (usualmente
visti in fisica). Ci serviranno successivamente per calcolare il volume di un solido o l’area
di una superficie ottenuti, rispettivamente, mediante rotazione di una superficie o di una
curva attorno ad uno degli assi.
Ci limitiamo a vedere le definizioni di massa, momenti e baricentro, per il caso
bidimensionale.

Definizione 7.12.1 Si definisce massa di un oggetto piano che riempe una regione C, con
densità data da µ(x, y) (funzione continua), la quantià m data da
ZZ
m= µ(x, y)dxdy
C

113
7. I NTEGRALI

Se un oggetto piano riempe una regione C con densità µ(x, y) (continua), i suoi momenti
sono dati da
ZZ
Mx = yµ(x, y)dxdy
Z ZC
My = xµ(x, y)dxdy
C

Il baricentro (o centro di massa) dell’oggetto è il punto (x, y) dato da (m essendo la massa)


RR
My xµ(x, y)dxdy
x= = RRC
m µ(x, y)dxdy
RR C
Mx yµ(x, y)dxdy
y= = RRC
m C
µ(x, y)dxdy

Nel caso di una curva piana γ, omogenea e con densità µ ≡ 1, si ha:


G la massa mZ è data da
m= ds =⇒ m = L (la lunghezza della curva)
γ

G i momenti sono
Z Z
Mx = yds My = xds
γ γ

G il baricentro ha coordinate
Z Z
My 1 Mx 1
x= = xds y= = yds
L L γ L L γ

Definiamo, a questo punto, il solido di rotazione.


Sia D un insieme del piano (x, y), chiuso e limitato (e integrabile). Per semplicità i valori
di y siano positivi.
Una rotazione del piano (x, y) intorno all’asse x (o y) fa sì che l’insieme D generi un solido
I nello spazio (x, y, z), che chiamiamo solido di rotazione.
Per calcolare il volume di un solido di rotazione si ha il

Teorema 7.12.1 (Primo teorema di Guldino) Il volume dell’insieme I, solido di rotazione ot-
tenuto dall’insieme D è uguale all’area di D per la lunghezza della circonferenza descritta nella
rotazione dal baricentro di D.
Supponendo che la rotazione sia fatta attorno all’asse x, il raggio della circonferenza descritta
dal baricentro è data dall’ordinata del baricentro (si considera µ ≡ 1). Quindi
volume(I) = area(D) × lunghezza della circonferenza
volume(I) = area(D) × 2π raggio della circonferenza
volume(I) = area(D)2π y
RR
ydxdy
volume(I) = area(D)2π RRD
dxdy
RR D
ydxdy
ZZ
volume(I) = area(D)2π D = 2π ydxdy
area(D) D

114
7.12. Solidi e superfici di rotazione

Figura 7.16: Insieme D da cui calcolare il volume del solido di rotazione attorno all’asse x.

Se la rotazione di D avviene attorno all’asse y, il volume del solido di rotazione è data da


ZZ
volume(I) = 2π xdxdy
D

perchè la circonferenza descritta dal baricentro ha raggio dato da x.


Definiamo, ora, la superficie di rotazione.
Sia γ una curva generalmente regolare del piano (x, y). Sia y > 0. Consideriamo l’asse
z ortogonale in (0, 0) al piano (x, y). Una rotazione del piano (x, y) intorno all’asse x (o y) fa
sì che la curva γ generi una superficie S nello spazio (x, y, z), che chiamiamo superficie di
rotazione.
Per misurare l’area di una superficie di rotazione si ha il

Teorema 7.12.2 (Secondo teorema di Guldino) L’area della superficie di rotazione S gene-
rata dalla curva γ è uguale alla lunghezza della curva per la lunghezza della circonferenza
descritta nella rotazione dal baricentro di γ.
Sia γ data da equazioni parametriche x = x(t), y = y(t) con t ∈ [a, b] e di lunghezza L.
La superficie sia ottenuta mediante rotazione attorno all’asse x. Allora la circonferenza ha
1R 1 Rb p
raggio y con y = γ
yds = a
y(t) (x0 (t))2 + (y 0 (t))2 dt. Allora
L L
area(S) = lunghezza della curva × lunghezza della circonferenza
area(S) = L2π y
Z b
1 p
area(S) = L2π y(t) (x0 (t))2 + (y 0 (t))2 dt
L a
Z b p
area(S) = 2π y(t) (x0 (t))2 + (y 0 (t))2 dt
a

Se la rotazione avviene attorno all’asse y invece si ha


Z b p
area(S) = 2π x(t) (x0 (t))2 + (y 0 (t))2 dt
a

115
7. I NTEGRALI

Esempio
Es. 7.12.1 Calcoliamo il volume del solido di rotazione ottenuto dalla rotazione completa
attorno all’asse x dell’insieme
 
3
D = (x, y) ∈ R2 : x2 + y 2 ≤ , x2 ≥ y, y ≥ 0, x ≥ 0
4

Per calcolare questo integrale dobbiamo applicare il primo teorema di Guldino. Il volume
richiesto sarà dato da
ZZ
V = 2π ydxdy
D

L’insieme D è dato dalla regione compresa al di sotto della√parabola y = x2 e all’inter-


no della circonferenza con centro nell’origine e raggio r = 3/2, che si trova nel primo
quadrante (si veda Figura 7.16).
Cerchiamo i punti di intersezione tra la parabola e la circonferenza risolvendo il sistema

y = x 2
3
x 2 + y 2 =
4
3
Sostituendo y = x2 nella seconda equazione si ha x2 + x4 = . Con la sostituzione
√4
3 −1 ± 1+3 −1 ± 2
t = x2 l’equazione diventa t2 + t − = 0 da cui t = = : quindi
4 2 2
1 3
le due radici sono t = e t = − . Ritornando a x2 = t, si ha come soluzione del
2 2
1 1
primo quadrante il punto x = √ e y = . Per calcolare l’integrale, possiamo vedere il
2 2
dominio di integrazione come normale rispetto all’asse x, considerando l’unione di due
1 1 3
insiemi, il primo dato da 0 ≤ x ≤ √ , e 0 ≤ y ≤ x2 , e il secondo dato da √ ≤ x ≤ e
r 2 2 2
3
0≤y≤ − x2 .
4
Quindi l’integrale da calcolare va spezzato in due integrali su questi domini. Oppure,
1
si può vedere il dominio di integrazione normale rispetto all’asse y, con 0 ≤ y ≤ e
r 2
√ 3
y≤x≤ − y2 .
4
In tal caso l’integrale diventa
Z Z √3 2
1/2 4 −y
V = √
ydxdy
0 y

Si ha
1/2
r Z 1/2 r Z 1/2
√ √
Z
3 2
3 2
V = y( − y − y)dy = y − y dy − y ydy
0 4 0 4 0
r r 1/2
1 1/2
Z Z 1/2 Z 1/2
3 3/2 1 3 2 3 2
− y 2 dy − y 5/2

=− (−2y) 2
− y dy − y dy = − D( − y )
2 0 4 0 2 0 4 4 5 0

116
7.12. Solidi e superfici di rotazione

1/2
1 2 3 1 1 1 1 3 1
( − y ) − √ = − ( )3/2 + ( )3/2 − √
2 3/2

=−
2 3 4 0 10 2 3 2 3 4 10 2
√ √ √ √
1 3 1 4 3 2 3
=− √ + − √ =− √ + =− +
6 2 8 10 2 14 2 8 7 8

Esempio
Es. 7.12.2 L’arco di parabola y = x2 per 1 ≤ x ≤ 2 è ruotato attorno all’asse y. Vogliamo
trovare l’area della superficie di rotazione. In questo caso dobbiamo applicare il secondo
teorema di Guldino, vedendo la parabola come la curva di coordinate parametriche x = x,
y = x2 , per cui
Z 2 p
area(S) = 2π x 1 + 4x2 dx.
1

Quindi
Z 2 Z 2
8x p 1 p
area(S) = 2π 2
1 + 4x dx = π D(1 + 4x2 ) 1 + 4x2 dx
1 8 4 1
2
1 2(1 + 4x2 )3/2

1 3/2 3/2
= π
4 3 = 6 π(17 − 5 )
1
1 √ √
= π(17 17 − 5 5)
6

117
C APITOLO 8
Equazioni differenziali ordinarie

L’ignoranza per la matematica


viene considerato un fatto
positivo, a un certo livello della
classe sociale. Eppure la
matematica ha determinato la
direzione e il contenuto di
buona parte del pensiero
filosofico, ha distrutto e
ricostruito dottrine religiose,
ha costituito il nerbo di teorie
economiche e sociali, ha
plasmato i principali stili
pittorici, musicali,
architettonici e letterari.

Morris Kline (1908-1992)

8.1 Cosa è un’equazione differenziale? . . . . . . . . . . . . . . . . . . . . . . . . . . . 119


8.2 Il problema di Cauchy in locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
8.3 Teorema di Cauchy (esistenza e unicità globale) . . . . . . . . . . . . . . . . . . . . 122
8.4 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
8.5 Equazioni differenziali lineari del primo ordine . . . . . . . . . . . . . . . . . . . . 123
8.6 Metodo di separazione delle variabili . . . . . . . . . . . . . . . . . . . . . . . . . . 125
8.7 Risoluzione di alcuni tipi di equazioni differenziali . . . . . . . . . . . . . . . . . . 126
8.8 Le equazioni differenziali lineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
8.8.1 Cosa è uno spazio vettoriale? . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
8.9 L’equazione omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
8.10 L’equazione non omogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
8.11 Equazioni lineari a coefficienti costanti . . . . . . . . . . . . . . . . . . . . . . . . . 132
8.12 Metodo dei coefficienti indeterminati . . . . . . . . . . . . . . . . . . . . . . . . . . 135

8.1 Cosa è un’equazione differenziale?


Un’equazione differenziale è un’equazione che coinvolge una funzione incognita y = y(x)
(che dipende dalla sola variabile x) e le sue derivate. Usualmente si parla di equazione diffe-
renziale ordinaria1 in quanto la funzione incognita, essendo funzione di una sola variabile,
ammette derivate ordinarie e non derivate parziali.
1 In inglese si dice: Ordinary Differential Equation, da cui la sigla ODE.

119
8. E QUAZIONI DIFFERENZIALI ORDINARIE

Un esempio di equazione differenziale lineare è dato da

y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 + a0 (x)y = b(x)

dove i coefficienti a0 (x), a1 (x), . . . , an−1 (x) e b(x) sono assegnate funzioni continue che dipen-
dono dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate
dn y
fino a quella di ordine n. Usiamo infatti la notazione y (n) per indicare .
dxn
Se nell’equazione differenziale compaiono le derivate di y fino all’ordine n, allora si dice
che l’equazione differenziale ha ordine (o grado) n. Bisogna quindi vedere l’ordine più elevato
della derivata che appare nell’equazione per capire l’ordine dell’equazione differenziale.
Per n = 1, l’equazione differenziale di prima diventa

y 0 + a(x)y = b(x)

Per n = 2 si ha, invece,

y 00 + a1 (x)y 0 + a0 (x)y = b(x)

Il caso più generale di un’equazione differenziale di ordine n è dato da un’equazione che


ha come variabili x, la funzione incognita y e le sue derivate fino all’ordine n, mediante una
funzione continua F (in genere non lineare):

F (x, y, y 0 , . . . , y (n) ) = 0

L’esempio di prima, di equazione differenziale lineare, ha come F la funzione

F (x, y, y 0 , . . . , y (n) ) = y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 + a0 (x)y − b(x)

Risolvere un’equazione differenziale (si dice anche integrare un’equazione differenziale)


vuol dire cercare le possibili (ve ne possono essere più di una) funzioni del tipo y = y(x)
definite per x che varia in un opportuno intervallo [a, b], continue e derivabili n volte in [a, b]
in modo che sia soddisfatta l’equazione differenziale data.
Le funzioni y = y(x) che soddisfano l’equazione differenziale si dicono soluzioni o integrali
dell’equazione differenziale.
Se un’equazione differenziale può essere scritta nella forma

y (n) = f (x, y, y 0 , . . . , y (n−1) )

con f funzione continua allora si dice che l’equazione differenziale è in forma normale.

Esempio
Es. 8.1.1 Data f , funzione continua in [a, b], si vuole risolvere

y 0 (x) = f (x) ∀x ∈ [a, b]

Questo problema equivale a quello di trovare una primitiva della funzione f , una
funzione, cioè, la cui derivata coincide con f .
Ogni funzione della forma y(x) = F (x) + y0 con y0 costante e F una primitiva di f è
soluzione del problema assegnato, ovvero dell’equazione differenziale. Come primitiva
di f , dal
R xteorema fondamentale del calcolo integrale, sappiamo che possiamo Rx scrivere
F (x) = x0 f (t)dt dove x0 è un numero reale fissato in [a, b]. Quindi y(x) = x0 f (t)dt + y0 è
soluzione del problema dato.

120
8.2. Il problema di Cauchy in locale

L’esempio che abbiamo descritto ora è molto particolare. Infatti si ha che la soluzione
y(x) per x = x0 vale proprio la costante y0 :
Z x0
y(x0 ) = f (t)dt + y0 = y0
x0

In questo caso, si dice che y(x) è soluzione del problema di Cauchy dato da
(
y 0 (x) = f (x)
y(x0 ) = y0

dove y(x0 ) = y0 rappresenta la condizione iniziale e x0 il punto iniziale da cui far partire
la soluzione al problema.
Vediamo dunque cosa è un problema di Cauchy.

8.2 Il problema di Cauchy in locale


Partiamo dal considerare l’equazione differenziale

y 0 = f (x, y)

Se la f è non lineare, è ragionevole aspettarsi che le soluzioni dell’equazioni differenziale


siano definite non in un intervallo assegnato a priori ma solo in un intorno di un punto
iniziale assegnato.
Fissati, dunque, x0 e y0 , supponiamo che:
1. la f sia definita in un intorno rettangolare I × J del punto (x0 , y0 ) del tipo (siano a e b
assegnati)
n o
I × J = (x, y) ∈ R2 t.c x0 − a ≤ x ≤ x0 + a, y0 − b ≤ y ≤ y0 + b

2. la f sia continua in I × J
∂f
3. la derivata parziale della f rispetto a y, , sia continua in I × J.
∂y
Sotto queste ipotesi esiste un intorno di x0 , [x0 − δ, x0 + δ] ed un’unica funzione y = y(x)
derivabile in [x0 − δ, x0 + δ] che è soluzione del problema di Cauchy dato da
(
y 0 (x) = f (x, y)
y(x0 ) = y0

Abbiamo appena stabilito una formulazione del teorema di Cauchy di esistenza e unicità
locale (in piccolo).

Teorema 8.2.1 (Teorema di Cauchy (in piccolo) per equazioni differenziali del primo ordine)
Sia f = f (x, y) una funzione reale definita nell’intervallo I × J (definito in precedenza). Se f
∂f
e la sua derivata sono funzioni continue in I × J, allora esiste un numero δ > 0 ed esiste
∂y
una ed una sola funzione y = y(x) derivabile in [x0 − δ, x0 + δ], soluzione in tale intervallo del
problema di Cauchy
(
y 0 (x) = f (x, y)
y(x0 ) = y0

121
8. E QUAZIONI DIFFERENZIALI ORDINARIE

Per equazioni differenziali di ordine n, il problema di Cauchy prevede condizioni iniziali


non solo sulla funzione incognita y ma anche sulle sue derivate fino a quella di ordine n − 1.
(n−1)
Consideriamo, infatti, un punto (x0 , y0 , y00 , y000 , . . . , y0 ) ∈ R × Rn . Sia I l’intervallo [x0 −
n (n−1)
a, x0 + a] (con a ∈ R), e J sia un intorno di R del punto Y0 = (y0 , y00 , y000 , . . . , y0 ), quindi

J = {Y ∈ Rn t.c. |Y − Y0 | ≤ b}

dove b ∈ Rqe |Y − Y0 | è il modulo del vettore Y − Y0 (quindi se Y = (y1 , y2 , y3 , . . . , yn ) si ha


(n−1)
|Y − Y0 | = (y0 − y1 )2 + (y00 − y2 )2 + . . . (y0 − yn )2 ).
Vale il seguente teorema.

Teorema 8.2.2 (Teorema di Cauchy in piccolo per eq. differenziali di ordine n) Sia f =
f (x, y1 , y2 , y3 , . . . , yn ) una funzione definita per x ∈ I e (y1 , y2 , . . . , yn ) ∈ J (I e J definiti prima).
Sia f continua insieme alle derivate parziali fatte rispetto a y1 , y2 , . . . , yn . Allora esiste un
numero reale δ > 0 ed una ed una sola funzione y(x), derivabile n volte in [x0 − δ, x0 + δ], che è
soluzione del seguente problema di Cauchy:


 y (n) = f (x, y, y 0 , y 00 , . . . , y (n−1) )

y(x0 ) = y0




y 0 (x0 ) = y00


 y 00 (x0 ) = y000

 ..
.





 (n−1) (n−1)
y (x0 ) = y0

Con il teorema di Cauchy di esistenza e unicità locale, sono date delle condizioni sufficien-
ti per risolvere localmente, in piccolo, il problema di Cauchy, determinando una soluzione
in un intorno del punto iniziale x0 .

8.3 Teorema di Cauchy (esistenza e unicità globale)


A volte è importante stabilire l’esistenza della soluzione del problema di Cauchy per un’e-
quazione differenziale ordinaria in un intervallo prefissato (quindi non in un intorno di x0 ),
cioè assegnato a priori, in cui l’equazione differenziale è definita.
Per stabilire delle condizioni sufficienti per risolvere globalmente, o in grande, il problema
di Cauchy, occorre avere condizioni più restrittive sulla funzione f .
Nel caso di un’equazione differenziale del primo ordine, si hanno queste condizioni:
1. f (x, y) è definita in una striscia verticale di R2 data da
n o
[a, b] × R = (x, y) ∈ R2 t.c. x ∈ [a, b], y ∈ R

2. f è continua
∂f (x, y)
3. la derivata parziale di f rispetto a y è continua e limitata, quindi
≤ L per ogni
∂y
(x, y) ∈ [a, b] × R, con L numero reale positivo.
In queste ipotesi, esiste una ed una sola funzione y(x) che risolve il problema di Cauchy
(
y 0 (x) = f (x, y)
y(x0 ) = y0

Possiamo enunciare il teorema:

122
8.4. Definizioni

Teorema 8.3.1 (Teorema di esistenza e unicità globale (caso di eq. diff. del primo ordine))
∂f (x, y)
Se f = f (x, y) è continua in [a, b] × R e la sua derivata è continua e limitata in [a, b] × R,
∂y
allora per ogni x0 ∈]a, b[ e per ogni y0 ∈ R esiste una ed una sola funzione y = y(x), derivabile
in [a, b] che risolve su tutto l’intervallo [a, b] il problema di Cauchy
(
y 0 (x) = f (x, y)
y(x0 ) = y0

Per equazioni differenziali di ordine n il teorema precedente si generalizza considerando


funzioni f = f (x, y1 , y2 , y3 , . . . , yn ) = f (x, Y ) definite nella striscia [a, b] × Rn con
n o
[a, b] × Rn = (x, Y ) = (x, y1 , y2 , y3 , . . . , yn ) ∈ Rn+1 , con x ∈ [a, b], y1 ∈ R, . . . , yn ∈ R

Teorema 8.3.2 (Teorema di esistenza e unicità globale (caso di eq. diff. di ordine n))
Se f = f (x, y1 , y2 , y3 , . . . , yn ) è continua in [a, b] × Rn e le derivate parziali fatte rispetto a y1 ,
y2 , . . . , yn sono continue e limitate in [a, b] × Rn , allora per ogni x0 ∈]a, b[ e per ogni punto di Rn
(n−1)
dato da (y0 , y00 , . . . , y0 ) esiste una ed una sola funzione y(x), derivabile n volte in [a, b], che
è soluzione del seguente problema di Cauchy:


 y (n) = f (x, y, y 0 , y 00 , . . . , y (n−1) )

y(x0 ) = y0




y 0 (x0 ) = y00


 y 00 (x0 ) = y000

 ..
.





 (n−1) (n−1)
y (x0 ) = y0

8.4 Definizioni
Consideriamo ora un’equazione differenziale del primo ordine e introduciamo le seguenti
definizioni.
G Per integrale generale si intende l’insieme delle soluzioni dell’equazione differenziale
che varia al variare di una costante c: qualunque sia la coppia (x0 , y0 ) si può stabilire il
valore della costante c tale che y(c, x0 ) = y0 .
G Per integrale particolare si intende invece una soluzione particolare dell’equazione
differenziale: fissata una coppia (x0 , y0 ) esiste una costante c tale che y(c, x0 ) = y0 .
G Si ha invece un integrale singolare se, data una coppia (x0 , y0 ), non esiste una costante c
tale che y(c, x0 ) = y0 , vale a dire che per quella coppia di dati, la soluzione dell’equazione
differenziale non rientra in un integrale particolare.

8.5 Equazioni differenziali lineari del primo ordine


Sia y 0 = f (x, y) con f funzione lineare in y, del tipo f (x, y) = b(x) − a(x)y.
Si ha, quindi, per l’equazione differenziale:

y 0 = f (x, y) =⇒ y 0 = b(x) − a(x)y =⇒ y 0 + a(x)y = b(x)

Vediamo ora tutti i passaggi per trovare l’integrale generale di questa equazione
differenziale.
1. Sia A(x) = a(x)dx una primitiva di a(x). Poniamo m(x) = eA(x) .
R

123
8. E QUAZIONI DIFFERENZIALI ORDINARIE

2. Moltiplichiamo l’equazione differenziale per m(x), ottenendo:

m(x)y 0 (x) + m(x)a(x)y(x) = m(x)b(x) (8.1)

3. Consideriamo ora la derivata di m(x). Si ha

dm(x) deA(x) dA(x) dA(x)


= = eA(x) = m(x)
dx dx dx dx
dA(x)
ma essendo A(x) una primitiva di a(x) vuole dire che = a(x), da cui si ricava
dx
dm(x)
= m(x)a(x)
dx
4. Facciamo ora la derivata di y(x)m(x). Abbiamo da fare la derivata di un prodotto di
funzioni, da cui
d(y(x)m(x)) dy(x) dm(x)
= m(x) + y(x)
dx dx dx
La derivata di m(x) l’abbiamo appena ricavata, la derivata di y(x) è y 0 (x), da cui

d(y(x)m(x))
= m(x)y 0 (x) + m(x)a(x)y(x)
dx
Abbiamo trovato il primo membro dell’equazione 8.1.
5. Possiamo quindi riscrivere l’equazione 8.1 come

d(y(x)m(x))
= m(x)b(x)
dx
6. Integrando ambo i membri dell’equazione e dividendo poi per m(x) (diversa da zero
perche è eA(x) ) si ha
Z Z
dy(x)m(x)
dx = m(x)b(x)dx + costante
dx
Z
y(x)m(x) = m(x)b(x)dx + costante
Z 
1
y(x) = m(x)b(x)dx + costante
m(x)

7. Riscrivendo la funzione m(x) come eA(x) si ha


Z 
y(x) = e−A(x) eA(x) b(x)dx + costante

L’integrale è generale perchè dipende da una costante.


Osserviamo, inoltre, che se a(x) e b(x) sono continue in un certo intervallo [a, b], allora il
problema di Cauchy che possiamo associare a questa equazione differenziale si può risolvere
globalmente in [a, b] × R poichè valgono le ipotesi del teorema di esistenza e unicità globale (la
∂f
funzione f = b(x)−a(x)y è continua e la derivata = −a(x) è continua e limitata (poichè a(x)
∂y
dipende solo da x ed è continua in un intervallo chiuso allora ammette minimo e massimo,
cioè è limitata).

124
8.6. Metodo di separazione delle variabili

Esempio
Es. 8.5.1 Risolviamo l’equazione differenziale y 0 + 4xy = x. In questo esempio a(x) = 4x
e b(x) = x. Applichiamo il procedimento appena descritto.
G A(x) = a(x)dx = 4xdx = 2x2 da cui m(x) = e2x .
R R 2

G Moltiplichiamo l’equazione differenziale per m(x) ricavando:


2 2 2
e2x y 0 (x) + e2x 4xy(x) = e2x x

G Abbiamo allora
2
dy(x)e2x 2
= e2x x
dx

G Integrando ambo i membri e dividendo poi per e 2x2


si ha
Z
2 2
y(x) = e−2x e2x xdx

2
Dobbiamo quindi calcolare e2x xdx: considerando che la derivata dell’esponente è
R

4x, basta moltiplicare e dividere per 4 ottenendo:


Z Z Z
2x2 1 2x2 1 2 1 2
e xdx = 4xe dx = D(2x2 )e2x dx = e2x + costante
4 4 4

Quindi
2 1 2 1 2
y(x) = e−2x ( e2x + costante) = + Ce−2x
4 4
dove C rappresenta la costante.

8.6 Metodo di separazione delle variabili


Se un’equazione differenziale del primo ordine può essere scritta nella forma

y 0 (x) = p(x)q(y)

con p(x) e q(y) continue, allora l’equazione si dice a variabili separabili.


Vediamo come si risolve questa equazione nel caso in cui q(y) 6= 0 per ogni y. In tal caso,
possiamo dividere ambo i membri per q(y), ottenendo

y 0 (x)
= p(x)
q(y)

Integriamo ambo i membri dell’equazione rispetto a x, ricavando:

y 0 (x)
Z Z
dx = p(x)dx (8.2)
q(y(x))

In modo equivalente possiamo scrivere anche


Z Z
1
dy = p(x)dx
q(y)

125
8. E QUAZIONI DIFFERENZIALI ORDINARIE

1
Sia Q(y) una primitiva di e P una primitiva di p. Vuol dire che
q(y)
dQ(y(x)) dQ(y(x)) dy 1
= = y 0 (x),
dx dy dx q(y(x))
dP (x)
mentre = p(x). Tornando alla relazione 8.2, poichè abbiamo trovato le primitive di
dx
ciascuno dei due integrali, si ha
Q(y(x)) = P (x) + costante
Se è possibile esplicitare la y allora abbiamo una forma esplicita della soluzione (e questo
lo si ha se la Q è invertibile), altrimenti abbiamo una forma implicita della soluzione mediante
la relazione Q(y(x)) − P (x) = costante.

Esempio
x2
Es. 8.6.1 Sia da risolvere il problema di Cauchy, y 0 = con la condizione iniziale y(0) =
y2
4.
Risolviamo prima l’equazione differenziale, applicando il metodo di separazione delle
1
variabili (p(x) = x2 , q(y) = 2 ). Separando le variabili infatti, abbiamo da risolvere:
y
Z Z
y dy = x2 dx
2

ovvero
y3 x3
= + costante
3 3
Risolvendo ora per y (che è funzione di x) otteniamo:

y(x) = (x3 + 3costante)1/3

Poichè la costante è arbitraria possiamo scrivere C = 3costante ricavando

y(x) = (x3 + C)1/3

Imponiamo ora la condizione iniziale y(0) = 4. Deve essere 4 = (C)1/3 da cui C = 43 = 64.
Quindi la soluzione del problema è data da y(x) = (x + 64)1/3 .

8.7 Risoluzione di alcuni tipi di equazioni differenziali


G Sia data un’equazione differenziale del secondo ordine, in cui manca il termine in y:
F (x, y 0 , y 00 ) = 0
In tal caso, si pone z(x) = y 0 (x), da cui z 0 (x) = y 00 (x). L’equazione differenziale
trasformata diventa:
F (x, z, z 0 ) = 0
Abbiamo un’equazione differenziale del primo ordine nella incognita z. Una volta tro-
vata z soluzione dell’equazione differenziale, quindi z = z(x, cost1 ), si ricava y cercando
una primitiva di z:
Z
y(x) = z(x, cost1 )dx + cost2

126
8.8. Le equazioni differenziali lineari

G Se l’equazione differenziale del secondo ordine non dipende esplicitamente da x


F (y, y 0 , y 00 ) = 0

allora si pensa y come variabile indipendente e si si pone z(y) = y 0 .


Allora (considerando che y è funzione di x e z è funzione di y):
dy 0 dz(y) dz dy
y 00 = = = = z0z
dx dx dy dx
Quindi l’equazione differenziale diventa

F (y, z, z 0 z) = 0
Se si trova un’integrale generale di questa equazione, z = z(y, cost), allora, per trovare
y, dalla relazione y 0 = z(y, cost) si ricava la soluzione y osservando che questa che
abbiamo appena scritto è un’equazione differenziale a variabili separabili.
G Ci sono molti altri casi di equazioni differenziali non lineari che presentano una forma
particolare e che possono essere risolte mediante tecniche ad hoc. Non stiamo però a
studiarle in questa sede.

8.8 Le equazioni differenziali lineari


Riprendiamo l’esempio visto quando abbiamo introdotto le equazioni differenziali:

y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 + a0 (x)y = b(x)

dove i coefficienti a0 (x), a1 (x), . . . , an−1 (x) e b(x) sono assegnate funzioni continue, che dipen-
dono dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate
fino a quella di ordine n.
Un’equazione differenziale scritta in questa forma, prende il nome di equazione
differenziale lineare, perchè è lineare rispetto a y e alle sue derivate.
G Se ciascuna funzione ai (x), per i = 0, 2, . . . , n−1 è costante rispetto alla variabile x, allora
l’equazione differenziale prende il nome di equazione differenziale lineare a coefficienti
costanti.
G Se b(x) = 0 per ogni valore di x, allora l’equazione si dice equazione differenziale
omogenea.
G Se b(x) 6= 0 allora l’equazione si dice equazione differenziale non omogenea.
L’equazione che si ha ponendo b(x) ≡ 0 si dice equazione omogenea associata
all’equazione di partenza in cui b(x) 6= 0.
Per quanto riguarda il problema di Cauchy associato ad un’equazione differenziale lineare
di ordine n, vale il seguente teorema.

Teorema 8.8.1 Se le funzioni a0 (x), a1 (x), . . . , an−1 (x) sono continue in un intervallo [a, b], allora
il problema di Cauchy




 y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 + a0 (x)y = b(x)y(x0 ) = y0
y 0 (x0 ) = y00





y 00 (x0 ) = y000
.
..





y (n−1) (x ) = y (n−1)

0 0

(n−1)
ammette sempre un’unica soluzione y(x) qualunque sia il punto (x0 , y0 , y00 , . . . , y0 ) associato
alle condizioni iniziali.

127
8. E QUAZIONI DIFFERENZIALI ORDINARIE

Dimostrazione. Infatti, l’equazione differenziale si può scrivere come

y (n) = f (x, y, y 0 , . . . , y (n−1) )

con f (x, y, y 0 , . . . , y (n−1) ) = b(x) − an−1 (x)y (n−1) − . . . − a1 (x)y 0 − a0 (x)y.


Riscrivendo la f come una funzione dipendente da x e da un punto Y = (y1 , y2 , . . . , yn ),
(quindi f (x, Y ) = b(x) − an−1 (x)yn − . . . a1 (x)y2 − a0 (x)y1 ) si ha che
∂f
= −ai−1 (x)
∂yi
Quindi ciascuna derivata è una funzione continua e limitata in [a, b] per cui sono soddi-
sfatte le ipotesi del teorema di Cauchy in grande, qualcunque sia il punto iniziale assegnato.
4
Per provare alcune proprietà generali delle equazioni differenziali lineari, conviene in-
trodurre alcune notazioni. La prima consiste nel vedere l’equazione differenziale come il
risultato di un operatore L applicato alla funzione y(x).
Introduciamo dunque l’operatore L che agisce su una funzione f (x) nel modo seguente:

L(f ) = f (n) + an−1 (x)f (n−1) + an−2 (x)f (n−2) + . . . + a0 (x)f

Introducendo i simboli D e Dn per indicare la derivata prima e la derivata n-sima rispetto


d dn
a x, D = , Dn = n , l’operatore L si può scrivere come
dx dx
L = Dn + an−1 (x)Dn−1 + an−2 (x)Dn−2 + . . . + a0 (x)

Allora l’equazione differenziale lineare

y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 + a0 (x)y = b(x)

può essere scritta come

L(y) = b(x)

Difatti:

L(y) = (Dn + an−1 (x)Dn−1 + an−2 (x)Dn−2 + . . . + a0 (x))y


= Dn (y) + an−1 (x)Dn−1 (y) + . . . + a0 (x)y
= y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 + a0 (x)y

Usando l’operatore L, è facile dedurre, facendo uso delle proprietà delle derivate, che vale:
1. L(y1 + y2 ) = L(y1 ) + L(y2 )
2. L(αy) = αL(y), dove α è una costante.
Queste due proprietà dicono che L è un operatore lineare.
Quindi, dato l’operatore L appena definito:
G L(y) = b(x) è un’equazione differenziale lineare non omogenea. La funzione b(x) prende
il nome di termine noto dell’equazione differenziale.
G L(y) = 0 è l’equazione differenziale omogenea (il termine noto vale zero) associata
all’equazione differenziale precedente, in quanto l’operatore L è lo stesso.
Possiamo stabilire questo risultato.

Teorema 8.8.2 Se y1 , y2 , . . . , ym sono un numero finito m di soluzioni dell’equazione differen-


ziale lineare omogenea L(y) = 0, allora anche ogni funzione data da c1 y1 + c2 y2 + . . . + cm ym ,
con c1 , c2 , . . . , cm costanti di R, è soluzione di L(y) = 0,

128
8.8. Le equazioni differenziali lineari

Dimostrazione. La dimostrazione segue dal fatto che L è un operatore lineare. Da


L(y1 ) = 0, L(y2 ) = 0, . . . L(ym ) = 0, e applicando la linearità di L, si ha

L(c1 y1 + c2 y2 + . . . + cm ym ) = L(c1 y1 ) + L(c2 y2 ) + . . . L(cm ym )


= c1 L(y1 ) + c2 L(y2 ) + . . . + cm L(ym )
=0

Teorema 8.8.3 Data l’equazione differenziale L(y) = 0 con le funzioni a0 (x), a1 (x), . . . , an−1 (x)
continue in un intervallo [a, b], allora per ogni x0 ∈]a, b[, la funzione identicamente nulla è l’unica
soluzione del problema di Cauchy L(y) = 0 con condizioni iniziali date da

y(x0 ) = 0, y 0 (x0 ) = 0, . . . , y (n−1) (x0 ) = 0

Dimostrazione. La dimostrazione segue dal teorema di esistenza ed unicità del pro-


blema di Cauchy, considerando che la funzione nulla risolve l’equazione differenziale con le
condizioni iniziali tutte nulle. 4
Chiamiamo con il simbolo N l’insieme delle soluzioni di un’equazione differenziale linea-
re omogenea data mediante l’operatore L. Questo insieme prende il nome di spazio nullo
dell’operatore L. L’insieme N è uno spazio vettoriale sul campo dei reali.

8.8.1 Cosa è uno spazio vettoriale?


Consideriamo un insieme N (non necessariamente quello di prima), costituito da funzioni
reali definite in R. Sia 0 lo zero di N , vale a dire la funzione identicamente nulla.
N è uno spazio vettoriale (sui reali), se:
G è possibile definire un’operazione interna + sugli elementi dell’insieme N , chiama-
ta somma, che gode della proprietà associativa e commutativa, per la quale esiste
l’elemento neutro (lo zero), e ogni elemento ha l’opposto.
G è possibile definire un’operazione esterna · degli elementi di N sui reali, chiamata
prodotto per la quale
– per ogni c1 e c2 in R e per ogni f in N , si ha (c1 c2 ) · f = c1 · (c2 · f )
– per ogni c1 e c2 in R e per ogni f in N , si ha (c1 + c2 ) · f = (c1 · f ) + (c2 · f )
– per ogni c in R e per ogni f e g in N , si ha c · (f + g) = c · f + c · g
– per ogni f in N , si ha 1 · f = f
Un elemento dello spazio vettoriale prende il nome di vettore.
Siano ora y1 , y2 , . . . , yn n elementi dello spazio vettoriale N . Si dice combinazione lineare
dei vettori y1 , y2 , . . . , yn mediante i coefficienti c1 , c2 , . . . , cn di R, il vettore dato da

c1 y1 + c2 y2 + . . . cn yn .

Gli n vettori y1 , y2 , . . . , yn si dicono linearmente indipendenti se l’unica combinazione


lineare dei vettori y1 , y2 , . . . , yn che produce il vettore nullo è data da coefficienti tutti nulli:

c1 y1 + c2 y2 + . . . cn yn = 0 ⇐⇒ c1 = c2 = . . . = cn = 0

Se uno spazio vettoriale ha n vettori linearmente indipendenti allora si dice che lo spazio
ha dimensione n. I vettori linearmente indipendenti costituiscono una base dello spazio.
Ogni funzione dello spazio può essere ottenuta mediante una combinazione lineare della
base, cioè dei suoi vettori linearmente indipendenti.

129
8. E QUAZIONI DIFFERENZIALI ORDINARIE

8.9 L’equazione omogenea


Torniamo all’equazione differenziale omogenea L(y) = 0 e cerchiamo di caratterizzare le
sue soluzioni.
Sia L(y) = y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 + a0 (x)y e sia data l’equazione differenziale
L(y) = 0.
Siano y1 , y2 , . . . , yn n integrali particolari, per x ∈ [a, b], dell’equazione differenziale omoge-
nea. Per capire se questi integrali sono linearmente indipendenti, abbiamo bisogno di intro-
durre il cosiddetto determinante wronskiano o, semplicemente, il wronskiano delle funzioni
y1 , y2 , . . . , yn , che è dato dalla funzione w(x) definita per x ∈ [a, b] mediante il determinante

y1 (x) y2 (x) ... yn (x)
0 0 0
y1 (x) y2 (x) ... yn (x)
00 00 00
w(x) = y1 (x) y2 (x) ... yn (x)

.. .. ..


.
(n−1) . . . . .

y (n−1) (n−1)
1 (x) y2 (x) . . . yn (x)

Teorema 8.9.1 Sia dato l’operatore L definito tramite le n funzioni a0 (x), a1 (x), . . . , an−1 (x),
continue in un intervallo aperto ]a, b[⊂ R. Siano y1 (x), y2 (x), . . . , yn (x) n funzioni diverse da zero
che soddisfano l’equazione differenziale:
L(y1 ) = L(y2 ) = · · · = L(yn ) = 0
Condizione necessaria e sufficiente affinchè le n soluzioni siano linearmente indipendenti è
che sia diverso da zero per ogni valore di x ∈]a, b[, il wronskiano w(x).

Teorema 8.9.2 Lo spazio delle funzioni che sono soluzione dell’equazione omogenea L(y) = 0
(lo spazio nullo N ) ha dimensione n, ovvero, l’equazione omogenea L(y) = 0 ammette sempre
un sistema di n integrali linearmente indipendenti.
Dimostrazione. Si fissi x0 ∈ R e si considerino gli n problemi di Cauchy

(1)L(y) = 0, y(x0 ) = 1, y 0 (x0 ) = 0, y 00 (x0 ) = 0, ... y (n−1) (x0 ) = 0

(2)L(y) = 0, y(x0 ) = 0, y 0 (x0 ) = 1, y 00 (x0 ) = 0, ... y (n−1) (x0 ) = 0


(3)L(y) = 0, y(x0 ) = 0, y 0 (x0 ) = 0, y 00 (x0 ) = 1, ... y (n−1) (x0 ) = 0
..
.
(n)L(y) = 0, y(x0 ) = 0, y 0 (x0 ) = 0, y 00 (x0 ) = 0, ... y (n−1) (x0 ) = 1
Quindi l’i-mo problema di Cauchy ha condizioni iniziali tutte nulle, eccetto la derivata
y (i−1) che in x0 vale 1.
Per ciascuno di questi problemi di Cauchy, la soluzione esiste ed è unica (per il teorema
di esistenza e unicità visto prima).
Consideriamo ora il wronskiano delle n funzioni yi (per i = 1, 2, . . . , n) che sono soluzioni
di questi problemi di Cauchy:


y1 (x) y2 (x) ... yn (x)

0
y20 (x) yn0 (x)

y1 (x) ...
00
y200 (x) yn00 (x)

w(x) = y1 (x) ...

.. .. ..


.
(n−1) . ...
.
y (n−1) (n−1)
1 (x) y 2 (x) . . . yn (x)

130
8.10. L’equazione non omogenea

Valutiamo w(x) per x = x0 . Si ha



1 0 . . . 0

0 1 . . . 0
w(x0 ) = . . .

.. .. . . . ..

0 0 . . . 1

Risulta che w(x0 ) è il determinante della matrice identità, che ha uno sugli elementi della
diagonale principale e zero altrove. Il determinante di questa matrice vale 1, quindi è diverso
da zero.
Poichè x0 è stato scelto in modo arbitrario in R, vuole dire che le n soluzioni dell’equazioni
differenziali sono linearmente indipendenti (in base al teorema 8.9.1).
Abbiamo trovato dunque n funzioni linearmente indipendenti che risolvono l’equazione
omogenea L(y) = 0. Queste n funzioni costituiscono una base per lo spazio delle soluzioni
dell’equazione L(y) = 0. 4

Definizione 8.9.1 Una n-pla di funzioni y1 , y2 , . . . , yn che sono soluzioni linearmente in-
dipendenti di L(y) = 0 prende il nome di sistema fondamentale di integrali di L(y) =
0.
Se conosciamo n soluzioni linearmente indipendenti di L(y) = 0, la generica soluzione
di L(y) = 0 è data da una combinazione lineare delle soluzioni linearmente indipendenti.
Questa generica soluzione prende il nome di integrale generale. Si ha il seguente teorema

Teorema 8.9.3 (Sull’integrale generale di un’equazione omogenea) Dato un sistema fon-


damentale di integrali y1 , y2 , . . . , yn dell’equazione differenziale omogenea L(y) = 0, l’integrale
generale è dato dalle combinazioni lineari

y = c1 y1 + c2 y2 + . . . cn yn

con c1 , c2 , . . . , cn costanti di R.

8.10 L’equazione non omogenea


Sia data ora un’equazione differenziale non omogenea

L(y) = b(x)

.
Sappiamo che ad essa possiamo associare l’equazione differenziale omogenea

L(y) = 0

Se conosciamo un integrale particolare dell’equazione non omogenea, y, e conosciamo


l’integrale generale dell’equazione omogenea associata, y, allora l’integrale generale dell’e-
quazione non omogenea, che indichiamo con η, è dato dalla somma di y e di y. Vale infatti il
seguente teorema.

Teorema 8.10.1 Dato y integrale particolare di L(y) = b(x), e dato l’integrale generale y di
L(y) = 0, allora l’integrale generale di L(y) = b(x) è dato da

η =y+y

131
8. E QUAZIONI DIFFERENZIALI ORDINARIE

Dimostrazione. Consideriamo η = y + y. Si ha

L(η) = L(y + y)
applicando la linearità di L
= L(y) + L(y)
ma L(y) = 0 e L(y) = b(x)
= b(x)

Quindi η è soluzione dell’equazione differenziale L(y) = b(x).


Supponiamo che y ∗ sia un altro integrale particolare diverso da y, per l’equazione non
omogenea, L(y ∗ ) = b(x), allora y ∗ = y ∗ − y risulta un integrale dell’omogenea associata, in
quanto

L(y ∗ ) = L(y ∗ − y) = L(y ∗ ) − L(y) = b(x) − b(x) = 0

Quindi y ∗ si può scrivere come combinazione lineare di un sistema fondamentale di integrali


dell’equazione omogenea, tramite dei coefficienti c1 , c2 , . . . , cn . Perciò y ∗ = y ∗ + y rientra come
caso particolare (perchè y ∗ è caratterizzato da specifici coefficienti) dell’integrale generale
η = y + y, cioè η = y + y è l’unico modo per rappresentare l’integrale generale dell’equazione
non omogenea. 4
Quindi l’integrale generale dell’equazione differenziale L(y) = b(x), conoscendo n integrali
linearmente indipendenti dell’equazione omogenea associata, e un integrale particolare y
della non omogenea, è dato da dato da

y = c1 y1 + c2 y2 + . . . , cn yn + y

8.11 Equazioni lineari a coefficienti costanti


Data l’equazione differenziale

y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 + a0 (x)y = b(x)

se a0 (x) ≡ a0 , a1 (x) ≡ a1 , . . . , an−1 (x) = an−1 , tutte le funzioni sono costanti in x, allora
l’equazione differenziale prende il nome di equazione differenziale a coefficienti costanti:

y (n) + an−1 y (n−1) + . . . + a1 y 0 + a0 y = b(x)

Per trovare l’integrale generale dell’equazione lineare a coefficienti costanti, si considera


la cosiddetta equazione caratteristica, che si ricava dall’equazione differenziale omogenea
associata, sostituendo alle derivate della funzione incognita le potenze della variabile z:

P (z) = z n + an−1 z n−1 + . . . + a1 z + a0 = 0

Quindi a y (n) sostituiamo z n , a y (n−1) sostituiamo z n−1 m fino ad arrivare a y che sostituiamo
con z 0 = 1. Il polinomio P (z) prende il nome di polimonio caratteristico. Si cercano le radici
del polinomio caratteristico, cioè i valori di z per cui P (z) = 0 e da queste radici è possibile
risalire (vedremo ora in che modo) all’integrale generale dell’equazione differenziale lineare
omogenea. Occorre poi trovare un integrale particolare per l’equazione non omogenea.
Ricordiamo che un polinomio di grado n ammette n radici: queste radici possono essere
reali o complesse, e possono essere con molteplicità semplice o di un certo grado, ma tali
che la somma dei gradi di ciascuna radice dia il grado del polinomio. Vediamo dei semplici
esempi.

132
8.11. Equazioni lineari a coefficienti costanti

Esempio
Es. 8.11.1 Consideriamo un polinomio di secondo grado. Sappiamo che, dato un poli-
nomio di secondo grado P (z) = az 2 + bz + c, per trovare√le radici del polinomio, cioè quei
−b ± b2 − 4ac
valori di z per cui P (z) = 0 si ha la formula z = , dove la quantità sotto
2a
2
radice, b − 4ac prende il nome di discrimante e viene indicato con il simbolo ∆.
G Se ∆ = b2 − 4ac > 0 si hanno due radici reali distinte.
Esempio: P (z) = z 2 − 5z − 6.
5±7
In questo caso ∆ = 25 + 24 = 49, da cui z = . Si hanno due radici distinte: z1 = 6 e
2
z2 = −1.
G Se ∆ = b2 − 4ac = 0 si hanno due radici reali coincidenti (una radice da contarsi due
volte, o con molteplicità due).
Esempio: P (z) = z 2 − 2z + 1. Qui ∆ = 4 − 4 = 0. Si ricava facilmente, o applicando la
formula, o riconoscendo che P (z) = (z − 1)2 , che la radice è z = 1 da contarsi due volte,
cioè z = 1 è una radice con molteplicità doppia.
G Se ∆ = b2 − 4ac < 0, non
√ si hanno radici
√ reali ma
p nel campo complesso,
√ introducendo
l’unità immaginaria i = −1, per cui b2 − 4ac = (−1)(4ac − b2 ) = i 4ac − b2 , essendo
ora 4ac − b2 > 0.
Esempio: P (z) = z 2 + 2z + 3. In questo caso ∆ = 4 − 12 = −8 Sotto radice ho −8, quindi le
radici sono complesse.

−2 ± i2 2 √
z= = −1 ± i 2
2
√ √
Trovo due radici z1 = −1 + i 2 e z2 = −1 − i 2.
Queste due radici sono complesse e coniugate, perchè la parte immaginaria delle due
radici è una l’opposta dell’altra.
Un numero complesso, infatti, si può vedere come z = a + ib, con a e b numeri reali e i
l’unità immaginaria. Il coniugato di z = a + ib è dato da z = a − ib.
Per determinare l’integrale generale di un’equazione differenziale omogenea si vanno a
cercare le radici del polinomio caratteristico. Supponiamo che il polimonio caratteristico
abbia n radici reali tutte distinte tra di loro, γ1 , γ2 , . . . , γn , allora le funzioni y(x) = eγi x
sono soluzioni particolari dell’equazione differenziale. Infatti da y(x) = eγx si ha y 0 = γeγx ,
y 00 = γ 2 eγx , . . . , y (n) = γ n eγx . Se andiamo a sostituire nell’equazione differenziale, ricaviamo

L(y) = L(eγx )
= γ n eγx + an−1 γ n−1 eγx + . . . + a1 γeγx + a0 eγx
metto in evidenza eγx
= (γ n + an−1 γ n−1 + . . . + a1 γ + a0 )eγx
= P (γ)eγx
ma γ è radice dell’equazione caratteristica
=0

Quindi y = eγx è soluzione dell’equazione differenziale lineare omogenea.


In genere, però, un polinomio di grado n può avere radici reali che si ripetono (che hanno
una certa molteplicità), o radici reali insieme a radici complesse e coniugate (e anche queste
radici possono avere una certa molteplicità).
Per ricavare l’integrale generale di un’equazione lineare omogenea, viene in aiuto il
seguente teorema.

133
8. E QUAZIONI DIFFERENZIALI ORDINARIE

Teorema 8.11.1 Siano γ1 , γ2 , . . . , γh h radici reali del polinomio caratteristico, ciascuna delle
quali ha rispettivamente molteplicità r1 , . . . , rh mentre siano α1 ± iβ1 , α2 ± iβ2 , . . . , αl ± iβk 2k
radici complesse e coniugate con molteplicità, rispettivamente, s1 , s2 , . . . , sk .
La molteplicità delle radici è tale che r1 + r2 + . . . + rh + 2(s1 + s2 + . . . + sk ) = n.
Allora le n funzioni
eγp x , xeγp x , . . . xrp −1 eγp x , per p = 1, 2, . . . , h
eαq x cos (βq x), eαq x sin (βq x), xeαq x cos (βq x), xeαq x sin (βq x), . . . ,
xsq −1 eαq x cos (βq x), xsq −1 eαq x sin (βq x), per q = 1, 2, . . . , k
sono n soluzioni reali dell’equazione differenziale omogenea linearmente indipendenti.
Scritto in forma meno compatta, vuol dire che se l’equazione caratteristica ha n radici,
in parte reale e in parte complesse coniugate, così come sono state descritte nel teorema, si
hanno le seguenti soluzioni per l’equazione lineare:
G dalle radici reali del polinomio caratteristico si hanno i seguenti integrali:
eγ1 x xeγ1 x x2 eγ1 x . . . xr1 −1 eγ1 x
eγ2 x xeγ2 x x2 eγ2 x . . . xr2 −1 eγ2 x
eγ3 x xeγ3 x x2 eγ3 x . . . xr3 −1 eγ3 x
.. .. .. ..
. . . ... .
eγh x xeγh x x2 eγh x . . . xrh −1 eγh x
G dalle radici complesse e coniugate del polinomio caratteristico si hanno i seguenti
integrali:
eα1 x cos (β1 x) eα1 x sin (β1 x) xeα1 x cos (β1 x) xeα1 x sin (β1 x)
2 α1 x 2 α1 x
x e cos (β1 x) x e sin (β1 x) . . . ...
... ... xs1 −1 eα1 x cos (β1 x) xs1 −1 eα1 x sin (β1 x)

eα2 x cos (β2 x) eα2 x sin (β2 x) xeα2 x cos (β2 x) xeα2 x sin (β2 x)
x2 eα2 x cos (β2 x) x2 eα2 x sin (β2 x) ... ...
... ... xs2 −1 eα2 x cos (β2 x) xs2 −1 eα2 x sin (β2 x)

eα3 x cos (β3 x) eα3 x sin (β3 x) xeα3 x cos (β3 x) xeα3 x sin (β3 x)
x2 eα3 x cos (β3 x) x2 eα3 x sin (β3 x) ... ...
... ... xs3 −1 eα3 x cos (β3 x) xs3 −1 eα3 x sin (β3 x)

.. .. .. ..
. . . .

eαk x cos (βk x) eαk x sin (βk x) xeαk x cos (βk x) xeαk x sin (βk x)
2 αk x 2 αk x
x e cos (βk x) x e sin (βk x) . . . ...
... ... xsk −1 eαk x cos (βk x) xsk −1 eαk x sin (βk x)
L’integrale generale è dato da una combinazione lineare di tutte queste soluzioni particolari.
Quindi l’integrale generale dell’equazione differenziale omogenea è dato dalle combinazio-
ni lineari delle soluzioni linearmente indipendenti trovate.

Esempio
Es. 8.11.2 Sia data l’equazione lineare omogenea y 00 − 4y = 0.
L’equazione caratteristica è data da P (z) = z 2 − 4 = 0
Le radici di questa equazione sono date da z1 = 2, z2 = −2. Sono due radici reali, con
molteplicità uno.
L’integrale generale dell’equazione differenziale è dunque dato da

y(x) = c1 e2x + c2 e−2x

134
8.12. Metodo dei coefficienti indeterminati

Esempio
Es. 8.11.3 Sia ora y 00 + 2y 0 + y = 0. Ora l’equazione caratteristica è data da P (z) =
z 2 + 2z + 1 = 0, che ha come radici z = −1 con molteplicità doppia.
In tal caso l’integrale generale è dato da

y(x) = c1 e−x + c2 xe−x

Esempio
Es. 8.11.4 Sia data l’equazione differenziale y 00 + 2y 0 + 3 = 0. Adesso si ha, per l’e-
quazione caratteristica,
√ P√(z) = z 2 + 2z + 3 = 0 che ha due radici complesse e √
coniugate
z1 = −1 + i 2 e z2 = −1 − i 2. La parte reale è a = −1 la parte complessa è b = 2, quindi
l’integrale generale è
√ √
y(x) = c1 e−x cos ( 2x) + c2 e−x sin ( 2x)
Se, invece, interessa la soluzione generale dell’equazione differenziale non omogenea,
dobbiamo trovare, oltre all’integrale generale dell’omogenea associata, anche un integrale
particolare dell’equazione non omogenea visto che l’integrale generale è dato dalla som-
ma dell’integrale generale dell’omogenea associata e dell’integrale particolare della non
omogenea (in base al teorema 8.10.1).
Il problema di trovare l’integrale generale di un’equazione differenziale non omogenea
L(y) = b(x) si riconduce alla soluzione di due problemi:
1. trovare l’integrale generale dell’equazione omogenea associata L(y) = 0
2. trovare un integrale particolare dell’equazione non omogenea L(y) = b(x)

8.12 Metodo dei coefficienti indeterminati


Per alcune funzioni b(x) è possibile trovare l’integrale particolare in modo abbastanza
semplice, applicando il cosiddetto metodo dei coefficienti indeterminati. Ecco un elenco di
possibili casi per b(x).
G Sia b(x) = P (x), un polinomio di grado p. Se nell’equazione differenziale, a0 6= 0 , allora
come soluzione particolare si ha y = Q(x), dove Q(x) è un polinomio di grado al più
p (si va a cercare un polinomio dello stesso grado del termine noto che sia soluzione
particolare dell’equazione non omogenea).
G Se b(x) = P (x) polinomio di grado p, ma a0 = a1 = . . . = ar−1 = 0 con r − 1 ≤ n − 1
(ciò equivale a dire che nell’equazione caratteristica associata si ha la radice z = 0 con
molteplicità r) allora si ha come soluzione particolare y = xr Q(x) polinomio di grado al
più p.
G Sia b(x) = eαx P (x) con α ∈ R e P (x) polinomio di grado p,
– Se α non è radice dell’eq. caratteristica, allora y = eαx Q(x), con Q(x) polinomio di
grado al più p.
– Se α è radice dell’eq. caratteristica, con molteplicità r, allora y = xr eαx Q(x) con
Q(x) polinomio di grado al più p.
G Sia b(x) = eαx cos(βx)P (x) oppure b(x) = eαx sin(βx)P (x) oppure b(x) = eαx (cos(βx) +
sin(βx))P (x), con α, β ∈ R e P (x) polinomio di grado p
– Se α ± iβ non è radice dell’eq. caratteristica, allora y = eαx (cos(βx)Q1 (x) +
sin(βx)Q2 (x)) con Q1 e Q2 polinomi di grado al più p.
– Se α ± iβ è radice dell’eq. caratteristica con molteplicità r, allora y =
xr eαx (cos(βx)Q1 (x) + sin(βx)Q2 (x)) con Q1 e Q2 polinomi di grado al più p.
Se il termine noto b(x) è dato dalla somma di funzioni, ciascuna delle quali si può ricon-
durre ad uno dei casi descritti sopra, allora l’integrale particolare è dato dalla somma degli
integrali particolari delle equazioni differenziali non omogenee legate a ciascun addendo

135
8. E QUAZIONI DIFFERENZIALI ORDINARIE

della funzione di partenza. Infatti, se il termine noto è dato dalla somma di m funzioni,
b(x) = b1 (x) + b2 (x) + . . . + bm (x), possiamo considerare sia l’equazione differenziale L(y) = b(x),
sia le m equazioni differenziali L(y) = b1 (x), L(y) = b2 (x), . . . L(y) = bm (x).
Siano y1 , y2 , . . . , ym m soluzioni particolari di queste m equazioni differenziali, allora vale

L(y1 + y2 + . . . ym ) = L(y1 ) + L(y2 ) + . . . + L(ym )


b1 (x) + b2 (x) + . . . + bm (x)
= b(x)

Quindi y = y1 + y2 + . . . + ym è soluzione dell’equazione differenziale L(y) = b(x).


Vediamo degli esempi sulla risoluzioni di equazioni differenziali non omogenee.

Esempio
Es. 8.12.1 Si voglia risolvere l’equazione differenziale

y 00 + y = 3x2

Per prima cosa risolviamo l’omogenea associata y 00 + y = 0. L’equazione caratteristica è :


z 2 + 1 = 0, da cui z = ±i: abbiamo due radici complesse e coniugate. L’integrale generale
è, dunque: y = c1 cos (x) + c2 sin (x).
Cerchiamo ora un integrale particolare. Vediamo che b(x) = 3x2 , è un polinomio di se-
condo grado, e il coefficiente a0 dell’equazione differenziale è diverso da zero. Quindi
l’integrale particolare deve essere un polinomio di secondo grado, del tipo y = ax2 + bx + c,
con a, b, c da determinare andando a sostituire y nell’equazione differenziale. Infatti deve
essere

y 00 + y = 3x2

Da y = ax2 + bx + c, si ha y 0 = 2ax + b e y 00 = 2a. Andando a sostituire nell’equazione


differenziale si ricava:

2a + ax2 + bx + c = 3x2

Ora i termini che hanno le stesse potenze di x a primo e a secondo membro vanno
eguagliati:

2
ax
 = 3x2
bx =0

2a + c =0

Risolviamo questo sistema di 3 equazioni in 3 incognite, ottenendo a = 3, b = 0, c = −2a =


−6. Perciò l’integrale particolare è dato da y = 3x2 − 6.
L’integrale generale dell’equazione differenziale non omogenea vale dunque: y =
c1 cos (x) + c2 sin (x) + 3x2 − 6.

Esempio
Es. 8.12.2 Sia da risolvere l’equazione differenziale

y 00 + 3y 0 + 2y = x + x3 − e−x sin (2x)

Per prima cosa cerchiamo le soluzioni dell’equazione omogenea associata. L’equazione


caratteristica è : z 2 + 3z + 2 = 0, da cui le radici reali z1 = −1 e z2 = −2. L’integrale
generale dell’omogenea è dunque y = c1 e−x + c2 e−2x .

136
8.12. Metodo dei coefficienti indeterminati

Consideriamo ora il termine noto b(x) = x + x3 − e−x sin (2x). Osserviamo come il termine
noto possa essere visto come somma del polinomio P (x) = x + x3 e della funzione
−e−x sin (2x).
Cerchiamo dunque un integrale particolare per l’equazione differenziale

y 00 + 3y 0 + 2y = x + x3

e un integrale particolare per l’equazione differenziale

y 00 + 3y 0 + 2y = −e−x sin (2x)

Per il primo integrale, vediamo che il termine noto è un polinomio di terzo grado e
che il coefficiente a0 6= 0, quindi l’integrale particolare è un polinomio di terzo grado
y = ax3 + bx2 + cx + d. Derivando, si ha y 0 = 3ax2 + 2bx + c e y 00 = 6ax + 2b. Andando a
sostituire nell’equazione differenziale si ha

6ax + 2b + 3(3ax2 + 2bx + c) + 2(ax3 + bx2 + cx + d) = x + x3

Raccogliendo i termini con le stesse potenze di x a primo membro, abbiamo

2ax3 + (9a + 2b)x2 + (6a + 6b + 2c)x + 2b + 3c + 2d = x + x3

Uguagliando i termini con le stesse potenze a primo e a secondo membro si ha:



2a


=1
9a + 2b =0
6a + 6b + 2c
 =1

2b + 3c + 2d =0

9 9 1 − 6a − 6b 23 −2b − 3c 51
Otteniamo a = 1/2, b = − a = − , c = = , d = = − , da cui
2 4 2 4 2 8
x3 9 2 23 51
y= − x + x− .
2 4 4 8
Passiamo ora a trovare un integrale particolare per la seconda equazione differenzia-
le che abbiamo ricavato che ha come termine noto la funzione −e−x sin (2x). Ricon-
ducendoci allo schema che abbiamo fatto per i vari casi di termini noto, questo si
riconduce alla funzione del tipo eαx sin (βx)P (x), dove α = −1, β = 2, P (x) = −1 (po-
linomio di grado 0). Poichè −1 ± i2 non è radice dell’equazione caratteristica (che ha
nel nostro caso solo radici reali), dobbiamo cercare un integrale particolare del tipo
y = e−x (cos (2x)a + sin (2x)b) (devono essere Q1 eQ2 polinomi di grado zero, cioè delle
costanti).
Allora,

y 0 = −e−x (a cos (2x) + b sin (2x)) + e−x (−2a sin (2x) + 2b cos (2x))
= e−x ((2b − a) cos (2x) − (b + 2a) sin (2x))

y 00 = −e−x ((2b − a) cos (2x) − (b + 2a) sin (2x))+


e−x (−2(2b − a) sin (2x) − 2(b + 2a) cos (2x))
= e−x ((−4b − 3a) cos (2x) + (4a − 3b) sin (2x))

137
8. E QUAZIONI DIFFERENZIALI ORDINARIE

Andando a sostituire nell’equazione differenziale, si ottiene:

e−x ((−4b − 3a) cos (2x) + (4a − 3b) sin (2x))+


3(e−x ((2b − a) cos (2x) − (b + 2a) sin (2x))+
2(e−x (a cos (2x) + b sin (2x)) = −e−x sin (2x)

Si può semplificare l’equazione dividendo ambo i membri per e−x . Raccogliendo i


termini in sin (2x) e cos (2x) si ha:

(2b − 4a) cos (2x) + (−4b − 2a) sin (2x) = − sin (2x)

Quindi:
(
2b − 4a = 0
−4b − 2a = −1

1 1 1 1
Risolvendo il sistema si trova a = e b = da cui y = e−x ( cos (2x) + sin (2x)).
10 5 10 5
Concludendo, l’integrale generale dell’equazione differenziale non omogenea da cui
siamo partiti è dato da:

x3 9 23 51 1 1
y = c1 exp −x + c2 exp −2x + − x2 + x − + e−x ( cos (2x) + sin (2x))
2 4 4 8 10 5
Se si ha un problema di Cauchy, si risolve prima l’equazione differenziale cercando un
integrale generale. Successivamente, le costanti vengono determinate in base alle condizioni
iniziali date dal problema.

138
C APITOLO 9
Forme differenziali

Nel campo della matematica,


se trovo un nuovo approccio a
un problema, ci può essere
sempre un altro matematico
che sostiene di aver trovato
una soluzione migliore, o
semplicemente più elegante.
Negli scacchi se qualcuno
sostiene di essere più bravo di
me, io gli posso sempre dare
scaccomatto.

Emanuel Lasker (1868-1941)

9.1 Introduzione alle forme differenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . 139


9.2 Integrali delle forme differenziali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140
9.3 Applicazione delle forme differenziali . . . . . . . . . . . . . . . . . . . . . . . . . . 143
9.4 Teorema fondamentale per gli integrali curvilinei . . . . . . . . . . . . . . . . . . . 144
9.5 Forme differenziali lineari esatte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
9.6 Le forme differenziali lineari chiuse . . . . . . . . . . . . . . . . . . . . . . . . . . . 149

9.1 Introduzione alle forme differenziali


Consideriamo una curva regolare γ nel piano data da equazioni parametriche

x = x(t), y = y(t), a≤t≤b

Sia data una funzione f (x, y) dipendente da due variabili. Possiamo pensare di integrare la
funzione f sulla curva γ rispetto a x o rispetto a y (quindi non sull’arco di curva, ds, ma in
dx o dy).
Si ha l’integrale curvilineo di f rispetto a x dato da
Z Z b
f (x, y)dx = f (x(t), y(t))x0 (t)dt
γ a

Si ha l’integrale curvilineo di f rispetto a y dato da


Z Z b
f (x, y)dy = f (x(t), y(t))y 0 (t)dt
γ a

139
9. F ORME DIFFERENZIALI

Infatti poichè x = x(t), allora dx = x0 (t)dt. Analogo è il ragionamento per la y.


Spesso questi due integrali appaiono insieme: se X e Y sono due funzioni nelle variabili
x e y e se γ è una curva (data da equazioni parametriche come in precedenza), allora
Z Z b
Xdx + Y dy = X(x, y)dx + Y (x, y)dy
γ a
Z b
= X(x(t), y(t))x0 (t)dt + Y (x(t), y(t))y 0 (t)dt
a
Z b
= (X(x(t), y(t))x0 (t) + Y (x(t), y(t))y 0 (t)) dt
a

L’espressione che abbiamo scritto come funzione integranda Xdx + Y dy prende il nome di
forma differenziale.
Possiamo dare allora la seguente definizione

Definizione 9.1.1 Date X e Y due funzioni definite in I ⊂ R2 , si chiama forma differenziale


lineare ω (o forma lineare) l’espressione

ω = Xdx + Y dy = X(x, y)dx + Y (x, y)dy

Le funzioni X e Y si chiamano coefficienti della forma differenziale.


Se i coefficienti sono di classe C p , la forma differenziale si dice di classe C p .
Per una forma differenziale, si possono definire le seguenti operazioni:
G dato un vettore r = (r1 , r2 ) e (x, y) ∈ I, il prodotto scalare tra ω e r è:

ω · r = X(x, y)r1 + Y (x, y)r2

G dato uno scalare c ∈ R e una funzione f definita in I e a valori in R si definisce la


moltiplicazione della forma differenziale per c e per f nel modo seguente:

cω = cXdx + cY dy

f ω = (f X)dx + (f Y )dy
G Date due forme differenziali ω 1 e ω2 , si definisce addizione di ω1 e di ω2 la seguente
forma:

ω1 + ω2 = (X1 dx + Y1 dy) + (X2 dx + Y2 dy) = (X1 + X2 )dx + (Y1 + Y2 )dy

Con queste operazione, l’insieme delle forme differenziali lineari, definite in un insieme I ⊂ R,
è uno spazio vettoriale.
Consideriamo, ora, il differenziale di una funzione f (x, y). Si ha df = fx dx + fy dy. Quindi il
differenziale di una funzione f si può vedere come una forma differenziale lineare. Non vale,
ovviamente, il viceversa: data una forma lineare, non è detto che ci sia una funzione f il cui
differenziale coincida con la forma lineare stessa.

9.2 Integrali delle forme differenziali


Abbiamo introdotto le forme differenziali introducendo degli integrali curvilinei fatti ri-
spetto a x e rispetto a y. Le forme differenziali, infatti, vengono utilizzate in integrali
curvilinei.
Data una curva regolare γ con il suo orientamento naturale, quindi una curva +γ, che
puó essere scritta in forma parametrica tramite le equazioni

x = x(t), y = y(t), a≤t≤b

140
9.2. Integrali delle forme differenziali

si definisce integrale curvilineo (o di linea) della forma differenziale ω sulla curva +γ,
l’integrale
Z Z Z b
ω= Xdx + Y dy = (X(x(t), y(t)x0 (t) + Y (x(t), y(t))y 0 (t)) dt
+γ +γ a

Se scriviamo le equazioni parametriche della curva usando una funzione vettoriale f =


(x(t), y(t)), l’integrale di prima può essere scritto come
Z Z b
ω= ω(f (t)) · f 0 (t)dt
+γ a

Difatti il prodotto scalare ω(f (t)) · f 0 (t) altro non è che la funzione integranda che abbiamo
scritto prima X(x(t), y(t)x0 (t) + Y (x(t), y(t))y 0 (t).
Ora cerchiamo di vedere cosa succede se facciamo l’integrale di una forma differenziale
su una curva +γ o sulla curva opposta −γ. Vediamolo con un esempio.

Esempio
Es. 9.2.1 Sia ω = yx2 dx + sin (πy)dy. Quindi X(x, y) = yx2 , e Y (x, y) = sin (πy).
La curva +γ sia il segmento che va dal punto (0, 2) al punto (1, 4).
La curva +γ in forma parametrica può essere scritta come

x = t, y = 2t + 2, 0≤t≤1

Per t = 0 si ha
R (0, 2), per t = 1 si ha (1, 4).
Calcoliamo +γω. Si ha
Z Z 1 Z 1
y(t)x(t)2 x0 (t) + sin (πy(t))y 0 (t) dt = (2t + 2)t2 + sin (π(2t + 2))2 dt
 
ω=
+γ 0 0
1 4
t3
Z
t 1
2t3 + 2t2 + 2 sin (π(2t + 2)) dt = 2 + 2 − cos (π(2t + 2))|t=1

= t=0
0 4 3 π
1 2 1 1 7
= + − + =
2 3 π π 6
Vediamo ora cosa succede se integriamo lungo la curva opposta −γ (ricordiamo che quan-
do abbiamo definito l’integrale curvilineo di una funzione lungo una curva γ, integrando
lungo la curva, cioè rispetto all’ascissa curvilinea ds, abbiamo detto che l’integrale non
dipende dall’orientamento della curva. In questo caso invece, le cose cambiano):
La curva opposta −γ ha equazioni parametriche

x = −t, y = −2t + 2, −1 ≤ t ≤ 0

Per t = −1 si ha (1, 4), per t = 0 si ha (0, 2).


Si ha dunque
Z Z 0 Z 0
yx2 dx + sin (πy)dy = (−2t + 2)(−t)2 (−1) + sin (π(−2t + 2))(−2) dt

ω=
−γ −1 −1
0
t4 t3
Z
1
2t3 − 2t2 − 2 sin (π(−2t + 2)) dt = 2 − 2 − cos (π(−2t + 2))|t=0

= t=−1
−1 4 3 π
1 1 2 1 7
=− − − + =−
π 2 3 π 6
Osserviamo dunque che il valore dell’integrale che abbiamo ottenuto sulla curva opposta
−γ è l’opposto dell’integrale che avevamo ottenuto sulla curva +γ.

141
9. F ORME DIFFERENZIALI

Vale infatti il seguente teorema

Teorema 9.2.1 Data una forma differenziale ω e una curva regolare +γ si ha


Z Z
ω=− ω
−γ +γ

Dimostrazione. Dimostriamo questo teorema considerando che se una curva +γ è data


da f = (x(t), y(t)) con a ≤ t ≤ b, la curva opposta si può scrivere come −γ con F = (x̃(t), ỹ(t)) =
(x(−t), y(−t)) con −b ≤ t ≤ −a Quindi x̃0 (t) è uguale alla derivata della funzione x(−t) che va
vista come la funzione composta x(h(t)) con h(t) = −t. Derivando, quindi, si ha la derivata di
x valutata in h(t) = −t per la derivata di h(t) che vale −1, da cui: x̃0 (t) = x0 (−t)(−1) = −x0 (−t).
Analogamente, vale ỹ(−t) = −y 0 (−t).
Allora
Z Z −a
ω= (X(x̃(t), ỹ(t))x̃0 (t) + Y (x̃(t), ỹ(t)), ỹ 0 (t)) dt
−γ −b
Z −a
= (X(x(−t), y(−t))(−x0 (−t)) + Y (x(−t), y(−t)), (−y 0 (−t))) dt
−b
Z −a
= − (X(x(−t), y(−t))x0 (−t) + Y (x(−t), y(−t))y 0 (−t)) dt
−b
facendo il cambiamento di variabili u = −t, du = −dt
e considerando che per t = −b, u = b, e per t = −a, u = a
Z a
= (X(x(u), y(u))x0 (u) + Y (x(u), y(u))y 0 (u)) du
b
Z b
=− (X(x(u), y(u))x0 (u) + Y (x(u), y(u))y 0 (u)) du
Za
=− ω

4
Quindi nel fare gli integrali curvilinei delle forme differenziali occorre prestare molta atten-
zione all’orientamento della curva. Per questo motivo, gli integrali curvilinei delle forme
differenziali sono detti integrali orientati.
Invece, anche per le forme differenziali, l’integrale curvilineo non dipende dal tipo di
rappresentazione utilizzata per la curva, cioè non dipende dalla scelta della rappresentazione
parametrica.
Si ha infatti la seguente proposizione
R
Proposizione 9.2.1 L’integrale curvilineo +γ
ω non dipende dalla particolare rappresentazio-
ne della curva regolare +γ.
Dimostrazione. Sia data la curva +γ tramite la funzione f = (x(t), y(t)), con a ≤ t ≤ b o,
in maniera equivalente, tramite la funzione F = (xF (u), yF (u)), con α ≤ u ≤ β . Sappiamo che,
dovendo rappresentare la medesima curva, le due funzioni f e F sono legate tra loro mediante
una funzione φ : [α, β] ⇒ [a, b] con φ0 (u) > 0, tale che φ(α) = a, φ(β) = b e F(u) = f (φ(u))
Torniamo all’integrale curvilineo. Da una parte
Z Z b
ω= (X(x(t), y(t))x0 (t) + Y (x(t), y(t))y 0 (t)) dt
+γ a

142
9.3. Applicazione delle forme differenziali

Dall’altra si ha:
Z Z β
ω= (X(xF (u), yF (u))x0F (u) + Y (xF (u), yF (u))yF0 (u)) du
+γ α

Ma per la relazione che lega F a f si ha:


F(u) = f (φ(u))
(xF (u), yF (u)) = (x(φ(u), y(φ(u))
x0F (u) = x0 (φ(u))φ0 (u)
yF0 (u) = y 0 (φ(u))φ0 (u)
Quindi si ha
Z Z β
ω= (X(xF (u), yF (u))x0F (u) + Y (xF (u), yF (u))yF0 (u)) du
+γ α
Z β
= (X(x(φ(u)), y(φ(u)))x0 (φ(u))φ0 (u) + Y (x(φ(u)), y(φ(u)))y 0 (φ(u))φ0 (u)) du
α
mettendo in evidenza φ0 (u)
Z β
= (X(x(φ(u)), y(φ(u)))x0 (φ(u)) + Y (x(φ(u)), y(φ(u)))y 0 (φ(u))) φ0 (u)du
α
operando il cambiamento di variabili t = φ(u)
e considerando dt = φ0 (u)du
e il cambiamento agli estremi u = α ⇒ t = a, u = β ⇒ t = b
Z b
= (X(x(t), y(t))x0 (t) + Y (x(t), y(t))y 0 (t)) dt
a
Abbiamo provato che la rappresentazione parametrica della curva non influisce sul risul-
tato finale perchè gli integrali coincidono qualunque sia la rappresentazione parametrica per
descrivere la stessa curva. 4
Per gli integrali curvilinei sulle forme differenziali valgono anche le seguenti proprietà:
G se c ∈ R ,
R
cω = c
R
ω
G R +γ R +γR
ω + ω2 = +γ ω1 + +γ ω2
G
+γ 1
se la curva +γ viene suddivisa in un certo numero k Rdi curveR regolari, R tali che R+γ =
+γ1 ∪+γ2 ∪. . .∪+γk o se la curva è regolare a tratti, allora +γ ω = +γ1 ω+ +γ2 ω+. . .+ +γk ω

9.3 Applicazione delle forme differenziali


In molte applicazioni soprattutto nella fisica, ci si trova a lavorare con funzioni vettoriali
da integrare su curve. Sia F~ = X(x, y)~i + Y (x, y)~j una funzione vettoriale (scritta in funzione
dei versori degli assi x e y rispettivamente). Sia data una curva regolare +γ data da ~r =
x(t)~i + y(t)~j (è la stessa cosa di scrivere f = (x(t), y(t)))) con a ≤ t ≤ b.
Si definisce integrale curvilineo del vettore F~ lungo la curva +γ l’integrale
Z Z b
F~ · d~r = F~ (~r) · r~0 (t)dt
+γ a

Poichè F~ (~r) = F~ (x(t), y(t)) = X(x(t), y(t))~i + Y (x(t), y(t))~j e r~0 (t) = x0 (t)~i + y 0 (t)~j, risulta
Z Z b
F~ · d~r = (X(x(t), y(t))~i + Y (x(t), y(t))~j) · (x0 (t)~i + y 0 (t)~j)dt
+γ a
Z b
= (X(x(t), y(t))x0 (t) + Y (x(t), y(t))y 0 (t)) dt
a

143
9. F ORME DIFFERENZIALI

Abbiamo ritrovato la definizione di integrale curvilineo di una forma differenziale, dove i


coefficienti della forma differenziale sono le componenti del vettore F~ .
Un esempio in cui vediamo applicata una forma differenziale in fisica è il lavoro compiuto
da un campo di forze. Se consideriamo una particella che si muove lungo una curva, indi-
cando con ~s la distanza percorsa dalla particella lungo la curva +γ, e con F~ = (X, Y ) una
forza che agisce sulla particella mentre essa si sposta di d~s, si definisce lavoro elementare
eseguito da F~ il prodotto scalare:

dL = F~ · d~s

In coordinate cartesiane, e limitandoci al caso bidimensionale, si può scrivere

dL = Xdx + Y dy

Il lavoro elementare è dunque una forma differenziale.


Il lavoro totale lungo tutta la curva +γ è invece definito tramite l’integrale della forma
differenziale dL:
Z Z b
L= dL = X(x(t), y(t))dx + Y (x(t), y(t))dy
+γ a

9.4 Teorema fondamentale per gli integrali curvilinei


Teorema 9.4.1 Assegnata una funzione f (x, y), si consideri la forma differenziale data dal
suo differenziale: ω = df = fx dx + fy dy.
Data una curva regolare +γ espressa mediante rappresentazione parametrica da (x(t), y(t))
(o mediante la funzione vettoriale ~r) , si ha
Z
df = f (x(b), y(b)) − f (x(a), y(a))

Questo risultato equivale anche a dire che


Z
∇f · d~r = f (x(b), y(b)) − f (x(a), y(a))

Dimostrazione.
Si ha
Z Z b
df = (fx (x(t), y(t))x0 (t) + fy (x(t), y(t))y 0 (t)) dt
+γ a
per le regole di derivazione delle funzioni composte
Z b
df (x(t), y(t))
= dt
a dt
t=b
= f (x(t), y(t))|t=a
= f (x(b), y(b)) − f (x(a), y(a))

9.5 Forme differenziali lineari esatte


Definizione 9.5.1 Una forma differenziale ω = Xdx + Y dy (definita in un insieme aperto e di
classe C 0 ) si dice esatta se esiste almeno una funzione F (di classe C 1 ) tale che dF = ω vale a
dire se Fx = X e Fy = Y .

144
9.5. Forme differenziali lineari esatte

Figura 9.1: A, B e C sono esempi di insiemi connessi.

Figura 9.2: L’insieme A costituito dall’unione dei tre insiemi non è un insieme connesso.

Si dice anche che F è una primitiva di ω.


Vediamo ora un particolare tipo di insieme che ci permette di stabilire alcune importanti
proprietà per le forme differenziali, se definite su questi insiemi. Si tratta degli insiemi
connessi.

Definizione 9.5.2 Un insieme aperto A ⊂ R2 si dice connesso se, qualunque siano i punti P
e Q presi in A, esiste una linea poligonale che è contenuta tutta in A e che ha P e Q come
estremi.
Per funzioni definite su insiemi connessi vale questo Lemma.

Lemma 9.5.1 Sia f una funzione di classe C 1 definita in un insieme aperto e connesso A di
R2 . Se, per ogni (x, y) ∈ A risulta fx (x, y) = fy (x, y) = 0, allora f è una funzione costante in A.

145
9. F ORME DIFFERENZIALI

Dimostrazione. Consideriamo due punti, P = (x, y) e P0 = (x0 , y0 ) in A. Dalla definizione


di insieme connesso, sappiamo che esiste una linea poligonale che congiunge P e P0 e che
si trova all’interno di A. Per semplicità supponiamo che la linea poligonale sia il segmento
congiungente i due punti. Allora, per il teorema di Lagrange, si ha

f (P ) = f (P0 ) + fx (Q)(x − x0 ) + fy (Q)(y − y0 )

con Q punto che non conosciamo, che si trova sul segmento congiungente P e P0 . Poichè
fx (Q) = fy (Q) = 0 (e questo qualunque sia il punto Q), si ha

f (P ) = f (P0 )

Possiamo variare il punto P , lasciando fisso P0 ma avremo sempre lo stesso risultato, quindi
la funzione assume valore costante.
Se, al posto di un segmento congiungente P e P0 , abbiamo una linea spezzata, si ripete il
ragionamento su ciascun segmento arrivando alla stessa conclusione. 4
Per le forme differenziali, vale il seguente lemma.

Lemma 9.5.2 Se F e G sono primitive, di classe C 1 , definite in un insieme aperto e connesso,


della stessa forma differenziale lineare ω, allora differiscono per una costante.
Dimostrazione. Poichè, per ipotesi, F e G sono primitive di ω = Xdx + Y dy, vuol dire che
Fx = Gx = X, Fy = Gy = Y . Consideriamo la funzione f = F − G. Questa funzione è definita
in un insieme aperto e connesso (come la forma lineare) ed è di classe C 1 (essendolo F e G).
Si ha fx = Fx − Gx = X − X = 0 e fy = Fy − Gy = Y − Y = 0, e questo qualunque sia (x, y) preso
nell’insieme di definizione. Ma, allora, sono soddisfatte le ipotesi del lemma precedente e
quindi f è una funzione costante: f (x, y) = cost. Di conseguenza, F (x, y) − G(x, y) = cost, cioè
F e G differiscono per una costante: F (x, y) = G(x, y) + cost. 4
Consideriamo ora i seguenti teoremi sulle forme differenziali lineari esatte.

Teorema 9.5.1 Data ω = Xdx + Y dy una forma differenziale lineare, di classe C 0 e definita
in un insieme aperto e connesso, se F è una sua primitiva, allora ogni primitiva di ω è del tipo
F + cost con cost una costante.
Dimostrazione. Se F è una primitiva di ω, la funzione G = F + cost è anch’essa primitiva,
in quanto Gx = Fx = X e Gy = Fy = Y (poichè la derivata di una costante rispetto a x e a y
vale zero).
Supponendo di conoscere un’altra primitiva di ω, G, poichè si ha sempre Gx = X e
Gy = Y , per il lemma precedente, si ha ancora che G e F differiscono per una costante,
quindi G = F + cost. 4
L’insieme delle primitive di una forma differenziale lineare ω in un insieme aperto e connesso
prende il nome di integrale indefinito, propriò perchè, nota una primitiva, tutte le altre
differiscono per una costante.

Teorema 9.5.2 Dato A ⊂ R2 aperto e connesso e data una forma differenziale lineare ω di
classe C 0 in A, le seguenti proposizioni sono equivalenti:
1. ω è esatta.
2. Se P0 e P sono due punti qualunque in A e +γ1 e +γ2 sono due curve generalmente
regolari orientate contenute in A, che hanno entrambe come primo estremo P0 e come
secondo estremo P , allora
Z Z
ω= ω
+γ1 +γ2

vale a dire l’integrale curvilineo dipende solo dagli estremi P0 e P e non dal cammino
percorso.

146
9.5. Forme differenziali lineari esatte

Figura 9.3: Le curve +γ1 e +γ2 hanno gli stessi estremi P0 e P . La curva −γ2 opposta a +γ2
ha come estremi P e P0 .

3. Se γ è una qualunque curva generalmente regolare, chiusa e contenuta in A, allora


Z
ω=0

Dimostrazione. Di questo teorema, dimostriamo che (1) ⇒ (2), (2) ⇒ (3) e (3) ⇒ (2).
(1) ⇒ (2) Sia per ipotesi ω = Xdx + Y dy esatta. Siano dati due punti P0 e P in A e
sia +γ una curva generalmente regolare che ha P0 come primo estremo e P come secondo
estremo. In forma parametrica, le equazioni della curva +γ siano
x = x(t) y = y(t) a≤t≤b
Quindi (x(a), y(a)) = (x0 , y0 ) = P0 , e (x(b), y(b)) = (x, y) = P .
Sia F una primitiva di ω (esiste perchè ω è esatta: vuol dire che dF = ω, poichè Fx = X e
Fy = Y .
Ma allora per il teorema fondamentale del calcolo degli integrali (si veda teorema 9.4.1)
Z Z
ω= dF = F (P ) − F (P0 )
+γ +γ

L’integrale non dipende dalla particolare curva +γ ma solo dagli estremi della curva e dalla
primitiva F . Perciò, date due curve +γ1 e +γ2 il risultato dell’integrale non cambia (si veda
Figura 9.3). La (2) è provata.
(2) ⇒ (3) Sia +γ una curva generalmente regolare chiusa data da equazioni
parametriche
x = x(t) y = y(t) a≤t≤b
0
Si fissi un punto t interno all’intervallo [a, b] e si considerino le due curve che si ottengono
da +γ facendo variare il parametro t in [a, t0 ] e in [t0 , b] in modo che +γ sia dato dall’unione
di queste due curve, che chiamiamo, rispettivamente +γ1 e +γ2 . La curva +γ1 ha come
primo estremo P0 e come secondo estremo il punto T = (x(t0 ), y(t0 ). La curva +γ2 ha come
primo estremo T e come secondo estremo P0 (essendo la curva chiusa e quindi (x(a), y(a)) =
(x(b), y(b))).
La curva opposta a +γ2 è la curva −γ2 e ha, quindi, come primo estremo P0 e come
secondo estremo T .
Dunque, le curve +γ1 e −γ2 hanno gli stessi estremi P0 e T . Ora, per l’ipotesi (2) sappiamo
che
Z Z
ω= ω
+γ1 −γ2

147
9. F ORME DIFFERENZIALI

Ma sappiamo anche che


Z Z
ω=− ω
−γ2 +γ2

Quindi
Z Z
ω=− ω
+γ1 +γ2

da cui
Z Z
ω+ ω=0
+γ1 +γ2

Torniamo all’integrale su tutta la curva +γ: poichè +γ = +γ1 ∪ +γ2 si ha


Z Z Z
ω= ω+ ω
+γ +γ1 +γ2

Ma la somma di questi due integrali vale zero, quindi


Z
ω=0

L’asserto è dunque provato.


(3) ⇒ (2) Siano date due curve +γ1 e +γ2 due curve generalmente regolari che hanno
gli stessi estremi P0 e P . Allora la curva +γ1 ∪ −γ2 è una curva chiusa generalmente regolare.
Per la (3) vale
Z
ω=0
+γ1 ∪−γ2

Ma
Z Z Z
ω= ω+ ω
+γ1 ∪−γ2 +γ1 −γ2

Quindi
Z Z
ω+ ω=0
+γ1 −γ2

da cui
Z Z Z Z
ω=− ω⇒ ω= ω
+γ1 −γ2 +γ1 +γ2

Abbiamo verificato il punto (2).


Per completare la dimostrazione del teorema, andrebbe dimostrato che (2) ⇒ (1). Poichè
la dimostrazione è abbastanza complicata, la tralasciamo. 4
Come corollario si ha

Proposizione 9.5.1 Siano A ⊂ R2 un insieme aperto e connesso e ω una forma differenziale


lineare di classe C 0 in A, con F primitiva. Allora, se +γ è una curva generalmente regolare e
orientata contenuta in A, che ha come primo estremo P0 e come secondo estremo P , si ha
Z
ω = F (P ) − F (P0 )

Dimostrazione. Questo risultato lo abbiamo dimostrato al punto (1) ⇒ (2) del teorema
precedente. 4

148
9.6. Le forme differenziali lineari chiuse

9.6 Le forme differenziali lineari chiuse


Definizione 9.6.1 Una forma differenziale lineare ω = Xdx + Y dy di classe C 1 in A, insieme
aperto di R2 , si dice chiusa se per ogni punto P di A risulta

∂X ∂Y
=
∂y ∂x

Teorema 9.6.1 Data ω = Xdx+Y dy una forma differenziale lineare di classe C 1 in un insieme
aperto A ⊂ R2 , ω esatta =⇒ ω chiusa.

Dimostrazione. Se ω è esatta, vuol dire che esiste una primitiva, F , tale che Fx = X
e Fy = Y . Per ipotesi ω è di classe C 1 , cioè le derivate parziali di X e Y sono continue. Di
conseguenza F è di classe C 2 (poichè le sue derivate parziali del secondo ordine coincidono
con le derivate parziali prime di X e Y ). Inoltre si ha

∂F 2 ∂X ∂F 2 ∂Y
= e =
∂x∂y ∂y ∂y∂x ∂x

∂F 2 ∂F 2
Per il teorema di Schwartz, le derivate parziali miste di F coincidono, = , quindi
∂x∂y ∂y∂x
risulta
∂X ∂Y
=
∂y ∂x

L’asserto è provato. 4
Osserviamo che il viceversa non vale sempre. Si possono avere forme differenziali chiuse che
non sono esatte.
Per poter avere l’implicazione ω chiusa ⇒ ω esatta, la forma differenziale lineare deve
essere definita in un insieme particolare. Introduciamo, perciò, la definizione di insieme
semplicemente connesso.

Definizione 9.6.2 Un sottoinsieme di R2 , A aperto, si dice semplicemente connesso se


G è connesso
G ogni curva generalmente regolare, chiusa e semplice contenuta in A è la frontiera di un
insieme limitato contenuto in A.
Dire che A è un insieme semplicemente connesso vuol dire che l’insieme è ”senza buchi“,
in quanto ogni curva chiusa e semplice, generalmente regolare, può essere deformata con
continuità fino a ridursi ad un singolo punto. Una corona circolare ha ”buchi“ e, infatti,
non è semplicemente connesso. Il piano privato di un punto non è semplicemente connesso.
L’interno di un cerchio è semplicemente connesso. La circonferenza non è semplicemente
connesso.

Teorema 9.6.2 Sia ω una forma differenziale lineare di classe C 1 in A aperto e semplicemente
connesso. Allora se ω è chiusa, ω è esatta.

149
Bibliografia

[1] D AWKINS , P. (2007), Calculus I, Class Notes, http://tutorial.math.lamar.edu/


terms.aspx.
[2] D AWKINS , P. (2007), Calculus II, Class Notes, http://tutorial.math.lamar.edu/
terms.aspx.
[3] D AWKINS , P. (2007), Calculus III, Class Notes, http://tutorial.math.lamar.edu/
terms.aspx.
[4] G UICHARD , D. (2012), Calculus, Late Trascendentals, Creative Commons Attribu-
tion Non-Commercial-ShareAlike License, https://www.whitman.edu/mathematics/
multivariable_late/.
[5] K EISLER , H. J. (2009), Elementary Calculus, An Infinitesimal Approach, Creative Com-
mons Attribution Non-Commercial-ShareAlike License, http://www.math.wisc.edu/
~Keisler/calc.html.
[6] S TEWAR T, J. (2003), Calculus, Thomson-Brooks/Cole.
[7] S TEWAR T, J. (2007), Calculus, Early Transcendentals, Thomson,Brooks/Cole.
[8] S TRANG , G. (1991), Calculus, Wellesley-Cambridge Press.
[9] T RENCH , W. F. (2012), Introduction to Real Analysis, Free Hyperlinked Edition 2.00,
February 2012.

151

Potrebbero piacerti anche