Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Indice iii
4 Massimi e minimi 35
4.1 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
4.2 Massimi e minimi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.3 Ricerca di massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.4 Sui massimi e minimi assoluti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
4.5 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.5.1 Equazione di una retta e vettore normale alla retta . . . . . . . . . . . . . 47
4.6 Curve di livello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
4.6.1 Significato del vettore gradiente . . . . . . . . . . . . . . . . . . . . . . . . 50
iii
I NDICE
5 Le curve 57
5.1 Equazioni parametriche di una curva . . . . . . . . . . . . . . . . . . . . . . . . . 57
5.2 Grafico di una curva parametrica . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.3 Parametrizzare una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.4 Tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
5.5 Lunghezza di un arco di funzione . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
5.6 Lunghezza di una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
5.7 La curva cicloide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
5.8 Sistema di coordinate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
5.9 Curve in coordinate polari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5.9.1 La curva cardioide . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.10 Lunghezza di una curva polare . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74
5.10.1Lunghezze di alcune curve . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
5.11 Funzioni a valori vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.12 Le curve riviste come funzioni vettoriali . . . . . . . . . . . . . . . . . . . . . . . 79
5.13 Retta tangente ad una curva . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.14 Curve orientate . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80
5.15 Di nuovo sulla lunghezza di una curva . . . . . . . . . . . . . . . . . . . . . . . . 80
5.16 L’ascissa curvilinea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
6 Superfici parametriche 83
6.1 Superfici parametriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
6.1.1 Sistema di coordinate sferiche . . . . . . . . . . . . . . . . . . . . . . . . . 85
6.2 Piano tangente a una superficie parametrica . . . . . . . . . . . . . . . . . . . . 87
6.2.1 Equazione di un piano e vettore normale al piano . . . . . . . . . . . . . . 87
7 Integrali 91
7.1 Integrali dipendenti da parametri . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
7.1.1 Integrali dipendenti da parametri per funzioni di una sola variabile . . . 91
7.1.2 Integrali dipendenti da parametri per funzioni di due variabili . . . . . . 92
7.2 Richiamo sugli integrali semplici . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
7.3 Integrali doppi su domini rettangolari . . . . . . . . . . . . . . . . . . . . . . . . . 94
7.4 Integrali iterati . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
7.5 Integrali doppi su domini generali . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
7.6 Proprietà degli integrali doppi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
7.7 Cambiamento di variabili . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
7.7.1 Significato dello jacobiano . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
7.8 Area di un dominio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
7.9 Cenni su integrali tripli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
7.10 Integrali curvilinei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.11 Integrali di superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.11.1Area di una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
7.11.2Integrale di una superficie . . . . . . . . . . . . . . . . . . . . . . . . . . . 111
7.12 Solidi e superfici di rotazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113
iv
Indice
Bibliografia 151
v
C APITOLO 1
Brevi richiami di analisi 1
1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Identità trigonometriche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Regole su funzione esponenziale e logaritmica . . . . . . . . . . . . . . . . . . . . . 2
1.4 Derivate e integrali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.5 Altri teoremi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1 Introduzione
Quando si descrivono teoremi, si danno definizioni o, semplicemente, si discute di
matematica, è abbastanza usuale prendere in prestito lettere dell’alfabeto greco.
È importante, quindi, saperle riconoscere e chiamarle in maniera corretta:
A α Alfa N ν Nu
B β Beta Ξ ξ Xi
Γ γ Gamma O o Omicron
∆ δ Delta Π π Pi
E Epsilon P ρ Rho
Z ζ Zeta Σ σ Sigma
H η Eta T τ Tau
Θ θ Theta Υ υ Upsilon
I ι Iota Φ φ Fi
K κ Kappa X χ Chi
Λ λ Lambda Ψ ψ Psi
M µ Mu Ω ω Omega
1
1. B REVI RICHIAMI DI ANALISI 1
1x = 1
ax+y = ax ay axy = (ax )y
aloga (x) = x a0 = 1
ax−y = ax /ay ax bx = (ab)x
loga (xy) = loga (x) + loga (y) loga (x/y) = loga (x) − loga (y)
loga (xy ) = y loga (x) loga (ax ) = x
loga (x)
logb (x) = bx = ax loga (b)
loga (b)
d (cf )
= cf 0 regola della costante
dx
d (f + g) df dg
= + regola della somma
dx dx dx
d (f /g) f 0 g − f g0
= regola del quoziente
dx g2
d (f g)
= f g0 + f 0 g regola del prodotto
d rx
df
= rf r−1 f 0 regola della potenza
dx
Tra le regole di integrazione, invece, ricordiamo quella di integrazione per parti:
Z Z
f g dx = f g − f 0 g dx
0
Diamo ora una tabella delle derivate e degli integrali delle funzioni più note (per gli inte-
grali lasciamo fuori la costante di integrazione), e con la simbologia arcsin(x) ≡ arcoseno(x),
arccos(x) ≡ arcocoseno(x), cot(x) ≡ cotangente (x), arctan(x) ≡ arcotangente(x), arccot(x) ≡,
arcocotangente(x).
2
1.5. Altri teoremi
f f0 f f0
1
ln(x) ex ex
x
sin (x) cos (x) cos (x) − sin (x)
1 1
tan (x) (= sec2 (x)) cot (x) − 2
cos2 (x) sin (x)
1 1 1 1
tan (x) − cot (x)
cos (x) cos (x) sin (x) sin (x)
1 1
arcsin (x) √ arccos (x) −√
1 − x2 1 − x2
1 1
arctan (x) arccot(x) −
1 + x2 1 + x2
R R
f fd x f fd x
xr+1
xr (r 6= 1) x−1 ln |x|
r+1
ex ex ln |x| x ln |x| − x
sin (x) − cos (x) cos (x) sin (x)
1
tan (x) ln | | cot (x) ln | sin (x)|
cos (x)
1 1 1 1
ln | + tan (x)| ln | + cot (x)|
cos (x) cos (x) sin (x) sin (x)
1 1
tan (x) − cot (x)
cos2 (x) sin2 (x)
3
1. B REVI RICHIAMI DI ANALISI 1
Quindi per funzioni continue, un valore compreso tra i due estremi dell’insieme di
definizione, è un valore assunto dalla funzione stessa (in uno o più punti).
Come conseguenza di questo teorema, se f (a)f (b) < 0 (la funzione assume segno opposto
agli estremi dell’intervallo [a, b]) allora esiste almeno un punto ξ tale che f (ξ) = 0, cioè esiste
almeno una radice dell’equazione f (x) = 0 nell’intervallo [a, b].
Teorema 1.5.4 (Esistenza del punto fisso) Data una funzione g definita in [a, b], continua e
tale che a ≤ g(x) ≤ b per ogni x ∈ [a, b], allora g ammette almeno un punto fisso.
Dimostrazione. Dire che una funzione g ammette almeno un punto fisso, vuol dire che
esiste almeno un punto ξ nel suo insieme di definizione, tale che g(ξ) = ξ.
Dalle ipotesi del teorema, i valori della funzione g sono contenuti nell’intervallo [a, b] e, in
particolare a ≤ g(a) ≤ b e a ≤ g(b) ≤ b. Definiamo, perciò, la funzione continua Φ(x) mediante
la relazione
Φ(x) = g(x) − x
Allora Φ(a) = g(a) − a > 0 e Φ(b) = g(b) − b < 0. Per il Teorema del Valore Intermedio esiste
almeno un punto ξ ∈]a, b[ tale che Φ(ξ) = 0, vale a dire g(ξ) − ξ = 0, cioè g(ξ) = ξ. Esiste
almeno un punto fisso per la funzione g. 4
4
1.5. Altri teoremi
Teorema 1.5.5 (Esistenza e unicità del punto fisso) Data una funzione g di classe C 1 in
[a, b], con a ≤ g(x) ≤ b per ogni x ∈ [a, b], e con |g 0 (x)| ≤ m < 1 per ogni x ∈ [a, b] allora esiste ed è
unico il punto fisso della g in tale intervallo.
Dimostrazione. L’esistenza di almeno un punto fisso è assicurata dal teorema prece-
dente (le ipotesi del teorema precedente ci sono tutte). Supponiamo, allora, che esistano due
punti fissi ξ e η, con ξ 6= η, per la funzione g. Si ha
|ξ − η| = |g(ξ) − g(η)|
Applicando il teorema del Valor Medio, esiste un punto c compreso tra ξ e η per cui
|g(ξ) − g(η)| = |g 0 (c)(ξ − η)| ≤ |g 0 (c)||ξ − η|
Ma per ipotesi |g 0 (c)| ≤ m < 1 da cui
|ξ − η| ≤ m|ξ − η| < |ξ − η|
Si arriva ad una contraddizione. L’assurdo deriva dall’aver supposto ξ 6= η. Quindi ξ = η e il
punto fisso è unico. 4
Teorema 1.5.6 (del Valor Medio del Calcolo Integrale) Se f ∈ C([a, b]) e g è integrabile in
[a, b] e g(x) non cambia segno in [a, b], allora esiste un punto ξ ∈]a, b[ tale che
Z b Z b
f (x)g(x) d x = f (ξ) g(x) d x
a a
Per g ≡ 1, questo teorema ci dà il valore medio della funzione f sull’intervallo [a, b], dato
1 Rb
da f (ξ) = f (x) d x
b−a a
Teorema 1.5.7 (di Rolle generalizzato) Sia f ∈ C([a, b]) n volte differenziabile in ]a, b[. Se f
si annulla in n + 1 punti distinti x0 , x1 , . . . , xn in ]a, b[, allora esiste un punto ξ ∈]a, b[ in cui la
derivata n-sima della f si annulla: f (n) (ξ) = 0.
differenze finite. L’importanza del suo lavoro e, soprattutto, della formula conosciuta oggi con il suo nome, venne
riconosciuta solo nel 1772 da Lagrange.
5
C APITOLO 2
Funzioni reali di più variabili
Augustus De Morgan
(1806-1871)
2.1 Lo spazio Rn . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 Definizioni preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2.1 Come determinare il dominio di una funzione di due variabili? . . . . . . . 9
2.2.2 Sui vettori . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.2.3 Intorno di un punto, insieme aperto, chiuso, frontiera... . . . . . . . . . . . 13
2.1 Lo spazio Rn
Dallo studio di funzioni reali di variabili reali f : R −→ R che alla variabile x ∈ R associa
il valore f (x) ∈ R, passiamo a studiare funzioni reali di più variabili: non c’è più una sola
variabile x come variabile di input della nostra funzione, ma possiamo avere due o più
variabili di input mentre il valore che assume la funzione rimane un valore reale (detto
anche scalare).
Se (x, y) è la coppia di variabili, ciascuna delle quali varia in R, possiamo definire una
funzione f che alla coppia (x, y) associa il valore f (x, y).
Analogamente, data la terna di variabili reali (x, y, z), si può definire una funzione f che,
in corrispondenza di (x, y, z), assume il valore reale f (x, y, z),
Il discorso si può generalizzare con una n−nupla di valori (x1 , x2 , . . . , xn ) introducendo
una funzione f che, per ogni n−nupla (x1 , x2 , . . . , xn ) associa il valore reale f (x1 , x2 , . . . , xn ).
Introduciamo, dunque, lo spazio Rn , dove n è un intero naturale, per definire lo spazio a
n dimensioni.
Un punto P ∈ Rn è definito da una n−nupla ordinata di numeri reali (x1 , x2 , . . . , xn ).
Ciascun valore xi , i = 1, 2, . . . , n, prende il nome di coordinata i−sima del punto P . Data
una funzione f definita in Rn , possiamo scrivere f (x1 , x2 , . . . , xn ) o f (P ) per dire che stiamo
valutando la funzione nel punto P .
G Per n = 1 si ha lo spazio reale R. I punti che vi appartengono prendono anche il nome
di scalari.
G Per n = 2 si ha lo spazio R e il generico punto è indicato mediante la coppia (x, y) (x
2
7
2. F UNZIONI REALI DI PIÙ VARIABILI
G Per n = 3 si ha lo spazio R 3
e il generico punto è indicato mediante la coppia (x, y, z),
rispettivamente ascissa, ordinata e quota del punto.
Esempi di funzioni di più variabili in R2 sono:
Gf1 (x, y) = x + y
Gf2 (x, y) = |x| + |y|
Gf3 (x, y) = (x + y) cos (x + y)
Di queste funzioni è possibile fare il grafico: così come una funzione reale di una variabile
reale genera una curva nello spazio R2 una funzione reale di due variabili reali genera una
superficie nello spazio R3 .
Per il grafico di funzioni reali di tre o più variabili reali il discorso si complica perchè
va fatto in uno spazio che ha una dimensione in più rispetto a quello di partenza (che non
riusciamo quindi a visualizzare). In tal caso il grafico genera un’ipersuperficie. Esempi di
funzioni reali in R3 sono:
Gf1 (x, y, z) = x3 + xyz + y 2 + z
Gf2 (x, y, z) = sin (xyz)
Gf3 (x, y, z) = ex+y+z
Definizione 2.2.1 Si definisce funzione di n variabili reali una legge che assegna un unico
numero reale f (x1 , x2 , . . . , xn ) ∈ R a ciascun punto (x1 , x2 , . . . , xn ) contenuto in un sottoinsieme
D(f ) di Rn . L’insieme dei punti D(f ) prende il nome di insieme di definizione o dominio della
funzione f . L’insieme di tutti i numeri reali f (x1 , x2 , . . . , xn ) al variare dei punti nel dominio
prende il nome di insieme dei valori o codominio della f (o range, per usare il termine matema-
tico inglese) e si denota con R(f ) oppure con f (A) se il dominio della funzione è stato indicato
con l’insieme A.
Per indicare una funzione f si possono usare le seguenti scritture:
f : A −→ B dove A ⊂ Rn , B ⊂ R, f (A) ⊂ B
Per funzioni di una variabile reale, è usuale indicare la funzione con la notazione y = f (x),
dal momento che il valore della funzione viene rappresentato sull’asse delle y nel piano
8
2.2. Definizioni preliminari
Figura 2.2: Rappresentazione grafica di una generica funzione di due variabili reali f (x, y).
cartesiano xy. Alla stessa maniera, è usuale indicare funzioni reali di due variabili reali
mediante la notazione z = f (x, y), visto che il valore di questa funzione viene rappresentato
sull’asse delle z. Per quanto riguarda il grafico di una funzione f in R2 , si può dare la
seguente definizione:
Definizione 2.2.2 Data una funzione f : D(f ) −→ R(f ) in R2 , il grafico ad essa associato è
dato dall’insieme
n o
G(f ) = (x, y, z) ∈ R3 : (x, y) ∈ D(f ), z = f (x, y)
In Figura 2.2 è rappresentato il grafico di una generica funzione di due variabili reali, nello
spazio R2 . I valori della funzione sono rappresentati sull’asse delle z, dove in rosso è rappre-
sentato l’insieme dei valori della funzione R(f ), mentre sul piano xy, in blu, è rappresentato
l’insieme di definizione D(f ). Generalmente, il dominio di una funzione di due variabili può
essere o l’intero spazio R2 o un suo sottoinsieme (come nella Figura 2.2).
A volte, il dominio di una funzione non è specificato. Come capire qual è l’insieme dei
punti per i quali la funzione f esiste? Ci soffermiamo sul caso di una funzione definita in
R2 .
9
2. F UNZIONI REALI DI PIÙ VARIABILI
x y
Figura 2.3: Grafico della funzione z = f (x, y) = 5 1 − − .
4 8
Esempio
Es. 2.2.1 Sia data la funzione z = f (x, y) = x3 + x2 y. Questa funzione è ben definita per
tutti i valori di x e y perchè qualunque sia la coppia (x, y), la funzione assume sempre
valori reali. Quindi f è definita in tutto R2 .
Esempio
x y
Es. 2.2.2 Sia ora z = f (x, y) = 5 1 − − per 0 ≤ x ≤ 2 e per 0 ≤ y ≤ 8 − 4x.
4 8
In tal caso la funzione è assegnata su uno specifico dominio, quindi, anche se la funzione
è ben definita per tutti i valori di x e di y, il dominio in cui va studiata, in questo esempio,
è quello dato, vale a dire per x ∈ [0, 2], e per y che varia nell’intervallo [0, 8] quando x = 0,
mentre y = 0 quando x = 2. Ciò significa che l’insieme di definizione è dato dal triangolo
di estremi (0, 0), (0, 8) e (2, 0) (si veda Figura 2.3).
Esempio
p
Es. 2.2.3 Vediamo ora la funzione z = f (x, y) = 16 − x2 − y 2 .
Questa funzione è ben definita solo quando l’espressione sotto radice è non negativa.
Perciò il suo dominio è dato dai punti (x,y) che soddisfano la condizione
16 − x2 − y 2 ≥ 0 ⇐⇒ x2 + y 2 ≤ 16
10
2.2. Definizioni preliminari
Esempio
10
Es. 2.2.4 Sia z = f (x, y) = . In tal caso, il dominio non è specificato ma ci accor-
x−y
giamo subito che la funzione, per essere definita, deve avere il denominatore diverso da
zero. Quindi la funzione non è definita per x = y. Il dominio della f è dunque tutto il
piano xy privato della retta x = y.
Per poter andare avanti nello studio delle funzioni, dobbiamo riprendere o generalizzare
altri concetti di base. Incominciamo dai vettori.
Pn 2
(con il simbolo i=1 (xi ) indichiamo la somma (x1 )2 + (x2 )2 + . . . (xn )2 ).
Definizione 2.2.5 Dati due vettori ~x e ~y in Rn si definisce distanza tra i due vettori la quantità
|~x − ~y |.
Geometricamente, la distanza tra due vettori non è altro che la distanza euclidea tra due
punti.
Esempio
Es. 2.2.5 Siano dati i due vettori p~ = (7, 1) e ~q = (3, 4). La distanza tra i due vettori è
data da
p √ √
p − ~q| = (7 − 3)2 + (1 − 4)2 = 16 + 9 = 25 = 5
|~
Se vediamo i due vettori come i punti del piano P e Q che hanno coordinate rispettiva-
mente (7, 1) e (3, 4) e vogliamo calcolare la distanza tra i due punti, dobbiamo applicare
esattamente la stessa formula (si veda Figura 2.4).
Quindi due punti nello spazio Rn possono essere visti come vettori e viceversa. Di con-
seguenza, in R2 o R3 , quella che per noi è la distanza tra due punti P e Q, e che ricaviamo
applicando il teorema di Pitagora, può essere vista come la distanza tra i due vettori.
Presi due punti P e Q in Rn possiamo fare P + Q o P − Q considerandoli come vettori e
quindi sommando o facendo la differenza delle componenti omonime dei punti-vettori. Tutte
le operazioni che possiamo fare tra vettori si ripetono tra punti.
11
2. F UNZIONI REALI DI PIÙ VARIABILI
Figura 2.4: Distanza tra due vettori p~ e ~q o distanza tra due punti P e Q.
Figura 2.5: A sinistra: somma e differenza tra punti in R2 . A destra: prodotto di uno scalare
per un punto. I vettori αQ, βQ, γQ e δQ sono messi sfalsati per ragioni pratiche di visibilità
ma sono sulla stessa linea.
Esempio
Es. 2.2.6 Siano dati i due punti di Rn , P (p1 , p2 , . . . , pn ) e Q(q1 , q2 , . . . , qn ) (usiamo questa
notazione per rappresentare il punto P (o Q) di coordinate (p1 , p2 , . . . , pn ) (o (q1 , q2 , . . . , qn )).
Allora il punto P + Q ha componenti (p1 + q1 , p2 + q2 , . . . , pn + qn ), mentre il punto P − Q è
dato da (p1 − q1 , p2 − q2 , . . . , pn − qn ).
Dato uno scalare α, il punto αP è dato da (αp1 , αp2 , . . . , αpn ).
Si veda Figura 2.5 per vedere l’interpretazione geometrica lavorando tra vettori.
Definizione 2.2.6 Dati due vettori ~x e ~y , si definisce prodotto scalare tra i due vettori il numero
reale indicato con il simbolo ~x · ~y dato da
n
X
~x · ~y = xi yi
i=1
12
2.2. Definizioni preliminari
Definizione 2.2.9 Dato x0 ∈ R e > 0, l’insieme dei punti x sull’asse reale che hanno distanza
da x0 minore di è un intervallo aperto di centro x0 e raggio che prende il nome di intorno di
13
2. F UNZIONI REALI DI PIÙ VARIABILI
A (x0 ) = {x ∈ R : |x − x0 | < }
Definizione 2.2.10 Dato P0 ∈ Rn e > 0, l’insieme dei punti P di Rn che hanno distanza da
P0 minore di prende il nome di intorno circolare di centro P0 e raggio .
Indichiamo con A (P0 ) questo insieme, possiamo dire che
A (P0 ) = {P ∈ Rn : |P − P0 | < }
(x − x0 )2 + (y − y0 )2 = 2
(x − x0 )2 + (y − y0 )2 + (−z0 )2 = 2
14
2.2. Definizioni preliminari
C (P0 ) = {P ∈ Rn : |P − P0 | ≤ }
15
C APITOLO 3
Limiti, continuità, differenziabilità di funzioni
di più variabili
se tutti i punti di un qualunque intorno di (x0 , y0 ) (senza considerare il punto (x0 , y0 )) ap-
partengono al dominio della funzione e se f (x, y) tende a L quando (x, y) tende a (x0 , y0 ). Più
vicino è il punto (x, y) a (x0 , y0 ), più il valore della funzione tende al valore del limite.
Formalmente, la definizione è la seguente.
Definizione 3.1.1 Siano dati una funzione f : I −→ R, con I ⊂ R2 , il punto P0 (x0 , y0 ), punto di
accumulazione per I, e L ∈ R, allora diciamo che
lim f (x, y) = L
(x,y)→(x0 ,y0 )
17
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI
se:
G ciascun intorno di P contiene punti del dominio di definizione della f (unica eccezione
0
può essere data dal punto P )
G e solo se, per ogni numero > 0, esiste un altro numero δ > 0 tale che
0
se
p
se 0 < (x − x0 )2 + (y − y0 )2 < δ allora |f (x, y) − L| <
lim f (P ) = L
P →P0
se:
G ciascun intorno di P contiene punti del dominio di definizione della f (unica eccezione
0
può essere data dal punto P )
G se e solo se, per ogni numero > 0, esiste un altro numero δ > 0 tale che
0
Il limite di una funzione può valere anche ±∞ e si può anche parlare di limite per P che
tende a infinito.
G lim P →P0 f (P ) = −∞ se per ogni valore M > 0, esiste δ > 0 tale che
Alcune regole sui limiti che già conosciamo dalle funzioni scalari si estendono facilmente
ai limiti di funzioni di più variabili. Ad esempio, date due funzioni f e g, se limP →P0 f (P ) = L
e limP →P0 g(P ) = M con L, M ∈ R, si ha
G limP →P0 f (P ) ± limP →P0 g(P ) = L ± M
G limP →P0 f (P )g(P ) = LM
G limP →P0
f (P )
g(P )
=
L
M
(questo si ha se M 6= 0).
Anche per funzioni di più variabili vale il teorema del confronto (noto anche come teorema
dei carabinieri in italiano o squeeze theorem in inglese)
18
3.1. Limite di una funzione di più variabili
Figura 3.1: Percorsi che possono essere fatti da (x, y) per tendere a (x0 , y0 ).
Teorema 3.1.1 Se f (x, y) ≤ g(x, y) ≤ h(x, y) per (x, y) in un intorno di (x0 , y0 ) e se vale
allora anche
lim g(x, y) = L.
(x,y)→(x0 ,y0 )
19
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI
Esempio
Es. 3.1.1 Consideriamo i seguenti limiti:
lim 3x − y 2 =?
(x,y)→(2,2)
lim xy 2 + x2 y =?
(x,y)→(3,4)
In tutti questi esempi il limite esiste e coincide con il valore della funzione nel punto di
limite:
lim 3x − y 2 = 6 − 4 = 2
(x,y)→(2,2)
lim xy 2 + x2 y = 48 + 36 = 84
(x,y)→(3,4)
Per la prima funzione il risultato è banale perchè la funzione la possiamo vedere come
somma di due funzioni scalari per le quali sappiamo calcolare facilmente il limite. La
seconda funzione è data dalla somma di due funzioni, ciascuna delle quali può essere
vista come il prodotto di una funzione nella sola variabile x e di una funzione nella sola
variabile y. Quindi calcoliamo il limite di queste funzioni, applichiamo la regola sul limite
di prodotto di funzioni e otteniamo il risultato.
Esempio
3xy
Es. 3.1.2 Consideriamo ora lim(x,y)→(0,0) .
x2 + y 2
Questo limite non esiste perchè si trovano facilmente due strade diverse per fare tendere
il punto (x, y) a (0, 0) attraverso le quali otteniamo due valori diversi del limite.
Prendiamo il punto (x, y) sulla retta y = kx con k numero reale arbritrario, diverso da
zero. Facciamo tendere dunque (x, kx) al punto (0, 0). Il limite diventa
3xkx 3kx2 2k
lim 2 2
= lim 2 2 2
=
(x,kx)→(0,0) x + (kx) (x,kx)→(0,0) x + k x 1 + k2
Questo valore del limite, che abbiamo ottenuto facilmente in quanto la funzione si è ridotta
a funzione della sola variabile x, dipende da k, e quindi cambia al cambiare di k. Ciò
significa che la funzione non può avere limite per (x, y) → 0.
Osserviamo che la funzione data è un esempio di funzione che non è definita nel punto
(0, 0) in quanto f (0, 0) = 0/0 è una forma indeterminata.
Esempio
8xy 2
Es. 3.1.3 Studiamo ora lim(x,y)→(0,0) .
x2
+ y4
Anche questa funzione è indeterminata in (0, 0).
Proviamo a calcolare il limite sulle rette y = kx con k ∈ R, k 6= 0. Otteniamo
8k 2 x3 8k 2 x
lim = lim =0
(x,kx)→(0,0) x2 +k x 4 4 x→0 1 + k 2 x2
Questo limite non dipende dunque dalla retta, in quanto non dipende da k.
20
3.2. Continuità di una funzione di più variabili
Ci verrebbe da concludere che allora il limite esiste e vale 0. Ma la risposta non sarebbe
corretta perchè con le rette non abbiamo esaurito tutti i percorsi che può fare il punto
per avvicinarsi a (0, 0).
Proviamo ad avvicinarci a (0, 0) lungo la parabola x = ky 2 In tal caso abbiamo
8ky 4 8k
lim 2 4 4
= 2
(ky 2 ,y)→(0,0) k y + y k +1
In questo caso, il limite dipende dalla curva x = ky 2 e il valore non è più 0 ma cambia
al cambiare di k. Quindi il limite non esiste.
Esempio
Es. 3.1.4 Proviamo invece che
4x2 y
lim =0
(x,y)→(0,0) x2 + y 2
In tal caso, non conviene scegliere particolari curve per mostrare che il limite vale 0 perchè
dovremmo dimostrare che qualunque sia il cammino per avvicinarsi a (0, 0) il limite è
sempre quello e, quindi, dovremmo lavorare su infiniti percorsi! In tal caso, dobbiamo
applicare la definizione di limite.
x2 p
Ora, poichè x2 ≤ x2 +y 2 si ha 2 2
≤ 1, mentre da y 2 ≤ x2 +y 2 , ricaviamo |y| ≤ x2 + y 2 .
x +y
Possiamo dunque dire che
4x2 y 4x2 y p
| − 0| = | 2 | ≤ |4y| ≤ 4 x2 + y 2
x2+y 2 x +y 2
Dalla definizione di limite, preso > 0, dobbiamo provare che esiste δ > 0 tale che per
p 4x2 y
0 < x2 + y 2 < δ, risulta | 2 − 0| < .
x + y2
Se scegliamo δ = /4, abbiamo:
4x2 y p
| 2 2
− 0| ≤ 4 x2 + y 2 < 4 =
x +y 4
4x2 y
Quindi abbiamo provato che | − 0| < , cioè il limite della nostra funzione per
x2 + y 2
(x, y) → (0, 0) vale esattamente 0.
21
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI
Definizione 3.2.3 Una funzione si dice continua se è continua in ogni punto del suo insieme
di definizione.
Esempio
Es. 3.2.1 lim(x,y)→(x0 ,y0 ) x sin (xy) = x0 sin (x0 y0 )
La funzione f (x, y) = x sin (xy) è una funzione continua. Infatti la possiamo vedere come il
prodotto della funzione x e della funzione sin (xy). La funzione sin (xy) la vediamo come la
funzione composta della funzione seno applicata al prodotto delle funzioni x e y. Poichè
x e y sono funzioni continue anche il loro prodotto è una funzione continua. La funzione
composta di funzioni continue è continua (quindi sin (xy) è continua) e il prodotto di x per
sin (xy) dà ancora una funzione continua.
Osserviamo che il concetto di continuità non è ovvio! Ci sono funzioni che ammettono
limite per (x, y) che tende a (x0 , y0 ) ma il valore del limite non necessariamente è uguale al
valore della funzione in (x0 , y0 ).
Esempio
Es. 3.2.2 La funzione definita come
(
0 se (x, y) 6= (0, 0)
f (x, y) =
1 se (x, y) = (0, 0)
ammette limite per (x, y) → (0, 0) ma il limite non è il valore della funzione in (0, 0). Questa
funzione non è continua in (0, 0). Difatti lim(x,y)→(0,0) f (x, y) = 0 6= f (0, 0) dal momento che
la funzione è di costante valore 0 ad eccezione del punto (0, 0) in cui vale 1. Questa
funzione è discontinua in (0, 0).
Esempio
Es. 3.3.1 Sia data f (x, y) = 4x3 y 5 . Determiniamo la velocità con cui la funzione cambia
in un punto fissato (x0 , y0 ), se non facciamo variare la y mentre facciamo variare la x,
e viceversa, determiniamo la velocità con cui cambia la funzione in (x0 , y0 ) fissando x e
variando y.
22
3.3. Derivate parziali
Nel primo caso, in cui lasciamo y fissato mentre x varia, dal momento che siamo inte-
ressati alla velocità della funzione nel punto (x0 , y0 ), per y fissato, vuol dire che dobbia-
mo considerare la funzione per y = y0 . Consideriamo quindi f (x, y0 ) = 4x3 (y0 )5 . Adesso
abbiamo una funzione di una sola variabile, la x. Possiamo quindi considerare la fun-
zione g(x) = f (x, y0 ) = 4x3 (y0 )5 . Di questa funzione in una sola variabile, sappiamo
cosa dobbiamo fare se vogliamo determinare la velocità di cambiamento della funzio-
ne per x = x0 : dobbiamo calcolare la derivata prima g 0 (x0 ). Nell’esempio, abbiamo
g 0 (x0 ) = 12(x0 )2 (y0 )5 .
Quello che abbiamo ottenuto prende il nome di derivata parziale di f (x, y) rispetto a x,
nel punto (x0 , y0 ). Denotiamo questa derivata parziale con uno dei seguenti simboli:
∂f
fx (x0 , y0 ) (x0 , y0 ) Dx f (x0 , y0 )
∂x
Al posto di (x0 , y0 ) si può scrivere anche P0 intendendo per P0 il punto di coordinate
(x0 , y0 ).
Quindi, nel nostro esempio, fx (x0 , y0 ) = 12(x0 )2 (y0 )5 .
Vediamo ora cosa succede se lasciamo fissa la variabile x e variamo y. In tal caso,
dobbiamo considerare la funzione h(y) = f (x0 , y) = 4(x0 )3 y 5 e calcolare la derivata prima
di questa funzione che dipende dalla sola variabile y nel punto y0 . Abbiamo h0 (y0 ) =
20(x0 )3 (y0 )4 .
Ciò che abbiamo ottenuto è la derivata parziale della f rispetto alla variabile y, nel
punto (x0 , y0 ). Indichiamo questa derivata parziale con uno dei seguenti simboli:
∂f
fy (x0 , y0 ) (x0 , y0 ) Dy f (x0 , y0 )
∂y
Definizione 3.3.1 Data una funzione f (x, y), le derivate parziali prime rispetto alle variabili x
e y sono date da:
∂f f (x + h, y) − f (x, y)
(x, y) = lim
∂x h→0 h
∂f f (x, y + h) − f (x, y)
(x, y) = lim
∂y h→0 h
23
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI
Esempio
√
Es. 3.3.2 Calcolare le derivate parziali prime della funzione f (x, y) = 3x5 + 2 y − 10xy.
Per calcolare la derivata fx (x, y) trattiamo la y come una costante, da cui fx (x, y) = 15x4 −
√
10y. Notiamo che la derivata rispetto a x di 2 y vale zero perchè la y è una costante.
Al contrario, per calcolare fy (x, y) dobbiamo ora trattare x come una costante, da cui
1
fy (x, y) = √ − 10x.
y
∂2f
∂ ∂f
(fx )x = fxx = =
∂x ∂x ∂x2
∂2f
∂ ∂f
(fx )y = fxy = =
∂y ∂x ∂y∂x
24
3.6. Differenziabilità di una funzione
∂2f
∂ ∂f
(fy )x = fyx = =
∂x ∂y ∂x∂y
∂2f
∂ ∂f
(fy )y = fyy = =
∂y ∂y ∂y 2
Le derivate fxy e fyx sono dette anche derivate parziali miste perchè le derivate sono fatte
rispetto a più di una variabile.
Osserviamo che, dal punto di vista della notazione usata, quando l’indice della derivata
parziale è posta in basso della funzione, per esempio fxy , dobbiamo derivare da sinistra verso
destra: in questo caso prima facciamo la derivata rispetto a x e poi rispetto a y. Quando
∂2f
invece usiamo la notazione frazionale ( ) la notazione è opposta: si va da destra verso
∂y∂x
sinistra. Nell’esempio, il risultato è lo stesso, prima si deriva rispetto a x e poi rispetto a y.
Esempio
Es. 3.5.1 Calcolare le derivate seconde di f (x, y) = sin (xy) − x3 e4y + 4y 2 .
Prima di tutto calcoliamo le derivate parziali prime:
Nell’esempio appena visto, le derivate parziali miste sono coincidenti. Si tratta di una
“coincidenza” o no? In realtà la funzione data gode di una proprietà importante che ci
permette di avere questo risultato.
Teorema 3.5.1 (di Clairaut-Schwarz) Data la funzione f definita in un insieme aperto A che
contiene il punto (x0 , y0 ), se le funzioni fxy e fyx sono continue in A, allora
25
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI
26
3.7. Differenziale
Dividendo per y − y0 si ha
f (x0 , y) − f (x0 , y0 ) |y − y0 |
=µ+ σ(x0 , y)
y − y0 y − y0
|y − y0 |
Passando al limite per y → y0 si ha che σ(x0 , y) → 0 e quindi
y − y0
f (x0 , y) − f (x0 , y0 )
lim =µ
y→y0 y − y0
4
Come conseguenza, una funzione differenziabile in P0 è continua in P0 .
Per (x, y) → (x0 , y0 ) il secondo membro della relazione appena scritta tende a zero, quindi
cioè
La f è continua in P0 . 4
3.7 Differenziale
Ricordiamo ora il concetto di differenziale di una funzione di una sola variabile.
df
Definizione 3.7.1 Data una funzione f (x) e assumendo che la derivata f 0 (x) = esiste in
dx
un punto x, il differenziale totale df della funzione è dato da
df
df = dx = f 0 (x)dx.
dx
La quantità df può essere interpretata come il cambiamento infinitesimale del valore della
funzione f (x) quando x cambia di una quantità infinitesima dx. Per esprimere questo da un
punto di vista formale, consideriamo l’incremento ∆f = f (x + ∆x) − f (x) che rappresenta
l’incremento sulla f quando x è incrementato di una quantità finita ∆x.
27
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI
df = f 0 (x)dx.
Definizione 3.7.2 Data f (x, y) funzione di due variabili, con derivate parziali prime continue,
si definisce differenziale totale della f
∂f ∂f
df = dx + dy = fx dx + fy dy.
∂x ∂y
Abbiamo suddiviso ∆f in due pezzi, il primo contenente una variazione solo in x e l’altro
contenente una variazione solo in y. Applicando il teorema del valor medio come prima,
otteniamo
28
3.8. Derivata direzionale
può scrivere come P = P0 + h~v con h scalare. Ciò significa che le coordinate del punto P si
possono scrivere come
x = x0 + hα1 y = y0 + hα2
La variazione della f tra il punto P e il punto P0 è data da f (x0 + hα1 , y0 + hα2 ) − f (x0 , y0 ).
Definizione 3.8.2 Data una funzione f che ammette derivate parziali in P0 , il vettore indicato
~ (P0 ) o grad f (P0 ) prende il nome di gradiente della funzione in P0 e ha come
con il simbolo ∇f
componenti le derivate parziali prime della f in P0 :
~ (P0 ) = (fx (P0 ), fy (P0 )).
∇f
Dividiamo
p ambo i membri p per h, ricordando anche che, poichè il vettore è unitario, si ha
h2 (α1 )2 + h2 (α2 )2 = |h| (α1 )2 + (α2 )2 = |h|. Quindi si ottiene:
Esempio
dz
Es. 3.9.1 Sia z = f (x, y) = x3 y + 3xy 2 con x = sin (2t) e y = cos (t). Calcoliamo
dt
∂f ∂f dx
applicando la formula. Poichè = 3x2 y + 3y 2 , = x3 + 6xy, = 2 cos (2t) e
∂x ∂y dt
dy
= − sin (t), ricaviamo:
dt
dz
= (3x2 y + 3y 2 )2 cos (2t) + (x3 + 6xy)(− sin (t))
dt
A questo punto abbiamo calcolato la derivata. Per completare, dobbiamo scrivere x
e y in funzione di t:
dz
= (3 sin2 (2t) cos (t) + 3 cos2 (t))2 cos (2t) + (sin3 (2t) + 6 sin (2t) cos (t)(− sin (t))
dt
e sistemando meglio i termini a destra ricaviamo
dz
= 6(sin2 (2t) cos (2t) cos (t)+cos2 (t) cos (2t))−(sin2 (2t) sin (t)+6 sin (2t) sin (t) cos (t)).
dt
G Secondo caso: : z = f (x, y) con x = g(s, t) e y = h(s, t). Le funzioni f , g e h siano
differenziabili. In questo caso possiamo calcolare le derivate parziali della f rispetto a s
e t. Otteniamo
∂z ∂f ∂x ∂f ∂y ∂z ∂f ∂x ∂f ∂y
= + = +
∂s ∂x ∂s ∂y ∂s ∂t ∂x ∂t ∂y ∂t
30
3.10. Piano tangente ad una superficie
Esempio
Es. 3.9.2 Sia z = f (x, y) = e2x sin (y) con x = st e y = s2 t.
In tal caso, applicando la formula abbiamo:
∂z
= 2e2x sin (y)t + e2x cos (y)(2s) = 2e2st (t sin (s2 t) + s cos (s2 t))
∂s
∂z
= 2e2x sin (y)s + e2x cos (y)s2 = se2st (2 sin (s2 t) + s cos (s2 t))
∂t
31
3. L IMITI , CONTINUITÀ , DIFFERENZIABILITÀ DI FUNZIONI DI PIÙ VARIABILI
(x − x0 )2 00
f (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + f (ξx )
2
dove ξx è un punto che si trova nell’insieme di definizione della f ed è compreso tra x e x0 .
La formula appena scritta prende il nome di formula di Taylor di centro x0 e permette di
approssimare la funzione f (x) in un intorno di x0 utlizzando i valori della funzione in x0 . Il
polinomio T1 (x) = f (x0 ) + f 0 (x0 )(x − x0 ) è il polinomio di Taylor di primo grado. In questo caso
rappresenta la retta tangente alla funzione f nel punto x0 . Se noi approssiamo f (x) mediante
(x − x0 )2 00
il polinomio di Taylor di primo grado, commettiamo un errore dato da R1 (x) = f (ξx ),
2
che possiamo maggiorare, in valore assoluto, considerando M = max |f 00 (x)| per x che varia
(x − x0 )2 00 (x − x0 )2
nell’insieme di definizione della f , ottenendo | f (ξx )| ≤ |M |, un errore del
2 2
secondo ordine.
In generale, il polinomio di Taylor di grado n è dato da
Teorema 3.11.1 Consideriamo una funzione f (x, y) di classe C 2 . Allora per ogni punto P0
nell’insieme di definizione della f , vale la formula di Taylor data da
32
3.11. Formula di Taylor
33
C APITOLO 4
Massimi e minimi
35
4. M ASSIMI E MINIMI
Dobbiamo poi moltiplicare il vettore riga (x, y) per il vettore colonna appena ottenuto (facendo
un prodotto scalare tra vettori) ricavando:
a11 x + a12 y
x y = x(a11 x + a12 y) + y(a21 x + a22 y) = a11 x2 + a12 xy + a21 xy + a22 y 2
a21 x + a22 y
Esempio
Es. 4.1.1 Sia F (x, y) = x2 + 10xy − 7y 2 . Possiamo scrivere questa forma quadratica in
forma matriciale ponendo A in forma non simmetrica:
1 2 x
F (x, y) = x y
8 −7 y
oppure possiamo scrivere A in forma simmetrica prendendo come valore per gli elementi
extra diagonali la semisomma dei corrispondenti elementi della matrice non simmetrica
1 5 x
F (x, y) = x y
5 −7 y
da cui
Nel caso dello spazio Rn si generalizza la definizione di forma quadratica nel modo
seguente.
36
4.1. Forme quadratiche
Se la matrice della forma quadratica non è simmetrica la si può rendere simmetrica come
abbiamo visto in R2 .
Torniamo ora a considerare forme quadratiche in R2 visto che lavoreremo soprattutto in
questo spazio.
b b2 b b2 c ac − b2 2
Osserviamo che x2 + 2 xy + 2 y 2 = (x + y)2 . Inoltre − 2 y 2 + y 2 = y .
a a a a a a2
Abbiamo dunque
ac − b2 2
b
F (x, y) = a (x + y)2 + y
a a2
La forma quadratica è dunque data dal prodotto di a per la somma di due termini: il termine
b ac − b2 2
(x + y)2 è il quadrato di un binomio ed è sempre positivo; il termine y può essere
a a2
2
positivo o negativo a seconda del segno di ac − b .
Se a > 0 e ac − b2 > 0 allora la forma quadratica è sempre maggiore di zero e quindi è
definita positiva.
Se a < 0 e ac − b2 > 0, la forma quadratica è definita negativa.
Se invece ac − b2 < 0 possiamo avere valori di (x, y) per cui la forma quadratica è positiva
e altri valori per cui la forma quadratica è negativa.
37
4. M ASSIMI E MINIMI
Supponiamo che la forma quadratica sia definita positiva: vuol dire che y 2 (at2 + 2bt + c) > 0
per ogni coppia (x, y) 6= (0, 0), quindi deve essere at2 + 2bt + c > 0 per ogni t: questo si ha con
a > 0 e con il discriminante dell’equazione di secondo grado in t negativo, cioè 4b2 − 4ac < 0,
vale a dire ac − b2 > 0.
Se invece la forma quadratica è definita negativa, vuol dire che at2 + 2bt + c < 0 per ogni
valore di t, quindi deve essere a < 0 e il discriminante negativo, quindi ancora ac − b2 > 0.
Se invece la forma quadratica è indefinita, possiamo avere sia valori positivi che valori
negativi, perciò il discriminante dell’equazione di secondo grado in t deve essere positivo,
cioè ac − b2 < 0.1 4
Nel caso di forme quadratiche in Rn , l’analogo teorema per vedere se una forma quadra-
tica è definita positiva, negativa o indefinita è dato dal teorema di Sylvester, che considera i
determinanti di tutti i minori principali delle matrice A che definisce la forma quadratica.
Teorema
Pn 4.1.2 (di Sylvester) Data una forma quadratica in Rn , F (x1 , x2 , . . . , xn ) =
i,j=1 aij xi xj , allora
G F è definita positiva se e solo se det(Ak ) > 0 per ogni k = 1, 2, . . . , n;
G F è definita negativa se e solo se (−1)k det(Ak ) > 0 per ogni k = 1, 2, . . . , n.
1 Per la seconda parte di questo teorema ci siamo rifatti alle note proprietà:
G ax2 + bx + c = 0
– se ∆ = b2 − 4ac < 0 ⇒ non esistono radici reali all’equazione;
−b
– se ∆ = 0 ⇒ le radici sono coincidenti x1 = x2 = ;
2a √
−b ± ∆
– se ∆ > 0 ⇒ esistono due radici reali e distinte date da .
2a
G ax2 + bx + c > 0, a > 0
– se ∆ = b2 − 4ac < 0 ⇒ l’insieme delle soluzioni che soddisfano la disequazione data è tutto R
– se ∆ = 0 ⇒ l’insieme delle soluzioni è tutto R privato della radice dell’equazione ax2 + bx + c = 0
– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori esterni all’intervallo delle due radici dell’equazione
di secondo grado.
G ax2 + bx + c < 0, a > 0
– se ∆ ≤ 0 ⇒ non ci sono soluzioni per questa disequazione;
– se ∆ > 0 ⇒ l’insieme delle soluzioni è dato dai valori interni all’intervallo delle due radici dell’equazione.
38
4.2. Massimi e minimi
Definizione 4.2.1 Sia data una funzione di due variabili f (x, y) definita in un sottoinsieme
I ⊂ R2 .
G Se esiste un punto P0 (x0 , y0 ) tale che per ogni P (x, y) ∈ I, risulta
f (x, y) ≤ f (x0 , y0 )
allora P0 si dice punto di massimo assoluto per la funzione f e il valore f (x0 , y0 ) si dice
massimo assoluto della funzione.
G Se esiste un punto P0 (x0 , y0 ) tale che per ogni P (x, y) ∈ I, P 6= P0 risulta
allora P0 si dice punto di massimo assoluto proprio per la funzione f e il valore f (x0 , y0 )
si dice massimo assoluto proprio della funzione.
Cambiando il segno alle diseguaglianze abbiamo la definizione di minimo assoluto e minimo
assoluto proprio.
G Se esiste un punto P0 (x0 , y0 ) tale che per ogni P (x, y) ∈ I, risulta
f (x, y) ≥ f (x0 , y0 )
allora P0 si dice punto di minimo assoluto per la funzione f e il valore f (x0 , y0 ) si dice
minimo assoluto della funzione.
G Se esiste un punto P0 (x0 , y0 ) tale che per ogni P (x, y) ∈ I, P 6= P0 risulta
allora P0 si dice punto di minimo assoluto proprio per la funzione f e il valore f (x0 , y0 ) si
dice minimo assoluto proprio della funzione.
Se queste definizioni valgono non in tutto l’insieme di definizione della funzione f ma local-
mente, in un intorno di P0 , allora si ottengono le definizioni di punto di massimo (o minimo)
relativo (o relativo proprio).
Definizione 4.2.2 Sia data una funzione di due variabili f (x, y) definita in un sottoinsieme
I ⊂ R2 .
G Se esiste un punto P0 (x0 , y0 ) e un intorno di centro P0 e opportuno raggio r tale che per
ogni P (x, y) ∈ Ar (P0 ), risulta
f (x, y) ≤ f (x0 , y0 )
allora P0 si dice punto di massimo relativo per la funzione f e il valore f (x0 , y0 ) si dice
massimo relativo della funzione.
G Se esiste un punto P0 (x0 , y0 ) e un intorno di centro P0 e opportuno raggio r tale che per
ogni P (x, y) ∈ Ar (P0 ), P 6= P0 , risulta
allora P0 si dice punto di massimo relativo proprio per la funzione f e il valore f (x0 , y0 ) si
dice massimo relativo della funzione.
39
4. M ASSIMI E MINIMI
Definizione 4.2.3 I valori massimo e minimo (assoluti o relativi) assunti dalla funzione si
chiamano anche estremi (assoluti e relativi) della funzione.
Un punto di estremo relativo interno all’insieme di definizione della funzione f si chiama
punto di estremo relativo interno.
~ )(P0 ) = (00).
∇(f
Non vale il viceversa, tuttavia se dobbiamo cercare i punti di massimo e minimo relativo
interni all’insieme di definizione di una funzione, dobbiamo analizzare quei punti che hanno
il gradiente nullo perchè tra questi ci saranno i punti di massimo e minimo relativi. Se
l’insieme di definizione della funzione è un insieme aperto, i punti di massimo e minimo
relativo sono tutti punti interni all’insieme di definizione.
Vale la seguente definizione.
Definizione 4.3.1 Data una funzione f ∈ C 2 (I), con I ⊂ R2 , I aperto, e dato un punto P0 ∈ I,
si definisce hessiano della f in P0 il determinante Hf (P0 ) della matrice
fxx (P0 ) fxy (P0 )
fxy (P0 ) fyy (P0 )
Teorema 4.3.1 (Test sulle derivate seconde) Data una funzione f ∈ C 2 (I), con I ⊂ R2 , I
aperto, e dato P0 punto critico per f , avente come hessiano Hf (P0 ) = fxx (P0 )fyy (P0 )−(fxy (P0 ))2 ,
si ha:
40
4.3. Ricerca di massimi e minimi relativi
ha il determinante della matrice ad essa associata che vale det(A) = fxx (P0 )fyy (P0 )−(fxy (P0 ))2
cioè det(A) = Hf (P0 ). Poichè per ipotesi, Hf (P0 ) > 0 e fxx (P0 ) > 0, allora la forma quadratica
è definita positiva. La stessa cosa vale per la forma quadratica definita in un opportuno
intorno di P0 , considerando il punto (ξx , ηx ) della formula di Taylor: la forma quadratica
data da Fξ,η (h, k) = fxx (ξx , ηy )h2 + 2fxy (ξx , ηy )hk + fyy (ξx , ηy )k 2 è una forma quadratica positiva,
cioè Fξ,η (h, k) > 0. Riprendendo la formula di Taylor, in un intorno di P0 risulta quindi
1
f (x, y) = f (x0 , y0 ) + Fξ,η (h, k)
2
da cui
1
f (x, y) − f (x0 , y0 ) = Fξ,η (h, k) > 0
2
cioè
41
4. M ASSIMI E MINIMI
Esempio
Es. 4.3.1 Calcolare i punti di massimo e minimo relativo e i corrispondenti valori di
massimo e minimo della funzione f (x, y) = x4 + y 4 − 4xy + 2.
Calcoliamo i punti critici della funzione calcolando le derivate parziali prime e ponendole
uguali a zero:
(
fx (x, y) = 4x3 − 4y = 0
fy (x, y) = 4y 3 − 4x = 0
0 = 4(x9 −x) = 4x(x8 −1) = 4x(x4 −1)(x4 +1) = 4x(x2 −1)(x2 +1)(x4 +1) = 4x(x−1)(x+1)(x2 +1)(x4 +1)
Le radici reali sono tre x = 0, x = 1, x = −1, che, insieme alla relazione y = x3 , ci danno i
tre punti critici P0 (0, 0), P1 (1, 1) e P2 (−1, −1).
Per ciascuno di questi punti critici applichiamo il teorema del test sulle derivate seconde.
In questo caso le derivate parziali seconde sono:
Per il punto P0 abbiamo Hf (P0 ) = −16 < 0, quindi possiamo dire subito che P0 è un punto
di sella.
Per P1 si ha Hf (P1 ) = 128 > 0, fxx (P1 ) = 12 > 0, quindi P1 è un punto di minimo relativo
interno proprio con valore minimo f (P1 ) = 0.
Per P2 vale Hf (P2 ) = 128 > 0, fxx (P2 ) = 12 > 0, quindi P2 è un altro punto di minimo
relativo interno proprio con valore minimo f (P2 ) = 0.
In Figura 4.1 possiamo osservare come P1 e P2 siano punti di minimo mentre P0 è un
punto di sella.
42
4.4. Sui massimi e minimi assoluti
Esempio
Es. 4.3.2 Consideriamo ora la funzione f (x, y) = 2y 2 e cerchiamo i punti di massimo e
minimo relativo. Per i punti critici, imponiamo che il gradiente della funzione sia uguale
a zero, quindi
(
fx = 0
fy = 4y = 0
La fx vale sempre zero perchè la f non dipende da x, Dalla seconda equazione ricaviamo
y = 0, da cui i punti critici della funzione sono tutti i punti di coordinate (x, 0), cioè tutti i
punti dell’asse delle x.
Andiamo a calcolare l’Hessiano in questi punti. Poichè fxx = 0, fxy = 0, e fyy = 4, segue
che Hf (x, 0) = 0. Quindi il teorema sul test delle derivate seconde non ci può dire nulla.
In tal caso, dobbiamo vedere come è fatta la funzione e cercare di capire cosa succede in
un intorno di questi punti critici.
Fissato x = x0 , per il punto (x0 , 0), in un suo qualunque intorno vale f (x, y) = 2y 2 ≥ 0 =
f (x0 , 0) (posso prendere anche un punto che ha y = 0 ma x 6= x0 ). Si conclude quindi
che (x0 , 0) è un punto di minimo relativo. Questo vale per tutti i punti (x, 0), che sono,
dunque, tutti punti di minimo relativo (non proprio). Si veda la Figura 4.2 per confrontare
i risultati.
43
4. M ASSIMI E MINIMI
Questo teorema è utile per trovare massimi e minimi assoluti di una funzione continua
in un insieme compatto I. Si può applicare questo metodo:
1. si calcola il valore della f nei punti critici della f che si trovano all’interno di I;
2. si studia la funzione sulla frontiera di I e si cercano i valori estremi della f sulla
frontiera;
3. il più grande dei valori trovati ai passi 1 e 2 rappresenta il valore assoluto massimo della
funzione; il più piccolo dei valori trovati rappresenta il valore minimo assoluto della
funzione. I corrispondenti punti sono rispettivamente i punti di massimo e minimo
assoluti della funzione.
Osserviamo, quindi, che la procedura per trovare i valori estremi assoluti di una funzione,
in un insieme compatto, è diversa dalla procedura per trovare gli estremi relativi di una
funzione mediante il test delle derivate seconde.
A volte, si cercano sia gli estremi assoluti sia gli estremi relativi di una funzione e, in
questo caso, vanno seguite entrambe le strade.
Esempio
Es. 4.4.1 Si devono trovare gli estremi assoluti della funzione f (x, y) = x2 − 4xy + 4y sul
rettangolo D = {(x, y) : 0 ≤ x ≤ 2, 0 ≤ y ≤ 4}.
L’insieme D è un insieme chiuso e limitato (il rettangolo di vertici A(0, 0), B(2, 0), C(2, 4),
D(0, 4)), la funzione è polinomiale, perciò continua. Ci troviamo nelle ipotesi del teorema
di Weierstrass, quindi esistono il massimo e il minimo assoluti della funzione in D.
Cerchiamo i punti critici interni: da fx = 2x − 4y e fy = −4x + 4, ponendo queste derivate
uguali a zero abbiamo il sistema di equazioni
(
2x − 4y = 0
4 − 4x = 0
1
Dalla seconda equazione ricaviamo x = 1, da cui, nella prima, 4y = 2, cioè y = . Ottenia-
2
1
mo il punto critico P0 (1, ). Il punto P0 si trova all’interno dell’insieme D (se così non fosse
2
non lo dovremmo prendere in considerazione). Calcoliamo f (P0 ) = 1. Non dobbiamo vede-
re se questo è un punto di massimo o minimo relativo (non è richiesto), quindi passiamo
a vedere cosa succede alla funzione sulla frontiera (se invece dovessimo calcolare anche
gli estremi relativi, a questo punto dovremmo applicare il test della derivata seconda). La
frontiera dell’insieme I è dato dall’unione dei segmenti AB, BC, CD e DA.
Il segmento AB ha equazione y = 0 con 0 ≤ x ≤ 2. Su questo segmento la funzione f si
riduce ad una funzione della sola variabile x, g(x) = f (x, 0) = x2 , con 0 ≤ x ≤ 2. Si vede
facilmente (poichè g 0 (x) = 2x ≥ 0 nell’intervallo dato) che la g è una funzione crescente
in [0, 2]: il suo valore minimo si ha per x = 0 (g(0) = 0) e il suo valore massimo per x = 2
(g(2) = 4). Quindi dal segmento AB dobbiamo ricordare i punti A e B dove la funzione
vale 0 e 4 rispettivamente.
Il segmento BC ha equazione x = 2 con 0 ≤ y ≤ 4. Qui la funzione si riduce a h(y) =
f (2, y) = 4 − 8y + 4y = 4 − 4y nell’intervallo [0, 4]. La funzione è decrescente (h0 (y) = −4 < 0),
quindi assume valore massimo in 0 (h(0) = 4) e minimo in 4 (h(4) = −12). Per y = 0
ritroviamo il punto B, per y = 4 troviamo il vertice C.
Sul segmento CD, di equazione y = 4, con 0 ≤ x ≤ 2, la funzione diventa g(x) = f (x, 4) =
x2 − 16x + 16 per x ∈ [0, 2]. La derivata g 0 (x) = 2x − 16 si annulla per x = 8 che è un punto
all’esterno dell’intervallo in cui deve variare la x (se fosse all’interno avremmo trovato
un punto critico da considerare ai fini del calcolo degli estremi della f ). Si ha g 0 (x) < 0
per 2x − 16 < 0 cioè x < 8: quindi nell’intervallo [0, 2] la g è decrescente e assume valore
massimo in 0 (g(0) = 16) e valore minimo in 2 (g(2) = −12). Per x = 0 abbiamo il vertice D,
per x = 2 ritroviamo C.
44
4.5. Funzioni implicite
Figura 4.3: Grafico della funzione f (x, y) = x2 − 4xy + 4y nell’insieme compatto [0, 2] × [0, 4].
Ma ci sono anche funzioni che sono definite implicitamente da una relazione tra x e y
come, ad esempio,
2
x2 + y 2 = 9 o x3 + y 3 = 12xy o xyexy + 3ye−x = 0 o ...
In alcuni casi è possibile risolvere questo tipo di equazioni scrivendo y come una funzione
esplicita (o più funzioni esplicite) di x. √
2
√ Nel caso di x + √ y 2 = 9, si ottiene y = ± 9 − x2 , quindi due troviamo due funzioni f (x) =
9 − x2 e g(x) = − 9 − x2 . I grafici della f e della g sono rispettivamente il semicerchio
superiore e inferiore della circonferenza x2 + y 2 = 9 e, insieme, ci danno il grafico di tutta la
circonferenza.
Non è altrettanto facile trovare un’espressione esplicita di y come funzione di x nel caso
di x3 + y 3 = 12xy: potremmo usare la formula per trovare le radici di un polinomio di terzo
45
4. M ASSIMI E MINIMI
grado (supponendo x costante). Ma le formule sono talmente complicate che non le scriviamo
neanche! Ci accontentiamo di sapere che è possibile risolvere il problema.
2
Per la funzione xyexy + 3ye−x = 0 non riusciamo a trovare una formula esplicita che ci
permetta di scrivere y in funzione di x o viceversa x come funzione di y.
Si ha quindi questo problema: data un’equazione f (x, y) = 0 è possibile scrivere y = g(x)
tale che f (x, g(x)) = 0? In tal caso diremo che la y = g(x) è definita implicitamente dalla f . Si
ha la seguente definizione.
Definizione 4.5.1 Data una funzione f (x, y) definita in un sottoinsieme di R2 , diciamo che
la funzione y = g(x) definita in un intervallo di R è definita implicitamente dall’equazione
f (x, y) = 0 se, per ogni x che appartiene all’intervallo di definizione della g, si ha che
G il punto (x, g(x)) appartiene all’insieme di definizione della f ;
G f (x, g(x)) = 0.
Dire f (x, y) = 0 vuol dire intersecare il grafico della superficie della funzione f con il piano
z = 0, cioè con il piano xy, ricavandone quindi una curva. Per tutti quei punti per cui
(x, g(x)) ∈ I e f (x, g(x)) = 0 il grafico della g coincide con il grafico della curva f (x, y) = 0.
Per capire se esiste una funzione g definita implicitamente dalla f e se è unica, si ha il
seguente teorema.
Teorema 4.5.1 (delle funzioni implicite o teorema di Dini) Sia data una funzione f :
I −→ R con I ⊂ R2 , I aperto, f ∈ C 1 (I). Sia P0 (x0 , y0 ) ∈ I tale che f (x0 , y0 ) = 0 e fy (x0 , y0 ) 6= 0.
Allora esiste un’unica funzione y = g(x) definita in un opportuno intorno di x0 (]x0 − , x0 + [),
di classe C 1 , tale che, per ogni x ∈]x0 − , x0 + [ risulta
G y0 = g(x0 )
G (x, g(x)) ∈ I
G f (x, g(x)) = 0
G g 0 (x) = −
fx (x, g(x))
fy (x, g(x))
.
Poichè, per l’ipotesi fy (x0 , y0 ) 6= 0 (quindi anche fy (x, g(x)) 6= 0) possiamo dividere tutto per fy
ricavando
fx (x, g(x))
g 0 (x) = −
fy (x, g(x))
Osserviamo che il teorema di Dini dà una condizione sufficiente ma non necessaria per
l’esistenza e unicità delle funzioni implicite.
46
4.5. Funzioni implicite
Come conseguenza del teorema, possiamo ricavare l’equazione della retta tangente alla
funzione y = g(x) definita implicitamente dalla f nel punto x0 . Infatti l’equazione della retta
tangente in x0 per la funzione g è data da
fx (x0 , y0 )
y − g(x0 ) = g 0 (x0 )(x − x0 ) cioè y − y0 = − (x − x0 )
fy (x0 , y0 )
fy (x0 , y0 )(y − y0 ) = −fx (x0 , y0 )(x − x0 ) da cui fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) = 0
Quest’ultima relazione dice che il gradiente della f in (x0 , y0 ) è ortogonale alla retta
tangente alla curva f (x, y) = 0 in P0 .
scritta prima significa dire che il gradiente della f in (x0 , y0 ) è ortogonale alla retta tangente
a f (x, y) = 0 in P0 .
Sia assegnata una retta nello spazio R2 e sia P0 = (x0 , y0 ) un punto che giace sulla retta.
Sia ~n = (a, b) (n sta per normale) un vettore ortogonale (normale, perpendicolare) alla
retta: il vettore è detto vettore normale.
Sia dato un altro generico punto P = (x, y) sulla retta.
Indichiamo con ~r e r~0 i vettori che ci indicano i due punti P e P0 rispettivamente (si veda
figura 4.4). Il segmento P P0 è dato dal vettore ~r − r~0 .
Ora, poichè ~n è ortogonale alla retta, esso è ortogonale al vettore ~r − r~0 , cioè il prodotto
scalare tra i due vettori è nullo:
~n · (~r − r~0 ) = 0
a(x − x0 ) + b(y − y0 ) = 0
47
4. M ASSIMI E MINIMI
Questa che abbiamo scritto rappresenta l’equazione della retta passante2 per P e P0 .
Quindi, data l’equazione di una retta nella forma a(x − x0 ) + b(y − y0 ) = 0 il vettore che ha
come componenti i due coefficienti a e b, rappresenta il vettore normale alla retta: ~n = (a, b).
3
Esempio
Es. 4.5.1 Sia data la funzione f (x, y) = xe4y + 3y − 1. Si vuol vedere se nel punto
1
P0 (x0 , y0 ) = (0, ) sono verificate le ipotesi del teorema di Dini e, in caso affermativo,
3
se la funzione y = g(x) definita implicitamente da f (x, y) = 0 è una funzione crescente o
decrescente, concava o convessa in un intorno di x0 .
1 1
Calcoliamo f (0, ) = 0 + 1 − 1 = 0. Inoltre fy (x, y) = 4xe4y + 3 e fy (0, ) = 3 6= 0.
3 3
L’altra derivata parziale è fx = e4y . Le derivate parziali sono continue, quindi f ∈ C 1 .
Siamo nelle ipotesi del teorema di Dini, quindi esiste un’unica funzione y = g(x) definita
in un intorno di x0 = 0 tale che (x, g(x)) appartiente all’insieme di definizione della f ,
fx (x, g(x))
f (x, g(x)) = 0 e g 0 (x) = − .
fy (x, g(x))
1
Per vedere se la funzione è crescente o decrescente, calcoliamo g 0 (0). Poichè fx (0, ) = e4/3
3
1 e4/3
e fy (0, ) = 3, risulta g 0 (0) = − < 0. Quindi la g è decrescente in un intorno di 0.
3 3
Per calcolare g 00 (0) (e capire quindi se la g è convessa o concava) torniamo all’equazione
fxx (x, g(x)) + fxy (x, g(x))g 0 (x) + fyx (x, g(x))g 0 (x) + fyy (x, g(x))(g 0 (x))2 + fy (x, g(x))g 00 (x) = 0
Nelle ipotesi (verificate in questo esempio) di derivate parziali seconde continue, vale
fxy = fyx . Inoltre, fy (x, g(x)) 6= 0 quindi
fxx (x, g(x)) + 2fxy (x, g(x))g 0 (x) + fyy (x, g(x))(g 0 (x))2
g 00 (x) = −
fy (x, g(x))
48
4.6. Curve di livello
Adesso possiamo calcolare g 00 (0). Abbiamo fxx = 0, fxy = 4e4y , fyy = 16xe4y , da cui
fxx (P0 ) = 0, fxy (P0 ) = 4e4/3 , fyy = 0, quindi
e4/3
8e4/3 (− )
g 00 (0) = − 3 >0
3
La funzione è convessa in un intorno di 0.
Osserviamo che, se f (x0 , y0 ) = 0 e fy (x0 , y0 ) = 0, non possiamo applicare il teorema di
Dini. Tuttavia, se, oltre a f (x0 , y0 ) = 0, si ha fx (x0 , y0 ) 6= 0, si può applicare il teorema di Dini,
scambiando il ruolo di x e y. Si ha la seguente formulazione
Teorema 4.5.2 (di Dini, scambiando il ruolo di x e y) Sia data una funzione f : I −→ R
con I ⊂ R2 , I aperto, f ∈ C 1 (I). Sia P0 (x0 , y0 ) ∈ I tale che f (x0 , y0 ) = 0 e fx (x0 , y0 ) 6= 0. Allora
esiste un’unica funzione x = h(y) definita in un opportuno intorno di y0 (]y0 − , y0 + [), di classe
C 1 , tale che, per ogni y ∈]y0 − , y0 + [ risulta
G x0 = h(y0 )
G (h(y), y) ∈ I
G f (h(y), y) = 0
G h0 (y) = −
fy (h(y), y)
fx (h(y), y)
.
Possiamo lavorare sulla funzione h così come abbiamo fatto per la funzione g per calcolare
l’equazione della retta tangente o la sua derivata seconda.
Definizione 4.6.1 Si definiscono curve di livello di una funzione f di due variabili, tutte le
curve di equazioni f (x, y) = c con c costante che appartiene all’insieme dei valori della f .
La curva di livello f (x, y) = c è quindi l’insieme di tutti i punti del dominio della f in cui la
funzione assume il valore assegnato c. Mostra, quindi, dove il grafico della f ha altezza c.
In Figura 4.5 troviamo un esempio di applicazione delle curve di livello per rappresentare
la temperatura in Europa. Ciascuna curva rappresenta un valore diverso di temperatura.
Per funzioni matematiche, un p esempio di curve di livello si vede in Figura 4.6 dove, a sinistra,
vi è la superficie data da z = x2 + y 2 mentre, a destra, sono rappresentate le sue curve di
livello.
Proposizione 4.6.1 Dato un valore c e P0 = (x0 , y0 ) tale che f (x0 , y0 ) = c nell’ipotesi che P0
~ )(P0 ) è ortogonale alla curva di livello f (x, y) = c
non sia critico per la f , allora il gradiente ∇(f
in P0 .
Dimostrazione. Per la dimostrazione, ci riconduciamo al teorema di Dini delle funzioni
implicite, considerando F (x, y) = f (x, y) − c.
Per ipotesi P0 non è punto critico, quindi almeno una delle due derivate parziali è non
nulla in P0 . Consideriamo il caso in cui fy (x0 , y0 ) 6= 0.
Allora F (x0 , y0 ) = 0, mentre Fy (x, y) = fy (x, y) da cui Fy (x0 , y0 ) = fy (x0 , y0 )
49
4. M ASSIMI E MINIMI
p
Figura 4.6: Superficie f (x, y) = x2 + y 2 (a sinistra) e le sue curve di livello (a destra).
Essendo soddisfatte le ipotesi del teorema di Dini, esiste un’unica funzione definita im-
plicitamente dalla F , y = g(x). Allora l’equazione della retta tangente alla F in P0 ha
equazione
Fx (x0 , y0 )(x − x0 ) + Fy (x0 , y0 )(y − y0 ) = 0
Con lo stesso ragionamento fatto prima Fx (x, y) = fx (x, y) da cui ricaviamo
fx (x0 , y0 )(x − x0 ) + fy (x0 , y0 )(y − y0 ) = 0
Quindi il vettore ∇f ~ (P0 ) è un vettore perpendicolare (normale) alla retta tangente alla
curva f (x, y) = c nel punto P0 . 4
50
4.6. Curve di livello
c che passa per P0 . Più brevemente, possiamo dire che è perpendicolare alla curva di livello.
Il vettore gradiente fornisce anche informazioni sulla direzione di massima crescita della
funzione f . Infatti, dal momento che la derivata direzionale dice la velocità di cambiamento
della f in quella direzione, noi possiamo calcolare la derivata direzionale della f in P0 lungo
tutte le possibili direzioni e vedere qual è il valore massimo e per quale direzione si ottiene.
Per la formula del gradiente, si ha (considerando ~v vettore unitario)
dove θ è l’angolo individuato dai vettori ∇f~ (P0 ) e ~v . Osserviamo che il prodotto scalare
scritto in questa maniera è del tutto equivalente alla formula che abbiamo dato utilizzando
le componenti dei vettori. 4 Poichè il massimo valore di cos θ è 1 e questo si ha quando θ = 0,
∂f (P0 ) ~ (P0 )| e si ha quando
vuol dire che il valore massimo della derivata direzionale vale |∇f
∂~v
~ (P0 ).
θ = 0 cioè quando ~v ha la stessa direzione di ∇f
4 Proviamo che, dati due vettori ~ a = (a1 , a2 ) e ~b = (b1 , b2 ), il prodotto scalare ~a · ~b = a1 b1 + a2 b2 si può scrivere,
in modo del tutto equivalente come ~a · ~b = |~a||~b| cos θ con θ l’angolo individuato dai due vettori ~a e ~b.
A tal proposito ricordiamo il teorema di Carnot (o del coseno) per cui dato un triangolo qualsiasi e dati due lati
(che scriviamo come vettori) ~a e ~b che formano un angolo θ, per il terzo lato ~c vale
dove |~a|, |~b|, |~c| sono i moduli dei tre vettori (cioè le lunghezze dei lati del triangolo).
Se consideriamo il vettore ~a + ~b, applicando sia la regola del parallelogramma sia il teorema di Carnot, tenendo
conto che adesso l’angolo compreso tra i due lati è π − θ (si veda Figura 4.7) e che cos (π − θ) = − cos θ, si ha
|~a + ~b|2 = |~a|2 + |~b|2 − 2|~a||~b| cos (π − θ) = |~a|2 + |~b|2 + 2|~a||~b| cos θ
Da questa relazione ricaviamo
1“ ”
|~a||~b| cos θ = |~a + ~b|2 − |~a|2 − |~b|2
2
Scrivendo in modo esplicito i moduli dei vettori, |~a+~b|2 = (a1 +b1 )2 +(a2 +b2 )2 , |~a|2 = (a1 )2 +(a2 )2 e |~b|2 = (b1 )2 +(b2 )2 ,
e sostituendo, si ha proprio
|~a||~b| cos θ = a1 b1 + a2 b2
Quindi il prodotto scalare può essere scritto sia in un modo che nell’altro.
51
4. M ASSIMI E MINIMI
Esempio
Es. 4.7.1 Si deve costruire una scatola di cartone, priva di coperchio, utilizzando 12m2
(metri quadrati) di cartone. Si vuole costruire una scatola con il massimo volume
possibile.
Il volume della scatola è dato da V = xyz (dove x, y, e z rappresentano lunghezza,
larghezza e altezza della scatola).
La superficie della scatola (che non ha coperchio) è data da 2xz + 2yz + xy = 12 (12 dai
12m2 di cartone a disposizione).
La superficie rappresenta il vincolo per la funzione volume di cui vogliamo calcolare il
massimo. Questo esempio può essere risolto in modo semplice andando a scrivere z in
funzione di x e y dalla relazione 2xz + 2yz + xy = 12:
12 − xy
z=
2(x + y)
12 − xy 12xy − x2 y 2
V = xyz = xy =
2(x + y) 2(x + y)
Cerchiamo, di questa funzione, gli estremi relativi e tra questi vediamo se c’è una so-
luzione fisicamente accettabile (x e y rappresentano delle lunghezze e devono essere
positive).
Troveremo (lo si faccia per esercizio) che V ha il suo valore massimo per x = y = 2, da cui
z = 1.
Tuttavia, questa strada non è sempre percorribile. Perciò vediamo cosa si deve fare, in
generale, quando si cercano punti di massimo o minimo di una funzione soggetta a un
vincolo.
Vediamo il caso in cui dobbiamo cercare i valori estremi di una funzione f (x, y) soggetta
al vincolo espresso dall’equazione g(x, y) = c. In maniera del tutto equivalente, possiamo dire
che dobbiamo cercare i valori estremi della f (x, y) quando il punto (x, y) deve appartenere
alla curva di livello g(x, y) = c. In Figura 4.8 vediamo la curva g(x, y) = c e delle curve di livello
della funzione f (x, y). Queste curve di livello hanno equazione f (x, y) = k con k = 7, 8, 9, 10, 11.
Se vogliamo cercare il massimo della f (x, y) soggetta al vincolo g(x, y) = c, dobbiamo cercare il
più grande valore di k tale che la curva di livello f (x, y) = k interseca g(x, y) = c. Dalla Figura,
si può vedere che questo accade quando le due curve si toccano appena l’una con l’altra,
cioè quando hanno in comune una retta tangente. Ciò significa che le normali alle rette
tangenti sia a g(x, y) = c sia a f (x, y) = k, nel punto (x0 , y0 ), che è il punto in cui g(x, y) = c
e f (x, y) = k si incontrano, sono identiche. Ricordando che il vettore normale alla retta
tangente ad una funzione f (x, y) è il gradiente della f , vuol dire che ∇f ~ (x0 , y0 ) e ∇g(x
~ 0 , y0 )
sono vettori paralleli, cioè le loro componenti differiscono di una costante. Seguiremo questo
approccio per il metodo dei moltiplicatori di Lagrange.
Teorema 4.7.1 Data una funzione f ∈ C 1 (I), con I ⊂ R2 aperto, condizione necessaria af-
finchè P0 (x0 , y0 ) ∈ I sia un punto di massimo o minimo relativo della f soggetta al vincolo
g(x, y) = c è che
G g(x0 , y0 ) = c
52
4.7. Estremi vincolati e moltiplicatori di Lagrange
G la matrice
fx (P0 ) fy (P0 )
gx (P0 ) gy (P0 )
prende il nome di matrice jacobiana della f e della g. Vale infatti la seguente definizione.
Definizione 4.7.1 Date le due funzioni f1 (x, y) e f2 (x, y) si definisce matrice jacobiana, la
matrice
∂f1 ∂f1
∂(f1 , f2 ) ∂x ∂y
= ∂f ∂f2
∂(x, y) 2
∂x ∂y
Si definisce jacobiano, il determinante della matrice jacobiana.
Osserviamo che il teorema che abbiamo enunciato prima è un teorema che ci dà una
condizione necessaria ma non sufficiente.
a b
5 Ricordiamo che, date due rette ax + by + c = 0 e a0 x + b0 y + c0 = 0 la condizione di parallelismo è = 0 ovvero
a0 b
ab0 − a0 b = 0.
53
4. M ASSIMI E MINIMI
Il metodo dei moltiplicatori di Lagrange ci permette di trovare gli estremi di una funzio-
ne f (x, y) soggetta al vincolo Φ(x, y) = 0 (sempre che il problema ammetta soluzione). Per
~
applicare questo metodo deve essere ∇Φ(x, y) 6= 0.
Abbiamo detto che, se P0 è un punto di estremo vincolato, il gradiente della f e del-
la funzione di vincolo sono tra loro paralleli, cioè le componenti dei due vettori gradiente
differiscono per una costante. Introduciamo questa costante mediante la variabile λ detta
moltiplicatore di Lagrange: vuol dire che fx (x0 , y0 ) = λΦx (x0 , y0 ) e fy (x0 , y0 ) = λΦy (x0 , y0 ).
Ora, per capire chi possa essere (x0 , y0 ), definiamo la funzione H(x, y, λ) = f (x, y)+λΦ(x, y),
che dipende dalle variabili x, y e λ. Il metodo dei moltiplicatori di Lagrange consiste dei
seguenti passi:
1. risolviamo il sistema di equazioni dato da
~
∇H(x, y, λ) = 0
vale a dire:
fx (x, y) + λΦx (x, y) = 0
fy (x, y) + λΦy (x, y) = 0
Φ(x, y) = 0
54
4.7. Estremi vincolati e moltiplicatori di Lagrange
Il sistema da risolvere è
2x + 2λx = 0
8y + 2λy = 0
2
x + y2 = 1
55
C APITOLO 5
Le curve
57
5. L E CURVE
x deve corrispondere un solo valore f (x)). Tuttavia, possiamo pensare alle coordinate (x, y)
della particella che si muove lungo la curva come funzioni del tempo t in modo da poter
scrivere x = f (t) e y = g(t). Questa coppia di funzioni ci permette di descrivere la curva e di
dare la definizione di curva sotto forma di equazioni parametriche.
x = f (t), y = g(t)
Esempio
Es. 5.1.1 Proviamo a fare il grafico per capire quale curva è rappresentata mediante le
equazioni parametriche
(
x = t2 + t
y = 2t − 1
In Figura 5.2 abbiamo messo su un piano cartesiano i punti (x, y) che si ottengono per
molti valori del parametro t e li abbiamo uniti in modo da ottenere il grafico di una curva.
58
5.1. Equazioni parametriche di una curva
Osserviamo che una particella, la cui posizione è data dalle equazioni parametriche
x = f (t), y = g(t), si muove lungo la curva nella direzione di t crescente. Ciò significa che
una curva parametrica ha una direzione, un orientamento dato da valori crescenti
di t. Sul grafico la direzione del movimento della curva è indicata mediante freccette.
Inoltre, osserviamo che a valori di t equidistanti non corrispondono, sulla curva, punti
equidistanti: ciò è dovuto al fatto che la particella rallenta o aumenta la sua velocità al
variare di t.
Dalla Figura 5.2, appare evidente che la curva tracciata dalla particella è una parabola.
In effetti, se eliminiamo il parametro t dalle due equazioni parametriche, ricaviamo proprio
l’equazione di una parabola. Per far ciò, dalla seconda equazione y = 2t − 1 ricaviamo
1
t = (y + 1) e sostituiamo il valore trovato per t nell’equazione in x. Troviamo
2
2
1 1 1 3
x= (y + 1) + (y + 1) = y 2 + y +
2 2 4 4
Esempio
Es. 5.1.2 Consideriamo le equazioni parametriche della curva precedente, ma con t ∈
[−1, 1]:
x = t2 + t y = 2t − 1 −1≤t≤1
Abbiamo solo una porzione della curva che abbiamo disegnata prima (si veda Figura 5.3).
59
5. L E CURVE
x = f (t), y = g(t), t0 ≤ t ≤ tf
Esempio
Es. 5.1.3 Cerchiamo di capire qual è la curva rappresentata dalle equazioni
parametriche x = cos t, y = sin t, con 0 ≤ t ≤ 2π.
Se facciamo un grafico con le coppie di punti (x, y) al variare di t, otteniamo il grafico
di una circonferenza. Ne abbiamo conferma eliminando il parametro t. Questa volta
sfruttiamo le relazioni trigonometriche osservando che
x2 + y 2 = cos2 t + sin2 t = 1
Esempio
Es. 5.1.4 Vediamo ora la curva rappresentata dalle equazioni parametriche x = sin 4t ,
y = cos 4t, con 0 ≤ t ≤ 2π.
Di nuovo, da x2 + y 2 = sin2 4t + cos2 4t = 1 ritroviamo l’equazione della circonferenza di
centro l’origine e raggio 1.
Questa volta, però, il punto iniziale della curva si ha in (sin 0, cos 0) = (0, 1). Per valori di t
crescenti, la particella si muove in direzione oraria lungo la circonferenza e la percorre 4
volte (il punto (0, 1) si ha per t = 0, π/2, π, 3π/2, 2π.
60
5.2. Grafico di una curva parametrica
Quindi la stessa curva può essere rappresentata in modi diversi. Conviene perciò fare la
distinzione tra curva, come insieme di punti, da curva parametrica, come insieme di punti
tracciati in modo particolare.
x = g(t), y = t.
Alla stessa maniera le curve di equazioni y = f (x) (le familiari funzioni di una variabile reale),
possono essere viste come curve di equazioni parametriche
x = t, y = f (t).
In generale, data una curva parametrica di equazioni x = f (t), y = g(t), con t0 ≤ t ≤ tf , per
farne il grafico possiamo far variare t nell’intervallo assegnato (o per valori crescenti in R) e
vedere dove giacciono, sul piano cartesiano, i corrispondenti punti (x, y), in modo da avere
l’orientamento della curva.
A volte conviene eliminare il parametro t per capire di che curva si tratta.
Altre volte la curva è talmente complicata che conviene affidarsi a programmi di grafica
al calcolatore per poterla visualizzare.
Esempio
Es. 5.2.1 Consideriamo il caso di una curva data da
Possiamo scrivere
x2 y2
1 = cos2 u + sin2 u = 2
+ 2
a b
trovando l’equazione di un’ellisse avente come centro l’origine (se a > b l’ellisse è oriz-
zontale con l’asse maggiore sull’asse delle x, viceversa se a < b l’ellisse è verticale con
l’asse maggiore sull’asse delle y, se invece a = b l’ellisse si riduce ad una circonferenza
di raggio a).
L’ellisse, per u ∈ [0, 2π] viene percorsa tutta. Ma adesso u varia fino a 2απ, il che vuol dire
che la curva viene percorsa α volte dal parametro u: è come un circuito di formula 1 da
ripetere per un numero α di giri.
61
5. L E CURVE
Esempio
Es. 5.2.2 Il cammino di una particella è dato da
x x 2 x2
cos (3t) = y =1+ =1+
4 4 16
Ricaviamo una parabola. Inoltre
62
5.3. Parametrizzare una curva
solo valore del parametro t, in altri casi lo stesso punto viene ripetuto per diversi valori di t.
Abbiamo le seguenti definizioni
Definizione 5.2.2 Una curva è chiusa se è definita per t ∈ [t0 , tf ] e (x(t0 ), y(t0 )) = (x(tf ), y(tf )):
il punto sulla curva che si ha per il valore iniziale del parametro t coincide con il punto sulla
curva che si ha per il valore finale di t.
x2 y2
+ =1
a2 b2
Come equazioni parametriche, possiamo considerare
In tal caso l’ellisse parte dal punto (a, 0) e vi termina dopo aver percorso l’ellisse in senso
antiorario.
Una curva può essere parametrizzata in vari modi, comunque. L’ellisse precedente, ad
esempio, può essere parametrizzata come
La presenza della costante α ci dice quante volte viene percorsa l’ellisse. Le ultime due
equazioni parametriche ci danno la curva percorsa in senso orario (sempre partendo da
t = 0).
x = x(t) y = y(t) t0 ≤ t ≤ tf
vogliamo ricavare una formula per la pendenza delle rette tangenti alla curva in ciascun suo
punto.
Nel caso di una funzione y = F (x), la retta tangente a F per x = a è data dall’equazione
dy
p(x) = m(x − a) + F (a), dove m = F 0 (a) = |x=a
dx
Per la curva parametrica, se riusciamo a calcolare la derivata della y in funzione di x,
possiamo utilizzare la formula appena scritta per ricavare l’equazione della tangente alla
63
5. L E CURVE
curva in un generico punto (x, y) della curva. Noi però abbiamo y in funzione del parametro
t e non di x.
Supponiamo di avere (ma non abbiamo) una funzione y = F (x) che ci permetta di scrivere
la curva non più in forma parametrica, eliminando cioè il parametro t. In realtà noi sappiamo
che y = y(t) e x = x(t), quindi sostituendo abbiamo
Deriviamo rispetto a t:
dy dF (x(t)) dx
=
dt dx dt
dy dF (x)
A noi serve una formula per ovvero per per avere la retta tangente. Dalla relazione
dx dx
dx
precedente, nell’ipotesi in cui 6= 0 ricaviamo
dt
dy
dy dF (x(t))
= = dt
dx dx dx
dt
Abbiamo trovato, in questo modo, la pendenza della retta tangente alla curva scritta
come y = F (x). Se vogliamo avere la tangente alla curva scritta invece come x = H(y), basta
scambiare il ruolo della x con la y. L’equazione della retta tangente nel punto f (a) è del tipo
dx
con m = H 0 (f (a)) = |y=f (a) . In maniera del tutto analoga a quanto visto prima, si ricava
dy
dx
dx dy
= dt per 6= 0
dy dy dt
dt
Esempio
Es. 5.4.1 Troviamo la tangente alla curva parametrica data dalle equazioni
x = t5 − 4t3 y = t2
dy
dy 2t 2
= dt = 4 = 3
dx dx 5t − 12t2 5t − 12t
dt
64
5.4. Tangente ad una curva
dy 1
m= |t=−2 = −
dx 8
e quindi la retta tangente è
1
y =4− x
8
Per t = 2 invece si ha
dy 1
m= |t=2 =
dx 8
e la retta tangente è
1
y =4+ x
8
Perchè due rette tangenti nel punto (0, 4)? Perchè la curva ”gira“ attorno al punto (0, 4)
e quindi abbiamo due rette tangenti (si veda Figura 5.5).
65
5. L E CURVE
dove P0 è inteso come un vettore, t è il parametro al variare del quale abbiamo i punti della
retta, ~v è il vettore che dà la direzione della retta. In forma parametrica abbiamo
dx(t0 ) dy(t0 )
r~t = (x0 + t , y0 + t )
dt dt
dx(t0 ) dy(t0 )
Osserviamo che, dalle equazioni della tangente x = x0 + t , y = y0 t , se dalla
dt dt
prima equazione ricaviamo t in funzione di x e sostituiamo nella seconda equazione, troviamo
l’equazione della retta tangente che abbiamo ricavato prima.
Prendendo valori di n sempre più grandi noi avremo valori via via più accurati. Passando al
limite per n → ∞ avremo la lunghezza dell’arco di curva:
n
X
L = lim |Pi−1 − Pi |
n→∞
i=1
Ora, ciascuno punto Pi ha coordinate del tipo (xi , f (xi )), da cui
p
|Pi−1 − Pi | = (xi − xi−1 )2 + (f (xi ) − f (xi−1 ))2
Dal teorema del valor medio sappiamo che f (xi ) − f (xi−1 ) = f 0 (ξi )(xi − xi−1 ) dove ξi è un
punto che non conosciamo all’interno dell’intervallo [xi−1 , xi ]. Ricordando che abbiamo diviso
66
5.6. Lunghezza di una curva
Inserendo questa formula nel limite che fornisce la lunghezza dell’arco di curva si ha
n p
X
L = lim 1 + f 0 (ξi )2 ∆x
n→∞
i=1
Se, invece, abbiamo una funzione scritta in funzione di y, vale a dire x = h(y) con c ≤ y ≤ d,
la stessa formula diventa:
s 2
Z d
dx
L= 1+ dy
c dy
x = x(t) y = y(t) t0 ≤ t ≤ tf
67
5. L E CURVE
dx
Assumiamo che ≥ 0: ciò significa che la curva è attraversata solo una volta, da sinistra
dt
verso destra, per t che aumenta nell’intervallo [t0 , tf ]. La curva, quindi, è semplice.
Supponiamo, come per la tangente, di poter scrivere y = F (x) o x = H(y) anche se, in
realtà, x = x(t) e y = y(t). Applicando le formule viste per l’arco di una funzione alla curva
scritta non in forma parametrica noi dobbiamo applicare una delle due formule:
s 2
Z b
dy
L= 1+ dx se y = f (x), a ≤ x ≤ b
a dx
s 2
Z d
dx
L= 1+ dy se x = h(y), c ≤ y ≤ d
c dy
dx
Nell’ipotesi fatta per cui è positiva possiamo semplificare ancora ottenendo
dt
s 2 2
Z tf
dx dy
L= + dt
t0 dt dt
dy
Osserviamo che, nel caso in cui è ≥ 0, usando la formula per x in funzione di y, si
dt
ottiene
v
dx 2
u
Z tf u
u1 + dt dy dt
u
L= dy
dt
t
t0
dt
da cui si arriva alla stessa formula.
Se invece non rappresentiamo la curva mediante la forma y = F (x) o x = H(y), arriviamo
allo stesso risultato utilizzando un’approssimazione poligonale. Dividiamo l’intervall [t0 , tf ] in
n sottointervalli di stessa ampiezza ∆t. Chiamiamo t0 , t1 , t2 , . . . , tn = tf i punti finali di questi
68
5.6. Lunghezza di una curva
sottointervalli e indichiamo con (xi , yi ) i punti che si ottengono sulla curva con il parametro
ti . Quindi xi = x(ti ) e yi = y(ti ). Indichiamo con Pi i punti sul piano cartesiano che hanno
coordinate date da (xi , yi ).
I punti Pi si trovano sulla curva γ e possiamo tracciare una poligonale con vertici dati da
Pi , che approssima la curva γ. Con lo stesso discorso fatto per trovare la lunghezza di un
arco di funzione, la lunghezza della curva γ è data dal limite delle lunghezze dei segmenti
Pi−1 Pi = |Pi−1 − Pi |
n
X
L≈ |Pi−1 − Pi |
i=1
Ora
p p
|Pi−1 − Pi | = (xi − xi−1 )2 + (yi − yi−1 )2 = (x(ti ) − x(ti−1 ))2 + (yti ) − y(ti−1 ))2
Applichiamo il teorema del Valor Medio alla funzione x(t) nell’intervallo [ti−1 , ti ]:
dove t∗i è un punto opportuno che si trova all’interno dell’intervallo [ti−1 , ti ]. Analogamente,
applicando lo stesso teorema alla funzione y(t) si ha
con t∗∗
i punto opportuno che si trova all’interno dell’intervallo [ti−1 , ti ]. Di conseguenza
q q
2 2 2 2
|Pi−1 − Pi | = [x0 (t∗i )∆t] + [y 0 (t∗∗
i )∆t] = [x0 (t∗i )] + [y 0 (t∗∗
i )] ∆t
Questo limite ci ricorda un integrale (così come abbiamo fatto per la lunghezza dell’arco di
una funzione) anche se non è esattamente lo stesso in quanto abbiamo due punti t∗i e t∗∗ i
che sono diversi. Si può provare, tuttavia, che se x(t) e y(t) sono funzioni continue, il limite
scritto prima è lo stesso che si avrebbe con i due punti t∗i e t∗∗
i coincidenti. Quindi si può
passare all’integrale
Z tf q
2 2
L= [x0 (t)] + [y 0 (t)] dt
t0
dx dy
Se, al posto di x0 (t) scriviamo e, al posto di y 0 (t) scriviamo otteniamo la formula vista
dt dt
prima per la lunghezza di una curva.
Riassumiamo questo risultato nel teorema.
Teorema 5.6.1 Se una curva γ è descritta tramite equazioni parametriche x = x(t) e y = y(t),
con t0 ≤ t ≤ tf , e x0 (t) e y 0 (t) sono funzioni continue e γ è una curva semplice (percorsa solo
una volta per t crescente da t0 a tf ), allora la lunghezza della curva è data da:
s
Z tf 2 2
dx dy
L= + dt
t0 dt dt
69
5. L E CURVE
Esempio
Es. 5.6.1 Vogliamo determinare la lunghezza della curva
dx dy
= 3 cos (t) = −3 sin (t)
dt dt
Dobbiamo quindi calcolare l’integrale
Z 2π q Z 2π q
L= 9 cos2 (t) + 9 sin2 (t)dt = 3 cos2 (t) + sin2 (t)dt =
0 0
Z 2π √ Z 2π
=3 1dt = 3 dt = 3 · 2π = 6π
0 0
OT = arc(P T )
θ arc(P T )
=
2π 2πr
Da questa relazione otteniamo arc(P T ) = rθ, da cui OT = rθ.
70
5.8. Sistema di coordinate polari
Figura 5.8: Considerazioni geometriche sul punto P della circonferenza quando il cerchio
rotola lungo l’asse x.
Questo risultato ci serve per trovare le coordinate del punto P . Si ha infatti (aiutandoci
con la Figura 5.8):
x = OT − P Q
y = CT − CQ
Abbiamo trovato, dunque, che le equazioni parametriche della curva cicloide sono date da
Osserviamo che, sebbene queste equazioni le abbiamo ricavate considerando 0 < θ < π/2,
esse sono valide anche per altri valori di θ. Un arco completo della curva cicloide è dato dalla
rotazione completa della circonferenza e si ha, quindi, per θ ∈ [0, 2π].
71
5. L E CURVE
niente per molti scopi, tra cui quello di rappresentare alcune curve parametriche. Questo
sistema prende il nome di sistema di coordinate polari.
Scegliamo un punto nel piano che chiamiamo polo o origine (lo indichiamo con O). Dal-
l’origine tracciamo una semiretta chiamata asse polare (in genere questo asse è tracciato
orizzontalmente, a destra del punto O e corrisponde al semiasse positivo dell’asse delle x
del sistema cartesiano). Se P è un qualunque altro punto in questo piano, tracciamo il seg-
mento, di lunghezza r, che unisce P all’origine e consideriamo l’angolo θ (di solito espresso
in radianti) tra l’asse polare e il segmento OP . Il punto P viene rappresentato dalla coppia
ordinata (r, θ) e r, θ sono le coordinate polari del punto P (si veda Figura 5.10). Si usa la
convenzione che un angolo è positivo se misurato in senso antiorario rispetto all’asse polare.
Inoltre il punto (0, θ) rappresenta l’origine, qualunque sia θ.
Si estende il sistema di coordinate polari a valori di r negativi, con la convenzione che il
punto del tipo (−r, θ) giace sulla stessa linea del punto (r, θ) e alla stessa distanza |r| da O,
ma sul lato opposto rispetto a (r, θ). Dire (−r, θ) è la stessa cosa di (r, θ + π). Come conse-
guenza, un punto nel sistema di coordinate polari può avere più di una rappresentazione.
Dal momento che una completa rotazione antioraria è data dall’angolo 2π, si ha che il punto
(r, θ) può essere rappresentato anche come (r, θ + 2nπ), e (−r, θ + (2n + 1)π) con n intero.
Per passare dalla rappresentazione in coordinate polari al sistema di coordinate cartesia-
ne, basta osservare che l’origine del sistema polare corrisponde all’origine del sistema carte-
siano, l’asse polare corrisponde all’asse delle x e, di conseguenza, il punto P di coordinate
polari (r, θ), ha coordinate cartesiane x e y date da
x = r cos θ, y = r sin θ
(si veda Figura 5.11: abbiamo applicato le relazioni trigonometriche che legano i lati di
un triangolo rettangolo all’angolo compreso tra ipotenusa e uno dei due cateti). Viceversa,
dato un punto P in coordinate cartesiane, per trovare i valori di r e θ delle corrispondenti
72
5.9. Curve in coordinate polari
Esempio
Es. 5.8.1 Convertiamo il punto (2, π/4) da coordinate polari a coordinate cartesiane. Da
2 √
x = r cos θ e y = r sin θ, sostituendo i valori di r e θ otteniamo x = 2 cos (π/4) = √ = 2 e
2
2 √ √ √
y = 2 sin (π/4) = √ = 2. In coordinate cartesiane abbiamo il punto ( 2, 2).
2
Esempio
Es. 5.8.2 Rappresentiamo in coordinate polari il punto dato in coordinate cartesiane
(1, −1).
Scegliamo la rappresentazione
√ √ con r > 0 andando a considerare la radice positiva di
x2 + y 2 . Quindi r = 1 + 1 = 2.
y
Abbiamo da risolvere l’equazione tan θ = = −1.
x
3π π
Sia θ = + 2nπ sia θ = − + 2nπ con n intero (n = 0, 1, . . .) hanno come tangente il
4 4 √
valore −1. Scegliamo il valore di θ che ci permette (insieme a r = 2) di avere il punto
π
P posizionato nel corretto quadrante: dobbiamo scegliere θ = − + 2nπ. Prendiamo
√ 4
π π
θ = − . Il punto in coordinate polari dato da ( 2, − ) corrisponde a (1, −1) in coordinate
4 4
√ 3π
cartesiane. Se considerassimo il punto ( 2, ) avremmo, in coordinate cartesiane (−1, 1)
4
(si veda Figura 5.12 per un confronto).
73
5. L E CURVE
Esempio
Es. 5.9.1 La curva di equazione polare r = 4 è data da tutti i punti (r, θ) con r = 4. Dal
momento che r rappresenta la distanza dei punti dal polo (l’origine del piano polare), la
curva data rappresenta il cerchio di centro il polo O e raggio 4.
Esempio
Es. 5.9.2 La curva polare θ = π/5 consiste di tutti i punti (r, θ) con θ = π/5 radianti.
Abbiamo quindi una retta che passa per O e che forma un angolo di π/5 radianti con
l’asse polare.
Esempio
Es. 5.9.3 Troviamo le equazioni cartesiane della curva polare r = 2 cos θ.
Se proviamo a fare il grafico della curva sul piano polare, al variare di θ, ci accorgiamo
che il grafico rappresenta una circonferenza.
Per passare a coordinate cartesiane, da x = r cos θ abbiamo cos θ = x/r quindi r = 2 cos θ =
2x/r, cioè r2 = 2x ma r2 = x2 +y 2 , da cui x2 +y 2 = 2x o ancora x2 +y 2 −2x = 0. Aggiungendo
e sottraendo 1 abbiamo
x2 + y 2 − 2x + 1 − 1 = 0 cioè (x − 1)2 + y 2 = 1
Quindi x e y sono funzioni di θ. Assumendo che f 0 sia una funzione continua, la lunghezza
della curva è data dalla formula
s
Z θf 2 2
dx dy
L= + dθ
θ0 dθ dθ
74
5.10. Lunghezza di una curva polare
75
5. L E CURVE
√
Per calcolare questo integrale moltiplichiamo e dividiamo per 1 − sin θ ricavando
√ p
√ Z 2π √ 1 − sin θ √ Z 2π 1 − sin2 θ
L= 2 1 + sin θ √ dθ = 2 √ dθ
0 1 − sin θ 0 1 − sin θ
√
√ Z 2π cos2 θ √ Z 2π | cos θ|
= 2 √ dθ = 2 √ dθ
0 1 − sin θ 0 1 − sin θ
Abbiamo un integrale che dipende dal valore assoluto di cos θ: poichè cos θ è positivo per
0 ≤ θ ≤ π/2 e per 3π/2 ≤ θ ≤ 2π, mentre è negativo per π/2 ≤ θ ≤ 3π/2, l’integrale si spezza nei
tre integrali
√ Z 2π
| cos θ|
L= 2 √ dθ =
0 1 − sin θ
√ Z π/2
cos θ √ Z 3π/2
cos θ √ Z 2π
cos θ
= 2 √ dθ − 2 √ dθ + 2 √ dθ
0 1 − sin θ π/2 1 − sin θ 3π/2 1 − sin θ
Osserviamo che
Z
cos θ
√ dθ
1 − sin θ
si può risolvere facendo il cambiamento di variabile u = sin θ da cui du = cos θdθ ricavando
−1 D(1 − u) √
Z Z Z
1
√ du = − √ du = − √ du = −2 1 − u + costante
1−u 1−u 1−u
Abbiamo considerato che la derivata di 1 − u vale −1 (l’abbiamo indicata con D(1 − u) e che
R n xn+1
x dx = + costante.
n+1
Ritornando a L e sostituendo quanto abbiamo trovato nei tre integrali, abbiamo
√ √ θ=π/2 √ θ=3π/2 √
θ=2π
L = 2 −2 1 − sin θ − −2 1 − sin θ + −2 1 − sin θ
θ=0 θ=π/2 θ=3π/2
√ √ √ √ √ √ √
= 2 −2 1 − 1 + 2 1 − 0 − −2 1 + 1 + 2 1 − 1 + −2 1 − 0 + 2 1 + 1
√ √ √
= 2 2+2 2−2+2 2
√ √
= 2 4 2 =8
La spirale di Archimede
La spirale di Archimede è una curva la cui equazione polare è ρ(θ) = kθ con k parametro
assegnato, positivo e θ che varia nell’intervallo [0, θf ] (si veda figura 5.14 per vedere cosa
succede aumentando θf ).
dρ
Per calcolare la lunghezza di questa curva, poichè = k si ha
dθ
Z θf p Z θf p
L= k 2 + (kθ)2 dθ = k 1 + θ2 dθ
0 0
76
5.10. Lunghezza di una curva polare
Per capire come si arriva al risultato, vediamo nei dettagli la sua risoluzione (specie perchè
1
si tratta di un integrale che può capitare R √ di incontrare anche in altre occasioni).
Calcoliamo quindi l’integrale 2
1 + x dx (per semplicità consideriamo l’integrale
indefinito e usiamo x al posto di θ).
Facciamo un cambiamento di variabile ponendo x = tan u. Sappiamo che D(tan u) =
1 1
. La funzione viene chiamiata anche secante (trigonometrica) e indicata con il
cos2 u cos u
1
simbolo sec u (sec u = ). Per semplicità useremo anche noi questa terminologia.
cos u
Consideriamo, inoltre, queste relazioni che useremo nel seguito:
G 1 + tan2 u = 1 +
sin2 u
cos2 u
=
cos2 u + sin2 u
cos2 u
=
1
cos2 u
= sec2 u
G D(sec u) = D(
1
cos u
)=
sin u
cos2 u
=
tan u
cos u
= tan u sec u
1
Tornando all’integrale, da x = tan u si ha dx = D(tan u)du = du = sec2 udu.
cos2 u
Sostituendo si ha
Z p Z p
I= 2
1 + x dx = 1 + tan2 u sec2 udu
esiste tutta questa lunga procedura che ci apprestiamo a descrivere per giungere alla formula finale (e quindi
torneremo su questi appunti per ricordarci quale sia il risultato dell’integrale).
77
5. L E CURVE
78
5.11. Funzioni a valori vettoriali
f : [a, b] → Rn
G Si dice sostegno (oppure traccia o traiettoria) della curva l’insieme f ([a, b]) (il codominio
della funzione).
G Un curva f si dice di classe C se f è di classe C ([a, b]) (cioè se ogni sua componente è di
k k
classe C k ).
La curva rappresentata dalla f viene detta anche curva γ.
79
5. L E CURVE
Esempio
Es. 5.12.1 La curva data da
f : [a, b] → Rn
dx(tp ) dy(tp )
r~t = (x(tp ) + t, y(tp ) + t)
dt dt
Definizione 5.13.2 Il vettore f 0 (tp ) si dice vettore tangente alla curva γ in f (tp ).
f 0 (t)
τ (t) =
|f 0 (t)|
Definizione 5.14.1 Data una curva γ di classe C 1 , data da f : [a, b] → Rn si chiama curva
opposta la curva Γ data da F : [−b, −a] → Rn per la quale F(u) = f (−u)
La curva orientata +Γ ha orientamento naturale opposto a quello della curva +γ. Proprio
per questo motivo, si può indicare con −γ la curva opposta +Γ.
80
5.16. L’ascissa curvilinea
poligonali così create, considerando tutte le possibili suddivisioni dell’intervallo [a, b] fatte
con un numero finito di punti.
Una curva che ha lunghezza finita si dice rettificabile.
Una curva regolare è rettificabile e la sua lunghezza è data da
Z b
L= |f 0 (t)|dt
a
Osserviamo che questa formula è esattamente quella che abbiamo ricavato in precedenza.
Per una curva regolare a tratti si ha un’analoga definizione, considerando la somma delle
lunghezze delle curve regolari di cui è composta.
Proposizione 5.15.1 L’integrale che fornisce la lunghezza di una curva non cambia se si
considera la curva opposta a quella data o se si considera la curva mediante rappresentazioni
equivalenti.
Questa funzione rappresenta la lunghezza dell’arco di curva tra f (a) e f (t) ed è detta ascissa
curvilinea. È una funzione crescente poichè s0 (t) = |f 0 (t)| > 0 (essendo la curva regolare).
La sua inversa è una funzione Φ(s) tale che Φ(s) = t e tale che ∀s ∈ [0, L] (dove L è la
lunghezza della curva γ) si ha Φ(0) = a, Φ(L) = b e Φ0 (s) > 0.
Ma, allora, f è equivalente alla funzione g = f ◦ Φ. La funzione g dipende dall’ascissa
curvilinea s.
La rappresentazione di una curva mediante l’ascissa curvilinea non dipende dalla
rappresentazione parametrica da cui si è partiti.
Non abbiamo considerato il modulo di Φ0 (s) essendo questa funzione positiva e scalare.
1
Poichè Φ è la funzione inversa di s, per la derivata vale Φ0 (s) = 0 (la derivata della
s (Φ(s))
inversa di una funzione è uguale al reciproco della derivata della funzione stessa), andando
a sostituire, si trova:
|g0 (s)| = 1
4
Considerando il differenziale dell’ascissa curvilinea si ha la cosiddetta lunghezza dell’arco
elementare:
ds = |f 0 (t)|dt
81
C APITOLO 6
Superfici parametriche
Alla stessa maniera con cui abbiamo visto le equazioni di una curva parametrica co-
me una funzione vettoriale, anche una superficie parametrica può essere vista come una
funzione vettoriale che dipende da due variabili ~r : R2 −→ R3 , tale che
La funzione vettoriale è definita su una regione D del piano uv e l’insieme dei pun-
ti (x, y, z) ∈ R3 , che sono i valori della funzione vettoriale, prende il nome di superficie
parametrica S.
83
6. S UPERFICI PARAMETRICHE
Esempio
Es. 6.1.1 Sia data la superficie di equazioni parametriche
x = 4 cos u, y = v, z = 4 sin u
Esempio
Es. 6.1.2 Nell’esempio di prima, non c’erano limitazioni ai parametri u e v. Se invece
poniamo delle limitazioni avremo una porzione di cilindro. Facciamo variare u in [0, π/4]
e v in [0, 1]. In Figura 6.2 possiamo osservare la superficie che otteniamo.
84
6.1. Superfici parametriche
Se una superficie parametrica S è data dalla funzione vettoriale ~r(u, v), è utile definire due
famiglie di curve che si trovano sulla superficie: una famiglia di curve che si ha considerando
u costante e l’altra che si ha considerando v costante. Queste due famiglie corrispondono a
linee verticali e orizzontali nel piano uv.
Prendendo u = u0 , la funzione vettoriale ~r(u0 , v) diventa una funzione vettoriale dipenden-
te dal solo parametro v e definisce una curva γ1 che giace sulla superficie S. Analogamente,
per v = v0 , si ha la curva γ2 data da ~r(u, v0 ) sulla superficie S.
Le due curve prendono il nome di curve coordinate o curve di griglia. I grafici che abbiamo
fatto per visualizzare le superfici degli esempi precedenti mostrano queste curve coordinate.
85
6. S UPERFICI PARAMETRICHE
Figura 6.5: Superficie sferica. Il grafico è fatto usando coordinate cartesiane (a sinistra) e
coordinate sferiche (a destra).
Esempio
Es. 6.1.3 L’equazione di una sfera di centro l’origine e raggio r è data da x2 +y 2 +z 2 = r2 .
Possiamo descrivere la sfera usando equazioni parametriche del tipo
p
x = x, y = y, z = ± r 2 − x2 − y 2
Osserviamo che abbiamo due funzioni per z. Usando queste equazioni e unendo i grafici,
otteniamo la sfera che si vede in Figura 6.5 a sinistra: parti della sfera non sono rappre-
sentate ma ci sono dei buchi, perchè x e y sono fatti variare in un dominio rettangolare e,
in corrispondenza dei buchi abbiamo delle radici quadrate di valori negativi! Se usiamo
invece coordinate sferiche, i punti hanno coordinate con ρ = r, da cui,
86
6.2. Piano tangente a una superficie parametrica
Il grafico della sfera usando le coordinate sferiche è in Figura 6.5 a destra. Osser-
viamo come la superficie sia ben rappresentata. In questo caso le curve coordinate
per φ costante sono delle circonferenze di valore costante (che corrispondono ai no-
ti paralleli che si studiano in geografia). Per θ costante abbiamo invece i meridiani
(semicirconferenze perchè 0 ≤ φ ≤ π) che collegano polo nord e polo sud.
87
6. S UPERFICI PARAMETRICHE
semplicità, nella figura 6.6 abbiamo messo sul piano il vettore ~n (anche se esso potrebbe
stare da tutt’altra parte). Ora, poichè ~n è ortogonale al piano, esso è ortogonale ad ogni
vettore che giace nel piano. In particolare esso è ortogonale al vettore ~r − r~0 . Vale dunque:
~n · (~r − r~0 ) = 0
Se ~n è un vettore di componenti (a, b, c), poichè ~r − r~0 = (x − x0 , y − y0 , z − z0 ), il prodotto
scalare diventa
a(x − x0 ) + b(y − y0 ) + c(z − z0 ) = 0
Questa è l’equazione scalare del piano. Spesso troviamo l’equazione scritta nella forma
ax + by + cz = d dove d = ax0 + by0 + cz0
Osserviamo quindi che, data l’equazione di un piano possiamo ricavare facilmente un vettore
normale al piano: esso è dato da ~n = (a, b, c).
Ora, dati due vettori ~a e ~b in R3 , il prodotto vettoriale ~a × ~b è un vettore che punta nella
direzione perpendicolare al piano individuato dai due vettori ~a e ~b, mentre la sua lunghezza
è data da
|~a × ~b| = |~a||~b| sin θ
dove θ è l’angolo compreso dai due vettori (0 ≤ θ ≤ π). Da questa formula deduciamo che
se i due vettori sono paralleli allora il loro prodotto vettoriale è nullo e viceversa. Come
interpretazione geometrica si ha che la lunghezza del prodotto vettoriale rappresenta l’area
del parallelogramma individuato dai vettori ~a e ~b. Per trovare le componenti del prodotto
vettoriale si ha la formula legata al determinante della matrice che ha sulla prima riga i
versori dell’asse delle x, delle y e delle z rispettivamente, sulla seconda riga le componenti
del vettore ~a e sulla terza riga le componenti del vettore ~b. Si calcola il determinante della
matrice rispetto alla prima riga in modo da avere come risultato un vettore. Sia ~a = (a1 , a2 , a3 )
e ~b = (b1 , b2 , b3 ). I versori unitari dei tre assi siano dati da ~i, ~j, ~k. Il prodotto vettoriale ~a × ~b è
dato da
~i ~j ~k
a2 a3 a1 a3 a1 a2
~ ~ ~ ~
~a × b = a1 a2 a3 = i
−j +k
b1 b2 b3 b2 b3 b1 b3 b1 b2
88
6.2. Piano tangente a una superficie parametrica
Quindi se abbiamo due vettori ~a e ~b che si trovano sul piano di cui vogliamo scrivere l’e-
quazione, il loro prodotto vettoriale è il vettore normale al piano e può essere utilizzato per
scrivere l’equazione del piano tangente.
Tornando al piano tangente ad una superficie parametrica in un punto P0 , poichè abbia-
mo trovato i due vettori tangenti r~tu e r~tv che si trovano sul piano tangente alla superficie,
allora il piano tangente è individuato dal vettore ~n = r~tu × r~tv (i due vettori non devono essere
tangenti tra loro).
Esempio
Es. 6.2.1 Sia data la superficie di equazioni parametriche
x = 2u2 , y = 3v 2 , z = 3u + 5v
Vogliamo trovare l’equazione del piano tangente alla superficie nel punto P0 (2, 3, 8).
Notiamo che questo punto si ha per u = v = 1.
Calcoliamo i due vettori tangenti r~tu e r~tv .
Poichè
∂x ∂y ∂z
= 4u, = 0, =3
∂u ∂u ∂u
valutando queste derivate in (1, 1) abbiamo
r~tu = (4, 0, 3)
Analogamente, poichè
∂x ∂y ∂z
= 0, = 6v, =5
∂v ∂v ∂v
valutando queste derivate in (1, 1) abbiamo
r~tv = (0, 6, 5)
Il prodotto vettoriale è
~i ~j ~k
o ancora
89
C APITOLO 7
Integrali
91
7. I NTEGRALI
Quindi, fissato un certo valore di x, calcoliamo l’integrale della funzione f (x, y), come funzio-
ne che dipende solo da y, per y0 ≤ y ≤ y1 . Al variare di x varia l’integrale. E l’integrale varia
anche al variare di y0 e y1 , perciò è una funzione che dipende da tre variabili, y0 , y1 e x.
La F è una funzione continua.
∂F ∂F
= f (x, y1 ) = −f (x, y0 )
∂y1 ∂y0
Dimostrazione.
La prima relazione segue dal fatto che, poichè stiamo facendo la derivata rispetto a y1 (che
è il secondo estremo dell’intervallo di integrazione), posso considerare la F come funzione
integrale di una funzione dipendente da una sola variabile. In particolare, fissati x e y0 ,
considero la funzione g(y) = f (x, y) e
Z y1
F1 (y1 ) = F (y0 , y1 , x) = g(y)dy
y0
Mi riconduco dunque al caso visto prima, da cui F10 (y1 ) = g(y1 ). Ma g(y1 ) = f (x, y1 ) e F10 (y1 )
∂F (y0 , y1 , x)
altro non è che la derivata della funzione F per y0 e x fissati, quindi F10 (y1 ) =
∂y1
Ricaviamo dunque
∂F (y0 , y1 , x)
= f (x, y1 )
∂y1
Per trovare la seconda formula che abbiamo scritto nella proposizione, basta ricordare
Rb Ra
che a g(x)dx = − b g(x)dx da cui
Z y1 Z y0
f (x, y)dy = − f (x, y)dy
y0 y1
92
7.2. Richiamo sugli integrali semplici
93
7. I NTEGRALI
Rb
Figura 7.1: Come si arriva alla definizione di a
f (x)dx.
dove a ≤ x ≤ b. Per integrali di questo tipo, diciamo che stiamo integrando la funzione f (x)
nell’intervallo [a, b]. I punti a e b si dicono estremi dell’intervallo di integrazione.
Il concetto di integrale di una funzione si deriva considerando l’area che si trova sotto la
curva definita da y = f (x) nell’intervallo [a, b] (supponiamo per semplicità che la funzione f
sia positiva, ma il concetto si generalizza a funzioni negative o che hanno valori sia positivi
che negativi... il valore di un integrale può essere sia positivo che negativo, a seconda della
funzione da integrare).
Per calcolare l’area sottesa dalla funzione y = f (x) possiamo pensare di dividere l’inter-
vallo [a, b] in n parti uguali, in modo da avere n sottointervalli di ampiezza ∆x. In ciascuno
di questi sottointervalli scegliamo un punto x∗i (ad esempio il punto medio di ciascuno dei
sottointervalli) e consideriamo il rettangolo di ampiezza ∆x e altezza f (x∗i ) (si veda Figu-
ra 7.1). Ciascuno di questi rettangoli ha area pari a f (x∗i )∆x, quindi l’integrale può essere
approssimato mediante la somma delle aree di ciascun rettangolo:
Z b
f (x)dx ≈ f (x∗1 )∆x + f (x∗2 )∆x + . . . + f (x∗n )∆x)
a
Per ottenere l’area esatta della nostra funzione, facciamo il limite per n che tende
all’infinito.
Z b n
X
f (x)dx = lim f (x∗i )∆x
a n→∞
i=1
94
7.3. Integrali doppi su domini rettangolari
Prendendo suddivisioni lungo l’asse x e y via via più raffinate, facendo cioè tendere
all’infinito n e m noi avremo una stima via via più accurata del volume V , vale a dire
n X
X m
V = lim f (x∗i , yj∗ )∆x∆y
n,m→∞
i=1 j=1
A questo punto abbiamo la definizione di integrale doppio (si noti la somiglianza con la
definizione data per integrale definito per funzioni di una singola variabile).
95
7. I NTEGRALI
Indichiamo, infatti come integrale doppio della funzione f sul dominio dato dal rettangolo
D proprio il volume V :
ZZ n X
X m
f (x, y)dA = lim f (x∗i , yj∗ )∆x∆y.
D n,m→∞
i=1 j=1
In questo caso, prima integriamo rispetto alla variabile x da a a b e poi integriamo rispetto a
y da c a d.
Esempio
R4R3
Es. 7.4.1 Valutiamo 0 2 xy 2 dydx.
Dobbiamo prima integrare rispetto alla variabile y, considerando x costante, ottenendo
Z 3 3 3
2 y
xy dy = x
2 3 2
33 23 19
=x −x = x
3 3 3
Il valore che abbiamo ottenuto corrisponde alla funzione A(x) introdotta prima.
Integriamo questa funzione per x che varia da 0 a 4. Otteniamo
Z 4Z 3 Z 4 Z 3
xy 2 dydx = xy 2 dy dx
0 2 0 2
4 4
19 x2
Z
19 19 152
= xdx = = 8=
0 3 3 2 0 3 3
96
7.5. Integrali doppi su domini generali
Esempio
R3R4
Es. 7.4.2 Proviamo ora a calcolare 2 0 xy 2 dxdy.
Questa volta dobbiamo integrare prima rispetto a x e poi rispetto a y. Abbiamo
Z 3Z 4 Z 3 Z 4
2 2
xy dxdy = xy dx dy
2 0 2 0
3 4
x2 2
Z
= y dy
2 2 0
Z 3 3 3
y
= 8y 2 dy = 8
2 3 2
33 23 152
= 8( − )=
3 3 3
Osserviamo come abbiamo ottenuto lo stesso risultato scambiando l’ordine di
integrazione. Si ha infatti il seguente teorema.
Teorema 7.4.1 (di Fubini) Se f (x, y) è una funzione continua su D = [a, b] × [c, d] allora:
ZZ Z b Z d Z d Z b
f (x, y)dA = f (x, y)dydx = f (x, y)dxdy
D a c c a
o,
! !
ZZ Z b Z d Z d Z b
f (x, y)dA = f (x, y)dy dx = f (x, y)dx dy
D a c c a
Quindi abbiamo due strade equivalenti per calcolare un integrale doppio di una funzione
continua su un dominio rettangolare, riconducendoci a integrali di una sola variabile che
sappiamo calcolare. Riassumendo:
G
nel primo caso
!
ZZ Z Z Z Z b d b d
f (x, y)dA = f (x, y)dydx = f (x, y)dy dx
D a c a c
noi prima calcoliamo l’integrale che sta all’interno (tra parentesi tonde), vale a dire,
Rd
c
f (x, y)dy considerando x come una costante e integrando rispetto alla variabile y. Co-
me risultato avremo una funzione che dipende solo da x e sarà questa che poi andremo
a integrare tra a e b rispetto alla variabile x;
G nel secondo caso
!
ZZ Z Z Z d Z b d b
f (x, y)dA = f (x, y)dxdy = f (x, y)dx dy
D c a c a
Rb
andiamo prima a calcolare l’integrale a f (x, y)dx rispetto a x, considerando y come una
costante e poi andremo a integrare il risultato ottenuto rispetto a y nell’intervallo [c, d].
97
7. I NTEGRALI
Figura 7.4: Dominio normale rispetto all’asse x (sinistra) e rispetto all’asse y (destra).
non si riduce ad un rettangolo ma può avere una forma più generale. Consideriamo il caso
in cui il dominio di integrazione sia un insieme limitato D (perciò esiste un rettangolo R che
lo contiene).
In tal caso l’integrale di una funzione f (x, y) sul dominio R si può ricondurre all’integrale
di una funzione F (x, y) sul rettangolo R così definita:
(
f (x, y) se (x, y) appartiene a D
F (x, y) =
0 se (x, y) appartiene a R ma non a D
Allora
ZZ ZZ
f (x, y)dA = F (x, y)dA
D R
Teorema 7.5.1 (di Fubini) Data una funzione f (x, y) da integrare su un dominio D,
98
7.5. Integrali doppi su domini generali
n o
Figura 7.5: A sinitra: D = (x, y) ∈ R2 : 1 ≤ y ≤ 2, y ≤ x ≤ y 3 . Il dominio è normale rispetto
n √ o
all’asse y. A destra: D = (x, y) ∈ R2 : 0 ≤ x ≤ 1, x3 ≤ y ≤ x . Il dominio è normale rispetto
all’asse x.
Figura 7.6: Dominio dato dal triangolo di vertici (0, 3), (1, 1) e (5, 3)
G nel caso in cui il dominio di integrazione è normale rispetto all’asse x (Caso 1) si ha:
ZZ Z b Z g2 (x)
f (x, y)dA = f (x, y)dydx
D a g1 (x)
G nel caso in cui il dominio di integrazione è normale rispetto all’asse y (Caso 2) si ha:
ZZ Z d Z h2 (y)
f (x, y)dA = f (x, y)dxdy
D c h1 (y)
Esaminiamo il Caso 1 (il discorso si ripete analogo per il Caso 2). Noi calcoliamo prima
R g (x)
l’integrale interno g12(x) f (x, y)dy considerando x come costante, rispetto alla variabile y. Il
risultato ora dipende da x in quanto gli estremi di integrazione sono funzioni di x. Una volta
ottenuto questo integrale, integriamo il risultato rispetto alla variabile x con estremi a e b.
A volte, un dominio può essere considerato normale sia rispetto all’asse x sia rispetto
all’asse y. Altre volte può essere visto come unione di due domini. A seconda dell’integrale
che si deve fare, conviene scegliere di vederlo in un modo piuttosto che in un altro.
99
7. I NTEGRALI
Esempio
Es. 7.5.1 Nel caso del triangolo mostrato in Figura 7.6, il dominio può essere visto co-
me l’unione di due domini normali rispetto all’asse x, oppure come un dominio normale
rispetto all’asse y.
Nel primo caso, D = D1 ∪ D2 , in quanto la funzione g1 (x) varia a seconda di dove si trovi
x:
Esempio
Es. 7.5.2 Calcoliamo D x2 dA dove D è l’insieme delimitato dalle parabole y = 3x2 e
RR
y = x2 + 2. Prima di tutta facciamo un grafico dell’insieme D (si veda Figura 7.7). I punti
di intersezione delle due parabole si hanno per 3x2 = x2 + 2 cioè 2x2 − 2 = vale a dire per
x = ±1. Si vede facilmente che il dominio è normale rispetto all’asse x: basta considerare
−1 ≤ x ≤ 1 e 3x2 ≤ y ≤ x2 + 2. Infatti la curva che delimita la porzione inferiore della
frontiera dell’insieme è data da y = 3x2 mentre la porzione superiore della frontiera è
y = x2 + 2. L’integrale diventa
ZZ Z 1 Z x2 +2
x2 ydA = x2 dydx
D −1 3x2
Z 1
2 y=x2 +2
= x y y=3x2
−1
Z 1
= x2 (x2 + 2 − 3x2 )dx
−1
1 3 1
x5
Z
x 2 2 8
= 2x2 − 2x4 dx = 2 − 2 =2 −2 =
−1 3 5 −1 3 5 15
Esempio
R1R1
Es. 7.5.3 Sia da calcolare l’integrale 0 y sin x2 dxdy. Se cerchiamo di valutare l’inte-
grale così come ci è stato presentato, abbiamo la difficoltà di dover valutare sin x2 dx.
R
Si tratta, infatti, di uno di quegli integrali impossibili da valutare mediante funzioni ele-
mentari! Ci conviene allora cambiare l’ordine di integrazione. Cerchiamo allora di ca-
pire come
n è fatto il dominio di integrazione
o D. Da come è scritto l’integrale, risulta
2
D = (x, y) ∈ R : 0 ≤ y ≤ 1, y ≤ x ≤ 1 . Facciamo il grafico (si veda Figura 7.8). Que-
sto dominio lo possiamo vedere come normale rispetto all’asse x prendendo 0 ≤ x ≤ 1 e
0 ≤ y ≤ x.
100
7.6. Proprietà degli integrali doppi
R1R1
Figura 7.8: Dominio di integrazione dell’integrale 0 y
sin x2 dxdy.
Quindi
Z 1Z 1 ZZ
sin x2 dxdy = sin x2 dA
0 y D
Z 1Z x Z 1 y=x
2
y sin x2 y=0 dx
= sin x dydx =
0 0 0
Z 1 Z 1
1
= x sin x2 dx = 2x sin x2 dx
0 2 0
1
d(x2 )
Z
1 1 1 1
= sin x2 dx = − cos x2 0 = (1 − cos 1)
2 0 dx 2 2
101
7. I NTEGRALI
Questa trasformazione può essere vista come una funzione vettoriale ~r = (x(u, v), y(u, v)).
L’ipotesi fondamentale, allo scopo di calcolare un integrale doppio, è che la trasformazione
ci permetta di ottenere tutti i punti del dominio di integrazione.
Una trasformazione T è dunque una funzione in cui sia il dominio che il codominio sono
sottoinsiemi di R2 . Se T (u1 , v1 ) = (x1 , y1 ) allora il punto (x1 , y1 ) è l’immagine del punto (u1 , v1 )
mediante la trasformazione. Se la trasformazione è una corrispondenza biunivoca tra l’insie-
me di definizione e il codominio della trasformazione, allora si può definire la trasformazione
inversa T −1 e si dice che la trasformazione è globalmente invertibile (si veda Figura 7.9).
102
7.7. Cambiamento di variabili
Figura 7.10: Trasformazione dell’elemento S nel piano uv nell’elemento R nel piano xy.
dove x = g(u), a = g(c), b = g(d). Nel caso di funzioni di due variabili, cosa si fa e per quale
motivo?
103
7. I NTEGRALI
La regione R = T (S) può essere approssimata dal parallelogramma dato dai vettori secanti
(si veda Figura 7.11) dati da
Quindi l’area della regione R può essere approssimata attraverso dall’area del parallelogram-
ma di lati ~a e ~b cioè ∆u~
rtu e ∆v r~tv . L’area del parallelogramma determinato da due vettori
è dato dal modulo del prodotto vettoriale dei due vettori stessi. Quindi l’area di R si può
approssimare tramite |(∆u~ rtu ) × (∆v r~tv )|. Si ha, quindi,
104
7.7. Cambiamento di variabili
Figura 7.12: Cambio di variabili per il calcolo di integrali doppi: trasformazione della regione
S nella regione R mediante la trasformazione regolare T .
∂(x, y)
Ritroviamo lo jacobiano delle due funzioni x e y rispetto a u e v: . Perciò, area(R) ≈
∂(u, v)
∂(x, y)
∂(u, v) ∆u∆v.
Si arriva perciò al seguente teorema (che non dimostriamo, però tutti i discorsi appena
fatti ci portano a intuire che il risultato non può che essere così!).
Teorema 7.7.1 Sia data una trasformazione regolare T della regione S del piano uv alla re-
gione R del piano xy. Inoltre sia assegnata una funzione f continua in R. Supponiamo che le
regioni R e S siano domini normali rispetto all’asse x o y. Allora
ZZ ZZ
∂(x, y)
f (x, y)dA = f (x(u, v), y(u, v) dudv
R S ∂(u, v)
105
7. I NTEGRALI
RR
Figura 7.14: Insiemi S e R per il calcolo dell’integrale R
4x + 8ydA.
Esempio
Es. 7.7.1 Consideriamo il caso della trasformazione data dalle coordinate polari, per cui
x(ρ, θ) = ρ cos (θ) e y(ρ, θ) = ρ sin (θ).
Il rettangolino ∆θ∆ρ viene trasformato in una specie di rettangolino con i lati curvi.
Il disegno mostrato in figura 7.13 è stato realizzato facendo variare θ nell’intervallino
2π 2π
[ , + 0.5] e ρ in [0.5, 0.75].
3 3
Lo jacobiano di questa trasformazione è dato da
∂(x, y) cos (θ) −ρ sin (θ) 2 2
∂(ρ, θ) sin (θ) ρ cos (θ) = ρ cos (θ) + ρ sin (θ) = ρ
=
106
7.8. Area di un dominio
Esempio
RR
Es. 7.7.2 Sia da calcolare 4x + 8ydA dove R è il parallelogramma di vertici A(−1, 3),
R
1 1
B(1, −3), C(3, −1) e D(1, 5). Si applichi la trasformazione x = (u + v), y = (v − 4u).
4 4
Il parallelogramma R è rappresentato in Figura 7.14. Se scriviamo le equazioni dei lati del
parallelogramma si trova facilmente che la retta per AB è data dall’equazione y + 3x = 0,
la retta per CD è data da y + 3x = 8, la retta per BC è x − y = 4 e infine quella per AD è
x − y = −4.
Da queste relazioni, si vede che ponendo u = x−y e v = y +3x, si ricava la trasformazione
1 1
assegnata x = (u + v), y = (v − 4u). Inoltre si vede che R è l’immagine del rettangolo S
4 4
delimitato dalle linee u = 4, u = −4, v = 0 e v = 8.
Se calcoliamo lo jacobiano delle funzioni x e y rispetto a u e v otteniamo
1
−3
∂(x, y) 4 4 1
∂(u, v) =
=
1 4
1
4 4
Allora
ZZ ZZ ZZ
1 1 1 1
4x + 8ydA = 4 (u + v) + 8 (v − 3u) dudv = (u + v + 2v − 6u) dudv
R S 4 4 4 S 4
v=8
1 4 8 1 4 3 2
Z Z Z
= (3v − 5u)dvdu = v − 5uv du
4 −4 0 4 −4 2 v=0
1 4
Z
1 u=4
= (96 − 40u)du = 96u − 20u2 u=−4 = 192
4 −4 4
Proviamo a dimostrare questo risultato, supponendo che D sia un dominio normale ri-
spetto all’asse x, da cui a ≤ x ≤ b e g1 (x) ≤ y ≤ g2 (y). L’area compresa tra le curve g2 (x) e
g1 (x), vale a dire l’area di D, può essere calcolata proprio come la differenze degli integrali
delle due funzioni, tramite l’integrale
Z b
area(D) = (g2 (x) − g1 (x))dx
a
107
7. I NTEGRALI
abbiamo
ZZ Z b Z g2 (x)
dxdy = ( dy)dx
D a g1 (x)
Z b
= (g2 (x) − g1 (x))dx
a
e, per quanto abbiamo appena visto
= area(D)
Abbiamo 6 diverse possibilità di integrazione, prima rispetto a x, poi rispetto a y, poi rispetto
a z, oppure lungo y, x, z, o ancora... (tutte le possibili combinazioni che si hanno scambiando
l’ordine delle tre variabili). Il risultato che si ottiene non cambia (consideriamo l’integrale di
funzioni continue, in modo da estendere il teorema di Fubini).
108
7.10. Integrali curvilinei
Si ha, inoltre, che il volume di una regione tridimensionale E è dato da un integrale triplo
e, precisamente
ZZZ
volume(E) = dV
E
2. Secondo caso: E = {(x, y, z) t.c. (y, z) ∈ D, u1 (y, z) ≤ x ≤ u2 (y, z)}, dove D è un regione
nel piano yz (che a sua volta può essere visto come un dominio normale rispetto all’asse
y o rispetto all’asse z). La regione E viene detta normale rispetto al piano yz. Se si riesce
a vedere l’insieme D come normale rispetto all’asse z allora si parla di integrazione per
strati o per sezione.
ZZZ Z Z "Z u2 (y,z)
#
f (x, y, z)dV = f (x, y, z)dx dA
E D u1 (y,z)
3. Secondo caso: E = {(x, y, z) t.c. (x, z) ∈ D, u1 (x, z) ≤ y ≤ u2 (x, z)}, dove D è un regione
nel piano xz (che a sua volta può essere visto come un dominio normale rispetto all’asse
x o rispetto all’asse z). La regione E viene detta normale rispetto al piano xz. Se l’in-
sieme D lo si può vedere come normale rispetto all’asse z allora si parla di integrazione
per strati o per sezione.
ZZZ Z Z "Z u2 (x,z)
#
f (x, y, z)dV = f (x, y, z)dy dA
E D u1 (x,z)
109
7. I NTEGRALI
Esempio
Es. 7.10.1 Vogliamo calcolare γ (4+xy 2 )ds dove γ è la porzione di circonferenza di centro
R
Se la curva è regolare a tratti, l’integrale curvilineo si scrive come somma degli integrali
curvilinei su ciascun tratto di curva regolare di cui è composta. In pratica se γ = γ1 ∪γ2 . . .∪γn
con n numero intero, allora
Z Z Z Z
g(x, y)ds = g(x, y)ds + g(x, y)ds + . . . + g(x, y)ds.
γ γ1 γ2 γn
Proposizione 7.10.1 Se si cambia l’orientamento di una curva, passando dalla curva +γ alla
curva −γ l’integrale curvilineo non cambia:
Z Z
g(x, y)ds = g(x, y)ds
γ −γ
110
7.11. Integrali di superficie
derivata di ~r rispetto alle variabili u e v, rispettivamente. Il discorso da fare è del tutto ana-
logo a quanto abbiamo visto nella sezione 7.7. L’area del parallelogramma, che approssima
l’area dell’elementino, è dunque uguale al modulo del prodotto vettoriale di ∆u~ru (ui , vj ) e
∆v~rv (ui , vj ).
L’area della superficie sarà dunque data dalla somma di tutte queste aree, facendo ten-
dere a infinito il numero degli elementini in cui suddividiamo la superficie. Si ha infatti la
definizione
Definizione 7.11.1 Data una superficie S di equazione ~r(u, v) = (x(u, v), y(u, v), z(u, v)), con
(u, v) ∈ D, allora l’area della superficie è data da
ZZ
area(S) = |~ru × ~rv |dA
D
∂x ∂y ∂z ∂x ∂y ∂z
dove ~ru = ( , , ) e ~rv = ( , , ).
∂u ∂u ∂u ∂v ∂v ∂v
Nel caso in cui la superficie è data da una funzione z = f (x, y), possiamo ricondurci al
caso precedente considerando ~r(u, v) = ~r(x, y) = (x, y, f (x, y)).
In tal caso
~i ~j ~k
∂f
1 0
∂x = (− ∂f , − ∂f , 1)
~ru × ~rv =
∂x ∂y
0 1 ∂f
∂y
s
2 2
∂f ∂f
Perciò |~ru × ~rv | = + + 1 e l’area della superficie è
∂x ∂y
s 2 2
ZZ
∂f ∂f
A(S) = + + 1dA
D ∂x ∂y
Dobbiamo prestare molta attenzione a questo tipo di integrali perchè l’integrale a destra è
un integrale doppio mentre l’integrale a sinistra è un integrale di superficie. Quindi il calcolo
di un integrale di superficie si riconduce ad un integrale doppio.
La superficie potrebbe essere scritta come y = f (x, z) o x = f (y, z). La definizione di
integrale di superficie è analoga (con le dovute sostituzioni) a quella appena scritta.
Se la superficie, invece, è scritta in forma parametrica :
111
7. I NTEGRALI
allora si ha
ZZ ZZ
g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|~ru × ~rv |dA
S I
dove |~ru × ~rv | rappresenta il modulo del prodotto vettoriale dei vettori che si hanno derivando
parzialmente rispetto a u e rispetto a v le equazioni parametriche della superficie, in modo
da poter avere l’area dell’elementino di superficie dS.
Quindi
~i ~j ~k
∂y ∂z ∂x ∂z ∂x ∂y
∂x ∂y ∂z
~ ∂u ∂u ~ ∂u ∂u ~ ∂u ∂u
~n = ~ru × ~rv = ∂u ∂u ∂u = i −j +k
∂y ∂z ∂x ∂z ∂x ∂y
∂x ∂y ∂z ∂v ∂v ∂v ∂v ∂v ∂v
∂v ∂v ∂v
scambiamo le colonne del sottodeterminante relativo a ~j
∂y ∂z ∂z ∂x ∂x ∂y
∂u ∂u ∂u ∂u ∂u ∂u
= ~i
+ ~j
+k
~
∂y ∂z ∂z ∂x ∂x ∂y
∂v ∂v ∂v ∂v ∂v ∂v
osserviamo che i sottodeterminanti sono degli jacobiani
∂(y, z) ∂(z, x) ∂(x, y)
~
= i ~
+j ~
+k
∂(u, v) ∂(u, v) ∂(u, v)
Chiamando
con n1, n2 e n3 le componenti
del vettore normale appena ottenuto, n1 =
∂(y, z)
, n2 = ∂(z, x) e n3 = ∂(x, y) , il modulo di ~n è dato da |~n| = (n1 )2 + (n2 )2 + (n3 )2 .
p
∂(u, v) ∂(u, v) ∂(u, v)
Quindi
ZZ ZZ
g(x, y, z)dS = g(x(u, v), y(u, v), z(u, v))|~ru × ~rv |dA
S
Z ZD p
= g(x(u, v), y(u, v), z(u, v)) (n1 )2 + (n2 )2 + (n3 )2 dA
D
Esempio
RR
Es. 7.11.1 Calcoliamo l’integrale di superficie I = S
yzdS dove S è la superficie di
equazioni parametriche x = u2 , y = u sin (v), z = u cos (v), con 0 ≤ u ≤ 1 e 0 ≤ v ≤ π/2.
L’integrale da calcolare diventa l’integrale doppio
ZZ Z 1 Z π/2
I= u sin (v)u cos (v)|~ru × ~rv |dudv = u2 sin (v) cos (v)|~ru × ~rv |dvdu
D 0 0
~k
~i ~j
cos (v) = . . . = ~i(−u) + ~j(2u2 sin (v)) + ~k(2u2 cos (v))
~ru × ~rv = 2u sin (v)
0 u cos (v) −u sin (v)
112
7.12. Solidi e superfici di rotazione
L’integrale è
Z 1 Z π/2 p Z 1 Z π/2 p
I= u2 sin (v) cos (v)u 1 + 4u2 dvdu = u3 1 + 4u2 sin (v) cos (v)dvdu
0 0 0 0
Osserviamo che abbiamo funzioni che dipendono solo da v e funzioni che dipendo-
no solo da u, perciò le funzioni che dipendono solo da u, le possiamo portare fuori
dall’integrale in v, ricavando
Z 1 p Z π/2
3
I= u 1+ 4u2 sin (v) cos (v)dvdu
0 0
Ora
π/2 π/2 π/2
sin2 (v)
Z Z
1
sin (v) cos (v)dv = sin (v)D(sin (v))dv = =
0 0 2
0 2
t−1 dt
Facciamo un cambiamento di variabili ponendo t = 1+4u2 da cui u2 = e 2udu = ,
4 4
dt
ovvero udu = . Inoltre, per u = 0 si ha t = 1 e per u = 1 si ha t = 5. Quindi
8
1 5 t − 1 √ dt
Z 1 p Z
1
I= u2 1 + 4u2 udu = t
2 0 2 1 4 8
Z 5 √ √ Z 5
1 1
= (t t − t)dt = (t3/2 − t1/2 )dt
64 1 64 1
5 √
1 2 5/2 2 3/2 5 5 1
= t − t = ... = +
64 5 3 1 48 240
Definizione 7.12.1 Si definisce massa di un oggetto piano che riempe una regione C, con
densità data da µ(x, y) (funzione continua), la quantià m data da
ZZ
m= µ(x, y)dxdy
C
113
7. I NTEGRALI
Se un oggetto piano riempe una regione C con densità µ(x, y) (continua), i suoi momenti
sono dati da
ZZ
Mx = yµ(x, y)dxdy
Z ZC
My = xµ(x, y)dxdy
C
G i momenti sono
Z Z
Mx = yds My = xds
γ γ
G il baricentro ha coordinate
Z Z
My 1 Mx 1
x= = xds y= = yds
L L γ L L γ
Teorema 7.12.1 (Primo teorema di Guldino) Il volume dell’insieme I, solido di rotazione ot-
tenuto dall’insieme D è uguale all’area di D per la lunghezza della circonferenza descritta nella
rotazione dal baricentro di D.
Supponendo che la rotazione sia fatta attorno all’asse x, il raggio della circonferenza descritta
dal baricentro è data dall’ordinata del baricentro (si considera µ ≡ 1). Quindi
volume(I) = area(D) × lunghezza della circonferenza
volume(I) = area(D) × 2π raggio della circonferenza
volume(I) = area(D)2π y
RR
ydxdy
volume(I) = area(D)2π RRD
dxdy
RR D
ydxdy
ZZ
volume(I) = area(D)2π D = 2π ydxdy
area(D) D
114
7.12. Solidi e superfici di rotazione
Figura 7.16: Insieme D da cui calcolare il volume del solido di rotazione attorno all’asse x.
Teorema 7.12.2 (Secondo teorema di Guldino) L’area della superficie di rotazione S gene-
rata dalla curva γ è uguale alla lunghezza della curva per la lunghezza della circonferenza
descritta nella rotazione dal baricentro di γ.
Sia γ data da equazioni parametriche x = x(t), y = y(t) con t ∈ [a, b] e di lunghezza L.
La superficie sia ottenuta mediante rotazione attorno all’asse x. Allora la circonferenza ha
1R 1 Rb p
raggio y con y = γ
yds = a
y(t) (x0 (t))2 + (y 0 (t))2 dt. Allora
L L
area(S) = lunghezza della curva × lunghezza della circonferenza
area(S) = L2π y
Z b
1 p
area(S) = L2π y(t) (x0 (t))2 + (y 0 (t))2 dt
L a
Z b p
area(S) = 2π y(t) (x0 (t))2 + (y 0 (t))2 dt
a
115
7. I NTEGRALI
Esempio
Es. 7.12.1 Calcoliamo il volume del solido di rotazione ottenuto dalla rotazione completa
attorno all’asse x dell’insieme
3
D = (x, y) ∈ R2 : x2 + y 2 ≤ , x2 ≥ y, y ≥ 0, x ≥ 0
4
Per calcolare questo integrale dobbiamo applicare il primo teorema di Guldino. Il volume
richiesto sarà dato da
ZZ
V = 2π ydxdy
D
Si ha
1/2
r Z 1/2 r Z 1/2
√ √
Z
3 2
3 2
V = y( − y − y)dy = y − y dy − y ydy
0 4 0 4 0
r r 1/2
1 1/2
Z Z 1/2 Z 1/2
3 3/2 1 3 2 3 2
− y 2 dy − y 5/2
=− (−2y) 2
− y dy − y dy = − D( − y )
2 0 4 0 2 0 4 4 5 0
116
7.12. Solidi e superfici di rotazione
1/2
1 2 3 1 1 1 1 3 1
( − y ) − √ = − ( )3/2 + ( )3/2 − √
2 3/2
=−
2 3 4 0 10 2 3 2 3 4 10 2
√ √ √ √
1 3 1 4 3 2 3
=− √ + − √ =− √ + =− +
6 2 8 10 2 14 2 8 7 8
Esempio
Es. 7.12.2 L’arco di parabola y = x2 per 1 ≤ x ≤ 2 è ruotato attorno all’asse y. Vogliamo
trovare l’area della superficie di rotazione. In questo caso dobbiamo applicare il secondo
teorema di Guldino, vedendo la parabola come la curva di coordinate parametriche x = x,
y = x2 , per cui
Z 2 p
area(S) = 2π x 1 + 4x2 dx.
1
Quindi
Z 2 Z 2
8x p 1 p
area(S) = 2π 2
1 + 4x dx = π D(1 + 4x2 ) 1 + 4x2 dx
1 8 4 1
2
1 2(1 + 4x2 )3/2
1 3/2 3/2
= π
4 3 = 6 π(17 − 5 )
1
1 √ √
= π(17 17 − 5 5)
6
117
C APITOLO 8
Equazioni differenziali ordinarie
119
8. E QUAZIONI DIFFERENZIALI ORDINARIE
dove i coefficienti a0 (x), a1 (x), . . . , an−1 (x) e b(x) sono assegnate funzioni continue che dipen-
dono dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate
dn y
fino a quella di ordine n. Usiamo infatti la notazione y (n) per indicare .
dxn
Se nell’equazione differenziale compaiono le derivate di y fino all’ordine n, allora si dice
che l’equazione differenziale ha ordine (o grado) n. Bisogna quindi vedere l’ordine più elevato
della derivata che appare nell’equazione per capire l’ordine dell’equazione differenziale.
Per n = 1, l’equazione differenziale di prima diventa
y 0 + a(x)y = b(x)
F (x, y, y 0 , . . . , y (n) ) = 0
con f funzione continua allora si dice che l’equazione differenziale è in forma normale.
Esempio
Es. 8.1.1 Data f , funzione continua in [a, b], si vuole risolvere
Questo problema equivale a quello di trovare una primitiva della funzione f , una
funzione, cioè, la cui derivata coincide con f .
Ogni funzione della forma y(x) = F (x) + y0 con y0 costante e F una primitiva di f è
soluzione del problema assegnato, ovvero dell’equazione differenziale. Come primitiva
di f , dal
R xteorema fondamentale del calcolo integrale, sappiamo che possiamo Rx scrivere
F (x) = x0 f (t)dt dove x0 è un numero reale fissato in [a, b]. Quindi y(x) = x0 f (t)dt + y0 è
soluzione del problema dato.
120
8.2. Il problema di Cauchy in locale
L’esempio che abbiamo descritto ora è molto particolare. Infatti si ha che la soluzione
y(x) per x = x0 vale proprio la costante y0 :
Z x0
y(x0 ) = f (t)dt + y0 = y0
x0
In questo caso, si dice che y(x) è soluzione del problema di Cauchy dato da
(
y 0 (x) = f (x)
y(x0 ) = y0
dove y(x0 ) = y0 rappresenta la condizione iniziale e x0 il punto iniziale da cui far partire
la soluzione al problema.
Vediamo dunque cosa è un problema di Cauchy.
y 0 = f (x, y)
2. la f sia continua in I × J
∂f
3. la derivata parziale della f rispetto a y, , sia continua in I × J.
∂y
Sotto queste ipotesi esiste un intorno di x0 , [x0 − δ, x0 + δ] ed un’unica funzione y = y(x)
derivabile in [x0 − δ, x0 + δ] che è soluzione del problema di Cauchy dato da
(
y 0 (x) = f (x, y)
y(x0 ) = y0
Abbiamo appena stabilito una formulazione del teorema di Cauchy di esistenza e unicità
locale (in piccolo).
Teorema 8.2.1 (Teorema di Cauchy (in piccolo) per equazioni differenziali del primo ordine)
Sia f = f (x, y) una funzione reale definita nell’intervallo I × J (definito in precedenza). Se f
∂f
e la sua derivata sono funzioni continue in I × J, allora esiste un numero δ > 0 ed esiste
∂y
una ed una sola funzione y = y(x) derivabile in [x0 − δ, x0 + δ], soluzione in tale intervallo del
problema di Cauchy
(
y 0 (x) = f (x, y)
y(x0 ) = y0
121
8. E QUAZIONI DIFFERENZIALI ORDINARIE
J = {Y ∈ Rn t.c. |Y − Y0 | ≤ b}
Teorema 8.2.2 (Teorema di Cauchy in piccolo per eq. differenziali di ordine n) Sia f =
f (x, y1 , y2 , y3 , . . . , yn ) una funzione definita per x ∈ I e (y1 , y2 , . . . , yn ) ∈ J (I e J definiti prima).
Sia f continua insieme alle derivate parziali fatte rispetto a y1 , y2 , . . . , yn . Allora esiste un
numero reale δ > 0 ed una ed una sola funzione y(x), derivabile n volte in [x0 − δ, x0 + δ], che è
soluzione del seguente problema di Cauchy:
y (n) = f (x, y, y 0 , y 00 , . . . , y (n−1) )
y(x0 ) = y0
y 0 (x0 ) = y00
y 00 (x0 ) = y000
..
.
(n−1) (n−1)
y (x0 ) = y0
Con il teorema di Cauchy di esistenza e unicità locale, sono date delle condizioni sufficien-
ti per risolvere localmente, in piccolo, il problema di Cauchy, determinando una soluzione
in un intorno del punto iniziale x0 .
2. f è continua
∂f (x, y)
3. la derivata parziale di f rispetto a y è continua e limitata, quindi
≤ L per ogni
∂y
(x, y) ∈ [a, b] × R, con L numero reale positivo.
In queste ipotesi, esiste una ed una sola funzione y(x) che risolve il problema di Cauchy
(
y 0 (x) = f (x, y)
y(x0 ) = y0
122
8.4. Definizioni
Teorema 8.3.1 (Teorema di esistenza e unicità globale (caso di eq. diff. del primo ordine))
∂f (x, y)
Se f = f (x, y) è continua in [a, b] × R e la sua derivata è continua e limitata in [a, b] × R,
∂y
allora per ogni x0 ∈]a, b[ e per ogni y0 ∈ R esiste una ed una sola funzione y = y(x), derivabile
in [a, b] che risolve su tutto l’intervallo [a, b] il problema di Cauchy
(
y 0 (x) = f (x, y)
y(x0 ) = y0
Teorema 8.3.2 (Teorema di esistenza e unicità globale (caso di eq. diff. di ordine n))
Se f = f (x, y1 , y2 , y3 , . . . , yn ) è continua in [a, b] × Rn e le derivate parziali fatte rispetto a y1 ,
y2 , . . . , yn sono continue e limitate in [a, b] × Rn , allora per ogni x0 ∈]a, b[ e per ogni punto di Rn
(n−1)
dato da (y0 , y00 , . . . , y0 ) esiste una ed una sola funzione y(x), derivabile n volte in [a, b], che
è soluzione del seguente problema di Cauchy:
y (n) = f (x, y, y 0 , y 00 , . . . , y (n−1) )
y(x0 ) = y0
y 0 (x0 ) = y00
y 00 (x0 ) = y000
..
.
(n−1) (n−1)
y (x0 ) = y0
8.4 Definizioni
Consideriamo ora un’equazione differenziale del primo ordine e introduciamo le seguenti
definizioni.
G Per integrale generale si intende l’insieme delle soluzioni dell’equazione differenziale
che varia al variare di una costante c: qualunque sia la coppia (x0 , y0 ) si può stabilire il
valore della costante c tale che y(c, x0 ) = y0 .
G Per integrale particolare si intende invece una soluzione particolare dell’equazione
differenziale: fissata una coppia (x0 , y0 ) esiste una costante c tale che y(c, x0 ) = y0 .
G Si ha invece un integrale singolare se, data una coppia (x0 , y0 ), non esiste una costante c
tale che y(c, x0 ) = y0 , vale a dire che per quella coppia di dati, la soluzione dell’equazione
differenziale non rientra in un integrale particolare.
Vediamo ora tutti i passaggi per trovare l’integrale generale di questa equazione
differenziale.
1. Sia A(x) = a(x)dx una primitiva di a(x). Poniamo m(x) = eA(x) .
R
123
8. E QUAZIONI DIFFERENZIALI ORDINARIE
d(y(x)m(x))
= m(x)y 0 (x) + m(x)a(x)y(x)
dx
Abbiamo trovato il primo membro dell’equazione 8.1.
5. Possiamo quindi riscrivere l’equazione 8.1 come
d(y(x)m(x))
= m(x)b(x)
dx
6. Integrando ambo i membri dell’equazione e dividendo poi per m(x) (diversa da zero
perche è eA(x) ) si ha
Z Z
dy(x)m(x)
dx = m(x)b(x)dx + costante
dx
Z
y(x)m(x) = m(x)b(x)dx + costante
Z
1
y(x) = m(x)b(x)dx + costante
m(x)
124
8.6. Metodo di separazione delle variabili
Esempio
Es. 8.5.1 Risolviamo l’equazione differenziale y 0 + 4xy = x. In questo esempio a(x) = 4x
e b(x) = x. Applichiamo il procedimento appena descritto.
G A(x) = a(x)dx = 4xdx = 2x2 da cui m(x) = e2x .
R R 2
G Abbiamo allora
2
dy(x)e2x 2
= e2x x
dx
2
Dobbiamo quindi calcolare e2x xdx: considerando che la derivata dell’esponente è
R
Quindi
2 1 2 1 2
y(x) = e−2x ( e2x + costante) = + Ce−2x
4 4
dove C rappresenta la costante.
y 0 (x) = p(x)q(y)
y 0 (x)
= p(x)
q(y)
y 0 (x)
Z Z
dx = p(x)dx (8.2)
q(y(x))
125
8. E QUAZIONI DIFFERENZIALI ORDINARIE
1
Sia Q(y) una primitiva di e P una primitiva di p. Vuol dire che
q(y)
dQ(y(x)) dQ(y(x)) dy 1
= = y 0 (x),
dx dy dx q(y(x))
dP (x)
mentre = p(x). Tornando alla relazione 8.2, poichè abbiamo trovato le primitive di
dx
ciascuno dei due integrali, si ha
Q(y(x)) = P (x) + costante
Se è possibile esplicitare la y allora abbiamo una forma esplicita della soluzione (e questo
lo si ha se la Q è invertibile), altrimenti abbiamo una forma implicita della soluzione mediante
la relazione Q(y(x)) − P (x) = costante.
Esempio
x2
Es. 8.6.1 Sia da risolvere il problema di Cauchy, y 0 = con la condizione iniziale y(0) =
y2
4.
Risolviamo prima l’equazione differenziale, applicando il metodo di separazione delle
1
variabili (p(x) = x2 , q(y) = 2 ). Separando le variabili infatti, abbiamo da risolvere:
y
Z Z
y dy = x2 dx
2
ovvero
y3 x3
= + costante
3 3
Risolvendo ora per y (che è funzione di x) otteniamo:
Imponiamo ora la condizione iniziale y(0) = 4. Deve essere 4 = (C)1/3 da cui C = 43 = 64.
Quindi la soluzione del problema è data da y(x) = (x + 64)1/3 .
126
8.8. Le equazioni differenziali lineari
F (y, z, z 0 z) = 0
Se si trova un’integrale generale di questa equazione, z = z(y, cost), allora, per trovare
y, dalla relazione y 0 = z(y, cost) si ricava la soluzione y osservando che questa che
abbiamo appena scritto è un’equazione differenziale a variabili separabili.
G Ci sono molti altri casi di equazioni differenziali non lineari che presentano una forma
particolare e che possono essere risolte mediante tecniche ad hoc. Non stiamo però a
studiarle in questa sede.
dove i coefficienti a0 (x), a1 (x), . . . , an−1 (x) e b(x) sono assegnate funzioni continue, che dipen-
dono dalla variabile x, mentre y è la funzione incognita e compare insieme alle sue derivate
fino a quella di ordine n.
Un’equazione differenziale scritta in questa forma, prende il nome di equazione
differenziale lineare, perchè è lineare rispetto a y e alle sue derivate.
G Se ciascuna funzione ai (x), per i = 0, 2, . . . , n−1 è costante rispetto alla variabile x, allora
l’equazione differenziale prende il nome di equazione differenziale lineare a coefficienti
costanti.
G Se b(x) = 0 per ogni valore di x, allora l’equazione si dice equazione differenziale
omogenea.
G Se b(x) 6= 0 allora l’equazione si dice equazione differenziale non omogenea.
L’equazione che si ha ponendo b(x) ≡ 0 si dice equazione omogenea associata
all’equazione di partenza in cui b(x) 6= 0.
Per quanto riguarda il problema di Cauchy associato ad un’equazione differenziale lineare
di ordine n, vale il seguente teorema.
Teorema 8.8.1 Se le funzioni a0 (x), a1 (x), . . . , an−1 (x) sono continue in un intervallo [a, b], allora
il problema di Cauchy
y (n) + an−1 (x)y (n−1) + . . . + a1 (x)y 0 + a0 (x)y = b(x)y(x0 ) = y0
y 0 (x0 ) = y00
y 00 (x0 ) = y000
.
..
y (n−1) (x ) = y (n−1)
0 0
(n−1)
ammette sempre un’unica soluzione y(x) qualunque sia il punto (x0 , y0 , y00 , . . . , y0 ) associato
alle condizioni iniziali.
127
8. E QUAZIONI DIFFERENZIALI ORDINARIE
L(y) = b(x)
Difatti:
Usando l’operatore L, è facile dedurre, facendo uso delle proprietà delle derivate, che vale:
1. L(y1 + y2 ) = L(y1 ) + L(y2 )
2. L(αy) = αL(y), dove α è una costante.
Queste due proprietà dicono che L è un operatore lineare.
Quindi, dato l’operatore L appena definito:
G L(y) = b(x) è un’equazione differenziale lineare non omogenea. La funzione b(x) prende
il nome di termine noto dell’equazione differenziale.
G L(y) = 0 è l’equazione differenziale omogenea (il termine noto vale zero) associata
all’equazione differenziale precedente, in quanto l’operatore L è lo stesso.
Possiamo stabilire questo risultato.
128
8.8. Le equazioni differenziali lineari
Teorema 8.8.3 Data l’equazione differenziale L(y) = 0 con le funzioni a0 (x), a1 (x), . . . , an−1 (x)
continue in un intervallo [a, b], allora per ogni x0 ∈]a, b[, la funzione identicamente nulla è l’unica
soluzione del problema di Cauchy L(y) = 0 con condizioni iniziali date da
c1 y1 + c2 y2 + . . . cn yn .
c1 y1 + c2 y2 + . . . cn yn = 0 ⇐⇒ c1 = c2 = . . . = cn = 0
Se uno spazio vettoriale ha n vettori linearmente indipendenti allora si dice che lo spazio
ha dimensione n. I vettori linearmente indipendenti costituiscono una base dello spazio.
Ogni funzione dello spazio può essere ottenuta mediante una combinazione lineare della
base, cioè dei suoi vettori linearmente indipendenti.
129
8. E QUAZIONI DIFFERENZIALI ORDINARIE
Teorema 8.9.1 Sia dato l’operatore L definito tramite le n funzioni a0 (x), a1 (x), . . . , an−1 (x),
continue in un intervallo aperto ]a, b[⊂ R. Siano y1 (x), y2 (x), . . . , yn (x) n funzioni diverse da zero
che soddisfano l’equazione differenziale:
L(y1 ) = L(y2 ) = · · · = L(yn ) = 0
Condizione necessaria e sufficiente affinchè le n soluzioni siano linearmente indipendenti è
che sia diverso da zero per ogni valore di x ∈]a, b[, il wronskiano w(x).
Teorema 8.9.2 Lo spazio delle funzioni che sono soluzione dell’equazione omogenea L(y) = 0
(lo spazio nullo N ) ha dimensione n, ovvero, l’equazione omogenea L(y) = 0 ammette sempre
un sistema di n integrali linearmente indipendenti.
Dimostrazione. Si fissi x0 ∈ R e si considerino gli n problemi di Cauchy
y1 (x) y2 (x) ... yn (x)
0
y20 (x) yn0 (x)
y1 (x) ...
00
y200 (x) yn00 (x)
w(x) = y1 (x) ...
.. .. ..
.
(n−1) . ...
.
y (n−1) (n−1)
1 (x) y 2 (x) . . . yn (x)
130
8.10. L’equazione non omogenea
Risulta che w(x0 ) è il determinante della matrice identità, che ha uno sugli elementi della
diagonale principale e zero altrove. Il determinante di questa matrice vale 1, quindi è diverso
da zero.
Poichè x0 è stato scelto in modo arbitrario in R, vuole dire che le n soluzioni dell’equazioni
differenziali sono linearmente indipendenti (in base al teorema 8.9.1).
Abbiamo trovato dunque n funzioni linearmente indipendenti che risolvono l’equazione
omogenea L(y) = 0. Queste n funzioni costituiscono una base per lo spazio delle soluzioni
dell’equazione L(y) = 0. 4
Definizione 8.9.1 Una n-pla di funzioni y1 , y2 , . . . , yn che sono soluzioni linearmente in-
dipendenti di L(y) = 0 prende il nome di sistema fondamentale di integrali di L(y) =
0.
Se conosciamo n soluzioni linearmente indipendenti di L(y) = 0, la generica soluzione
di L(y) = 0 è data da una combinazione lineare delle soluzioni linearmente indipendenti.
Questa generica soluzione prende il nome di integrale generale. Si ha il seguente teorema
y = c1 y1 + c2 y2 + . . . cn yn
con c1 , c2 , . . . , cn costanti di R.
L(y) = b(x)
.
Sappiamo che ad essa possiamo associare l’equazione differenziale omogenea
L(y) = 0
Teorema 8.10.1 Dato y integrale particolare di L(y) = b(x), e dato l’integrale generale y di
L(y) = 0, allora l’integrale generale di L(y) = b(x) è dato da
η =y+y
131
8. E QUAZIONI DIFFERENZIALI ORDINARIE
Dimostrazione. Consideriamo η = y + y. Si ha
L(η) = L(y + y)
applicando la linearità di L
= L(y) + L(y)
ma L(y) = 0 e L(y) = b(x)
= b(x)
y = c1 y1 + c2 y2 + . . . , cn yn + y
se a0 (x) ≡ a0 , a1 (x) ≡ a1 , . . . , an−1 (x) = an−1 , tutte le funzioni sono costanti in x, allora
l’equazione differenziale prende il nome di equazione differenziale a coefficienti costanti:
Quindi a y (n) sostituiamo z n , a y (n−1) sostituiamo z n−1 m fino ad arrivare a y che sostituiamo
con z 0 = 1. Il polinomio P (z) prende il nome di polimonio caratteristico. Si cercano le radici
del polinomio caratteristico, cioè i valori di z per cui P (z) = 0 e da queste radici è possibile
risalire (vedremo ora in che modo) all’integrale generale dell’equazione differenziale lineare
omogenea. Occorre poi trovare un integrale particolare per l’equazione non omogenea.
Ricordiamo che un polinomio di grado n ammette n radici: queste radici possono essere
reali o complesse, e possono essere con molteplicità semplice o di un certo grado, ma tali
che la somma dei gradi di ciascuna radice dia il grado del polinomio. Vediamo dei semplici
esempi.
132
8.11. Equazioni lineari a coefficienti costanti
Esempio
Es. 8.11.1 Consideriamo un polinomio di secondo grado. Sappiamo che, dato un poli-
nomio di secondo grado P (z) = az 2 + bz + c, per trovare√le radici del polinomio, cioè quei
−b ± b2 − 4ac
valori di z per cui P (z) = 0 si ha la formula z = , dove la quantità sotto
2a
2
radice, b − 4ac prende il nome di discrimante e viene indicato con il simbolo ∆.
G Se ∆ = b2 − 4ac > 0 si hanno due radici reali distinte.
Esempio: P (z) = z 2 − 5z − 6.
5±7
In questo caso ∆ = 25 + 24 = 49, da cui z = . Si hanno due radici distinte: z1 = 6 e
2
z2 = −1.
G Se ∆ = b2 − 4ac = 0 si hanno due radici reali coincidenti (una radice da contarsi due
volte, o con molteplicità due).
Esempio: P (z) = z 2 − 2z + 1. Qui ∆ = 4 − 4 = 0. Si ricava facilmente, o applicando la
formula, o riconoscendo che P (z) = (z − 1)2 , che la radice è z = 1 da contarsi due volte,
cioè z = 1 è una radice con molteplicità doppia.
G Se ∆ = b2 − 4ac < 0, non
√ si hanno radici
√ reali ma
p nel campo complesso,
√ introducendo
l’unità immaginaria i = −1, per cui b2 − 4ac = (−1)(4ac − b2 ) = i 4ac − b2 , essendo
ora 4ac − b2 > 0.
Esempio: P (z) = z 2 + 2z + 3. In questo caso ∆ = 4 − 12 = −8 Sotto radice ho −8, quindi le
radici sono complesse.
√
−2 ± i2 2 √
z= = −1 ± i 2
2
√ √
Trovo due radici z1 = −1 + i 2 e z2 = −1 − i 2.
Queste due radici sono complesse e coniugate, perchè la parte immaginaria delle due
radici è una l’opposta dell’altra.
Un numero complesso, infatti, si può vedere come z = a + ib, con a e b numeri reali e i
l’unità immaginaria. Il coniugato di z = a + ib è dato da z = a − ib.
Per determinare l’integrale generale di un’equazione differenziale omogenea si vanno a
cercare le radici del polinomio caratteristico. Supponiamo che il polimonio caratteristico
abbia n radici reali tutte distinte tra di loro, γ1 , γ2 , . . . , γn , allora le funzioni y(x) = eγi x
sono soluzioni particolari dell’equazione differenziale. Infatti da y(x) = eγx si ha y 0 = γeγx ,
y 00 = γ 2 eγx , . . . , y (n) = γ n eγx . Se andiamo a sostituire nell’equazione differenziale, ricaviamo
L(y) = L(eγx )
= γ n eγx + an−1 γ n−1 eγx + . . . + a1 γeγx + a0 eγx
metto in evidenza eγx
= (γ n + an−1 γ n−1 + . . . + a1 γ + a0 )eγx
= P (γ)eγx
ma γ è radice dell’equazione caratteristica
=0
133
8. E QUAZIONI DIFFERENZIALI ORDINARIE
Teorema 8.11.1 Siano γ1 , γ2 , . . . , γh h radici reali del polinomio caratteristico, ciascuna delle
quali ha rispettivamente molteplicità r1 , . . . , rh mentre siano α1 ± iβ1 , α2 ± iβ2 , . . . , αl ± iβk 2k
radici complesse e coniugate con molteplicità, rispettivamente, s1 , s2 , . . . , sk .
La molteplicità delle radici è tale che r1 + r2 + . . . + rh + 2(s1 + s2 + . . . + sk ) = n.
Allora le n funzioni
eγp x , xeγp x , . . . xrp −1 eγp x , per p = 1, 2, . . . , h
eαq x cos (βq x), eαq x sin (βq x), xeαq x cos (βq x), xeαq x sin (βq x), . . . ,
xsq −1 eαq x cos (βq x), xsq −1 eαq x sin (βq x), per q = 1, 2, . . . , k
sono n soluzioni reali dell’equazione differenziale omogenea linearmente indipendenti.
Scritto in forma meno compatta, vuol dire che se l’equazione caratteristica ha n radici,
in parte reale e in parte complesse coniugate, così come sono state descritte nel teorema, si
hanno le seguenti soluzioni per l’equazione lineare:
G dalle radici reali del polinomio caratteristico si hanno i seguenti integrali:
eγ1 x xeγ1 x x2 eγ1 x . . . xr1 −1 eγ1 x
eγ2 x xeγ2 x x2 eγ2 x . . . xr2 −1 eγ2 x
eγ3 x xeγ3 x x2 eγ3 x . . . xr3 −1 eγ3 x
.. .. .. ..
. . . ... .
eγh x xeγh x x2 eγh x . . . xrh −1 eγh x
G dalle radici complesse e coniugate del polinomio caratteristico si hanno i seguenti
integrali:
eα1 x cos (β1 x) eα1 x sin (β1 x) xeα1 x cos (β1 x) xeα1 x sin (β1 x)
2 α1 x 2 α1 x
x e cos (β1 x) x e sin (β1 x) . . . ...
... ... xs1 −1 eα1 x cos (β1 x) xs1 −1 eα1 x sin (β1 x)
eα2 x cos (β2 x) eα2 x sin (β2 x) xeα2 x cos (β2 x) xeα2 x sin (β2 x)
x2 eα2 x cos (β2 x) x2 eα2 x sin (β2 x) ... ...
... ... xs2 −1 eα2 x cos (β2 x) xs2 −1 eα2 x sin (β2 x)
eα3 x cos (β3 x) eα3 x sin (β3 x) xeα3 x cos (β3 x) xeα3 x sin (β3 x)
x2 eα3 x cos (β3 x) x2 eα3 x sin (β3 x) ... ...
... ... xs3 −1 eα3 x cos (β3 x) xs3 −1 eα3 x sin (β3 x)
.. .. .. ..
. . . .
eαk x cos (βk x) eαk x sin (βk x) xeαk x cos (βk x) xeαk x sin (βk x)
2 αk x 2 αk x
x e cos (βk x) x e sin (βk x) . . . ...
... ... xsk −1 eαk x cos (βk x) xsk −1 eαk x sin (βk x)
L’integrale generale è dato da una combinazione lineare di tutte queste soluzioni particolari.
Quindi l’integrale generale dell’equazione differenziale omogenea è dato dalle combinazio-
ni lineari delle soluzioni linearmente indipendenti trovate.
Esempio
Es. 8.11.2 Sia data l’equazione lineare omogenea y 00 − 4y = 0.
L’equazione caratteristica è data da P (z) = z 2 − 4 = 0
Le radici di questa equazione sono date da z1 = 2, z2 = −2. Sono due radici reali, con
molteplicità uno.
L’integrale generale dell’equazione differenziale è dunque dato da
134
8.12. Metodo dei coefficienti indeterminati
Esempio
Es. 8.11.3 Sia ora y 00 + 2y 0 + y = 0. Ora l’equazione caratteristica è data da P (z) =
z 2 + 2z + 1 = 0, che ha come radici z = −1 con molteplicità doppia.
In tal caso l’integrale generale è dato da
Esempio
Es. 8.11.4 Sia data l’equazione differenziale y 00 + 2y 0 + 3 = 0. Adesso si ha, per l’e-
quazione caratteristica,
√ P√(z) = z 2 + 2z + 3 = 0 che ha due radici complesse e √
coniugate
z1 = −1 + i 2 e z2 = −1 − i 2. La parte reale è a = −1 la parte complessa è b = 2, quindi
l’integrale generale è
√ √
y(x) = c1 e−x cos ( 2x) + c2 e−x sin ( 2x)
Se, invece, interessa la soluzione generale dell’equazione differenziale non omogenea,
dobbiamo trovare, oltre all’integrale generale dell’omogenea associata, anche un integrale
particolare dell’equazione non omogenea visto che l’integrale generale è dato dalla som-
ma dell’integrale generale dell’omogenea associata e dell’integrale particolare della non
omogenea (in base al teorema 8.10.1).
Il problema di trovare l’integrale generale di un’equazione differenziale non omogenea
L(y) = b(x) si riconduce alla soluzione di due problemi:
1. trovare l’integrale generale dell’equazione omogenea associata L(y) = 0
2. trovare un integrale particolare dell’equazione non omogenea L(y) = b(x)
135
8. E QUAZIONI DIFFERENZIALI ORDINARIE
della funzione di partenza. Infatti, se il termine noto è dato dalla somma di m funzioni,
b(x) = b1 (x) + b2 (x) + . . . + bm (x), possiamo considerare sia l’equazione differenziale L(y) = b(x),
sia le m equazioni differenziali L(y) = b1 (x), L(y) = b2 (x), . . . L(y) = bm (x).
Siano y1 , y2 , . . . , ym m soluzioni particolari di queste m equazioni differenziali, allora vale
Esempio
Es. 8.12.1 Si voglia risolvere l’equazione differenziale
y 00 + y = 3x2
y 00 + y = 3x2
2a + ax2 + bx + c = 3x2
Ora i termini che hanno le stesse potenze di x a primo e a secondo membro vanno
eguagliati:
2
ax
= 3x2
bx =0
2a + c =0
Esempio
Es. 8.12.2 Sia da risolvere l’equazione differenziale
136
8.12. Metodo dei coefficienti indeterminati
Consideriamo ora il termine noto b(x) = x + x3 − e−x sin (2x). Osserviamo come il termine
noto possa essere visto come somma del polinomio P (x) = x + x3 e della funzione
−e−x sin (2x).
Cerchiamo dunque un integrale particolare per l’equazione differenziale
y 00 + 3y 0 + 2y = x + x3
Per il primo integrale, vediamo che il termine noto è un polinomio di terzo grado e
che il coefficiente a0 6= 0, quindi l’integrale particolare è un polinomio di terzo grado
y = ax3 + bx2 + cx + d. Derivando, si ha y 0 = 3ax2 + 2bx + c e y 00 = 6ax + 2b. Andando a
sostituire nell’equazione differenziale si ha
9 9 1 − 6a − 6b 23 −2b − 3c 51
Otteniamo a = 1/2, b = − a = − , c = = , d = = − , da cui
2 4 2 4 2 8
x3 9 2 23 51
y= − x + x− .
2 4 4 8
Passiamo ora a trovare un integrale particolare per la seconda equazione differenzia-
le che abbiamo ricavato che ha come termine noto la funzione −e−x sin (2x). Ricon-
ducendoci allo schema che abbiamo fatto per i vari casi di termini noto, questo si
riconduce alla funzione del tipo eαx sin (βx)P (x), dove α = −1, β = 2, P (x) = −1 (po-
linomio di grado 0). Poichè −1 ± i2 non è radice dell’equazione caratteristica (che ha
nel nostro caso solo radici reali), dobbiamo cercare un integrale particolare del tipo
y = e−x (cos (2x)a + sin (2x)b) (devono essere Q1 eQ2 polinomi di grado zero, cioè delle
costanti).
Allora,
y 0 = −e−x (a cos (2x) + b sin (2x)) + e−x (−2a sin (2x) + 2b cos (2x))
= e−x ((2b − a) cos (2x) − (b + 2a) sin (2x))
137
8. E QUAZIONI DIFFERENZIALI ORDINARIE
(2b − 4a) cos (2x) + (−4b − 2a) sin (2x) = − sin (2x)
Quindi:
(
2b − 4a = 0
−4b − 2a = −1
1 1 1 1
Risolvendo il sistema si trova a = e b = da cui y = e−x ( cos (2x) + sin (2x)).
10 5 10 5
Concludendo, l’integrale generale dell’equazione differenziale non omogenea da cui
siamo partiti è dato da:
x3 9 23 51 1 1
y = c1 exp −x + c2 exp −2x + − x2 + x − + e−x ( cos (2x) + sin (2x))
2 4 4 8 10 5
Se si ha un problema di Cauchy, si risolve prima l’equazione differenziale cercando un
integrale generale. Successivamente, le costanti vengono determinate in base alle condizioni
iniziali date dal problema.
138
C APITOLO 9
Forme differenziali
Sia data una funzione f (x, y) dipendente da due variabili. Possiamo pensare di integrare la
funzione f sulla curva γ rispetto a x o rispetto a y (quindi non sull’arco di curva, ds, ma in
dx o dy).
Si ha l’integrale curvilineo di f rispetto a x dato da
Z Z b
f (x, y)dx = f (x(t), y(t))x0 (t)dt
γ a
139
9. F ORME DIFFERENZIALI
L’espressione che abbiamo scritto come funzione integranda Xdx + Y dy prende il nome di
forma differenziale.
Possiamo dare allora la seguente definizione
cω = cXdx + cY dy
f ω = (f X)dx + (f Y )dy
G Date due forme differenziali ω 1 e ω2 , si definisce addizione di ω1 e di ω2 la seguente
forma:
Con queste operazione, l’insieme delle forme differenziali lineari, definite in un insieme I ⊂ R,
è uno spazio vettoriale.
Consideriamo, ora, il differenziale di una funzione f (x, y). Si ha df = fx dx + fy dy. Quindi il
differenziale di una funzione f si può vedere come una forma differenziale lineare. Non vale,
ovviamente, il viceversa: data una forma lineare, non è detto che ci sia una funzione f il cui
differenziale coincida con la forma lineare stessa.
140
9.2. Integrali delle forme differenziali
si definisce integrale curvilineo (o di linea) della forma differenziale ω sulla curva +γ,
l’integrale
Z Z Z b
ω= Xdx + Y dy = (X(x(t), y(t)x0 (t) + Y (x(t), y(t))y 0 (t)) dt
+γ +γ a
Difatti il prodotto scalare ω(f (t)) · f 0 (t) altro non è che la funzione integranda che abbiamo
scritto prima X(x(t), y(t)x0 (t) + Y (x(t), y(t))y 0 (t).
Ora cerchiamo di vedere cosa succede se facciamo l’integrale di una forma differenziale
su una curva +γ o sulla curva opposta −γ. Vediamolo con un esempio.
Esempio
Es. 9.2.1 Sia ω = yx2 dx + sin (πy)dy. Quindi X(x, y) = yx2 , e Y (x, y) = sin (πy).
La curva +γ sia il segmento che va dal punto (0, 2) al punto (1, 4).
La curva +γ in forma parametrica può essere scritta come
x = t, y = 2t + 2, 0≤t≤1
Per t = 0 si ha
R (0, 2), per t = 1 si ha (1, 4).
Calcoliamo +γω. Si ha
Z Z 1 Z 1
y(t)x(t)2 x0 (t) + sin (πy(t))y 0 (t) dt = (2t + 2)t2 + sin (π(2t + 2))2 dt
ω=
+γ 0 0
1 4
t3
Z
t 1
2t3 + 2t2 + 2 sin (π(2t + 2)) dt = 2 + 2 − cos (π(2t + 2))|t=1
= t=0
0 4 3 π
1 2 1 1 7
= + − + =
2 3 π π 6
Vediamo ora cosa succede se integriamo lungo la curva opposta −γ (ricordiamo che quan-
do abbiamo definito l’integrale curvilineo di una funzione lungo una curva γ, integrando
lungo la curva, cioè rispetto all’ascissa curvilinea ds, abbiamo detto che l’integrale non
dipende dall’orientamento della curva. In questo caso invece, le cose cambiano):
La curva opposta −γ ha equazioni parametriche
x = −t, y = −2t + 2, −1 ≤ t ≤ 0
141
9. F ORME DIFFERENZIALI
4
Quindi nel fare gli integrali curvilinei delle forme differenziali occorre prestare molta atten-
zione all’orientamento della curva. Per questo motivo, gli integrali curvilinei delle forme
differenziali sono detti integrali orientati.
Invece, anche per le forme differenziali, l’integrale curvilineo non dipende dal tipo di
rappresentazione utilizzata per la curva, cioè non dipende dalla scelta della rappresentazione
parametrica.
Si ha infatti la seguente proposizione
R
Proposizione 9.2.1 L’integrale curvilineo +γ
ω non dipende dalla particolare rappresentazio-
ne della curva regolare +γ.
Dimostrazione. Sia data la curva +γ tramite la funzione f = (x(t), y(t)), con a ≤ t ≤ b o,
in maniera equivalente, tramite la funzione F = (xF (u), yF (u)), con α ≤ u ≤ β . Sappiamo che,
dovendo rappresentare la medesima curva, le due funzioni f e F sono legate tra loro mediante
una funzione φ : [α, β] ⇒ [a, b] con φ0 (u) > 0, tale che φ(α) = a, φ(β) = b e F(u) = f (φ(u))
Torniamo all’integrale curvilineo. Da una parte
Z Z b
ω= (X(x(t), y(t))x0 (t) + Y (x(t), y(t))y 0 (t)) dt
+γ a
142
9.3. Applicazione delle forme differenziali
Dall’altra si ha:
Z Z β
ω= (X(xF (u), yF (u))x0F (u) + Y (xF (u), yF (u))yF0 (u)) du
+γ α
Poichè F~ (~r) = F~ (x(t), y(t)) = X(x(t), y(t))~i + Y (x(t), y(t))~j e r~0 (t) = x0 (t)~i + y 0 (t)~j, risulta
Z Z b
F~ · d~r = (X(x(t), y(t))~i + Y (x(t), y(t))~j) · (x0 (t)~i + y 0 (t)~j)dt
+γ a
Z b
= (X(x(t), y(t))x0 (t) + Y (x(t), y(t))y 0 (t)) dt
a
143
9. F ORME DIFFERENZIALI
dL = F~ · d~s
dL = Xdx + Y dy
Dimostrazione.
Si ha
Z Z b
df = (fx (x(t), y(t))x0 (t) + fy (x(t), y(t))y 0 (t)) dt
+γ a
per le regole di derivazione delle funzioni composte
Z b
df (x(t), y(t))
= dt
a dt
t=b
= f (x(t), y(t))|t=a
= f (x(b), y(b)) − f (x(a), y(a))
144
9.5. Forme differenziali lineari esatte
Figura 9.2: L’insieme A costituito dall’unione dei tre insiemi non è un insieme connesso.
Definizione 9.5.2 Un insieme aperto A ⊂ R2 si dice connesso se, qualunque siano i punti P
e Q presi in A, esiste una linea poligonale che è contenuta tutta in A e che ha P e Q come
estremi.
Per funzioni definite su insiemi connessi vale questo Lemma.
Lemma 9.5.1 Sia f una funzione di classe C 1 definita in un insieme aperto e connesso A di
R2 . Se, per ogni (x, y) ∈ A risulta fx (x, y) = fy (x, y) = 0, allora f è una funzione costante in A.
145
9. F ORME DIFFERENZIALI
con Q punto che non conosciamo, che si trova sul segmento congiungente P e P0 . Poichè
fx (Q) = fy (Q) = 0 (e questo qualunque sia il punto Q), si ha
f (P ) = f (P0 )
Possiamo variare il punto P , lasciando fisso P0 ma avremo sempre lo stesso risultato, quindi
la funzione assume valore costante.
Se, al posto di un segmento congiungente P e P0 , abbiamo una linea spezzata, si ripete il
ragionamento su ciascun segmento arrivando alla stessa conclusione. 4
Per le forme differenziali, vale il seguente lemma.
Teorema 9.5.1 Data ω = Xdx + Y dy una forma differenziale lineare, di classe C 0 e definita
in un insieme aperto e connesso, se F è una sua primitiva, allora ogni primitiva di ω è del tipo
F + cost con cost una costante.
Dimostrazione. Se F è una primitiva di ω, la funzione G = F + cost è anch’essa primitiva,
in quanto Gx = Fx = X e Gy = Fy = Y (poichè la derivata di una costante rispetto a x e a y
vale zero).
Supponendo di conoscere un’altra primitiva di ω, G, poichè si ha sempre Gx = X e
Gy = Y , per il lemma precedente, si ha ancora che G e F differiscono per una costante,
quindi G = F + cost. 4
L’insieme delle primitive di una forma differenziale lineare ω in un insieme aperto e connesso
prende il nome di integrale indefinito, propriò perchè, nota una primitiva, tutte le altre
differiscono per una costante.
Teorema 9.5.2 Dato A ⊂ R2 aperto e connesso e data una forma differenziale lineare ω di
classe C 0 in A, le seguenti proposizioni sono equivalenti:
1. ω è esatta.
2. Se P0 e P sono due punti qualunque in A e +γ1 e +γ2 sono due curve generalmente
regolari orientate contenute in A, che hanno entrambe come primo estremo P0 e come
secondo estremo P , allora
Z Z
ω= ω
+γ1 +γ2
vale a dire l’integrale curvilineo dipende solo dagli estremi P0 e P e non dal cammino
percorso.
146
9.5. Forme differenziali lineari esatte
Figura 9.3: Le curve +γ1 e +γ2 hanno gli stessi estremi P0 e P . La curva −γ2 opposta a +γ2
ha come estremi P e P0 .
Dimostrazione. Di questo teorema, dimostriamo che (1) ⇒ (2), (2) ⇒ (3) e (3) ⇒ (2).
(1) ⇒ (2) Sia per ipotesi ω = Xdx + Y dy esatta. Siano dati due punti P0 e P in A e
sia +γ una curva generalmente regolare che ha P0 come primo estremo e P come secondo
estremo. In forma parametrica, le equazioni della curva +γ siano
x = x(t) y = y(t) a≤t≤b
Quindi (x(a), y(a)) = (x0 , y0 ) = P0 , e (x(b), y(b)) = (x, y) = P .
Sia F una primitiva di ω (esiste perchè ω è esatta: vuol dire che dF = ω, poichè Fx = X e
Fy = Y .
Ma allora per il teorema fondamentale del calcolo degli integrali (si veda teorema 9.4.1)
Z Z
ω= dF = F (P ) − F (P0 )
+γ +γ
L’integrale non dipende dalla particolare curva +γ ma solo dagli estremi della curva e dalla
primitiva F . Perciò, date due curve +γ1 e +γ2 il risultato dell’integrale non cambia (si veda
Figura 9.3). La (2) è provata.
(2) ⇒ (3) Sia +γ una curva generalmente regolare chiusa data da equazioni
parametriche
x = x(t) y = y(t) a≤t≤b
0
Si fissi un punto t interno all’intervallo [a, b] e si considerino le due curve che si ottengono
da +γ facendo variare il parametro t in [a, t0 ] e in [t0 , b] in modo che +γ sia dato dall’unione
di queste due curve, che chiamiamo, rispettivamente +γ1 e +γ2 . La curva +γ1 ha come
primo estremo P0 e come secondo estremo il punto T = (x(t0 ), y(t0 ). La curva +γ2 ha come
primo estremo T e come secondo estremo P0 (essendo la curva chiusa e quindi (x(a), y(a)) =
(x(b), y(b))).
La curva opposta a +γ2 è la curva −γ2 e ha, quindi, come primo estremo P0 e come
secondo estremo T .
Dunque, le curve +γ1 e −γ2 hanno gli stessi estremi P0 e T . Ora, per l’ipotesi (2) sappiamo
che
Z Z
ω= ω
+γ1 −γ2
147
9. F ORME DIFFERENZIALI
Quindi
Z Z
ω=− ω
+γ1 +γ2
da cui
Z Z
ω+ ω=0
+γ1 +γ2
Ma
Z Z Z
ω= ω+ ω
+γ1 ∪−γ2 +γ1 −γ2
Quindi
Z Z
ω+ ω=0
+γ1 −γ2
da cui
Z Z Z Z
ω=− ω⇒ ω= ω
+γ1 −γ2 +γ1 +γ2
Dimostrazione. Questo risultato lo abbiamo dimostrato al punto (1) ⇒ (2) del teorema
precedente. 4
148
9.6. Le forme differenziali lineari chiuse
∂X ∂Y
=
∂y ∂x
Teorema 9.6.1 Data ω = Xdx+Y dy una forma differenziale lineare di classe C 1 in un insieme
aperto A ⊂ R2 , ω esatta =⇒ ω chiusa.
Dimostrazione. Se ω è esatta, vuol dire che esiste una primitiva, F , tale che Fx = X
e Fy = Y . Per ipotesi ω è di classe C 1 , cioè le derivate parziali di X e Y sono continue. Di
conseguenza F è di classe C 2 (poichè le sue derivate parziali del secondo ordine coincidono
con le derivate parziali prime di X e Y ). Inoltre si ha
∂F 2 ∂X ∂F 2 ∂Y
= e =
∂x∂y ∂y ∂y∂x ∂x
∂F 2 ∂F 2
Per il teorema di Schwartz, le derivate parziali miste di F coincidono, = , quindi
∂x∂y ∂y∂x
risulta
∂X ∂Y
=
∂y ∂x
L’asserto è provato. 4
Osserviamo che il viceversa non vale sempre. Si possono avere forme differenziali chiuse che
non sono esatte.
Per poter avere l’implicazione ω chiusa ⇒ ω esatta, la forma differenziale lineare deve
essere definita in un insieme particolare. Introduciamo, perciò, la definizione di insieme
semplicemente connesso.
Teorema 9.6.2 Sia ω una forma differenziale lineare di classe C 1 in A aperto e semplicemente
connesso. Allora se ω è chiusa, ω è esatta.
149
Bibliografia
151