Il 0% ha trovato utile questo documento (0 voti)
17 visualizzazioni179 pagine

1617 Analisi2 Fisica Finale

Le note per il Corso di Analisi Matematica II per Fisica forniscono una guida allo studio di vari argomenti di analisi matematica, tra cui calcolo differenziale, integrazione in più variabili, successioni e serie di funzioni, curve e superfici regolari, serie di potenze e sistemi di equazioni differenziali. Ogni parte del documento è strutturata in sezioni che trattano in dettaglio concetti fondamentali e proprietà matematiche, con avvertenze sull'uso delle note come supporto allo studio. Le note non sono un libro di testo completo e mancano di illustrazioni e commenti esplicativi.

Caricato da

lucio.ferrari829
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Il 0% ha trovato utile questo documento (0 voti)
17 visualizzazioni179 pagine

1617 Analisi2 Fisica Finale

Le note per il Corso di Analisi Matematica II per Fisica forniscono una guida allo studio di vari argomenti di analisi matematica, tra cui calcolo differenziale, integrazione in più variabili, successioni e serie di funzioni, curve e superfici regolari, serie di potenze e sistemi di equazioni differenziali. Ogni parte del documento è strutturata in sezioni che trattano in dettaglio concetti fondamentali e proprietà matematiche, con avvertenze sull'uso delle note come supporto allo studio. Le note non sono un libro di testo completo e mancano di illustrazioni e commenti esplicativi.

Caricato da

lucio.ferrari829
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd

Note per il Corso di Analisi Matematica II per Fisica -SMID

Ernesto De Vito
Dipartimento di Matematica, Università di Genova
Maggio 2017

Indice

Parte 1. Calcolo Differenziale 5


1. Spazi vettoriali euclidei 5
1.1. Vettori, norma e prodotto scalare 5
1.2. Elementi di topologia 7
2. Funzioni 10
2.1. Funzioni continue 14
2.2. Limiti di funzioni scalari 19
2.3. Proprietà delle funzioni continue 25
2.4. Complemento: successioni 28
2.5. Complemento: teorema del punto fisso 30
2.6. Complemento: funzioni complesse di variabile complessa 31
3. Funzioni differenziabili 32
3.1. Proprietà delle funzioni scalari differenziabili 42
3.2. Trasformazioni regolari di coordinate 52
3.3. Funzioni implicite 58

Parte 2. Integrazione in più variabili 67


4. Integrale di Lebesgue 67
5. Formule di riduzione 79
6. Integrali parametrici e derivazione sotto segno di integrale 86
7. Dimostrazioni e complementi 90

Parte 3. Successioni e serie di funzioni 97


8. Successioni di funzioni 97
9. Serie di funzioni 104
10. Complemento: serie numeriche 109
10.1. Serie a termini positivi 112
10.2. Convergenza assoluta 116
10.3. Serie a segno alterno 116

Parte 4. Curve e superfici regolari 119


11. Curve ed integrali di linea 119
1
2

12. Superfici ed integrali di superficie 126


13. Teorema del rotore e della divergenza 133
13.1. Caso bidimensionale 133
13.2. Caso tridimensionale 138
14. Campi irrotazionali e solenoidali 139

Parte 5. Serie di potenze 149

Parte 6. Sistemi di equazioni differenziali del primo ordine 161


15. Sistemi lineari a coefficienti costanti. 164
15.1. Esponenziale di una matrice 164
15.2. Sistemi di equazioni differenziali a coefficienti costanti 169
15.3. Programmi per calcolare la forma canonica 175
16. Sistemi lineari non autonomi. 175
16.1. Caso omogeneo 175
16.2. Sistemi lineari non omogenei 177
3

Avvertenza. Queste note devono servire come guida per lo studio: non sono un libro
di testo (ve ne sono di ottimi da consultare in biblioteca), non sono una trascrizione di
quanto detto a lezione (gli appunti sono essenziali), mancano i commenti ed i disegni
(indispensabili per la comprensione), vi sono alcuni argomenti che non sono stati trattati
a lezione (ma che possono servire di approfondimento).
I commenti compresi tra i simboli I . . . J richiedono risultati che verranno introdotti nelle
sezioni successive. Il simbolo  indica punti che richiedono particolare attenzione.
Ricordiamo alcune notazioni di base non completamente universali.

N insieme dei numeri naturali incluso lo zero


c
A = {x ∈
/ A} complementare di A
A⊂B inclusione debole: se x ∈ A allora x ∈ B
A(B inclusione forte: se x ∈ A allora x ∈ B ed esiste y ∈ B tale y ∈
/A
f ◦g funzione composta: (f ◦ g)(x) = f (g(x))
(a, b) intervallo aperto di estremi a < b
funzione crescente f (x) ≤ f (y) se x ≤ y
funzione strett. crescente f (x) < f (y) se x < y
log x, ln x logaritmo di x in base e.
5

Parte 1. Calcolo Differenziale

1. Spazi vettoriali euclidei

In questa sezione sono richiamate alcune proprietà di Rn , visto come spazio vettoriale
euclideo.

1.1. Vettori, norma e prodotto scalare. Per semplicità consideriamo esplicitamente il


caso n = 2. Gli elementi del prodotto cartesiano
R2 = {(x, y) | x, y ∈ R}
sono detti vettori. Ogni vettore v ∈ R2 è una coppia ordinata (x, y) ed i numeri reali x, y
sono detti le componenti di v. In particolare si denota con 0 = (0, 0) il vettore nullo. In
R2 sono definite le seguenti operazioni che lo rendono uno spazio vettoriale euclideo.

a) La somma di due vettori v1 = (x1 , y1 ) e v2 = (x2 , y2 ) è il vettore


v1 + v2 = (x1 + x2 , y1 + y2 ).
b) La moltiplicazione di un vettore v = (x, y) per uno scalare λ ∈ R è il vettore
λv = (λx, λy).
c) La norma di un vettore v = (x, y) è lo scalare
p
kvk = x2 + y 2 .
La norma soddisfa le seguenti proprietà:
kvk ≥ 0
kvk = 0 ⇐⇒ v = 0
kλvk = |λ| kvk
| kvk − kwk | ≤ kv + wk ≤ kvk + kwk (disuguaglianza triangolare)
per ogni v, w ∈ R2 e λ ∈ R. Inoltre, se v = (x, y)
|x| ≤ kvk |y| ≤ kvk. (1)
d) Il prodotto scalare di due vettori v1 = (x1 , y1 ) e v2 = (x2 , y2 ) è lo scalare
v1 · v2 = x1 x2 + y1 y2 .
Il prodotto scalare soddisfa le seguenti proprietà:
v1 · v2 = v2 · v1
v1 · (λv2 ) = λ(v1 · v2 )
v1 · (v2 + v3 ) = (v1 · v2 ) + (v1 · v3 )
v1 · v1 = kv1 k2
|v1 · v2 | ≤ kv1 kkv2 k (disuguaglianza di Schwarz)
per ogni v1 , v2 , v3 ∈ R2 e λ ∈ R.
. A differenza della retta reale in R2 non è stata introdotta una relazione d’ordine “<”.
. Il nome “disuguaglianza triangolare” si riferisce alla relazione kv + wk ≤ kvk + kwk,
da cui discende l’altra. Inoltre vale che
| kvk − kwk | ≤ kv − wk ≤ kvk + kwk.
. Il prodotto scalare v1 · v2 = 0 se e solo se vale una della seguenti tre condizioni
π
v1 = 0 o v2 = 0 o θ = ± ,
2
dove θ ∈ (−π, π] è l’angolo compreso tra i due vettori (se entrambi sono non nulli).
6

Nota. A volte è comodo identificare i vettori di R2 con matrici 2 × 1 (vettori colonna) o


matrici 1 × 2 (vettori riga)  
x
vt = x y
 
v=
y
t
dove indica la trasposizione. Con questa notazione il prodotto scalare diventa
 
t
  x2
v1 · v2 = v1 v2 = x1 y1 ,
y2
dove il prodotto è quello righe per colonne.

Indicheremo i versori degli assi cartesiani con


   
1 0
i= j= ,
0 1
che soddisfano
kik = 1 kjk = 1 i · j = 0,
e per ogni vettore v = (x, y) ∈ R2
v = x i + y j,
cioè sono una base ortonormale di R2 .
Nel piano euclideo, in cui sono stati scelti un’origine O ed un sistema di assi cartesiani, ogni
vettore v è rappresentato geometricamente da un segmento orientato il cui primo estremo
è l’origine O. Il secondo estremo del vettore individua univocamente un punto P del piano
di modo che la coppia ordinata (x, y) indica sia le componenti del vettore v = (x, y) sia le
coordinate del punto P = (x, y). In particolare il vettore nullo 0 individua l’origine O.
Viceversa, due punti del piano P1 = (x1 , y1 ) e P2 = (x2 , y2 ) individuano un vettore il cui
primo estremo è P1 e il secondo estremo è P2 . Tale vettore, denotato con P2 − P1 , ha
componenti
P2 − P1 = (x2 − x1 , y2 − y1 ).
Infine, dato un punto P = (x, y) ed un vettore v = (h, k), il secondo estremo del vettore
v, il cui primo estremo è in P , individua un punto, denotato con P + v, le cui coordinate
sono
P + v = (x + h, y + k).
Il punto P + v è detto il traslato di P .
La distanza (euclidea) tra due punti P0 = (x0 , y0 ) e P1 = (x1 , y1 ) è definita da
p
d(P1 , P0 ) = (x1 − x0 )2 + (y1 − y0 )2 = kP1 − P0 k. (2)
che è invariante per traslazioni, cioè per ogni v ∈ R2
d(P1 + v, P0 + v) = d(P1 , P0 ).
Quanto detto si estende naturalmente al prodotto di n copie di R
Rn = {(x1 , . . . , xn ) | x1 , . . . , xn ∈ R},
in particolare i punti di R3 sono descritti da triple (x, y, z) ed i tre versori sono
     
1 0 0
i= 0  j= 1  k = 0 .

0 0 1
Nel seguito identificheremo Rn × Rm con Rn+m ponendo
(v, w) = (v1 , . . . , vn , w1 , . . . , wm ) v = (v1 , . . . , vn ) ∈ Rn , w = (w1 , . . . , wm ) ∈ Rm (3)
che preserva le operazioni algebriche e
k(v, w)k2n+m = kvk2n + kwk2m
kvk2n ≤ k(v, w)k2n+m (4)
kwk2m ≤ k(v, w)k2n+m ,
7

dove kvkn indica la norma di v ∈ Rn .

1.2. Elementi di topologia. Dati P0 ∈ Rn e δ > 0 si definisce palla (aperta) di centro


P0 e raggio δ l’insieme
B(P0 , δ) = {P ∈ Rn | kP − P0 k < δ}.
Se n = 2 e P0 = (x0 , y0 ), allora
B((x0 , y0 ), δ) = (x, y) ∈ R2 | (x − x0 )2 + (y − y0 )2 < δ 2 ,


cioè B((x0 , y0 ), δ) è il cerchio di centro (x0 , y0 ) e raggio δ, circonferenza esclusa. In R3


B(P0 , δ) è una sfera (senza la buccia). Le seguenti definizioni esprimono le proprietà di
vicinanza di un punto ad un insieme.
Def. 1.1. Siano A ⊂ Rn e P0 ∈ Rn .

a) Il punto P0 è interno ad A se esiste δ > 0 tale che B(P0 , δ) ⊂ A, cioè


∃ δ > 0 tale che se P ∈ Rn e kP − P0 k < δ allora P ∈ A,
ovvero P0 è interno se tutti i punti sufficientemente vicini a P0 appartengono ad A.
b) Il punto P0 è di aderenza per A se per ogni δ > 0 si ha B(P0 , δ) ∩ A 6= ∅, cioè
∀ δ > 0 ∃ P ∈ A tale che kP − P0 k < δ,
ovvero P0 è di aderenza se esistono punti di A arbitrariamente vicini a P0 .
c) Il punto P0 è di frontiera per A se per ogni δ > 0 si ha che B(P0 , δ) ∩ A 6= ∅ e
B(P0 , δ) ∩ Ac 6= ∅, in altre parole se
∀ δ > 0 ∃ P ∈ A e Q ∈ Ac tali che kP − P0 k < δ e kQ − P0 k < δ,
ovvero P0 è di frontiera se esistono punti di A e del suo complementare Ac arbitraria-
mente vicini a P0 . Questo equivale al fatto che P0 è di aderenza per A, ma non è interno
ad A.
d) Il punto P0 è di accumulazione per A se per ogni δ > 0 esiste P ∈ B(P0 , δ)∩A e P 6= P0 ,
in altre parole se
∀δ > 0 ∃P ∈ A tale che 0 < kP − P0 k < δ,
ovvero se esistono punti di A, diversi da P0 , arbitrariamente vicini a P0 . Un punto di
accumulazione è sempre un punto di aderenza. Un punto interno è sempre di accumu-
lazione. I punti di aderenza che non sono di accumulazione sono detti punti isolati ed
appartengono necessariamente ad A.

Introduciamo alcuni insiemi costruiti a partire da A in base alle precedenti definizioni.


Def. 1.2. Sia A ⊂ Rn .
a) L’insieme dei punti interni di A si chiama parte interna e si denota con Å. Poiché un
punto interno appartiene necessariamente ad A, allora Å ⊂ A.
b) L’insieme dei punti di aderenza di A si chiama chiusura e si denota con A. Poiché i
punti di A sono necessariamente di aderenza per A, si ha A ⊂ A.
c) L’insieme dei punti di frontiera di A si denota con ∂A.
Prop. 1.3. Data A ⊂ Rn , valgono le seguenti relazioni
Å ⊂ A ⊂ A (5a)
A = Å ∪ ∂A (5b)
Å ∩ ∂A = ∅ (5c)
c
∂A = ∂A (5d)
(Ac )˚= (A)c (5e)
Ac = (Å)c . (5f)
8

Dimostrazione. Le relazioni (5a) e (5c) seguono immediatamente dalle definizione. Dimo-


striamo la (5b). Evidentemente, Å ∪ ∂A ⊂ A. Proviamo che A ⊂ Å ∪ ∂A. Se P ∈ A e
P ∈ ∂A, la tesi è evidente. Viceversa, se P ∈ A e P 6∈ ∂A, allora esiste δ > 0 tale che
B(P, δ) ∩ Ac = ∅, cioè B(P, δ) ⊂ A, per cui P ∈ Å.
Dimostriamo la (5e). Dato punto P ∈ Rn , P ∈ (Ac )˚se esiste δ > 0 tale che B(P, δ) ⊂ Ac ,
condizione equivale al fatto che B(P, δ) ∩ A = ∅, cioè P ∈/ A. La (5e) segue dalla (5e)
applicata a Ac . 

Definiamo due famiglie di insiemi per cui l’inclusione destra o sinistra in (5a) è in effetti
un’uguaglianza.
Def. 1.4. Sia A ⊂ Rn .
a) L’insieme A è detto aperto se tutti i suoi punti sono interni, cioè se Å = A. Se P0 ∈ A,
A è detto un intorno aperto di P0 .
b) L’insieme A è detto chiuso se tutti i suoi punti di aderenza appartengono ad A, cioè, se
A = A.
c) L’insieme A è limitato se esiste R > 0 tale che A ⊂ B(O, R), cioè se
kP − Ok < R ∀P ∈ A.
Nella definizione di limitato si può sostituire l’origine con un qualunque punto P0 . Se
A non è limitato, si dice che A è illimitato.
d) L’insieme A è detto compatto se A è chiuso e limitato.
. Gli unici insiemi che sono sia aperti sia chiusi sono R2 e ∅.
Esempio 1.5. La palla B(P0 , r) di centro P0 ∈ Rn e raggio r > 0 è aperta. Infatti
se Q0 ∈ B(P0 , r) allora Q0 è punto interno. Scelto δ = r − kQ0 − P0 k, δ > 0 poiché
kQ0 − P0 k < r. Allora, per ogni P ∈ B(Q0 , δ) la disuguaglianza triangolare implica che
kP − P0 k ≤ kP − Q0 k + kQ0 − P0 k < δ + kQ0 − P0 k = r
allora P ∈ B(P0 , r) e, quindi, B(Q0 , δ) ⊂ B(P0 , r). Ne segue che Q0 è punto interno ed
B(P0 , r) è aperto.
Prop. 1.6. Dato A ⊂ Rn ,
a) A è aperto se e solo se A ∩ ∂A = ∅;
b) A è chiuso se e solo se ∂A ⊂ A;
c) A è aperto se e solo se il suo complementare Ac è chiuso;
d) A è chiuso se e solo se Ac è aperto;
e) Å è aperto e A è chiuso.
f) l’unione arbitraria e l’intersezione finita di aperti sono aperti;
g) l’unione finita e l’intersezione arbitraria di chiusi sono chiusi;
h) A è limitato se e solo se sup kP − Ok < +∞.
P ∈A

Dimostrazione. Dimostriamo le affermazioni


a) Se A è aperto, allora per la (5c) A ∩ ∂A = Å ∩ ∂A = ∅. Viceversa, se A ∩ ∂A = ∅, dato
P ∈ A ⊂ A allora per la (5b) necessariamente P ∈ Å, cioè Å = A.
b) Segue dalla (5b).
c) Per il punto a), A è aperto se e solo se ∂A ⊂ Ac e, per la (5d), quest’ultima condizione
equivale a ∂Ac ⊂ Ac , cioè, per il punto b), se e solo se Ac è chiuso.
d) È conseguenza del punto c) e del fatto che (Ac )c = A.
e) Mostriamo che Å è aperto. Per definizione, dato P0 ∈ Å, esiste r > 0 tale che B(P0 , r) ⊂
A. Mostriamo che in effetti B(P0 , r) ⊂ Å. Poiché B(P0 , r) è un insieme aperto, allora
per ogni P ∈ B(P0 , r) esiste δ > 0 tale che
B(P, δ) ⊂ B(P0 , r) ⊂ A,
9

per cui P è interno ad A. Allora B(P0 , r) ⊂ Å e, quindi, Å è aperto. Per mostrare che
A è chiuso è sufficiente usare la (5e) ed il punto d).
f) Data una famiglia (Ai )i∈I di insiemi aperti mostriamo che A = ∪i∈I Ai è aperto. Dato
P ∈ ∪i∈I Ai , esiste i ∈ I tale che P ∈ Ai . Essendo Ai aperto, esiste δ > 0 per cui
B(P, δ) ⊂ Ai ⊂ A, allora P è un punto interno di A. Per l’arbitrarietà di P , segue che
A è aperto. Supponiamo ora che I sia finito e mostriamo che B = ∩i∈I Ai è aperto.
Dato P ∈ B, allora P ∈ Ai per ogni i ∈ I e, analogamente a sopra esistono δi > 0 tali
che B(P, δi ) ⊂ Ai . Essendo I finito, δ = mini∈I δi > 0 e
B(P, δ) ⊂ B(P, δi ) ⊂ Ai ∀i ∈ I,
cioè B(P, δ) ⊂ B. Allora P è un punto interno di B e, per l’arbitrarietà di P , segue che
B è aperto.
g) Segue da f) e le leggi di De Morgan.
h) Segue dalla definizione di insieme limitato.


. In generale, l’intersezione arbitraria di insiemi aperti, non è aperto. Ad esempio
\
B(P0 , r) = B(P0 , 1).
r>1

Gl insiemi compatti sono caratterizzati dalla proprietà di Heine-Borel.


Teo 1.7 (Teorema di Heine-Borel). Dato A ⊂ Rn , sono fatti equivalenti

a) l’insieme A è compatto;
b) se (Vj )j∈J è una famiglia di aperti di Rn tali che A ⊂ ∪j∈J Vj , allora esiste una sotto-
famiglia finita Vj1 , . . . , VjN tale che Vj1 ∪ . . . ∪ VjN ⊃ A.
c) Data una successione (Pk )k di punti di A, esiste una sotto-successione (Pkj )j ed un
punto P ∈ A tale che limj→+∞ kPkj − P k = 0.

La famiglia (Vj )j∈J è detta un ricoprimento aperto di A e la sotto-famiglia Vj1 , . . . , VjN un


sotto-ricoprimento finito.

Dimostrazione. Per complezza dimostriamo separatamente l’equivalenza delle condizioni


a) e b) (Passi 1 e 2) e quella tra b) e c) (Passi 3 e 4).
Passo 1 Proviamo che a) implica b). Per semplicità consideriamo il caso n = 2. Assu-
miamo che A sia compatto e per assurdo che esista un ricoprimento aperto (Vj )j∈J di A,
che non ammetta nessun sotto-ricoprimento finito. Essendo A limitato, esiste un quadrato
Q1 = [a1 , b1 ] × [c1 , d1 ] di lato L = b1 − a1 = d1 − c1 tale che A ⊂ Q1 .
Poiché A è chiuso, Ac è aperto, ed eventualmente aggiungendo tale aperto al ricoprimento
iniziale, possiamo sempre supporre che (Vj )j∈J ricopra Q1 e che non esista nessun sotto-
ricoprimento finito di Q1 . Dividiamo Q1 in quattro quadrati uguali di lato L/2, di cui
almeno un quadrato non ammette un sotto-ricoprimento finito. Denotiamo tale quadrato
con Q2 = [a2 , b2 ] × [c2 , d2 ] di lato b2 − a2 = d2 − c2 = L/2. A sua volta, dividiamo Q2 in
quattro quadrati di lato L/4 e procediamo come sopra. Otterremo una successione
Q1 ) Q2 , ) . . . ) Qk ) Qk+1 . . .
di quadrati chiusi inscatolati, nessuno dei quali ammette un sotto-ricoprimento finito.
Abbiamo, quindi, ottenuto due successioni di intervalli chiusi inscatolati
[a1 , b1 ] ) [a2 , b2 ] ) . . . ) [ak , bk ] ) [ak+1 , bk+1 ] . . .
[c1 , d1 ] ) [c2 , d2 ] ) . . . ) [ck , dk ] ) [ck+1 , dk+1 ] . . .
10

di lunghezza bk −ak = dk −ck = L/2k−1 . Per la proprietà degli intervalli chiusi inscatolati1,
esistono unici x, y ∈ R tali che per ogni k ≥ 1 x ∈ [ak , bk ] ed y ∈ [ck , dk ], cioè, posto
P = (x, y) allora P ∈ Qk per ogni k ≥ 1. Essendo (Vj )j∈J un ricoprimento di Q1 e P ∈ Q1 ,
esiste j ∈ J tale che P ∈ Vj √
e, essendo Vj aperto, esiste δ > 0 tale che B(P, δ) ⊂ Vj . Scelto
k ∈ N tale che L/2k−1 < δ/ 2 allora Qk ⊂ B(P, δ) ⊂ Vj , cioè Qk può essere ricoperto da
un singolo elemento della famiglia (Vj )j∈J , contraddicendo la condizione con cui è stato
scelto Qk .
Passo 2 Proviamo che b) implica a). Se scegliamo come ricoprimento di A, la famiglia di
tutte le palle di raggio 1, quindi limitate, segue che A può essere ricoperto da un numero
finito di insiemi limitati, quindi A è limitato. Mostriamo che A è chiuso, provando che
Ac è aperto. Dato P ∗ ∈ Ac , la famiglia {B(P, kP ∗ − P k/2)}P ∈A è evidentemente un
ricoprimento aperto di A e, per ipotesi, ammette un sotto-ricoprimento finito
A ⊂ B(P1 , kP ∗ − P1 k/2) ∪ . . . ∪ B(PN , kP ∗ − PN k/2).
Posto δ = min{kP ∗ − P1 k, . . . , kP ∗ − PN k}/2, allora B(P ∗ , δ) ∩ A = ∅, per cui P ∗ è un
punto interno di Ac .
Passo 3 Proviamo che b) implica c). Data una successione (Pk )k se l’insieme {Pk |k ∈ N}
è finito, allora esiste P ∈ {Pk |k ∈ N} ed una sotto-successione (Pkj )j tale che P = Pkj per
ogni j. Se l’insieme {Pk |k ∈ N} ha infiniti elementi e, per assurdo, non ammette un punto
di accumulazione, allora per ogni P ∈ A esiste un aperto VP che contiene solo un numero
finito di elementi della successione. Poiché (VP )P ∈A è un ricoprimento aperto di A, per
l’ipotesi B esiste un sotto-ricoprimento finito V1 , . . . VN che per costruzione contiene un
numero finito di punto di {Pk |k ∈ N}, che è una contraddizione.
Passo 4 Proviamo che c) implica a). Se per assurdo A non è limitato, per ogni k esiste
Pk ∈ A e kPk − Ok > k. Evidentemente, per la successione (Pk )k non esistono sotto-
successioni convergenti. Mostriamo che A è chiuso. Sia P un punto di accumulazione
per A. Per definizione, per ogni k ∈ N esiste Pk ∈ A tale che 0 < kPk − P k < 1/k.
Evidentemente, per ogni sotto-successione limj kPkj − P k = 0. Per la proprietà c) segue
che P ∈ A. 

2. Funzioni

Una funzione F : A ⊂ Rn → Rm è una legge che assegna ad ogni punto P ∈ A uno ed


un solo elemento Q = F (P ) ∈ Rm . L’insieme A è detto dominio ed Rm codominio. Dato
B ⊂ Rn , l’immagine di B secondo F è il sotto-insieme di Rm
F (B) = {F (P ) ∈ Rm | P ∈ B},
in particolare F (A) = Im F è detta immagine di F . Dato C ⊂ Rm , la contro-immagine di
C secondo F è il sotto-insieme di Rn
F −1 (C) = {P ∈ A | F (P ) ∈ C}.
Se m = 1, la funzione è detta scalare, se m > 1 è detta funzione vettoriale. In gene-
rale, si hanno n-variabili indipendenti P = (x1 , . . . , xn ) ∈ Rn e m-variabili dipendenti
Q = (f1 (P ), . . . , fm (P )) ∈ Rm e la funzione Q = F (P ) si può scrivere come

 z1 = f1 (x1 , . . . , xn )
F : ... .
zm = fm (x1 , . . . , xn )

Le m funzioni scalari f1 : A → R, . . ., fm : A → R sono dette le componenti della funzione


F , hanno tutte lo stesso dominio A ⊂ Rn e lo stesso codominio R.
1Equivalentemente, per il teorema sul limite delle successioni monotone

x = lim ak = lim bk y = lim ck = lim dk .


k→+∞ k→+∞ k→+∞ k→+∞
11

1
Esempio 1.8. Sia F (x, y) = (xy, x2 +y 2 , log x), allora

F : A ⊂ R2 → R3
A = (x, y) ∈ R2 | (x, y) 6= (0, 0), x > 0 = ((0, +∞) × R) \ {(0, 0)}


z1 = xy = f1 (x, y)

1
F : z2 = x2 +y 2 = f2 (x, y)

z3 = log x = f3 (x, y)

Consideriamo nel seguito alcuni casi particolari.


Funzioni scalari. Data una funzione scalare di n variabili indipendenti

f : A ⊂ Rn → R

l’equazione z = f (x1 , . . . , xn ) definisce un sotto-insieme di Rn+1

{(x1 , . . . , xn , z) ∈ Rn+1 | (x1 , . . . , xn ) ∈ A, z = f (x1 , . . . , xn )}

chiamato grafico della funzione. Dato c ∈ R l’equazione f (x1 , . . . , xn ) = c definisce un


sotto-insieme di Rn

Ac = {(x1 , . . . , xn ) ∈ R2 | (x1 , . . . , xn ) ∈ A, f (x, y) = c},

chiamato insieme di livello di f di quota c.


Nel caso di una funzione di due variabili, il grafico z = f (x, y) è una superficie nello spazio
e, fissato c ∈ R l’insieme di livello f (x, y) = c è una curva (eventualmente patologica) nel
piano ottenuta proiettando l’intersezione del grafico della funzione con il piano z = c sul
piano xy.
p
 . L’insieme di livello può essere patologico. Ad esempio, la funzione f (x, y) = 1 − x2 − y 2
con dominio A = {(x, y) ∈ R | x + y ≤ 1}, ha come grafico la semisfera x + y + z 2 = 1
2 2 2 2 2

che giace nel semispazio delle z ≥ 0 (emisfero √ nord). Se 0 < c < 1, l’insieme di livello è
la circonferenza di centro l’origine e raggio 1 − c2 . Tuttavia se c = 1 l’insieme di livello
si riduce alla sola origine {(0, 0)}, mentre se c > 1 o c < 0 l’insieme di livello è l’insieme
vuoto.

Esempio 1.9. Una funzione scalare lineare affine di due variabili è della forma

f (x, y) = z0 + a(x − x0 ) + b(y − y0 ) = z0 + (a, b) · (x − x0 , y − y0 ),

dove z0 , a, b ∈ R sono coefficienti fissati. Il grafico è il piano passante per il punto (x0 , y0 , z0 )
in R3 di equazione cartesiana

a(x − x0 ) + b(y − y0 ) − (z − z0 ) = 0,

non parallelo all’asse z. Dato c ∈ R, se a2 + b2 6= 0 l’insieme di livello è la retta (nel piano)


di equazione cartesiana
a(x − x0 ) + b(y − y0 ) = c − z0 .
Se a = b = 0, il grafico è il piano z = z0 parallelo al piano xy e gli insiemi di livello sono
tutti l’insieme vuoto, tranne nel caso in cui c = z0 per cui Az0 = R2 .

Esempio 1.10. La densità di probabilità di un vettore gaussiano V = (X, Y ) di R2 è data


dalla funzione scalare
s
det C − 1 (v−µ)t C(v−µ)
f (v) = e 2
(2π)2
12
 
c1 c2
dove µ = (µX , µY ) ∈ R2 è il vettore delle medie, C = è una matrice 2 × 2
c2 c3
simmetrica strettamente definita positiva e, se v = (x, y),
  
t
  c1 c2 x − µX
(v − µ) C(v − µ) = x − µX y − µY
c2 c3 y − µY
= c1 (x − µX )2 + 2c2 (x − µX )(y − µY ) + c3 (y − µY )2
è la corrispondente forma quadratica. L’inversa di C è la matrice di covarianza.

Curve. Una curva è una funzione γ(t) = (x1 (t), . . . , xn (t)) con dominio I ⊂ R e codominio
Rn . Le funzioni x1 (t), . . . , xn (t) sono dette componenti della curva e sono funzioni scalari
con dominio I ⊂ R e codominio R. Nel caso n = 3, γ si denota spesso con

 x = x(t)
γ: y = y(t) t∈I ⇐⇒ γ(t) = x(t) i + y(t) j + z(t) k t ∈ I.
z = z(t)

L’immagine di γ
γ(I) = {(x(t), y(t), z(t)) ∈ R3 | t ∈ I} ⊂ R3
è detta traccia o traiettoria della curva. Nel caso n = 2, si parla di curve piane.
. Nelle precedenti equazioni vi è un piccolo abuso di notazione, poiché i simboli x ed y
indicano sia le componenti di γ, che sono funzioni, sia il valore di tali funzioni in t, cioè
numeri reali.
Esempio 1.11. Dato r > 0, la curva piana

x = r cos t
γ: t∈R
y = r sin t
ha come componenti x(t) = r cos t e y(t) = r sin t, la traccia è la circonferenza di centro
l’origine e raggio r di equazione cartesiana
x2 + y 2 = r 2 .

Campi. Un campo n-dimensionale è una funzione F : A ⊂ Rn → Rn


F (P ) = (f1 (P ), . . . , fn (P ))
che assegna ad ogni punto P del dominio un vettore F (P ) ∈ Rn . Le n-componenti
f1 , . . . , fn sono funzioni scalari con dominio A ⊂ R2 e codominio R. Nel caso n = 2 o
n = 3, il campo F si denota anche con
F (x, y) = u(x, y) i + v(x, y) j F (x, y, z) = u(x, y, z) i + v(x, y, z) j + w(x, y, z) k
Esempio 1.12. La forza applicata da una carica positiva unitaria posta in P0 su una
particella di carica positiva unitaria posta nel punto P è
1 P − P0
F (P ) =
4π0 kP − P0 k3
con componenti
1 x − x0
u(x, y, z) =
4π0 (x − x )2 + (y − y )2 + (z − z )2  23
0 0 0
1 y − y0
v(x, y, z) =
4π0 (x − x )2 + (y − y )2 + (z − z )2  23
0 0 0
1 z − z0
w(x, y, z) =
4π0 (x − x )2 + (y − y )2 + (z − z )2  23
0 0 0
13

Trasformazioni. Una trasformazione (attiva) è una funzione


Ψ : A ⊂ Rn → Rn
legge che assegna ad ogni punto del dominio P ∈ A il punto Ψ(P ). Ad esempio, nel caso
n = 2, la trasformazione è data da
(
x = x(x, y)
Ψ: .
y = y(x, y)
dove le componenti x(x, y) ed y(x, y) sono le coordinate del punto trasformato.
 
a c
Esempio 1.13. Data la matrice 2 × 2, A = , la trasformazione lineare associata è
b d
(
x = ax + cy
Ψ: ,
y = bx + dy
in cui le componenti sono x(x, y) = ax + cy e y(x, y) = bx + dy. La trasformazione Ψ
manda il quadrato di vertici (0, 0), (1, 0), (1, 1) e (0, 1), nel parallelogramma di vertice
l’origine ed i cui due lati adiacenti sono i vettori (a, b) e (c, d). Se il determinate ad − bc è
zero, i vettori (a, b) e (c, d) sono paralleli ed il parallelogramma si riduce ad un segmento.
Un caso di particolare interesse sono le rotazioni. Fissato un angolo θ ∈ R, la corrispondente
matrice di rotazione è  
cos θ − sin θ
Rθ =
sin θ cos θ
e la corrispondente trasformazione lineare è data da
(
x = cos θ x − sin θ y
Ψ: .
y = sin θ x + cos θ y
Dato un punto P0 = (x0 , y0 ) ed un angolo θ ∈ R, per ogni P = (x, y) definiamo
Pθ = P0 +Rθ (P −P0 ) = (x0 +cos θ (x−x0 )−sin θ (y −y0 ), y0 +sin θ (x−x0 )+cos θ (y −y0 ),
che si ottiene ruotando P di un angolo θ intorno a P0 .
La norma, il prodotto scalare e la distanza euclidea sono invarianti per rotazioni, cioè per
ogni θ ∈ R,
kRθ vk = kvk v ∈ R2
Rθ v · Rθ w = v · w v, w ∈ R2
d(P0 + Rθ (P − P0 ), P0 + Rθ (Q − P0 )) = d(P, Q) P, Q, P0 ∈ R2 .

Superfici. Una superficie (in R3 ) è una funzione σ(t, s) = (x(t, s), y(t, s), z(t, s)) con
dominio A ⊂ R2 e codominio R3 . La superficie si denota spesso con

x = x(t, s)

σ : y = y(t, s) ⇐⇒ σ(t, s) = x(t, s) i + y(t, s) j + z(t, s) k.

z = z(t, s)

Esempio 1.14 (piano). Dato un punto P0 = (x0 , yo , z0 ) e due vettori v = (v1 , v2 , v3 ) e


w = (w1 , w2 , w3 ) non paralleli tra di loro, il piano passante per i punti P0 , P0 + v e P0 + w
è la superficie

x = x0 + tv1 + sw1

σ : y = y0 + tv2 + sw2 .

z = z0 + tv3 + sw3

14

La condizione che v e w non siano paralleli equivale al fatto che il rango della matrice 3 × 2
 
v 1 w1
v2 w2 
v 3 w3
sia uguale a due.

Ritornando al caso generale, l’esempio delle funzioni scalari lineari può essere facilmente
esteso al caso vettoriale.
Esempio 1.15 (funzioni lineari). Data una matrice A = [aij ] di taglia m × n questa
definisce una funzione F : Rn → Rm definita da
    
a11 . . . a1n v1 a1: · v
F (v) = A v =  . . . . . . . . .  . . . =  . . . 
am1 . . . amn vn am: · v
dove v = (v1 , . . . , vn ) è pensato come vettore colonna, A v indica il prodotto matriciale
riga per colonna, e ai,: ∈ Rn è l’i-esimo vettore riga della matrice A. Dato i = 1, . . . , m, la
i-esima componente di F è
n
X
fi (v) = (Av)i = aij vj = ai,: · v.
j=1
La funzione F è lineare
F (λv + λ0 v 0 ) = λF (v) + λ0 F (v 0 ).
Ogni funzione lineare da Rn in Rm è della forma descritta per un’unica matrice A di taglia
m × n.
Esempio 1.16 (funzioni affini). Una matrice A = [aij ] di taglia m×n e due punti P ∗ ∈ Rn
e Q∗ ∈ Rm definiscono una funzione F : Rn → Rm
 ∗ 
x1 − x∗1
 
z1 a11 . . . a1n
F (P ) = Q∗ + A(P − P ∗ ) = . . . +  . . . . . . . . .   . . .  ,
zm∗ am1 . . . amn xn − x∗n
∗ ). Dato i = 1, . . . , m, la
dove P = (x1 , . . . , xn ), P ∗ = (x∗1 , . . . , x∗n ) e Q∗ = (z1∗ , . . . , zm
i-esima componente di F è
Xn

fi (P ) = zi + aij (xj − x∗j ) = zi∗ + ai,: · (P − P ∗ ).
j=1

2.1. Funzioni continue. La definizione di funzione continua è la naturale estensione di


quella data per funzioni di una variabile.
Def. 1.17. Sia F : A ⊂ Rn → Rm una funzione.
a) Dato P0 ∈ A, la funzione F è continua in P0 se per ogni  > 0 esiste δ > 0 tale che
kF (P ) − F (P0 )k <  se P ∈ A e kP − P0 k < δ,
equivalentemente F è continua in P0 se F (P ) è arbitrariamente vicino a F (P0 ) per ogni
P ∈ A sufficientemente vicino a P0 .
b) Dato B ⊂ A, la funzione F è continua su B se F è continua in tutti i punti di B.
c) La funzione F è detta continua se è continua sul suo dominio.

Si denota con C0 (A, Rm ) l’insieme delle funzioni continua definite su A ⊂ Rn ed a valori


in Rm . Se m = 1 si scrive semplicemente C0 (A).

Se z = f (x, y) è una funzione scalare di due variabili con dominio A ⊂ R2 , f è continua


nel punto P0 = (x0 , y0 ) ∈ A se per ogni  > 0 esiste δ > 0 tale che
p
|f (x, y) − f (x0 , y0 )| <  per ogni (x, y) ∈ A tale che (x − x0 )2 + (y − y0 )2 < δ.
15

Nota. La continuità è una proprietà locale del senso che se F e G sono due funzioni con
dominio A e B rispettivamente, dato P0 ∈ A ∩ B se esiste δ > 0 per cui
A ∩ B(P0 , δ) = B ∩ B(P0 , δ)
F (P ) = G(P ) ∀P ∈ A ∩ B(P0 , δ),
allora F è continua in P0 se e solo se G è continua in P0 .

Una classe di funzioni continue sono le funzioni lipschitziane.

Lemma 1.18. Data una funzione F : A ⊂ Rn → Rm per cui esiste una costante L > 0
tale che
kF (Q) − F (P )k ≤ LkQ − P k per ogni P, Q ∈ A, (6)
allora F è continua.

Dimostrazione. Dato P0 ∈ A, per ogni  > 0 definiamo δ = /L, allora se P ∈ A e


kP − P0 k < δ, allora

kF (P ) − F (P0 )k ≤ LkP − P0 k < L = .
L


Le funzioni che soddisfano la (6) sono dette lipschitziane ed L la costante di Lipschitz.


Esempio 1.19. Consideriamo la funzione f : Rn → R, f (v) = kvk. Dalla disuguaglianza
triangolare
|kvk − kwk| ≤ kv − wk,
segue che la norma è una funzione lipschitziana con costante 1, quindi è continua.
Esempio 1.20. Le funzioni lineari e affini introdotte negli esempi 1.15–1.16 sono lipschi-
tziane e quindi, continue.
Infatti, data una funzione affine F : Rn → Rm
F (P ) = Q∗ + A(P − P ∗ ),
con P ∗ ∈ Rn , Q∗ ∈ Rm ed A = [aij ] matrice di taglia m × n, allora
m X
X n
kF (Q) − F (P )k2 = kA(Q − P )k2 = ( ai,j (Q − P )j )2
i=1 j=1
m
X m
X
2
= (ai,: · (Q − P )) ≤ kai,: k2 kQ − P k2 = L2 kQ − P k2
i=1 (∗) i=1

dove (∗) segue dalla disuguaglianza di Schwarz e la costante di Lipschitz è


m
X m X
X n
2 2
L = kai,: k = a2i,j = kAk22 .
i=1 i=1 j=1

Se F (v) = Av è una funzione lineare, dalla precedente disuguaglianza, segue che per
ogni v ∈ Rn
kAvk ≤ kAk2 kvk,
e, quindi, la quantità
kAvk
kAk∞ = sup = sup kAvk ≤ kAk2
v∈Rd , v6=0 kvk v∈Rd , kvk=1
16

è finita e, per costruzione, è la migliore stima della costante di Lipschitz della funzione li-
neare affine associata alla matrice A. La quantità kAk∞ è detta norma spettrale o uniforme
della matrice A, mentre kAk2 è chiamata norma di Frobenius, e vale
kAvk ≤ kAk∞ kvk ≤ kAk2 kvk v ∈ Rn . (7)

La continuità di una funzione vettoriale può essere ricondotta allo studio della continuità
delle sue componenti.
Lemma 1.21. Una funzione vettoriale
F : A ⊂ Rn → Rm F (P ) = (f1 (P ), . . . , fm (P ))
è continua se e solo se tutte le sue componenti f1 : A → R, . . ., fm : A → R sono continue.

Dimostrazione. Per chiarezza supponiamo che m = 2. Se F è continua in P0 , dato  > 0


esiste δ > 0 tale che kF (P ) − F (P0 )k <  se P ∈ A e kP − P0 k < δ. Dalla (1) si ha che
|f1 (P ) − f1 (P0 )| <  e |f2 (P ) − f2 (P0 )| <  per cui f1 e f2 sono entrambe continue in P0 .
Viceversa, se f1 e f2 sono continue in P0 ∈ A, dato  > 0 esistono δ1 , δ2 > 0 tali che

|f1 (P ) − f1 (P0 )| < P ∈ A ∩ B(P0 , δ1 )
2

|f2 (P ) − f2 (P0 )| < P ∈ A ∩ B(P0 , δ2 ).
2
Posto δ = min{δ1 , δ2 }, se P ∈ A ∩ B(P0 , δ), valgono entrambe le precedenti disuguaglianze
r
p
2 2
2
kF (P ) − F (P0 )k = (f1 (P ) − f1 (P0 )) + (f2 (P ) − f2 (P0 )) = 2 < .
4


Dal precedente lemma segue che una curva piana γ : I ⊂ R → R2



x = x(t)
γ:
y = y(t)
è continua se e solo se sono continue le componenti x(t) e y(t) ed un campo bidimensionale
F : A ⊂ R2 → R2
F (x, y) = (u(x, y), v(x, y)) = u(x, y) i + v(x, y) j
è continuo se e solo se sono continue le sue componenti u e v.
La continuità è preservata dalle operazioni elementari tra funzioni, come mostrano i se-
guenti due teoremi.

Teo 1.22 (Continuità della funzione composta). Date due funzioni F : A ⊂ Rn → Rm e


G : B ⊂ Rm → Rp tali che F (A) ⊂ B.
a) Se F è continua in P0 ∈ A e G è continua in Q0 = F (P0 ) ∈ B, allora la funzione
composta G ◦ F : A ⊂ Rn → Rp è continua in P0 .
b) Se F e G sono continue, la funzione composta G ◦ F è continua.

Dimostrazione. È sufficiente mostrare il punto a). Dato  > 0, per la continuità di G in


Q0 = F (P0 ) esiste δ 0 > 0 tale
kG(Q) − G(F (P0 ))k <  se kQ − F (P0 )k < δ 0 e Q ∈ B. (8)
Per la continuità di F in P0 , esiste δ > 0 tale che
kF (P ) − F (P0 )k < δ 0 se kP − P0 k < δ e P ∈ A.
Quindi se P ∈ A e kP − P0 k < δ, scegliendo nella (8) Q = F (P ), che appartiene a B
essendo F (A) ⊂ B, segue che kG(F (P )) − G(F (P0 ))k < . 
17

Per dimostrare il successivo teorema abbiamo bisogno del seguente lemma che mostra
come alcune semplici operazioni siano continue. Nell’enunciato lo spazio Rn × Rm è stato
identificato con Rn+m in accordo con la (3).
Lemma 1.23. Le seguenti funzioni
π k : Rn → R πk (v) = vk k = 1, . . . , n
n n n
s:R ×R →R s(v, w) = v + w
n n
m:R×R →R m(t, v) = tv
sono continue.

Dimostrazione. È sufficiente mostrare che le funzioni sono lipschitziane. Relativamente


alle proiezioni πk
|πk (v) − πk (v ∗ )| = |vk − vk∗ | ≤ kv − v ∗ k,
per cui sono lipschitziane con L = 1. La funzione s è lipschitziana con costante 2. Infatti
ks(v, w) − s(v ∗ , w∗ )kn = k(v − v ∗ ) + (w − w∗ )kn ≤ kv − v ∗ kn + kw − w∗ kn
≤ 2k(v, w) − (v ∗ , w∗ )k2n ,
dove si è usato la (4).
Infine, per la moltiplicazione, fissato (t∗ , v ∗ ) ∈ Rn+1 mostriamo che m è continua in
(t∗ , v ∗ ). Essendo la continuità una proprietà locale, possiamo restringere m all’insieme
aperto B((t∗ , v ∗ ), 1). Allora per ogni (t, v) ∈ B((t∗ , v ∗ ), 1)
km(t, v) − m(t∗ , v ∗ )kn = k(t − t∗ )v + (v − v ∗ )t∗ kn
≤ |t − t∗ | kv − v ∗ + v ∗ kn + kv − v ∗ kn |t∗ |
≤ |t − t∗ | (kv − v ∗ kn + kv ∗ kn ) + kv − v ∗ kn |t∗ |
(∗)
≤ (kv − v ∗ kn + kv ∗ kn ) k(t − t∗ , v − v ∗ )kn+1 + |t∗ | k(t − t∗ , v − v ∗ )kn+1
(∗∗)
≤ (1 + kv ∗ kn + |t∗ |) k(t − t∗ , v − v ∗ )kn+1 ,
(∗∗∗)

dove in (*) si è usato la disuguaglianza triangolare, in (**) le (4) ed in (***) l’assunzione


che kv − v ∗ kn ≤ k(t − t∗ , v − v ∗ )kn+1 < 1. Fissato  > 0, scegliamo

δ = min{1, } ≤ 1.
1 + kv kn + |t∗ |

Allora, per ogni (t, v) ∈ B((t∗ , v ∗ ), δ)


km(t, v) − m(t∗ , v ∗ )kn ≤ (1 + kv ∗ kn + |t∗ |) k(t − t∗ , v − v ∗ )kn+1 < ,
per cui m ristretta a B((t∗ , v ∗ ), 1) è continua. 
. Data una funzione continua di una variabile ϕ : I → R, questa definisce naturalmente
una funzione di due variabili f : I × R → R
f (x, y) = ϕ(x) ⇐⇒ f (x, y) = ϕ(π1 (x, y))
che è continua poiché π1 è continua. Analogamente, se si scambia il ruolo di x ed y.
Teo 1.24. Valgono le seguenti proprietà.

a) Date due funzione scalari continue


f : A ⊂ Rn → R g : B ⊂ Rn → R
allora la somma f + g, il prodotto f g ed il rapporto f /g sono funzioni continue sul loro
dominio naturale.
18

b) Date due funzioni vettoriali


F : A ⊂ Rn → Rm G : B ⊂ Rn → Rm
allora la somma F + G, la moltiplicazione per scalare λF con λ ∈ R, la norma kF k ed
il prodotto scalare F · G sono funzioni continue sul loro dominino naturale.
c) Date una funzione scalare f ed una funzione vettoriale F
f : A ⊂ Rn → R F : B ⊂ Rn → Rm
allora la funzione f F è continua sul suo dominino naturale.

Dimostrazione. Per semplicità supponiamo che n = m = 2.

a) Mostriamo ad esempio che il prodotto è una funzione continua su A ∩ B. Per ogni


(x, y) ∈ A ∩ B
f (x, y) g(x, y) = m(f (x, y), g(x, y)) = m(F (x, y)),
dove m : R × R → R, m(t, v) = tv è la funzione continua definita nel Lemma 1.23
con n = 1, ed F : A ∩ B ⊂ R2 → R2 , F (x, y) = (f (x, y), g(x, y)), è continua per il
Lemma 1.21. Allora f g è continua per il Teorema 1.22.
b) Mostriamo ad esempio che F + G è una funzione continua. Per ogni (x, y) ∈ A ∩ B
F (x, y) + G(x, y) = s(F (x, y), G(x, y)) = s(H(x, y)),
dove s : R2 × R2 → R2 , s(v, w) = v + w è la funzione continua definita nel Lem-
ma 1.23 con n = 2, ed H : A ∩ B → R4 , H(x, y) = (F (x, y), G(x, y)), è continua per il
Lemma 1.21. Quindi, F + G è continua per il Teorema 1.22.
c) Si dimostra analogamente al punto a).



Esempio 1.25. La funzione f (x, y) = x2 / y è continua su R × (0, +∞) poiché prodotto

delle funzioni g(x, y) = x2 = ϕ(π1 (x, y)) e h(x, y) = 1/ y = ψ(π2 (x, y)) dove
1
ϕ(t) = t2 ψ(t) = √
t
sono funzioni (di una variabile) continue rispettivamente su R e su (0, +∞).

2.1.1. Funzioni infinitesime. Introduciamo una classe di funzioni che formalizzano l’idea
intuitiva di errore infinitesimo.
Def. 1.26. Una funzione  : A ⊂ Rn → Rm è detta infinitesima (nell’origine) se 0 ∈ A,
(0) = 0 ed  è continua in zero. In altre parole, se per ogni e
 > 0 esiste δ > 0 tale che
se v ∈ A e kvk < δ allora k(v)k < e
.

Se (v) è una funzione infinitesima (nell’origine) e P0 è un punto di Rn , diremo che (P −P0 )
è una funzione infinitesima (in P0 ).
Una funzione vettoriale (v) = (1 (v), . . . , m (v)) è infinitesima se e solo se lo sono tutte le
sue componenti i . Una funzione scalare  : A ⊂ R2 → R è infinitesima se (0, 0) ∈ A e
p
∀e > 0, ∃δ > 0 tale che |(h, k)| < e  se (h, k) ∈ A e h2 + k 2 < δ.
. Con lieve abuso di notazione, nel seguito indicheremo con (v), (P − P∗ ) una generica
funzione infinitesima, anche quando si tratta di funzioni differenti. Ad esempio 2(v) = (v)
e (v) − (v) = (v) 6= 0.
19

Dalle proprietà delle funzioni continue si verifica immediatamente che


λ(v) + µ(v) = (v) λ, µ ∈ R
((v)) = (v) (9)
k(v)k = (v)
per ogni vettore v per cui il membro di sinistra è ben definito. Inoltre

a) se una funzione F vettoriale è maggiorata da una funzione scalare (positiva) infinitesima,


kF (v)k ≤ (v) v ∈ A,
allora F è una funzione infinitesima;
b) se f è una funzione scalare tale che 0 ∈ dom f ed f è localmente limitata, cioè esistono
C, δ > 0 per cui |f (v)| ≤ C per ogni v ∈ dom f ∩ B(0, δ), allora
f (v)(v) = (v);
c) se F è una funzione vettoriale tale che 0 ∈ dom F ed F è localmente limitata, cioè
esistono C, δ > 0 per cui kF (v)k ≤ C per ogni v ∈ dom F ∩ B(0, δ), allora
F (v) · (v) = (v).

Evidentemente, una funzione F : A ⊂ Rn → Rm è continua in P0 se e solo se


F (P0 + v) = F (P0 ) + (v), (10)
dove l’errore (v) è una funzione infinitesima.

2.2. Limiti di funzioni scalari. La definizione di limite è analoga a quella per funzione
di una sola variabile. Per semplicità, enunciamo le definizioni solo per funzioni scalari di
due variabili.
Def. 1.27. Data una funzione f : A ⊂ R2 → R, z = f (x, y), ed un punto (x0 , y0 ) ∈ R2 di
accumulazione per A,

a) la funzione f ha limite ` ∈ R per (x, y) che tende a (x0 , y0 ) se per ogni  > 0 esiste
δ > 0 tale che
p
|f (x, y) − `| <  se (x, y) ∈ A e 0 < (x − x0 )2 + (y − y0 )2 < δ;
b) la funzione f ha limite ` = ±∞ per (x, y) che tende a (x0 , y0 ) se per ogni M > 0 esiste
δ > 0 tale che
(
f (x, y) > M ` = +∞ p
se (x, y) ∈ A e 0 < (x − x0 )2 + (y − y0 )2 < δ.
f (x, y) < −M ` = −∞

In entrambi i casi si scrive


lim f (x, y) = `.
(x,y)→(x0 ,y0 )

Più delicata è l’estensione del concetto di limite “all’infinito”.


Def. 1.28. Data una funzione f : A ⊂ R2 → R, z = f (x, y), con dominio A non limitato,

a) la funzione f ha limite ` ∈ R per k(x, y)k che tende a +∞ se per ogni  > 0 esiste R > 0
tale che p
|f (x, y) − `| <  se (x, y) ∈ A e x2 + y 2 > R;
b) la funzione f ha limite ` = ±∞ per k(x, y)k che tende a +∞ se per ogni M > 0 esiste
R > 0 tale che
(
f (x, y) > M ` = +∞ p
se (x, y) ∈ A e x2 + y 2 > R.
f (x, y) < −M ` = −∞
20

In entrambi i casi si scrive


lim f (x, y) = `.
k(x,y)k→+∞

p
Da notare che A è non limitato se e solo se sup(x,y)∈A x2 + y 2 = +∞.
. Essendo la norma positiva, non ha senso il limite per k(x, y)k che tende a −∞. Poiché
in R2 non è stata definita una relazione d’ordine, non hanno senso i limiti per (x, y) che
tende a ±∞.

Per i limiti in R2 valgono tutti i teoremi visti per le funzioni di una variabile, tranne quello
relativo alle funzioni monotone. Inoltre, dalla definizione segue che

i) una funzione  è infinitesima se e solo se (0, 0) = 0


lim (h, k) = 0 ⇐⇒ lim (x − x0 , y − y0 ) = 0
(h,k)→(0,0) (x,y)→(x0 ,y0 )

dove è sottinteso che (0, 0) è un punto di accumulazione per il dominio di ;


ii) esiste finito lim(x,y)→(x0 ,y0 ) f (x, y) = ` ∈ R se e solo se esiste una funzione infinitesima 
tale che
|f (x, y) − `| ≤ (x − x0 , y − y0 ) (x, y) ∈ A, (x, y) 6= (x0 , y0 );
iii) se (x0 , y0 ) ∈ A ed è di accumulazione per A, la funzione f è continua in (x0 , y0 ) se e
solo se
lim f (x, y) = f (x0 , y0 ). (11)
(x,y)→(x0 ,y0 )

Il seguente lemma fornisce una condizione necessaria.


Lemma 1.29. Data una funzione f : A ⊂ R2 → R, z = f (x, y)

a) se esiste
lim f (x, y) = ` ∈ R ∪ {±∞},
(x,y)→(x0 ,y0 )

dove (x0 , y0 ) ∈ R2 è un punto di accumulazione per A, per ogni curva continua



x = x(t)
γ: a≤t<b
y = y(t)
tale che (
(x(t), y(t)) ∈ A \ {(x0 , y0 )} a<t<b
,
(x(a), y(a)) = (x0 , y0 ) t=a
allora esiste
lim f (x(t), y(t)) = `; (12)
t→a
b) se esiste
lim f (x, y) = ` ∈ R ∪ {±∞},
k(x,y)k→+∞
dove A è un insieme non limitato, per ogni curva continua

x = x(t)
γ: a ≤ t < b,
y = y(t)
tale che (x(t), y(t)) ∈ A per ogni t ∈ A e
p
lim x(t)2 + y(t)2 = limkγ(t))k = +∞,
t→b t→b
allora esiste
lim f (x(t), y(t)) = `.
t→b
21

Dimostrazione. Proviamo il lemma nel caso in cui (x0 , y0 ) è di accumulazione per A ed


` ∈ R. Definiamo la funzione g : A ∪ {(x0 , y0 )} → R
(
g(x, y) = f (x, y) se (x, y) ∈ A, (x, y) 6= (x0 , y0 )
.
g(x, y) = ` se (x, y) = (x0 , y0 )
Per la (11) l’esistenza del limite equivale al fatto che g sia continua in (x0 , y0 ). Essendo γ
continua in t = a il Teorema 1.22 implica che la funzione composta g(x(t), y(t)) è continua
in t = a. Quindi
lim g(x(t), y(t)) = g(x(a), y(a)) = g(x0 , y0 ) = `.
t→a
Se t 6= a, per ipotesi, (x(t), y(t)) ∈ A \ {(x0 , y0 )} e, quindi, g(x(t), y(t)) = f (x(t), y(t)), da
cui la tesi. 

Discutiamo l’uso del precedente lemma per calcolare il limite (se esiste) quando (x0 , y0 ) è
un punto di accumulazione per A. Il caso del limite per k(x, y)k che tende a +∞ si tratta
in modo simile. Per il Lemma 1.29, affinché il limite in due variabili lim(x,y)→(x0 ,y0 ) f (x, y)
esista, per ogni curva γ(t) uscente dal punto (x0 , y0 ) deve necessariamente esistere il limite
in una variabile limt→a f (γ(t)) ed il valore del limite deve essere indipendente da γ.
Passo 1. La scelta più semplice per la curva γ corrisponde alle rette parallele agli assi
cartesiani. Il limite (12) si riduce a calcolare
lim f (x, y0 ) e lim f (x0 , y),
x→x0 y→y0

purché esista δ > 0 tale che (x, y0 ) ∈ A se 0 < |x − x0 | < δ e (x0 , y) ∈ A se 0 < |y − y0 | < δ.
Se uno dei due limiti non esiste oppure sono diversi tra di loro, allora non può esistere
lim(x,y)→(x0 ,y0 ) f (x, y), vedi Esempio 1.30. Viceversa, se
lim f (x, y0 ) = lim f (x0 , y) = ` ∈ R ∪ {±∞}
x→x0 y→y0

necessariamente ` sarà (se esiste) il limite in due variabili. Tuttavia, come mostrato
dall’esempio 1.31 questa condizione non è sufficiente.
Passo 2. Il passo successivo è quello di scegliere come curva una generica semi-retta
uscente dal punto (x0 , y0 )

x(r) = x0 + r cos θ
γ: r ∈ [0, δ),
y(r) = y0 + r sin θ
parametrizzata dall’angolo θ ∈ (−π, π] che forma con l’asse positivo delle ascisse. Si calcola,
quindi,
lim f (x0 + r cos θ, y0 + r sin θ)
r→0
per tutte le direzioni θ ∈ (−π, π] ammissibili, cioè tali che
(x0 + r cos θ, y0 + r sin θ) ∈ A per ogni 0 < r < δ
per un opportuno δ > 0. Se uno di questi limiti non esiste oppure sono diversi lungo
due semi-rette distinte, allora analogamente a prima lim(x,y)→(x0 ,y0 ) f (x, y) non esiste, vedi
Esempio 1.31.
. Se per tutte le direzioni θ ammissibili esiste
lim f (x0 + r cos θ, y0 + r sin θ) = ` ∈ R ∪ {±∞}
r→0

con ` indipendente da θ, in generale non si può concludere che lim(x,y)→(x0 ,y0 ) f (x, y) esista,
vedi Esempio 1.32.

Passo 3 Avendo determinato `, si possono seguire due strade alternative.


22

a) Se esiste una funzione infinitesima positiva  tale che


|f (x, y) − `| ≤ (x − x0 , y − y0 ) `∈R
1
f (x, y) ≥ ` = +∞
(x − x0 , y − y0 )
1
f (x, y) ≤ − ` = −∞,
(x − x0 , y − y0 )
allora esiste lim(x,y)→(x0 ,y0 ) f (x, y) = `, vedi Esempio 1.33. La difficoltà sta nel trovare
una funzione (x − x0 , y − y0 ) che maggiori |f (x, y) − `| e sia infinitesima.
b) Se esiste una curva continua γ(t) = (x(t), y(t)) come nell’enunciato del punto a) del
Lemma 1.29 tale che
lim f (x(t), y(t)) 6= `,
t→a
allora il limite lim(x,y)→(x0 ,y0 ) f (x, y) non esiste, vedi Esempio 1.32.
. La definizione di limite non può essere ricondotta all’esistenza dei limiti iterati. Infatti
x+y x+y
lim lim =1 lim lim = −1,
x→0 y→0 x − y y→0 x→0 x − y
ax+by
ma il limite lim(x,y)→0 cx+dy non esiste. Infatti,
 
x+y
lim =1
x→0 x − y |y=0

ed analogamente
 
x+y
lim = −1.
y→0 x−y |x=0

Esempio 1.30. Non esiste


x2
lim
(x,y)→(0,0) y 2 + x4
poiché
1 0
lim f (x, 0) = lim = +∞ lim f (0, y) = lim = 0.
x→0 x→0 x2 y→0 y→0 y2
Esempio 1.31. Non esiste
xy
lim
(x,y)→(0,0) x2 + y 2
poiché, dato θ ∈ (−π, π]
r cos θ r sin θ
lim = cos θ sin θ,
r→0 r 2 cos2 θ + r2 sin2 θ
che dipende esplicitamente da θ. Da notare che per θ = −π/2, 0, π/2, π, cioè lungo gli assi
cartesiani, il limite vale zero.
Esempio 1.32. Non esiste
xy 2
lim
(x,y)→(0,0) x2 + y 4

nonostante che per ogni θ ∈ (−π, π]


r cos θ r2 sin2 θ
lim = 0.
r→0 r 2 cos2 θ + r 4 sin4 θ

Infatti, scelta la curva γ(t) = (t2 , t), che soddisfa le ipotesi del punto a) del Lemma 1.29,
t4 1
lim = .
t→0 t4 + t4 2
23

Esempio 1.33. Esiste


x2 y
lim = 0.
(x,y)→(0,0) x2 + y 2

Infatti, poiché f (x, 0) = 0, se esiste il limite, deve essere zero. Inoltre poiché x2 ≤ x2 + y 2 ,
per ogni (x, y) 6= (0, 0)
x2 y
| 2 | ≤ |y|
x + y2
x2 y
ed (x, y) = |y| è una funzione infinitesima, allora lim(x,y)→(0,0) x2 +y 2
= 0.

Ricordando che le coordinate polari sono definite da



x = r cos θ
y = r sin θ
con r > 0 e θ ∈ (−π, π], la seguente proposizione fornisce una condizione equivalente per
l’esistenza del limite ottenuta scrivendo la funzione in coordinate polari con centro (x0 , y0 ).
Prop. 1.34. Data una funzione f : A ⊂ R2 → R tale che
A = {(x0 + r cos θ, y0 + r sin θ) ∈ R2 | r ∈ (0, R), θ ∈ J}, (13)
dove R > 0 e J ⊂ (−π, π], allora esiste
lim f (x, y) = ` ∈ R ∪ {±∞}
(x,y)→(x0 ,y0 )

se e solo se
lim sup|f (x0 + r cos θ, y0 + r sin θ) − `| = 0 `∈R
r→0 θ∈J

lim inf f (x0 + r cos θ, y0 + r sin θ) = +∞ ` = +∞ (14)


r→0 θ∈J
lim sup f (x0 + r cos θ, y0 + r sin θ) = −∞ ` = −∞.
r→0 θ∈J

. Nell’enunciato della proposizione è implicitamente assunto che J 6= ∅.

Dimostrazione. Dimostriamo la proposizione nel caso ` ∈ R e (x0 , y0 ) = (0, 0). Definiamo


 : (0, R) → R
(r) = sup|f (r cos θ, r sin θ) − `| 0<r<R
θ∈J
(0) = 0
L’assunzione (13) sul dominio A implica che l’origine sia un punto di accumulazione per
A e (0, 0) ∈
/ A, Inoltre, per ogni (x, y) ∈ A, esistono r ∈ (0, R) e θ ∈ J tali che
x = r cos θ y = r sin θ,
allora p
|f (x, y) − `| = |f (r cos θ, r sin θ) − `| ≤ (r) = ( x2 + y 2 ).
p
Se vale la (14), allora (r) è una funzione infinitesima, quindi, anche ( x2 + y 2 ) è
infinitesima poiché composizione di funzioni infinitesime, per cui lim(x,y)→(0,0) f (x, y) = `.
Viceversa, se esiste il limite lim(x,y)→(0,0) f (x, y) = `, mostriamo che (r) è infinitesima.
Fissato ˜ > 0, esiste 0 < δ < R tale che
|f (x, y) − `| < ˜ ∀(x, y) ∈ A ∩ B(0, δ).
Per tali (x, y) = (r cos θ, r sin θ) con 0 < r < δ e θ ∈ J, si ha |f (r cos θ, r sin θ) − `| < ˜.
Allora, fissato 0 < r < δ, dalla precedente disuguaglianza
(r) = sup|f (r cos θ, r sin θ) − `| ≤ ˜.
θ∈J

Quindi, per ogni 0 < r < δ, 0 ≤ (r) ≤ ˜, per cui (r) è infinitesima, cioè vale la (14). 
24

La condizione (13) stabilisce che il dominio di f è un’unione di settori circolari di centro


(x0 , y0 ) e raggio R, escluso il punto (x0 , y0 ). Nel caso in cui J = (−π, π], A è la palla di
raggio R privata del centro.
. Poiché il limite è una proprietà locale, la condizione (13) si può indebolire richiedendo
che esistano R > 0 e ∅ =6 J ⊂ (−π, π] tali che
(dom f ∩ B((x0 , y0 ), R)) \ {(x0 , y0 )} = {(x0 + r cos θ, y0 + r sin θ) ∈ R2 | r ∈ (0, R), θ ∈ J}.
. La condizione (14) implica che per ogni θ ∈ J
lim f (x0 + r cos θ, y0 + r sin θ) = `,
r→0
cioè che i limiti lungo le semi-rette passanti per (x0 , y0 ) esistono e sono tutti eguali tra
di loro. Tuttavia quest’ultima condizione da sola non è sufficiente a garantire la (14),
come mostra l’esempio 1.35. È necessario che i limiti lungo le rette tendano ad ` uni-
formemente rispetto alla direzione θ. Per verificare la (14) occorre prima fare l’estremo
superiore/inferiore su θ e poi il limite per r che tende a zero. In molti casi non è necessario
determinare tale estremo, ma è sufficiente trovare una funzione infinitesima (r) positiva
tale che per ogni 0 < r < R e θ ∈ J
|f (x0 + r cos θ, x0 + r sin θ) − `| ≤ (r) `∈R
1
f (x0 + r cos θ, y0 + r sin θ) ≥ ` = +∞
(r)
1
f (x0 + r cos θ, y0 + r sin θ) ≤ − ` = −∞.
(r)
Esempio 1.35. Consideriamo nuovamente l’esempio 1.32. Fissato 0 < r < 1/2, sfruttando
il fatto che ` = 0 e la funzione |xy 2 /(x2 + y 4 )| è pari in x ed y, allora
cos θ sin2 θ 1 cos θ
sup |f (r cos θ, r sin θ)| = r sup 2 2 4 ≥ r sup 2 2
θ∈(−π,π] θ∈[0, π2 ] cos θ + r sin θ θ∈[ π4 , π2 ] 2 cos θ + r
t 1 1
= r sup√ =r =
t∈[0, 2
]
t2 +r 2 2r 2
2

√ se π/4 ≤ θ ≤ π/2, allora 1/2 ≤


poiché, sin2 θ ≤ 1, e cos θ varia
√ su tutto l’intervallo
2 2
[0, 2/2] ed il punto di massimo di t/(t + r ) sull’intervallo [0, 2/2] è t = r < 1/2.
Allora
sup |f (r cos θ, r sin θ)| ≥ 1/2,
θ∈(−π,π]
per cui la (14) non è verificata.
Esempio 1.36. Consideriamo nuovamente l’esempio 1.33
x2 y
lim .
(x,y)→(0,0) x2 + y 2

Ricordando che ` = 0, per ogni r > 0 e θ ∈ (−π, π]


r2 cos2 θ r sin θ
|f (r cos θ, r sin θ)| = | | ≤ r,
r2 cos2 θ + r2 sin2 θ
essendo |cos2 θ sin θ| ≤ 1. Poiché (r) = r è una funzione infinitesima, allora il limite esiste.

Un analogo risultato vale per domini non limitati.


Prop. 1.37. Data una funzione f : A ⊂ R2 → R tale che
A = {(x0 + r cos θ, y0 + r sin θ) ∈ R2 | r ∈ (R, +∞), θ ∈ J}, (15)
dove R > 0 e ∅ =
6 J ⊂ (−π, π] allora esiste
lim f (x, y) = ` ∈ R ∪ {±∞}
k(x,y)k→+∞
25

se e solo se
lim sup|f (x0 + r cos θ, y0 + r sin θ) − `| = 0 `∈R
r→+∞ θ∈J

lim inf f (x0 + r cos θ, y0 + r sin θ) = +∞ ` = +∞ (16)


r→+∞ θ∈J
lim sup f (x0 + r cos θ, y0 + r sin θ) = −∞ ` = −∞
r→+∞ θ∈J

La condizione (16) implica che per ogni θ ∈ J il limite della funzione di una sola variabile
lim f (x0 + r cos θ, x0 + r sin θ) = `, (17)
r→+∞

tuttavia la (17) da solo non è sufficiente a garantire l’esistenza del limite limk(x,y)k→+∞ f (x, y).
Deve esistere una funzione infinitesima (r) tale che per ogni r > R e θ ∈ J
1
|f (x0 + r cos θ, x0 + r sin θ) − `| ≤ ( ) `∈R
r
1
f (x0 + r cos θ, x0 + r sin θ) ≥ 1 ` = +∞
( r )
−1
f (x0 + r cos θ, x0 + r sin θ) ≤ 1 ` = −∞.
( r )
Esempio 1.38. Il limite
1
lim
k(x,y)k→+∞ xy
non esiste. Infatti, dato c 6= 0, se γ è la curva

x = ct
γ: t ∈ (0, +∞),
y = 1t
allora
1
lim kγ(t)k2 = lim (ct)2 + = +∞,
t→+∞ t→+∞ t2
ma
1
lim f (ct, ) = c,
t→+∞ t
che dipende esplicitamente da c. Osservate che per ogni θ ∈ (π, π) con θ 6= −π/2, 0, π/2, π,
1 1
lim f (r cos θ, r sin θ) = lim 2
=0
r→+∞ r→+∞ r cos θ sin θ

e, tuttavia
1 1
lim sup | | = +∞.
r→+∞ −π<θ<π r2 cos θ sin θ
θ6=0,±π/2

2.3. Proprietà delle funzioni continue. Il seguente risultato sulle contro-immagini di


funzioni continue è utile per determinare se un insieme è aperto o chiuso.
Prop. 1.39. Data una funzione continua F : A ⊂ Rn → Rm , allora

a) per ogni aperto V ⊂ Rm esiste un aperto U ⊂ Rn tale che


F −1 (V ) = A ∩ U,
se, inoltre, anche A è aperto, la contro-immagine F −1 (V ) è aperta;

b) per ogni chiuso C ⊂ Rm esiste un chiuso D ⊂ Rn tale che


F −1 (C) = A ∩ D,
se, inoltre, anche A è chiuso, la contro-immagine F −1 (C) è chiusa.
26

Dimostrazione. È sufficiente mostrare il punto a). Dato V aperto di Rm , fissato un punto


P0 ∈ F −1 (V ), allora Q0 = F (P0 ) appartiene all’aperto V , per cui esiste  > 0 tale che
B(Q0 , ) ⊂ V . Per la continuità di F in P0 , esiste δ > 0 tale che
se P ∈ A ∩ B(P0 , δ) allora F (P ) ∈ B(Q0 , ) ⊂ V. (18)
Ricordando che il raggio δ = δ(P0 ) dipende esplicitamente da P0 , definiamo
[
U= B(P0 , δ(P0 )),
P0 ∈F −1 (V )

che è aperto perché unione arbitraria di aperti. Mostriamo che F −1 (V ) = A ∩ U . Per


costruzione F −1 (V ) ⊂ A ∩ U , viceversa, se P ∈ A ∩ U , allora esiste P0 ∈ F −1 (V ) tale che
P ∈ A ∩ B(P0 , δ(P0 )) e, quindi, F (P ) ∈ V per la (18). 
. Per una funzione continua, in generale non è vero che l’immagine di un insieme aperto
(risp. chiuso) sia aperto (risp. chiuso). Ad esempio, la funzione scalare f : R2 → R,
f (x, y) = 1+x12 +y2 è continua, ma f (R2 ) è l’intervallo (0, 1]. Infatti, per ogni (x, y) ∈ R2
1
evidentemente 0 < f (x, y) ≤ 1 e, dall’Analisi 1, {f (x, 0) = 1+x 2 | x ∈ R} = (0, 1] . Allora

f (R2 ) = (0, 1] dove R2 è chiuso ed aperto, ma (0, 1] non è né chiuso né aperto.

Introduciamo la seguente definizione che estende ad Rn il concetto di intervallo.


Def. 1.40. Un insieme C ⊂ Rn è connesso per archi se, per ogni P0 , P1 ∈ C, esiste una
curva continua γ : [0, 1] → Rn tale che P0 = γ(0), P1 = γ(1) e γ(t) ∈ C per ogni t ∈ [0, 1],
cioè esiste una curva continua γ di estremi γ(0) = P1 e γ(1) = P2 , la cui traccia è contenuta
tutta in C.
Nota. Se C è un sottoinsieme di R, C è connesso per archi se e solo se è un intervallo.
Infatti, se C è un intervallo chiaramente è connesso per archi. Viceversa, se C è un insieme
connesso per archi, proviamo che C è un intervallo, mostrando che se x1 < x2 < x3 e
x1 , x3 ∈ C, allora x2 ∈ C. Sia γ : [0, 1] → R curva continua di estremi γ(0) = x1 e
γ(1) = x2 e γ(t) ∈ C per ogni t ∈ [0, 1]. Essendo γ continua e γ(0) = x1 < x2 < x3 = γ(1)
per il teorem dei valori intermedi (Analisi I), esiste t ∈ (0, 1) tale che γ(t) = x2 e, quindi,
x2 ∈ C.
Teo 1.41. Data una funzione continua F : A ⊂ Rn → Rm ,

a) se K ⊂ A è compatto di Rn , allora F (K) è un sottoinsieme compatto di Rm ;


b) se C ⊂ A è connesso per archi di Rn , allora F (C) è un sottoinsieme connesso per archi
di Rm .

Dimostrazione. Dimostriamo il punto a). Se K ⊂ A è un compatto, mostriamo che F (K)


è compatto usando il Teorema 1.7. Dato un ricoprimento aperto (Vj )j∈J di F (K), la
Proposizione 1.39 assicura che per ogni j ∈ J esiste Uj aperto di Rn tale che
F −1 (Vj ) = Uj ∩ A.
Allora (Uj )j∈J è un ricoprimento aperto di K. Il Teorema 1.7 assicura che, essendo K
compatto, esiste un sotto-ricoprimento finito Uj1 , . . . , UjN e, quindi, Vj1 , . . . , VjN è un
ricoprimento finito di F (K). Applicando nuovamente il Teorema 1.7, anche F (K) è
compatto.
Proviamo il punto b). Se C è connesso per archi, mostriamo che F (C) è connesso per
archi. Dati Q0 , Q1 ∈ F (C), allora esistono P0 , P1 ∈ C tali che Q0 = F (P0 ) e Q1 = F (P1 ).
Per l’ipotesi su C, esiste una curva continua γ : [0, 1] → Rn di estremi P0 = γ(0) e
P1 = γ(1) la cui traccia è contenuta in C. Allora la curva γ̃(t) = F (γ(t))) è continua
perché composizione di funzioni continue, ha estremi γ̃(0) = Q0 e γ̃(1) = Q1 e la traccia è
contenuta in F (C), poiché γ(t) ∈ C per ogni t ∈ [0, 1]. Ne segue che F (C) è connesso per
archi. 
27

. Data una funzione continua F : A ⊂ Rn → Rm ed un compatto K ⊂ Rm in generale la


contro-immagine F −1 (K) non è compatto in Rn . Ad esempio, per la funzione f : R2 → R,
f (x, y) = y − x, la contro-immagine f −1 (0) dell’insieme compatto K = {0} è la bisettrice
y = x, che non è limitata e, quindi, non è compatta.
. Data una funzione continua F : A ⊂ Rn → Rm ed un insieme connesso per archi
B ⊂ Rm in generale la contro-immagine F −1 (B) non è connessa per archi in Rn . Ad
esempio se f (x, y) = x2 y e B = (0, +∞), allora f −1 = {(x, y) ∈ R2 | x 6= 0, y > 0}, che
non è connesso per archi.

Una funzione F : A ⊂ Rn → Rm è detta uniformemente continua se per ogni  > 0 esiste


δ > 0 tale che
se P, Q ∈ A e kQ − P k < δ allora kF (Q) − F (P )k < . (19)
Le funzioni uniformemente continue sono continue, ma in generale la continuità è solo una
condizione necessaria. Tuttavia se il dominio è un insieme compatto le due nozioni sono
equivalenti, come mostra il seguente risultato.
Teo 1.42. Data una funzione continua F : A ⊂ Rn → Rm definita su un insieme A
compatto, allora F è uniformemente continua.

Dimostrazione. Fissato  > 0, l’ipotesi che F sia continua implica che per ogni P ∈ A
esiste δ = δP dipendente da P tale che
se Q, P ∈ A e kQ − P k < δ allora kF (Q) − F (P )k < .
La famiglia {B(P, δP /2)}P ∈A è un ricoprimento aperto di A e, essendo A compatto, esiste
un sotto-ricoprimento finito
δP δP
B(P, 1 ) ∪ . . . ∪ B(P, N ) ⊃ A. (20)
2 2
Posto δ = min{δP1 /2, . . . , δPN /2}, verifichiamo che vale la (19). Dati P, Q ∈ A tali che
kP − Qk < δ, per la (20) esiste Pj ∈ A tale che kP − Pj k < δPj /2 e, per definizione di δPj ,
vale kF (P ) − F (Pj )k < . Poiché
kQ − Pj k ≤ kQ − P k + kPj − P k < δ + δPj /2 ≤ δPj ,
vale kF (Q) − F (Pj )k < . Allora
kF (Q) − F (P )k ≤ kF (Q) − F (Pj )k + kF (Pj ) − F (P )k < 2.


2.3.1. Proprietà delle funzioni continue scalari. I seguenti due teoremi valgono solo per
funzioni scalari, poiché solo su R è stata introdotta una relazione d’ordine compatibile con
le operazioni algebriche.
Teo 1.43 (Teorema di Weierstrass). Data una funzione continua f : A ⊂ Rn → R definita
su un compatto A, allora esistono P1 , P2 ∈ A tali che
f (P1 ) ≤ F (P ) ≤ f (P2 ) ∀P ∈ A.

Dimostrazione. Essendo f continua e A compatto, f (A) è un insieme chiuso e limitato di


R, per cui f (A) ammette minimo m e massimo M , cioè esistono quindi P1 , P2 ∈ A tali che
m = f (P1 ) ≤ f (P ) ≤ f (P2 ) = M per ogni P ∈ A. 

I valori f (P1 ) = min f (A) e f (P2 ) = max f (A) sono detti, rispettivamente, minimo e
massimo assoluto di f su A. I punti P1 e P2 sono detti punti di minimo e massimo assoluti
(in generale non sono unici).
La condizione che il dominio di f sia compatto non si può eliminare.
28

Esempio 1.44. La funzione f (x, y) = x2 + y 2 con dominio R2 è continua. Si verifica


facilmente che sup(x,y)∈R2 f (x, y) = +∞, poiché limx→+∞ f (x, x) = +∞. Quindi f non
ammette massimo assoluto in R2 .
La funzione f (x, y) = √ 1 2 2 con dominio A = (x, y) ∈ R2 | x2 + y 2 < 1 è continua e

1−x −y
sup(x,y)∈R2 f (x, y) = +∞, poiché limx→1− f (x, 0) = +∞. Quindi f non ammette massimo
assoluto in A.
Teo 1.45 (Teorema dei valori intermedi). Data una funzione continua f : A ⊂ Rn → R
definita su un insieme A connesso per archi, per ogni c ∈ (inf f, sup f ) esiste un punto
Pc ∈ A per cui f (Pc ) = c.

Dimostrazione. Se inf f = sup f la funzione è constante e non c’è nulla da dimostrare. Dato
inf f < c < sup f , per definizione di estremo inferiore e superiore, esistono `1 , `2 ∈ f (A)
tali che `1 < c < `2 . Essendo A connesso ed f continua, f (A) è connesso per archi e,
quindi, è un intervallo, cui appartengono sia `1 sia `2 , allora c ∈ f (A), cioè esiste Pc ∈ A
per cui f (Pc ) = c. 
. Nelle ipotesi del teorema dei valori intermedi segue immediatamente che l’immagine
di f è l’intervallo estremi inf f e sup f , tuttavia gli estremi possono o meno appartenere a
f (A). Più precisamente


 (inf f, sup f ) se f non ammetta né minimo né massimo

[min f, sup f ) se f ammetta minimo, ma non massimo
f (A) =

 (inf f, max f ] se f ammetta massimo, ma non minimo

[min f, max f ] se f ammetta minimo e massimo

Sia z = f (x, y) continua con dominio A connesso per archi, allora il teorema dei valori
intermedi assicura che se inf f < c < sup f , l’equazione f (x, y) = c ammette almeno una
soluzione (x0 , y0 ) ∈ A. Ovviamente se c < inf f o c > sup f l’equazione f (x, y) = c non ha
soluzioni. Se c = inf f o c = sup f , l’equazione f (x, y) = c ha soluzione solo se f ammette
minimo o massimo assoluto, rispettivamente. In particolare, se f è continua ed il dominio
è connesso per archi e compatto l’immagine di f è l’intervallo chiuso
Im f = [min f, max f ].
Per la validità del teorema dei valori intermedi, la condizione che A sia connesso per archi
non si può eliminare.
1
con (x, y) ∈ A = (x, y) ∈ R2 | xy 6= 0 . La funzione è

Esempio 1.46. Sia f (x, y) = xy
continua, inf (x,y)∈A f (x, y) = −∞ e sup(x,y)∈A f (x, y) = +∞ poiché
lim f (x, x) = +∞ lim f (x, −x) = −∞.
x→0 x→0
1
Tuttavia l’equazione xy = 0 non ha soluzioni.

2.4. Complemento: successioni. La definizione di successione convergente è analoga a


quella data nel caso di successioni numeriche.
Def. 1.47. Sia (Pk )k una successione di punti di Rn .

a) La successione (Pk )k converge a P ∗ ∈ Rn e si scrive lim Pk = P ∗ , se


k→+∞

lim kPk − P ∗ k = 0
k→+∞

Equivalentemente, se per ogni  > 0 esiste N ∈ N tale che per ogni k > N
kPk − P ∗ k <  ⇐⇒ Pk ∈ B(P ∗ , ).
Il punto P ∗ è detto il limite della successione.
29

b) La successione è di Cauchy se
lim sup kPk+h − Pk k = 0,
k→+∞ h>0

ovvero, se per ogni  > 0 esiste N ∈ N tale che kPj − Pk k <  per ogni j > k > N .

Si verifica facilmente che se la successione (Pk )k converge a P ∗ , allora

a) il punto P ∗ è di aderenza per l’insieme {P1 , . . . , Pk , . . .};


b) la successione (Pk )k è di Cauchy;
c) vale
lim kPk − Ok = kP ∗ − Ok. (21)
k→+∞

Se n = 2, posto Pk = (xk , yk ) e P ∗ = (x∗ , y ∗ ), la (2) e la (1) implicano che



 lim xk = x∗

lim Pk = P ⇐⇒ k→+∞ (22)
k→+∞  lim yk = y ∗
k→+∞

e la successione (Pk )k è di Cauchy se e solo se entrambe le successioni (xk )n e (yk )n sono


di Cauchy. Vale il seguente risultato che riportiamo senza dimostrazione.
Teo 1.48 (Completezza). Data una successione (Pk )k di Cauchy, allora esiste un unico
punto P ∗ tale che lim Pk = P ∗ .
k→+∞

Gli insiemi compatti sono caratterizzanti dalla seguente importante proprietà.


Teo 1.49. Dato K ⊂ Rn , l’insieme K è compatto se e sole se per ogni successione (Pk )k
di punti di K esiste una sotto-successione (Pkj )j convergente ad un punto P ∗ ∈ K.

Dimostrazione. Per semplicità consideriamo il caso n = 2. Assumiamo che K sia compatto.


Posto Pk = (xk , yk ), poiché K è limitato, allora supk kPk − Ok < +∞. Di conseguenza,
per la (1) entrambe le successioni reali (xk )k e (yk )k sono limitate. Per il teorema di
Bolzano-Weierstrass applicato a (xk )k , esiste una sotto-successione (xkm )m convergente
a x∗ . Applicando nuovamente il suddetto teorema alla sotto-successione limitata (ykm ),
esiste una sotto-successione (ykmj )j che converge a y ∗ . Posto P ∗ = (x∗ , y ∗ ), la (22) implica
che limj Pkmj = P ∗ . Essendo P ∗ un punto di aderenza di {Pkm1 , . . . , Pkmj , . . .}, che è un
sottoinsieme di K, l’assunzione che K sia chiuso assicura che P ∗ ∈ K.
Viceversa assumiamo la proprietà enunciata nella seconda parte del teorema e supponiamo
per assurdo che K non sia chiuso. Allora esiste un punto P ∗ di aderenza che non appartiene
a K. Per ogni k ≥ 1, esiste quindi un punto Pk ∈ K tale che kPk − P ∗ k < 1/k, da cui
limk Pk = P ∗ converge. Di conseguenza, tutte le sue sotto-successioni di (Pk )k convergono
a P ∗ 6∈ K, in contraddizione con l’ipotesi su K. Analogamente se per assurdo K non fosse
limitato, allora esisterebbe una successione (Pk )k tale che limk kPk − Ok = +∞. La (21)
implica che non potrebbero esistere sotto-successioni convergenti. Ne segue che K deve
essere limitato e, quindi, essendo anche chiuso, è necessariamente compatto. 

Vale la seguente caratterizzazione della continuità per successioni.


Lemma 1.50. Data una funzione F : A ⊂ Rn → Rm e P ∗ ∈ A, sono fatti equivalenti:

a) la funzione F è continua in P ∗ ;
b) se (Pk )k è una successione di punti di A tale che limk Pk = P ∗ , allora
lim F (Pk ) = F (P ∗ ).
k→+∞
30

Dimostrazione. Supponiamo che F sia continua in P ∗ e mostriamo l’affermazione b). Dato


 > 0 esiste δ > 0 tale che kF (P ) − F (P ∗ )k <  se kP − P ∗ k < δ e P ∈ A. Data una
successione (Pk )k di punti di A tale che limk Pk = P ∗ , esiste N ∈ N tale che kPk − P ∗ k < δ
se k > N . Per tali valori di k, si ha che kF (Pk ) − F (P ∗ )k < , per cui limk F (Pk ) = F (P ∗ ).
Viceversa, se vale l’ipotesi b) e per assurdo F non fosse continua, allora esisterebbe 0 > 0,
tale che per ogni k ∈ N esiste Pk ∈ A tale che kPk − P ∗ k < 1/k e kF (Pk ) − F (P ∗ )k ≥ 0 .
Ne segue che limk Pk = P ∗ e, per l’ipotesi b), che limk F (Pk ) = F (P ∗ ), in contraddizione
con il fatto che kF (Pk ) − F (P ∗ )k ≥ 0 . 

2.5. Complemento: teorema del punto fisso. Per le funzioni lipschiziane con costante
di Lipschitz strettamente minore di 1 vale la seguente importante proprietà.
Teo 1.51 (Teorema del punto fisso). Data una funzione F : C ⊂ Rn → Rn con dominio
C ⊂ Rn chiuso ed immagine F (C) ⊂ C. Se esiste una costante 0 < L < 1 tale che per
ogni P, Q ∈ C
kF (Q) − F (P )k ≤ LkQ − P k
allora

a) esiste unico P ∗ ∈ C tale che F (P ∗ ) = P ∗ ;


b) dato P0 ∈ C, sia (Pk )k la successione di C definita da
P1 = F (P0 ) P2 = F (P1 ) = F (F (P0 )) ... Pk = F (Pk−1 )
allora
lim Pk = P ∗ (23a)
k→+∞
Lk
kPk − P ∗ k ≤ kF (P0 ) − P0 k. (23b)
1−L

Dimostrazione. Dati P0 , Q0 ∈ C siano (Pk )k e (Qk )k le corrispondenti successioni definite


nel punto b). L’ipotesi F (C) ⊂ C assicura che Pk , Qk ∈ C per ogni k ≥ 1. Inoltre
l’assunzione che F è lipschitziana implica che
kQ1 − P1 k = kF (Q0 ) − F (P0 )k ≤ LkQ0 − P0 k
kQ2 − P2 k = kF (Q1 ) − F (P1 )k ≤ LkQ1 − P1 k ≤ L2 kQ0 − P0 k
...
kQk − Pk k = kF (Qk−1 ) − F (Pk−1 )k ≤ Lk kQ0 − P0 k. (24)
Fissiamo P0 ∈ C e h ≥ 1, dato con la scelta di Q0 = Ph poiché Qk = Pk+h la (24) implica
kPk+h − Pk k =≤ Lk kPh − P0 k.
Inoltre
kPh − P0 k ≤ kP1 − P0 k + kP2 − P1 k + . . . + kPh − Ph−1 k
= kP1 − P0 k + kF (P1 ) − F (P0 )k + . . . + kF (Ph−1 ) − F (Ph−2 )k
1 − Lh
≤ (1 + L + L2 + . . . Lh−1 )kP1 − P0 k = kP1 − P0 k.
1−L
Sostituendo nella precedente espressione
Lk − Lk+h
kPk+h − Pk k ≤ kP1 − P0 k, (25)
1−L
da cui, essendo L < 1,
Lk
lim supkPk+h − Pk k = lim kP1 − P0 k = 0.
k→+∞ h>0 k→+∞ 1 − L
31

Allora la successione (Pk )n è di Cauchy, quindi convergente ad un punto P ∗ ∈ Rn . Poiché


C è chiuso, P ∗ ∈ C. Inoltre, per la continuità di F ,
F (P ∗ ) = lim F (Pk ) = lim Pk+1 = P ∗ ,
k→+∞ k→+∞

cioè F (P ∗ ) = P ∗. Passando al limite per h che tende all’infinito la (25) segue che
Lk
kP ∗ − Pk k = lim kPk+h − Pk k ≤
kF (P0 ) − P0 k,
h→∞ 1−L
cioè la (23b). Per mostrare l’unicità, sia Q∗ un altro punto in C tale che F (Q∗ ) = Q∗ ,
allora
kQ∗ − P ∗ k = kF (Q∗ ) − F (P ∗ )k ≤ LkP ∗ − Q∗ k.
Poiché L < 1, allora kQ∗ − P ∗ k = 0, cioè Q∗ = P ∗ . 

2.6. Complemento: funzioni complesse di variabile complessa. Ricordiamo che R2


può essere identificato con l’insieme dei numeri complessi C ponendo
z = (x, y) = x + iy
e tale identificazione preserva sia la somma sia la moltiplicazione per scalare (reale).
Ricordiamo che in C sono definite altre due operazioni algebriche:

i) il prodotto tra due numeri complessi z = x + iy e z 0 = x0 + iy 0


zz 0 = xx0 − yy 0 + i(xy 0 + yx0 ),
che è un numero complesso;
ii) il complesso coniugato di z = x + iy
z̄ = x − iy.

Le proprietà topologiche di C sono indotte da quelle di R2 , tuttavia la norma di z = (x+iy)


si denota con |z| ed è detta modulo.
. In generale il prodotto tra numero complessi è diverso dal prodotto scalare tra i
corrispondenti vettori.
(x + iy)(x0 + iy 0 ) 6= (x, y) · (x0 , y 0 )

Tuttavia, vale la relazione z̄z = |z|2 = k(x, y)k2 .


Avendo identificato R2 con C, una funzione f : A ⊂ C → C si chiama funzione complessa
di variabile complessa e si denota
w = f (z) = u(x, y) + i v(x, y) z = x + i y.
dove u(x, y) e v(x, y) sono la parte reale ed immaginaria di f . La continuità di f è
equivalente alla continuità di u e v. Si verifica facilmente che il prodotto, rapporto ed il
complesso coniugato di funzioni continue sono funzioni continue.
Esempio 1.52. L’esponenziale complesso
f (z) = ez = ex+iy = ex (cos y + i sin y) = ex cos y + i ex sin y,
è continuo poiché u(x, y) = ex cos x e u(x, y) = ex sin y sono continue.
La funzione di variabile complessa f (z) = z1 è definita su C \ {0} ed è continua come
1
rapporto di funzioni continue. Osservate che non ha senso definire il rapporto (x,y) tra un
numero ed un vettore. Per ottenere le componenti (reale ed immaginaria) basta osservare
che
1 z x y
f (z) = = 2 = 2 2
−i 2
z |z| x +y x + y2
x y
da cui u(x, y) = x2 +y2 e u(x, y) = − x2 +y2 .
32

. In alcuni casi, come le funzioni d’onda che descrivono lo stato di un sistema quanti-
stico o le funzioni caratteristiche associate alle distribuzione di probabilità, si considerano
funzioni da Rn a valori in C (o, più in generale, in Cm ). Le proprietà di queste funzioni
sono molti più simili a quelle delle funzioni scalari (o vettoriali), che alle proprietà delle
funzioni di variabile complessa.

3. Funzioni differenziabili

Ricordiamo il seguente risultato. Data una funzione scalare di una variabile f : A ⊂


R → R, y = f (x), f è derivabile in un punto interno x0 ∈ A se in un intorno aperto
sufficientemente piccolo di x0 il grafico della funzione è approssimato bene da una retta
passante per (x0 , f (x0 )) ed il cui coefficiente angolare è la derivata prima f 0 (x0 ). Più
precisamente, per ogni h sufficientemente piccolo
f (x0 + h) = f (x0 ) + f 0 (x0 )h + |h| (h)
dove  è una funzione infinitesima. La definizione di funzione differenziabile è la naturale
estensione al caso di più variabili.
Def. 1.53. Data una funzione F : A ⊂ Rn → Rm , F (P ) = (f1 (P ), . . . , fm (P )), ed un
punto P0 interno ad A,

a) la funzione si dice differenziabile in P0 se esiste una matrice M di taglia m × n tale che


per ogni v ∈ Rn sufficientemente piccolo
F (P0 + v) = F (P0 ) + M v + kvk (v), (26)
dove (v) ∈ Rm è una funzione infinitesima. La matrice M è detta matrice jacobiana
di F nel punto P0 , si denota con JF (P0 ) ed i suoi elementi con
 
∂f1 ∂f1
(P 0 ) . . . (P 0 )
 ∂x1 ∂xn
JF (P0 ) =  . . . ... ... ;

∂fm ∂fm
∂x1 (P0 ) . . . ∂xn (P0 )

∂fi
dove Jf (P0 )ij = ∂x j
è detta la derivata parziale di fi rispetto a xj ;
b) se B ⊂ A è un insieme aperto ed F è differenziabile in tutti i punti di B, si dice che F
è differenziabile su B;
c) se A è aperto, si dice che F è differenziabile, se è differenziabile sul suo dominio.

La notazione M v indica il prodotto tra la matrice M di taglia m × n ed il vettore colonna


v in Rn . Ad esempio se n = m = 2 e P0 = (x0 , y0 ) la (27) diventa
     ∂f1 ∂f1
   
f1 (x0 + h, y0 + k) f1 (x0 , y0 ) ∂x (x0 , y0 ) ∂y (x 0 , y0 ) h p 1 (h, k)
= + + h2 + k 2  .
  
 
f2 (x0 + h, y0 + k) f2 (x0 , y0 ) ∂f 2 ∂f2 k 2 (h, k)
∂x (x0 , y0 ) ∂y (x0 , y0 )

Ponendo P = P0 + v in (27), la differenzibilità di F equivale al fatto che per ogni P ∈ A


F (P ) = F (P0 ) + JF (P0 )(P − P0 ) + kP − P0 k (P − P0 ), (27)
che esprime il fatto che la funzione F è approssimata da una funzione lineare affine (vedi
Esempio 1.16)
F (P0 ) + JF (P0 )(P − P0 ),
ed il resto  
F (P ) − F (P0 ) + JF (P0 )(P − P0 ) = kP − P0 k(P − P0 )
va a zero più velocemente della distanza tra P e P0 .
33

Esempio 1.54. Le funzioni lineare affini F : Rn → Rm , F (P ) = Q∗ + M (P − P ∗ ), sono


differenziabili e la matrice jacobiana è Jf (P ) = M per ogni P ∈ Rn . Infatti, fissato
P0 ∈ Rn , per ogni v ∈ Rn
F (P0 + v) − F (P0 ) = M v = M v + kvk (v)
avendo posto (v) = 0 (!).

Consideriamo prima due casi semplici.


Curve. Per una curva γ : I → Rm , dato t0 punto interno ad I, la matrice jacobiana
Jγ(t0 ) si riduce ad un vettore (colonna) m-dimensionale denotato con γ 0 (t0 ) chiamato
vettore tangente (o vettore velocità) di γ in t0 . Infatti, la condizione che la curva sia
differenziabile in t0 equivale al fatto che esista finito
γ(t) − γ(t0 )
lim = γ 0 (t0 ). (28)
t→t0 t − t0
. La definizione di differenziabilità richiede che t0 sia un punto interno, tuttavia se I =
[a, b] l’equazione(28) ha significato anche se t0 coincide con uno degli estremi dell’intervallo,
per cui è possibile definire γ 0 (a) o γ 0 (b).

Funzioni scalari. Se f : A ⊂ Rn → R è una funzione scalare differenziabile in P0 ∈ A, la


matrice jacobiana Jf (P0 ) è un vettore (riga) n-dimensionale denotato con
 
∂f ∂f
∇f (P0 ) = (P0 ), . . . , (P0 ) , (29)
∂x1 ∂xn
chiamato gradiente di f e la (27) diventa
f (P ) = f (P0 ) + ∇f (P0 ) · (P − P0 ) + kP − P0 k(P − P0 ) P ∈ A. (30)
Consideriamo esplicitamente il caso n = 2. Se P0 = (x0 , y0 ), allora
 
∂f ∂f
∇f (x0 , y0 ) = (x0 , y0 ), (x0 , y0 ) ,
∂x ∂y
e la (27) è data esplicitamente da
∂f ∂f
f (x, y) = f (x0 , y0 ) + (x0 , y0 ) (x − x0 ) + (x0 , y0 ) (y − y0 )+ (31)
∂x ∂y
p
+ (x − x0 )2 + (y − y0 )2 (x − x0 , y − y0 )
dove (x−x0 , y −y0 ) è una funzione infinitesima del vettore incremento. Equivalentemente,
∂f ∂f p
f (x0 + h, y0 + k) = f (x0 , y0 ) + (x0 , y0 )h + (x0 , y0 )k + h2 + k 2 (h, k).
∂x ∂y
Dalla (31) segue che f è differenziabile in (x0 , y0 ) se e solo se
f (x, y) − f (x0 , y0 ) + ∂f ∂f 
∂x (x0 , y0 )(x − x0 ) + ∂y (x0 , y0 )(y − y0 )
lim p = 0. (32)
(x,y)→(x0 ,y0 ) (x − x0 )2 + (y − y0 )2
La differenziabilità ha un’importante interpretazione geometrica. Osserviamo che il grafico
della funzione approssimante
∂f ∂f
g(x, y) = f (x0 , y0 ) + (x0 , y0 ) (x − x0 ) + (x0 , y0 ) (y − y0 )
∂x ∂y
è il piano di R3 di equazione cartesiana
∂f ∂f
z = f (x0 , y0 ) + (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) (33)
∂x ∂y
passante per il punto (x0 , y0 , f (x0 , y0 )) ∈ R3 e vettore normale ( ∂f ∂f
∂x (x0 , y0 ), ∂y (x0 , y0 ), −1),
le cui prime due componenti sono proprio il gradiente ∇f (x0 , y0 ) e la terza componente è
sempre −1.
34

La condizione che f sia differenziabile in (x0 , y0 ) dal punto geometrico significa che la
distanza in R3 tra il punto (x, y, f (x, y)) sul grafico di f ed il corrispondente punto
(x, y, f (x0 , y0 ) + ∂f ∂f
∂x (x0 , y0 )(x − x0 ) + ∂y (x0 , y0 )(y − y0 )) sul piano (33) tende a zero più
velocemente della distanza in R2 di (x, y) da (x0 , y0 ). Per questo il piano di equazione
cartesiana (33) è detto piano tangente al grafico di f nel punto (x0 , y0 , f (x0 , y0 )) ∈ R3 .
In forma parametrica l’equazione del piano tangente è

 x = x0 + h
y = y0 + k h, k ∈ R,
z = f (x0 , y0 ) + ∂f ∂f
∂x (x0 , y0 )h + ∂y (x0 , y0 )k

Il piano tangente è, quindi, generato dalle rette r1 ed r2 passanti per (x0 , y0 , f (x0 , y0 )) e
di equazione rispettivamente

 x = x0 + h
r1 : y = y0 h ∈ R,
∂f
z = f (x0 , y0 ) + ∂x (x0 , y0 )h

intersezione del piano tangente con il piano y = y0 parallelo al piano xz, e dalla retta r2 ,

 x = x0
r2 : y = y0 + k k ∈ R,
z = f (x0 , y0 ) + ∂f (x , y )k

∂y 0 0

intersezione del piano tangente con il piano x = x0 parallelo al piano yz. La derivata
parziale ∂f
∂x (x0 , y0 ) è il coefficiente angolare della retta r1 proiettata nel piano xz e la
derivata parziale ∂f ∂y (x0 , y0 ) è il coefficiente angolare della retta r2 proiettata sul piano yz.

Ritornando al caso vettoriale, analogamente al caso della continuità, la differenziabilità di


una funzione vettoriale si riduce a studiare la differenziabilità delle sue componenti.
Lemma 1.55. Una funzione F : A ⊂ Rn → Rm , F (P ) = (f1 (P ), . . . , fm (P )) è diffe-
renziabile in P ∗ punto interno di A se e solo se tutte le sue componenti f1 , . . ., fm sono
differenziabili in P ∗ . In tal caso
  ∂f1 ∗ ∂f1 ∗)

∇f1 (P ∗ )

∂x1 (P ) . . . ∂xn (P
JF (P ∗ ) =  ...  ...
= ... ... .


∇fm (P ). ∂f m ∗ ∂f m ∗
∂x (P ) . . . ∂x (P )
1 n

 
a11 . . . a1n
Dimostrazione. Posto JF (P ∗ ) =  . . . . . . . . . , allora ∇fi (P ∗ ) = (ai1 , . . . , ain ) e la
am1 . . . amn
condizione di differenziabilità diventa
f1 (P ∗ ) x1 − x∗1 1 (P − P ∗ )
        
f1 (P ) a11 . . . a1n
 ...  =  ...  +  ... ... ...  ...  +  ... 
fm (P ) fm (P ∗ ) am1 . . . amn xn − xn ∗ m (P − P )∗

dove P = (x1 , . . . , xn ), P ∗ = (x∗1 , . . . , x∗n ). Cioè, per ogni componente fi


fi (P ) = fi (P ∗ ) + ∇fi (P ∗ ) · (P − P ∗ ) + i (P − P ∗ ).
La tesi segue osservando che  è infinitesima se e solo se lo sono tutte le sue componenti i .


Come conseguenza del lemma, una trasformazione


(
x = x(x, y)
Ψ:
y = y(x, y)
35

è differenziabile se e solo se sono differenziabili le funzioni x(x, y) e y(x, y). La matrice


jacobiana è una matrice 2 × 2 data da
" ∂x ∂x #
∂x (x, y) ∂y (x, y)
JΨ(x, y) = ∂y ∂y
.
∂x (x, y) ∂y (x, y)

Se γ è una curva piana 


x = x(t)
γ: t∈I
y = y(t)
allora γ(t) è differenziabile se e solo se le componenti x(t) e y(t) sono derivabili (nel senso
ordinario di funzioni di una variabile) ed il vettore tangente è
γ 0 (t) = (x0 (t), y 0 (t)).

Il seguente risultato mostra che le funzioni differenziabili sono sempre continue, ma non
vale il viceversa vedi Esempio 1.61.
Prop. 1.56. Sia F : A ⊂ Rn → Rm una funzione differenziabile in P0 , punto interno di
A, allora F è continua in P0 .

Dimostrazione. Essendo P0 punto interno, è sicuramente di accumulazione per A. Poiché


JF (P0 )(P − P0 ) e kP − P0 k sono funzione continue che si annullano in P0 , sono entrambe
infinitesime e la (27) implica che
F (P ) = F (P0 ) + (P − P0 ) + (P − P0 )(P − P0 ) = F (P0 ) + (P − P0 ),
che equivale al fatto che F sia continua in P0 . 

Forniamo ora alcune condizioni necessarie per la differenziabilità, che enunciamo del caso
di funzioni scalari. Introduciamo la seguente nozione di funzione derivabile
Def. 1.57. Data una funzione f : A ⊂ Rn → R, ed un punto P0 = (x1 , . . . , xn ) interno ad
A, la funzione si dice derivabile in P0 se per ogni i = 1, . . . , n la funzione di una variabile
t 7→ f (x1 , . . . , xi−1 , t, xi+1 , . . . , xn )
è derivabile in t = xi .

I teoremi sulle funzioni derivabili di una variabile implicano che somma, differenza, pro-
dotto e rapporto di funzioni (di due variabili) derivabili è derivabile.
Nel caso n = 2, f (x, y) è derivabile in P0 = (x0 , y0 ) se esistono finiti
f (x, y0 ) − f (x0 , y0 ) df (x, y0 )
lim = x=x0
(34)
x→x0 x − x0 dx
f (x0 , y) − f (x0 , y0 ) df (x0 , y)
lim = , (35)
y→y0 y − y0 dy y=x0
df (x,y0
dove dx x=x0
denota la derivata della funzione (di una variabile) x 7→ f (x, y0 ) calcolata
df (x0 ,y)
in x = x0 . Un discorso analogo vale per dy , scambiando il ruolo di x ed y.
y=y0

Il seguente teorema dà una condizione necessaria per la differenziabilità e giustifica il nome


di derivate parziali per le componenti del gradiente definito dalla (112).
Teo 1.58 (Condizione necessaria per la differenziabilità I). Sia f : A ⊂ Rd → R una
funzione differenziabile in P0 = (x1 , . . . , xn ) punto interno di A, allora f è derivabile in
P0 e
 
∂fi d
(P0 ) = f (x1 , . . . , xi−1 , t, xi+1 , . . . , xn ) . (36)
∂xj dt t=xi
36

Dimostrazione. Mostriamo la (36) nel caso n = 2 e i = 1. Posto y = y0 nella (31) si ha


che per x 6= x0
f (x, y0 ) − f (x0 , y0 ) ∂f |x − x0 |
= (x0 , y0 ) + (x − x0 , 0).
x − x0 ∂x x − x0
Poiché |x − x0 |/(x − x0 ) è una funzione limitata ed (x − x0 , 0) è infinitesima, il secondo
addendo a destra dell’uguaglianza è una funzione infinitesima, allora
f (x, y0 ) − f (x0 , y0 ) ∂f
lim = (x0 , y0 ).
x→x0 x − x0 ∂x


Dal precedente teorema (e l’unicità della derivata in una variabile) segue che il gradiente
di una funzione scalare e la matrice jacobiana di una funzione vettoriale sono unici.
. Se n > 1, la derivabilità è condizione necessaria, ma non sufficiente per la differenzia-
bilità, come mostra il seguente esempio.
Esempio 1.59. La funzione f : R2 → R
( xy
(x, y) 6= (0, 0)
f (x, y) = x2 + y 2
0 (x, y) = (0, 0)
è derivabile in (0, 0), ma non è differenziabile in (0, 0). Infatti,
f (x, 0) − f (0, 0) x0
lim = lim 2 =0
x→0 x x→0 (x + 0)x
f (0, y) − f (0, 0) 0y
lim = lim = 0,
y→0 y y→0 (0 + y 2 )y

per cui f è derivabile in (0, 0) e


∂f ∂f
(0, 0) = 0 (0, 0) = 0.
∂x ∂y
Tuttavia, l’esempio 1.31 mostra che f non è continua in (0, 0) e, quindi, per la Proposizio-
ne 1.56 f non è differenziabile.

Il seguente teorema dà un’altra condizione necessaria che contiene la precedente come caso
particolare.
Teo 1.60 (Condizione necessaria per la differenziabilità II). Sia f : A ⊂ Rd → R una
funzione differenziabile in P0 punto interno di A. Per ogni vettore v ∈ Rs esiste finito
f (P0 + tv) − f (P0 )
lim = ∇f (P0 ) · v. (37)
t→0 t

Dimostrazione. La dimostrazione è del tutto analoga al quella del Teorema 1.58, scegliendo
P = P0 + tv in (30) 

Se esiste finito il limite (37) si pone


∂f f (P0 + tv) − f (P0 )
(P0 ) = lim ,
∂v t→0 t
e si chiama derivata direzionale lungo il vettore v ∈ Rd nel punto P0 . Nel caso n = 2, se
v = (v1 , v2 ) ∈ R2 ,
∂f ∂f ∂f
(x0 , y0 ) = (x0 , y0 )v1 + (x0 , y0 )v2
∂v ∂x ∂y
37

In particolare,
∂f ∂f
(x0 , y0 ) = (x0 , y0 ) se v = (1, 0)
∂v ∂x
∂f ∂f
(x0 , y0 ) = (x0 , y0 ) se v = (0, 1),
∂v ∂y
per cui il Teorema 1.58 è un caso particolare del Teorema 1.60.
Il seguente esempio mostra che l’esistenza di tutte le derivate direzionali sia solo una
condizione necessaria.
Esempio 1.61. La funzione f : R2 → R

 x2 y
(x, y) 6= (0, 0)
f (x, y) = 2 2
 x +y
0 (x, y) = (0, 0)

ammette derivate direzionali lungo ogni vettore v = (v1 , v2 ) ∈ R2 in (0, 0)


 v12 v2

∂f (v1 , v2 ) 6= (0, 0)
(0, 0) = v12 + v22 ,
∂v
0 (v1 , v2 ) = (0, 0)

ma non è differenziabile in (0, 0).


Infatti, dato v = (v1 , v2 ) 6= (0, 0)
f (tv1 , tv2 ) − f (0, 0) (tv1 )2 tv2 v12 v2
lim = lim = .
t→0 t t→0 ((tv1 )2 + (tv1 )2 ) t v12 + v22

In particolare si ha che ∂f ∂f
∂x (0, 0) = 0 (se v = (1, 0)) e ∂y (0, 0) = 0 (se v = (0, 1)).
Tuttavia f non è differenziabile in (0, 0). Infatti, se lo fosse, l’equazione (37) implicherebbe
∂f
∂v (0, 0) = 0 per ogni v.

Il seguente teorema dà una condizione sufficiente per la differenziabilità, espressa in termini


di continuità delle derivate parziali.

Teo 1.62. Sia f : A ⊂ Rd → R con A aperto. Se sono soddisfatte le seguenti condizioni


a) f è derivabile in A,
∂f ∂f
b) le funzioni ∂x1
, . . . , ∂xn
sono continue in A.

allora f è differenziabile in A.

Dimostrazione. Riportiamo la dimostrazione nel caso n = 2. A meno di una traslazione, è


sufficiente mostrare che f è differenziabile in (0, 0) ∈ A. Poiché (0, 0) è interno ad A, esiste
r > 0 tale che [−r, r] × [−r, r] ⊂ A. Per ogni (x, y) ∈ [−r, r] × [−r, r]
f (x, y) − f (0, 0) = f (x, y) − f (0, y) + f (0, y) − f (0, 0)
| {z } | {z }
I II
∂f ∂f
= (tx,y , y) x + (0, τy ) y
∂x ∂y
dove 0 ≤ |tx,y | ≤ |x| e 0 ≤ |τy | ≤ |y|. Infatti, per l’addendo I, fissato y, si è applicato il
teorema di Lagrange alla funzione di una variabile
ϕy : [−r, r] → R ϕy (x) = f (x, y)
38

che per l’ipotesi a) risulta derivabile con derivata ϕ0y (x) = ∂f ∂x (x, y). Analogamente per
l’addendo II si è applicato il teorema di Lagrange alla funzione di una variabile
∂f
ψ : [−r, r] → R ψ(y) = f (0, y) ψ 0 (y) = (0, y).
∂y
Osserviamo che per costruzione tx,y e τy sono funzioni infinitesime di (x, y). L’ipotesi b) e
c) di continuità assicurano che
∂f ∂f
(x, y) = (0, 0) + (x, y)
∂x ∂x
∂f ∂f
(x, y) = (0, 0) + (x, y)
∂x ∂y

dove le funzioni  (eventualmente diverse tra di loro) sono infinitesime. Ne segue che
∂f ∂f
f (x, y) =f (0, 0) + (tx,y , y) x + (0, τy ) y
∂x ∂y
∂f ∂f
= f (0, 0) + (0, 0) x + (0, 0) y + (tx,y , y) x + (x, ty ) y
∂x ∂y
∂f ∂f
= f (0, 0) + (0, 0) x + (0, 0) y+
(∗) ∂x ∂y
!
p x y
+ x2 + y 2 (x, y) p + (x, y) p ,
x2 + y 2 x2 + y 2
∂f ∂f p
= f (0, 0) + (0, 0) x + (0, 0) y + x2 + y 2 (x, y),
(∗∗) ∂x ∂y
dove in (*) si è sfruttato il fatto che tx,y e τy sono infinitesime ed in (∗∗)  è ancora
infinitesima poiché
x y
|p |≤1 e |p | ≤ 1.
2
x +y 2 x + y2
2

Una funzione F : A ⊂ Rn → Rm è detta di classe C 1 se tutte le sue componenti f1 , . . . , fm


∂fi
sono derivabili e tutte le derivate parziali ∂x j
sono continue, in tal caso scriveremo che
F ∈ C (A, R ). Il precedente teorema, che vale anche nel caso di funzioni da Rn ad Rm ,
1 m

assicura che se F ∈ C 1 (A, Rm ), allora F è differenziabile.


Dalle proprietà delle funzioni continue e derivabili segue che somma, differenza, prodotto
e rapporto di funzioni di classe C 1 è di classe C 1 e, quindi, differenziabile.
Dalle regole di derivazione si deduce che, se f, g : A ⊂ Rn → R e Φ, Ψ : A ⊂ Rn → Rm
sono funzioni di classe C 1 , allora per ogni λ1 λ2 ∈ R
∇(λ1 f + λ2 g) = λ1 ∇f + λ2 ∇g J(λ1 Φ + λ2 Ψ) = λ1 JΦ + λ2 JΨ
∇(f g) = g∇f + f ∇g J(f Φ) = Φ ∇f + f JΦ,
dove Φ ∇f è la matrice di taglia m × n ottenuta moltiplicando il vettore colonna Φ per il
∂f
vettore riga ∇f , cioè (Φ∇f )ij = Φi ∂x j
. Ad esempio se n = m = 2
" #
Φ1 ∂f ∂f
 h
Φ1 ∂f ∂f
i
∂x Φ 1 ∂y
Φ ∇f = = ∂f .
Φ2 ∂x ∂y Φ2 ∂f
∂x Φ 2 ∂y

Esempio 1.63. Sia f : R2 → R la funzione f (x, y) = x2 + y 2 = kP − Ok2 (distanza al


quadrato di P dall’origine O). Poiché f è derivabile e le derivate parziali
∂f ∂f
(x, y) = 2x e (x, y) = 2y ∀(x, y) ∈ R2
∂x ∂x
39

sono funzioni continue, f è di classe C 1 (R2 ) e, quindi, è differenziabile. In particolare, dato


un punto P0 = (x0 , y0 ) ∈ R2 il gradiente vale
∇f (x0 , y0 ) = 2(x0 , y0 ) in forma compatta ∇f (P0 ) = 2(P0 − O)
e la differenziabilità assicura l’esistenza del piano tangente al grafico di f nel punto
(x0 , y0 , x20 + y02 ) di equazione
z = x20 + y02 + 2x0 (x − x0 ) + 2y0 (y − y0 ) = 2x0 x + 2y0 y − (x20 + y02 )
e la derivata direzionale lungo ogni vettore v = (v1 , v2 ) ∈ R2 in P0
∂f ∂f
(x0 , y0 ) = 2x0 v1 + 2y0 v2 in forma vettoriale (P0 ) = (P0 − O) · v.
∂v ∂v

Il seguente teorema assicura che la composizione di due funzioni differenziabili è differen-


ziabile.
Teo 1.64 (Derivazione in catena). Date due funzioni differenziabili F : A ⊂ Rn → Rm
e G : B ⊂ Rm → Rp , con A aperto di Rn , B aperto di Rm ed F (A) ⊂ B. Se F è
differenziabile in P0 e G è differenziabile in Q0 = F (P0 ), allora la funzione composta
G ◦ F : A ⊂ Rn → Rp è differenziabile in P0 e vale
J(G ◦ F )(P0 ) = (JG)(F (P0 )) (JF )(P0 ),
dove la moltiplicazione è quella righe per colonne tra la matrice JG(Q0 ) di taglia p × m e
la matrice JF (P0 ) di taglia m × n.

Dimostrazione. Denotiamo con M = JF (P0 ) ed N = JG(Q0 ) = JG(F (P0 )) le matrici


jacobiane di F e G. Per definizione di differenziabilità
F (P ) = F (P0 ) + M (P − P0 ) + (P − P0 ) P ∈A
G(Q) = G(Q0 ) + N (Q − Q0 ) + (Q − Q0 ) Q ∈ B,
dove (P − P0 ) e (Q − Q0 ) sono funzioni infinitesime. Allora, per ogni P ∈ A, ponendo
Q = F (P ) ∈ B e Q0 = F (P0 ) nella seconda equazione, si ottiene
G(F (P )) = G(F (P0 )) + N (F (P ) − F (P0 )) + (F (P ) − F (P0 ))
 
= G(F (P0 )) + N M (P − P0 ) + (P − P0 ) + (P − P0 )
(∗)
= G(F (P0 )) + N M (P − P0 ) + N (P − P0 ) + (P − P0 )
(∗∗)
= G(F (P0 )) + N M (P − P0 ) + (P − P0 ) + (P − P0 )
(∗∗∗)
= G(F (P0 )) + N M (P − P0 ) + (P − P0 )
dove in (∗), essendo F continua in P0 , si ha che
(F (P ) − F (P0 )) = ((P − P0 )) = (P − P0 ),
in (∗∗) si è usato il fatto che M (v + w) = M v + M w ed in (∗ ∗ ∗)
 
N (P − P0 ) = (P − P0 ),

poiché N v è una funzione lineare e, quindi, infinitesima. 

Nel caso di funzioni di due variabili, il precedente teorema dà luogo alle tre seguenti regole
di derivazione.
Data una funzione differenziabile f : A ⊂ R2 → R
40

a) se ϕ : (a, b) ⊂ R → R è una funzione derivabile tale che f (x, y) ∈ (a, b) per ogni
(x, y) ∈ A, allora la funzione composta g(x, y) = ϕ(f (x, y)) con dominio A e codominio
R è differenziabile e vale per ogni (x, y) ∈ A
 ∂g ∂f
0
 ∂x (x, y) = ϕ (f (x, y)) ∂x (x, y)

cioè ∇g(P ) = ϕ0 (f (P ))∇f (P );
 ∂g (x, y) = ϕ0 (f (x, y)) ∂f (x, y)

∂x ∂y

b) se γ è una curva

x = x(t)
γ: t ∈ (a, b)
y = y(t)
differenziabile tale che (x(t), y(t)) ∈ A per ogni t ∈ (a, b), allora la funzione composta
ψ(t) = f (γ(t)) = f (x(t), y(t)) con dominio (a, b) e codominio R è derivabile e vale per
ogni t ∈ (a, b)
∂f ∂f
ψ 0 (t) = (x(t), y(t)) x0 (t) + (x(t), y(t)) y 0 (t) = ∇f (γ(t)) · γ 0 (t); (38)
∂x ∂y
c) se Φ : B ⊂ R2 → R2
Φ(x, y) = (x(x, y), y(x, y))
è una trasformazione di coordinate tale che Φ(x, y) ∈ A per ogni (x, y) ∈ B, allora la
funzione composta g(x, y) = f (Φ(x, y)) = f (x(x, y), y(x, y)) con dominio B e codominio
R è differenziabile e vale per ogni (x, y) ∈ B
∂g ∂f ∂x ∂f ∂y
(x, y) = (x(x, y), y(x, y)) (x, y) + (x(x, y), y(x, y)) (x, y)
∂x ∂x ∂x ∂y ∂x
∂g ∂f ∂x ∂f ∂y
(x, y) = (x(x, y), y(x, y)) (x, y) + (x(x, y), y(x, y)) (x, y)
∂x ∂x ∂y ∂y ∂y
ovvero in forma compatta
∇g(x, y) = ∇f (Φ(x, y))JΦ(x, y),
dove ∇f (Φ(x, y))JΦ(x, y) è la moltiplicazione (riga per colonna) del vettore riga ∇f (Φ(x, y))
per la matrice JΦ(x, y) di taglia 2 × 2.
p
Esempio 1.65. Sia g(x, y) = x2 + y 2 = kP − Ok con dominio R2 . Poiché la funzione
= x2 + y 2 è differenziabile in R2 con ∇f (x, y) = (2x, 2y) = 2(P − O) e la funzione
f (x, y) √
ϕ(t) = t è derivabile in (0, +∞) con φ0 (t) = 2√ 1
t
, per il teorema di derivazione in catena
2 2 2

g è differenziabile in A = (x, y) ∈ R | x + y 6= 0 e vale
∂g x

 ∂x (x, y) = p 2


x + y2 P −O
∂g y cioè (∇g)(P ) = .

 (x, y) = p kP − Ok
∂y x2 + y 2

Nell’origine g(x, y) non è derivabile poiché non esistono le derivate parziali in (0, 0): infatti
le funzioni g(x, 0) = |x| e g(0, y) = |y| non sono derivabili in 0.
Analogamente, la funzione h(x, y) = √ 21 2 = kP −Ok 1
con dominio (x, y) ∈ R2 | x2 + y 2 6= 0

x +y
− 12 0
= − 2(√1t)3 , vale

è differenziabile e, poiché t

P −O −1 P −O
(∇h)(P ) = − = .
kP − Ok3 kP − Ok2 kP − Ok
Esempio 1.66. Sia γ(t) = (x0 + v1 t, y0 + v2 t) = P0 + vt, t ∈ R, la retta passante per
P0 = (x0 , y0 ) con direzione v = (v1 , v2 ). La curva è differenziabile e γ 0 (t) = v per ogni
t ∈ R.
41

Se f : A ⊂ R2 → R è differenziabile in P0 punto interno di A, allora la funzione composta


ψ(t) = f (x0 + v1 t, y0 + v2 t) è derivabile in 0 e l’equazione (38) con t = 0 dà

ψ 0 (0) = f (x0 + v1 t, y0 + v2 t)0 = ∇f (P0 ) · v


t=0

che, ovviamente, coincide con (37).

Il concetto di derivate di ordine successivo si definisce in modo ricorsivo. Trattiamo espli-


citamente solo il caso delle derivate seconde per funzioni scalari di due variabili. Sia
f : A ⊂ R2 → R una funzione scalare con A aperto. Se f è differenziabile in A ed il
gradiente ∇f : A → R2 è differenziabile, allora si dice che f è differenziabile due volte. La
differenziabilità del gradiente è equivalente al differenziabilità delle due derivate parziali
∂f ∂f
∂x (x, y) e ∂y (x, y) in A. La jacobiano del gradiente è una matrice 2 × 2, detta matrice
hessiana, esplicitamente data da
 ∂f   ∂ ∂f ∂ ∂f

∇( ∂x (x, y)) ∂x ( ∂x (x, y)) ∂y ( ∂x (x, y))
Hf (x, y) = J∇f (x, y) =  = 
 
∇( ∂f
∂x (x, y)) ∂ ∂f
(
∂x ∂y (x, y)) ∂ ∂f
(
∂y ∂y (x, y))

∂2f ∂2f
 
∂x2
(x, y) ∂y∂x (x, y)
= .
 
∂2f ∂2f
∂x∂y (x, y) ∂y 2
(x, y)

Analogamente, f è derivabile due volte se f è derivabile ed entrambe le derivare parziali


∂f ∂f
∂x e ∂y sono a loro volta derivabili. Se, inoltre, tutte e quattro le derivate seconde sono
continue, si dice che f è una funzione di classe C 2 e si scrive f ∈ C 2 (A). Se f è di classe C 2 ,
il teorema 1.62 implica che la funzione f è differenziabile due volte ed il seguente risultato
mostra che la matrice hessiana è simmetrica.

Teo 1.67 (Teorema di Schwarz). Sia f : A ⊂ R2 → R con A aperto ed f ∈ C 2 (A), allora

∂2f ∂2f
(x, y) = (x, y) (x, y) ∈ A.
∂y∂x ∂x∂y

Dimostrazione. Senza perdita di generalità, assumiamo che l’origine (0, 0) ∈ A e dimo-


∂2f ∂2f
striamo che ∂y∂x (0, 0) = ∂x∂y (0, 0).
Dato δ > 0 tale che (−δ, δ) × (−δ, δ) ⊂ A, definiamo h : (−δ, δ) × (−δ, δ) → R

h(x, y) = f (x, y) − f (x, 0) − f (0, y) + f (0, 0)


= g(x, y) − g(0, y)
= ĝ(x, y) − ĝ(x, 0),

dove

g : (−δ, δ) × (−δ, δ) → R g(x, y) = f (x, y) − f (x, 0)


ĝ : (−δ, δ) × (−δ, δ) → R ĝ(x, y) = f (x, y) − f (0, y)

sono funzioni derivabili che soddisfano


∂g ∂f ∂f
(x, y) = (x, y) − (x, 0)
∂x ∂x ∂x
∂ĝ ∂f ∂f
(x, y) = (x, y) − (0, y).
∂y ∂y ∂y
42

Fissati x, y ∈ (0, δ), per il teorema di Lagrange esiste 0 ≤ tx,y ≤ x tale che
∂g
h(x, y) = g(x, y) − g(0, y) = (tx,y , y) x
∂x
 ∂f ∂f 
= (tx,y , y) − (tx,y , 0) x
∂x ∂x
∂2f
= (tx,y , τx,y ) xy
∂y∂x
 2 
∂ f
= (0, 0) + (tx,y , τx,y ) xy
∂y∂x
dove 0 ≤ τx,y ≤ y per il teorema di Lagrange applicato a ∂f ∂x (x, y) ed  è infinitesima
∂2f
per l’ipotesi di continuità di ∂y∂x . Poiché anche tx,y e τx,y sono infinitesime, per ogni
x, y ∈ (0, δ)
h(x, y) ∂2f
= (0, 0) + (x, y). (39a)
xy ∂y∂x
Ripetendo lo stesso ragionamento con ĝ al posto di g si deduce che
h(x, y) ∂2f
= (0, 0) + (x, y). (39b)
xy ∂x∂y
Confrontando la (39a) e la (39b), segue che
∂2f ∂2f
(0, 0) = (0, 0).
∂x∂y ∂y∂x

. Senza l’ipotesi che le derivate seconde siano continue, può succedere che le derivate
miste non siano uguali tra di loro, come mostra il seguente esempio
 2 2
 xy(y − x )
(x, y) 6= 0
f (x, y) = x2 + y 2 .
0 (x, y) = 0

3.1. Proprietà delle funzioni scalari differenziabili.


Il seguente risultato è l’analogo del teorema di Lagrange. Ricordiamo che un insieme
A ⊂ Rn è convesso se dati P1 , P2 ∈ A, il segmento di estremi P1 e P2 è tutto contenuto in
A, cioé se per ogni t ∈ [0, 1] allora P1 + t(P2 − P1 ) ∈ A.

Teo 1.68 (formula dell’accrescimento finito). Dato A ⊂ Rn insieme aperto e convesso ed


una funzione differenziabile f : A → R, allora per ogni P1 , P2 ∈ A, esiste Q ∈ A tale che
f (P2 ) − f (P1 ) = ∇f (Q) · (P2 − P1 ) (40)
dove Q = P1 + t(P2 − P1 ) con t ∈ (0, 1).

Dimostrazione. Fissati P1 , P2 ∈ A, definiamo la curva γ(t) = P1 + t(P2 − P1 ) con t ∈ [0, 1]


che è derivabile, γ 0 (t) = (P2 −P1 ) e la cui traccia è contenuta in A per l’ipotesi di convessità.
Inoltre, la funzione composta f (γ(t)), definita da [0, 1] a valori in R, è continua in [0, 1] e
derivabile in (0, 1). Per il teorema di Lagrange esiste t ∈ (0, 1) tale che
f (P2 ) − f (P1 ) = f (γ(1)) − f (γ(0)) = f (γ(t))0 (1 − 0) = ∇f (P1 + t(P2 − P1 )) · (P2 − P1 )
dove l’ultima uguaglianza segue dalla (38). La tesi segue ponendo Q = P1 + t(P2 − P1 ). 

Nel caso n = 2 la formula (40) diventa


∂f ∗ ∗ ∂f ∗ ∗
f (x2 , y2 ) − f (x1 , y1 ) = (x , y )(x2 − x1 ) + + (x , y )(y2 − y1 ).
∂x ∂y
43

dove
x∗ = x1 + t(x2 − x1 ) y ∗ = y1 + t(y2 − y1 ) con t ∈ (0, 1).
. Per le funzioni a valori vettoriali il teorema è falso. Ad esempio la curva γ : R → R2 ,
γ(t) = (sin t, cos t), è di classe C 1 e γ(0) = γ(2π), ma non esiste un valore t ∈ (0, 2π) tale
che γ 0 (t) = (0, 0) poiché kγ 0 (t)k = 1.

Tuttavia, vale la seguente generalizzazione.


Teo 1.69 (formula dell’accrescimento finito vettoriale). Data una funzione differenziabile
F : A ⊂ Rn → Rm con A aperto e convesso, per ogni P1 , P2 ∈ A esiste t ∈ (0, 1) tale che
kF (P2 ) − F (P1 )k ≤ kJF (P1 + t(P2 − P1 ))k∞ kP2 − P1 k (41)

Dimostrazione. Fissati P1 , P2 ∈ A, se F (P2 ) = F (P1 ) non c’è nulla da dimostrare. Altri-


F (P2 ) − F (P1 )
menti, posto n = con knk = 1, definiamo g : A → R
kF (P2 ) − F (P1 )k
m
X
g(P ) = n · F (P ) = ni fi (P ),
i=1
che è differenziabile con gradiente
m
X
∇g(P ) = ni ∇fi (P ) = nJF (P )
i=1
dove n ∈ Rm e ∇g(F (P )) ∈ Rn sono visti come vettori riga. Per la formula dell’accresci-
mento finito applicata a g(F (P )) nei punti P1 e P2 , esiste t ∈ (0, 1) tale che
kF (P2 ) − F (P1 )k = g(P2 ) − g(P1 ) = ∇g(P1 + t(P2 − P1 )) · (P2 − P1 )
= nJF (P1 + t(P2 − P1 ))(P2 − P1 )
(∗)
 
= n · JF (P1 + t(P2 − P1 ))(P2 − P1 )
(∗∗)
≤ kJF (P1 + t(P2 − P1 ))(P2 − P1 )k knk
(∗∗∗)
≤ kJF (P1 + t(P2 − P1 ))k∞ kP2 − P1 k,
(∗∗∗∗)

dove in (∗) P2 − P1 è pensato come vettore colonna Rm ed in (∗∗) la matrice jacobiana


è identificata con la corrispondente funzione lineare da Rn ad Rm , in (∗ ∗ ∗) si è usata la
disuguaglianza di Cauchy-Schwarz e in (∗ ∗ ∗∗) la definizione di norma spettrale di una
matrice ed il fatto che n è un versore. 
Nota. Nelle ipotesi del precedente teorema, se inoltre esiste M > 0 tale che per ogni P ∈ A
kJF (P )k∞ ≤ M allora, per ogni P1 , P2 ∈ A
kF (P2 ) − F (P1 )k ≤ M kP2 − P1 k,
cioè F è una funzione lipschitziana. La condizione kJF (P )k∞ ≤ M equivalente al fatto
che tutte le derivate parziali
∂fi
| (P )| ≤ M P ∈ A.
∂xj

Il seguente teorema estende al caso di funzioni di più varibaili la formula di Taylor con il
resto di Peano al second’ordine. Valgono risultati analoghi per sviluppi agli ordini successivi
e con il resto di Lagrange. Ricordiamo che, data una funzione f : A ⊂ Rn → R di classe
C 2 ed un punto P0 ∈ A, per il teorema di Schwarz Hf (P0 ) è una matrice simmetrica, cui
è associata la forma quadratica
v t Hf (P0 )v = v · Hf (P0 )v,
44

dove nel membro di sinistra v è pensato come vettore colonna e v t come vettore riga, mentre
in quello a destra Hf (P0 ) è identificata con la funzione lineare da Rn in Rn . Esplicitamente
nel caso n = 2, se P0 = (x0 , y0 ) ed v = (h, k)
" 2
∂2f
# 
∂ f
2 (x 0 , y0 ) (x 0 , y0 ) h
v t Hf (P0 )v = h k ∂x ∂y∂x
 
∂2f ∂2f k
∂x∂y (x0 , y0 ) ∂y 2
(x0 , y0 )
∂2f 2 ∂2f ∂2f ∂2f
= (x 0 , y0 )h + (x 0 , y0 )hk + (x 0 , y0 )kh + (x0 , y0 )k 2
(∗) ∂x2 ∂x∂y ∂y∂x ∂y 2

dove in (∗) il secondo ed il terzo addendo sono uguali per il teorema di Schwarz.

Teo 1.70 (Formula di Taylor). Data una funzione f : A ⊂ Rn → R definita su un aperto


A e di classe C 2 e fissato P0 ∈ A, allora per ogni v ∈ Rn tale che P0 + v ∈ A
1
f (P0 + v) = f (P0 ) + ∇f (P0 ) · v + v · Hf (P0 )v + kvk2 (v). (42)
2
dove (v) è una funzione infinitesima.

Dimostrazione. Per semplicità supponiamo che n = 2 e, senza perdita di generalità, che


P0 sia l’origine O e fissiamo δ > 0 tale che B(0, δ) ⊂ A. Definiamo il resto g : B(O, δ) → R

g(x, y) = f (x, y)−


 ∂f ∂f 1 ∂2f 2 ∂2f 1 ∂2f 2

f (0, 0) + (0, 0)x + (0, 0)y + (0, 0)x + (0, 0)xy + (0, 0)y .
∂x ∂y 2 ∂x2 ∂x∂y 2 ∂y 2
La funzione g è di classe C 2 , g(0, 0) = 0

∂g ∂f ∂f ∂2f ∂2f
(x, y) = (x, y) − (0, 0) − (0, 0)x − (0, 0)y
∂x ∂x ∂x ∂x2 ∂x∂y
∂g ∂f ∂f ∂2f ∂2f
(x, y) = (x, y) − (0, 0) − (0, 0)x − 2 (0, 0)y
∂y ∂y ∂y ∂x∂y ∂y
e, quindi,
∇g(0, 0) = 0.
Infine
Hg(x, y) = Hf (x, y) − Hf (0, 0) Hg(0, 0) = 0.
Essendo g di classe C 2 , ∇g è differenziabile in (0, 0), cioè ricordando che J∇g = Hg, per
ogni (x, y) ∈ B(0, δ)

∇g(x, y) = ∇g(0, 0) + Hg(0, 0)(x, y) + k(x, y)k(x, y) = k(x, y)k(x, y).

Essendo B(O, δ) convesso, dalla formula dell’accrescimento finito applicata a g per ogni
(x, y) ∈ B(O, δ) esiste tx,y ∈ (0, 1) tale che

|g(x, y)| = |g(x, y) − g(0, 0)| = |∇g(tx,y x, tx,y y) · (x, y)| ≤ k∇g(tx,y x, tx,y y)kk(x, y)k
= tx,y k(tx,y x, tx,y y)kk(x, y)k2 ≤ k(x, y)k2 (x, y).

dove si è sfruttato che (tx,y x, tx,y y) è infinitesima e tx,y ∈ (0, 1).


Abbiamo, quindi, dimostrato che il resto g soddisfa per ogni (x, y) ∈ B(0, δ)

|g(x, y)| ≤ k(x, y)k2 (x, y)

con  infinitesima, che implica la tesi. 


45

Se n = 2 e P0 = (x0 , y0 ) la (42) diventa


∂f ∂f
f (x0 + h, y0 + k) =f (x0 , y0 ) + (x0 , y0 )h + (x0 , y0 )k
∂x ∂y
1 ∂2f 2 ∂2f 1 ∂2f
+ (x 0 , y0 )h + (x 0 , y0 )hk + (x0 , y0 )k 2 +
2 ∂x2 ∂x∂y 2 ∂y 2
+ (h2 + k 2 ) (h, k).
ovvero, denotato con P = P0 + v = (x, y) = (x0 + h, y0 + k) il punto traslato
∂f ∂f
f (x, y) =f (x0 , y0 ) + (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 )
∂x ∂y
1 ∂2f 2 ∂2f 1 ∂2f
+ (x0 , y0 )(x − x 0 ) + (x 0 , y0 )(x − x 0 )(y − y 0 ) + (x0 , y0 )(y − y0 )2 +
2 ∂x2 ∂x∂y 2 ∂y 2
+ ((x − x0 )2 + (y − y0 )2 ) (x − x0 , y − y0 ),

La seguente proposizione fornisce un’interpretazione geometrica del gradiente.


Prop. 1.71. Data una funzione f : A ⊂ Rn → R differenziabile in un punto interno
P0 ∈ A tale che ∇f (P0 ) 6= 0, allora

a) fissato v ∈ Rn con kvk = 1, sia θ l’angolo compreso tra le semirette orientate individuate
dai vettori v e ∇f (P0 ), allora
∂f
(P0 ) = k∇f (P0 )k cos θ,
∂v
b) fissata una curva differenziabile γ : (−1, 1) → Rn tale che
γ(0) = P0 f (γ(t)) = f (P0 ) t ∈ (−1, 1),
allora
∇f (P0 ) · γ 0 (0) = 0.

Dimostrazione. L’affermazione in a) segue dalla (37) e dal fatto che il prodotto scalare tra
due vettori è il prodotto delle corrispondenti norme per il coseno dell’angolo compreso. Il
punto b) segue dalla (38) ponendo t = 0. 
. ∂f
Se ∇f (P0 ) = 0, la (37) implica che ∂v (P0 ) = 0 per ogni vettore v.

La proposizione fornisce un’importante interpretazione geometrica del gradiente. Infatti,


dal punto a) segue che la derivata direzionale ∂f ∂v è massima se v ha la stessa direzione
e verso di ∇f (P0 ), è nulla se v è perpendicolare a ∇f (P0 ) ed è minima se v ha la stessa
direzione e verso opposto di ∇f (P0 ). Quindi il vettore ∇f (P0 ), diverso da zero per ipotesi,
individua la direzione di massima crescita per f . Inoltre il punto b) mostra che se γ è una
curva passante per P0 e la cui traccia è contenuta nell’insieme di livello di quota c = f (P0 )
Ac = {P ∈ A | f (P ) = f (P0 )},
allora il gradiente ∇f (P0 ) è perpendicolare al vettore tangente alla curva in P0 e quindi la
retta di equazione
∇f (P0 ) · (P − P0 ) = 0
è la retta tangente all’insieme di livello Ac nel punto P0 = (x0 , y0 ). Se n = 2 e P0 = (x0 , y0 )
la retta tangente ha equazione
∂f ∂f
(x0 , y0 )(x − x0 ) + (x0 , y0 )(x − x0 ) = 0.
∂x ∂y
46

Esempio 1.72. Sia f (x, y) = x2 + y 2 = kP − Ok2 e P0 = (x0 , y0 ) 6= (0, 0). L’insieme


di livello Ac = (x, y) ∈ R2 | x2 + y 2 = x20 + y02 di quota c = x20 + y02 è una circonferenza

di raggio c. Ricordando che ∇f (P0 ) = 2(x0 , y0 ) = 2(P0 − O) 6= (0, 0), la funzione ha
la massima crescita nella direzione e verso del vettore P0 − O, applicato in P0 , e la retta
tangente in P0 ad Ac ha equazione
2x0 (x − x0 ) + 2y0 (y − y0 ) = 0 cioè (P − P0 ) · (P0 − O) = 0.
In (0, 0) il gradiente è nullo e l’insieme di livello di quota 0 si riduce ad un punto.

Il seguente teorema caratterizza le funzioni che hanno gradiente nullo in tutti i punti del
dominio, purché sia connesso per archi.

Prop. 1.73. Data una funzione differenziabile f : A ⊂ Rn → R definita su un insieme A


aperto e connesso per archi, se per ogni P ∈ A
∇f (P ) = 0 (43)
allora f è una funzione costante, cioè esiste c ∈ R tale che f (P ) = c per ogni P ∈ A.

Dimostrazione. La dimostrazione è divisa in due passi.

Passo 1. Mostriamo che f è localmente costante. Poiché A è aperto, fissato P ∗ ∈ A esiste


δ > 0 tale che B(P ∗ , δ) ⊂ A e, essendo B(P ∗ , δ) convesso, la formula dell’accrescimento
finito (40) implica che per ogni P ∈ B(P ∗ , δ) esiste Q ∈ B(P ∗ , δ) tale che
f (P ) − f (P ∗ ) = ∇f (Q) · (P − P ∗ ) = 0
poiché per ipotesi il gradiente di f è nullo su A, da cui segue che f (P ) = f (P ∗ ) per ogni
P ∈ B(P ∗ , δ).
Passo 2. Proviamo che dati due punti P0 , P1 ∈ A, allora f (P1 ) = f (P0 ). Per ipotesi di
connessione per archi esiste una curva continua γ di estremi γ(0) = P0 e γ(1) = P1 , la cui
traccia è contenuta tutta in A. Essendo l’insieme
I = {t ∈ [0, 1] | f (γ(t)) = f (P0 )}
non vuoto e contenuto in [0, 1], l’estremo superiore t∗ di I è finito e t∗ ∈ [0, 1]. Denotato
con P ∗ = γ(t∗ ), per quanto visto esiste δ > 0 tale che per ogni P ∈ B(P ∗ , δ) ⊂ A allora
f (P ) = f (P ∗ ). Per la continuità di γ, esiste δ 0 tale che se t ∈ [0, 1] ∩ (t∗ − δ 0 , t∗ + δ 0 ), allora
γ(t) ∈ B(P ∗ , δ) e, quindi,
f (γ(t)) = f (P ∗ ) t ∈ [0, 1] ∩ (t∗ − δ 0 , t∗ + δ 0 ). (44)
La definizione di estremo superiore implica che esiste t ∈ [0, 1] e t − δ 0 < t ≤ t∗ tale che
f (γ(t)) = f (P0 ). Dalla (44) segue che f (P ∗ ) = f (P0 ) e, quindi, che f (γ(t)) = f (P0 ) per
ogni t ≥ t∗ e t ∈ [0, 1]. Poiché t∗ è un maggiorante, allora necessariamente t∗ = 1, da cui
segue che f (P1 ) = f (P0 ).


Nel caso n = 2, la condizione (43) diventa


∂f


 (x, y) = 0
∂x ∀(x, y) ∈ A
∂f

 (x, y) = 0
∂y
La condizione che A sia connesso per archi non si può eliminare dalle ipotesi del proposi-
zione.
47

Esempio 1.74. Sia A = (x, y) ∈ R2 | xy 6= 0 ed f : A → R



   
x y x
f (x, y) = arctan + arctan =ϕ ,
y x y
dove ϕ(t) = arctan t + arctan(1/t) definita su R \ {0}. Il gradiente di f è nullo poiché
 
0 x 1 x
∇f = ϕ ( ,− 2) = 0
y y y
essendo ϕ0 (t) = 0. Tuttavia f non è costante poiché f (1, 1) = π/2 ed f (1, −1) = −π/2.

La seguente proposizione dà una condizione necessaria per l’esistenza di estremi relativi,


di cui richiamiamo la definizione.
Def. 1.75. Sia f : A ⊂ Rn → R e P0 ∈ A. Se esiste δ > 0 tale che per ogni P ∈
A ∩ B(P0 , δ), P 6= P0
P0 è detto punto di minimo relativo
f (P ) ≥ f (P0 )
f (P0 ) è detto minimo relativo
P0 è detto punto di massimo relativo
f (P ) ≤ f (P0 )
f (P0 ) è detto massimo relativo
P0 è detto punto di minimo relativo stretto
f (P ) > f (P0 )
f (P0 ) è detto minimo relativo stretto
P0 è detto punto di massimo relativo stretto
f (P ) < f (P0 )
f (P0 ) è detto massimo relativo stretto
Infine, P0 è detto punto di sella se esistono due versori v̂, ŵ ∈ Rn e δ > 0 tali che per ogni
0 < |t| < δ
f (P0 + tv̂) > f (P0 )
f (P0 + tŵ) < f (P0 ).

In analogia con il caso delle funzioni di una variabile, vale la seguente condizione necessaria.
Prop. 1.76 (Condizione necessaria del prim’ordine per estremi relativi). Data una fun-
zione f : A ⊂ R2 → R differenziabile in P0 punto interno di A. Se P0 punto di massimo o
minimo relativo, allora
∇f (P0 ) = 0.

Dimostrazione. Consideriamo il caso in cui P0 sia un punto di massimo relativo. Per


definizione, esiste δ > 0 tale che f (P ) − f (P0 ) ≤ 0 per ogni P ∈ B(P0 , δ) ⊂ A. Posto
δ
v = ∇f (P0 ), se 0 < t < 1+kvk , i punti P0 + t v appartengono a B(P0 , δ) ⊂ A e, dalla
definizione di differenziabilità,
f (P0 + t v) − f (P0 ) ∇f (P0 ) · tv + ktvk(tv)
0≥ = = v · v + kvk(t v) = kvk2 + kvk(tv)
t t
Passando al limite per t che tende a zero (da destra) si ottiene che kvk2 ≤ 0, da cui
v = 0. 

Se ∇f (P0 ) = 0, P0 è detto un punto critico per f in A. La proposizione implica che gli


estremi relativi interni al dominio di f sono da cercare tra i punti critici, cioè, nel caso
n = 2, tra le soluzioni del sistema
(
∂f
∂x (x0 , y0 ) = 0 .
∂f
∂y (x0 , y0 ) = 0

Tuttavia tale condizione è solo necessaria, come mostra il seguente esempio.


48

Esempio 1.77. La funzione f (x, y) = y 2 − x2 ha come punti critici solo l’origine (0, 0).
Tuttavia, f (0, 0) = 0 e
f (x, y) > 0 = f (0, 0) se |y| > |x|
f (x, y) < 0 = f (0, 0) se |y| < |x|,
per cui f (x, y) cambia segno in ogni palla di centro (0, 0) e, quindi, (0, 0) non è un punto
di estremo relativo.

La seguente proposizione dà una condizione sufficiente affinchè un punto critico sia di


estremo relativo. A tal fine ricordiamo alcune proprietà delle forma quadratiche associate
alle matrici simmetriche.
Una matrice simmetrica M di taglia n × n è detta

a) definita positiva se v · M v > 0 per ogni v ∈ Rn , v 6= 0;


b) definita negativa se v · M v < 0 per ogni v ∈ Rn , v 6= 0;
c) indefinita se esistono v, w ∈ Rn tali che v · M v > 0 e w · M w < 0.

Una matrice M simmetrica è diagonalizzabile su R tramite una matrice ortogonale, cioè


esiste una base ortonormale {e1 , . . . , en } di Rn ed un insieme di numeri reali λ1 ≤ . . . λn
tali che
M e1 = λ1 e1 ... M en = λn en
ed inoltre per ogni v ∈ Rn
λ1 kvk2 ≤ v · M v ≤ λn kvk2 . (45)

Dalla (45) segue immediatamente che

a) una matrice è definita positiva se e solo se tutti i suoi autovalori sono strettamente
positivi: λ1 > 0;
b) una matrice è definita negativa se e solo se tutti i suoi autovalori sono strettamente
negativi: λn < 0 ;
c) una matrice è indefinita se ha almeno un autovalore strettamente positivo ed uno
strettamente negativo: λ1 < 0 < λn .

Vale la seguente condizione sufficiente per l’esistenza di estremi relativi.


Teo 1.78. Data una funzione f : A ⊂ Rn → R con A aperto ed f ∈ C 2 (A) ed punto critico
P0 ∈ A di f

i) se Hf (P0 ) è definita positiva, allora P0 è un punto di minimo relativo stretto;


ii) se Hf (P0 ) è definita negativa, allora P0 è un punto di massimo relativo stretto;
iii) Se Hf (P0 ) è indefinita, P0 è un punto di sella.

Dimostrazione. Sia M = Hf (P0 ), con la notazione introdotta sopra, osserviamo prelimi-


narmente che le condizioni del teorema sono equivalenti a
i) ⇐⇒ λn ≥ λ1 > 0
ii) ⇐⇒ λ1 ≤ λn < 0 .
ii) ⇐⇒ λ1 < 0 < λn
Essendo P0 interno esiste δ > 0 tale che B(P0 , δ) ⊂ A. Dalla formula di Taylor (42) per
ogni kvk < δ
1
f (P0 + v) − f (P0 ) = ∇f (P0 ) · v + v · Hf (P0 )v + kvk2 (v)
2
1
= v · Hf (P0 )v + kvk2 (v),
2
poiché ∇f (P0 ) = 0 essendo per ipotesi P0 un punto critico.
49

Se vale l’assunzione i), cioè λ1 > 0, allora per la (45)


λ1
f (P0 + v) − f (P0 ) ≥ ( + (v))kvk2 ,
2
e, per definizione di funzione infinitesima, esiste δ 0 < δ tale che (v) > −λ1 /4 per ogni
v ∈ Rn per cui kvk < δ 0 . Allora, se 0 < kvk < δ 0
λ1 λ1 λ1
f (P0 + v) − f (P0 ) ≥ ( − )kvk2 = kvk2 > 0
2 4 4
da cui f (P0 + v) > f (P0 ), per cui P0 è un punto di minimo stretto. Se vale l’assunzione
ii) si ragiona in modo analogo.
Se vale iii) scegliendo v = te1 con 0 < |t| < δ
λ1 λ1 2
f (P0 + te1 ) − f (P0 ) = ( + (te1 ))t2 ≤ t < 0.
2 4
Analogamente, scegliendo v = ten con 0 < |t| < δ 0
λn λn 2
f (P0 + ten ) − f (P0 ) = ( + (ten ))t2 ≥ t > 0,
2 4
per cui se 0 < |t| < min{δ, δ 0 }
f (P0 + te1 ) < f (P0 ) < f (P0 + ten ),
e, quindi P0 è un punto di sella. 
. Se P0 non è un punto critico, non può essere un punto di massimo o minimo relativo.
 
a b
Discutiamo esplicitamente il caso n = 2. Se M = è una matrice 2 × 2, l’equazione
b d
singolare è

 
a−λ b
det(A − λ I) = det = λ2 − (a + d)λ + (ad − b2 ) = 0,
b d−λ
che ha sempre due soluzione reali
p p
(a + d) − (a − d)2 + 4b2 (a + d) + (a − d)2 + 4b2
λ1 = λ2 = .
2 2
Da notare che

a) λ1 ≤ λ2 ;
b) det M = λ1 λ2 e tr(M ) = a + d = λ1 + λ2 ;
c) se det M > 0, cioé ad > b2 ≥ 0, allora a e d hanno lo stesso segno e sono entrambi non
nulli;
d) la condizione che λ2 ≥ λ1 > 0 equivale a ad − b2 > 0 e a > 0 (oppure d > 0);
e) la condizione che λ1 ≤ λ2 < 0 equivale a ad − b2 > 0 e a < 0 (oppure d < 0).

Se e1 , e2 ∈ R2 è la base di autovettori di M
M e1 = λ1 e1
M e2 = λ2 e2
ei · ej = δij ,
allora, a meno di cambiare e1 in −e1 , esiste una matrice di rotazione
 
cos θ − sin θ
V =
sin θ cos θ
50

tale che
   
1 cos θ
e1 = V =
0 sin θ
    (46)
0 − sin θ
e2 = V = ,
1 cos θ
da cui segue che M si può scrivere come
 
λ1 0
M =V V t.
0 λ2
Inoltre, poiché v = he1 + ke2 con h2 + k 2 = kvk2 , allora
M v = λ1 he1 + λ2 ke2
e la forma quadratica risulta
v t M (P0 )v = λ1 h2 + λ2 k 2
e la (45) diventa
λ1 kvk2 ≤ v t M v ≤ λ2 kvk2 . (47)
Dalla (47) segue che, se M 6= 0, vale una delle seguenti condizioni
M definita positiva ⇐⇒ λ2 ≥ λ1 > 0 ⇐⇒ ad − bc > 0 e a > 0
M definita negativa ⇐⇒ λ1 ≤ λ2 < 0 ⇐⇒ ad − bc > 0 e a < 0 . (48)
M indefinita ⇐⇒ λ1 < 0 < λ2 ⇐⇒ ad − bc < 0
Se det M = 0, cioè se λ1 λ2 = 0, esiste un vettore v ∈ R2 , v 6= 0 tale che M v = 0.
Tenuto conto della (48) il teorema precedente assume la seguente forma.
Prop. 1.79 (Condizione sufficiente del second’ordine per estremi relativi).
Data una funzione f : A ⊂ R2 → R con A aperto ed f ∈ C 2 (A), sia (x0 , y0 ) ∈ A un punto
critico di f .
2
i) Se det Hf (x0 , y0 ) > 0 e ∂∂xf2 (x0 , y0 ) > 0, allora P0 è un punto di minimo relativo
stretto. 2
ii) Se det Hf (x0 , y0 ) > 0 e ∂∂xf2 (x0 , y0 ) < 0, allora P0 è un punto di massimo relativo
stretto.
iii) Se det Hf (x0 , y0 ) < 0, P0 è un punto di sella.
. Se det Hf (x0 , y0 ) = 0, cioè λ2 λ1 = 0, la condizione del second’ordine non permette di
stabilire se un punto critico sia un punto di estremo relativo o meno. Tuttavia se λ2 > 0
si può escludere che sia un massimo ed, analogamente, se λ1 < 0 che sia un minimo.
Esempio 1.80. Le funzioni f (x, y) = x4 + y 4 e g(x, y) = x4 − y 4 sono di classe C 2 (R2 ),
hanno come unico punto critico l’origine (0, 0) e la matrice hessiana nell’origine è
 
0 0
Hf (0, 0) = Hg(0, 0) = .
0 0
Tuttavia, (0, 0) è un punto di minimo assoluto per f poiché x4 + y 4 ≥ 0 e (0, 0) non è
un punto di estremo relativo per g poiché g(x, 0) = x4 ha un minimo assoluto in x = 0 e
g(0, y) = −y 4 ha un massimo assoluto in y = 0.

Osserviamo che, data f : A ⊂ R2 → R con A aperto ed f ∈ C 2 (A), se P0 ∈ A un punto


critico di f , allora con la notazione introdotta,
λ1 λ2
f (P ) − f (P0 ) = ((P − P0 ) · e1 )2 + ((P − P0 ) · e2 )2 + kP − P0 k2 (P − P0 )
2 2
= g(P ) + kP − P0 k2 (P − P0 ).
Le quantità
h = (P − P0 ) · e1 k = (P − P0 ) · e2 .
51

descrivono le componenti dell’incremento P − P0 lungo la base e1 , e2 degli autovettori della


matrice Hessiana nel punto critico P0 . La funzione
λ1 λ2
g(P ) = ((P − P0 ) · e1 )2 + ((P − P0 ) · e2 )2
2 2
descrive, a meno del resto kP − P0 k2 (P − P0 ), il corrispondente incremento della funzione
f . Se λ1 λ2 > 0, per cui P0 è un punto estremo relativo, l’insieme di livello di g di quota
c/2
C = {P ∈ R2 | g(P ) = c/2};

i) è un’ellisse con centro P0 , asse p lungo e1 ed asse minore lungo e2 , se c ha


p maggiore
segno concorde con λ1 e λ2 ( c/λ1 e c/λ2 sono le lunghezze dei semi-assi);
ii) si riduce al solo punto P0 , se c = 0;
iii) è l’insieme vuoto, se c < 0.

Nel caso λ1 < 0 < λ2 , per cui P0 non è un estremo relativo,

i) C è un’iperbole
p con assi le rette con vettori direzionali e1 ed e2 , e vertici nei punti
P0 ± c/λ2 e2 , se c > 0;
ii) C si riduce ad una coppia di rette, se c = 0;
iii) C è un’iperbole
p con assi le rette con vettori direzionali e1 ed e2 , e vertici nei punti
P0 ± c/λ1 e1 , se c < 0.

Se λ1 λ2 = 0, l’approssimazione g non è sufficiente per descrive il comportamento di f


vicino a P0 .
Esempio 1.81. Consideriamo la funzione f (x, y) = x2 + xy + y 2 , definita su R2 e di classe
C 2 . Il gradiente e la matrice hessiana sono
 
2 1
∇f (x, y) = (2x + y, x + 2y) Hf (x, y) = .
1 2
L’unico punto critico è l’origine (0, 0) e gli autovalori della matrice hessiana (che non
dipende dal punto) sono le soluzioni dell’equazione
(2 − λ)2 − 1 = 0 cioè λ1 = 1 λ2 = 3,
ed i rispettivi autovettori sono
1 1
e1 = √ (1, −1) e2 = √ (1, 1),
2 2
che si ottengono ruotando la base canonica (1, 0), (0, 1) di un angolo θ = −π/4, vedi (46).
Poiché entrambi gli autovalori sono strettamente positivi, l’origine (0, 0) è un punto di
minimo. Dato c > 0, l’insieme di livello di f di quota c è un’ellisse con asse maggiore lungo
e1 e asse minore lungo e2 .
In effetti, completando a quadrato
1 21 x
    
1 3 1 0
f (x, y) = (x + y)2 + y 2 = g √
3 ,
2 4 0 2
0 1 y

dove g(x, y) = x2 + y 2 . Gli insiemi di livello di g ed f si ottengono l’uno dall’altro con la


trasformazione di coordinate lineare
1 12 x 1 − 12 1 0
           
x 1 √0 x x
= 3 = 0 √2
y 0 2 0 1 y y 0 1 3
y
Ad esempio, l’insieme di livello di f di quota 1 è ottenuto dilatando
√ la circonferenza uni-
taria (di centro l’origine) lungo l’asse delle y di un fattore 2/ 3 e quindi effettuando uno
1
“shearing” [ 1 − 2 ] parallelo all’asse delle x, vedi Figura 1.
0 1
52

0,5

-2 -1,5 -1 -0,5 0 0,5 1 1,5 2

-0,5

-1

Figura 1. Esempio 1.81

3.2. Trasformazioni regolari di coordinate. Ricordiamo che, data una trasformazione


(per semplicità) del piano
(
x = x(x, y)
Ψ: .
y = y(x, y)
le componenti x(x, y) ed y(x, y) sono le coordinate del punto trasformato. Se Ψ è inverti-
bile, la trasformazione può essere pensata in modo passivo, interpretando i valori x(x, y)
ed y(x, y) come coordinate del punto (x, y) nel sistema di riferimento trasformato. Solita-
mente si preferisce scrivere la funzione inversa che assegna ad (x, y) il corrispondente punto
Φ(x, y) = (x(x, y), y(x, y))
(
x = x(x, y)
Φ:
y = y(x, y),
dove (x, y) sono le coordinate del punto nel nuovo sistema di riferimento ed x = x(x, y)
e y = y(x, y) le coordinate dello stesso punto nel vecchio sistema di riferimento. Questa
costruzione motiva la seguente definizione.
Def. 1.82. Una funzione Φ : B ⊂ Rn → Rn definita su un aperto B tale che

a) la funzione Φ è iniettiva e di classe C 1 ;


b) l’immagine A = Φ(B) è un aperto;
c) la funzione inversa Φ−1 : A ⊂ Rn → Rn è di classe C 1 ;

è detta una trasformazione di coordinate regolare tra gli aperti B ed A.


Nota. Per definizione di funzione inversa, per ogni Q ∈ A, P = Φ−1 (Q) ∈ B e
Φ(Φ−1 (Q)) = Q.
Quindi, la regola di derivazione in catena implica che
JΦ(P ) JΦ−1 (Q) = I
dove I è la matrice identica di taglia n × n e, quindi, che JΦ(P ) è una matrice invertibile e
JΦ−1 (Q) = JΦ(P )−1 .
Per un noto teorema di algebra lineare. la condizione che JΦ(P ) sia una matrice invertibile
equivale al fatto che det JΦ(P ) 6= 0.
53

Esempio 1.83. Sia Φ : R2 → R2 la trasformazione lineare associata alla matrice M = [ ac db ]



x = ax + by
Φ: .
y = cx + dy
La trasformazione è regolare se e solo se det M = ad − bc 6= 0. Infatti, Φ ∈ C 1 (R2 )
poiché le componenti x(x, y) = ax + by ed y(x, y) = cx + dy sono di classe C 1 (R2 ). Un
teorema dell’algebra lineare assicura che Φ è iniettiva se e solo se ad − bc 6= 0 e, in tal caso,
Φ(R2 ) = R2 , che è aperto. L’inversa di Φ è la trasformazione lineare associata alla matrice
 
−1 1 d −b
M =
ad − bc −c a
cioè 
 x= d −b
 x+ y
Φ−1 : ad − bc ad − bc ,
 y = −c x +

a
y
ad − bc ad − bc
che è di classe C 1 .
La mappa Φ definisce un cambio di coordinate

x = ax + by
vecchie: (x, y) ←→ nuove: (x, y)
y = cx + dy
e, con questa notazione, " #
∂x ∂x  
∂x ∂y a b
JΦ(x, y) = ∂y ∂y = .
∂x ∂y
c d

Esempio 1.84. Sia Φ : R2 → R2 la trasformazione di coordinate lineare definite nell’E-


sempio 1.84 con ad − bc 6= 0. Data f : A ⊂ R2 → R differenziabile su A aperto, la funzione
composta
g(x, y) = f (ax + by, cx + dy) = f (x, y) (49)
2
ha dominio B = {(x, y) ∈ R | (ax + by, cx + dy) ∈ A}, che risulta aperto. La regola
di derivazione in catena mostra che g è differenziabile e nel punto (x, y) ∈ B le derivate
parziali valgono
∂g ∂f ∂x ∂f ∂y ∂f ∂f
(x, y) = (x, y) (x, y) + (x, y) (x, y) = (x, y) a + (x, y) c
∂x ∂x ∂x ∂y ∂x ∂x ∂y
∂g ∂f ∂x ∂f ∂y ∂f ∂f
(x, y) = (x, y) (x, y) + (x, y) (x, y) = (x, y) b + (x, y) d
∂y ∂x ∂y ∂y ∂y ∂x ∂y
o, in forma compatta,  
a b
∇g(x, y) = ∇f (x, y) .
c d
∂f ∂f
Nelle precedenti espressioni ∂x e ∂y indicano le derivate parziali rispetto alla prima e
∂g ∂g
seconda variabile di f , pensata come funzione delle variabili vecchie (x, y), mentre ∂x e ∂y
indicano le derivate parziali rispetto alla prima e seconda variabile di g, cioè f pensata
come funzione delle variabili nuove (x, y) (come suggerisce l’equazione (49)). Tuttavia è
utile usare due simboli diversi per f , funzione delle vecchie variabili, ed g, funzione delle
nuove variabili, per evitare confusione notazionale, come mostra il seguente esempio.
. Sia    
a b 1 0
= ,
c d 1 1
allora
∂g ∂f ∂f ∂f

  = + 6=
x=x

ma ∂x ∂x ∂y ∂x .
y = x + y 6= y ∂g ∂f

 =
∂y ∂y
54

I seguenti due teoremi caratterizzano le trasformazioni regolari di coordinate.


Teo 1.85 (Teorema della mappa inversa locale). Data una funzione Φ : B ⊂ Rn → Rn
definita su un aperto B e di classe C 1 ed un punto P0 ∈ B tale che
det JΦ(P0 ) 6= 0, (50)
allora esistono due aperti V ⊂ B e W ⊂ Rn che soddisfano le seguenti condizioni:

a) P0 ∈ V e Φ(P0 ) ∈ W ;
b) la funzione Φ ristretta a V è iniettiva e Φ(V ) = W ;
c) la funzione inversa Φ−1 : W → Rn è di classe C 1 e per ogni Q ∈ W
JΦ−1 (Q) = (JΦ(P ))−1 con P = Φ−1 (Q),
dove (JΦ(P ))−1 è la matrice inversa di JΦ(P ).

Dimostrazione. La dimostrazione è divisa in quattro passi.


1 Passo. Proviamo la tesi nell’ipotesi aggiuntiva che
P0 = 0 Φ(P0 ) = 0 JΦ(0) = I, (51)
dove I è la matrice identica. Per dimostrare il teorema, bisogna trovare per ogni w ∈ Rn
sufficientemente piccolo un unico v ∈ B tale che Φ(v) = w, cioè che soddisfa l’equazione
di punto fisso
w − Φ(v) + v = v.
È, quindi, sufficiente dimostrare che T (v) = w + v − Φ(v) soddisfa le ipotesi del teorema
di punto fisso. Definiamo
Ω : B → Rn Ω(v) = v − Φ(v),
che è di classe C1 e soddisfa
Ω(0) = 0 JΩ(0) = I −JΦ(0) = 0,
poiché per la (51) JΦ(0) è la matrice identica.
Essendo la funzione det JΦ(v) continua e, per ipotesi, det JΦ(0) = 1, esiste δ 0 > 0 tale che
per ogni v ∈ B(0, δ 0 ) ⊂ B vale det JΦ(v) 6= 0 e, quindi, JΦ(v) è invertibile. Inoltre, poiché
la funzione Ω è di classe C 1 , esiste2 0 < δ < δ 0 tale che
kJΩ(v)k∞ ≤ 1/2 per ogni v ∈ B(0, δ) ⊂ B.
Essendo B(0, δ 0 ) convesso, la (41) implica che per ogni v1 , v2 ∈ B(0, δ) esiste w ∈ B(0, δ)
(poiché w è sul segmento di estremi v1 e v2 )
1
kΩ(v2 ) − Ω(v1 )k ≤ kJΩ(w)k∞ kv2 − v1 k ≤ kv2 − v1 k. (52)
2
In particolare, se v2 = v e v1 = 0 poiché Ω(0) = 0,
1
kΩ(v)k = kΩ(v) − Ω(0)k ≤ kvk.
2
Fissato w ∈ B(0, δ/2), mostriamo che esiste unico v ∈ B(0, δ) tale che
Φ(v) = w ⇐⇒ w + Ω(v) = v.
2Ad esempio, se n = 2, ponendo v = (x, y) e Ω(x, y) = (f (x, y), g(x, y)), la condizione che JΩ(0, 0) = 0
equivale al fatto che
∂f ∂f ∂g ∂g
(0, 0) = (0, 0) = (0, 0) = (0, 0).
∂x ∂y ∂x ∂y
Poiché tutte le derivate parziali sono continue, esiste δ > 0 tale che per ogni (x, y) ∈ B(0, δ)
s
∂f ∂f ∂g ∂g
kJΩ(x, y)k∞ ≤ kJΩ(x, y)k2 = (x, y)2 + (x, y)2 + (x, y)2 + (x, y)2 ≤ 1/2.
∂x ∂y ∂x ∂y
55

Definiamo T : B(0, δ) → Rn
T (v) = w + Ω(v).
Poiché kw + Ω(v)k ≤ δ/2 + δ/2 = δ, allora T (B(0, δ)) ⊂ B(0, δ). Inoltre, per ogni v2 , v1 ∈
B(0, δ) applicando la (52),
1
kT (v2 ) − T (v1 )k = kΩ(v2 ) − Ω(v1 )k ≤ kv2 − v1 k. (53)
2
Ne segue che T soddisfa le ipotesi del teorema di punto fisso con L = 1/2, per cui esiste
unico v ∈ B(0, δ) tale che T (v) = v, cioè w = Φ(v).
Riassumendo, abbiamo dimostrato che, per ogni w ∈ Rn , kwk ≤ δ/2, esiste unico v ∈ Rn ,
kvk ≤ δ, dipendente da w, tale che
Φ(v) = w ⇐⇒ w + Ω(v) = v. (54)
Definiamo
W = B(0, δ/2)
V = B(0, δ) ∩ Φ−1 (W ) ⊂ B
Evidentemente, W è aperto e 0 ∈ W . Inoltre, poiché Φ(0) = 0, 0 ∈ V e V è aperto essendo
Φ−1 (W ) aperto per la Proposizione 1.39. Dalla (54) segue che Φ ristretta a V è iniettiva
e Φ(V ) = W , infatti per ogni w ∈ W esiste un unica v ∈ B(0, δ) tale che Φ(v) = w ed
inoltre
δ δ
kvk = kv + Ω(v)k ≤ kwk + kΩ(v)k < + = δ,
2 2
che garantisce che v ∈ V . La restrizione di Φ a V è, quindi, invertibile e la sua inversa è
data da
Φ−1 : W → Rn Φ−1 (w) = v,
dove v soddisfa la (54).
Passo 2. Mostriamo che Φ−1 è lipschitziana e, quindi, continua. Dati w1 , w2 ∈ W
kΦ−1 (w2 ) − Φ−1 (w1 )k = kv2 − v1 k = k(w2 + Ω(v2 )) − (w1 + Ω(v1 ))k
≤ kw2 − w1 k + kΩ(v2 ) − Ω(v1 )k
1 1
≤ kw2 − w1 k + kv2 − v1 k = kw2 − w1 k + kΦ−1 (w2 ) − Φ−1 (w1 )k,
2 2
dove nell’ultima disuguaglianza si è usata la (53). Quindi
kv2 − v1 k = kΦ−1 (w2 ) − Φ−1 (w1 )k ≤ 2kw2 − w1 k. (55)

Passo 3. Ricordiamo che per definizione di δ 0 e del fatto che δ < δ 0 , per ogni v ∈ B(0, δ)
la matrice JΦ(v) è invertibile. Mostriamo che Φ−1 è differenziabile e JΦ−1 (w) = JΦ(v)−1
dove v = Φ−1 (w) Fissiamo w0 ∈ W , allora per ogni w ∈ W , posto v = Φ−1 (w) e v0 =
Φ−1 (w0 )
 
Φ−1 (w) − Φ−1 (w0 )+ JΦ(v0 )−1 (w − w0 ) = v − v0 − JΦ(v0 )−1 (Φ(v) − Φ(v0 ))
 
= v − v0 − JΦ(v0 )−1 JΦ(v0 )(v − v0 ) + kv − v0 k(v − v0 )
(∗)

= −kv − v0 kJΦ(v0 )−1 (Φ−1 (w) − Φ−1 (w0 ))


kv − v0 k
= kw − w0 k(w − w0 ) = kw − w0 k(w − w0 )
(∗∗) kw − w0 k (∗∗∗)

dove in (∗), per la differenziabilità di Φ in v0 , (v − v0 ) è una funzione infinitesima, in (∗∗),


poiché Φ−1 (w) è continua in w0 e (JΦ(v0 ))−1 è una matrice, allora
−(JΦ(v0 ))−1 (Φ−1 (w) − Φ−1 (w0 )) = (w − w0 ).
56

In (***), per la (55), kv − v0 k ≤ 2kw − w0 k. Ne segue che


Φ−1 (w) = Φ−1 (w0 ) + (JΦ(v0 ))−1 (w − w0 ) + kw − w0 k(w − w0 ),
per cui Φ−1 è differenziabile in w0 e JΦ−1 (w0 ) = JΦ(v0 )−1 . Infine, essendo Φ di classe C 1 ,
tutte le derivate parziali di Φ sono continue, quindi sono continui tutti gli elementi della
matrice (JΦ(Φ−1 (w)))−1 , per cui anche Φ−1 è di classe C 1 .
Passo 4. Dimostriamo la tesi nel caso generale. Denotiamo con M = Jf (P0 ) la matrice
jacobiana di Φ in P0 che è invertibile per l’ipotesi (50), e consideriamo la funzione
Φ0 : {v ∈ Rn | P0 + v ∈ B} → Rn Φ0 (v) = M −1 (Φ(P0 + v) − Φ(P0 )),
che è definita in un insieme aperto contenente l’origine, è di classe C 1 e soddisfa la (51).
Applicando a Φ0 quanto dimostrato nei passi precedenti esistono V0 , W0 aperti di Rn tali
che 0 ∈ V0 , 0 ∈ Φ0 (V0 ) = W0 e Φ0 ristretta a V0 è invertibile con inversa Φ−1 1
0 di classe C .
Definiamo
V = P0 + V 0 W = M W0 + Φ(P0 ),
che sono insiemi aperti che contengono rispettivamente P0 e Φ(P0 ). Si verifica immediata-
mente che la funzione di classe C 1
Ψ : W → Rn Ψ(Q) = Φ−1
0 (M
−1
(Q − Φ(P0 ))) + P0
è l’inversa di Φ. 
Teo 1.86 (Teorema della mappa inversa). Data una funzione Φ : B ⊂ Rn → Rn definita
su un aperto B e di classe C 1 . Se Φ è iniettiva e
det JΦ(P ) 6= 0 ∀P ∈ B, (56)
allora A = Φ(B) è un insieme aperto, la funzione inversa Φ−1 : A ⊂ Rn → Rn è di classe
C 1 e per ogni Q ∈ A
JΦ−1 (Q) = (JΦ(P ))−1 con P = Φ−1 (Q),
dove (JΦ(P ))−1 è la matrice inversa di JΦ(P ).

Dimostrazione. Per il teorema della mappa inversa locale, per ogni P0 ∈ B esiste un
aperto VP0 contenente P0 per cui la restrizione di Φ a VP0 è una trasformazione regolare
di coordinate con inversa di classe C 1 data da Φ−1 n
P0 : WP0 → R con WP0 = Φ(VP0 )
aperto (da notare che ogni restrizione ha un’inversa diversa). Tuttavia, osserviamo che se
Q ∈ WP0 ∩ WP1 , allora
Φ(Φ−1
P0 (Q)) = Q Φ(Φ−1
P1 (Q)) = Q,

e l’ipotesi di iniettività di Φ implica che Φ−1 −1


P0 (Q) = ΦP1 (Q). Definiamo A = ∪P0 WP0 , che
−1
è aperto, e Φ : A → R n

Φ−1 (Q) = Φ−1


P0 (Q) Q ∈ W P0 .

Poiché la restrizione di Φ−1 a ciascun aperto WP0 coincide con Φ−1


P0 , allora Φ
−1 è l’inversa

di Φ, è di classe C 1 e vale
JΦ−1 (Q) = (JΦ(P ))−1 con P = Φ−1 (Q).

. Nel caso n = 1, la condizione (56) si riduce all’assunzione che la derivata prima sia
diversa da zero. Se il dominio è un intervallo, questo implica che la funzione è iniettiva.
Tuttavia se n > 1, l’ipotesi che Φ sia iniettiva non si può togliere, anche se il dominio è
connesso per archi, come mostra il seguente esempio.
57

Esempio 1.87 (Coordinate polari). Sia



x = r cos θ
Φ: r ∈ (0, +∞) θ ∈ R.
y = r sin θ
La funzione Φ non è iniettiva poiché Φ(r, θ) = Φ(r, θ + 2π), ma
 
cos θ −r sin θ
det JΦ(r, θ) = det =r>0 r ∈ (0, +∞) θ ∈ R.
sin θ r cos θ
Tuttavia, Φ definisce una trasformazione di coordinate regolare sull’aperto B = (0, +∞) ×
(−π, π) e la trasformazione inversa è
 p
 r = x2 + y 2
Φ−1 (x, y) = y (x, y) ∈ A = R2 \ (x, y) ∈ R2 | y = 0, x ≤ 0 ,

θ = 2 arctan p
x2 + y 2 + x

(57)
dove la seconda relazione segue osservando che
y
θ 2 sin 2θ cos 2θ sin θ r θ
tan = θ
= = x ∈ (−π/2, π/2)
2 2
2 cos 2 1 + cos θ 1 + r 2
e l’arcotangente è l’inversa della tangente in (−π/2, π/2).
La trasformazione Φ−1 non si può estendere in modo continuo al semiasse delle ascisse
negative. Infatti, ad esempio,
p
y 1 + y2 + 1
lim θ(−1, y) = lim 2 arctan p = 2 lim arctan = ±π.
y→0± y→0± 1 + y2 − 1 y→0± y
La matrice jacobiana della trasformazione inversa è data da
 −1   "√ x √ y #
cos θ −r sin θ 1 r cos θ r sin θ
JΦ−1 (x, y) = = = x2 +y 2
y
x2 +y 2 .
sin θ r cos θ r − sin θ cos θ − x2 +y 2
x
x2 +y 2

La regola di derivazione in catena permette di calcolare come si trasformano le derivate


parziali rispetto ad un cambiamento di coordinate.
Esempio 1.88. Sia z = f (x, y) una funzione differenziabile definita nell’aperto A e Φ la
trasformazione di coordinate polari definita nel precedente esempio. La funzione composta
g(r, θ) = f (Φ(r, θ)) = f (r cos θ, r sin θ) è la funzione f in coordinate polari con dominio
B = Φ−1 (A). La regola di derivazione in catena dà
∂g ∂f ∂x ∂f ∂y
(r, θ) = (r cos θ, r sin θ) (r, θ) + (r cos θ, r sin θ) (r cos θ, r sin θ)
∂r ∂x ∂r ∂y ∂r
∂f ∂f
= cos θ (r cos θ, r sin θ) + sin θ (r cos θ, r sin θ)
∂x ∂y

∂g ∂f ∂x ∂f ∂y
(r, θ) = (r cos θ, r sin θ) (r, θ) + (r cos θ, r sin θ) (r cos θ, r sin θ)
∂θ ∂x ∂θ ∂y ∂θ
∂f ∂f
= −r sin θ (r cos θ, r sin θ) + r cos θ (r cos θ, r sin θ).
∂x ∂y
Le formule precedenti hanno una interpretazione geometrica. Siano nr = (cos θ, sin θ)
e nθ = (− sin θ, cos θ) rispettivamente il versore radiale ed il versore angolare nel punto
P = (x, y) = (r cos θ, r sin θ), allora
∂g
(r, θ) = ∇f (P ) · nr
∂r
∂g
(r, θ) = r∇f (P ) · nθ
∂r
58

Esempio 1.89 (Coordinate sferiche). Sia Φ : R3 → R3



 x = r sin θ cos ϕ
Φ(r, θ, ϕ) : y = r sin θ sin ϕ r ∈ R, φ ∈ R, θ ∈ R.
z = r cos θ

La funzione Φ è di classe C 1 con matrice jacobiana


 
sin θ cos ϕ r cos θ cos ϕ −r sin θ sin ϕ
JΦ(r, θ, ϕ) =  sin θ sin ϕ r cos θ sin ϕ r sin θ cos ϕ 
cos θ −r sin θ 0
e det JΦ(r, θ, ϕ) = r2 sin θ. La funzione Φ definisce una trasformazione regolare di coordi-
nate tra l’aperto
B = (0, +∞) × (0, π) × (−π, π)
e l’aperto
A = Φ(B) = R3 \ {(x, y, z) ∈ R3 | y = 0, x ≤ 0}.

3.3. Funzioni implicite. Il seguente teorema fornisce una condizione sufficiente affinché,
data un’equazione della forma f (x, y) = 0, sia possibile determinare y come funzione della
variabile x.

Teo 1.90 (Teorema della funzione implicita o di Dini). Data una funzione f : A ⊂ R2 → R
con A aperto ed f ∈ C 1 (A), se un punto (x0 , y0 ) ∈ A soddisfa
∂f
f (x0 , y0 ) = 0 e (x0 , y0 ) 6= 0,
∂y
allora esiste una funzione ϕ : I ⊂ R → R, I intorno aperto di x0 ,
y = ϕ(x)
di classe C1 tale che
f (x, ϕ(x)) = 0 (58a)
∂f
∂x (x, ϕ(x))
ϕ0 (x) = − ∂f (58b)
∂y (x, ϕ(x))

per ogni x ∈ I. Inoltre, esiste V ⊂ R2 intorno aperto di (x0 , y0 ) tale che


a) per ogni x ∈ I (x, ϕ(x)) ∈ V
b) se (x, y) ∈ V è soluzione dell’equazione f (x, y) = 0, allora x ∈ I e y = ϕ(x). In
particolare
ϕ(x0 ) = y0 (58c)

Se, inoltre f ∈ C k (A), allora ϕ ∈ C k (I).

. ∂f
La (58a) e la (58b) sottintendono che(x, ϕ(x)) ∈ A e ∂y (x, ϕ(x)) 6= 0 per ogni x ∈ I.

Dimostrazione. Definiamo la funzione Φ : A ⊂ R2 → R2


Φ(x, y) = (x, f (x, y)),
che è di classe C 1 con matrice Jacobiana
 
1 0
JΦ(x, y) = ∂f ∂f
∂x (x, y) ∂y (x, y)

il cui determinante è ∂f ∂f
∂y (x, y). L’ipotesi ∂y (x0 , y0 ) 6= 0 implica che det JΦ(x0 , y0 ) 6= 0 ed
il teorema della funzione inversa locale assicura che esistono due aperti V e W tali che
59

(x0 , y0 ) ∈ V ⊂ A, (x0 , f (x0 , y0 )) = (x0 , 0) ∈ W , Φ(V ) = W , Φ ristretta a V è invertibile e


l’inversa Φ−1 : W ⊂ R2 → R2
Φ−1 (u, v) = (g(u, v), h(u, v)) (59)
è di classe C 1. Poiché Φ(Φ−1 (u, v)) = (u, v), segue che
g(u, v) = u
f (g(u, v), h(u, v)) = v = f (u, h(u, v)). (60)
Definiamo I = {x ∈ R | (x, 0) ∈ W } e ϕ : I → R
ϕ(x) = h(x, 0).
Poiché W è un intorno aperto di (x0 , 0), allora I è un intorno aperto di x0 e ϕ è di classe
C 1 per costruzione. La (58a) segue dalla (60) con u = x e v = 0.
Essendo f (x, ϕ(x)) = 0 e, quindi, f (x, ϕ(x))0 = 0 per ogni x ∈ I, dalla regola di derivazione
in catena segue che
∂f ∂f
f (x, ϕ(x))0 = (x, ϕ(x)) + (x, ϕ(x))ϕ0 (x) = 0, (61)
∂x ∂y
sa cui segue la (58b).
Evidentemente, se x ∈ I, (x, 0) ∈ W e Φ−1 (x, 0) = (x, ϕ(x)) ∈ V . Viceversa se (x, y) ∈ V
e f (x, y) = 0
(x, y) = Φ−1 (Φ(x, y)) = Φ−1 (x, f (x, y)) = Φ−1 (x, 0),
sa cui segue che x ∈ I e y = ϕ(x).
Se f è di classe C 2 , dall’equazione (58b), segue che ϕ è di classe C 2 . Per derivazione
successive si dimostra il caso f ∈ C k .


L’applicazione y = ϕ(x) è detta funzione definita implicitamente dall’equazione f (x, y) = 0


in un intorno di (x0 , y0 ) e, nelle ipotesi del teorema, esiste ed è unica per x sufficientemente
vicine ad x0 (essendo I un intorno aperto di x0 , esiste δ > 0 tale che (x0 − δ, x0 + δ) ⊂ I).
Dal punto di vista geometrico la condizione f (x, ϕ(x)) = 0 equivale al fatto che l’insieme
di livello di f di quota 0 in un intorno di (x0 , y0 )
{(x, y) ∈ A ∩ V | f (x, y) = 0}
è il grafico y = ϕ(x) di una funzione di una variabile.
Analogamente, se f (x0 , y0 ) = 0 e ∂f
∂x (x0 , y0 ) 6= 0, è possibile esplicitare la variabile x come
funzione della variabile y. Più precisamente, esiste ψ : J → R, J intorno aperto di y0 , di
classe C 1 tale che
∂f
0 ∂y (ψ(y), y)
ψ(y0 ) = x0 f (ψ(y), y) = 0 ψ (y) = − ∂f
∂x (φ(y), y)
per ogni y ∈ J.
Esempio 1.91. Sia f ∈ C 2 (A) con A aperto di R2 e (x0 , y0 ) ∈ A tale che
∂f


 (x0 , y0 ) = 0
f (x0 , y0 ) = 0 e ∂x .
∂f

 (x0 , y0 ) 6= 0
∂y
poiché ∂f
∂y (x0 , y0 ) 6= 0 il teorema della funzione implicita assicura che esiste y = ϕ(x)
definita in un intorno aperto I di x0 , derivabile due volte in I, e
∂2f
0 00 2 (x0 , y0 )
ϕ(x0 ) = y0 , ϕ (x0 ) = 0 e ϕ (x0 ) = − ∂x
∂f
,
∂y (x0 , y0 )
60

dove la seconda uguaglianza segue da (58b) e ∂f


∂x (x0 , y0 ) = 0, mentre la terza si ottiene
2
derivando ulteriormente la (61) e ponendo x = x0 . In particolare, se ∂∂xf2 (x0 , y0 ) 6= 0, x0 è
un punto di minimo o massimo relativo per ϕ.

∂f
Il seguente esempio mostra i problemi che insorgono se ∂y (x0 , y0 ) = 0.

Esempio 1.92. L’equazione y 2 − x = 0 ha √ come soluzione


√ (x0 , y0 ) = (0, 0). Tuttavia,
per ogni x > 0 esistono due soluzioni y = x e y = − x, mentre per x < 0 non esiste
alcuna soluzione. Il teorema della funzione implicita non si può applicare: infatti, posto
f (x, y) = y 2 − x, ∇f (x, y) = (−1, 2y) per cui ∂f ∂f
∂y (0, 0) = 0. Tuttavia, poiché ∂x (0, 0) = −1,
è possibile esplicitare x come funzione della y, infatti x = y 2 = ψ(y) per ogni y ∈ R.

Il seguente esempio mostra i problemi che insorgono se ∇f (x0 , y0 ) = 0.


Esempio 1.93. L’equazione y 2 − x2 = 0 ha come soluzione (x0 , y0 ) = (0, 0). Tuttavia in
un intorno di (0, 0) nonè possibile esplicitare né la y come funzione della x, né la y come
funzione della x poiché (x, y) ∈ R2 | y 2 − x2 = 0 è la coppia di rette y = x e y = −x che
si intersecano nell’origine. Il teorema della funzione implicita non si può applicare: infatti,
posto f (x, y) = y 2 − x2 , ∇f (x, y) = (−2x, 2y) per cui ∂f ∂f
∂x (0, 0) = ∂y (0, 0) = 0.

Il teorema della funzione implicita può essere utilizzato per mostrare come le soluzioni di
un’equazione dipendano con regolarità dai coefficienti, come mostra il seguente esempio.
Esempio 1.94. Dato a ∈ R, si consideri l’equazione x3 + ax2 + x − 1 = 0. Se a = −1,
x3 −x2 +x−1 = (x2 +1)(x−1) per cui l’unica soluzione reale dell’equazione è x = 1. Posto
f (x, a) = x3 +ax2 +x−1, ∇f (x, a) = (3x2 +2ax+1, x2 ), poiché f (1, −1) = 0 e ∂f ∂x (1, −1) =
2 6= 0, il teorema della funzione implicita assicura che, per ogni a sufficientemente vicino a
−1, esiste unico xa = ψ(a), sufficientemente vicino a 1, soluzione di x3 + ax2 + x − 1 = 0.
Inoltre, poiché ψ 0 (−1) = − 12 < 0, per a > −1 si ha xa < 1 e per a < −1 si ha xa > 1.

Il teorema della funzione implicita può essere esteso al caso in cui si abbia un sistema di
m-equazioni in Rn con m < n.
Teo 1.95. Date f1 , . . . , fm : A ⊂ Rn → R funzioni di classe C 1 dove A è aperto ed m < n
e un punto (P0 , Q0 ) ∈ A, con P0 ∈ Rn−m e Q0 ∈ Rm , tale che
f1 (P0 , Q0 ) = . . . = fm (P0 , Q0 ) = 0 (62)
 ∂f ∂f1

1
∂xn−m+1 (P0 , Q0 ) . . . ∂xn (P0 , Q0 )
det  ... ... ...  6= 0, (63)
 
∂fm ∂fm
∂xn−m+1 (P0 , Q0 ) . . . ∂xn (P0 , Q0 )

allora esiste Φ : U ⊂ Rn−m → Rm , U intorno aperto di P0 ,


Φ(P ) = (ϕ1 (P ), . . . , ϕm (P )),
di classe C 1 che soddisfa il sistema di equazioni
f1 (P, Φ(P )) = . . . = fm (P, Φ(P )) = 0 (64a)

per ogni P ∈ U . Inoltre, esiste V ⊂ Rn intorno aperto di (P0 , Q0 ) tale che

a) per ogni P ∈ U , (P, Φ(P )) ∈ V


b) se (P, Q) ∈ V soddisfa
f1 (P, Q) = . . . = fm (P, Q) = 0,
allora P ∈ U e Q = Φ(P ). In particolare
Φ(P0 ) = Q0 . (64b)
61

Dimostrazione. La dimostrazione è del tutto simile a quella del caso scalare n = 2 ed


m = 1. 

Se P = (x1 , . . . , xn−m ), Q = (xn−m+1 , . . . , xn ) e


Q = Φ(P ) = (ϕ1 (P ), . . . , ϕm (P )) = (xn−m+1 , . . . , xn ),
l’equazione (64a) diventa un sistema di m-equazioni

f1 (x1 , . . . , xn−m , ϕ1 (x1 , . . . , xn−m ), . . . , ϕm (x1 , . . . , xn−m )) = 0

... .

fm (x1 , . . . , xn−m , ϕ1 (x1 , . . . , xn−m ), . . . , ϕm (x1 , . . . , xn−m )) = 0

La condizione (63) ha un’interessante interpretazione geometrica. Infatti implica che gli


m-vettori
∇f1 (P0 , Q0 ), . . . , ∇fm (P0 , Q0 )
sono linearmente indipendenti in Rm . Viceversa, se ∇f1 (P0 , Q0 ), . . . , ∇fm (P0 , Q0 ) sono li-
nearmente indipendenti, a meno di una permutazioni delle variabili indipendenti x1 , . . . , xn ,
vale la (63).
Esempio 1.96. Consideriamo il sistema di due equazioni, m = 2, e tre incognite, n = 3,
(
a1 x + b1 y + c1 z = 0
. (65)
a2 x + b2 y + c2 z = 0
Le funzioni f1 (x, y, z) = a1 x + b1 y + c1 z ed f2 (x, y, z) = a2 x + b2 y + c2 z, sono di classe
C 1 su R3 e, essendo x = y = z = 0 una soluzione del sistema, con la scelta P0 = 0 ∈ R e
Q0 = (0, 0) ∈ R2 la (62) è soddisfatta. La (63) diventa
" #
∂f1 ∂f2  
∂y ((0, 0, 0) ∂z (0, 0, 0) b1 c1
det ∂f2 ∂f2 = det 6= 0. (66)
∂y (0, 0, 0) ∂z (0, 0, 0)
b2 c2

Sotto questa ipotesi, il teorema della funzione implicita assicura che esistono due funzioni
(
y = ϕ1 (x)
z = ϕ2 (x)
definite in un intorno aperto di zero tali che
f1 (x, ϕ1 (x), ϕ2 (x)) = f2 (x, ϕ1 (x), ϕ2 (x)) = 0. (67)
Dal punto di vista geometrico, il luogo dei punti che sono soluzione del sistema (65) è
l’intersezione dei due piani passanti per l’origine ed aventi vettori normali
n1 = (a1 , b1 , c1 ) n2 = (a2 , b2 , c2 ).
Con questa notazione, la (66) è data da (n1 ∧ n2 ) · i 6= 0. La condizione che n1 ∧ n2
sia diverso da zero, cioè che n1 ed n2 non siano paralleli, esprime il fatto che i due piani
a1 x+b1 y +c1 z = 0 e a2 x+b2 y +c2 z = 0 non siano paralleli tra loro e, quindi, si intersechino
in una retta (propria) passante per l’origine con vettore direzionale (α, β, γ) = n1 ∧ n2 e
rappresentazione parametrica 
x = α t

y = β t t ∈ R.

z =γt

L’ulteriore assunzione α = (n1 ∧ n2 ) · i 6= 0 equivale al fatto che la retta non giaccia nel
piano x = 0 e, quindi, una rappresentazione parametrica equivalente è data da

x = x

y = αβ x .
z = αγ x


62

Confrontando con la rappresentazione parametrica implicita data dalla (67) segue che
(
ϕ1 (x) = αβ x
.
ϕ2 (x) = αγ x
Esempio 1.97 (Curve in R3 definite implicitamente). Date due funzioni f, g : A ⊂ R3 → R
di classe C 1 definite su un aperto A di R3 , definiamo l’insieme
C = {(x, y, z) ∈ A | f (x, y, z) = g(x, y, z) = 0}.
Scelto un punto (x0 , y0 , z0 ) ∈ C se
" #
∂f ∂f
(x0 , y0 , z0 ) ∂z (x0 , y0 , z0 )
det ∂y ∂g ∂g 6= 0,
∂y (x0 , y0 , z0 ) ∂z (x0 , y0 , z0 )

allora per il teorema della funzione implicita esistono ϕ1 , ϕ2 : I ⊂ R → R di classe C 1 , I


intorno aperto di x0 tali che se x ∈ I
ϕ1 (x0 ) = y0 ϕ2 (x0 ) = z0 f (x, ϕ1 (x), ϕ2 (x)) = 0
e, per un opportuno intorno V di (x0 , y0 , z0 )
C ∩ V = {(x, ϕ1 (x), ϕ2 (x)) | x ∈ I}.
Possiamo quindi definire una curva γ di classe C 1

x(t) = x0 + t

γ : y(t) = ϕ1 (x0 + t)

z(t) = ϕ2 (x0 + t)

con la proprietà che γ(0) = (x0 , y0 , z0 ) e


{γ(t) ∈ R3 | x0 + t ∈ I} = C ∩ V.
In altre parole, le equazioni f (x, y, z) = g(x, y, z) = 0 definiscono implicitamente una curva
di classe C 1 in un intorno del punto (x0 , y0 , z0 ).
A meno di una permutazione delle coordinate x, y, z, condizione sufficiente per l’esistenza
della curva γ è che i vettori ∇f (x0 , y0 , z0 ) e ∇g(x0 , y0 , z0 ) siano linearmente indipendenti,
cioè che i piani tangenti ai due insiemi di livello
{(x, y, z) ∈ A | f (x, y, z) = 0} {(x, y, z) ∈ A | g(x, y, z) = 0}
nel punto (x0 , y0 , z0 ) non siano paralleli.

Il seguente teorema dà una condizione necessaria per l’esistenza di estremi relativi di una
funzione f su un insieme C espresso come insieme di livello di una funzione g.

Teo 1.98 (teorema dei moltiplicatori di Lagrange). Data una funzione f : A ⊂ R2 → R


con A aperto ed f di classe C 1 ed un insieme
C = {(x, y) ∈ A | g(x, y) = 0},
dove g : A → R è una funzione di classe C 1 , se un punto (x0 , y0 ) ∈ C soddisfa le seguenti
condizioni:
a) esiste δ > 0 tale che per ogni (x, y) ∈ C ∩ B((x0 , y0 ), δ)
f (x, y) ≥ f (x0 , y0 ) [ oppure f (x, y) ≤ f (x0 , y0 )];
b) il gradiente ∇g(x0 , y0 ) 6= 0,
allora " #
∂f ∂f
∂x (x0 , y0 ) ∂y (x0 , y0 )
det ∂g ∂g = 0. (68)
∂x (x0 , y0 ) ∂y (x0 , y0 )
63

∂g
Dimostrazione. Supponiamo, ad esempio, che ∂y (x0 , y0 ) 6= 0, per il teorema della funzione
1
implicita esiste ϕ : I → R, y = ϕ(x), di classe C tale che ϕ(x0 ) = y0 e
C ∩ V = {(x, ϕ(x)) ∈ R2 | x ∈ I},
dove I è un un intorno aperto di x0 e V un intorno aperto di (x0 , y0 ). Allora x0 è un punto
(interno) di estremo relativo per la funzione f (x, ϕ(x)) definita su I e di classe C 1 e, quindi
la derivata prima f (x, ϕ(x)) in x = x0 è zero. Dalla regola di derivazione in catena, si ha
che
∂f ∂f
f (x0 , ϕ(x0 ))0 = (x0 , ϕ(x0 )) + (x0 , ϕ(x0 ))ϕ0 (x0 )
∂x ∂y
∂g
∂f ∂f ∂x (x0 , y0 )
= (x0 , y0 ) − (x0 , y0 ) ∂g
,
∂x ∂y
∂y (x0 , y0 )

dove per la (58b)


∂g
(x0 , ϕ(x0 ))
ϕ0 (x0 ) = − ∂x
∂g
.
∂y (x0 , ϕ(x0 ))
La condizione f (x0 , ϕ(x0 ))0 = 0 implica che
" #
∂f ∂f
∂f ∂g ∂f ∂g ∂x (x0 , y0 ) ∂y (x0 , y0 )
(x0 , y0 ) (x0 , y0 ) − (x0 , y0 ) (x0 , y0 ) = det ∂g ∂g = 0.
∂x ∂y ∂y ∂x ∂x (x0 , y0 ) ∂y (x0 , y0 )

La condizione a) esprime il fatto che P0 è un punto di minimo (risp. massimo) relativo per
la funzione f vincolata su C.
. Il teorema assicura che i punti di estremo relativo vincolato sono da cercare tra i punti
(x, y) ∈ A che sono soluzione del sistema
" #
∂f ∂f

det ∂x (x, y) ∂y (x, y) = 0

∂g ∂g
∂x (x, y) ∂y (x, y)
.

g(x, y) = 0

La condizione (68) è solo necessaria, quindi in generale ci sono soluzione del sistema che
non sono estremi relativi vincolati.

Poiché ∇g(x0 , y0 ) 6= 0, la condizione (68)


 
∇f (x0 , f0 )
det =0
∇g(x0 , f0 )
equivale al fatto che esiste λ ∈ R tale che
∇f (x0 , y0 ) = λ∇g(x0 , y0 ), (69)
in cui λ prende il nome di moltiplicatore di Lagrange. La (69) esprime il fatto che ∇f (x0 , y0 )
è parallelo a ∇g(x0 , y0 ), cioè perpendicolare alla retta tangente a C in (x0 , y0 ).
Il seguente esempio mostra come calcolare gli autovalori di una matrice simmetrica.
Esempio 1.99. Data una matrice simmetrica [ ab cb ] , la corrispondente forma quadratica
f : R2 → R
  
2 2
  a b x
f (x, y) = ax + 2bxy + cy = x y
b c y
ammette minimo f (x1 , y1 ) e massimo f (x2 , y2 ) assoluti sull’insieme
C = (x, y) ∈ R2 | x2 + y 2 = 1 ,

64

poiché f è continua e C è chiuso e limitato. Il vincolo C è l’insieme di livello di quota 0


della funzione g(x, y) = x2 + y 2 − 1. Le funzioni f e g sono di classe C 1 (R2 ) e
  
a b x
∇f (x, y) = 2(ax + by, bx + cy) = 2
b c y
∇g(x, y) = 2(x, y).
Poiché ∇g(x, y) 6= 0 per ogni (x, y) ∈ C, il teorema dei moltiplicatori di Lagrange implica
che i punti di minimo e massimo (x1 , y1 ) e (x2 , y2 ) sono soluzioni rispettivamente di
         
a b x1 x1 a b x2 x
= λ1 = λ2 2
b c y1 y1 b c y2 y2
con la condizione x21 + y12 = x22 + y22 = 1. In altre parole, (x1 , y1 ) e (x2 , y2 ) sono gli
autovettori di norma 1 della matrice simmetrica [ ab cb ]. I corrispondenti moltiplicatori di
Lagrange sono i rispettivi autovalori λ1 e λ2 . Inoltre è immediato verificare che
f (x1 , y1 ) = λ1 e f (x2 , y2 ) = λ2 ,
da cui segue che λ1 ≤ f (x, y) ≤ λ2 per ogni (x, y) ∈ C. Infine, osservando che f (αx, αy) =
α2 f (x, y) per ogni α ∈ R, segue che
  
2 2
 a b x
≤ λ2 (x2 + y 2 ) ∀(x, y) ∈ R2 .

λ1 (x + y ) ≤ x y
b c y

Il seguente esempio mostra come calcolare i vertici di un’ellisse.


Esempio 1.100. La funzione f (x, y) = x2 + y 2 ammette massimo e minimo assoluti
sull’insieme
C = (x, y) ∈ R2 | x2 + y 2 + xy = 1 ,


poiché f è continua e C è chiuso e limitato, dove la limitatezza segue dal fatto che
x2 + y 2
≤ x2 + y 2 + xy
2
per cui C ⊂ B(O, 2). Posto g(x, y) = x2 + y 2 + xy − 1, f e g sono di classe C 1 (R2 ) e
∇f (x, y) = (2x, 2y)
∇g(x, y) = (2x + y, 2y + x) 6= 0 ∀(x, y) ∈ C.
Il teorema dei moltiplicatori di Lagrange implica che i punti di minimo e massimo sono
necessariamente soluzioni del sistema
  
2x 2y  2
det =0 x − y2 = 0

2x + y 2y + x ⇐⇒ ,
 2 x2 + y 2 + xy = 1
x + y 2 + xy = 1
che ha come soluzioni
 √ √
 P1 = ( 3 , 3 )

2
3√ 3 √ f (P1 ) = f (P2 ) =
 P = (− 3 , − 3 )
 3
1
 3 3
P3 = (1, −1)
f (P3 ) = f (P4 ) = 2.
P4 = (−1, 1)
Dal punto di vista geometrico P1 e P2 sono i punti di C che hanno distanza minore dell’o-
rigine, per cui sono i vertici dell’ellisse che giacciono sull’asse minore, mentre P3 e P4 sono
i punti di C che hanno distanza maggiore dall’origine, per cui sono i vertici che giacciono
sull’asse maggiore. Ne segue che C è un’ellisse con assi posti lungi le rette y = −x e y = x.

Il teorema dei moltiplicatori di Lagrange può essere esteso al caso di m vincoli in Rn ,


purché m < n.
65

Teo 1.101. Data una funzione f : A ⊂ Rn → R definita su un aperto A aperto e di classe


C 1 ed un insieme
C = {P ∈ A | g1 (P ) = . . . = gm (P ) = 0},
dove g1 , . . . , gm : A → R sono di classe C 1 e m < n, se P0 ∈ C punto di estremo relativo di
f vincolata su C ed i vettori ∇g1 (P0 ), . . . , ∇gm (P0 ) sono linearmente indipendenti, allora
esistono unici λ1 , . . . , λm ∈ R che soddisfano
Xm
∇f (P0 ) = λi ∇gi (P0 ). (70)
i=1
67

Parte 2. Integrazione in più variabili

Nel corso di Analisi I è stato introdotto l’integrale di Riemann per funzioni di una variabi-
le. La teoria può essere estesa al caso di funzioni di più variabili ed è basata sul concetto
di misura di Peano-Jordan. Tuttavia, è possibile introdurre un’altra nozione di integrale,
detto di Lebesgue, che dal punto di vista teorico permette di dimostrare risultati più po-
tenti, mentre dal punto di vista del calcolo esplicito degli integrali elementari dà gli stessi
risultati dell’integrale di Riemann con le medesime tecniche di calcolo (teorema fondamen-
tale del calcolo integrale, formule di riduzione e cambiamento di variabile). In queste note
introduciamo l’integrale di Lebesgue per funzioni di due variabili (tuttavia quanto detto
vale per funzioni definite su Rn con n qualunque, compreso n = 1). A differenza dei corsi
avanzi di analisi in queste note si è posto l’accento sulla teoria dell’integrazione piuttosto
che su quella della misura, che ne costituisce il fondamento astratto.

4. Integrale di Lebesgue

Ricordiamo che, dato un insieme A ⊂ R2 , la funzione caratteristica di A è definita come


(
1 (x, y) ∈ A
1A : R → R
2
1A (x, y) =
0 (x, y) 6∈ A,
ed è spesso denotata con χA . Valgono le seguenti proprietà elementari: per ogni A, B ⊂ R2
1A∩B = 1A 1B 1A∪B = 1A + 1B − 1A∩B . (71)
La teoria dell’integrazione in R2 si costruisce a partire dalla nozione geometrica di area di
un rettangolo.
Def. 2.1 (Rettangolo). Un rettangolo è un sottoinsieme di R2 della forma
R = (x, y) ∈ R2 | a ≤ x < b, c ≤ y < d = [a, b) × [c, d)


con a < b e c < d. La misura (o area) del rettangolo R è


m(R) = (b − a)(d − c).
Per convenzione l’insieme vuoto è un rettangolo e si pone m(∅) = 0.

È facile verificare che l’intersezione finita di rettangoli è ancora un rettangolo, mentre


l’unione finita di rettangoli non è un rettangolo, ma si può sempre scrivere come l’unione
finita di rettangoli a due a due disgiunti.
La teoria dell’integrazione si base su funzioni constanti a tratti su rettangoli.
Def. 2.2 (Funzioni semplici). Una funzione ϕ : R2 → R è detta semplice se è combinazione
lineare finita di funzioni caratteristiche su rettangoli, cioè è della forma
ϕ(x, y) = c1 1R1 (x, y) + . . . + cn 1Rn (x, y) (x, y) ∈ R2 , (72)
dove R1 , . . . , Rn è una famiglia finita di rettangoli e c1 , . . . , cn è una famiglia finita di
numeri reali.
Data una funzione semplice ϕ = c1 1R1 + . . . + cn 1Rn il suo integrale è definito come
Z
ϕ(x, y) dxdy = c1 m(R1 ) + . . . + cn m(Rn ). (73)
R2
. La decomposizione (72) di una funzione semplice ϕ come combinazione lineare di
funzioni caratteristiche su rettangoli non è unica. Ad esempio
1[0,2)×[0,2) = 1[0,1)×[0,2) + 1[1,2)×[0,2) .
R
Tuttavia, si verifica facilmente che il valore dell’integrale ϕ(x, y) dxdy non dipende dalla
R2
decomposizione scelta.
68

Data una funzione semplice, con un po’ di pazienza, si dimostra che esiste sempre una
famiglia finita R1 , . . . , Rn di rettangoli a due a due disgiunti tale che

c (x, y) ∈ R1
 1


... ...
ϕ(x, y) = , (74)

 cn (x, y) ∈ Rn
0 (x, y) 6∈ (R1 ∪ . . . ∪ Rn )

cioè ϕ è una funzione costante a tratti su una famiglia finita di rettangoli (e zero altrove).
Se c1 , . . . , cn sono positivi e i rettangoli R1 , . . . , Rn sono a due a due disgiunti, la (73)
rappresenta il volume del solido compreso tra il grafico z = ϕ(x, y) ed il piano xy. Il
volume è l’unione di n parallelepipedi a base rettangolare, ciascuno dei quali con area
m(Ri ) ed altezza ci .
Dalla definizione, si dimostrano le seguenti proprietà elementari.

a) Linearità: se ϕ e ψ sono funzioni semplici ed α, β ∈ R, allora la loro combinazione


αϕ + βψ è semplice e vale
Z Z Z
(αϕ(x, y) + βψ(x, y)) dxdy = α ϕ(x, y) dxdy + β ψ(x, y) dxdy. (75a)
R2 R2 R2

b) Monotonia: se ϕ e ψ sono semplici ed ϕ(x, y) ≤ ψ(x, y) per ogni (x, y) ∈ R2 , allora


Z Z
ϕ(x, y) dxdy ≤ ψ(x, y) dxdy. (75b)
R2 R2
R
In particolare, se ϕ è positiva, allora ϕ(x, y) dxdy ≥ 0.
R2
c) Disuguaglianza triangolare: se ϕ è semplice, allora |ϕ| è semplice e
Z Z
| ϕ(x, y) dxdy| ≤ |ϕ(x, y)| dxdy. (75c)
R2 R2
d) Se ϕ e ψ sono funzioni semplici, allora le funzioni
|ϕ(x, y) − ψ(x, y)| + ϕ(x, y) + ψ(x, y)
max{ϕ(x, y), ψ(x, y)} =
2
ϕ(x, y) + ψ(x, y) − |ϕ(x, y) − ψ(x, y)|
min{ϕ(x, y), ψ(x, y)} =
2

sono funzioni semplici.

L’idea di base per estendere la definizione di integrale ad una famiglia più ampia è quella
di approssimare in modo opportuno un’arbitraria funzione con funzioni semplici. A tal fine
si introduce la nozione di insieme trascurabile.
Def. 2.3. Un insieme E ⊂ R2 è detto trascurabile se, per ogni  > 0, esiste una famiglia
numerabile di rettangoli R1 , . . . , Rn , . . . tale che

X
E ⊂ R1 ∪ . . . ∪ Rn ∪ . . . e m(Rn ) ≤ .
n=1
. La famiglia di rettangoli che ricopre l’insieme dipende da  ed i rettangoli non sono
necessariamente a due a due disgiunti.

La definizione di insieme trascurabile implica che ogni sottoinsieme di un insieme trascu-


rabile è trascurabile e che unione numerabile di insiemi trascurabili è trascurabile. In
particolare, come mostrano i prossimi esempi, Q × Q è un insieme trascurabile, denso in
R2 .
69

Esempio 2.4. L’insieme costituito


√ da un solo √ punto A = {(x0 , y0 )} è trascurabile. Infatti
dato  > 0, sia R = [x0 , x0 + ) × [y0 , y0 + ), A ⊂ R e m(R) = . Ne segue che un
insieme costituito da una numero finito o numerabile di punti è trascurabile.
Esempio 2.5. Dato x0 ∈ R, la retta E = (x, y) ∈ R2 | x = x0 è trascurabile. Infatti,

dato  > 0 sia
  n n 2 2n 
Rn = [x0 − n , x0 + n ) × [− , ) m(Rn ) = n = n ∀n ≥ 1,
n2 n2 4 4 n2 4 2
S P∞ P∞ 
allora E ⊂ n≥1 Rn e n=1 m(Rn ) = n=1 2n = . Ne segue che l’insieme
[
E = (x, y) ∈ R2 | x ∈ Q, y ∈ R =

{x} × R
x∈Q
è trascurabile poiché è unione numerabile di insiemi trascurabili.
Più in generale si può dimostrare che se

x = x(t)
γ: t∈I I intervallo
y = y(t)
è una curva di classe C 1 , allora la sua traccia A = {(x(t), y(t)) | t ∈ I} è un insieme
trascurabile.

Siamo ora in grado di dare la definizione di funzione integrabile.


Def. 2.6. Una funzione f : R2 → R si dice (Lebesgue) integrabile se esiste una successione3
di funzioni (ϕn )n tale che
a) per ogni n ≥ 1 le funzioni ϕn : A → R sono semplici;
b) esiste un insieme trascurabile E ⊂ R2 tale che per ogni (x, y) 6∈ E
f (x, y) = lim ϕn (x, y) (76)
n→+∞
c) Z
lim sup |ϕn+h (x, y) − ϕn (x, y)| dxdy = 0. (77)
n→+∞ h>0
R2

In tal caso si definisce integrale di f il limite, necessariamente finito,


Z Z
f (x, y) dxdy = lim ϕn (x, y) dxdy. (78)
n→+∞
R2 R2

Poiché |ϕn+h (x, y) − ϕn (x, y)| sono funzioni semplici, gli integrali in (77) e in (78) sono
definiti dalla (73). La (76) è una condizione di approssimazione di f con funzioni semplici
e, se è soddisfatta, si dice che la funzione f è (Lebesgue) misurabile. Una successione di
funzioni (ϕn )n (non necessariamente semplici) che soddisfa la condizione (76) si dice che
converge quasi ovunque ad f . La (77) è una condizione di convergenza degli integrali
e garantisce che il limite in (78) esiste e non dipende dalla successione (ϕn )n scelta per
approssimare f , come dimostra il Lemma 2.42. La (77) è equivalente ad assumere che per
ogni  > 0 esiste N ∈ N tale che se m > n > N allora
Z
|ϕm (x, y) − ϕn (x, y)| dxdy ≤ ,
R2
ed è detta condizione 1
L -Cauchy.
La definizione di integrale si estende anche a funzioni definite su sottoinsiemi di R2 .
3Una successione di funzioni (ϕ ) è una famiglia numerabile di funzioni definite su R2 a valori in R
n n

ϕ1 , ϕ 2 , . . . , ϕ n , . . .
e l’indice n è un intero maggiore od uguale ad 1.
70

Def. 2.7. Una funzione f : A ⊂ R2 → R è detta integrabile [risp. misurabile] su A se la


funzione fb : R2 → R

f (x, y) (x, y) ∈ A
f (x, y) =
b
0 (x, y) 6∈ A
è integrabile [risp. misurabile], e si definisce integrale di f su A il valore
Z Z
f (x, y) dxdy = fb(x, y) dxdy.
A R2

Esistono funzioni non misurabili, ma tali esempi sono estremamente patologici. La totalitità
delle funzioni che si incontrano negli esercizi sono misurabili poiché valgono le seguenti
proprietà.

a) Somma, prodotto e rapporto (purché il denominatore non si annulli) di funzioni misu-


rabili è misurabile.
b) Se f è misurabile, allora |f | è misurabile.
c) Se f è misurabile e f (x, y) = g(x, y) per ogni (x, y) 6∈ E con E trascurabile, allora g è
misurabile.
d) Se f (x, y) = limn→+∞ fn (x, y) per ogni (x, y) ∈ R2 e le funzioni fn sono misurabili,
allora f è misurabile.
e) Le funzioni continue sono misurabili.

Dalla definizione segue immediatamente che l’integrale non cambia se si modifica la fun-
zione su un insieme trascurabile.
Lemma 2.8. Data una funzione integrabile f : A ⊂ R2 → R ed un insieme trascurabile
E, se g : A → R è una funzione tale che g(x, y) = f (x, y) per ogni (x, y) ∈ E c , allora g è
integrabile e Z Z
f (x, y) dxdy = g(x, y) dxdy.
A A

Dimostrazione. Poiché unione di due insiemi trascurabile è trascurabile, la (76) vale anche
per g e la (77) non dipende da f , la tesi segue dalla definizione di integrale. 

La seguente proposizione riassume le principali proprietà dell’integrale, la cui dimostrazione


segue facilmente dalle analoghe proprietà dell’integrale per funzioni semplici.
Prop. 2.9. Sia A un sottoinsieme di R2 .

a) Linearità: se f e g sono funzioni integrabili su A ed α, β ∈ R, allora αf +βg è integrabile


su A e vale
Z Z Z
(αf (x, y) + βg(x, y)) dxdy = α f (x, y) dxdy + β g(x, y) dxdy.
A A A
b) Monotonia: se f e g sono integrabili su A e f (x, y) ≤ g(x, y) per ogni (x, y) ∈ A, allora
Z Z
f (x, y) dxdy ≤ g(x, y) dxdy.
A A
R
In particolare, se f è positiva vale f (x, y) dxdy ≥ 0.
A

c) Disuguaglianza triangolare: se f è integrabile su A, allora |f | è integrabile su A e


Z Z
| f (x, y) dxdy| ≤ |f (x, y)| dxdy.
A A
71

d) Se f1 , . . . , fn sono funzioni integrabili su A, allora le funzioni


max{f1 (x, y), . . . , fn (x, y)}
min{f1 (x, y), . . . , fn (x, y)}
sono integrabili su A.

Dimostrazione. Dimostriamo solo il punto a) con A = R2 . Le affermazioni b), c) e d) si


mostrano in modo analogo. Siano (ϕn )n e (ψn )n due successioni L1 -Cauchy ed E ed F
due insiemi trascurabili tali che (ϕn )n converge puntualmente ad f su E c e (ψn )n converge
puntualmente ad g su F c . Poiché E ∪F è un insieme trascurabile, la successione di funzioni
semplici (αϕn + βψn )n converge quasi ovunque ad αf + βg. Inoltre, per ogni n, h
Z
|(αϕn+h (x, y) + βψn+h (x, y)) − (αϕn (x, y) + βψn (x, y))| dxdy ≤
R2
Z Z
|α| |ϕn+h (x, y) − ϕn (x, y)| dxdy + |β| |ψn+h (x, y) − ψn (x, y)| dxdy
R2 R2

allora
Z
sup |(αϕn+h (x, y) + βψn+h (x, y)) − (αϕn (x, y) + βψn (x, y))| dxdy ≤
h>0
R2
Z Z
|α| sup |ϕn+h (x, y) − ϕn (x, y)| dxdy + |β| sup |ψn+h (x, y) − ψn (x, y)| dxdy
h>0 h>0
R2 R2

e facendo il limite per n che tende a +∞ si deduce che (αϕn + βψn )n è una successione
L1 -Cauchy. Ne segue che αf + βg è integrabile ed, usando la linearità dell’integrale sulle
funzioni semplici,
 
Z Z Z
(αf (x, y) + βg(x, y)) dxdy = lim α ϕn (x, y) dxdy + β ψm (x, y) dxdy 
n→+∞
R2 R2 R2
Z Z
=α f (x, y) dxdy + β g(x, y) dxdy.
R2 R2

I due teoremi che seguono sono il nucleo della teoria dell’integrazione.


Teo 2.10 (Teorema della convergenza monotona). Data una successione (fn )n di funzioni
fn : A ⊂ R2 → R tale che

a) per ogni n ≥ 1, fn è integrabile su A;


b) la successione (fn )n è monotona;
c) esiste finito
Z
lim fn (x, y) dxdy ∈ R, (79)
n→+∞
A

allora esiste una funzione integrabile f : A → R tale che


f (x, y) = lim fn (x, y) ∀(x, y) ∈ E c , (80)
n→+∞

dove E ⊂ A è trascurabile, e vale


Z Z
f (x, y) dxdy = lim fn (x, y) dxdy.
A n→+∞ A
72

Dimostrazione. Senza perdita di generalità, supponiamo che A = R2 e che per ogni n ≥ 1


fn (x, y) ≤ fn+1 (x, y) (x, y) ∈ R2 .
R
Essendo la successione numerica ( fn (x, y) dxdy)n convergente allora è di Cauchy e, per
R2
la monotonia dell’integrale, è crescente, allora
Z Z
lim sup fn+h (x, y) dxdy − fn (x, y) dxdy =
n→+∞ h>0
R2 R2
Z Z
= lim sup fn+h (x, y) dxdy − fn (x, y) dxdy = 0. (81)
n→+∞ h>0
R2 R2

Poiché per ogni n, h ≥ 1,


 
Z Z Z
sup |fn+h (x, y) − fn (x, y)| dxdy = sup  fn+h (x, y) dxdy − fn (x, y) dxdy 
h>0 h>0
R2 R2 R2

la (81) implica che (fn )n soddisfa la (106) della Proposizione 2.44, per cui esiste una
funzione f integrabile per cui
Z Z
f (x, y) dxdy = lim fn (x, y) dxdy.
n→∞
R2 R2

Inoltre, esiste una sotto-successione (fnk )k tale che


lim fnk (x, y) = f (x, y) (82)
k→+∞

per ogni (x, y) ∈ E c dove E è un insieme trascurabile. Per ipotesi di monotonia, la


successione numerica (fn (x, y))n è crescente e, se (x, y) ∈ E c , dalla (82) la successione
ammette una sotto-successione converge a f (x, y). Per l’unicità del limite
lim fn (x, y) = f (x, y).
n→+∞


R 
Poiché A fn (x, y) dxdy n è una successione numerica monotona, la (79) è equivalente al
fatto che esista C > 0 tale che per ogni n ≥ 1
Z
fn (x, y) dxdy ≤ C.
A

Inoltre, poiché la successione (fn )n è monotona, il limite limn→+∞ fn (x, y) esiste sem-
pre e, come conseguenza del teorema enunciato, è finito tranne per un insieme di punti
trascurabile.
Teo 2.11 (Teorema della convergenza dominata). Data una successione (fn )n di funzioni
fn : A ⊂ R2 → R tale che

a) per ogni n ≥ 1, fn è integrabile su A;


b) esiste una funzione f : A ⊂ R2 → R tale che
f (x, y) = lim fn (x, y) ∀(x, y) ∈ E c , (83)
n→+∞

dove E ⊂ A è trascurabile;
c) esiste una funzione g : A → R integrabile tale che per ogni (x, y) ∈ A,
|fn (x, y)| ≤ g(x, y),
73

allora f è integrabile su A e vale


Z Z
f (x, y) dxdy = lim fn (x, y) dxdy.
n→+∞
A A

Dimostrazione. Senza perdita di generalità, possiamo supporre che A = R2 e, eventual-


mente ridefinendo fn ed f uguali a zero su E, che la (83) valga su tutto R2 . L’ipotesi (83)
implica che per ogni (x, y) ∈ R2 la successione numerica (fn (x, y))n è di Cauchy e, quindi,
per ogni n ≥ 1 (vedi (118b))
sup |fj (x, y) − fi (x, y)| < +∞
i,j≥n
lim sup |fi (x, y) − fj (x, y)| = 0.
n→+∞ i,j≥n

Passo 1. Definiamo per ogni m ≥ n ≥ 1,


ϕn,m : R2 → [0, +∞) ϕn,m (x, y) = max |fj (x, y) − fi (x, y)|.
n≤i,j≤m

Poiché tutte le funzioni fn sono integrabili, allora ciascuna ϕn.m è integrabile e


Z Z
0 ≤ ϕn,m (x, y) dxdy ≤ 2 g(x, y) dxdy.
R2 R2
Fissato n ≥ 1, la successione (ϕn,m )m è crescente e converge puntualmente a
ψn : R2 → [0, +∞) ψn (x, y) = sup |fj (x, y) − fi (x, y)|.
i,j≥n

Allora per il teorema della convergenza monotona, ciascuna ψn è integrabile.


Passo 2. La successione (ψn )n è decrescente, converge puntualmente a zero e
Z Z
0 ≤ ψn (x, y) dxdy ≤ ψ1 (x, y) dxdy,
R2 R2
allora per il teorema della convergenza monotona
Z
lim ψn (x, y) dxdy = 0.
n→+∞
R2

Passo 3. Poiché
Z Z
sup |fn+h (x, y) − fn (x, y)| dxdy ≤ sup |fj (x, y) − fi (x, y)| dxdy
h>0 i,j≥n
R2 R2
Z
= ψn (x, y) dxdy,
R2
R
allora limn→+∞ suph>0 |fn+h (x, y) − fn (x, y)| dxdy = 0. Allora (fn )n soddisfa la (58a)
R2
della Proposizione 2.44, per cui esiste g integrabile e vale
Z Z
g(x, y) dxdy = lim fn (x, y) dxdy.
n→∞
R2 R2
Inoltre, pur di passare ad una sotto-successione, possiamo sempre assumere che per ogni
(x, y) ∈ E c (dove E è un insieme trascurabile)
lim fn (x, y) = g(x, y),
n→+∞
c
L’ipotesi
R R che f (x, y) = g(x, y) per ogni (x, y) ∈ E e, quindi, f è integrabile e
(80) implica
f (x, y) dxdy = g(x, y) dxdy. 
R2 R2
74

Cor. 2.12 (Integrazione termine a termine I). Data una successione (fn )n di funzioni di
funzioni fn : A ⊂ R2 → R tale che
a) per ogni n ≥ 1, fnP
è integrabile su A;
+∞ R
b) la serie numerica n=1 |fn (x, y)| dxdy converge;
A

allora esiste una funzione integrabile f : A → R tale che


+∞
X
f (x, y) = fn (x, y) ∀(x, y) ∈ E c ,
n=1
dove E ⊂ A è trascurabile, e vale
Z +∞ Z
X
f (x, y) dxdy = fn (x, y) dxdy.
A n=1 A

Dimostrazione. Dividiamo la dimostrazione in due passi.


Passo 1. Per ogni n ≥ 1, definiamo sn , Sn : A → R

sn (x, y) = f1 (x, y) + . . . + fn (x, y) (x, y) ∈ A


Sn (x, y) = |f1 (x, y)| + . . . + |fn (x, y)| (x, y) ∈ A.

Le funzioni Sn sono integrabili su A, la successione di funzioni (sn )n è crescente e


Z Z X n
Sn (x, y) dxdy = |fk (x, y)| dxdy
A A k=1
Xn Z +∞ Z
X
= |fk (x, y)| dxdy ≤ |fn (x, y)| dxdy < +∞.
k=1 A n=1 A

Per il teorema della convergenza monotona esiste una funzione integrabile g : A → R tale
che
lim Sn (x, y) = g(x, y) (x, y) ∈
/ E. (84)
n→+∞

P insieme trascurabile. Fissato (x, y) ∈


dove E è un / E, la (84) equivale al fatto che la serie
numericaP n |fn (x, y)| converga. Poiché la convergenza assoluta implica quella semplice,
la serie n fn (x, y) converge. Definiamo f : A → R
(P
n fn (x, y) (x, y) ∈/E
f (x, y) =
0 (x, y) ∈ E.

Evidentemente, per ogni (x, y) ∈


/ E, limn→+∞ sn (x, y) = f (x, y) e
n
X n
X
|sn (x, y)| = fk (x, y) ≤ |fk (x, y)| ≤ g(x, y),
k=1 k=1

allora per il teorema della convergenza dominata f è integrabile e vale


Z Z +∞ Z
X
f (x, y) dxdy = lim sn (x, y) dxdy = fn (x, y) dxdy.
n→+∞
A A n=1 A


75

Supponiamo che le funzioni fn sianoR tutte positive e che la serie +∞


.
P
P+∞ n=1 f (x, y) converga
a f (x, y) per ogni (x, y) ∈ A. Se n=1 A fn (x, y) dxdy diverge, allora f non è integrabile
su A. Infatti, se per assurdo f fosse integrabile, dalla relazione
0 ≤ f1 (x, y) + . . . + fn (x, y) ≤ f (x, y) (x, y) ∈ A, n ≥ 1,
ed il teorema della convergenza dominata seguirebbe che
+∞ Z
X Z
0≤ fn (x, y) dxdy = f (x, y) dxdy < +∞.
n=1 A A

Il teorema della convergenza dominata implica, in particolare, il seguente criterio di inte-


grabilità.
Prop. 2.13 (Criterio del confronto). Data una funzione misurabile f : A ⊂ R2 → R, se
esiste una funzione positiva g integrabile su A tale che per ogni (x, y) ∈ A
|f (x, y)| ≤ g(x, y),
allora f è integrabile su A.

Dimostrazione. Poiché f è misurabile esiste una successione (ϕn )n di funzioni semplici,


quindi integrabili, che converge quasi ovunque ad f , cioè soddisfa la condizione (76). Per
ogni n ≥ 1 definiamo ψn : A → R

−g(x, y) ϕn (x, y) > −g(x, y)

ψn (x, y) = ϕn (x, y) −g(x, y) ≤ ϕn (x, y) ≤ g(x, y)

g(x, y) ϕn (x, y) < g(x, y)

= min{g(x, y), max{ϕn (x, y), −g(x, y)}}.


Poiché ϕn e g sono integrabili, ψn è integrabile e vale |ψn (x, y)| ≤ g(x, y). Inoltre la
successione (ψn )n converge puntualmente ad f per costruzione, allora per il teorema della
convergenza dominata f è integrabile. 

La definizione di misura o area di un insieme è immediata conseguenza della definizione di


integrale.
Def. 2.14. Un sottoinsieme A di R2 è detto

a) misurabile (secondo Lebesgue) se la funzione 1A è misurabile;


b) di misura finita se la funzione 1A è integrabile e si definisce misura (o area) di A il
valore Z
m(A) = 1A (x, y) dxdy.
R2
Se A è misurabile, ma non è di misura finita, si pone m(A) = +∞.

Dalle proprietà delle funzioni misurabili seguono le seguenti proprietà.

a) Unione numerabile ed intersezione numerabile di insiemi misurabili è misurabile.


b) Il complemento di un insieme misurabile è misurabile.
c) Gli insiemi aperti e chiusi sono misurabili.

Per la positività dell’integrale, evidentemente m(A) ∈ [0, +∞) ∪ {+∞}. Se A e B sono mi-
surabili, la monotonia dell’integrale ed il criterio del confronto implicano che la monotonia
della misura, cioè
se A ⊂ B allora m(A) ≤ m(B).
Prop. 2.15 (additività integrale e misura). Data una funzione f : A ∪ B ⊂ R2 → R dove
A e B sono misurabili e A ∩ B = ∅, allora sono fatti equivalenti
76

a) f è integrabile su A e su B;
b) f è integrabile su A ∪ B.

In tal caso vale


Z Z Z
f (x, y) dxdy = f (x, y) dxdy + f (x, y) dxdy (85a)
A∪B A B
m(A ∪ B) = m(A) + m(B). (85b)

Dimostrazione. Se f è integrabile su A e su B, allora la linearità dell’integrale implica che


f è integrabile su A ∪ B e vale la (85a).
Viceversa, se f è integrabile su A ∪ B, evidentemente |f 1A | ≤ |f 1A∪B |. Poiché A è
misurabile, f 1A è misurabile, ed il criterio del confronto implica che f è integrabile su A.
Con un analogo ragionamento si dimostra che f c è integrabile su B.
Se A e B sono entrambi di misura finita, la (85b) segue applicando il precedente risultato
al caso f = 1. Se A oppure B hanno misura infinita, per la monotonia della misura segue
che m(A ∪ B) = +∞. 

Dal teorema della convergenza monotona segue la seguente proprietà della misura di
Lebesgue, detta σ-additività.

Cor. 2.16. Data una famiglia numerabile (An )n di insiemi misurabili di R2 a due a due
disgiunti, allora
[  X +∞
m An = m(An ). (86)
n n=1

Dimostrazione. Posto, A = ∪n An , se esiste n ≥ 1 tale che m(An ) = +∞, allora m(A) =


+∞ poiché An ⊂ A.
Se m(An ) < +∞ per ogni n ≥ 1, definiamo fn : R2 → R
fn (x, y) = 1An (x, y)
allora, poiché An ∩ Am = ∅ se n 6= m,
+∞
fn (x, y) = 1A (x, y),
X

n=1

e la tesi segue applicando il corollario 2.12 e tenendo conto dell’osservazione successiva al


corollario stesso. 

Dal criterio del confronto si ha che

a) se f è misurabile, allora f è integrabile se e solo se |f | è integrabile;


b) se A è un insieme misurabile e limitato ed f è una funzione misurabile e limitata, allora
A è di misura finita, f è integrabile su A e vale
Z
f (x, y) dxdy ≤ m(A) sup |f (x, y)|;
(x,y)∈A
A

Le condizioni di limitatezza di A e di f sono condizioni sufficienti, ma non necessarie, per


garantire l’integrabilità come mostra il seguente esempio.
77

Esempio 2.17. Consideriamo la successione di funzioni


(
n n ≤ x < n + n13 , 0 ≤ y < 1
fn (x, y) = .
0 altrimenti
P
Mostriamo che la serie n fn converge assolutamente ad una funzione integrabile f . Per
questo è sufficiente applicare il corollario sull’integrazione termine a termine le cui ipotesi
sono soddisfatte poiché ciascuna fn è una funzione semplice e, quindi, integrabile, e
∞ Z ∞ Z ∞ ∞
X X X n X 1
|fn (x, y)|dxdy = ndxdy = = < +∞
n3 n2
n=1 2 n=1 1 n=1 n=1
R [n,n+ )×[0,1)
n3

Tuttavia f non è limitata e non si annulla al di fuori di un insieme limitato.

Nel teorema della convergenza monotona la condizione che la successione sia monotona
non si può eliminare come mostra il seguente esempio.
Esempio 2.18. Dato n ≥ 1, sia fn : R2 →R

 −1 1 ≤ x < 2, 0 ≤ y < 1
2 ≤ x < 3, 0 ≤ y < 21

 1


fn (x, y) = ... ... .
1
(−1)n n ≤ x < n + 1, 0 ≤ y <



 n
0 altrove

Le fn sono funzioni semplici il cui integrale vale


(−1)n
Z
1
fn (x, y) dxdy = −1 + + . . . + .
2 n
R2
La successione (fn )n converge puntualmente a f : R2 → R

 −1 1 ≤ x < 2, 0 ≤ y < 1
2 ≤ x < 3, 0 ≤ y < 21

 1



 ... ...


f (x, y) = (−1)n n ≤ x < n + 1, 0 ≤ y < n1 .

 (−1) n+1 n + 1 ≤ x < n + 2, 0 ≤ y < 1

 n+1
. . . . . .




0 altrove

R P∞ (−1)n
Benché limn→+∞ fn (x, y) dxdy = n=1 n sia finito, la funzione f non è integrabile.
R2
Supponiamo per assurdo che f sia integrabile. Questo implica che |f | è integrabile e,
essendo |fn (x, y)| ≤ |f (x, y)| per ogni (x, y) ∈ R2 , il teorema della convergenza dominata
assicura che esiste finito
Z Z ∞
X 1
|f (x, y)| dxdy = lim |fn (x, y)| dxdy = ,
n→+∞ n
n=1
R2 R2
P∞ 1
il che è assurdo poiché la serie n=1 n diverge a +∞.

Il seguente risultato mostra che le funzioni continue sono sempre integrabili su insiemi
compatti.

Teo 2.19 (Teorema della media integrale). Data una funzione f : A ⊂ R dove A è un
insieme compatto ed f è continua, allora A è di misura finita, f è integrabile su A e
Z
m(A) min f (x, y) ≤ f (x, y) dxdy ≤ m(A) max f (x, y). (87)
(x,y)∈A (x,y)∈A
A
78

Inoltre, se A è connesso per archi, esiste P ∗ ∈ A take che


Z
f (x, y) dxdy = f (P ∗ )m(A). (88)
A

Dimostrazione. Essendo compatto, A è chiuso, quindi misurabile, e limitato, quindi di


misura finita. Essendo, f continua, per il teorema di Weierstrass, esistono P1 , P2 ∈ A tali
che
f (P1 ) ≤ f (P ) ≤ f( P2 ) P ∈ A.
Essendo A di misura finita ed f misurabile, per il criterio del confronto f è integrabile e
vale
Z Z Z
f (P2 )m(A) = f (P1 ) dxdy ≤ f (x, y) dxdy ≤ f (P1 ) dxdy = f (P2 )m(A),
A A A

da cui segue la (87). Evidentemente la (88) è vera se m(A) = 0 per ogni scelta di P ∗ ∈ A.
Se A è connesso per archi ed m(A) > 0 per il teorema dei valori intermedi esiste P ∗ ∈ A
tale che
R
f (x, y) dxdy
∗ A
f (P ) = ∈ [f (P1 ), f (P2 )],
m(A)
da cui segue la (88). 

La seguente proposizione chiarisce il ruolo degli insiemi di misura nulla.

Prop. 2.20 (annullamento). Valgono i seguenti fatti.

a) Data una funzione f :R R2 → R, sono fatti equivalenti


i) f è integrabile e R2 |f (x, y)| dxdy = 0;
ii) esiste E trascurabile tale che f (x, y) = 0 per ogni (x, y) ∈ E c .
Se vale una delle due precedenti condizioni, allora
Z
f (x, y) dxdy = 0.
R2

b) Un insieme E è trascurabile se e solo se m(E) = 0.

Dimostrazione.
Punto a). Se f (x, y) = 0 per ogni (x, y) ∈ E c con E trascurabile, allora |f (x, y)| = 0 per
(x, y) ∈ E c e per il Lemma 2.8 |f | è integrabile ed il suo integrale è nullo.
R
Viceversa, se |f (x, y)| dxdy = 0, definiamo fn = n|f |, la successione (fn )n è crescente
R R2
e fn (x, y) dxdy = 0. Quindi per il teorema della convergenza mononota, esiste un
R2
insieme trascurabile E tale che la successione (fn (x, y))n converge per ogni (x, y) ∈ E c .
Per costruzione, tale limite deve essere zero con f (x, y) = 0.
Punto b). Se E è trascurabile, per il Lemma 2.8 m(E) = 0. Viceversa, se m(E) = 0, per
quanto visto al punto a) esiste F trascurabile tale che 1E (x, y) = 0 per ogni (x, y) ∈ F c ,
allora E ⊂ F . Allora E è trascurabile. 
79

5. Formule di riduzione

Il seguente teorema è di fondamentale importante per il calcolo degli integrali e mostra


che, per le funzioni continue di una variabile l’integrale di Riemann coincide con quello di
Lebesgue.
Teo 2.21 (Teorema fondamentale del calcolo integrale). Sia f : I ⊂ R → R una funzione
continua definita su un intervallo I.

a) Fissato a ∈ I definiamo F : I → R
 R

 f (t) dt x>a

Z x [a,x]

F (x) = f (t) dt = 0 x=a,
a  R
− f (t) dt x<a



[x,a]

allora F è derivabile con derivata F 0 (x)


= f (x) per ogni x ∈ I.
b) Se G è una qualunque primitiva di f ed a, b ∈ I, allora
Z b
f (x)dx = G(b) − G(a).
a

Dimostrazione. Mostriamo che F è derivabile in x0 ∈ I. Supponiamo che x0 > a, allora


per ogni h > 0, l’additività sui domini assicura che
Z x0 +h
F (x0 + h) − F (x0 ) f (x) − f (x0 )
− f (x0 ) = dx
h x0 h
Z x0 +h
f (x) − f (x0 )
≤ dx
x0 h
≤ sup |f (x) − f (x0 )|.
x0 ≤x≤x0 +h

La continuità di f in x0 implica che limh→0+ supx0 ≤x≤x0 +h |f (x) − f (x0 )| = 0, da cui


F (x0 + h) − F (x0 )
lim = f (x0 ).
h→0+ h
La seconda parte è evidente. 

I teoremi di Fubini e Tonelli, la cui dimostrazione si trova sui testi avanzati di analisi, sono
lo strumento principale per il calcolo degli integrali doppi come integrali iterati.
Teo 2.22 (Teorema di Fubini). Data una funzione f : R2 ⊂ R integrabile, allora
 
Z Z Z
f (x, y)dx =  f (x, y)dy  dx. (89)
R2 R R
dove è sottinteso che

a) esiste un insieme trascurabile E ⊂ R tale che per ogni x ∈ E c , la funzione y 7→ f (x, y)


è integrabile su R;
b) la funzione R
c
 f (x, y)dy x ∈ E

 R
g:R→R g(x) =


0 x∈E

è integrabile su R.

Il seguente teorema fornisce una condizione sufficiente.


80

Teo 2.23 (Tonelli). Data una funzione f : R2 → R misurabile, tale che


 
Z Z
0 ≤  |f (x, y)|dy  dx < +∞ (90)
R R

allora f è integrabile su R2 .

La condizione (90) significa che

a) esiste un insieme trascurabile E ⊂ R tale che per ogni x ∈ E c , la funzione y 7→ |f (x, y)|
è integrabile su R;
b) la funzione
R
 |f (x, y)|dy x ∈ E c
g:R→R g(x) = R
0 x∈E
è integrabile su R.

Facciamo alcune osservazioni.

a) Vale un risultato analogo scambiando il ruolo delle variabili x ed y. Ad esempio, se f è


integrabile, allora
 
Z Z Z
f (x, y)dx =  f (x, y)dx dy. (91)
R2 R R
b) Il secondo membro delle equazioni (89) e (91) è detto integrale iterato.
c) Come mostra l’esempio 2.24, l’esistenza dell’ integrale iterato non è sufficiente a ga-
rantire l’integrabilità di f . Tuttavia se f una funzione positiva (e misurabile), allora il
teorema di Tonelli assicura che l’esistenza di uno dei due integrale iterati è sufficiente a
garantite l’integrabilità di f e, per il teorema di Fubini, gli integrali iterati coincidono.
d) Il teorema di Fubini e quello di annullamento implicano che un insieme F ⊂ R2 è
trascurabile se e solo se esiste un insieme trascurabile E ⊂ R tale che per ogni x ∈ E c ,
l’insieme
Fx = {y ∈ R | (x, y) ∈ F }
è trascurabile.

Il seguente esempio mostra come l’esistenza degli integrali iterati non garantisca l’integra-
bilità della funzione
−y2 2
Esempio 2.24. Sia f (x, y) = (xx2 +y 2 )2 con (x, y) 6= (0, 0) e f (0, 0) = 0.

Poiché
∂ −x ∂ y
f (x, y) = 2 2
= (x, y) 6= (0, 0),
∂x (x + y ) ∂y (x + y 2 )
2

allora Z 1 Z 1  Z 1
y y=1 1 π
f (x, y)dy dx = 2 + y 2 ) y=0
dx = arctan x = ,
0 0 0 (x 0 4
ma Z 1 Z 1  Z 1
−x x=1 1 π
f (x, y)dx dy = 2 2
dy = − arctan y =− .
0 0 0 (x + y ) x=0 0 4
La funzione f non è continua in (0, 0) e non è limitata in un intorno di (0, 0) poiché
1
lim f (x, 0) = lim = +∞.
x→0 x→0 x2

Il seguente corollario è di interesse in Probabilità.


81

Cor. 2.25. Data una funzione f : R → R integrabile tale che


f (x) ≥ 0 x∈R (92a)
Z
f (x) dx = 1 (92b)
R

e posto F : R → R
Zx
F (x) = f (y) dy, (92c)
−∞

se f (x) = 0 per ogni x < 0, allora per ogni n ≥ 0


Z +∞
Z
xn f (x) dx = nxn−1 (1 − F (x)) dx (92d)
R 0

purché uno dei due integrali sia finito.

Dimostrazione. Definiamo la funzione h : R2 → R


h(x, y) = ny n−1 1[0,x] (y)f (x),
dove h(x, y) = 0 se x < 0 (poiché f (x) = 0) oppure se x ≥ 0 ed y ≤ 0. Ne segue che y n è
ben definito anche se n non è intero.
Essendo la funzione h positiva, per il teorema di Tonelli h è integrabile se e solo se esiste
finito uno dei due integrali iterati ed, in tal caso, i due integrali coincidono. Allora
+∞
 
Z Z Z Z x 
 ny n−1
1[0,x] (y)f (x)dy dx = f (x) ny n−1
dy dx
0
R R 0
+∞
Z
= xn f (x) dx,
0

poiché una primitiva della funzione continua ny n−1 è y n , mentre


 
Z Z Z +∞ Z +∞ 
 ny n−1 1[0,x] (y)f (x)dx dy = ny n−1
f (x)dx dy
0 y
R R
Z +∞
= ny n−1 (1 − F (y)) dy,
0
R
dove si è usata l’ipotesi che f (x)dx = 1.
R

Se uno dei due integrali è finito, per il teorema di Tonelli h è integrabile ed i due integrali
iterati coincidono per il teorema di Fubini. 

Le condizioni (92a) e (92b) assicurano che f è la densita di probabilità di una variabile


casuale X. La funzione F definita da (92c) si chiama funzione di distribuzione cumulativa
e, dati a, b ∈ R con a < b il valore F (b) − F (a) è la probabilità che X assuma valori
compresi tra a e b. La condizione che f (x) = 0 se x < 0 equivale ad assumere che X sia
a valori positivi. Il membro destro della (92d) è il valor medio (o speranza matematica)
di X n .
Un caso particolare del teorema di Fubini è quello in cui si integra una funzione (continua)
su domini normali.
82

Teo 2.26 (Formula di riduzione). Sia A un insieme della forma


A = (x, y) ∈ R2 | x ∈ [a, b], ϕ(x) ≤ y ≤ ψ(x)

(93)
dove ϕ, ψ : [a, b] → R sono continue, ed f : A → R una funzione continua, allora f è
integrabile su A e
Z Z b Z ψ(x) !
f (x, y) dxdy = f (x, y) dy dx. (94)
a ϕ(x)
A

Gli insiemi della forma data dalla (93) sono detti insiemi normali rispetto all’asse x. Per
costruzione A è chiuso e limitato, da cui segue l’integrabilità di f .
Nell’equazione (94), fissato x ∈ [a, b], fx (y) = f (x, y) è una funzione continua della variabile
y, quindi per il teorema fondamentale del calcolo integrale
Z ψ(x)
f (x, y) dy = F (x, ψ(x)) − F (x, ϕ(x)),
ϕ(x)

dove F (x, y) è una primitiva di f (x, y) rispetto ad y, cioè ∂F


∂y (x, y) = f (x, y). Poiché la
primitiva F (x, y) può sempre essere scelta in modo che sia continua, F (x, ψ(x))−F (x, ϕ(x))
è a sua volta continua e il teorema fondamentale del calcolo integrale assicura
Z
f (x, y) dxdy = G(b) − G(a)
A

dove G0 (x) = F (x, ψ(x)) − F (x, ϕ(x)).


Chiaramente il teorema vale anche per insiemi normali rispetto all’asse y
A = (x, y) ∈ R2 | y ∈ [a, b], ϕ(y) ≤ x ≤ ψ(y) ,


in cui l’ordine di integrazione nell’integrale iterato è scambiato


Z Z b Z ψ(y) !
f (x, y) dxdy = f (x, y) dx dy.
a ϕ(y)
A

Esempio 2.27. L’integrale della funzione continua f (x, y) = x2 + y sull’insieme


A = (x, y) ∈ R2 | y ≥ x2 , y ≤ 1


= (x, y) ∈ R2 | x ∈ [−1, 1], x2 ≤ y ≤ 1



√ √
= (x, y) ∈ R2 | y ∈ [0, 1], − y ≤ x ≤ y ,


che è normale sia rispetto a x sia rispetto a y, vale


Z 1 Z 1 1 1
y2
Z  Z
2 2 2
(x + y) dxdy = (x + y)dy dx = (x y + ) dx
−1 x2 −1 2 x2
A
1
x4
Z  
1 16
= (x2 + ) − (x4 + ) dx = ,
−1 2 2 15
oppure
√ ! √
1 y 1 y
x3
Z Z Z Z
2 2
(x + y) dxdy = √
(x + y)dx dy = 2 ( + xy) dy
0 − y 0 3 0
A
3
!
Z 1
y2 3 16
=2 + y2 dy = .
0 3 15

Il seguente teorema mostra come cambia l’integrale tramite una trasformazione regolare di
coordinate.
83

Teo 2.28 (Cambiamento di variabili). Sia Φ : A b ⊂ R2 → R2 una trasformazione regolare


di coordinate tra gli aperti A
b e A = Φ(A)
b

x = x(x, y)
Φ: (x, y) ∈ A.
b
y = x(x, y)

Data una funzione f : A → R vale


Z Z
f (x, y) dxdy = f (x(x, y), y(x, y)) |det JΦ (x, y)| dxdy
A
b
A

purché uno dei due integrali esista.

Il seguente esempio mostra il significato geometrico del fattore |det JΦ (x, y)|.

Esempio 2.29. Sia Φ : R2 → R2 la trasformazione di coordinate lineare



x = ab
x + bb
y
Φ:
y = cb
x + db
y

dove a, b, c, d ∈ R tali che ad − bc 6= 0. Sia Ab = (0, 1) × (0, 1) il quadrato di vertice l’origine


e lato 1, allora A = Φ(A) è il parallelogramma con vertice l’origine e lati i vettori (a, c) e
b
(b, d). L’area di tale parallelogramma è
Z Z Z
m(A) = 1 dxdy = |det JΦ (x, y)| dxdy = |ad − bc| dxdy = |ad − bc|,
Φ(A)
b A
b A
b

in accordo con la geometria elementare.

Il seguente esempio mostra l’uso combinato del teorema di convergenza monotona e del
cambiamento di coordinate.

Esempio 2.30. Vogliamo mostrare che per ogni σ > 0


Z
1 x2
√ e− 2σ2 dx = 1.
2πσ 2
R

Il primo passo è calcolare l’integrale doppio


Z
2 2
e−(x +y ) dxdy.
R2
2 +y 2 )
La funzione f (x, y) = e−(x è continua e positiva, per cui è integrabile su ogni insieme

Bn = B(O, n) = (x, y) ∈ R2 | x2 + y 2 ≤ n2 .


Sia Φ(r, θ) = (r cos θ, r sin θ) la trasformazione di coordinate angolari. Posto


bn = [0, n] × [π, π]
B cn = (0, n) × (−π, π)
A

osserviamo che

a) Φ è una trasformazione regolare di coordinate tra l’aperto A


cn e l’aperto

bn ) = (x, y) ∈ R2 | x2 + y 2 < n2 \ (x, y) ∈ R2 | x = 0, y ≤ 0 ,


 
An = Φ(A

bn \ A
b) m(B cn ) = 0,
c) m(Bn \ An ) = 0,
84

il teorema di cambiamento di coordinate e quello su domini normali assicurano


Z Z
−(x2 +y 2 ) 2 2
e dxdy = e−(x +y ) dxdy
Bn
ZAn Z
2 2
= e−r rdrdθ = e−r rdrdθ
An
b Bn
b
Z n
2 2 n 2
= 2π e−r rdr = πe−r = π(1 − e−n ). (95)
0 0

Posto fn : R2 → R  2 2
e−(x +y ) (x, y) ∈ Bn
fn (x, y) = ,
0 (x, y) 6∈ Bn
la successione (fn )n è crescente, converge puntualmente ad f , ogni fn è integrabile e
Z Z
2 2 2
lim fn (x, y) = lim e−(x +y ) dxdy = lim π(1 − e−n ) = π.
n→+∞ n→+∞ B n→+∞
n
R2
Il teorema della convergenza monotona assicura che f è integrabile e
Z Z
−(x2 +y 2 ) 2 2
e dxdy = lim e−(x +y ) dxdy = π.
n→+∞ B
n
R2
Calcolando lo stesso integrale usando la formula di integrazione su domini normali,
Z Z
−(x2 +y 2 ) 2 2
e dxdy = lim e−(x +y ) dxdy
n→+∞ [−n,n]×[−n,n]
R2
Z n Z n 
2 2
= lim e−x dx e−y dy =π
n→+∞ −n −n
R +∞ 2 √
da cui −∞ e−x dx = π e, quindi, facendo il cambio di variabile x 7→ √x ,
2σ 2
Z
1 x2
√ e− 2σ2 dx = 1.
2πσ 2
R

La teoria dell’integrazione si estende in modo naturale a funzioni definite in Rn . In


particolare la misura di un sottoinsieme A di R3 di misura finita si chiama volume
Z
volume(A) = m(A) = 1 dxdydz.
A
Per quanto riguardo il calcolo, il teorema di cambiamento di variabili si estende in modo
naturale, mentre il teorema di Fubini dà luogo a due casi.
Teo 2.31 (Integrazione per fili). Sia A un insieme della forma
A = {(x, y, z) ∈ R3 | (x, y) ∈ D, ϕ(x, y) ≤ z ≤ ψ(x, y)}
dove ϕ, ψ : D → R sono funzioni continue definite su un insieme D ⊂ R2 chiuso e limitato,
ed f : A → R una funzione continua, allora
 
Z Z ψ(x,y)
Z
f (x, y, z) dxdydz =  f (x, y, z) dz  dxdy. (96)
 

A D ϕ(x,y)

Teo 2.32 (Integrazione per strati). Sia A un insieme compatto connesso per archi ed
f : A → R una funzione continua, allora
 
Z Z b Z
f (x, y, z) dxdydz =  f (x, y, z) dxdy  dz. (97)
a
A Az
85

dove,
[a, b] = {z ∈ R | (x, y, z) ∈ A per qualche (x, y) ∈ R2 }
Az = {(x, y) ∈ R2 | (x, y, z) ∈ A} z ∈ [a, b]

L’insieme
{z ∈ R | (x, y, z) ∈ A per qualche (x, y) ∈ R2 } = πz (A)
è la proiezione di A sull’asse delle z e, essendo la proiezione πz : R3 → R, πz (x, y, z) = z una
funzione continua, πz (A) è un insieme compatto e connesso per archi, cioè un intervallo
della forma [a, b]. Fissato z ∈ [a, b], l’insieme Az ⊂ R2 è detto strato di quota z. Se
z 6∈ [a, b] Az è l’insieme vuoto.
Nei due teoremi, l’insieme A è compatto, per cui f è integrabile e, nella formula di in-
tegrazione per strati, Az è chiuso e limitato. Entrambe le formule (96) e (97) riducono
l’integrale triplo ad un integrale iterato, un integrale unidimensionale in dz ed un integrale
doppio in dxdy, che a sua volto può essere ridotto. La differenza consiste nell’ordine in cui
vengono calcolati i due integrali e nel dominio di integrazione. Per entrambe le tecniche di
riduzione, valgono analoghe formule permutando tra di loro le variabili x, y e z.
Esempio 2.33. Calcoliamo il volume del solido
A = {(x, y, z) ∈ R3 | (x − z)2 + (y − z)2 ≤ 1 − z 2 .}
integrando per strati la funzione 1. Posto g(x, y) = (x − z)2 + (y − z)2 + z 2 − 1, per ogni
|z| > 1 l’insieme Az è√vuoto, mentre se z ∈ [−1, 1] lo strato Az rappresenta un cerchio di
centro (z, z) e raggio 1 − z 2 . Poiché
Z
area(Az ) = 1 dxdy = π(1 − z 2 )
Az
si ha
Z1 Z1
 
z3
Z
1 4π
volume(A) =  1 dxdy  dz = π(1 − z 2 ) dz = 2π(z − = ,
3 0 3
−1 Az −1
che è il volume della sfera di raggio 1
B = {(x, y, z) ∈ R3 | x2 + y 2 + z 2 ≤ 1}.
Questo è conseguenza del principio di Cavalieri: due solidi A e B per cui i corrispondenti
strati Az e Bz hanno la stessa area per ogni z ∈ [a, b] (e lo strato è vuoto se z 6∈ [a, b])
hanno lo stesso volume.

Esempio 2.34 (Volume di un solido di rotazione). Sia D un sottoinsieme misurabile del


semipiano xz delle x positive
D ⊂ {(x, z) ∈ R2 | x ≥ 0}.
Si consideri il solido V ottenuto ruotando D intorno all’asse z di un angolo di 2π
p
V = {(x, y, z) ∈ R3 | ( x2 + y 2 , z) ∈ D}.
Il volume di V è dato dalla (prima) formula di Guldino
Z Z
volume(V ) = 1 dxdydz = 2π x dxdz = 2πxbar area(D) (98)
V D
dove xbar è l’ascissa del baricentro di D visto come insieme bidimensionale nel piano xz,
cioè Z
1
xbar = x dxdz.
area(D)
D
86

Per dimostrare il risultato, introduciamo le coordinate cilindriche



x = r cos θ

Φ(r, θ, z) = y = r sin θ r, θ, z ∈ R.

z=z

La funzione Φ è iniettiva, di classe C 1 e


 
cos θ −r sin θ 0
det JΦ(r, θ, z) = det  sin θ r cos θ 0  = r > 0,
0 0 1
e definisce una trasformazione regolare di coordinate tra gli aperti
b = (0, +∞) × (−π, π) × R
A
e A = Φ(A)b = R3 \ {(x, y, z) ∈ R3 | y = 0, x ≤ 0}. Il teorema di cambiamento di variabili
implica che
Z Z Z
1 dxdydz = 1 dxdydz = r drdθdz
V V ∩A {(r,θ,z)∈A
b | (r,z)∈D, θ∈(−π,π)}
Z
= 2π xdxdz
{(x,z)∈D}
Z

= xdxdz area(D)
area(D)
{(x,z)∈D}

6. Integrali parametrici e derivazione sotto segno di integrale

In questa sezione vengono introdotti alcuni risultati che permettono di scambiare le ope-
razione di limite e derivazione con quella di integrazione

Teo 2.35. Data una funzione misurabile f : I × J → R, z = f (x, y) con I, J intervalli


tale che
a) per ogni y ∈ J la funzione x 7→ f (x, y) è continua su I;
b) esiste una funzione integrabile g : J → [0 + ∞) tale che per ogni x ∈ I ed y ∈ J
|f (x, y)| ≤ g(y), (99)
allora la funzione F : I → R Z
F (x) = f (x, y) dy
J
è continua.

Dimostrazione. Essendo f misurabile, la (99) ed il criterio del confronto (Prop. 2.13 )


implicano che la funzione y 7→ f (x, y) è integrabile su J per ogni x ∈ I e la funzione F
risulta ben definita.
Fissato x0 ∈ I, mostriamo che F è continua in x0 . Data una successione (xn )n di punti di
I che converge a x0 , allora
Z
F (xn ) = f (xn , y) dy.
| {z }
J =fn (y)
87

Per l’ipotesi a) la successione (fn )n converge puntualmente ad f (x0 , y), e per l’ipotesi b)
|fn (y)| ≤ g(y),
Allora il teorema della convergenza dominata implica che
Z
lim F (xn ) = f (x0 , y)dy = F (x0 ).
n→+∞
J


Se I = [a, b] e J = [c, d] ed f è continua su I × J, allora tutte le ipotesi del teorema sono


soddisfatte.
Teo 2.36. Data una funzione f : I × J → R, z = f (x, y) con I e J intervalli, se

a) f ammette derivata parziale rispetto ad x;


b) per ogni x ∈ I, le funzioni y 7→ f (x, y) ed y 7→ ∂f
∂x (x, y) sono integrabili su J;
c) esiste una funzione integrabile g : J → [0 + ∞) tale che per ogni x ∈ I ed y ∈ J
∂f
| (x, y)| ≤ g(y),
∂x
allora la funzione F : I → R Z
F (x) = f (x, y)dy
J
è derivabile e Z
0 ∂f
F (x) = (x, y)dy.
∂x
J

Dimostrazione. Fissato x0 ∈ I, mostriamo che F è derivabile in x0 . Data una successione


(xn )n di punti di I che converge a x0 , allora
F (xn ) − F (x0 ) f (xn , y) − f (x0 , y)
Z
= dy.
xn − x0 xn − x0
J | {z }
=fn (y)

Per costruzione ciascuna fn è integrabile su J per l’ipotesi b), e converge puntualmente a


∂f
∂x (x0 , y) per l’ipotesi a). Inoltre, il teorema di Lagrange applicato a f (·, y) assicura che
esiste t ∈ I
∂f
|fn (y)| = | (t, y)| ≤ g(y),
∂x
dove l’ultima disuguaglianza vale per l’ipotesi c). Il teorema della convergenza dominata
implica che
F (xn ) − F (x0 )
Z
∂f
lim = (x0 , y)dy.
n→+∞ xn − x0 ∂x
J


Dal precedente risultato segue il seguente corollario.


Cor. 2.37. Dati un insieme aperto A ⊂ R2 tale che
I × [a, b] ⊂ A,
con I intervallo, ed una funzione f : A → R di classe C k (A), allora la funzione
Zb
F :I→R F (x) = f (x, y)dy
a
88

è di classe C k (I) e
Zb
(k) ∂kf
F (x) = F (x) = (x, y)dy. (100)
∂xk
a

Dimostrazione. Fissato x0 ∈ I, mostriamo che F è derivabile in x0 . Supponiamo che x0


sia un punto interno di I, allora, esistono c < x0 < d tali che (c, d) ⊂ I. Applichiamo
il teorema 2.36 alla restrizione di f all’insieme (c, d) × [a, b]. Le prime due ipotesi sono
verificate poiché f ∈ C 1 (A), mentre la terza è soddisfatta scegliendo come g : [a, b] → R la
funzione constante uguale a
∂f
C= max | (x, y)|,
x∈[c,d],y∈[a,b] ∂x
che è ovviamente integrabile su [a, b]. Allora F ristretta a (c, d) è derivabile e vale
Zb
0 ∂f
F (x) = (x, y)dy.
∂x
a

Inoltre, per il teorema 2.35 segue che F è di classe C 1 su (c, d). Poiché x0 è un punto
interno a (c, d) allora F : I → R è derivabile in un intorno di x0 (in particolare in x0 ), vale
la (100) con k = 1 e la derivata F 0 (x) è continua in x0 . Se x0 coincide con una dei due
estremi di I si ripete il ragionamento considerando [x0 , d] ⊂ I o [c, x0 ] ⊂ I. 

Osserviamo inoltre che il teorema si estende in modo naturale a funzioni f : A × B → R


dove A aperto di Rn e B ⊂ Rm ed
Z
F (x1 , . . . , xn ) = f (x1 , . . . , xn , y1 , . . . , ym ) dy1 . . . dym .
B

Esempio 2.38. Data una funzione g : R → C, se esiste k ∈ N tale che


Z
(1 + |ω|k )g(ω)dω < +∞,
R
allora la funzione f : R → C Z
f (t) = g(ω)e2πiωt dω
R
è di classe C k (R) e per ogni n ≤ k
Z
f (n) (t) = (2πi)n ω n g(ω)e2πitω dω.
R

Posto h : R2 → C, h(t, ω) = g(ω)e2πitω ,


se k = 0 è sufficiente applicare il Teorema 2.35 ad
h osservando che e |h(t, ω)| = |g(ω)|. Se k = 1, la tesi segue dal Teorema 2.36 osservando
che se (1 + |ω|)g(ω) è integrabile allora lo sono sia g(ω) sia ωf (ω). Se k > 1 si ragiona per
induzione.

Una conseguenza dei precedenti risultati e del teorema fondamentale del calcolo integrale
è il seguente corollario.
Cor. 2.39. Data f : I × J → R, z = f (x, t), dove I, J sono intervalli aperti di R ed f è
una funzione di classe C 1 , allora la funzione g : I × J × J → R
Zy
g(x, y, z) = f (x, t) dt
z
89

è di classe C 1 e
Zy
∂g ∂f
(x, y, z) = (x, t) dt
∂x ∂x
z
∂g
(x, y, z) = f (x, y)
∂y
∂g
(x, y, z) = −f (x, z).
∂z

Dimostrazione. Fissati z, y ∈ J, possiamo supporre senza perdita di generalità che z < y.


Passo 1. Mostriamo che g è derivabile rispetto ad x. Fissato x0 ∈ I e δ > 0 tale che
[x0 − δ, x0 + δ] ⊂ I. Poiché [z, y] ⊂ J, per il commento a) al precedente teorema (applicato
a [x0 − δ, x0 + δ] × [z, y]), g è derivabile rispetto ad x e vale
Zy
∂g ∂f
(x0 , y, z) = (x0 , t) dt.
∂x ∂x
z
Essendo x0 arbitrario, l’uguaglianza vale per ogni x ∈ I.
∂g
Passo 2. Mostriamo che ∂x è continua su I × J × J. Dato (x0 , y0 , z0 ) ∈ I × J × J, fissiamo
δ > 0 tale che
[x0 − δ, x0 + δ] ⊂ I [y0 − δ, y0 + δ] ⊂ J [z0 − δ, z0 + δ] ⊂ J,
allora, per ogni x ∈ [x0 − δ, x0 + δ], y ∈ [y0 − δ, y0 + δ] e z ∈ [z0 − δ, z0 + δ],
∂g ∂g ∂g ∂g ∂g ∂g
| (x, y, z) − (x0 , y0 , z0 )| ≤ | (x, y, z) − (x, y0 , z0 )| + | (x, y0 , z0 ) − (x0 , y0 , z0 )| .
∂x ∂x |∂x {z∂x } | ∂x {z ∂x }
I II
Mostriamo che entrambi gli addenti a secondo membro tendono a zero. Il primo
Zy Zy0 Zy Zz
∂f ∂f ∂f ∂f
I=| (x, t) dt − (x, t), dt| = | (x, t) dt − (x, t), dt|
∂x ∂x ∂x ∂x
z z0 y0 z0
∂f
≤ |y − y0 | max | (x, t)|
x∈[x0 −δ,x0 +δ] ∂x
t∈[y0 −δ,y0 +δ]
∂f
+ |z − z0 | max | (x, t)|,
x∈[x0 −δ,x0 +δ] ∂x
t∈[z0 −δ,z0 +δ]

tende a zero se (x, y, z) tende a (x0 , y0 , z0 ) poiché f è di classe C 1 per cui ∂f


∂x è limitata su
[x0 − δ, x0 + δ] × [y0 − δ, y0 + δ] e su [x0 − δ, x0 + δ] × [z0 − δ, z0 + δ]. Il secondo
Zy0 Zy0
∂f ∂f
II = | (x, t) dt − (x0 , t) dt|
∂x ∂x
z0 z0

Ry0 ∂f
tende a zero poiché la funzione ∂x (x, t) dt è continua in x0 per il teorema 2.35 applicato
z0
a I = [x0 − δ, x0 + δ] ed a J l’intervallo di estremi z0 ed y0 .
Passo 3. Mostriamo che g è derivabile rispetto ad y e z con derivata continua. Fissati
x ∈ I e t0 ∈ J, per ogni y, z ∈ J
Zy Zz
g(x, y, z) = f (x, t) dt − f (x, t) dt.
t0 t0
90

Poiché la funzione t 7→ f (x, t) è continua su J, per il teorema fondamentale del calcolo


integrale allora g ammette derivata parziale rispetto ad y e z e
∂g ∂g
(x, y, z) = f (x, y) (x, y, z) = −f (x, z),
∂y ∂z
∂g ∂g
da cui segue che ∂y e ∂z sono continue. 

Nelle ipotesi del precedente corollario, se ϕ, ψ : I → R sono due funzioni di classe C 1 tali
che ϕ(x), ψ(x) ∈ J per ogni x ∈ I, allora la regola di derivazione in catena implica che la
funzione
ψ(x)
Z
F :I→R F (x) = f (x, t)dt
ϕ(x)

è di classe C 1 e, per ogni x ∈ I,


ψ(x)
Z
0 ∂f
F (x) = (x, t)dt + f (x, ψ(x)) ψ 0 (x) − f (x, ϕ(x)) ϕ0 (x). (101)
∂x
ϕ(x)

Esempio 2.40.
Z1
tx − 1
g(x) = calcolare g(x)
log t
0
Zy
2
f (x, y) = e−xt dt gradiente
0
Zx
2
g(x) = ext log(1 + t2 ) dt invertibilità e (g −1 )0 (0)
−1

7. Dimostrazioni e complementi

In questa sezione riportiamo alcuni risultati complementari necessari per dimostrare i


risultati principali.
Lemma 2.41. Data una funzione f : R2 → R ed una successione (ϕn )n di funzioni
semplici che soddisfa
Z
lim sup |ϕn+h (x, y) − ϕn (x, y)| dxdy = 0
n→+∞ h>0
R2
lim ϕn (x, y) = f (x, y) ∀(x, y) ∈ E c ,
n→+∞

con E insieme trascurabile, allora, per ogni n ≥ 1, la funzione |f − ϕn | è integrabile e


Z
lim |f (x, y) − ϕn (x, y)| dxdy = 0.
n→+∞
R2

Dimostrazione. Dato N ≥ 1, la successione di funzioni semplici (|ϕn − ϕN |)n converge


puntualmente a |f − ϕN | su E c , ed è L1 -Cauchy per la disuguaglianza
| |ϕn+h (x, y) − ϕN (x, y)| − |ϕn (x, y) − ϕN (x, y)| | ≤ |ϕn+h (x, y) − ϕn (x, y)|
91

e la (75b). Allora |f − ϕN | è integrabile e vale


Z Z
|f (x, y) − ϕN (x, y)| dxdy = lim |ϕn − ϕN | dxdy
n→∞
R2 R2
Z
≤ sup |ϕN +h − ϕN | dxdy,
h>0
R2
R
La condizione (77) implica che limN →+∞ |f (x, y) − ϕN (x, y)| = 0. 
R2

Introduciamo la seguente notazione, se Q ⊂ R2 è l’unione numerabile di una famiglia di


rettangoli R1 , R2 , . . . a due a due disgiunti, poniamo
m(Q) = m(R1 ) + m(R2 ) + . . . ,
dove la serie è convergente o divergente a +∞.
Lemma 2.42 (Lemma di transizione). Sia (ϕn )n una successione di funzioni semplici tale
che Z
lim sup |ϕn+h (x, y) − ϕn (x, y)| dxdy = 0, (102)
n→+∞ h>0
R2
allora
R
a) esiste finito limn→∞ ϕn (x, y)
R2
b) esiste una sotto-successione (ϕnk )k ed una funzione integrabile f : R2 → R tale che
lim |f (x, y) − ϕnk (x, y)| = 0 ∀(x, y) ∈ E c (103)
k→+∞

per un opportuno insieme trascurabile E;


c) per ogni  > 0 esiste U , unione numerabile di rettangoli a due a due disgiunti, tale che
m(U ) ≤ 
lim sup |f (x, y) − ϕnk (x, y)| = 0, (104)
k→+∞ (x,y)∈U c


dove (ϕnk )k è la sotto-successione al punto b).

Se, inoltre, f (x, y) = 0 per ogni (x, y) ∈ F c , dove F è trascurabile, allora


Z
lim ϕn (x, y) dxdy = 0.
n→∞
R2

Dimostrazione. Dividiamo la dimostrazioni in più passi.


Passo 1. Dalla (75c) per ogni m > n ≥ 1
Z Z Z
ϕn+h (x, y) dxdy − ϕn (x, y) dxdy ≤ |ϕn+h (x, y) − ϕn (x, y)| dxdy,
R2 R2 R2

allora la (102) implica che


Z Z
lim sup ϕn+h (x, y) dxdy − ϕn (x, y) dxdy = 0
n→+∞ h>0
R2 R2
R
e la completezza di R assicura che limn→∞ ϕn (x, y) dxdy esiste finito.
R2
92

Passo 2. Dalla (102) esiste n1 ≥ 1 tale che per ogni h > 0


Z
1
|ϕn1 +h (x, y) − ϕn1 (x, y)| dxdy ≤ . (105a)
4
R2
Analogamente esiste n2 > n1 tale che per ogni h > 0
Z
1
|ϕn2 +h (x, y) − ϕn2 (x, y)| dxdy ≤ 2
4
R2
e per la (105a) con h = n2 − n1
Z
1
|ϕn2 (x, y) − ϕn1 (x, y)| dxdy ≤ .
4
R2
Per induzione, possiamo costruire una successione n1 < n2 < . . . < nk < nk+1 < . . . con la
proprietà che Z
1
|ϕnk+1 (x, y) − ϕnk (x, y)| dxdy ≤ k .
4
R2

Passo 3. Per non appesantire la dimostrazione, rinominiamo la sotto-successione (ϕnk )k


semplicemente con (ϕn )n , che quindi soddisfa
Z
1
|ϕn+1 (x, y) − ϕn (x, y)| dxdy ≤ n . (105b)
4
R2
Poiché |ϕn+1 (x, y) − ϕn (x, y)| è una funzione semplice, l’insieme
1
Qn = {(x, y) ∈ R2 | |ϕn+1 (x, y) − ϕn (x, y)| ≥ }
2n
è l’unione disgiunta di rettangoli R1 , . . . , Rk e vale
Z
1 1
(m(R 1 ) + . . . + m(R k )) ≤ |ϕn+1 (x, y) − ϕn (x, y)| dxdy ≤ n ,
2n 4
R2
dove nell’ultima disuguaglianza si è usata la (105b). Ne segue che
1
m(Qn ) = m(R1 ) + . . . + m(Rk ) ≤ n (105c)
2
e per ogni (x, y) 6∈ Qn
1
|ϕn+1 (x, y) − ϕn (x, y)| < n . (105d)
2
Fissato N ≥ 1, UN = QN ∪ QN +1 ∪ . . . è l’unione numerabile di rettangoli a due a due
disgiunti UN = R10 ∪ R20 ∪ . . . e vale
m(UN ) = m(R10 ) + m(R20 ) + . . . ≤ m(QN ) + m(QN +1 ) + . . .
1 1 1
= N + N +1 + . . . = N −1 . (105e)
2 2 2
Inoltre per ogni n ≥ N ed h > 0, se (x, y) 6∈ UN
|ϕn+h (x, y) − ϕn (x, y)| ≤ |ϕn+1 (x, y) − ϕn (x, y)| + |ϕn+2 (x, y) − ϕn+1 (x, y)| + . . . +
+ |ϕn+h (x, y) − ϕn+j−1 (x, y)|

1 1 1 X 1 1
< n
+ . . . + n+h
< n h
= n−1 ,
2 2 2 2 2
h=0
cioè per ogni n ≥ N e h > 0
1
sup |ϕn+h (x, y) − ϕn (x, y)| ≤ . (105f)
c
(x,y)∈UN 2n−1
Allora limn→+∞ suph>0 sup(x,y)∈UNc |ϕn+h (x, y) − ϕn (x, y)| = 0.
93

Passo 4. Posto E = ∩N ≥1 UN , allora E è trascurabile essendo E ⊂ UN con UN unione


numerabile di rettangoli a due a due disgiunti tale che m(UN ) ≤ 1/2N −1 . Inoltre, per ogni
(x, y) 6∈ E esiste N ≥ 1 tale che (x, y) 6∈ UN e, quindi, dalla (105f) si ha che

lim sup|ϕn+h (x, y) − ϕn (x, y)| = 0.


n→+∞ h>0

Per la completezza di R, per ogni (x, y) ∈ E c esiste finito limn→+∞ ϕn (x, y) che denotia-
mo f (x, y) e definiamo f (x, y) = 0 se (x, y) ∈ E. Evidentemente f è integrabile e vale
la (103). Analogamente, fissato  > 0 esiste N tale che 1/2N −1 ≤ , allora posto U = UN
dalla (105e) m(U ) ≤  e dalla (105f) passando al limite per h che tende a +∞ segue
immediatamente la (104).
R
Passo 5. Assumiamo ora che f = 0. Per mostrare che limn→∞ ϕn (x, y) dxdy è zero,
R2
poiché dal punto a) sappiamo che il limite esiste, è sufficiente provare che

Z
lim ϕnk (x, y) dxdy = 0,
k→∞
R2

considerando la sotto-successione trovata al Passo 3. Inoltre, pur di ridefinire E come


E ∪ F , che è trascurabile, possiamo sempre assumere che F ⊂ E. Dato  > 0 dalla (102)
esiste N ≥ 1 tale che per ogni n ≥ N

Z
|ϕn (x, y) − ϕN (x, y)| dxdy ≤ .
R2

Sia K = max(x,y)∈R2 |ϕN (x, y)| e Z = {(x, y) ∈ R2 | ϕN (x, y) 6= 0}, che è unione finita di
rettangoli e, quindi, m(Z) < +∞. Fissiamo M ≥ N in modo tale che


m(UM ) ≤ 1/2M −1 ≤ .
1+K

Allora passando al limite per h che tende all’infinito la (105f) e che limn ϕn (x, y) = 0 per
ogni (x, y) ∈ E C ⊃ UM
c per ipotesi su f , allora per ogni n ≥ M ,

1
sup |ϕn (x, y)| ≤
c
(x,y)∈UM 2n−1

da cui segue che, per ogni n ≥ M

1
Qn = {(x, y) ∈ R2 | |ϕn (x, y)| > } ⊂ UN
2n−1
94


e, quindi, m(Qn ) ≤ 1+K . Allora4
Z Z Z Z
ϕn (x, y) dxdy ≤ |ϕn (x, y)| dxdy + |ϕn (x, y)| dxdy + |ϕn (x, y)| dxdy
Qcn ∩Z Qcn ∩Z c Qn
R2
Z Z
≤ |ϕn (x, y)| dxdy + |ϕn (x, y) − ϕN (x, y)| dxdy+
Qcn ∩Z Qcn ∩Z c
Z Z
+ |ϕn (x, y) − ϕN (x, y)| dxdy + |ϕN (x, y)| dxdy
Qn Qn
Z
m(Z)
≤ n−1 + 2 |ϕn (x, y) − ϕN (x, y)| dxdy + m(Qn )K
2
R2
m(Z)
≤ + 2 +  ≤ 4
2n−1
m(Z)
per ogni n ≥ 1 + log2  . Per l’arbitrarietà di , allora
Z
lim ϕn (x, y) dxdy = 0.
n→+∞
R2


Sfruttando la linearità dell’integrale (per funzioni semplici) il punto c) del lemma dimostra
che la definizione (78) è ben posta.
Lemma 2.43 (Lemma di approssimazione). Data una funzione integrabile f , per ogni
 > 0 esistono una funzione semplice ϕ ed un insieme U , unione numerabile di rettangoli
a due a due disgiunti, tali che
Z
|f (x, y) − ϕ(x, y)| dxdy ≤ 
R2
sup |f (x, y) − ϕ(x, y)| ≤  e m(U ) ≤ .
(x,y)∈U c

Dimostrazione. Fissiamo  > 0. Poiché f è integrabile, esiste una successione (ϕn )n di


funzioni semplici che soddisfano
R le condizioni (76) e (77). Il Lemma 2.41 assicura che esiste
N tale che per ogni n ≥ N , |f (x, y) − ϕn (x, y)| dxdy ≤ . La (77) assicura che possiamo
R2
applicare il lemma 2.42 e, quindi, eventualmente passando ad una sotto-successione, esiste
un insieme U , unione numerabile di rettangoli a due a due disgiunti, m(U ) ≤  tale che la
successione di funzioni (ϕn ) converge uniformemente su U c e, per la (76), la funzione limite
è necessariamente f . Esiste, quindi, n ≥ N tale che sup(x,y)∈U c |f (x, y) − ϕn (x, y)| ≤ . La
tesi segue ponendo ϕ = ϕN . 

La seguente proposizione mostra che lo spazio delle funzioni integrabili è completo.


Prop. 2.44. Sia (fn )n una successione di funzioni integrabili tale che
Z
lim sup |fn+h (x, y) − fn (x, y)| dxdy = 0, (106)
n→+∞ h>0
R2

4Per semplificare la notazione, se Q è un’unione finita di rettangoli e ϕ è una funzione semplice, definiamo
Z Z
ϕ(x, y) dxdy = ϕ(x, y)1Q (x, y) dxdy
Q
R2
Z Z
ϕ(x, y) dxdy = ϕ(x, y)1Qc (x, y) dxdy,
Qc
R2

dove si dimostra facilmente che ϕ(x, y)1Q e ϕ(x, y)1Qc sono funzioni semplici.
95

allora

a) esiste una funzione f integrabile tale che


Z
lim |f (x, y) − fn (x, y)| dxdy = 0
n→+∞
R2
Z Z
lim fn (x, y) dxdy = f (x, y) dxdy;
n→+∞
R2 R2
b) esiste una sotto-successione (fnk )k ed un insieme trascurabile E tale
lim fnk (x, y) = f (x, y) ∀ (x, y) ∈ E c .
k→+∞

Dimostrazione. Dimostriamo primo il punto a). Dividiamo la dimostrazione in più passi.


Passo 1. Il Lemma 2.43 assicura che per ogni n ≥ 1 esiste ϕn funzione semplice tale che
Z
1
|fn (x, y) − ϕn (x, y)| dxdy ≤
n
R2
e, quindi, per ogni n ≥ 1 and h > 0
Z Z
|ϕn+h (x, y) − ϕn (x, y)| dxdy ≤ |ϕn+h (x, y) − fn+h (x, y)| dxdy+
R2 R2
Z
+ |fn+h (x, y) − fn (x, y)| dxdy+
R2
Z
+ |ϕn (x, y) − ϕn (x, y)| dxdy
R2
Z
1 1
≤ + |fn+h (x, y) − fn (x, y)| dxdy + .
n+h n
R2
Allora
Z Z
2
sup |ϕn+h (x, y) − ϕn (x, y)| dxdy ≤ |fn+h (x, y) − fn (x, y)| dxdy +
h>0 n
R2 R2
La (106) implica che la successione (ϕn )n soddisfa la condizione (102) del Lemma 2.42.
Allora esiste una funzione integrabile f ed un insieme trascurabile E tali che una sotto-
successione (ϕnk )k converge puntualmente su E c ad f .
Passo 2. Per ogni n ≥ 1 scegliamo nk tale che nk > n, allora
Z Z
|f (x, y) − fn (x, y)| dxdy ≤ |f (x, y) − ϕnk (x, y)| dxdy+
R2 R2
Z
+ |ϕnk (x, y) − fnk (x, y)| dxdy+
R2
Z
+ |fnk (x, y) − fn (x, y)| dxdy
2
ZR
1
≤ |f (x, y) − ϕnk (x, y)| dxdy + +
nk
R2
Z
+ sup |fn+h (x, y) − fn (x, y)| dxdy.
h>0
R2
96

Facendo tendere n all’infinito, nk tende all’infinito, allora il primo addendo tende a zero
per il Lemma 2.41 ed il terzo per l’ipotesi (106), per cui
Z
lim |f (x, y) − fn (x, y)| dxdy = 0.
n→+∞
R2
Dalla disuguaglianza triangolare per gli integrali segue che
Z Z
lim fn (x, y) dxdy = f (x, y) dxdy.
n→+∞
R2 R2

Dimostriamo ora il punto b).


Passo 4. Dal Lemma 2.43 segue che si può sempre scegliere ϕn in modo tale che
1
sup |fn (x, y) − ϕn (x, y)| ≤
(x,y)∈Unc n
con Un , unione numerabile di rettangoli m(Un ) ≤ 1/2n . Allora, posto WN = ∪n≥N Un ,
evidentemente m(WN ) ≤ 1/2N −1 , WN ⊃ WN +1 e ∩N ≥1 Wn è un insieme trascurabile.
Quindi, pur di ridefinire E, possiamo sempre assumere che ∩N ≥1 Wn ⊂ E. Allora, dato
(x, y) ∈ E c , esiste N tale che (x, y) ∈ WNc ⊂ WNc +1 , allora per ogni k tale che nk ≥ N
|f (x, y) − fnk (x, y)| ≤ |f (x, y) − ϕnk (x, y)| + |ϕnk (x, y) − fnk (x, y)|
1
≤ |f (x, y) − ϕnk (x, y)| + .
nk
La tesi segue facendo il limite per k che tende a +∞. 
97

Parte 3. Successioni e serie di funzioni

Per semplicità consideriamo il caso di funzioni scalari, tuttavia molte definizioni e risultati
si estendono immediatamente al caso di funzioni a valori vettoriali. Tutti gli esempi e gli
esercizi riguardano il caso di funzioni in una variabile.

8. Successioni di funzioni

Una successione di funzioni (fn )n è una famiglia numerabile di funzioni definite su A ⊂ Rd


a valori in R
f1 : A ⊂ Rd → R, f2 : A ⊂ Rd → R, . . . , fn : A ⊂ Rd → R, . . .
dove l’indice n è un intero maggiore od uguale ad 1 (se non altrimenti specificato). Ogni
punto P ∈ A definisce una successione numerica (fn (P ))n
f1 (P ), f2 (P ), . . . , fn (P ), . . . .
. Per ipotesi, tutte le funzioni fn sono definite sullo stesso dominio A, che non dipende
da n. Se le funzioni hanno dominio diverso è sufficiente definire A = ∩n dom fn , verificando
che non sia l’insieme vuoto.
Esempio 3.1. Data la successione di funzioni
xn
 

1 + nx n

il dominio comune delle funzioni fn (x) = xn / 1 + nx è
\ 1
(− , +∞) = [0, +∞) = A
n
n≥1
e, per x = 0, 1, 2, le corrispondenti successioni numeriche sono

0, 0, . . . , 0, . . .
 x=0
1 1
√ , √ ,..., √ 1
2 3 1+n
,... x = 1 .
√ √4
 2 n
2, 3 , . . . , √1+n , . . . x = 2
Def. 3.2 (Convergenza puntuale ed uniforme).
Data la successione di funzioni (fn )n , fn : A ⊂ Rd → R,
a) l’insieme
Apunt = {P ∈ A | esiste finito lim fn (P )} ⊂ Rd
n→+∞
è detto insieme di convergenza puntuale della successione e la funzione
f : Apunt ⊂ Rd → R f (P ) = lim fn (P ) ∈ R
n→+∞
è detta funzione limite;
b) dato B ⊂ A, si dice che (fn )n converge puntualmente su B ad f se B ⊂ Apunt ;
c) dato un insieme B ⊂ A, la successione (fn )n converge uniformemente su B se

B ⊂ Apunt
.
 lim sup |fn (P ) − f (P )| = 0
n→+∞ P ∈B

. L’insieme di convergenza puntuale è il più grande sottoinsieme di A su cui la successione


(fn )n converge puntualmente.
La definizione di convergenza uniforme è relativa alla scelta di un insieme B ⊂ Apunt ⊂ A,
ma non esiste in generale un insieme che è il più grande insieme di convergenza uniforme.
Per definizione, la convergenza uniforme implica quella puntuale.

Dato B ⊂ A, le definizioni date implicano che


98

i) la successione (fn )n converge puntualmente su B se e solo se


∀P ∈ B e ∀  > 0 ∃ n,P ≥ 1 tale che |fn (P ) − f (P )| ≤  ∀n ≥ n,P ;
ii) la successione (fn )n converge uniformemente su B se e solo se
∀ > 0 ∃ n ≥ 1 tale che |fn (P ) − f (P )| ≤  ∀P ∈ B e ∀n ≥ n .
iii) (criterio di Cauchy) la successione (fn )n converge uniformemente su B se e solo se
lim sup sup |fn+h (P ) − fn (P )| = 0,
n→+∞ h>0 P ∈B

cioè se
∀ > 0 ∃ n ≥ 1 tale che |fm (P ) − fn (P )| ≤  ∀P ∈ B e ∀m, n ≥ n .
Nota. Data una successione (fn )n di funzioni definite su A ⊂ Rd , se esiste f : B ⊂ Rd → R,
B ⊂ A tale che  
lim sup |fn (P ) − f (P )| = 0,
n→+∞ P ∈B
allora, evidentemente, per ogni P ∈ B
lim fn (P ) = f (P ) ∈ R.
n→+∞

Ne segue che B ⊂ Apunt e, per l’unicità del limite, f coincide con la funzione limite (ristretta
a B) e la successione (fn )n converge puntualmente ed uniformemente su B.
Esempio 3.3. La successione di funzioni (fn )n
x
fn : R → R fn (x) = q
1
x2 + n2

converge puntualmente su R ad

1
 x>0
f :R→R f (x) = 0 x=0

−1 x < 0

La successione (fn )n non converge uniformemente su [0, 1] poiché


x
sup |fn (x) − f (x)| = sup | q − 1|
0≤x≤1 0<x≤1 x2 + n12
q
x2 + n12 − x
= sup q
0<x≤1 x2 + n12
1 1
= sup q
n2 0<x≤1 x2 +
q
1 1
n2
( x2 + n2
+ x)
1 1 1 2
= lim q = n = 1,
n2 x→0 x2 + n2
q
1 1
n2
( x2 + n2
+ x)
q q
1 1
essendo la funzione x2 + n2
(x2 + n2
+ 1) crescente su [0, +∞).

La successione (fn )n converge uniformemente su [1, +∞) poiché con ragionamento analogo
1 1
sup|fn (x) − f (x)| = lim q
n2 x→1 x2 +
q
1 1
x≥1
n2
( x2 + n2
+ x)
1 1
=
n2 1 +
q q
1 1
n2
( 1+ n2
+ 1)
99

e quindi
lim sup|fn (x) − f (x)| = 0.
n→+∞ x≥1
n
Esempio 3.4. Siano fn : R\{−1} → R, fn (x) = x1+x
+1
per ogni n ≥ 1. Poiché


 +∞ x > 1
1 x=1

lim xn = ,
n→+∞ 
 0 |x| < 1
6∃ x ≤ −1

la successione (fn )n converge puntualmente su (−1, 1] alla funzione limite f : (−1, 1] → R



1 x=1
f (x) = 1 .
1+x |x| < 1
Per quanto riguarda la convergenza uniforme della successione (fn )n

a) I non converge uniformemente su (−1, 1] poiché le fn sono funzioni continue sul loro
dominio ed f non è continua in 1 (se la convergenza fosse uniforme, il teorema sulla
continuità della funzione limite implicherebbe che f sarebbe continua); J
b) non converge uniformemente su (−1, 1) poiché
|x|n
sup |fn (x) − f (x)| = sup = +∞ ∀n ≥ 1,
x∈(−1,1) x∈(−1,1) 1 + x
|x| n
poiché limx→−1+ 1+x = +∞;
c) non converge uniformemente su [0, 1) poiché
xn 1
sup |fn (x) − f (x)| = sup ≥ ∀n ≥ 1,
x∈[0,1) x∈[0,1) 1 + x 2
x n
poiché limx→1− 1+x = 12 . I In modo alternativo, poiché le funzioni fn sono conti-
nue in x = 1, se ci fosse convergenza uniforme in [0, 1), la successione convergerebbe
uniformemente su [0, 1] per la Prop. 3.7 e la funzione limite sarebbe continua in 1; J
d) converge uniformemente su (− 31 , 21 ] poiché
|x|n 3 1
sup |fn (x) − f (x)| = sup ≤ ∀n ≥ 1
x∈(− 13 , 12 ] x∈(− 1 , 1 ] 1 + x 2 2n
3 2

e limn→+∞ 32 21n = 0.
Esempio 3.5. La successione di funzioni (fn )n
nx
fn : R → R fn (x) =
1 + n2 x2
converge puntualmente a zero su R, ma non converge uniformemente in ogni intervallo
[0, a]. Infatti, f1 è una funzione di classe C 1 con derivata f10 (x) = (1 − x2 )/(1 + x2 )2 .
Quindi f1 (x) è crescente su [0, 1] e decrescente su [1, +∞) con limx→+∞ f1 (x) = 0. Allora
per ogni x ∈ [0, +∞)
0 = f (0) ≤ f1 (x) ≤ f1 (1) = 1.
Poiché fn (x) = f1 (nx), allora fn (x) è crescente su [0, 1/n] e decrescente su [1/n, +∞) e
0 = f (0) ≤ fn (x) ≤ f1 (1/n) = 1.
Fissato a > 0, se n ≥ 1/a, 1/n ∈ [0, a] e quindi
sup |fn (x) − f (x)| = max fn (x) = fn (1/n) = 1.
x∈[0,a] x∈[0,a]

Viceversa, (fn )n converge uniformemente su [a, +∞) poiché se n > 1/a


sup |fn (x) − f (x)| = max fn (x) = fn (a) −→ 0.
x∈[a,+∞) x∈[a,+∞) n→+∞
100

I seguenti teoremi caratterizzano le proprietà della funzione limite.


Teo 3.6 (Continuità del limite).
Data una successione di funzioni (fn )n , fn : A ⊂ Rd → R, tale che
a) le funzioni fn sono continue in A per ogni n ≥ 1;
b) la successione (fn )n converge uniformemente su A,
allora la funzione limite f è continua.

Dimostrazione. Fissato P0 ∈ P , dimostriamo che f è continua in P0 .


Dato  > 0, l’ipotesi b) implica che esiste n ≥ 1 (dipendente da , ma non da P ) tale che
|fn (P ) − f (P )| ≤  ∀P ∈ A, ∀n ≥ n. (107)
La continuità di fn in P0 (ipotesi a) ) assicura che esiste δ > 0 tale che
|fn (P ) − fn (P0 )| ≤  ∀P ∈ A ∩ B(P0 , δ). (108)
Allora per ogni P ∈ A ∩ B(P0 , δ),
|f (P ) − f (P0 )| = |f (P ) − fn (P ) + fn (P ) − fn (P0 ) + fn (P0 ) − f (P0 )|
( disug. triangolare ) ≤ |f (P ) − fn (P )| + |fn (P ) − fn (P0 )| + |fn (P0 ) − f (P0 )|
≤  +  +  = 3,
dove per maggiorare il primo ed il terzo addendo si usa la (107) in P ed P0 , rispettivamente,
mentre per maggiorare il secondo si usa la (108). L’arbitrarietà di  implica che f è continua
in P0 . 

La seguente proposizione fornisce un criterio sufficiente per la convergenza uniforme.


Prop. 3.7. Sia A ⊂ Rd , data una successione di funzioni (fn )n dove
fn : A ⊂ Rd → R
tale che
a) per ogni n ≥ 1 le funzioni fn sono continue su A;
b) la successione (fn )n converge uniformemente su A,

allora (fn )n converge uniformemente su A e la funzione limite è continua.

Dimostrazione. La convergenza uniforme su A implica che, dato  > 0, esiste n ≥ 1 tale


che per ogni n, m ≥ n
|fm (P ) − fn (P )| ≤  ∀P ∈ A. (109)
Poiché tutte le funzioni fn − fm sono continue su A
sup |fm (P ) − fn (P )| = sup |fm (P ) − fn (P )| ≤  (110)
P ∈A P ∈A

dove l’ultima disuguaglianza segue dalla (109). Quindi, per ogni P ∈ A la successione
numerica (fn (P ))n è di Cauchy, per cui esiste finito
lim fn (P ) =: f (P ).
n→+∞

Fissato P ∈ A e passando al limite per m che tende a +∞ la (110), segue che |f (P ) − fn (P )| ≤


 e, quindi,
sup |f (P ) − fn (P )| ≤ ,
P ∈A
cioé (fn )n converge uniformemente su A e, per il Teorema 3.6, la funzione limite è continua.

. Nel caso di funzioni di una variabile y = fn (x), il precedente risultato si applica spesso
al caso A = (a, b) con a, b ∈ R, per cui A = [a, b].
101

Esempio 3.8. La successione (fn )n dell’Esempio 3.4 non converge uniformente su (−1, 1)
( e, quindi, su (−1, 1]) poiché se per assurdo convergesse, allora (fn (x))n convergerebbe in
x = −1 (invece il limite non esiste) e uniformemente in [−1, 1] e, quindi, la funzione limite
sarebbe continua.

Data una successione di funzioni (fn )n , se

a) le funzioni fn sono integrabili su A per ogni n ≥ 1;


b) esiste g : A → R tale che |fn (P )| ≤ g(P ) per ogni P ∈ A;
c) la successione (fn )n converge puntualmente su A,

allora il teorema della convergenza dominata implica che la funzione limite f è integrabile
su A e vale
Z Z
f (x1 , . . . , xn ) dx1 . . . dxn = lim fn (x1 , . . . , xn ) dx1 . . . dxn .
n→+∞
A A
Il seguente teorema fornisce una diversa condizione.

Teo 3.9 (Limite sotto segno di integrale).


Sia (fn )n una successione di funzioni, fn : A ⊂ Rd → R. Se
a) il dominio A è compatto e le funzioni fn sono continue per ogni n ≥ 1;
b) la successione (fn )n converge uniformemente su A,
allora la funzione limite f è integrabile in A e
Z Z
f (x1 , . . . , xn ) dx1 . . . dxn = lim fn (x1 , . . . , xn ) dx1 . . . dxn . (111)
n→+∞
A A

Dimostrazione. Riportiamo la dimostrazione nel caso d = 2. L’ipotesi a) assicura che le


funzioni fn sono integrabili in A ed il teorema della continuità della funzione limite che f
è continua e, quindi, integrabile su A. Le proprietà dell’integrale implicano che
Z Z Z
0≤ fn (x, y) dxdy − f (x, y) dxdy = (fn (x, y) − f (x, y)) dxdy
A A
ZA
≤ |fn (x, y) − f (x, y)| dxdy
A
≤ m(A) sup |fn (x, y) − f (x, y)|
x∈A
Per l’ipotesi b) limn→+∞ supx∈A |fn (x, y) − f (x, y)| = 0 e, quindi,
Z Z
lim fn (x, y) dxdy = f (x, y) dxdy.
n→+∞
A A

. È possibile dimostrare il precedente risultato, usando il teorema della convergenza
dominata osservando che per ogni P ∈ A
|fn (P )| ≤ |fn (P ) − f (P )| + |f (P )| ≤ sup |fn (P ) − f (P )| + |f (P )| ≤ C + |f (P )| = g(P ),
P ∈A
dove C < +∞ poiché
lim sup |fn (P ) − f (P )| = 0
n→+∞ P ∈A
e g è integrabile poiché f è continua.
102

Nel caso di funzioni di una variabile y = fn (x) ed A = [a, b], nelle ipotesi del precedente
teorema, la (111) diventa
Z b  Z b 
lim fn (x) dx = lim fn (x) dx.
n→+∞ a a n→+∞

. Siano fn : [0, 1] → R, fn (x) = n2 xn (1 − x) per ogni n ≥ 1. La successione (fn )n


R1
converge puntualmente su [0, 1] a f (x) = 0 e 0 f (x) dx = 0, ma
Z 1
1 1
lim fn (x) dx = lim n2 ( − ) = 1.
n→+∞ 0 n→+∞ n+1 n+2
La successione infatti non converge uniformemente su [0, 1] poiché
fn0 (x) = n2 xn−1 (n − (n + 1)x)
e, quindi
n2
 
n 1
min fn (x) = fn (0) = fn (1) = 0 max fn (x) = fn = 1 n n + 1.
x∈[0,1] x∈[0,1] n+1 (1 + n )
Allora
lim sup |fn (x) − f (x)| = lim sup fn (x)
n→+∞ x∈[0,1] n→+∞ x∈[0,1]
 
n
= lim max fn (x) = lim fn
n→+∞ x∈[0,1] n→+∞ n+1
1 n2
= lim = +∞.
n→+∞ (1 + 1 )n n + 1
n

Da notare che la successione (fn )n converge uniformemente su ogni intervallo [0, a] ⊂ [0, 1]
n a
poichè se n+1 > a, cioè per ogni n > 1−a ,

min fn (x) = fn (0) = 0 max fn (a) = n2 an (1 − a)


x∈[0,a] x∈[0,a]

e, quindi,
lim sup |fn (x) − f (x)| = lim sup fn (x)
n→+∞ x∈[0,a] n→+∞ x∈[0,a]

= lim max fn (x) = lim fn (a)


n→+∞ x∈[0,a] n→+∞

= lim n2 an (1 − a) = 0,
n→+∞

poiché a < 1.
Teo 3.10 (Limite sotto segno di derivata).
Sia (fn )n una successione di funzioni, fn : A ⊂ Rd → R, dove A è aperto. Se

a) le funzioni fn sono di classe C 1 per ogni n ≥ 1,


b) la successione (fn )n converge puntualmente
  su A ad f ;
∂fn
c) per ogni i = 1, . . . , d, la successione ∂xi delle derivate parziali converge uniforme-
n
mente su A,

allora la funzione limite f è di classe C 1 (A) e, per ogni i = 1, . . . , d,


∂f ∂fn
(P ) = lim (P ) P ∈ A.
∂xi n→+∞ ∂xi

Se, inoltre, A è convesso e limitato, allora la successione (fn )n converge uniformemente


su A.
103

Dimostrazione. Per semplicità consideriamo   il caso n = 2 e fissiamo (x0 , y0 ) ∈ A. Per


∂fn
l’ipotesi c) con i = 1, la successione ∂x converge uniformemente ad una funzione
n
g : A → R, che è continua per il teorema di continuità della funzione limite. Essendo A
aperto, esistono a < x0 < b tale che (x, y0 ) ∈ A per ogni x ∈ [a, b]. Allora, per il teorema
del limite sotto il segno di integrale
Z x Z x
∂fn
g(t, y0 ) dt = lim (t, y0 ) dt
a n→+∞ a ∂x
= lim fn (x, y0 ) − fn (a, y0 )
n→+∞
= f (x, y0 ) − f (a, y0 ),
dove il passaggio intermedio è conseguenza del teorema fondamentale del calcolo integrale
per fn (continue per ipotesi) e l’ultima uguaglianza segue dall’ipotesi b). Pertanto
Z x
f (x, y0 ) = g(t, y0 ) dt + f (a, y0 ) ∀x ∈ [a, b].
a

Essendo g continua, il teorema fondamentale del calcolo integrale implica che x 7→ f (x, y0 )
è derivabile su [a, b] e, quindi, in particolare in x0 , cioè f ammette derivata parziale rispetto
a x in (x0 , y0 ) e
∂f ∂fn
(x0 , y0 ) = g(x0 , y0 ) = lim (x0 , y0 ).
∂x n→+∞ ∂x

Ne segue che f è derivabile rispetto ad x con derivata parziale continua (essendo g conti-
nua). Lo stesso ragionamento vale per la derivata rispetto ad y, per cui f è di classe C 1 e,
quindi, differenziabile.
Per dimostrare l’ultimo punto, eventualmente cambiando fn in fn − f , possiamo sempre
supporre che f = 0. Osserviamo che per ogni P ∈ A
 
∂fn ∂fn
sup k∇fn (P )k ≤ sup (P ) + (P )
P ∈A P ∈A ∂x ∂y
∂fn ∂fn
≤ sup (P ) + sup (P ) .
P ∈A ∂x P ∈A ∂y

Per l’ipotesi c) entrambe le derivate parziali convergono uniformemente a zero (poiché


f = 0), per cui
lim sup k∇fn (P )k = 0. (112)
n→+∞ P ∈A

Fissiamo P0 ∈ A, poiché A è limitato esiste R > 0 tale che supP ∈A kP − P0 k = R < +∞.
Essendo A convesso, la formula dell’accrescimento finito e la disuguaglianza di Cauchy-
Schwarz implicano che per ogni P ∈ A, esiste QP ∈ A tale che
|fn (P ) − fn (P0 )| ≤ k∇fn (QP )kkP − P0 k.
Allora, tenuto conto delle precedenti disuguaglianze
sup |fn (P )| ≤ |fn (P0 )| + sup |fn (P ) − fn (P0 )|
P ∈A P ∈A
≤ |fn (P0 )| + sup (k∇fn (QP )kkP − P0 k)
P ∈A
≤ |fn (P0 )| + sup k∇fn (Q)k R.
Q∈A

Per l’ipotesi b), lim n + ∞|fn (P0 )| = 0 e la (112) implica che


lim sup |fn (P )| = 0,
n→+∞ P ∈A

per cui (fn )n converge uniformemente a zero su A. 


104

Nel caso di funzioni di una variabile, y = fn (x) con x ∈ I ⊂ R, nelle ipotesi del teorema,
vale  0
0
lim fn (x) = lim fn (x) x ∈ I,
n→+∞ n→+∞
e si ha convergenza uniforme su ogni intervallo limitato contenuto in I.
Dalla dimostrazione del teorema segue che l’ipotesi c) può essere indebolita, richiedendo che
per ogni P0 ∈ A esista δ > 0 tale che la successione converga uniformemente su B(P0 , δ).
. Siano fn : [0, 2π] → R, fn (x) = sin(nx)
n per ogni n ≥ 1. La successione (fn )n converge
puntualmente su [0, 2π] a f (x) = 0 per ogni x ∈ [0, 2π], le funzioni fn e f sono derivabili
in [0, 2π] con f 0 (x) = 0, ma

0 1 x = 0, 2π
lim fn (x) = lim cos(nx) =
n→+∞ n→+∞ 6 ∃ 0 < x < 2π

9. Serie di funzioni
P∞
Data una successione di funzioni (fn )n , fn : A ⊂ Rd → R, la serie di funzioni n=1 fn è
la successione di funzioni (sn )n delle somme parziali
s n : A ⊂ Rd → R sn (P ) = s1 (P ) + . . . + sn (P ), . . .

P serie ed sn è l’n-esima somma parziale. Ogni punto P ∈ A


dove fn è il termine generale della
definisce una serie numerica ∞ n=1 fn (P ) definita dalla successione delle somme parziali
(sn (P ))n . Nel Capitolo 10 sono richiamate le principali proprietà delle serie numeriche.
Esempio 3.11. Data la serie di funzioni ∞ n
P
n=1 x con termine generale
fn : R → R fn (x) = xn
l’n-esima somma parziale è la funzione sn : R → R
(
x−xn+1
2 n 1−x x 6= 1
sn (x) = x + x + . . . + x =
n x=1
e, per x = 0, 1/2, 2, le corrispondenti serie numeriche sono
P∞
n
Pn=1 0
 x=0
∞ 1
n=1 2n x = 21 .
 ∞ n
 P
n=1 2 x=2
Def. 3.12 (Convergenza puntuale,
P∞ assoluta, uniforme e totale).
Data una serie di funzioni n=1 fn , fn : A ⊂ Rd → R,

a) l’insieme

X
Apunt = {P ∈ A | fn (P ) converge semplicemente} ⊂ Rd
n=1
è detto insieme di convergenza puntuale della serie e la funzione

X
d
f : Apunt ⊂ R → R f (P ) = fn (P ) ∈ R;
n=1
è detta funzione somma;
b) l’insieme

X
Aass = {P ∈ A | fn (P ) converge assolutamente} ⊂ Rd
n=1
è detto insieme di convergenza assoluta della serie;
105

c) dato B ⊂ A, si dice che ∞


P
n=1 fn converge puntualmente [risp. assolutamente] su B ad
f se B ⊂ Apunt [risp. B ⊂ Aass ]; P
d) dato un insieme B ⊂ A, la serie ∞ n=1 fn converge uniformemente su B se esiste

B ⊂ Apunt
 lim sup |sn (P ) − f (P )| = 0,
n→+∞ P ∈B

dove sn : A → R è l’n-esima somma


P parziale ed f la funzione somma;
e) dato un insieme B ⊂ A, la serie ∞
n=1 fn converge totalmente su B se converge la serie
numerica

X
sup |fn (P )|.
n=1 P ∈B

.
P∞
Come per le serie numeriche, la funzione somma è spesso denotata con n=1 fn ,
pensata come funzione definita sull’insieme di convergenza puntuale.

Dalle definizioni date segue che

i) la serie ∞
P
n=1 fn converge puntualmente (rispett. uniformemente) su B se e solo se la
successione delle somme parziali (sn )n converge puntualmente (rispett. uniformemen-
te) su B, e vale
f (P ) = lim sn (P ) P ∈ B;
n→+∞

ii) per quanto visto per le serie numeriche, la convergenza assoluta implica quella pun-
tuale, cioè Aass ⊂ Apunt ;
P ∈ Aass se e solo se la serie ∞
P
iii) un punto P n=1 |fn (P )| converge, tuttavia, in generale

|f (P )| ≤P n=1 |fn (P )|;
iv) la serie ∞ n=1 fn converge totalmente su B se e solo se per ogni n ≥ 1


X
esiste an ≥ 0 tale che |fn (P )| ≤ an per ogni P ∈ B e an < +∞. (113)
n=1

Il seguente risultato mostra che la convergenza totale implica le altre.

Teo 3.13 (Criterio di Weierstrass).


funzioni ∞
P d
P∞
Data una serie diP n=1 fn , fn : A ⊂ R → R, se n=1 fn converge totalmente
su B ⊂ A, allora ∞ f
n=1 n converge uniformemente, assolutamente e puntualmente su B.
In particolare B ⊂ Aass ⊂ Apunt .

P∞
Dimostrazione. Per ipotesi, esiste una serie n=1 an convergente tale che

|fn (P )| ≤ an ∀P ∈ B, n ≥ 1. (114)

Fissato P ∈ B, la condizione
P∞ (114) e il criterio del confronto (per serie numeriche) assicu-
rano che la serie numerica n=1 fn (P ) converge assolutamente e, quindi, puntualmente in
P , per cui B ⊂ Aass ⊂ Apunt .
Sia f : Apunt → R la somma della serie

X
f (P ) = fn (P ) P ∈ Apunt
n=1
106

e sn : A → R l’n-esima somma parziale. Dati n, m ∈ N, m > n ≥ 1, per ogni P ∈ B


|sm (P ) − sn (P )| = |fn+1 (P ) + f2 (P ) + . . . + fm (P )|
( disug. triangolare) ≤ |fn+1 (P )| + |fn+2 (P )| + . . . + |fm (P )|
(Eq. (114) ) ≤ an+1 + . . . + am
= (a1 + . . . + am ) − (a1 + . . . + an )
La serie n=1 an converge a ` ∈ (0, +∞) e ∞
P∞ P
n=1 sn (P ) converge a f (P ) per cui, facendo
tendere m a +∞ nella precedente disuguaglianza, si ha
|f (P ) − sn (P )| ≤ ` − (a1 + . . . + an ) ∀P ∈ B,
da cui
sup |f (P ) − sn (P )| ≤ ` − (a1 + . . . + an ) .
P ∈B
Facendo tendere n a +∞, il teorema del confronto implica che
lim sup |f (P ) − sn (P )| = 0.
n→+∞ B∈A


. La convergenza uniforme implica quella puntuale, ma, in generale, non implica né la
convergenza assoluta né quella totale, come mostra il seguente esempio.
Esempio 3.14. Si consideri la serie di funzioni

X (−1)n+1 x2 x3
xn = x − + + ....
n 2 3
n=1
P∞ n
a) La serie converge assolutamente solo in (−1, −1). Infatti, dato |x| < 1, n=1 |x|
1
converge e limn→+∞ n = 0, quindi il criterio del confronto asintotico assicura la con-
(−1)n+1 n n
vergenza di ∞ x |. Se |x| ≥ 1, poiché |x|n ≥ n1 e ∞ 1
P P
n=1 | n n=1 n = +∞, il criterio
(−1)n+1 n
del confronto implica che ∞
P
n=1 | n x | diverge.
b) La serie converge puntualmente solo in (−1, 1]. Se |x| < 1, la serie converge assoluta-
mente e, quindi, puntualmente. Se x = 1, la convergenza puntuale segue dal criterio di
Leibnitz. Se x = −1, la serie diverge (serie armonica). Se |x| > 1, la serie non converge
n+1
poiché non è soddisfatta la condizione di Cauchy (limn→+∞ | (−1)n xn | = +∞). In
particolare, l’insieme di convergenza puntuale è l’intervallo (−1, 1].
c) La serie converge uniformemente su [0, 1], ma non converge totalmente. Infatti, dato
n
x ∈ [0, 1], la successione xn n è positiva, decrescente ed infinitesima. Il criterio di
Leibnitz implica che
xn+1 1
|f (x) − sn (x)| ≤ ≤ n ≥ 1,
n+1 n+1
per cui
1
sup |f (x) − sn (x)| ≤ →0 se n → +∞
x∈[0,1] n+1
e la serie converge uniformemente su [0, 1]. Tuttavia
∞ ∞
X (−1)n+1 n X1
sup | x |= = +∞.
n n
n=1 x∈[0,1] n=1

per cui la serie non converge totalmente in [0, 1].


d) La serie converge totalmente in [0, 21 ]. Infatti
∞ ∞
X (−1)n+1 n X 1
sup | x |= < +∞.
1 n n 2n
n=1 x∈[0, 2 ] n=1
107

La relazione tra la convergenza uniforme della serie ∞


P
n=1 fn e la convergenza uniforme
della successione delle somme parziali (sn )n implica i seguenti risultati.
Cor. 3.15 (Continuità della
Psomma).
Data una serie di funzioni ∞ d
n=1 fn , fn : A ⊂ R → R, se

P fn sono continue su A per ogni n ≥ 1,


a) le funzioni
b) la serie ∞ n=1 fn converge uniformemente su A;

allora la funzione somma ∞


P
n=1 fn è continua.

Il seguente risultato è l’analogo alla Prop. 3.7.


Cor. 3.16. Data una serie di funzioni ∞ d
P
n=1 fn , fn : A ⊂ R → R tale che

n ≥ 1 le funzioni fn sono continue su A;


a) per ogni P
b) la serie ∞ n=1 fn converge uniformemente (risp. totalmente) su A,
P∞
allora la serie
P∞ n=1 fn converge uniformemente (risp. totalmente) su A e la funzione
somma n=1 fn è continua su A.

Dimostrazione. Se ∞
P
n=1 fn converge uniformemente su A, la tesi segue dalla Prop. 3.7.
Assumiamo che la serie converga totalmente. Per la continuità di fn
sup |fn (P )| = sup |fn (P )|.
P ∈A P ∈A
P∞
Poiché n=1 fn converge totalmente su A,

X
sup |fn (P )| < +∞,
n=1 P ∈A
P∞
quindi, n=1 fn converge totalmente su A. 

I seguenti due corollari sono un’immediata conseguenza degli analoghi risultati per le
successioni di funzioni.
Cor. 3.17 (Integrazione termine
P∞ a termine II). d
Data una serie di funzioni n=1 fn , fn : A ⊂ R → R, se

P A è compatto e le funzioni fn sono continue per ogni n ≥ 1;


a) il dominio
b) la serie ∞ n=1 fn converge uniformemente su [a, b],

allora la funzione ∞
P
n=1 fn è integrabile in A e
∞ ∞ Z
Z X !
X
fn (x1 , . . . , xn ) dx1 . . . dxn = fn (x1 , . . . , xn ) dx1 . . . dxn .
A n=1 n=1 A

Nel caso di funzioni di una variabile y = fn (x), nelle ipotesi del precedente teorema, si ha
che
∞ ∞ Z b
Z b X ! 
X
fn (x) dx = fn (x) dx .
a n=1 n=1 a

. Le ipotesi del precedente risultato vanno confrontate con quelle del Cor. 2.12.
Cor. 3.18 (Derivazione termine a termine).
Data una serie di funzioni ∞ d
P
n=1 fn , fn : A ⊂ R → R, dove A è aperto, se
1
P∞fn sono di classe C per ogni n ≥ 1,
a) le funzioni
b) la serie n=1 fn converge puntualmente su A,
108

c) per ogni i = 1, . . . , d, la serie ∞ ∂fn


P
n=1 ∂xi delle derivate parziali converge uniformemente
su A,

allora la funzione somma ∞ 1


P
n=1 fn è di classe C e vale

! +∞
∂ X X ∂fn
fn (P ) = (P ) P ∈ A.
∂xi ∂xi
n=1 i=1

Se, inoltre, A è convesso e limitato, allora la serie ∞


P
n=1 fn converge uniformemente su A.

Per funzioni di una variabile, y = fn (x) con x ∈ I ⊂ R, nelle ipotesi del corollario

!0 ∞
X X
fn (x) = fn0 (x) ∀x ∈ I.
n=1 n=1
P∞ x
Esempio 3.19. La serie n=1 x2 +n2 converge assolutamente su R poiché, fissato x ∈ R
x 1 |x|
| |= 2 x2
x2 +n 2 n +1
n2
|x| P∞ 2
dove limn→+∞ x2
= |x| e n=1 1/n < +∞.
+1
n2
x
Tuttavia la serie non converge totalmente su R. Infatti, essendo fn (x) = x2 +n2
una funzione
dispari e positiva su [0, +∞)
sup|fn (x)| = sup fn (x).
x∈R x∈[0,+∞)

−x 2 2
Inoltre, essendo fn0 (x) = (xn2 +n2 )2 , fn ha un punto di massimo (assoluto) in x = n ed il

massimo assoluto è fn (n) = 1/(2n) e quindi


∞ ∞
X X 1
sup|fn (x)| = = +∞.
x∈R 2n
n=1 n=1

Invece la serie converge totalmente su ogni intervallo [a, b]. Infatti, posto R = max{|a|, |b|},
allora
x x R
sup | 2 2
| ≤ sup | 2 2
|≤ 2
x∈[a,b] x + n x∈[−R,R] x + n n
P∞
dove n=1 1/n2 < +∞.
Analogamente, si dimostra che la serie delle derivate ∞ 0
P
n=1 fn

X n2 − x2
(x2 + n2 )2
n=1

converge totalmente su ogni intervallo [a, b] poiché


n2 − x2 n2 + R 2
sup | | ≤ .
x∈[a,b] (x2 + n2 )2 n4
Per il teorema sulla derivazione termine a termine, la funzione somma f : R → R

X x
f (x) =
x2 + n2
n=1

è di classe C 1 su ogni intervallo [a, b] e, quindi, f ∈ C 1 (R). Inoltre, poiché la serie converge
totalmente e, quindi, uniformemente su [0, 1], per il teorema di integrazione termine a
109

termine
∞ ∞ Z ∞
!
Z 1 1
X x X x 1X
dx = dx = log(t2 + n2 ) 1
0
0 x + n2
2 2
x +n 2 2
n=1 n=1 0 n=1

1 X 1+ n2
= log( ).
2 n2
n=1

10. Complemento: serie numeriche

Il concetto di serie estende la definizione di somma al caso in cui ci sia un numero infinito
di addendi. Un esempio è l’espansione decimale di una frazione, ad esempio
13 2 8 8 8
= 0.28888 . . . = + + 3 + ... + n + ... .
45 10 100 10 10
Def. 3.20 (Serie). Data una successione (an )n di numeri reali an ∈ R, si chiama serie

X
an = a1 + a2 + . . . + an + . . .
n=1
di termine generale an , la successione (sn )n delle somme parziali definita da
s1 = a1
s2 = a1 + a2
... = ...
n
X
sn = a1 + a2 + . . . + an = ak . (115)
k=1
... = ...
Il termine sn è detto somma parziale n-esima. La serie ∞
P
n=1 an converge (semplicemente)
se esiste finito
lim (a1 + a2 + . . . + an ) = lim sn = s ∈ R,
n→+∞ n→+∞
il valore del limite s è detto somma della serie e si scrive
X∞
an = s.
n=1
P∞
Se limn→+∞ sn = ±∞ si dice che la serie n=1 an diverge a +∞ (o −∞) e e si scrive

X
an = ±∞.
n=1
Se non esiste limn→+∞ sn , si dice che la serie ∞
P
n=1 an è indeterminata.
P∞
Il fatto che n=1 an converga, diverga o sia indeterminata è detto il carattere della serie.
Esempio 3.21. La serie ∞ 1
P
n=1 log(1 + n ) diverge a +∞. Infatti, dato n ≥ 1, la somma
parziale n-esima
1 1 1 1
sn = log(1 + ) + log(1 + ) + . . . + log(1 + ) + log(1 + )
1 2 n−1 n
2 3 n n+1
= log( ) + log( ) + . . . + log( ) + log( )
1 2 n−1 n
 
23 n n+1
= log ... = log(n + 1).
12 n−1 n
Poiché
lim sn = lim log(n + 1) = +∞,
n→+∞ n→+∞
P∞ 1
la serie n=1 log(1 + n ) diverge a +∞.
110

I seguenti esempi introducono alcune serie notevoli.


Esempio 3.22 (Serie geometrica). Dato q ∈ R, la serie geometrica di ragione q

X
qn = q + q2 + q3 + . . .
n=1

ha il seguente carattere


X +∞
 se q ≥ 1
n q
q = se |q| < 1 .
 1−q
n=1 
indeterminata se q ≤ −1
Infatti,
sn = q + q 2 + . . . + q n n ≥ 1.
Se q = 1, allora sn = n e
lim sn = lim n = +∞,
n→+∞ n→+∞
per cui la serie diverge a +∞.
Se q 6= 1,
1−q  q − q n+1
sn = q + q2 + . . . + qn = n ≥ 1,
1−q 1−q
per cui

∞  +∞ q > 1
q
X
n |q| < 1
q = lim sn = 1−q .
n→+∞
6 ∃ q ≤ −1

n=1

I Il carattere della serie geometrica può essere studiato anche senza calcolare esplicita-
mente le somme parziali.

a) Se q ≥ 1, ∞ n n
P
n=1 q è una serie a termini positivi il cui termine generale q non tende
a zero. La condizione necessaria di Cauchy e il carattere delle serie a termini positivi
implicano che ∞ n diverge a +∞.
P
n=1 q
b) Se |q| ≤ 1,
1
|q n | = (n2 |q|n ) 2 ∀n ≥ 1,
n
P∞ 1
la serie n=1 n2 convergePe limn→+∞ n2 |q|n = 0, allora il criterioPdel confronto asinto-
tico assicura che la serie ∞ n
n=1 |q | converge e, quindi, converge
∞ n
n=1 q .
c) Se q ≤ −1,
qn = (−1)n |q|n ∀n ≥ 1,
la successione (|q|n )n∈N è monotona crescente (|q| ≥ 1) e non tende a 0, quindi il criterio
di Leibnitz garantisce che la serie è indeterminata. J
Esempio 3.23 (Serie armonica generalizzata). Dato α > 0, la serie armonica generalizzata
di esponente α

X 1 1 1
= 1 + α ... + α + ...
nα 2 n
n=1
ha il seguente caratettere

(
X 1 converge se α > 1
= .
nα +∞ se α ≤ 1
n=1
1
I Poiché la funzione xα è positiva e decrescente su [1, +∞) e
Z +∞  1
1 α−1 α > 1 ,
dx =
1 x α +∞ α ≤ 1
111

il criterio del test integrale implica che


∞ 
X 1 converge α>1
diverge a + ∞ α ≤ 1.

n=1

della serie armonica ∞ 1


P
Si può provare la divergenza n=1 n in modo alternativo. Infatti, la
1 n

successione (1 + n ) n è crescente e converge al numero di Nepero e. Quindi
1 n
1 ≤ (1 + ) ≤e ∀n ≥ 1
n
e la crescenza del logaritmo assicura
1 1
0 ≤ log(1 +)≤ ∀n ≥ 1.
n n
Poiché la serie ∞
P 1 P∞ 1
n=1 log(1+ n ) diverge, il criterio del confronto implica che n=1 n = +∞.
J
P∞ P∞
Date due serie n=1 an e n=1 bn , i teoremi sui limiti assicurano che

X ∞
X ∞
X
(αan + βbn ) = α an + β bn
n=1 n=1 n=1
per ogni α, β ∈ R, tranne quando si ha una forma indeterminata.
La (115) implica che la successione delle somme parziali (sn )n è definita per ricorrenza

s1 = a1
. (116)
sn = sn−1 + an n ≥ 2
Date due serie ∞
P P∞
n=1 an e n=1 bn per cui esiste n ≥ 1 tale che
an = bn ∀n ≥ n,
allora le due serie hanno lo stesso carattere, ma, in generale, hanno somma diversa. Inoltre,
se bn = 0 per ogni n < n, la serie ∞
P
n=1 bn si denota semplicemente con
+∞
X
an = an + an+1 + . . .
n=n
Analogamente l’indice iniziale n può essere 0 o un intero negativo.
Esempio 3.24. La serie +∞ n
P
n=0 q converge se e solo se |q| < 1 con somma
+∞ ∞
X X q 1
qn = 1 + qn = 1 + = .
1−q 1−q
n=0 n=1

Prop.
P∞ 3.25 (Condizione necessaria di Cauchy per le serie).
Se n=1 an è una serie convergente, allora
lim an = 0.
n→+∞

Dimostrazione. La definizione di somma parziale implica che


sn − sn−1 = (a1 + . . . + an ) − (a1 + . . . + an−1 ) = an ∀n ≥ 1
per cui
lim an = lim (sn − sn−1 ) = s − s = 0
n→+∞ n→+∞
con limn→+∞ sn = s ∈ R poiché la serie ∞
P
n=1 an è convergente. 
. La condizione limn→+∞ an = 0 non è sufficiente, in generale, aP
garantire la convergenza
di ∞ 1 ∞ 1
P
a
n=1 n . Ad esempio, limn→+∞ log(1 + n ) = 0, ma la serie n=1 log(1 + n ) diverge
a +∞.

Richiamiamo la seguente proprietà dei numeri reali.


112

Teo 3.26 (Completezza). Una successione (an )n di numeri reali è convergente se e solo
se
per ogni  > 0 esiste n ∈ N tale che |am − an | ≤  per ogni m ≥ n ≥ n. (117)

Una successione che soddisfa (117) si chiama successione di Cauchy ed equivale a richiedere
che valga una delle seguenti condizioni
lim sup |an+h − an | = 0 (118a)
n→+∞ h>0

lim sup |ai − aj | = 0. (118b)


n→+∞ i,j≥n

Vale un’analoga proprietà per le serie numeriche.


Cor. 3.27 (Condizione di Cauchy). Una serie ∞
P
n=1 an è convergente se e solo se per
ogni  > 0 esiste n tale che per ogni n ≥ n e per ogni m > n
m
X
|an + an+1 + . . . + am | = | ak | ≤ .
k=n

10.1. Serie a termini positivi. Una serie ∞


P
n=1 an è detta a termini positivi se an ≥ 0
per ogni n ≥ 1. I seguenti criteri caratterizzano il carattere di queste serie.
Prop. 3.28. Una serie ∞
P
n=1 an a termini positivi converge oppure diverge a +∞. Inoltre,
se esiste C > 0 tale che
Xn
ak ≤ C per ogni n ≥ 1, (119)
k=1
P∞
allora n=1 an è convergente.

Dimostrazione. La definizione di somma parziale implica che


sn = (a1 + . . . + an−1 ) + an = sn−1 + an
per ogni n ≥ 1. Poiché an ≥ 0, allora sn ≥ sn−1 , cioé la successione delle somme parziali
(sn )n è crescente ed il teorema sulle successioni monotone implica che esiste
lim sn = sup{sn | n ≥ 1} = s ∈ [0, +∞) ∪ {+∞},
n→+∞

cioé, la la serie è convergente o divergente a +∞. Se, inoltre, vale la (119), allora sn ≤ C
per ogni n ≥ 1 e, quindi, s = sup{sn | n ≥ 1} è finito, cioé la serie converge. 
P∞
La precedente
P proposizione implica che una serie n=1 an a termini positivi è convergente
se e solo se ∞n=1 an < +∞.

Prop. 3.29 (Criterio del confronto).


Data una serie ∞
P
a
n=1 n a termini positivi,

X ∞
X
se per ogni n ≥ 1 esiste bn ≥ an e bn < +∞ allora an < +∞ (120a)
n=1 n=1
X∞ X∞
se per ogni n ≥ 1 esiste bn ≤ an e bn = +∞ allora an = +∞. (120b)
n=1 n=1

P∞
Dimostrazione. Dimostriamo la (120a). Per ogni n ≥ 1, poichè 0 ≤ an ≤ bn e n=1 bn è
convergente, allora
X n X n ∞
X
ak ≤ bk ≤ bn < +∞,
k=1 k=1 n=1
113
P∞ P∞
allora la (119) è soddisfatta con C = n=1 bn e per la Prop. 3.28 la serie n=1 an è
convergente. Analogamente, per dimostrare la (120b), per ipotesi
n
X n
X
bk ≤ ak ,
k=1 k=1

P per n che tende a +∞, il teorema del confronto per successioni


allora, passando al limite
implica che limn→+∞ nk=1 ak = +∞. 
Prop.
P 3.30 (Criterio del confronto asintotico).
Sia ∞ n=1 an una serie a termini positivi tale che per ogni n ≥ 1
an = cn bn dove bn , cn ≥ 0


X ∞
X
se lim cn ∈ (0, +∞) allora an e bn hanno lo stesso carattere (121a)
n→+∞
n=1 n=1

X X∞
se lim cn = 0 e bn < +∞ allora an < +∞ (121b)
n→+∞
n=1 n=1

X ∞
X
se lim cn = +∞) ∪ {+∞} e bn = +∞ allora an = +∞. (121c)
n→+∞
n=1 n=1

Dimostrazione. Dimostriamo che se limn→+∞ cn è finito e ∞


P
n=1 bn converge, allora anche
P ∞
a
n=1 n converge. Poiché limn→+∞ nc ∈ R, allora la successione (cn )n è limitata ed esiste
M > 0 tale che
0 ≤ cn ≤ M ∀n ≥ 1.
Moltiplicando la disuguaglianza per bn ≥ 0
0 ≤ an = bn cn ≤ M bn ∀n ≥ 1.
P∞
La
P∞convergenza della serie n=1 bn ed il criterio del confronto assicurano che la serie
n=1 an converge. Da questo segue la (121b).
dimostriamo che se limn→+∞ cn = +∞ e ∞
P
Analogamente,
P∞ n=1 bn diverge, allora anche
a
n=1 n diverge. Essendo lim n→+∞ n c strettamente positivo o +∞, esiste N ∈ N tale
che cn > 0 per ogni n > N ed esiste finito limn→+∞ 1/cn . Analogamente a prima esiste
M 0 > 0 tale che
1
0< ≤ M0 ∀n > N.
cn
Moltiplicando la disuguaglianza per an = bn cn ≥ 0
0 ≤ bn ≤ M 0 an ∀n > N.
P∞
La divergenza della serie
P ∞ P∞bn ed il criterio del confronto assicurano che la serie
n=1
a
n=N +1 n diverge e, quindi, n=1 an diverge. Da questo segue la (121c).
P
Per dimostrare la (121a)
P∞ è sufficiente applicare il primo risultato se bn converge ed il
secondo risultato se n=1 bn diverge. 

Nella precedente proposizione non si perde di generalità ad assumere che limn→+∞ an = 0


(poiché altrimenti la serie diverge) e che bn > 0, di modo che cn = an /bn . In (121a) l’ipotesi
che limn→+∞ an /bn ∈ (0, +∞) equivale al fatto che le successioni (an )nPe (bn )n hanno lo
stesso ordine di infinitesimo e la proposizione assicura che ∞ ∞
P
a
n=1 n e n=1 bn hanno lo
stesso carattere. In (121b) l’ipotesi chePlimn→+∞ an /bn = 0 equivale al fatto cheP (an )n va
a zero più velocemente di (bn )n e se ∞ b
n=1 n converge, allora converge anche ∞
n=1 an .
Infine in (121c) l’ipotesi chePlimn→+∞ an /bn = +∞ equivale al fatto P∞che (an )n va a zero
più lentamente di (bn ) e se ∞ n=1 b n diverge, allora diverge anche n=1 an .
114

Se limn→+∞ an /bn = 0 e ∞
.
P P∞
n=1 bn diverge oppure se
Plim n→+∞ an /bn = +∞ e n=1 bn
converge, non si può concludere nulla sul carattere di ∞ a
n=1 n .

Il teorema del confronto e del confronto asintotico non valgono per serie a segni qualunque.
 . La serie
P∞ P∞ 1
n=1 (−n) diverge a −∞, la serie n=1 n2 converge e
1
−n ≤ 0 ≤ ∀n ≥ 1.
n2
P∞ (−1)n
La serie n=1

n
converge per il criterio di Leibnitz (che vedremo successivamente),
P∞  1 (−1)n 
la serie n=1 n + diverge a +∞ (poiché somma di una serie divergente ed una

n
convergente) e
1 (−1)n (−1)n (−1)n
 
+ √ = 1+ √ √
n n n n
| {z } | {z } | {z }
an cn bn
 
(−1)n
con limn→+∞ 1 + √
n
= 1.

Prop. 3.31 (Criterio della radice).


Data una serie ∞
P
a
n=1 n a termini positivi tale che esista

lim n an = ` ∈ [0, +∞) ∪ {+∞}.
n→+∞

a) Se ` < 1, allora la serie converge.


b) Se ` > 1, allora la serie diverge.

Dimostrazione. Se ` < 1, si fissi q ∈ R tale che ` < q < 1. Allora


√ n
n
an
an = qn ∀n ≥ 1.
q
P∞ n
P∞serien n=1 an converge per il criterio del confronto asintotico. Infatti, poiché q < 1
La
n=1 q converge, inoltre √
n
an `
lim = < 1,
n→+∞ q q
e quindi
√ n
n √
n
an a
n log( q n )
lim = lim e =0
n→+∞ q n→+∞

Se ` > 1, la dimostrazione è analoga scegliendo 1 < q < `. 


Prop. 3.32 (Criterio del rapporto).
Data una serie ∞
P
a
n=1 n a termini strettamente positivi tale che esista
an+1
lim = ` ∈ [0, +∞) ∪ {+∞}.
n→+∞ an

a) Se ` < 1, allora la serie converge.


b) Se ` > 1, allora la serie diverge.

Dimostrazione. Se ` < 1, la definizione di limite con  = 1−`


2 > 0 implica che esiste n ≥ 1
tale che
an+1 1−` 1+`
≤`+ = ∀n ≥ n.
an 2 2
1+`
Posto 0 < q = 2 < 1 e moltiplicando per an ≥ 0
0 ≤ an+1 ≤ qan ∀n ≥ n.
115

Poiché il carattere della serie non cambia, se i primi n termini sono cambiati, si può
supporre che la disuguaglianza sia verificata per ogni n ≥ 1. Allora
0 ≤ a2 ≤ qa1
0 ≤ a3 ≤ qa2 ≤ q 2 a1
... ≤ ...
0 ≤ an ≤ qan−1 ≤ q n−1 a1
P∞ n−1
Essendo 0 < q < 1, laPserie n=1 q converge e il criterio del confronto implica la
convergenza della serie ∞ a
n=1 n .
Se ` > 1, la dimostrazione è analoga. 

Il criterio del confronto e della radice non permettono di stabilire il carattere della serie
nel caso in cui ` = 1.
Esempio 3.33. La serie ∞ 1
P
n=1 nα converge se α > 1 e diverge se α ≤ 1, ma
r
n 1 nα
lim = 1 lim =1
n→+∞ nα n→+∞ (n + 1)α

per ogni α > 0.


Prop. 3.34 (Test integrale). Data una funzione Pf : [1, +∞) → R, decrescente e positiva,
posto an = f (n) per ogni n ≥ 1, allora la serie ∞
n=1 an converge se e solo se la funzione
f ammette integrale improprio convergente sull’intervallo [1, +∞) e
+∞
Z ∞ +∞
Z
X
f (x) dx ≤ an ≤ a1 + f (x) dx. (122)
1 n=1 1

Dimostrazione. Poiché f è decrescente e positiva,


P∞ la funzione ammette integrale improprio
convergente o divergente a +∞. La serie n=1 an è a termini positivi, quindi anch’essa
è convergente o divergente a +∞. Fissato n ≥ 1, l’additività dell’integrale sui domini
implica che
n+1
Z Z2 Z3 n+1
Z
f (x) dx = f (x) dx + f (x) dx + . . . + f (x) dx,
1 1 2 n
e, essendo f decrescente, la monotia dell’integrale assicura che per ogni k = 1, . . . , n
k+1
Z
ak+1 = f (k + 1) ≤ f (x) dx ≤ f (k) = ak .
k
Allora
n+1
Z
a2 + . . . + an+1 ≤ f (x) dx ≤ a1 + a2 + . . . + an .
1
Passando al limite per n che tende a +∞
∞ +∞
Z ∞
X X
an − a1 ≤ f (x) dx ≤ an ,
n=1 1 n=1

da cui la tesi. 
P∞
Esempio 3.35. La serie armonica n=1 n1 diverge a +∞ poiché la funzione f (x) = 1
x ha
integrale divergente su [1, +∞). Inoltre si può stimare la somma parziale n-esima
1 1
ln(n + 1) ≤ 1 + + . . . + ≤ 1 + log n.
2 n
116

10.2. Convergenza assoluta. Il seguente risultato mostra che lo studio del carattere di
una serie a segni non costanti può essere ricondotto a quello di una serie a termini positivi.
Introduciamo la seguente definizione.
Def. 3.36P(Convergenza assoluta).
Una serie ∞
P∞
n=1 an converge assolutamente se la serie a termini positivi n=1 |an | converge.

Proviamo che la convergenza assoluta implica la convergenza (semplice).


Prop. 3.37 (Convergenza assoluta).
Se una serie n=1 an converge assolutamente, allora ∞
P∞ P
n=1 an converge (semplicemente).

Dimostrazione. Per ogni n ≥ 1 sia



an se an ≥ 0 |an | + an
bn = = max{an , 0} =
0 se an < 0 2

−an se an ≤ 0 |an | − an
cn = = − min{an , 0} =
0 se an > 0 2
La definizione implica che
bn ≥ 0, cn ≥ 0, |an | = bn + cn , an = bn − cn
per ogni n ≥ 1. In particolare
0 ≤ bn ≤ |an | 0 ≤ cn ≤ |an |,
P∞
la
P∞ convergenza Pdi n=1 |an | ed Pil criterio del
P∞confrontoP∞implicano la convergenza sia di
∞ ∞ P∞
b
n=1 n che di c
n=1 n . Poiché n=1 na = b
n=1 n − c
n=1 n , la serie a
n=1 n converge.


L’implicazione opposta è in generale falsa, come mostra il seguente contro-esempio.


(−1)n n1 converge (semplicemente) per il criterio di Leibnitz, ma non
 . I La serie
P

converge assolutamente poiché ∞ 1


P
n=1 n = +∞. J

La serie
1 1 1 1 1 1
1−1+ − + − + ... + − + ...
2 2 3 3 n n
converge, poiché le somme parziali sono
1
s2n−1 = s2n = 0,
n
per cui la serie converge a zero, ma la serie
1 1 1 1 1 1
1 + 1 + + + + + ... + + + ... ≥
2 2 3 3 n n
1 1 1 1 1
≥ 1 + + + + + ... + + ...
2 3 4 5 n
è divergente per confronto con la seria armonica.

10.3. Serie a segno alterno.


Prop.
P 3.38 (Criterio di Leibnitz).
Sia ∞ n=1 (−1)n+1 a = a − a + a − a + . . . una serie tale che
n 1 2 3 4

a) an ≥ 0 per ogni n ≥ 1,
b) limn→+∞ an = 0,
c) an+1 ≤ an per ogni n ≥ 1,

allora ∞ n+1 a converge e la somma s della serie soddisfa


P
n=1 (−1) n

|s − sn | ≤ an+1 ∀n ≥ 1. (123)
117

Dimostrazione. La dimostrazione èP divisa in tre passi. Preliminarmente, si noti che la


somma parziale n-esima della serie ∞n=1 (−1)
n+1 a è
n

sn = a1 − a2 + a3 − a4 + . . . + (−1)n+1 an ∀n ≥ 1. (124)
Passo 1. L’ipotesi c) implica che esistono
lim s2n = sp ∈ R ∪ {+∞}
n→+∞
lim s2n+1 = sd ∈ R ∪ {−∞}.
n→+∞
Mostriamo, infatti, che (s2n )n è una successione crescente e (s2n+1 )n è una successione
decrescente. Per ogni n ≥ 1, dalla (124)
s2(n+1) = s2n+2 = s2n + (a2n+1 − a2n+2 ) ≥ s2n
poiché a2n+1 ≥ a2n+2 . Analogamente
s2n+1 = s2n−1 − (a2n − a2n+1 ) ≤ s2n−1 = s2(n−1)+1 ,
poiché a2n ≥ a2n+1 . Il teorema sulle successioni monotone implica che esistono
lim s2n = sup{s2n | n ≥ 1} ∈ R ∪ {+∞}
n→+∞
lim s2n+1 = inf{s2n+1 | n ≥ 1} ∈ R ∪ {−∞}.
n→+∞
Passo 2. L’ipotesi b) implica che limn→+∞ s2n = limn→+∞ s2n+1 = s ∈ R. Infatti, la (124)
assicura
lim s2n+1 = lim (s2n + a2n+1 ) = lim s2n
n→+∞ n→+∞ n→+∞
poiché limn→+∞ a2n+1 = 0. Il fatto che s ∈ R segue osservando che s = limn→+∞ s2n+1 6=
+∞ e s = limn→+∞ s2n 6= −∞.
Passo 3. Mostriamo la (123). Infatti, poiché la somma s è sia l’estremo superiore di
{s2n | n ≥ 1} sia l’estremo inferiore di {s2n+1 | n ≥ 1},
s2n ≤ s ≤ s2n+1 ∀n ≥ 1,
allora, sottraendo s2n ,
0 ≤ s − s2n ≤ s2n+1 − s2n = a2n+1 ,
da cui |s − s2n | ≤ a2n+1 . Analogamente,
s2n ≤ s ≤ s2n−1 ∀n ≥ 1,
allora, sottraendo s2n−1 ,
−a2n = s2n − s2n−1 ≤ s − s2n−1 ≤ 0,
da cui |s − s2n−1 | ≤ a2n . 

Si verifica facilmente che l’ipotesi a), an ≥ 0, è conseguenza del fatto che la successione
(an )n≥0 è infinitesima
P∞ e decrescente (ipotesi b) e c) ).
n
Data una serie n=0 (−1) an , dove (an )n≥0 è una successione monotona, il primo passo
della dimostrazione prova che esistono sempre
lim s2n e lim s2n+1 ,
n→+∞ n→+∞
il secondo passo prova che tali limitiP
sono uguali (quindi, necessariamente finiti) se e solo
se limn→+∞ an = 0. Per cui la serie ∞ n
n=0 (−1) an , con (an )n≥0 monotona, o converge (se
limn→+∞ an = 0) o è indeterminata (se limn→+∞ an 6= 0).
119

Parte 4. Curve e superfici regolari

11. Curve ed integrali di linea

Ricordiamo che una curva è una funzione γ : I ⊂ R → Rn . Nel caso di curve piane (n = 2)
o nello spazio (n = 3) useremo spesso la notazione
γ(t) = x(t) i + y(t) j γ(t) = x(t) i + y(t) j + z(t) k.
. Attenzione a non confondere γ con la sua traccia (o traiettoria)
γ(I) = {γ(t) ∈ Rn | t ∈ I},
che è un sottoinsieme di Rn . La funzione γ rappresenta la parametrizzazione dell’insieme
γ(I) e contiene le informazioni di tipo analitico.

Data una curva continua γ : [a, b] → Rn

a) i punti γ(a) e γ(b) si chiamano primo e secondo estremo della curva, rispettivamente;
b) se γ(a) = γ(b), si dice che γ è una curva chiusa;
c) si dice che γ è una curva semplice se, dati a ≤ t1 < t2 ≤ b tali che γ(t1 ) = γ(t2 ), allora
t1 = a e t2 = b.
d) la curva γ− : [a, b] → Rn
γ− (t) = γ(b + a − t) (125)
è detta curva con orientamento opposto a γ;
e) se η : [b, c] → Rn è un’altra curva tale che γ(b) = η(b), cioé il secondo estremo della
prima curva coincide con il primo estremo della seconda, si denota con γ + η la curva
γ : [a, c] → Rn 
γ(t) t ∈ [a, b]
(γ + η)(t) = ,
η(t) t ∈ (b, c]
la curva γ + η è detta la somma di γ ed η.
Def. 4.1 (Curva regolare). Una curva γ : I → Rn , I ⊂ R, intervallo si dice regolare se γ
è di classe C 1 (I) ed il vettore tangente soddisfa la condizione
γ 0 (t) 6= 0 ∀t ∈ I. (126)
. Se I = [a, b], nella definizione si assume sempre che esistano (finiti) i limiti
γ(t) − γ(a) γ(t) − γ(b)
γ 0 (a) = lim γ 0 (b) = lim .
t→a+ t−a t→b− t−b

La condizione (126) equivale al fatto che la velocità scalare v(t) = kγ 0 (t)k sia sempre
positiva e garantisce l’esistenza della retta tangente alla traccia in tutti i punti γ(t0 ) al
variare di t0 ∈ [a, b].
Dato t0 ∈ I, l’equazione parametrica della retta tangente alla curva nel punto P0 = γ(t0 )
è
P = γ(t0 ) + h γ 0 (t0 ) h ∈ R.
Nota. Nel caso di curve piane regolari, γ(t) = x(t) i + y(t), il vettore tangente è
γ 0 (t) = x0 (t) i + y 0 (t) j
e la (126) diventa
p
v(t) = x0 (t)2 + y 0 (t)2 > 0,
l’equazione parametrica della retta tangente alla curva nel punto γ(t0 ) = (x(t0 ), y(t0 )) è
data da (
x = x(t0 ) + hx0 (to )
h ∈ R,
y = y(t0 ) + hy 0 (to )
120

mentre la corrispondente equazione cartesiana è


y 0 (t0 )(x − x(t0 )) − x0 (t0 )(y − y(t0 )) = 0.

Spesso è utile, indebolire la defizione di regolarità.


Def. 4.2. Una curva γ : [a, b] → Rn si dice regolare a tratti se è somma di un numero
finito di curve regolari, cioè γ = γ1 + . . . + γn dove
γi : [ai , ai+1 ] → Rn

curve regolari tali che γi (ai+1 ) = γi+1 (ai+1 )
.
a = a1 < a2 < . . . < an < an+1 = b
. Una curva γ è regolare a tratti se γ è continua sull’intervallo [a, b] ed esiste una
partizione finita dell’intervallo [a, b]
a = a1 < a2 < . . . < an < an+1 = b
tale che la restrizione di γ a ciascun intervallo [ai , ai+1 ] sia una curva regolare. In partico-
lare, per ogni 1 < i < n + 1 esistono sempre le derivate destre e sinistre di γ in t = ai , ma
possono essere diverse tra di loro.

Una classe importante di curve bidimensionali è descritta dal seguente esempio.


Esempio 4.3 (Grafico di una funzione). Data una funzione di classe C 1 , ϕ : I ⊂ R → R
definita su un intervallo I, allora la curva

x=t
γ: t∈I
y = ϕ(t)
è una curva regolare la cui traccia è il grafico di ϕ, (x, y) ∈ R2 | x ∈ I, y = ϕ(x) , e


γ 0 (t) = (1, ϕ0 (t))


p
v(t) = 1 + ϕ0 (t)2 .
L’equazione della retta tangete in γ(t0 ) = (t0 , ϕ(t0 )) = (x0 , ϕ(x0 )) risulta
ϕ0 (x0 )(x − x0 ) − (y − ϕ(x0 )) = 0,
in accordo con il significato geometrico di derivata.
Esempio 4.4 (Curve in coordinate polari). L’equazione parametrica di una curva piana
può essere assegnata in coordinate polari
(
r = r(t)
t∈I
θ = θ(t)
dove r(t), θ(t) sono due funzioni di classe C 1 . Questo definisce una curva
(
x = r(t) cos θ(t)
γ: t∈I
y = r(t) sin θ(t)
con vettore tangente
γ 0 (t) = (r0 (t) cos θ(t) − r(t)θ0 (t) sin θ(t)) i + (r0 (t) sin θ(t) + r(t)θ0 (t) cos θ(t)) j
e velocità p
v(t) = r0 (t)2 + r(t)2 θ0 (t)2 .

Data una curva regolare γ si definiscono

a) il versore tangente
γ 0 (t)
τ (t) = ,
kγ 0 (t)k
b) se τ (t) è derivabile e τ 0 (t) 6= 0, il versore normale
τ 0 (t)
n(t) = ,
kτ 0 (t)k
121

c) se τ (t) è derivabile, la curvatura


kτ 0 (t)k kτ 0 (t)k
χ(t) = = ;
kγ 0 (t)k v(t)
d) fissato t0 , il piano passante per γ(t0 ) generato dai versori τ (t0 ) e n(t0 )
{γ(t0 ) + hτ (t0 ) + kn(t0 ) | h, k ∈ R}
è detto piano osculatore alla curva. Nel caso di curve nello spazio, il piano osculatore
ha equazione cartesiana
(P − γ(t0 )) · (τ (t0 ) ∧ n(t0 )) = 0.

Il significato geometrico è chiarito dalle seguenti relazioni


γ 0 (t) = v(t)τ (t) (127a)
τ (t) · n(t) = 0 cioè τ (t) ⊥ n(t) (127b)
0
τ (t) = χ(t)v(t)n(t) (127c)
00 0 0 0 2
γ (t) = v (t)τ (t) + v(t)τ (t) = v (t)τ (t) + χ(t)v(t) n(t). (127d)
La prima e la terza relazione sono ovvie, la seconda segue derivando τ (t) · τ (t) = 0,
la quarta si deduce derivando la prima ed usando la terza e mostra che l’accelerazione
giace sempre nel piano osculatore. Nel caso di curve nel piano, se α(t) indica l’angolo
tra la semiretta delle ascisse positive e la semiretta individuata dal vettore tangente γ 0 (t)
(positivo se misurato in senso antiorario), allora
τ (t) = (cos α(t), sin α(t))
α0 (t)
n(t) = (− sin α(t), cos α(t))
|α0 (t)|
τ 0 (t) = |α0 (t)|n(t)
(il versore (− sin α(t), cos α(t)) è ottenuto ruotando τ (t) di π/2 in senso antiorario).
Def. 4.5 (Cambio regolare di parametrizzazione). Dati due intervalli Iˆ e I di R, un cambio
regolare di parametrizzazione tra Iˆ e I è una funzione t = t(t̂), definita per ogni t̂ ∈ I,
ˆ di
1
classe C tale che
ˆ =I
{t(t̂) | t̂ ∈ I} (128)
t0 (t̂) 6= 0 t̂ ∈ Iˆ (129)

Poiché la funzione t(t̂) è continua e Iˆ è un intervallo, la sua immagine è necessariamente un


intervallo che, per la (128), è proprio I. Poiché anche la derivata è continua e, per la (129),
ˆ allora t0 (t̂) ha segno costante (positivo/negativo) su I.
non si annulla su I, ˆ

Nota. Data γ : I → Rn curva regolare e t = t(t̂) cambio regolare di parametrizzazione tra


Iˆ e I, dalla regola di derivazione in catena segue immediatamente che la curva γ̂ : Iˆ → Rn
definita da
γ̂(t̂) = γ(t(t̂)) t̂ ∈ Iˆ (130)
è una curva regolare e valgono le seguenti relazioni:
γ̂ 0 (t̂) = t0 (t̂)γ 0 (t(t̂)) (131a)
0
v̂(t̂) = |t (t̂)|v(t(t̂)) (131b)
(
+τ (t(t̂)) se t0 (t̂) > 0
τ̂ (t̂) = (131c)
−τ (t(t̂)) se t0 (t̂) < 0
n̂(t̂) = n(t(t̂)) (131d)
χ̂(t̂) = χ(t(t̂)). (131e)
122

Def. 4.6 (Curve equivalenti). Due curve regolari γ : I → Rn e γ̂ : Iˆ → Rn , sono dette


equivalenti se vale la (130) dove t = t(t̂) è un cambio regolare di parametrizzazione tra gli
intervalli Iˆ e I su cui sono definite le due curve. Inoltre

a) se t(t̂) > 0 si dice che γ e γ̂ hanno lo stesso orientamento;


b) se t(t̂) < 0 si dice che γ e γ̂ hanno hanno orientamento opposto.

Due curve equivalenti hanno la stessa traccia per la (129) e, quindi, parametrizzano lo
stesso insieme di Rn , hanno lo stesso versore normale e la stessa curvatura, per la (131d)
e (131e), rispettivamente. Tuttavia, sono percorse con velocità differenti, vedi (131b).
I vettori tangenti sono proporzionali per la (131a). Il versore tangente è lo stesso se
hanno lo stesso orientamento (in tal caso il verso di percorrenza è lo stesso), altrimenti
ha verso opposto. Evidentemente, la curva γ− data dalla (125) è equivalente a γ, ma
ha orientamento opposto. La definizione di curve equivalente (e quella di curve con lo
stesso orientamento) stabilisce una relazione di equivalenza nella famiglia di tutte le curve
regolari.
La lunghezza di una curva può essere data in due modi. Il primo è comodo dal punto di
vista operativo.

Def. 4.7 (Lunghezza di una curva). Data una curva regolare γ : [a, b] → Rn

a) si chiama lunghezza della curva il valore positivo


Z b Z b
`γ = kγ 0 (t)k dt = v(t) dt,
a a

b) si chiama ascissa curvilinea la funzione s : [a, b] → R


Z t Z t
s(t) = kγ 0 (τ )k dτ = v(τ ) dτ.
a a

Poiché γ è di classe C 1 , v(t) è una funzione continua, quindi è integrabile in [a, b]. Valgono
le seguenti proprietà.

i) La lunghezza di due curve equivalenti è la stessa. Infatti, se γ̂ è una curva equivalente


a γ (con lo stesso orientamento), dalla (131c)
Z b̂ Z b̂
`γ̂ = v̂(t̂)dt̂ = |t0 (t̂)|v(t(t̂))dt̂
â â
Z b̂ Z b
= t0 (t̂) v(t(t̂))dt̂ = v(t)dt = `γ ,
â a

dove è stato fatto il cambio di variabili t = t(t̂) ed il fatto che a = t(â) e b = t(b̂). Se
γ̂ ha orientamento opposto a γ, si applica un ragionamento simile.
ii) Poiché v(t) è una funzione continua, per il teorema fondamentale del calcolo integrale,
la funzione s = s(t) è di classe C 1 ([a, b]) e s0 (t) = v(t) > 0. Ne segue che, s(t) è
strettamente crescente e
s([a, b]) = [s(a), s(b)] = [0, `γ ]
iii) Essendo s(t) invertibile, se denotiamo con t = t(s) l’inversa dell’ascissa curvilinea, la
curva γst : [0, `γ ] → Rn
γst (s) = γ(t(s))
si chiama rappresentazione standard della curva γ ed è una curva equivalente a γ con lo
stesso orientamento, quindi γ ed γst hanno la stessa traccia, gli stessi versori tangente
123

e normale, e la stessa curvatura. Poiché t0 (s) = 1/v(t(s)), dalle (127a) e (127d) segue
che per ogni s ∈ [0, `γ ]
0 00
γst (s) = τ (t(s)) vst (s) = 1 γst (s) = χ(t(s))n(t(s)).

iv) Se γ̂ è una curva equivalente a γ, la corrispondente rappresentazione standard coincide


con γst o γst − in accordo con il fatto che γ̂ abbia o meno lo stesso orientamento di
γ. Infatti, per la proprietà transitiva delle relazioni di equivalenza, γst e γ̂s sono
equivalenti tra di loro, per cui esiste un cambio di parametro s = s(ŝ) tra le due
ascisse curvilinee tale che s(0) = 0, s(`γ ) = `γ e
γ̂st (ŝ) = γst (s(ŝ)).
Poiché vst = v̂st = 1, la (131c) implica che |s0 (ŝ)| = 1. Se γ e γ̂ hanno lo stesso
orientamento, anche le due rappresentazioni standard hanno lo stesso orientamento,
da cui segue che s0 (ŝ) = 1, cioè s(ŝ) = ŝ e quindi γst = γ̂st . Se hanno orientamento
opposto, allora s(ŝ) = `γ − ŝ, cioè γst − = γ̂st .

Il seguente teorema mostra che la definizione di lunghezza ha un significato geometrico.

Teo 4.8. Data una curva regolare γ : [a, b] → Rn , allora


n
!
X
`γ = sup kγ(ti ) − γ(ti−1 )k ,
∆a,b i=1
dove l’estremo superiore è fatto su tutte le partizioni ∆a,b = {t0 = a < t1 < . . . < tn = b}
dell’intervallo [a, b].

Dimostrazione. La dimostrazione è suddivisa in cinque passi. Per chiarezza supponiamo


che n = 2.
Passo 1. Poiché la funzione γ 0 è una funzione continua è possibile integrarla componente
per componente
Z b Z b  Z b 
0 0 0
γ (t) dt = x (t) dt i + y (t) dt j ∈ R2
a a a

e per il teorema fondamentale del calcolo integrale


Z b
γ 0 (t) dt = γ(b) − γ(a). (132)
a

Passo 2. Vale la disuguaglianza


Z b Z b
0
k γ (t) dtk ≤ kγ 0 (t)k dt. (133)
a a
Rb
Infatti, posto v = a γ 0 (t) dt ∈ Rn , se v = 0 la disuguaglianza è evidente. Se v 6= 0, per la
linearità dell’integrale e la disuguaglianza di Cauchy-Schwarz
Z b Z b Z b
kvk2 = v12 + v22 = v1 x0 (t) dt + v2 y 0 (t) dt = v · γ 0 (t) dt
a a a
Z b Z b
≤ kvk kγ 0 (t)k dt = kvk kγ 0 (t)k dt,
a a

da cui dividendo per kvk =


6 0 si ottiene la (133).
124

Passo 3. Mostriamo che per ogni partizione ∆a,b = {t0 = a < t1 < . . . < tn = b} vale
Xn Z b
kγ(ti ) − γ(ti−1 )k ≤ kγ 0 (t)k dt.
i=1 a

Infatti, usando la (132) e la (133) su ogni intervallo [ti−1 , ti ] si ha che


Xn n Z ti
X
kγ(ti ) − γ(ti−1 )k = k γ 0 (t) dtk
i=1 i=1 ti−1
n
X tiZ Z b
0
≤ kγ (t)k dt = kγ 0 (t)k dt,
i=1 ti−1 a

dove si è usata l’additività degli integrali sui domini ed il fatto che ∆a,b è una partizione
di [a, b]. Ne segue che
n
! Z
X b
sup kγ(ti ) − γ(ti−1 )k ≤ kγ 0 (t)k dt. (134)
∆a,b i=1 a

Passo 4. Per ogni t ∈ [a, b] definiamo


n
!
X
S(t) = sup kγ(ti ) − γ(ti−1 )k
∆a,t i=1

dove l’estremo superiore è fatto su tutte le partizioni ∆a,t = {t0 = a < t1 < . . . < tn = t}
dell’intervallo [a, t]. Mostriamo che S(t) è derivabile su [a, b] ed S 0 (t) = kγ 0 (t)k. Per
la (134),
Z t
S(t) ≤ kγ 0 (τ )kdτ < +∞.
a
Fissato t ∈ [a, b) ed h > 0 tale che t + h ≤ b, si dimostra che
n
!
X
S(t + h) − S(t) = sup kγ(ti ) − γ(ti−1 )k ,
∆t,t+h i=1

dove l’estremo superiore è fatto su tutte le partizioni ∆t,t+h = {t0 = t < t1 < . . . < tn =
t + h} dell’intervallo [t, t + h]. Scegliendo la partizione banale ∆t,t+h = {t, t + h}, allora
kγ(t + h) − γ(t)k ≤ S(t + h) − S(t),
dall’altra parte per la (134)
Z t+h
S(t + h) − S(t) ≤ kγ 0 (τ )kdτ.
t
Dividendo per h > 0
t+h
γ(t + h) − γ(t) S(t + h) − S(t)
Z
1
k k≤ ≤ kγ 0 (τ )kdτ
h h h t
e passando al limite per h che tende a zero, poiché
γ(t + h) − γ(t)
lim k k = kγ 0 (t)k
h→0 h
1 t+h 0
Z
lim kγ (τ )kdτ = kγ 0 (t)k
h→0 h t

per il teorema del confronto si ottiene che


S(t + h) − S(t)
lim = kγ 0 (t)k.
h→0 h
125

Quindi S 0 (t) = kγ 0 (t)k.


Passo 5. Per quanto visto al passo precedente e per il teorema fondamentale del calcolo
integrale
Z b
S(b) − S(a) = kγ 0 (t)k dt = `γ .
a
Poiché S(a) = 0, la definizione di S(b) implica che
n
!
X
sup kγ(ti ) − γ(ti−1 )k = S(b) = `γ .
∆a,b i=1

Esempio 4.9 (Moto rettilineo). Siano (x0 , y0 ) ∈ R2 , θ ∈ [−π, π] e γ la curva

x = x0 + r(t) cos θ
γ(t) = t ∈ [0, 1]
y = y0 + r(t) sin θ

r(0) = 0
1
dove r : [0, 1] → R r ∈ C ([0, 1]) r0 (t) > 0 t ∈ [0, 1].
r(1) = `
Poiché γ 0 (t) = r0 (t)(cos θ, sin θ), γ è una curva regolare la cui traccia è il segmento di
estremi P1 = (x0 , y0 ) e P1 = (x0 + ` cos θ, y0 + ` sin θ), che giace sulla retta passante per
(x0 , y0 ) ed ha direzione il versore (cos θ, sin θ). Inoltre si ha che
v(t) = r0 (t) τ (t) = (cos θ, sin θ) τ 0 (t) = 0 χ(t) = 0.
Rt 0
L’ascissa curvilinea è data da s(t) = 0 r (τ )dτ = r(t) e la lunghezze della curva è s(1) =
r(1) = `. La rappresentazione standard della curva γ risulta

x(s) = x0 + s cos θ
γst (s) = γ(t(s)) = s ∈ [0, `],
y(s) = y0 + s sin θ
che è l’equazione parametrica del segmento di estremi P0 e P1 .
Esempio 4.10 (Moto circolare). Sia r > 0 e γ la curva

x = r cos θ(t)
γ(t) = t ∈ [0, 1]
y = r sin θ(t)

θ(0) = θ0
dove θ : [0, 1] → R 1
θ ∈ C ([0, 1]) θ0 (t) > 0 t ∈ [0, 1].
θ(1) = θ1
Poiché γ 0 (t) = rθ0 (t)(− sin θ(t), cos θ(t)), γ è una curva regolare la cui traccia è l’arco
di circonferenza di raggio r, centro l’origine e di estremi P0 = (r cos θ0 , r sin θ0 ) e P1 =
(r cos θ1 , r sin θ1 ). Inoltre si ha che
1
v(t) = rθ0 (t) τ (t) = (− sin θ(t), cos θ(t)) n(t) = −(cos θ(t), sin θ(t)) χ(t) = .
r
Rt 0
L’ascissa curvilinea è data da s(t) = 0 rθ (τ )dτ = r(θ(t) − θ0 ) e la lunghezze della curva
è s(1) = r(θ1 − θ0 ). La rappresentazione standard della curva γ risulta
 x(s) = r cos(θ0 + s )

γst (s) = γ(t(s)) = r s ∈ [0, r(θ1 − θ0 )],


 y(s) = r sin(θ0 + s )
r
che è l’equazione parametrica dell’arco di circonferenza di estremi P0 e P1 .
Def. 4.11 (Integrale di linea). Sia γ : [a, b] → Rn una curva regolare.

a) Data una funzione scalare f : A ⊂ Rn → R tale che γ([a, b]) ⊂ A, si chiama integrale
di linea di f lungo γ
Z Z b
f (P )d`(P ) = f (γ(t))kγ 0 (t)k dt,
γ a
purché la funzione t 7→ f (γ(t))kγ 0 (t)k sia integrabile su [a, b].
126

b) Dato un campo F : A ⊂ Rn → Rn tale che γ([a, b]) ⊂ A, si chiama integrale di linea di


F lungo γ
Z Z b
F (P ) · dγ(P ) = F (γ(t)) · γ 0 (t) dt
γ a
Z
= F (P ) · τ (P ) d`(P ),
γ

purché la funzione t 7→ F (γ(t)) · γ 0 (t)


sia integrabile su [a, b] e, nell’ultima equazione,
τ (P ) denota il versore tangente a γ nel punto P = γ(t).
Nota. Nel caso n = 3 l’integrale di linea è esplicitamente dato da
Z Z b p 
f (P )d`(P ) = f (x(t), y(t), z(t)) x0 (t)2 + y 0 (t)2 + z 0 (t)2 dt
γ a
Z Z b
u(x(t), y(t), z(t)) x0 (t) + v(x(t), y(t), z(t)) y 0 (t) + w(x(t), y(t), z(t)) z 0 (t) dt

F (P ) · dγ(P ) =
γ a

dove γ(t) = x(t) i + y(t) j + z(t) k ed F (x, y, z) = u(x, y, z) i + v(x, y, z) j + w(x, y, z) k.

Entrambe le definizioni si estendono in modo naturale al caso in cui la curva γ sia regolare
a tratti. Valgono le seguenti proprietà, di dimostrazione immediata.

i) Se la funzione f o il campo F sono continui la condizione di integrabilità è sempre


soddisfatta.
ii) L’integrale di linea soddisfa le usuali proprietà dell’integrale, quali linearità, monoto-
nia, additività rispetto alla somma di curve.
iii) Date due curve equivalente γ e γ̂, se f è una funzione scalare allora
Z Z
f (P )d`(P ) = f (P )d`(P ).
γ γ̂
Se F è un campo vettoriale allora
(R R
γ̂ F (P ) · dγ̂(P ) = + γ F (P ) · dγ(P ) se hanno lo stesso orientamento
R R
γ̂ F (P ) · dγ̂(P ) = − γ F (P ) · dγ(P ) se hanno orientamento opposto.
In particolare
Z Z Z Z
f (P )d`(P ) = f (P )d`(P ) e F (P ) · dγ− (P ) = − F (P ) · dγ(P )
γ− γ γ− γ

iv) Se γst : [0, `] → Rn è la rappresentazione standard di γ e τ (s) è il versore tangente,


Z Z `
f (P )d`(P ) = f (γst (s))ds
γ 0
Z Z `
F (P ) · dγ(P ) = F (γst (s)) · τ (s) ds.
γ 0

12. Superfici ed integrali di superficie

Una superficie in R3 può essere descritta in due modi.


Def. 4.12 (Superficie regolare). Un insieme S ⊂ R3 è detto una superficie regolare se
esiste una funzione g : A ⊂ R3 → R, dove A è aperto e g è di classe C 1 tale che
S = {x ∈ A | g(x, y, z) = 0}
∇g(x, y, z) 6= 0 ∀(x, y, z) ∈ S.
L’equazione g(x, y, z) = 0 è detta equazione cartesiana della superficie.
127

Def. 4.13 (Rappresentazione parametrica ). Data una superficie regolare S di equazione


cartesiana g(x, y, z) = 0, una rappresentazione parametrica di S è una funzione

x = x(t, s)

2 3
σ:V ⊂R →R σ : y = y(t, s) ⇐⇒ σ(x, t) = x(t, s) i + y(t, s) j+ z(t, s) k

z = z(t, s)

dove V è un aperto, σ è di classe C 1 e soddisfa

i) la funzione σ è iniettiva su V ;
ii) il vettore
i j k
 
∂σ ∂σ ∂y
N (t, s) = (t, s) ∧ (t, s) = det  ∂x ∂z 
(135)

∂t ∂s ∂t ∂t ∂t 
∂x ∂y ∂z
∂s ∂s ∂s
è diverso da zero per ogni (t, s) ∈ V .
iii) S = σ(V ) = {(x(t, s), y(t, s), z(t, s)) ∈ R3 | (t, s) ∈ V }.

Il vettore N (t, s) è detto vettore normale alla superficie nel punto σ(t, s) = (x(t, s), y(t, s), z(t, s)).

La condizione iii) equivale a richiedere che


g(x(t, s), y(t, s), z(t, s)) = 0 (t, s) ∈ V
e che, per ogni P ∈ S, esista una coppia di parametri (t, s) ∈ V tale che
P = (x(t, s), y(t, s), z(t, s)).
Per la condizione i) tale coppia di parametri è unica. La ii) è equivalente alle seguenti
condizioni

ii.a) i vettori ∂σ ∂σ
∂t e ∂s non sono paralleli tra di loro (in particolare sono entrambi diversi
da zero);
ii.b) la matrice jacobiana, di taglia 3 × 2,
 ∂x ∂x 
∂t ∂s
Jσ(t, s) =  ∂y ∂y 

∂t ∂s 
∂z ∂z
∂t ∂s
ha rango 2;
ii.c) almeno uno dei tre minori di ordine 2 di Jσ è diverso da zero. Infatti
N (t, s) = M1 i + M2 j + M3 k
dove
" ∂y ∂y
# " # " ∂x ∂x
#
∂z ∂z
∂t ∂s ∂t ∂s ∂t ∂s
M1 = det ∂z ∂z
M2 = det ∂x ∂x
M3 = det ∂y ∂y
∂t ∂s ∂t ∂s ∂t ∂s

Fissato un√punto P0 = (x(t0 , s0 ), y(t0 , s0 ), z(t0 , s0 )) ∈ S con (s0 , t0 ) ∈ V e δ tale che


B((t0 , s0 ), 2δ) ⊂ V , allora
 
x = x(t, s0 )
 x = x(t0 , s)

γ1 : y = y(t, s0 ) t ∈ (t0 − δ, t + δ) γ2 : y = y(t0 , s) s ∈ (s0 − δ, s + δ)
 
z = z(t, s0 ) z = z(t0 , s)
 

sono due curve regolare di R3 passanti per P0 , giacenti sulla superficie S ed i cui vettori
tangente in P0 sono dati rispettivamente da
∂σ ∂σ
γ10 (t0 ) = (t0 , s0 ) e γ20 (s0 ) = (t0 , s0 ).
∂t ∂s
128

Per la condizione ii), i due vettori tangenti non sono paralleli tra di loro e, quindi, generato
un piano passante per P0 di equazione parametrica
∂σ ∂σ
P = P0 + (t0 , s0 )(t − t0 ) + (t0 , s0 )(s − s0 )
∂t ∂s
e di equazione cartesiana
N (t0 , s0 ) · (P − P0 ) = 0.
Il piano così definito ha il significato geometrico di piano tangente alla superficie S nel
punto P0 . Dalla condizione iii) segue inoltre che ∇g(P0 ) è ortogonale ad entrambi i vettori
tangenti e, quindi, è parallelo a N (t0 , s0 ) e l’equazione del piano tangente è anche data da
∇g(P0 ) · (P − P0 ) = 0.
Esempio 4.14. Il piano passante per il punto P0 = (x0 , y0 , z0 ) e con vettori direzionali
v = (v1 , v2 , v3 ) e w = (w1 , w2 , w3 ), non paralleli tra di loro, di equazione cartesiana
a(x − x0 ) + b(y − y0 ) + c(z − z0 ) = 0
dove n = (a, b, c) 6= 0 è il vettore
n = v ∧ w.
è una superficie regolare con rappresentazione parametrica

x = x0 + tv1 + sw1

σ : y = y0 + tv2 + sw2 t, s ∈ R2 ,

z = z0 + tv3 + sw3

e vettore normale
N (t, s) = v ∧ w = n,
costante per tutti i punti del piano.

Data una superficie S in forma cartesiana, non è sempre possibile trovare una rappresen-
tazione parametrica come mostra il seguente esempio della sfera. Tuttavia, in molti casi è
possibile definire una parametrizzazione σ : W ⊂ R2 → R3 di classe C 1 per cui

a) esiste un aperto V ⊂ W per cui σ ristretta a V soddisfa le prime due condizioni della
definizione 4.13;
b) esiste un insieme trascurabile E ⊂ W per cui σ ristretta a V ∪ E soddisfa la terza
proprietà, cioè σ(V ∪ E) = S.

In altre parole la rappresentazione σ parametrizza in modo regolare tutta la superficie,


tranne una porzione S \ σ(V ) = σ(E) “trascurabile”, essendo E di misura nulla.
Esempio 4.15 (sfera). La sfera di centro P0 = (x0 , y0 , z0 ) e raggio R > 0, di equazione
cartesiana
(x − x0 )2 + (y − y0 )2 + (z − z0 )2 = R2
è una superficie regolare, con rappresentazione parametrica

x = x0 + R sin θ cos ϕ

σ(θ, ϕ) = y = y0 + R sin θ sin ϕ θ ∈ [0, π] ϕ ∈ [−π, π]

z = z0 + R cos θ

Infatti σ è di classe C 1 su W = R2 , è iniettiva su V = (0, π) × (−π, π) e


 
i j k
N (θ, ϕ) = det  R cos θ cos ϕ R cos θ sin ϕ −R sin θ
−R sin θ sin ϕ R sin θ cos ϕ 0
= R2 sin θ (sin θ cos ϕ, sin θ sin ϕ, cos θ)
129

che è diverso da zero su V poiché kN (θ, ϕ)k = R2 sin θ. Infine E = ∂V è trascurabile


poiché unione di 4 segmenti e σ(V ) è tutta la superficie sferica. Da notare che il vettore
N (t, s) ha la stessa direzione del vettore radiale
σ(θ, ϕ) − P0 = (R sin θ cos ϕ, R sin θ sin ϕ, R cos θ)
ed è diretto verso l’esterno della sfera poiché R sin θ > 0.
Esempio 4.16 (toro). Il toro con asse di rotazione l’asse delle z, raggio r > 0 e distanza
dall’asse R > r di equazione cartesiana
p
( x2 + y 2 − R)2 + z 2 = r2 ,
è una superficie regolare con equazione parametrica

x = (R + r cos θ) cos ϕ

σ(ϕ, θ) = y = (R + r cos θ) sin ϕ θ ∈ [−π, π], ϕ ∈ [−π, π]

z = r sin θ

è una superficie regolare. Infatti, σ è di classe C 1 su W = R2 , σ è iniettiva sull’aperto


V = (−π, π) × (−π, π) e
 
i j k
N (ϕ, θ) = det  −r sin θ cos ϕ r sin θ sin ϕ r cos θ
−(R + r cos θ) sin ϕ (R + r cos θ) cos ϕ 0
= r(R + r cos θ) (cos ϕ cos θ, sin ϕ cos θ, sin θ)
che è diverso da zero su V poiché kN (θ, ϕ)k = r(R + r cos θ). Infine ∂V è trascurabile
poiché unione di 4 segmenti e σ(V ) è tutto il toro.
Esempio 4.17 (cono). Il cono, con asse di rotazione l’asse delle z e con retta generatrice
la bisettrice z = x, y = 0, di equazione cartesiana
x2 + y 2 − z 2 = 0 (x, y, z) 6= 0
è una superficie regolare con equazione parametrica

x = t cos ϕ

σ(ϕ, t) = y = t sin ϕ t ∈ R \ {0}, ϕ ∈ [−π, π]

z=t

Infatti, σ è di classe C 1 su W = R2 , σ è iniettiva sull’aperto V = R \ {0} × (−π, π) e


 
i j k
N (ϕ, t) = det −t sin ϕ t cos ϕ 0 
cos ϕ sin ϕ 1
= t (cos ϕ, sin ϕ, −1)

che è diverso da zero su V poiché kN (t, ϕ)k = |t| 2. Infine E = R \ {0} × {±π} è
trascurabile poiché unione di 2 rette (meno l’origine).
Da notare che il cono x2 + y 2 − z 2 = 0 con il vertice (0, 0, 0) non è una superficie regolare.

Il seguente esempio mostra che il grafico di una funzione di due variabili è una superficie
regolare se la funzione è di classe C 1 .
Esempio 4.18. Sia f : V ⊂ R2 → R, z = f (x, y), una funzione di classe C 1 definita su
un aperto V il grafico
z − f (x, y) = 0
è una superficie regolare, con rappresentazione parametrica

x = t

σ(t, s) = y = s (t, s) ∈ V

z = f (t, s)

130

Infatti, σ è iniettiva, di classe C 1 e


i j k
 
∂f
N (t, s) = det 1 0 ∂x (t, s)
0 1 ∂f ∂y (t, s)
 
∂f ∂f
= − (t, s), − (t, s), 1
∂x ∂y
che è diverso da zero su V e
s
∂f ∂f
kN (t, s)k = 1 + (t, s)2 + (t, s)2 .
∂x ∂y
. Data g : A ⊂ R3 → R di classe C 1 con ∇g(P ) 6= 0 per ogni P ∈ A tale che g(P ) = 0,
il teorema della funzioni implicita implica che, per ogni punto (x0 , y0 , z0 ) ∈ g −1 (0) esiste
un’intorno aperto Ω per cui ’insieme g −1 (0)∩Ω, a meno di una permutazione delle variabili
x, y, z, è il grafico di una funzione z = f (x, y) e quindi ammette una rappresentazione
parametrica locale. Tuttavia in generale non è possibile trovare una rappresentazione
parametrica globale.
. Data una funzione di classe C 1 σ : Ω ⊂ R2 → R3

x = x(t, s)

σ : y = y(t, s)

z = z(t, s)

iniettiva e il vettore ∂σ ∂σ
∂t ∧ ∂s è diverso da zero, l’immagine σ(Ω) non è una superficie nel senso
della definizione 4.12, poiché non è possibile trovare una funzione g per cui σ(Ω) = g −1 (0),
come ad esempio il nastro di Möebius

t ϕ
x = 1 + 2 cos 2  cos(ϕ)

σ(t, ϕ) = y = 1 + 2t cos ϕ2 sin(ϕ) − 1 ≤ t ≤ 1 ϕ ∈ [−π, π].
 t ϕ
z = 2 sin 2

Una superficie ha molte rappresentazioni parametriche equivalenti.


Lemma 4.19. Data una rappresentazione parametrica σ : V ⊂ R2 → R3 di una superficie
regolare S ed una trasformazione regolare di coordinate Φ : V̂ ⊂ R2 → R2
(
t = t(t̂, ŝ)
Φ:
s = s(t̂, ŝ)
tra gli aperti V̂ e V , allora

i) la funzione σ̂ : V̂ → R3
σ̂(t̂, ŝ) = σ(Φ(t̂, ŝ)). (136)
è una rappresentazione parametrica di S;
ii) il corrispondente vettore normale è

N̂ (t̂, ŝ) = det JΦ(t̂, ŝ) N (Φ(t̂, ŝ)). (137)
Inoltre, tutte le rappresentazioni parametriche di S sono della forma (136) per qualche
trasformazione regolare di coordinate Φ.

Dimostrazione. Poiché Φ è iniettiva e di classe C 1 , σ̂ soddisfa le stesse proprietà. Inoltre,


per la regola di derivazione in catena
∂ σ̂ ∂σ ∂t ∂σ ∂s
= +
∂ t̂ ∂t ∂ t̂ ∂s ∂ t̂
∂ σ̂ ∂σ ∂t ∂σ ∂s
= +
∂ŝ ∂t ∂ŝ ∂s ∂ŝ
131

da cui
   
∂σ ∂t ∂σ ∂s ∂σ ∂t ∂σ ∂s
N̂ = + ∧ +
∂t ∂ t̂ ∂s ∂ t̂ ∂t ∂ŝ ∂s ∂ŝ
 
∂t ∂s ∂t ∂s ∂σ ∂σ
= − ∧
∂ t̂ ∂ŝ ∂ŝ ∂ t̂ ∂t ∂s
= det (JΦ) N.
Per ipotesi det (JΦ) 6= 0 su V̂ , ne segue che anche N̂ 6= 0, per cui σ̂ è una rappresentazione
parametrica di S.
Supponiamo ora che σ̂ è una rappresentazione parametrica di S. Essendo σ iniettiva ed
immagine σ(V ) = S, allora esiste l’inversa σ −1 : S → R2 con immagine V . Definiamo,
Φ(t̂, ŝ) = σ −1 (σ̂(t̂, ŝ)),
che è iniettiva, Φ(V̂ ) = V , soddisfa la (136) e, quindi, la (137) (con la stessa dimostrazione
vista prima). La dimostrazione che Φ è di classe C 1 richiede alcune strumenti avanzati e
viene omessa. Poiché sia σ sia σ̂ sono rappresentazioni parametriche, dalla (137) segue che
JΦ 6= 0, cioè Φ è una trasformazione regolare di coordinate. 
. L’equazione (137) mostra che il vettore normale dipendente esplicitamente dalla pa-
rametrizzazione σ, ma i diversi vettori normali hanno tutti la stessa direzione, per cui il
piano tangente alla superficie è univocamente definito. Il verso del vettore normale cambia
in accordo con il segno di JΦ. Se V è connesso per archi, il segno di JΦ è constante. In
tal caso, due rappresentazioni hanno lo “stesso orientamento” se JΦ > 0, altrimenti si dice
che hanno “orientamento opposto”.
Def. 4.20 (Area di una superficie). Data una superficie regolare S con rappresentazione
parametrica σ : V → R3 , si definisce area di S
Z
AS = kN (t, s)k dtds, (138)
V
purché la funzione (t, s) 7→ kN (t, s)k sia integrabile su V .

Dall’Eq. (135) segue che


p
kN (t, s)k = M1 (t, s)2 + M2 (t, s)2 + M3 (t, s)2
dove M1 , M2 ed M3 sono i minori di ordine 2 della matrice jacobiana Jσ(t, s).
Def. 4.21 (Integrale di superficie). Data una funzione misurabile f : A ⊂ R3 → R ed
una superficie regolare S ⊂ A con rappresentazione parametrica σ : V → R3 , si definisce
integrale di superficie
Z Z
f (P )dS(P ) = f (σ(t, s))kN (t, s)k dtds (139)
S V
purché la funzione (t, s) 7→ f (σ(t, s))kN (t, s)k sia integrabile su V .

Osserviamo che

i) l’integrale di superficie non dipende dalla scelta della rappresentazione parametrica.


Infatti, se σ̂(t̂, ŝ) = σ(Φ(t̂, ŝ)) è un’altra rappresentazione con Φ trasformazione re-
golare di coordinate di V̂ e V , allora per il teorema sul cambio di variabili per gli
integrali
Z Z
f (σ(t, s))kN (t, s)k dtds = f (σ(Φ(t̂, ŝ)))kN (Φ(t̂, ŝ))k |JΦ(t̂, ŝ)| dt̂dŝ
V
ZV̂
= f (σ̂(t̂, ŝ))kN̂ (t̂, ŝ)k dt̂dŝ

132

per la (137).

ii) la definizione (139) vale anche nel caso in cui la rappresentazione σ ricopre S a meno
di una porzione σ(E) con E trascurabile.

La definizione di area è motivata dal seguente esempio.


Esempio 4.22. Data la porzione di piano

x = x0 + tv1 + sw1

σ : y = y0 + tv2 + sw2 = P0 + tv + sw t, s ∈ [0, 1],

z = z0 + tv3 + sw3

l’area è data da Z
AS = kN (t, s)k dtds = |v ∧ w|
[0,1]×[0,1]
che è l’area del parallegramma che giace sul piano di vertice P0 e lati v e w.
Esempio 4.23 (Area di un solido di rotazione). Data una curva regolare che giace nel
semipiano xz con le x positive

x = x(t)

γ: y=0 t ∈ [a, b], x(t) ≥ 0

z = z(t)

consideriamo la superficie S ottenuta ruotando la curva intorno all’asse z. La superficie ha


equazione parametrica

x = x(t) cos ϕ

σ : y = x(t) sin ϕ t ∈ [a, b], ϕ ∈ [0, 2π]

z = z(t)

allora l’area di S è data dalla (seconda) formula di Guldino


AS = 2πxbar `. (140)
dove xbar è l’ascissa del baricentro della curva γ ed ` la lunghezza di γ (da confrontare con
l’equazione (98) ).
Per dimostrarla, osserviamo che il vettore normale è dato da
N (t, ϕ) = (x0 (t) cos ϕ, x0 (t) sin ϕ, z 0 (t)) ∧ (−x(t) sin ϕ, x(t) cos ϕ, 0)
= (x(t)z 0 (t) cos ϕ, x(t)z 0 (t) sin ϕ, x0 (t)x(t))
kN (t, ϕ)k2 = x(t)2 (z 0 (t)2 + x0 (t)2 ),
per cui
Z Z b p Z
AS = kN (t, ϕ)k dtdϕ = 2π 0 2 0 2
x(t) (z (t) + x (t) )dt = 2π x d`(x, y),
a γ
[a,b]×[0,2π]

da cui segue la (140) per la definizione di baricentro.


Def. 4.24 (Flusso). Sia F : A ⊂ R3 → R3 un campo (misurabile) e S una superficie
regolare S ⊂ A, si definisce flusso del campo F attraverso la superficie S
Z Z
F (P ) · dσ(P ) = F (σ(t, s)) · N (t, s) dtds, (141)
S V
dove σ : V → R3
è una rappresentazione parametrica di S e (t, s) 7→ (σ(t, s)) · N (t, s) è
una funzione integrabile su V .
133

N (t,s)
Per ogni (t, s) ∈ V , definiamo il versore normale n(t, s) = kN (t,s)k , allora è immediato
verificare che Z Z
F (P ) · dσ(P ) = F (P ) · n(P ) dS(P ),
S S
da cui segue che l’integrale di flusso è indipendente dalla rappresentazione σ a meno di un
segno: se due rappresentazioni hanno la stesso orientamento l’integrale di flusso è uguale,
se hanno orientamento opposto, l’integrale di flusso cambia segno.
Esempio 4.25 (Area di una superficie z = f (x, y)). Data una funzione f : V ⊂ R2 → R
di classe C 1 e V aperto, l’area della superficie S rappresentata dal grafico di f , vedi
Esempio 4.18, è data da
Z s
∂f ∂f
AS = 1+ (x, y)2 + (x, y)2 dxdy
V ∂x ∂y
Dato il campo F : A ⊂ R3 → R3
F (x, y, z) = u(x, y, z) i + v(x, y, z) j + w(x, y, z) k,
R
se S ⊂ A, allora il flusso S F (P ) · dσ(P ) è dato da
Z
∂f ∂f
−u(x, y, f (x, y)) (x, y) − v(x, y, f (x, y)) (x, y) + w(x, y, f (x, y)) dxdy.
V ∂x ∂y

13. Teorema del rotore e della divergenza

Per enunciare i seguenti teoremi in modo matematicamente preciso, sarebbe necessario


introdurre alcuni concetti avanzati che vanno oltre le finalità del corso. Ci limiteremo a
definizioni di tipo qualitativo, basate sull’intuizione geometrica di “bordo”. Iniziamo dal
caso bi-dimensionale.

13.1. Caso bidimensionale. Consideriamo un dominio limitato D ⊂ R2 . Se l’insieme è


sufficientemente regolare, il bordo è la frontiera dell’insieme ed è la traccia di una curva
regolare a tratti chiusa semplice γ. Scegliamo l’orientamento di γ in modo tale che il
dominio si trovi sempre a sinistra della curva. Con questa scelta, fissato un punto P =
γ(t) del bordo e denotato con τ (t) = (cos θ(t), sin θ(t)) il versore tangente e con ne (t) =
(sin θ(t), − cos θ(t)) il versore ortogonale ad τ (t) ottenuto ruotando τ (t) in senso orario,
allora γ(t) +  ne (t) 6∈ D per  positivo sufficientemente piccolo. Il versore ne è detto
versore normale uscente e γ il bordo orientato (positivamente) di D, denotato anche con
+∂D.
. Se τ (t) = (cos θ(t), sin θ(t)) denota il versore tangente, allora il versore normale è dato
da
τ 0 (t) θ0 (t)
n(t) = = (− sin θ(t), cos θ(t))
kτ 0 (t)k |θ0 (t)|
e, quindi,
θ0 (t)
n(t) = − ne (t).
|θ0 (t)|
I due versori hanno la stessa direzione, n(t) punta verso l’interno della curva, mentre ne (t)
punta verso l’esterno del dominio.

Vediamo due esempi.


Esempio 4.26 (Dominio regolare). Un insieme aperto e limitato D ⊂ R2 si dice dominio
regolare se esiste una funzione f : U → R con U ⊂ R2 aperto e f di classe C 1 (U ) tale che
∂D = (x, y) ∈ R2 | f (x, y) = 0


D = (x, y) ∈ R2 | f (x, y) < 0




∇f (x, y) 6= 0 per ogni (x, y) ∈ ∂D.


134

Per il teorema della funzione implicita, esistono γ1 : [a1 , b1 ] → R2 , . . ., γn : [an , bn ] → R2


curve semplici regolari tali che γ è la somma delle curve
γ = γ1 + . . . + γn ,
scegliendo l’orientamento di ciascuna γi in modo tale che il bordo sia orientato positiva-
mente.
Esempio 4.27. Dato un dominio normale rispetto all’asse delle ascisse
D = (x, y) ∈ R2 | x ∈ [a, b], ϕ(x) ≤ y ≤ ψ(x) ,


dove ϕ, ψ : [a, b] → R di classe C 1 , ha come bordo orientato la curva


γ = γ1 + γ2 − γ3 − γ4
dove
 
x=t x=b
γ1 (t) = t ∈ [a, b] γ2 (t) = t ∈ [ϕ(b), ψ(b)]
y = ϕ(t) y=t
 
x=t x=a
γ3 (t) = t ∈ [a, b] γ4 (t) = t ∈ [ϕ(a), ψ(a)],
y = ψ(t) y=t
con vettori tangente
γ10 (t) = i + ϕ0 (t) j γ20 (t) = j
γ30 (t) = i + ψ 0 (t) j γ40 (t) = j.

Dato un campo F : A ⊂ R2 → R2 , F (x, y) = u(x, y) i + v(x, y) j, di classe C 1 sull’aperto


A, definiamo
∂v ∂u
rot F (x, y) = ∇ ∧ F (x, y) = (x, y) − (x, y) rotore (bidimensionale)
∂x ∂y
∂u ∂v
div F (x, y) = ∇ · F (x, y) = (x, y) + (x, y) divergenza (bidimensionale).
∂x ∂y
Il seguente teorema estende al caso di integrali doppi la formula fondamentale del calcolo
integrale per funzioni f ∈ C 1 ([a, b])
Z b
f 0 (x) dx = f (b) − f (a).
a

Teo 4.28 (Teorema di Green). Sia F : A ⊂ R2 → R2 un campo di classe C 1 (A)


F (x, y) = u(x, y) i + v(x, y) j
e D dominio tale che D ⊂ A, allora
Z Z Z
rot F (x, y) dxdy = F (P ) · τ (P ) d`(P ) = F (P ) · dγ(P ) (142)
D γ γ
Z Z
div F (x, y) dxdy = F (P ) · ne (P ) d`(P ), (143)
D γ
dove γ è il bordo orientato positivamente di D.

Dimostrazione. Dimostriamo la (142) nel caso in cui D sia un dominio normale rispetto
all’asse delle ascisse, adottando la notazione dell’Esempio 4.27. Per linearità è sufficiente
mostrare che
Z Z
∂u
(x, y)dxdy = − u(P ) i · dγ(P ) (144)
D ∂y γ
Z Z
∂v
(x, y)dxdy = v(P ) j · dγ(P ). (145)
D ∂x γ
135

Poiché D è un dominio normale rispetto all’asse delle ascisse, dalla (94)


Z Z b Z ψ(x) !
∂u ∂u
(x, y)dxdy = (x, y)dy dx
D ∂y a ϕ(x) ∂y
Z b
= u(x, ψ(x)) − u(x, ϕ(x)) dx,
a

dove l’ultima uguaglianza vale per il teorema fondamentale del calcolo integrale essendo
∂u 1
∂y di classe C . Poiché le curve γ2 e γ4 hanno il vettore tangente parallelo a j, allora
Z Z
u(P ) i · dγ2 (P ) = u(P ) i · dγ4 (P ) = 0,
γ2 γ4

mentre
Z Z b
u(P ) i · dγ(P ) = u(t, ϕ(t)) dt
γ1 a
Z Z b
u(P ) i · dγ(P ) = u(t, ψ(t)) dt,
γ3 a

da cui
Z Z b
− u(P ) i · dγ(P ) = (u(t, ψ(t)) − u(t, ϕ(t))) dt
γ a

e, quindi, la (144) è dimostrata.


Per dimostrare la (145), introduciamo la funzione g : [a, b] → R
Z ψ(x)
g(x) = v(x, y) dy.
ϕ(x)

Essendo le funzioni v, ϕ e ψ di classe C 1 , per il corollario 2.39 e la regola di derivazione in


catena, g è una funzione di classe C 1 e
Z ψ(x)
0 ∂v
g (x) = (x, y) dy + v(x, ψ(x))ψ 0 (x) − v(x, ϕ(x))ϕ0 (x).
ϕ(x) ∂x
Allora, analogamente a sopra,
Z Z b Z ψ(x) !
∂v ∂v
(x, y)dxdy = (x, y )dy dx
D ∂x a ϕ(x) ∂x
Z b
g 0 (x) + v(x, ϕ(x))ϕ0 (x) − v(x, ψ(x))ψ 0 (x) dx

=
a
Z Z
= g(b) − g(a) + v(P ) j · dγ1 (P ) − v(P ) j · dγ3 (P ).
γ1 γ3

La (145) segue immediatamente osservando che


Z ψ(b) Z
g(b) = v(b, y) dy = v(P ) j · dγ4 (P )
ϕ(b) γ4
Z ψ(a) Z
g(a) = v(a, y) dy = v(P ) j · dγ2 (P ).
ϕ(a) γ2

Per mostrare la (143), ricordando che


 
0 1
ne (t) = R τ (t) dove R= ,
−1 0
136

allora, per ogni t ∈ [a, b],


F (γ(t)) · ne (t) kγ 0 (t)k = F (γ(t)) · Rτ (t) kγ 0 (t)k
= Rt F (γ(t)) · τ (t) kγ 0 (t)k
 

= (−v(x, y) i + u(x, y) j) · γ 0 (t).


Applicando la (142) al campo G(x, y) = −v(x, y) i + u(x, y) j
Z Z
F (P ) · ne (P ) d`(P ) = G(P ) · dγ(P )
γ γ
Z Z
= rot G(x, y) dxdy = div F (x, y) dxdy
D D
poiché rot G = div F . 

Osservando che i seguenti campi hanno rotore uguale a 1,


1
F (x, y) = x j F (x, y) = −y i F (x, y) = (−y i + x j) ,
2
il teorema di Green assicura che
Z Z b
AD = x j · dγ(x, y) = x(t)y 0 (t) dt
γ a
Z Z b
=− y i · dγ(x, y) = − y(t)x0 (t) dt
γ a
Z Z b
1 1
x(t)y 0 (t) − y(t)x0 (t) dt

= (−y i + x j) · dγ(x, y) =
2 γ 2 a
dove 
x = x(t)
γ: t ∈ [a, b]
y = y(t)
è il bordo orientato positivamente di D.
n o
2 y2
Esempio 4.29 (Area dell’ellisse). Dati a, b > 0, sia D = (x, y) ∈ R2 | xa2 + b2
≤ 1 , il
cui bordo (orientato positivamente) è

x = a cos t
γ: t ∈ [0, 2π].
y = b sin t
Con la scelta F (x, y) = x j
Z Z Z 2π
m(D) = 1 dxdy = F (P ) · dγ(P ) = a cos t b cos t dt = πab.
D γ 0

Un’interessante applicazione del teorema della divergenza è data dalla seguente proprietà
delle funzioni armoniche.
Def. 4.30 (funzione armonica). Una funzione f : A ⊂ R2 → R definita su un aperto A e
di classe C 2 è detta armonica se
∂2f ∂2f
2
(x, y) + 2 (x, y) = div ∇f (x, y) = 0 (x, y) ∈ A, (146)
∂x ∂y

Cor. 4.31. Sia f una funzione armonica definita su un aperto A ⊂ R2 . Dato un punto
P0 = (x0 , y0 ) ∈ A ed r > 0 tale che B(P0 , r) ⊂ A, allora
Z 2π
1
f (x0 , y0 ) = f (x0 + r cos θ, y0 + r sin θ) dθ. (147)
2π 0
137

La proprietà (147) è detta proprietà del valore medio per funzioni armoniche.

Dimostrazione. Essendo A aperto, l’insieme I = {r ≥ 0 | B(P0 , r) ⊂ A} è un intervallo


con primo estremo 0. Definiamo g : I → R
Z 2π
1
g(r) = f (x0 + r cos θ, y0 + r sin θ) dθ.
2π 0
Poiché f è di classe C 2 e [0, 2π] è compatto, allora per il teorema 2.36, g è una funzione di
classe C 1 la cui derivata è data da, per r > 0,
Z 2π  
0 1 ∂f ∂f
g (r) = (x0 + r cos θ, y0 + r sin θ) cos θ + (x0 + r cos θ, y0 + r sin θ) sin θ dθ
2π 0 ∂x ∂y
Z 2π
1
= ∇f (x0 + r cos θ, y0 + r sin θ) · ne (θ)rdθ
2πr 0
Z
1
= ∇f (P ) · ne (P ) d`(P )
2πr γ
Z
1
= div ∇f (x, y) dxdy,
2πr
B(P0 ,r)

dove γ è la circonferenza di centro (x0 , y0 ) e raggio r percorsa in senso antioraria



x = x0 + r cos θ
γ(θ) = θ ∈ [0, 2π] kγ 0 (θ)k = r
y = y0 + r sin θ
e l’ultima uguaglianza segue dal teorema della divergenza.
Essendo f armonica, ne segue che g 0 (r) = 0 per ogni r > 0 e, per continuità, g 0 (0) = 0.
Allora g è constante sull’intervallo I e, quindi, per ogni r ∈ I, g(r) = g(0) cioè
Z 2π Z 2π
1 1
f (x0 + r cos θ, y0 + r sin θ) dθ = f (x0 , y0 ) dθ = f (x0 , y0 ).
2π 0 2π 0


Il seguente risultato mostra che le funzioni armoniche assumono i valore massimo o minimo
sul bordo.
Cor. 4.32. Data una funzione armonica f definita su un aperto A ⊂ R2 connesso per
archi, se f ammette un punto di massimo o minimo assoluto, allora f è costante su A.

Dimostrazione. Supponiamo che f ammetta minimo assoluto e che, senza perdita di gene-
ralità, tale minimo sia 0, cioè f (x, y) ≥ 0 per ogni (x, y) ∈ A. Poiché f è continua, esiste
C insieme chiuso di R2 tale che
f −1 (0) = A ∩ C 6= ∅.
Mostriamo che f −1 (0) è aperto. Dato P0 = (x0 , y0 ) ∈ f −1 (0) ed A è aperto, esiste R > 0
tale che B(P0 , R) ⊂ A. Per ogni r < R per la (147)
Z 2π
f (x0 + r cos θ, y0 + r sin θ) dθ = 0,
0
essendo per ipotesi f (x0 , y0 ) = 0. Poiché f (x, y) ≥ 0 ed f è continua, segue che per ogni
θ ∈ (−π, π], f (x0 + r cos θ, y0 + r sin θ) = 0. Per l’arbitrarietà di r, allora f (P ) = 0 per
ogni P ∈ B(P0 , R) e, quindi, B(P0 , R) ⊂ f −1 (0). Essendo A connesso per archi, la seconda
parte della dimostrazione della Prop. 1.73 assicura che f −1 (0) = A, cioè f (P ) = 0 per ogni
P ∈ A.

138

13.2. Caso tridimensionale. Passiamo ora al caso tridimensionale. Consideriamo un


dominio V di R3 limitato, il cui “bordo” è l’unione di un numero finito di superfici regolari
S = S1 ∪ . . . ∪ Sn .
Per ciascuna di esse, fissiamo una rappresentazione parametrica in modo tale che il vettore
normale sia “esterno”. Chiamiamo S il bordo orientato di V . Notiamo che S è una superficie
chiusa e, quindi, non ha bordo.
Consideriamo ora una superficie S limitata e fissiamo un orientamento che permetta di
distinguere tra "lato interno" e “lato esterno” di S. Il “bordo” della superficie è l’unione di
un numero finito di curve semplici regolari,
γ = γ1 + . . . + γn ,
tutte orientate in modo tale che il “lato esterno della superficie”, definito dal vettore nor-
male, sia “alla sinistra della curva”. La curva γ è detta bordo orientato di S ed è una curva
chiusa (per cui non ha “bordo”).
Se F : Ω ⊂ R3 → R3 , dove Ω è aperto ed F = u i + v j + w k è di classe C 1 , definiamo

 
i j k  
∂ ∂ ∂  ∂w ∂v ∂u ∂w ∂v ∂u
rot F = ∇ ∧ F = det  ∂x ∂y ∂z = − , − , − rotore (148)
∂y ∂z ∂z ∂x ∂x ∂y
u v w
∂u ∂v ∂w
div F = ∇ · F = + + divergenza. (149)
∂x ∂y ∂z
I seguenti due risultati sono l’analogo del teorema di Gauss-Green.

Teo 4.33 (Teorema della divergenza o di Gauss). Dato un campo F : Ω ⊂ R3 → R3 dove


Ω è aperto ed F è di classe C 1 , ed un dominio V tale che V ⊂ Ω, allora
Z Z
F (P ) · dσ(P ) = div F (x, y, z) dxdydz. (150)
S V
dove S è il bordo orientato di V .

Dimostrazione. Dimostriamo il teorema nel caso in cui F (x, y, z) = w(x, y, z)k ed il volume
V sia della forma
V = {(x, y, z) ∈ R3 | (x, y) ∈ A, ϕ(x, y) ≤ z ≤ ψ(x, y)},
dove A ⊂ R2 è aperto limitato e ϕ, ψ : A ⊂ R2 → R sono funzioni di classe C 1 . Il bordo di
V è formato da una superficie “inferiore” S1 ed una “superiore” S2 di equazione parametrica,
rispettivamente
 
x = t
 x = t

σ1 (t, s) = y = s σ2 (t, s) = y = s (t, s) ∈ A,
 
z = ϕ(t, s) z = ψ(t, s)
 

ed da una superficie “laterale” S3 .


R
Poiché il versore normale di S3 è perpendicolare all’asse z, allora S3 F (P ) · dσ(P ) = 0. I
vettori normali esterni a S1 ed S2 sono dati rispettivamente da
∂ϕ ∂ϕ ∂ϕ ∂ϕ
N1 (t, s) = −(1, 0, ) ∧ (0, 1, )=( , , −1)
∂t ∂s ∂t ∂s
∂ψ ∂ψ ∂ψ ∂ψ
N2 (t, s) = (1, 0, ) ∧ (0, 1, ) = (− , − , 1).
∂t ∂s ∂t ∂s
139

Allora,
Z Z
F (P ) · dσ(P ) = − w(t, s, ϕ(t, s)) dtds
S1 A
Z Z
F (P ) · dσ(P ) = w(t, s, ψ(t, s)) dtds.
S2 A
L’integrale di volume, usando la formula di integrazione per fili, diventa
Z Z
∂w
div F (x, y, z) dxdydz = (x, y, z) dxdydz
V V ∂z
Z Z ψ(x,y)
∂w
= (x, y, z) dz
A ϕ(x,y) ∂z
Z
= w(x, y, ψ(x, y)) − w(x, y, ϕ(x, y)) dxdy,
A
dove nell’ultima uguaglianza si è usato il teorema fondamentale del calcolo integrale,
essendo ∂w
∂z continua. 
Teo 4.34 (Teorema del rotore o di Stokes). Data un campo vettoriale F : Ω ⊂ R3 → R3
dove Ω è aperto ed F è di classe C 1 , ed una superficie S tale che S ⊂ Ω, allora
Z Z
F (P ) · dγ(P ) = rot F (P ) · dσ(P ).
γ S
dove γ è il bordo orientato positivamente di S.

Dimostrazione. Dimostriamo il teorema nel caso particolare in cui S è una superficie piana
che giace nel piano z = z0

x = t

σ(t, s) = y = s (t, s) ∈ A

z = z0

Il vettore normale ad S è
∂σ ∂σ
N (t, s) = (t, s) ∧ (t, s) = (1, 0, 0) ∧ (0, 1, 0) = (0, 0, 1) = k.
∂t ∂s
Se F (x, y, z) = u(x, y, z) i + v(x, y, z) j + w(x, y, z) k, allora
Z Z Z
∂v ∂u
rot F (P ) · dσ(P ) = rot F (σ(t, s)) · N (t, s) dtds = (t, s, z0 ) − (t, s, z0 ) dtds.
S A A ∂x ∂y
(151)
Inoltre il bordo di S è una curva γ(t) = (x(t), y(t), z0 ) che giace nel piano z0 e la cui
proiezione γ̂(t) = (x(t), y(t)) sul piano xy è il bordo orientato di A, allora
Z Z b
F (P ) · dγ(P ) = (u(γ̂(t), z0 ) i + v(γ̂(t), z0 ) j) · γ̂ 0 (t)dt
γ a
Z  
∂v ∂u
= (x, y, z0 ) − (x, y, z0 ) dxdy.
A ∂x ∂y
per il teorema di Gauss-Green. Confrontando con la (151) segue la tesi. 

14. Campi irrotazionali e solenoidali

Trattiamo esplicitamente il caso tridimensionali, anche se alcuni esempi si riferisco a campi


bidimensionali.
Def. 4.35. Dato un campo F : A ⊂ R3 → R3 definito su un aperto A e di classe C 1
F (x, y, z) = u(x, y, z) i + v(x, y, z) j + w(x, y, z) k,
si dice che
140

a) il campo F è irrotazionale se
rot F (x, y, z) = 0 (x, y, z) ∈ A,
b) il campo F è solenoidale se
div F (x, y, z) = 0 (x, y, z) ∈ A,
c) il campo F è conservativo se esiste g : A → R di classe C 2 tale che
∇g(x, y, z) = F (x, y, z) (x, y, z) ∈ A
e la funzione g si chiama potenziale del campo.
d) il campo F ammette potenziale vettore se esiste G : A → R3 di classe C 2 (A) tale che
rot G(x, y, z) = F (x, y, z) (x, y, z) ∈ A.

La condizione che F sia irrotazionale equivale a richiedere che


∂Fi ∂Fj
= i, j = 1, . . . , 3 (152)
∂xj ∂xi
dove F1 = u, F2 = v, F3 = w e x1 = x, x2 = y, x3 = z. La condizione (152) permette di
estendere la definizione di campo irrotazionale a campi in Rn .
La seguente proposizione fornisce alcune proprietà dei campi conservativi.

Prop. 4.36. Dato un campo conservativo F : A ⊂ R3 → R3 dove A è aperto, F ∈ C 1 (A)


ed F è conservativo, allora valgono i seguenti fatti.
a) Il campo F è irrotazionale;
b) Se A è connesso per archi e g : A → R è un potenziale di F , allora tutti i potenziali di
F sono dati da
h(P ) = g(P ) + c P ∈A
dove c ∈ R.
c) Data una curva regolare a tratti γ di estremi P0 e P1 con traccia contenuta in A ed un
potenziale g : A → R di F , allora
Z
F (P ) · dγ(P ) = g(P1 ) − g(P0 ). (153)
γ
d) Se A è connesso per archi, dato P0 ∈ A l’unico potenziale di F tale che g(P0 ) = 0 è
Z
g(P ) = F (Q) · dγ(Q), P ∈A (154)
γP
dove γP è una qualunque curva regolare a tratti di primo estremo P0 e secondo estremo
P con traccia contenuta in A.

Dimostrazione. Dimostriamo che F è irrotazionale. Sia g : A → R tale che F = ∇g, con


la notazione dell’equazione (152)
∂Fi ∂ ∂g ∂ ∂g ∂Fj
= =
∂xj ∂xj ∂xi ∂xi ∂xj ∂xi
per ogni i, j = 1, . . . , 3, dove la seconda uguaglianza segue dal teorema di Schwarz (Teo. 1.67)
essendo g ∈ C 2 (A).
Assumiamo ora che A sia connesso per archi ed h sia un altro potenziale di F , allora
∇(h − g)(x, y, z) = 0, per cui esiste c ∈ R tale che h(x, y, z) − g(x, y, z) = c. Inoltre,
evidentemente g(P ) + c è un potenziale di F .
141

Per dimostrare la (153), possiamo supporre senza perdita di generalità che γ : [a, b] → R3
sia una curva regolare, allora per la regola di derivazione in catena
Z Z b Z b
F (P ) · dγ(P ) = F (γ(t)) · γ 0 (t) dt = ∇g(γ(t)) · γ 0 (t) dt
γ a a
Z b
= g(γ(t))0 dt = g(γ(b)) − g(γ(a)) = g(P1 ) − g(P0 ).
a

Per mostrate il punto d). Sia h un potenziale di F e definiamo g : A → R, g(P ) =


h(P ) − h(P0 ), che è l’unico potenziale di F tale che g(P0 ) per quanto visto al punto b).
Essendo A connesso per archi, per ogni punto P ∈ A esiste una curva continua γP con
primo estremo P0 e secondo estremo P . Poiché A è aperto, si può dimostrare che γP può
sempre essere scelta come una curva regolare a tratti e la (154) segue dalla (153) poiché
per ipotesi g(P0 ) = 0. 
. La condizione che il campo F sia irrotazionale non è sufficiente a garantire che sia
conservativo, come mostra l’esempio 4.38.

La seguente proposizione fornisce delle condizioni equivalenti al fatto che F sia conservativo.

Prop. 4.37. Dato una campo F : A ⊂ R3 → R3 , dove A è un insieme aperto connesso


per archi ed F ∈ C 1 (A), le seguenti condizioni sono equivalenti.
a) Il campo F è conservativo.
b) Per ogni curva chiusa semplice γ regolare a tratti con traccia contenuta in A vale
Z
F (P ) · dγ(P ) = 0.
γ
c) Per ogni coppia di curve semplici γ1 , γ2 regolari a tratti con traccia contenuta in A e
che hanno la stesso primo estremo e lo stesso secondo estremo vale
Z Z
F (P ) · dγ1 (P ) = F (P ) · dγ2 (P ).
γ1 γ2

Dimostrazione. Il fatto che a) implichi b) segue dalla (153) essendo γ una curva chiusa.
La condizione b) implica c) essendo γ = γ1 − γ2 una curva chiusa e
Z Z Z
F (P ) · dγ(P ) = F (P ) · dγ1 (P ) − F (P ) · dγ2 (P ).
γ γ1 γ2

Per dimostrare che c) implica a), scegliamo un punto P0 ∈ A. Essendo A connesso per
archi, per ogni punto P ∈ A esiste una curva continua γP con primo estremo P0 e secondo
estremo P . Poiché A è aperto, si può dimostrare che γP può sempre essere scelta come
una curva regolare a tratti semplice. Definiamo g : A → R
Z
g(P ) = F (Q) · dγ(Q).
γP

Mostriamo che g ammette derivate parziale rispetto a x nel punto P = (x, y, z) ∈ A.


Fissato δ > 0 tale che Ph = (x + h, y, z) ∈ A per ogni |h| < δ, denotiamo con ∆h il
segmento di primo estremo P = (x, y, z) e secondo estremo Ph = (x + h, y, z) di equazione
parametrica
∆h (τ ) = (x + τ h)i + yj + zk τ ∈ [0, 1].
142

Allora, per ogni |h| < δ, essendo ∆0h (τ ) = h i


g(x + h, y, z) − g(x, y, z)
Z Z
1 1
= F (Q) · dγ(Q) = F (P ) · dγ(P ) =
h h γP −γP h ∆h
h

1 1 1 x+h
Z Z
= u(x + τ h, y, z)h dτ = u(t, y, z) dt
h 0 h x
dove u(x, y, z) = F (x, y, z) · i, la seconda uguaglianza segue dall’ipotesi c) osservando che
γPh − γP e ∆h hanno come primo estremo P e come secondo estremo Ph , e la terza segue
dal cambio di variabili t = hτ . Essendo u continua, per il teorema fondamentale del calcolo
integrale
∂g g(x + h, y, z) − g(x, y, z)
(x, y, z) = lim = u(x, y, z).
∂x h→0 h
Ripetendo un analogo ragionamento per le altre due direzioni, si conclude che g è di classe
C 1 e ∇g = F . 

Il seguente esempio mostra come un campo irrotazionale non sia necessariamente conser-
vativo.
Esempio 4.38. Dati A = R3 \ {(0, 0, z) | z ∈ R} ed F : A → R3
−y x
F (x, y, z) = i+ 2 j = u(x, y, z) i + v(x, y, z) j,
x2
+y 2 x + y2
poiché F non dipende da z, F (x, yz) · k = 0 e
y 2 − x2

∂v
(x, y, z) =


∂x (x2 + y 2 )2

,
∂u y 2 − x2
(x, y, z) =


(x2 + y 2 )2

∂y
allora il campo è irrotazionale, tuttavia se γ è la circonferenza nel piano z = 0 di raggio 1
e centro l’origine percorsa in verso antiorario

x = cos t

γ(t) = y = sin t t ∈ [0, 2π]

z=0

allora l’integrale di linea di F risulta


Z Z 2π
F (P ) · dγ(P ) = (sin2 t + cos2 t) dt = 2π,
γ 0

per cui F non è conservativo.

Il seguente teorema dà una condizione sufficiente sul dominio affinchè un campo irrotazio-
nale sia conservativo. A questo fine si dà la seguente definizione.
Def. 4.39. Un insieme A ⊂ R3 aperto e connesso per archi si dice semplicemente connesso
se per ogni curva γ regolare, semplice e chiusa la cui traccia è contenuta in A, esiste una
superficie con bordo S ⊂ A tale che γ è il bordo orientato positivamente di D.
. Nel caso n = 2 si richiede che esista un dominio con bordo D ⊂ A tale che γ è il bordo
orientato positivamente di D.

Teo 4.40. Sia A ⊂ R3 un insieme semplicemente connesso ed F : A → R3 un campo di


classe C 1 . Il campo F è conservativo se e solo se è irrotazionale.
143

Dimostrazione. Se F è conservativo, allora è irrotazionale per la Proposizione 4.36. Vice-


versa, assumiamo che F sia irrotazionale. Data una curva γ regolare, semplice e chiusa la
cui traccia è contenuta in A, esiste un domino D di cui γ è il bordo e, per il teorema di
Stokes Z Z
F (P ) · dγ(P ) = rot F (x, y, z) dxdydz = 0.
γ D
Allora F è conservativo per la Prop. 4.37. 

Se A non è semplicemente connesso, un campo irrotazionale F può essere conservativo o


meno, come mostrano il seguente esempio e l’esempio 4.38.
Esempio 4.41. Dati A = R3 \ {(0, 0, z) | z ∈ R} ed F : A → R3
x y
F (x, y, z) = 2 i+ 2 j
x + y2 x + y2
1
Posto g(x, y, z) = 2 log(x2 + y 2 ), il fatto che
 ∂g x
 ∂x (x, y, z) = x2 +y2

∂g y
∂y (x, y, z) = x2 +y 2
(x, y, z) ∈ A
 ∂g

∂z (x, y, z) = 0
implica che g è un potenziale per F e, essendo A connesso per archi, ogni potenziale di F
è della forma g(x, y, z) + c con c ∈ R.

Nel caso di campi radiali, il problema di calcolare il potenziale si riduce al calcolo di una
primitiva, come mostra il seguente esempio.
Esempio 4.42. Dati A = R3 \ {(0, 0, 0)} ed F : A → R3
x y z
F (x, y, z) = 2 2 2
i+ 2 2 2
j+ 2 k
x +y +z x +y +z x + y2 + z2
P −O 1
F (P ) = f (kP − Ok) f (r) = = (log r)0
kP − Ok r
Posto g(P ) = log(kP − Ok), cioè g(x, y, z) = 12 log(x2 + y 2 + z 2 ), il fatto che
 ∂g x
 ∂x (x, y, z) = x2 +y2 +z 2

∂g y
∂y (x, y, z) = x2 +y 2 +z 2 (x, y, z) ∈ A
 ∂g
 y
∂z (x, y, z) = x2 +y 2 +z 2
implica che g è un potenziale per F e, essendo A connesso per archi, ogni potenziale di F
è della forma g(x, y, z) + c con c ∈ R.
. Il fatto che un campo irrotazionale sia conservativo o meno dipende fortemente dal-
l’insieme A su cui si considera il campo, come mostra il seguente esempio.
Esempio 4.43. Consideriamo il campo bidimensionale
−y x
F (x, y) = 2 i+ 2 j
x + y2 x + y2
il cui dominio naturale è l’insieme aperto
A = R2 \ {(0, 0)}.
Poiché
y 2 − x2

∂v
(x, y) = 2


∂x (x + y 2 )2

,
∂u y 2 − x2
(x, y) = 2


(x + y 2 )2

∂y
allora F il campo è irrotazionale. Studiamo ora il problema dell’esistenza di un potenziale
per F .
144

Osserviamo preliminarmente che in coordinate polari


1
F (r cos θ, r sin θ) = nθ
r
dove nθ = − sin θ i + cos θ j è il versore tangenziale. Inoltre, se γ è l’arco di circonferenza
di raggio r0 e centro l’origine, percorso in verso antiorario, parametrizzato da

x = r0 cos θ
γ(θ) = θ ∈ [θ1 , θ2 ] 0 < θ2 − θ1 ≤ 2π,
y = r0 sin θ
allora l’integrale di linea di F lungo γ risulta
Z Z θ2
F (P ) · dγ(P ) = (sin2 θ + cos2 θ) dθ = (θ2 − θ1 ). (155)
γ θ1

Inoltre, fissato θ0 ∈ R, se γ è il segmento di equazione



x = r cos θ0
γ(r) = r ∈ [r1 , r2 ] 0 < r1 < r2
y = r sin θ0
allora l’integrale di linea di F lungo γ è dato da
Z
F (P ) · dγ(P ) = 0. (156)
γ

Scegliendo come γ la circonferenza di raggio 1, curva chiusa semplice la cui traccia è tutta
contenuta in A, dalla (155) con θ1 = 0 e θ2 = 2π, segue
Z
F (P ) · dγ(P ) = 2π 6= 0
γ

per cui F non è conservativo su A per la Prop. 4.37.


Consideriamo l’insieme
B = R2 \ {(x, y) ∈ R2 | y = 0, x ≤ 0},
che risulta aperto, connesso per archi e semplicemente connesso. Per il Teo. 4.40 F am-
mette un unico potenziale g : B → R tale che g(1, 0) = 0. Per calcolarlo, utilizziamo
l’equazione (154) in cui P0 = (1, 0), P = (x, y) = (r cos θ, r sin θ), con r > 0 e θ ∈ (−π, π),
e γ = γ1 + γ2 dove γ1 è l’arco di circonferenza di raggio 1 e centro l’origine di primo
estremo P0 e secondo estremo P1 = (cos θ, sin θ) e γ2 è il segmento che congiunge P1 con
P . Osservando che γ1 è percorsa in senso antiorario se θ ≥ 0 ed in senso orario se θ < 0,
le (155) e (156) implicano che
Z Z
g(x, y) = g(P ) = F (P ) · dγ(P ) = F (P ) · dγ(P ) = θ (157)
γ γ1
!
y
= 2 arctan p ,
x2 + y 2 + x
dove l’ultima uguaglianza segue dalla (57).
Consideriamo ora l’insieme C
C = R2 \ {(x, y) ∈ R2 | y = 0, x ≥ 0},
che risulta aperto, connesso per archi e semplicemente connesso. Per il Teo. 4.40 F am-
mette un unico potenziale h : C → R tale che g(−1, 0) = 0. Per calcolarlo, utilizziamo
l’equazione (154) in cui P2 = (−1, 0), P = (x, y) = (r cos ϕ, r sin ϕ), con r > 0 e ϕ ∈ (0, 2π),
e Γ = γ3 + γ4 dove γ3 è l’arco di circonferenza di raggio 1 e centro l’origine di primo estre-
mo P2 e secondo estremo P3 = (cos ϕ, sin ϕ) e γ4 è il segmento che congiunge P3 con P .
145

Osservando che γ3 è percorsa in senso orario se ϕ ≤ π e in senso anti-orario se ϕ > 0,


dalla (155) e la (156) segue che
Z Z
h(P ) = F (P ) · dγ(P ) = F (P ) · dγ(P ) = ϕ − π (158)
Γ γ3
 !
 y

 2 arctan p −π 0<ϕ<π
x2 + y 2 + x

 !

 y
= 0 ϕ=π = −2 arctan p
 ! x2 + y 2 − x
y



2 arctan p 2 + π π < ϕ < 2π


x + y2 + x
(159)
dove la quarta uguaglianza segue dalla (57) e dal fatto che
(
ϕ=θ 0<ϕ<π
ϕ = θ + 2π π < ϕ < 2π
e la quinta dalla relazione
(
1 + π2 t>0
arctan t + arctan = .
t − π2 t<0
Osserviamo che F ammette un potenziale g su B ed un potenziale h su C. Benché B ∪ C =
A, F non ammette un potenziale su tutto A, come abbiamo già visto. Tuttavia è possibile
mostrarlo direttamente. Supponiamo per assurdo che esista una funzione f : A → R di
classe C 2 tale che ∇f (x, y) = F (x, y) per ogni (x, y) ∈ A. Evidentemente f ristretta a
B e C è ancora un potenziale e, essendo B e C entrambi connessi per archi con g(1, 0) =
h(−1, 0) = 0, allora si avrebbe che
(
f (x, y) = g(x, y) + f (1, 0) (x, y) ∈ B
,
f (x, y) = h(x, y) + f (−1, 0) (x, y) ∈ C
da cui
h(x, y) − g(x, y) = f (1, 0) − f (−1, 0) (x, y) ∈ B ∩ C,
mentre le (57) e (159) implicano che
(
−π y > 0
h(x, y) − g(x, y) = (x, y) ∈ B ∩ C = {(x, y) ∈ R2 | y 6= 0}.
+π y < 0
Da notare che B ∩ C è aperto, ma non è connesso per archi, per cui il risultato non è in
contraddizione con la Prop. 4.36 b).

Consideriamo ora il caso del potenziale vettore.


Prop. 4.44. Dato un campo F : A ⊂ R3 → R3 , definito su un insieme apero A e di classe
C 1 , se F ammette un potenziale vettore G, cioè F = rot G, valgono i seguenti fatti.

a) Il campo F è solenoidale, cioè div F = 0.

b) Data una superficie regolare chiusa S, S ⊂ A allora


Z
F (P ) · dσ(P ) = 0.
S

c) Se A è semplicemente connesso, i potenziali vettori di F sono tutti e soli della forma


G + ∇ϕ, dove ϕ : A → R è una funzione di classe C 2 .
146

Dimostrazione. Il fatto che F sia solenoidale segue dalla relazione


div F = div(rot G) = 0.
La dimostrazione del punto b) richiede argomenti avanzati, ne forniamo un cenno. Suppo-
niamo per assurdo che esista una superficie regolare chiusa S, S ⊂ A, tale che
Z
F (P ) · dσ(P ) = B 6= 0,
S
dove σ : V ⊂ R2 → R3è una parametrizzazione regolare della superficie S che la ricopre
a meno di un insieme trascurabile. Senza perdita di generalità possiamo assumere che
(0, 0) ∈ V e sia P0 = σ(0, 0) ∈ S. Poiché V è aperto, esiste R > 0 tale che B(0, R) ⊂ V e,
di conseguenza, per ogni 0 < r ≤ R la circonferenza di centro (0, 0) e raggio r ha traccia
contenuta in V . Allora
γr (θ) = σ(r cos θ, r sin θ) θ ∈ [0, 2π]
è una curva chiusa di R3 che giace sulla superficie S, dividendola in due porzioni, Sr ed
Sr0 , la prima non contenente P0 e la seconda contenente P0 . Per la regola di derivazione in
catena
∂σ ∂σ
γr0 (θ) = (r cos θ, r sin θ) (−r sin θ) + (r cos θ, r sin θ) (r cos θ)
∂t ∂s
da cui segue che kγr0 (θ)k ≤ Cr dove
 
∂σ ∂σ
C = max k (r cos θ, r sin θ)k + k (r cos θ, r sin θ)k
θ∈[0,2π] ∂t ∂s
e quindi
Z 2π
`γr = kΓ0r (θ)kdθ ≤ C 2πr (160)
0
Inoltre, Sr0 è parametrizzata da σ(t, s) con t2 + s2 < r2 , allora
Z Z
| F (P ) · dσ(P )| ≤ |F (σ(t, s)) · N (t, s)|dtds
Sr0 t2 +s2 <r2
2
≤ M πr ,
dove M = maxt2 +s2 ≤R2 |F (σ(t, s)) · N (t, s)|. Ne segue che
Z Z Z !
lim F (P ) · dσ(P ) = lim F (P ) · dσ(P ) − F (P ) · dσ(P ) = B 6= 0. (161)
r→0 Sr r→0 S Sr0

D’altra parte γr è il bordo orientato di Sr , il fatto che F = rot G ed il teorema del rotore
implicano che
Z Z
F (P ) · dσ(P ) = rot G(P ) · dσ(P )
Sr Sr
Z
= G(P ) · dγ(P ).
γr

Dalla (161) segue che Z


lim G(P ) · dγ(P ) = B 6= 0.
r→0 γr

Tuttavia, posto M 0 = maxt2 +s2 ≤R2 |G(σ(t, s))|, dalla (160) segue che
Z Z 2π
| G(P ) · dγ(P )| ≤ |G(γr (θ) · γr0 (θ)| dθ
γr 0
Z 2π
≤ kG(γr (θ)k kγr0 (θ)k dθ
0
≤ M 0 `γr
147

da cui Z
lim G(P ) · dγ(P ) = 0,
r→0 γr
che è una contraddizione.
Per provare la terza affermazione, assumiamo ora che A sia semplicemente connesso. Un
campo G0 : A ⊂ R3 → R3 è un potenziale vettore di F se e solo se per ogni (x, y, z) ∈ A
rot(G0 − G)(x, y, z) = rot G0 (x, y, z) − rot G(x, y, z) = F (x, y, z) − F (x, y, z) = 0,
cioè se G0 − G è un campo irrotazionale. Essendo A semplicemente connesso, per il Teo-
rema 4.40 questa condizione equivale al fatto che G0 − G sia conservativo, cioè che esista
ϕ : A → R di classe C 2 , tale che G0 = G + ∇ϕ. 

La condizione che F sia solenoidale in generale non è sufficiente a garantire che il campo
F ammetta un potenziale vettore come mostra il seguente esempio.
Esempio 4.45. Dato il campo F : R3 \ {(0, 0, 0)} → R3
1
F (x, y, z) = 3 (x i + y j + z k) .
(x2 + y 2 + z 2 ) 2
Poiché !
∂ x 1 x2
3 = 3 − 3 5 ,
∂x (x2 + y 2 + z 2 ) 2 (x2 + y 2 + z 2 ) 2 (x2 + y 2 + z 2 ) 2
è immediato verificare che
3 x2 + y 2 + z 2
div F (x, y, z) = 3 −3 5 = 0.
(x2 + y 2 + z 2 ) 2 (x2 + y 2 + z 2 ) 2
Tuttavia se S è la sfera di centro l’origine e raggio 1, con la parametrizzazione dell’Esem-
pio 4.15.
Z Z
F (P ) · dσ(P ) = (sin θ cos ϕ, sin θ sin ϕ, cos θ) · N (θ, ϕ) dθdϕ
S
[0,π]×[0,2π]
Z
= sin θ dθdϕ = 4π 6= 0,
[0,π]×[0,2π]

per cui F non può ammettere potenziale vettore per la Proposizione 4.44.

Il seguente teorema, la cui dimostrazione non viene riportata, fornisce una condizione
sufficiente per l’esistenza del potenziale vettore.
Teo 4.46. Dato un insieme aperto, connesso per archi A ⊂ R3 tale che per ogni superficie
regolare chiusa S, S ⊂ A esiste un dominio V , V ⊂ A, di cui S sia il bordo orientato,
allora un campo F : A → R3 di classe C 1 ammette un potenziale vettore se e solo se F è
solenoidale.
. Un insieme A che soddisfa la condizione del teorema è detto due-semplicemente con-
nesso ed è una condizione indipendente dalla semplice connessione.
i) L’insieme R3 \ {(0, 0, 0)} è semplicemente connesso, ma non è due-semplicemente
connesso.
ii) L’insieme R3 \ {(0, 0, z) ∈ R3 | z ∈ R} non è semplicemente connesso, ma è due-
semplicemente connesso.
149

Parte 5. Serie di potenze

In questa sezione vengono introdotte le serie di potenze sul campo C dei numeri
p complessi.
Ricordiamo che, dato z = x + iy ∈ C, il modulo di z è denotato con |z| = x2 + y 2 ed in
C è definito il prodotto
z1 z2 = (x1 x2 − y1 y2 ) + i(x1 y2 + x2 y1 ) z1 = x1 + iy1 ,
z2 = x2 + iy2 .
Def. 5.1. Data una successione (an )n∈N con an ∈ C, la serie di funzioni ∞ n
P
n=0 an z si
chiama serie di potenze (di centro 0) e si definisce raggio di convergenza il valore
+∞
X
ρ = sup{|z| ∈ [0 + ∞) | z ∈ C e la serie numerica an z n converge}.
n=0

P+∞ n
La serie numerica converge (semplicemente) se esiste w = x + iy ∈ C tale che
n=0 an z
N
(P
+∞
X
n Re(an z n ) = x
lim an z − w = 0 ⇐⇒ Pn=0
+∞ n
.
n=0 Im(an z ) = y
N →+∞
n=0
P+∞ n
P+∞ n
La serie n=0 an z converge assolutamente, se la serie a termini positivi n=0 |an z |
converge. La convergenza assoluta implica quella semplice. Dato DP ⊂ C, la serie di potenze
converge totalmente su D se converge la serie a termini positivi +∞ n
n=0 supz∈D |an z |. La
convergenza totale implica quella assoluta per ogni z ∈ D.
. Nelle serie di potenze si usa la convenzione 00 = 1 per cui
X∞
an z n = a0 + a1 z + a2 z 2 + . . . + an z n + . . . ,
n=0
P+∞ n
Ne segue che la serie n=0 an z converge sempre in 0 con somma a0 e, quindi,
ρ ∈ [0, +∞) ∪ {+∞}.

Il seguente teorema caratterizza l’insieme di convergenza di una serie di potenze.


P+∞ n
Teo 5.2 (Raggio di convergenza). Data una serie di potenze n=0 an z con raggio di
convergenza ρ,
a) se ρ = 0, allora la serie +∞ n
P
n=0 an z converge solo se z = 0;

b) se 0 < ρ < P+∞,


1) la serie +∞ n
n=0 an z converge assolutamente se |z| < ρ;
P+∞ n
2) la serie n=0 an z non converge se |z| > ρ;
Inoltre per ogni 0 < R < ρ, la serie +∞ n
P
n=0 an z converge totalmente su B(0, R);

c) se ρ = +∞, la serie +∞ n
P
n=0 an z assolutamente per ogni z ∈ C e converge totalmente su
B(0, R) per ogni R > 0.

La dimostrazione del teorema è basata sul seguente risultato.

Lemma 5.3. Sia +∞ n


P
n=0 an z una serie di potenze che converge puntualmente in z0 ∈ C
con z0 6= 0, allora la serie di potenze converge totalmente su B(0, R) per ogni 0 < R < |z0 |.

Dimostrazione. Poiché la serie numerica ∞ n


P
n=0 an z0 è convergente, la condizione necessaria
di Cauchy assicura che
lim an z0n = 0.
n→+∞
150

Allora la successione (an z0n )n≥0 è limitata, per cui esiste M > 0 tale che
|an z0n | ≤ M ∀n ∈ N. (162)
Sia 0 < R < |z0 |, per ogni n ∈ N e z ∈ B(0, R)
|an z n | = |an ||z|n
≤ |an |Rn
 n
n R
= |an z0 |
|z0 |
 n
R
( Eq. (162) ) ≤ M
|z0 |
e, quindi,
 n
n R
sup |an z | ≤ M ∀n ∈ N.
z∈[−R,R] |z0 |
P+∞  n
R
La serie numerica n=0 M è convergente poiché è proporzionale alle serie geometri-
|z0 |
R
con 0 < q < 1. Ne segue che la serie +∞ n
P
ca di ragione q = |z0 | n=0 an z converge totalmente
su B(0, R). 

Dimostrazione del Teo. 5.2. Supponiamo, ad esempio, che 0 < ρ < +∞. Per definizione
di
P+∞estremo superiore, se la serie di potenze converge in z ∈ R, allora |z| ≤ ρ e, quindi,
n
n=0 an z non converge se |z| > ρ.

Dato 0 < R < ρ, dimostriamo che la serie converge totalmente su B(0, R). La definizione
di ρ come estremo superiore implica che esiste z0 ∈ C tale che R < |z0 | ≤ ρ e la serie
P+∞ n
n=0 an z0 converge. Per il Lemma 5.3, la serie converge totalmente su B(0, R) e, quindi,
assolutamente in z per ogni |z| ≤ R.
P+∞
Dimostriamo ora che n=0 |an z n | converge per ogni |z| < ρ. A tal fine è sufficiente scegliere
|z0 | ≤ R < ρ. Per quanto visto sopra la serie converge totalmente su B(0, R) 3 z0 e, quindi,
assolutamente in z0 . 

Il
Pprecedente teorema implica che l’insieme di convergenza puntuale di una serie di potenze
+∞ n con raggio di convergenza 0 < ρ < +∞ è un insieme D tale che
a
n=0 n z
B(0, ρ) ⊂ D ⊂ B(0, ρ).
 . Per il Teo. 5.2 la serie
P +∞ n
n=0 an z converge assolutamente per ogni |z| < ρ e non
converge per ogni |z| > ρ. Ne segue che, per determinare il raggio diPconvergenza, è
sufficiente studiare l’insieme di convergenza della serie a termini positivi +∞ n
n=0 |an ||z| .

Tuttavia,
P+∞ il raggio di convergenza non fornisce informazioni sulla convergenza della serie
n
n=0 an z sulla circonferenza {z ∈ C | |z| = ρ}. In particolare, possono esistere punti
|z| = ρ dove la serie converge semplicemente, ma non assolutamente. Come mostrano i
seguenti esempi.
Esempio 5.4. Sia ρ il raggio di convergenza ed D l’insieme di convergenza puntuale delle
seguenti serie di potenze
P+∞ n
n=0 z ⇒ ρ = 1 D = {z ∈ C | |z| < 1}
P+∞ (−1)n+1 n
n=1 n z ⇒ ρ = 1 D = {z ∈ C | |z| ≤ 1, z 6= −1}
P+∞ 1 n
n=1 n2 z ⇒ ρ = 1 D = {z ∈ C | |z| ≤ 1}.
151

Per quanto riguarda la prima serie, fissato z ∈ C, ragionando come nell’esempio 3.14, per
ogni N ∈ N si ha
N
( N +1
1−z
X
n 1−z z 6= 1
z =
n=0
N + 1 z = 1.
PN
Ne segue che, se |z| < 1, esiste limN →+∞ n=0 z n = 1/(1 − z), mentre se |z| ≥ 1 il limite
non esiste in C. Ne segue che l’insieme di convergenza è {z ∈ C | |z| < 1} ed il raggio di
convergenza è 1.
Per la seconda, consideriamo inizialmente la convergenza assoluta, cioè
+∞ +∞
X (−1)n+1 n X |z|n
| z |= ,
n n
n=1 n=1
che converge se e solo se |z| < 1. Ne segue che il raggio di convergenza è ρ = 1. Per
determinare il comportamento sulla frontiera, osserviamo che se z = −1 la serie diventa
− +∞
P
n=1 1/n che diverge a −∞. Se z = cos θ + i sin θ con θ ∈ (−π, π), allora
+∞ +∞ +∞
X (−1)n+1 n
X 1 in(θ+π) X cos(nθ0 ) + i sin(nθ0 )
z =− e =− ,
n n n
n=1 n=1 n=1
θ0
dove = θ + π ∈ (0, 2π). Entrambe le serie nell’ultimo membro convergono per il criterio
di Abel-Dirichelet5 poiché (1/n)n è una successione positiva, decrescente, infinitesima e
N N 0
X X 0 ei(N +1)θ 1
| cos(nθ0 )| ≤ | einθ | = | 0 | = =M
n=1 n=1
1−e iθ |1 − eiθ0 |

ed, analogamente, per | N 0


P
n=1 sin(nθ )|.

L’insieme di convergenza della terza serie è {z ∈ C | |z| ≤ 1}. Infatti,


+∞ +∞
X 1 X 1 n
| 2 zn| = |z| ,
n n2
n=1 n=1
che converge se e solo se |z| ≤ 1.

Se i coefficienti an della serie di potenze sono tutti reali e si considerano z = x ∈ R,


P ∞ n è detta serie di potenze reale. Per il Teo. 5.2,
P∞ n
n=0 an x n=0 an x converge sull’insieme
I = D ∩ R, che è un intervallo
(−ρ, ρ) ⊂ I ⊂ [−ρ, ρ],
e vale

X
ρ = sup{|x| | x ∈ R e an xn converge}.
n=0
Inoltre, se x ∈ I, la somma è un numero reale. In generale, non si può dire nulla sugli
estremi x = ±ρ, come mostrano i seguenti esempi.
I seguenti corollari caratterizzano il raggio di convergenza.
Cor. 5.5. Sia +∞ n
P
n=0 an z una serie di potenze tale che an 6= 0 per ogni n ≥ 1. Se esiste
|an+1 |
lim = ` ∈ [0, +∞) ∪ {+∞},
n→+∞ |an |
5Data una serie numerica reale P∞ a b tale che (b ) è uns successione positiva, decrescente ed
n=1 n n n
infinitesima ed esiste M > 0 tale che
N
X
| an | ≤ M ∀N ≥ 1,
n=1
P∞
allora la serie n=1 an bn converge.
152

allora 
 +∞ ` = 0
1
ρ= ` ∈ (0, +∞) .
 `
0 ` = +∞
P+∞ n
Cor. 5.6. Sia n=0 an z una serie di potenze tale che esiste
p
lim n |an | = ` ∈ [0, +∞) ∪ {+∞},
n→+∞

allora 
 +∞ ` = 0
1
ρ= ` ∈ (0, +∞) .
 `
0 ` = +∞

Dimostrazione. La dimostrazione dei due corollari è simile. Riportiamo la seconda nel caso
` ∈ (0, +∞). Dato z ∈ C, per ipotesi
p
lim n |an z n | = `|z|.
n→+∞

Il criterio della radice implica che la serie numerica ∞ n


P
n=0 |an z | converge se `|z| < 1 e
diverge se `|z| > 1. La definizione di ρ ed il fatto che la convergenza semplice equivale a
quella assoluta (se |z| < ρ) implicano che ρ = 1` . 
 . La serie
P ∞ n 2n ha raggio di convergenza ρ = 1 poiché è la serie geometrica di
n=0 4 z 2
ragione w = (2z)2 . Tuttavia non si possono applicare i precedenti corollari. Infatti, la
successione (an )n che definisce la serie di potenze è
a0 = 1
a1 = 0
a2 = 4
a3 = 0
,
... = ...
a2n = 4n
a2n+1 = 0
... = ...
p √
per cui non esiste limn→+∞ n
|an | e si osservi che limn→+∞ n 4n = 4.

Il seguente risultato fornisce informazioni sulla convergenza uniforme.


P+∞ n con raggio di convergenza
Teo 5.7 (di Abel). Data una serie di potenze n=0 an z
ρ ∈ (0, +∞) sono fatti equivalenti

a) la serie converge puntualmente in z0 ∈ C con |z0 | = ρ;


b) la seria converge uniformemente sul segmento aperto {tz0 | t ∈ (0, 1)};
c) la seria converge uniformemente sul segmento chiuso {tz0 | t ∈ [0, 1]}.

Dimostrazione. Dimostriamo l’enunciato nel caso an ∈ R per ogni nN e z0 = ρ dove


{tz0 | t ∈ [0, 1]} = [0, ρ]. L’equivalenza tra b) e c) èPconseguenza della Prop. 3.7. Inoltre,
evidentemente b) implica a). Dimostriamo che se ∞ n
n=0 an x converge in ρ allora si ha
convergenza uniforme su [0, ρ]. Poiché
∞ ∞
X
n
X x
an x = an ρn ( )n ,
ρ
n=0 n=0
senza perdita di generalità, possiamo supporre ρ = 1.
Per ipotesi la serie numerica ∞
P
n=0 a n converge. Allora, fissato  > 0, esiste n ∈ N tale che
|an + an+1 + . . . + am | ≤  ∀m ≥ n ≥ n. (163)
153

Siano m > n ≥ n ed x ∈ [0, 1], allora


an xn + an+1 xn+1 + . . . + am xm = an (xn − xn+1 ) + (an + an+1 )(xn+1 − xn+2 ) + . . .
+ (an + an+1 + . . . am−1 )(xm−1 − xm )
+ (an + an+1 + . . . am−1 + am )xm .
Essendo 0 ≤ x ≤ 1, (xk − xk+1 ) ≥ 0 per ogni k = n, . . . , m − 1, e la (163) implica che
an xn + an+1 xn+1 + . . . + am xm ≤ (xn − xn+1 ) + (xn+1 − xn+2 ) + . . .
+ (xm−1 − xm ) + xm
= xn ≤ .
Facendo il limite per m che tende a +∞ segue che, per ogni n ≥ n e per ogni x ∈ [0, 1]

X n
X
m
am x − ak xk ≤ .
m=0 k=0

L’arbitrarietà di  > 0 implica che la serie converge uniformemente su [0, 1]. 


(−1)n n
Esempio 5.8 (Confronta con Esempio 3.14). La serie di potenze ∞
P
n=1 n x ha raggio
di convergenza ρ = 1 poiché
s
(−1)n
` = lim n = 1.
n→+∞ n
(−1)n
Il teorema sul raggio di convergenza e il fatto che ∞ converge, mentre ∞ 1
P P
n=1 n n=1 n
diverge, implicano che l’insieme di convergenza puntuale è (−1, 1] e che il più grande
insieme di convergenza assoluta è (−1, 1). Il teorema di Abel assicura che ci sia convergenza
uniformemente su [0, 1], ma non in (−1, 0].

Il seguente risultato caratterizza le proprietà della funzione somma. Per semplicità consi-
deriamo solo il caso di serie di potenze reali.
Prop. 5.9. Data una serie di potenze reali ∞ n
P
n=0 an x con raggio di convergenza ρ > 0
ed insieme di convergenza I, la funzione somma

X
f :I→R f (x) = an xn
n=0
è continua su I e per ogni x ∈ I
∞ ∞
Z x !
Z x X
n
X 1
f (t) dt = an t dt = an xn+1 , (164a)
0 0 n+1
n=0 n=0
dove la serie integrata nel membro di destra ha raggio di convergenza ρ. Inoltre, f è
derivabile su (−ρ, ρ) e vale

!0 ∞
X X
0 n
f (x) = an x = an nxn−1 x ∈ (ρ, ρ), (164b)
n=0 n=1

dove la serie (di potenze) derivata nel membro di destra ha raggio di convergenza ρ.

Dimostrazione. La dimostrazione è divisaPin cinque passi.


Passo 1. Proviamo che la serie derivata ∞ n=1 an nx
n−1 ha raggio di convergenza ρ. Sia R

il raggio di convergenzaPdella serie derivata. Dimostriamo che R ≤ ρ. Sia x ∈ R tale che


|x| < R, allora la serie ∞n=1 an nx
n−1 converge assolutamente. Inoltre, poiché

|x|
|an xn | = |an nxn−1 | n≥1
n
154

e limn→+∞ |x|
P∞ n
n = 0 il criterio del confronto asintotico implica che la serie n=0 an x
converge assolutamente, per cui ρ ≥ |x| e, per l’arbitrarietà di x ∈ (−R, R), ρ ≥ R.
Dimostriamo che ρ ≤ R. Sia x ∈ R, |x| < ρ, e y ∈ R tale che |x| < y < ρ, allora la serie
P ∞ n
n=1 an y converge assolutamente. Inoltre, poiché

n|x|n−1
|an nxn−1 | = |an y n | n≥1
yn
n−1
e limn→+∞ n|x|yn = 0 (essendo 0 ≤ |x| y < 1) il criterio del confronto asintotico implica
P∞ n−1
che la serie n=1 an nx converge assolutamente, per cui R ≥ |x| e, per l’arbitrarietà di
x ∈ (−ρ, ρ), R ≥ ρ. Per quanto visto prima, ρ = R.
Passo 2. Dimostriamo prima che f è P derivabile in (−ρ, ρ) e vale la (164b).
L’n-esimo termine generale della serie ∞ n
n=0 an x è la funzione fn : R → R

fn (x) = an xn x ∈ R,
che è derivabile in R e
fn0 (x) = an nxn−1 x ∈ R. (165)
P∞ 0 P∞
La serie n=1 fn è la serie derivata n=1 an nxn−1 con raggio di convergenza ρ per quanto
visto al Passo 1.
Fissato x ∈ (−ρ, ρ),P sia R ∈ R tale che |x| < R < ρ. Il teorema sul raggio di convergenza
assicura che la serie ∞
P∞ 0
f
n=0 n converge puntualmente su [−R, R] e la serie n=1 fn converge
uniformemente su [−R, R], allora il teorema di derivazione termine a termine implica che
la somma f è derivabile in [−R, R] e, quindi, in x ∈ (−ρ, ρ). Inoltre

X
0
f (x) = an nxn−1 .
n=1

Passo 3. Proviamo che la serie integrata ∞ 1 n+1 ha raggio di convergenza ρ. Sia


P
n=0 an n+1 x
r il raggio di convergenza della serie
P∞integrata. La derivazione termine a termine della serie
n
integrata, è la serie di partenza n=0 an x che ha raggio di convergenza ρ. Per quanto
visto al Passo 1, r = ρ.
Passo 4. Proviamo ora che f è continua in x ∈ I. Se x ∈ (−ρ, ρ), la tesi segue dal fatto
che f è derivabile in x. Se x coincide con uno dei due estremi, ad esempio x = ρ, il teorema
di Abel implica che la serie ∞
P
n=0 n converge uniformemente su [0, ρ]. Il teorema sulla
f
continuità della somma assicura che f è continua in [0, ρ] e, quindi, in ρ.

Passo 5. Infine, dimostriamo la (164a). Fissato x ∈ I, sia J l’intervallo chiuso diPestremi


0 e x (ovviamente J ⊂ I poiché I è un intervallo), per quanto visto sopra, la serie ∞n=0 fn
converge uniformemente su J e il teorema di integrazione termine a termine implica che
Z x ∞ Z x ∞ Z x ∞
X X X 1
f (t) dt = fn (t) dt = an tn dt = an xn+1 .
0 0 0 n + 1
n=0 n=0 n=0


La
P∞serie derivata e quella integrata hanno lo stesso raggio di convergenza della serie
n
n=0 an x , ma, in generale, l’insieme di convergenza puntuale può essere diverso. Tut-
tavia, il teorema di Abel ed i teoremi di integrazione e derivazione per le serie di funzio-
ni
P∞ implicano che l’insieme di convergenza della serie integrata contiene quello della serie
n
n=0 an x che, a sua volta, contiene quello della serie derivata.
(−1)n n
Esempio 5.10. L’esempio 3.14 mostra che l’insieme di convergenza della serie ∞
P
P∞ n=1 n x
è (−1, 1] , mentre l’insieme di convergenza della serie derivata n=1 (−1)n xn−1 è (−1, 1),
(−1)n n+1
mentre la serie integrata ∞
P
n=1 n(n+1) x converge in [−1, 1].
155
P∞ n
Teo 5.11. Data una serie di potenze n=0 an x con raggio di convergenza ρ > 0 ed
insieme di convergenza I, la funzione somma
X∞
f :I→R f (x) = an xn
n=0
è derivabile infinite volte in (−ρ, ρ) ⊂ I e per ogni k ∈ N k ≥ 0,

(k)
X n!
f (x) = an xn−k x ∈ (−ρ, ρ).
(n − k)!
n=k
In particolare
f (n) (0) = n! an n ∈ N.

Dimostrazione. Per n = 1, è il contenuto della Prop. 5.9. La prova per n > 1 segue per
induzione poiché f (k) = (f (k−1) )0 . 
Esempio 5.12. La serie di potenze

X (−1)n+1 n
x = log(1 + x) x ∈ (−1, 1].
n
n=1
Infatti, l’esempio 3.14 mostra che l’insieme di convergenza è (−1, 1], mentre la serie derivata
∞ ∞
X X 1
(−1)n+1 xn−1 = (−x)n = x ∈ (−1, 1), (166)
1+x
n=1 n=0
poiché è la serie geometrica. Per il teorema sull’integrazione e derivazione delle serie di
potenze
∞ Z x
X (−1)n+1 n 1
x = dt = log(1 + x) x ∈ (−1, 1).
n 0 1+t
n=1
(−1)n+1 n
Poiché ∞
P
n=1 n x e log(1 + x) sono funzioni continue in 1, l’uguaglianza (166) vale
anche per x = 1 e, quindi,

X (−1)n+1
= log 2.
n
n=1

Esempio 5.13 (Serie esponenziale). Si chiama serie esponenziale la serie di potenze



X 1 n 1 1
x = 1 + x + x2 + x3 + . . . ,
n! 2 3!
n=0
che converge assolutamente in R alla funzione esponenziale ex .
Infatti, poiché
n! 1
lim = lim = 0,
n→+∞ (n + 1)! n→+∞ n + 1
per il criterio del rapporto il raggio di convergenza è +∞ e laPserie converge assolutamente
∞ 1 n
in R per il teorema sulle serie di potenze. Sia f (x) = n=0 n! x , allora il teorema
sull’integrazione e derivazione delle serie di potenze implica
∞ ∞
X n n−1 X 1 n
f 0 (x) = x = x ,
n! n!
n=1 n=0
e, quindi, f 0 (x)
= f (x) per ogni x ∈ R e, in particolare, f (0) = a0 = 1. Posto h(x) =
e−x f (x) per ogni x ∈ R, si ha che h(0) = 1, h è derivabile e
h0 (x) = −e−x f (x) + e−x f 0 (x) = 0 x ∈ R.
Allora, h è una funzione costante uguale a h(0) = 1, per cui f (x) = ex per ogni x ∈ R.
I Il fatto che la somma delle serie esponenziale sia ex si può provare in modo alternativo.
La funzione esponenziale ex è infinitamente derivabile in R e le derivate di ogni ordine in
156

x0 = 0 sono uguali ad 1, per cui la serie esponenziale è la serie di Maclaurin della funzione
ex . Inoltre, fissato x ∈ R, vale
0 ≤ D(n) et = et ≤ e|x|

∀|t| ≤ |x|,
allora la funzione ex è sviluppabile in serie di Taylor in R essendo soddisfatta la condizione
sufficiente (teorema 5.17). J
Esempio 5.14 (Serie binomiale). Dato α ∈ R, α 6∈ N, si chiama serie binomiale la serie
di potenze
∞  
X α n α(α − 1) 2 α(α − 1)(α − 2) 3
x = 1 + αx + x + x + ...
n 2 3!
n=0
α

dove 0 = 1 e
 
α α(α − 1) . . . (α − (n − 1))
= n ∈ N, ≥ 1.
n n!
La serie converge assolutamente in (−1, 1) alla funzione (1 + x)α .
Infatti, poiché
α

α−n
lim | n+1
α
 | = lim | | = 1,
n→+∞ n→+∞ n + 1
n
per il criterio del rapporto il raggio di convergenza è 1 e laPserie converge assolutamente
in (−1, 1) per il teorema sulle serie di potenze. Sia f (x) = ∞ α
 n
n=0 n x , allora il teorema
sulla derivazione delle serie di potenze implica che per ogni x ∈ (−1, 1)
∞   ∞  
0
X α n−1
X α n
f (x) = (α − (n − 1)) x = (α − n) x
n−1 n
n=1 n=0
∞   ∞  
!0
X α n X α n
=α x −x x
n n
n=0 n=0
= αf (x) − xf 0 (x).
Da cui
(1 + x)f 0 (x) = αf (x) x ∈ (−1, 1)
−α
e f (0) = a0 = 1. Posto h(x) = (1 + x) f (x) per ogni x ∈ (−1, 1), si ha che h(0) = 1, h è
derivabile e
h0 (x) = −(1 + x)−α−1 αf (x) + (1 + x)−α f 0 (x) = 0 x ∈ (−1, 1).
Allora, h è costante uguale a 1, per cui f (x) = (1 + x)α per ogni (−1, 1).

Il seguente risultato estende alle serie di potenze, il principio di identità dei polinomi.

Cor. 5.15. Siano ∞


P n
P∞ n
n=0 an x e n=0 bn x due serie di potenze di centro x0 e raggi di
convergenza ρ1 > 0 e ρ2 > 0, rispettivamente. Se esiste 0 < δ < min{ρ1 , ρ2 } tale che per
ogni x ∈ (−δ, δ)
X∞ ∞
X
n
an x = bn xn ,
n=0 n=0
allora an = bn per ogni n ∈ N.

Dimostrazione. La serie di potenze ∞ n


P
n=0 (an − bn ) x converge a f (x) = 0 per ogni |x| < δ
(n)
e, ovviamente, f (0) = 0 per ogni n ∈ N. Il teorema precedente implica che
f (n) (0)
(an − bn ) = =0 n ∈ N,
n!
da cui an = bn . 
157

I risultati sopra ottenuti si estendono facilmente alle serie di potenze ∞ n


P
n=0 an (x − x0 )
di centro x0 arbitrario. In particolare, l’insieme di convergenza puntuale è un intervallo I
tale che
(x0 − ρ, x0 + ρ) ⊂ I ⊂ [x0 − ρ, x0 + ρ],
dove ρ è il raggio di convergenza della serie ∞
P n
P∞ n
n=0 an x , la somma n=0 an (x − x0 ) è
una funzione di classe C ∞ sull’intervallo (x0 − ρ, x0 + ρ) e an = f (n) (x0 )/n!.
Def. 5.16. Sia f : I → R con I ⊂ R intervallo tale che f sia derivabile infinite volte in I.
Fissato x0 ∈ I, la serie di potenze

X f (n) (x0 )
(x − x0 )n
n!
n=0

si chiama serie di Taylor di f con centro x0 (se x0 = 0 si chiama serie di Maclaurin).


La funzione f è sviluppabile in serie di Taylor con centro x0 nell’intervallo I se

X f (n) (x0 )
f (x) = (x − x0 )n ∀x ∈ I.
n!
n=0

Data una serie di potenze ∞ n


P
n=0 an (x − x0 ) con raggio di convergenzaPρ > 0, il teorema
sull’integrazione e derivazione implica che la funzione somma f (x) = ∞ n=0 an (x − x0 )
n

è sviluppabile in serie di Taylor di centro x0 in (x0 − ρ, x0 + ρ). Ad esempio, per quanto


visto sopra, le funzioni ex , log(1 + x) e (1 + x)α sono sviluppabili in serie di Maclaurin
rispettivamente in R, (−1, 1] e (−1, 1).

Teo 5.17 (Condizione sufficiente per la sviluppabilità in serie di Taylor). Sia f : I → R


con I ⊂ R intervallo tale che f sia derivabile infinite volte in I. Se esistono M > 0, L > 0
tali che per ogni n ∈ N
|f (n) (x)| ≤ M Ln ∀x ∈ I, (167)
allora, dato x0 ∈ I, f è sviluppabile in serie di Taylor con centro x0 in I.

Dimostrazione. Dato n ∈ N, la somma parziale n-esima della serie di Taylor di f è il


polinomio di Taylor Tn di f di centro x0
f (n) (x0 )
Tn (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + . . . + (x − x0 )n .
n!
Fissato x ∈ I, la formula di Taylor con il resto di Lagrange implica che esiste tx ∈ I tale
che
f (n+1) (tx )
f (x) = Tn (x) + (x − x0 )n+1 .
(n + 1)!
La condizione (167) implica
Ln+1
|f (x) − Tn (x)| ≤ M |x − x0 |n+1 . (168)
(n + 1)!
Ln
La condizione necessaria di Cauchy per la serie numerica ∞ n
P
n=0 n! |x − x0 | (che converge
essendo la serie esponenziale) assicura
Ln
|x − x0 |n = 0.
lim
n→+∞ n!

Facendo il limite per n che tende a +∞ della (168), il criterio del confronto implica
lim (f (x) − Tn (x)) = 0,
n→+∞

per cui limn→+∞ Tn (x) = f (x). 


158

La condizione (167) può essere indebolita. Infatti è sufficiente richiedere che, per ogni
x ∈ I, esistano M > 0, L > 0 (eventualmente dipendenti da x) tali che
|f (n) (t)| ≤ M Ln ∀t ∈ I, |t − x0 | ≤ |x − x0 |.
. Data una funzione f : I ⊂ R definita su un intervallo I aperto di classe C ∞ , fissato
x0 ∈ I denotiamo con Tn il polinomio di Taylor di centro x0 ed ordine n
f (n) (x0 )
Tn (x) = f (x0 ) + f 0 (x0 )(x − x0 ) + . . . + (x − x0 )n .
n!
Il teorema di Taylor con il resto di Peano assicura che fissato n ≥ 1
f (x) − Tn (x)
lim =0
x→x0 (x − x0 )n

cioè il resto f (x) − Tn (x) va a zero più velocemente di (x − x0 )n se x tende a x0 .


Se f inoltre è sviluppabile in serie di Taylor di centro x0 , la definizione implica che fissato
x∈I
lim f (x) − Tn (x) = 0.
n→+∞

Consideriamo una funzione f : I ⊂ R → R sviluppabile in serie di Taylor con centro x0 ∈ I


in un intorno (x0 − δ, x0 + δ), cioè

X f (n) (x0 )
f (x) = (x − x0 )n ∀x ∈ (x0 − δ, x0 + δ).
n!
n=0
P+∞ f (n) (x
0)
Ne segue che k=0 n! (z − x0 )n è una serie di potenze di centro x0 e raggio di
convergenza ρ > δ e, quindi, definisce una funzione
+∞ (n)
X f (x0 )
fˆ : B(x0 , ρ) ⊂ C → C fˆ(z) = (z − x0 )n ,
n!
k=0
tale che
fˆ(x) = f (x) x ∈ (x0 − δ, x0 + δ).
Esempio 5.18 (Esponenziale complesso). La funzione esponenziale f (x) = ex definita su
R è sviluppabile in serie di Taylor
+∞ n
X x
ex = x ∈ R.
n!
n=0
Ne segue che la serie di potenze
+∞ n
X z
=: ez
n!
n=0
converge su tutto C. Se z = x è reale coincide con l’esponenziale reale ex , se z = iy è
immaginario puro, allora
+∞ +∞ +∞
X yn X y 2k X y 2n+1
eiy = (i)n = (−1)k +i (−1)n = cos y + i sin y.
n! (2k)! (n + 1)!
n=0 k=0 n=0
Si può dimostrare che ez 1 +z 2 = ez1 ez2 per ogni z1 , z2 ∈ C. Ne segue che se z = x + iy ∈ C
con x, y ∈ R
ez = ex eiy = ex (cos y + i sin y).
159

Serie di Maclaurin di alcune funzioni elementari.

1 P∞
1−x = n=0 xn = 1 + x + x2 + x3 + . . . x ∈ (−1, 1)
P∞ 1
ex = n=0 n! xn = 1 + x + 12 x2 + 1 3
3! x + ... x∈R
P∞ (−1)n+1 n
log (1 + x) = n=1 n x = x − 12 x2 + 13 x3 + . . . x ∈ (−1, 1]
P∞ (−1)n 2n+1 1 3 1 5
sin x = n=0 (2n+1)! x = x− 3! x + 5! x + ... x∈R

P∞ (−1)n 2n
cos x = n=0 (2n)! x = 1 − 21 x2 + 1 4
4! x + ... x∈R

P∞ (−1)n 2n+1
arctan x = n=0 2n+1 x = x − 31 x3 + 15 x5 + . . . x ∈ [−1, 1]
P∞ α α(α−1) 2 α(α−1)(α−2) 3
(1 + x)α xn

= n=0 n = 1 + αx + 2 x + 3! x + . . . x ∈ (−1, 1)
α ∈ R α 6∈ N
P∞ n+k−1 P∞ n−1
(1 − x)−k xn xn−k
 
= n=0 k−1 = n=k k−1 x ∈ (−1, 1)
161

Parte 6. Sistemi di equazioni differenziali del primo ordine

Data una funzione F : A ⊂ Rn+1 → Rn , un sistema di equazioni differenziali del primo


ordine (in forma normale) è il problema di trovare una curva γ : I ⊂ R → Rn , dove I è un
intervallo e γ ∈ C 1 (I), tale che
γ 0 (t) = F (t, γ(t)) t ∈ I, (169)
dove nella (169) è sottinteso che (t, γ(t)) ∈ A per ogni t ∈ I. Fissato un intervallo I,
l’insieme di tutte le soluzioni del sistema (169) è detto integrale generale.
Nel caso n = 2, se
F (t, x, t) = f (t, x, y) i + g(t, x, t) j e γ(t) = x(t) i + y(t) j,
allora la (169) diventa (
x0 (t) = f (t, x(t), y(t))
t ∈ I.
y 0 (t) = g(t, x(t), y(t))
Se F non dipende esplicitamente dal tempo, cioè A = R × B e F (t, v) = F (v) per ogni
v ∈ B ⊂ Rn , il sistema (169) si dice autonomo.
Dato (t∗ , v ∗ ) ∈ A, il problema di Cauchy associato al sistema (169) è il problema di trovare
una curva γ : I ⊂ R → Rn , dove I è un intervallo contenente x∗ e γ ∈ C 1 (I), tale che
(
γ 0 (t) = F (t, γ(t)) t∈I
∗ ∗
. (170)
γ(t ) = v
Il vettore v ∗ si chiama condizione iniziale per t = t∗ .
Osserviamo che per i sistemi autonomi γ : I → Rn è una soluzione del problema di Cauchy
(
γ 0 (t) = F (γ(t)) t∈I
∗ ∗
,
γ(t ) = v
se e solo se Γ : J → Rn , Γ(t) = γ(t + t∗ ) dove J = {t − t∗ | t ∈ I}, è una soluzione del
problema di Cauchy (
γ 0 (t) = F (γ(t)) t∈J

.
γ(0) = v
Date due soluzioni γ1 : I1 → Rn e γ2 : I2 → Rn del sistema (169) tali che I1 ed I2 sono
intervalli aperti, I1 ∩ I2 6= ∅ e
γ1 (t) = γ2 (t) t ∈ I1 ∩ I2 ,
allora (
γ(t) = γ1 (t) t ∈ I1
γ : I1 ∪ I2 → Rn
γ(t) = γ2 (t) t ∈ I2
è ancora una soluzione di (169) definita sull’intervallo I1 ∪ I2 ed è detta prolungamento.
Una soluzione è detta massimale se non ammette prolungamenti.
Una classe importante di esempi è dato dai sistemi lineari a coefficienti constanti. Data
una matrice A di taglia n × n definiamo
F (t, v) = Av (t, v) ∈ R × Rn ,
allora la (169) è data esplicitamente da
γ 0 (t) = Aγ(t).
Se n = 2 ed A = [ ac db ], il sistema diventa
(
x0 (t) = ax(t) + by(t)
.
y 0 (t) = cx(t) + cy(t)
162

Come vedremo questi sistemi ammettono sempre una soluzione definita su tutto R. Con-
sideriamo due semplici casi.
Esempio 6.1. Il sistema
(
x0 (t) = 3x(t)

3 0
A=
y 0 (t) = −y(t) 0 −1
ha come soluzione (
x(t) = α1 e3t
α1 , α2 ∈ R,
y(t) = α2 e−t
mentre il sistema (
x0 (t) = y(t)
 
0 1
A=
y 0 (t) = 0 0 0
ha come soluzione (
x(t) = α2 t + α1
α1 , α2 ∈ R.
y(t) = α2

Con una scelta opportuna della funzione F il sistema (169) è equivalente al problema
di risolvere un’equazione differenziale normale di ordine n. Infatti, data una funzione
f : A ⊂ Rn+1 → R, consideriamo il problema di trovare una funzione x = x(t), definita su
un intervallo I e di classe C n (I), che soddisfi
x(n) (t) = f (t, x(t), x0 (t), . . . , x(n−1) (t)) t ∈ I. (171)
Definiamo 


f1 (t, v) = v2

f2 (t, v) = v3


F = (f1 , . . . , fn ) : A → Rn F : ... .

fn−1 (t, v) = vn





f (t, v) = f (t, v)
n
Con questa scelta, una curva γ(t) = (x1 (t), . . . , xn (t)) è soluzione di (169) se e solo esiste
una funzione x = x(t) che soddisfa la (171) e valgono le seguenti relazioni


 x1 (t) = x(t)
x (t) = x0 (t)

2
t ∈ I.

 ...

xn (t) = x(n−1) (t)

La condizione iniziale del problema di Cauchy (169) diventa


 ∗ ∗
x(t ) = v1

x0 (t∗ ) = v ∗

2
.

 . . .

 (n−1) ∗
x (t ) = vn∗

In generale non è garantita né l’esistenza né l’unicità della soluzione di un problema di


Cauchy come mostrano i due seguenti esempi.
Esempio 6.2. Il problema di Cauchy
(
x0 (t) = 1 − x(t)2 + 1
p
p
F (t, v) = 1 − v 2 + 1 (t, v) ∈ R × [−1, 1]
x(0) = 1
non ammette soluzione. Infatti, se per assurdo esistesse x(t) definita in un intorno di t∗ = 0
e di classe C 1 , allora x0 (0) = 1 > 0 e, quindi, esisterebbe δ > 0, tale che x0 (t) > 0 per
163

|t| < δ. Allora x(t) sarebbe strettamente crescente e, in particolare, x(t) > 1 per 0 < t < δ,
che è assurdo.
Esempio 6.3. Il problema di Cauchy
(
x0 (t) = 3 3 x(t)2 √
p
3
F (t, v) = 3 v 2 (t, v) ∈ R2
x(0) = 0
ammette più soluzioni definite su tutto R
(
3 t3 t>0
x1 (t) = 0 x2 (t) = t x3 (t) = .
0 t≤0

Tuttavia, il seguente risultato mostra che sotto deboli condizioni su F il corrispondente


problema di Cauchy ammette sempre un’unica soluzione, almeno localmente.
Teo 6.4. Data F : A ⊂ Rn+1 → Rn dove A è aperto ed F 1 (A), per ogni (t∗ , v ∗ ) ∈ A esiste
δ > 0 tale che il problema di Cauchy
(
γ 0 (t) = F (t, γ(t))
γ(t∗ ) = v ∗
ammette un’unica soluzione definita sull’intervallo I = (t∗ − δ, t∗ + δ).

Il precedente teorema non garantisce né l’esistenza né l’unicità in grande, come mostrano


i seguente esempi.
Esempio 6.5. Il problema di Cauchy
(
x0 (t) = −x(t)2
F (t, v) = −v 2 (t, v) ∈ R2
x(1) = 1
ammette un’unica soluzione x(t) = 1/t definita su (0, +∞) che non può essere estesa su
un intervallo più ampio poiché limt→0+ x(t) = +∞.
Esempio 6.6. Il problema di Cauchy
(
x0 (t) = 3 3 x(t)2
p

x(1) = 1

ammette un’unica soluzione x(t) = t3 in un intorno di t∗ = 1, ma ammette due soluzioni


definite su tutto R
(
t3 t > 0 √
3
x1 (t) = t3 x3 (t) = F (t, v) = 3 v 2 (t, v) ∈ R2 .
0 t≤0

È tuttavia possibile avere esistenza “in grande” sotto ipotesi più forti sulla funzione F .
Teo 6.7. Sia F : I × Rn → Rn dove I ⊂ R è un intervallo aperto ed F 1 (I × Rn ), tale che
per ogni intervallo compatto J = [a, b] ⊂ I
kF (t, v)k ≤ aJ kvk + bJ t ∈ J, v ∈ Rn ,
dove aJ , bJ > 0 sono constanti che possono dipendere da J. Allora per ogni t∗ ∈ I e
v ∗ ∈ Rn esiste unica soluzione del problema di Cauchy
(
γ 0 (t) = F (t, γ(t))
γ(t∗ ) = v ∗
definita su tutto I.
164

15. Sistemi lineari a coefficienti costanti.

Iniziamo lo studio dei sistemi di equazioni differenziali dal caso più semplice dei sistemi
lineari (a coefficienti costanti).

15.1. Esponenziale di una matrice. Indichiamo con Mn (C) lo spazio vettoriale (sui
numeri complessi) delle matrici n × n a coefficienti in C e con Mn (R) il sottoinsieme delle
matrici a coefficienti reali. Denotiamo con
   
0 0 ... 0 1 0 ... 0
0 0 ... 0  0 1 ... 0 
0= 
. . . . . . . . . . . . I= 
. . . . . . . . . . . .
0 0 ... 0 0 0 ... 1

la matrice nulla e la matrice identità e, dati λ1 , . . . , λn ∈ C,


 
λ1 0 ... 0
 0 λ2 ... 0 
diag(λ1 , . . . , λn ) = 
. . . . . .

. . . . . .
0 0 . . . λn

le matrici diagonali.
Dati A, B ∈ Mn (C) la matrice prodotto AB è definita da
n
X
(AB)ij = Aik Bkj i, j = 1, . . . n,
k=1

e la matrice aggiunta A∗
(A∗ )ij = Aji i, j = 1, . . . n.
La norma (di Frobenius o Hilbert-Schmidt) di A ∈ Mn (C) è
n
X
kAk2 = |Aij |2 . (172)
i,i=1

Valgono le seguenti proprietà.

Prop. 6.8. Per ogni A, B ∈ Mn (C), v ∈ Cn e λ ∈ C


kAk > 0 A 6= 0 (173a)
kAk = 0 A=0 (173b)
kλAk = |λ| kAk (173c)
kA + Bk ≤ kAk + kBk (173d)

kA k = kAk (173e)
kABk ≤ kAk kBk (173f)
kAvk ≤ kAk kvk. (173g)

2
Dimostrazione. Identificando Mn (C) con Cn , la norma (172) coincide con l’usuale norma
2
in Cn , da cui seguono le proprietà (173a)–(173d). La definizione di matrice aggiunta
implica immediatamente la (173e) .
165

Per dimostrare la (173f), definiamo


 t
a1
 t
 a2   
A= 
. . . B = b1 b2 . . . bn
 
atn
dove at1 , . . . , atn ∈ Cn sono le righe della matrice A e b1 , . . . , bn ∈ Cn sono le colonne della
matrice B. Allora
X XX X
kABk2 = |(AB)ij |2 = | Aik Bkj |2 = |ai · bj |2
ij ij k ij
X X X
≤ kai k2 kbj k2 = |Aik |2 |Bkj |2 = kAk2 kBk2
ij ik kj

dove bj è il vettore le cui componenti sono il complesso coniugato delle rispettive com-
ponenti di bj e la seconda riga è conseguenza della disuguaglianza di Cauchy-Schwartz.
La (173g) si dimostra in modo simile. 
P+∞
Diremo che la serie di matrici k=0 Ak converge ad A ∈ Mn (C) se
XN
lim k Ak − Ak = 0,
N →+∞
k=0

equivalentemente, per ogni v ∈ Cn ,


N
X
lim k Ak v − Avk = 0,
N →+∞
k=0

oppure, per ogni i, j = 1, . . . n,


+∞
P


 Re(Ak )ij = Re Aij
+∞
X k=0

(Ak )ij = Aij ⇐⇒ . (174)
k=0


 +∞
P

 Im(Ak )ij = Im Aij
k=0

Il seguente risultato fornisce una condizione sufficiente per la convergenza di una serie di
matrici.
+∞
P +∞
P
Prop. 6.9. Data una serie Ak tale che la serie numerica kAk k sia convergente,
k=0 k=0
+∞
P
allora la serie Ak converge.
k=0

La seguente proposizione estende la definizione di funzione esponenziale al caso in cui A è


una matrice. Ricordiamo che se z = a + ib ∈ C, allora

X zk
ez = ea (cos a + i sin b) = ,
k!
k=0

e, data A ∈ Mn (C), definiamo, per induzione, per ogni k ∈ N,


A0 = I A1 = A A2 = AA ... Ak = Ak−1 A.
. Con la precedente definizione se A è la matrice nulla 0, allora 00 = I.
166

Prop. 6.10. Data A ∈ Mn (C), la serie


+∞ k
X A 1 1 1
= I +A + A2 + A2 + . . . + Ak + . . .
k! 2 3! k!
k=0
converge e la somma si denota con
+∞ k
A
X A
exp(A) = e = .
k!
k=0

Inoltre valgono le seguenti proprietà:

a) exp(0) = I;
b) se A ∈ Mn (R) allora exp(A) ∈ Mn (R);
c) se V ∈ Mn (C) è invertibile, allora
exp(V AV −1 ) = V exp(A)V −1 ; (175)

d) se B ∈ Mn (C) tale che AB = BA allora


exp(A)B = B exp(A) (176a)
exp(A) exp(B) = exp(B) exp(A). (176b)

+∞ k
k Ak! k
P
Dimostrazione. Per la Prop. 6.9 è sufficiente dimostrare che la serie numerica
k=0
converge. Dalla (173f) per ogni k ≥ 1 vale6
kAk k ≤ kAkk ,
allora, per ogni N ≥ 1,
N N +∞
X Ak X kAkk √ X kAkk √
≤ kIk + ≤ n+ = n + exp(kAk) − 1 < +∞
k! k! k!
k=0 k=1 k=1
+∞ k
k Ak! k converge.
P
ed il criterio del confronto implica che la serie 
k=0

Dimostriamo le altre proprietà.

a) se A = 0, allora Ak = 0 per ogni k ≥ 1 e A0 = I;


N
Ak
b) segue dal fatto che se A ∈ Mn (R), allora Ak ∈ Mn (R) e, quindi
P
k! ∈ Mn (R);
k=0
c) poiché V −1 V = V V −1 = I e per ogni k ≥ 1
 
V Ak V −1 = V Ak−1 V −1 V AV −1 ,
k
per induzione segue che V Ak V −1 = V AV −1
per ogni k ∈ N. Fissato N ∈ N
N N
!
X 1 k X 1
V AV −1 − V exp(A)V −1 k = kV Ak − exp(A) V −1 k

k
k! k!
k=0 k=0
N
X 1 k
≤ kV kk A − exp(A)kkV −1 k,
k!
k=0

6La disuguaglianza non vale per k = 0 poiché kA0 k = kIk = √n, mentre kAk0 = 1.
167

dove l’ultima disuguaglianza segue dalla (173f). Allora


N
X 1 k
lim k V AV −1 − V exp(A)V −1 k = 0,
N →+∞ k!
k=0
da cui la tesi.
d) La dimostrazione della (176a) è simile a quella del punto precedente, tenuto conto che
per ogni k ∈ N, si ha che Ak B = BAk . La (176b) segue dalla (176a), sostituendo B
con exp(B), che commuta con A per la (176a).
L’equazione (175) permette di calcolare la matrice esponenziale nel caso in cui A sia una
matrice diagonalizzabile (su C). Infatti, per definizione esiste una matrice V ∈ Mn (C)
invertibile tale che
A = V DV −1 = V diag(λ1 , λ2 , . . . , λn )V −1 .
Osservando che Dk = diag(λk1 , λk2 , . . . , λkn ), si ha immediatamente che
exp(D) = diag(eλ1 , eλ2 , . . . , eλn ),
e, quindi,
exp(A) = V diag(eλ1 , eλ2 , . . . , eλn )V −1 . (177)

Da notare che se A = A, allora A è sempre diagonalizzabile con una matrice V tale che
V −1 = V ∗ .
. Anche se A ∈ Mn (R), in generale V e D sono in Mn (C), tuttavia exp(A) = V exp(D)V −1
è in Mn (R) per la proprietà b) della Prop. 6.10.
Esempio 6.11. Data la matrice 2 × 2
 
0 −1
A=
1 0
allora
    
 

1 0
0 10 −1 2 −1 0 3 0 1
A = A = A = = −I A = −A = ,
0 1 1 0 0 −1 −1 0
da cui segue che Ak+4n = Ak per ogni k = 0, 1, 2, 3 ed n ∈ N. Allora
 P∞
− ∞

1 1
(−1)k (2k)! θ2k (−1)k (2k+1)! θ2k+1
P
X 1 k=0 k=0
exp(θA) = Ak = P∞ P∞ 
k! k 1 2k+1 k 1 2k
k=0 k=0 (−1) (2k+1)! θ k=0 (−1) (2k)! θ
 
cos θ − sin θ
= .
sin θ cos θ
Esempio 6.12. Data la matrice 2 × 2
 
0 1
A=
1 0
si verifica che
      
1 1 −1 1 0 1 1 1
A= √ √ = V DV −1 ,
2 1 1 0 −1 2 −1 1
allora
    t     
1 1 −1 e 0 1 1 1 cosh t sinh t
exp(tA) = V exp(D)V −1 = √ √ = .
2 1 1 0 e−t 2 −1 1 sinh t cosh t

Ricordiamo che una funzione A(t) ∈ Mn (C), dove t ∈ I ed I è un intervallo, è di classe


C k (I) se per ogni i, j = 1, . . . , n le funzioni Re Aij (t) e Im Aij (t) sono entrambe di classe
C k (I). Un’analoga definizione valgono per le funzione v(t) ∈ Cn . Inoltre valgono le seguenti
regole
(A(t)B(t))0 = A(t)0 B(t) + A(t)B(t)0 (A(t)v(t))0 = A(t)0 v(t) + A(t)v(t)0 ,
dove A(t), B(t) ∈ Mn (C) e v(t) ∈ Cn sono di classe C 1 .
168

Prop. 6.13. Data A ∈ Mn (C) la funzione


F : R → Mn (C) F (t) = exp(tA)
è di classe C ∞ (R) e valgono le seguenti proprietà

exp(tA)0 = A exp(tA) (178a)

exp(tA)|t=0 = I (178b)
exp((t + s)A) = exp(tA) exp(sA) (178c)
−1
exp(−tA) = exp(tA) (178d)
per ogni s, t ∈ R. Inoltre, se B ∈ Mn (C) tale che AB = BA, allora
exp(t(A + B)) = exp(tA) exp(tB). (178e)

Dimostrazione. Dimostriamo la (178a). Fissati i, j = 1, . . . , n, la definizione di matrice


esponenziale e la (174) implicano che
+∞
X (Ak )ij
exp(tA)ij = tk t ∈ R,
k!
k=0

cioè Fij (t) è una serie di potenze con raggio di convergenza infinito e, di conseguenza, è di
classe C ∞ (R). Derivando termine a termine, per ogni t ∈ R,
+∞ +∞ n n +∞
X (Ak )ij k−1 X X (Ak−1 )`j tk−1 X X (Ak )`j k
exp(tA)0ij = t = (A)i` = (A)i` t
(k − 1)! (k − 1)! k!
k=1 k=1 `=1 `=1 k=0
= A exp(tA).
La (178b) segue dal fatto che exp(0) = I. Per provare la (178d), osserviamo che, per ogni
t∈R
(exp(tA) exp(−tA))0 = exp(tA)0 exp(−tA) + exp(tA) exp(t(−A))0
 

= A exp(tA) exp(−tA) + exp(tA)(−A) exp(−tA) = 0,


dove la seconda uguaglianza segue dalla (178a) e la terza dalla (176a). Ne segue che
exp(tA) exp(−tA) = (exp(tA) exp(−tA))|t=0 = I I = I,
per la (178b). Dalla precedente relazione e dal fatto che exp(tA) è una matrice quadrata,
segue che exp(tA) è invertibile com inversa exp(−tA).
Analogamente a prima, per dimostrare la (178e), osserviamo che, per ogni t ∈ R
(exp(tA + tB) exp(−tA) exp(−tB))0 = exp(tA + tB)0 exp(−tA) exp(−tB) +


+ exp(tA + tB) exp(−tA)0 exp(−tB) +




+ exp(tA + tB) exp(−tA) exp(−tB)0




= (A + B) exp(tA + tB) exp(−tA) exp(−tB)+


− exp(tA + tB)A exp(−tA) exp(−tB)+
− exp(tA + tB) exp(−tA)B exp(−tB) = 0,
poiché AB = BA. Ne segue che
exp(tA + tB) exp(−tA) exp(−tB) = I t∈I
169

e, per la (178d), segue la (178e) e, quindi, la (178c) scegliendo B = sA/t se t 6= 0 (altrimenti


la tesi è banale). 
. Se le matrici A e B non commutano, la (178e) in generale non è vera. Ad esempio
       
0 1 0 0 1 0 0 0
A= B= AB = 6= = BA.
0 0 1 0 0 0 0 1
Inoltre, poiché A2 = B 2 = 0, allora
   
1 t 1 0
exp(tA) = exp(tB) = .
0 1 t 1
Viceversa, (A + B) = [ 01 10 ], e, tenuto conto dell’esempio 6.12,
1 + t2 t
   
cosh t sinh t
exp(t(A + B)) = 6= = exp(tA) exp(tB).
sinh t cosh t t 1

15.2. Sistemi di equazioni differenziali a coefficienti costanti. Il seguente risulta-


to mostra che un sistema di equazioni differenziali definito da una matrice A ∈ Mn (C)
ammette sempre una soluzione.

Teo 6.14. Dati A ∈ Mn (C) e v ∗ ∈ Cn il problema di Cauchy


(
γ 0 (t) = Aγ(t)
(179)
γ(0) = v ∗
ha come unica soluzione
γ(t) = exp(tA)v ∗ t ∈ I. (180)
1 n n
Fissata una base v , . . . v di C , l’integrale generale del sistema
γ 0 (t) = Aγ(t) (181)
è dato da
n
X
1
Integrale generale = {γ ∈ C (R) | γ(t) = αi exp(tA)v i , α1 , . . . , αn ∈ C} (182)
i=1
= {γ ∈ C 1 (R) | γ(t) = exp(tA)V α, α ∈ Cn }
n
X
1
= {γ ∈ C (R) | γ(t) = αi γ i (t), α1 , . . . , αn ∈ R}
i=1
dove
 
α1
 α2  n
V = v 1 |v 2 | . . . |v n ∈ Mn (C) γ i (t) = exp(tA)v i .
 
. . . ∈ C
α= 

αn

Dimostrazione. Per la Prop. 6.13 la funzione γ(t) = exp(tA)v ∗ è di classe C 1 (R) e vale
(exp(tA)v ∗ )0 = A exp(tA)v ∗ (exp(tA)v ∗ )|t=0 = v ∗ .
Se Γ : R → Rn è un’altra soluzione allora
(exp(−tA)Γ(t))0 = exp(−tA)0 Γ(t)+exp(−tA)Γ(t)0 = −A exp(−tA)Γ(t)+exp(−tA)AΓ(t) = 0,
dove la seconda uguaglianza segue dalla (178a) e dal fatto che Γ è soluzione di (179). Allora
exp(−tA)Γ(t) = (exp(−tA)Γ(t))t=0 = Γ(0) = v ∗ ,
da cui Γ(t) = exp(tA)v ∗ per la (178d).
170

Mostriamo la (182). Fissati α1 , . . . , αn ∈ Cn , poiché exp(tA) è una matrice,


n n
!
X X
i
αi exp(tA)v = exp(tA) αi v = exp(tA)V α = exp(tA)v ∗
i

i=1 i=1
n
X
= αi γ i (t)
i=1
dove v∗ = V α. La (180) implica che exp(tA)v ∗ è soluzione di (181) e, quindi
n
X
Integrale generale ⊃ {γ ∈ C 1 (R) | γ(t) = αi exp(tA)v i , α1 , . . . , αn ∈ C}.
i=1

Viceversa, data una soluzione del sistema γ(t)0


= Aγ(t), definita su tutto R, posto v ∗ =

γ(0), allora per la (180) γ(t) = exp(tA)v . Poiché v 1 , . . . , v n è una base, esiste α =
(α1 , . . . , αn ) ∈ Cn tale che
n
X
v∗ = αi v i = V α,
i=1
da cui la (182). 
. Per quanto osservato sui sistemi autonomi, se la condizione iniziale del problema di
Cauchy (179) è γ(t∗ ) = v ∗ , allora la soluzione è γ(t) = exp((t − t∗ )A)v ∗ .

La (182) mostra che l’integrale generale di un sistema di equazioni differenziali lineare a


coefficienti costanti è un sotto-spazio V dello spazio vettoriale C 1 (R) e V è generato dalle
soluzioni γ 1 , . . . , γ n associate alla base v 1 , . . . , v n di Cn . In effetti γ 1 , . . . , γ n è una base V
poiché le funzioni sono linearmente indipendenti. Infatti, se α1 , . . . , αn ∈ Cn sono tali che
n
X
αi γ i (t) = 0 ∀t ∈ R,
i=1
allora, in particolare per t = 0,
n
X n
X
i
0= αi γ (t) = αi vi .
i=1 i=1

Essendo v 1 , . . . , v n una base segue che α1 = . . . = αn = 0. Inoltre, una funzione γ ∈ C 1 (R)


soddisfa il problema di Cauchy (179) per un fissato v ∗ ∈ Cn se e solo se
 
α1
n
 α2  = V −1 v ∗ .
X
αi γ i
 
γ= dove . . .
i=1
αn
La famiglia γ 1 , . . . , γ n è detta famiglia fondamentale di soluzioni del sistema (180).
Il problema di risolvere il sistema (179) è, quindi, ricondotto al calcolo della matrice espo-
nenziale exp(tA) ed alla scelta di una base opportuna v 1 , . . . , v n di Cn . Consideriamo
alcuni casi.

15.2.1. Matrici diagonalizzabili. Se A è una matrice diagonalizzabile su C allora esiste una


base v 1 , . . . , v n di Cn ed una famiglia λ1 , . . . , λn ∈ C tali che
Av i = λi v i i = 1, . . . n.
Definiamo
V = v 1 |v 2 | . . . |v n ∈ Mn (C)
 
D = diag(λ1 , . . . , λn ),
allora V è invertibile e
A = V DV −1 exp(tA) = V diag(eλ1 t , . . . , eλn t )V −1 .
171

Scegliendo come base nella (182) gli autovettori v 1 , . . . , v n di A, ne segue che una famiglia
fondamentale di soluzioni per il sistema (179) è data da
γ 1 (t) = eλ1 t v 1 ... γ n (t) = eλn t v n ,
e la soluzione del problema di Cauchy (180) è data da
 
α1
n
X  α2 
γ(t) = λi t i
αi e v   = V −1 v ∗ .
. . .
i=1
αn

15.2.2. Matrici nilpotenti. Se A è una matrice nilpotente esiste m ∈ N tale che Am = 0.


In tal caso m è detto indice di nilpotenza di A se Am−1 6= 0. Inoltre, Ak = 0 per ogni
k ≥ m e, quindi,
m−1
X 1 k k 1
Am−1 tm−1 = pij (t) i,j=1,...,n ,
 
exp(tA) = A t = I +tA + . . . +
k! (m − 1)!
k=0

dove i coefficienti pij (t) sono polinomi nella variabile t di grado minore od uguale ad m − 1
(ed almeno uno dei coefficienti è di grado m − 1).
Scelta la base canonica e1 , . . . , en di Cn nella (182), una famiglia fondamentale di soluzioni
è data da    
p11 (t) p1n (t)
γ 1 (t) =  . . .  ... γ n (t) =  . . .  .
pn1 (t) pnn (t)
Essendo la matrice V associata alla base canonica la matrice identità, la soluzione del
problema di Cauchy (180) è
Xn
γ(t) = vi∗ γ i (t).
i=1

15.2.3. Matrici arbitrarie. Osserviamo preliminarmente che, data una matrice A ∈ Mn (C),
per il teorema di Jordan esistono (uniche) matrici S ed N tali che S è diagonalizzabile ed
N è nilpotente e
A=S+N SN = N S. (183)
Per la (178e) segue che
exp(tA) = exp(tS) exp(tN ),
per cui il problema dl calcolo di exp(tA) può essere ricondotto a quanto visto nei casi
precedenti.
Il teorema di Jordan, inoltre, assicura che esistono una matrice invertibile
V = v 1 |v 2 | . . . |v n ∈ Mn (C),
 

dove v 1 , . . . , v n è una base di Cn , ed una matrice diagonale a blocchi


 
J1 0 . . . 0
 0 J2 . . . 0 
J = . . . . . . . . . . . . ∈ Mn (C),

0 0 . . . J`
e ciascun blocco Jk è una matrice quadrata di taglia dk × dk della forma
 
λk 1 0 ... ... 0
0 λk 1 0 ... 0 
can
 
. . .
Jk =   = λk I +Nk ∈ Mdk (C),
. . . . . . . . . . . . . . .
0 0 . . . 0 λk 1 
0 0 . . . . . . 0 λk
172

tali che
 
exp(tJ1 ) 0 ... 0
0 exp(tJ 2) ... 0
A = V JV −1
  −1
exp(tA) = V 
 ...
V ,
... ... ... 
0 0 . . . exp(tJ` )
con
exp(tJk ) = eλk t exp(tNkcan ) ∈ Mdk (C).
Il calcolo di exp(tNkcan ) è molto semplice. Infatti, data una generica matrice B ∈ Mdk , il
prodotto Nkcan B è la matrice che si ottiene spostando verso l’alto le righe di B, mentre
l’ultima riga è nulla, cioè
  
0 1 ... ... 0 b11 b12 ... b1(dk −1) b1dk
  b21 b22 ... b1(dk −1) b1dk 
0 0 1 ... 0  
can
 
Nk B = . . . . . . . . . . . . . . .  . . .
   ... ... ... ...  
0 0 ... 0 1  b(dk −1)1 b(dk −1)2 . . . b(dk −1)(dk −1) b(dk −1)dk 
0 0 ... ... 0 bdk 1 bn2 ... bdk (dk −1) bdk dk
 
b21 b22 . . . b1dk
 ... ... ... ... 
=bdk 1 bdk 2 . . . bdk dk  .

0 0 ... 0
Riportiamo l’espressione esplicita nel caso dk = 2, 3
t2
 
  1 t
1 t 2
exp(tNkcan ) = dk = 2 exp(tNkcan ) = 0 1 t dk = 3.
0 1
0 0 1
Con questa scelta di V , la (182) assicura che una famiglia fondamentale è data da
 
0

 0 

 . . . 
i i i λk t 
 i

γ (t) = exp(tA)v = V exp(tJ)e = e V exp(tNk )Pk e  ,

 0 

 ... 
0
dove e1 , . . . en è la base canonica di C e Pk ei è la proiezione sul k-esimo blocco.
Riportiamo la forma esplicita delle soluzioni corrispondenti al caso in cui J1 sia un blocco
di Jordan di dimensione 2 o 3
d1 = 2 : γ 1 (t) = eλ1 t v 1 γ 2 (t) = eλ1 t (v 2 + tv 1 )
t2 1
d1 = 3 : γ 1 (t) = eλ1 t v 1 γ 2 (t) = eλ1 t (v 2 + tv 1 ) γ 2 (t) = eλ1 t (v 3 + tv 2 +
v ).
2
Osserviamo che λ1 è un autovalore di A con molteplicità maggiore di 1. Il vettore v 1 è un
autovettore di A, cioè
Av 1 = λ1 v 1 =⇒ (A − λ1 I)v 1 = 0,
mentre v 2 e v 3 sono autovettori generalizzati di A, cioè
d1 = 2, 3 : (A − λ1 I)v 2 = v 1 =⇒ (A − λ1 I)2 v 2 = 0
d1 = 3 : (A − λ1 I)v 3 = v 2 =⇒ (A − λ1 I)3 v 3 = 0.
. Occorre prestare attenzione al caso in cui due o più blocchi di Jordan abbiano lo stesso
autovalore. Ad esempio nel caso n = 3 se
 
λ1 1 0
J =  0 λ1 0  ,
0 0 λ1
173

allora λ1 è un autovalore con moltiplicità algebrica 3 e geometrica 2, cioè


ker (A − λ1 I) = {av1 + bv3 | a, b ∈ C},
mentre v2 è un autovettore generalizzato di A tale che
Av2 = v1 6= v3 ⇐⇒ (A − λ1 )2 v2 = 0 e v2 ∈
/ {av1 + bv3 | a, b ∈ C}.
Tuttavia poiché n = 3 la matrice N = A − λ1 I è nilpotente con ordine di nilpotenza 2 per
cui
exp(tN ) = I +tN.

15.2.4. Soluzioni per n = 3. Consideriamo esplicitamente il caso A ∈ M3 (R). Il primo


passo è trovare le soluzioni dell’equazione di terzo grado
det (A − λI) = 0.
Indichiamo con λ1 , λ2 , λ3 ∈ C gli autovalori, eventualmente ripetuti in accordo con la
molteplicità, ed ordinati per molteplicità decrescente
molteplicità(λ1 ) ≥ molteplicità(λ2 ) ≥ molteplicità(λ3 ).

Caso 1. Se
dim ker (A − λi I) = molteplicità(λi ) i = 1, 2, 3,
allora esistono v1, v2, v3 ∈ C3 linearmente indipendenti tali che
(A − λi I)v i = 0 ⇐⇒ Av i = λi v i i = 1, 2, 3.
Definiamo γi : R → C3
γi (t) = eλi t v i i = 1, 2, 3,
allora  λt 
 1 2 3 e 0 0 
1
t
exp(tA) = v v v  0 eλ2 t 0  v1 v2 v3 ,
0 0 eλ3 t
e l’integrale generale del sistema (181) è
{α1 eλ1 t v 1 + α2 eλ2 t v 2 + α3 eλ3 t v 3 | α1 , α2 , α3 ∈ C}.

Caso 2. Se
dim ker (A − λ1 I) = 1 < molteplicità(λ1 ) = 2 dim ker (A − λ3 I) = molteplicità(λ3 ) = 1,
allora
λ1 = λ2 = λ 6= λ3 ,
gli autovalori sono reali ed esistono v 1 , v 3 ∈ R3 linearmente indipendenti tali che
(A − λI)v 1 = 0 (A − λ3 )v 3 = 0.
Inoltre esiste v 2 ∈ R3 tale che
(A − λI)v 2 = v 1
Definiamo γi : R → R3
γ1 (t) = eλt v 1 γ1 (t) = eλt (v 2 + tv 1 ) γ3 (t) = eλ3 t v 3 ,
allora  λt
teλt

e 0  t
exp(tA) = v 1 v 2 v 3  0 eλt 0  v1 v2 v3 ,
 

0 0 e λ3 t
e l’integrale generale del sistema (181) è
{α1 eλt v 1 + α2 eλt (v 2 + tv 1 ) + α3 eλ3 t v 3 | α1 , α2 , α3 ∈ C}.
174

Caso 3. Se
dim ker (A − λ1 I) = 2 < molteplicità(λ1 ) = 3
allora
λ1 = λ2 = λ3 = λ,
gli autovalori sono reali. Esiste v1 6= 0 ∈ R3 tale che
v 1 ∈ Im(A − λI) dim Im(A − λI) = 1,
che soddisfa
(A − λI)v 1 = 0.
Inoltre esiste v 3 ∈ R3 linearmente indipendente da v 1 tale che
(A − λI)v 3 = 0.
Infine, esiste v 2 ∈ R3 tale che
(A − λI)v 2 = v 1 .
Definiamo γi : R → R3
γ1 (t) = eλt v 1 γ1 (t) = eλt (v 2 + tv 1 ) γ3 (t) = eλ3 t v 3
allora  
1 t 0  t
exp(tA) = eλt v 1 v 2 v 3 0 1 0 v 1 v 2 v 3 ,
 
0 0 1
e l’integrale generale del sistema (181) è
{α1 eλt v 1 + α2 eλt (v 2 + tv 1 ) + α3 eλt v 3 | α1 , α2 , α3 ∈ C}.

Caso 4. Se
dim ker (A − λ1 I) = 1 < molteplicità(λ1 ) = 3,
allora
λ1 = λ2 = λ3 = λ,
gli autovalori sono reali. Inoltre, esiste v 1 6= 0 ∈ R3 tale che
(A − λI)v 1 = 0.
Inoltre, esistono v 2 , v 3 ∈ R3 tali che
(A − λI)v 2 = v 1 (A − λI)v 3 = v 2 .
Definiamo γi : R → R3
t2 3
γ1 (t) = eλt v 1 γ1 (t) = eλt (v 2 + tv 1 ) γ3 (t) = eλt (v 3 + tv 2 + v )
2
allora
t2
 
 1 t 2 t
exp(tA) = eλt v 1 v 2 v 3 0 1 t  v1 v2 v3 ,
 

0 0 1
e l’integrale generale del sistema (181) è
t2 1
{α1 eλt v 1 + α2 eλt (v 2 + tv 1 ) + α3 eλt (v 3 + tv 2 + v ) | α1 , α2 , α3 ∈ C}.
2
. Nel Caso 3 e Caso 4 si vede facilmente che la decomposizione di Jordan (183) è
A = λI + N
dove N = A − λI è una matrice nilpotente di ordine 2 (Caso 3) e 3 (Caso 4). Ne segue
che ( λt
e (I  + tN ) 2  Caso 3
exp(tA) = λt t 2
e I + tN + 2 N Caso 4.
175

15.3. Programmi per calcolare la forma canonica. La diagonalizzazione di una ma-


trice o il calcolo della forma quadratica è in generale molto lungo. Si possono utilizzare
programmi di calcolo scientifico, quali Python, che è gratuito, oppure MatLab a pagamento.
 
a b
In Python, se la matrice è A = , per diagonalizzare
c d
In [1]: import numpy as np
In [2]: A = [Link]([[a, b] , [c , d]])
In [3]: D, V = [Link](A),
mentre per il calcolo della forma canonica di Jordan
In [1]: import numpy as np
In [2]: from sympy import Matrix
In [3]: A =[Link]([[a, b] , [c , d]])
In [4]: B = Matrix(A)
In [5]: V, J = B.jordan_form()
. La prima procedura, se A non è diagonalizzabile, calcola solo gli autovettori (che
vengono eventualmente ripetuti). La seconda procedura è instabile numericamente.

16. Sistemi lineari non autonomi.

In questa sezione consideriamo il caso di sistemi di equazioni differenziali lineari, i cui


coefficienti dipendono esplicitamente dal variabile t.

16.1. Caso omogeneo. Trattiamo per primo il caso di sistemi omogenei.

Teo 6.15. Dato I ⊂ R intervallo aperto , sia A(t) ∈ Mn (R), t ∈ I, una funzione di
classe C 1 (I).
a) Dati t∗ ∈ I e v ∗ ∈ Rn esiste unica soluzione del problema di Cauchy
(
γ 0 (t) = A(t)γ(t)
γ(t∗ ) = v ∗
definita su tutto l’intervallo I;
b) l’integrale generale del sistema
γ 0 (t) = A(t)γ(t)
è uno sotto-spazio vettoriale W di dimensione n dello spazio vettoriale
C 1 (I, Rn ) = {γ : I → Rn | γ ∈ C 1 (I)};
c) fissata una base v 1 , . . . , v n di Rn e t∗ ∈ I, una base di W è data dalla famiglia di
funzione γ1 , . . . , γn dove ciascuna γi è la soluzione del problema di Cauchy
(
γ 0 (t) = A(t)γ(t) t∈I
∗ i
,
γ(t ) = v
cioè
n
X
W={ αi γi | α1 , . . . , αn ∈ R}. (184)
i=1
Inoltre, tutte le basi di W sono di questa forma.

Dimostrazione. Per dimostrare il punto a) è sufficiente applicare il Teo. 6.7 alla funzione
F : I × Rn → Rn F (t, v) = A(t)v,
176

che è di classe C 1 per l’ipotesi su A(t). Inoltre, fissato J = [a, b] ⊂ I, per la (173g)
kF (t, v)k = kA(t)vk ≤ kA(t)kkvk ≤ supkA(t)kkvk
t∈J

per ogni t ∈ J e v ∈ Rn ,
dove aJ = supt∈J kA(t)k < +∞ poiché ciascuna componente
A(t)ij è una funzione continua e, quindi, limita su J per il teorema di Weierstrass.
Il punto b) è un immediata conseguenza del punto c) per dimostrare il quale osserviamo
che, fissata una base v 1 , . . . , v n e t∗ ∈ R, le soluzioni γ1 , . . . , γn esistono (uniche) su tutto I
per il punto a). Mostriamo che γ1 , . . . , γn sono funzioni linearmente indipendenti. Infatti
se α1 , . . . , αn ∈ R tali che
Xn
αi γi (t) = 0 ∀t ∈ I,
i=1
allora per t = t∗
n
X n
X

0= αi γi (t ) = αi v i ∀t ∈ I,
i=1 i=1
da cui α1 = . . . = αn = 0 poiché v1 , . . . , vn sono linearmente indipendenti. Dimostriamo
n generano l’integrale generale W. Dati α1 , . . . , αn ∈ R, definiamo la
ora che γ1 , . . . , γP
funzione γ(t) = ni=1 αi γi (t), che è una soluzione del sistema. Infatti,
n n n
!
X X X
0 0
γ (t) = αi γi (t) = αi A(t)γi (t) = A(t) αi γi (t) = A(t)γ(t),
i=1 i=1 i=1

dove la seconda uguaglianza segue dalla definizione di γi e la terza dalla linearità di A(t).
Allora
Xn
W⊃{ αi γi | α1 , . . . , αn ∈ R}.
i=1
Per mostrare l’altra inclusione, sia γ una soluzione di γ 0 (t) = A(t)γ(t) definita su I, allora,
poiché v1 , . . . , vn sono un insieme di generatori di Rn esistono α1 , . . . , αn ∈ R tali che
n
X
γ(t∗ ) = αi v i = v ∗ .
i=1
Pn
Sia Γ(t) = i=1 αi γi (t), t ∈ I. Per quanto visto sopra Γ è ancora una soluzione e soddisfa
la condizione iniziale
n
X n
X
Γ(t∗ ) = αi γi (t∗ ) = αi v i = v ∗ .
i=1 i=1
Per l’unicità vista al punto a) segue che Γ = γ, per cui
Xn
W⊂{ αi γi | α1 , . . . , αn ∈ R}.
i=1
Ne segue che W è uno spazio vettoriale di dimensione n di cui γ1 , . . . , γn ne è una base.
Per mostrare l’ultima affermazione, sia γ1 , . . . , γn una base qualunque di W e definiamo
v i = γi (t∗ ) i = 1, . . . , n.
È sufficiente mostrare che i vettori v 1 , . . . , v n sono linearmente indipendenti. Siano α1 , . . . , αn ∈
R tali che
X n
αi v i = 0
i=1
Pn
e definiamo γ(t) = i=1 αi γi (t) che è soluzione del problema di Cauchy
(
γ 0 (t) = A(t)γ(t) t∈I
,
γ(t∗ ) = 0
177

che ammette anche la soluzione identicamente nulla. Per l’unicità della soluzione γ(t) = 0,
cioè per ogni t ∈ I
Xn
αi γi (t) = 0.
i=1
Essendo γ1 , . . . , γn funzioni linearmente indipendenti, α1 = . . . = αn = 0. 
. Il precedente teorema vale anche nell’ipotesi più debole che la matrice A(t) sia una
funzione continua su I e nel caso in cui A(t) ∈ Mn (C).
Def. 6.16 (Matrice wronskiana). Una base γ1 , . . . , γn dell’integrale generale del sistema
γ 0 (t) = A(t)γ(t) è detta famiglia fondamentale e la matrice n × n
 
W (t) = γ1 (t) γ2 (t) . . . γn (t) i∈I
è detta matrice wronskiana.

Fissato t∗ ∈ I, le colonne di
W (t∗ ) = v 1 v 2 . . . v n
 

formano una base di Rn e, di conseguenza, la matrice W (t∗ ) è invertibile. Per l’arbitrarietà


di t∗ , ne segue che W (t) è invertibile per ogni t ∈ I. Inoltre, le funzioni W (t) e W (t)−1
sono di classe C 1 e
W (t)0 = A(t)W (t) (W (t)−1 )0 = −W (t)−1 A(t) t ∈ I. (185)
Infatti, per quanto osservato sopra la matrice wronskiana è invertibile per ogni t ∈ I e la
formula dell’inversa
1
W (t)−1
ij = cofattore W (t)ji
det W (t)
mostra che anche W (t)−1 è una funzione di classe C 1 . Inoltre, poiché γ1 ,. . . , γn sono
soluzione del sistema γ 0 (t) = A(t)γ(t),
W 0 (t) = γ10 (t) γ20 (t) . . . γn0 (t) = A(t)γ1 (t) A(t)γ2 (t) . . . A(t)γn (t) = A(t)W (t).
   

Infine, poiché W (t)W (t)−1 = I,


0 = (W (t))0 W (t)−1 + W (t)(W (t)−1 )0 = A(t)W (t)W (t)−1 + W (t)(W (t)−1 )0
da cui (W (t)−1 )0 = −W (t)−1 A(t).
Esempio 6.17. Nel caso in cui A(t) = A non dipenda dal tempo e v 1 , . . . , v n è una base
di Rn , fissato t∗ ∈ R, allora
W (t) = exp((t − t∗ )A)V V = v1 v2 . . . vn
 

Se si sceglie come v 1 , . . . , v n la base canonica di Rn e t∗ = 0, allora W (t) = exp(tA).


Se la matrice A è diagonalizzabile
A = V diag(λ1 , . . . , λn )V −1 V = v1 v2 . . . vn ,
 

scegliendo la base di autovettori v 1 , . . . , v n e t∗ = 0, allora


W (t) = exp(tA)V = V diag(etλ1 , . . . , etλn ) = etλ1 v 1 etλ2 v 2 . . . etλn v n .
 

16.2. Sistemi lineari non omogenei. Il seguente teorema, noto come formula delle va-
riazioni delle costanti, fornisce una soluzione esplicita di un sistema lineare non omogeneo.

Teo 6.18. Dato I ⊂ R intervallo aperto, siano A(t) ∈ Mn (R) e b(t) ∈ Rn , t ∈ I, due
funzioni di classe C 1 (I).
178

a) Dati t∗ ∈ R e v ∗ ∈ Rn esiste unica soluzione del problema di Cauchy


(
γ 0 (t) = A(t)γ(t) + b(t)
(186a)
γ(t∗ ) = v ∗
definita su tutto l’intervallo I ed è data esplicitamente da
Z t
∗ −1 ∗
γ(t) = W (t)W (t ) v + W (t) W (τ )−1 b(τ ) dτ t ∈ I, (186b)
t∗
dove  
W (t) = γ1 (t) γ2 (t) . . . γn (t)
è la matrice wronskiana associata ad una famiglia fondamentale di soluzioni γ1 , . . . , γn
del sistema omogeneo associato
γ 0 (t) = A(t)γ(t) t ∈ I; (186c)
b) l’integrale generale del sistema
γ 0 (t) = A(t)γ(t) + b(t) (186d)
è un sotto-spazio affine di C 1 (I, Rn ) dato da
n
X
γ + W = {γ + αi γi |α1 , . . . , αn ∈ R}
i=1
dove γ è una soluzione particolare di (186d) e W è l’integrale generale del sistema
omogeneo associato (186c).

Dimostrazione. Mostriamo che la (186b) è una soluzione del problema di Cauchy (186a).
Essendo W (t)−1 di classe C 1 , la funzione integranda
τ 7→ W (τ )−1 b(τ )
è una funzione continua e, per il teorema fondamentale del calcolo integrale, γ è di classe
C 1 . Allora, usando la (185)
 Z t 
0 0 ∗ −1 ∗
γ (t) = W (t) W (t ) v + W (τ ) b(τ ) dτ + W (t)W (t)−1 b(t)
−1
t∗
 Z t 
∗ −1 ∗ −1
= A(t)W (t) W (t ) v + W (τ ) b(τ ) dτ + b(t)
t∗
= A(t)γ(t) + b(t).
Inoltre si verifica immediatamente che γ(t∗ ) = v ∗ , per cui è soluzione del problema di
Cauchy (186a).
L’unicità si può dimostrare usando il Teo. 6.7. Alternativamente, sia Γ un’altra soluzione
di (186a). La funzione W (t)−1 Γ(t), t ∈ I, è di classe C 1 e la sua derivata è, usando la (185),
0
W (t)−1 Γ(t) = (W (t)−1 )0 Γ(t) + W (t)−1 Γ0 (t)
= −A(t)W (t)−1 )0 Γ(t) + W (t)−1 (A(t)Γ(t) + b(t)) = W (t)−1 b(t)
Integrando entrambi i membri tra t∗ e t
Z t
−1 ∗ −1 ∗
W (t) Γ(t) − W (t ) Γ(t ) = W (τ )−1 b(τ ) dτ.
t∗
Tenuto conto che Γ(t∗ ) = v ∗ , segue che
Z t
∗ −1 ∗
Γ(t) = W (t)W (t ) v + W (t) W (τ )−1 b(τ ) dτ.
t∗
Per dimostrare il punto b), sia γ una soluzione del sistema (186d), che esiste per quanto
visto nel punto a). Sia γ una generica soluzione del sistema (186d), allora
(γ(t) − γ(t))0 = γ 0 (t) − γ 0 (t) = (A(t)γ(t) + b(t)) − (A(t)γ(t) + b(t)) = A(t) (γ(t) − γ(t)) .
179

Pn segue che γ − γ è soluzione del sistema omogeneo (186c) e, per il Teo. 6.15, γ − γ =
Ne
i=1 αi γi , da cui segue la tesi. 

L’equazione (186b) mostra che la soluzione del problema di Cauchy (186a) è la somma
γ = γ0 + γ dove
γ0 (t) = W (t)W (t∗ )−1 v ∗
è la soluzione del problema di Cauchy omogeneo
(
γ 0 (t) = A(t)γ(t)
γ(t∗ ) = v ∗
con lo stesso dato iniziale γ(t∗ ) = v ∗ , e
Z t
γ(t) = W (t) W (τ )−1 b(τ ) dτ
t∗
è la soluzione particolare del problema completo
(
γ 0 (t) = A(t)γ(t) + b(t)
γ(t∗ ) = 0
con condizione iniziale nulla.

Potrebbero piacerti anche