Sei sulla pagina 1di 147

Analisi Matematica 2

Corso di Studi in Matematica

A.A. 2017-18
2
Indice

1 Serie di funzioni 5
1.1 Introduzione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Convergenza uniforme . . . . . . . . . . . . . . . . . . . . . . . . 7
1.3 Convergenza totale . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Integrazione termine a termine . . . . . . . . . . . . . . . . . . . 14
1.5 Derivazione termine a termine . . . . . . . . . . . . . . . . . . . . 15
1.6 Serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.7 Sviluppabilità in serie di Taylor . . . . . . . . . . . . . . . . . . . 21
1.8 Sviluppi notevoli . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.9 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27

2 Calcolo differenziale 31
2.1 Spazi metrici . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Compattezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.3 Funzioni: limiti e continuità . . . . . . . . . . . . . . . . . . . . . 39
2.4 Convessità e connessione . . . . . . . . . . . . . . . . . . . . . . . 40
2.5 Il teorema delle contrazioni . . . . . . . . . . . . . . . . . . . . . 42
2.6 Trasformazioni lineari . . . . . . . . . . . . . . . . . . . . . . . . 43
2.7 Funzioni numeriche differenziabili . . . . . . . . . . . . . . . . . . 46
2.8 Funzioni di classe C 1 . . . . . . . . . . . . . . . . . . . . . . . . . 48
2.9 Funzioni omogenee . . . . . . . . . . . . . . . . . . . . . . . . . . 52
2.10 Funzioni differenziabili a valori vettoriali . . . . . . . . . . . . . . 54
2.11 Derivazione sotto il segno di integrale . . . . . . . . . . . . . . . 56
2.12 Derivate di ordine superiore . . . . . . . . . . . . . . . . . . . . . 58
2.13 Formule di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
2.14 Estremi locali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
2.15 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67

3 Curve 69
3.1 Definizioni ed esempi . . . . . . . . . . . . . . . . . . . . . . . . . 69
3.2 Lunghezza di un arco di curva . . . . . . . . . . . . . . . . . . . . 71
3.3 Curve piane: curvatura . . . . . . . . . . . . . . . . . . . . . . . 74
3.4 Curve dello spazio: curvatura e torsione . . . . . . . . . . . . . . 78
3.5 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

3
4 INDICE

4 Forme differenziali 83
4.1 Definizioni e proprietà . . . . . . . . . . . . . . . . . . . . . . . . 83
4.2 Forme esatte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 84
4.3 Forme chiuse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
4.4 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90

5 Funzioni implicite 93
5.1 Il teorema di Dini . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.2 Sistemi di funzioni implicite . . . . . . . . . . . . . . . . . . . . . 99
5.3 Trasformazioni localmente invertibili . . . . . . . . . . . . . . . . 103
5.4 Estremi vincolati . . . . . . . . . . . . . . . . . . . . . . . . . . . 105

6 Misura e integrazione 111


6.1 Misura secondo Peano-Jordan . . . . . . . . . . . . . . . . . . . . 111
6.2 Integrale secondo Riemann . . . . . . . . . . . . . . . . . . . . . 116
6.3 Proprietà dell’integrale . . . . . . . . . . . . . . . . . . . . . . . . 118
6.4 Formule di riduzione . . . . . . . . . . . . . . . . . . . . . . . . . 120
6.5 Formule di Gauss-Green nel piano . . . . . . . . . . . . . . . . . 123
6.6 Cambiamenti di variabili . . . . . . . . . . . . . . . . . . . . . . . 125
6.7 Sommabilità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 129
6.8 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131

7 Varietà 135
7.1 Definizioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.2 Integrali superficiali . . . . . . . . . . . . . . . . . . . . . . . . . 139
7.3 Teorema della divergenza . . . . . . . . . . . . . . . . . . . . . . 141
7.4 Formula di Stokes . . . . . . . . . . . . . . . . . . . . . . . . . . 143
7.5 Esercizi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145

Bibliografia 147
Capitolo 1

Serie di funzioni

1.1 Introduzione
Le serie di funzioni assunsero grande importanza a partire dal XVIII secolo in
quanto utili per rappresentare funzioni, per risolvere equazioni differenziali, per
approssimazioni numeriche.
Prendiamo le mosse da alcuni esempi concreti.
Sia f una funzione definita in un intervallo aperto I di R e supponiamo che essa
sia dotata di derivate di qualsiasi ordine. Sia x0 un di punto I e n un intero
positivo. Se x ∈ I per la formula di Taylor si ha
n
X f (k) (x0 )
(1.1) f (x) = (x − x0 )k + εn (x)
k!
k=0

dove f (0) = f e f (k) denota la derivata k−ma di f . Il termine εn (x), noto come
resto n−mo, è un infinitesimo per x che tende a x0 di ordine superiore rispetto
a (x − x0 )n . Risulta cioè

εn (x)
(1.2) lim = 0,
x→x0 (x − x0 )n
ovvero, in simboli,
εn (x) = o ((x − x0 )n ) .
In definitiva f può essere ragionevolmente approssimata, almeno per x prossimo
ad x0 , con il polinomio di Taylor di punto iniziale x0 e grado n
n
X f (k) (x0 )
(1.3) (x − x0 )k .
k!
k=0

L’errore, in base alla (1.2), è trascurabile se lo si confronta con il termine di


grado n del polinomio (1.3) sempre che esso non sia nullo. Ovviamente tale
interpretazione ha solo carattere qualitativo in quanto manca ogni valutazione

5
6 CAPITOLO 1. SERIE DI FUNZIONI

numerica dell’errore. A tale inconveniente pone rimedio una formula che dà
conto della consistenza del termine εn . In base a tale formula il resto assume la
seguente espressione
f (n+1) (ξ)
(1.4) εn (x) = (x − x0 )n+1
(n + 1)!
con ξ che si colloca (di meglio non si può dire!) tra il punto iniziale x0 e x.
Utilizziamo tale formula in relazione alla funzione esponenziale.
Dalle (1.1) e (1.4) si ha
n
X xk xn+1
ex = exp x = + eξ
k! (n + 1)!
k=0

con ξ compreso tra zero e x. Il resto si maggiora allora con


n+1
|x|
max{1, ex } .
(n + 1)!
Tale quantità è infinitesima al divergere di n. Si ha quindi

X xk
(1.5) exp x = .
k!
k=0

Abbiamo in definitiva una espressione che esibisce i valori di una classica funzio-
ne elementare come somma di una serie i cui termini sono potenze ad esponente
intero di grado crescente.
Ragionando come nel caso della funzione esponenziale si può verificare che
valgono i seguenti sviluppi
x3 x2n+1
(1.6) sin x = x− + · · · + (−1)n + ···
3! (2n + 1)!

x2 x2n
(1.7) cos x = 1− + · · · + (−1)n + ··· .
2! (2n)!

Le (1.5), (1.6), (1.7) sono esempi di serie di potenze. Oltre a questo tipo di
sviluppo ne esistono altri, come le serie trigonimetriche, che fanno intervenire,
in luogo delle potenze ad esponenti interi, altre semplici funzioni elementari.
Riportiamo a titolo di esempio il seguente sviluppo
 x
 se x ∈] − π, π[
sin 2x sin 3x 
2
sin x − + − ··· =
2 3 
0 se x = π .

Se si estende per periodicità tale rappresentazione a tutto R si ha a secondo


membro una funzione discontinua nei punti (2k + 1)π con k intero relativo. Non
è quindi scontato che una somma infinita di funzioni continue dia come risultato
una funzione continua.
1.2. CONVERGENZA UNIFORME 7

1.2 Convergenza uniforme


Data una successione di funzioni {fn }, tutte definite nello stesso intervallo I,
diremo che la serie di funzioni di termine generale fn

X
(1.8) fk
k=1

ha per somma la funzione f , ovvero, in simboli



X
fk = f
k=1

se !
n
X
f (x) = lim fk (x)
n→∞
k=1

per ogni x ∈ I.
Lo studio di una serie di funzioni è in tal modo ricondotto a quello della succes-
sione delle sue somme parziali. Introduciamo alcune definizioni che si riferiscono
per l’appunto a successioni di funzioni.
Definizione 1.2.1. - La successione {fn } converge puntualmente a f in I se

lim fn (x) = f (x) , ∀x ∈ I


n→+∞

ovvero se, fissato x ∈ I,

(1.9) ∀ε > 0 ∃ν : ∀n > ν |fn (x) − f (x)| < ε .


1
Esempio 1.2.1. - Posto fn (x) = x n , risulta

 0 se x = 0
lim fn (x) =
n→∞
1 se x ∈]0, 1] .

Il limite puntuale della successione {fn } non è continua in zero.


Si osservi inoltre che
   
1 = lim lim fn (x) 6= lim lim fn (x) = 0 .
x→0 n→∞ n→∞ x→0

Non sempre quindi è possibile commutare due operazioni di limite.


Il fenomeno patologico riscontrato nell’esempio 1.2.1 scompare se si introduce
un tipo di convergenza piú forte di quella puntuale.
Definizione 1.2.2. - La successione {fn } converge uniformemente a f in I se

(1.10) ∀ε > 0 ∃ν : ∀n > ν , ∀x ∈ I |fn (x) − f (x)| < ε .


8 CAPITOLO 1. SERIE DI FUNZIONI

Se si confrontano le definizioni 1.2.1 e 1.2.2 si può notare che, nel primo caso,
l’indice ν dipende, oltre che da ε, anche da x, nel secondo, la scelta di ν può
essere effettuata prescindendo dal punto x.
Per cominciare verifichiamo che la convergenza uniforme conserva la continuità.

Teorema 1.2.1. - Sia {fn } una successione di funzioni, continue in x0 , con-


vergente uniformemente in I ad una funzione f . Allora f è continua in x0 .

Dimostrazione. In corrispondenza di ε > 0 fissiamo n > ν dove ν è l’indice che


compare nella (1.10). Per la continuità di fn in x0 è possibile determinare un
δ > 0 tale che, se x ∈ I e |x − x0 | < δ, si ha

|fn (x) − fn (x0 )| < ε .

Da tale relazione e dalla (1.10) si ottiene

|f (x) − f (x0 )| ≤ |f (x) − fn (x)| + |fn (x) − fn (x0 )| + |fn (x0 ) − f (x0 )| < 3ε

se x ∈ I e |x − x0 | < δ. Ciò comporta la continuità di f in x0 .

Osservazione 1.2.1. - Dal teorema 1.2.1 si deduce tra l’altro che la successione
dell’esempio 1.2.1 non converge uniformemente in [0, 1] in quanto il suo limite
è discontinuo nell’origine.
Osservazione 1.2.2. - Si può facilmente dimostrare che la (1.10) è equivalente
alla seguente condizione
 
lim sup |fn (x) − f (x)| = 0 .
n→∞ x∈I

Esempio 1.2.2. - Se α > 0 sia

fn (x) = nα x(1 − x2 )n , x ∈ [0, 1] .

È evidente che la successione {fn } converge puntualmente alla funzione identi-


camente nulla. Essendo
n


2n
max fn (x) = √
x∈[0,1] 2n + 1 2n + 1

si ha  
1
lim max fn (x) = 0 ⇐⇒ α < .
n→∞ x∈[0,1] 2
Quindi per quanto detto nell’oss. 1.2.2 la successione converge uniformemente
alla funzione identicamente nulla solo se il valore di α non supera 1/2.
Per ottenere la convergenza uniforme si può anche aggiungere qualche condizione
ulteriore alla convergenza puntuale come nel caso del seguente risultato noto
come teorema di Dini.
1.2. CONVERGENZA UNIFORME 9

Teorema 1.2.2. - Sia {fn } una successione di funzioni continue convergente


puntualmente in [a, b] ad una funzione continua f . Se si ha

(1.11) fn (x) ≥ fn+1 (x) , ∀n ∈ N , ∀x ∈ [a, b]

allora la convergenza è uniforme.


Dimostrazione. Possiamo sempre supporre che f sia la funzione identicamente
nulla. Basta infatti ragionare sulla successione {fn − f }.
Se Mn è il massimo di fn e xn un punto di massimo per la (1.11) si ha

Mn = fn (xn ) ≥ fn (xn+1 ) ≥ fn+1 (xn+1 ) = Mn+1 .

Quindi la successione {Mn } è decrescente: essa converge ad un valore M ≥ 0.


Sia {xnk } una sottosuccessione di {xn } convergente ad un punto x0 . Fissato n,
se nk > n per la (1.11) si ha

fn (xnk ) ≥ fnk (xnk ) = Mnk

e quindi
fn (x0 ) = lim fn (xnk ) ≥ lim Mnk = M .
k→∞ k→∞

Poiché
lim fn (x0 ) = 0
n→∞

deve essere M = 0. Basta a questo punto ricordare quanto riportato nell’oss.


1.2.2.
In relazione alla convergenza uniforme sussiste la seguente caratterizzazione che
va sotto il nome di criterio di convergenza di Cauchy.
Teorema 1.2.3. - La successione {fn } converge uniformemente in I se e solo
se

(1.12) ∀ε > 0 ∃ν : ∀n, m > ν ∀x ∈ I |fn (x) − fm (x)| < ε .

Dimostrazione. La condizione è ovviamente necessaria.


Per quanto riguarda la sufficienza osserviamo che {fn (x)} converge per il criterio
di convergenza di Cauchy relativo alle successioni numeriche. Poniamo

lim fn (x) = f (x) .


n→∞

Si fissi l’indice n e si faccia tendere m ad infinito nella diseguaglianza che


compare in (1.12). Si ottiene

|fn (x) − f (x)| ≤ ε , ∀n > ν , ∀x ∈ I .

Ciò comporta che la successione converge uniformemente a f .


Concludiamo il paragrafo con la seguente generalizzazione del teorema 1.2.1.
10 CAPITOLO 1. SERIE DI FUNZIONI

Teorema 1.2.4. - Sia {fn } una successione uniformemente convergente a f in


un intervallo aperto I e sia x0 un suo estremo. Se ogni fn converge in x0 allora
anche f converge in x0 e si ha
   
(1.13) lim f (x) = lim lim fn (x) = lim lim fn (x) .
x→x0 x→x0 n→∞ n→∞ x→x0

Dimostrazione. Dalla ipotesi di convergenza uniforme, fissato ε, esiste un indice


ν tale che per ogni n, m > ν e per ogni x ∈ I, si ha

(1.14) |fn (x) − fm (x)| < ε .

Posto
ln = lim fn (x) ,
x→x0

passando al limite nella (1.14) per x che tende a x0 abbiamo

(1.15) |ln − lm | ≤ ε

per ogni n, m > ν. Se x0 ∈ R prolunghiamo per continuità fn in x0 ponendo


fn (x0 ) = ln . Le (1.14) e (1.15) comportano che tale successione di funzioni
converge uniformemente in un intervallo chiuso contenente l’estremo x0 . È
possibile applicare allora il teorema 1.2.1.
Consideriamo il caso in cui x0 non sia finito. Per la (1.15) la successione {ln }
é convergente: sia l il suo limite. Si determini l’indice ν in corrispondenza di ε
secondo quanto indicato nella (1.10). Abbiamo quindi

(1.16) |fn (x) − f (x)| < ε , ∀n > ν , ∀x ∈ I .

Scegliamo inoltre tale indice in modo tale che risulti anche, per n > ν,

(1.17) |ln − l| < ε .

Fissato m > ν, è possibile determinare un intorno Ix0 di x0 tale che risulti

|fm (x) − lm | < ε

se x ∈ Ix0 . Da tale relazione, dalla (1.16) e dalla (1.17) si ottiene

|f (x) − l| ≤ |f (x) − fm (x)| + |fm (x) − lm | + |lm − l| < 3ε ,

sempre se x ∈ Ix0 . Si è ottenuto in tal modo la (1.13).

1.3 Convergenza totale


La definizione di convergenza uniforme può essere adattata in modo naturale al
caso delle serie di funzioni. Si dice infatti che la serie di funzioni (1.8) converge
uniformemente in un intervallo I ad una funzione f se converge uniformemente
in I a f la successione delle somme parziali.
Per le serie i teoremi 1.2.1 e 1.2.4 portano al seguente risultato.
1.3. CONVERGENZA TOTALE 11

Teorema 1.3.1. - Se la serie (1.8) converge uniformemente in un intervallo I


e le funzioni fn sono continue in un punto di I allora anche la somma f della
serie è continua in tale punto.
Sia I aperto e sia x0 un suo estremo. Se le funzioni fn convergono in x0 e la
serie è uniformemente convergente in I allora f converge in x0 e si ha
∞ ∞ 
! 
X X
(1.18) lim f (x) = lim fn (x) = lim fn (x) .
x→x0 x→x0 x→x0
n=1 n=1

Posto
rn,k (x) = fn+1 (x) + · · · + fn+k (x)
il teorema 1.2.3 per le serie assume la seguente forma.
Teorema 1.3.2. - La serie di funzioni (1.8) converge uniformemente in I se e
solo se, per ogni ε esiste un indice ν tale che

|rn,k (x)| < ε ∀n > ν , ∀k ∈ N , ∀x ∈ I .

Per riconoscere se una serie è uniformemente convergente è talvolta utile ricor-


rere ad una condizione piú forte che va sotto il nome di totale convergenza.
Definizione 1.3.1. - Si dice che la serie (1.8) è totalmente convergente in I se
esiste una successione {Mn } tale che |fn (x)| ≤ Mn per x ∈ I e

X
Mn < +∞ .
n=1

Sussiste il seguente risultato.


Teorema 1.3.3. - Una serie di funzioni totalmente convergente è anche asso-
lutamente ed uniformemente convergente.

Dimostrazione. Che la convergenza sia assoluta è ovvio. Occupiamoci della


convergenza uniforme,
Per il criterio di convergenza di Cauchy per le serie numeriche, fissato ε, esiste
un indice ν tale che
Mn+1 + · · · + Mn+k < ε
per ogni n > ν e per ogni k > 0. Si ha quindi

|rn,k (x)| ≤ Mn+1 + · · · + Mn+k < ε

da cui, per il teorema 1.3.2, discende il risultato.

Esempio 1.3.1. - La serie



X √
xn (1 − n
x)
n=1
12 CAPITOLO 1. SERIE DI FUNZIONI

converge totalmente in [0, 1].


Si ha infatti
n2
√ n2

 n 1
Mn = max x (1 − n x) = .
x∈[0,1] n2 + 1 n2 +1

La serie di termine generale Mn è convergente in quanto confrontabile con la


serie armonica generalizzata di esponente 2.
Esempio 1.3.2. - La serie

X 1
n=1
1 + n2 x

converge totalmente e quindi uniformemente in [a, +∞[ con a positivo. In un


tale intervallo infatti la serie risulta maggiorata dalla serie numerica conver-
gente

X 1
.
n=1
1 + n2 a

La serie peraltro non converge uniformemente in ]0, +∞[, altrimenti, in base al


teorema 1.3.1, la sua somma convergerebbe in zero e dovrebbe valere la (1.18).
Esempio 1.3.3. - La serie

X x2 + n
(−1)n
n=1
n2

non è assolutamente convergente. Quindi essa non è neanche totalmente con-


vergente.
Ad essa è applicabile il criterio di Leibnitz per le serie a segni alterni. Se f è la
sua somma si ha inoltre

n−1 2 x2 + n
kx + k
X
f (x) − (−1) ≤ .

k2 n2
k=1

Ne consegue l’uniforme convergenza sui limitati di R.


Tale esempio mette in evidenza il fatto che può esserci convergenza uniforme
anche in assenza di convergenza totale.
Esempio 1.3.4. - Posto
x
fn (x) =
nα (1 + n x2 )

con α reale positivo si consideri la serie di termine generale fn . Essa converge


per ogni x ∈ R. Essendo
1
max |fn (x)| =
x∈R 2 nα+1/2
1.3. CONVERGENZA TOTALE 13

la serie converge totalmente se α > 1/2.


Se α = 1/2 si consideri il resto parziale

rk,2k (x) = fk+1 (x) + · · · + f2k (x) .

Si ha 
1 1

rk,2k ≥ √ .
k 3 2
Pertanto non vale il criterio di convergenza di Cauchy. La serie non converge
uniformemente.
Esempio 1.3.5. - Sia {rn } la successione dei numeri razionali contenuti in
[0, 1]. Sia  −2
 n se x ∈ [0, rn ]
fn (x) =
0 se x ∈]rn , 1] .

La serie di funzioni di termine generale fn è totalmente convergente. Per il


teorema 1.3.3 la sua somma è continua in ogni punto irrazionale di [0, 1]; essa
è invece discontinua in ogni punto razionale.
Concludiamo tale paragrafo riportando l’esempio di una funzione continua e
priva di derivata in ogni punto.
Consideriamo la restrizione della funzione valore assoluto all’intervallo [−1, 1] e
prolunghiamola per periodicità a tutto R. Indichiamo con V la funzione in tal
modo ottenuta. Si ha allora

(1.19) V (x + 2) = V (x) .

È inoltre evidente che

(1.20) |V (x) − V (y)| ≤ |x − y|

e che il segno di uguaglianza sussiste solo se tra x e y non ci sono interi relativi.
Definiamo la funzione
∞  n
X 3
f (x) = V (4n x) .
n=0
4

Alla serie si può ovviamente applicare il teorema 1.3.3; quindi la funzione f è


continua.
Fissato m ∈ N , se x ∈ R è possibile fare in modo che nell’intervallo aperto di
estremi 4m x e 4m x+δm non vi siano interi relativi se scegliamo δm = 1/2 ovvero
δm = −1/2. Poniamo

V (4n x + 4n−m δm ) − V (4n x)


Vn (x) = .
4−m δm
Se n > m l’intero 4n−m δm è un multiplo di due, quindi, per la (1.19), risulta
Vn (x) = 0. Se n = m si ha |Vm (x)| = 4m in quanto per costruzione tra 4m x e
14 CAPITOLO 1. SERIE DI FUNZIONI

4m x + δm non vi sono interi: quindi nella (1.20) vale il segno di uguaglianza.


Infine, sempre per la (1.20), si ha |Vn (x)| ≤ 4n se n < m.
In definitiva risulta
m  n m−1
f (x + 4−m δm ) − f (x) X 3m + 1

3
m
X
n
= V (x) ≥ 3 − 3 = .

n

4−m δm 4 2


n=0 n=0

−m
Al divergere di m diverge la successione {4 δm } tende a zero. Quindi f non
è derivabile in x.

1.4 Integrazione termine a termine


La convergenza uniforme si rivela la condizione giusta anche quando si vuole
invertire l’operazione di limite o quella di serie con le operazioni di integrazione
definita e di derivazione.
Cominciamo dimostrando il seguente risultato.
Teorema 1.4.1. - Sia {fn } una successione di funzioni continue convergente
uniformemente in [a, b] ad una funzione f ; si ha allora
Z b Z b Z b
(1.21) lim fn (x) dx = f (x) dx = lim fn (x) dx .
n→∞ a a a n→∞

Dimostrazione. Fissato ε esiste ν tale che per n > ν vale la (1.10). Si ha allora
Z Z
b Z b b
fn (x) dx − f (x) dx ≤ |fn (x) − f (x)| dx < ε(b − a)


a a a

ovvero la (1.21).
Esempio 1.4.1. - Sia {fn } la successione dell’esempio 1.2.2. Si ha


 +∞ se α > 1
Z 1 



lim fn (x) dx = lim = 1/2 se α = 1
n→∞ 0 n→∞ 2(n + 1) 



0 se α < 1 .

Quindi la (1.21) sussiste per α < 1. È bene ricordare che solo per α < 1/2 la
convergenza è uniforme.
L’ipotesi di continuità delle funzioni fn nel teorema 1.4.1 serve solo per ottenere
in modo immediato l’integrabilità della funzione limite f . In realtà tale ipotesi
può essere rimpiazzata dalla piú generale condizione di integrabilità secondo
Riemann.
Teorema 1.4.2. - Sia {fn } una successione di funzioni, ciascuna integrabile
secondo Riemann, convergente uniformemente in [a, b] ad una funzione f . Vale
allora la (1.21).
1.5. DERIVAZIONE TERMINE A TERMINE 15

Dimostrazione. Dobbiamo solo dimostrare che f è integrabile secondo Riemann.


A tale proposito ricordiamo che f è tale se
Z b Z b
(1.22) sup g(x) dx = inf h(x) dx
g≤f a f ≤h a

con g, h integrabili secondo Riemann.


Fissato ε scegliamo n in modo tale che

g(x) = fn (x) − ε < f (x) < fn (x) + ε = h

per ogni x ∈ [a, b]. Si ha allora


Z b Z b
h(x) dx − g(x) dx < 2ε(b − a)
a a

da cui la (1.22) e, quindi, l’integrabilità di f .


Concludiamo osservando che quanto detto per le successioni può essere riformu-
lato per le serie. In particolare per una serie di funzioni, continue o anche solo
integrabili secondo Riemann, convergente uniformemente in [a, b] si ha
Z ∞
bX ∞ Z
X b
(1.23) fn (x) dx = fn (x) dx .
a n=1 n=1 a

1.5 Derivazione termine a termine


Per quanto riguarda l’operazione di derivazione sussiste il seguente risultato.
Teorema 1.5.1. - Sia {fn } una successione di funzioni derivabili in un inter-
vallo I. Se la successione {fn } converge in un punto x0 e la successione {fn0 }
converge uniformemente in I allora la successione {fn } converge uniformemente
sui sottointervalli limitati di I ad una funzione f derivabile. Si ha inoltre
 0
(1.24) lim fn0 (x) = f 0 (x) = lim fn (x) .
n→∞ n→∞

Dimostrazione. Fissato ε determiniamo ν in modo tale che, per n, m > ν, risulti

(1.25) |fn (x0 ) − fm (x0 )| < ε

nonché, per ogni x ∈ I

(1.26) |fn0 (x) − fm


0
(x)| < ε .

Considerati due punti x, x̄ in I, se n, m > ν per il teorema di Lagrange e per la


(1.26) si ha

(1.27) |fn (x) − fm (x) − fn (x̄) + fm (x̄)| < ε|x − x̄| .


16 CAPITOLO 1. SERIE DI FUNZIONI

Dalle (1.25) e (1.27) si ottiene

|fn (x) − fm (x)| ≤ |fn (x) − fm (x) − fn (x0 ) + fm (x0 )| + |fn (x0 ) − fm (x0 )|

≤ ε(|x − x0 | + 1)

da cui l’uniforme convergenza di {fn } sui sottoinsiemi limitati di I. Indichiamo


con f il limite della successione {fn }.
Fissato x̄, se x 6= x̄ sia
fn (x) − fn (x̄)
ψn (x) = .
x − x̄
Per n, m > ν dalla (1.27) si ha

|ψn (x) − ψm (x)| < ε

da cui si ottiene l’uniforme convergenza di {ψn } in [a, b]\{x̄}.


Poiché le funzioni ψn sono convergenti in x̄ è possibile applicare il teorema 1.2.4;
si ha quindi
   
lim fn0 (x̄) = lim lim ψn (x) = lim lim ψn (x)
n→∞ n→∞ x→x̄ x→x̄ n→∞

f (x) − f (x̄)
= lim = f 0 (x̄)
x→x̄ x − x̄
da cui la derivabilità di f nonché la (1.24).
Dal teorema 1.5.1 discende in modo naturale il seguente risultato per le serie di
funzioni.
Teorema 1.5.2. - Se la (1.8) converge in un punto x0 e la serie di termi-
ne generale fn0 converge uniformemente in [a, b], allora la serie (1.8) converge
uniformemente in [a, b] ad una funzione derivabile e si ha

!0 ∞
X X
fn (x) = fn0 (x) .
n=1 n=1

La dimostrazione del teorema 1.5.1, ovvero quella del teorema 1.5.2, procede
piú speditamente se si suppone che le funzioni fn0 siano continue.
Poniamo

(1.28) ϕ(x) = lim fn0 (x)


n→∞

(1.29) c = lim fn (x0 ) .


n→∞

Per il teorema fondamentale del calcolo integrale si ha


Z x
fn (x) = fn (x0 ) + fn0 (t) dt .
x0
1.6. SERIE DI POTENZE 17

Dalle (1.28) e (1.29), ricordando il teorema 1.4.1, la successione {fn } converge


alla funzione Z x
f (x) = c + ϕ(t)dt .
x0

Essendo ϕ continua, di nuovo per il teorema fondamentale del calcolo integrale,


si ha f 0 = ϕ ovvero la (1.24).
Esempio 1.5.1. - Posto
sin nx
fn (x) = √
n
la successione {f√n } converge uniformemente alla funzione identicamente nulla.
Poiché fn0 (x) = n cos nx risulta

lim fn0 (0) = +∞ .


n→∞

Non vale quindi la (1.24).


Esempio 1.5.2. - Sia
x
fn (x) = .
1 + n2 x2
Si verifica facilmente che la successione {fn } converge uniformemente alla fun-
zione identicamente nulla. Essendo
1 − n2 x2
fn0 (x) =
(1 + n2 x2 )2

risulta 
 1 se x = 0
lim fn0 (x) =
n→∞
0 se x 6= 0 .

Quindi {fn0 } non converge uniformemente in quanto il suo limite non è continuo.
La (1.24) non vale per x = 0.

1.6 Serie di potenze


Assegnata una successione di numeri reali {an } la serie di funzioni

X
an (x − x0 )n = a0 + a1 (x − x0 ) + · · · + an (x − x0 )n + · · ·
n=0

prende il nome di serie di potenze di punto iniziale x0 .


Con una traslazione ci si può sempre ricondurre ad una serie di potenze di punto
iniziale zero, cioè ad una serie del tipo

X
(1.30) an xn = a0 + a1 x + · · · + an xn + · · · .
n=0
18 CAPITOLO 1. SERIE DI FUNZIONI

Per semplicità nel seguito ci riferiremo sempre a tale tipo di serie di potenze.
Per caratterizzare l’insieme di convergenza di una serie di potenze è utile il
seguente risultato.
Teorema 1.6.1. - Se la serie (1.30) converge in un punto x̄ essa converge
assolutamente in ogni punto x tale che |x| < |x̄|. Di piú la serie converge
totalmente e, quindi, uniformemente in ogni intervallo [−δ, δ] con δ < |x̄|.

Dimostrazione. Poiché la serie è convergente in x̄ la successione {an x̄n } è in-


finitesima e, quindi, limitata. Esiste allora una costante M tale che, per ogni
n,
|an ||x̄|n ≤ M .
Posto h = δ/|x̄| < 1, se x ∈ [−δ, δ] si ha
 n
|x|
|an ||x|n = |an ||x̄|n ≤ M hn .
|x̄|

La serie è assolutamente convergente e totalmente convergente in [−δ, δ].

Dal teorema 1.6.1 si deduce facilmente che la serie di potenze (1.30) converge
in un intervallo simmetrico rispetto all’origine e non converge all’esterno di tale
intervallo. Sussiste cioè il seguente risultato.
Teorema 1.6.2. - Si verifica una delle seguenti tre eventualità.

a) Esiste un numero r > 0, detto raggio di convergenza della serie (1.30), tale
che la serie converge assolutamente se x appartiene all’intervallo ] − r, r[,
non converge se x è esterno a tale intervallo; l’intervallo ] − r, r[ è detto
intervallo di convergenza.

b) La serie (1.30) converge ovunque; in tal caso si dice che il raggio di


convergenza è infinito e che l’intervallo di convergenza è tutto l’asse reale.

c) La serie (1.30) converge solo nell’origine; in tal caso si dice che il raggio
di convergenza è zero.

Infine la convergenza è totale in ogni intervallo compatto contenuto nell’inter-


vallo di convergenza.
Per individuare quindi l’insieme di convergenza di una serie di potenze è neces-
sario calcolare il relativo raggio di convergenza. A tale proposito risulta decisivo
il seguente risultato.
Teorema 1.6.3. (Teorema di Cauchy-Hadamard) - Sia
p
l = lim sup n |an | .
n→∞

Allora il raggio di convergenza della serie (1.30) è 1/l con ovvio significato del
simbolo se l = 0 ovvero l = +∞.
1.6. SERIE DI POTENZE 19

Dimostrazione. Sia |x| < 1/l con l ∈]0, +∞[. Si ha


p p
lim sup n |an ||x|n = |x| lim sup n |an | = |x|l < 1 .
n→∞ n→∞

Dal criterio della radice discende che per tali valori di x la serie di potenze (1.30)
converge assolutamente.
Sia |x| > 1/l e quindi
p 1
l = lim sup n |an | > .
n→∞ |x|
Per le proprietà del massimo limite esistono infiniti indici n per i quali si ha
p
n 1
|an | >
|x|
ovvero |an ||x|n > 1. La serie di potenze (1.30) non può allora convergere per
tale valore di x in quanto la successione il cui termine generale é |an ||x|n non è
infinitesima.
Piú semplice è la dimostrazione nei casi
p l = +∞ e l = 0; in quest’ultima
eventualità ovviamente la successione { n |an |} è regolare e infinitesima.
Dal teorema 1.6.3 discende il seguente criterio.
Teorema 1.6.4. - Se p
n
lim |an | = l
n→∞

il raggio di convergenza di (1.30) è 1/l.


Ricordiamo inoltre il seguente risultato.
Teorema 1.6.5. - Se
an
lim =r
n→∞ an+1

allora r è il raggio di convergenza della serie (1.30).


Dimostrazione. Basta osservare che

an+1 p
lim = lim n |an |
n→∞ an n→∞

e applicare teorema 1.6.4.


Osservazione 1.6.1. - Poiché

p
n
an+1
lim sup |an | ≤ lim sup
n→∞ n→∞ an
il raggio di convergenza di una serie di potenze non puó essere messo in relazione
con il massimo limite della successione {|an+1 /an |}.
Esempio 1.6.1. - La serie √ (1.30) con an = n! ha raggio di convergenza nullo
in quanto la successione { n n!} diverge.
20 CAPITOLO 1. SERIE DI FUNZIONI

Esempio 1.6.2. - La serie geometrica ha raggio di convergenza uno. Essa non


converge nei due estremi dell’intervallo di convergenza.
Esempio 1.6.3. - La serie (1.30) con an = n−1 ha raggio di convergenza
uno. Essa converge per il criterio di Leibnitz sulle serie alternanti nell’estremo
sinistro dell’intervallo di convergenza ma non converge nell’altro estremo.
Esempio 1.6.4. - La serie (1.30) con an = n−2 ha per raggio di convergenza
1. Tale serie converge in tutti e due gli estremi dell’intervallo di convergenza.
Gli ultimi tre esempi mettono in evidenza il fatto che il comportamento di
una serie di potenze agli estremi dell’intervallo di convergenza non è a priori
determinabile. A tale proposito è utile richiamare il seguente risultato.
Teorema 1.6.6. (Teorema di Abel) - Sia r il raggio di convergenza della se-
rie di potenze (1.30) e supponiamo che essa converga in un estremo α dell’inter-
vallo di convergenza. Allora la serie converge uniformemente in ogni intervallo
chiuso i cui estremi sono α e un punto interno all’intervallo di convergenza. Se
la serie converge in entrambi gli estremi dell’intervallo di convergenza allora la
convergenza è uniforme in [−r, r].

Dimostrazione. Possiamo sempre supporre che sia r = 1 e che la serie (1.30) sia
convergente, per esempio, in 1. Ciò implica che risulta convergente la serie il
cui termine generale è an .
Fissato ε, per il criterio di convergenza di Cauchy esiste un indice ν tale che per
ogni n > ν e per ogni intero k risulti

(1.31) |rn,k | = |an+1 + · · · + an+k | < ε .

Manipoliamo ora il resto parziale della serie di potenze nel modo seguente

ρn,k (x) = an+1 xn+1 + an+2 xn+2 + · · · + an+k−1 xn+k−1 + an+k xn+k

= rn,1 xn+1 + (rn,2 − rn,1 )xn+2 + · · · + (rn,k − rn,k−1 )xn+k

= rn,1 (xn+1 − xn+2 ) + rn,2 (xn+2 − xn+3 ) + . . .

+ rn,k−1 (xn+k−1 − xn+k ) + rn,k xn+k .

Se x ∈ [0, 1], per la (1.31) si ha

|ρn,k (x)| ≤ |rn,1 |(xn+1 − xn+2 ) + |rn,2 |(xn+2 − xn+3 ) + . . .

+ |rn,k−1 |(xn+k−1 − xn+k ) + |rn,k |xn+k

≤ εxn+1 ≤ ε
1.7. SVILUPPABILITÀ IN SERIE DI TAYLOR 21

da cui l’uniforme convergenza in [0, 1].


L’uniforme convergenza in [c, 1] con c ∈] − 1, 0[ segue dal teorema 1.6.2.
Come conseguenza dei teoremi 1.6.6 e 1.3.1 si ha il seguente risultato.
Teorema 1.6.7. - Se α è un estremo dell’intervallo di convergenza in cui la
serie di potenze (1.30) converge e f è la somma di (1.30) allora

X
(1.32) lim f (x) = an αn .
x→α
n=0

1.7 Sviluppabilità in serie di Taylor


Per quanto riguarda la possibilità di derivare e integrare termine a termine una
serie di potenze sussiste il seguente risultato.
Teorema 1.7.1. - Sia f la somma della serie di potenze (1.30). Per ogni x
appartenente all’intervallo di convergenza si ha

X
(1.33) f 0 (x) = nan xn−1
n=1

e
Z x ∞
X an n+1
(1.34) f (t)dt = x .
0 n=0
n+1

Inoltre le serie di potenze a secondo membro nelle (1.33) e (1.34) hanno lo stesso
raggio di convergenza della serie di potenze (1.30).
Dimostrazione. Le serie a secondo membro in (1.33) e (1.34) e la serie (1.30)
hanno lo stesso raggio di convergenza in quanto
r
n |an−1 |
p
n
p
n
lim sup |an | = lim sup (n + 1)|an+1 | = lim sup .
n→∞ n→∞ n→∞ n
Si puó utilizzare allora il teorema 1.6.3.
Ciò premesso l’identità (1.34) si ottiene applicando alla serie di potenze (1.30) la
(1.23), operazione lecita dal momento che, per il teorema 1.6.2, la serie converge
uniformemente in ogni sottointervallo compatto dell’intervallo di convergenza.
Per quanto riguarda la (1.33) essa è conseguenza del risultato di derivazione
termine a termine contenuto nel teorema 1.5.1.
Se si applica ripetutamente la (1.33) si ha che la somma di una serie di potenze
ha derivate di ogni ordine e che tali derivate si ottengono derivando piú volte
termine a termine la serie di partenza. Si ha quindi

X
(k)
f (x) = (n + k) · · · (n + 1)an+k xn
n=0
22 CAPITOLO 1. SERIE DI FUNZIONI

da cui f (k) (0) = k! ak . Risulta pertanto



X f (n) (0) n
(1.35) f (x) = x
n=0
n!

ovvero, se il punto iniziale è x0 ,



X f (n) (x0 )
(1.36) f (x) = (x − x0 )n .
n=0
n!

La serie a secondo membro in (1.36) prende il nome di serie di Taylor di f di


punto iniziale x0 . Nel caso in cui il punto iniziale sia lo zero, ovvero nel caso in
cui si consideri la serie a secondo membro in (1.35), questa prende il nome di
serie di McLaurin di f .
Per poter scrivere formalmente una serie di Taylor di una funzione basta che
questa sia dotata in un intervallo I di derivate di ogni ordine. In tal caso si dice
che essa è di classe C ∞ .
Definizione 1.7.1. - Se la serie di Taylor di una funzione di classe C ∞ ha
per somma la funzione stessa in un intorno del punto iniziale si dice che f è
sviluppabile in serie di Taylor.
Esempio 1.7.1. - La serie di Taylor di una funzione potrebbe avere raggio di
convergenza nullo. Alla funzione

X
f (x) = e−n cos n2 x
n=0

si può applicare indefinitamente il teorema 1.5.2: essa è pertanto di classe C ∞ .


Si vede immediatamente che le derivate in zero di f di ordine dispari sono nulle
mentre per quelle di ordine pari si ha

X
f (2k) (0) = (−1)k n4k e−n
n=0

da cui
(0) ≥ (2k)4k e−2k .
(2k)
f

Essendo (2k)! < (2k)2k abbiamo


2k
|f (2k) (0)| 2k (2k)4k e−2k x2k

2kx
x > = .
(2k)! (2k)2k e
Se x 6= 0 per ogni k > e/(2x) risulta

|f (2k) (0)| 2k
x > 1.
(2k)!
La serie di McLaurin di f non converge per tale valore di x.
1.7. SVILUPPABILITÀ IN SERIE DI TAYLOR 23

Esempio 1.7.2. - Non sempre per la somma della serie di Taylor di una
funzione f vale la (1.36). Sia
 2
 e−1/x se x 6= 0
f (x) =
0 se x = 0 .

Si ha f (n) (0) = 0 per ogni intero n. Quindi la serie di McLaurin di f è la serie


identicamente nulla mentre f (x) 6= 0 per x 6= 0.
Per stabilire se una funzione f è sviluppabile in serie di Taylor può talvolta
risultare utile il seguente criterio.
Teorema 1.7.2. - Supponiamo che la funzione f abbia derivate equilimitate o,
piú in generale, che esistano due costanti M, h tali che

(1.37) |f (k) (x)| ≤ M hk

per ogni x appartenente ad un intorno di x0 e per ogni k. Allora f è sviluppabile


in serie di Taylor di punto iniziale x0 .

Dimostrazione. Si ha
n
X f (k) (x0 ) f (n+1) (ξ)
f (x) = (x − x0 )k + (x − x0 )n+1
k! (n + 1)!
k=0

con ξ compreso tra x e x0 . Per la (1.37) abbiamo


n

X f (k) (x0 )
k [h|x − x0 |]n+1
f (x) − (x − x0 ) ≤ M .

k! (n + 1)!
k=0

La successione a secondo membro è infinitesima al divergere di n. Si ottiene


pertanto il risultato.

È lecito chiedersi se una funzione per la quale sussista la (1.36) in un intorno


I di x0 sia sviluppabile in serie di Taylor con punto iniziale diverso da x0 . La
risposta a un tale quesito è contenuta nel seguente risultato.
Teorema 1.7.3. - Sussista la (1.36) per ogni x ∈ I =]x0 − r, x0 + r[. Allora per
ogni a ∈ I, la funzione f è sviluppabile in serie di Taylor di punto iniziale a. Il
raggio di convergenza di tale sviluppo in serie è almeno pari al valore minimo
tra (x0 − r − a) e (x0 + r − a).

Dimostrazione. Premettiamo il seguente risultato.


Se {aij } è una successione doppia tale che
 !
X n Xm 
(1.38) sup |aij | < +∞
n,m  
j=1 i=1
24 CAPITOLO 1. SERIE DI FUNZIONI

si ha
 
∞ ∞ ∞ ∞
!
X X X X
(1.39) aij =  aij  .
j=1 i=1 i=1 j=1

Supponiamo che i termini aij siano non negativi e denotiamo con S la quantità
(1.38). Se S 0 denota, per esempio, il termine a sinistra in (1.39), si ha

n m
! n
!
X X X X
aij ≤ aij ≤ S 0
j=1 i=1 j=1 i=1

da cui S ≤ S 0 .
D’altra parte
∞ ∞
n
! n
! m n
!
X X X X X X
aij = aij = lim aij ≤S
m→∞
j=1 i=1 i=1 i=1 j=1 i=1

da cui S 0 ≤ S. Abbiamo quindi provato che S = S 0 .


In modo analogo si dimostra che S coincide con il termine a destra nella (1.39).
− −
Sia aij = a+ +
ij − aij . Ovviamente risulta finita la quantità (1.38) con aij o aij al
posto di aij . Si ha allora
∞ ∞ ∞ ∞ ∞ ∞
! ! !
X X X X X X
aij = a+
ij − a−
ij
j=1 i=1 j=1 i=1 j=1 i=1
     

X X∞ ∞
X ∞
X ∞
X X∞
=  a+
ij
−  a−
ij
=  aij 
i=1 j=1 i=1 j=1 i=1 j=1

cioè la (1.39).
Procediamo ora con la dimostrazione del teorema.
Per semplicità assumiamo x0 = 0; vale quindi la (1.35) per ogni x ∈] − r, r[.
Sia a un punto di tale intervallo e riscriviamo la (1.35) nel modo seguente
∞ ∞
" n   #
X f (n) (0) n
X f (n) (0) X n h n−h
f (x) = [(x − a) + a] = (x − a) a .
n=0
n! n=0
n! h
h=0

Per poter commutare le due sommatorie bisogna dimostrare che vale la (1.38),
bisogna cioè verificare che

" n   #
X |f (n) (0)| X n
|x − a|h |a|n−h < +∞ .
n=0
n! h
h=0

Tale quantità non è altro che



X |f (n) (0)| n
(|x − a| + |a|)
n=0
n!
1.8. SVILUPPI NOTEVOLI 25

che risulta finita se |x − a| + |a| < r. Per tali valori di x si ha


∞ ∞   (n)
!
X X n f (0) n−h
f (x) = a (x − a)h .
h n!
h=0 n=h

Quindi f è sviluppabile in serie di potenze di punto iniziale a.

1.8 Sviluppi notevoli


Completiamo l’elenco degli sviluppi in serie di potenze delle funzioni elementari
iniziato nel primo paragrafo con gli sviluppi (1.5), (1.6), (1.7).
Se x ∈] − 1, 1[ si ha

1 X
(1.40) = (−1)n xn .
1 + x n=0

Dalla (1.34) si ha allora, sempre per x ∈] − 1, 1[,



X xn
(1.41) log(1 + x) = (−1)n−1 .
n=1
n

La serie a secondo membro converge nell’estremo destro dell’intervallo di con-


vergenza per il criterio di Leibnitz. Per il teorema 1.6.7 la serie di potenze (1.41)
converge uniformemente in ogni intervallo [a, 1] con a ∈] − 1, 1[.
Dalla (1.32) si riottiene l’identità

X 1
log 2 = (−1)n−1 .
n=1
n

Ponendo x2 al posto di x nella (1.40) abbiamo



1 X
= (−1)n x2n
1 + x2 n=0

con x ∈] − 1, 1[. Utilizzando la (1.34) si ottiene



X x2n+1
arctan x = (−1)n
n=0
2n + 1

per ogni x ∈] − 1, 1[. Poiché la serie a secondo membro converge agli estremi
dell’intervallo di convergenza, per il teorema 1.6.7, la convergenza della serie è
uniforme in [−1, 1]. Inoltre si ha

π X 1
= arctan 1 = (−1)n .
4 n=0
2n +1
26 CAPITOLO 1. SERIE DI FUNZIONI

Consideriamo ora la funzione (1 + x)α con α reale. Si ha

dk
(1 + x)α = α(α − 1) . . . (α − k + 1)(1 + x)α−k .
dxk
Poniamo
   
α α α(α − 1) . . . (α − k + 1)
= 0, = , se k 6= 0 .
0 k k!
Se α è un intero positivo si riottengono i coefficienti binomiali; in tal caso la
serie (1.42) si riduce a un polinomio. La serie di McLaurin di (1 + x)α si scrive
allora nel modo seguente
∞  
X α n
(1.42) x ;
n=0
n

essa prende il nome di serie binomiale.


Poiché  
α

n n+1
lim   = lim =1
n→∞
α n→∞ |α − n|
n+1

per il teorema 1.6.5 la serie (1.42) ha raggio di convergenza 1. Sia f la somma


della serie (1.42) in ] − 1, 1[.
Per la (1.33) si ha
∞  
0
X α n−1
f (x) = n x .
n=1
n
Essendo    
α α−1
n =α
n n−1
risulta
∞   ∞  
1 0 X α − 1 n−1 X α − 1 n
f (x) = x = x .
α n=1
n−1 n=0
n
Moltiplichiamo primo e secondo membro per (1 + x). Si ottiene
∞    
1 0 X α−1 α−1
f (x)(1 + x) = 1 + + xn .
α n=1
n − 1 n

Facendo uso dell’identità


     
α−1 α−1 α
+ = ,
n−1 n n
si ha
∞  
1 0 X α n
f (x)(1 + x) = x = f (x)
α n=0
n
1.9. ESERCIZI 27

da cui
d f (x)
= 0.
dx (1 + x)α
Risulta allora
f (x)
= f (0) = 1
(1 + x)α
e quindi
∞  
α
X α
(1.43) (1 + x) = f (x) = xn , x ∈] − 1, 1[ .
n=0
n

Per α = −1/2 la (1.43) diventa



1 X (2n − 1)!! n
√ =1+ (−1)n x , x ∈] − 1, 1[
1+x n=1
(2n)!!

dove con il simbolo k!! si intende il prodotto di tutti i naturali non superiori a
k che abbiano la stessa parità di k. Ponendo −x2 al posto di x si ha

1 X (2n − 1)!! 2n
√ =1+ x .
1−x2
n=1
(2n)!!

Integrando tra 0 e x abbiamo il seguente ulteriore sviluppo



X (2n − 1)!! x2n+1
(1.44) arcsin x = x + .
n=1
(2n)!! 2n + 1

Dalla formula r
(2n)!! 1 π
lim √ =
n→∞ (2n − 1)!! 2n + 1 2
si deduce l rapporto tra (2n)!! e (2n − 1)!! è un infinito di ordi ne 1/2; pertanto
la serie

X (2n − 1)!! 1
1+
n=1
(2n)!! 2n + 1
è convergente: per la (1.32) la sua somma è π/2. Il teorema 1.6.6 assicura
infine che la serie a secondo membro nella (1.44) è uniformemente convergente
in [−1, 1].

1.9 Esercizi
1. Si verifichi che la successione riportata nell’esempio 1.2.1 non converge
uniformemente in tutto l’intervallo [0, 1] facendo vedere che non è possibile
determinare in corrispondenza di un generico ε un indice ν indipendente
da x. Dimostrare invece che converge uniformemente se ci si restringe agli
intervalli [a, 1] con a > 0.
28 CAPITOLO 1. SERIE DI FUNZIONI

2. Dimostrare che la serie



X 2
(nx)n e−n x

n=1

è totalmente convergente in [0, +∞[.

3. Si consideri la successione di funzioni {sin(πxn )} con x ∈ [0, 1]. Essa


converge uniformemente?

4. Sia
x
fn (x) = sin
n2
con x ∈ [0, π]. Dimostrare che la successione {fn } converge uniforme-
mente alla funzione identicamente nulla. Dimostrare che é totalmente
convergente la serie il cui termine generale è fn . Sia f la somma di tale
serie; integrarla termine a termine.

5. Sia {fn } una successione di funzioni


P∞ continue, non negative e crescenti in
[0, 1]. Dimostrare che se la serie n=1 fn converge allora essa converge
totalmente.

6. Se una serie di potenze di punto iniziale 1 converge nel punto 3 si può


affermare che essa converge nel punto −1/2? cosa succede in −1?

7. Si consideri la successione di funzioni il cui termine generale é

h x2
i n+1
2n
fn (x) = n(e n − 1) .

Si calcoli la funzione limite f della successione. Si verifichi che le funzioni


fn hanno tutte derivata nulla in zero. Le funzioni fn sono derivabili mentre
la funzione f non é derivabile nell’origine. Quale ipotesi del teorema 1.5.1
non sussiste in tale circostanza?

8. Dimostrare che la serie di funzioni


+∞
X 1
1 + (2x)n
n=1

converge uniformemente nell’intervallo [2/3, +∞[.

9. Determinare il raggio di convergenza e studiare il comportamento agli


estremi dell’intervallo di convergenza delle seguenti serie di potenze
1.9. ESERCIZI 29

∞ ∞
X n2 n X 3n
a) x b) xn
n=1
2n n=2
n lg2 n

∞ √ ∞
n
X 2 X nn n
c) xn d) x
n=1
n n=1
e n2

∞  √  n3 ∞
X n
en X log(1 + n!) n
e) xn f) x
n=0
n + 1 n=1
log(1 + n)

∞ ∞
X 2 X x2n
g) n−n xn h)
n=0 n=1
n

∞ ∞
X √
n n
X xn
i) n x l) .
n=1 n=1
n!

10. Dimostrare che


+∞
X xn+2
= (1 − x) log(1 − x) + x .
n=0
(n + 1)(n + 2)

11. Si consideri la serie di funzioni


+∞
X
(2x| log x|)n .
n=1

Verificare se tale serie é totalmente convergente.

12. Dimostrare la convergenza uniforme in [0, +∞[ della serie


+∞
X
xn e−nx .
n=0

13. La serie di potenze


+∞
X
an (x + 1)n
n=0

converge in −2 e non converge in 0. Cosa si può dire sul suo raggio di


convergenza?
14. Calcolare il raggio di convergenza della serie di potenze (1.30) assumendo
che
an
lim = 3.
n→+∞ n
30 CAPITOLO 1. SERIE DI FUNZIONI
Capitolo 2

Calcolo differenziale

2.1 Spazi metrici


L’obiettivo di tale capitolo è trasferire un certo numero di concetti relativi alla
struttura dei reali e alle funzioni ivi definite (limitatezza, distanza, convergenza,
completezza, compattezza, connessione, continuità, differenziabilità, etc.) dap-
prima agli spazi euclidei e poi, anche se solo con qualche cenno, a strutture piú
complesse.
Se N è un intero lo spazio euclido RN è l’insieme delle N -ple ordinate di numeri
reali

(2.1) x = (x1 , . . . , xN ) = (xi ) .

Osservazione 2.1.1. - Nel caso di R2 o di R3 , per semplicità notazionale,


piuttosto che utilizzare la scrittura (2.1) si preferisce denotare con (x, y) ovvero
con (x, y, z) i rispettivi punti.

Per prodotto scalare di due vettori x = (xi ), y = (yi ) si intende la quantità


N
X
(2.2) < x, y > = xi yi .
i=1

Piú in generale, se V uno spazio vettoriale si chiama prodotto scalare un’appli-


cazione

(2.3) (v, w) ∈ V 2 −→ < v, w > ∈ R

che goda delle seguenti proprietà

S1 ) < v, v > ≥ 0

S2 ) < v, v > = 0 ⇐⇒ v = 0

31
32 CAPITOLO 2. CALCOLO DIFFERENZIALE

S3 ) per ogni α ∈ R
< α v, w >= α < v, w >

S4 ) < v, w >=< w, v >


S5 ) < u + v, w >=< u, w > + < v, w > .
Tali proprietà sono ovviamente soddisfatte dal prodotto scalare (2.2).
Se l’applicazione (2.3) assume valori complessi la S4 ) è sostituita dalla seguente
proprietà di Hermite
S04 ) < v, w >= < w, v > .
Da S04 ) e S3 ) discende in modo ovvio la seguente proprietà.
S03 ) Se α è complesso
< v, α w >= α < v, w > .

Introdotto in V un prodotto scalare si definisce norma o lunghezza di v la


quantità

(2.4) kvk = < v, v > .

In RN , dotato del prodotto scalare (2.2), si ha


v
uN
uX
(2.5) kxk = t x2i .
i=1

Ricordiamo che è possibile introdurre una norma in uno spazio vettoriale anche
senza far ricorso ad un prodotto scalare.
Con il termine norma si intende un’applicazione

v ∈ V −→ kvk ∈ R

che goda delle proprietà


N1 ) kvk ≥ 0
N2 ) kvk = 0 ⇐⇒ v = 0
N3 ) se α è uno scalare allora kα vk = |α| kvk
N4 ) kv + wk ≤ kvk + kwk .
Uno spazio vettoriale in cui sia definita una norma prende il nome di spazio
normato.
Verifichiamo ora che la (2.4) è effettivamente una norma.
Le prime tre proprietà sono di facile verifica. Per dimostrare la quarta è
necessario prima provare la seguente disuguaglianza di Schwarz

(2.6) | < v, w > | ≤ kvkkwk .


2.1. SPAZI METRICI 33

Supponiamo che il campo degli scalari sia R.


Sia v 6= 0 e t reale. Per le proprietà del prodotto scalare si ha

0 ≤ < t v + w, t v + w >= t2 < v, v > +2t < v, w > + < w, w >

da cui, ricordando la (2.4),

0 ≤ t2 kvk2 + 2t < v, w > +kwk2 .

Il polinomio di secondo grado in t in tal modo ottenuto assume valori non


negativi. Deve pertanto essere

< v, w >2 −kvk2 kwk2 ≤ 0

da cui la (2.6).
Per la (2.6) si ha

kv + wk2 = < v + w, v + w > = < v, v > +2 < v, w > + < w, w >

2
≤ kvk2 + 2kvkkwk + kwk2 = (kvk + kwk)

da cui la proprietà N4 ).
Si ha inoltre il seguente risultato.
Teorema 2.1.1. - Se v, w sono due vettori di uno spazio normato allora

(2.7) | kvk − kwk | ≤ kv − wk .

Dimostrazione. Per la N4 ) si ha kvk ≤ kv−wk+kwk da cui kvk−kwk ≤ kv−wk.


In modo analogo si ha kwk − kvk ≤ kv − wk. Abbiamo quindi la (2.7).
La (2.6) può essere scritta nel modo seguente
< v, w >
−1 ≤ ≤ 1.
kvkkwk

Esiste quindi un unico valore θ ∈ [0, π] tale che


< v, w >
cos θ = .
kvkkwk
Il valore θ cosı́ determinato è, per definizione, l’angolo formato dai vettori v, w.
Se il valore di tale angolo è π/2 si dice che essi sono ortogonali. Si estende in
tal modo al caso degli spazi vettoriali dotati di prodotto scalare la nozione di
perpendicolarità.
Ricordiamo infine che per distanza o metrica in un insieme D si intende un’ap-
plicazione
(x, y) ∈ D2 −→ d(x, y) ∈ R
la quale soddisfi le condizioni
34 CAPITOLO 2. CALCOLO DIFFERENZIALE

M1 ) d(x, y) = d(y, x)
M2 ) d(x, y) ≥ 0
M3 ) d(x, y) = 0 ⇐⇒ x = y
M4 ) d(x, y) ≤ d(x, z) + d(z, y) .
L’ultima condizione è nota come proprietà triangolare.
La coppia (D, d) prende il nome di spazio metrico.
In una tale struttura si può in modo naturale pervenire ad una definizione di
convergenza.
Definizione 2.1.1. - Si dice che una successione {xn } di punti di D converge
a x0 se
lim d(xn , x0 ) = 0 .
n→+∞

Si verifica facilmente che uno spazio vettoriale normato è uno spazio metrico
una volta che si definisca la distanza tra due vettori u, v come norma della loro
differenza
d(u, v) = ku − vk .
Si ottiene in tal modo per esempio la distanza euclidea in RN
v
uN
uX
(2.8) kx − yk = t (xi − yi )2 .
i=1

La convergenza indotta in RN dalla metrica (2.8) può essere caratterizzata nel


seguente modo.
Proposizione 2.1.1. - Posto
(n) (n)
x(n) = (x1 , . . . , xN )

la successione {x(n) } converge a x = (x1 , . . . , xN ) se e solo se ciascuna delle N


(n)
successioni numeriche {xi }, con i = 1, . . . , N , converge a xi .
Dimostrazione. Osservato che
N
(n) (n)
X
|xi − xi | ≤ kx(n) − xk ≤ |xi − xi |
i=1

si perviene facilmente all’asserto.


Due differenti metriche definite in un insieme sono equivalenti se una successione
che sia convergente rispetto all’una lo è anche rispetto all’altra. Si dice in tal
caso che esse inducono la stessa topologia. Nel caso in cui tali distanze siano
generate da due differenti norme k · k e k · k∗ ciò si verifica se per ogni v ∈ V si
ha
akvk ≤ kvk∗ ≤ bkvk
2.1. SPAZI METRICI 35

con a, b costanti positive.


Se x = (xi ) poniamo
N
X
(2.9) kxk1 = |xi |
i=1

(2.10) kxk∞ = max |xi | .


i

Si dimostra facilmente che la (2.9) e la (2.10) sono norme; esse sono equivalenti
alla norma euclidea (2.5).
Altro notevole esempio di spazio metrico è lo spazio vettoriale C 0 ([a, b]) delle
funzioni continue in [a, b]. Verificato che

(2.11) kf kC 0 = max |f (x)|


x∈[a,b]

è una norma, la distanza tra due funzioni f, g è

kf − gkC 0 = max |f (x) − g(x)| .


x∈[a,b]

Una successione {fn } converge allora ad f se


 
lim max |fn (x) − f (x)| = 0
n→∞ x∈[a,b]

ovvero se essa converge uniformemente in [a, b] a f (cfr. oss. 1.2.2).


Sempre in C 0 ([a, b]) è possibile definire norme differenti dalla (2.11).
Un primo esempio è costituito da
Z b
(2.12) kf kL1 = |f (x)| dx .
a

La distanza tra due funzioni f, g in tal caso è


Z b
|f (x) − g(x)| dx .
a

Osservazione 2.1.2. - Le norme (2.9), (2.10), (2.11) e (2.12) non si ottengono


a partire da un prodotto scalare.
Si può dimostrare infatti che ciò è possibile solo se per la norma data vale la
seguente regola del parallelogramma

2kuk2 + 2kvk2 = ku + vk2 + ku − vk2 .

Si può definire una norma in C 0 ([a, b]) a partire dal prodotto scalare
Z b
< f, g >= f (x)g(x) dx .
a
36 CAPITOLO 2. CALCOLO DIFFERENZIALE

La norma di f è allora
!1/2
Z b
(2.13) kf kL2 = |f (x)|2 dx
a

e la distanza tra due funzioni f, g diventa


!1/2
Z b
2
kf − gkL2 = |f (x) − g(x)| dx .
a

Dalla disuguaglianza di Schwarz (2.6) si ha allora


Z !1/2 Z !1/2
b Z b b
2 2
f (x)g(x)dx ≤ |f (x)| dx |g(x)| dx .


a a a

Nel caso in cui C 0 ([a, b]) sia dotato o della norma (2.12) o della norma (2.13) si
ottiene un tipo di convergenza piú debole della convergenza uniforme nel senso
che, se una successione converge uniformemente, allora essa converge anche in
questi due nuovi spazi metrici.
Una successione convergente di uno spazio metrico gode ovviamente della se-
guente proprietà
(2.14) ∀ε > 0 ∃ν : ∀n, m > ν d(xn , xm ) < ε .
In R, per il criterio di convergenza di Cauchy, la (2.14) è condizione necessaria
e sufficiente perché una successione converga. Tale equivalenza non vale in un
generico spazio metrico.
Una successione che verifichi la condizione (2.14) prende il nome di successione
di Cauchy.
Definizione 2.1.2. - Uno spazio metrico dicesi completo se ogni successione di
Cauchy è convergente.
Per quanto detto in precedenza sul significato della convergenza negli spazi
euclidei e in C 0 ([a, b]) dotato della norma (2.11) in tutti e due casi,si ha a che
fare con spazi metrici completi.
Lo spazio C 0 ([a, b]) con una delle norme (2.12) o (2.13) non è invece completo.
Uno spazio normato, se completo, prende il nome di spazio di Banach, ovvero,
di spazio di Hilbert se la norma è definita a partire da un prodotto scalare.

2.2 Compattezza
Sia (D, d) uno spazio metrico. Introduciamo la seguente terminologia che si rifà
a quella in uso per la retta reale.
• L’intorno sferico di x̄ di raggio r è l’insieme
S(x̄, r) = {x ∈ D : d(x, x̄) < r} .
2.2. COMPATTEZZA 37

• Un punto è interno a X se esiste un suo intorno sferico incluso in X.


• Un punto è esterno a X se esso è interno al complementare di X.
• Un punto che non sia né esterno né interno dicesi di frontiera. L’insieme
dei punti di frontiera di X si denota con il simbolo ∂X.
• Un punto x0 è di accumulazione per X se, comunque si prenda un suo
intorno sferico, questo contiene almeno un punto di X diverso da x0 .
• Un insieme è limitato se esiste un intorno sferico che lo contiene.
• Un insieme è aperto se tutti i suoi punti sono interni.
• Un insieme che contenga tutti i suoi punti di accumulazione dicesi chiuso.
• Un insieme è compatto se ogni successione di suoi elementi ha una sotto-
successione convergente ad un punto dell’insieme.
Sussistono i seguenti risultati di semplice verifica.
Teorema 2.2.1. - Se x0 è un punto di accumulazione di X allora esiste una
successione di punti di X\{x0 } convergente a x0 .
Teorema 2.2.2. - Un insieme X è chiuso se e solo se ogni successione conver-
gente di punti di X ha per limite un punto di X.
Teorema 2.2.3. - Un insieme è chiuso (aperto) se e soltanto se il suo comple-
mentare è aperto (chiuso).
La caratterizzazione delle successioni convergenti di RN (cfr. prop. 2.1.1)
nonché quella dei compatti della retta reale consentono di pervenire al seguente
risultato.
Teorema 2.2.4. - Un sottoinsieme K di RN è compatto se e solo se esso è
chiuso e limitato.
Dimostrazione. Se K è compatto esso è anche chiuso per il teorema 2.2.2.
Dimostriamo che è limitato. Se cosı́ non fosse, per ogni n esisterebbe un ele-
mento x(n) di K tale che kx(n) k > n. Sia {x(nh ) } una sottosuccessione di {x(n) }
convergente ad un punto x di K. Per la (2.7) si ha

kx(nh ) − xk ≥ kx(nh ) k − kxk ≥ nh − kxk .

Quindi la successione {kx(nh ) − xk} diverge positivamente. Ma ciò è assurdo in


quanto la successione {x(nh ) } tende a x.
Supponiamo K chiuso e limitato. Sia
(n) (n)
x(n) = (x1 , · · · , xN )
(n)
una successione di punti di K. Ovviamente è limitata la successione {x1 } for-
mata dalle prime coordinate dei punti della successione. Da essa si può quindi
38 CAPITOLO 2. CALCOLO DIFFERENZIALE

(n )
estrarre una successione {x1 h } convergente ad un numero x1 . Si consideri la
(n )
successione limitata {x2 h }. Da essa estraiamo una sottosuccessione conver-
gente ad un valore x2 . Cosı́ procedendo si costruisce una sottosuccessione della
successione di partenza tale che ciascuna delle N successioni numeriche costi-
tuite dalle coordinate i-me converge ad un valore xi . Allora la sottosuccessione
converge a x = (xi ) che appartiene a K per il teo. 2.2.2.

Osservazione 2.2.1. - Nell’ambito degli spazi normati la propietà che da ogni


successione limitata si possa estrarre una successione convergente è prerogativa
degli spazi euclidei. Si pensi alla successione di C 0 ([0, 1]) dell’es. 1.2.2 con
α = 1/2. Tale successione è limitata ma da essa non è possibile estrarre alcuna
sottosuccessione convergente uniformemente alla funzione identicamente nulla.
La nozione di compattezza negli spazi euclidei può essere anche formulata in
modo differente.
Definizione 2.2.1. - Una famiglia di aperti {Ai }i∈I di RN prende il nome di
ricoprimento di X se X è contenuto nell’unione degli Ai .
La famiglia {Aj }j∈J con J ⊂ I è un sottoricoprimento di {Ai }i∈I se
[
X⊂ Aj .
j∈J

Vale il seguente risultato.


Teorema 2.2.5. - Un sottoinsieme K di RN è compatto se e solo se ogni suo
ricoprimento ha un sottoricoprimento finito.

Dimostrazione. Sia K compatto. Verifichiamo che, comunque si fissi ε > 0, è


possibile ricoprire K con un numero finito di sfere di raggio ε. Ragioniamo per
assurdo. Fissato x(1) ∈ K, sia S1 la sfera di centro x(1) e raggio ε. Esiste
certamente un punto x(2) ∈ K\S1 , altrimenti S1 ricoprirebbe K. Procedendo
per induzione si ottiene una successione di sfere {Sn }, ciascuna con centro in
un punto x(n) ∈ K e raggio ε, tale che
n
[
(2.15) x(n+1) 6∈ Sk .
k=1

La successione {x(n) } ha un punto di accumulazione x ∈ K. Denotata con S la


sfera di centro x e raggio ε/2, si fissino due indici h, k, con k > h, tali che sia
x(h) , x(k) ∈ S. Si ha allora kx(h) − x(k) k < ε. Quindi x(k) ∈ Sh in contrasto con
la (2.15).
Fissato un intero n, consideriamo un ricoprimento finito di K costituito da sfere
di raggio 1/n. Se dal ricoprimento {Ai }i∈I non fosse possibile estrarne uno finito
allora almeno una di tali sfere non è ricoperta da un numero finito di elementi
della famiglia {Ai }i∈I . Sia Sn una tale sfera e scegliamo x(n) ∈ Sn ∩ K. La
successione {x(n) } in tal modo ottenuta ha un punto di accumulazione x ∈ K
che appartiene ad un aperto Ai del ricoprimento. Fissiamo r e n in modo tale
2.3. FUNZIONI: LIMITI E CONTINUITÀ 39

che S(x, r) ⊂ Ai , kx(n) − xk < 2r e n1 < 2r . Risulta allora Sn ⊂ Ai contro la


condizione che Sn non è ricopribile con un numero finito di elementi di {Ai }i∈I .
Supponiamo che ora che da ogni ricoprimento di aperti di K se ne possa estrarre
uno finito. Se K non fosse compatto esisterebbe una successione di punti di K,
con sostegno infinito, priva di punti di accumulazione. Allora per ogni x ∈ K
esisterebbe un intorno sferico Sx di tale punto contenente solo un numero finito
di elementi della successione. La famiglia {Sx }x∈K è un ricoprimento di aperti
di K. Da essa se ne può estrarre uno finito; ma questo comporta che il sostegno
della successione è finito. Si è giunti pertanto ad un assurdo.
Concludiamo tale paragrafo con la seguente interessante conseguenza del teore-
ma 2.2.5.
Teorema 2.2.6. - L’intersezione di una successione {Kn } decrescente di com-
patti non vuoti è non vuota.
Dimostrazione. Procediamo per assurdo. Supponiamo che l’intersezione dei
compatti sia vuota. Allora l’unione degli aperti An = RN \Kn coincide con
tutto RN : quindi K1 ⊂ ∪n An . Essendo K1 compatto esso può essere ricoperto
da un numero finito di An ovvero da uno solo di questi, che indichiamo con Am ,
dal momento che la successione {An } è crescente. Si ha in definitiva

Km ⊆ K1 ⊂ Am = RN \Km .

Ma ciò non possibile in quanto Km è non vuoto.

2.3 Funzioni: limiti e continuità


Riportiamo qui di seguito alcuni risultati relativi a funzioni numeriche cioè a
funzioni definite in sottoinsiemi di uno spazio metrico (D, d) e a valori reali.
Se x̄ è di accumulazione per X si dice che f converge a l in x̄, ovvero, in simboli,

lim f (x) = l ,
x→x̄

se
∀ > 0 ∃r > 0 : ∀x ∈ X ∩ S(x̄, r)\{x̄} |f (x) − l| <  .
Se x̄ ∈ X e risulta
lim f (x) = f (x̄)
x→x̄
si dice che f è continua in x̄.
Una funzione continua in ogni punto di X dicesi continua in X.
Si dice che f diverge positivamente (negativamente) in x̄, ovvero, in simboli,

lim f (x) = +∞ (−∞)


x→x̄

se
∀k > 0 ∃r > 0 : ∀x ∈ X ∩ S(x̄, r)\{x̄} f (x) > k (< k) .
Sussiste il seguente risultato.
40 CAPITOLO 2. CALCOLO DIFFERENZIALE

Teorema 2.3.1. (Teorema di Weierstrass) - Sia f una funzione continua


in un compatto K. Allora f è dotata di minimo e di massimo, esistono cioè
due punti x, x di K tali che

f (x) ≤ f (x) ≤ f (x)

per ogni x ∈ K.

Dimostrazione. Sia
m = inf f (x) .
x∈K

Per le proprietà dell’estremo inferiore è possibile determinare una successione


{xn } di elementi di K tale che

(2.16) lim f (xn ) = m .


n→∞

Essendo K compatto dalla successione {xn } è possibile estrarre una sottosuc-


cessione {xnh } convergente ad un elemento x di K. Per la continuità di f risulta
allora
lim f (xnh ) = f (x) .
h→∞

Per la (2.16) si ha f (x) = m.


In modo analogo si ragiona per quanto riguarda il massimo.

Definizione 2.3.1. - Una funzione f è uniformemente continua in X se, per


ogni ε, esiste un δ tale che |f (x) − f (y)| < ε non appena risulti d(x, y) < δ.

Ovviamente una funzione uniformemente continua è anche continua. Sussiste


inoltre il seguente risultato la cui dimostrazione non viene riportata dal momento
che ricalca quella relativa alle funzioni definite sui compatti della retta reale.

Teorema 2.3.2. (Teorema di Cantor) - Una funzione continua in un com-


patto è ivi uniformemente continua.

2.4 Convessità e connessione


La nozione di continuità si può estendere al caso di un’applicazione f tra due
differenti spazi metrici (D, d) e (D0 , d0 ).
Si dice infatti che f è continua in x̄ ∈ D se, comunque si fissi ε esiste un r tale
che d0 (f (x), f (x̄)) < ε per ogni x ∈ S(x̄, r). Diremo inoltre che f è continua se
essa è continua in ogni punto.
Riportiamo senza dimostrazione la seguente caratterizzazione delle funzioni con-
tinue.

Teorema 2.4.1. - Un’applicazione tra spazi metrici è continua se e solo se


l’antiimmagine di un qualsiasi aperto (chiuso) è un aperto (chiuso).
2.4. CONVESSITÀ E CONNESSIONE 41

Consideriamo il caso di una applicazione tra gli spazi euclidei RN e RM

x = (x1 , · · · , xN ) ∈ A −→ f (x) = (f1 (x), · · · , fM (x)) .

Si verifica facilmente che essa è continua solo se tali sono le M componenti fi .


Dati due punti x, y di RN per segmento di estremi x, y si intende il codominio
della funzione
t ∈ [0, 1] −→ ty + (1 − t)x .
Fissati n punti x1 , · · · , xn in RN , l’insieme dei punti appartenenti ai segmenti
di estremi xi , xi+1 con i = 1, · · · , n − 1, prende il nome di poligonale di estremi
x1 , xn e di vertici x1 , · · · , xn .
Ciò premesso richiamiamo alcune nozioni relative a sottoinsiemi di RN .

• X è convesso se comunque si prendano due suoi punti il segmento che li


congiunge è contenuto in X.

• X è convesso rispetto a un suo punto x̄ se comunque si prenda un punto


x ∈ X il segmento che congiunge x e x̄ è contenuto in X.

• X è connesso per poligonali se, comunque si prendano x, x0 ∈ X, esiste


una poligonale di estremi x, x0 contenuta in X.

Ovviamente un convesso è anche convesso rispetto ad ogni suo punto. Un


insieme convesso rispetto ad un punto è anche connesso per poligonali.
Per completezza riportiamo l’usuale definizione di connessione.
Definizione 2.4.1. - Si dice che X è connesso se non è possibile determinare
due aperti A, B disgiunti tali che X sia contenuto nell’unione di A, B e ciascuna
delle intersezioni X ∩ A e X ∩ B sia non vuota.
Si può dimostrare che un insieme connesso per poligonali è anche connesso e che
per gli insiemi aperti le due definizioni sono equivalenti.
Sussiste il seguente risultato che estende al caso pluridimensionale il teorema
degli zeri.
Teorema 2.4.2. - Sia f una funzione numerica continua in un insieme X di
RN connesso per poligonali. Se in due punti x0 , x00 di X la funzione assume
valori di segno opposto allora esiste almeno un punto di X in cui f si annulla.

Dimostrazione. Uniamo i due punti x0 , x00 con una poligonale di vertici xi (i =


1, · · · , n) con x1 = x0 e xn = x00 . Se in nessuno dei vertici la funzione f si annulla
è allora possibile determinare un indice j tale che f (xj ) ≤ 0 e f (xj+1 ) > 0.
Consideriamo allora la restrizione di f al segmento di estremi xj e xj+1 cioè la
funzione di una sola variabile

t ∈ [0, 1] −→ F (t) = f (txj+1 + (1 − t)xj ) .

Tale funzione è ovviamente continua. Essa agli estremi dell’intervallo [0, 1] as-
sume valori di segno opposto. Per il teorema degli zeri per funzioni di una
42 CAPITOLO 2. CALCOLO DIFFERENZIALE

variabile la funzione F si annulla per un opportuno valore della variabile t. Ciò


ovviamente significa che la funzione f si annulla in un punto del segmento che
congiunge xj e xj+1 .
Osserviamo infine che il risultato sussiste anche nella piú generale ipotesi di
connessione.

Concludiamo tale breve rassegna con il seguente risultato ovvia conseguenza dei
teoremi 2.3.1 e 2.4.2.
Corollario 2.4.1. - Sia X un sottoinsieme di RN compatto e connesso per
poligonali e sia f una funzione continua in X. Allora il codominio di f è
l’intervallo [m, M ] dove m, M denotano rispettivamente il minimo e il massimo
di f .

2.5 Il teorema delle contrazioni


Sia (D, d) uno spazio metrico e sia

F : x ∈ D → F (x) ∈ D

un’applicazione di D in sé.
Definizione 2.5.1. - Si dice che F è una contrazione se esiste una costante
α ∈]0, 1[ tale che

(2.17) d(F (x), F (y)) ≤ α d(x, y)

per ogni x, y ∈ D.
Sussiste il seguente risultato.
Teorema 2.5.1. (Teorema delle contrazioni) - Se F è una contrazione di
uno spazio metrico completo in sé allora l’equazione

(2.18) F (x) = x

ha una e una sola soluzione che prende il nome di punto unito di F .

Dimostrazione. Sia y un punto di D. Fissato ε, se d(x, y) ≤ α−1 ε per la (2.17)


si ha d(F (x), F (y)) ≤ ε da cui la continuità di F in y.
Per dimostrare l’esistenza della soluzione si utilizza un procedimento noto anche
come metodo delle approssimazioni successive.
Se x0 ∈ D definiamo per ricorrenza una successione mediante la posizione

(2.19) xn+1 = F (xn ) .

Per la (2.17) si ha

d(xn+1 , xn ) = d(F (xn ), F (xn−1 )) ≤ α d(xn , xn−1 )


2.6. TRASFORMAZIONI LINEARI 43

da cui, utilizzando il principio di induzione matematica, si ottiene

d(xn+1 , xn ) ≤ αn d(x1 , x0 ) .

Per la proprietà triangolare risulta

d(xn+k , xn ) ≤ d(xn+k , xn+k−1 ) + · · · + d(xn+1 , xn )

≤ (αn+k−1 + · · · + αn ) d(x1 , x0 ) .

Essendo α < 1 la serie geometrica di ragione α è convergente. Fissato ε, esiste


un indice ν tale che, per ogni n > ν e per ogni k,

αn + · · · + αn+k−1 < ε .

In definitiva risulta, sempre per n > ν e per ogni k,

d(xn+k , xn ) < ε d(x1 , x0 ) .

La sucessione {xn } è quindi di Cauchy. Per l’ipotesi di completezza tale succes-


sione converge ad un punto x. Dalla (2.19), passando al limite, ricordando che
F è continua, si ottiene x = F (x). Quindi x è un punto unito per F .
Dimostriamo infine che la soluzione di (2.18) è unica.
Se x = F (x) e y = F (y) risulta

d(x, y) = d(F (x), F (y)) ≤ α d(x, y) .

Essendo α < 1 deve essere d(x, y) = 0 da cui x = y.

2.6 Trasformazioni lineari


Richiamiamo alcune nozioni sulle trasformazioni lineari tra due spazi euclidei
RN e RM cioè su quelle funzioni L tali che

L(αx + βy) = αL(x) + βL(y)

per ogni x, y ∈ RN e per ogni α, β ∈ R.


L’insieme delle trasformazioni lineari di RN in RM si denota con L(RN , RM ).
È noto che ad ogni L ∈ L(RN , RM ) si può associare una matrice
 
a11 ··· a1N
 
 
(2.20)  ··· ··· ··· 
 .
 
aM 1 ··· aM N
44 CAPITOLO 2. CALCOLO DIFFERENZIALE

Essa agisce sugli elementi di RN , rappresentati come vettori colonna


 
x1
 
 
(2.21) x =  ··· 

,
 
xN
mediante il prodotto righe per colonne; si ha cioè
    PN 
a11 · · · a1N x1 j=1 a1j xj
    
    
L(x) =  ··· ··· ···  ··· ···
 = .
  
    
PN
aM 1 · · · aM N xN j=1 aM j xj
Nel caso in cui il funzionale lineare assuma valori reali si può usare la seguente
piú comoda notazione
(2.22) L(x) = a1 x1 + · · · aN xN =< a, x >
con a = (ai ).
Fissate due norme, la prima in RN , la seconda in RM , norme che per semplicità
indichiamo con lo stesso simbolo k · k, poniamo
kL(x)k
(2.23) kLk = sup .
x6=0 kxk

Si verifica facilmente che la (2.23) è una norma in L(RN , RM ).


In particolare, se nei due spazi euclidei RN e RM si introduce la norma (2.10),
abbiamo la seguente norma in L(RN , RM )
kL(x)k∞
kLk∞ = sup .
x6=0 kxk∞

Sussiste il seguente risultato.


Teorema 2.6.1. - Se (2.20) è la matrice associata a L ∈ L(RN , RM ) allora
N
X
(2.24) kLk∞ = max |aij | .
i=1,··· ,M
j=1

Dimostrazione. Si ha innanzitutto
 
N N
X X
kL(x)k∞ = max aij xj ≤ max  |aij ||xj |
i=1,··· ,M i=1,··· ,M
j=1 j=1
 
XN
≤ max  |aij | kxk∞
i=1,··· ,M
j=1
2.6. TRASFORMAZIONI LINEARI 45

e quindi
 
N
X
(2.25) kLk∞ ≤ max  |aij | .
i=1,··· ,M
j=1

Per semplicità assumiamo che


 
XN N
X
max  |aij | = |a1j | .
i=1,··· ,M
j=1 j=1

Scegliamo il vettore x in modo tale che la sua j-ma componente sia nulla se
a1j = 0 ovvero uguale a sgn(a1j ) se a1j 6= 0. Si verifica facilmente che
 
XN
kL(x)k∞ = max  |aij | kxk∞
i=1,··· ,M
j=1

da cui, tenendo presente la (2.25), si ottiene la (2.24).

Consideriamo il caso di un funzionale lineare L di RN in sé cui associamo la


matrice quadrata
 
a11 · · · a1N
 
 
(2.26)  ··· ··· ··· .

 
aN 1 · · · aN N

Se {ei } è la base canonica di RN poniamo


( N
)
X
I= x= ci ei : ci ∈ [0, 1] .
i=1

L’insieme I è l’ipercubo di RN i cui spigoli sono i versori ei . A tale insieme si


assegna come misura il valore uno. I vettori L(ei ) sono i vettori colonna della
matrice (2.26). Essi sono gli spigoli di
( N
)
X
L(I) = ci L(ei ) : ci ∈ [0, 1] ,
i=1

una sorta di N -parallelepipedo cui si può attribuire in modo naturale una misura
per la quale vale il seguente risultato che ci limitiamo a riportare.
Teorema 2.6.2. - La misura dell’insieme L(I) è uguale al valore assoluto del
determinante della matrice (2.26).
46 CAPITOLO 2. CALCOLO DIFFERENZIALE

2.7 Funzioni numeriche differenziabili


La nozione di derivata, per come è stata definita, sembra destinata ad essere
confinata al caso di funzioni numeriche di una variabile. Per poter presentare
una analoga nozione nel contesto piú generale degli spazi euclidei è necessario
seguire un approccio diverso.
A tale proposito ricordiamo che, nel caso unidimensionale, per il teorema del
differenziale, una funzione f è derivabile in x̄ se e solo se esiste una costante a
tale che

(2.27) f (x̄ + h) = f (x̄) + a h + o(h) .

Il simbolo o(h) denota un infinitesimo di ordine superiore rispetto ad h, una


funzione cioè tale che
o(h)
lim = 0.
h→0 h

È facile verificare che la costante a altro non è che la derivata di f in x̄. Quindi,
in base alla (2.27), una funzione di una variabile è derivabile o, anche, differen-
ziabile se l’incremento della funzione è, a meno di infinitesimi di ordine superiore
al primo, funzione lineare dell’incremento della variabile x.
Prendiamo spunto dalla (2.27) per formulare la seguente
Definizione 2.7.1. - Sia f una funzione numerica definita in A aperto di RN .
Si dice che f è differenziabile in x̄ ∈ A se, per x + h ∈ A, si ha

(2.28) f (x̄ + h) − f (x̄) = L(h) + o(h)

con L funzionale lineare e o(h) tale che,

o(h)
(2.29) lim = 0.
h→0 khk

Teorema 2.7.1. - Una funzione differenziabile in un punto x̄ è ivi continua.


Dimostrazione. Per la (2.22) scriviamo il funzionale lineare che compare nella
(2.28) come prodotto scalare di un vettore a = (ai ) e di un generico vettore
h = (hi ). Per la disuguaglianza di Schwarz (2.6) si ha

|f (x̄ + h) − f (x)| ≤ kakkhk + |o(h)|

da cui l’asserto, essendo o(h), per la (2.29), infinitesima per h che tende al
vettore nullo.
La (2.28) è suscettibile di una interpretazione geometrica: essa mette in luce il
fatto che, a meno di infinitesimi di ordine superiore al primo, il grafico di f si
può identificare con l’iperpiano di RN +1 di equazione
N
X
xN +1 = f (x̄1 , · · · , x̄N ) + ai (xi − x̄i )
i=1
2.7. FUNZIONI NUMERICHE DIFFERENZIABILI 47

che è, per definizione, il piano tangente al grafico di f nel punto


(x̄1 , · · · , x̄N , f (x̄1 , · · · , x̄N )) .
In analogia con il caso unidimensionale i coefficienti ai hanno una interpretazione
di tipo differenziale. Infatti per la (2.29) si ha
f (x̄1 , · · · , x̄i + h, · · · , x̄N ) − f (x̄1 , · · · , x̄i , · · · , x̄N )
lim = ai .
h→0 h
Tale limite prende il nome di derivata parziale di f rispetto alla variabile xi e
si denota con uno dei seguenti simboli
∂f
fxi .
∂xi
Con la notazione introdotta la (2.28) assume la seguente forma
N
X ∂f
(2.30) f (x) = f (x̄) + (x̄)(xi − x̄i ) + o((x − x̄)) ,
i=1
∂xi

ovvero la forma
f (x) = f (x̄)+ < ∇f (x̄), x − x̄ > +o((x − x̄))
dove il simbolo
∇f = (fx1 , · · · , fxN )
denota il vettore noto come gradiente di f .
Definizione 2.7.2. - Il funzionale lineare
N
X ∂f
dfx̄ : h = (hi ) −→ (x̄)hi =< ∇f (x̄), h >
i=1
∂xi

prende il nome di differenziale di f in x̄. Talvolta si usa piú semplicemente il


simbolo df .
Abbiamo visto che la differenziabilità di una funzione f implica che è derivabile
la restrizione di tale funzione a rette parallele agli assi cartesiani. Ci chiediamo
se una tale proprietà si possa estendere ad una qualsiasi direzione indicata da
un versore v = (vi ).
Consideriamo la restrizione di f alla retta di equazione parametrica x(t) = x̄+tv
e il suo rapporto incrementale
f (x̄ + tv) − f (x̄)
(2.31) .
t
Essendo f differenziabile in x̄, per la (2.30) si ha
N
!
1 X ∂f
lim f (x̄ + tv) − f (x̄) − t (x̄)v i = 0.
t→0 t ∂xi
i=1
48 CAPITOLO 2. CALCOLO DIFFERENZIALE

Si ha pertanto che il rapporto incrementale (2.31), per t che tende a zero,


converge al valore finito
N
df X ∂f
(2.32) = (x̄)vi =< ∇f (x̄), v >
dv i=1
∂xi

che prende il nome di derivata direzionale di f .


Applicando la disuguaglianza di Schwarz (2.6) alla (2.32) si ha

df
≤ k∇f k .
dv

La derivata direzionale assume il valore massimo quando v indica la direzione


del gradiente.

2.8 Funzioni di classe C 1


Abbiamo visto che una funzione differenziabile è dotata di derivate direzionali in
ogni direzione. Diversamente dal caso unidimensionale però la derivabilità par-
ziale o, anche, la derivabilità in ogni direzione non è sinonimo di differenziabilità
come illustrato nei seguenti esempi.
Esempio 2.8.1. - Si consideri la funzione

2xy 2
se (x, y) 6= (0, 0)


 2
f (x, y) = x + y4


0 se (x, y) = (0, 0) .

Sia v = (cos θ, sin θ) con cos θ 6= 0. Si ha


df f (t cos θ, t sin θ) (sin θ)2
= lim+ =2 ;
dv t→0 t cos θ
inoltre la derivata direzionale è nulla se cos θ = 0.
Quindi f ha derivate direzionali nell’origine qualunque direzione si fissi. Poiché
le derivate parziali fx , fy sono nulle nell’origine non vale la formula (2.32):
la funzione quindi non è differenziabile. La restrizione di f alla parabola di
equazione x = y 2 è costantemente uguale a 1. La funzione f non puó essere
continua nell’origine.
Esempio 2.8.2. - Tutte le derivate direzionali in (0, 0) di
 4  2
x x
 2 exp − se y 6= 0


(2.33) f (x, y) = y y


0 se y = 0

sono nulle. Essa non è differenziabile in quanto non risulta continua nell’ori-
gine: basta considerare la restrizione della funzione alle parabola di equazione
y = x2 e ragionare come nel precedente esempio.
2.8. FUNZIONI DI CLASSE C 1 49

Definizione 2.8.1. - Se A è un aperto di RN si dice che f è di classe C 1 (A)


se le sue derivate parziali sono continue in A.
Sussiste il seguente risultato che fornisce una utile condizione sufficiente per la
differenziabilità.
Teorema 2.8.1. (Teorema del differenziale) - Se f è di classe C 1 (A) allora
f è differenziabile in ogni punto di A.
Dimostrazione. Per semplificare l’esposizione consideriamo il caso bidimensio-
nale.
Se (x, y) è un punto di A scegliamo (x + ∆x, y + ∆y) in un cerchio, di centro
(x, y), contenuto in A.
Poniamo

∆f = f (x + ∆x, y + ∆y) − f (x, y)


(2.34)
= f (x + ∆x, y + ∆y) − f (x, y + ∆y) + f (x, y + ∆y) − f (x, y) .

Applicando il teorema di Lagrange alla funzione di una variabile

t −→ f (t, y + ∆y) ,

relativamente all’intervallo di estremi x e x + ∆x, nonché alla funzione

t −→ f (x, t) ,

relativamente all’intervallo di estremi y e y + ∆y, abbiamo

∆f = fx (x + ξ∆x, y + ∆y)∆x + fy (x, y + η∆y)∆y

con ξ, η compresi tra 0 e 1.


Risulta allora
∆f = fx (x, y)∆x + fy (x, y)∆y + ω
con

ω = [fx (x + ξ∆x, y + ∆y) − fx (x, y)] ∆x + [fy (x, y + η∆y) − fy (x, y)] ∆y .

Si ha
|ω|
p ≤ |fx (x + ξ∆x, y + ∆y) − fx (x, y)| + |fy (x, y + η∆y) − fy (x, y)| .
∆x2 + ∆y 2

Per la continuità di fx e fy , fissato , è allora possibile determinare un δ in modo


tale che risulti
|ω|
p <ε
∆x2 + ∆y 2
p
se ∆x2 + ∆y 2 < δ.
50 CAPITOLO 2. CALCOLO DIFFERENZIALE

Abbiamo in tal modo verificato che ω è un infinitesimo di ordine superiore al


primo. Quindi f è differenziabile.
La dimostrazione nel caso N > 2 procede in modo del tutto analogo. Punto di
partenza, in luogo della (2.34), è la seguente riscrittura dell’incremento ∆f di f

f (x1 + ∆x1 , x2 + ∆x2 , · · · , xN + ∆xN ) − f (x1 , x2 + ∆x2 , · · · , xN + ∆xN )

+f (x1 , x2 + ∆x2 , · · · , xN + ∆xN ) − f (x1 , x2 , x3 + ∆x3 , · · · , xN + ∆xN )

···

+f (x1 , · · · , xN −1 , xN + ∆xN ) − f (x1 , · · · , xN −1 , xN ) .

C’è ovviamente da applicare N volte il teorema di Lagrange.


Dimostriamo ora la seguente formula di derivazione per funzioni composte.
Teorema 2.8.2. - Sia f differenziabile in A aperto di RN . Se le componenti
della funzione

t ∈ [a, b] −→ x(t) = (x1 (t), · · · , xN (t)) ∈ A

sono derivabili allora anche la funzione composta

F : t ∈ [a, b] −→ F (t) = f (x1 (t), · · · , xN (t))

è derivabile e si ha
N
X
0
(2.35) F (t) = fxi (x(t))x0i (t) =< ∇f (x(t)), x0 (t) >
i=1

dove x0 = (x0i ).
Dimostrazione. Sia

∆F = F (t + ∆t) − F (t)

= f (x1 (t + ∆t), · · · , xN (t + ∆t)) − f (x1 (t), · · · , xN (t)) .

Poniamo ∆x = (∆xi ) con ∆xi = xi (t + ∆t) − xi (t). Per la differenziabilità di


f si ha
XN
∆F = fxi (x1 (t), · · · , xN (t))∆xi + o(∆x)
i=1
con
o(∆x)
(2.36) lim = 0.
∆x→0 k∆xk
2.8. FUNZIONI DI CLASSE C 1 51

D’altra parte, essendo


k∆xk
q
lim = x02 02
1 + · · · + xN ,
∆t→0 |∆t|

per la (2.36) si ha
|o(∆x)| |o(∆x)| k∆xk
lim = lim lim = 0.
∆t→0 |∆t| ∆x→0 k∆xk ∆t→0 |∆t|

In definitiva risulta
N   N
∆F X ∆xi o(∆x) X
lim = fxi (x(t)) lim + lim = fxi (x(t))x0i (t)
∆t→0 ∆t ∆t→0 ∆t ∆t→0 ∆t
i=1 i=1

cioè (2.35).

Il teorema 2.8.2 è suscettibile della seguente generalizzazione.


Teorema 2.8.3. - Sia
x(t) = (x1 (t1 , · · · , tM ), · · · , xN (t1 , · · · , tM ))
una funzione definita in un aperto T di RM e a valori in A ⊂ RN , con compo-
nenti xi di classe C 1 (T ). Se f è di classe C 1 (A) la funzione composta
F (t1 , · · · , tM ) = f (x1 (t1 , · · · , tM ), · · · , xN (t1 , · · · tM ))
è di classe C 1 (T ) e si ha
N
∂F X ∂f ∂xi
(2.37) (t) = (x(t)) (t) .
∂tj i=1
∂xi ∂tj

Dimostrazione. La derivabilità parziale della funzione composta nonché la for-


mula (2.37) è conseguenza del teorema 2.8.2 una volta che si osservi che una
derivata parziale non è altro che una derivata ordinaria eseguita rispetto ad una
delle variabili. Dalla (2.37) discende anche che F è di classe C 1 (T ) e, quindi,
differenziabile.
Va osservato che la differenziabilità della funzione composta F e la formula di
derivazione (2.37) sussistono anche se si assume piú generalmente che f e le
funzioni xi sono solo differenziabili.

Una conseguenza della formula di derivazione (2.35) è il seguente risultato che


estende alle funzioni di piú variabili il teorema di Lagrange.
Teorema 2.8.4. - Sia f differenziabile in un aperto A. Se il segmento che uni-
sce due punti x̄ = (x̄i ), ȳ = (ȳi ) è contenuto in A esiste un punto c appartenente
a tale segmento tale che
N
X
(2.38) f (ȳ) − f (x̄) =< ∇f (c), ȳ − x̄ >= fxi (c)(ȳi − x̄i ) .
i=1
52 CAPITOLO 2. CALCOLO DIFFERENZIALE

Dimostrazione. Applichiamo alla funzione

F (t) = f (tȳ + (1 − t)x̄) ,

definita in [0, 1], il teorema di Lagrange. Esiste un valore θ ∈]0, 1[ tale che

f (y) − f (x) = F (1) − F (0) = F 0 (θ)

da cui, essendo per la (2.35)


N
X
F 0 (t) = fxi (tȳ + (1 − t)x̄)(ȳi − x̄i ) ,
i=1

si ottiene la (2.38) con c = θȳ + (1 − θ)x̄.


Definizione 2.8.2. - Si dice che una funzione f è lipschitziana in un aperto A
se esiste una costante L, detta costante di Lipschtz, tale che

(2.39) |f (y) − f (x)| ≤ Lky − xk

per ogni x, y ∈ A.
Dal teorema 2.8.4 si ottengono inoltre i seguenti risultati.
Teorema 2.8.5. - Sia f una funzione differenziabile in un aperto A convesso.
Se le derivate parziali di f sono limitate in A, la funzione f è lipschitziana.
Dimostrazione. Posto
L = sup k∇f (x)k ,
x∈A

la (2.39) discende dalla (2.38) e dalla disuguaglianza (2.6).


Teorema 2.8.6. - Una funzione f , definita in un aperto A connesso per poli-
gonali, con derivate parziali nulle è costante.
Dimostrazione. Se x, y sono gli estremi di un segmento contenuto in A, dalla
(2.38) si ha che f assume in tali punti lo stesso valore. Alla stessa conclusione si
perviene se tali punti sono gli estremi di una poligonale contenuta in A. Quindi
f è costante.

2.9 Funzioni omogenee


Come ulteriore applicazione della regola di derivazione delle funzioni composte
esibiamo una condizione che caratterizza le cosiddette funzioni omogenee.
Definizione 2.9.1. - Un sottoinsieme C di RN dicesi cono se

x ∈ C ⇒ µx ∈ C

per ogni µ positivo.


2.9. FUNZIONI OMOGENEE 53

Definizione 2.9.2. - Una funzione f definita in un cono C dicesi omogenea di


grado α se, per ogni x ∈ C e per ogni µ positivo, si ha

(2.40) f (µx) = µα f (x) .

Osservazione 2.9.1. - Una funzione omogenea di grado zero non può essere
prolungata per continuità nell’origine a meno che essa non sia costante. Una
tale funzione infatti assume valori costanti su tutte le semirette uscenti dall’o-
rigine, pertanto il limite nell’origine dipende dalle direzioni di tali semirette.

Sussiste il seguente risultato.

Teorema 2.9.1. (Teorema di Eulero) - Sia f differenziabile in un cono C.


Allora f è omogenea di grado α se e solo se si ha
N
X
(2.41) xi fxi (x) = αf (x) , ∀x ∈ C .
i=1

Dimostrazione. Deriviamo la (2.40) rispetto a µ

N
X
xi fxi (µx) = αµα−1 f (x) .
i=1

Ponendo µ = 1 si ottiene la (2.41).


Scriviamo la (2.41) con µx al posto di x

N
X
µ xi fxi (µx) = αf (µx) .
i=1

Moltiplicando per µ−α−1 si ottiene


N
X ∂  −α
µ−α xi fxi (µx) − αµ−α−1 f (µx) =

µ f (µx) = 0 .
i=1
∂µ

Quindi la funzione µ−α f (µx) è costante rispetto a µ ∈ R+ . Si ha quindi

µ−α f (µx) = f (x)

ovvero la (2.40).

Sempre in relazione alle funzioni omogenee si può osservare quanto segue.

Teorema 2.9.2. - Sia f differenziabile in un cono C. Se f è omogenea di


grado α 6= 0 ovvero di grado 0 ma non costante allora le funzioni fxi risultano
omogenee di grado α − 1.
54 CAPITOLO 2. CALCOLO DIFFERENZIALE

Dimostrazione. Per semplicità riferiamoci alla derivata parziale fx1 . Si ha

f (µx1 + h, · · · , µxN ) − f (µx1 , · · · , µxN )


fx1 (µx) = lim
h→0 h

f (x1 + hµ−1 , · · · , xN ) − f (x1 , · · · , xN )


= µα−1 lim
h→0 hµ−1

= µα−1 fx1 (x)

da cui l’asserto.

Esempio 2.9.1. - Consideriamo la funzione omogenea di grado uno


 2
 xy

se (x, y) 6= (0, 0)
x + y2
2

f (x, y) =


0 se (x, y) = (0, 0) .

Essa è parzialmente derivabile in ogni punto del piano. Per il teorema 2.9.2 e
per quanto sottolineato nell’oss. 2.9.1 tali derivate non sono continue nell’ori-
gine; pertanto f non è di classe C 1 . Essa è continua ma non differenziabile
nell’origine. Infatti per le derivate direzionali non vale la formula (2.32).
Esempio 2.9.2. - Consideriamo la funzione

x2 y 2
f (x, y) =
(x2 + y 2 )3/2

ristretta al semipiano y > 0. Prolunghiamo f a tutto il piano ponendo

f (x, 0) = 0 , f (x, y) = −f (x, −y) se y < 0 .

Si ottiene una funzione omogenea di grado uno. Le sue derivate sono quindi
omogenee di grado zero: f non è allora di classe C 1 . Si verifica facilmente che
f non è differenziabile nell’origine in quanto non vale la formula (2.32).

2.10 Funzioni differenziabili a valori vettoriali


La nozione di differenziabilità può essere estesa al caso di una applicazione f la
quale associ al vettore (2.21) appartenente ad un aperto A di RN il seguente
vettore colonna a M componenti
 
f1 (x1 , · · · , xN )
 
 
(2.42) f (x) =  ··· .

 
fM (x1 , · · · , xN )
2.10. FUNZIONI DIFFERENZIABILI A VALORI VETTORIALI 55

Definizione 2.10.1. - Si dice che f è differenziabile in un punto x̄ ∈ A se


esiste una trasformazione lineare L di RN in RM tale che

(2.43) f (x̄ + h) = f (x̄) + L(h) + o(h)

dove
ko(h)k
lim = 0.
khk→0 khk
Il funzionale L prende il nome di differenziale di f e si denota con df .

Sussiste il seguente risultato.

Teorema 2.10.1. - La funzione (2.42) è differenziabile in x̄ ∈ A se e solo se


tali sono le sue componenti fi . La matrice associata al suo differenziale, che
prende il nome di matrice jacobiana di f , è

∂f1 ∂f1
 
···
 ∂x1 ∂xN 
 
 
(2.44) fx =  · · · ··· ···  .
 
 
 
 ∂f ∂fM 
M
···
∂x1 ∂xN

Dimostrazione. Sia L il differenziale di f che compare in (2.43) e sia (2.20) la


sua rappresentazione matriciale. Poniamo inoltre

Li = (ai1 , · · · , aiN ) , i = 1, · · · , M .

interpretiamo cioè le righe della matrice (2.20) come funzionali funzionali lineari
su RN . La funzione vettoriale
f (x̄ + h) − f (x̄) − L(h)
khk

è infinitesima se e solo se sono infinitesime le sue M componenti

fi (x̄ + h) − fi (x̄) − Li (h)


.
khk

Ciò prova intanto che la differenziabilità di f equivale a quella delle M funzioni


numeriche fi . I coefficienti di Li sono le derivate parziali di fi ; il funzionale
lineare L si rappresenta allora mediante la matrice (2.44).

Dai teoremi 2.10.1 e 2.8.1 discende in modo ovvio il seguente risultato.

Teorema 2.10.2. - Se f è di classe C 1 allora f è differenziabile.

Concludiamo con il seguente teorema.


56 CAPITOLO 2. CALCOLO DIFFERENZIALE

Teorema 2.10.3. - Sia h = g ◦ f con f e g trasformazioni di classe C 1 tra


spazi euclidei. Si ha

(2.45) hx (x̄) = gy (f (x̄)) fx (x̄) .

Il termine a secondo membro in (2.45) è il prodotto righe per colonne delle due
matrici gy , fx .
Dimostrazione. Basta far riferimento alla rappresentazione (2.44) del differen-
ziale di h e applicare le formule (2.37) di derivazione delle funzioni composte.

2.11 Derivazione sotto il segno di integrale


Sia f una funzione di due variabili continua nell’insieme I = [a, b] × [c, d]. Sia
Z d
(2.46) F (x) = f (x, t) dt .
c

Sussiste il seguente teorema che può essere interpretato come un ulteriore risul-
tato di inversione di due successive operazioni di limite.
Teorema 2.11.1. - La funzione (2.46) è continua in [a, b]. Se anche fx è
continua in I allora F è di classe C 1 ([a, b]) e si ha
Z d
(2.47) F 0 (x) = fx (x, t) dt .
c

Dimostrazione. Si ha
Z d
|F (x + ∆x) − F (x)| ≤ |f (x + ∆x, t) − f (x, t)| dt .
c

Per il teorema 2.3.2 la funzione f è uniformemente continua in I. Pertanto,


fissato ε, esiste un δ tale che, se |∆x| < δ,

|f (x + ∆x, t) − f (x, t)| < ε

da cui
|F (x + ∆x) − F (x)| ≤ ε(d − c)
ovvero la continuità di F . Per il teorema di Lagrange si ha
d d
f (x + ∆x, t) − f (x, t)
Z Z
∆F
= dt = fx (x + θ(t) ∆x, t) dt
∆x c ∆x c

con θ(t) ∈ [0, 1]. Poiché fx è continua, sempre per il teorema 2.3.2, fissato ε,
esiste un δ tale che, se |∆x| < δ, si ha

|fx (x + θ(t) ∆x, t) − fx (x, t)| < ε


2.11. DERIVAZIONE SOTTO IL SEGNO DI INTEGRALE 57

e quindi, se |∆x| < δ,


Z
∆F Z d d
− fx (x, t) dt ≤ |fx (x + θ(t) ∆x, t) − fx (x, t)| dt < ε(d − c)

∆x

c c

da cui la (2.47). Ovviamente F 0 è continua: basta ripercorrere la dimostrazione


relativa alla continuità di F .

Esempio 2.11.1. - Consideriamo la funzione


 3  2
x x
 2 exp − se t 6= 0


f (x, t) = t t


0 se t = 0 .

Essa non è continua nell’origine: basta infatti considerare la sua restrizione alla
parabola di equazione t = x2 . Poiché
Z 1
f (x, t) dt = x exp(−x2 )
0

risulta  Z 1 
d
f (x, t) dt = 1.
dx 0 x=0

D’altra parte si ha fx (0, t) ≡ 0. Non vale quindi la (2.47).


Come immediata conseguenza del teorema 2.11.1 si ha il seguente risultato.
Teorema 2.11.2. - Nelle ipotesi del teorema 2.11.1, se α, β sono due funzioni
derivabili in [a, b] e a valori in [c, d] allora la funzione
Z β(x)
F (x) = f (x, t) dt
α(x)

è derivabile e si ha
Z β(x)
(2.48) F 0 (x) = fx (x, t) dt + f (x, β(x))β 0 (x) − f (x, α(x))α0 (x) .
α(x)

Dimostrazione. Poniamo
Z z
G(x, y, z) = f (x, t) dt
y

con x ∈ [a, b] e y, z ∈ [c, d]. Per il teorema 2.11.1 si ha


Z z
(2.49) Gx (x, y, z) = fx (x, t) dt ;
y
58 CAPITOLO 2. CALCOLO DIFFERENZIALE

inoltre Gx è continua. Per il teorema fondamentale del calcolo integrale abbiamo


inoltre

(2.50) Gy (x, y, z) = −f (x, y) , Gz (x, y, z) = f (x, z) .

Pertanto G è di classe C 1 . Poiché


Z β(x)
f (x, t) dt = G(x, α(x), β(x))
α(x)

la (2.48) consegue dalla regola di derivazione delle funzioni composte (2.35) e


dalle (2.49), (2.50).
Il teorema 2.11.1 è suscettibile di una generalizzazione al caso in cui f dipenda,
oltre che dalla variabile t ∈ [c, d], da una variabile x = (xi ) appartenente a

I = [a1 , b1 ] × [a2 , b2 ] × · · · [aN , bN ] .

Teorema 2.11.3. - Sia

f : (x1 , · · · , xN , t) ∈ I × [c, d] −→ f (x1 , · · · , t) ∈ R

una funzione continua con le sue derivate parziali fxi . Allora la funzione
Z d
F (x1 , · · · , xN ) = f (x1 , · · · , xN , t) dt
c

è di classe C 1 (I) e si ha
Z d
∂F ∂f
(2.51) (x1 , · · · , xN ) = (x1 , · · · , xN , t) dt .
∂xi c ∂xi

2.12 Derivate di ordine superiore


Sia f differenziabile in un aperto A di RN . Supponiamo che ogni fxi sia a sua
volta differenziabile e, quindi, dotata di N derivate parziali. Veniamo in tal
modo a definire N 2 ulteriori funzioni, dette derivate parziali seconde di f , per
le quali si usano i simboli
∂2f
, fx2i ,
∂x2i
ovvero, se si deriva due volte f prima rispetto alla variabile xi poi rispetto a xj
con i 6= j, i simboli
∂2f
, fxi xj .
∂xj ∂xi
Queste ultime sono dette derivate miste. Per esse ha senso chiedersi quale
relazione ci sia tra fxi xj e fxj xi . In generale non è detto che tali derivate siano
uguali come illustrato nel seguente esempio.
2.12. DERIVATE DI ORDINE SUPERIORE 59

Esempio 2.12.1. - Sia



x2 − y 2
 xy 2 se (x, y) 6= (0, 0)


f (x, y) = x + y2


0 se (x, y) = (0, 0) .

Essendo fx (0, y) = −y e fy (x, 0) = x si ha fxy (0, 0) = −1 mentre fyx (0, 0) = 1.


Si osservi che le derivate seconde non sono continue nell’origine in quanto
omogenee di grado zero.
È possibile invertire l’ordine di derivazione se si fanno opportune ipotesi di
regolarità.
Teorema 2.12.1. (Teorema di Schwarz) - Se f , definita in un aperto A
del piano, è dotata delle derivate parziali fx , fy e della derivata seconda mista
fxy e se quest’ultima è continua in (x0 , y0 ) allora fy è derivabile rispetto a x in
(x0 , y0 ) e si ha

(2.52) fxy (x0 , y0 ) = fyx (x0 , y0 ) .

Dimostrazione. Possiamo sempre assumere che (x0 , y0 ) coincida con l’origine.


Essendo fxy continua in tale punto, fissato ε, è possibile individuare un numero
positivo δ tale che

(2.53) |fxy (x, y) − fxy (0, 0)| < ε

se (x, y) appartiene al quadrato

Qδ = {(x, y) : |x| , |y| < δ} .

Sia (x, y) un punto di Qδ . Applichiamo il teorema di Lagrange alla funzione

g(t) = f (t, y) − f (t, 0)

ristretta all’intervallo di estremi 0 e x; si ha

[f (x, y) − f (x, 0)] − [f (0, y) − f (0, 0)] = [fx (ξ, y) − fx (ξ, 0)] x

con |ξ| < δ. Riapplicando il teorema di Lagrange alla funzione h(t) = fx (ξ, t)
ristretta all’intervallo di estremi 0 e y si ha

fx (ξ, y) − fx (ξ, 0) = fxy (ξ, η) y

con |η| < δ. In definitiva abbiamo

[f (x, y) − f (x, 0)] − [f (0, y) − f (0, 0)] = fxy (ξ, η) x y

con (ξ, η) ∈ Qδ . Quindi per la (2.53) si ha



[f (x, y) − f (x, 0)] − [f (0, y) − f (0, 0)]
− f xy (0, 0) < ε.
xy
60 CAPITOLO 2. CALCOLO DIFFERENZIALE

Facendo tendere y a zero abbiamo



fy (x, 0) − fy (0, 0)
− fxy (0, 0) ≤ ε
x

con |x| < δ. Ciò comporta che

fy (x, 0) − fy (0, 0)
lim = fxy (0, 0) .
x→0 x
Quindi fy è derivabile rispetto a x in (0, 0) e sussiste la (2.52).
Definizione 2.12.1. - Una funzione f è di classe C 2 (A), con A aperto di RN
se le sue derivate seconde sono continue in A.
Teorema 2.12.2. - Se f è di classe C 2 (A) allora fxi xj = fxj xi per ogni i, j.
Dimostrazione. Per ottenere le derivate seconde miste di una funzione si opera
sulla sua restrizione ad un piano di RN di dimensione due. Il risultato si ottiene
allora applicando il teorema 2.12.1.
Se f ∈ C 2 (A) la matrice
 
fx1 x1 ··· fx1 xN
(2.54)  ··· ··· ···  ,
fxN x1 ··· fxN xN

nota come matrice hessiana di f , è simmetrica per il teorema 2.12.2. Il suo


determinante, che si denota con la lettera H, prende il nome di hessiano di f .
Il procedimento che ha consentito di introdurre le derivate parziali seconde può
essere iterato. Infatti se le derivate seconde sono ulteriormente derivabili le
derivate parziali cosı́ ottenute prendono il nome di derivate parziali terze. Piú
in generale, definite le derivate di ordine (n − 1), le derivate parziali di queste
prendono il nome di derivate parziali n-me.
Per le derivate parziali n-me si può facilmente verificare, facendo ricorso al
teorema 2.12.2, che l’operazione di derivazione non è influenzata dall’ordine in
cui le varie derivate sono eseguite sempre che tutte le derivate fino a quelle di
ordine n siano continue. Si dice in tal caso che la funzione è di classe C n .
Introduciamo la seguente notazione. Indichiamo con ih indici scelti tra i primi
n interi e ph interi positivi tali che
k
X
ph = p1 + · · · + pk = n .
h=1

Con uno dei simboli


∂nf
, fxp1 ···xpk
∂xpi11 · · · ∂xpikk i1 ik

si denota la derivata parziale di ordine n di f ottenuta derivando rispetto a xih


per ph volte.
2.13. FORMULE DI TAYLOR 61

2.13 Formule di Taylor


L’introduzione delle derivate di ordine superiore consente di scrivere versioni
della formula di Taylor per funzioni di piú variabili.
Cominciamo supponendo che f sia una funzione di classe C 2 (A).
Fissato x̄ ∈ A consideriamo un incremento h = (hi ) tale che il segmento di
estremi x̄ e x̄ + h sia contenuto in A. Posto

(2.55) F (t) = f (x̄ + th)

per la formula di Taylor per funzioni di una variabile si ha


F 00 (θ)
(2.56) f (x̄ + h) = F (1) = F (0) + F 0 (0) +
2
con θ ∈]0, 1[.
Per la formula di derivazione delle funzioni composte (2.35) risulta
N
X
F 0 (t) = fxi (x̄ + th)hi
i=1

N
X
00
F (t) = fxi xj (x̄ + th)hi hj .
i,j=1

Pertanto la (2.56) diventa


N N
X 1 X
(2.57) f (x̄ + h) = f (x̄) + fxi (x̄)hi + fx x (x̄ + θh)hi hj .
i=1
2 i,j=1 i j

Dalla (2.57) si deduce la seguente ulteriore formula di Taylor


N N
X 1 X
(2.58) f (x̄ + h) = f (x̄) + fxi (x̄)hi + fx x (x̄)hi hj + o(khk2 ) .
i=1
2 i,j=1 i j

Riscriviamo infatti la (2.57) nel modo seguente


N N
X 1 X
f (x̄ + h) = f (x̄) + fxi (x̄)hi + fx x (x̄)hi hj
i=1
2 i,j=1 i j

N
1 X 
+ fxi xj (x̄ + θh) − fxi xj (x̄) hi hj .
2 i,j=1

Poiché le derivate seconde di f sono continue il termine


N
1 X 
fxi xj (x̄ + θh) − fxi xj (x̄) hi hj
2 i,j=1
62 CAPITOLO 2. CALCOLO DIFFERENZIALE

è un infinitesimo di ordine superiore rispetto a khk2 . Si ha quindi la (2.58).


Supponiamo ora che f sia di classe C n (A). Applichiamo alla funzione (2.55) la
formula di Taylor con resto di Lagrange
n−1
X F (k) (0) k F (n) (θ) n
(2.59) F (t) = t + t
k! n!
k=0

con θ ∈]0, 1[.


Applicando piú volte la formula di derivazione delle funzioni composte risulta
N
X
(k)
F (t) = fxi1 ···xik (x̄ + th)hi1 · · · hik .
i1 ,··· ,ik =1

Per denotare tale derivata talvolta si usa la seguente sintetica scrittura

N
!(k)
X
(k)
F (t) = fxi (x̄ + th)hi
i=1

che si legge potenza k−ma simbolica del differenziale di f . Il termine si giustifica


con il fatto che l’espressione di F (k) si ottiene, calcolando dapprima la potenza
k-ma del differenziale di f , sostituendo poi ogni termine che risulti prodotto
delle funzioni fxi1 , · · · , fxik con la corrispondente derivata parziale fxi1 ···xik .
Ciò premesso dalla (2.59) si ottiene la seguente formula di Taylor di punto
iniziale x̄ con resto di Lagrange

n−1 n
!(k) N
!(n)
X 1 X 1 X
f (x̄ + h) = f (x̄) + fxi (x̄)hi + fxi (x̄ + θh)hi .
k! i=1
n! i=1
k=1

Procedendo come per la dimostrazione della (2.58) si ha infine la seguente


ulteriore formula
n N
!(k)
X 1 X
f (x̄ + h) = f (x̄) + fxi (x̄)hi + o(khkn ) .
k! i=1
k=1

2.14 Estremi locali


Dalla formula di derivazione delle funzioni composte si può far discendere una
prima condizione necessaria relativa ai cosiddetti punti di estremo locale per
una funzione di piú variabili.
Definizione 2.14.1. - Sia f un funzione definita in un aperto A. Un punto x̄ è
di minimo ovvero di massimo relativo per f se esiste un intorno sferico S(x̄, r)
contenuto in A tale che
f (x) ≥ f (x̄)
2.14. ESTREMI LOCALI 63

o
f (x) ≤ f (x̄)

per ogni x ∈ S(x̄, r).

Teorema 2.14.1. - Se x̄ è un punto di minimo o massimo relativo per una


funzione f di classe C 1 si ha

(2.60) ∇f (x̄) = 0 .

Dimostrazione. Supponiamo, per esempio, che x̄ sia un punto di minimio rela-


tivo per f . Fissato un versore v = (vi ) consideriamo la funzione

(2.61) F (t) = f (x̄ + tv) .

Lo zero è un punto di minimo relativo per F ; pertanto F 0 (0) = 0. Per la (2.35)


si ha allora
XN
fxi (x̄) vi = 0 .
i=1

Dall’arbitrarietà di v discende la condizione (2.60).

La (2.60) è ovviamente solo una condizione necessaria. In generale un punto in


cui sussista la (2.60), anche quando non risulti un punto di massimo o minimo
relativo, prende il nome di punto critico per f . In determinate situazioni è
possibile, con il solo ausilio della (2.60), risolvere il problema di individuare gli
eventuali valori estremi di una funzione. A titolo di esempio diamo un cenno
del cosiddetto metodo dei minimi quadrati.
Supponiamo che la legge che mette in relazione tra loro due variabili x, y sia
lineare cioè del tipo

(2.62) y = ax + b

con a, b costanti da determinare. Supponiamo inoltre che siano noti sperimen-


talmente i valori y1 , · · · , yn corrispondenti ai valori x1 , · · · , xn della variabile x.
Poichè i dati sperimentali sono sempre affetti da errori i punti (xi , yi ) non si
troveranno su una retta; non è possibile cioè ottenere una valutazione esatta
delle costanti a, b. Per risolvere il problema si cerca di determinare i valori di
a, b in modo tale che risulti minima la seguente somma di quadrati
n
X
(2.63) f (a, b) = [yi − (axi + b)]2 .
i=1

Con tali valori di a e b la retta di equazione (2.62) è, in un certo senso, quella
che meglio descrive il fenomeno in esame. Imponendo alla funzione (2.63) la
64 CAPITOLO 2. CALCOLO DIFFERENZIALE

condizione (2.60) si ottiene il seguente sistema lineare nelle incognite a, b


 n
! n
 X X
x a + n b = yi

i




 i=1 i=1

 n
! n
! n
 X X X
x2i

a+ xi b= xi yi .




i=1 i=1 i=1

Tale sistema ha un’unica soluzione in corrispondenza della quale si può dimo-


strare che la funzione (2.63) realizza il suo minimo valore.
Per descrivere in modo piú preciso il comportamento di una funzione in un
intorno di un punto critico è utile ricorrere alla formula di Taylor.
Consideriamo dapprima il caso bidimensionale.
Sia (x̄, ȳ) un punto critico per f . Riscriviamo la funzione (2.61) nella forma
seguente
F (t) = f (x̄ + λt, ȳ + µt)
con v = (λ, µ). Si ha
(2.64) F 00 (0) = fxx (x̄, ȳ)λ2 + 2fxy (x̄, ȳ)λµ + fyy (x̄, ȳ)µ2 .
Il discriminante del polinomio di secondo grado (2.64) è l’opposto del determi-
nante hessiano H di f calcolato in (x̄, ȳ). Se
2
H(x̄, ȳ) = fxx (x̄, ȳ)fyy (x̄, ȳ) − fxy (x̄, ȳ) < 0
il punto (x̄, ȳ) non può essere né un punto di minimo né un punto di massimo
relativo. Infatti è possibile determinare delle direzioni in corrispondenza delle
quali la derivata seconda (2.64) di F è positiva ed altre direzioni in corrispon-
denza delle quali essa risulta negativa. Ciò vuol dire che la restrizione della
funzione f alle rette passanti per il punto critico presentano nel punto (x̄, ȳ) o
un punto di minimo o un punto di massimo relativo a seconda della direzione
scelta. Pertanto non è possibile individuare un intorno del punto critico in cui
la funzione assuma valori maggiori o minori del valore assunto nel punto (x̄, ȳ).
Si dice in tal caso che il punto critico è un punto sella.
Abbiamo quindi la seguente ulteriore condizione necessaria.
Teorema 2.14.2. - In un punto che sia o di minimo o di massimo relativo
per una funzione di due variabili di classe C 2 il determinante hessiano è non
negativo.
Per ottenere delle condizioni sufficienti bisogna far riferimento al seguente risul-
tato.
Teorema 2.14.3. - Sia f una funzione di classe C 2 (A) e sia (x̄, ȳ) un punto
in cui siano soddisfatte, oltre alla (2.60), le seguenti condizioni
(2.65) H(x̄, ȳ) > 0

(2.66) fxx (x̄, ȳ) > 0(< 0) .


2.14. ESTREMI LOCALI 65

Allora il punto (x̄, ȳ) è un punto di minimo (massimo) relativo per f .

Dimostrazione. Per la (2.57), tenuto conto della (2.60), lo studio del segno
dell’incremento
f (x̄ + h, ȳ + k) − f (x̄, ȳ)
di f è ricondotto a quello del polinomio P di secondo grado nelle variabili h, k

fxx (x̄ + θh, ȳ + θk)h2 + 2fxy (x̄ + θh, ȳ + θk)hk + fyy (x̄ + θh, ȳ + θk)k 2

dove θ denota un valore compreso tra zero e uno.


Tenendo presente che le derivate seconde di f sono continue, se h, k sono
sufficientemente piccoli, in base alla (2.65), si ha

H(x̄ + θh, ȳ + θk) > 0 .

Quindi P ha discriminante negativo.


Sempre per h, k sufficientemente piccoli, se fxx (x̄, ȳ) > 0, si ha anche

fxx (x̄ + θh, ȳ + θk) > 0 .

In definitiva il polinomio P assume valori non negativi. Si ha allora che il punto


critico è punto di minimo relativo.
In modo analogo si ragiona se fxx (x̄, ȳ) < 0.

Esempio 2.14.1. - Sia

(2.67) f (x, y) = x(x − 1)2 − y 2 .

I punti (1, 0) e (1/3, 0) sono gli unici punti critici per f . Essendo

fxx = 2(3x − 2) , H(x, y) = −4(3x − 2) ,

il punto (1/3, 0) è un punto di massimo relativo, mentre il punto (1, 0) è un


punto sella.

Consideriamo il caso generale. Sussiste il seguente risultato.

Teorema 2.14.4. - Sia f una funzione di classe C 2 (A) e sia x̄ un punto cri-
tico per f . Supponiamo inoltre che la forma quadratica associata alla matrice
hessiana di f sia definita positiva (negativa) nel senso che

N
X
(2.68) fxi xj (x̄)ξi ξj > 0(< 0)
i,j=1

per ogni vettore non nullo ξ = (ξi ).


Allora il punto x̄ è un punto di minimo (massimo) relativo per f .
66 CAPITOLO 2. CALCOLO DIFFERENZIALE

Dimostrazione. Supponiamo che nella (2.68) valga il segno >.


Osserviamo che esiste una costante positiva m tale che
N
X N
X
(2.69) fxi xj (x̄)ξi ξj ≥ m ξi2
i,j=1 i=1

per ogni ξ = (ξi ). Basta osservare che, per la (2.68), la funzione di ξ a primo
membro in (2.69) assume valori positivi sul compatto

B = {ξ : kξk = 1} .

Essendo tale funzione continua su B, per il teorema di Weierstrass 2.3.1 essa ha


un minimo m positivo.
Se ξ è un vettore non nullo si ha allora
N
X ξi ξj
fxi xj (x̄) ≥m
i,j=1
kξk kξk

da cui (2.69).
In relazione al resto che compare nella formula di Taylor (2.58) scegliamo δ in
modo tale che, se khk < δ, risulti
m
(2.70) |o(khk2 )| ≤ khk2 .
2
Per la (2.58), ricordando le (2.60), (2.69) e (2.70), si ha, sempre per khk < δ,
m m
f (x̄ + h) − f (x̄) ≥ khk2 − khk2 = 0
2 2
da cui l’asserto.
Se nella (2.68) sussiste il segno < si procede in modo analogo.
Esistono condizioni equivalenti alla (2.68). La prima coinvolge gli autovalori
della matrice hessiana (2.54). Se tali autovalori, tutti reali, sono positivi allora
sussiste la (2.68) con il segno >. Se invece tali autovalori sono negativi sussiste
la (2.68) con il segno <. Si può dimostrare infatti che, mediante una opportuna
trasformazione ortonormale, la forma quadratica a primo membro della (2.68)
si scrive nel modo seguente
XN
λi ηi2
i=1

dove λi sono gli autovalori della matrice hessiana di f . Tale risultato, oltre
che confermare quanto sopra detto, consente di concludere che, in presenza
di autovalori di segno opposto, il punto critico non può essere né un punto
di massimo né un punto di minimo. Abbiamo quindi un punto critico con
caratteristiche analoghe a quelle che abbiamo descritto in relazione ai punti
sella nel caso bidimensionale.
2.15. ESERCIZI 67

Restano in definitiva scoperti i casi in cui uno o piú autovalori sono nulli e
gli altri hanno lo stesso segno; in tali casi in si dice che la forma quadratica
associata alla matrice hessiana è semidefinita positiva o negativa. Tali punti
critici vengono chiamati punti critici degeneri. Lo studio del comportamento
della funzione in un intorno di un punto critico degenere richiede strumenti ad
hoc.
Per semplicità ritorniamo al caso bidimensionale. Se (x̄, ȳ) è un punto critico
per f e l’hessiano in tale punto è nullo allora il polinomio (2.64) si annulla per
una opportuna scelta della direzione v = (λ, µ). Supponiamo inoltre che per
ogni altra direzione il polinomio assuma valori positivi. Allora se la derivata
terza della funzione F in zero è non nulla la restrizione di f alla retta passante
per il punto critico e con numeri direttori (λ, µ) presenta un flesso; pertanto il
punto critico non è né di minimo né di massimo relativo. Alla stessa conclusione
si perviene se tale derivata terza è nulla ma è negativa la derivata quarta. Se
quest’ultima invece è positiva non si può concludere che il punto critico è un
punto di minimo relativo come illustrato dal seguente esempio.

Esempio 2.14.2. - Sia

f (x, y) = (y − x2 )(y − 2 x2 ) .

L’origine è un punto critico degenere. Si vede facilmente che tale punto non è
né punto di minimo né punto di massimo.

Per riconoscere se un punto critico è di minimo o di massimo si può anche far


ricorso al seguente criterio di Sylvester.

Proposizione 2.14.1. - Siano



fx1 x1 · · · fx1 xk



Hk = · · · ··· · · · , k = 1, · · · , N


fxk x1 · · · fxk xk

i minori principali della matrice (2.54). Se essi sono positivi in x̄ allora la forma
quadratica (2.68) è definita positiva. Se invece risulta (−1)k Hk (x̄) > 0 la forma
quadratica (2.68) è definita negativa.

2.15 Esercizi
1. Dimostrare che le (2.9), (2.10), (2.11), (2.12) sono norme. Verificare inoltre
che per esse non vale la regola del parallelogramma (cfr. oss. 2.1.2).

2. Si utilizzi il teorema 2.1.1 per dimostrare che la norma è una funzione


continua.
68 CAPITOLO 2. CALCOLO DIFFERENZIALE

3. Scrivere l’equazione del piano tangente al grafico di ciascuna delle seguenti


funzioni nel punto a fianco indicato.
 π π
a) x cos y + y cos x (0, 0, 0) b) x sin xy −1 , 1,
2 2
1
c) (1, 2, 1/6) d) log(y − x2 ) (1, 2, 0)
1 + x2 + y 2
2
+y 2 )
e) e−(x (1, 1, e−2 ) f) sin(xy) (1, π, 0)
4. Esiste una funzione differenziabile in un punto tale che la derivata dire-
zionale in tale punto sia positiva qualunque sia la direzione?

5. Si assuma che due derivate direzionali di una funzione differenziabile siano


nulle. Dimostrare che è nulla ogni altra derivata direzionale.
6. Classificare i punti critici delle seguenti funzioni
a) 2x3 − 6xy − 3y 2 + 12y b) x2 + y 2 − xy

c) xy d) 2x2 + 2y 2 − 3xy − x − y

x2 y3
e) xy − + f) x2 + 2xy − y 3
2 3

g) x2 − 2x + y 4 + y 2 h) (1 − y)(2 − y − x2 )

y4
i) xy(x − 1)2 − y 2 l) − x2 y + x2
4

m) x2 + y 2 + z 2 − 2x − 2z − 5 n) x2 + y 2 + z 2 − xyz

o) 4 x3 + 4 y 3 − 12 xy + 3 (x + y) p) x(x2 − 1) + y 2 + z(z − 1)2


Capitolo 3

Curve

3.1 Definizioni ed esempi


Si consideri la funzione a valori in RN

(3.1) t ∈ [a, b] → ϕ(t) = (ϕ1 (t), · · · , ϕN (t))

con ϕi ∈ C 1 ([a, b]). Se il differenziale dell’applicazione (3.1) non è mai nullo se


cioè

(3.2) ϕ0 (t) = (ϕ01 (t), · · · , ϕ0N (t)) 6= (0, · · · , 0)

per ogni t ∈ [a, b] la (3.1) prende il nome di curva regolare. Il codominio


dell’applicazione (3.1) è detto sostegno della curva.
Il vettore ϕ0 (t0 ) individua la direzione della retta tangente alla curva (3.1) nel
punto ϕ(t0 ). Esso infatti si ottiene come limite per h che tende a zero dei
vettori, di componenti
ϕi (t0 + h) − ϕi (t0 )
,
h
paralleli alle rette secanti la curva passanti per ϕ(t0 ) e ϕ(t0 + h). Ciò giustifica
la seguente definizione.
Definizione 3.1.1. - La retta di equazioni parametriche

xi (τ ) = ϕi (t0 ) + ϕ0i (t0 )τ

è la retta tangente alla curva (3.1) nel punto ϕ(t0 ).


Esempio 3.1.1. - L’ipotesi (3.2) è essenziale. Si consideri infatti la curva
piana di classe C 1
t ∈ R −→ (t|t|, t2 )
il cui sostegno è la spezzata costituita dalle bisettrici del primo e del secondo
quadrante. Non è soddisfatta la condizione (3.2) per t = 0. Nell’origine la
curva non ha retta tangente pur essendo la (3.1) differenziabile per t = 0.

69
70 CAPITOLO 3. CURVE

Nel seguito faremo uso della seguente terminologia.


• La curva (3.1) si dice semplice se la restrizione di ϕ all’intervallo semia-
perto [a, b[ è iniettiva.
• La curva (3.1) dicesi generalmente regolare se ϕ è continua e inoltre [a, b]
può essere decomposto in un numero finito di intervalli e la restrizione di
(3.1) ad ognuno di essi è una curva regolare.
• La curva (3.1) si dice chiusa se ϕ(a) = ϕ(b). Essa è inoltre regolare se ϕ
è di classe C 1 e i vettori ϕ0 (a) e ϕ0 (b) sono paralleri e concordi.
Osservazione 3.1.1. - Una classe di curve piane regolari si ottiene conside-
rando l’insieme delle funzioni di classe C 1 in intervalli di R. I relativi grafici
sono il sostegni della curve. Si può dimostrare che ogni curva piana regolare è,
almeno localmente, grafico di una funzione della variabile x e/o della variabile
y.
Esempio 3.1.2. - Per le curve piane che si rappresentano in coordinate polari
mediante equazioni del tipo ρ = f (θ) il vettore tangente è
(f 0 (θ) cos θ − f (θ) sin θ, f 0 (θ) sin θ + f (θ) cos θ) .
Tra tali curve rientrano la spirale di Archimede di equazione ρ = kθ, con θ
positivo, e la spirale logaritmica di equazione ρ = ekθ .
Attraverso l’equazione
(3.3) ρ = 1 + cos θ , θ ∈ [−π, π]
si definisce la cosiddetta cardioide.
Esempio 3.1.3. - La curva piana
(3.4) t ∈ R → (r(t − sin t), r(1 − cos t))
è detta cicloide. Le equazioni (3.4) descrivono il moto di un determinato punto
di una circonferenza di raggio r che rotola sull’asse delle x con velocità r.
Per t = 2kπ, con k intero relativo, la condizione (3.2) non è soddisfatta. Nei
punti corrispondenti a tali valori del parametro la curva perde di regolarità; in
tali punti non si può parlare di vettore tangente. La cicloide è comunque una
curva generalmente regolare.
Esempio 3.1.4. - L’ellisse di equazione
x2 y2
+ =1
a2 b2
si rappresenta anche mediante l’applicazione
t ∈ [0, 2π] −→ (a cos t, b sin t) .
Se a = b = r si ha la rappresentazione della circonferenza di centro l’origine e
raggio r.
3.2. LUNGHEZZA DI UN ARCO DI CURVA 71

Esempio 3.1.5. - La curva

t ∈ [0, 2π] −→ (cos3 t, sin3 t)

prende il nome di asteroide. Essa è una curva generalmente regolare semplice e


chiusa.
Esempio 3.1.6. - La curva dello spazio

t ∈ R → (r cos t, r sin t, vt)

è detta elica. Il vettore tangente a tale curva è (−r sin t, r cos t, v).
Definizione 3.1.2. - Sia

(3.5) p : τ ∈ [α, β] → p(τ ) ∈ [a, b]

un’applicazione biunivoca dotata di derivata prima continua e mai nulla. Allora


la curva
τ ∈ [α, β] → ψ(τ ) = ϕ(p(τ ))
dicesi equivalente alla curva (3.1). Curve equivalenti hanno lo stesso sostegno.
Nell’insieme delle curve regolari viene introdotta in tal modo una relazione di
equivalenza. Nel seguito con il termine curva si intenderà indifferentemente o
l’applicazione (3.1) oppure una delle classi di equivalenza generate dalla relazio-
ne appena introdotta. Se si attribuisce il termine di rappresentazione parame-
trica alla legge (3.1) quanto illustrato nella def. 3.1.2 descrive la procedura da
seguire per passare, per una stessa curva, da una rappresentazione parametrica
ad un’altra.
È intuitivamente evidente che ogni rappresentazione parametrica induce sulla
curva un orientamento, ovvero una relazione d’ordine per effetto della quale un
punto della curva precede un altro se il valore del parametro cui corrisponde il
primo punto è minore di quello cui corrisponde il secondo. Data una curva è
evidente che su di essa è possibile introdurre due orientamenti, l’uno l’opposto
dell’altro, e che le varie rappresentazioni parametriche possono essere inserite
a loro volta in due classi distinte in modo tale che tutte le rappresentazioni
che appartengono ad una delle due individuino il medesimo orientamento sulla
curva. Se denotiamo con γ una curva, con il simbolo +γ si intende la curva su
cui sia assegnato un orientamento. Con il simbolo −γ si intende la stessa curva
con l’orientamento opposto.

3.2 Lunghezza di un arco di curva


Assegnata la curva (3.1) poniamo
v
uN
uX
H(t) = t ϕ0 (t)2 .
i
i=1
72 CAPITOLO 3. CURVE

Nel caso di un arco di curva regolare di R3 una sua rappresentazione parametrica

t ∈ [a, b] → (x(t), y(t), z(t))

può essere interpretata come la legge oraria del moto di un punto materiale. Il
vettore (x0 , y 0 , z 0 ) tangente alla curva è il vettore velocità mentre H è la velocità
scalare. Ciò suggerisce la seguente definizione.
Definizione 3.2.1. - La lunghezza dell’arco di curva (3.1) è l’integrale
Z b
(3.6) H(t)dt .
a

Facendo uso della regola del cambiamento di variabili per gli integrali definiti si
può verificare che il valore (3.6) non dipende dalla particolare rappresentazione
parametrica della curva.
La definizione di lunghezza di un arco di curva trova piena giustificazione nel
seguente risultato.
Teorema 3.2.1. - L’integrale (3.6) è l’estremo superiore dell’insieme numerico
delle lunghezze delle poligonali inscritte nella curva (3.1).
Dimostrazione. Per evitare complicazioni di carattere notazionale dimostriamo
il risultato nel caso di una curva piana; le componenti della sua rappresentazione
parametrica siano due funzioni x, y di classe C 1 ([a, b]).
Fissata una decomposizione

(3.7) a = t0 < t1 < · · · < tn = b

dell’intervallo [a, b] consideriamo la poligonale i cui vertici sono i punti della


curva corrispondenti ai valori ti del parametro. La lunghezza della poligonale è
allora
n−1
Xp
p= [x(ti+1 ) − x(ti )]2 + [y(ti+1 ) − y(ti )]2 .
i=0

Applicando il teorema di Lagrange si ha anche


n p
X
p= x0 (ui )2 + y 0 (vi )2 (ti+1 − ti )
i=0

con ui , vi ∈ [ti , ti+1 ].


Dobbiamo ora confrontare p con la somma di Riemann
n−1
Xp
σ= x0 (ti )2 + y 0 (ti )2 (ti+1 − ti ) .
i=0

A tal fine introduciamo la seguente funzione


p
F (u, v) = x0 (u)2 + y 0 (v)2
3.2. LUNGHEZZA DI UN ARCO DI CURVA 73

che risulta uniformemente continua nel compatto [a, b] × [a, b].


È allora possibile applicare il teorema di Cantor 2.3.2. Fissato ε esiste un δ tale
che
|F (u, v) − F (u0 , v 0 )| < ε
se |u − u0 | < δ e |v − v 0 | < δ.
Pertanto, se la massima ampiezza degli intervalli della decomposizione (3.7) è
minore di δ, abbiamo
n−1
X
|p − σ| = [F (ui , vi ) − F (ti , ti )] (ti+1 − ti ) < ε(b − a) .


i=0

Ora, per la definizione di integrale secondo Riemann, è possibile scegliere δ in


modo tale che, se la massima ampiezza degli intervalli della decomposizione
(3.7) è minore di δ, risulti
Z b

σ − H(t)dt < ε .

a

In definitiva si ha
Z b

(3.8) p − H(t)dt < ε(b − a + 1)

a

sempre a patto che la poligonale venga costruita a partire da una decomposizione


(3.7) tale che la massima ampiezza dei singoli intervalli non superi il valore δ
fissato in precedenza.
Si consideri ora una generica poligonale di lunghezza p0 inscritta nella curva. È
possibile, aggiungendo ulteriori vertici, costruire una poligonale la cui lunghezza
p, ovviamente maggiore di p0 , soddisfi la (3.8). Si ha allora
Z b
0
p ≤p< H(t)dt + ε(b − a + 1) .
a

Dall’arbitrarietà di ε discende
Z b
0
p ≤ H(t)dt .
a

Ciò, insieme alla (3.8), comporta appunto che l’integrale (3.6) è l’estremo supe-
riore dell’insieme delle lunghezze delle poligonali inscritte nella curva.

Nel caso del grafico di una funzione f di classe C 1 ([a, b]) la lunghezza è
Z b q
1 + f 0 2 dx
a
74 CAPITOLO 3. CURVE

mentre, se la curva viene rappresentata in coordinate polari e la variabile ango-


lare θ appartiene all’intervallo [α, β], la lunghezza è
Z βq
f 2 + f 0 2 dθ .
α

Data una curva regolare o, anche, solo generalmente regolare, è possibile in-
trodurre su di essa un sistema di ascisse curvilinee in modo analogo a quanto
solitamente viene fatto per gli assi cartesiani.
Fissato un orientamento scegliamo un punto ϕ(t0 ) che funge da origine del
nostro riferimento. Allora al generico punto ϕ(t) associamo come ascissa il
valore
Z t
(3.9) s(t) = ± H(τ )dτ.
t0

In tale espressione va considerato il segno + se l’orientamento positivo coincide


con quello indotto dalla rappresentazione parametrica, altrimenti va scelto il
segno −.
La (3.9) è una funzione della variabile t la cui derivata è o positiva o negati-
va. Essa pertanto risulta un’applicazione biunivoca dell’intervallo [a, b] su un
intervallo [α, β]. Sia
s ∈ [α, β] → t(s) ∈ [a, b]
la sua inversa. Ricordando quanto detto in relazione alla (3.5), abbiamo una
nuova rappresentazione parametrica della curva riferita al parametro ascissa
curvilinea
s ∈ [α, β] −→ ψ(s) = ϕ(t(s)) .
La particolarità di tale rappresentazione consiste nel fatto che i vettori tangenti
hanno lunghezza unitaria. Infatti dalla (3.9), per la regola di derivazione delle
funzioni inverse, si ottiene
ϕ0i (t(s))
ψi0 (s) = ±
H(t(s))
da cui
v
uN
uX 2
0
(3.10) kψ k = t ψi0 = 1 .
i=1

3.3 Curve piane: curvatura


Consideriamo una curva piana di equazioni parametriche

(3.11) ψ(s) = (x(s), y(s))

con s parametro ascissa curvilinea. Le funzioni x, y siano di classe C 2 .


3.3. CURVE PIANE: CURVATURA 75

Per (3.10) si ha
2 2
x0 + y 0 = 1
da cui

(3.12) x0 x00 + y 0 y 00 = 0 .

Per la (3.12) il versore t = (x0 , y 0 ), tangente alla curva, è perpendicolare al vet-


tore t0 = (x00 , y 00 ) che, se non nullo, punta nella direzione in cui la curva volge
la propria convessità. Fissiamo infatti sulla curva un punto; possiamo sempre
supporre che esso sia ψ(0) e che coincida con l’origine. Dobbiamo allora verifi-
care che, per s abbastanza piccolo, il prodotto scalare tra il vettore spostamento
ψ(s) e t0 (0) è positivo. Per la formula di Taylor di ordine due con resto di Peano
relativa alle funzioni x, y e per la (3.12) abbiamo

x00 (0)2 + y 00 (0)2 2


< ψ(s), t0 (0) >= x(s) x00 (0) + y(s) y 00 (0) = s + o(s2 ) .
2
Tale prodotto scalare risulta per l’appunto positivo almeno per valori di s
prossimi a zero.
Indichiamo con n il versore normale alla curva orientato in modo che la coppia
(t, n) sia congruente alla coppia dei versori dei due assi cartesiani. Si ha allora
 
0 −1
(3.13) n= t.
1 0

Il versore n si ottiene cioè facendo ruotare t in senso antiorario di un angolo


pari a π/2. Consideriamo un punto della curva in cui t0 non sia nullo. I vettori
t0 e n sono paralleli. Si ha allora

(3.14) t0 = κn .

La quantità κ prende il nome di curvatura e si ha


p
(3.15) |κ(s)| = x00 (s)2 + y 00 (s)2 .

Dalle (3.13), (3.14) si ha


   
0 −1 0 −1
n0 =   t0 = κ  n
1 0 1 0

da cui, per la (3.13),

(3.16) n0 = −κt .

Le (3.14) e (3.16) sono note come equazioni di Frenet della curva.


Definiamo la funzione θ(s) in modo tale che risulti

t(s) = (cos θ(s), sin θ(s)) .


76 CAPITOLO 3. CURVE

Si verifica facilmente che θ ha derivata prima continua. Inoltre per la (3.13) si


ha n(s) = (− sin θ(s), cos θ(s)). Abbiamo quindi t0 = θ0 n da cui, ricordando la
(3.14),
(3.17) θ0 = κ .
La curvatura misura cioè la velocità con cui varia la direzione della retta tangente
alla curva. Inoltre la curva volta a sinistra o a destra se la curvatura è positiva
o negativa.
Sia (x(0), y(0)) = (0, 0) e (x0 (0), y 0 (0)) = (1, 0); quest’ultima condizione assicura
che θ(0) = 0 e quindi, per la (3.17),
Z s
θ(s) = κ(σ) dσ .
0

Si ha pertanto
Z s Z σ  Z s Z σ 
(3.18) x(s) = cos κ(t) dt dσ , y(s) = sin κ(t) dt dσ .
0 0 0 0

Dalle (3.18) si deduce che le uniche curve con curvatura costante sono gli archi
di circonferenze; il raggio è il reciproco del modulo della curvatura.
Riscriviamo la formula relativa alla curvatura nel caso in cui la rappresentazione
parametrica, riferita ad un generico parametro t, si presenti sotto la forma
(3.19) γ(t) = (ξ(t), η(t)) = (x(s(t)), y(s(t)))
dove s(t) è la funzione (3.9). Assumendo che gli orientamenti indotti da tale
rappresentazione parametrica e dalla (3.11) coincidano abbiamo
ξ 0 (t) = x0 (s(t)) H(t) , η 0 (t) = y 0 (s(t)) H(t) .
2 2
Essendo H 2 = ξ 0 + η 0 si ha
ξ 0 ξ 00 + η 0 η 00
(3.20) H0 = .
H
Abbiamo inoltre
H 0 (t) H 0 (t)
ξ 00 (t) = x00 (s(t))H 2 (t) + ξ 0 (t) , η 00 (t) = y 00 (s(t))H 2 (t) + η 0 (t)
H(t) H(t)
da cui
H0 H0
   
1 1
x00 (s(t)) = ξ 00 − ξ 0 , y 00 (s(t)) = η 00 − η 0 .
H2 H H2 H
Per la (3.20) risulta allora
" 2 2 #
H0 H0

00 2 00 2 1
κ2 =x +y = 4 ξ 00 − ξ 0 + η 00 − η 0
H H H

1 0 00
= (ξ η − η 0 ξ 00 )2
H6
3.3. CURVE PIANE: CURVATURA 77

e quindi
|ξ 0 η 00 − η 0 ξ 00 |
(3.21) |κ| = .
H3
Se la curva è il grafico di una funzione f la (3.21) diventa
|f 00 |
(3.22) |κ| = 3/2
.
(1 + f 02 )
Definizione 3.3.1. - Se in un punto ψ(s) della curva (3.11) la curvatura è non
nulla allora la quantità r(s) = |κ−1 (s)| prende il nome di raggio di curvatura
della curva nel punto assegnato.
Il termine raggio di curvatura si giustifica sulla base del fatto che, tra tutte le
circonferenze tangenti in ψ(s) alla curva, quella che aderisce meglio ad essa è la
circonferenza il cui centro si colloca a distanza r(s) da ψ(s) sulla normale alla
curva dalla parte in cui la curva volge la convessità. Tale circonferenza prende
il nome di circonferenza osculatrice.
Per semplicità assumiamo che il punto considerato sia l’origine; inoltre è facile
verificare che, in un intorno dell’origine, l’arco di curva si rappresenta come
grafico di una funzione f , per esempio, della variabile x tale che
f (0) = f 0 (0) = 0 , f 00 (0) > 0 .
−1
In tal caso, per la (3.22), il raggio di curvatura è [f 00 (0)] .
La circonferenza osculatrice ha equazione
 2  2
1 1
y − 00 + x2 = .
f (0) f 00 (0)
Basta allora osservare che la differenza
 s 
2
1 1
f (x) −  00 − − x2 
f (0) f 00 (0)

è infinitesima di ordine superiore al secondo per x che tende a zero.

Definizione 3.3.2. - La curva descritta dai centri delle circonferenze osculatri-


ci della curva (3.11) prende il nome di evoluta. Essa ha equazione parametrica
n(s)
(s) = ψ(s) +
κ(s)
con s parametro ascissa curvilinea della curva (3.11).
Esempio 3.3.1. - L’evoluta della parabola di equazione y = x2 /2 ha la seguente
rappresentazione parametrica
 
3
t −→ −t3 , 1 + t2 .
2
Tale curva presenta una cuspide in (0, 1).
78 CAPITOLO 3. CURVE

Osservazione 3.3.1. - Se si interpretano i vettori del piano come vettori dello


spazio con la terza componente nulla allora la (3.14) afferma che il modulo della
curvatura è la lunghezza del prodotto vettoriale dei versori t e t0 ovvero

|κ| = kt × t0 k .

Se si usa la rappresentazione parametrica (3.19), essendo

γ0
t=
H
si ha
γ0 γ 00 γ0 H0
 
dt d ds
t0 = = = 2− .
ds dt H dt H H3
Abbiamo quindi
kγ 0 × γ 00 k
|κ| =
H3
cioè la (3.21).

3.4 Curve dello spazio: curvatura e torsione


Consideriamo una curva regolare dello spazio

(3.23) ψ(s) = (x(s), y(s), z(s))

con s parametro ascissa curvilinea. Supponiamo che le funzioni x, y, z siano


di classe C 2 . Come per le curve piane si può dimostrare che il vettore ψ 00 è
perpendicolare al versore tangente alla curva t = ψ 0 . Il suo modulo
q
κ = x00 2 + y 00 2 + z 00 2

prende il nome di curvatura. Diversamente però dal caso bidimensionale, per le


curve dello spazio, la curvatura è sempre non negativa. Si ha quindi

(3.24) t0 = κn

con n noto come versore normale principale.


Definizione 3.4.1. - Se i vettori ψ 0 (s) e ψ 00 (s) non si annullano il piano
passante per ψ(s) e parallelo ai versori t, n, cioè il piano di equazione

x − x(s) y − y(s) z − z(s)


x0 (s) 0 0

y (s) z (s) = 0,


x00 (s) y 00 (s) z 00 (s)

prende il nome di piano osculatore alla curva in ψ(s)ψ(s).


3.4. CURVE DELLO SPAZIO: CURVATURA E TORSIONE 79

Indichiamo con b il versore ortogonale al piano osculatore orientato in modo


tale che la terna (t, n, b) sia congruente a quella costituita dai tre versori degli
assi cartesiani. Il vettore b, detto vettore binormale, è il prodotto vettoriale di
t e n. Si ha cioè
 0 00
y z − z 0 y 00 z 0 x00 − x0 z 00 x0 y 00 − y 0 x00

(3.25) b=t × n= , , .
κ κ κ

La terna (t, n, b) si chiama triedro principale della curva.


Controlliamo ora in che misura la curva si scosti dal piano osculatore in un
punto della curva. Possiamo sempre supporre che tale punto sia l’origine e che
la sua ascissa curvilinea sia zero. Assumiamo che la curva sia di classe C 3 .
Consideriamo la proiezione del vettore spostamento ψ(s) su b e utilizziamo la
formula di Taylor per le funzioni x, y, z; per comodità usiamo l’indice 0 per
denotare i valori di tali funzioni, delle loro derivate e della curvatura in s = 0.
Tenendo conto della (3.25) abbiamo

x(s)(y00 z000 − z00 y000 ) + y(s)(z00 x000 − x00 z000 ) + z(s)(x00 y000 − y00 x000 )
< ψ(s), b > =
κ0
x00 (y00 z000 − z00 y000 ) + y00 (z00 x000 − x00 z000 ) + z00 (x00 y000 − y00 x000 )
= s
κ0
x000 (y00 z000 − z00 y000 ) + y000 (z00 x000 − x00 z000 ) + z000 (x00 y000 − y00 x000 ) 2
+ s
2κ0
x000 0 00 0 00 000 0 00 0 00 000 0 00 0 00
0 (y0 z0 − z0 y0 ) + y0 (z0 x0 − x0 z0 ) + z0 (x0 y0 − y0 x0 ) 3
+ s
6κ0

+ o(s3 ) .

I primi due termini si annullano in quanto b è ortogonale sia a t che a n. Si ha


quindi
0
x0 y00 z00



1 00
y000 z000 s3 + o(s3 ) .

(3.26) < ψ(s), b >= x
6κ0 0
000
x0 y0000 z0000

Tale calcolo mette in evidenza il fatto che il piano osculatore individua, tra tutti
i piani passanti per la retta tangente alla curva, quello che, in qualche senso,
aderisce meglio ad essa.
Essendo < t, n >= 0 si ha < t, n0 >= − < t0 , n >. Inoltre, dalla relazione
< n, n >= 1, si ottiene < n, n0 >= 0. Abbiamo allora

n0 =< n0 , t > t+ < n0 , n > n+ < n0 , b > b = − < t0 , n > t+ < n0 , b > b
80 CAPITOLO 3. CURVE

da cui, per la (3.24),


(3.27) n0 = −κt + τ b
con τ =< n0 , b >; quest’ultima costante prende il nome di torsione.
Si ha
b0 =< b0 , t > t+ < b0 , n > n+ < b0 , b > b = − < t0 , b > t− < n0 , b > n
da cui, sempre per la (3.24),
(3.28) b0 = −τ n .
Le (3.24), (3.27), (3.28) sono note come equazioni di Frenet.
Dalla (3.24), per la (3.27), si ha
ψ 000 = t00 = κ0 n + κn0 = κ0 n − κ2 t + κτ b .
Consideriamo un punto della curva che, come al solito, assumiamo che coincida
con l’origine e abbia ascissa curvilinea nulla. Per la formula di Taylor si ha
ψ 00 (0) 2 ψ 000 (0) 3
ψ(s) = ψ 0 (0) s + s + s + o(s3 )
2 3!

κ2 3 κ 2 κ0 3
   
τκ 3
= s− s t+ s + s n+ s b + o(s3 ) .
6 2 6 6
Proiettando su b e confrontando il coefficiente del termine del terzo ordine con
quello riportato in (3.26) otteniamo la seguente espressione per la torsione
0
x0 y00 z00



τ = κ−2
00
x0 y000 z000 .

0

000
x0 y0000 z0000

Le curve piane hanno ovviamente torsione nulla. Il risultato si può invertire.


Se la curva (3.23) è a torsione nulla allora, per la (3.28), la funzione b(s) è
costante: sia b0 il valore di tale costante. Il piano osculatore alla curva in ψ(s)
ha equazione
(3.29) < b0 , x − ψ(s) >= 0
dove x denota il generico punto del piano osculatore. Poichè
d
< b0 , ψ(s) >=< b0 , ψ 0 (s) >= 0
ds
risulta
< b0 , ψ(s) >= c ∈ R .
Dalla (3.29) si deduce che il piano osculatore non varia ed ha equazione
< b0 , x >= c .
La curva giace su tale piano.
3.5. ESERCIZI 81

Osservazione 3.4.1. - Come per le curve piane si puó ottenere una formula per
la curvatura nel caso in cui la rappresentazione parametrica di (3.23) è riferita
ad un parametro che non sia l’ascissa curvilinea. Si ha
p
(x0 y 00 − y 0 x00 )2 + (x0 z 00 − z 0 x00 )2 + (y 0 z 00 − z 0 y 00 )2
κ= .
H3
Esempio 3.4.1. - Consideriamo l’elica dell’es. 3.1.6 con r = v = 1. Usiamo la
seguente rappresentazione parametrica riferita al parametro ascissa curvilinea s
 
s s s
cos √ , sin √ , √ .
2 2 2
Si vede facilmente che
1
κ=τ =
2
quindi sia la curvatura che la torsione sono costanti.
Si può dimostrare una curva dello spazio con tale caratteristica è necessaria-
mente un arco di elica.

3.5 Esercizi
1. Dimostrare che una curva piana regolare è localmente grafico di una
funzione della variabile x e/o della variabile y.
2. Calcolare le lunghezze della cicloide (3.4) e della cardioide (3.3).
3. Si consideri l’elica dell’esempio 3.1.6 e si faccia variare il parametro t
nell’intervallo [0, 2π]. Calcolare la lunghezza dell’arco di curva in tal modo
ottenuto.
4. Si calcoli la lunghezza dell’arco di curva di equazione y = ex con x ∈ [0, 1].
5. Sia f una funzione crescente di classe C 1 ([0, 1]). Se L è la lunghezza del
grafico di f dimostrare che L ≤ 1 + f (b) − f (a).
82 CAPITOLO 3. CURVE
Capitolo 4

Forme differenziali

4.1 Definizioni e proprietà


Sia γ una curva generalmente regolare e sia (3.1) una sua rappresentazione
parametrica. Se sul suo sostegno è definita una funzione f continua
Z Z b
(4.1) f ds = f (ϕ(t))H(t) dt
γ a

denota l’integrale curvilineo di f esteso a γ. Si verifica facilmente che la quantità


a secondo membro nella (4.1) non dipende dalla particolare rappresentazione
parametrica utilizzata.
Esempio 4.1.1. - Se γ è una curva di R3 il suo baricentro ha coordinate
Z Z Z
1 1 1
xγ = x ds , yγ = y ds , zγ = z ds
L γ L γ L γ

dove L è la lunghezza della curva.


Consideriamo un punto materiale di massa unitaria che si muova in un campo
di forze F = (X, Y, Z) con componenti continue. Se

(4.2) t ∈ [a, b] −→ (x(t), y(t), z(t))

è la legge oraria del moto sia +γ l’arco orientato descritto dal punto. Indichiamo
con
2 2 2
x0 (t) + y 0 (t) + z 0 (t)
E(t) =
2
l’energia cinetica della particella. Per la seconda legge della dinamica si ha
F = (x00 , y 00 , z 00 ); quindi E 0 (t) assume la seguente espressione

X(x(t), y(t), z(t))x0 (t) + Y (x(t), y(t), z(t))y 0 (t) + Z(x(t), y(t), z(t))z 0 (t) .

83
84 CAPITOLO 4. FORME DIFFERENZIALI

L’incremento dell’energia cinetica è allora


Z b
[X(x(t), y(t), z(t))x0 (t) + Y (x(t), y(t), z(t))y 0 (t) + Z(x(t), y(t), z(t))z 0 (t)] dt .
a

Tale integrale rappresenta il lavoro compiuto dalle forze del campo e si indica
anche con il simbolo Z
X dx + Y dy + Z dz .

Esso è l’integrale curvilineo esteso alla curva (4.2) della funzione prodotto scalare
del vettore F e del versore tangente alla curva opportunamente orientato.
Quanto appena detto relativamente al caso tridimensionale può essere riformu-
lato in un qualsiasi spazio euclideo nel modo seguente. Assegnate N funzioni
Xi continue in un aperto A di RN il simbolo
N
X
(4.3) ω = X1 dx1 + · · · + XN dxN = Xi dxi
i=1

prende il nome di forma differenziale lineare o 1-forma. Sia +γ un arco orien-


tato della curva (3.1) contenuta in A e siano t1 e t2 i valori del parametro cui
corrispondono i due estremi dell’arco presi nell’ordine. La quantità
Z Z N
t2 X
ω= Xi (ϕ(t))ϕ0i (t) dt
+γ t1 i=1

è per definizione l’integrale curvilineo di ω esteso a +γ. Anche in questo caso


va osservato che tale integrale non risente della particolare rappresentazione
parametrica utilizzata per la curva.
Sussistono i seguenti risultati di semplice verifica.
Proposizione 4.1.1. - Se L è la lunghezza di γ allora
Z N
!1/2
X
Xi2

ω ≤ L max .

+γ γ
i=1

Proposizione 4.1.2. - Se +γ è suddiviso in due sottoarchi +γ1 e +γ2 allora


Z Z Z
(4.4) ω= ω+ ω.
+γ +γ1 +γ2

4.2 Forme esatte


I piú semplici esempi di 1-forme sono i differenziali di funzioni numeriche. Una
questione importante è stabilire se la 1-forma (4.3) è un differenziale se cioè
esiste una funzione f tale che
∂f
(4.5) Xi = i = 1, · · · , N .
∂xi
4.2. FORME ESATTE 85

Si dice allora che la forma differenziale (4.3) è esatta o integrabile e che f è una
sua primitiva. Nel caso tridimensionale, se i coefficienti della forma differenziale
sono le componenti di un campo di forze, l’integrabilità della 1-forma equivale
ad affermare il corrispondente campo vettoriale è conservativo. La primitiva
allora è il potenziale del campo.

Teorema 4.2.1. - Sia ω una forma differenziale esatta in un aperto connesso


per poligonali. Allora due sue primitive differiscono per una costante.

Dimostrazione. Se f, g sono due primitive di ω allora (f −g) ha derivate parziali


nulle. Il risultato segue dal teorema 2.8.6.

La stretta connessione tra la nozione di forma differenziale esatta e quella di


campo conservativo appare in tutta la sua evidenza nel seguente criterio di
integrabilità.

Teorema 4.2.2. - Se la 1-forma ω è definita in un aperto A connesso per


poligonali allora le seguenti proprietà sono equivalenti.

i) ω è esatta.

ii) Se x, y sono gli estremi di due curve γ1 e γ2 generalmente regolari, orien-


tate da x a y, allora Z Z
ω= ω.
+γ1 +γ2

iii) L’integrale di ω esteso ad una qualsiasi curva generalmente regolare chiusa


è nullo.

Dimostrazione. La condizione ii) afferma che l’integrale di una forma esatta non
dipende dalla curva ma solo dai suoi estremi e dal verso di percorrenza. È ciò che
si riscontra per i campi conservativi. In tal caso infatti il lavoro compiuto dalle
forze del campo non dipende dal particolare percorso che il punto materiale
segue per giungere alla posizione finale partendo da una assegnata posizione
iniziale.
Per evitare complicazioni di carattere notazionale riportiamo la dimostrazione
riferita al caso bidimensionale. Supponiamo cioè che sia

(4.6) ω = Xdx + Y dy .

Se ω è esatta sussistono le (4.5) che in tal caso diventano

(4.7) fx = X , fy = Y .

Assegnata una curva γ sia (x(t), y(t)) una sua rappresentazine parametrica.
Denotiamo con (x1 , y1 ), (x2 , y2 ) i suoi estremi che corrispondono ai valori t1 , t2
di t; fissiamo come positivo l’orientamento che va dal primo punto al secondo.
86 CAPITOLO 4. FORME DIFFERENZIALI

Dalla (4.7), dalla regola di derivazione delle funzioni composte (2.35) e dal
teorema fondamentale del calcolo integrale si ha
Z Z t2
ω = [fx (x(t), y(t))x0 (t) + fy (x(t), y(t))y 0 (t)] dt
+γ t1

Z t2
d
= f (x(t), y(t)) dt = f (x2 , y2 ) − f (x1 , y1 )
t1 dt

cioè ii).
Supponiamo ora che sussista ii). Fissato (x0 , y0 ) sia (x, y) un ulteriore punto di
A. Essendo A connesso per poligonali esiste una curva generalmente regolare γ
che collega i due punti. Per la ii) l’integrale di ω esteso a tale curva, orientata in
modo che i suoi estremi siano nell’ordine (x0 , y0 ) e (x, y), è indipendente dalla
scelta fatta; ha senso quindi definire la seguente funzione
Z
f (x, y) = ω.

Verifichiamo che f è una primitiva di ω. Consideriamo la curva +γ, di estremi


(x0 , y0 ) e (x + h, y), costituita da una prima curva +γ1 che va (x0 , y0 ) a (x, y)
e da una seconda curva +γ2 rappresentata dal segmento orientato di estremi
(x, y) e (x + h, y); si scelga h in modo che tale segmento sia contenuto in A. Per
la (4.4) si ha
Z Z Z Z 1
f (x + h, y) − f (x, y) = ω− ω= ω=h X(x + th, y) dt .
+γ +γ1 +γ2 0

Utilizzando il teorema della media integrale abbiamo

f (x + h, y) − f (x, y) = hX(x + θh, y)

con θ ∈]0, 1[. Sfruttando l’ipotesi di continuità di X si ha

f (x + h, y) − f (x, y)
lim = X(x, y) .
h→0 h

Abbiamo in tal modo provato la prima della (4.7). In modo analogo si dimostra
che Y è la derivata parziale di f rispetto a y. Quindi ii) implica i).
Ovvia risulta infine l’equivalenza tra le due proprietà ii) e iii).

Osservazione 4.2.1. - Le condizioni ii), iii) del teorema 4.2.2 possono essere
riformulate facendo riferimento alle sole poligonali. Una forma differenziale
risulta allora esatta se è nullo l’integrale della forma esteso ad una qualsiasi
poligonale chiusa.
4.3. FORME CHIUSE 87

4.3 Forme chiuse


Una semplice condizione che deve essere soddisfatta dalle forme esatte è conte-
nuta nel seguente teorema.

Teorema 4.3.1. - Se la forma differenziale (4.3) ha coefficienti di classe C 1 ed


è esatta allora
∂Xi ∂Xj
(4.8) =
∂xj ∂xi

per ogni i, j.

Dimostrazione. Sia f una primitiva di (4.3). Derivando la i−ma e la j−ma


identità (4.5), la prima rispetto a xj , la seconda rispetto a xi , abbiamo

∂Xi ∂2f ∂Xj ∂2f


= , = .
∂xj ∂xi ∂xj ∂xi ∂xj ∂xi

La (4.8) è allora conseguenza del teorema 2.12.1.

Definizione 4.3.1. - La forma differenziale (4.3), a coefficienti di classe C 1 ,


dicesi chiusa se sussistono le (4.8).

Nel caso della forma piana (4.6) le (4.8) si riducono alla condizione Xy = Yx .
In R3 , posto
ω = Xdx + Y dy + Zdz ,
le (4.8) diventano
Zy = Yz Xz = Zx Yx = Xy .
In tal caso il campo vettoriale (X, Y, Z) dicesi irrotazionale o libero da vortici.
La condizione (4.8) da sola non basta per assicurare che una forma sia esatta.
La forma differenziale
y x
(4.9) − dx + 2 dy ,
x2 +y 2 x + y2

definita in tutto il piano privato dell’origine, è chiusa ma non esatta; si può in-
fatti facilmente verificare che l’integrale della forma esteso ad una circonferenza
con centro nell’origine non è nullo.
La condizione di chiusura basta però per dire che una forma è esatta se si fanno
opportune ipotesi di natura topologica sull’insieme in cui essa è definita.

Lemma 4.3.1. (Lemma di Poincaré) - Sia A un aperto di RN convesso


rispetto a un punto x̄ = (x̄i ). Se la forma differenziale (4.3) è a coefficienti di
classe C 1 (A) ed è chiusa allora essa risulta esatta.
88 CAPITOLO 4. FORME DIFFERENZIALI

Dimostrazione. Se x = (xi ) ∈ A consideriamo il segmento di estremi x̄, x

t ∈ [0, 1] −→ x̄ + t(x − x̄)

con l’orientamento indotto da tale rappresentazione. Definiamo la funzione


Z 1 "X
N
#
f (x) = Xi (x̄ + t(x − x̄))(xi − x̄i ) dt .
0 i=1

Per il teorema 2.11.3 si ha


Z 1" X N
#
∂Xi
fxj (x) = t (x̄ + t(x − x̄))(xi − x̄i ) + Xj (x̄ + t(x − x̄)) dt .
0 i=1
∂xj

Utilizzando dapprima le (4.8), poi la regole di derivazione delle funzioni com-


poste (2.35) e quella del prodotto, quindi il teorema fondamentale del calcolo
integrale abbiamo
Z 1" X N
#
∂Xj
fxj (x) = t (x̄ + t(x − x̄))(xi − x̄i ) + Xj (x̄ + t(x − x̄)) dt
0 i=1
∂xi
Z 1  
d
= t Xj (x̄ + t(x − x̄)) + Xj (x̄ + t(x − x̄)) dt
0 dt
Z 1
d
= [tXj (x̄ + t(x − x̄))] dt = Xj (x)
0 dt

per ogni indice j. Quindi f è la primitiva della forma differenziale.


Per il lemma 4.3.1 risulta esatta una forma piana che sia chiusa e definita, per
esempio, in un insieme I × J con I, J intervalli di R. È possibile in tal caso
attivare una procedura per il calcolo di una primitiva f . Dalla relazione fy = Y ,
integrando rispetto a y, si ottiene
Z
f (x, y) = Y (x, y) dy + c(x)

dove c è una funzione che può essere determinata sfruttando l’ulteriore condi-
zione fx = X.
Illustriamo tale metodo nel caso della forma chiusa (4.9) ristretta per esempio
al semipiano R+ × R. Sia f la primitiva. Dall’identità
x
fy (x, y) = ,
x2 + y 2
integrando rispetto alla variabile y, abbiamo
y
f (x, y) = arctan + c(x) .
x
4.3. FORME CHIUSE 89

Derivando rispetto a x e ricordando che deve essere


y
fx (x, y) = −
x2 + y 2
otteniamo c0 (x) = 0. Abbiamo quindi
y
f (x, y) = arctan +c
x
con c costante arbitraria. Se poniamo z = x + i y e c = 0 la primitiva è una
determinazione della funzione a piú valori arg z. Ovviamente una tale funzione
non potrà mai rappresentare una primitiva di (4.9) in R2 privato dell’origine.
Se si vuole indagare piú a fondo sul nesso tra la condizione di chiusura e quella
di integrabilità è necessario introdurre una nuova nozione di natura topologica.
Siano γ0 e γ1 due curve regolari e chiuse con sostegni contenuti in A, aperto
di RN . Supponiamo che per tali due curve siano fissate rappresentazioni con
parametri che variino in [0, 1]. Tali due curve si dicono omotope in A se esiste
un’applicazione di classe C 1

(4.10) (t, τ ) ∈ [0, 1] × [0, 1] −→ H(t, τ ) ∈ A

tale che, per ogni τ ∈ [0, 1],



 H(0, τ ) = γ0 (τ )
(4.11)
H(1, τ ) = γ1 (τ )

e, per ogni t ∈ [0, 1],

(4.12) H(t, 0) = H(t, 1) .

La (4.10), al variare del parametro t, descrive il moto di una curva che resta
chiusa per la (4.12) e che, per le (4.11), all’istante iniziale t = 0 coincide con
la curva γ0 , all’istante finale t = 1 con γ1 . In definitiva la curva γ0 subisce
una deformazione che, con continuità, la trasforma in γ1 senza che, durante tale
processo, si esca dall’insieme A. Ciò premesso diremo che A è semplicemente
connesso se ogni curva chiusa in esso contenuta è omotopa ad un punto di A, se
cioè ogni curva chiusa si può deformare con continuità fino a ridursi ad un punto.
Si può dimostrare che insiemi limitati del piano la cui frontiera sia costituita
da un’unica curva generalmente regolare, semplice e chiusa sono semplicemente
connessi. Tali non sono gli insiemi, come le corone circolari, che presentano buchi
al loro interno. Piú complessa è la situazione in R3 o in spazi a dimensione piú
alta. Un esempio di insieme non semplicemente connesso è costituito dal toro
mentre la corona sferica, la quale presenta una frontiera costituita da due diverse
superfici, è un insieme semplicemente connesso.
Riportiamo per completezza il seguente risultato.
Teorema 4.3.2. - Una forma differenziale chiusa, definita in un aperto sem-
plicemente connesso di RN , è esatta.
90 CAPITOLO 4. FORME DIFFERENZIALI

4.4 Esercizi
1. Si determini il baricentro dell’arco di parabola di equazione y = x2 con
x ∈ [0, 1].

2. Si determini il baricentro dell’arco di circonferenza (cos t, sin t) al variare


di t in [−α, α].

3. Si consideri la forma differenziale


x y
ω= 2
dx + dy .
1+y 1 + x2
Si calcoli l’integrale curvilineo di ω esteso alla curva orientata costitui-
ta
√ dall’arco
√ di circonferenza, con centro nell’origine, di estremi (1, 0) e
( 2/2, 2/2) orientata nel verso che va dal primo al secondo di tali due
punti.

4. Per ciascuna delle seguenti forme differenziali si indichi l’insieme di defini-


zione, si stabilisca se è esatta e, in caso affermativo, si determini l’insieme
delle primitive.
√ √
log(1 + y) x
a) √ dx + √ √ dy
x y(1 + y)
y x
b) 2 2 dx + 2 2 dy
x y +1 x y +1
c) (2x sin y + y 2 sin x) dx + (x2 cos y − 2y cos x) dy
d) y 2 cos(xy 2 ) dx + 2y(1 + x cos(xy 2 )) dy
 
x x x
e) e dx + 1 −
y e y dy
y
   
y 1 1 x
f) + dx − + dy
x2 y x y2
2x (1 + y)2 + x2
g) 2 2
dx + dy
1+x +y 1 + x2 + y 2
h) (2y + 1) dx + (2x − 1) dy + 2z dz .

5. Si consideri la forma differenziale


xk yk
ωk = dx + dy .
x2 + y 2 x2 + y 2
Determinare il valore di k in corrispondenza del quale ωk è chiusa. Ve-
rificare che tale forma è esatta in tutto il piano privato dell’origine e
determinarne una primitiva.
4.4. ESERCIZI 91

6. Sia
ω = (x2 + y) dx + ϕ(x) dy .
Determinare ϕ in modo tale che ω sia esatta.

7. Determinare quella funzione X(y) nulla per y = 0 tale che risulti chiusa
la forma differenziale
ω = X(y) dx + xy dy .
Scrivere una primitiva di ω.

8. Indicare una funzione g(y) tale che risulti esatta la seguente forma diffe-
renziale
g(y) dx + xeg(y) dy .

9. Posto
ω = y dx − x dy
α
e γα = {y = x : 0 ≤ x ≤ 1} con α > 0, verificare che
Z
−1 < ω<1
+γα

dove l’orientamento positivo sulla curva è quello delle x crescenti.


92 CAPITOLO 4. FORME DIFFERENZIALI
Capitolo 5

Funzioni implicite

5.1 Il teorema di Dini


Sia f una funzione continua in un aperto del piano. Vogliamo descrivere il luogo
geometrico delle soluzioni dell’equazione

(5.1) f (x, y) = 0 .

In particolare ci interessano i casi in cui l’equazione può essere risolta rispetto


ad una delle variabili, i casi cioè in cui la (5.1) si può scrivere localmente sotto
la forma

(5.2) y = g(x) ovvero x = h(y) .

Consideriamo alcuni esempi. L’equazione

(5.3) x2 + y 2 = 0

ha (0, 0) come unica soluzione; quindi la (5.3) non può essere scritta in una delle
forme (5.2). L’insieme delle soluzioni dell’equazione

(5.4) x2 − y 2 = 0

è rappresentato dai punti di due rette passanti per (0, 0). Anche in questo caso,
comunque si fissi un intorno dell’origine, il luogo delle soluzioni di (5.4) non
può essere descritto in termini di grafico di una funzione della variabile x o
della variabile y. I punti della circonferenza con centro nell’origine e raggio uno
risolvono l’equazione

(5.5) x2 + y 2 − 1 = 0 .

Se fissiamo un punto di tale circonferenza è possibile determinare un suo intorno


in modo che la parte della circonferenza ivi contenuta si rappresenta come grafico
di una funzione di una delle variabili x, y. È evidente che una tale proprietà ha

93
94 CAPITOLO 5. FUNZIONI IMPLICITE

carattere locale nel senso che essa viene meno se si allarga oltre un certo limite
l’intorno del punto. Si osservi che le funzioni a primo membro nelle equazioni
(5.3) e (5.4) hanno gradiente nullo nell’origine, mentre, nel caso della funzione a
primo membro in (5.5), il gradiente è non nullo in ogni punto della circonferenza.
Tale condizione sul gradiente è l’ipotesi giusta per gli scopi che ci siamo prefissi.
Sussiste infatti il seguente risultato.
Teorema 5.1.1. (Teorema di Dini) - Sia f di classe C 1 (A) con A aperto del
piano. Sia

(5.6) f (x̄, ȳ) = 0

(5.7) fy (x̄, ȳ) 6= 0

con (x̄, ȳ) ∈ A. Allora è possibile determinare due numeri positivi δ, k tali che
per ogni x ∈ [x̄ − δ, x̄ + δ] esiste un unico valore g(x) ∈]ȳ − k, ȳ + k[ per cui si ha

(5.8) f (x, g(x)) = 0 .

La funzione g dicesi implicitamente definita dall’equazione (5.1). Essa è di


classe C 1 e si ha
fx (x, g(x))
(5.9) g 0 (x) = − .
fy (x, g(x))

Dimostrazione. Supponiamo per semplicità che sia

fy (x̄, ȳ) > 0 .

Per la continuità di fy è possibile determinare k e m in modo che risulti

(5.10) fy (x, y) ≥ m > 0

nel quadrato

(5.11) Qk = {(x, y) : |x − x̄| ≤ k , |y − ȳ| ≤ k} .

La funzione della variabile t

t ∈ [ȳ − k, ȳ + k] −→ f (x̄, t)

è allora strettamente crescente. Poiché essa si annulla in ȳ deve essere

f (x̄, ȳ − k) < 0 , f (x̄, ȳ + k) > 0 .

È possibile quindi fissare δ ≤ k tale che

f (x, ȳ − k) < 0 , f (x, ȳ + k) > 0


5.1. IL TEOREMA DI DINI 95

per x ∈ [x̄ − δ, x̄ + δ]. Per tali valori di x la funzione

t ∈ [ȳ − k, ȳ + k] −→ f (x, t) ,

strettamente crescente per la (5.10), assume valori di segno opposto agli estremi
dell’intervallo. Esiste quindi un unico valore g(x), con

(5.12) |g(x) − ȳ| < k ,

per cui sussiste la (5.8). Abbiamo in tal modo individuato la funzione implici-
tamente definita dall’equazione (5.1). Resta da verificare che essa è derivabile.
Se x e x + ∆x appartengono a [x̄ − δ, x̄ + δ] poniamo

∆g = g(x + ∆x) − g(x) .

Facendo ricorso al teorema 2.8.4 si ha

0 = f (x + ∆x, g(x + ∆x)) − f (x, g(x))

= f (x + ∆x, g(x) + ∆g)) − f (x, g(x))

= fx (x + θ∆x, g(x) + θ∆g)∆x + fy (x + θ∆x, g(x) + θ∆g)∆g

con θ ∈]0, 1[. Si ha pertanto


fx (x + θ∆x, g(x) + θ∆g)
∆g = − ∆x .
fy (x + θ∆x, g(x) + θ∆g)

Dalla limitatezza di fx e dalla (5.10) si deduce che ∆g è infinitesima per ∆x che


tende a zero: quindi g è continua. Abbiamo anche
∆g fx (x + θ∆x, g(x) + θ∆g)
=− .
∆x fy (x + θ∆x, g(x) + θ∆g)
Poiché ∆g è infinitesimo al tendere di ∆x a zero, dalla continuità delle derivate
parziali di f discende allora la (5.9).
Riportiamo per completezza una seconda dimostrazione che fa uso del teorema
delle contrazioni 2.5.1. Se poniamo
f (x, y)
F (x, y) = y − ȳ −
fy (x̄, ȳ)

la (5.1) si scrive nel modo seguente

(5.13) y = ȳ + F (x, y) .

Poiché Fy (x̄, ȳ) = 0 si può determinare k in modo tale che risulti


1
(5.14) |Fy (x, y)| <
2
96 CAPITOLO 5. FUNZIONI IMPLICITE

per (x, y) appartenente al quadrato (5.11). Essendo inoltre F (x̄, ȳ) = 0 esiste
un δ ≤ k tale che
k
(5.15) |F (x, ȳ)| <
2
se |x− x̄| ≤ δ. Denotiamo ora con X il sottoinsieme di C 0 ([x̄−δ, x̄+δ]) costituito
dalle funzioni continue y per cui

(5.16) |y(x) − ȳ| ≤ k

per ogni x ∈ [x̄ − δ, x̄ + δ]. Si può facilmente verificare che X è chiuso e, quindi,
completo. Si consideri la trasformazione

T : y ∈ X −→ T (y) = ȳ + F (x, y)

e verifichiamo innanzitutto che essa è un’applicazione di X in sé. Si ha

|T (y)(x) − ȳ| = |F (x, y(x))| ≤ |F (x, y(x)) − F (x, ȳ)| + |F (x, ȳ)| .

Se x ∈ [x̄ − δ, x̄ + δ], ricorrendo al teorema di Lagrange, per le (5.14) e (5.16)


abbiamo
|y(x) − ȳ| k
|F (x, y(x)) − F (x, ȳ)| ≤ ≤ .
2 2
Da tale stima e dalla (5.15) ricaviamo

(5.17) |T (y)(x) − ȳ| < k

se x ∈ [x̄ − δ, x̄ + δ]. Pertanto T (y) appartiene a X.


Se y1 , y2 sono due elementi di X, per il teorema di Lagrange e per la (5.14)
abbiamo
|y1 (x) − y2 (x)|
|T (y1 )(x) − T (y2 )(x)| = |F (x, y1 (x)) − F (x, y2 (x))| ≤
2
ovvero
1
kT (y1 ) − T (y2 )kC 0 ≤
ky1 − y2 kC 0 .
2
Pertanto T è una contrazione. Per il teorema 2.5.1 esiste un unico elemento g
in X che è punto unito di T . Tale funzione g verifica ovviamente la (5.8) e, per
la (5.17), anche la (5.12).
Per la regolarità di g si procede come nella prima dimostrazione; basta solo
osservare che la condizione (5.10) è conseguenza della (5.14).
Se in luogo della (5.7) si ha

(5.18) fx (x̄, ȳ) 6= 0

l’enunciato del teorema va opportunamente modificato nel senso che in tal caso
è possibile rendere esplicita la variabile x in funzione di y. È possibile cioè
5.1. IL TEOREMA DI DINI 97

determinare in modo univoco una funzione h, definita in un intorno di ȳ e a


valori in un intorno di x̄, tale che f (h(y), y) = 0. Si ha inoltre
fy (h(y), y)
(5.19) h0 (y) = − .
fx (h(y), y)
In definitiva, se il gradiente di f non è nullo in tutti i punti per cui sussista
la (5.1) il luogo geometrico delle soluzioni di (5.1) è una curva che localmente
si presenta come grafico di una funzione di una delle due variabili. La retta
tangente a tale curva in un suo punto (x̄, ȳ), per la (5.9) ovvero per la (5.19), si
scrive nel modo seguente
(5.20) fx (x̄, ȳ)(x − x̄) + fy (x̄, ȳ)(y − ȳ) = 0 .
Osservazione 5.1.1. - Nel teorema di Dini si puó anche fare a meno dell’ipotesi
che f sia di classe C 1 . Basta infatti supporre che f sia continua e che esista
una sola delle due derivate parziali; questa deve essere continua e per essa deve
valere la (5.7) o la (5.18). Ovviamente in tal caso si recupera solo la continuità
della funzione implicitamente definita dalla (5.1) non la sua differenziabilità.
Osservazione 5.1.2. - La (5.20) comporta che il gradiente di f in (x̄, ȳ) è
perpendicolare in tale punto alla curva di equazione (5.1). Tale proprietà vale
anche per gli insiemi di livello
Lc = {(x, y) ∈ A : f (x, y) = c}
almeno in quei punti di Lc che non siano critici per f . Anche in questi casi
l’espressione della retta tangente è data dalla (5.20).
Osservazione 5.1.3. - La scrittura
(5.21) X(x, y)dx + Y (x, y)dy = 0
con Y 6= 0 è un modo alternativo di presentare l’equazione differenziale
X(x, y)
(5.22) y0 = − .
Y (x, y)
Se la forma differenziale a primo membro in (5.21) è esatta e se f è una sua
primitiva allora quanto detto nell’oss. 5.1.2 consente di concludere che l’insieme
delle soluzioni di (5.22) è dato dalla famiglia di curve di equazione f (x, y) = c
con c costante. Tali soluzioni sono quindi espresse in forma implicita. Poiché
fy = Y 6= 0, per il teorema di Dini, queste si possono scrivere anche come
funzioni della x.
Con semplici modifiche il teorema di Dini può essere esteso al caso di equazioni
in N variabili con N > 2. Se x0 = (x1 , · · · , xN −1 ) sia x = (x0 , xN ) il generico
punto di RN . Consideriamo l’equazione
(5.23) f (x1 , · · · , xN ) = f (x0 , xN ) = 0
con f di classe C 1 (A) dove A è un aperto di RN .
98 CAPITOLO 5. FUNZIONI IMPLICITE

Teorema 5.1.2. - Sia (x̄0 , x̄N ) un punto di A, soluzione dell’equazione (5.23),


tale che

(5.24) fxN (x̄0 , x̄N ) 6= 0 .

Si possono determinare δ, k tali che, per ogni x0 con kx0 − x̄0 k∞ ≤ δ, esiste un
unico valore g(x0 ) ∈]x̄N − k, x̄N + k[ per cui

f (x0 , g(x0 )) = 0 .

La funzione g dicesi implicitamente definita dall’equazione (5.23). Essa è di


classe C 1 (A) e si ha

∂g 0 fx (x0 , g(x0 ))
(5.25) (x ) = − i 0 i = 1, · · · , N − 1 .
∂xi fxN (x , g(x0 ))

Dimostrazione. Per quanto riguarda la determinazione della funzione g si pro-


cede come nella dimostrazione del teorema 5.1.1; basta sostituire x, x̄ rispettiva-
mente con x0 , x̄0 e la distanza in R con la distanza di RN −1 indotta dalla norma
(2.10). Diamo quindi solo un cenno della dimostrazione della (5.25).
Se ∆x0 = (∆x1 , · · · , ∆xN −1 ) poniamo ∆g = g(x0 + ∆x0 ) − g(x0 ). Per il teorema
di Lagrange si ha

0 = f (x0 + ∆x0 , g(x0 + ∆x0 )) − f (x0 , g(x0 ))

= f (x0 + ∆x0 , g(x0 ) + ∆g) − f (x0 , g(x0 ))

N
X −1
= fxi (x0 + θ∆x0 , g(x0 ) + θ∆g)∆xi + fxN (x0 + θ∆x0 , g(x0 ) + θ∆g)∆g
i=1

con θ ∈]0, 1[. Con le stesse argomentazioni usate nella dimostrazione del teorema
5.1.1 si ottiene la continuità di g. Dalla precedente identità, se si incrementa
solo la i-ma variabile, si ha anche

∆g fx (x0 + θ∆xi ei , g(x0 ) + θ∆g)


=− i 0
∆xi fxN (x + θ∆xi ei , g(x0 ) + θ∆g)

dove ei indica il versore dell’asse delle xi . Facendo tendere ∆xi a zero e tenendo
conto della continuità di g otteniamo la (5.25).

Se la (5.24) viene sostituita dalla condizione fxj (x̄) 6= 0, con j 6= N , allora


la variabile xj si esprime in funzione delle altre. Quindi se ogni punto che
risolve l’equazione (5.23) non è critico per f il luogo geometrico delle soluzioni
di (5.23) si rappresenta localmente come grafico di una funzione di (N − 1)
variabili. Un tale luogo geometrico costituisce un primo esempio di superficie
ovvero di varietà. Il piano tangente a tale grafico nel punto (x̄i ), in base alle
5.2. SISTEMI DI FUNZIONI IMPLICITE 99

(5.25) o alle analoghe formule relative al caso in cui una qualsiasi altra variabile
si esprima in funzione delle altre, ha equazione

N
X
(5.26) fxi (x̄1 , · · · , x̄N )(xi − x̄i ) = 0 .
i=1

La (5.26) comporta che il gradiente di f risulta perpendicolare alla varietà. Tale


proprietà vale ovviamente anche per un generico insieme di livello della funzione.

5.2 Sistemi di funzioni implicite


La versione piú generale del teorema di Dini si riferisce ai sistemi di equazioni.
Il caso piú semplice è costituito dal sistema di due equazioni in tre incognite

 f (x, y, z) = 0
(5.27)
g(x, y, z) = 0

con f, g funzioni di classe C 1 . Poniamoci il problema di descrivere il luogo


delle soluzioni di (5.27) in un intorno di un punto (x̄, ȳ, z̄) che sia soluzione del
sistema. Prendiamo in considerazione ciascuna delle due equazioni. L’insieme
delle relative soluzioni si può interpretare, sempre che siano soddisfatte le ipotesi
del teorema 5.1.2, come una superficie. Il luogo dei punti che risolvono il sistema
(5.27) è quindi l’intersezione di due superfici. Ci si può chiedere sotto quali
condizioni tale intersezione sia una curva. Se si prende a modello il caso di un
sistema di due equazioni lineari ciò si verifica se la matrice dei coefficienti ha
rango due. In tal caso infatti le soluzioni del sistema vanno a collocarsi su una
retta di R3 . Per il sistema (5.27) il ruolo che riveste nel caso lineare la matrice
dei coefficienti è assunto dalla matrice jacobiana
 
fx fy fz
(5.28)  .
gx gy gz

Se il rango di tale matrice nel punto (x̄, ȳ, z̄) è due i piani tangenti in tale punto
alle due superfici sono incidenti. Si può allora dimostrare che l’intersezione di
tali due superfici è una curva regolare dello spazio.
Quanto sopra brevemente delineato può essere formulato nel modo seguente.
Consideriamo il sistema di N equazioni in N + M incognite

 f1 (x1 , · · · , xM , y1 , · · · , yN ) = 0




(5.29) ···




fN (x1 , · · · , xM , y1 , · · · , yN ) = 0 .

100 CAPITOLO 5. FUNZIONI IMPLICITE

Supponiamo che le funzioni fi siano di classe C 1 (A) con A aperto di RN +M e


che esista un punto

(5.30) (x̄1 , · · · , x̄M , ȳ1 , · · · , ȳN ) ∈ A

tale che


 f1 (x̄1 , · · · , x̄M , ȳ1 , · · · , ȳN ) = 0



(5.31) ···




fN (x̄1 , · · · , x̄M , ȳ1 , · · · , ȳN ) = 0 .

Assumiamo inoltre che nel punto (5.30) sia soddisfatta la condizione relativa al
determinante di fy

∂f1 ∂f1

···



∂y1 ∂yN


(5.32) ··· ··· · · · 6= 0 .




∂fN ∂fN
···
∂y1 ∂yN

Il determinate a primo membro nella (5.32) è noto come jacobiano delle N


funzioni fi relativo alle N variabili yj e si denota con il simbolo

∂(f1 , · · · , fN )
.
∂(y1 , · · · , yN )

Ci chiediamo se sia possibile, almeno in un intorno del punto (5.30), rendere


esplicite le N variabili yi in funzione delle M variabili xj . Con ciò intendiamo
dire che cerchiamo N funzioni gi , definite in un intorno di (x̄1 , · · · , x̄M ) e a
valori in un intorno di (ȳ1 , · · · , ȳN ) tali che


 ȳ1 = g1 (x̄1 , · · · , x̄M )



···




ȳN = gN (x̄1 , · · · , x̄M )

e


 f1 (x1 , · · · , xM , g1 (x1 , · · · , xM ), · · · , gN (x1 , · · · , xM )) = 0



(5.33) ···




fN (x1 , · · · , xM , g1 (x1 , · · · , xM ), · · · , gN (x1 , · · · , xM )) = 0 .

5.2. SISTEMI DI FUNZIONI IMPLICITE 101

In tal modo il sistema (5.29) risulta localmente equivalente al sistema




 y1 = g1 (x1 , · · · , xM )



···




yN = gN (x1 , · · · , xM ) .

Indichiamo con x e y, rispettivamente, i vettori di RM e RN ; la (5.29) si scrive


allora piú sinteticamente nel modo seguente

(5.34) f (x, y) = 0 .

Se indichiamo con il simbolo (x̄, ȳ) il punto (5.30) la (5.31) diventa

(5.35) f (x̄, ȳ) = 0 .

Sussiste il seguente risultato che estende ai sistemi il teorema di Dini.


Teorema 5.2.1. - Sia f di classe C 1 . Se in (x̄, ȳ) è soddisfatta la (5.35) e la
condizione (5.32) allora è possibile determinare due valori positivi δ, k tali che,
per ogni x con kx− x̄k∞ ≤ δ, esiste un unico vettore g(x), con kg(x)− ȳk∞ < k
per cui

(5.36) f (x, g(x)) = 0 .

La funzione g dicesi implicitamente definita dalla (5.34); essa è di classe C 1 e


si ha

(5.37) gx (x) = −fy−1 (x, g(x))fx (x, g(x))

dove fy−1 è l’inversa di fy e il termine a secondo membro è il prodotto righe per


colonne tra matrici.
Dimostrazione. Seguiamo lo schema della seconda dimostrazione del teorema
5.1.1. Per la (5.35) è possibile fissare un intorno di (x̄, ȳ) in cui il determinante
di fy è non nullo; la matrice fy è allora dotata di inversa. Posto

F(x, y) = y − ȳ − fy−1 (x̄, ȳ)f (x, y)

l’equazione (5.34) assume la forma

y = ȳ + F(x, y) .

Poiché
Fy (x, y) = IN − fy−1 (x̄, ȳ)fy (x, y) ,
dove IN è l’identità di RN , risulta Fy (x̄, ȳ) = 0N dove 0N è la matrice nulla di
RN . Si può allora determinare k in modo tale che
1
(5.38) kFy (x, y)k∞ <
2
102 CAPITOLO 5. FUNZIONI IMPLICITE

se kx − x̄k∞ ≤ k e ky − ȳk∞ ≤ k. Per semplicità abbiamo denotato con lo


stesso simbolo k · k∞ la norma (2.10) in uno qualsiasi dei due spazi euclidei RN
e RM . Poiché F(x̄, ȳ) è nullo possiamo inoltre determinare un valore δ ≤ k tale
che risulti
k
(5.39) kF(x, ȳ)k∞ <
2
se kx − x̄k∞ ≤ δ. Posto Iδ = {x : kx − x̄k∞ ≤ δ} sia X il sottoinsieme dello
spazio C 0 (Iδ ) delle funzioni y continua in Iδ a valori in RN tali che

(5.40) ky(x) − ȳk∞ ≤ k

ovvero
ky − ȳkC 0 (Iδ ) = max ky(x) − ȳk∞ ≤ k .
x∈Iδ

L’insieme X è l’intorno sferico chiuso di ȳ di raggio k. Esso, in quanto chiuso,


è completo. Consideriamo la trasformazione

T : y ∈ X −→ T (y) = ȳ + F(x, y) .

Verifichiamo dapprima che T muta X in sé. Si ha

kT (y)(x) − ȳk∞ ≤ kF(x, y(x)) − F(x, ȳ)k∞ + kF(x, ȳ)k∞ .

Per il teorema di Lagrange risulta


N
X ∂Fi
Fi (x, y(x)) − Fi (x, ȳ) = (x, c(x))(yj (x) − ȳj )
j=1
∂yj

con c(x) appartenente al segmento di estremi y(x) e ȳ. Tenendo presente la


(2.24) si ha
 
N
X ∂Fi
|Fi (x, y(x)) − Fi (x, ȳ)| ≤  ∂yj (x, c(x)) ky(x) − ȳk∞

j=1

≤ kFy (x, c(x))k∞ ky(x) − ȳk∞ ,

dove kFy (x, c(x))k∞ denota la norma (2.23) di Fy (x, c(x)) in L(RN , RN ). Per
le (5.38) e (5.40) abbiamo quindi
k
kF(x, y(x)) − F(x, ȳ)k∞ < .
2
In definitiva, ricordando la (5.39), si ha

(5.41) kT (y) − ȳkC 0 < k .

Quindi T (y) appartiene a X. In modo analogo si dimostra che T è una con-


trazione. Esiste allora un solo punto unito g per T per il quale vale la (5.36).
5.3. TRASFORMAZIONI LOCALMENTE INVERTIBILI 103

Dalla (5.41) discende anche che kg(x) − ȳk∞ < k. Per quanto riguarda la
differenziabilità di g si procede nel modo seguente. Fissato l’indice i poniamo

∆g = g(x + ∆xi ei ) − g(x)

dove ei come al solito denota l’i-mo vettore della base canonica di RN . Si ha


allora per il teorema di Lagrange

0 = fj (x + ∆xi ei , g(x + ∆xi ei )) − fj (x, g(x))

N
∂fj X ∂fj
= fj (x + ∆xi ei , g(x) + ∆g) − fj (x, g(x)) = ∆xi + ∆gh
∂xi ∂yh
h=1

dove ∆gh rappresentano le componenti di ∆g; le derivate parziali delle funzioni


fj sono calcolate nel punto

(5.42) (x + θ∆xi ei , g(x) + θ∆g)

con θ ∈]0, 1[. Dividendo per ∆xi si ottiene che i rapporti incrementali

∆gh
h = 1, · · · , N
∆xi

sono soluzioni di un sistema lineare la cui matrice dei coefficienti è fy calcolata


nel punto (5.42) il cui determinante è non nullo per quanto detto all’inizio della
dimostrazione. Risolvendo tale sistema e facendo tendere ∆xi a zero abbiamo
che ciascuna funzione gj è derivabile rispetto a xi . Inoltre le derivate parziali
delle funzioni gj rispetto a xi risolvono il seguente sistema lineare

∂f1 ∂g1 ∂f1 ∂gN ∂f1




 + ··· + =−



 ∂y1 ∂xi ∂yN ∂xi ∂xi


··· .





 ∂fN ∂g1 ∂fN ∂gN ∂fN

 + ··· + =− .
∂y1 ∂xi ∂yN ∂xi ∂xi

Si ottengono quindi le varie espressioni delle derivate delle funzioni gj sintetiz-


zate nella (5.37).

5.3 Trasformazioni localmente invertibili


Il teorema 5.2.1 costituisce il punto di partenza per giungere ad un risultato
invertibilità per una trasformazione di RN in sé

(5.43) y −→ x = f (y)
104 CAPITOLO 5. FUNZIONI IMPLICITE

di classe C 1 (A) con A aperto RN . La (5.43) può essere anche scritta sotto forma
di sistema di N equazioni in 2N incognite


 x1 = f1 (y1 , · · · , yN )



(5.44) ···




xN = fN (y1 , · · · , yN )

dove le funzioni fi sono le componenti della funzione vettoriale f . L’obiettivo


è esprimere le variabili yi in funzione delle xj in modo da riscrivere il sistema
(5.44) nella forma


 y1 = g1 (x1 , · · · , xN )



(5.45) ···




yN = gN (x1 , · · · , xN ) .

Sussiste il seguente risultato di invertibilità locale.


Teorema 5.3.1. - Se ȳ ∈ A e

∂(f1 , · · · , fN )
(5.46) (ȳ) 6= 0
∂(y1 , · · · , yN )

allora, è possibile determinare un intorno Iȳ di ȳ e un intorno di Ix̄ di x̄ = f (ȳ)


tali che la restrizione di f a Iȳ è una trasformazione biunivoca tra Iȳ e Ix̄ .
L’inversa g, rappresentata dal sistema (5.45), è di classe C 1 e si ha

(5.47) gx (x) = f −1
y (g(x)) .

Dimostrazione. Applichiamo il teorema 5.2.1 all’equazione

F(x, y) = f (y) − x = 0 .

È possibile determinare δ, k tali che, per ogni x appartenente all’intorno aperto


di x̄
X = {x : kx − x̄k∞ < δ}
esiste un unico vettore g(x) appartenente all’intorno aperto di ȳ

Y = {y : ky − ȳk∞ < k}

tale che F(x, g(x)) = 0, ovvero, f (g(x)) = x. Ció assicura che x è un punto in-
terno di f (A); pertanto, se la condizione (5.46) è soddisfatta ovunque in A allora
f (A) è aperto. In generale non è detto che g(X) ricopra tutto Y . Per ovviare a
tale inconveniente è necessario considerare la restrizione di f all’antiimmagine
di X tramite f che è un insieme aperto per il teorema 2.4.1.
5.4. ESTREMI VINCOLATI 105

La (5.37) diventa

gx (x) = −F−1
y (x, g(x))Fx (x, g(x)) .

Poiché Fy = fy e Fx = −IN abbiamo la (5.47).


Si ha infine
∂(g1 , · · · , gN ) 1
(5.48) (x) =
∂(x1 , · · · , xN ) ∂(f1 , · · · , fN )
(g(x))
∂(y1 , · · · , yN )

come ovvia conseguenza della (5.47).

La condizione (5.46) da sola non basta per poter concludere che la trasfor-
mazione è globalmente invertibile. Un esempio in tal senso è costituito dalla
trasformazione a coordinate polari del piano

 x = ρ cos θ
(5.49)
y = ρ sin θ .

Tale trasformazione muta R+ × R in tutto il piano privato dell’origine. Il suo


jacobiano vale ρ ed è quindi diverso da zero. La trasformazione non è però
globalmente invertibile.
Osservazione 5.3.1. - Se alla (5.46) si aggiunge l’ipotesi che f (A) è semplice-
mente connesso allora si può dimostrare che f è invertibile.

5.4 Estremi vincolati


Usiamo quanto illustrato nei precedenti paragrafi per risolvere un problema di
estremo vincolato. Sia A un aperto di RN . Consideriamo una funzione f di
classe C 1 (A). Se g1 ∈ C 1 (A) sia S l’insieme delle soluzioni dell’equazione

(5.50) g1 (x) = 0 .

Supponiamo che i punti di S non siano critici nel senso che risulti soddisfatta
la condizione

(5.51) ∇g1 (x) 6= 0

per ogni x ∈ S. Si dice che il punto x̄ di S è un estremo di f con il vincolo


(5.50) se esiste un intorno sferico I di x̄ tale

(5.52) f (x̄) ≤ f (x) ovvero f (x̄) ≥ f (x)

per ogni x ∈ I ∩ S. Nel primo caso x̄ viene indicato come punto di minimo
locale vincolato, nel secondo come punto di massimo locale vincolato.
106 CAPITOLO 5. FUNZIONI IMPLICITE

Teorema 5.4.1. - Sia x̄ ∈ S un punto di estremo vincolato per f . Allora esiste


un numero reale λ, noto come moltiplicatore di Lagrange, tale che
(5.53) ∇f (x̄) = λ∇g1 (x̄) .
Dimostrazione. Consideriamo una curva
(5.54) x(t) = (x1 (t), · · · , xN (t)) ,
con x(0) = x̄, il cui sostegno sia contenuto in S. Si ha allora g1 (x(t)) = 0 da
cui
(5.55) < ∇g1 (x̄), x0 (0) >= 0 .
La funzione
ϕ(t) = f (x1 (t), · · · , xN (t))
presenta ovviamente nello zero un estremo relativo. Si ha pertanto
N
X
(5.56) ϕ0 (0) = fxi (x̄)x0i (0) = 0 .
i=1

Al variare della curva (5.54) i vettori x0 (0) descrivono il piano tangente in x̄ alla
superficie S. Dalle (5.55) e (5.56) discende che i gradienti di f e g1 calcolati in
x̄ sono paralleli. Poiché per la (5.51) il gradiente di g1 è non nullo è possibile
determinare una costante λ tale che sussista la (5.53).
La (5.53) si traduce in N equazioni che, insieme alla (5.23), costituiscono un
sistema di N + 1 equazioni nelle N + 1 incognite x1 , · · · , xN , λ.
Riprendiamo il problema della determinazione degli estremi di una funzione f
continua in un compatto K e derivabile nei punti interni a K.
In tal caso, oltre ad individuare i punti critici interni a K, è necessario determi-
nare gli estremi assoluti della restrizione di f alla frontiera di K. Se si assume
che
∂K = {x ∈ RN : g(x) = 0}
con g di classe C 1 e priva di punti critici su ∂K, allora il tutto è ricondotto ad
un problema di estremo vincolato.
A titolo esemplificativo consideriamo la funzione (2.67) e determiniamo
√ i suoi
estremi assoluti nel cerchio con centro nell’origine e raggio 2.
Ricordiamo che abbiamo già individuato i due unici punti punti critici (1/3, 0)
e (1, 0). Bisogna ora individuare gli estremi della funzione sulla frontiera del
cerchio cioè sull’insieme dei punti che soddisfano il vincolo
(5.57) g(x, y) = x2 + y 2 − 2 = 0 .
La (5.53) si traduce nel seguente sistema

 (x − 1)(3x − 1) + 2λx = 0
(5.58)
−2y + 2λy = 0 .

5.4. ESTREMI VINCOLATI 107

Si vede subito
√ che le √ sole soluzioni del sistema (5.58) e dell’equazione (5.57) sono
i punti (− 2, 0), ( 2, 0). Calcolati i valori della funzione in tali punti √
e nei due
punti critici si√ottiene che il massimo della funzione è realizzato in ( 2, 0), il
minimo in (− 2, 0).
Come ulteriore applicazione del teorema 5.4.1 consideriamo il caso della forma
quadratica
N
X
Q(x1 , · · · , xN ) = aij xi xj
i,j=1

associata alla matrice simmetrica A = (aij ); si ha ovviamente


Q(x) =< A x, x > .
Sia µ un autovalore di A e v il corrispondente autovettore. Si ha A v = µv da
cui
µ =< A v, v >= Q(v) .
Risulta pertanto
m = min Q(x) ≤ µ ≤ max Q(x) = M
S1 S1

dove
S1 = {x : kxk = 1} .
Gli autovalori di A sono da ricercare tra i valori assunti dalla forma quadratica
Q sulla sfera unitaria S1 . Verifichiamo che i valori estremi m, M sono essi stessi
autovalori di A. Assegniamo il vincolo
(5.59) g1 (x) = kxk2 − 1 = 0 .
Essendo
N
∂Q X
=2 aij xj ,
∂xi j=1

si ha ∇Q = 2 A x. Risulta inoltre ∇g1 = 2x. Se x̄ è un punto di estremo per Q


su S1 per la (5.53) si ha A x̄ = λx̄ e quindi
Q(x̄) =< A x̄, x̄ >= λkx̄k2 = λ .
Si può pertanto concludere che i punti in cui Q assume il valore minimo e il
valore massimo su S1 sono da ricercare tra gli autovettori di A e che i rispettivi
autovalori rappresentano i valori estremi. Come conseguenza di ciò si ottiene
che m e M sono rispettivamente il piú piccolo e il piú grande degli autovalori
di A. Si spiega in tal modo, tra l’altro, la (2.69).
Vediamo come impostare un problema di estremo vincolato quando, invece
dell’unico vincolo (5.23), si assegnino M vincoli

 g1 (x1 , · · · , xN ) = 0




(5.60) ···




gM (x1 , · · · , xN ) = 0

108 CAPITOLO 5. FUNZIONI IMPLICITE

con M < N . Le funzioni gi siano di classe C 1 (A) con A aperto di RN . Indichia-


mo con V la varietà costituita dai punti di RN soluzioni del sistema (5.60). Se
f è una funzione di classe C 1 (A) sia x̄ ∈ V un punto di estremo locale vincolato
di f un punto cioè tale che sussista ancora una delle due relazioni (5.52) con x
appartenente all’intersezione di V con un intorno sferico di x̄.
Teorema 5.4.2. - Supponiamo che in x̄ ∈ V , punto di estremo vincolato per
f , la matrice a N righe e M colonne
 
∂gi
∂xj

abbia rango M . Esistono allora M numeri λ1 , · · · , λM , noti come moltiplicatori


di Lagrange, tali che, in x̄, risulti
 M
 ∂f X ∂gi
= λi


∂x ∂x



 1 i=1 1




(5.61) ···




 M
∂f ∂gi

 X
= λi .



 ∂x
N i=1
∂xN

Dimostrazione. Per verificare la (5.61) si puó procedere nel modo seguente. Si


fissi una curva su V passante per x̄. Il gradiente di f in x̄ è allora perpendi-
colare al vettore tangente a tale curva. Al variare della curva i relativi vettori
tangenti descrivono uno spazio vettoriale lineare di dimensione N − M il cui
spazio ortogonale, di dimensione M , è generato dal sistema di M vettori linear-
mente indipendenti (∇gi (x̄)). Quindi il vettore ∇f (x̄) appartiene a tale spazio;
si ottiene in tal modo la (5.61).

Abbiamo prima caratterizzato il piú grande autovalore di A, che indichiamo µ1 ,


come il valore massimo assunto da Q su S1 ; sia v1 il corrispondente autovettore.
Introduciamo il seguente ulteriore vincolo

g2 (x) =< v1 , x >= 0 ;

si ha ovviamente ∇g1 = v1 . Oltre al vincolo (5.59) imponiamo il vincolo

(5.62) g2 (x) = 0 .

Se denotiamo con v2 un punto di massimo di Q con i vincoli (5.59) e (5.62) la


(5.61) diventa
∇Q(v2 ) = 2λ2 v2 + 2λ1 v1
ovvero
A v2 = λ2 v2 + λ1 v1 .
5.4. ESTREMI VINCOLATI 109

Essendo v2 perpendicolare a v1 si ha < A v2 , v1 >= λ1 ; inoltre per la simmetria


di A risulta

< A v2 , v1 >=< v2 , A v1 >= µ1 < v2 , v1 >= 0

da cui λ1 = 0. Si ha pertanto

A v2 = λ2 v2 .

Abbiamo ottenuto in tal modo un ulteriore autovalore, che indichiamo con µ2 ,


cui corrisponde l’autovettore v2 . Essendo

µ2 =< A v2 , v2 >= Q(v2 )

tale autovalore si caratterizza come il valore massimo di Q con i vincoli (5.62).


Se ora aggiungiamo al sistema (5.62) l’ulteriore vincolo

g3 (x) =< v2 , x >= 0

e ricerchiamo il massimo di Q con i tre vincoli indicati si ottiene un ulte-


riore autovalore e il corrispondente autovettore. Cosı́ procedendo si possono
caratterizzare tutti gli altri autovalori di A.
110 CAPITOLO 5. FUNZIONI IMPLICITE
Capitolo 6

Misura e integrazione

6.1 Misura secondo Peano-Jordan


Poniamoci il problema di misurare un sottoinsieme di RN , di associare cioè ad
esso un valore numerico che, per esempio, si riduca all’area nel caso di figure
geometriche del piano come i poligoni. Il modo tradizionale di procedere consiste
nell’attribuire una misura a oggetti elementari per poi passare ad insiemi di
struttura via via piú complessa.

Definizione 6.1.1. - Assegnate due N −ple (ai ), (bi ) con ai ≤ bi l’insieme

(6.1) I = {(xi ) : ai ≤ xi ≤ bi } = [a1 , b1 ] × · · · × [aN , bN ]

si chiama intervallo chiuso di RN . Per misura di I si intende la quantità

N
Y
m(I) = (bi − ai ) .
i=1

Nella definizione di misura di un intervallo non è essenziale che esso sia chiuso.
Si puó infatti far riferimento anche a intervalli aperti, semiaperti a destra o a
sinistra, a quei casi cioè in cui ciascun intervallo chiuso [ai , bi ] è rimpiazzato
dall’intervallo, con gli stessi estremi, aperto, semiaperto a sinistra o a destra.

Definizione 6.1.2. - Sia

(6.2) D = {I1 , · · · , In }

una famiglia di intervalli a due a due privi di punti interni comuni. Si chiama
pluriintervallo l’insieme
[n
P = Ik .
k=1

111
112 CAPITOLO 6. MISURA E INTEGRAZIONE

La famiglia (6.2) prende il nome di decomposizione del pluriintervallo. Il dia-


metro di D è il massimo tra i diametri degli intervalli Ik . Per misura di P si
intende la quantità
n
X
(6.3) m(P ) = m(Ik ) .
k=1

Nella definizione (6.3) non è necessario precisare la natura dei singoli intervalli
che possono essere, anche solo in parte, chiusi, aperti o semiaperti. Ci si puó
peró restringere alla famiglia degli intervalli semiaperti a sinistra o a destra
perché l’insieme dei corrispondenti plurintervalli è chiuso rispetto alle opera-
zioni di unione, intersezione e differenza (cfr. [2]). La definizione (6.3) non si
presta ad equivoci: si può far vedere infatti che il valore (6.3) non cambia se
il pluriintervallo viene in altro modo decomposto in unione di intervalli a due
a due privi di punti interni comuni. Bisogna prima verificare, ma per brevità
omettiamo la dimostrazione, che
X
(6.4) m(I) = m(Ik )
k

se l’intervallo I è unione di un numero finito intervalli Ik a due a due privi di


punti interni comuni. Sia ora P un pluriintervallo e siano {I 0 k }, {I 00 h } due sue
decomposizioni. Applicando due volte la (6.4) abbiamo
!
X X X
0 0 00
m(I k ) = m(I k ∩ I h )
k k h
!
X X X
= m(I 0 k ∩ I 00 h ) = m(I 00 h ) .
h k h

Riportiamo il seguente risultato.


Proposizione 6.1.1. - L’unione, l’intersezione e la differenza di due plurin-
tervalli P1 , P2 è un pluriintervallo. Si ha inoltre
(a) P1 ⊆ P2 ⇒ m(P1 ) ≤ m(P2 )
(b) m(P1 ∪ P2 ) = m(P1 ) + m(P2 ) − m(P1 ∩ P2 )
(c) P1 ⊆ P2 =⇒ m(P2 \P1 ) = m(P2 ) − m(P1 ) .
Sia X un sottoinsieme limitato di RN . Consideriamo l’insieme dei plurintervalli
in esso contenuti. L’estremo superiore dell’insieme numerico delle misure di tali
plurintervalli prende il nome di misura interna di X e si denota con mi (X).
Consideriamo l’insieme dei plurintervalli contenenti X. Esso risulta non vuoto
per l’ipotesi di limitatezza su X. L’estremo inferiore dell’insieme delle misure di
tali plurintervalli prende il nome di misura esterna di X e si denota con me (X).
Ovviamente risulta mi (X) ≤ me (X).
6.1. MISURA SECONDO PEANO-JORDAN 113

Definizione 6.1.3. - Se mi (X) = me (X) l’insieme X dicesi misurabile secondo


Peano-Jordan. La sua misura è

m(X) = mi (X) = me (X) .

Il simbolo M denota la famiglia dei sottoinsiemi misurabili di RN .


Teorema 6.1.1. - Se X1 , X2 ∈ M allora X1 ∪ X2 , X1 ∩ X2 , X1 \X2 sono
misurabili. Si ha inoltre

(i) X1 ⊆ X2 ⇒ m(X1 ) ≤ m(X2 ) (monotonia)


(ii) m(X1 ∪ X2 ) ≤ m(X1 ) + m(X2 ) (subadditività)
(iii) X1 ∩ X2 = ∅ =⇒ m(X1 ∪ X2 ) = m(X1 ) + m(X2 ) (additività)
(iv) X2 ⊂ X1 =⇒ m(X1 \X2 ) = m(X1 ) − m(X2 ) .

Dimostrazione. Per note proprietà delle operazioni insiemistiche basta verificare


che l’unione di due insiemi misurabili e la differenza di due insiemi misurabili,
l’uno incluso nell’altro, sono misurabili.
Fissato ε > 0 determiniamo i plurintervalli P1 , P10 , P2 , P20 , con P1 ⊆ X1 ⊆ P10 e
P2 ⊆ X2 ⊆ P20 , tali che

(6.5) m(P10 ) − m(P1 ) < ε , m(P20 ) − m(P2 ) < ε .

Si ha P1 ∪ P2 ⊆ X1 ∪ X2 ⊆ P10 ∪ P20 . Facendo uso della proprietà (b) della


proposizione 6.1.1, della (6.5) e del fatto che P1 ∩ P2 ⊆ P10 ∩ P20 abbiamo

m(P10 ∪ P20 ) − m(P1 ∪ P2 ) = m(P10 ) + m(P20 ) − m(P10 ∩ P20 )

− m(P1 ) − m(P2 ) + m(P1 ∩ P2 ) < 2ε

da cui la misurabilità di X1 ∪ X2 .
Sia X2 ⊆ X1 . Proviamo che X1 \X2 è misurabile. Per la proprietà (c) della
proposizione 6.1.1 e per la (6.5) si ha

m(P10 \P2 ) = m(P10 ) − m(P2 ) < m(X1 ) − m(X2 ) + 2ε .

Ricordando la proprietà (b) della proposizione 6.1.1 e la (6.5), abbiamo

m(P1 \P20 ) = m(P1 ) − m(P1 ∩ P20 ) ≥ m(X1 ) − ε − m(P20 )

≥ m(X1 ) − m(X2 ) − 2ε .

Poiché P1 \P20 ⊆ X1 \X2 ⊆ P10 \P2 si ha la misurabilità di X1 \X2 . Dalle prece-


denti disuguaglianze discende anche che

m(X1 ) − m(X2 ) − 2ε ≤ m(X1 \X2 ) ≤ m(X1 ) − m(X2 ) + 2ε


114 CAPITOLO 6. MISURA E INTEGRAZIONE

da cui la (iv).
Dimostriamo ora la proprietà (iii). Per la proprietà (b) della proposizione 6.1.1
e per la (6.5) abbiamo

m(P10 ∪ P20 ) ≤ m(P10 ) + m(P20 ) ≤ m(X1 ) + m(X2 ) + 2ε

e, per la proprietà (c) della proposizione 6.1.1 e per la (6.5),

m(P1 ∪ P2 ) = m(P1 ) + m(P2 ) ≥ m(X1 ) + m(X2 ) − 2ε .

Poiché
m(P1 ∪ P2 ) ≤ m(X1 ∪ X2 ) ≤ m(P10 ∪ P20 )
risulta
|m(X1 ∪ X2 ) − (m(X1 ) + m(X2 ))| ≤ 2ε .
Dall’arbitrarietà di ε discende l’asserto.
Se X ha misura nulla allora, per ogni ε > 0, è possibile determinare un pluriin-
tervallo Pε contenente X tale che

(6.6) m(Pε ) < ε .

Ovviamente X è privo di punti interni. Inoltre ogni suo sottoinsieme è misura-


bile ed ha misura nulla.
Sussiste la seguente utile caratterizzazione degli insiemi misurabili.
Teorema 6.1.2. - Un insieme X è misurabile secondo Peano-Jordan se e
soltanto se la sua frontiera ha misura nulla.
Dimostrazione. Se X è privo di punti interni esso ha misura nulla. Fissato ε
consideriamo un pluriintervallo Pε , unione di intervalli chiusi, per cui valga la
(6.6). Essendo tale pluriintervallo chiuso deve essere anche ∂X ⊂ Pε ; si ha
quindi m(∂X) = 0.
Se X ha punti interni, fissato ε, è possibile determinare due plurintervalli
Pε 0 , Pε 00 , il primo unione di intervalli aperti, il secondo di intervalli chiusi, tali
che Pε 0 ⊆ X ⊆ Pε 00 e m(Pε 00 ) − m(Pε 0 ) < ε. Ovviamente la frontiera di X è
contenuta nel pluriintervallo Pε 00 \Pε 0 . Si ha

m(Pε 00 \Pε 0 ) = m(Pε 00 ) − m(Pε 0 ) < ε

e quindi m(∂X) = 0.
Sia I un intervallo contenente X e sia Pε un pluriintervallo contenente la fron-
tiera di X tale che m(Pε ) < ε. Di una decomposizione di I\Pε selezioniamo
gli intervalli contenuti in X: otteniamo in tal modo un pluriintervallo P . Si ha
P ⊆ X ⊆ P ∪ Pε e

m(P ∪ Pε ) − m(P ) = m(Pε ) < ε .

Abbiamo in tal modo dimostrato che X è misurabile.


6.1. MISURA SECONDO PEANO-JORDAN 115

Liberiamoci ora dell’ipotesi di limitatezza su X.


Definizione 6.1.4. - Un insieme X non limitato dicesi misurabile se è misu-
rabile la sua intersezione con una qualsiasi sfera Sr con centro nell’origine e
raggio r. Per misura di X si intende la quantità

(6.7) m(X) = lim m(X ∩ Sr ) ∈ [0, +∞] .


r→∞

Esempio 6.1.1. - Sia D l’insieme dei numeri razionali di [0, 1]. Poiché D
è denso in [0, 1] la sua frontiera coincide con l’intervallo [0, 1]. Il teorema
6.1.2 comporta che esso non è misurabile. Altrettanto puó dirsi del sottoinsieme
dell’intervallo [0, 1]N costituito dai punti a coordinate razionali.
L’insieme dell’es. 6.1.1 è numerabile; quindi l’unione di una successione di
insiemi misurabili non è detto che sia misurabile. Tale inconveniente può essere
eliminato se si generalizza opportunamente la definizione di misura. Nel caso di
insiemi di misura nulla essa viene formulata nel modo seguente
Definizione 6.1.5. - Un sottoinsieme X di RN ha misura nulla secondo Lebe-
sgue se, comunquie si fissi ε, è possibile ricoprire X con una successione {In }
di intervalli aperti tale che

X
(6.8) m(In ) < ε .
n=1

Osservazione 6.1.1. - Se un insieme X ha misura nulla secondo Lebesgue ed


è compatto allora esso ha ha anche misura nulla secondo Peano-Jordan. In-
fatti se {In } è un ricoprimento di X per il quale valga la (6.8), da esso per il
teorema 2.2.5 è possibile estrarne uno finito. L’unione di tali intervalli è un
pluriintervallo la cui misura, sempre in base alla (6.8), è minore di ε.
Per completezza costruiamo un esempio di insieme non misurabile secondo
Peano-Jordan la cui misura secondo Lebesgue è positiva. Seguiamo una proce-
dura simile a quella utilizzata per definire l’insieme di Cantor (cfr. [4] e, anche,
[3]). Fissato a ∈]0, 1[ si cancellino i punti dell’intervallo aperto, di centro 21 e
di ampiezza a2 , i cui estremi sono 12 − a4 e 12 + a4 . Dai due intervalli rimanenti
cancelliamo gli intervalli aperti, centrati nei rispettivi punti medi, di ampiezza
a
23 . Restano quattro intervalli chiusi: da questi, con la stessa procedura, cancel-
liamo gli intervalli aperti di ampiezza 2a5 . Dopo aver ripetuto il procedimento n
volte la misura del pluriintervallo unione degli intervalli via via eliminati è
 
1 1 1
a + + ··· n .
2 22 2

Per una proprietà della misura secondo Lebesgue l’unione di tali plurintervalli
è misurabile e la sua misura è a. Il complementare in [0, 1] di tale insieme ha
quindi misura 1 − a. Tale insieme è privo di punti interni e la sua frontiera non
ha misura nulla. Quindi esso non può essere misurabile secondo Peano-Jordan.
116 CAPITOLO 6. MISURA E INTEGRAZIONE

6.2 Integrale secondo Riemann


Occupiamoci di estendere la nozione di integrale secondo Riemann a funzioni
limitate definite in insiemi di RN misurabili secondo Peano-Jordan. Sia f li-
mitata in X ∈ M e sia I un intervallo contenente X. Prolunghiamo f ad I
ponendola uguale a zero in I\X. Con tale procedura è possibile limitarsi a
funzioni definite in intervalli.
Sia D = {I1 , · · · , In } una decomposizione di I; gli insiemi Ik sono intervalli a
due a due privi di punti interni in comune. Per diametro di D si intende il piú
grande tra i diametri degli intervalli Ik . Di facile verifica è il seguente risultato.
Proposizione 6.2.1. - Comunque si fissi δ > 0 esiste una decomposizione di I
il cui diametro è minore di δ.
Consideriamo le quantità
n
X n
X
(6.9) s(f, D) = m(Ik ) inf f , S(f, D) = m(Ik ) sup f .
Ik Ik
k=1 k=1

Nel seguito, se non c’è possibilità di equivoco, nei simboli che denotano le somme
(6.9) non verrà indicata la funzione cui tali somme si riferiscono.
Proposizione 6.2.2. - Gli insiemi numerici {s(D)} e {S(D)} sono separati.

Dimostrazione. Sia I l’intervallo (6.1) e siano D1 , D2 due sue decomposizioni.


Indichiamo con D12 la decomposizione di I i cui elementi si ottengono nel modo
seguente. Suddividiamo ciascun intervallo [ak , bk ] prendendo in considerazione
le k-me coordinate dei vertici di tutti gli intervalli che compaiono sia in D1 che in
(k)
D2 . Ogni [ak , bk ] viene in tal modo decomposto in intervalli Ih . Gli intervalli
(1) (N )
Ih1 × · · · × IhN

generano la decomposizione D12 di I. Si vede facilmente che ogni intervallo di


D12 è contenuto in un intervallo di D1 e di D2 . Ció comporta che

(6.10) s(D1 ) ≤ s(D12 ) ≤ S(D12 ) ≤ S(D2 )

da cui l’asserto.

Definizione 6.2.1. - Se

(6.11) sup s(D) = inf S(D) ,


D D

la funzione f dicesi integrabile secondo Riemann in I. La quantità (6.11) si


denota con il simbolo
Z
(6.12) f (x) dx
I
6.2. INTEGRALE SECONDO RIEMANN 117

o con il simbolo
Z
(6.13) f (x1 , · · · , xN ) dx1 · · · dxN
I

e prende il nome di integrale secondo Riemann di f esteso ad I.


Definizione 6.2.2. - Una funzione f definita in un insieme misurabile X dicesi
quasi ovunque continua in X secondo Peano-Jordan se esiste un sottoinsieme
X0 di X di misura nulla secondo Peano-Jordan tale che f è continua in ogni
punto di X\X0 . Se invece X0 ha misura nulla secondo Lebesgue si dice che f è
quasi ovunque continua secondo Lebesgue.
Dimostriamo il seguente criterio di integrabilità.
Teorema 6.2.1. - Se f è una funzione limitata e quasi ovunque continua
secondo Peano-Jordan in X ∈ M allora essa è integrabile secondo Riemann.
Dimostrazione. Consideriamo prima il caso in cui X è un intervallo I. Sia M
tale che
(6.14) |f (x)| ≤ M , ∀x ∈ I
e sia I0 l’insieme dei punti in cui f non è continua. Poiché I0 ha misura nulla,
fissato ε, è possibile determinare un pluriintervallo aperto Pε contenente I0 tale
che
(6.15) m(Pε ) < ε .
La funzione f risulta pertanto continua nel compatto Iε = I\Pε . Per il teorema
2.3.2 esiste un δ tale che, per ogni x, y ∈ Iε la cui distanza non superi δ, risulti
(6.16) |f (x) − f (y)| < ε .
Consideriamo una decomposizione {Ih } del pluriintervallo Iε con diametro mino-
re di δ e aggiungiamo ad essa gli intervalli {Ik0 } di una qualsiasi decomposizione
di Pε ; indichiamo con D la decomposizione di X in tal modo ottenuta.
Per le (6.14), (6.15) e (6.16) si ha
  X !
X
0
S(D) − s(D) = m(Ih ) sup f − inf f + m(Ik ) sup f − inf
0
f
Ih Ih Ik0 Ik
h k
X
≤ ε m(I) + 2M m(Ik0 ) < ε(m(I) + 2M )
k

da cui l’asserto.
Se f è definita in X ∈ M e I è un intervallo contenente X il prolungamento
di f a tutto I è quasi ovunque continuo in X secondo Peano-Jordan in quanto
gli eventuali ulteriori punti di discontinuità vanno a collocarsi sulla frontiera
di X che ha misura nulla per il teorema 6.1.2. L’integrale di f su X è allora
l’integrale del prolungamento esteso ad I. È evidente che tale valore non dipende
dal particolare intervallo I scelto. Per denotare tale integrale si usa una delle
notazioni (6.12), (6.13) con X al posto di I.
118 CAPITOLO 6. MISURA E INTEGRAZIONE

Il criterio appena dimostrato dà solo una condizione sufficiente per l’integrabilità
di una funzione limitata. Riportiamo per completezza, senza però fornirne la
dimostrazione, la seguente caratterizzazione delle funzioni integrabili secondo
Riemann.
Teorema 6.2.2. (Criterio di Vitali-Lebesgue) - Una funzione limitata in
un insieme limitato e misurabile secondo Peano-Jordan è integrabile secondo
Riemann se e solo se essa è quasi ovunque continua secondo Lebesgue.
Osservazione 6.2.1. - Alla somma della serie descritta nell’esempio 1.3.5
è possibile applicare il teorema 6.2.2. Si osservi che l’integrabilità secondo
Riemann di tale funzione è anche conseguenza del teorema 1.4.2.

6.3 Proprietà dell’integrale


Se X ⊂ RN la funzione caratteristica di X è

 1 se x ∈ X
χX (x) =
0 se x 6∈ X .

Teorema 6.3.1. - L’insieme X è misurabile secondo Peano-Jordan se e solo


se la sua funzione caratteristica χX è integrabile secondo Riemann.
Dimostrazione. Sia X misurabile e sia I un intervallo contenente X. I punti di
discontinuità della funzione caratteristica di X sono i punti della frontiera. Il
risultato è conseguenza dei teoremi 6.1.2 e 6.2.1.
Sia χX integrabile. Se I è un intervallo contenente X e D una sua decomposi-
zione, allora s(D) è la misura di un pluriintervallo contenuto in X mentre S(D)
è la misura di un pluriintervallo contenente X. L’integrabilità diχX comporta
la misurabilità di X.
Proposizione 6.3.1. - Valgono le seguenti proprietà:
• proprietà distributiva: se f, g sono integrabili in X ∈ M e α, β ∈ R la
funzione αf + βg è integrabile e si ha
Z Z Z
[αf (x) + βg(x)] dx = α f (x) dx + β g(x) dx ;
X X X

• proprietà additiva: se X1 , X2 ∈ M sono due insiemi privi di punti interni


comuni si ha
Z Z Z
(6.17) f (x) dx = f (x) dx + f (x) dx ;
X1 ∪X2 X1 X2

• proprietà di monotonia: se f, g sono integrabili in X ∈ M e f ≤ g allora


Z Z
f (x) dx ≤ g(x) dx ;
X X
6.3. PROPRIETÀ DELL’INTEGRALE 119

• proprietà di media: e f è integrabile in X ∈ M si ha


Z
m(X) inf f ≤ f (x) dx ≤ m(X) sup f ;
X X X

se X è connesso per poligonali e f è continua esiste un punto c ∈ X tale


che Z
f (x) dx = f (c) m(X) ;
X

• se f è integrabile in X ∈ M tale è anche la funzione |f | e si ha


Z Z

f (x) dx ≤ |f (x)| dx .

X X

Chiamiamo cilindroide di base X ∈ M relativo alla funzione f , integrabile e


non negativa, l’insieme di RN +1

 (x1 , · · · , xN ) ∈ X

0 ≤ xN +1 ≤ f (x1 , · · · , xN ) −

In analogia con quanto già osservato in relazione agli integrali di funzioni di una
variabile (cfr. per esempio [1]) si può dimostrare che la misura di tale insieme è
l’integrale di f esteso a X. Ció comporta che il grafico di una funzione continua
ha misura nulla. Come conseguenza si ha il seguente utile risultato.
Proposizione 6.3.2. - Se la frontiera di X, sottoinsieme limitato di RN , è
localmente grafico di una funzione di N − 1 variabili allora X è misurabile.
Dimostrazione. Basta osservare che la frontiera di X, in quanto compatta, è ri-
copribile con un numero finito di aperti tali che l’intersezione di ∂X con ciascuno
di essi è grafico di una funzione di N − 1 variabili.
Esempio 6.3.1. - Se A è un sottoinsieme del piano le coordinate del suo
baricentro sono
Z Z
x dxdy y dxdy
(6.18) x̄A = A , ȳA = A .
m(A) m(A)
Le formule (6.18) si riferiscono al caso di lamine omogenee cioè di densità
costante. Nel caso in cui la densità è descritta da una funzione ρ continua le
formule relative al baricentro si scrivono nel modo seguente
Z Z
x ρ(x, y) dxdy y ρ(x, y) dxdy
x̄A = ZA , ȳA = ZA .
ρ(x, y) dxdy ρ(x, y) dxdy
A A

Analoghe formule sussistono nel caso tridimensionale.


120 CAPITOLO 6. MISURA E INTEGRAZIONE

6.4 Formule di riduzione


L’obiettivo di questo paragrafo e dei successivi è quello di esibire metodi per
il calcolo di integrali di funzioni di piú variabili. Il primo di questi consiste
nel ricondurre tale calcolo a quello di piú integrali possibilmente di funzioni
dipendenti da una sola variabile.
Teorema 6.4.1. - Siano X e Y intervalli rispettivamente di RN e RM e sia f
integrabile in X × Y . Se per ogni x ∈ X la funzione

y ∈ Y −→ f (x, y)

è integrabile in Y allora la funzione


Z
g(x) = f (x, y) dy
Y

è integrabile in X e si ha
Z Z Z Z
(6.19) f (x, y) dx dy = g(x) dx = dx f (x, y) dy .
X×Y X X Y

Se per ogni y ∈ Y la funzione

x ∈ X −→ f (x, y)

è integrabile in X allora la funzione


Z
h(y) = f (x, y) dx
X

è integrabile in Y e si ha
Z Z Z Z
(6.20) f (x, y) dx dy = h(y) dy = dy f (x, y) dx .
X×Y Y Y X

Dimostrazione. Siano {X1 , · · · , Xh } e {Y1 , · · · , Yh } decomposizioni rispettiva-


mente di X e Y con le proprietà indicate nella dimostrazione della prop. 6.2.2
relative alla decomposizione D12 . Ovviamente {Xi × Yj } è una decomposizione
di X × Y ; per quanto osservato sempre nella dimostrazione della prop. 6.2.2 tali
decomposizioni possono essere prese in considerazione per testare la proprietà
di integrabilità di una funzione. Se x ∈ Xi si ha
Z h
X h
X
g(x) = f (x, y) dy ≤ m(Yj ) sup f (x, y) ≤ m(Yj ) sup f
X j=1 y∈Yj j=1 Xi ×Yj

da cui
h
X
sup g ≤ m(Yj ) sup f
Xi j=1 Xi ×Yj
6.4. FORMULE DI RIDUZIONE 121

e quindi, poiché m(Xi × Yj ) = m(Xi )m(Yj ),


h
X h
X
(6.21) m(Xi ) sup g ≤ m(Xi × Yj ) sup f .
i=1 Xi i,j=1 Xi ×Yj

In modo analogo si prova che


h
X h
X
(6.22) m(Xi × Yj ) inf f ≤ m(Xi ) inf g .
Xi ×Yj Xi
i,j=1 i=1

Poiché f è integrabile è possibile scegliere le decomposizione {Xi } e {Yj } in


modo tale che risulti
h
!
X
(6.23) m(Xi × Yj ) sup f − inf f < ε .
Xi ×Yj Xi ×Yj
i,j=1

Per le (6.21) e (6.22) abbiamo anche


Xh  
m(Xi ) sup g − inf g < ε .
Xi Xi
i=1

La funzione g è allora integrabile. Si ha inoltre per le (6.21), (6.22) e (6.23)


Z Z


f (x, y) dxdy − g(x) dx < ε
X×Y X

da cui la (6.19). In modo analogo si dimostra la (6.20).


Come prima applicazione del teorema 6.4.1 consideriamo il caso di un integrale
doppio esteso al dominio normale

 a≤x≤b
(6.24)
α(x) ≤ y ≤ β(x) ,

con α e β funzioni continue in [a, b], ovvero



 c≤x≤d
(6.25)
γ(x) ≤ y ≤ δ(x)

con γ e δ funzioni continue in [c, d].


Teorema 6.4.2. - Se D è l’insieme (6.24) e f è continua in D allora
Z Z b Z β(x)
(6.26) f (x, y) dxdy = dx f (x, y) dy ;
D a α(x)

se invece D è l’insieme (6.25) si ha


Z Z d Z δ(y)
(6.27) f (x, y) dxdy = dy f (x, y) dx .
D c γ(y)
122 CAPITOLO 6. MISURA E INTEGRAZIONE

Dimostrazione. Il dominio (6.24) è contenuto nell’intervallo I = [a, b] × [m, M ]


dove m denota il minimo di α e M il massimo di β. Prolunghiamo al solito modo
f in tutto I. Sono soddisfatte le ipotesi del teorema 6.4.1. La (6.26) è allora
una banale conseguenza della (6.19). In modo analogo si ottiene la (6.27).

Le (6.26) e (6.27) sono note come formule di riduzione. La loro utilità poggia
sul fatto che il calcolo di un integrale doppio viene ricondotto al calcolo di due
integrali di funzioni di una sola variabile. È ovvio inoltre che l’efficacia delle
suddette formule non va confinata ai soli domini normali. Tenendo conto della
proprietà additiva (6.17) esse possono essere utilizzate per tutti quegli insiemi
che siano unione di un numero finito di domini normali a due a due privi di
punti interni comuni. Per esempio, un insieme la cui frontiera è costituita da
una o piú curve generalmente regolari semplici e chiuse può essere decomposto
in tal modo. Un tale insieme prende il nome di dominio regolare.
Se f è il prodotto di una funzione della sola x e di una della sola y,
! Z !
Z Z b d
(6.28) g(x)h(y)dxdy = g(x)dx h(y)dy .
[a,b]×[c,d] a c

Consideriamo il dominio normale rispetto sia all’asse delle x sia all’asse delle y

D = {(x, y) : 0 ≤ x ≤ a, 0 ≤ y ≤ x} = {(x, y) : 0 ≤ y ≤ a, y ≤ x ≤ a} .

Applicando la (6.26) e la (6.27) si ottiene la seguente formula


Z Z a Z x Z a Z a
f (x, y)dxdy = dx f (x, y)dy = dy f (x, y)dx .
D 0 0 0 y

Alle formule di riduzione (6.26) e (6.27) relative agli integrali doppi corri-
spondono analoghe formule per gli integrali di funzioni di piú di due variabili.
Consideriamo il caso in cui il dominio D ⊂ RN +1 sia

 (x1 , · · · , xN −1 ) ∈ T

α(x1 , · · · , xN −1 ) ≤ xN ≤ β(x1 , · · · , xN −1 )

con α, β continue in T , insieme misurabile di RN −1 . Se x0 = (x1 , · · · , xN −1 ) si


ha
Z Z Z β(x0 )
f (x1 , · · · , xN ) dx1 · · · dxN = dx0 f (x0 ) dxN
D T α(x0 )

con f continua in D. Quindi il calcolo dell’integrale è ricondotto, nell’ordine,


al calcolo di un integrale semplice e di un integrale di una funzione di (N − 1)
variabili. A quest’ultimo integrale si possono ovviamente applicare ulteriori
formule di riduzione se la forma del dominio di integrazione T lo consente.
Concludiamo richiamando una interessante formula di riduzione che per sempli-
cità riportiamo limitatamente al caso degli integrali tripli.
6.5. FORMULE DI GAUSS-GREEN NEL PIANO 123

Sia T un sottoinsieme limitato e misurabile di R3 . Supponiamo che per ogni


z ∈ [a, b] l’insieme
Tz = {(x, y) ∈ R2 : (x, y, z) ∈ T }
sia misurabile e non vuoto; gli insiemi Tz sono in sostanza le proiezioni sul piano
z = 0 delle sezioni di T con i piani perpendicolari all’asse delle z. Sia f continua
in T . Per il teorema 6.4.1 si ha
Z Z b Z
(6.29) f (x, y, z) dxdydz = dz f (x, y, z) dxdy .
T a Tz

Nel caso particolare in cui f ≡ 1 dalla (6.29) si ottiene la formula


Z b
(6.30) m(T ) = m(Tz ) dz .
a

La (6.30) è anche nota come principio di Cavalieri; secondo tale principio due
solidi, le cui sezioni con i piani paralleli ad un piano assegnato sono di eguale
estensione, hanno anche lo stesso volume.
Esempio 6.4.1. - Sia T il solido che si ottiene facendo ruotare il rettangoloide
di f , funzione non negativa continua in [a, b], attorno all’asse delle x di un
angolo pari a 2π. Dalla (6.30) si ottiene
Z b
m(T ) = π [f (x)]2 dx .
a

La versione N -dimensionale della (6.29) è


Z Z b Z
(6.31) f (x0 , xN ) dx0 dxN = dxN f (x0 , xN ) dx0 .
T a TxN

6.5 Formule di Gauss-Green nel piano


Proponiamo ora alcune formule che consentono ridurre il calcolo di un integrale
doppio esteso a un dominio a quello dell’integrale di una forma differenziale
esteso alla frontiera del dominio opportunamente orientata.
Definizione 6.5.1. - Sia D un dominio regolare. Se (x, y) è un punto regola-
re di ∂D indichiamo con ni il versore normale a ∂D in (x, y) orientato verso
l’interno di D. L’orientamento positivo di ∂D è quello cui corrisponde un ver-
sore tangente τ tale che la coppia (τ , ni ) risulti congruente alla coppia (i, j) dei
versori degli assi delle x e delle y. La frontiera di D in tal modo orientata si
indica con il simbolo +∂D.
La frontiera di un dominio regolare consta di una o piú curve generalmente rego-
lari semplici e chiuse. Di queste una costituisce il bordo esterno dell’insieme, le
altre, se presenti, vanno a costituire il cosiddetto bordo interno. l’orientamento
descritto nella def. 6.5.1 implica che la prima è orientata in senso antiorario le
altre in senso orario. Valgono le seguenti regole di integrazione note anche come
formule di Gauss-Green.
124 CAPITOLO 6. MISURA E INTEGRAZIONE

Teorema 6.5.1. - Siano X, Y funzioni di classe C 1 in un aperto A del piano


e sia D un dominio regolare contenuto in A. Si ha allora
Z Z
(6.32) Xx dxdy = X dy
D +∂D
Z Z
(6.33) Yy dxdy = − Y dx .
D +∂D

Dimostrazione. Come primo passo dimostriamo la (6.32) nel caso in cui D sia
il dominio normale (6.25) con γ, δ funzioni di classe C 1 . Per la (6.27) e per il
teorema fondamentale del calcolo integrale si ha
Z Z d Z δ(y) Z d
Xx dxdy = dy Xx (x, y) dx = [X(δ(y), y) − X(γ(y), y)] dy .
D c γ(y) c

Per concludere basta verificare che l’ultimo termine è l’integrale della forma
differenziale a secondo membro nella (6.32).
Sia ora D il dominio (6.24) con α, β funzioni di classe C 1 . Introduciamo la
funzione Z x Z y
F (x, y) = X(t, α(t))α0 (t) dt + X(x, t) dt .
a α(x)

Per il teorema fondamentale del calcolo integrale e per la (2.48) si ha


Z y
Fx (x, y) = X(x, α(x))α0 (x) + Xx (x, t) dt − X(x, α(x))α0 (x)
α(x)

e quindi
Z y
(6.34) Fx (x, y) = Xx (x, t) dt .
α(x)

Sempre per il teorema fondamentale del calcolo integrale risulta inoltre

(6.35) Fy (x, y) = X(x, y) .

Si ha ovviamente Z
Fx dx + Fy dy = 0 .
+∂D

D’altra parte, per le (6.34) e (6.35), abbiamo


Z Z a Z β(x) Z
Fx dx + Fy dy = dx Xx (x, t) dt + X dy .
+∂D b α(x) +∂D

Ricordando la formula di riduzione (6.26) si ottiene la (6.32).


Sia D un dominio regolare. Come già accennato in precedenza esso è unione di
un numero finito di domini normali a due a due privi di punti interni comuni.
In tal caso la (6.32) discende dalla proprietà additiva degli integrali curvilinei
6.6. CAMBIAMENTI DI VARIABILI 125

una volta che si osservi che i tratti delle frontiere dei domini normali interni a
D non danno contributi perché ciascun tratto viene percorso due volte nei due
sensi.
Infine la (6.33) si ottiene dalla (6.32) scambiando il ruolo delle variabili x e y.
Tale operazione inverte l’orientamento della frontiera di D; ció spiega il cambio
di segno.

Osservazione 6.5.1. - Una semplice conseguenza delle formula di Gauss-Green


è la seguente espressione per la misura di un dominio regolare
Z
m(D) = xdy − ydx .
+∂D

Concludiamo tale paragrafo dimostrando il seguente criterio di integrabilità per


le forme piane chiuse. A tal fine è necessario richiamare il seguente risultato
noto come teorema di Jordan (cfr. [5]).

Teorema 6.5.2. - Una curva piana generalmente regolare, semplice e chiusa è


la frontiera di un insieme limitato e semplicemente connesso.

Teorema 6.5.3. - Sia


ω = X dx + Y dy
una forma chiusa in A aperto di R2 la cui frontiera sia una curva generalmente
regolare semplice e chiusa. Allora ω è esatta.

Dimostrazione. Una qualsiasi una curva generalmente regolare semplice e chiusa


γ con sostegno in A è la frontiera di un insieme D, semplicemente connesso,
contenuto in A per il teorema 6.5.2. Utilizzando le (6.32) e l’ipotesi di chiusura
di ω si ha Z Z
Xdx + Y dy = [−Xy + Yx ] dxdy = 0 .
+γ D

Per il teorema 4.2.2 la forma differenziale è esatta.

6.6 Cambiamenti di variabili


Consideriamo la trasformazione in RN in sé

y ∈ A ⊂ RN −→ x = ϕ(y) = (ϕi (y)) ∈ RN

di classe C 1 . Supponiamo che il suo jacobiano soddisfi la condizione

∂(ϕ1 , · · · , ϕN )
(6.36) (y) 6= 0 , ∀y ∈ A .
∂(y1 , · · · , yN )

La (6.36) (cfr. teorema 5.3.1) assicura che ϕ(A) è un aperto e che ϕ è localmente
invertibile.
126 CAPITOLO 6. MISURA E INTEGRAZIONE

Definizione 6.6.1. - Si dice che ϕ è un diffeomorfismo tra A e B = ϕ(A) se


ϕ è iniettiva e soddisfa la (6.36).
Sia ψ la trasformazione inversa di ϕ. Ovviamente anche ψ è un diffeomorfismo
e il determinante della sua matrice jacobiana è il reciproco del determinante
(6.36) per la (5.48). Supponiamo per semplicità che ψ sia di classe C 2 e che
fissi l’origine.
Se L0 è la matrice jacobiana di ψ i cui termini sono calcolati nell’origine, per la
formula di Taylor si ha

(6.37) ψ(x) = L0 (x) + O(δ 2 ) ,

per ogni x appartenente a Iδ = {x : kxk∞ ≤ δ} con δ sufficientemente piccolo;


O(δ 2 ) denota una funzione di x la cui norma tende a zero come δ 2 . Si può allora
utilizzare la (6.37) per valutare di quanto ψ(Iδ ) si discosti dal parallelepipedo
L0 (Iδ ). Esso infatti risulta incapsulato tra i due parallelepipedi che si ottengono
dilatando o contraendo opportunamente L0 (Iδ ): c’è infatti da aggiungere o
eliminare i punti che distano dal bordo di L0 (Iδ ) al piú di una quantità che va a
zero come δ 2 . La differenza tra tali due parallelepipedi ha una misura che può
essere stimata in termini di un infinitesimo dell’ordine di δ N +1 . Per il teorema
2.6.2 si ha
m(Iδ )
m(L0 (Iδ )) =
|J0 |
dove J0 è il determinante jacobiano (6.36) calcolato nell’origine. Si ha allora

m(Iδ )
(6.38) m(ψ(Iδ )) = + 0(δ N +1 )
|J0 |

dove 0(δ N +1 ) indica una quantità che tende a zero come δ N +1 .


Consideriamo ora un sottoinsieme X di B misurabile secondo Peano-Jordan.
Possiamo sempre approssimare dall’interno X con una successione di plurinter-
(n)
valli {Pn } ciascuno dei quali è unione di cubi Ik tutti con spigoli di lunghezza
2n−1 . Poiché il numero di tali cubi è dell’ordine di nN per la (6.38) si ha
(n) (n)
X X
m(Ik ) = |Jk |m(ψ(Ik )) + 0(n−1 )
k k

(n)
dove Jk è il determinante jacobiano (6.36) calcolato nel centro di Ik . Facendo
divergere n si ottiene allora la seguente formula

∂(ϕ1 , · · · , ϕN )
Z
(6.39) m(X) = dy1 · · · dyN .
ψ(X) ∂(y1 , · · · , yN )

Il procedimento delineato per la determinazione della formula (6.39) può essere


adattato al caso dell’integrale di una funzione continua in X. Sussiste infatti il
seguente risultato che dà una formula relativa al calcolo di un integrale quando
si effettua un cambio delle variabili di integrazione.
6.6. CAMBIAMENTI DI VARIABILI 127

Teorema 6.6.1. - Sia ϕ un diffeomorfismo tra A e B e ψ il diffeomorfismo


inverso. Se X è un sottoinsieme compatto e misurabile di B e f è una funzione
continua in X si ha

∂(ϕ1 , · · · , ϕN )
Z Z
(6.40) f (x) dx = f (ϕ(y)) dy
X Y ∂(y1 , · · · , yN )

dove Y = ψ(X). In particolare, se f ≡ 1, si ha



∂(ϕ1 , · · · , ϕN )
Z
m(X) = dy .
ψ(X) ∂(y1 , · · · , yN )

Osservazione 6.6.1. - Sia Sr (ȳ) l’intorno sferico di ȳ di raggio r. Dalla (6.39)


si ha
∂(ϕ1 , · · · , ϕN )
lim m(ϕ(Sr (y0 )) .

∂(y1 , · · · , yN ) (ȳ) = r→0

m(Sr (y0 ))
Il valore assoluto del determinante jacobiano di ϕ è un indice di come la defor-
mazione ϕ influenza a livello locale il modo di misurare gli insiemi.
La formula (6.40) nel caso della trasformazione a coordinate polari (5.49) diventa
Z Z
(6.41) f (x, y) dxdy = f (ρ cos θ, ρ sin θ)ρ dρdθ
X Y

dove X è il trasformato di Y .
Per quanto riguarda gli integrali tripli riportiamo due formule relative ad altret-
tanti classici cambiamenti di variabili.
Consideriamo dapprima il caso delle coordinate cilindriche.
p
Se (x, y, z) non appartiene all’asse z poniamo ρ = x2 + y 2 . Sia inoltre θ
l’angolo formato dal piano coordinato y = 0 e dal piano passante per l’asse
delle z e per il punto (x, y, z). Allora il passaggio a coordinate cilindriche viene
descritto dal seguente sistema


 x = ρ cos θ



(6.42) y = ρ sin θ




z = z.

Il determinante jacobiano della trasformazione (6.42) è ρ quindi la (6.40) diventa


Z Z
(6.43) f (x, y, z) dxdydz = f (ρ cos θ, ρ sin θ, z)ρ dρdθdz
X Y

dove X è l’immagine di Y mediante la trasformazione (6.42).


Il passaggio a coordinate cilindriche si rivela utile quando l’integrale è esteso ad
un insieme X che si ottiene dalla rotazione attorno all’asse delle z di un insieme
A contenuto nel piano coordinato y = 0 e a intersezione vuota con l’asse di
128 CAPITOLO 6. MISURA E INTEGRAZIONE

rotazione. L’insieme risulta essere l’immagine mediante la (6.42) dell’insieme Y


dei punti (ρ, θ, z) con (ρ, z) ∈ A e θ ∈ [0, 2π]. La (6.43) diventa
Z Z 2π Z
(6.44) f (x, y, z) dxdydz = dθ f (ρ cos θ, ρ sin θ, z)ρ dρdz .
X 0 A

Se f ≡ 1 da (6.44) e (6.18) si ha
Z
(6.45) Vol(X) = 2π ρ dρdz = 2π ρ̄A Area(A)
A

dove ρ̄A è la distanza dall’asse delle z del baricentro di A. Abbiamo in tal modo
dimostrato il seguente risultato.
Teorema 6.6.2. (Primo teorema di Guldino) - Il volume del solido che
si ottiene facendo ruotare una figura piana A intorno ad un asse complanare
e ad essa esterno è uguale al prodotto dell’area di A e della lunghezza della
circonferenza descritta dal baricentro della figura.
Esempio 6.6.1. - Il toro si ottiene facendo ruotare un cerchio di raggio r
attorno ad una retta complanare al cerchio e ad esso esterna. In base alla
(6.45) il volume di tale insieme è 2π 2 r2 a dove a è la distanza del centro del
cerchio dall’asse di rotazione.
Occupiamoci ora della trasformazione a coordinate polari in RN con N ≥ 3.
Queste si definiscono induttivamente.
Cominciamo dal caso N = 3. Posto
p
ρ = x2 + y 2 + z 2

sia  
x
u = arccos
ρ
la colatitudine; ovviamente u ∈]0, π[. L’asse delle x fa da asse di rotazione. Il
piano equatoriale ha quindi equazione x = 0: i suoi punti hanno colatitudine
π/2. Sia v ∈]0, 2 π[ il parametro angolare relativo al sistema di coordinate polari
del piano equatoriale; v è la cosiddetta longitudine. Il legame tra le coordinate
cartesiane e quelle polari è descritto dal sistema


 x = ρ cos u



y = ρ sin u cos v




z = ρ sin u sin v .

Lo jacobiano di tale trasformazione è ρ2 sin u. Pertanto, se Sr è la sfera di R3


con centro nell’origine e raggio r, l’integrale esteso a Sr diventa
Z 2π Z π Z r
dv sin u du f (ρ cos u, ρ sin u cos v, ρ sin u sin v) ρ2 dρ .
0 0 0
6.7. SOMMABILITÀ 129

In particolare, se f ≡ 1, si ottiene il valore della misura della sfera di R3 di


raggio unitario.
In generale sia v
uN
uX
ρ = kxk = t x2 i
i=1
e  
x1
θ1 = arccos ∈]0, π[ .
ρ
Siano (θ2 , · · · , θN −1 ) le componenti angolari delle coordinate polari del punto
del piano equatoriale: θN −1 varia in ]0, 2π[, tutti gli altri parametri angolari
in ]0, π[. Il legame tra le coordinate cartesiane e tali coordinate polari è allora
descritto dal seguente sistema


 x1 = ρ cos θ1




x2 = ρ sin θ1 cos θ2







(6.46) ···




xN −1 = ρ sin θ1 sin θ2 · · · sin θN −2 cos θN −1








xN = ρ sin θ1 sin θ2 · · · sin θN −2 sin θN −1 .

Il determinante jacobiano di tale trasformazione è


N −2 2
(6.47) ρN −1 (sin θ1 ) · · · (sin θN −3 ) sin θN −2 .

6.7 Sommabilità
La nozione di integrale secondo Riemann può estendersi, pur con qualche cau-
tela, al caso di funzioni non limitate e/o definite in insiemi non compatti. Come
nel caso delle funzioni di una variabile la procedura da seguire comporta in
primo luogo che si definisca l’integrale per funzioni non negative.
Sia f una funzione continua in un insieme misurabile X non necessariamente li-
mitato. Con il simbolo K denoteremo un generico sottoinsieme di X, misurabile
e limitato, tale che la restrizione di f a K sia limitata. Se
Z
sup f (x) dx < +∞
K K

si dice che f è sommabile in X; si pone allora


Z Z
(6.48) f (x) dx = sup f (x) dx .
X K K

Consideriamo una successione {Kn } di sottoinsiemi di X misurabili e compatti


invadente X, tale cioè che
130 CAPITOLO 6. MISURA E INTEGRAZIONE

(i) Kn ⊂ Kn+1

(ii) ∀K ∃n : K ⊆ Kn .

Essendo f ≥ 0 per la (i) si ha


Z Z
f (x) dx ≤ f (x) dx ;
Kn Kn+1

si può dimostrare che


Z Z
(6.49) f (x) dx = lim f (x) dx .
X n→∞ Kn

A titolo esemplificativo consideriamo la funzione


1
(6.50) f (x) =
kxkα

con α > N .
Consideriamo la restrizione di f al complementare della sfera Sr con centro
nell’origine e raggio r. Sia

Kn = {x : r ≤ kxk ≤ n} .

Passando a coordinate polari e tenendo conto dell’espressione (6.47) dello jaco-


biano di tale trasformazione si ha
Z
1 σN α−N
lim dx = r
n→∞ C kxkα α −N
n

dove σN è la misura della frontiera della sfera unitaria di RN . Si verifica


facilmente che f non è sommabile se α ≤ N .
In modo analogo si prova la sommabilità della funzione (6.50) in Sr se α < N .
Un risultato analogo vale funzioni
1
.
kx − x̄kα

Di facile dimostrazione è il seguente utile criterio di sommabilità.


Teorema 6.7.1. - Siano f, g due funzioni non negative, continue in un insieme
misurabile X e sia f ≤ g. Se g è sommabile tale è anche f . Se f non è
sommabile tale è anche g.
Da tale risultato e da quanto ottenuto in precedenza in relazione alla somma-
bilità della funzione (6.50) si ottiene che lo studio sulla sommabilità può spesso
essere ricondotto a quello dell’ordine di infinitesimo all’infinito ovvero dell’ordine
di infinito in un punto al finito.
6.8. ESERCIZI 131

Esempio 6.7.1. - Se Cr è il cerchio con centro nell’origine e raggio r per la


(6.41) si ha
Z Z r
−(x2 +y 2 ) 2 2
e dxdy = 2π e−ρ ρ dρ = π(1 − e−r ) .
Cr 0

Si ha allora, facendo divergere r,


Z
2 2
e−(x +y ) dxdy = π .
R2

Utilizzando la formula di riduzione (6.28) risulta anche


Z Z +∞ 2
2
+y 2 ) 2
e−(x dxdy = e−x dx .
R2 −∞

Si ha quindi Z +∞ √
2
e−x dx = π.
−∞

Liberiamoci ora dell’ipotesi di segno su f .


Definizione 6.7.1. - Si dice che f è sommabile se tale è |f | ovvero se sono
sommabili sia la parte positiva f + che quella negativa f − . Si pone allora
Z Z Z
f (x) dx = f + (x) dx − f − (x) dx .
X X X

6.8 Esercizi
1. Sia D = {(x, y) ∈ R2 : x, y ≥ 0, x2 + y 2 ≤ 1}. Calcolare l’integrale doppio
Z
2 2
x2 ex +y dxdy .
D


2. Sia D = {(x, y) : 1 ≤ x ≤ 2, 0 ≤ y ≤ x}. Calcolare l’integrale doppio
Z
dxdy
.
D (x + y)2

3. Sia D il rettangoloide di base [0, 1] relativo alla funzione x2 . Calcolare


l’integrale doppio Z
x3 exy dxdy .
D
132 CAPITOLO 6. MISURA E INTEGRAZIONE

4. Calcolare l’integrale doppio


Z
sin(x − y) dxdy
D

dove D è il triangolo {(x, y) ∈ R2 : 0 ≤ x ≤ π/2, y ≤ x}.



5. Sia D = {(x, y) ∈ R2 : 0 ≤ y ≤ π, 0 < x ≤ y 2 }. Calcolare l’integrale
doppio
sin y 2
Z
√ dxdy .
D x

6. Sia D il settore circolare che in coordinate polari si individua mediante le


limitazioni
0 ≤ ρ ≤ 1, 0 ≤ θ ≤ π/4 .
Calcolare l’integrale doppio
Z
x
dxdy .
D 1 + x2 + y 2

7. Sia D = {(x, y) ∈ R2 : x ≥ 0, y ≥ x, x2 + y 2 ≤ 1}. Calcolare l’integrale


doppio Z √
2 2
e x +y dxdy .
D

8. Sia D il cerchio con centro nell’origine e raggio 1. Calcolare l’integrale


doppio Z
cos(x2 + y 2 ) dxdy .
D

9. Sia D la parte di corona circolare delimitata dalle circonferenze, con cen-


tro nell’origine e raggi 1 e 2, contenuta nel primo quadrante. Calcolare
l’integrale doppio Z
(y + x2 ) dxdy .
D

10. Calcolare l’integrale doppio


Z
y log x dxdy
D

dove D = {(x, y) ∈ R2 : 1 ≤ x2 + y 2 ≤ 4, 0 ≤ y ≤ x}.


6.8. ESERCIZI 133

11. Sia D il semicerchio, contenuto nel semipiano delle y positive, con centro
nel punto (2, 0) e raggio 2. Calcolare l’integrale doppio
Z
(y + 2x − 4) dxdy .
D

12. Determinare le coordinate del baricentro dell’insieme

{(x, y) ∈ R2 : x ∈ [0, 1] , −x2 ≤ y ≤ x2 } .

13. Sia Q = [0, 1] × [0, 1] e sia f una funzione positiva di classe C 0 (Q).
Dimostrare che esiste un unico valore a ∈]0, 1[ tale che
Z a Z 1 Z
1
dx f (x, y) dy = f (x, y) dxdy .
0 0 2 Q

14. Sia Ω = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ f (x)}, con f ∈ C 1 (0, 1), tale


che f (1) = 1. Verificare che
Z
1
yf 0 (x)dxdy = .
Ω 6

15. Sia C la parte di corona circolare, delimitata dalle circonferenze con centro
nell’origine e raggi 1/2 ed 1 contenuta nel primo quadrante. Indicare la
distanza dall’origine del baricentro di C

16. Sia
t ∈ [a, b] → (x(t), y(t))
la rappresentazione parametrica di una curva generalmente regolare, sem-
plice e chiusa, frontiera di un insieme D del piano; supponiamo inoltre
che il verso di percorrenza indotto da tale rappresentazione parametrica
coincida con il verso positivo di ∂D. Facendo uso di una delle formu-
le di Gauss-Green, scrivere sotto forma di integrale doppio esteso a D il
seguente integrale
Z b
x2 (t)y 0 (t)dt .
a
134 CAPITOLO 6. MISURA E INTEGRAZIONE

17. Sia f una funzione con derivate prime continue in un dominio normale T
e nulla sulla frontiera di T ; dimostrare che
Z
∂f
dxdy = 0 .
T ∂x

18. Posto
xy 2
f=
x2 + y2
calcolare l’integrale doppio di f esteso al dominio

D = {(x, y) : x, y ≥ 0, 1 ≤ x2 + y 2 ≤ 4} .

Si determini una funzione F tale che Fx = f e si calcoli l’integrale facendo


uso della formula di Gauss-Green.

19. Sia T un insieme del piano a frontiera regolare e di misura pari a 1/2.
Facendo uso delle formule di Gauss-Green verificare che l’integrale
Z
x2 dy
+∂T

fornisce l’ascissa del baricentro di T .

20. Sia Q il quadrato di vertici (0, 0), (1, 0), (1, 1), (0, 1) e sia f una funzione
di classe C 2 (R2 ); dimostrare che

∂2f
Z
dxdy = f (1, 1) + f (0, 0) − f (1, 0) − f (0, 1) .
Q ∂x∂y

21. Si verifichi che la misura della sfera di R4 con centro nell’origine e raggio
r è 2−1 π 2 r4 .
Capitolo 7

Varietà

7.1 Definizioni
Abbiamo già introdotto il termine superficie come luogo degli zeri di una fun-
zione regolare definita in un aperto di R3 nell’ipotesi che i suoi punti non siano
critici. Proponiamo qui un approccio differente analogo a quello utilizzato per
definire le curve.
Se D è un aperto del piano sia

(7.1) (u, v) ∈ D −→ (x(u, v), y(u, v), z(u, v)) ∈ R3

un’applicazione iniettiva di classe C 1 (D). Supponiamo inoltre che la matrice


 
xu xv
 
 
(7.2)  yu yv  ,
 
 
zu zv

cioè il differenziale di (7.1), abbia rango due ovvero che in ciascun punto di D
risulti diverso da zero almeno uno dei minori

yu yv zu zv xu xv

(7.3) A = , B=

, C=

.

zu zv xu xv yu yv

Allora l’applicazione (7.1) prende il nome di superficie regolare; il codominio è


il suo sostegno. A quest’ultimo talvolta viene attribuito il termine superficie; in
tal caso l’applicazione (7.1) assume la veste di rappresentazione parametrica.
Come per le curve una superficie può avere differenti rappresentazioni para-
metriche. Per costruirne una differente consideriamo il diffeomorfismo (def.
6.6.1)

(7.4) (s, t) ∈ D1 −→ (u(s, t), v(s, t)) ∈ D .

135
136 CAPITOLO 7. VARIETÀ

La nuova rappresentazione parametrica assume allora la seguente forma

(7.5) (s, t) ∈ D1 −→ (x(u(s, t), v(s, t)), y(u(s, t), v(s, t)), z(u(s, t), v(s, t))) .

La matrice (7.2) relativa a tale nuova rappresentazione parametrica ha tre minori


A1 , B1 , C1 per i quali valgono le seguenti formule

∂(u, v) ∂(u, v) ∂(u, v)


(7.6) A1 = A , B1 = B , C1 = C .
∂(s, t) ∂(s, t) ∂(s, t)

Fissato un punto (ū, v̄) in D, sia (x̄, ȳ, z̄) il corrispondente punto della superficie.
Consideriamo la curva di equazioni parametriche

u −→ (x(u, v̄), y(u, v̄), z(u, v̄)) .

Il vettore tangente in (x̄, ȳ, z̄) alla curva è il vettore che occupa la prima co-
lonna della matrice (7.2). Una analoga interpretazione vale per l’altro vettore
colonna. L’ipotesi sul rango di (7.2) comporta allora che tali due vettori sono
linearmente indipendenti. Sia (u(t), v(t)) una curva contenuta in D passante
per (ū, v̄) all’istante t = t̄. Si verifica facilmente che

(7.7) (x(u(t), v(t)), y(u(t), v(t)), z(u(t), v(t))

rappresenta una curva regolare. Il vettore tangente in (x̄, ȳ, z̄) a tale curva è

(7.8) (x̄u u0 (t̄) + x̄v v 0 (t̄), ȳu u0 (t̄) + ȳv v 0 (t̄), z̄u u0 (t̄) + z̄v v 0 (t̄))

dove i simboli x̄u , x̄v etc. stanno ad indicare i valori in (ū, v̄) delle corrispondenti
funzioni. Il vettore (7.8) è combinazione lineare dei vettori colonna di (7.2) e
quindi giace sul piano la cui equazione è

x̄u x̄v x − x̄



ȳu ȳv y − ȳ = 0



z̄u z̄v z − z̄

ovvero

(7.9) Ā(x − x̄) + B̄(y − ȳ) + C̄(z − z̄) = 0

dove Ā, B̄, C̄ sono i valori assunti in (ū, v̄) dai tre minori (7.3). Esso è il piano
tangente alla superficie in (x̄, ȳ, z̄). Dalla (7.9) discende che, in ogni punto della
superficie, il vettore (A, B, C) è normale ai due vettori colonna di (7.2) e, quindi,
alla superficie. Esso non è altro che il prodotto vettoriale dei due vettori colonna
e il suo modulo, p
W (u, v) = A2 + B 2 + C 2 ,
è l’area del parallelogramma da questi generato.
7.1. DEFINIZIONI 137

Consideriamo ancora la curva (??). Se ds = H(t)dt, posto

E = x2u + yu2 + zu2 , F = xu xv + yu yv + zu zv , G = x2v + yv2 + zv2

si ha

(7.10) ds2 = E du2 + 2 F du dv + G dv 2 .

La (7.10) è nota come prima forma fondamentale della superficie. Si puó


facilmente verificare che
EG − F 2 = W 2 .
Teorema 7.1.1. - Una superficie regolare è localmente il grafico di una funzione
di due delle tre variabili x, y, z.
Dimostrazione. Supponiamo per semplicità che sia C̄ = C(ū, v̄) 6= 0. Per il
teorema 5.3.1 la trasformazione

(u, v) −→ (x(u, v), y(u, v))

è invertibile in un intorno di (ū, v̄). Sia

(x, y) −→ (u(x, y), v(x, y))

la trasformazione inversa, definita in un intorno di (x̄, ȳ). Allora la superficie


si rappresenta localmente come grafico della funzione z(u(x, y), v(x, y)). Si può
facilmente verificare che il piano tangente a tale grafico non è altro che il piano
di equazione (7.9).
Sia

(7.11) u ∈ [a, b] −→ (r(u), z(u))

una curva piana regolare e sia r(u) 6= 0 per ogni u. La superficie che si ot-
tiene facendo ruotare attorno all’asse delle z la curva (7.11) ha la seguente
rappresentazione parametrica

(7.12) (u, v) ∈ [a, b] × [0, 2π[−→ (r(u) cos v, r(u) sin v, z(u)) .

Essa prende il nome di superficie di rotazione o di rivoluzione.


In particolare, se si fa ruotare un opportuno semicerchio di raggio unitario
attorno al suo diametro, si ottiene la sfera di equazioni parametriche

(u, v) ∈]0, π[×]0, 2π[−→ (sin u sin v, sin u cos v, cos u) .

Altro esempio è costituito dalla superficie torica che si ottiene facendo ruotare
una circonferenza di raggio r intorno ad un asse ad essa complanare la cui
distanza dal centro è R > r. Si ottiene allora la superficie

(u, v) ∈]0, 2π[2 −→ ((R + r cos u) cos v, (R + r cos u) sin v, r sin u) .


138 CAPITOLO 7. VARIETÀ

Di tutt’altra natura è il seguente esempio noto come nastro di Möbius


 u u u
(u, v) ∈]0, 2π[×[−1, 1] −→ cos u − v sin cos u, sin u + v sin sin u, v cos .
2 2 2
Nel caso in cui si faccia variare il parametro u in un intervallo di ampiezza
maggiore di 2π l’applicazione non è piú iniettiva.
Quanto detto nel caso dello spazio tridimensionale può essere opportunamente
esteso al caso di un generico spazio euclideo.
Consideriamo un’applicazione iniettiva, di classe C 1 (D) con D aperto di RN −1 ,

(7.13) u = (ui ) ∈ D −→ ϕ(u) = (ϕj (u)) ∈ RN .

Se la matrice
 
∂ϕj
(7.14)
∂ui

ha rango massimo l’applicazione (7.13) prende il nome di varietà di RN a N − 1


dimensioni. Il suo codominio ne è il sostegno.
Fissiamo un punto ū in E e indichiamo con x̄ = ϕ(ū) il corrispondente punto
sulla varietà. Argomentando come per le superfici di R3 si può pervenire alla
definizione di piano tangente alla varietà facendo intervenire i minori di ordine
massimo della matrice (7.14). Posto infatti
 
∂ϕi
(7.15) Ak = (−1)k−1 det
∂uj i6=k

il piano tangente in x̄ alla varietà ha equazione


N
X
(7.16) Āk (xk − x̄k ) = 0
k=1

dove ciascun termine Āk è il valore assunto in ū da (7.15). Il vettore di


componenti Āk è perpendicolare al piano tangente alla varietà. Il suo modulo
v
uN
uX
(7.17) W (u) = t A2k (u)
k=1

è la misura del parallelepipedo generato dai vettori colonna della matrice (7.14).
La (7.13) definisce una varietà di codimensione uno. Consideriamo il caso
generale di varietà di codimensione maggiore di uno.
Se M < N − 1 sia

(7.18) (u1 , · · · , uM ) ∈ D −→ (ϕ1 (u1 , · · · , uM ), · · · , ϕN (u1 , · · · , uM )) ,

un’applicazione di classe C 1 (D).


7.2. INTEGRALI SUPERFICIALI 139

Per ogni M -pla λ = (i1 , · · · , iM ) di interi compresi tra 1 e N , ordinati in modo


crescente, poniamo
 
∂ϕih
Aλ = det .
∂uk h,k=1,··· ,M

Se almeno una delle quantità Aλ è diversa da zero la (7.18) definisce una varietà
M -dimensionale di RN . Le quantità Aλ sono le componenti di un cosiddetto
M -vettore per il quale si può ancora definire la norma nel modo seguente
sX
(7.19) W (u) = A2λ (u) .
λ

7.2 Integrali superficiali


Indichiamo co S il sostegno della superficie regolare (7.1) e supponiamo che D
sia un dominio regolare.

Definizione 7.2.1. - L’integrale


Z
(7.20) W (u, v) dudv
D

è l’area di S.

La motivazione della posizione (7.20) poggia essenzialmente su quanto detto in


relazione al significato di W . Si può inoltre verificare che il valore dell’integrale
(7.20) resta immutato se si usa una differente rappresentazione parametrica della
superficie.
Va sottolineato che non vale per le superfici un risultato analogo a quello de-
scritto nel teorema 3.2.1 per le curve. Infatti, in analogia con quanto fatto per le
curve, si possono considerare le superfici poliedriche in essa inscritte. Con tale
termine si intende una superficie che sia unione di un numero finito di triangoli
con i vertici collocati sulla superficie. Si dimostra però che la quantità (7.20)
non è l’estremo superiore delle aree di tali superfici poliedriche.

Esempio 7.2.1. - Sia f di classe C 1 (D), con D dominio regolare del piano.
Allora l’area del grafico di f è ha la seguente area
Z q
1 + fx2 + fy2 dxdy .
D

Per le superfici di rotazione sussiste il seguente risultato.

Teorema 7.2.1. (Secondo teorema di Guldino) - L’area della superficie di


rotazione (7.12) è uguale al prodotto della lunghezza della curva (7.11) e della
circonferenza descritta dal baricentro della curva.
140 CAPITOLO 7. VARIETÀ

Dimostrazione. Essendo
p
W (u, v) = r(u) r0 (u)2 + z 0 (u)2

dalla (7.20), tenendo conto della (6.28), si ha la seguente espressione per l’area
della superficie
Z b p
2π r(u) r0 (u)2 + z 0 (u)2 du = 2πL(γ)r̄γ
a

dove r̄γ rappresenta la distanza del baricentro di γ (cfr. es. 4.1.1) dall’asse di
rotazione.
Una volta introdotta la nozione di area di una superficie, con lo stesso procedi-
mento utilizzato per introdurre l’integrale di Riemann, si puó definire l’integrale
superficiale di una funzione continua definita sul sostegno della superficie. Per
tale integrale si usa il simbolo Z
f dσ .
S

È possibile dimostrare che


Z Z
f dσ = f (x(u, v), y(u, v), z(u, v)) W (u, v) dudv .
S D

Richiamiamo ora brevemente la nozione di misura e di integrale nel caso di una


varietà di RN . Consideriamo la porzione V della varietà (7.13) immagine dei
punti di un dominio regolare D ⊂ RN −1 . Allora la misura di V è
Z
W (u) du
D

dove W è la funzione (7.17). Inoltre, se f è una funzione continua su V ,


Z Z
(7.21) f dσ = f (ϕ(u)) W (u) du
V D

è l’integrale di f esteso a V .
Ovviamente le stesse formule possono essere riproposte nel caso di varietà a
codimensione maggiore di uno; in tal caso W è la funzione (7.19).
Le definizioni di misura di una varietà e di integrale ad essa esteso sono state
date nel caso che la varietà si rappresenti mediante la (7.13). Non tutte le
varietà sono però riconducibili ad un tale ambito. Consideriamo il caso in cui
essa sia il luogo degli zeri di una funzione g di classe C 1

(7.22) V = {x : g(x) = 0} .

Supponiamo inoltre che V sia compatta e che i suoi punti non siano critici per
la funzione g. È la tipica situazione in cui V è la frontiera del dominio

(7.23) T = {x : g(x) < 0} .


7.3. TEOREMA DELLA DIVERGENZA 141

Per il teorema 5.1.2 la varietà V si rappresenta localmente come grafico di una


funzione. Per l’ipotesi di compattezza è possibile ricoprire V con un numero
finito di intorni {Ik }k=1,··· ,n tali che la restrizione di V a ciascun Ik è grafi-
co di una funzione di N − 1 variabili e quindi rappresentabile mediante una
trasformazione del tipo (7.13).
Si può dimostrare che è possibile determinare un numero finito n di funzioni vk
tali che

• vk ∈ C ∞ (RN )

• vk ≥ 0

• vk ≡ 0 in RN \Ik
n
X
• vk ≡ 1 su V .
k=1

Tale famiglia di funzioni prende il nome di partizione dell’unità di V .


Ciò premesso, se f è una funzione continua su V , si pone
Z n Z
X
(7.24) f dσ = f vk dσ .
V k=1 V ∩Ik

Ovviamente ciascuno degli integrali a secondo membro è ben definito in quanto


abbiamo ripristinato le condizioni per poter utilizzare la formula (7.21).

7.3 Teorema della divergenza


Se F = (X, Y ) è un campo vettoriale con componenti di classe C 1 (A) si chiama
divergenza di F la funzione

∂X ∂Y
div F = + .
∂x ∂y

Sia D un dominio regolare contenuto nell’aperto A; dalle formule di Gauss-Green


(6.32) si ha
Z Z
(7.25) div F dxdy = Xdy − Y dx .
D +∂D

Supponiamo che la frontiera di D sia una curva generalmente regolare, semplice


e chiusa; sia
s ∈ [α, β] −→ (x(s), y(s))
una sua rappresentazione parametrica con s parametro ascissa curvilinea. Sup-
poniamo inoltre che l’orientamento indotto da tale rappresentazione parametri-
ca coincida con quello positivo; ciò comporta (cfr. defin. 6.5.1) che il versore
142 CAPITOLO 7. VARIETÀ

normale alla frontiera rivolto verso l’esterno è ne = (y 0 (s), −x0 (s)). Allora
l’integrale curvilineo a secondo membro in (7.25) ha la seguente espressione
Z β Z
[X(x(s), y(s))y 0 (s) − Y (x(s), y(s))x0 (s)]ds = < F, ne > ds .
α ∂D

Si ha pertanto la seguente formula


Z Z
(7.26) div F dxdy = < F, ne > ds .
D ∂D

La (7.26) afferma dunque che l’integrale della divergenza di un campo vettoriale


esteso ad un dominio regolare D è uguale al flusso uscente dal dominio.
Posto ne = (nx , ny ) le formule di Gauss-Green (6.32) assumono la forma
Z Z
∂X
dxdy = X nx ds
D ∂x ∂D
(7.27)
Z Z
∂Y
dxdy = Y ny ds .
D ∂y ∂D

Usiamo la (7.26) per esibire una interpretazione fisica della divergenza.


Il campo vettoriale F sia il campo stazionario delle velocità di un fluido di
densità unitaria e incomprimibile che scorra sul piano. Fissato (x̄, ȳ) sia Cr il
cerchio con centro in tale punto e raggio r. La quantità
Z
∆t < F, ne > ds
∂Cr

è, con una certa approssimazione, la massa di fluido che esce da Cr in un


intervallo temporale di ampiezza ∆t. Poiché
Z
div F dxdy
div F(x̄, ȳ) = lim Cr
r→0 πr2
il valore che assume la divergenza in un punto dà l’idea della quantità di fluido
che esce, per unità di tempo, da un cerchio di raggio sufficientemente piccolo
con centro nel punto assegnato. Essa viene chiamata per questo motivo densità
di sorgente.
Proponiamo ora la versione N -dimensionale della formula (7.26).
Posto F = (X1 , · · · , XN ) con Xi funzioni di classe C 1 in un aperto A di RN ,
chiamiamo divergenza di F la funzione
N
X ∂Xi
div F = .
i=1
∂xi
7.4. FORMULA DI STOKES 143

Sia T il dominio (7.23), contenuto in A, e (7.22) la sua frontiera. Se i punti di


∂T non sono critici per g si ha versore
∇g
ne = .
k∇gk

Sussiste il seguente risultato.


Teorema 7.3.1. (Teorema della divergenza) - Se le componente Xi del
campo vettoriale F sono di classe C 1 si ha
Z Z
(7.28) div F dx = < F, ne > dσ .
T ∂T

In tre dimensioni, posto F = (X, Y, Z), si ha

div F = Xx + Yy + Zz .

Se ne = (nx , ny , nz ) dalla (7.28) si ottengono le seguenti tre identità


Z Z
∂X
dxdydz = X nx dσ
T ∂x ∂T
Z Z
∂Y
dxdydz = Y ny dσ
T ∂y ∂T
Z Z
∂Z
dxdydz = Z nz dσ ,
T ∂z ∂T

analoghe alle (7.27).

7.4 Formula di Stokes


Sia S la superficie (7.1). Come per le curve anche per le superfici la rappresenta-
zione parametrica scelta per rappresentare S induce su di essa un orientamento
legato in questo caso al verso del vettore normale di componenti (7.3). Fissare
un orientamento della superficie significa in sostanza pensare ad essa come un
foglio di spessore nullo con due differenti pagine, una positiva l’altra negativa.
Tale superficie orientata viene indicata con il simbolo +S. È altresı́ evidente
che tutte le rappresentazioni parametriche di una stessa superficie possono essere
suddivise in due distinte classi di equivalenza ciascuna delle quali contiene tutte
le rappresentazioni che inducono lo stesso orientamento. Nel passaggio dalla
rappresentazione (7.1) alla (7.5) l’orientamento si conserva o muta se il segno
dello jacobiano della trasformazione (7.4) è positivo o negativo (cfr. (7.6)).
Restringiamo l’applicazione (7.1) a un dominio regolare D la cui frontiera è
orientata come descritto all’inizio del paragrafo 6.5. Indichiamo ancora con S la
superficie in tal modo ottenuta. Ai punti di ∂D corrispondono mediante la (7.1)
punti dello spazio che costituiscono il bordo di S denotato con il simbolo ∂S.
144 CAPITOLO 7. VARIETÀ

Esso è costituito da curve generalmente regolari, semplici e chiuse. Se si conviene


che alla superficie sia associato l’orientamento indotto dalla rappresentazione
parametrica (7.1) allora l’orientamento positivo della frontiera di D induce sul
bordo di S un orientamento positivo. Il bordo dicesi allora orientato e si indica
con +∂S.
Fissiamo come positivo l’orientamento indotto dalla rappresentazione parame-
trica (7.1). Viene in tal modo definito su S il campo vettoriale
 
A B C
n= , ,
W W W

costituito dai versori normali a S. Se F = (X, Y, Z) è un campo vettoriale


definito in un aperto di R3 contenente il sostegno di S si definisce flusso di F
attraverso la superficie orientata +S il seguente integrale il seguente integrale
Z
< F, n > dσ .
S

Se le componenti del campo F sono di classe C 1 si definisce rotore di F il vettore

rot F = (Zy − Yz , Xz − Zx , Yx − Xy ) .

Si ha allora il seguente risultato.


Teorema 7.4.1. (Formula di Stokes) - Se X, Y, Z sono di classe C 1 si ha
Z Z
(7.29) < rot F, n > dσ = Xdx + Y dy + Zdz .
S +∂S

Dimostrazione. Assumiamo che le funzioni (7.1) siano di classe C 2 . Per sem-


plicità supponiamo che la frontiera di D sia una curva generalmente regolare
semplice e chiusa di equazioni parametriche

t ∈ [a, b] −→ (u(t), v(t))

cui corrisponda, come orientamento, il verso antiorario. Orientiamo di conse-


guenza il bordo di S. L’integrale a secondo membro in (7.29) è
Z b
[X(xu u0 + xv v 0 ) + Y (yu u0 + yv v 0 ) + Z(zu u0 + zv v 0 )] dt
a

ovvero Z
(Xxu + Y yu + Zzu )du + (Xxv + Y yv + Zzv )dv .
+∂D

Applicando le formule di Gauss-Green (6.32) tale integrale curvilineo diventa


Z
[(Xxv + Y yv + Zzv )u − (Xxu + Y yu + Zzu )v ] dudv
D

che non è altro che il primo membro di (7.29).


7.5. ESERCIZI 145

7.5 Esercizi
1. Si consideri il campo vettoriale (0, 0, z) definito in tutto R3 . Si calcoli
il flusso di tale campo attraverso la superficie di equazione z = x2 + y 2 ,
con x2 + y 2 ≤ 1, orientata in modo che il versore normale abbia la terza
componente positiva.

2. Si calcoli l’area della superficie S la cui rappresentazione parametrica è

(7.30) (u, v) ∈ D = [1, 2] × [0, π] −→ (u cos v, u sin v, v) .

Si assuma che l’orientamento positivo di S sia quello indotto dalla rap-


presentazione parametrica (7.30) e si orienti di conseguenza il bordo della
superficie ∂S. Si calcoli l’integrale curvilineo
Z
z dx + x dy + y dz .
+∂S

3. Si calcoli il flusso del campo (0, 0, z) attraverso la calotta sferica S


p
z = 1 − x2 − y 2

al variare di (x, y) nel cerchio C con centro nell’origine e raggio 1; si


assuma che S sia orientata in modo tale che il versore normale abbia la
terza componente non negativa.

4. Si calcoli il flusso del rotore del campo vettoriale (y, z, x) attraverso la


superficie S di equazione

z = 1 − x2 − y 2

con (x, y) appartenente al cerchio C con centro nell’origine e raggio 1; si


assuma che S sia orientata in modo tale che il versore normale abbia la
terza componente negativa.
146 CAPITOLO 7. VARIETÀ
Bibliografia

[1] A.Alvino, Appunti del corso di Analisi Matematica 1, sito docenti UNINA
[2] F.Cafiero, Analisi Matematica 2, Liguori Ed.

[3] N.Fusco-P.Marcellini-C.Sbordone, Analisi Matematica due, Liguori Ed.


[4] B.R.Gelbaum-J.M.H.Olmsted, Controesempi in Analisi Matematica, Ed.
Mursia
[5] E.M.Stein-R.Shakarki, Complex Analysis, Princeton Un. Press

147