Esplora E-book
Categorie
Esplora Audiolibri
Categorie
Esplora Riviste
Categorie
Esplora Documenti
Categorie
Indice
1 Derivazione delle funzioni composte
2 Formula di Taylor
14
16
18
21
26
28
30
34
38
41
14 Misurabilit`
a secondo PeanoJordan e domini normali
44
49
52
17 Alcune estensioni
55
18 Cambiamenti di variabili
59
67
75
21 La formula di GaussGreen
77
22 Serie di funzioni
82
23 Serie di potenze
83
86
90
91
94
98
104
30 Estensioni e applicazioni
107
31 Esistenza in piccolo
108
Il caso scalare
Sia A un aperto di RN . Una funzione f : A R `e differenziabile in x0 A se esiste un
vettore a tale che
f (x) f (x0 ) a (x x0 ) = o(kx x0 k).
Questa propriet`
a determina univocamente a: ogni a0 RN tale che
f (x) f (x0 ) a0 (x x0 ) = o(kx x0 k)
deve verificare
(a0 a) (x x0 ) = o(kx x0 k)
ovvero
(a0 a)
x x0
0
kx x0 k
per x x0 ,
(1)
e ci`o implica a0 = a. Per semplificare le notazioni, verifichiamo tale implicazione nel caso N = 2.
La (1) si riscrive
(a0 a)(x x0 ) + (b b0 )(y y0 )
p
0
(x x0 )2 + (y y0 )2
prendendo x 6= x0 , y = y0 si ha
(a0 a)(x x0 )
0
|x x0 |
per x x0 ,
per x x0
e quindi
f (x) f (x0 ) (x x0 )
0
x x0
per x x0 ,
01
Dalla propriet`
a di migliore approssimazione lineare vista un attimo fa segue che il piano di equazione
z = f (x0 , y0 ) + fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 ) `e quello che per (x, y) (x0 , y0 ) meglio
approssima il grafico della funzione z = f (x, y), e per questo viene detto piano tangente.
In R3 riscriviamo la differenziabilit`
a di f con le notazioni P = (x, y, x), P0 = (x0 , y0 , x0 ):
f (P ) f (P0 ) fx (P0 )(x x0 ) fy (P0 )(y y0 ) fz (P0 )(z z0 ) = o(kP P0 k).
(2)
2.1
Date tre funzioni s 7 x(s), y(s), z(s) definite in un intervallo ]a, b[ con (x(s), y(s), z(s)) A
per s ]a, b[, sia s0 ]a, b[ con (x(s0 ), y(s0 ), z(s0 )) = P0 . Se si aggiunge allipotesi che f sia
differenziabile in P0 quella che le x(s), y(s), z(s) siano differenziabili, ovvero derivabili, in s0 , allora
la funzione composta F : s 7 f (x(s), y(s), z(s)) `e differenziabile, ovvero derivabile, in s0 con
derivata
F 0 (s0 ) = fx (P0 )x0 (s0 ) + fy (P0 )y 0 (s0 ) + fz (P0 )z 0 (s0 ).
(3)
2.2
Infatti dalla (2) con P = (x(s), y(s), z(s)) si deduce, scrivendo lo(kP P0 k) come (P )kP P0 k
con : A R continua in P0 , (P0 ) = 0, che
F (s) F (s0 ) = fx (P0 )(x(s) x(s0 )) + fy (P0 )(y(s) y(s0 )) + fz (P0 )(z(s) z(s0 ))
p
+(x(s), y(s), z(s)) (x(s) x(s0 ))2 + (y(s) y(s0 ))2 + (z(s) z(s0 ))2 .
A questo punto, tenendo conto che in s0 la funzione composta s 7 (x(s), y(s), z(s)) `e continua e
vale 0, basta dividere per s s0 6= 0 e far tendere s a s0 per ottenere la (3).
Passiamo a introdurre tre funzioni (s, t) 7 x(s, t), y(s, t), z(s, t) definite in un aperto B del piano
con (x(s, t), y(s, t), z(s, t)) A per ogni (s, t) B. Sia (s0 , t0 ) B con (x(s0 , t0 ), y(s0 , t0 ), z(s0 , t0 )) =
P0 . Aggiungendo allipotesi che f sia differenziabile in P0 quella che le x(s, t), y(s, t), z(s, t) siano
differenziabili in (s0 , t0 ), si vede subito che la funzione composta F : (s, t) 7 f (x(s, t), y(s, t), z(s, t))
`e dotata in (s0 , t0 ) delle derivate parziali
Fs (s0 , t0 ) = fx (P0 )xs (s0 , t0 ) + fy (P0 )ys (s0 , t0 ) + fz (P0 )zs (s0 , t0 ),
(4)
2.3
Ft (s0 , t0 ) = fx (P0 )xt (s0 , t0 ) + fy (P0 )yt (s0 , t0 ) + fz (P0 )zt (s0 , t0 ).
(5)
2.4
Possiamo ancora affermare che in (s0 , t0 ) la F , oltre che derivabile (rispetto a s ed a t), `e anche
differenziabile? La risposta `e S`, ma qui, per giustificarla senza allontanarci dalle tecniche che
stiamo utilizzando, introduciamo lipotesi supplementare che le x(s, t), y(s, t), z(s, t) siano di classe
C 1 in B e la f (x, y, z) lo sia in A. Allora le due identit`a precedenti valgono al variare di (s0 , t0 )
in B con i secondi membri delle (4),(5), funzioni continue, per cui F C 1 (B), e il Teorema del
differenziale totale garantisce che F `e differenziabile in ogni punto di B .
Il caso vettoriale
Un vettore (u1 , . . . , uN ) si pu`
o anche intendere come una matrice 1 N oppure N 1:
u1
.
[u1 . . . uN ] oppure
.
.
uN
4
xs (s, t)
Fs (s, t) = [fx (P ) fy (P ) fz (P )] ys (s, t) , Ft (s, t) = [fx (P )
zs (s, t)
fy (P )
xt (s, t)
fz (P )] yt (s, t)
zt (s, t)
xs (s, t) xt (s, t)
fy (P ) fz (P )] ys (s, t) yt (s, t) .
zs (s, t) zt (s, t)
xs (s, t)
Fs (s, t) Ft (s, t)
= fx (P ) fy (P ) fz (P ) ys (s, t)
gx (P ) gy (P ) gz (P )
Gs (s, t) Gt (s, t)
zs (s, t)
xt (s, t)
yt (s, t)
(6)
zt (s, t)
2.5
(7)
F(s) = f (x(s)).
2.6
Formula di Taylor
P
Dato il generico vettore1 u = (u1 , . . . , uN ) RN , indichiamo con u loperatore N
i=1 ui Di =
PN
n , n 1, in un aperto A di RN associa la
u
che
ad
ogni
funzione
reale
f
di
classe
C
i=1 i xi
funzione
N
N
X
X
(u )f = u f =
ui Di f =
ui fxi .
i=1
Per n 2 il quadrato (u
i=1
P
2 e definito attraverso lidentit`
a
=( N
i=1 ui Di ) `
)2
(u )2 f = (u )[(u )f ]
ovvero
N
X
!2
ui Di
f=
i=1
N
X
!"
ui Di
i=1
N
X
! #
ui Di
f .
(9)
tay1
i=1
Operando sui simboli Di come se fossero dei numeri, che commutano cogli ui perch`e questi ultimi
sono fissati, cio`e non dipendono dalle variabili rispetto a cui si deriva, vediamo che la quantit`
a (9)
`e uguale alla forma quadratica
N
X
ui uj Di Dj f =
i,j=1
N
X
ui uj fxi xj = u Hu = ut Hu
i,j=1
fx1 x1 (x) . . .
H(x) = . . .
fxN x1 (x) . . .
fx1 xN (x)
fxN xN (x)
tay2
.
tetay1
Teorema 2.1. Se f `e una funzione di C n (A) e A contiene tutto il segmento che congiunge i punti
x0 , x0 + u la funzione (10) `e di classe C n nel segmento [0, 1] e verifica
(k)
(11)
per ogni k = 1, . . . , n.
DIM. Quando k = 1 la (11) segue subito dalla regola di derivazione delle funzioni composte. Per k >
1 arbitrario si procede induttivamente, tenendo conto che a sinistra compare d/dt[dk1 [u] (t)/dtk1 ]
e a destra (u )[(u )k1 f (x0 + tu)].
1
Inteso, quando il contesto lo richiede, come la colonna delle sue componenti, ovvero come matrice N 1.
tay3
(12)
tay4
1
1
f (x0 +u) = f (x0 )+(u)f (x0 )+ (u)2 f (x0 + u) = f (x0 )+(u)f (x0 )+ uH(x0 + u)u. (13)
2
2
tay5
1
1
(u )n1 f (x0 ) + (u )n f (x0 + u). (14)
(n 1)!
n!
tay6
DIM. Siccome [u] (1) = f (x0 + u) e [u] (0) = f (x0 ), la (12) segue dallidentit`a
[u] (1) = [u] (0) + 0[u] ( )
(Teorema del valor medio) e dal Teorema 2.1. Abbiamo poi
1
[u] (1) = [u] (0) + 0[u] (0) + 00[u] ( )
2
per n = 2 e
[u] (1) = [u] (0) + 0[u] (0) + +
1
1 (n)
(n1)
[u] (0) + [u] ( )
(n 1)!
n!
per n qualunque (formula di Taylor), sicche ancora una volta basta applicare il Teorema 2.1.
Per le funzioni di N variabili la (12) esprime il teorema del valor medio, mentre le (13) e
(14) sono gli sviluppi di Taylor (rispettivamente di ordine 2 e di ordine n) con il resto di
Lagrange.
Si faccia attenzione: la richiesta che il segmento di estremi x0 e x0 + u sia tutto contenuto in A
`e essenziale per garantire per la validit`
a delle (12), (13) e (14)2 . A questo riguardo introduciamo la
seguente nozione. Un sottoinsieme U di RN `e convesso se contiene ogni segmento di cui contiene
gli estremi. Ad esempio, ogni sfera `e convessa. Con questa terminologia si ottiene dal Teorema 2.1
il
valmed
per x A.
(15)
per x, y A.
Per esempio, indichiamo con A il piano privato della semiretta x = 0, y 0 e con f la funzione A R uguale a
per y < 0 ed a (segno di x)y 2 per x 6= 0, y 0. Siano x0 > 0, x = x0 : la quantit`
a f (x0 , 1) f (x, 1) vale 2, mentre
fx `e identicamente nulla e quindi f (, 1), 6= 0, ha prodotto scalare nullo con (x0 , 1) (x, 1) = (2x0 , 0). Dunque
non vale la tesi del Teorema di Lagrange.
lip
(16)
tay2
senzaltro ben definita per 1 < t < 1 e u = (u1 , u2 ) tale che kuk < r R se R > 0 `e cos` piccolo
che tutto il disco di centro (x0 , y0 ) e raggio R sia contenuto in A. Per k = 1 la (11) si riscrive
0[u] (t) = u1 fx (x0 + tu1 , y0 + tu2 ) + u2 fy (x0 + tu1 , y0 + tu2 ) = u f (x0 + tu1 , y0 + tu2 )
e per k = 2
00[u] (t) = u21 fxx (x0 + tu1 , y0 + tu2 ) + 2u1 u2 fxy (x0 + tu1 , y0 + tu2 ) + u22 fyy (x0 + tu1 , y0 + tu2 )
= u H(x0 + tu1 , y0 + tu2 )u;
(17)
tay5
1
1
u H(x0 , y0 )u + u [H(x0 + u1 , y0 + u2 ) H(x0 , y0 )]u
2
2
(19)
con la norma3
kH(x0 + u1 , y0 + u2 ) H(x0 , y0 )k
infinitesima per r 0 uniformemente in grazie alla continuit`a delle derivate seconde di f .4
3
qP
ij
tay5
rest
Sia f una funzione C 1 (A), dove A R2 `e aperto. Diciamo che in un punto (x0 , y0 ) A la f
assume un estremo locale, e pi`
u precisamente un minimo locale o un massimo locale, se esiste
un intorno aperto U A di (x0 , y0 ) tale che per ogni (x, y) U risulti, rispettivamente, f (x, y)
f (x0 , y0 ) oppure f (x, y) f (x0 , y0 ) (e aggiungiamo laggettivo proprio se le disuguaglianze sono
soddisfatte in senso stretto nei punti (x, y) 6= (x0 , y0 )). Ci`o equivale a richiedere che per r > 0
sufficientemente piccolo tutte le funzioni (16) con 1 < t < 1 e u = (u1 , u2 ) tale che kuk < r
assumano rispettivamente un minimo o un massimo locale nel punto t = 0.
Le precedenti nozioni trasferiscono immediatamente alla dimensione 2 quelle analoghe viste in
dimensione 1. Ma per le funzioni di pi`
u di una variabile pu`o presentarsi unulteriore eventualit`
a:
quella che un punto ne di minimo ne di massimo (in nessun suo intorno) sia per`o un punto di
sella, cio`e di minimo in una direzione e di massimo in unaltra, ovvero ancora che esistano due
diversi vettori u tali che in corrispondenza ad uno di essi la [u] (t) assuma in t = 0 un minimo
locale proprio e in corrispondenza allaltro un massimo locale proprio.
ind
Esempio 3.1. Lorigine degli assi `e un punto di sella per la funzione f (x, y) = (x2 y 2 )/2: la
restrizione f (x, 0) = x2 /2 allasse x (vettore u = (1, 0)) ha minimo (assoluto) per x = 0, mentre
la restrizione f (0, y) = y 2 /2 allasse y (vettore u = (0, 1)) ha massimo (assoluto) per y = 0. (Il
grafico di f (x, y) `e il celeberrimo paraboloide a sella, detto anche iperbolico.)
La condizione necessaria di estremalit`a del primo ordine per f (x, y) segue subito da quella gi`
a
nota per le funzioni di una variabile.
Teorema 3.1. Affinche un punto (x0 , y0 ) A sia di minimo o massimo locale per una funzione
f C 1 (A) `e necessario che f (x0 , y0 ) = 0.
DIM. In t = 0 ogni funzione ] 1, 1[3 t 7 [u] (t) = f (x0 + tu1 , y0 + tu2 ) con u = (u1 , u2 ) di norma
< r `e dotata di estremo, e quindi ha derivata nulla:
0[u] (0) = fx (x0 , y0 )u1 + fy (x0 , y0 )u2 = 0.
Dallarbitrariet`
a della scelta di (u1 , u2 ) segue che f (x0 , y0 ) = (fx (x0 , y0 ), fy (x0 , y0 )) = (0, 0).
Ogni punto di A in cui f `e dotata di gradiente nullo `e un punto critico o stazionario o anche
un estremale di f , e come per le funzioni di una variabile non `e detto che si tratti di un minimo
o di un massimo locale: si pensi a 0 per f (x) = x3 , ovvero a (0, 0) per f (x, y) = x3 ...
Per poter passare alle condizioni del secondo ordine introduciamo la seguente terminologia. Se
B `e una matrice simmetrica N N , la forma quadratica RN 3 u 7 u Bu si dice:
semidefinita positiva o semidefinita negativa a seconda che per ogni u RN risulti
u Bu 0 o u Bu 0;
definita positiva o definita negativa a seconda che per ogni u RN \{0} risulti uBu > 0
o u Bu < 0.
E fin qui si direbbe che stiamo semplicemente estendendo al caso di una qualunque dimensione
N delle banali nozioni unidimensionali sulla funzione R 3 u 7 Bu2 legate al segno dello scalare B.
Ma non `e cos`: quando N = 1 la funzione pu`o solo essere soltanto 0 o 0, mentre gi`a per N = 2
incontriamo semplici forme quadratiche che non sono semidefinite, bens` verificano u Bu > 0 o
u Bu < 0 a seconda della scelta di u.
ind
mkvk v v =
N
X
i vi2 M kvk2 ,
i=1
per u RN
grazie allisometria kuk = kvk; la prima (la seconda) disuguaglianza debole diventa lidentit`a quando u `e un autovettore associato allautovalore m (M ). Dunque richiedere che B sia semidefinita
positiva (semidefinita negativa) equivale a richiedere che m 0 (M 0), per cui B non `e semidefinita se e solo se m < 0 < B; richiedere che B sia definita positiva (definita negativa) equivale a
richiedere che m > 0 (M < 0).
nec
Teorema 3.2. Affinche un punto (x0 , y0 ) A sia di minimo oppure di massimo locale per una
funzione f C 2 (A) `e necessario non solo che (x0 , y0 ) sia un punto critico, ma anche che la forma
quadratica u H(x0 , y0 )u sia rispettivamente semidefinita positiva oppure negativa, ovvero che tutti
gli autovalori di H(x0 , y0 ) siano 0 oppure 0.
DIM. Supponiamo che (x0 , y0 ) sia di minimo per f . Allora ogni funzione t 7 [u] (t), essendo dotata
di minimo in t = 0, verifica non solo 0[u] (0) = 0 ma anche 00[u] (0) 0, e quindi
u H(x0 , y0 )u = u21 fxx (x0 , y0 ) + 2u1 u2 fxy (x0 , y0 ) + u22 fyy (x0 , y0 ) = 00[u] (0) 0.
Analogo discorso se (x0 , y0 ) `e di massimo.
10
controes
Osservazione 3.1. Nelle dimostrazioni di entrambi i teoremi precedenti abbiamo sfruttato limplicazione:
la f (x, y) ha un minimo locale in (x0 , y0 ) = tutte le [u] (t) hanno un minimo locale in (x0 , y0 ).
Ebbene, vale la pena di notare che questa implicazione non si inverte. Siano ad esempio A = R2 ,
f (x, y) = (y x2 )(y 2x2 ). In (0, 0) il gradiente di f `e nullo e lhessiana vale
0 0
,
0 2
per cui `e semidefinita positiva. Ma (0, 0) non `e di minimo per f , perche ogni intorno dellorigine
contiene punti in cui f `e positiva ed altri in cui `e negativa. Invece in t = 0 tutte le
[u] (t) = f (tu1 , t2 ) = t2 (u2 tu21 )(u2 2tu21 )
hanno minimo locale (proprio) uguale a 0: infatti t2 (u2 tu21 )(u2 2tu21 ) con |t| > 0 abbastanza
piccolo ha il segno di di u22 > 0 se u2 6= 0, mentre per vale 2t4 u41 > 0 per t 6= 0, u1 6= 0, u2 = 0.
Col Teorema 3.2 abbiamo ottenuto una condizione solo necessaria perche un punto critico sia di
estremo locale. NellOsservazione 3.1 abbiamo gi`a visto un controesempio, e altri ne menzioneremo
nellOsservazione 3.2. Passiamo alla condizione sufficiente.
suf
Teorema 3.3. Un punto critico (x0 , y0 ) A per una funzione f C 2 (A) tale che la forma quadratica u H(x0 , y0 )u sia definita positiva oppure negativa, ovvero che tutti gli autovalori di H(x0 , y0 )
siano > 0 oppure < 0, `e rispettivamente di minimo o massimo locale proprio.
DIM. Applichiamo la formula di Taylor di ordine 2 con f (x0 , y0 ) = (0, 0) (il punto `e critico): dato
comunque u = (u1 , u2 ) R2 con kuk < r esiste un ]0, 1[ tale che
1
f (x0 + u1 , y0 + u2 ) f (x0 , y0 ) = u H(x0 + u1 , y0 + u2 )u
2
1
1
= u H(x0 , y0 )u + u [H(x0 + u1 , y0 + u2 ) H(x0 , y0 )]u
2
2
con la norma
kH(x0 + u1 , y0 + u2 ) H(x0 , y0 )k
infinitesima per r 0 uniformemente in (cfr. (18) e (19)).
Supponiamo che la forma quadratica u 7 u H(x0 , y0 )u sia definita positiva, ovvero che il
minimo autovalore m di H(x0 , y0 ) sia > 0. Fissiamo un r = rm/2 > 0 tale che
kH(x0 + u1 , y0 + u2 ) H(x0 , y0 )k <
m
2
e quindi
u [H(x0 + u1 , y0 + u2 ) H(x0 , y0 )]u kH(x0 + u1 , y0 + u2 ) H(x0 , y0 )kkuk2 <
per kuk < r. Siccome
u H(x0 , y0 )u mkuk2
11
m
kuk2
2
come abbiamo visto con le considerazioni che precedono il Teorema 3.25 , otteniamo
f (x0 + u1 , y0 + u2 ) f (x0 , y0 )
m
m
m
kuk2 kuk2 kkuk2 = kuk2 ,
2
4
4
da cui f (x, y) > f (x0 , y0 ) per 0 < k(x x0 )2 + (y y0 )2 k < r2 . Ne segue che la f `e dotata in
(x0 , y0 ) di minimo (per di pi`
u proprio).
Il ragionamento per il massimo `e del tutto analogo.
semidef
12
Tutto il contenuto di questa sezione, ad eccezione della precedente osservazione, si estende senza
difficolt`a da 2 a pi`
u variabili.
Esempio 3.3. Siano A = R2 , f (x, y) = x2 + y 3 xy. I punti critici di f sono le soluzioni del
sistema
fx (x, y) = 2x y = 0, fy (x, y) = 3y 2 x = 0,
ovvero (0, 0) e (1/12, 1/6). Studiamo il discriminante
2
(x, y) = fxy
(x, y) fxx (x, y)fyy (x, y) = (1)2 2 6y.
Siccome (0, 0) = 1 e (1/12, 1/6) = 1 con fxx (1/12, 1/6) = 2, lorigine `e un punto di sella e
(1/12, 1/6) `e un punto di minimo locale (ma non assoluto: nel piano la f `e illimitata sia inferiormente
che superiormente!) Si noti che lhessiana di f nel punto generico (x, y) vale
2 1
H(x, y) =
,
1 6y
per cui
2 1
,
H(0, 0) =
1 0
2 1
H(1/12, 1/6) =
1 1
e quindi u H(0, 0)u = 2u21 2u1 u2 non `e semidefinita (basta prendere u1 6= 0 e u2 una volta uguale
a u1 /2 e unaltra a 2u1 ), mentre u H(1/12, 1/6)u = 2u21 2u1 u2 + u22 = u21 + (u1 u2 )2 `e definita
positiva.
Esempio 3.4. Siano A =]0, 2[2 , f (x, y) = x2 + 2y 2 4xy + 2x. Imponendo il sistema
fx (x, y) = 2x 4y + 2 = 0,
fy (x, y) = 4y 4x = 0
13
sec1
Notiamo tuttavia che una comunissima funzione come x non `e C 1 , e non `e lipschitziana, in
I = [0, 1]. Vi `e, comunque, uniformemente continua? S`, semplicemente perche vi `e continua.
Infatti vale limportantissimo Teorema di HeineCantor, il quale afferma che quando I `e un
sottoinsieme sia chiuso che limitato di R, anzi pi`
u in generale di un qualunque RN (con la distanza
tra due punti al posto del modulo della differenza di due numeri), ogni f : I R continua in I vi
`e uniformemente continua.
Affrontiamo alla luce delluniforme continuit`a il criterio di integrabilit`a di una funzione f definita
e limitata nellintervallo chiuso e limitato I = [a, b]. Affinche esista lintegrale (di Riemann) di f `e
necessario e sufficiente che ad ogni > 0 si possa associare una partizione {x0 = a < x1 < x2 <
< xm = b} di [a, b] tale che
!
m
X
sup f inf f (xh xh1 ) < .
(20)
h=1
]xh1 ,xh [
]xh1 ,xh [
f = max f = f (x0h ),
[xh1 ,xh ]
inf
f=
]xh1 ,xh [
min f = f (x00h )
[xh1 ,xh ]
per opportuni x0h , x00h [xh1 , xh ], sicche la condizione (20) che bisogna ottenere diventa
m
X
f (x0h ) f (x00h ) (xh xh1 ) < .
h=1
h=1
` facile convincersi che luniforme continuit`a in un insieme I implica la continuit`a in (ogni punto
E
di) I: anzi, a prima vista verrebbe fatto di dire che si tratti proprio della stessa cosa. E invece no,
perche non vale il viceversa, come mostrano i seguenti esempi.
Esempio 4.1. Sia I =]0, 1] (intervallo limitato, ma non chiuso). La funzione f (x) = sin(1/x) `e
di classe C 0 (I), ovvero continua in ogni punto di I, ma non uniformemente in I: la quantit`
a
14
sum
f (1/(2n + /2)) f (1/(2n)) = sin(2n + /2) sin(2n) `e sempre = 1, dunque > non
appena < 1, nonostante che per ogni scelta di > 0 si possano sempre trovare infiniti n tali che
0 < 1/(2n) 1/(2n + /2) < .
Esempio 4.2. Sia I = [0, [ (intervallo chiuso, ma non limitato). La funzione f (x) = x2 `e di
classe C 0 (I), ovvero continua in ogni punto di I, ma non uniformemente in I: per ogni scelta di
> 0 e di x0 1/ la quantit`
a f (x0 + /2) f (x0 ) = (2x0 + /2)/2 `e > x0 1, dunque > non
appena < 1, e questo nonostante tutti i punti x0 , x0 + /2 con x0 1/ distino meno di .
Si noti che in ciascuno dei due esempi la f `e di classe C 1 , anzi C , nellintervallo I in cui
`e stata definita, ma con derivata f 0 illimitata com`e ovvio, altrimenti il teorema di Lagrange implicherebbe la lipschitzianit`
a (con costante di Lipschitz K = supI |f 0 |) e quindi luniforme
continuit`a.
Ai fini dei prossimi sviluppi ritorniamo ora sul criterio generale di integrabilit`a secondo Riemann,
e dimostriamo il
tint
Teorema 4.1. Siano < a < b < . Una funzione limitata f : [a, b[ R, se `e integrabile
secondo Riemann su [a, B] per ogni B ]a, b[, lo `e anche su tutto [a, b], con
Z b
Z B
f (x) dx = lim
f (x) dx.
(21)
Bb
(22)
Sia poi {x0 = a < < xm1 = B} una partizione di [a, B] per la quale, grazie allipotesi di
integrabilit`a su [a, B], risulti
!
m1
X
Allora {x0 = a < < xm1 = B < xm = b} `e una partizione di [a, b] per la quale risulta
!
m
X
sup f inf f (xh xh1 )
]xh1 ,xh [
h=1
m1
X
h=1
]xh1 ,xh [
!
sup
]xh1 ,xh [
inf
]xh1 ,xh [
!
(xh xh1 ) + 2 sup |f | (b B) <
[a,b]
+ = .
2 2
Ne segue che la (20) `e soddisfatta, e quindi che f `e integrabile. Che poi valga la (21) `e conseguenza
immediata di
Z b
Z b
Z B
f (t) dt sup |f |(b B) < /2.
f (x) dx
f (x) dx =
a
[a,b]
15
int2
b-B
Per < a < b indichiamo con f una funzione [a, b[ R integrabile secondo Riemann da a
a B per ogni B ]a, b[.
Come abbiamo visto col Teorema 4.1, se aggiungiamo le ipotesi che (i) b sia finito e (ii) f sia
limitata, la funzione `e dotata di integrale di Riemann da a a b, e vale la (21).
Lasciamo cadere almeno una tra la (i) e la (ii). Il primo membro della (21) non ha pi`
u senso
come integrale di Riemann: lo chiamiamo integrale improprio di f da a a b. Il limite nel secondo
membro (con lintesa che b si legga come se b = ) non `e detto che esista, ne, se esiste, che
sia finito. Se esiste diciamo che il suo valore `e quello dellintegrale improprio a primo membro, che
chiamiamo convergente o divergente a seconda che sia finito o no.
In maniera analoga a quanto abbiamo appena visto si affronta poi il caso di una funzione f
definita su un ]a, b], dove a < b < , e integrabile secondo Riemann su ogni sottointervallo
[A, b], a < A < b, col valore dellintegrale improprio dato da
Z
f (x) dx = lim
Aa+
f (x) dx
(23)
int3
nel caso che il limite esista (e con lintesa che a+ si legga come se a = ).
Se infine f `e una funzione definita su un ]a, b[ con a < b e integrabile secondo
Riemann su ogni sottointervallo [A, B] con a < A < B < b, il suo integrale improprio da a a b vale
Z
Z
f (x) dx =
lim
Aa+ ,Bb
f (x) dx
(24)
nel caso che entrambi i limiti indipendenti! esistano senza essere uguali uno a + e laltro
a .
e2.1
x dx
16
int4
x dx
ba
|x|
dy
.
y
Z
dx = 2
ex dx
an 1[n,n+1[ (x)
n=K
(che su ogni intervallo limitato soddisfa lipotesi del Teorema 4.1 e di conseguenza `e integrabile). Ci`
o
rende interessante, nel contesto dellintegrazione impropria, approfondire alcune questioni relative
alle serie.
Ricordiamo il criterio del confronto per le serie a termini non negativi : se due successioni
reali {an } e {bn } verificano definitivamente
0 an bn
P
P
P
la convergenza
della
b
implica
quella
della
a
,
mentre
la
divergenza
della
an implica quella
n
n
P
della
bn .
Quando i termini di una serie soddisfano, da un certo punto in poi, le disuguaglianze strette
an > 0, unutile applicazione
del criterio del confronto `e il criterio del rapporto: condizione
P
sufficiente affinche
an converga `e che esista un numero % ]0, 1[ tale che
an+1 /an % per n K
dove K `e un opportuno naturale. Infatti dalle disuguaglianze
aK+1 aK %,
aK+2 aK+1 %,
17
...,
an+K an1+K %
(25)
rapporto
si ricava che
an+K an+K1 % aK+1 %n1 aK %n
P
P
e quindi che la serie n an+K `e maggiorata termine a termine dalla serie convergente n aK %n
(prodotto di una costante per la serie geometrica di ragione %). Se il rapporto an+1 /an tende a
un limite L < 1, la (25) vale con un qualunque % fissato in ]L, 1[ a patto di prendere K = K(%)
sufficientemente grande.
Esempio 5.2. (i) Siccome
1
1
n! =
0
(n + 1)!
n+1
per n
P
la serie n 1/n! P
converge (e si dimostra che la sua somma `e e).
(ii) La serie n n!/nn converge perche
n
n
(n + 1)! nn
n
1
1
=
=
< 1.
1
(n + 1)n+1 n!
n+1
n+1
e
Se an+1 /an tende a un limite L > 1 la serie diverge, perche per un opportuno N i suoi
addendi verificano an+1 /an 1 per n , e quindi a+p a per p N: viene meno la condizione
an 0 che sappiamo essere necessaria per la convergenza.
P
Se an+1 /an P1 pu`
o accadere sia che la serie converga, come la
n
con > 1, e sia che
diverga, come la
n con 1.
P E se i termini an della serie non sono di segno costante? Si pu`o passare allo studio della serie
|an | dei moduli e controllare se converge. In tal caso converge anche la serie a termini positivi
o nulli An = |an | + an , che verificano An 2|an |. Ne segue allora anche la convergenza, che
chiamiamo assoluta, della originaria serie degli an = An |an |.
Torniamo agli integrali impropri. Nella maggior parte dei casi di specifiche funzioni bisogna aspettarsi che il calcolo esplicito dei limiti che compaiono nelle formulazioni generali a secondo membro
` dunque utile poter disporre
della (21) o della (23) o della (24) si riveli semplicemente impossibile. E
di un criterio di convergenza/divergenza di integrali impropri, che riguarda funzioni non negative
e costituisce la generalizzazione del criterio del confronto per serie a termini non negativi.
tint1
Teorema 6.1 (del confronto). Siano f, g : [a, b[ R, dove < a < b , funzioni entrambe
integrabili secondo Riemann da a a B per ogni B [a, b[, con
0 f (x) g(x)
per a x < b.
(26)
18
int5
f (x) dx
a
g(x) dx.
a
Entrambi gli integrali sono funzioni crescenti della B dal momento che i loro integrandi sono 0,
e di conseguenza ammettono limite per B b . La conclusione segue subito.
Il passaggio ai casi f, g :]a, b] R con a < b < , e f, g :]a, b[ R con a < b
si fa in un attimo.
Il prossimo esempio estende, a partire dallEsempio 5.1, la classe delle funzioni su cui appoggiarsi
per lutilizzo pratico del criterio del confronto.
Esempio 6.1. (i) Lintegrale improprio su R di 1/(1 + |x| ) converge o diverge a seconda che
> 1 o 1. Per convincersene basta limitarsi alla semiretta x 1 (per 1 x 1 non ci sono
problemi e per x 1 si utilizza la simmetria del modulo): siccome
1
1
1
2x
1+x
x
per x 1
(ii) Per 1 e |x| 1 vale la maggiorazione e|x| e|x| , e quindi la convergenza del
tint2
Teorema 6.2. Per < a < b lintegrale improprio di una f : [a, b[ R, integrabile secondo
Riemann da a a B per ogni B [a, b[, se `e assolutamente convergente `e anche convergente.
DIM. Siccome
0 f + , f |f |
la convergenza dellintegrale improprio di |f | implica quella degli integrali impropri di f + e di f ,
dunque quella di f = f + f .
Il precedente enunciato non si inverte: pu`o ben accadere che un integrale improprio converga
ma non assolutamente, ovvero che converga condizionatamente.
ex32
sin x dx =
cos x
=
(2k + 1) 2k
(2k + 1)
(2k + 1)
2k
e quindi
D
Z
X
k=1
(2k+1)
2k
X
| sin x|
1
dx
= .
x
(k + 1)
k=1
la sostituzione y = x2 d`
a infatti
1
F =
2
Z
1
sin y
1
dy = J1 .
y
2
20
Il criterio del
P confronto per la convergenza/divergenza degli integrali impropri si pu`o trasportare
ad una serie n an (a termini 0) quando esiste una funzione f continua e decrescente in una
semiretta [K, [ (K N) che verifica f (n) = an e quindi an+1 f (x) an . In tal caso infatti
risulta
Z
n+1
f (x) dx an
an+1
n
da cui
f (x) dx
an+1
K
n=K
an ,
n=K
e si arriva al criterio P
integrale di convergenzaP
o divergenza per le serie: se lintegrale improprio
P di
f converge, converge n an+1 e quindi anche n an ; se lintegrale improprio di f diverge, n an
diverge.
Questo criterio pu`
o rivelarsi uno strumento prezioso quando gli altri criteri
sono di applicazione
P
un po troppo complicata. Si pensi gi`
a alla serie armonica generalizzata
n : dallEsempio 5.1
segue subito laPconvergenza o la divergenza a seconda che 1 o > 1. Ancora pi`
u illuminante
`e il caso della (n log n)1 : il confronto con le serie armoniche generalizzate non fornisce nessuna
informazione che permetta di concludere, mentre basta osservare che la funzione (x log x)1 , essendo
la derivata di log(log x), ha integrale improprio divergente, per ottenere la divergenza della serie.
Lanalogia tra P
integrali impropri e serie deve peraltro essere maneggiata con cautela. Se, ad
esempio, una serie an converge, sia pure solo semplicemente, il suo termine generale an `e infinitesimo per n , mentre se lintegrale improprio di una funzione f su un intervallo superiormente
illimitato converge non `e affatto detto che f (x) 0 per x : si pensi a f (x) = sin x2 , 1 x <
(Esempio 6.2), o ancora meglio alla funzione
f (x) =
n1[n,n+1/n3 ] (x),
n=1
addirittura illimitata su
[K, [ eppure dotata di integrale improprio assolutamente
P ogni semiretta
2 . Dunque non si pu`
1/n
o pensare di estendere dalle serie agli integrali
convergente uguale a
n=1
impropri una qualche versione puntuale! del criterio di convergenza di Cauchy (e infatti
per dimostrare col Teorema 6.2 che la convergenza assoluta implica la convergenza siamo ricorsi al
Teorema del confronto 6.1, mentre per le serie si utilizza tranquillamente Cauchy).
Anche in pi`
u variabili luniforme continuit`
a in C segue, senza passare per HeineCantor, da propriet`
a pi`
u forti
della continuit`
a, come la lipschitzianit`
a. Ma questultima, senza qualche ulteriore ipotesi su C, come ad esempio la
convessit`
a che consente di applicare su ogni segmento contenuto in C il Teorema del valor medio in una variabile,
non `e pi`
u a sua volta conseguenza automatica della regolarit`
a C1.
21
T6
Teorema 7.1. Sia f una funzione continua in I [c, d] con I intervallo chiuso e limitato, <
c < d < . Allora
Z d
F (x) =
f (x, t) dt
c
`e continua in I. Se poi si suppone che per ogni t [c, d] esista la derivata fx (x, t) di I 3 x 7 f (x, t)
e che fx C 0 (I [c, d]), allora anche F `e dotata di derivata continua
Z d
fx (x, t) dt
(27)
F 0 (x) =
in I.
DIM. Siano x0 , x I. Grazie alluniforme continuit`a della funzione f nel rettangolo chiuso e
limitato I [c, d] possiamo associare ad ogni > 0 un = > 0 tale che
|f (x, t) f (x0 , t)|
per t [c, d]
ottenere
Z
|F (x) F (x0 )|
(28)
fx (x0 , t) dt =
fx (x0 , t) dt
h
h
c
c
Z d
=
[fx (x0 + h, t) fx (x0 , t)] dt
c
otteniamo
Z d
Z b
F (x0 + h) F (x0 )
fx (x0 , t) dt
|fx (x0 + h, t) fx (x0 , t)| dt < (d c).
h
a
c
A questo punto la (27) per x = x0 segue dallarbitrariet`a di . Applicando poi a fx (x, t) il precedente
risultato di continuit`
a si ottiene anche la continuit`a di F 0 in I.
22
Naturalmente nel Teorema 7.1 gli estremi di integrazione possono essere scambiati tra di loro:
questo significa semplicemente passare da F e F 0 a G = F e G0 = F 0 .
Adesso facciamo variare gli estremi di integrazione.
T66
(29)
Se poi si aggiunge lipotesi che per ogni t [c, d] esista la derivata fx (x, t) di I 3 x 7 f (x, t) e che
fx C 0 (I [c, d]), allora per ogni (y, z) [c, d] [c, d] la I 3 x 7 (x, y, z) `e dotata anche della
derivata
Z z
x (x, y, z) =
fx (x, t) dt,
(30)
(31)
z0
Osservazione 7.1. Nelle due precedenti dimostrazioni `e stata utilizzata lipotesi che I sia, oltre
che chiuso, anche limitato. Per`
o esse si ripetono tali e quali con le intersezioni [x0 r, x0 + r] I,
r > 0, al posto di I, per cui i Teoremi 7.1 e 7.2 continuano a valere con lintervallo I chiuso ma
non limitato.
23
Teorema 7.3. Sia f C 0 (I [c, d]) con I intervallo chiuso, < c < d < , e siano ,
C 0 (I) tali che c (x), (x) d. La funzione
Z (x)
f (x, t) dt
G(x) =
(x)
`e continua su I; se poi si aggiungono le ipotesi che per ogni t [c, d] esista la derivata fx (x, t) di
I 3 x 7 f (x, t) continua in I [c, d] e che , appartengano a C 1 (I), allora G `e dotata di derivata
continua
Z
G0 (x) =
(x)
(x)
in I.
DIM. Continuit`
a della funzione composta G(x) = (x, (x), (x)); derivabilit`a della funzione
composta (dal momento che `e C 1 ), e dunque
G0 (x) = x (x, (x), (x)) + y (x, (x), (x))0 (x) + z (x, (x), (x)) 0 (x),
poi le (29) e la (30).
Il Teorema 7.3 ha unapplicazione importante nel metodo di Duhamel per la risoluzione di
equazioni differenziali lineari non omogenee a coefficienti costanti. Cominciamo dal I ordine. Per
a R e f C 0 (]c, d[) si verifica in un attimo che la funzione
Z t
y(t) =
ea(ts) f (s) ds
(32)
ord1
t0
soddisfa lequazione lineare y 0 + ay = f (t) (insieme alla condizione di Cauchy y(t0 ) = 1): non c`e
bisogno di ricorrere al Teorema 7.3, visto che il secondo membro si riscrive
Z t
at
e
eas f (s) ds
t0
con lintegrando che non dipende dal parametro t, e di conseguenza si deriva elementarmente.
Tuttavia la (32) `e istruttiva, perche fornisce al I ordine la formula di Duhamel
Z t
y(t) =
Y (t s)f (s) ds
(33)
t0
con Y (t) che qui denota la soluzione eat dellequazione omogenea Y 0 + aY = 0 che soddisfa la
condizione di Cauchy Y (0) = 1.
Passiamo al II ordine.
TDu
Teorema 7.4. Siano a, b R, f C 0 (]c, d[). La funzione (33) con Y (t) soluzione del problema di
Cauchy
Y 00 + aY 0 + bY = 0, Y (0) = 0, Y 0 (0) = 1
`e una soluzione dellequazione non omogenea
y 00 + ay 0 + by = f (t),
e pi`
u esattamente lunica ad annullarsi in t0 insieme alla sua derivata prima.
24
(34)
Du
DIM. Adesso bisogna applicare, per due volte, la regola di derivazione degli integrali dipendenti da
un parametro. Si ottiene prima
Z t
Z t
0
0
Y 0 (t s)f (s) ds,
Y (t s)f (s) ds =
y (t) = Y (0)f (t) +
t0
t0
poi
00
00
Y 00 (t s)f (s) ds
t0
t0
e infine
00
t0
cio`e la tesi. (Abbiamo utilizzato lequazione omogenea soddisfatta da Y nei punti t s.)
Esempio 7.1. Sia b R. Lintegrale generale dellequazione
y 00 + by = f (t)
vale
c1 sin t b + c2 cos t b +
t0
sin (t s) b
f (s) ds
b
t b
+ c2 e
t b
e(ts)
t0
e(ts)
2 b
f (s) ds
per b < 0.
Prendiamo in particolare b = 1, f (t) = 1/ cos t per /2 < t < /2. La funzione (33) con
t0 = 0 `e allora
Z t
Z t
Z t
sin(t s)
sin t cos s cos t sin s
sin s
ds =
ds = t sin t cos t
ds
cos s
cos s
0
0
0 cos s
= t sin t + cos t log(cos t).
Il metodo di Duhamel che abbiamo finora illustrato per le equazioni del I e del II ordine
si trasporta immediatamente a un qualunque ordine N : per a0 , . . . , aN 1 R e f C 0 (]c, d[)
lequazione
y (N ) + aN 1 y (N 1) + + a1 y 0 + a0 y = f (t)
`e soddisfatta dalla funzione y(t) che ha lespressione (33) con Y (t) soluzione adesso dellomogenea
Y (N ) + aN 1 Y (N 1) + + a1 Y 0 + a0 Y = 0
che soddisfa le condizioni di Cauchy Y (0) = Y 0 (0) = = Y (N 2) (0) = 0, Y (N 1) (0) = 1. La
verifica troppo lunga! si fa con N derivazioni successive attraverso il Teorema 7.3. Qui ci
limitiamo ad osservare che nel caso particolarissimo a0 = = aN 1 = 0 la funzione Y (t) richiesta
`e la tn1 /(n 1)!, per cui
Z t
1
y(t) =
(t s)n1 f (s) ds
(n 1)! t0
`e la soluzione di y (N ) = f (t) che si annulla in t0 insieme a tutte le sue derivate fino all(n1)esima.
25
per n ,x .
Prescindendo dalla conoscenza delleventuale limite F (x), la condizione necessaria e sufficiente per
la convergenza di {Fn (x)} `e fornita dal criterio di Cauchy: dato comunque > 0, esiste un ,x N
tale che
|Fn (x) Fn+p (x)| per n ,x , p N.
Se poi ci interessiamo alla eventuale convergenza di ogni successione numerica {Fn (x)} al variare
di x I detta convergenza puntuale delle Fn in I , le precedenti formule rimangono
inalterate: laspetto cruciale `e che ci si accontenta di poter appurare per ogni e per ogni x
lesistenza di quellindice denotato appunto ,x .
Adesso introduciamo una nozione pi`
u stringente, richiedendo lesistenza di tale indice ancora in
dipendenza da , ma non pi`
u da x. Diciamo dunque che le Fn convergono uniformemente7 in
I a una funzione F se, dato comunque > 0, esiste un N tale che
|Fn (x) F (x)| per x I, n
(35)
unif
(36)
unifsup
unifcau
ovvero
xI
La condizione `e anche sufficiente per la convergenza uniforme, e viene detta criterio uniforme
di Cauchy: da essa segue essa infatti la convergenza puntuale ad una F (x), e passando al limite
per p si ottiene la (35).8
Il prossimo teorema fornisce condizioni sufficienti per scambiare tra di loro il segno di limite per
n con quello di limite per x x0 , con quello di integrale e con quello di derivata.
T6
Per laffinit`
a concettuale con la continuit`
a uniforme di una funzione in un intervallo cfr. la Sezione 4.
Se avessimo optato per la richiesta delle disuguaglianze forti < invece di quelle deboli, assolutamente equivalenti
per larbitrariet`
a di > 0, ci saremmo procurati qualche inutile complicazione, sia pur di minimo conto.
8
26
unif
(iii) Se le funzioni Fn : I R sono di classe C 1 in I, con {Fn (x0 )} convergente per qualche
scelta di x0 I e le Fn0 uniformemente convergenti in I, allora in I esiste F = limn Fn di classe
C 1 , con
F 0 (x) = lim Fn0 (x) per x I.
(39)
n
unif
DIM. (i) Fissiamo arbitrariamente un > 0 e associamogli N in modo che valga la (35). Grazie
allipotesi di continuit`
a di ogni Fn in x0 esiste un = , > 0 tale che
|F (x) F (x0 )| < per x I,
|x x0 | < .
F
(x)
dx
|F
(x)
F
(x)|
dx
n
n
a
Ma allora F (x) = limn Fn (x) esiste e assume il valore (40) per ogni x, da cui = F (x0 ) e, derivando,
G(x) = F 0 (x).
Osservazione 8.1. Nel punto (i) del teorema lipotesi di uniforme convergenza delle Fn `e essenziale,
come si vede con semplicissimi esempio: per dirne uno, quello gi`a visto delle funzioni continue
Fn (x) = xn , ma stavolta per x I = [0, 1], che convergono puntualmente alla funzione discontinua
che vale 0 per x [0, 1[ e ad 1 per x = 1. Invece sia la (38) e sia la (39) valgono sotto ipotesi molto
pi`
u deboli delluniforme convergenza rispettivamente delle Fn e delle Fn0 .
27
unif
Teorema 9.1. Sia f una funzione continua in I]c, d[ con I intervallo chiuso, c < d .
Supponiamo che
|f (x, t)| g(t) per (x, t) I]c, d[
(41)
con g funzione reale 0 dotata di integrale improprio (assolutamente) convergente su ]c, d[. Allora
la funzione
Z d
I 3 x 7 F (x) =
f (x, t) dt
c
`e continua. Se poi si aggiungono le ipotesi che per ogni t ]c, d[ esista la derivata fx (x, t) di
I 3 x 7 f (x, t), che fx C 0 (I]c, d[) e che valga una disuguaglianza
|fx (x, t)| g(t)
(42)
eS
F (x) =
fx (x, t) dt.
c
DIM. Innanzitutto, la (41) garantisce, grazie al Teorema del confronto, che per ogni fissato x I
la funzione t 7 f (x, t) ha integrale improprio assolutamente convergente da c a d. Dunque F (x) `e
ben definita. Studiamo la sua regolarit`a al variare di x in I.
Siano {cn }, {dn } ]c, d[ tali che cn c e dn d.
Dal Teorema 7.1 (e alla luce dellOsservazione 7.1 se I `e illimitato) sappiamo che per ogni n la
funzione
Z
dn
I 3 x 7 Fn (x) =
f (x, t) dt
(43)
param
cn
`e continua. Daltra parte, dalla convergenza dellintegrale improprio di g segue che, dato comunque
> 0, esiste un = N tale che
Z
cn
g(t) dt per n .
g(t) dt +
c
(44)
dn
Dunque la (41), oltre a garantire che per ogni x I la funzione t 7 f (x, t) `e dotata di integrale improprio assolutamente convergente, ovvero che F (x) `e ben definita, fornisce anche la
disuguaglianza
Z cn
Z d
|f (x, t)| dt +
|f (x, t)| dt per x I, n .
c
dn
Ma allora
Z
|F (x) Fn (x)|
cn
Z
f (x, t) dt +
dn
f (x, t) dt per x I, n .
Ne segue che in I la successione delle funzioni continue Fn (x) converge uniformemente in I ad F (x),
e quindi (Teorema 8.1 (i)) che questultima `e continua.
28
eqg
Fn0 (x) =
fx (x, t) dt.
cn
Dalla (42) segue poi che per ogni x I la funzione t 7 fx (x, t) `e dotata di integrale improprio
assolutamente convergente, ovvero che la funzione
d
Z
I 3 x 7 G(x) =
fx (x, t) dt
c
`e ben definita; inoltre G C 0 (I) grazie alla prima parte del teorema.
Sia > 0 arbitrariamente fissato, e sia di nuovo = N tale che valga la (44). Allora risulta
Z
cn
per x I, n
dn
per cui
|G(x)
Fn0 (x)|
cn
Z
fx (x, t) dt +
dn
fx (x, t) dt per x I, n .
Ne segue che la successione delle funzioni continue Fn0 (x) converge uniformemente a G(x), e quindi
(Teorema 8.1 (iii)) F (x) = limn Fn (x) `e derivabile con F 0 (x) = G(x).
Naturalmente non `e affatto restrittivo richiedere che le disuguaglianze (41) e (42) valgano con
la stessa funzione g(t): se si parte da due diverse funzioni nei secondi membri basta prendere la
loro somma per ricondursi alle ipotesi del teorema.
Esempio 9.1. Fissiamo x in I = [a, [, a > 0. Su ]c, d[=]0, [ sia la funzione t 7 f (x, t) =
t1 etx sin t che la sua derivata t 7 fx (x, t) = etx sin t sono maggiorate in modulo dalla funzione
continua g(t) = eta , che ha integrale improprio assolutamente convergente. Dunque la
Z
sin t
F (x) =
etx
dt
t
0
`e continua e anzi derivabile per x a, con
F 0 (x) =
Esempio 9.2. La funzione f (x, t) = xext soddisfa tutte le ipotesi del Teorema 7.1 con I = R e
[c, d] qualunque. Si pu`
o dedurre da questo che il suo integrale di Riemann su [c, d] `e una funzione
continua, anzi derivabile della x; pi`
u direttamente, basta tener conto che xext = (ext )0 e
applicare il Teorema Fondamentale del Calcolo. Invece
Z
F (x) =
xext dt = ext
0
29
F (x) = 1
per x > 0
(e in qualunque intervallo [0, b] si ha convergenza puntuale ma non uniforme delle funzioni continue
Z n
n
Fn (x) =
xext dt = ext = 1 enx
0
a F (x): cfr il Teorema 8.1 (i)). Infatti non si applica il Teorema 9.1: non esiste una funzione
]0, [3 t 7 g(t) dotata di integrale improprio convergente e tale che valga la (41), dal momento che
per 1/t b il max0xb xext si ottiene per x = 1/t e vale (et)1 , sicche una qualunque g(t) xext
per (x, t) R [0, [ non pu`
o essere integrabile in quanto deve verificare g(t) (et)1 .
Per gli integrali impropri semplicemente convergenti non vale il teorema di derivazione sotto il
segno di integrale, come mostra il seguente
Esempio 9.3. Per x > 0 la funzione
Z
F (x) =
0
sin tx
dt
t
R
assume costantemente il valore dellintegrale improprio semplicemente convergente 0 [(sin u)/u] du,
come si vede operando il cambiamento u = tx della variabile dintegrazione. Dunque F 0 (x) = 0,
mentre lintegrale improprio della derivata della funzione x 7 (sin tx)/t, cio`e di cos tx, non solo
non vale identicamente 0, ma non `e neppure convergente.
10
tutto Z, essendo la circonferenza di centro lorigine e raggio r, sia un grafico. Per`o Z `e localmente
grafico di una funzione o della x oppure della y (senza che un caso escluda necessariamente laltro).
Vediamo i dettagli.
In un opportuno intorno aperto A di un punto (x0 , y0 ) Z tale che Fy (x0 , y0 ) = 2y0 6= 0,
per cui la retta tangente
alla circonferenza
e quindi x0 = r o x0 = r, non esiste nessun intorno del punto, per quanto piccolo, la cui
intersezione con Z sia grafico di una funzione della x.
In un opportuno intorno aperto A di di un punto (x0 , y0 ) Z tale che Fx (x0 , y0 ) = 2x0 6= 0,
per cui la retta tangente p
alla circonferenza nelppunto non `e orizzontale, i punti di Z sono
quelli del grafico di x = r y 2 o di x = r y 2 a seconda che x0 > 0 (e allora A `e
lintero semipiano delle x > 0) o x0 < 0 (e allora A `e lintero semipiano delle x < 0). Invece
non esiste nessun intorno, per quanto piccolo, del punto (0, r) o del punto (0, r) la cui
intersezione con Z sia grafico di una funzione della y.
Il precedente esempio illustra significativamente il caso di una classe abbastanza generale di
equazioni F (x, y) = 0, tranne per un aspetto (non di poco conto). Come vedremo col prossimo
risultato, infatti, sotto opportune ipotesi esiste un intorno di una soluzione (x0 , y0 ) dellequazione
in cui questultima definisce implicitamente una delle due variabili come funzione dellaltra, nel
senso che le soluzioni dellequazione che cadono nellintorno sono tutti e soli punti del grafico di
tale funzione; di questultima per`
o sar`
a impossibile, in genere, dare unespressione esplicita come
invece si `e facilmente fatto nellesempio.
t6.1
Teorema 10.1 (di Dini). Sia F di classe C 1 in un aperto di R2 . Supponiamo che per un
(x0 , y0 ) risulti F (x0 , y0 ) = 0 e Fy (x0 , y0 ) 6= 0. Allora esistono , > 0 tali che in A =
]x0 , x0 + []y0 , y0 + [ (la Fy si mantiene 6= 0 e) lequazione F (x, y) = 0 definisce
implicitamente una funzione y = f (x) continua, ed anzi di classe C 1 ; la derivata di f si ottiene
derivando rispetto ad x lidentit`
a F (x, f (x)) = 0, da cui Fx (x, f (x)) + Fy (x, f (x))f 0 (x) = 0 e quindi
f 0 (x) =
Fx (x, f (x))
Fy (x, f (x))
31
per |x x0 | < .
(45)
der
DIM. Per fissare le idee supponiamo Fy (x0 , y0 ) > 0. Grazie alla continuit`a della Fy in possiamo
applicarle il Teorema della permanenza del segno e trovare due numeri reali positivi a e con
la seguente propriet`
a: per |x x0 | a e |y y0 | risulta Fy (x, y) > 0, e di conseguenza ogni
funzione y 7 F (x, y) ad x fissato `e crescente. Poiche F (x0 , y0 ) = 0, questo implica F (x0 , y0 ) < 0
e F (x0 , y0 + ) > 0. Applichiamo di nuovo il Teorema della permanenza del segno, questa volta
alle due funzioni x 7 F (x, u0 ) e x 7 F (x, y0 + ): se = a `e un numero reale positivo
sufficientemente piccolo (per intendersi, tanto pi`
u piccolo quanto pi`
u piccolo `e ) abbiamo sia
F (x, y0 ) < 0 che F (x, y0 + ) > 0 per x nellintervallo chiuso [x0 , x0 + ]. Fissiamo la x
nellintervallo aperto 9 ]x0 , x0 +[ ed applichiamo il Teorema di esistenza degli zeri alla funzione
continua e strettamente monotona y 7 F (x, y): otteniamo
F (x, f (x)) = 0
per un unico valore f (x) strettamente compreso tra y0 e y0 + , cio`e tale che
|f (x) y0 | < .
(46)
cont
Naturalmente f (x0 ) = y0 .
Passiamo alla dimostrazione della (49). Come `e detto nellenunciato, essa segue subito dallidentit`a F (x, f (x)) = 0 in ]x0 , x0 + [ grazie alla regola di derivazione delle funzioni composte,
a patto per`
o di sapere preliminarmente che f `e derivabile, cosa questa che non abbiamo ancora fatto vedere. Cominciamo col mostrare la continuit`a di f in ]x0 , x0 + [. Per x fissato
in ]x0 , x0 + [ si ha anche x + h ]x0 , x0 + [, e quindi (x + h, f (x + h)) A, se |h|
`e sufficientemente piccolo, diciamo |h| < k. Il teorema del valor medio applicato alla funzione
t 7 (t) = F (x + th, f (x) + t(f (x + h) f (x))) assicura lesistenza di un ]0, 1[ tale che
F (x + h, f (x + h)) F (x, f (x)) = (1) (0) = 0 ( )
= Fx (x + h, f (x) + (f (x + h) f (x)))h + Fy (x + h, f (x) + (f (x + h) f (x)))(f (x + h) f (x)).
Il primo membro di questa identit`
a `e nullo, e dividendo per Fy (x + h, f (x) + (f (x + h) f (x)))
m = minA Fy > 0, otteniamo
f (x + h) f (x) =
Fx (x + h, f (x) + (f (x + h) f (x)))
h.
Fy (x + h, f (x) + (f (x + h) f (x)))
(47)
Il secondo membro si maggiora in modulo con M |h|/m dove M = maxA |Fx |, e questo mostra la
continuit`a di f nel punto x. Grazie ad essa la frazione nel secondo membro `e il rapporto di due
funzioni continue di h ] k, k[. Dividiamo entrambi i membri della (47) per h 6= 0: otteniamo
Fx (x + h, f (x) + (f (x + h) f (x)))
f (x + h) f (x)
=
h
Fy (x + h, f (x) + (f (x + h) f (x)))
e quindi la derivabilit`
a di f facendo tendere h a 0.
9
Naturalmente qui anche lintervallo chiuso andrebbe bene. Per`
o quando poi si passer`
a dalla variabile scalare x
ad una vettoriale far`
a comodo limitare questultima ad un aperto, in modo di poterle associare senza difficolt`
a la
nozione di regolarit`
a C 1 che nei chiusi diventa delicata se le variabili sono pi`
u di una.
32
incr
Tutte le funzioni del secondo membro sono calcolate in (x, f (x)), per cui `e dato il loro valore per
x0 = 0: adesso disponiamo dei valori non solo di f (x0 ) e di f 0 (x0 ), ma anche di f 00 (x0 ). Cos`
procedendo (beninteso nei limiti dellumanamente, e anche numericamente, possibile) possiamo
pensare di arrivare a dare alla f un buono sviluppo di Taylor di punto iniziale x0 .
Osservazione 10.3. Abbiamo visto che se F appartiene a C 1 (), dove `e un aperto di R2 , e
per un (x0 , y0 ) A verifica F (x0 , y0 ) = 0, Fy (x0 , y0 ) 6= 0, allora esiste un intorno di (x0 , y0 ) in cui
linsieme di livello F = 0 coincide col grafico di una funzione y = f (x) di classe C 1 , cio`e con una
curva dotata in (x0 , y0 ) di retta tangente di equazione
y y0 = f 0 (x0 )(x x0 )
ovvero
y y0 =
Fx (x0 , y0 )
(x x0 )
Fy (x0 , y0 )
e quindi
Fx (x0 , y0 )(x x0 ) + Fy (x0 , y0 )(y y0 ) = 0.
(48)
Per ottenere lequazione (48) della retta tangente in (x0 , y0 ) alla curva F = 0 abbiamo utilizzato
il Teorema di Dini sotto lipotesi Fy (x0 , y0 ) 6= 0. Per`o saremmo arrivati allo stesso risultato sotto
lipotesi Fx (x0 , y0 ) 6= 0. Dunque possiamo concludere che ogni punto (x0 , y0 ) di in cui F si
annulla e il gradiente10 (Fx , Fy ) = F non `e il vettore nullo ha un intorno nel quale lequazione
F = 0 definisce una curva regolare con retta tangente (al sostegno) in (x0 , y0 ) data dallequazione
(48) o, ci`o che `e lo stesso, con retta normale di direzione F (x0 , y0 ).
10
Ricordiamo che il gradiente di una funzione u di classe C in un aperto del piano ha, in ogni punto in cui non si
annulla, la direzione e il verso di massima crescita di u. Infatti la derivata in (x0 , y0 ) di u lungo una direzione (, ),
2 + 2 = 1, cio`e 0 (t) = du(x0 +t, y0 +t)/dt calcolata in t = 0, vale, grazie alla disuguaglianza di CauchySchwarz,
p
0 (0) = ux (x0 , y0 ) + uy (x0 , y0 ) ux (x0 , y0 )2 + uy (x0 , y0 )2
col segno = se e solo se (, ) = u(x0 , y0 )/ku(x0 , y0 )k.
33
4.1
Il Teorema di Dini per le funzioni scalari di 2 variabili si estende con ovvie modifiche alle funzioni
di un qualunque numero di variabili. Per le funzioni di 3 variabili, ad esempio, abbiamo il
t4.1
fy (x, y) =
per (x, y) A0 .
(49)
der
Naturalmente questo teorema continua a valere con la variabile z sostituita dalla x o dalla y
nellipotesi che sia diversa da 0 la corrispondente derivata di F nel punto, eccetera.
Osservazione 10.4. Occupiamoci dellequazione F (x, y, z) = 0. Se F appartiene a C 1 () con
aperto di R3 e in un punto (x0 , y0 , z0 ) di si ha F (x0 , y0 , z0 ) = 0, Fz (x0 , y0 , z0 ) 6= 0, il Teorema
10.2 con N = 2 afferma che esiste un intorno di (x0 , y0 , z0 ) in cui linsieme di livello F = 0 coincide
col grafico di una funzione z = f (x, y) di classe C 1 , cio`e con una superficie dotata in (x0 , y0 , z0 ) di
piano tangente di equazione
z z0 = fx (x0 , y0 )(x x0 ) + fy (x0 , y0 )(y y0 )
ovvero
z z0 =
Fy (x0 , y0 , z0 )
Fx (x0 , y0 , z0 )
(x x0 )
(y y0 )
Fz (x0 , y0 , z0 )
Fz (x0 , y0 , z0 )
e quindi
Fx (x0 , y0 , z0 )(x x0 ) + Fy (x0 , y0 , z0 )(y y0 ) + Fz (x0 , y0 , z0 )(z z0 ) = 0.
(50)
4.1
Per ottenere lequazione (50) del piano tangente in (x0 , y0 , z0 ) alla superficie F = 0 abbiamo
utilizzato il Teorema di Dini sotto lipotesi Fz (x0 , y0 , z0 ) 6= 0. Per`o saremmo arrivati allo stesso
risultato sotto lipotesi Fx (x0 , y0 , z0 ) 6= 0 o lipotesi Fy (x0 , y0 , z0 ) 6= 0. Possiamo dunque affermare
che ogni punto (x0 , y0 , z0 ) di in cui F si annulla e F non `e il vettore nullo ha un intorno nel
quale lequazione F = 0 definisce una superficie con piano tangente (al sostegno) in (x0 , y0 , z0 ) dato
dallequazione (50) o, ci`
o che `e lo stesso, con retta normale di direzione F (x0 , y0 , z0 ).
11
34
pia
delle equazioni di due piani. Se i due piani sono paralleli, ovvero la matrice jacobiana
(F, G)
Fx Fy Fz
a b c
=
= 0 0 0
Gx Gy G z
a b c
(x, y, z)
ha rango 1, la loro intersezione o `e vuota o coincide con entrambi. Supponiamo che il rango sia 2,
diciamo con
(F, G)
Fy Fz
b c
= det
= det 0 0 6= 0
(52)
det
Gy G z
b c
(y, z)
pia
per fissare le idee. Le soluzioni di (51) sono allora tutti e soli i punti di una retta, e possiamo
risolvere il sistema (52) rispetto a y e z (come funzioni di x, ovviamente). Procedendo con lalgebra
lineare otteniamo y = f (x) e z = g(x) da
(F, G) 1 ax + d
f (x)
=
.
g(x)
a0 x + d0
(y, z)
Ma possiamo anche ricorrere alle elementari tecniche di sostituzioni successive. Dalla prima delle
equazioni (51), supponendo (non `e restrittivo) c 6= 0 ricaviamo z = (ax by d)/c; sostituendo
nella seconda equazione otteniamo
a0 x + b0 y +
da cui
c0 (ax by d)
+ d0 = 0
c
bc0
ac0
c0 d
b0
y + a0
x + d0
= 0.
c
c
c
Grazie allipotesi (52) il coefficiente di y in questa equazione `e diverso da 0, per cui possiamo
scrivere la y come funzione di x e poi, sostituendola nella precedente espressione della z, ottenere
anche questultima come funzione di x. A questo punto non abbiamo bisogno di esplicitare i calcoli
rimanenti. Quello che interessa `e vedere come le sostituzioni successive permettano di abbordare
lo studio di un pi`
u generale sistema di 2 equazioni scalari in 3 variabili
F (x, y, z) = 0
(53)
G(x, y, z) = 0
indicando con (x0 , y0 , z0 ) una sua soluzione. Abbiamo bisogno di ipotesi che consentano di operare
i seguenti passaggi:
mostrare, servendosi del Teorema 10.2, che in un opportuno intorno (tridimensionale) di
(x0 , y0 , z0 ) la prima delle (53) definisce implicitamente una funzione z = (x, y) di classe C 1 ,
con (x0 , y0 ) = z0 ;
mostrare, servendosi del Teorema 10.1, che in un opportuno intorno (bidimensionale) di
(x0 , y0 ) lequazione (x, y) = G(x, y, (x, y)) = 0 definisce implicitamente una funzione
y = f (x) di classe C 1 , con f (x0 ) = y0 .
Arrivati qui ci basta porre g(x) = (x, f (x)) per verificare che in un opportuno intorno (tridimensionale) di (x0 , y0 , z0 ) il sistema (53) definisce implicitamente due funzioni scalari
y = f (x),
35
z = g(x)
ee4.2
(54)
con largomento delle funzioni uguale a x nel primo membro ed a (x, f (x), g(x)) nel secondo.
Lipotesi che consente di effettuare i passaggi richiesti `e la trasposizione al caso generale della
(52):
(F, G)
Fy (x0 , y0 , z0 ) Fz (x0 , y0 , z0 )
det
6= 0.
(55)
(x0 , y0 , z0 ) = det
Gy (x0 , y0 , z0 ) Gz (x0 , y0 , z0 )
(y, z)
side
e4.4
Infatti la (55) implica innanzitutto che in (x0 , y0 , z0 ) una almeno delle derivate Fy , Fz sia diversa da
0, e non `e restrittivo supporre che si tratti della Fz . Dunque il Teorema 10.2 pu`o essere applicato
e fornisce lesistenza della , che inoltre sappiamo derivare, in particolare rispetto ad y:
y =
Fy
.
Fz
Calcoliamo
y = Gy + Gz y = Gy Gz
Fy
1
(F, G)
.
= det
Fz
Fz
(y, z)
Grazie di nuovo alla (55), otteniamo y (x0 , y0 ) 6= 0 e possiamo applicare il Teorema 10.1 per
ottenere lesistenza della f . Dunque:
Teorema 11.1. Siano F, G di classe C 1 in un aperto di R3 . Supponiamo che per un (x0 , y0 , z0 )
risulti F (x0 , y0 , z0 ) = G(x0 , y0 , z0 ) = 0 e che valga la (55). Allora esiste un intorno aperto
tridimensionale A di (x0 , y0 , z0 ) in cui (il determinante di (F, G)/(y, z) si mantiene 6= 0 e)
il sistema (53) definisce implicitamente due funzioni y = f (x), z = g(x) di classe C 1 , con f 0 e g 0
date dalla (54).
Con un po pi`
u di sforzo, ma con la stessa tecnica di base, il precedente teorema si generalizza
cos`:
diffeomo
diffeomo_1
definisce implicitamente due funzioni u = f (x, y), v = g(x, y) di classe C 1 , con f e g dati da
1
fx fy
Fu Fv
Fx Fy
=
gx gy
Gu Gv
Gx G y
con largomento delle funzioni uguale a (x, y) nel primo membro ed a (x, y, f (x, y), g(x, y)) nel
secondo.
Per illustrare unimportantissima conseguenza del Teorema 11.2 ricordiamo innanzitutto che su
un aperto B di RN un diffeomorfismo (= applicazione iniettiva B RN di classe C 1 con inversa di
classe C 1 ) deve avere matrice jacobiana invertibile su tutto B. Possiamo formulare la congettura
che, viceversa, ogni applicazione B RN di classe C 1 con matrice jacobiana invertibile su tutto B
sia un diffeomorfismo di B? In questi termini ovviamente no: gi`a per N = 1 si danno facilmente
dei controesempi quando B non `e un intervallo. Per`o `e vero che, se B `e un intervallo di R, una
funzione reale di classe C 1 con derivata sempre diversa da 0, quindi sempre positiva o sempre
negativa, `e dotata in tutto B di funzione inversa di classe C 1 . Ebbene, questo risultato globale non
si estende alle dimensioni N > 1, a prescindere dalla regolarit`a (ad esempio la convessit`a) che si
pu`o pensare di imporre a B: basta pensare alla funzione (r, ) 7 (r cos , r sin ), che ha in ogni
punto (r, ) B =]0, [R matrice jacobiana di determinante r > 0 e quindi invertibile, ma per
ogni fissato r `e periodica in e dunque non iniettiva su tutto il suo dominio B.
Il risultato generale che vale in dimensione N maggiore di 1 `e di natura locale, e per N = 2 segue
dal Teorema 11.2, di cui riprendiamo le notazioni. Infatti invertire unapplicazione : B R2 ,
di componenti x = (u, v) e y = (u, v), significa ottenere una coppia di funzioni u = (x, y),
v = (x, y) definite implicitamente dal sistema (56) con A = R2 B e F (x, y, u, v) = x (u, v),
G(x, y, u, v) = y (u, v). Ma noi abbiamo visto che vicino ad un punto (x0 , y0 , u0 , v0 ) con
x0 = (u0 , v0 ) e y0 = (u0 , v0 ) questo `e possibile se nel punto lo jacobiano di , cio`e il determinante
della matrice jacobiana (F, G)/(u, v), `e diverso da 0. Abbiamo cos` dimostrato per N = 2 un
risultato, che enunciamo senza dimostrarlo in tale generalit`a, per N qualunque:
diffeomo
Sia S R3 . Allora `e equivalente richiedere che, vicino ad un suo punto, S sia il grafico di
una funzione C 1 di 2 variabili o il sostegno di una superficie regolare o linsieme di livello di una
funzione C 1 di 3 variabili con gradiente 6= (0, 0, 0) nel punto.
12
Quando A `e un aperto di R2 la ricerca dei punti iin cui una f C 1 (A) pu`
o assumere valori estremi
cio`e massimi o minimi locali va ristretta innanzitutto ai punti stazionari, in cui il gradiente
f `e nullo.11
E se si `e interessati agli estremi di f non in tutto A, bens` in un suo sottoinsieme chiuso E
(ad esempio sotto lulteriore ipotesi che E sia limitato, per cui ogni funzione in C 0 (E) `e senzaltro
dotata di massimo e minimo assoluti grazie al teorema di Weierstrass)? Il procedimento appena
visto in A rimane valido nellinterno (se non `e vuoto) di E, ma diventa inapplicabile sulla sua
frontiera. L` bisogna, quando `e possibile, ricorrere alle altre tecniche che costituiscono largomento
di questa sezione.
Indichiamo dunque con S una curva contenuta in A (quale potrebbe ad esempio essere una
porzione della frontiera dellinsieme E di cui si `e precedentemente parlato). Con lutilizzo del
termine tra virgolette intendiamo dire che i punti (x, y) S costituiscono:
(i) o limmagine di un intervallo I in una rappresentazione parametrica t 7 ((t), (t)) di classe
1
C con 0 (t)2 + 0 (t)2 > 0,
(ii) o il grafico di una funzione y = (x) oppure x = (y) di classe C 1 in un intervallo I,
(iii) o un sottoinsieme S dellinsieme di livello F (x, y) = 0 di una F C 1 (A) con F 6= 0 in S.
Nei casi (i) e (ii) la ricerca degli estremanti di una f C 1 (A) sul vincolo S si restringe alla
ricerca dei punti stazionari di funzioni di una variabile. Come `e facile vedere, infatti, richiedere
che un punto (x, y) S sia, per fissare le idee, un massimo locale di f |S , cio`e che tutti i punti di
S (non di A!) distanti da (x, y) meno di un opportuno > 0 soddisfino f (x, y) f (x, y), significa
richiedere:
o (caso (i)) che t I con ((t), (t)) = (x, y) sia un massimo locale di g(t) = f ((t), (t)), e
quindi
g 0 (t) = fx (x, y)0 (t) + fy (x, y) 0 (t) = 0
se t `e interno ad I;
o (primo sottocaso di (ii)) che x I con (x) = y sia un massimo locale di g(x) = f (x, (x)),
e quindi
(57)
g 0 (x) = fx (x, y) + fy (x, y) 0 (x) = 0
se x `e interno ad I;
11
Ricordiamo che se f C 2 (A) la ricerca va ulteriormente ristretta, escludendo quei punti stazionari in cui la
matrice hessiana
fxx fxy
fxy fyy
non `e semidefinita, ovvero siccome siamo in R2 ha determinante < 0; un punto stazionario in cui invece
lhessiana ha determinante > 0 `e di minimo locale o di massimo locale a seconda che in esso la fxx sia > 0 o < 0.
38
lag1
o (secondo sottocaso di (ii)) che y I con (y) = x sia un massimo locale di g(y) = f ((y), y),
e quindi
g 0 (y) = fx (x, y)0 (y) + fy (x, y) = 0
(58)
se y `e interno ad I.
Esempio 12.1. In A = R2 la regolarissima funzione f (x, y) = x + y 2 `e priva di punti stazionari
perche fx non si annulla mai. Dunque non esistono punti di estremo relativo di f in A. Per`
o la
restrizione f |E di f ad un qualunque sottoinsieme chiuso e limitato E del piano `e dotata di massimo
e minimo assoluti. Prendiamo
E = {(x, y) R2 | y x y, x2 + y 2 1}.
Per quello che abbiamo appena visto, gli estremi di f |E non possono cadere allinterno di E.
Scriviamo la frontiera di E come unione dei tre insiemi
S1 = {(x, y) E | x2 + y 2 = 1},
S2 = {(x, y) E | y = x},
S3 = {(x, y) E | y = x}.
2
cos /3 + sin2 /3 = 1/2
+
3/4
=
5/4.
Negli
estremi:
cos(/4)
+
sin
(/4)
=
(
2 + 1)/2,
e ( 2 + 1)/2.
2
Possiamo anche vedere S1 come grafico di y = 1
x per x [1/ 2,21/ 2]. Allinterno
di questo intervallo cerchiamo i punti stazionari di f (x, 1 x2p
) = x + 1 x : si deve annullare
d(x + 1
x2 )/dx = 1 2x, dal
che x = 1/2, e l`abbiamo f (1/2, 1 1/4) = 1/2 +
1 1/4 = 5/4.
2
+
1
1/2
=
1/
2
+
1/2
=
(
2
+
1)/2
allestremo
sinistro,
1/
2 + 1 1/2 =
Poi:
1/
S2 `e il grafico di y = x per x [1/ 2, 0]; allinterno di questo intervallo non cadono punti
stazionari di f (x, x) = x + x2 , perch`e d(x + x2 )/dx = 1+ 2x si annulla per x = 1/2.
Allestremo sinistro la restrizione di f assume il valore minimo ( 2 + 1)/2 e allestremo destro il
massimo 0.
S3 `e il grafico di y = x per x [0, 1/ 2]; allinterno di questo intervallo non cadono punti
stazionari di f (x, x) = x + x2 , perch`e d(x + x2 )/dx = 1 + 2x si annulla per x = 1/2.Allestremo
sinistro la restrizione di f assume il valore minimo 0 e allestremo destro ilmassimo (
2 + 1)/2.
Conclusione: il minimo e il massimo di f in E sono rispettivamente ( 2 + 1)/2 e ( 2 + 1)/2.
Passiamo a (iii). Siccome le derivate Fx e Fy non si annullano mai contemporaneamente in S,
per il Teorema di Dini ogni punto (x0 , y0 ) di S ha un intorno U (in generale di ampiezza non nota)
la cui intersezione con S `e grafico di una funzione (in generale non nota) x = (y) o y = (x).
Siamo formalmente nella situazione (ii), nel senso che in S U vanno cercati i punti (x, y) in cui
vale la (57) o la (58): per`
o, oltre alle coordinate x e y che stiamo per lappunto cercando, nella
prima `e ignota anche la funzione 0 e nella seconda la 0 ! Per aggirare questo ostacolo ricorriamo
allespressione delle derivate delle funzioni implicite:
0 (x) =
Fx (x, y)
,
Fy (x, y)
0 (x) =
39
Fy (x, y)
.
Fx (x, y)
lag2
Fx (x, y)
= 0,
Fy (x, y)
fx (x, y)
Fy (x, y)
fy (x, y) = 0
Fx (x, y)
a seconda che nel punto (ignoto!) risulti Fy (x, y) 6= 0 o Fx (x, y) 6= 0, e quindi comunque
fx (x, y)Fy (x, y) fy (x, y)Fx (x, y) = 0.
Questa `e unequazione algebrica nelle sole incognite x e y che ci interessano, e richiede che il determinante jacobiano di f e F in (x, y) si annulli, dunque abbia tanto le righe che le colonne linearmente
dipendenti. Imponiamo la dipendenza lineare delle colonne, che sono f (x, y) e F (x, y). Siccome
abbiamo supposto che il secondo di questi vettori non `e nullo, deve esistere un moltiplicatore di
Lagrange R, che non interessa calcolare, tale che
f (x, y) + F (x, y) = (0, 0).
Riassumiamo:
Teorema 12.1. Siano A un aperto di R2 e f, F C 1 (A). Se in un sottoinsieme S dellinsieme di
livello F = 0 il gradiente di F non `e mai nullo, gli eventuali punti di minimo e di massimo locali
per la restrizione f |S di f ad S vanno cercati tra le soluzioni (x, y) S del sistema
F (x, y) = 0
fx (x, y) + Fx (x, y) = 0
fy (x, y) + Fy (x, y) = 0
per unopportuna costante .
Esempio 12.2. Cerchiamo il minimo e massimo assoluti di f (x, y) = xy nellinsieme E dei punti
(x, y) R2 con x2 xy + y 2 1, che `e chiuso e limitato dal momento che `e costituito dai punti
che cadono su un ellisse o al suo interno. Siccome in tutto A = R2 lunico punto stazionario di f `e
lorigine, e si vede subito che si tratta di un punto di sella, resta solo da applicare i moltiplicatori
sulla frontiera S di E, che `e tutto linsieme di livello F (x, y) = x2 xy + y 2 1 = 0. Imponiamo
y + 2x y = 0,
x + 2y x = 0,
x2 xy + y 2 = 1.
F (x, y, z) = 0
fx (x, y, z) + Fx (x, y, z) = 0
(59)
f (x, y, z) + Fy (x, y, z) = 0
y
fz (x, y, z) + Fz (x, y, z) = 0
per unopportuna costante .
40
**
xy + yz + zx = 1
yz + (y + z) = 0
xz + (x + z) = 0
xy + (x + y) = 0.
Dalle ultime 3 equazioni ricaviamo
xyz + x(y + z) = 0
xyz + y(x + z) = 0 .
xyz + z(x + y) = 0
Dunque
x(y + z) = y(x + z)= z(x
F (x, y, z) = 0
y
fz (x, y, z) + Fz (x, y, z) + Gz (x, y, z) = 0
per opportune costanti , .
13
Sia R il rettangolo [a, b] [c, d]. Una partizione di R `e una famiglia = {(xh , yk ) | x0 =
a < x1 < < xm = b, y0 = c < y1 < < yn = b} (dove m ed n dipendono da ). In
maniera equivalente si pu`
o individuare anche assegnando la famiglia F() dei sottorettangoli
di R `e un raffinamento della
Shk = [xh1 , xh ] [yk1 , yk ] associati a . Unaltra partizione
se la contiene.
Si tratta di nozioni che quasi banalmente trasferiscono alla dimensione 2 quelle utilizzate nel caso
unidimensionale per lo studio dellintegrale di Riemann in una variabile, e noi qui ce ne serviamo
appunto per i primi passi nellintegrazione di Riemann in due variabili. Fissiamo dunque una
funzione limitata f definita sul rettangolo. Con la notazione A(S) per larea (base per altezza) di
un qualunque rettangolo S, definiamo le somme integrali superiore e inferiore di f associate
ad una partizione di R come, rispettivamente, i numeri
!
X
sup f A(Shk )
h,k
hk
o pi`
u concisamente
X
sup f A(S)
S
SF ()
!
X
h,k
inf f
A(Shk )
hk
o pi`
u concisamente
X
inf f A(S).
SF ()
P
P
(Qui, come nel seguito, h,k sta per h=1,...,m, k=1,...,n .)
Per ogni scelta di risulta banalmente
X
X
sup f A(S)
inf f A(S).
SF ()
SF ()
di R `e un raffinamento di , risulta
Daltra parte `e facile vedere che, se
X
X
X
X
sup f A(S)
sup f A(T )
inf f A(T )
inf f A(S).
SF ()
T F ()
T F ()
SF ()
sup
]x0 ,x01 []yk1 ,yk [
!
(x01
x0 )(yk yk1 ) +
sup
]x01 ,x1 []yk1 ,yk [
e cos` via. Per ogni scelta delle partizioni e 0 si ottiene dunque, passando se necessario al loro
raffinamento comune 0 ,
X
X
sup f A(S)
inf f A(T ).
SF ()
T F (0 )
42
SF ()
T F (0 )
(60)
(61)
e di conseguenza
inf
X
X
inf f A(S)
sup f A(S) = sup
SF ()
SF ()
SF ()
SF ()
quale che sia la partizione di R = [0, 1]2 , la (60) con 0 < < 1 non `e soddisfatta.
Invece:
excontR
(62)
DIM. Dato arbitrariamente un > 0, sia = > 0 tale che per ogni coppia di punti (x0 , y 0 ), (x00 , y 00 )
di R distanti meno di risulti |f (x0 , y 0 ) f (x00 , y 00 )| < (uniforme continuit`a di f nel compatto R).
Chiamiamo una partizione di R tale che ogni sottorettangolo S F() abbia diametro minore
di . Risulta
X
X
sup f inf f A(S) =
max f min f A(S) < A(R)
SF ()
SF ()
Z
F (x) =
f (x, y)dy.
c
Su [a, b] la funzione x 7 F (x) `e continua (cfr. il Teorema 7.1), dunque integrabile. Fissiamo
arbitrariamente una partizione di R, il che `e come dire una partizione x0 = a < x1 < < xm = b
di [a, b] ed una partizione y0 = c < y1 < < yn = d di [c, d]. Grazie alladditivit`a degli integrali
di una variabile rispetto agli intervalli di integrazione valgono le identit`a
Z b
m Z xh
n Z yk
X
X
F (x) dx =
F (x) dx e F (x) =
f (x, y) dy,
a
h=1 xh1
k=1
43
yk1
fub1
per cui
Z b Z
f (x, y) dy
dx =
m Z
X
n Z
X
xh
h=1 xh1
XZ
h,k
xh
k=1
yk
f (x, y) dy
dx
yk1
yk
f (x, y) dy
dx :
yk1
xh1
xh1
yk1
sup
h,k
hk
f (x, y) dy
dx
X
h,k
sup f
S
A(Shk ).
hk
Siccome f `e integrabile su R, il suo integrale `e lunico numero reale che soddisfa le stesse
disuguaglianze del secondo membro qui sopra al variare di , per cui vale lidentit`a
Z
Z b Z d
f (x, y) dx dy =
f (x, y) dy dx
R
e quindi la prima delle (62). La seconda si dimostra in modo del tutto analogo.
Le (62) forniscono le formule di riduzione dellintegrale doppio di f .
14
Misurabilit`
a secondo PeanoJordan e domini normali
44
Cominciamo con alcune nozioni che riguardano la funzione caratteristica di un generico limitato
E R2 . Fissato un rettangolo R E, se 1E `e integrabile su R secondo Riemann diciamo che E `e
misurabile secondo PeanoJordan o pi`
u brevemente PJ misurabile (in R2 ), e chiamiamo
Z
1E dxdy
A(E) =
R
la sua misura (bidimensionale), o area, di PeanoJordan. (Si noti che queste nozioni sono
indipendenti dalla scelta del particolare rettangolo R E.)
Richiedere che E sia PJmisurabile equivale dunque a richiedere che, dato comunque > 0,
risulti
X
sup 1E inf 1E A(S) <
SF ()
A(S)
ovvero
X
SF ()
S E6=
A(S) <
SF ()
S E
SF ()
S E6=
SF ()
S E
ovvero
X
A(S) <
(63)
SF ()
S F 6=
SF ()
S F 6=
r1
Osservazione 14.1. Utilizzando la (63) si vede subito che lunione di un numero finito di insiemi
PJtrascurabili `e anchessa PJtrascurabile.
45
T1
SF ()
SF ()
(65)
Infatti per ogni S F() si verifica uno ed uno solo dei seguenti tre casi:
S E,
S E = S E = ,
S E 6= = S E 6=
per S E = S E = ,
per S E,
per S E 6= = S E 6= .
Dunque `e equivalente richiedere che per ogni > 0 si possano trovare R e tali che risulti < il
primo membro della (65) (PJmisurabilit`a di E) oppure il secondo (PJtrascurabilit`a di E).
r2
Osservazione 14.2. Grazie al precedente teorema ed allOsservazione 14.1 si constata subito che
lunione e lintersezione di un numero finito di insiemi PJmisurabile sono PJmisurabili.
Osservazione 14.3. La frontiera di ([0, 1]Q)2 `e tutto il quadrato [0.1]2 , che non `e PJtrascurabile
perche la sua misura esterna di PeanoJordan `e la sua area e quindi vale 1. Questo significa che,
se si vorr`a estendere al di l`
a della teoria di PeanoJordan la classe dei sottoinsiemi misurabili di
R2 in modo da farci rientrare anche ([0, 1] Q)2 , non si potr`a immaginare di estendere anche la
caratterizzazione fornita dal Teorema 14.1.
exgraf
max min (xk xk1 ) <
[xk1 ,xk ]
[xk1 ,xk ]
.
A(R)
Ma gli addendi della somma qui sopra sono le aree A(Qk ) dei rettangoli
Qk = [xk1 , xk ]
min , max ,
[xk1 ,xk ]
46
[xk1 ,xk ]
P
la cui unione ricopre E e verifica k A(Qk ) < . A questo punto si trova una partizione di R
tale che ogni Qk sia unione di sottorettangoli di F(). Siccome la somma delle aree A(S) degli
S F() contenuti in Qk `e uguale a A(Qk ), risulta
X
X
X
X
A(S) =
A(Qk ) < . (66)
max 1E A(S)
sup 1E inf 1E A(S)
SF ()
SF ()
SF ()
Sk Qk
tr
Teorema 14.2. Sia data una funzione f continua e limitata su un insieme PJmisurabile E.
Allora il suo prolungamento f di f a zero fuori di E `e integrabile secondo Riemann su un qualunque
rettangolo R E.
DIM. Dimostriamo il teorema sotto lipotesi aggiuntiva che f sia uniformemente continua (come`e
il caso, ad esempio, se E `e chiuso). Ci`
o significa che, fissato un > 0, esiste un = > 0 tale che
per ogni coppia di punti (x0 , y 0 ), (x00 , y 00 ) E distanti meno di risulti |f (x0 , y 0 ) f (x00 , y 00 )| < .
Sia R un rettangolo E. Grazie alla PJtrascurabilit`a di E, esiste una partizione di R tale
che
X
X
sup 1E =
A(S) < ,
(67)
SF ()
SF ()
S E6=
e si pu`o sempre fare in modo (eventualmente passando ad un opportuno raffinamento) che i diametri
di tutti gli S F() siano minori del che abbiamo associato ad per luniforme continuit`
a di
f . Siccome su tutti gli S che non intersecano E la f o `e uguale alla f o `e identicamente nulla, e
quindi verifica comunque
sup f inf f < ,
S
otteniamo
X
SF ()
S E6=
< 2 max |f |
E
A(S) +
SF ()
S E6=
X
SF ()
S E=
A(S) < 2 max |f | + A(R) ,
X
SF ()
S E=
47
E_0
Siano adesso date due funzioni continue , su un intervallo compatto [a, b] di R con la propriet`
a
in [a, b].
Linsieme
D = {(x, y) R2 | a x b, (x) y (x)}
(68)
(69)
un dominio normale rispetto allasse y. Entrambi questi domini sono chiusi, limitati e PJ
misurabili, dal momento che le loro frontiere sono unioni di grafici di funzioni continue e (addirittura) segmenti verticali o orizzontali. Ebbene:
exnorm
Teorema 14.3. Sia data una f continua sul dominio normale D. Allora la funzione f uguale ad
f in D ed a 0 fuori `e integrabile su R; il suo integrale doppio
ZZ
Z
Z
f (x, y) dxdy oppure
f (x, y) dxdy oppure
f dxdy
D
soddisfa
Z
Z
f (x, y) dx dy =
(x)
Z
dx
f (x, y) dy.
(70)
(x)
DIM. Lintegrabilit`
a di f segue dalla dimostrazione del Teorema (14.2) che abbiamo dato per f
uniformemente continua. La (70) si dimostra quasi punto per punto come la prima della (62)
scrivendo f al posto di f . Le sole differenze di cui va tenuto conto sono che qui la funzione
y 7 f(x, y),
x [a, b],
Z
F (x) =
f(x, y)dy =
(x)
f (x, y) dy.
(x)
f (x, y) dx dy =
D]
exarea
(y)
dy
a
f (x, y) dx.
(y)
Osservazione 14.4. Sia dato un dominio normale D come in (68). Dal Teorema 14.3 con f = 1D
segue che D `e PJmisurabile (conseguenza anche del Lemma 14.1!), e che la sua area vale
Z
Z
(x) dx
(x) dx.
a
48
In questa formula rientrano banalmente le aree misurate dalla geometria elementare nel caso dei
rettangoli, inizialmente con i lati paralleli agli assi coordinati, e dei triangoli rettangoli, inizialmente coi cateti paralleli agli assi coordinati, ma poi anche nel caso di arbitrari triangoli e di
parallelogrammi in quanto domini normali rispetto ad entrambi gli assi.
Consideriamo il caso di (x) identicamente nulla. D `e allora il sottografico della funzione continua e non negativa (x), e lintegrale di questultima da a a b ha legittimamente quel significato di
area che gli viene intuitivamente attribuito nelle considerazioni introduttive sullaspetto geometrico
dellintegrabilit`
a in una variabile.
Passiamo allaspetto geometrico della condizione di integrabilit`a fornita dal Teorema 14.3 per
una generica funzione continua e non negativa f (x, y). Le sue somme integrali inferiori sono somme
di volumi (elementari!) A(S)(minS f ) di parallelepipedi contenuti nel sottografico e privi di punti
interni comuni (siccome f 0, in ogni S F() non contenuto in D il minimo della f `e 0), mentre
quelle superiori sono somme A(S) (maxS f) di volumi di parallelepipedi la cui unione contiene il
sottografico di f . Ne segue che una buona definizione di volume del sottografico di f `e: lunico
elemento di separazione tra somme integrali superiori e inferiori, ovvero lintegrale della funzione.
Per avere poi una pi`
u generale teoria della misura tridimensionale di solidi limitati bisogna passare
alla teoria dellintegrale in tre variabili.
15
h,k
h,k
49
con 0 degenere. A questo punto si vede subito che la combinazione lineare a + b con a, b R `e
.
ancora una funzione a scala, che vale ahk + bhk in Shk
Definiamo integrale (elementare) della data in (71) il numero
Z
X
=
hk A(Shk ) .
h,k
Inoltre `e lineare:
h,k
Z
(a + b) = a
Z
per a, b R
+b
h,k
Infine,
hk A(Shk ) + b
h,k
hk A(Shk ) .
h,k
= 0 se `e degenere.
h,k
hk
h,k
50
con E = hk Shk (unione di segmenti verticali e orizzontali), il secondo membro della (73) `e
lintegrale elementare della funzione semplice
!
X
sup f 1S (x, y) + sup f 1E (x, y)
(x, y) =
h,k
hk
hk
Z
f = inf
sup f
S
h,k
A(Shk )
hk
o pi`
u concisamente
Z
f = inf
X
sup f
A(S).
SF ()
Z
(f + g)
Z
f+
(74)
(dal momento che la somma di un elemento di Sf+ ed uno di Sg+ sta in Sf++g e lintegrale elementare
delle funzioni a scala `e lineare) e positivamente omogeneo
Z
Z
(af ) = a f per a [0, [.
(75)
Il prossimo esempio mostra che lintegrale superiore non ha, sulla totalit`
a delle funzioni di Lc ,
la propriet`a di linearit`
a: pur essendo subadditivo non `e additivo, e pur essendo positivamente
omogeneo non `e omogeneo.
e1
Esempio 15.1. Come nellEsempio 13.1, indichiamo con f la funzione di Dirichlet 1(Q[0,1])2 .
Siccome
X
X
sup(f ) A(S) = 0
sup f A(S) = 1,
SF ()
SF ()
Z
f+
(f ) = 1 ,
con la presente scelta di f non valgono ne il segno uguale nella disuguaglianza debole della (74)
quando g = f , ne lidentit`
a della (75) quando a = 1.
51
Z
(f ) = f.
Siccome
Z
0=
Z
(f f )
Z
f+
Z
(f ) =
Z
f
Z
f
f.
(76)
Z
(f + g)
Z
f+
g.
X
f = sup
inf f A(S).
SF ()
Z
A(E) =
SF ()
SF ()
S E6=
X
X
1E = sup
inf 1E A(S) = sup
A(S)
SF ()
SF ()
S E
16
separ
Per`o `e altrettanto evidente che lintegrale inferiore della funzione di Dirichlet `e nullo, mentre quello
superiore, come abbiamo visto nellEsempio 13.1, vale 1. Ci`o significa che, se f `e una generica
funzione della classe Lc , la disuguaglianza (64) pu`o effettivamente venire soddisfatta o in senso
stretto o come identit`
a. Supponiamo che si verifichi il secondo caso:
Z
Z
f= f
(77)
ovvero
Z
sup
ovvero ancora
sup
Z
Sf = inf
Sf+
X
SF ()
inf f
S
X
sup f A(S)
A(S) = inf
SF ()
(78)
R2
R2
R
o ancora, volendo essere particolarmente sbrigativi, con f come per le funzioni a scala.
Richiedere che una f : R2 R a supporto compatto appartenga a Riem (R2 ) equivale dunque
a richiedere che, dato > 0, si possano trovare un rettangolo R contenente il supporto di f ed una
partizione di R tali che
X
sup f inf f A(S) <
(79)
S
SF ()
N0
(cfr. la (60): qui sintende che due partizioni distinte vengono sostituite da un loro comune
raffinamento).
Sia a > 0. Poiche sono positivamente omogenei sia lintegrale inferiore che quello superiore si
ha
Z
Z
Z
Z
f Riem (R2 ) = af Riem (R2 )
con
(af ) =
(af ) =
(af ) = a
f.
Ma allora
Z
Z
Z
Z
(af ) = (af ) = a f = a f
e quindi
Z
Z
Z
Z
Z
(af ) = (af ) = a f = a f = (af ) .
Z
(af ) =
Z
(af ) =
Z
(af ) = a
53
(80)
Sia adesso data unaltra g Riem (R2 ). Siccome su Riem (R2 ) coincidono integrale superiore e
inferiore,
Z
Z
Z
Z
Z
Z
Z
Z
Z
Z
f + g = f + g (f + g) (f + g) f + g = f + g .
Dunque lintegrale di Riemann `e additivo:
2
f, g Riem (R ) = f + g Riem (R )
con
(f + g) =
f+
Z
con
(af + bg) = a
f +b
per a, b R .
Fissiamo adesso un > 0 e una tale che valga la (79). Facciamo variare le coppie di punti
(x0 , y 0 ), (x00 , y 00 ) interni ad un S F(). Da
|f (x0 , y 0 )| |f (x00 , y 00 )| |f (x0 , y 0 ) f (x00 , y 00 )| sup f inf f
S
ricaviamo
sup |f | inf |f | sup f inf f
S
sup |f | inf |f | A(S) < .
S
Da qui concludiamo che |f | Riem (R2 ); grazie alla positivit`a dellintegrale di Riemann,
Z Z
f |f |.
Un procedimento analogo mostra che f, g Riem (R2 ) = f g Riem (R2 ). Infatti
f (x0 , y 0 )g(x0 , y 0 ) f (x00 , y 00 )g(x00 , y 00 )
|f (x0 , y 0 ) f (x00 , y 00 )||g(x0 , y 0 )| + |g(x0 , y 0 ) g(x00 , y 00 )||f (x00 , y 00 )|
sup f inf f sup |g| + sup g inf g sup |f |
S
e quindi
sup(f g) inf (f g) C sup f inf f + sup g inf g .
S
o6.1
Osservazione 16.1. Ripercorrendo la costruzione dellintegrale di Riemann ci si accorge che apparentemente essa viene a dipendere dalla scelta di un particolare riferimento cartesiano in R2 : un
bel guaio se proprio cos` fosse, come si vede pensando al caso particolare delle misure di Peano
Jordan che perderebbero ogni significato geometrico. Ma poi si riflette sul punto di partenza, cio`e
larea dei rettangoli, che `e invariante per composizioni di rotazioni e traslazioni, e ci si convince
che deve valere un risultato del tipo: f Riem (R2 ) f Riem (R2 ) con
Z
Z
f = (f ) .
Questo effettivamente `e vero, come vedremo pi`
u in l`a (Osservazione 18.1).
54
Siano E R2 PJ-misurabile e f : E R limitata. Se il prolungamento f di f a zero fuori di
E sta in Riem (R2 ), diciamo che f sta in Riem (E) e che la quantit`a
Z
Z
f dxdy =
f dxdy
R2
Z
f 1E
f 1E (sup f )A(E) = 0.
E
Ladditivit`
a dellintegrale rispetto alla somma di funzioni si trasferisce alle unioni disgiunte di
domini di integrazione: se E ed F sono PJ-misurabili con E F = , una funzione f : E F R
`e integrabile su E F se e solo se integrabile sia su E che su F , e in tal caso
Z
Z
Z
f dxdy =
f dxdy +
f dxdy;
EF
17
Alcune estensioni
Leb
Integrali di Riemann in R3 (e in RN )
Un primo, semplice allargamento delle nozioni viste finora consiste nel passaggio dalle funzioni di 2
variabili a quelle di un qualunque numero N di variabili. Gi`a il caso N = 3 illustra significativamente
il procedimento. Al posto dei rettangoli si prendono i parallelepipedi P , con la notazione V (P )
per i volumi (base per altezza per profondit`a). Una partizione di P = [a, b] [c, d] [r, s] `e una
famiglia = {(xh , yk , z` ) | x0 = a < x1 < < xm = b, y0 = c < y1 < < yn = b, z0 = r < z1 <
< zp = s}, e F() `e la famiglia dei sottoparallelepipedi Qhk` = [xh1 , xh ] [yk1 , yk ] [z`1 , z` ].
55
Una funzione limitata R3 R `e una funzione a scala se, per unopportuna scelta di P e , `e nulla
fuori di P e assume valore costanti hk` negli interni dei Qhk` F(). Lespressione
Z
X
=
hk` V (Qhk` )
h,k,`
`e lintegrale elementare di . Una volta constatato che si tratta di una definizione ben posta si
arriva senza difficolt`
a agli integrali superiore e inferiore di Riemann; agli insiemi PJtrascurabili
3
(adesso in R !); allintegrale (triplo) di Riemann denotato con
Z
ZZZ
Z
f dxdydz
f (x, y, z) dxdydz oppure
f (x, y, z) dxdydz oppure
R3
R3
R3
R
o ancora, sbrigativamente, con f ; alla misura (tridimensionale) di PeanoJordan, ovvero ai volumi
dei solidi misurabili secondo PeanoJordan (cfr. lOsservazione ??).
Lo studio degli integrali sui domini normali del piano ammette una prima generalizzazione
immediata allo spazio tridimensionale. Vediamo come. Fissate due funzioni , continue su un
rettangolo R = [a, b] [c, d] del piano con in R vediamo subito (procedendo per R3 come
nella dimostrazione del Teorema 14.3 per R2 ) che una f C 0 (D) `e integrabile su D; inoltre risulta
Z
(x,y)
Z
Z
f (x, y, z) dx dy dz =
dx dy
f (x, y, z) dz =
Z
dx
(x,y)
Z
dy
f (x, y, z) dz
(81)
(x,y)
(x,y)
(x,y)
Z
Z
f (x, y, z) dz dx dy
(x,y)
(e si noti che diamo per scontata una generalizzazione del Teorema 7.1 per la quale lintegrale
semplice da (x, y) a (x, y) `e una funzione continua, dunque integrabile, di (x, y) R); la seconda
identit`a della (81) segue dalla formula di riduzione dellintegrale doppio. Per dimostrare la (81) si
procede come nella dimostrazione della (70), solo che al posto delladditivit`a dellintegrale semplice
sui sottointervalli associati ad una partizione di [a, b] adesso si sfrutta quella dellintegrale doppio
sui sottorettangoli associati ad una partizione di R.
Da qui si potrebbe poi passare alla generalizzazione della prima delle identit`a (81) che si ottiene
prendendo
D = {(x, y, z) R3 | (x, y) K, (x, y) z (x, y)}
con K sottoinsieme PJmisurabile di R2 :
Z
f (x, y, z) dx dy dz =
D
(x,y)
Z
Z
dx dy
f (x, y, z) dz
(82)
K
(x,y)
La prima identit`
a nella (81) e pi`
u in generale la (82) sono le formule di riduzione degli
integrali tripli.
A questo punto si pu`
o passare senza difficolt`a a definire in RN , per un qualunque valore naturale
N , gli integrali secondo Riemann, detti allora N pli ed indicati semplicemente con
Z
f (x) dx ,
RN
(o di nuovo sbrigativamente con f ) e gli insiemi misurabili secondo PeanoJordan: basta prendere
come punto di partenza i prodotti cartesiani [a1 , b1 ] [aN , bN ] e le quantit`a (b1 a1 ) (bN aN )
al posto rispettivamente degli ordinari parallelepipedi e degli ordinari volumi.
k=1 k di
f
P
funzioni semplici con k 0 per k 2 e k=1 k f . Lintegrale superiore di Lebesgue `e la
quantit`a (non necessariamente reale)
)
( Z
Z
X
X
k
k +
.
f = inf
f
k=1
k=1
La nozione che abbiamo introdotto non richiede nessuna restrizione su f : ne che si annulli al
di fuori di un compatto, ne che sia limitata. E se prendiamo in P
particolare le f Lc ? Allora ogni
+
Sf `e la somma della serie + 0 + 0 + , cio`e della serie
k=1 k con 1 = e k = 0 per
R
P R
+
+
k 2, che sta in f e verifica k=1 k = . Ne segue che Sf +
f e
Z
Z
f
f.
(83)
Lintegrale superiore di Lebesgue `e, come quello di Riemann, positivo, positivamente omogeneo
e subadditivo. (Per questultima propriet`a si utilizza lidentit`a
X
X
X
(k + k ) =
k +
k ,
k=1
k=1
k=1
+
qui valida perche le serie in +
f e g , avendo tutti i termini 0 tranne (eventualmente) il primo,
sono incondizionatamente convergenti o divergenti.)
Lintegrale inferiore di Lebesgue `e la quantit`a
Z
Z
f =
(f ).
Anche lintegrale inferiore `e positivo e positivamente omogeneo. Inoltre `e superadditivo: questultima propriet`
a segue dalla subadditivit`a dellintegrale superiore, che implica anche
Z
Z
f
f.
(84)
57
Si ha poi
Z
Z
f
f.
(85)
Se i due membri della (84) sono finiti e uguali si dice che f `e integrabile secondo Lebesgue,
e per il loro comune valore si utilizzano le stesse notazioni che per lintegrale di Riemann. Ci`
o non
crea ambiguit`
a perche, grazie alle (83) e (85) che implicano
Z
Z
f
Z
f
f,
una funzione di Lc integrabile secondo Riemann lo `e anche secondo Lebesgue, e i due integrali
coincidono.
Nel caso particolare che sia integrabile secondo Lebesgue la funzione caratteristica di un E R2
diciamo cheRE `e misurabile secondo Lebesgue (in R2 ) con misura di Lebesgue (finita) data
da (E) = 1E . Ne segue che, quando E `e limitato, se `e misurabile secondo PeanoJordan lo `e
anche secondo Lebesgue.
Per mostrare che non vale il viceversa prendiamo E = ([0, 1] Q)2 , che sappiamo non essere
PJmisurabile. E consiste in una successione di punti {(xk , yk )}. Fissato arbitrariamente > 0,
indichiamo per ogni k con Q,k il quadrato [xk /k, xk + /k] [yk /k, yk + /k]. Siccome 1E
`e maggiorata dalla serie di funzioni semplici
X
1Q,k
k
A(Q,k ) =
X 42
k
k2
= K2
P
con K = 4 k 1/k 2 , facendo variare concludiamo che lintegrale superiore di Lebesgue della 1E
`e 0, per cui la funzione `e dotata di integrale di Lebesgue nullo, ovvero E `e misurabile secondo
Lebesgue con misura di Lebesgue nulla, ovvero ancora `e trascurabile secondo Lebesgue (e
ricordiamo che la frontiera di E `e tutto [0, 1]2 , che ha misura di PeanoJordan uguale ad 1).
A questo stesso
u semplicemente, notando che 1E `e essa
P risultato si arriva peraltro, ancora pi`
stessa una serie k 1(xk ,yk ) di funzioni a scala degeneri, dunque con la serie degli integrali uguale a
0, e questo `e un ragionamento che pu`
o essere tranquillamente ripetuto per una qualunque infinit`
a
2
2
numerabile E di punti di R , ad esempio per E = Q . O anche per una retta verticale o orizzontale
unione di uninfinit`
a numerabile di intervalli limitati e poi per una infinit`a numerabile di tali rette.
` il
E qui si pu`o almeno enunciare un risultato cui abbiamo alluso subito dopo il Teorema 14.2. E
Teorema di VitaliLebesgue: Condizione necessaria e sufficiente affinche una funzione f Lc
sia integrabile secondo Riemann `e che linsieme dei suoi punti di discontinuit`a sia trascurabile
secondo Lebesgue.
Infine (ma nella teoria di Lebesgue `e appena linizio. . . ) si vede, procedendo come per lintegrale
di Riemann, che le funzioni integrabili secondo Lebesgue costituiscono uno spazio vettoriale su cui
lintegrale di Lebesgue `e positivo e lineare.
58
18
Cambiamenti di variabili
Nel Calcolo in una variabile un ruolo importantissimo per il calcolo effettivo degli integrali sugli
intervalli `e svolto dalla regola di integrazione per sostituzione, che si enuncia cos`: date una funzione
h di classe C 1 in un intervallo compatto [, ] e una funzione continua f sullimmagine di [, ]
nella h, vale lidentit`
a
Z h()
Z
f () d =
f (h(v))h0 (v) dv.
(86)
h()
f () d =
A
f (h(v))h0 (v) dv
(87)
59
Calcoliamo
kV1 dv V2 dvk = k(xu (u0 , v0 )i + yu (u0 , v0 )j) (xv (u0 , v0 )i + yv (u0 , v0 )j)k |du||dv|
= |xu (u0 , v0 )yv (u0 , v0 ) yu (u0 , v0 )xv (u0 , v0 )||du||dv|.
Dunque | (u0 , v0 )| dudv (con du > 0, dv > 0) coincide con la noma del prodotto vettoriale dei
vettori V1 du e V2 dv, ovvero `e larea del parallelogramma da essi generato, ed approssima, a meno
di infinitesimi di ordine superiore al primo, larea (nel senso di PeanoJordan!) della porzione di
piano compresa tra le curve
u 7 (x(u, v0 ), y(u, v0 ))
per u0 u u0 +du,
per u0 u u0 +du,
per v0 v v0 +dv,
per v0 v v0 +dv.
.
u + v
u
u
=
7
:
u + v
v
v
A(S)
.
|det |
Dimostriamo che se f `e una funzione limitata, nulla fuori di un rettangolo R e integrabile, allora `e
integrabile anche (f )| |, quindi f perche `e costante, e vale lidentit`a
Z
Z
f (x, y) dxdy = |det |
(f )(u, v) dudv .
(88)
R
1 (R)
(f )11 (S ) + 1E
SF ()
60
af
SF ()
Z
=
X
SF ()
Z
X
inf (f ) 11 (S ) + 1E |det |
(f )11 (S ) + 1E |det |
1 (S )
SF ()
Z
=
(f )|det |.
X
sup f A(S).
(f )|det |
SF ()
Riassumiamo:
X
SF ()
inf f
S
Z
A(S)
Z
(f )|det |
X
(f )|det |
sup f A(S).
SF ()
(89)
afff
cio`e la (88)14 .
Le considerazioni precedenti, applicate a 1F con F insieme limitato, dunque contenuto in un
rettangolo R, e PJmisurabile, mostrano subito che anche 1 (F ) `e PJmisurabile, con misura di
PeanoJordan uguale a quella di F divisa per |det |.
oin
1 (S )
61
1 (S )
e10
Esempio 18.1. Calcoliamo lintegrale di f (x, y) = (x2 y 2 )2 sul quadrato Q compreso tra le rette
y + x = 2, y x = 2. Siccome x2 y 2 = (x + y)(x y), viene in mente di porre
u=x+y
v =xy
e da qui, invertendo, definire la attraverso il sistema
x = (u + v)/2
y = (u v)/2
cio`e
u
u
1/2 1/2
u
:
7
=
.
v
v
1/2 1/2 v
Teorema 18.1. Siano dati due aperti U e V di R2 , il primo dei quali limitato e PJmisurabile con
chiusura K = U contenuta in V . Sia : V R2 un diffeomorfismo di V , o pi`
u in generale una
funzione di classe C 1 che ristretta ad U sia un diffeomorfismo. Allora anche (U ) `e PJmisurabile,
e per ogni f : (U ) R continua e limitata (dunque integrabile su (U ) grazie al Teorema 14.2)
vale lidentit`
a
Z
Z
f (x, y) dxdy = (f )(u, v)| (u, v)| dudv .
(90)
(U )
aff
Sottolineiamo che al posto degli aperti U e (U ) si possono prendere, senza che cambi nulla, le
loro chiusure, per cui la (90) si scrive anche
Z
Z
Z
f (x, y) dxdy =
f (x, y) dxdy =
(f )(u, v)| (u, v)| dudv .
(U )
(K)
Questo teorema si applica ovviamente nel caso in cui sia una trasformazione affine invertibile,
ed allora la (90) non `e che la (88).
La meticolosit`
a dellenunciato del Teorema 18.1 si pu`o dire che `e fatta apposta per la seguente
importante applicazione.
(91)
A1
La (90) diventa
Z
Z
Z
f (x, y) dxdy =
f (% cos , % sin )% dd% =
DR
Z
d
f (% cos , % sin )% d%
(92)
per f continua e limitata su C 0 (DR ). In particolare ritroviamo per f (x, y) = 1 larea R2 del disco
DR integrando la lunghezza 2% della circonferenza di raggio %, che `e dunque la derivata dellarea
del disco di raggio %:
Z
R
2% d%.
A(DR ) =
0
3x}
1
1 + x2 + y 2
5
f (x, y) dxdy =
f (% cos , % sin )% dd% =
d
d% = log .
2
1
+
%
6
2
D
K
0
1
o9.1
Osservazione 18.2. Nellintegrazione unidimensionale non avevamo mai visto comparire la richiesta che la sostituzione realizzasse un diffeomorfismo. In dimensione > 1 questa richiesta, formulata
nel Teorema 18.1, `e invece essenziale, come si vede dal seguente esempio per N = 2: il passaggio a
coordinate polari (, %) non realizza un diffeomorfismo del rettangolo U =]0, []0, 1[ se > 2,
e lidentit`a
Z
Z
dxdy =
% dd%
(K)
non `e soddisfatta perch`e (K) `e il disco chiuso di raggio 1 e la sua area `e il valore del primo
membro, mentre quello del secondo `e
Z Z 1
d
% d% = > .
2
0
0
63
o9.1
per (u, v) U
la regola di derivazione delle funzioni composte, e passando ai determinanti delle matrici jacobiane,
otteniamo
1 ((u, v)) (u, v) = 1,
e siccome in A risulta = 1 arriviamo a
(u, v) =
1
.
((u, v))
(93)
ja
A questo punto, dovendosi calcolare il secondo membro della (93), ritorna pur sempre in ballo
la questione dellespressione esplicita della . E per`o se ne pu`o prescindere in certi casi speciali:
tipicamente quelli degli esercizi di un corso, come nel prossimo esempio...
o9.1
(94)
y2
x2
inie
1
.
2(1 v 2 )
(95)
Come si vede, non c`e stato bisogno del calcolo esplicito di , che peraltro si fa subito: `e la
trasformazione
r
r
u
u
x=
, y=v
,
2
1v
1 v2
di classe C 1 in V = R] 1, 1[ ed iniettiva in U . Da questa espressione si arriva di nuovo alla (95),
anche se con qualche conto in pi`
u.
Servendosi delle coordinate polari si pu`o formulare un rapido approccio allintegrazione impropria nel piano. Per cominciare, poniamo
CrR = {(x, y) | 0 < r2 x2 + y 2 R2 < }.
Lintegrale
Z
IrR =
CrR
vale
2
(R+2 r+2 )
+2
%+1 d%
per 6= 2,
2(log R log r)
per = 2.
Dunque
lim IrR = per 2,
r0
lim IrR =
lim IrR =
r0
2r+2
+2
2R+2
+2
per < 2,
per > 2.
Teorema 18.2. (i) Sia f definita allesterno del disco x2 + y 2 r2 per qualche r > 0 ed integrabile
in ogni CrR , R > r. Allora lintegrale improprio
Z
f (x, y) dxdy
x2 +y 2 r2
converge assolutamente se esiste una costante K > 0 tale che 0 |f (x, y)| K(x2 + y 2 )/2 per
un < 2, mentre diverge se esiste una costante K > 0 tale che f (x, y) K(x2 + y 2 )/2 per un
2;
(ii) Sia f definita in un disco bucato 0 < x2 + y 2 R2 per qualche R > 0 ed integrabile in ogni
CrR , 0 < r < R. Allora lintegrale improprio
Z
f (x, y) dxdy
x2 +y 2 R2
converge assolutamente se esiste una costante K > 0 tale che 0 |f (x, y)| K(x2 + y 2 )/2 per
un > 2, mentre diverge se esiste una costante K > 0 tale che f (x, y) K(x2 + y 2 )/2 per un
2.
65
deja
Teorema 18.3. Siano dati due aperti U e V di R3 , il primo dei quali limitato con chiusura K = U
contenuta in V . Sia : V R3 un diffeomorfismo di V , o pi`
u in generale una funzione di classe C 1
che ristretta ad U sia un diffeomorfismo, con (U ) PJmisurabile. Allora anche U `e PJmisurabile,
e per ogni f : (U ) R limitata e integrabile vale lidentit`
a
Z
Z
f (x, y, z) dxdydz = (f )(u, v, w)| (u, v, w)| dudvdw
(96)
(U )
aff
ovvero
Z
f (x, y, z) dxdydz =
f (x, y, z) dxdydz =
(U )
(K)
Oltre alla (89), che si trasferisce banalmente al caso di una trasformazione affine dello spazio,
unimportante applicazione che rientra nel Teorema 18.4 `e la seguente.
Coordinate sferiche
La trasformazione
(, %, ) = (% cos cos , % sin cos , % sin ),
il cui jacobiano (, %, ) vale %2 cos , `e regolarissima su tutto V = R3 , e diventa un diffeomorfismo quando `e ristretta al prodotto cartesiano ]0, 2[]0, R[] /2, /2[. Prendendo ad esempio
questultimo come U , per cui (K) `e la palla (tridimensionale) chiusa BR , otteniamo
Z
Z
f (x, y, z) dxdydz =
f (% cos cos , % sin cos , % sin )%2 cos dd%d
(97)
K
BR
Z
d
=
0
/2
d%
0
/2
per f C 0 (BR ) limitata (cfr. la (81)). La (97) fornisce il volume 4R3 /3 della sfera come integrale
dellarea (nel senso della geometria euclidea) 4%2 della superficie sferica di raggio %, area che `e
quindi la derivata del volume della sfera di raggio %:
Z R
V (BR ) =
4%2 d%.
0
p
cos x2 + y 2 + z 2
dxdydz
x2 + y 2 + z 2
con
D = {(x, y, z) | 1 x2 + y 2 + z 2 4, z 0}
passiamo a coordinate sferiche x = % cos cos , y = % sin cos , z = sin , dove 1 % 2, 0
2 e (attenzione!) 0 /2. Otteniamo
Z
cos % 2
I=
% cos d%dd = 2(sin 2 sin 1).
2
[1,2][0,2][0,/2] %
66
(8.3)
Utilizziamo le coordinate sferiche per occuparci dellintegrazione impropria nello spazio a 3
dimensioni. Poniamo
rR = {(x, y, z) | 0 < r2 x2 + y 2 + z 2 R2 < }.
Lintegrale
Z
IrR =
rR
vale
4
(R+3 r+3 )
+3
%+2 d%
per 6= 3,
4(log R log r)
per = 3.
Dunque
lim IrR = per 3,
lim IrR =
r0
lim IrR =
r0
4r+3
+3
4R+3
+3
per < 3,
per > 3.
Da qui si ricava il
T9.2
Teorema 18.4. (i) Sia f definita allesterno della palla x2 + y 2 + z 2 r2 per qualche r > 0 ed
integrabile in ogni rR , R > r. Allora lintegrale improprio
Z
f (x, y, z) dxdydz
x2 +y 2 +z 2 r2
converge assolutamente se esiste una costante K > 0 tale che 0 |f (x, y, z)| K(x2 + y 2 + z 2 )/2
per un < 3, mentre diverge se esiste una costante K > 0 tale che f (x, y) K(x2 + y 2 + z 2 )/2
per un 3;
(ii) Sia f definita in una palla bucata 0 < x2 + y 2 + z 2 R2 per qualche R > 0 ed integrabile
in ogni rR , 0 < r < R. Allora lintegrale improprio
Z
f (x, y) dxdydz
x2 +y 2 +z 2 R2
converge assolutamente se esiste una costante K > 0 tale che 0 |f (x, y, z)| K(x2 + y 2 + z 2 )/2
per un > 3, mentre diverge se esiste una costante K > 0 tale che f (x, y, z) K(x2 + y 2 + z 2 )/2
per un 3.
19
Z
(t) dt =
Z
1 (t) dt, . . . ,
67
N (t) dt .
nor
(t) dt,
y=
a
il risultato cercato.
QuandoN = 2 e N = 3 le pi`
u abituali notazioni per la la generica curva sono rispettivamente
t 7 (x(t), y(t)),
68
Si dice che `e: semplice se (t1 ) 6= (t2 ) per a t1 < t2 b tranne, eventualmente, quando
t1 = a e t2 = b; chiusa se (a) = (b); aperta se (a) 6= (b).
Lorientazione di `e quella in cui (t1 ) precede (t2 ) se a t1 < t2 b; il primo estremo
o origine di `e (a), il secondo estremo o termine `e (b). Lopposta di `e la curva
[a, b] 3 t 7 (a + b t).
Il sostegno di `e limmagine ([a, b]). Si tatta di un insieme (sempre chiuso nella topologia
di RN !) da cui in nessun modo si pu`
o risalire alla funzione : basta pensare che esso `e lo stesso per
ogni altra curva p non appena p `e di classe C 0 in un intervallo compatto [c, d] con p([c, d]) = [a, b].
Ci`o corrisponde perfettamente alla distinzione tra una funzione (scalare) e il suo grafico, salvo per
la differenza, non di poco conto, che abitualmente il termine di curva viene utilizzato proprio col
significato di sostegno, non certo di funzione (vettoriale). E anche qui in certi casi far`a comodo,
per procedere un po pi`
u speditamente, riferirsi al sostegno di una famiglia di curve come se fosse
la stessa cosa di una o di alcune particolari curve della famiglia.
Esempio 19.2. In R2 la circonferenza di centro (x0 , y0 ) e raggio r, pensata come curva (semplice
e chiusa), `e la funzione
[0, 2] 3 t (x0 + r cos t, y0 + r sin t).
Esempio 19.3. Dati x e y in RN il segmento (orientato) (x, y) che va da x a y, inteso come
curva (semplice e aperta), `e una qualunque funzione
[a, b] 3 t 7
bt
ta
x+
y
ba
ba
con a e b presi in R, a < b. I segmenti (x, y) e (y, x) sono opposti tra loro.
Due curve : [a, b] RN e : [c, d] RN di classe C 1 sono equivalenti luna allaltra
quando ( ) = ( p)( ), [c, d], con p di classe C 1 , p0 6= 0 in [c, d] e p([c, d]) = [a, b] (per cui p `e
strettamente monotona con p1 C 1 ([a, b])). Se p `e crescente, cio`e se (a) = (c) e (b) = (d),
lorientazione di coincide con quella di , altrimenti una `e lopposta dellaltra.
Esempio 19.4. In R2 la curva di classe C 1
[0, ] 3 t 7 (cos t, sin t)
non `e equivalente alla curva
y=
che non `e di classe
curve di classe C 1
C 1.
p
1 x2 ,
1 x 1,
e
y=
p
1 x2 ,
1
1
x :
2
2
Una curva : [a, b] RN di classe C 1 `e regolare se soddisfa k0 k > 0 in ]a, b[. Una ragion
dessere di questa condizione sta nella sua interpretazione geometrica quando a < t0 < b: se e solo
se non `e nulla, la derivata 0 (t0 ), limite per t t0 del rapporto incrementale
(t) (t0 )
t t0
con t0 , t ]a, b[, t 6= t0 , `e lN pla dei parametri direttori di una retta, e pi`
u esattamente della
tangente al sostegno di in (t0 ). Per N generico, N = 2, N = 3 i versori di tale tangente si
scrivono rispettivamente15
0 (t0 )
,
k0 (t0 )k
Nel particolare caso bidimensionale di una curva y = f (x) i versori della tangente in (x0 , f (x0 ))
sono
(1, f 0 (x0 ))
p
1 + f 0 (x0 )2
e quindi quelli della normale sono
(f 0 (x0 , 1))
p
.
1 + f 0 (x0 )2
Diversa la questione dal punto di vista cinematico: come velocit`a istantanea allistante t0 del
moto con legge oraria (e quindi con traiettoria uguale al sostegno di ) la derivata 0 (t0 ) pu`
o
benissimo avere tutte le componenti uguali a 0.
Esempio 19.5. La curva (t) = (t3 , t2 ) per 1 t 1 `e di classe C 1 e costituisce la legge oraria
di un moto con velocit`
a (vettoriale) nulla allistante 0. Per`o il suo sostegno, cio`e la traiettoria
del moto, `e anche il sostegno della curva (=grafico della funzione) y = x2/3 , e dunque `e privo di
tangente nellorigine.
Lagganciamento della curva ad una seconda curva : [c, d] RN ha senso (solo) quando
(b) = (c). Esso d`
a luogo alla curva : [a, b+dc] RN definita dalle identit`a: ( ) = ( ) per
a b, ( ) = ( b + c) per b < b + d c. Dunque la ristretta a [a, b] `e la stessa cosa
della , mentre ristretta a [b, b + d c] non `e esattamente la bens` la p con p( ) = b + c.
Lagganciamento consecutivo di tre o pi`
u curve si effettua agganciando, per cominciare, la prima e
la seconda (purche ci`
o sia possibile), poi agganciando la curva cos` ottenuta e la terza delle curve
date (purche ci`
o sia possibile), eccetera. Lagganciamento di un numero finito di segmenti `e una
poligonale.
Un cammino `e una curva detta anche regolare a tratti ottenuta agganciando consecutivamente un numero finito di curve di classe C 1 ; lorientazione di una qualunque di tali curve
determina quella di tutto il cammino se questo `e una curva semplice. Un cammino `e dunque una
funzione di classe C 1 a tratti (oltre che, naturalmente, di classe C 0 ). Ci`o significa che si pu`
o
dare una partizione a = a0 < a1 < < am = b di [a, b] in modo tale che la derivata 0 (t) esista
continua in ogni intervallo ]ah1 , ah [ e sia dotata di limite in RN tanto per t ah1 + 0 che per
t ah 0. Naturalmente rientra nella definizione di cammino una di classe C 1 su tutto [a, b].
15
La scelta del segno + o dipende dallorientazione che si fissa sulla tangente: il segno + `e quello che d`
a alla
tangente lorientazione determinata da quella della curva.
70
Indichiamo con G una funzione continua sul sostegno di un cammino [a, b] RN . Lintegrale
curvilineo (di prima specie) di G su `e definito nel modo seguente:
Z
Z b
G ds =
G((t))k0 (t)k dt.
a
La definizione `e ben posta perche la funzione integranda t 7 G((t))k0 (t)k `e definita, limitata e
continua nellintervallo [a, b] privato al pi`
u di un numero finito di punti ah ; inoltre
Z
m Z ah
X
G ds =
G((t))k0 (t)k dt.
h=1 ah1
Esempio 19.6. Se G `e una funzione reale continua sul grafico di una funzione f C 1 ([a, b]) il suo
integrale di prima specie sulla curva y = f (x) `e dato da
Z b
p
G(x, f (x)) 1 + f 0 (x)2 dx.
a
Dalla formula di integrazione per sostituzione segue facilmente il
Teorema 19.1. Se due curve e di classe C 1 sono equivalenti tra di loro vale lidentit`
a
Z
Z
G ds =
G ds
Adesso fissiamo N funzioni Lj continue in un aperto A di RN ed associamo loro tanto la
funzione vettoriale A RN , o campo vettoriale, L = (L1 , . . . , LN ) che la forma differenziale
= L1 dx1 + + LN dxN ; quando N = 3 il campo vettoriale pu`o essere interpretato come un
campo di forze, e allora lo si denota abitualmente con F = (F1 , F2 , F3 ). Naturalmente ogni
enunciato su L, o in particolare su F, `e equivalente ad un enunciato su .
Dato un cammino = (1 , . . . , N ) : [a, b] RN col sostegno C contenuto in A lintegrale
curvilineo (di seconda specie) di su `e il numero
Z
=
Z bX
N
a j=1
71
P
0
La definizione `e ben posta perche la funzione integranda t 7 N
e definita, limitata
j=1 Lj ((t))j (t) `
e continua nellintervallo [a, b] privato di un numero finito di punti (quelli in cui non `e definita
qualcuna delle derivate 0j ). Dividendo e moltiplicando lintegrando a secondo membro per la
norma k0 (t)k (definita e non nulla in tutto [a, b] con leccezione di un numero finito di punti) si
vede che tra gli integrali curvilinei delle due specie sussiste il legame
Z
Z
= L ds
dove = (t) indica il versore tangente 0 (t)/k0 (t)k alla curva (con la sua orientazione!) nel
punto (t); quando N = 3 e il campo vettoriale viene interpretato come un campo di forze F il
secondo membro
Z
F ds
inv
Teorema 19.2. Se due curve e di classe C 1 con i sostegni contenuti in A sono equivalenti tra
di loro vale lidentit`
a
Z
Z
=
oppure lidentit`
a
Z
Z
=
j=1
j=1
j=1
a j=1
N
aX
oppure
Z
b
a seconda che
p0
>0o
p0
Lj ((t))0j (t) dt =
j=1
< 0.
72
Esempio 19.8. Applicando ripetutamente il Teorema 19.2 si verifica che lintegrale di seconda
specie
[0, 2]3 t 7 (cos t, sin t) `e uguale alla somma di quelli
p sullopposta
sulla circonferenza
di
2 , 1/ 2
y = 1 x2 , 1/ 2 x 1/ 2(cfr lEsempio
1.4),
sullopposta
di
x
=
y
p
y 1/ 2, su y = 1 x2 , 1/ 2 x 1/ 2 e su x = 1 y 2 , 1/ 2 y 1/ 2.
Se esiste una funzione U C 1 (A) tale che L = U in A si dice che `e una forma differenziale
esatta in A con primitiva data da U ; grazie al teorema di derivazione delle funzioni composte
che qui vale perche U , essendo di classe C 1 , `e differenziabile! si ottiene
Z bX
N
Lj ((t))0j (t) dt =
Z bX
N
a j=1
a j=1
d
U ((t)) dt = U ((b)) U ((a)).
dt
Ci`o significa che lintegrale di su non dipende dal sostegno della curva, bens` solo dai suoi
estremi (a) e (b) con lordine in cui sono presi, o, in maniera equivalente, che lintegrale `e nullo
se `e chiusa, ovvero (a) = (b). Per N = 3, con il campo vettoriale interpretato come campo
di forze F, lesistenza di U si esprime dicendo che F `e conservativo, con potenziale dato da U ;
il lavoro compiuto dal campo per spostare un punto materiale lungo la curva dipende solo dagli
estremi di essa e dal verso in cui essi si seguono, con valore 0 se la curva `e chiusa.
Quella appena formulata `e una condizione necessaria, che si potrebbe dimostrare essere anche
sufficiente, per lesistenza di U in tutto A. Unaltra condizione necessaria, ma stavolta non sufficiente, `e la seguente, che si ottiene sotto lipotesi che il campo vettoriale (L1 , . . . , LN ) sia di classe
C 1 . Supponiamo che il campo sia il gradiente della funzione U , per cui questultima `e adesso di
classe C 2 e quindi, grazie al Teorema di Schwarz, verifica (con la notazione Di = /xi )
Di Dk U = Dk Di U
da cui
D i Lk = D k Li
per i, k = 1, . . . , N , propriet`
a questa che si esprime dicendo che la forma differenziale `e chiusa;
nel caso tridimensionale la propriet`
a in questione, riferita al campo di forze F, si riscrive
F1
F2
=
,
y
x
F1
F3
=
,
z
x
F2
F3
=
z
y
73
sulla curva chiusa (t) = (cos t, sin t), 0 t 2 non vale 0 bens`
Z 2
(sin2 t + cos2 t) dt = 2.
0
E per`o nel caso C 1 lipotesi di chiusura della forma, o irrotazionalit`a del campo, diventa sufficiente per lesistenza di U in tutto A se si impone qualche restrizione sulla geometria di A: ad
esempio, lipotesi che A sia stellato rispetto ad un suo punto x0 , ovvero che, dato comunque x A,
tutto il segmento [0, 1] 3 t 7 (t) = x0 + t(x x0 ) sia contenuto in A16 . Allora infatti lipotesi
che sia chiusa in A implica che `e esatta in A. Dimostriamo questo risultato per N = 2 con A
stellato rispetto allorigine nel caso di un campo di forze irrotazionale (piano) F = (F1 , F2 ). Sia
Z
Z 1
U (x, y) =
F1 dx + F2 dy =
[F1 (tx, ty)x + F2 (tx, ty)y] dt.
=
[F1 (tx, ty)x+F2 (tx, ty)y] dt =
[(D1 F1 )(tx, ty)tx+F1 (tx, ty)+(D1 F2 )(tx, ty)ty] dt.
x
0 x
0
Dal momento che D1 F2 = D2 F1 per lipotesi di irrotazionalit`a, lultimo integrale qui sopra vale
Z 1
Z 1
[tF1 (tx, ty)]
[(D1 F1 )(tx, ty)tx)+(D2 F1 )(tx, ty)ty+F1 (tx, ty] dt =
dt = [tF1 (tx, ty)]10 = F1 (x, y).
t
0
0
Analogamente si vede che
U (x, y)
= F2 (x, y).
y
In generale, dunque, possiamo dire che in un qualunque aperto A lipotesi di chiusura di una
forma C 1 , o per N = 3 lipotesi di irrotazionalit`a di un campo di forze C 1 , pu`o non essere sufficiente
a garantire lesattezza della forma, o la conservativit`a del campo, in tutto A, ma `e senzaltro
sufficiente in ogni sottoinsieme di A che sia stellato rispetto a un suo punto; per`o pu`o anche
accadere che questultima condizione venga violata e che tuttavia il campo sia conservativo...
Esempio 19.10. Il campo magnetico, pur non essendo conservativo su tutto R2 \ {(0, 0)}, lo `e
in ogni sottoinsieme ottenuto privando R2 non solo del singolo punto {(0, 0)}, ma di unintera
semiretta uscente da tale punto: allora infatti laperto che si ottiene `e stellato rispetto a ogni
punto della semiretta opposta a . Ma questaltro campo
x
y
,
,
x2 + y 2 x2 + y 2
anchesso definito solo in R2 \ {(0, 0)}, vi `e globalmente conservativo, con potenziale log r. Il
fatto `e che esso rientra nella famiglia dei campi vettoriali radiali, cio`e della forma
r
r2n
r = (x, y)
per N = 2, r = (x, y, z)
16
per N = 3, r = krk
Casi particolarissimi: ogni prodotto cartesiano di intervalli `e stellato rispetto ad un qualunque suo punto; il piano
privato della semiretta x > 0 `e stellato rispetto ad un qualunque punto della semiretta x < 0 ma non lo `e rispetto
a nessun altro suo punto; eccetera.
74
per n 6= 0,
log r
per n = 0.
20
quella di una poligonale che ottiene agganciando uno dopo laltro un numero finito di segmenti
(xk , yk ) `e la somma delle lunghezze kxk yk k, e noi la indichiamo con `(). Se z `e un punto di
(x, y), cio`e z = x + (y x) per un ]0, 1[, la disuguaglianza triangolare vale col segno uguale:
kx yk = kx zk + kz yk.
Da ci`o segue che la lunghezza di (x, y) non varia se, invece che come un segmento, lo si considera
come la poligonale di vertici consecutivi x, z e y. Pi`
u in generale, dunque, la lunghezza di una
poligonale non varia se ai suoi vertici ne vengono aggiunti degli altri, non essenziali nel senso
appena detto.
Sia adesso data una curva semplice : [a, b] RN . Una poligonale inscritta in viene
costruita fissando una partizione a = t0 < t1 < < tn = b di [a, b] e agganciando consecutivamente
i segmenti ((tk1 ), (tk )), k = 1, ..., n. Diciamo che `e rettificabile se le lunghezze delle
poligonali inscritte in costituiscono un insieme limitato. In tal caso la lunghezza di `e
indicata con `() ed `e definita cos`:
`() = sup `( ).
Lipotesi che sia semplice non `e essenziale se non per fare in modo che la sua lunghezza possa
essere interpretata come lunghezza del suo sostegno.
Teorema 20.1. Se `e rettificabile ogni altra curva tale che = p per unopportuna funzione
reale continua ed invertibile p : [a, b] R `e a sua volta rettificabile ed ha la stessa lunghezza di .
DIM. Un numero finito di punti th distinti tra di loro determina una partizione di [a, b] se e solo
se i punti h = p(th ) sono distinti tra di loro e determinano una partizione di [c, d]. Dunque una
poligonale inscritta a `e una poligonale inscritta a , e viceversa.
Nelle considerazioni che abbiamo svolto finora non abbiamo fatto intervenire nessuna ipotesi di
regolarit`a delle curve in aggiunta a quella (di continuit`a) automaticamente garantita dalla definizione. Ma in un contesto cos` generale pu`o venir meno la rettificabilit`a, e perfino lunidimensionalit`
a.
Uno splendido esempio (troppo elaborato per essere presentato qui) `e la curva di Peano, il cui
sostegno `e lintero quadrato [0, 1]2 . Ma anche curve continue inequivocabilmente unidimensionali
possono non essere rettificabili:
75
Esempio 20.1. La curva piana (t) = (t, t sin(/2t)) per 0 < t 1, (0) = (0, 0) non `e rettificabile.
Sia
Pn infatti K un qualunque numero reale, e sia n = nK un numero naturale cos` grande che
j=2 1/j > K (divergenza della serie armonica). Sia poi la poligonale inscritta associata alla
partizione t0 = 0 < t1 = 1/n < t2 = 1/(n 1) < < tn = 1. Poiche
(j1)
sin j
sin
1
1
1
2
2
k(tj ) (tj1 )k
> , j = 2, ..., n,
= +
j
j1 j
j1
j
la lunghezza `( ) `e maggiore di K.
Passiamo a richiedere che la curva : [a, b] RN sia non pi`
u soltanto continua, bens` anche C 1
a tratti, dunque un cammino. Sia a = a0 < a1 < < am = b una partizione di [a, b] tale che 0 (t)
esista continua in ogni intervallo ]ah1 , ah [ ed ammetta limite in RN tanto quando t ah1 + 0 che
quando t ah 0. La norma k0 (t)k `e definita, limitata e continua in tutto [a, b] con leccezione
al pi`
u dei punti ah , dunque integrabile su [a, b] secondo Riemann.
Teorema 20.2. Ogni cammino : [a, b] RN `e rettificabile, e la sua lunghezza `e data dalla
formula
Z b
`() =
k0 (t)k dt.
(98)
cu4
DIM. Ci si convince facilmente che `e sufficiente dimostrare il presente enunciato per le restrizioni di
ai vari intervalli [ah1 , ah ] in cui essa `e una funzione di classe C 1 . Ma allora tanto vale supporre
direttamente che lo sia su tutto [a, b].
Per ogni partizione a = t0 < t1 < tn1 < tn = b la lunghezza della poligonale di vertici
(tk ) verifica
m
Z tk
m
X
X
0 (t) dt
k(tk ) (tk1 )k =
`( ) =
tk1
k=1
k=1
m Z tk
X
k=1
k0 (t)k dt =
tk1
k0 (t)k dt
Z
`()
k0 (t)k dt.
76
(99)
cu6
tk1
tk1
che
tk
Z
Z
Z tk
tk
tk
0
k0 (t)k dt 2
(t) dt
k0 (tk ) 0 (t)k dt.
tk1
tk1
tk1
(100)
cu7
Il primo membro della (100) `e la quantit`a k(tk ) (tk1 )k, e passando alla somma su k si ottiene
la lunghezza della poligonale determinata dalla partizione. Fissiamo > 0 e determiniamo
= > 0 tale che k0 ( ) 0 (t)k < per t, in [a, b] con |t | < (uniforme continuit`a di 0 (t)
su [a, b]). Per i tk tali che tk tk1 < otteniamo
b
Z
`( )
k0 (t)k dt 2(b a)
k0 ( )k d
della ristretta ad [a, t], dove t [a, b], `e una funzione detta ascissa curvilinea, che verifica
ds
= k0 (t)k.
dt
Questo spiega la notazione adottata per gli integrali curvilinei di prima specie. La s(t) `e una
funzione iniettiva di classe C 1 su [a, b]: la sua inversa t = t(s), di classe C 1 sullintervallo [0, `()],
fornisce una nuova curva [0, `()] 3 s 7 (t(s)) equivalente alla [a, b] 3 t 7 (t).
21
La formula di GaussGreen
Siano date due funzioni reali continue , : [a, b] R con < su ]a, b[, dove < a < b < .
Indichiamo con K luno o laltro dei due domini normali definiti a partire da f e g, cio`e o
{(x, y) R2 | a x b, (x) y (x)}
77
(101)
7.1
oppure
{(x, y) R2 | a y b, (y) x (y)}.
(102)
7.2
Se K `e il dominio (101) la sua frontiera `e il sostegno del cammino chiuso ottenuta agganciando
consecutivamente: la curva y = (x), a x b; il segmento (che pu`o anche ridursi ad un punto)
x = b, (b) y (b); lopposta della curva y = (x), a x b; lopposto del segmento (che pu`
o
anche ridursi ad un punto) x = b, (a) y (a). Considerazioni del tutto analoghe valgono per
K dato dalla (102).
Aggiungiamo lipotesi che e siano di classe C 1 su [a, b]. Per semplificare la terminologia
diciamo che i domini (101) e (102) sono adesso, rispettivamente, di tipo I e di tipo II. In entrambi
i casi la frontiera K di K `e sostegno di un cammino che orientiamo in senso antiorario e denotiamo
con +K. Per fissare le idee, sia K dato da (101). In ogni punto di K ad eccezione di (a, (a)),
(a, (a)), (b, (b)) e (b, (b)) sono definiti:
il versore tangente positivo a +K, che indichiamo con , uguale a
(1, 0 (x))
p
1 + 0 (x)2
(1, 0 (x))
p
1 + 0 (x)2
nonche a (0, 1) nei punti (a, y) con (a) < y < (a) (se ce ne stanno), (0, 1) nei punti (b, y)
con (b) < y < (b) (se ce ne stanno);
il versore normale esterno a K, che indichiamo con e , uguale a
( 0 (x), 1)
p
1 + 0 (x)2
(0 (x), 1)
p
1 + 0 (x)2
nonche a (1, 0) nei punti (a, y) con (a) < y < (a) (se ce ne stanno), (1, 0) nei punti (b, y)
con (b) < y < (b) (se ce ne stanno).
Prolunghiamo e a tutto R conservando la loro regolarit`a C 1 e ancora una volta, per fissare
le idee, prendiamo come K il dominio (101). Se A `e un aperto che contiene K, questultimo `e
contenuto nellunione di rettangoli aperti I]c, d[ con
[a, b] [c, d] A,
t7.1
x I.
(103)
7.3
Teorema 21.1. Sia K uno dei due aperti (101) o (102) e siano L, M due funzioni continue, nonche
dotate di derivate parziali Ly , Mx anchesse continue, in un aperto A K. Risulta
Z
Z
(Mx Ly ) dxdy =
L dx + M dy.
(104)
7.4
+K
DIM. Sia K il dominio di tipo I dato dalla (101). Per la formula di riduzione degli integrali doppi
ed il teorema fondamentale del calcolo integrale risulta
Z
Z b
Z (x)
Z b
Z
Ly dxdy =
dx
Ly (x, y) dy =
[L(x, (x)) L(x, (x))] dx =
L dx. (105)
K
(x)
+K
78
7.5
Per ogni scelta di I, c, d tali che che sia soddisfatta la (103), si applica il Teorema 7.3 alla
funzione
Z (x)
M (x, y) dy
x 7 (x) =
(x)
(x)
(x)
M (x, y) dy =
(x)
(x)
che viene dunque ad essere valida in ogni punto x [a, b]. Integrandola su [a, b] otteniamo
Z
(b)
(a)
(b)
Z
M (a, y) dy
M (b, y) dy
Mx (x, y) dy
(x)
(x)
dx
Mx dxdy =
Z
(a)
Z
=
M dy,
+K
1
+
a
#
Z b"
p
1
0 (x)
L(x, (x)) p
+ M (x, (x)) p
1 + 0 (x)2 dx,
0 (x)2
0 (x)2
1
+
1
+
a
Z (a)
Z (b)
M (a, y)(1) dy e
M (b, y) 1 dy.
(a)
(b)
F ds.
K
Nel secondo membro la scelta dellorientazione sulla frontiera di K, che non pu`o tradursi nel verso
di percorrenza sul cammino di integrazione dellintegrale di prima specie, dal momento che questultimo ne `e indipendente (e infatti abbiamo soppresso il segno +), compare invece nella funzione
integranda, dove il versore tangente `e orientato seguendo il verso antiorario di percorrenza del
cammino.
Diamo una formulazione equivalente della formula di GaussGreen prendendo una funzione
vettoriale continua G = (P, Q) : A R2 con derivate Px , Qy anchesse continue in A. Per L
79
7.6
+K
1
+
a
#
Z b"
p
1
0 (x)
+ Q(x, (x)) p
1 + 0 (x)2 dx,
P (x, (x)) p
1 + 0 (x)2
1 + 0 (x)2
a
Z (a)
Z (b)
P (a, y)(1) dy e
P (b, y) 1 dy.
(a)
(b)
G e ds.
(107)
Nel secondo membro la scelta dellorientazione sulla frontiera di K `e realizzata dal versore normale,
che `e precisamente quello esterno e e non il suo opposto. La variante (107) della formula di Green
esprime, sotto le ipotesi che abbiamo dato, il Teorema della divergenza.
Indichiamo con K il cerchio di centro lorigine e raggio 1. Si tratta s` di un dominio normale,
ma non di tipo I ne di tipo II, perche le funzioni
p
p
[1, 1] 3 x 7 1 x2 , [1, 1] 3 y 7 1 y 2
non sono di classe C 1 . Per`
o domini quali
K1 = {(x, y) R2 | x2 + y 2 1, x 1/ 2}
e
K2 = {(x, y) R2 | x2 + y 2 1, x 1/ 2}
K3 = {(x, y) R2 | x2 + y 2 1, 1/ 2 x 1/ 2}
`e di tipo I (non di tipo II). K `e unione dei Kj , e la sua frontiera, con lorientazione indotta da
quelle delle +Kj , diventa una curva orientata che indichiamo con +K. (Naturalmente avremmo
potuto pi`
u semplicemente dire che +K `e la circonferenza unitaria orientata in senso antiorario,
per`o in tal modo non avremmo suggerito una procedura di portata generale.) Se le funzioni L ed
M sono continue, con Ly e Mx anchesse continue, in un aperto contenente K si pu`o applicare la
formula di GaussGreen su ogni Kj ed ottenere
Z
(Mx Ly ) dxdy =
K
j=1
3 Z
X
j=1
3 Z
X
(Mx Ly ) dxdy
Kj
Z
L dx + M dy =
+Kj
L dx + M dy
+K
80
7.7
R
grazie alla cancellazione reciproca dei contributi negli +Kj L dx + M dy dei segmenti verticali
delle Kj . Lultimo membro si pu`
o adesso scrivere come un integrale sulla curva [0, 2] 3 t 7
(cos t, sin t).
Le considerazioni appena svolte per il cerchio si generalizzano ad ogni dominio K di cui si
possa dare, mediante intersezioni con opportune rette verticali ed orizzontali, una decomposizione
in un numero finito di sottodomini di tipo I o II privi due a due di punti interni in comune; le
frontiere dei sottodomini orientate positivamente inducono automaticamente sulla frontiera di K
una orientazione (positiva per definizione). Diciamo allora che K `e ammissibile, e il Teorema 21.1
ammette il seguente
Corollario 21.1. La formula di GaussGreen vale in ogni dominio ammissibile K per funzioni L
ed M continue, con Ly e Mx anchesse continue, in un aperto contenente K.
Lenunciato precedente si trasforma in un attimo nella sua variante per il Teorema della divergenza.
Esempio 21.1. Se un triangolo ha un lato verticale `e un dominio di tipo I, se ne ha uno orizzontale
`e un dominio di tipo II. Peraltro `e facile decomporre un qualunque triangolo nellunione di due
triangoli con un lato verticale oppure con uno orizzontale in comune. Ne segue che ogni triangolo
`e un dominio ammissibile.
Esempio 21.2. Una corona circolare `e ammissibile, e lorientazione positiva sulla sua frontiera induce il verso di percorrenza antiorario sulla circonferenza maggiore, quello orario sulla circonferenza
minore.
Esempio 21.3. Se ad un dominio normale di tipo I o II si toglie un disco aperto la cui chiusura sia
contenuta allinterno del dominio si ottiene un dominio ammissibile (unione di 8 domini normali di
tipo I oppure II). Da qui si arriva facilmente a generalizzare lEsempio 7.2 della corona circolare,
mostrando che `e ammissibile un disco chiuso privato di un disco aperto con la chiusura contenuta
allinterno del disco di partenza.
Osservazione 21.1. Prendendo una volta L(x, y) = 0, M (x, y) = x e laltra L(x, y) = y,
M (x, y) = 0 otteniamo per larea di un dominio ammissibile K le espressioni
Z
Z
v2 (K) =
x dy =
y dx.
+K
+K
Spesso, nelle applicazioni, quella che viene data esplicitamente `e una curva semplice e chiusa su
cui bisogna calcolare un integrale di seconda specie: se si vuole ricorrere alla formula di GaussGreen
nella formulazione data qui col Teorema 21.1 (tante altre, naturalmente, se ne possono trovare!)
bisogna mostrare innanzitutto che il sostegno di `e la frontiera di un dominio ammissibile K, e
poi che lintegrale su `e uguale a quello su +K.
81
22
Serie di funzioni
P
e
Data una successione di funzioniP
fk definita in un intervallo I, le associamo la serie
n=1 fk , cio`
che
ogni
successione
{g
}
di
funzioni
la successione delle ridotte Fn = nk=1 fk (e si tenga presente
n
P
(g
g
)).
Diciamo
che la serie
`e a sua volta la successione delle ridotte della serie g1 +
k+1
k
k=1
delle fn `e uniformemente convergente in I se `e tale la successione delle Fn . Utilizzando la
(37) scriviamo subito il criterio di Cauchy che fornisce la condizione necessaria e sufficiente per la
convergenza uniforme della serie: dato comunque > 0 esiste = N tale che
n+p
X
fk (x) per x I, n , p N
(108)
k=n+1
ovvero
n+p
X
sup
fk (x) per n , p N.
xI
k=n+1
Z b
X
fk (x) dx =
fk (x) dx
a k=1
k=1
k=1
k=1
X dfk
d X
fk (x) =
(x)
dt
dt
per x I.
per x I,
P
il che P
equivale alla convergenza della serie numerica k supxI |fk (x)| maggiorata termine a termine
dalla
n=1
PAk . La convergenza totale su I implica in ogni punto
P x di I la convergenza della serie
numerica k |fk (x)|, cio`e la convergenza assoluta della serie k fkP
(x). Ma c`e di pi`
u. Grazie alla
condizione di Cauchy soddisfatta dalla serie numerica convergente
A
ed
alle
disuguaglianze
k=1 k
n+p
n+p
n+p
X
X
X
fk (x)
|fk (x)|
Ak per x I
k=n+1
k=n+1
k=n+1
si vede subito che una serie totalmente convergente soddisfa la condizione uniforme di Cauchy (108)
e quindi converge uniformemente su I. Insomma, la convergenza totale implica quella uniforme.
82
causer
P
k
Per`o non vale il viceversa: in I = R la serie numerica
k=1 (1) /k, che converge grazie ad un
criterio di Leibniz, essendo una serie di funzioni costanti, `e uniformemente convergente, ma non
converge assolutamente e quindi neanche totalmente. Ma in un intervallo I una serie di funzioni pu`
o
convergere sia uniformemente che assolutamente senza convergere totalmente. Questo si verifica
ad esempio, di nuovo in I = R, fissando una successione di intervalli compatti Jk 6= due a due
disgiunti e prendendo come fk la funzione caratteristica di Jk moltiplicata per 1/k: la convergenza
assoluta `e ovvia e quella uniforme segue dallidentit`a
sup
n+p
X
xR k=n+1
1
1
1Jk (x) =
,
k
n+1
23
Serie di potenze
an (x x0 )n
(109)
serpo1
n=0
an xn
(110)
n=0
xn
n=0
(coefficienti tutti uguali ad 1, punto iniziale lo 0) che converge, ed ha per somma 1/(1 x), se e
solo se |x| < 1.
Naturalmente la (109) converge sempre almeno nel punto iniziale; quando
P la successione dei
coefficienti `e limitata il confronto della serie dei moduli con la serie geometrica (supn |an |)|xx0 |n
mostra subito che la (109) converge assolutamente per |x x0 | < 1.
Se la (109) converge assolutamente in un punto x1 si vede subito col confronto che la convergenza
`e totale per |x x0 | |x1 x0 |. In altri termini:
Lemma 23.1. La convergenza assoluta della (109) in x1 6= x0 `e equivalente alla convergenza totale
in tutto lintervallo chiuso [x0 r, x0 + r] con r = |x1 x0 |.
83
serpo2
tser1
Teorema 23.1. Se r `e il raggio di convergenza della (109) la serie converge assolutamente in ogni
punto dellintervallo aperto ]x0 r, x0 + r[, cio`e totalmente in ogni intervallo chiuso [x0 %, x0 + %]
con % < r (dove ci si limita al caso significativo r > 0), mentre non converge in nessun punto fuori
dellintervallo chiuso [x0 r, x0 + r] (nel caso r < ).
Esempio 23.1. Se la successione {an } dei coefficienti della serie (109) `e limitata il raggio di
convergenza della serie `e 1.
Diciamo che lintervallo di convergenza della serie (109) `e ]x0 r, x0 + r[ se 0 < r < ,
tutto R se r = .
Il Teorema 23.1 ammette il seguente
Corollario 23.1. Se il raggio di convergenza di r della serie di potenze (109) `e > 0 la somma f (x)
della serie `e una funzione continua allinterno del disco di convergenza.
84
X
xn
n!xn ,
n=0
n=0
n!
X
xn
n
n=0
valgono
0, , 1. Soffermiamoci sulla terza serie.
> 1 la serie numeP rispettivamente
P Quando
n
rica
1/n converge, e quindi la convergenza assoluta della n x /n ha luogo nella chiusura
dellintervallo di convergenza, cio`e per |x| 1. Quando invece < 1 si ha convergenza assoluta
solo per |x| < 1; per x = 1 non si ha mai neppure convergenza semplice, mentre, se `e positivo,
si ha convergenza semplice! per x = 1 grazie al criterio di Leibniz, e quindi anche (cfr.
lOsservazione 23.1) convergenza uniforme in [0, 1].
therag
nan (x x0 )n1 ,
n=1
e in generale
n=2
n=k
nan xn .
(111)
n=1
In ogni punto x dove questultima converge assolutamente deve convergere assolutamente anche la
(111), grazie alla disuguaglianza |an ||x|n n|an ||x|n . Dunque r0 r. Adesso supponiamo r > 0 e
85
serpo3
mostriamo che la (111) converge assolutamente per |x| < r, dal che seguir`a r0 = r. Indichiamo con
% un numero reale compreso in senso stretto tra |x| e r. Siccome la serie di partenza converge in %,
e di conseguenza |an |%n 0, il secondo membro della disuguaglianza
n
x
n
n|an ||x| n |an |%n
%
P
`e maggiorato definitivamente dal termine generico della serie convergente ntn con 0 t = |x|/% <
1. Ne segue che la (111) converge assolutamente per |x| < r.
P
n1 `
e uguale ad r. Da
Abbiamo dunque mostrato che il raggio di convergenza della
n=1 nan x
qui segue subito anche il risultato per k qualunque.
Grazie al precedente teorema abbiamo che, indicata con f (x) la somma della serie (109),
questultima ha il coefficiente an di indice n dato dallespressione
an =
f (n) (x0 )
n!
X
f (n) (x0 )
n=0
n!
(x x0 )n
(112)
serta1
(113)
serta2
o in particolare, se x0 = 0, di Maclaurin
X
f (n) (0)
n=0
n!
xn
di f (x).
Osservazione 23.2. Quando 0 < r < il Teorema 3.1 non dice nulla a proposito del comportamento della serie sulla frontiera dellintervallo di convergenza, e come abbiamo visto nellEsempio
23.2 la risposta andr`
a trovata caso per caso.
24
In Analisi I gi`
a si incontrano delle serie di Taylor o in particolare di Maclaurin delle funzioni f di
classe C in un intorno del punto iniziale. Nei vari esempi che allora sono stati studiati soltanto
dal punto di vista della convergenza puntuale non `e difficile in effetti determinare quelli che sono,
come sappiamo adesso, i rispettivi intervalli di convergenza. Ecco un rapido riepilogo.
86
n
X
xk
k=0
k!
+ Rn (x)
con
per x R
xn+1
e
(n + 1)!
Rn (x) =
|Rn (x)|
segue che Rn (x) 0 per n quale che sia x R. Quindi il raggio di convergenza `e , e vale
lo sviluppo in serie di Maclaurin
ex =
X
xk
k=0
k!
per x R.
(114)
n
X
(1)k
k=0
x2k+1
+ R2n+2 (x)
(2k + 1)!
con
|R2n+2 (x)|
per x R
|x|2n+3
.
(2n + 3)!
Dunque R2n+2 (x) 0 per n quale che sia x R: il raggio di convergenza `e , e vale lo
sviluppo in serie di Maclaurin
sin x =
(1)k
k=0
x2k+1
(2k + 1)!
per x R.
n
X
(1)k
k=0
x2k
+ R2n+1 (x)
(2k)!
con
|R2n+1 (x)|
per x R
|x|2n+2
.
(2n + 2)!
Dunque R2n+1 (x) 0 per n quale che sia x R: il raggio di convergenza `e , e vale lo
sviluppo in serie di Maclaurin
X
x2k
cos x =
(1)k
(2k)!
k=0
87
per x R.
serta3
Esempio 24.4. Integrando da 0 fino ad un qualunque x > 1 lidentit`a
1
tn+1
= 1 t + t2 + (1)n tn + (1)n+1
1+t
1+t
otteniamo
x2 x3
xn+1
+
+ + (1)n
+ Rn+1 (x),
2
3
n+1
log(1 + x) = x
dove
n+1
tn+1
dt
1+t
soddisfa
|Rn+1 (x)|
|x|n+2
se 1 < x < 0,
(n + 2)(1 + x)
|Rn+1 (x)|
xn+2
se x 0.
n+2
(1)n+1
n=1
xn
n
per 1 < x < 1: il raggio di convergenza `e 1. Per x = 1 il secondo membro converge semplicemente
a log 2, dal momento che
1
|Rn+1 (1)|
n+2
e anzi in [0, 1] la convergenza, senza essere totale, `e per`o uniforme.
Esempio 24.5. Integrando da 0 fino ad un qualunque x lidentit`a
2n+2
1
2
4
n 2n
n+1 t
=
1
t
+
t
+
(1)
t
+
(1)
1 + t2
1 + t2
otteniamo
x3 x5
x2n+1
+
+ + (1)n
+ R2n+1 (x),
3
5
2n + 1
Z x 2n+2
t
R2n+1 (x) = (1)n+1
dt
2
0 1+t
arctan x = x
con
e quindi
Z
|R2n+1 (x)|
0
|x|
t2n+2
dt
1 + t2
|x|
t2n+2 dt =
(1)n
n=0
88
x2n+1
2n + 1
|x|2n+3
.
2n + 3
X (1)n
=
.
4
2n + 1
n=0
Ricordiamo che in un punto x dellintervallo di convergenza la somma della (112) o della(113)
2
pu`o anche non essere il valore f (x) assunto dalla funzione di partenza: la funzione che vale e1/x
per x 6= 0 e 0 per x = 0, di classe C su R, coincide solo nellorigine con la somma della sua serie
di Maclaurin, che `e la funzione identicamente nulla.
Grazie al Teorema 22.1 (iii) di derivazione delle serie di funzioni di una variabile reale siamo
in grado di tornare indietro, dalle serie di potenze reali alle serie di Taylor, nel senso del prossimo
risultato.
Teorema 24.1. Se la serie (109) ha raggio di convergenza r > 0 la somma
f (x) =
an (x x0 )n
(115)
serta4
n=0
`e di classe C nel suo intervallo di convergenza, e la serie di Taylor di punto iniziale x0 della f `e
il secondo membro della (112), ovvero
an =
DIM. La serie
f (n) (x0 )
.
n!
nan (x x0 )n1
(116)
n=1
`e ottenuta derivando termine a termine la (109) rispetto ad x. Dal Teorema 23.3 sappiamo che
r `e anche il raggio di convergenza della (116), quindi che questultima converge totalmente e di
conseguenza uniformemente in [x0 %, x0 + %] per ogni % < r. Ma allora segue dal Teorema 22.1
(iii) che la somma della serie (116) `e la derivata f 0 (x) della somma f (x) della serie (109): questo `e
vero in ogni punto x ]x0 r, x0 + r[, come si vede prendendo % compreso strettamente tra |x x0 |
ed r.
Cos procedendo si dimostrano per ogni k le identit`a
f
(k)
(x) =
n (n k + 1)an (x x0 )nk
per |x x0 | < r.
n=k
X
f (n) (x0 )
n=0
n!
89
(x x0 )n .
serta5
25
secI1-4
(117)
I-4.1
con a(t) funzione reale continua in un intervallo aperto I R. La funzione identicamente nulla `e
soluzione di questa equazione. Prendiamo y 6= 0 e operiamo nella (117) una separazione delle
variabili attraverso lutilizzo a prima vista un po disinvolto della notazione di Leibniz
dy/dt = y 0 :
dy
a(t) dt.
y
In effetti per il primo membro di questa identit`a ha perfettamente senso come forma differenziale, e
da tale punto di vista ne vedremo una generalizzazione tra breve. Qui per`o va benissimo riscriverlo
semplicemente sotto forma integrale:
Z
Z
dy
= a(t)dt
y
ovvero
log |y| = A(t) + K
(118)
I-4.2
con K costante e A(t) primitiva di t 7 a(t) in I. La (118) `e una famiglia di equazioni cartesiane
in I] , 0[ e in I]0, [. Risolvendo rispetto a y troviamo per ogni scelta di C(= eK ) non
nulla la soluzione
y(t) = CeA(t) , t I,
sempre diversa da 0. Prendendo C = u0 eA(t0 ) in questa espressione otteniamo la condizione
y(t0 ) = u0 ,
(119)
I-4.4
con t0 fissato in I e u0 in R \ {0}, ricavando cos` per il problema di Cauchy (117),(119) lunica
soluzione
Rt
a( ) d
y(t) = u0 e t0
,
(120)
I-4.3
e in questa espressione rientra anche lunica soluzione dellequazione che in qualche punto t0 assuma
il valore u0 = 0, cio`e la funzione identicamente nulla.
Passiamo allequazione non omogenea
y 0 = a(t)y + f (t)
(121)
con f (t) anchessa continua da I in R. Indichiamo con y1 (t) il secondo membro della (120) per
u0 = 1 e riprendiamo la tecnica della variazione delle costanti. Affinche una funzione y(t), che
scriviamo come prodotto v(t)y1 (t), soddisfi la (121) in I, ovvero la quantit`a
y 0 (t) a(t)y(t) = [D a(t)][v(t)y1 (t)] = v 0 (t)y1 (t)
sia uguale a f (t), `e necessario e sufficiente che v 0 (t) sia uguale a f (t)/y1 (t). Questa richiesta
individua v(t) a meno di una costante additiva reale:
Z
v(t) = K +
t0
f (s)
ds = K +
y1 (s)
90
e
t0
Rs
t0
a( ) d
f (s) ds
I-4.5
(t0 , t I). Abbiamo cos` mostrato che la (121) `e dotata delle infinite soluzioni che si ottengono
facendo variare K nella somma
Z t R
R
Z t R
Rt
Rt
t
t
a( ) d
a( ) d
a( ) d
ts a( ) d
t
t
t
0
0
0
0
+
e s a( ) d f (s) ds
(122)
= Ke
+
e
f (s) ds e
Ke
I-4.6
t0
t0
dellintegrale generale dellomogenea (117) e di un integrale particolare della non omogenea stessa.
(Ai fini del calcolo nei casi concreti si fa prima ad ottenere una soluzione particolare della
(121) ripercorrendo il procedimento con cui `e stata ottenuta la funzione ausiliaria v(t) che non ad
applicare lespressione (122).)
Ponendo K = u0 nella (122) si ottiene la soluzione del problema di Cauchy (121),(119) (ovviamente unica, perche la differenza di due soluzioni `e la costante nulla, unica soluzione di (117) che
si annulla in un punto t0 ).
26
secI-5
Il metodo che adesso presentiamo consente (almeno in via teorica) la risoluzione esplicita di unequazione differenziale non lineare della forma
y 0 = a(t)b(y)
(123)
I-5.1
dy
=
b(y)
Z
a(t) dt
ovvero
B(y) = A(t) + K
(124)
I-5.2
dove K `e una costante, A(t) una primitiva di t 7 a(t) in I e B(y) una di y 7 [b(y)]1 in un
sottointervallo ]c, d[ di U dove b(y) 6= 0. La (124) `e una famiglia di equazioni cartesiane in I]c, d[
che per ogni scelta di un ammissibile valore di K possiamo risolvere rispetto a y (grazie alla
monotonia di B(y), la cui derivata b(y) `e sempre > 0 o sempre < 0 per come `e stato preso ]c, d[),
ottenendo lunica soluzione
y(t) = B 1 (A(t) + K) per t J
(125)
I-5.3
con J sottointervallo aperto di I (dipendente da K); con laggettivo in corsivo intendiamo semplicemente dire che, affinche il secondo membro dellidentit`a abbia senso, A(t) + K deve variare in
B(]c, d[) per ogni t J. Aggiungendo poi alla (123) la condizione di Cauchy (119) con t0 I e
u0 ]c, d[ si trova una e una sola soluzione y(t): quella data dalla (125) con K = B(u0 ) A(t0 ),
valore ammissibile perche A(t) + K, dal momento che vale B(u0 ) per t = t0 , resta nellintervallo
aperto B(]c, d[) al variare di t in un conveniente intervallo aperto 3 t0 .
Fin qui non abbiamo fatto altro che estendere lo stesso approccio gi`a applicato allequazione
lineare omogenea (117), la quale rientra nella (123) per b(y) = y, U = R. Ma tale estensione non
pu`o sempre procedere oltre, come ora passiamo ad illustrare.
91
Cosa succede, innanzitutto, se U contiene punti u1 dove b(y) si annulla, per cui la soluzione
costante y(t) = u1 soddisfa lequazione e quindi, banalmente, il corrispondente problema di Cauchy?
Quando b(y) = y abbiamo potuto mostrare che la funzione costante y(t) = 0 `e lunica soluzione
dellequazione che in un qualche prefissato punto t0 di I vale 0, e ci`o `e come dire che una soluzione
della (117) o coincide identicamente con la costante nulla oppure non la incontra mai. Invece nel
caso generale, diciamo con u1 = 0, non si pu`o escludere che una soluzione non identicamente nulla
vada a coincidere da un certo punto in poi con lo 0, come mostra il prossimo esempio.
Esempio 26.1. Lequazione
y 0 = |y|1/2
`e a variabili separabili con I = U = R. Cerchiamo una soluzione y(t) diversa da 0, diciamo < 0
(per cui prendiamo ]c, d[=] , 0[), in un intervallo aperto J. Siccome 2(y)1/2 `e una primitiva
di |y|1/2 = (y)1/2 in ] , 0[ e t `e una primitiva di 1 in R, imponiamo
1
[y(t)]1/2 = (C t)
2
per t J
ovvero
1
y(t) = (C t)2 per t J
4
con C arbitrariamente fissata. La funzione che ha questa espressione in J =] , C[ e vale
identicamente 0 in [C, [ `e una soluzione dellequazione su tutto I = R che allistante C soddisfa
la stessa condizione di Cauchy della soluzione identicamente nulla.
La causa del fenomeno di non unicit`a appena osservato risiede nella mancanza, per la funzione
di sufficiente regolarit`
a in vicinanza dello zero. Anticipando un risultato che dimostreremo
pi`
u in l`a segnaliamo che lunicit`
a di soluzioni per problemi di tipo (123),(119) `e invece garantita se
b(y), pur annullandosi nel punto u0 (come b(y) = |y|1/2 in u0 = 0), verifica in un suo intorno una
condizione di Lipschitz.
Ricordiamo poi che nel caso della (117) una qualunque soluzione viene automaticamente ad
essere definita in tutto lintervallo I. Questo accade anche per certe equazioni non lineari (123),
come quella dellesempio precedente, ma non per tutte.
|y|1/2 ,
I-e 5.2
per t J
ovvero
y(t) = (C t)1
per t J
(126)
con C arbitrariamente fissata. Per ogni C abbiamo ottenuto una soluzione che non si estende a
destra di J =] , C[ perche tende all per t C (e se, ad esempio, cerchiamo la totalit`a delle
soluzioni definite per ogni t 1 troviamo tutte e sole le (126) con C > 1).
92
I-5.5
I-o 5.2
I-5.6
2
u0
sicche la (124) con A(t) = t t0 e K = 0 diventa
Z y
d
= t t0 .
2
u0
Siccome lintegrale vale
1
y
log
u0
u0
y
u0
.
( u0 )e(tt0 ) + u0
(128)
Quando u0 `e negativo, non importa quanto vicino a 0, il denominatore della (128) `e una funzione
decrescente che, siccome tende a per t ed a u0 < 0 per t , deve annullarsi per t
uguale a un tempo finito T1 = T1 (u0 ) > t0 . Ne segue che y(t) 0 per t e y(t) per
t T1 .
Per ogni valore iniziale u0 ]0, /[ (com`e nel caso, con molto pi`
u piccolo di , del modello
biologico) la soluzione `e definita su tutto R. Poiche `e strettamente crescente e tende a 0 e /
rispettivamente per t e per t , il suo grafico ha la forma detta ad S nelle pubblicazioni
di carattere demografico.
Quando u0 > / il denominatore della (128) `e una funzione crescente che, siccome tende a 0
per t e vale > 0 per t = t0 , deve annullarsi per t uguale a un tempo finito T2 = T2 (u0 ) < t0 .
Ne segue che y(t) / per t e y(t) per t T2+ .
Abbiamo dunque visto che per t la soluzione di (127),(119) tende a / quando u > 0
viene comunque preso nellintorno ]0, [ di /: la soluzione costante y(t) = / `e un equilibrio
stabile. Invece nessuna soluzione del problema con u0 6= 0 resta, al crescere di t, in un intorno di
0 come ad esempio ] 1/2, 1/2[: lo 0 `e un equilibrio instabile.
93
I-5.7
27
Le equazioni differenziali di cui adesso passiamo ad occuparci sono quelle che si possono porre sotto
la forma
d
F (t, y) = 0
dt
con F (t, y) di classe C 1 in un aperto W del piano e y = y(t), funzione incognita di classe C 1
in qualche intervallo J. Il precedente corsivo ha una specifica ragion dessere che sar`a chiara tra
pochissimo. Per intanto riscriviamo lequazione evidenziando la dipendenza dellincognita da t:
d
F (t, y(t)) = Ft (t, y(t)) + Fy (t, y(t))y 0 (t) = 0
dt
per t J.
(129)
exa
per t J
con K costante. In altri termini, y(t) viene ad essere definita implicitamente dallequazione
F (t, y) = K
nel senso che si richiede al suo grafico {(t, y(t)) | t J} di giacere su una curva di livello della
funzione F . Il Teorema di Dini fornisce una condizione sufficiente perche ci`o possa accadere: se
(t0 , u0 ) W `e tale che Fy (t0 , u0 ) 6= 0, allora esiste ununica funzione y(t) di classe C 1 in un intervallo
aperto J 3 t0 il cui grafico coincide con la porzione della curva di livello F (t, y) = F (t0 , u0 ) che
cade in un opportuno intorno aperto V W di (t0 , u0 ) dove Fy si mantiene 6= 0. Questo ci dice
che esiste ununica funzione y = y(t) che soddisfa la (129) ovvero la
y 0 (t) =
Ft (t, y(t))
Fy (t, y(t))
per t J
(130)
exa1
con p(t, y) e q(t, y) continue in un aperto W del piano, q(t0 , u0 ) 6= 0 per qualche (t0 , u0 ) W ,
purche esista una F (t, y) di classe C 1 in W con Ft (t, y) = p(t, y) e Fy (t, y) = q(t, y), ovvero la
corrispondente forma differenziale p(t, y) dt + q(t, y) dy sia esatta. Per questo motivo si chiama
allora esatta lequazione differenziale (130), che si riscrive
p(t, y) dt + q(t, y) dy = 0.
(131)
E allora dobbiamo passare alla domanda successiva: come facciamo a riconoscere se il primo membro
della (131) `e una forma differenziale esatta? Una condizione sufficiente in un rettangolo R W
94
exa2
F (t, y) =
q(t0 , ) d +
u0
p(, y) d.
t0
Infatti
Ft (t, y) = p(t, y),
Z
q (, y) d = q(t, y).
py (, y) d = q(t0 , y) +
Fy (t, y) = q(t0 , y) +
t0
t0
Sottolineiamo che non abbiamo richiesto la derivabilit`a di p rispetto a t. Vedremo tra un attimo
(nellOsservazione 27.1) un esempio in cui questo margine pi`
u ampio si riveler`a utile.
Le equazioni della forma (123) rientrano nella classe di quelle esatte con p(t, y) = a(t), q(t, y) =
1/b(y), e a ben vedere proprio cos` ne abbiamo impostato lo studio. Solo che la particolare espressione a variabili separabili consente di ottenere subito la funzione che qui stiamo indicando con
F (t, y), e che per la (123) non `e altro che A(t) + B(y) con A(t) e B(y) primitive rispettivamente di
a(t) in I e di [b(y)]1 in ]c, d[, la cui esistenza `e diretta conseguenza del Teorema Fondamentale del
Calcolo. Inoltre lesistenza di soluzioni y(t) della (123) non ha bisogno di essere dimostrata attraverso il Teorema di Dini, visto che segue semplicemente dallinvertibilit`a della funzione monotona
B(y) della (sola) variabile y ]c, d[. Di pi`
u: applicando B 1 si pu`o dare (almeno teoricamente)
unesplicita espressione delle soluzioni che invece nel caso generale il Teorema di Dini non pu`
o
garantire.
Com`e ovvio siamo in grado di applicare il precedente ragionamento per risolvere la (129) anche
se in W non `e esatta la forma p dt+q dy, ma lo `e invece la forma p dt+q dy per unopportuna (t, y)
di classe C 1 e mai nulla, detta fattore integrante. Come trovare (t, y)? Sempre supponendo
che py , qt esistano continue imponiamo la condizione di chiusura (p)y = (q)t , cio`e
py + py = qt + qt .
(132)
(133)
dt
q
se la frazione nel secondo membro (con denominatore 6= 0) dipende solo dalla t. Analogamente,
esiste una soluzione della (132) indipendente dalla t e dunque tale che
qt py
d
=
dy
p
se la frazione nel secondo membro (con denominatore 6= 0) dipende solo dalla y.
Esempio 27.1. Per risolvere la (132) con
p(t, y) = 2ty + t2 y +
osserviamo che
y3
,
3
q(t, y) = t2 + y 2
py (t, y) qt (t, y)
2t + t2 + y 2 2t
=
= 1.
q(t, y)
t2 + y 2
95
exa4
exa5
Osservazione 27.1. Lequazione lineare non omogenea (121), a differenza di quella omogenea,
non `e a variabili separabili. Per`
o si riconduce a unequazione esatta, come si vede introducendo
un fattore integrante. Siano infatti p(t, y) = a(t)y f (t) (si noti che non abbiamo bisogno di
derivabilit`a rispetto a t) e q(t, y) = 1. Siccome (py (t, y) qt (t, y))/q(t, y) = a(t), una soluzione
Rt
(t) = e
t0
a( ) d
(134)
ber
con p(t) e q(t) continue in un intervallo aperto I. Fissiamo un diverso sia da 0 che da 1. La
(7.1) non `e lineare, ma richiedere che essa sia soddisfatta in un intervallo aperto J I da una y(t)
positiva (o anche negativa, se ad esempio N) equivale a richiedere che
y 0 y + p(t)y 1 + q(t) = 0
ovvero che [y(t)]1 coincida con una soluzione z(t) dellequazione lineare
z 0 + (1 )p(t)z = (1 )q(t),
t J.
96
(135)
ber1
La (134) `e detta equazione di Bernoulli. Lequation de mon Fr`ere, la chiama in una lettera
Johann Bernoulli, ma `e lui che la risolve, con la semplice trasformazione che abbiamo appena visto,
dopo mesi di infruttuosi tentativi da parte del fratello Jacob.
Attenzione per`
o a non voler trasferire automaticamente alla (134) ogni risultato noto per unequazione lineare quale la (135). Una qualunque soluzione z(t) di questultima `e infatti definita in
tutto I, ma non `e affatto detto che ci`o valga per la y(t) = z(t)1/(1) : si pensi allesempio, gi`
a
0
2
studiato con la separazione delle variabili, di y = y (dunque p(t) = 0, q(t) = 1, I = R) e alle
soluzioni y(t) = (C t)1 definite solo in J =] , C[ o solo in J =]C, [. Possiamo per`
o dire
che, dati comunque t0 I e u0 > 0 (o anche u0 < 0, se ad esempio N), esiste ununica funzione
definita e positiva in un opportuno intervallo aperto J I, J 3 t0 , che soddisfa la (134) e vale u0
in t0 : la funzione y(t) = z(t)1/(1) , t J, dove z(t) `e lunica soluzione della (135) che vale u1
0
in t0 .
` di Bernoulli lequazione
Esempio 27.2. E
y0
y
y 3 sin t = 0.
t
(136)
exa6
(137)
exa7
sin t
cos t C
2 cos t 4
4 2 + 2
t
t
t
1/2
97
per t0 fissato in R. Imponiamo la condizione di Cauchy y(t0 ) = u0 , che trasformiamo nella z(t0 ) =
u1
0 supponendo u0 6= 0. Otteniamo K = ( u0 )/u0 , e di conseguenza
z(t) =
( u0 )e(tt0 ) + u0
.
u0
u0
.
( u0 )e(tt0 ) + u0
28
(138)
2eq
x0 = Ax
(139)
complx
a b
.
A=
c d
(140)
defA
ovvero
con x = col (x1 , x2 ) e
Le soluzioni sono curve t 7 x(t) = col (x1 (t), x2 (t)), e chiaramente costituiscono uno spazio vettoriale. Vedremo che esse sono definite per ogni t R; i loro sostegni (o orbite, o traiettorie) si
ottengono, eliminando il parametro t tranne ovviamente nel caso delle soluzioni costanti x(t) = u
con Au = 0, dette equilibri , come grafici, qui chiamati diagrammi di fase, nel piano (x1 , x2 ),
qui chiamato piano delle fasi del sistema (139).
Uno strumento fondamentale del nostro studio sar`a lesame delle soluzioni dellequazione
caratteristica
det (I A) = 2 (tr A) + det A = 0
(dove tr A denota la traccia a + d di A), dette autovalori della matrice A. Se `e un autovalore e
u `e un autovettore associato a , cio`e un vettore 6= 0 tale che Au = u, una soluzione del sistema
diversa dallequilibrio 0 `e data dalla funzione t 7 et u:
(et u)0 = et u = et Au = A(et u).
Gli autovalori 1 e 2 di A verificano
1 + 2 = tr A,
98
1 2 = det A,
(141)
III-4.2
Infatti la funzione scalare y(t) soddisfa lequazione (141) se e solo se la funzione vettoriale
x1 (t)
y(t)
= 0
x2 (t)
y (t)
soddisfa il sistema
x01 = x2
x02 = kx1 hx2
Viceversa, derivando o luna o laltra equazione di tale sistema e poi procedendo per sostituzione
si vede che sia y(t) = x1 (t) e sia y(t) = x2 (t) soddisfano lequazione scalare
y 00 (tr A)y 0 + det A = 0,
la cui equazione caratteristica `e, non sorprendentemente, la stessa del sistema.
Il sistema `e detto stabile se tutte le sue soluzioni soluzioni sono limitate per t , instabile
in caso contrario, e asintoticamente stabile se tutte le sue soluzioni convergono a 0 per t .
Aggiungendo al sistema (139) la condizione iniziale
C1
x(0) = C =
(142)
C2
condi
y(0) = C1 ,
K1
y(0) = K =
= P 1 C.
K2
comply
(144)
Ebbene: a seconda degli autovalori di A si riesce sempre a costruire una matrice di passaggio P
in modo tale che risulti estremamente semplice dimostrare lesistenza di ununica soluzione per
ogni problema (143),(144), fornendone anzi lesplicita espressione e quindi anche visualizzandone
il diagramma di fase nel piano (y1 , y2 ). A quel punto basta operare la trasformazione affine P
99
cond
per passare allesistenza di ununica soluzione per ogni problema (139),(142), alla sua esplicita
espressione17 , nonche alla visualizzazione del suo diagramma di fase nel piano (x1 , x2 ).
1o Supponiamo per cominciare che A abbia due autovalori reali e distinti 1 e 2 , con rispettivi
autovettori u1 e u2 . Questo ci d`
a subito due soluzioni e1 t u1 e e2 t u2 , che si vede subito essere
linearmente indipendenti: ma come controllare se generano lo spazio di tutte le soluzioni, ovvero
se questultimo ha dimensione 2? Per rispondere, notiamo che A `e simile alla matrice diagonale
1 0
B=
0 2
con matrice di passaggio P = [u1
A[u1
u2 ]: infatti
u2 ] = [Au1
Au2 ] = [1 u1
2 u2 ] = [u1
u2 ]B.
Quindi anche allesplicita espressione di ogni soluzione y(t) del sistema (139), dal momento che (142) `e banalmente
soddisfatta con C definito come y(0).
100
III-e4.3
2o Siano i con , R, 6= 0 gli autovalori di una A M2 (R) con rispettivi autovettori
v iw (dove v, w sono vettori colonne di R2 ). Di nuovo otteniamo due funzioni e(i)t (v iw) che
soddisfano la (139)18 , e si vede anche, in un attimo, che sono linearmente indipendenti: ma si tratta
di funzioni a valori in C2 , non in R2 come interessa a noi. Allora procediamo con unopportuna
similitudine: quella tra A e la matrice
B=
con matrice di passaggio P = [v
w]. Infatti da
Aw = v + w
ovvero
A[v
w] = [Av
Aw] = [v w
v + w] = [v
w]B.
(146)
Partiamo dallidentit`
a di Eulero
e(+i)t = et (cos t + i sin t).
Derivando otteniamo
D(et cos t) = et ( cos t sin t),
ovvero
D[et (cos t + i sin t)] = ( + i)et (cos t + i sin t)
da cui
De(+i)t = ( + i)e(+i)t :
in altri termini, come per reale, cos` anche per complesso risulta
Det = et ,
o anche, moltiplicando per un qualunque vettore u di C2 ,
D(et u) = et u.
Naturalmente poi
D(Ket ) = Ket
al variare di K non solo nei reali, ma anche nei complessi, per cui lequazione omogenea z 0 = z con C ammette
le infinite soluzioni complesse Ket con K C; altre non ce ne sono, perche una qualunque soluzione si scrive
z(t) = v(t)et con v(t) differenziabile in un intervallo I, e quindi
0 = z 0 (t) z(t) = [v(t)et ]0 v(t)et = v(t)[(et )0 e ] + v 0 (t)et = v 0 (t)et ,
da cui v 0 (t) = 0. Ne segue che, fissato K C, Ket `e lunica soluzione del problema di Cauchy
z 0 = z,
y(0) = K.
101
comply
e quindi equivale a unequazione scalare nellincognita complessa z(t) = y1 (t) + iy2 (t):
y10 + iy20 = y1 + y2 + i(y1 + y2 ) z 0 = ( i)z.
Ogni soluzione di questa equazione `e univocamente espressa, una volta fissato il valore complesso
K1 + iK2 imposto a z(t) per t = 0, da
z = y1 + iy2 = (K1 + iK2 )e(i)t = (K1 + iK2 )et (cos t i sin t)
= et [K1 cos t + K2 sin t + i(K1 sin t + K2 cos t)];
da qui si ricava che ogni soluzione col (y1 (t), y2 (t) del sistema (146) `e univocamente espressa da
t
t
e sin t
e cos t
K1 cos t + K2 sin t
t
+ K2 t
= K1
e
e cos t
et sin t
K1 sin t + K2 cos t
una volta fissati i valori K1 e K2 rispettivamente imposti a y1 (t) e y2 (t) per t = 0 . Se = 0 lorigine
`e un centro: le traiettorie delle curve piane y1 = K1 cos t + K2 sin t, y2 = K1 sin t + K2 cos t,
t R, sono le circonferenze y12 + y22 = K12 + K22 . Altrimenti lorigine `e un fuoco stabile o instabile
a seconda che < 0 o > 0: le traiettorie delle curve piane y1 = et (K1 cos t + K2 sin t),
y2 = et (K1 sin t + K2 cos t), t R, sono spirali che escono dallorigine e crescono verso
linfinito per t decrescente nel primo caso e invece per t crescente nel secondo.
A questo punto, con una deformazione affine di matrice [v w] si ottiene la totalit`a della
soluzioni (a valori in R2 ) del sistema (139) facendo variare K1 , K2 R nellespressione
t K1 cos t + K2 sin t
v w e
= K1 et (v cos t w sin t) + K2 et (v sin t + w cos t),
K1 sin t + K2 cos t
per cui esse costituiscono uno spazio vettoriale reale di dimensione 2, e si arriva anche alla rappresentazione grafica delle loro traiettorie nel piano delle fasi (x1 , x2 ).
Esempio 28.2. La matrice dei coefficienti del sistema
0
x1 = 3x1 + 5x2
x02 = 5x1 + 3x2
ha un autovalore uguale a 3 5i con un autovettore dato da col (0, 1) + i col (1, 0) (e quindi, automaticamente, laltro autovalore `e uguale a 3 + 5i con un autovettore dato da col (0, 1) i col (1, 0)).
Un integrale generale `e dunque
0 1 3t K1 cos 5t K2 sin 5t
sin 5t
cos 5t
e
= K1 e3t
+ K2 e3t
.
sin 5t
1 0
K1 sin 5t + K2 cos 5t
cos 5t
3o Supponiamo che i due autovalori di A abbiano lo stesso valore reale , con autovettore u. Si trova
una soluzione et u di (139): e poi? Innanzitutto A, se non `e gi`a diagonale, non `e diagonalizzabile.
Per`o `e comunque comunque triangolarizzabile, cio`e simile ad una matrice triangolare (superiore
o inferiore). Sia infatti v un versore ek non proporzionale ad u. Supponendo k = 2 per fissare le
idee, possiamo scrivere il vettore Av (seconda colonna di A) come combinazione lineare di u e v
102
perche questi vettori, essendo linearmente indipendenti, costituiscono una base di R2 . Dunque Av
`e uguale a pu + qv, per cui
A[u
v] = [Au
Av] = [u
pu + qv] = [u
v]B
con
p
B=
.
0 q
Devessere q = perche B, essendo simile ad A, ha lo stesso autovalore di molteplicit`a 2; daltra
parte, p = 0 se e solo se v `e un altro autovettore della matrice, la quale `e allora diagona(lizzabi)le
perche due suoi autovettori sono linearmente indipendenti. Dunque vale la similitudine
p
AP = P B con P = u v e B =
, p 6= 0.
0
Il sistema y0 = By, ovvero
y10 = y1 + py2
(147)
y20 = y2
si risolve subito: inserendo nella prima equazione lunica soluzione della seconda che assume
nellorigine un dato valore K2 , cio`e y2 (t) = K2 et , si ottiene lequazione
y10 = y1 + pK2 et
la cui unica soluzione che assume nellorigine un dato valore K1 `e y1 (t) = et (K1 + K2 pt). Ne segue
che la totalit`
a delle soluzioni del sistema (147) si ottiene facendo variare K1 , K2 R nellespressione
t
t
e
e pt
t K1 + K2 pt
e
= K1
+ K2
.
K2
0
et
Per ottenere i diagrammi di fase ricaviamo innanzitutto t dalla y2 = K2 et : t =
y2 /K2 > 0. Dalla y1 = (K1 + K2 pt)et ricaviamo poi
y2
y2
K2 p
y1 = K1 +
log
K2 K2
y2
log K
per
2
sia per y2 > 0, purche K2 > 0, e sia per y2 < 0, purche K2 < 0: lorigine `e un nodo improprio
stabile o instabile a seconda che < 0 o > 0.
Ancora una volta concludiamo operando una deformazione affine, stavolta di matrice [u v]:
le soluzioni dellequazione di partenza si ottengono dalla formula
t K1 + K2 pt
u v e
= K1 et u + K2 et (tpu + v)
K2
sicche costituiscono uno spazio vettoriale reale di dimensione 2, e otteniamo subito la rappresentazione grafica delle loro traiettorie nel piano delle fasi (x1 , x2 ).
Esempio 28.3. La matrice dei coefficienti del sistema
0
x1 = x1 x2
x02 = x1 + 3x2
ha un autovalore doppio = 2, con autovettore u = col (1, 1). Prendiamo come v il versore
col (0, 1). Siccome Av = u + 2v, la totalit`a delle soluzioni del sistema si scrive come
1 0 2t K1 + K2 t
(K1 K2 t)e2t
e
=
.
1 1
K2
[K1 + K2 (t + 1)]e2t
103
comply
29
esistgr
Teorema 29.1. Sia f (t, y) una funzione reale continua in una striscia chiusa [A, B] R, dove
< A < B < , e dotata di derivata rispetto ad y continua con
|fy (t, y)| < .
sup
(148)
derlim
(t,y)[A,B]R
Allora, dati comunque t0 [A, B] e y0 R, esiste ununica funzione y = y(t) che soddisfa in [A, B]
lequazione differenziale
y 0 (t) = f (t, y(t))
(149)
pbcaueq
y(t0 ) = y0 .
(150)
pbcaueq
(151)
equint
nel seguente senso: una funzione y = y(t) `e di classe C 0 e soddisfa la (151) per t [A, B] se
e solo se `e di classe C 1 e verifica la (157) per t [A, B] insieme alla y(t0 ) = y0 .
Per dimostrare limplicazione se basta tener conto che il secondo membro della (151) vale
y0 per t = t0 e inoltre (Teorema fondamentale del Calcolo) `e derivabile in tutto [A, B] con
derivata uguale a f (t, y(t)), dunque continua = in [A, B] la y(t) `e di classe C 1 e soddisfa la
(157) insieme a y(t0 ) = y0 .
Limplicazione solo se si dimostra scrivendo la (157) con s al posto di t e integrando poi
entrambi i membri da t0 a t.
La seconda considerazione `e questa: grazie alla (148) esiste una costante L tale che
|f (t, y) f (t, z)| L|y z|
(152)
Dal Teorema del valor medio segue infatti che nel primo membro della (152) la quantit`
a
dentro al modulo `e uguale a fy (t, )(y z) per qualche opportuno valore di compreso tra y
e z, e quindi la (152) `e soddisfatta con L = sup(x,y)[A,B]R |fy (x, y)|.
Mostriamo lunicit`
a. Siano date due soluzioni y(t) e y(t), per cui sono soddisfatte in [A, B]
tanto la (151) che la
Z t
y(t) = y0 +
f (s, y(s)) ds.
t0
[0, (2L)1 ]
Fissato il pi`
u grande valore di a
tale che t1 = t0 + a B, sottraiamo membro a
membro le due equazioni integrali e passiamo alla maggiorazione dei moduli utilizzando la (152):
per [t0 , t1 ] risulta
Z
Z
|y( ) y( )|
|f (s, y(s)) f (s, y(s))| ds L
|y(s) y(s)| ds La ,
2
t0
t0
104
lipcau
dove denota il massimo di |y(t) y(t)| in [t0 , t1 ], e quindi, prendendo come un punto in cui tale
massimo viene assunto, otteniamo
,
2
da cui = 0. Ci`
o mostra che y(t) = y(t) per t0 t t1 . Se t1 < B fissiamo il pi`
u grande valore di
a [0, (2L)1 ] tale che t2 = t1 + a B e poniamo y1 = y(t1 ) = y(t1 ). Adesso y(t) e y(t) verificano
rispettivamente
Z
t
y(t) = y1 +
t1
f (s, y(s)) ds
y(t) = y1 +
t1
e possiamo ripetere il ragionamento precedente, arrivando a dimostrare che y(t) = y(t) per t0 t
t2 . In un numero finito di passi concludiamo che y(t) = y(t) per t0 t B; in maniera analoga si
vede che y(t) = y(t) per A t t0 .
Passiamo allesistenza. Definiamo per ricorrenza
Z t
y1 (t) = y0 +
f (s, y0 ) ds,
t0
t
Z
y2 (t) = y0 +
f (s, y2 (s)) ds
y3 (t) = y0 +
t0
e via via
Z
yn+1 (t) = y0 +
f (s, yn (s)) ds
per n N.
(153)
nterm
(154)
ricorr
t0
per n N,
`e a sua volta uniformemente convergente. Ne segue che nel secondo membro della (153) si pu`
o
passare al limite sotto il segno dintegrale, e quindi che la y(t) soddisfa la (151) in [A, B].
Per concludere:
DIM. DEL LEMMA Sia M il massimo di |f (, y0 | su [A, B]. Facciamo dapprima variare t in [t0 , B]:
otteniamo innanzitutto
Z
t
|y1 (t) y0 |
|f (s, y0 )| ds M (t t0 ),
t0
105
(st0 ) = LM
t0
t
2
t0
t0
t0
|y1 (s)y0 | ds LM
t0
(t t0 )2
,
2
(s t0 )2
(t t0 )3
= L2 M
,
2
3!
da cui in generale
|yn+1 (t) yn (t)| Ln M
(B A)n+1
.
(n + 1)!
(155)
magtot
Siccome il secondo membro della (155) `e laddendo generico di una serie numerica convergente,
abbiamo ottenuto la convergenza totale della serie (154) in [t0 , B]. Allo stesso modo si ottiene la
convergenza totale della serie (154) in [A, t0 ].
olip
Osservazione 29.1. Come abbiamo evidenziato allinizio della precedente dimostrazione, la (148)
non `e servita ad altro che ad ottenere la propriet`a (152), questultima s` assolutamente essenziale in
tutto il successivo svolgimento. In altri termini: la tesi del Teorema 29.1 continua a valere inalterata
se lipotesi che f sia dotata di fy continua con la propriet`
a (148) viene indebolita richiedendo che
per unopportuna costante L sia soddisfatta la (152). A questo punto viene naturale chiedere:
perche non abbiamo gi`
a in partenza enunciato il teorema con lipotesi pi`
u debole? E la risposta
`e: perche sempre, quando si vuole appurare se una funzione verifica una condizione di Lipschitz
in una data variabile, la prima cosa da fare `e verificare se la funzione `e dotata, rispetto a quella
variabile, di derivata limitata, per cui si possa applicare il Teorema del valor medio! Poi, certo,
tale verifica pu`
o avere esito negativo, e allora si dovr`a ricorrere a opportune tecniche ad hoc, come
vedremo per esempio nel caso della dimostrazione del Teorema 31.1.
Ecco unutile variante del Teorema 29.1:
esistgr
Teorema 29.2. Sia f (t, y) una funzione reale continua in una striscia aperta S =]a, b[R, dove
a < b , e dotata in S di derivata rispetto ad y continua, con
|fy (t, y)| <
sup
(156)
derlim
(t,y)[A,B]R
per ogni coppia di punti A, B ]a, b[ con A < B. Allora, dati comunque t0 ]a, b[ e y0 R, esiste
ununica funzione y = y(t) che soddisfa in ]a, b[ lequazione differenziale
y 0 (t) = f (t, y(t))
(157)
pbcaueq
(158)
pbcaueq
106
y(t0 ) = y0 .
DIM. Fissiamo una successione crescente di intervalli [An , Bn ] ]a, b[ tutti contenenti t0 , con An a
e Bn b. Per ogni n possiamo applicare il Teorema 29.1 e ottenere lesistenza di una soluzione y (n)
in [An , Bn ] del problema (158). Per lunicit`a, su [An , Bn ] ogni y (n+k) coincide con y (n) , e quindi la
funzione y(t) posta uguale a y (n) (t) se t [An , Bn ] (`e univocamente determinata e) soddisfa, oltre
alla condizione di Cauchy per t = t0 , lequazione (157) per ogni t ]a, b[.
Sottolineiamo un aspetto molto importante dei Teoremi 29.1 e 29.2: abbiamo ottenuto una
soluzione y(t) che soddisfa lequazione (157) in tutto il primo lato della striscia su cui `e definita
la f (t, y) ([A, B] per il Teorema 29.1 e ]a, b[ per il Teorema 29.2), ovvero una soluzione in grande.
Ci`o `e stato possibile grazie alla limitatezza della fy nel prodotto cartesiano di [A, B] per tutto R
richiesta in (148) e (163): richiesta molto forte, che per`o permette di coprire casi significativi come
mostreremo nella prossima sezione.
30
Estensioni e applicazioni
Casi particolari di applicazione del Teorema 29.2 si costruiscono facilmente: ad esempio y 0 = cos t2 y,
2 2
(t, y) S =]a, b[R, dove < a < b < , oppure y 0 = t3 et y , (t, y) S =] , [R...
Per tutta una classe di esempi vanno menzionate le equazioni lineari (che peraltro, si sanno anche
risolvere esplicitamente) y 0 + a(t)y = g(t) con a(t), g(t) continue in ]a, b[, a < b .
Per casi pi`
u significativi passiamo allequazione differenziale (vettoriale)
y0 = f (t, y)
cio`e al sistema
(159)
IV-(2.1)
(160)
IV-(2.3)
(161)
IV-(2.4)
(162)
IV-(2.5)
y1 = f1 (t, y1 , . . . , yN )
..
.
0
yN = fN (t, y1 , . . . , yN )
...,
yN (t0 ) = y0N .
2 = y3
..
.
= yN
yN
0 1
yN = g(t, y1 , . . . , yN )
107
y (N 1) (t0 ) = yN 1
...,
associate alla (162) si trasformano facilmente nelle (161), e quindi nella (160).
Passando dal caso scalare a quello vettoriale si estendono facilmente Teoremi 29.1 e 29.2;
questultimo, in particolare, diventa
Teorema 30.1. Sia f (t, y) una funzione a valori in RN continua in un aperto S =]a, b[RN , dove
a < b , e dotata in S di matrice jacobiana [f (t, y)/y] rispetto ad y continua, con
|det [f (t, y)/y]| <
sup
(163)
(t,y)[A,B]RN
per ogni coppia di punti A, B ]a, b[ con A < B. Allora, dati comunque t0 ]a, b[ e y0 R, esiste
ununica funzione y = y(t) che soddisfa in ]a, b[ lequazione differenziale
y0 (t) = f (t, y(t))
insieme alla condizione di Cauchy y(t0 ) = y0 , ovvero il problema di Cauchy
y0 = f (t, y),
y(t0 ) = y0 .
0
yN = a1N (t)y1 + + aN
N yN (t) + gn (t)
con le aij (t), gj (t) continue in ]a, b[, a < b , e scalare di ordine N
y (N ) + aN 1 (t)y (N 1) + + a0 (t)y = g(t)
con le aj (t), g(t) continue in ]a, b[, a < b .
31
Esistenza in piccolo
Passiamo ad occuparci dellesistenza di soluzioni per il problema di Cauchy quando lipotesi, utilizzata nei Teoremi 29.1 e 29.2, di limitatezza della fy nelle strisce chiuse [A, B] R viene sostituita
da una condizione pi`
u debole.
esistpic
Teorema 31.1. Sia f (t, y) una funzione reale continua e dotata di derivata continua rispetto ad y
in un aperto U di R2 . Allora, dato comunque (t0 , y0 ) U , esiste un intervallo ], [3 t0 su cui `e
definita ununica soluzione y = y(t) del problema di Cauchy (158).
108
derlim
DIM. Sia R = [A, B] [C, D] U un rettangolo contenente (t0 , y0 ) al proprio interno, e sia
L = max(t,y)R |fy (t, y)|, per cui
|f (t, y) f (t, z)| L|y z|
La funzione
(164)
lipcau
f (t, y) per A t B, C y D
F (t, y) = f (t, D) per A t B, y > D
`e continua in [A, B]R; non `e dotata di derivata rispetto ad y nei punti di [A, B]{C} e [A, B]{D},
per`o soddisfa, grazie alla (164), la
|F (t, y) F (t, z)| L|y z|
Tanto basta, tenendo conto dellOsservazione 29.1, ad applicare il Teorema 29.1 con f sostituita da
F : in [A, B] esiste ununica soluzione y = y(t) dellequazione
y 0 (t) = F (t, y(t))
(165)
Ma attraverso ulteriori sviluppi della teoria si arriva a fornire una determinazione otttimale dellintervallo, che
prende il nome di intervallo massimale di esistenza della soluzione.
109
pbcaueq-
y0
,
1 y0 t
(166)
dove o t < 1/y0 se y0 > 0, o t > 1/y0 se y0 < 0: nel primo caso y(t) `e positiva nella semiretta
aperta e tende all per t (1/y0 ) , nel secondo caso `e negativa nella semiretta aperta e tende a
per t (1/y0 )+ .
Come si colloca questo esempio rispetto ai teoremi di esistenza e unicit`a visti finora? Il secondo
membro di (166) `e una funzione continua e derivabile in R2 , e questultimo `e naturalmente una
striscia ]a, b[R con a = e b = , ma non possiamo applicare il Teorema 29.2: la derivata
2y di y 2 non si mantiene limitata in nessuna striscia [A, B] R (e, data comunque L > 1, basta
prendere y > L e = 0 per violare (152)). Invece sono soddisfatte le ipotesi del Teorema 31.1 con
U = R2 : lintervallo ], [ della tesi non coincide con la totalit`a (tutto R!) dei valori di t per i quali
ha senso f (t, y) = y 2 , bens` solo con ] , 1/y0 [ o ]1/y0 , [ a seconda che y0 > 0 o y0 < 0.
E se y0 = 0, caso finora non considerato? Banale: per il risultato dunicit`a la funzione
identicamente nulla `e la sola che soddisfa lequazione e la condizione di Cauchy.
110
pbcaueq