Sei sulla pagina 1di 1270

Appunti di Analisi matematica

Paolo Acquistapace
2 aprile 2009
Indice
1 Numeri 1
1.1 Alfabeto greco . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Insiemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Il sistema dei numeri reali . . . . . . . . . . . . . . . . . . . . 9
1.5 Assioma di completezza . . . . . . . . . . . . . . . . . . . . . 13
1.6 Numeri naturali, interi, razionali . . . . . . . . . . . . . . . . . 21
1.7 La formula del binomio . . . . . . . . . . . . . . . . . . . . . . 32
1.8 Radici n-sime . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.9 Valore assoluto . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.10 La funzione esponenziale . . . . . . . . . . . . . . . . . . . . . 47
1.11 Geometria nel piano . . . . . . . . . . . . . . . . . . . . . . . 60
1.12 Numeri complessi . . . . . . . . . . . . . . . . . . . . . . . . . 80
2 Successioni 112
2.1 Limiti di successioni . . . . . . . . . . . . . . . . . . . . . . . 112
2.2 Serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
2.3 Successioni monotone . . . . . . . . . . . . . . . . . . . . . . . 129
2.4 Criteri di convergenza per le serie . . . . . . . . . . . . . . . . 137
2.5 Assoluta convergenza . . . . . . . . . . . . . . . . . . . . . . . 146
2.6 Successioni di Cauchy . . . . . . . . . . . . . . . . . . . . . . . 153
2.7 Serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . 155
2.8 Riordinamento dei termini di una serie . . . . . . . . . . . . . 171
2.9 Moltiplicazione di serie . . . . . . . . . . . . . . . . . . . . . . 180
3 Funzioni 185
3.1 Spazi euclidei R
m
e C
m
. . . . . . . . . . . . . . . . . . . . . . 185
3.2 Funzioni reali di m variabili . . . . . . . . . . . . . . . . . . . 200
i
3.3 Limiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
3.4 Propriet`a delle funzioni continue . . . . . . . . . . . . . . . . . 224
3.5 Asintoti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
4 Calcolo dierenziale 239
4.1 La derivata . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
4.2 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . 255
4.3 Propriet`a delle funzioni derivabili . . . . . . . . . . . . . . . . 266
4.4 Condizioni sucienti per la dierenziabilit`a . . . . . . . . . . 275
4.5 Dierenziabilit`a di funzioni composte . . . . . . . . . . . . . . 278
4.6 Derivate successive . . . . . . . . . . . . . . . . . . . . . . . . 282
4.7 Confronto di innitesimi e inniti . . . . . . . . . . . . . . . . 288
4.8 Formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . 297
4.9 Massimi e minimi relativi per funzioni di una variabile . . . . 310
4.10 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . 313
4.11 Massimi e minimi relativi per funzioni di pi` u variabili . . . . . 319
4.12 Convessit`a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
5 Calcolo integrale 334
5.1 Lintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
5.2 Propriet`a dellintegrale . . . . . . . . . . . . . . . . . . . . . . 343
5.3 Alcune classi di funzioni integrabili . . . . . . . . . . . . . . . 349
5.4 Il teorema fondamentale del calcolo integrale . . . . . . . . . . 355
5.5 Metodi di integrazione . . . . . . . . . . . . . . . . . . . . . . 360
5.6 Formula di Stirling . . . . . . . . . . . . . . . . . . . . . . . . 370
5.7 Integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . . 374
6 Equazioni dierenziali 385
6.1 Generalit`a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385
6.2 Alcuni tipi di equazioni del primo ordine . . . . . . . . . . . . 399
6.3 Equazioni lineari del secondo ordine . . . . . . . . . . . . . . . 406
Indice analitico 413
ii
Capitolo 1
Numeri
1.1 Alfabeto greco
Un ingrediente indispensabile per lo studente che aronta un corso di analisi
matematica `e la conoscenza dellalfabeto greco, di cui verranno usate a vario
titolo gran parte delle lettere (minuscole e maiuscole). Eccolo:
alfa A iota I ro P
beta B cappa K sigma
gamma lambda tau T
delta mu (mi) M iupsilon Y
epsilon E nu (ni) N
zeta Z csi chi X
eta H omicron o O psi
teta pi omega
Esercizi 1.1
1. Scrivere il proprio nome e cognome in lettere greche.
1.2 Insiemi
Il concetto di insieme `e un concetto primitivo, quindi non si pu`o denire se
non ricorrendo a circoli viziosi; comunque in modo vago ma ecace possiamo
dire che un insieme `e una collezione di elementi. Indicheremo gli insiemi con
lettere maiuscole A, B, . . . e gli elementi di un insieme con lettere minuscole
1
a, b, x, t, . . . .
Per evitare paradossi logici, `e bene parlare di insiemi solo dopo aver ssa-
to un insieme universo X, che `e lambiente dentro al quale lavoriamo, e
considerarne i vari sottoinsiemi(cio`e gli insiemi A contenuti in X). La scelta
dellambiente X va fatta di volta in volta e sar`a comunque chiara dal conte-
sto.
Come si descrive un insieme? Se esso `e nito (ossia ha un numero nito di
elementi), e questi elementi sono pochi, ci`o pu`o avvenire elencandoli; ma
se linsieme ha molti elementi, o ne ha addirittura una quantit`a innita (si
dice allora che linsieme `e innito), esso si pu`o descrivere individuando una
propriet`a p(x) che gli elementi x delluniverso X possono possedere o no, e
che caratterizza linsieme che interessa. Per esempio, linsieme
A = 1, 2, 3, 4, 6, 12
`e altrettanto bene descritto dalla propriet`a
p(x) = x `e divisore di 12,
la quale, allinterno dei numeri naturali (che in questo caso costituiscono il
nostro universo), contraddistingue esattamente gli elementi dellinsieme A.
Introduciamo alcuni simboli che useremo costantemente nel seguito.
x A signica: x appartiene ad A, ovvero x `e un elemento di A.
A B, B A signicano: A `e contenuto in B, ovvero B contiene
A, ovvero ogni elemento di A `e anche elemento di B, o anche A `e
sottoinsieme di B.
A = B signica: A coincide con B, ovvero A e B hanno gli stessi
elementi, ovvero A B e B A.
A B, B A signicano: A `e strettamente contenuto in B, ovvero A
`e sottoinsieme proprio di B, ovvero ogni elemento di A `e elemento di
B ma esiste almeno un elemento di B che non `e elemento di A, ovvero
A B ma A non coincide con B.
Per negare le propriet`a precedenti si mette una sbarretta sul simbolo corri-
spondente: ad esempio, x / A signica che x non appartiene allinsieme A,
A ,= B signica che gli insiemi A e B non hanno gli stessi elementi (e dunque
2
vi `e almeno un elemento che sta in A ma non in B, oppure che sta in B ma
non in A), eccetera.
Sia X un insieme e siano A, B sottoinsiemi di X. Deniamo:
AB = unione di A e B, ossia linsieme degli x X che appartengono
ad A oppure a B (oppure ad entrambi).
A B = intersezione di A e B, ossia linsieme degli x X che
appartengono sia ad A che a B.
A B = dierenza fra A e B, ossia linsieme degli x X che apparten-
gono ad A, ma non a B.
A
c
= X A = complementare di A in X, ossia linsieme degli x X
che non appartengono ad A.
= insieme vuoto, ossia lunico insieme privo di elementi.
Si noti che A B = B A, A B =
BA, ma in generale AB ,= BA. Se
A B = , gli insiemi A e B si dicono
disgiunti.
Vi sono altre importanti propriet`a degli insiemi e delle operazioni su di es-
si, di cui non ci occupiamo qui: ne parleremo di volta in volta quando ci
occorreranno. Introduciamo ora alcuni insiemi importanti:
N = insieme dei numeri naturali = 0, 1, 2, 3, 4, 5, 6, 7, . . ..
N
+
= insieme dei numeri naturali diversi da 0 = 1, 2, 3, 4, 5, 6, 7, . . ..
3
Z = insieme dei numeri interi = 0, 1, 1, 2, 2, 3, 3, 4, 4, . . ..
Q = insieme dei numeri razionali, cio`e di tutte le frazioni
p
q
con p Z,
q N
+
.
R = insieme dei numeri reali: su questo insieme ci soermeremo a
lungo; esso contiene Q, ma anche numeri rrazionali come , e,

2,

3.
C = insieme dei numeri complessi, cio`e i numeri della forma a + ib,
con a, b R; la quantit`a i si chiama unit`a immaginaria e verica
luguaglianza i
2
= 1: essa non `e un numero reale. Anche su questo
insieme avremo molto da dire.
Notiamo che valgono le inclusioni
N
+
N Z Q R C.
Nelle nostre formule useremo alcuni altri simboli che sono delle vere e proprie
abbreviazioni stenograche, e che andiamo ad elencare.
Il simbolo signica per ogni: dunque dire che x B x A
equivale a dichiarare che ogni elemento di A sta anche in B, cio`e che
A B.
Il simbolo signica esiste almeno un: dunque aermare che x A
tale che x B vuol dire che c`e almeno un elemento di A che sta anche
in B, ossia che A B non `e vuoto. i due simboli , exists vengono
detti quanticatori esistenziali.
Il simbolo ! signica esiste un unico: dunque la frase ! x A
tale che x B indica che c`e uno ed un solo elemento di A che sta in
B, ossia che A B `e costituito da un solo elemento.
Il simbolo : signica tale che: dunque laermazione ! x A : x
B ha lo stesso signicato dellenunciato del punto precedente.
Il simbolo = signica implica: quindi la frase x A = x B
vuol dire che se x A allora x B, ossia A B.
Il simbolo signica se e solo se: si tratta della doppia implica-
zione, la quale ci dice che i due enunciati a confronto sono equivalenti.
Ad esempio la frase x A x B indica che A = B.
4
Nel nostro corso non ci occuperemo di questioni di logica formale e non parle-
remo di predicati, proposizioni, variabili, tabelle di verit`a, eccetera; cerchere-
mo di ragionare secondo il nostro buon senso, anato (si spera) dalle passate
esperienze scolastiche, rimandando al corso di logica la sistemazione rigorosa
di questi aspetti. Ci limitiamo ad osservare che la pulizia formale `e sempre
utile ma non determinante: laermazione di poco sopra x A : x B `e
formalmente perfetta ma, se ad esempio
A = n N : n 5, B = n N : n
2
> 25,
essa risulta inesorabilmente falsa.
Come si fa a negare unaermazione della forma x A y B tale che
x = y? Dobbiamo formulare lesatto contrario dellenunciato precedente:
dunque, a lume di naso, ci sar`a almeno un x A per il quale, comunque
si scelga y B, sar`a sempre x ,= y; ovvero, existsx A tale che y B
risulta x ,= y. Si noti come i quanticatori e si siano scambiati di posto.
Unaltra importante operazione fra due insiemi X, Y `e il prodotto cartesiano
X Y : esso `e denito come linsieme di tutte le coppie (x, y) con x X e
y Y . Pu`o anche succedere che Y = X, ed in tal caso scriveremo spesso
X
2
in luogo di X X; in questo caso si noti che entrambe le coppie (x, y) e
(y, x) appartengono allinsieme X
2
, e che esse sono diverse luna dallaltra.
Esercizi 1.2
1. Sia A R. Scrivere la negazione delle seguenti aermazioni:
(i) y R : x < y x A,
(ii) x A y A : x < y,
(iii) y, z R : y < x < z x A,
(iv) x A y, z A : y < x < z.
5
2. Elencare gli elementi di ciascuno dei seguenti insiemi:
A =
_
k Z :
1
k
Z
_
;
B = k Z : h Z : k = 6h;
C = n N : m N : m 10, n = 6m;
D =
_
n N :
1
n+2
N
_
;
E = n N : m N : n = 3
m
;
F = n N : n +m > 25 m N.
3. Dimostrare che
_
x R :
x
2
5x + 6
x
2
3x + 2
> 0
_
=] , 1[[3, +[.
4. Sono vere le seguenti aermazioni?
(i) 1 x R : x
2
< 1, (ii) 0 x R : x
2
< 1,
(iii) 1 x R : x
2
= 1, (iv) 2 x R : x
2
4.
5. Disegnare i seguenti sottoinsiemi di R
2
:
A = (x, y) R
2
: y = 2x,
B = (y, x) R
2
: y = 2x,
C = (x, y) R
2
: x = 2y.
6. Siano A, B, C, D sottoinsiemi di un insieme X. Provare le seguenti
relazioni (formule di de Morgan:
(i) (A B) (C D) = (A C) (B D),
(ii) (A B) (C D) = (A C) (B D),
(iii) (A B) (C D) (A C) (B D),
(iv) (A B) C = (A C) (B C),
(v) (A B) C = (A C) (B C).
6
1.3 Funzioni
Uno dei concetti pi` u importanti della matematica, e non solo dellanalisi, `e
quello di funzione. Una funzione f `e una corrispondenza (di qualunque na-
tura) fra due insiemi X e Y , con lunica regola di associare ad ogni elemento
x di X uno e un solo elemento di Y , che viene indicato con f(x). Si suole
scrivere f : X Y (si legge f da X in Y ) e si dice che f `e denita
su X, a valori in Y . Linsieme X `e il dominio di f, mentre limmagine, o
codominio, di f `e il sottoinsieme f(X) di Y costituito da tutti i punti di Y
che sono immagini mediante f di punti di X, cio`e sono della forma f(x)
per qualche x X. Pu`o benissimo capitare che uno stesso y sia immagine
di diversi punti di X, ossia che si abbia y = f(x) = f(x

) per x, x

X e
x ,= x

; quello che non pu`o succedere `e che ad un x X vengano associati


due distinti elementi di Y , cio`e che risulti f(x) = y e f(x) = y

con y ,= y

.
Esempi di funzioni appaiono dappertutto: a ciascun membro dellinsieme
S degli studenti che sostengono un esame si pu`o associare il relativo voto:
questa `e una funzione S N. Ad ogni citt`a dItalia si possono associare le
temperature minima e massima di una data giornata: questa `e una funzione
dallinsieme C delle citt`a capoluogo italiane nel prodotto cartesiano Z
2
. Ad
ogni corridore che porta a termine una data corsa ciclistica si pu`o associare
il tempo impiegato, misurato ad esempio in secondi: avremo una funzione a
valori in R (se teniamo conto dei decimi, centesimi, millesimi, eccetera).
Il graco di una funzione f :
X Y `e il sottoinsieme del pro-
dotto cartesiano X Y costitui-
to da tutte le coppie della for-
ma (x, f(x)), cio`e da tutte e so-
le le coppie (x, y) X Y che
risolvono lequazione y = f(x).
Le funzioni si possono comporre: se f : X Y e g : Y Z sono fun-
zioni, ha senso considerare la funzione composta g f : X Z, denita da
g f(x) = g(f(x)) per ogni x X. Naturalmente, anche la composizione
abbia senso, occorre che il codominio di f sia contenuto nel dominio di g.
Una funzione si dice iniettiva se a punti distinti vengono associate immagini
distinte, ovvero se
f(x) = f(x

) = x = x

.
7
Una funzione si dice surgettiva se si ha f(X) = Y , cio`e se ogni y Y `e
immagine di almeno un x X.
Una funzione si dice bigettiva, o invertibile, o biunivoca, se `e sia iniettiva che
surgettiva: in tal caso, per ogni y Y vi `e un unico x X tale che f(x) = y.
In questo caso `e denita la funzione inversa f
1
(si legge f alla meno uno);
f
1
`e denita su Y , a valori in X, e ad ogni y Y associa quellunico x per
cui f(x) = y. Si dice allora che f denisce una corrispondenza biunivoca fra
gli insiemi X e Y . In particolare, se f `e bigettiva si ha f
1
(f(x)) = x per
ogni x X ed anche f(f
1
(y)) = y per ogni y Y : in altre parole, risulta
f
1
f = I
X
, f f
1
= I
Y
, avendo indicato con I
X
e I
Y
le funzioni identit`a,
denite da I
X
(x) = x per ogni x X e I
Y
(y) = y per ogni y Y .
Osservazione 1.3.1 Se f : X X `e una funzione invertibile e f
1
: X
X `e la sua funzione inversa, le equazioni y = f(x) e x = f
1
(y) sono equi-
valenti e descrivono entrambe il graco di f. Invece, scambiando fra loro le
variabili x, y (ossia eettuando una simmetria rispetto alla retta y = x nel
piano cartesiano XX), la seconda equazione diventa y = f
1
(x) e descrive
il graco di f
1
, il quale `e dunque il simmetrico del graco di f rispetto alla
bisettrice del primo quadrante.
8
Si noti che `e sempre possibile supporre che una data funzione f : X Y
sia surgettiva: basta pensarla come funzione da X in f(X). Il problema `e
che nei casi concreti `e spesso dicile, se non impossibile, caratterizzare il
sottoinsieme f(X) di Y .
Vedremo innumerevoli esempi di funzioni e di graci nel seguito del corso.
Esercizi 1.3
1. Posto f : R R, f(x) = 3x 1, e g : R R, g(t) = t
2
, scrivere
esplicitamente le funzioni composte
g f(x) = g(f(x)), x R, f g(t) = f(g(t)), t R.
2. Quali di queste funzioni a valori in R sono iniettive, quali surgettive e
quali invertibili?
(i) f(x) = 1/x, x R 0; (ii) f(x) = x
3
x, x R;
(iii) f(x) =
1
x
2
+1
, x R; (iv) f(k) = (1)
k
, k Z;
(v) f(s) = s
2
, s R; (vi) f(x) =
_
x
2
se x 0
x
2
se x < 0.
3. Sia f(x) = 2x 1, x R. Tracciare il graco delle seguenti funzioni:
(i) f(x); (ii) f(x);
(iii) maxf(x), f(x); (iv) f(f(x));
(v)
f(x)f(x)
2
; (vi)
f(x)+f(x)
2
;
(vii) minf(x), 0; (viii) maxf(x), 0.
1.4 Il sistema dei numeri reali
Denire in modo rigoroso che cosa siano i numeri reali `e un compito tuttaltro
che elementare anche per un matematico di professione: non `e il caso quindi
di addentrarsi in questa problematica allinizio di un corso di analisi. Ma
anche senza avere pretese fondazionali, per lavorare coi numeri reali occorre
conoscerne le propriet`a, e riettere per un momento sul signicato dei simboli
e delle formule che siamo abituati a manipolare pi` u o meno meccanicamente
n dalle scuole elementari.
Le propriet`a dei numeri reali si possono classicare in tre gruppi:
9
(a) propriet`a algebriche, riguardanti le operazioni che si possono eseguire tra
numeri reali;
(b) propriet`a di ordinamento, relative alla possibilit`a di confrontare tra loro
i numeri reali per identicarne il maggiore;
(c) propriet`a di continuit`a, pi` u profonde e nascoste, legate allidea che devo-
no esistere abbastanza numeri per rappresentare grandezze che va-
riano con continuit`a, quali il tempo o la posizione di un punto su una
retta.
Tutte queste propriet`a caratterizzano il sistema R dei numeri reali, nel senso
che esse si possono assumere come assiomi che deniscono ed individuano in
modo unico il sistema R. Noi non entreremo in questa questione, limitandoci
pi` u modestamente a mettere in rilievo il fatto che le propriet`a (a) e (b) sono
alla base di tutte le regole di calcolo che abbiamo imparato ad usare n
dallinfanzia.
Propriet`a algebriche
Nellinsieme R sono denite due operazioni, laddizione e la moltiplicazione,
le quali associano ad ogni coppia a, b di numeri reali la loro somma, che
indichiamo con a+b, e il loro prodotto, che indichiamo con a b od anche con
ab. Valgono le seguenti propriet`a:
1. Associativit`a: a + (b +c) = (a +b) +c, a(bc) = (ab)c per ogni a, b, c R.
2. Commutativit`a: a +b = b +a, ab = ba per ogni a, b R.
3. Distributivit`a: a(b +c) = ab +ac per ogni a, b, c R.
4. Esistenza degli elementi neutri: esistono (unici) due numeri reali distinti,
che indichiamo con 0 e 1, tali che a + 0 = a, a 1 = a per ogni a R.
5. Esistenza degli opposti: per ogni a R esiste un (unico) b R tale che
a +b = 0; tale numero b si dice opposto di a e si indica con a.
6. Esistenza dei reciproci: per ogni a R 0 esiste un (unico) b R tale
che ab = 1; tale numero b si dice reciproco di a e si indica con
1
a
od
anche con a
1
.
10
Dalle propriet`a precedenti seguono facilmente tutte le regole usuali dellalge-
bra elementare, quali:
il fatto che a 0 = 0 per ogni a R;
la semplicazione per laddizione: se a +b = a +c, allora b = c;
la semplicazione per la moltiplicazione: se ab = ac e a ,= 0, allora
b = c;
la denizione di sottrazione: per ogni a, b R esiste un unico c R
tale che a + c = b, e tale numero c, detto dierenza fra b e a, si indica
con b a;
la denizione di divisione: per ogni a, b R con a ,= 0 esiste un unico
c R tale che ac = b, e tale numero c si indica con
b
a
;
la legge di annullamento del prodotto: se ab = 0 allora deve essere a = 0
oppure b = 0 (oppure entrambi).
Provate a dimostrare qualcuno degli enunciati precedenti utilizzando gli as-
siomi 1-6!
Propriet`a di ordinamento
Nellinsieme dei numeri reali esiste un sottoinsieme P, i cui elementi sono
detti numeri positivi, dotato delle propriet`a seguenti:
7. Se a, b sono numeri positivi, anche a +b e ab sono positivi.
8. Per ogni a R vale una e una sola di queste tre possibilit`a: a `e positivo,
oppure a `e positivo, oppure a = 0.
Si noti che, per lassioma 8, il numero reale 0 non pu`o essere positivo. I
numeri diversi da 0 e non positivi si dicono negativi: dunque un numero
reale a `e negativo se e solo se a `e positivo. Si scrive a > 0 quando a `e
positivo, e b > a (o equivalentemente a < b) quando b a `e positivo, cio`e
b a > 0; in particolare, x < 0 signica x > 0, cio`e x negativo. Si scrive
poi a 0 quando a `e positivo o uguale a 0, e b a (o equivalentemente
a b) quando b a 0. Si osservi che
a b e a b a = b.
Dagli assiomi 7-8 discendono i seguenti altri fatti (esercizi 1.4.2 e 1.4.3).
11
Il prodotto di due numeri negativi `e positivo; in particolare, se x `e un
numero reale diverso da 0, il suo quadrato x
2
, che `e denito come x x,
`e sempre positivo:
x
2
= x x > 0 x R 0.
Il numero 1 `e positivo (e quindi N
+
P).
Inoltre si deducono facilmente tutte le usuali regole di calcolo con le disugua-
glianze. Provate a dedurne qualcuna!
Introduciamo adesso alcuni speciali sottoinsiemi di R deniti mediante lor-
dinamento: gli intervalli. Se a, b R ed a b, poniamo:
[a, b] = x R : a x b = intervallo chiuso di estremi a, b;
]a, b[ = x R : a < x < b = intervallo aperto di estremi a, b;
[a, b[ = x R : a x < b = intervallo semiaperto a destra di estremi
a, b;
]a, b] = x R : a < x b = intervallo semiaperto a sinistra di
estremi a, b;
] , b] = x R : x b = semiretta chiusa di secondo estremo b;
] , b[ = x R : x < b = semiretta aperta di secondo estremo b;
[a, +[ = x R : a x = semiretta chiusa di primo estremo a;
]a, +[ = x R : a < x = semiretta aperta di primo estremo a;
] , +[ = R = retta reale.
(I simboli , + si leggono pi` u innito, meno innito e non sono
numeri reali.)
Esercizi 1.4
1. Provare che se u `e un elemento di R tale che a u = u, ove a `e un ssato
numero reale diverso da 1, allora u = 0.
2. Provare che il prodotto di due numeri negativi `e positivo.
12
3. Provare che 1 `e un numero positivo.
4. Sia a b. Dimostrare che se c 0 allora ac bc, mentre se c < 0 si
ha ac bc.
5. Dimostrare le uguaglianze
[a, b] =

n=1
_
a
1
n
, b
_
, ]a, b] =

_
n=1
_
a +
1
n
, b
_
.
1.5 Assioma di completezza
Le propriet`a 1-8 sin qui viste non sono prerogativa esclusiva di R, dato che
sono ugualmente vere nellinsieme dei numeri razionali Q. Ci`o che davvero
caratterizza R `e la propriet`a di continuit`a, che si esprime con il corrispon-
dente assioma di continuit`a, detto anche assioma di completezza. Prima di
enunciarlo in una delle sue numerose formulazioni equivalenti, conviene dare
alcune denizioni.
Denizione 1.5.1 Sia A R. Diciamo che A `e limitato superiormente
se esiste m R tale che m a per ogni a A. Tale numero m si dice
maggiorante dellinsieme A.
Denizione 1.5.2 Sia A R. Diciamo che A `e limitato inferiormente se
esiste R tale che a per ogni a A. Tale numero si dice minorante
dellinsieme A.
Denizione 1.5.3 Sia A R. Diciamo che A `e limitato se `e sia limitato
superiormente, sia limitato inferiormente.
`
E chiaro che se A `e limitato superiormente e m `e un maggiorante di A, allora
ogni numero reale x m `e ancora un maggiorante di A; analogamente, se
A `e limitato inferiormente e `e un minorante di A, allora ogni numero reale
x `e ancora un minorante di A.
Ad esempio, se A = [0, 1] linsieme dei minoranti di A `e la semiretta ] , 0]
mentre linsieme dei maggioranti di A `e la semiretta [1, +[. Se A =]0, 1[,
oppure [0, 1[, oppure ]0, 1], succede esattamente lo stesso. Invece, se A =
[0, +[, allora A non ha maggioranti, mentre sono minoranti di A tutti i
numeri non positivi.
13
Denizione 1.5.4 Sia A R un insieme limitato superiormente. Diciamo
che A ha massimo m se:
(i) m `e un maggiorante di A,
(ii) m A.
In tal caso, si scrive m = max A.
Denizione 1.5.5 Sia A R un insieme limitato inferiormente. Diciamo
che A ha minimo se:
(i) `e un minorante di A,
(ii) A.
In tal caso, si scrive = min A.
Non `e detto che un insieme limitato superiormente abbia massimo: per esem-
pio, [0, 1[ non ha massimo, perche esso `e disgiunto dallinsieme dei suoi mag-
gioranti. Analogamente, non `e detto che un insieme limitato inferiormente
abbia minimo. Notiamo anche che se A ha massimo, allora max A `e il mini-
mo dellinsieme dei maggioranti di A, e che se A ha minimo, allora min A `e
il massimo dellinsieme dei minoranti di A.
Denizione 1.5.6 Due sottoinsiemi non vuoti A, B R si dicono separati
se si ha
a b a A, b B.
Esempi 1.5.7 Sono coppie di insiemi separati:
] , 0], [0, [; ] , 0], ]0, [; ] , 0[, ]0, [;
[0, 1[, [2, 3]; [2, 1], N; 0, 3; 0, 0.
Sono coppie di insiemi non separati:
1/2, Z; Q, RQ; [0, 2], [1, 3]; x R : x
2
< 2, x R : x
2
> 2.
Osserviamo inoltre che:
se A, B sono insiemi separati, allora ogni elemento b B `e un maggio-
rante di A e ogni elemento a A `e un minorante di B;
14
se A `e non vuoto e limitato superiormente, e se M `e linsieme dei
maggioranti di A, allora A e M sono separati;
similmente, se A`e non vuoto e limitato inferiormente, e se N `e linsieme
dei minoranti di A, allora N e A sono separati.
Lassioma di completezza di R asserisce la possibilit`a di interporre un numero
reale fra gli elementi di qualunque coppia di insiemi separati: in sostanza,
esso ci dice che i numeri reali sono in quantit`a suciente a riempire tutti i
buchi fra coppie di insiemi separati. Lenunciato preciso `e il seguente:
9. Per ogni coppia A, B di sottoinsiemi di R non vuoti e separati, esiste
almeno un elemento separatore, cio`e un numero reale tale che
a b a A, b B.
Questo assioma sembra avere un carattere abbastanza intuitivo: in eetti `e
facile determinare esplicitamente gli elementi separatori in tutti i casi degli
esempi 1.5.7 in cui essi esistono. Tuttavia, come vedremo, le conseguenze
dellassioma di completezza sono di larghissima portata.
Si osservi che in generale lelemento separatore fra due insiemi separati A e B
non `e unico. Per`o se A `e un insieme non vuoto limitato superiormente e sce-
gliamo come B linsieme dei maggioranti di A, allora vi `e un unico elemento
separatore fra A e B: infatti ogni elemento separatore deve soddisfare la
relazione
a b a A, b B;
in particolare, la prima disuguaglianza dice che `e maggiorante per A, ossia
B; la seconda ci dice allora che = min B. Poiche il minimo di B `e
unico, ne segue lunicit`a dellelemento separatore.
In modo analogo, se B `e non vuoto e limitato inferiormente e prendiamo come
A linsieme dei minoranti di B, allora vi `e un unico elemento separatore fra
A e B: il massimo dei minoranti di B.
Denizione 1.5.8 Sia A R non vuoto e limitato superiormente, sia M
linsieme dei maggioranti di A. Lunico elemento separatore fra A e M si
dice estremo superiore di A e si denota con sup A.
Il numero reale sup A`e dunque il minimo dei maggioranti di A. In particolare,
esso coincide con max A quando questultimo numero esiste.
15
Denizione 1.5.9 Sia A R non vuoto e limitato inferiormente, sia N
linsieme dei minoranti di A. Lunico elemento separatore fra N e A si dice
estremo inferiore di A e si denota con inf A.
Il numero reale inf A `e dunque il massimo dei minoranti di A e coincide con
min A quando questultimo numero esiste.
Lestremo superiore di un insieme A (non vuoto e limitato superiormen-
te), la cui esistenza `e conseguenza diretta dellassioma di completezza, si
caratterizza in questo modo:
Proposizione 1.5.10 Sia A R non vuoto e limitato superiormente, e sia
m R. Si ha m = sup A se e solo se m verica le seguenti due propriet`a:
(i) m a per ogni a A;
(ii) per ogni > 0 esiste a A tale che m < a m.
Dimostrazione Se m = sup A, allora m `e il minimo dei maggioranti di A:
quindi vale (i). Daltra parte, per ogni > 0 il numero reale m non `e
un maggiorante per A: quindi c`e almeno un elemento a A per il quale
m < a, il che implica la condizione (ii).
Viceversa, se m verica (i) e (ii), allora m `e maggiorante di A mentre per
ogni > 0 il numero m non pu`o esere maggiorante di A. Ne segue che
m `e il minimo dei maggioranti di A, ossia m = sup A.
Una caratterizzazione analoga, la cui dimostrazione viene omessa essendo
identica alla precedente, vale per lestremo inferiore:
Proposizione 1.5.11 Sia A R non vuoto e limitato inferiormente, e sia
R. Si ha = inf A se e solo se verica le seguenti due propriet`a:
(i) a per ogni a A;
(ii) per ogni > 0 esiste a A tale che a < +.
Esempi 1.5.12 (1) Se A = [0, 1], si ha sup A = max A = 1, inf A =
min A = 0.
(2) Se A = [0, 1[, si ha ancora inf A = min A = 0, sup A = 1, mentre max A
non esiste.
(3) Se A = 1, 7, 8, si ha inf A = min A = 1, sup A = max A = 8.
16
(4) Questo esempio mostra limportanza dellassioma di completezza: esso
permette di costruire, nellambito dei reali, il numero

2. Sia
A = x R : x
2
< 2;
ovviamente A non `e vuoto, perche 1 A. Mostriamo che A `e limitato
superiormente: a questo scopo basta far vedere che sono maggioranti di A
tutti i numeri positivi t tali che t
2
> 2. Infatti se t > 0 e t
2
> 2, e se ci fosse
x A con x > t, allora avremmo anche x > 0 e quindi 2 < t
2
< xt < x
2
< 2,
il che `e assurdo. Dunque A `e limitato superiormente e per lassioma di
completezza esiste m = sup A. Poiche 1 A, si ha m 1; aermiamo che
m
2
= 2.
Infatti, non pu`o essere m
2
< 2, poiche in tal caso, scrivendo per ogni ]0, 1[
(m +)
2
= m
2
+
2
+ 2m < m
2
+ + 2m,
avremmo (m +)
2
< 2 pur di scegliere
< min
_
1,
2 m
2
2m + 1
_
:
tale scelta `e sempre possibile, prendendo ad esempio come la met`a del
numero a secondo membro. Ci`o signicherebbe che m + appartiene ad
A, contro il fatto che m `e uno dei maggioranti di A. Daltra parte non pu`o
nemmeno essere m
2
> 2, poiche in tal caso avremmo per ogni ]0, m[
(m)
2
= m
2
+
2
2m > m
2
2m,
e dunque (m)
2
> 2 pur di scegliere
<
m
2
2
2m
.
Ci`o signicherebbe, per quanto osservato allinizio, che m `e un maggio-
rante di A; ma allora m non pu`o essere il minimo dei maggioranti di A, e ci`o
`e assurdo. Pertanto lunica possibilit`a `e che sia m
2
= 2.
Si noti che m`e lunica radice reale posi-
tiva dellequazione x
2
= 2; tale numero
si dice radice quadrata di 2 e si scrive
m =

2; lequazione x
2
= 2 ha poi
unaltra radice reale che `e negativa, ed
`e

2.
17
Osservazione 1.5.13 Si vede facilmente che il numero reale

2 non pu`o
essere un numero razionale: infatti supponiamo che sia

2 =
p
q
con p, q N
+
,
e che la frazione sia stata ridotta ai minimi termini: allora si ha
p
2
q
2
= 2, ossia
p
2
= 2q
2
. Ci`o implica che p
2
, e quindi anche p, `e un numero pari: sar`a
dunque p = 2k, con k N
+
. Ma allora 4k
2
= p
2
= 2q
2
, da cui 2k
2
= q
2
:
ne segue che q
2
`e pari e pertanto anche q `e pari. Ci`o per`o `e assurdo, perche
la frazione sarebbe ulteriormente semplicabile, cosa che era stata esclusa.
Dunque

2 non `e un numero razionale.


In modo assolutamente analogo (esercizio 1.5.2) si prova lesistenza della
radice quadrata di un arbitrario numero positivo x, che sar`a in generale un
numero irrazionale.
In denitiva, imponendo lassioma 9 siamo necessariamente usciti dallambito
dei numeri razionali, che sono troppo pochi per rappresentare tutte le
grandezze: per misurare la diagonale del quadrato di lato unitario occorre il
numero irrazionale

2. In altre parole, nellinsieme Q non vale lassioma di


completezza.
Osservazione 1.5.14 Nel seguito del corso useremo massicciamente, pi` u
che lassioma di completezza in se, il fatto che ogni insieme non vuoto e
limitato superiormente `e dotato di estremo superiore. Notiamo a questo
proposito che se, invece, A R non `e limitato superiormente, A non ha
maggioranti e dunque lestremo superiore non esiste; in questo caso si dice
per convenzione che A ha estremo superiore + e si scrive sup A = +.
Analogamente, se A non `e limitato inferiormente, si dice per convenzione
che A ha estremo inferiore e si scrive inf A = . In questo modo,
tutti i sottoinsiemi non vuoti di R possiedono estremo superiore ed inferiore,
eventualmente inniti. Per linsieme vuoto, invece, non c`e niente da fare!
Esercizi 1.5
1. Provare che

2 = inf x R : x
2
< 2.
2. Provare che per ogni numero reale a > 0, lequazione x
2
= a ha esat-
tamente due soluzioni reali, una lopposta dellaltra; quella positiva si
chiama radice quadrata di a e si indica con

a. Si provi inoltre che

a = sup x R : x
2
< a,

a = inf x R : x
2
< a.
18
Cosa succede quando a = 0? E quando a < 0?
3. Determinare linsieme delle soluzioni reali delle seguenti equazioni:
(i)

x
2
= x , (ii) (

x)
2
= x , (iii)
_
(

x)
2
=
_

x
2
.
4. Dimostrare che

3 `e un numero irrazionale.
5. Sia n N. Dimostrare che

n `e un numero razionale se e solo se n `e
un quadrato perfetto.
[Traccia: Si consideri dapprima il caso in cui n `e un numero primo;
si ricordi poi che ogni numero naturale n ha ununica scomposizione in
fattori primi.]
6. Siano m, n N e supponiamo che almeno uno dei due non sia un
quadrato perfetto. Provare che il numero

m +

n `e irrazionale.
7. Provare che per ogni n N
+
il numero

4n 1 `e irrazionale.
8. Stabilire se i seguenti sottoinsiemi di R sono separati e determinarne
eventualmente gli elementi separatori:
(i) [0, 1], [1, 7];
(ii) [0, 2[, 2, 3;
(iii) x R : x
3
< 2, x R : x
3
> 2;
(iv) n N : n < 6, n N : n 6;
(v) r Q : r
2
< 2, ]

2, +[;
(vi) x R : x
2
< 1, x R : x
4
> 1.
9. Una sezione di R `e una coppia (A, B) di sottoinsiemi separati di R, tali
che A B = R, A B = . Si dimostri che lenunciato
per ogni sezione (A, B) di R esiste un unico elemento separatore fra
A e B
`e equivalente allassioma di completezza di R.
10. Si provi che esistono sezioni (A, B) di Q prive di elemento separatore
in Q.
[Traccia: si considerino A = x Q : x 0x Q : x > 0, x
2
< 2
e B = Q A.]
19
11. Provare che se A B R e A ,= , allora
inf B inf A sup A sup B;
si forniscano esempi in cui una o pi` u disuguaglianze sono strette.
12. Sia A un sottoinsieme non vuoto e limitato di R, e poniamo
B = x : x A.
Si provi che
sup B = inf A, inf B = sup A.
13. Provare che se A, B sono sottoinsiemi non vuoti e limitati di R si ha
sup A B = maxsup A, sup B, inf A B = mininf A, inf B.
14. Provare che se A, B sono sottoinsiemi di R con a B ,= , allora
sup A B minsup A, sup B, inf A B maxinf A, inf B;
si verichi che le disuguaglianze possono essere strette.
15. Siano A, B sottoinsiemi di ]0, [. Se esiste K > 0 tale che xy K per
ogni x A e per ogni y B, si provi che
sup A sup B K.
16. Calcolare lestremo superiore e lestremo inferiore dei seguenti sottoin-
siemi di R, specicando se si tratta di massimi o di minimi:
(i)
_
2x
x
2
+1
: x R
_
; (ii) x
2
+y
2
: x, y [1, 1], x < y;
(iii)
_
x +
1
x
: x > 0
_
; (iv) x
2
y
2
: 0 < x < y < 4;
(v)
_
n1
n
: n N
+
_
; (vi)
_
1
1+x
2
: x R
_
;
(vii)
_
(1)
k
k
: k N
+
_
; (viii)
_
1
k
3
: k Z 0
_
.
17. Siano a, b, c, d Q. Mostrare che:
(i) a +b

2 = 0 a = b = 0;
(ii) a +b

2 +c

3 = 0 a = b = c = 0;
(iii) a +b

2 +c

3 +d

5 = 0 a = b = c = d = 0.
18. Per quali x R sono vere le seguenti asserzioni?
(i) (x) x
2
> x; (ii)

x
2
= x; (iii) (x
2
)
2
> 16.
20
1.6 Numeri naturali, interi, razionali
A partire dagli assiomi di R, ed in particolare dallassioma di continuit`a,
possiamo ora rivisitare in maniera pi` u rigorosa alcuni concetti che abbiamo
conosciuto e adoperato su base intuitiva n dalla scuola dellobbligo. Comin-
ciamo ad esaminare linsieme N dei numeri naturali e le sue apparentemente
ovvie propriet`a.
Ci occorre anzitutto la seguente
Denizione 1.6.1 Un insieme A R si dice induttivo se verica le seguenti
condizioni:
(i) 0 A,
(ii) per ogni x A si ha x + 1 A.
Ad esempio sono insiemi induttivi R, [a, +[ per ogni a 0, ]b, +[ per
ogni b < 0. Si noti che se A, B R sono induttivi, anche la loro intersezione
AB lo `e; anzi, dato un qualunque insieme di indici I e presa una arbitraria
famiglia di insiemi induttivi A
i

iI
, la loro intersezione

iI
A
i
= x R : x A
i
i I
`e un insieme induttivo: infatti 0 A
i
per ogni i I in quanto ciascun A
i
`e induttivo, e se x A
i
per ogni i I, lo stesso si ha per x + 1, sempre a
causa dellinduttivit`a di ciascun A
i
.
Denizione 1.6.2 Chiamiamo insieme dei numeri naturali, e denotiamo
con N, lintersezione di tutti i sottoinsiemi induttivi di R.
Da questa denizione segue subito che N `e il pi` u piccolo insieme induttivo:
infatti se A R `e induttivo, esso viene a far parte della famiglia di insiemi
di cui N `e lintersezione, cosicche N A. Dunque in N c`e il minimo
indispensabile di numeri che occorre per essere induttivo: perci`o ci sar`a
0, ci sar`a 1 = 0 + 1, ci sar`a 2 = 1 + 1, ci sar`a 3 = 2 + 1, e cos` via.
Questa denizione di N `e stata per`o introdotta proprio per evitare di far uso
della locuzione ...e cos` via: a questo scopo conviene introdurre il seguente
fondamentale
21
Teorema 1.6.3 (principio di induzione) Sia A N un insieme denito
da una certa propriet`a p(n), ossia A = n N : p(n). Supponiamo di
sapere che
(i) p(0) `e vera, ovvero 0 A;
(ii) p(n) implica p(n +1) per ogni n N, ovvero se n A allora n +1 A.
Allora p(n) `e vera per ogni n N, ovvero A = N.
Dimostrazione Si tratta di una immediata conseguenza della denizione
di N. In eetti, per ipotesi A `e contenuto in N; le condizioni (i) e (ii) ci dicono
daltronde che linsieme A `e induttivo, e quindi A contiene N per denizione
di N: se ne deduce che A = N.
Il principio di induzione `e importante non solo come metodo dimostrativo,
come vedremo, ma anche perche consente di introdurre denizioni ricorsive
in modo non ambiguo.
Esempi 1.6.4 (1) (Fattoriale) Consideriamo la sequenza di numeri cos`
deniti:
_
a
0
= 1,
a
n+1
= (n + 1)a
n
n N.
Si vede subito che a
1
= 1, a
2
= 2 1, a
3
= 3 2 1, a
4
= 4 3 2 1, e cos`
via; ssato n N, il numero a
n
cos` introdotto si chiama fattoriale di n e si
scrive a
n
= n! (si legge n fattoriale).
(2) (Somme nite) Data una famiglia innita di numeri reali a
n

nN
,
consideriamo la sequenza di numeri cos` denita:
_
s
0
= a
0
s
n+1
= a
n+1
+s
n
n N.
Si ha chiaramente
s
1
= a
0
+a
1
s
2
= a
0
+a
1
+a
2
s
3
= a
0
+a
1
+a
2
+a
3
s
4
= a
0
+a
1
+a
2
+a
3
+a
4
22
e cos` via; per il numero s
n
, che `e la somma di a
0
, a
1
, a
2
, eccetera, no ad
a
n
, si usa il simbolo
s
n
=
n

k=0
a
k
.
Si noti che la variabile k dentro il simbolo di somma `e muta: ci`o signica
che s
n
`e un numero che dipende solo dallestremo n della somma, e non da k, il
quale `e solo una lettera per denotare gli addendi della somma. In particolare,
potremmo usare qualunque altro simbolo al posto di k senza alterare il valore
di s
n
:
n

k=0
a
k
=
n

i=0
a
i
=
n

&=0
a
&
=
n

pippo=0
a
pippo
.
Naturalmente, `e anche lecito considerare somme nite il cui primo estremo
sia un numero diverso da 0: ad esempio
34

k=30
k = 30 + 31 + 32 + 33 + 34 = 160.
(3) (Prodotti niti) In modo analogo al caso delle somme, data una famiglia
a
n

nN
di numeri reali si denisce la seguente sequenza di numeri:
_
p
0
= a
0
p
n+1
= a
n+1
p
n
n N;
si ha p
1
= a
0
a
1
, p
2
= a
0
a
1
a
2
, p
3
= a
0
a
1
a
2
a
3
, e per il numero p
n
si usa il
simbolo
p
n
=
n

k=0
a
k
,
ove nuovamente k `e una variabile muta. Si noti che, in particolare,
n! =
n

k=1
k n N
+
.
(4) Sia q un numero reale. La somma
1 +q +q
2
+q
3
+... +q
n
=
n

k=0
q
k
23
si dice progressione geometrica di ragione q. (Naturalmente, q
k
signica 1 se
k = 0, mentre se k > 0 denota il prodotto di k fattori uguali a q.)
Proviamo che si ha
n

k=0
q
k
=
_
n + 1 se q = 1
1q
n+1
1q
se q ,= 1
n N,
dove il simbolo q
k
nel caso speciale k = 0 e q = 0 deve intendersi come 1.
Se q = 1, la dimostrazione `e banale e si lascia per esercizio. Supposto q ,= 1,
indichiamo con p(n) lenunciato seguente:
p(n) = vale luguaglianza
n

k=0
q
k
=
1 q
n+1
1 q
.
Allora p(0) `e vera in quanto
0

k=0
q
k
= q
0
= 1 =
1 q
1
1 q
;
Supponiamo adesso che p(n) sia vera per un dato n N, e proviamo a dedurre
p(n +1) (il che, di per se, non signicher`a che p(n) e p(n +1) siano vere per
davvero!). Si pu`o scrivere, isolando lultimo addendo,
n+1

k=0
q
k
=
n

k=0
q
k
+q
n+1
,
e poiche stiamo supponendo vera p(n), otteniamo
n+1

k=0
q
k
=
1 q
n+1
1 q
+q
n+1
=
1 q
n+1
+ (1 q)q
n+1
1 q
=
1 q
n+2
1 q
,
che `e proprio p(n + 1). Abbiamo cos` provato che p(n) implica p(n + 1) per
ogni n N. Poiche p(0) `e vera, dal principio di induzione segue che p(n) `e
vera per ogni n N.
(5) Proviamo la disuguaglianza
2
n
(n + 1)! n N.
24
Posto p(n) =2
n
(n + 1)!, si ha che p(0) `e vera in quanto 2
0
= 1 `e
eettivamente non superiore a 1! = 1. Supposto ora che p(n) sia vera, si pu`o
scrivere
2
n+1
= 2 2
n
2 (n + 1)! ;
da qui ricaviamo, essendo ovviamente 2 n + 2 per ogni n N,
2
n+1
(n + 2)(n + 1)! = (n + 2)! ,
il che mostra che vale p(n+1). Abbiamo cos` provato che p(n) implica p(n+1)
per ogni n N: essendo anche p(0) vera, per il principio di induzione p(n) `e
vera per ogni n N.
(6) Proviamo la disuguaglianza
n
2
2
n
n N, n 4.
Posto p(n) =n
2
2
n
, osserviamo che p(0), p(1) e p(2) sono vere mentre
p(3) `e falsa; inoltre p(4) `e vera. Proviamo adesso che p(n) = p(n + 1) per
ogni n N con n 4: usando lipotesi induttiva, si ha
2
n+1
= 2 2
n
2n
2
> n
2
+ 2n + 1 = (n + 1)
2
;
la seconda disuguaglianza `e vera in quanto equivale a n
2
2n + 1 > 2, ossia
a (n1)
2
> 2, e questultima `e vericata addirittura per ogni n 3. Poiche
p(4) `e vera e p(n) implica p(n+1) per ogni n 4, per il principio di induzione
(applicato, per essere precisi, non a p(n) ma a q(n) = p(n + 4)) segue che
p(n) `e vera per ogni n 4.
Propriet`a di N, Z, Q
Anzitutto deniamo rigorosamente gli insiemi Z e Q.
Denizione 1.6.5 Linsieme dei numeri interi Z `e N n : n N;
linsieme dei numeri razionali Q `e
m
n
: m Z, n N
+
(ricordiamo che
N
+
= N 0).
Dalla denizione di N seguono abbastanza facilmente alcune sue propriet`a.
Proposizione 1.6.6 N `e illimitato superiormente.
25
Dimostrazione Supponiamo per assurdo che N sia limitato superiormente:
in tal caso L = sup N `e un numero reale, che per la proposizione 1.5.10
verica
(a) n L per ogni n N,
(b) per ogni ]0, 1[ esiste N tale che L < L.
Avendo scelto < 1, da (b) segue che il numero naturale + 1 verica
L < + < + 1,
il che contraddice (a). Dunque L = +.
Di conseguenza, Z e Q sono illimitati sia superiormente che inferiormente.
Proposizione 1.6.7 (propriet`a di Archimede) Per ogni coppia a, b di
numeri reali positivi esiste n N tale che na > b.
Dimostrazione Poiche sup N = +, il numero
b
a
non `e un maggiorante
di N; quindi esiste n N per cui risulta n >
b
a
. Moltiplicando per a, che `e
positivo, ne segue la tesi.
Una conseguenza della propriet`a di Archimede `e il fatto che linsieme dei
numeri razionali `e denso in R: ci`o signica che in ogni intervallo ]a, b[ R
cade almeno un numero razionale (e quindi inniti: vedere lesercizio 1.6.4).
Si ha infatti:
Corollario 1.6.8 Per ogni coppia a, b di numeri reali con a < b, esiste r Q
tale che
a < r < b.
Dimostrazione Supponiamo dapprima a 0. Per la propriet`a di Archi-
mede, esiste n N tale che n(b a) > 1, ossia
1
n
< b a.
Consideriamo ora linsieme
A =
_
m N :
m
n
a
_
;
esso `e ovviamente limitato superiormente (n a ne `e un maggiorante) e non
vuoto (0 A). Posto L = sup A, e ssato ]0, 1[, dalla proposizione 1.5.10
26
segue che esiste A tale che L < L, ossia L < + < +1;
pertanto A mentre + 1 / A (essendo + 1 > sup A). Si ha allora

n
a <
+ 1
n
=

n
+
1
n
< a + (b a) = b.
Il numero razionale r =
+1
n
soddisfa dunque la tesi.
Supponiamo ora a < 0. Se b > 0, si ha la tesi scegliendo r = 0. Se invece
b 0, per quanto gi`a provato esiste un razionale r tale che b < r < a, e
dunque il numero razionale r appartiene ad ]a, b[. La tesi `e provata.
Osservazione 1.6.9 Non `e dicile dimostrare che il numero L della di-
mostrazione precedente `e in realt`a un massimo. Si dimostra anzi che ogni
sottoinsieme limitato di N ha massimo (esercizio 1.6.2).
Vi `e un risultato di densit`a pi` u ne, che `e il seguente:
Teorema 1.6.10 Sia un numero reale. Linsieme
E = k +h : k, h Z
`e denso in R se e solo se `e irrazionale.
Dimostrazione Se Q, =
m
n
, allora
E =
_
km +hn
n
: k, h Z
_
=
_
p
n
: p Z
_
e quindi i punti di E distano fra loro almeno
1
n
: pertanto E non pu`o essere
denso in R.
Supponiamo invece R Q: proveremo la densit`a di E in R mostrando
che per ogni x R e per ogni > 0 esistono k, h Z tali che
x < k +h < x +.
`
E chiaramente suciente provare la tesi per > 0. Sia dunque ]0, [ e
cominciamo con il caso x = 0. Fissiamo N N e poniamo
E
N
= k +h : k, h Z [N, N].
Poiche `e irrazionale, gli elementi di E
N
sono tutti distinti e sono esatta-
mente (2N + 1)
2
. Inoltre
E
N
[N(1 +), N(1 +)].
27
Consideriamo adesso, per 1 m
_
4N(1+)

_
+1, gli intervalli chiusi adiacenti
I
m
=
_
N(1 +) + (m1)

2
, N(1 +) +m

2
_
,
la cui unione ricopre lintervallo [N(1 + ), N(1 + )], e quindi E
N
. Sce-
gliamo N abbastanza grande, in modo che
_
4N(1 +)

_
+ 1 < (2N + 1)
2
:
ci`o `e certamente possibile, risolvendo la disequazione pi` u forte
(2N + 1)
2
>
4N(1 +)

+ 1,
o quella ancora pi` u forte, ma pi` u facile,
(2N + 1)
2
> (2N + 1)
2(1 +)

+ (2N + 1).
Allora, necessariamente, almeno uno fra gli intervalli I
m
dovr`a contenere
due diversi elementi di E
N
(questo `e il cosiddetto principio dei cassetti: se
mettiamo p oggetti in q cassetti vuoti, e se p > q, allora esiste almeno un
cassetto che contiene pi` u di un oggetto). Quindi esistono quattro interi p
1
,
p
2
, q
1
, q
2
, non superiori a N in valore assoluto, tali che
p
1
+q
1
, p
2
+q
2
I
m
per un opportuno m. In particolare, poiche I
m
ha ampiezza minore di ,
< (p
1
p
2
) + (q
1
q
2
) < ,
e ci`o prova la tesi nel caso x = 0.
Sia ora x > 0: per quanto gi`a provato, esistono m, n Z tali che
< m +n < ,
e rimpiazzando eventualmente m, n con m, n possiamo supporre che
0 < m +n < .
28
Adesso scegliamo p N tale che
p(m +n) x < (p + 1)(m +n)
(sar`a quindi p =
_
x
m+n

). Si ha allora
x < x (m +n) < p(m +n) x
e quindi abbiamo la tesi con k = pm, h = pn.
Inne, se x < 0, per quanto dimostrato esistono m, n Z tali che
x < m +n < x +,
e dunque si ha la tesi con k = m, h = n.
Esercizi 1.6
1. Dimostrare, sulla base della denizione di N, i seguenti enunciati:
(i) Non esiste alcun numero naturale minore di 0.
(ii) Se p, q N, allora p +q, pq N.
(iii) Se p N
+
, allora p 1 N.
(iv) Se p, q N e p > q, allora p q N.
(v) Se p, q N e p > q, allora p q N
+
.
[Traccia: per (ii), mostrare che S = p N : p + q N e P = p :
pq N sono insiemi induttivi; per (iii), mostrare che T = 0 p
N : p 1 N `e induttivo; per (iv), mostrare che A = p N : p q
N q N [0, p[ `e induttivo; inne (v) segue da (iv).]
2. Si provi che ogni sottoinsieme limitato di N ha massimo.
3. Dati a, b R con a < b, trovare un numero irrazionale c tale che
a < c < b.
4. Siano a, b R con a < b. Provare che esistono inniti numeri razionali
compresi fra a e b.
5. Un numero intero k si dice pari se esiste m Z tale che k = 2m, si
dice dispari se k + 1 `e pari. Dimostrare che:
29
(i) nessun intero `e simultaneamente pari e dispari;
(ii) ogni numero intero `e o pari, o dispari;
(iii) la somma e il prodotto di numeri pari sono numeri pari;
(iv) la somma di due numeri dispari `e pari mentre il prodotto `e dispari.
6. Sia b N, b 2. Provare che linsieme delle frazioni in base b, ossia
_
m
b
n
: m Z, n N
+
_
,
`e denso in R.
7. Quanti sono i sottoinsiemi distinti di un ssato insieme di n elementi?
8. Per quali n N
+
risulta 2
n
n! n
n
?
9. Si consideri la seguente forma modicata del principio di induzione:
Sia A = n N : p(n). Supponiamo che valgano i seguenti fatti:
(a) p(0) `e vera,
(b) se vale p(k) per ogni k N con k n, allora vale p(n + 1).
Allora p(n) `e vera per ogni n N, ossia A = N.
(i) Si provi che questo enunciato implica il principio di induzione.
(ii) Si provi che questo enunciato `e implicato dal principio di induzione.
[Traccia: Per (ii), si applichi il principio di induzione allaermazione
q(n) denita da q(n) =p(k) per ogni k N con k n.]
10. Si provi che ogni insieme non vuoto E N ha minimo.
[Traccia: se cos` non fosse, posto p(n) =n / E, si applichi a p(n) il
principio di induzione nella forma dellesercizio 1.6.9.]
11. Si dimostri che ogni n N
+
`e scomponibile in fattori primi.
[Traccia: Utilizzare il principio di induzione nella forma dellesercizio
1.6.9.]
12. Provare che:
(i)

n
k=1
k =
n(n+1)
2
per ogni n N
+
;
30
(ii)

n
k=1
(2k 1) = n
2
per ogni n N
+
;
(iii)

n
k=1
k
2
=
n(n+1)(2n+1)
6
per ogni n N
+
;
(iv)

n
k=1
k
3
=
n
2
(n+1)
2
4
per ogni n N
+
.
13. Siano a, b, c, d reali positivi. Provare che
min
_
a
c
,
b
d
_

a +b
c +d
max
_
a
c
,
b
d
_
.
14. Stabilire se sono vere o false le seguenti aermazioni:
(i) la somma di due irrazionali `e irrazionale;
(ii) il prodotto di due irrazionali `e irrazionale;
(iii) la somma di un razionale e di un irrazionale `e irrazionale;
(iv) il prodotto di un razionale e di un irrazionale `e irrazionale.
15. Siano a, b R. Provare che se 0 < a < b allora 0 < a
n
< b
n
per ogni
n N
+
.
16. Provare che:
(i) n k(n + 1 k)
1
4
(n + 1)
2
per ogni k N con 1 k n;
(ii) (n!)
2
=

n
k=1
k(n + 1 k) per ogni n N
+
;
(iii) n
n
(n!)
2

_
n+1
2
_
2n
per ogni n N
+
.
17. Siano a
1
, . . . , a
n
, b
1
, . . . , b
n
numeri reali. Denotiamo con a
k
il riordi-
namento crescente e con a
k
il riordinamento decrescente della sequen-
za a
k
, e similmente per b
k
. Si provino le disuguaglianze seguenti:
(i)

n
k=1
a
k

b
k

n
k=1
a
k
b
k

n
k=1
a
k

b
k
,
(ii)

n
k=1
a
k

b
k

1
n
(

n
k=1
a
k
) (

n
k=1
b
k
)

n
k=1
a
k
b
k
.
[Traccia: si pu`o supporre che b
k
sia gi`a riordinata in modo crescente.
Consideriamo le due disuguaglianze di destra: per (i), si verichi che
se i < j e a
i
> a
j
, allora risulta a
i
b
i
+ a
j
b
j
< a
j
b
i
+ a
i
b
j
; per (ii), si
decomponga la quantit`a

n
k,h=1
(a
k
a
h
)(

b
k

b
h
) e si noti che essa `e non
negativa. Le disuguaglianze di sinistra si ottengono applicando quelle
di destra a a
k
e a b
k
.]
31
1.7 La formula del binomio
Per ogni n, k N con n k deniamo i coecienti binomiali
_
n
k
_
(si leggen
su k) nel modo seguente:
_
n
k
_
=
n!
k!(n k)!
.
Si noti che
_
n
k
_
= 1 quando k = n e quando k = 0; negli altri casi si ha
_
n
k
_
=
n(n 1) (n k + 1)
k!
,
e questa espressione si prester`a ad ulteriori generalizzazioni nel seguito del
corso. Dalla denizione seguono subito queste propriet`a:
(simmetria)
_
n
k
_
=
_
n
nk
_
,
(legge del triangolo di Tartaglia)
_
n
k1
_
+
_
n
k
_
=
_
n+1
k
_
.
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1

Il triangolo di Tartaglia ha tutti 1 sui lati obliqui ed ogni suo elemento al-
linterno `e la somma dei due elementi ad esso soprastanti. Gli elementi del
triangolo sono appunto i coecienti binomiali:
_
n
k
_
si trova al posto k-simo
nella riga n-sima (cominciando sempre a contare da 0).
La denominazione coeciente binomiale nasce dal fatto che questi numeri
saltano fuori come coecienti nella formula di Newton che d`a lo sviluppo del
32
binomio (a +b)
n
, formula che adesso dimostreremo. Ricordiamo preliminar-
mente che se x R0 e n N, la potenza x
n
, il cui signicato `e comunque
ovvio, andrebbe denita rigorosamente nel seguente modo:
_
x
0
= 1
x
n+1
= x x
n
n N;
se invece x = 0, si pone 0
n
= 0 per ogni n N
+
, mentre 0
0
non si denisce.
Ci`o posto, si ha:
Teorema 1.7.1 Se a, b R 0 e n N
+
, si ha
(a +b)
n
=
n

k=0
_
n
k
_
a
k
b
nk
.
Dimostrazione Utilizziamo il principio di induzione. Se n = 1 la formula
`e vera perche
a +b =
_
1
0
_
a
0
b
1
+
_
1
1
_
a
1
b
0
= b +a.
Supponiamo vera la formula per un binomio di grado n e proviamola per un
binomio di grado n + 1. Si ha
(a +b)
n+1
= (a +b)(a +b)
n
= (per ipotesi induttiva)
= (a +b)
n

k=0
_
n
k
_
a
k
b
nk
=
=
n

k=0
_
n
k
_
a
k+1
b
nk
+
n

k=0
_
n
k
_
a
k
b
n+1k
=
(ponendo h = k + 1 nella prima somma e h = k nella seconda)
=
n+1

h=1
_
n
h 1
_
a
h
b
n+1h
+
n

h=0
_
n
h
_
a
h
b
n+1h
=
(isolando lultimo addendo nella prima somma e il primo addendo
nella seconda)
=
_
n
n
_
a
n+1
b
0
+
_
n
0
_
a
0
b
n+1
+
n

h=1
_
n
h 1
_
a
h
b
n+1h
+
+
n

h=1
_
n
h
_
a
h
b
n+1h
=
33
= a
n+1
+b
n+1
+
n

h=1
__
n
h 1
_
+
_
n
h
__
a
h
b
n+1h
=
(per la legge del triangolo di Tartaglia)
= a
n+1
+b
n+1
+
n

h=1
_
n + 1
h
_
a
h
b
n+1h
=
n+1

h=0
_
n + 1
h
_
a
h
b
n+1h
.
Per il principio di induzione la formula `e vera per ogni n N
+
.
Osservazioni 1.7.2 (1) La formula del binomio vale pi` u in generale per
a, b R e n N, se in tale formula si conviene di interpretare il simbolo 0
0
come 1.
(2) Scelti a = 1, b = 1, n N
+
si ottiene
0 = (1 + 1)
n
=
n

k=0
_
n
k
_
(1)
k
1
nk
,
cio`e
n

k=0
(1)
k
_
n
k
_
= 0 n N
+
.
(3) Scelti a = 1, b = 1, n N si ottiene
n

k=0
_
n
k
_
= 2
n
n N.
Questa uguaglianza ha una interpretazione combinatoria: 2
n
`e il nume-
ro di sottoinsiemi distinti di un ssato insieme con n elementi (esercizio
1.6.refsotto), mentre
_
n
k
_
`e il numero di sottoinsiemi distinti aventi k ele-
menti di un insieme con n elementi (esercizio 1.7.2). Si tratta dunque di
contare tutti i sottoinsiemi raggruppandoli per numero di elementi.
(4) Un altro modo di enunciare la propriet`a dellesercizio 1.7.2 `e il seguente:
_
n
k
_
`e il numero di modi in cui si possono sistemare k palline indistinguibili
in n scatole distinte, una per scatola: infatti ogni distribuzione di palline
individua un sottoinsieme di k scatole (sulle n complessive). In termini pro-
babilistici si pu`o anche dire: data unurna contenente k palline bianche e
n k palline nere, la probabilit`a di estrarre le k palline bianche nelle prime
34
k estrazioni (intesa come rapporto tra gli esiti favorevoli e gli esiti possibili)
`e pari a
1
_
n
k
_.
Infatti nella prima estrazione ci sono k esiti favorevoli su n possibili, nella
seconda k 1 su n 1, e cos` via, nche nella k-sima si ha un solo esito
favorevole su n k + 1 possibili: dunque la probabilit`a `e
k
n

k 1
n 1

1
n k + 1
=
1
_
n
k
_.
Ad esempio la probabilit`a di fare 6 al Superenalotto `e
1
_
90
6
_ =
1
622.614.630
0.000000016
(qui le palline bianche sono i 6 numeri prescelti e il simbolo signica
circa uguale a).
(5) Dalla formula del binomio segue subito la seguente disuguaglianza di
Bernoulli:
(1 +x)
n
1 +nx x 0, n N
(basta osservare che tutti gli addendi nello sviluppo del binomio (1+x)
n
sono
non negativi); una versione pi` u generale di questa disuguaglianza `e enunciata
nellesercizio 1.7.5. Si pu`o anche osservare che risulta
(1 +x)
n
1 +nx +
n(n 1)
2
x
2
x 0, n N.
Esercizi 1.7
1. Provare che:
(i) k
_
n
k
_
= n
_
n1
k1
_
per ogni n, k N con n k 1;
(ii)

n
k=1
k
_
n
k
_
= n 2
n1
per ogni n N
+
;
(iii)

n
k=1
k
2

_
n
k
_
= n(n + 1) 2
n2
per ogni n N
+
;
(iv)

n
m=k
_
m
k
_
=
_
n+1
k+1
_
per ogni n, k N con n k.
2. Provare che un insieme di n elementi ha
_
n
k
_
sottoinsiemi distinti con k
elementi (0 k n).
35
3. Calcolare la probabilit`a di fare un terno al lotto.
4. Calcolare la probabilit`a di fare 5 + 1 al Superenalotto.
5. (Disuguaglianza di Bernoulli) Provare che risulta
(1 +x)
n
1 +nx x 1, n N
+
.
6. Provare che
sup
__
1
x
n
2
_
n
: n N
+
_
= 1 x 0.
[Traccia: utilizzare la disuguaglianza di Bernoulli.]
7. Si generalizzi la formula del binomio al caso di tre addendi.
1.8 Radici n-sime
Proviamo adesso unaltra conseguenza dellassioma di continuit`a, vale a dire
lesistenza della radice n-sima di qualunque numero reale non negativo.
Teorema 1.8.1 Sia n N
+
. Per ogni numero reale a 0 esiste un unico
numero reale r 0 tale che r
n
= a; tale numero si chiama radice n-sima di
a, e si scrive r =
n

a oppure r = a
1
n
.
Dimostrazione Supporremo n 2, dato che per n = 1 la tesi `e ovvia. Se
a = 0, allora lunica soluzione dellequazione x
n
= 0 `e il numero 0 in virt` u
della legge di annullamento del prodotto. Supponiamo dunque a > 0.
Proviamo dapprima lunicit`a della radice n-sima: se vi fossero due numeri
r e , entrambi non negativi ed entrambi soluzioni dellequazione x
n
= a,
uno dei due, ad esempio , sarebbe maggiore dellaltro; ma da r < segue
(esercizio 1.6.15) che a = r
n
<
n
= a, il che `e assurdo. Dunque r = e
lunicit`a `e provata.
Per dimostrare lesistenza della radice n-sima, consideriamo linsieme
A = x 0 : x
n
< a
(ovviamente non vuoto, dato che 0 A) e mostriamo:
(a) che A `e limitato superiormente,
36
(b) che r = sup A `e il numero che stiamo cercando, ossia che r
n
= a.
Proviamo (a): se a 1, facciamo vedere che il numero a `e un maggiorante
di A, mentre se 0 < a < 1 facciamo vedere che il numero 1 `e un maggiorante
di A. Sia a 1: se per un x A risultasse x > a, moltiplicando questa disu-
guaglianza per x e per a avremmo x
2
> ax > a
2
; essendo a 1, dedurremmo
x
2
> a
2
a. Procedendo per induzione, avremmo x
n
> a, contraddicendo il
fatto che x A: dunque si ha x a per ogni x A. Sia ora 0 < a < 1: se
per un x A risultasse x > 1, procedendo analogamente troveremmo x
n
> 1;
essendo 1 > a, otterremmo x
n
> a, nuovamente contraddicendo il fatto che
x A. Se ne conclude che linsieme A ha maggioranti, e quindi `e limitato
superiormente.
Proviamo (b). Notiamo anzitutto che r = sup A > 0. Infatti A contiene
elementi non nulli: ad esempio, se a > 1 si ha 1 A in quanto 1
n
= 1 < a,
mentre se 0 < a < 1 si ha a A poiche a
n
< a; inne se a = 1 si ha
1
2
A
dato che
_
1
2
_
n
<
1
2
< 1 = a.
Dobbiamo mostrare che r
n
= a, e lo faremo provando che sono assurde en-
trambe le relazioni r
n
> a e r
n
< a. Supponiamo che sia r
n
> a: vogliamo
mostrare che, di conseguenza, deve essere
(r )
n
> a
per ogni positivo e sucientemente piccolo; ci`o implicherebbe che linter-
vallo ]r , r[ `e costituito da maggioranti di A, contraddicendo il fatto che
r `e il minimo dei maggioranti di A. Invece di ricavare dalla disuguaglian-
za (r )
n
> a, che non sappiamo risolvere, ne dedurremo unaltra pi` u
restrittiva, ma pi` u facile da risolvere. A questo scopo osserviamo che per
]0, r[ si ha, grazie alla disuguaglianza di Bernoulli (esercizio 1.7.5; si noti
che

r
> 1)
(r )
n
= r
n
_
1

r
_
n
r
n
_
1 n

r
_
;
se ne deduce (r )
n
> a purche risulti
r
n
_
1 n

r
_
> a.
Questa disuguaglianza, che segue da quella originale ed `e quindi pi` u restrit-
tiva di essa, si risolve subito: essa `e vericata se e solo se
<
r
n
_
1
a
r
n
_
,
37
e dunque si deduce, come volevamo, che
(r )
n
> a
_
0,
r
n
_
1
a
r
n
__
]0, r[;
di qui, come si `e detto, segue lassurdo.
Supponiamo ora che sia r
n
< a: vogliamo analogamente dedurre che
(r +)
n
< a
per ogni positivo ed abbastanza piccolo; da ci`o seguir`a che A contiene
numeri maggiori di r, contraddicendo il fatto che r `e un maggiorante di A.
Trasformiamo la disuguaglianza che ci interessa: si ha
(r +)
n
= r
n
_
1 +

r
_
n
< a
1
r
n
_
1 +

r
_
n
>
1
a
;
daltronde, applicando nuovamente la disuguaglianza di Bernoulli (si noti che

r
1+

r
> 1), risulta
1
_
1 +

r
_
n
=
_
1

r
1 +

r
_
n
> 1 n

r
1 +

r
> 1 n

r
;
quindi al posto della disuguaglianza (r +)
n
> a si ottiene la disuguaglianza
pi` u restrittiva
1
r
n
_
1 n

r
_
>
1
a
che `e vera se e solo se
0 < <
r
n
_
1
r
n
a
_
]0, r[.
Dunque si ottiene, come si voleva,
(r +)
n
< a
_
0,
r
n
_
1
r
n
a
__
,
e quindi, come si `e osservato, lassurdo.
In denitiva, non resta che dedurre luguaglianza r = a.
38
Disuguaglianza delle medie
Un risultato molto importante, utilissimo in svariate situazioni, `e la disugua-
glianza tra media geometrica e media aritmetica di n numeri non negativi. Se
a
1
, a
2
, . . . , a
n
sono numeri non negativi, la loro media geometrica `e il numero
reale
G =
n

_
n

k=1
a
k
,
mentre la loro media aritmetica `e il numero reale
A =
1
n
n

k=1
a
k
.
Si ha allora:
Teorema 1.8.2 Se n N
+
e se a
1
, . . . , a
n
sono numeri non negativi, allora
n

_
n

k=1
a
k

1
n
n

k=1
a
k
;
inoltre vale il segno di uguaglianza se e solo se gli a
k
sono tutti uguali fra
loro.
Dimostrazione Anzitutto, `e chiaro che se gli a
k
sono tutti uguali fra loro
allora G = A. Per provare il viceversa, mostreremo che se gli a
k
non sono
tutti uguali allora risulta G < A; ci`o `e ovvio se qualcuno degli a
k
`e nullo,
perche in tal caso si ha G = 0 < A. Possiamo dunque supporre gli a
k
strettamente positivi e non tutti uguali. Proveremo la disuguaglianza G < A
per induzione.
Se n = 2, la tesi `e vera perche

a
1
a
2
<
1
2
(a
1
+a
2
) (

a
2

a
1
)
2
> 0,
ed essendo a
1
,= a
2
, la relazione a destra `e vera.
Supponiamo che la disuguaglianza stretta sia vera per ogni n-pla di numeri
positivi non tutti uguali, con n 2, e dimostriamola nel caso di n + 1
numeri. Prendiamo dunque n + 1 numeri positivi a
1
, . . . , a
n
, a
n+1
non tutti
uguali: allora ce ne sar`a almeno uno diverso dalla media aritmetica A; per
39
simmetria, o meglio per denizione stessa di media aritmetica, di numeri
diversi da A ce ne dovranno essere due, a
i
e a
j
, dei quali uno sar`a maggiore
ed uno sar`a minore di A. Quindi, a meno di riordinare gli a
k
, non `e restrittivo
supporre che risulti
a
n
< A < a
n+1
.
Il fatto che A `e la media aritmetica degli a
k
si pu`o riscrivere cos`:
n1

k=1
a
k
+ (a
n
+a
n+1
A) = n A
(ricordiamo che n + 1 3 e quindi la prima somma contiene almeno un
addendo). Questa relazione ci dice che A `e anche la media aritmetica degli
n numeri non negativi a
1
, . . . , a
n1
, a
n
+ a
n+1
A; per ipotesi induttiva, la
loro media geometrica `e non superiore ad A, ossia
n

_
(a
n
+a
n+1
A)
n1

k=1
a
k
A.
Elevando alla n-sima potenza e moltiplicando per A si ricava allora
A (a
n
+a
n+1
A)
n1

k=1
a
k
A
n+1
.
Daltra parte risulta
a
n
a
n+1
< A(a
n
+a
n+1
A)
in quanto
A(a
n
+a
n+1
A) a
n
a
n+1
= (A a
n
)(a
n+1
A) > 0;
quindi a maggior ragione otteniamo
n+1

k=1
a
k
< A (a
n
+a
n+1
A)
n1

k=1
a
k
A
n+1
.
La disuguaglianza per n + 1 numeri `e dunque stretta se essi non sono tutti
uguali.
Per il principio di induzione, la tesi `e provata.
40
Esempi 1.8.3 (1) Applicando la disuguaglianza delle medie si dimostra
questa basilare propriet`a delle radici n-sime:
inf
nN
+
a
1
n
= 1 a 1, sup
nN
+
a
1
n
= 1 a ]0, 1].
(Si osservi la notazione: inf
nN
+ a
1
n
signica inf a
1
n
: n N
+
, e analoga-
mente sup
nN
+ a
1
n
denota sup a
1
n
: n N
+
.)
Infatti la propriet`a `e evidente quando a = 1, poiche 1
1
n
= 1 per ogni
n N
+
. Supponiamo adesso a > 1: allora, ssato n 2 e prendendo
a
1
= = a
n1
= 1 e a
n
= a, dalla disuguaglianza delle medie si ha
1 < a
1
n
<
1
n
(n 1 +a) = 1 +
a 1
n
n 2,
da cui
1 inf
nN
+
a
1
n
inf
nN
+
_
1 +
a 1
n
_
= 1.
Ci`o prova la tesi quando a > 1.
Se a < 1, si ha
1
a
> 1 e, per quanto visto,
1 <
_
1
a
_1
n
< 1 +
1
a
1
n
= 1 +
1 a
na
n 2,
da cui
1
1 +
1a
na
< a
1
n
< 1 n 2;
ne segue
1 = sup
nN
+
1
1 +
1a
na
sup
nN
+
a
1
n
1.
(2) Dimostriamo la seguente importante disuguaglianza:
_
1 +
x
n
_
n
<
_
1 +
x
n + 1
_
n+1
x R 0, n N
+
con n > x.
Essa segue dalla disuguaglianza delle medie, scegliendo a
1
= = a
n
= 1+
x
n
e a
n+1
= 1: infatti
_
1 +
x
n
_
n
=
n+1

k=1
a
k
<
_
1
n + 1
n+1

k=1
a
k
_
n+1
=
41
=
_
1
n + 1
_
n
_
1 +
x
n
_
+ 1
_
_
n+1
=
=
_
n +x + 1
n + 1
_
n+1
=
_
1 +
x
n + 1
_
n+1
.
Esercizi 1.8
1. Provare che per ogni numero reale a > 0 e per ogni intero pari n 2
lequazione x
n
= a ha le due soluzioni reali x = a
1
n
; si provi inoltre
che
a
1
n
= inf x R : x
n
< a.
2. Provare che per ogni a R e per ogni intero dispari n 1, lequazione
x
n
= a ha esattamente una soluzione reale, e cio`e:
x =
_
a
1
n
se a 0,
(a)
1
n
se a < 0;
questo permette di estendere la denizione di radice n-sima, quando n
`e dispari, a tutti i numeri a R.
3. Si dimostri la formula risolutiva per le equazioni di secondo grado.
[Traccia: data lequazione ax
2
+ bx + c = 0, si osservi che non `e re-
strittivo supporre a > 0; si completi il quadrato a primo membro
scrivendola nella forma
_

a x +
b
2

a
_
2
=
b
2
4ac
4a
,
e si analizzi il segno del discriminante b
2
4ac. . . ]
4. Sia n N
+
. Si provi la seguente disuguaglianza tra media armonica e
media geometrica di n numeri positivi:
n

n
k=1
1
a
k

_
n

k=1
a
k
.
42
1.9 Valore assoluto
In geometria la retta `e un concetto primitivo, ossia non se ne fornisce la de-
nizione ma la si considera come un ente intrinsecamente noto. Il sistema dei
numeri reali costituisce il modello matematico dellidea intuitiva di retta: si
assume che ad ogni punto della retta corrisponda uno ed un solo numero reale
(che viene detto ascissa del punto). Questo `e un vero e proprio assioma, ma
`e peraltro un enunciato del tutto ragionevole; per realizzare tale corrispon-
denza, si ssa sulla retta un sistema di riferimento, costituito da unorigine,
a cui associamo il numero reale 0, da ununit`a di misura, che ci permette
di identicare i punti a cui associare i numeri interi, e da unorientazione,
allo scopo di distinguere i punti corrispondenti a numeri positivi da quelli
corrispondenti a numeri negativi.
Per misurare la grandezza di un numero, a prescindere dal fatto che esso
sia positivo oppure negativo, `e fondamentale la seguente
Denizione 1.9.1 Il valore assoluto, o modulo, di un numero reale x `e il
numero non negativo [x[ cos` denito:
[x[ =

x
2
=
_
x se x 0,
x se x < 0.
Si noti che risulta
[x[ x [x[ x R,
od equivalentemente
[x[ = maxx, x x R.
Si noti anche che
[x[ a a x a
e. pi` u generalmente,
[x u[ a u a x u +a.
Rappresentando R come retta orientata, [x[ `e la distanza del numero reale x
dallorigine 0, e analogamente [a b[ `e la distanza fra i due numeri reali a e
b.
43
La proposizione che segue riassume le principali propriet`a del valore assoluto.
Proposizione 1.9.2 Valgono i seguenti fatti:
(i) [x[ 0 per ogni x R, e [x[ = 0 se e solo se x = 0;
(ii) [x[ [y[ = [xy[ per ogni x, y R;
(iii) (subadditivit`a) [x +y[ [x[ +[y[ per ogni x, y R;
(iv) [[x[ [y[[ [x y[ per ogni x, y R;
(v)

1
x

=
1
|x|
per ogni x R 0;
(vi)

x
y

=
|x|
|y|
per ogni x R e y R 0.
Dimostrazione La propriet`a (i) `e evidente. Per (ii) si osservi che dalla
denizione segue subito x
2
= [x[
2
per ogni x R; quindi
([x[ [y[)
2
= [x[
2
[y[
2
= x
2
y
2
= (xy)
2
= [xy[
2
,
da cui la tesi estraendo la radice quadrata: infatti
t R,

t
2
= t t 0.
Proviamo (iii): usando (i) e (ii), si ha
[x +y[
2
= (x +y)
2
= x
2
+y
2
+ 2xy [x[
2
+[y[
2
+ 2[xy[ =
= [x[
2
+[y[
2
+ 2[x[[y[ = ([x[ +[y[)
2
,
da cui la tesi estraendo la radice quadrata.
La (iv) `e conseguenza della subadditivit`a: infatti
[x[ = [(x y) +y[ [x y[ +[y[,
44
da cui [x[ [y[ [x y[; scambiando i ruoli di x e y si ottiene anche
[y[ [x[ [y x[ = [x y[, e quindi
[[x[ [y[[ = max[x[ [y[, [y[ [x[ [x y[.
Dimostriamo (v): da (ii) segue
[x[

1
x

x
1
x

= [1[ = 1,
quindi

1
x

`e linverso di [x[, ossia vale la tesi.


Inne (vi) `e conseguenza evidente di (ii) e (v).
Disuguaglianza di Cauchy-Schwarz
Unaltra importante disuguaglianza, che come si vedr`a ha un rilevante signi-
cato geometrico, `e la seguente:
Teorema 1.9.3 Fissato n N
+
, siano a
1
, . . . , a
n
, b
1
, . . . , b
n
numeri reali.
Allora si ha
n

i=1
a
i
b
i

_
n

i=1
a
2
i

_
n

i=1
b
2
i
.
Dimostrazione Fissato t R, consideriamo la quantit`a, certamente non
negativa,

n
i=1
(a
i
+tb
i
)
2
. Si ha
0
n

i=1
(a
i
+tb
i
)
2
=
n

i=1
a
2
i
+ 2t
n

i=1
a
i
b
i
+t
2
n

i=1
b
2
i
t R.
Questa espressione `e un trinomio di secondo grado nella variabile reale t. Il
fatto che esso sia sempre non negativo implica che il discriminante
= 4
_
n

i=1
a
i
b
i
_
2
4
n

i=1
b
2
i
n

i=1
a
2
i
deve essere non positivo (esercizio 1.8.3). La condizione 0 implica la
tesi.
45
Esercizi 1.9
1. Determinare sotto quali condizioni sui numeri reali x, y valgono le
uguaglianze:
(i) [x[ [y[ = [x y[; (ii) [x +y[ = [x y[;
(iii) [x[ [y[ = x y; (iv) [x[ [y[ = x +y;
(v) [[x[ [y[[ = [x +y[; (vi) [[x[ [y[[ = [x y[;
(vii) [[x[ [y[[ = x +y; (viii) [[x[ [y[[ = x y.
2. Risolvere le seguenti equazioni e disequazioni:
(i) [x[ + 1 = [x + 1[, (ii) [x[ x
2
= [[x[ +x[,
(iii) [x + 3[ < [2x 3[, (iv) [[x 1[ + 1[ < 1,
(v)
1
|x|

1
|x+3|
>
1
|x+4|
, (vi) [[2x 1[ [x + 3[[ < [4x + 5[.
3. Risolvere le seguenti equazioni e disequazioni:
(i) [x 1[ < 3; (ii) [2 + 3x[ = [4 x[;
(iii) [10 3x[ = 4; (iv) [1 + 2x[ 1;
(v) [x + 2[ 5x; (vi) [5 +x
1
[ < 1;
(vii) [x
2
2[ 1; (viii) x < [x
2
12[ < 4x;
(ix)
15x 3
x
2
5
3 ; (x)
_
x + 1 > 1
3x + 4 > 2
;
(xi)
[x
2
2[ + 3
3x + 1
1; (xii)
[x + 2[ 2x
x
2
2x
1;
(xiii)
2
x + 2
>
2x
x
2
1
; (xiv) x
2
5[x[ + 6 0.
4. Siano a, b R con b 0. Vericare che
[x a[ < b a b < x < a +b.
5. Determinare un numero reale M tale che si abbia
[x[ 1 = [x
2
x[ M.
46
6. Risolvere le seguenti disequazioni:
(i)
_
x + 1
x + 3
2; (ii)

[x + 2[
[x 1[
> 1;
(iii)

4x
2
1 < x 3; (iv)

3x
2
1 >

x
2
3;
(v) [x[

1 2x
2
> 2x
2
1; (vi)
[x[ 3

x 2
>

x.
7. Provare che per ogni a R si ha
maxa, 0 =
a +[a[
2
, mina, 0 = maxa, 0 =
a [a[
2
.
8. Si dimostri la disuguaglianza di Cauchy-Schwarz utilizzando il principio
di induzione.
1.10 La funzione esponenziale
Vogliamo denire la funzione esponenziale a
x
per ogni base a > 0 e per
ogni esponente x R, naturalmente preservando le propriet`a usuali, noto-
riamente vere quando gli esponenti sono numeri naturali. A questo scopo
procederemo in vari passi.
Prima di cominciare, enunciamo un lemma che useremo a pi` u riprese.
Lemma 1.10.1 (dellarbitrariet`a di ) Siano a, b numeri reali e M, nu-
meri reali positivi. Supponiamo che risulti
a b +M ]0, [;
allora si ha necessariamente a b.
Dimostrazione Se fosse a > b, scegliendo

_
0, min
_
,
a b
M
__
si otterrebbe a > b +M, contro lipotesi.
1
o
passo (esponenti naturali) Ricordiamo che per n N e a R la
47
potenza a
n
`e stata denita allinizio del paragrafo 1.7; `e facile vericare che
se a, b > 0 valgono i seguenti fatti:
(i) a
n
> 0 n N, a
0
= 1;
(ii) a
n+m
= a
n
a
m
n, m N;
(iii) a
nm
= (a
n
)
m
n, m N;
(iv) (ab)
n
= a
n
b
n
n N;
(v) a < b = a
n
< b
n
n N
+
;
(vi)
_
a < 1 = a
n
< 1
a > 1 = a
n
> 1
n N
+
;
(vii)
_
a < 1 = a
m
< a
n
a > 1 = a
m
> a
n
m, n N
+
con m > n.
Le propriet`a (i)-(vi) si vericano per induzione su n (esercizio 1.10.1), mentre
la (vii) segue banalmente da (vi) scrivendo a
m
= a
n
a
mn
.
2
o
passo (radici n-sime) Per n N
+
e a > 0 la quantit`a a
1/n
`e stata
denita nel paragrafo 1.8 come lunica soluzione positiva dellequazione x
n
=
a; dunque per denizione si ha
(a
1
n
)
n
= a n N
+
.
Risulta anche
a
1
nm
= (a
1
n
)
1
m
n, m N
+
(perche, per (iii), i due membri risolvono entrambi lequazione x
mn
= a),
(a
1
n
)
m
= (a
m
)
1
n
n, m N
+
(perche, per (iii), i due membri risolvono entrambi lequazione x
n
= a
m
),
(ab)
1
n
= a
1
n
b
1
n
n N
+
(perche, per (iv), i due membri risolvono entrambi lequazione x
n
= ab),
_
a < 1 = a
1
n
< 1
a > 1 = a
1
n
> 1
n N
+
48
(per lesercizio 1.10.2),
_
a < 1 = a
1
n
< a
1
m
a > 1 = a
1
n
> a
1
m
n, m N
+
con m > n
(elevando entrambi i membri alla potenza mn ed usando (iii), (vii)).
3
o
passo (esponenti razionali) Se r Q, sar`a r =
p
q
con p Z, q N
+
;
se a > 0 poniamo allora, per denizione,
a
p
q
=
_

_
_
a
1
q
_
p
se p 0
1

a
1
q

p
se p < 0.
Occorre per`o vericare che questa `e una buona denizione, nel senso che essa
non deve dipendere dal modo di rappresentare in frazione il numero razionale
r: in altri termini, bisogna controllare che se r =
p
q
=
m
n
, cio`e m = kp, n = kq
con k N
+
, allora risulta a
p
q
= a
m
n
. Ed infatti, supposto ad esempio p 0,
utilizzando le propriet`a precedenti si trova
a
m
n
= (a
1
kq
)
kp
= [((a
1
q
)
1
k
)
k
]
p
= (a
1
q
)
p
= a
p
q
;
il discorso `e del tutto analogo se p < 0.
Si ottengono allora facilmente le estensioni delle propriet`a (i)-(vii) al caso di
esponenti razionali (vedere esercizio 1.10.3):
(i) a
r
> 0 r Q, a
0
= 1;
(ii) a
r+s
= a
r
a
s
r, s Q;
(iii) a
rs
= (a
r
)
s
r, s Q;
(iv) (ab)
r
= a
r
b
r
r Q;
(v) a < b = a
r
< b
r
r Q con r > 0;
(vi)
_
a < 1 = a
r
< 1
a > 1 = a
r
> 1
r Q con r > 0;
(vii)
_
a < 1 = a
r
< a
s
a > 1 = a
r
> a
s
r, s Q con r > s.
49
4
o
passo (esponenti reali) Manco a dirlo, nellestensione da Q a R `e
essenziale lassioma di continuit`a. Prima di denire la quantit`a a
x
per x R,
dimostriamo il seguente risultato che ci illuminer`a sul modo di procedere.
Proposizione 1.10.2 Siano a, x R con a > 0, e poniamo
A = a
r
: r Q, r < x, B = a
s
: s Q, s > x.
Allora gli insiemi A e B sono separati; in particolare, se a 1 si ha sup A =
inf B, mentre se a 1 risulta inf A = sup B.
Dimostrazione Supponiamo a 1 e poniamo = sup A, = inf B; questi
numeri , sono niti (esercizio 1.10.4). Da (vii) segue che
a
r
< a
s
r, s Q con r < x < s,
quindi risulta . Dobbiamo provare che = . Se fosse invece < ,
dal fatto che
inf
nN
+
a
1
n
= 1
(esempio 1.8.3 (1)) segue che possiamo scegliere n N
+
tale che
1 < a
1
n
<

.
Scelto poi r Q tale che x
1
n
< r < x, il che `e lecito per la densit`a dei
razionali in R (corollario 1.6.8), si ha r +
1
n
> x; dunque, usando (ii),
a
r+
1
n
= a
r
a
1
n
a
1
n
<

= .
Ci`o `e assurdo e pertanto = .
Supponiamo adesso 0 < a 1 e poniamo L = inf A, M = sup B; nuo-
vamente, questi numeri L, M sono niti (esercizio 1.10.4). Da (vii) segue
stavolta
a
r
> a
s
r, s Q con r < x < s,
cosicche L M. Se fosse L > M, preso n N
+
tale che
M
L
< a
1
n
< 1
50
(lecito, essendo sup
nN
+ a
1
n
= 1) e scelto s Q con x < s < x +
1
n
, si ha
s
1
n
< x e dunque, per (ii),
L a
s
1
n
=
a
s
a
1
n

M
a
1
n
< M
L
M
= L.
Ci`o `e assurdo e pertanto L = M.
La precedente proposizione ci dice che la nostra scelta per denire a
x
`e
obbligata: se vogliamo mantenere la propriet`a (vii) siamo forzati a dare
questa
Denizione 1.10.3 Siano a, x R con a > 0. Indichiamo con a
x
il numero
reale seguente:
a
x
=
_
supa
r
: r Q, r < x = infa
s
: s Q, s > x se a 1
infa
r
: r Q, r < x = supa
s
: s Q, s > x se 0 < a 1.
Non `e dicile vericare che nel caso in cui x `e razionale questa denizione
concorda con la precedente (esercizio 1.10.4).
Osservazioni 1.10.4 (1) Dalla denizione segue subito che 1
x
= 1 per
ogni x R.
(2) Per ogni a > 0 e per ogni x R risulta a
x
=
1
a
x
. Infatti, supposto ad
esempio a 1, si ha
a
x
= supa
r
: r Q, r < x = (posto s = r)
= supa
s
: s Q, s > x = (per denizione nel caso
di esponente razionale)
= sup
_
1
a
s
: s Q, s > x
_
= (per lesercizio 1.10.5)
=
1
infa
s
: s Q, s > x
=
1
a
x
;
il discorso `e analogo se 0 < a 1.
Estendiamo adesso le propriet`a (i)-(vii) al caso di esponenti reali. La (i) `e
evidente. Per la (ii) si ha:
Proposizione 1.10.5 Per ogni a > 0 si ha
a
x+y
= a
x
a
y
x, y R.
51
Dimostrazione Supponiamo ad esempio a 1. Poiche
a
x+y
= supa
q
: q Q, q < x +y,
per ogni r, s Q con r < x e s < y si ha r +s < x +y e quindi
a
r
a
s
= a
r+s
a
x+y
.
Passando allestremo superiore separatamente rispetto a r e rispetto a s,
otteniamo (esercizio 1.5.15)
a
x
a
y
a
x+y
.
In modo del tutto analogo, usando il fatto che
a
x+y
= infa
q
: q Q, q > x +y,
si prova che a
x
a
y
a
x+y
. La tesi `e cos` provata quando a 1.
Nel caso 0 < a 1 si procede esattamente come sopra: lunica dierenza `e
che dalla relazione
a
x+y
= infa
q
: q Q, q < x +y
segue che a
x
a
y
a
x+y
, mentre dalla relazione
a
x+y
= supa
q
: q Q, q < x +y
segue che a
x
a
y
a
x+y
.
Proviamo ora (iv) e (iii); per le propriet`a (v), (vi), (vii) si rimanda agli
esercizi 1.10.6, 1.10.7 e 1.10.8.
Proposizione 1.10.6 Per ogni a, b > 0 si ha
(ab)
x
= a
x
b
x
x R.
Dimostrazione Supponiamo a, b 1. Usando la caratterizzazione di a
x
,
b
x
, (ab)
x
mediante gli estremi superiori, si vede che per ogni r Q con r < x
si ha
a
r
b
r
= (ab)
r
(ab)
x
.
Daltra parte ssato > 0 esistono r, r

Q con r < x e r

< x tali che


a
x
< a
r
a
x
, b
x
< b
r

b
x
;
52
quindi posto = maxr, r

si ha a maggior ragione
a
x
< a

a
x
, b
x
< b

b
x
.
Ne segue, scegliendo 0 < < mina
x
, b
x
,
(a
x
)(b
x
) < a

= (ab)

(ab)
x
da cui, essendo
2
> 0,
a
x
b
x
(b
x
+a
x
) < (ab)
x
ossia
a
x
b
x
< (ab)
x
+(a
x
+b
x
) ]0, mina
x
, b
x
[;
per il lemma dellarbitrariet`a di si deduce che a
x
b
x
(ab)
x
.
Utilizzando invece le caratterizzazioni di a
x
, b
x
, (ab)
x
mediante gli estremi
inferiori, si ottiene in modo analogo che a
x
b
x
(ab)
x
. La tesi `e cos` provata
quando a, b 1.
Se a, b 1 si procede in modo simmetrico: usando le caratterizzazioni con
gli estremi superiori si trova che a
x
b
x
(ab)
x
, usando quelle con gli estremi
inferiori si trova laltra disuguaglianza.
Inne se a > 1 > b e, ad esempio, ab 1, allora usando le caratterizzazioni
con gli estremi superiori avremo:
a
r
b
r
= (ab)
r
(ab)
x
r Q con r < x,
e per ogni > 0 esistono r

, s

Q, con r

< x, s

> x, tali che


a
x
< a
r

a
x
, b
x
< b
s

b
x
;
dunque se 0 < < mina
x
, b
x
si ricava, ricordando che b
s

1,
0 < (a
x
)(b
x
) < a
r

b
s

a
r

b
r

= (ab)
r

(ab)
x
,
da cui, procedendo come prima, a
x
b
x
(ab)
x
. Similmente, usando le carat-
terizzazioni con gli estremi inferiori, si arriva alla disuguaglianza opposta. Se
a > 1 > b e ab 1, la procedura `e la stessa, mutatis mutandis, e lasciamo
i dettagli al lettore.
53
Osservazione 1.10.7 Dalla proposizione precedente segue, in particolare,
che
a
x

_
1
a
_
x
= 1
x
= 1 a > 0, x R,
cio`e, ricordando losservazione 1.10.4,
1
a
x
= a
x
=
_
1
a
_
x
a > 0, x R.
Proposizione 1.10.8 Per ogni a > 0 si ha
(a
x
)
y
= a
xy
x, y R.
Dimostrazione
`
E suciente considerare il caso x, y 0: infatti, provata
la tesi in questo caso, se minx, y < 0 ci si riconduce ad esso nel modo
seguente:
(a
x
)
y
=
_
1
a
x
_
y
=
1
a
(x)y
= a
xy
se x < 0 y;
(a
x
)
y
=
1
(a
x
)
y
=
1
a
xy
= a
xy
se y < 0 x;
(a
x
)
y
=
1
(a
x
)
y
=
1
_
1
a
x
_
y
=
1
1
a
(x)(y)
= a
(x)(y)
= a
xy
se x, y < 0.
Siano dunque x, y 0: se x = 0 oppure y = 0 la tesi `e evidente, dunque
possiamo assumere x, y > 0. Consideriamo dapprima il caso a 1: in
particolare avremo anche a
x
1. Usando la caratterizzazione con gli estremi
superiori, si ha che
(a
r
)
s
= a
rs
a
xy
r, s Q con r < x e s < y,
e per ogni ]0,
1
2
[ esistono r

, s

Q tali che 0 < r

< x, 0 < s

< y e
a
x
(1 ) < a
r

a
x
, (a
x
)
y
(1 ) < (a
x
)
s

(a
x
)
y
.
Dunque, facendo uso della proposizione 1.10.8 e tenendo conto che s

0 e
0 < r

< xy, si ottiene


(a
x
)
y
<
(a
x
)
s

1
=
(a
x
)
s

(1 )
s

(1 )
s

+1
=
[a
x
(1 )]
s

(1 )
s

+1

a
r

(1 )
s

+1

a
xy
(1 )
s

+1
.
54
Da qui, scegliendo n N tale che s

+1 n, e osservando che da <


1
2
segue
1
1
< 1 + 2, concludiamo che
(a
x
)
y
<
a
xy
(1 )
s

+1
< a
xy
(1 + 2)
n
.
Daltra parte, dalla formula del binomio (teorema 1.7.1) e dallosservazione
1.7.2 (3) segue che
(1 + 2)
n
= 1 +
n

k=1
_
n
k
_
(2)
k
< 1 + 2
n

k=1
_
n
k
_
< 1 + 2
n+1
,
da cui nalmente
(a
x
)
y
< a
xy
+a
xy
2
n+1

_
0,
1
2
_
,
e dunque (a
x
)
y
a
xy
in virt` u dellarbitrariet`a di .
In modo analogo, usando la caratterizzazione con gli estremi inferiori, si prova
la disuguaglianza opposta: ci`o conclude la dimostrazione nel caso a 1.
Se 0 < a 1 si procede in modo analogo: la caratterizzazione con gli estremi
superiori implicher`a che (a
x
)
y
a
xy
, mentre quella con gli estremi inferiori
porter`a alla disuguaglianza opposta. La tesi `e cos` provata.
Logaritmi
Abbiamo visto che la funzione esponenziale di base a (con a numero positivo
e diverso da 1) `e denita per ogni x R ed `e a valori in ]0, [. Essa `e
strettamente monot`ona, ossia verica (esercizio 1.10.8)
x < y = a
x
< a
y
se a > 1, x < y = a
x
> a
y
se a < 1 :
se a > 1 `e dunque una funzione strettamente crescente su R, se a < 1 `e
strettamente decrescente su R. In particolare, essa `e iniettiva: ci`o signica
che ad esponenti distinti corrispondono potenze distinte, ossia
a
x
= a
y
= x = y.
Inoltre la funzione esponenziale ha per codominio la semiretta ]0, [, vale
a dire che ogni numero positivo `e uguale ad una potenza di base a, per un
opportuno esponente x R; ci`o `e garantito dal seguente risultato:
55
Teorema 1.10.9 Se a `e un numero positivo diverso da 1, allora per ogni
y > 0 esiste un unico x R tale che a
x
= y; tale numero x si chiama
logaritmo in base a di y e si indica con x = log
a
y.
Dimostrazione Lunicit`a di x `e conseguenza delliniettivit`a della funzione
esponenziale. Proviamo lesistenza. Trattiamo dapprima il caso a > 1, y > 1:
consideriamo linsieme
A = t R : a
t
< y,
che `e certamente non vuoto, essendo 0 A. Notiamo che A `e anche limi-
tato superiormente. Infatti esiste n N tale che a
n
> y, dato che per la
disuguaglianza di Bernoulli (esercizio 1.7.5) si ha a
n
> 1 +n(a 1) > y non
appena n >
y1
a1
; quindi risulta a
n
> y > a
t
per ogni t A, da cui n > t per
ogni t A, ossia ognuno di tali n `e un maggiorante di A. Poniamo allora
x = sup A, e mostriamo che a
x
= y.
Se fosse a
x
> y, scelto n N in modo che a
1/n
< a
x

1
y
, il che `e possibile
grazie allesempio 1.8.3 (1), avremmo a
x1/n
> y > a
t
per ogni t A, da cui
x
1
n
> t per ogni t A: ne seguirebbe che x
1
n
sarebbe un maggiorante
di A, il che contraddice la denizione di x. Se fosse a
x
< y, scelto n in
modo che a
1/n
< y a
x
, avremmo a
x+1/n
< y, cio`e x +
1
n
A, nuovamente
contraddicendo la denizione di x. Perci`o a
x
= y, e la tesi `e provata nel caso
a > 1, y > 1.
Se a > 1, y = 1 allora chiaramente x = 0. Se a > 1, 0 < y < 1, allora
1
y
> 1,
cosicche per quanto gi`a visto esiste un unico x

R tale che a
x

=
1
y
; quindi,
posto x = x

, si ha a
x
= a
x

= y.
Inne, se 0 < a < 1 e y > 0, per quanto visto esiste un unico x

R tale che
(1/a)
x

= y; posto x = x

, ne segue a
x
= y.
La funzione esponenziale (con base positiva e diversa da 1) `e dunque inver-
tibile: la funzione inversa, che ad ogni y > 0 associa lunico esponente x R
per il quale si ha a
x
= y, `e il logaritmo di base a:
a
x
= y x = log
a
y.
La funzione logaritmo `e denita su ]0, [, a valori in R, ed `e ovviamente
anchessa bigettiva: dunque per ogni x R esiste un unico y > 0 tale che
log
a
y = x, e tale y `e precisamente a
x
. Si hanno dunque le relazioni
a
log
a
y
= y y > 0, log
a
a
x
= x x R.
56
Dalle propriet`a dellesponenziale seguono le corrispondenti propriet`a dei lo-
garitmi:
log
a
(bc) = log
a
b + log
a
c b, c > 0, a ]0, [1
(conseguenza di a
x+y
= a
x
a
y
, scegliendo x = log
a
b, y = log
a
c);
log
a
1
c
= log
a
c c > 0, a ]0, [1
(conseguenza di a
x
=
1
a
x
, scegliendo x = log
a
c);
log
a
c = log
a
b log
b
c c > 0, a, b ]0, [1
(conseguenza di (a
x
)
y
= a
xy
, scegliendo x = log
a
b, y = log
b
c). In particolare:
log
a
b
c
= log
a
b log
a
c b, c > 0, a ]0, [1,
log
a
1 = 0 a ]0, [1,
log
a
b
c
= c log
a
b c R, b > 0, a ]0, [1,
log
a
b =
1
log
b
a
a, b ]0, [1.
I graci approssimativi delle funzioni a
x
, log
a
x sono riportati di seguito.
57
Landamento qualitativo del graco di a
x
`e giusticato dalle seguenti consi-
derazioni: se a > 1, lincremento della quantit`a a
x
nel passaggio da 0 a `e
pari a a

1, mentre nel passaggio da t a t + `e pari a a


t+
a
t
, ossia a
a
t
(a

1). Dunque `e lo stesso di prima, dilatato o contratto di un fattore a


t
(che `e maggiore di 1 se t > 0, minore di 1 se t < 0). Se 0 < a < 1, vale lo
stesso discorso, ma rovesciato: si hanno incrementi dilatati se t < 0, contratti
se t > 0.
Il graco qualitativo di log
a
x si ottiene da quello di a
x
per riessione rispetto
alla retta y = x, come sempre accade per le funzioni inverse (osservazione
58
1.3.1).
Esercizi 1.10
1. Dimostrare le regole di calcolo con esponenti naturali, ossia le propriet`a
(i)-(vi) enunciate nel 1
o
passo.
2. Si provi che
a 1 a
1/n
1 n N
+
;
0 < a 1 a
1/n
1 n N
+
.
3. Dimostrare le regole di calcolo con esponenti razionali, ossia le propriet`a
(i)-(vii) enunciate nel 3
o
passo.
4. Per a > 0 poniamo
A = a
r
: r Q, r < x, B = a
s
: s Q, s > x.
Si provi che A e B sono limitati inferiormente, e che:
(i) se a 1, A `e limitato superiormente, mentre se a 1, B `e limitato
superiormente;
(ii) supposto x =
p
q
Q, se a 1 si ha a
p/q
= sup A = inf B, mentre
se a 1 si ha a
p/q
= inf A = sup B.
5. Sia A un insieme non vuoto contenuto nella semiretta ]0, [. Si provi
che
sup
_
1
x
: x A
_
=
_
+ se inf A = 0
1
inf A
se inf A > 0,
inf
_
1
x
: x A
_
=
_
0 se sup A = +
1
sup A
se sup A < +.
6. Siano a, b > 0 e x > 0. Si provi che se a < b allora a
x
< b
x
.
7. Siano a, x > 0. Si provi che se a < 1 allora a
x
< 1, mentre se a > 1
allora a
x
> 1.
59
8. Siano a > 0 e x, y R con x < y. Si provi che se a < 1 allora a
x
> a
y
,
mentre se a > 1 allora a
x
< a
y
.
9. Dimostrare che lequazione 37
x
= (0.58)
x
3
non ha soluzioni reali diverse
da 0.
10. Risolvere le seguenti equazioni:
(i)

8
x
=
1
4
; (ii) 9
1/(x1)
= 3
1/(3x1)
;
(iii) 7
x
2
5x+9
= 343; (iv)
(5
2x
)
3+x
25
x1
=
(5
x2
)
2x3
25
2x
125
3
;
(v)
_
x +y = 4
3
xy
= 27
; (vi)
_
x
2
+y
2
= 17
5
x+y
= 125
;
(vii) 8
5x
2
3
x
2
+1
= 2
153x
2
3x
2
+1
; (viii) 81
2x1
+ 2 9
4x
+ 711 = 81
2x+1
+
1
9
.
11. Risolvere le seguenti equazioni e disequazioni:
(i) 7
x+1
+ 7
x1
= 5
x
; (ii)

4
x
15
4

4
x
= 16;
(iii) 3
x+1
5
1x
; (iv)
1
2
< [2
x
1[ < 2;
(v) log
3
x log
1/3
x > 2; (vi) log
1/2
(2x + 3) 3;
(vii) [log
10
[x[[ = 100; (viii) (3 2
x
)(5
x/2
2) > 0;
(ix) log
3
_
log
4
(x
2
5)
_
< 0 ; (x) log
2
[x[ 3 log
4
[x[;
(xi) log
4
x
2
log
8

x =
5
3
; (xii) log
2x
x <
1
2
;
(xiii)
_
y
x
= 10
4
y
1/x
= 10
(xiv)
_
xy = 1/2
x
log
2
y
=
1
4
.
12. Dimostrare che
[a
x
1[ a
|x|
1 a 1, x R.
1.11 Geometria nel piano
In geometria il piano, come la retta, `e un concetto primitivo. Lassioma che
permette di identicare una retta orientata con linsieme dei numeri reali ci
60
consente anche di rappresentare univocamente i punti del piano con coppie
di numeri reali. Per fare ci`o, si deve ssare il sistema di riferimento, che `e
costituito da tre oggetti: (a) un punto origine O, (b) due direzioni, ossia
due rette orientate (non coincidenti e non opposte) passanti per O, e inne
(c) unorientazione: si deve decidere quale sia la prima direzione e quale la
seconda; la prima retta si chiama asse delle ascisse, o asse x e la seconda asse
delle ordinate, o asse y. Si dice che il sistema `e orientato positivamente se,
partendo dal lato positivo dellasse x e girando in verso antiorario, si incontra
il lato positivo dellasse y prima di quello negativo. Il sistema `e orientato
negativamente nel caso opposto. Noi considereremo soltanto sistemi di rife-
rimento orientati positivamente.
A questo punto si proietta P su ciascuna retta parallelamente allaltra: alle
sue due proiezioni A sullasse x e B sullasse y corrispondono univocamente
(per quanto visto) due numeri reali a, b, che si chiamano coordinate di P (ri-
spettivamente, ascissa e ordinata). La coppia (a, b) determina allora in modo
unico il punto P: si noti che se a ,= b le coppie (a, b) e (b, a) individuano punti
diversi. In denitiva, il piano si pu`o identicare con il prodotto cartesiano
R
2
= R R. Nel seguito questa identicazione sar`a sistematica.
`
E comodo, anche se per nulla necessario, utilizzare sistemi di riferimento or-
togonali, nei quali cio`e le due direzioni sono perpendicolari fra loro; `e anche
utile (ma talvolta controindicato) scegliere la stessa unit`a di misura per le
ascisse e per le ordinate: si parla allora di coordinate cartesiane ortogonali
monometriche.
61
I punti di R
2
si possono sommare fra loro e moltiplicare per una costante
reale, utilizzandone la rappresentazione in coordinate: se P = (x
P
, y
P
) e
Q = (x
Q
, y
Q
) sono punti di R
2
, la loro somma P +Q `e il punto di coordinate
(x
P
+x
Q
, y
P
+y
Q
); se P = (x
P
, y
P
) R
2
e `e un numero reale, il prodotto
P `e il punto di coordinate (x
P
, y
P
). Scriveremo in particolare P in
luogo di (1)P, e questo permette di denire la sottrazione: P Q signi-
ca P + (1)Q e dunque ha coordinate (x
P
x
Q
, y
P
y
Q
). La somma e la
sottrazione si possono rappresentare gracamente per mezzo della cosiddetta
regola del parallelogrammo.
Per queste operazioni valgono le usuali propriet`a della somma e del prodotto
ordinari (associativit`a, commutativit`a, distributivit`a, eccetera). La possibi-
lit`a di eettuare queste operazioni sui punti del piano denisce in R
2
una
struttura di spazio vettoriale, e per questo i punti di R
2
sono anche detti
vettori.
62
Distanza in R
2
Il passo successivo `e quello di rappresentare, e quindi denire mediante i
numeri reali, le principali propriet`a ed entit`a geometriche. Cominciamo con
la fondamentale nozione di distanza euclidea nel piano.
Denizione 1.11.1 Siano P = (x
P
, y
P
), Q = (x
Q
, y
Q
) due punti di R
2
. La
distanza euclidea fra P e Q `e il numero non negativo
PQ =
_
(x
P
x
Q
)
2
+ (y
P
y
Q
)
2
.
Elenchiamo le propriet`a di cui gade la distanza euclidea:
(i) (positivit`a) PQ 0 e PQ = 0 se e solo se P = Q;
(ii) (simmetria) PQ = QP per ogni P, Q R
2
;
(iii) (disuguaglianza triangolare) PQ PR +RQ per ogni P, Q, R R
2
.
Le propriet`a (i) e (ii) sono ovvie per denizione;
proviamo la (iii). Poniamo, al solito,
P = (x
P
, y
P
), Q = (x
Q
, y
Q
), R = (x
R
, y
R
)
ed anche, per comodit`a,
u = x
P
x
R
, v = y
P
y
R
,
w = x
R
x
Q
, z = y
R
y
Q
.
Dobbiamo dimostrare che
_
(u +w)
2
+ (v +z)
2

u
2
+v
2
+

w
2
+z
2
.
In eetti si ha, utilizzando la disuguaglianza di Cauchy-Schwarz (teorema
1.9.3),
(u +w)
2
+ (v +z)
2
= u
2
+w
2
+v
2
+z
2
+ 2(uw +vz)
u
2
+v
2
+w
2
+z
2
+ 2

u
2
+v
2

w
2
+z
2
=
= (

u
2
+v
2
+

w
2
+z
2
)
2
.
La distanza euclidea ha unaltra fondamentale propriet`a: linvarianza per
traslazioni. Una traslazione `e una trasformazione del piano (cio`e una funzione
63
da R
2
in R
2
) che manda ogni punto P nel punto P + U, ove U `e un ssato
punto di R
2
. Dalla denizione di distanza `e evidente il fatto che
(P +U)(Q+U) = PQ P, Q, U R
2
,
il quale esprime appunto linvarianza per traslazioni della distanza euclidea.
Invece la trasformazione del piano che manda ogni punto P di R
2
nel punto
P, ove `e un ssato numero reale, si dice omotetia; il comportamento della
distanza rispetto alle omotetie `e il seguente:
(P)(Q) = [[PQ P, Q R
2
, R .
La distanza fra due punti `e anche, come suggerisce lintuizione, invariante
rispetto a rotazioni e simmetrie del piano (esercizi 1.11.22 e 1.11.23).
Osservazione 1.11.2 La distanza euclidea PQ fra due punti P e Q coin-
cide, come abbiamo visto, con la distanza di P Q dallorigine O, cio`e con
O(P Q). In luogo di questultima notazione si usa spessissimo la seguente:
[P Q[ = PQ =
_
(x
P
x
Q
)
2
+ (y
P
y
Q
)
2
P, Q R
2
;
se Q = O, si scriver`a pi` u semplicemente [P[ in luogo di [P O[ (si dice che
[P[ `e il modulo del vettore P). Con questa notazione si pu`o scrivere, in modo
pi` u naturale,
[(P +U) (Q+U)[ = [P Q[ P, Q, U R
2
,
[P Q[ = [[ [P Q[ P, Q R
2
, R.
Alla distanza euclidea si associa-
no in modo naturale alcuni spe-
ciali sottoinsiemi del piano: i di-
schi e le circonferenze. Siano P =
(a, b) R
2
e r > 0. Il disco, o
cerchio, di centro P e raggio r `e
linsieme
B(P, r) = X R
2
: [X P[ < r = (x, y) R
2
: (x a)
2
+(y b)
2
< r
2
;
il disco chiuso di centro P e raggio r `e
B(P, r) = X R
2
: [X P[ r = (x, y) R
2
: (x a)
2
+(y b)
2
r
2
;
la circonferenza di centro P e raggio r `e
S(P, r) = X R
2
: [X P[ = r = (x, y) R
2
: (x a)
2
+(y b)
2
= r
2
.
64
Rette
Tutti i sottoinsiemi del piano, in linea di principio, possono essere descritti in
termini delle coordinate dei propri punti, tramite equazioni e disequazioni.
Vediamo come si rappresentano le rette in R
2
.
Se una retta `e orizzontale (parallela allasse x), i suoi punti avranno ordinata
y costante e quindi la retta sar`a descrittadallequazione
y = k,
ove k `e un ssato numero reale. Analogamente, una retta verticale (parallela
allasse y) `e costituita da punti di ascissa costante e quindi la sua equazione
sar`a
x = h
con h ssato numero reale.
Consideriamo ora una retta r obliqua, ossia non parallela agli assi coordinati.
Fissiamo due punti distinti P e Q in r. Siano poi r

la retta per P parallela


allasse x e r

la retta per Q parallela allasse y: tali rette sono perpendicolari


fra loro e quindi si incontrano in un punto T. Il triangolo PTQ `e rettangolo,
di cateti PT e QT.
Se prendiamo due altri punti distinti P

e Q

su r, e ripetiamo la stessa co-


struzione, otteniamo un altro triangolo rettangolo P

, di cateti P

e
Q

, il quale `e simile al precedente. Quindi fra le lunghezze dei rispettivi


cateti vale la proporzione
QT : PT = Q

: P

.
65
Dato che, per costruzione, T = (x
Q
, y
P
) e Q

= (x
Q
, y
P
), la proporzione
sopra scritta diventa, dopo un cambiamento di segno,
y
P
y
Q
x
P
x
Q
=
y
P
y
Q

x
P
x
Q

.
Questa relazione `e valida per ogni coppia P

, Q

di punti (distinti) di r. Ad
esempio, scegliendo P

= P, pensando P sso e facendo variare Q, si ottiene


che
y
P
y
Q
x
P
x
Q
=
y
P
y
Q

x
P
x
Q

Q, Q

r,
ossia il rapporto m =
y
P
y
Q
x
P
x
Q
`e indipendente da Q quando Q varia in r. La
quantit`a m sopra denita si chiama pendenza o coeciente angolare della
retta r. Se la retta `e orizzontale si ha m = 0; se la semiretta (di tale retta)
corrispondente alle y positive forma con la direzione positiva dellasse x un
angolo acuto, si ha m > 0, mentre se tale angolo `e ottuso si ha m < 0. Per
le rette verticali il coeciente angolare non `e denito, ma si suole dire che
esse hanno pendenza innita.
Come abbiamo visto, se X = (x, y) `e un punto di R
2
si ha X r se e solo se
y
P
y
x
P
x
= m;
dunque lequazione cartesiana della retta (obliqua) r `e la seguente:
y y
P
= m(x x
P
),
o anche, posto q = y
P
+mx
P
,
y = mx +q.
Il numero reale q `e lordinata del punto di incontro di r con lasse y.
Riepilogando ed unicando tutti i casi sopra visti, otteniamo che la pi` u
generale equazione cartesiana di una retta `e
ax +by +c = 0
con a, b, c numeri reali tali che a e b non siano entrambi nulli. Se b = 0 la
retta `e verticale (di equazione x =
c
a
), se a = 0 la retta `e orizzontale (di
equazione y =
c
b
), e se a e b sono entrambi non nulli la retta `e obliqua
66
(di equazione y =
a
b
x
c
b
). Notiamo anche che una retta di equazione
ax+by +c = 0 passa per lorigine se e solo se il suo termine noto c `e nullo.
Si noti che lequazione cartesiana di una retta `e unica a meno di un fattore
di proporzionalit`a non nullo: se ,= 0, le equazioni
ax +by +c = 0, ax +by +c = 0
individuano la stessa retta.
Inne, la retta passante per due punti distinti assegnati P e Q ha equazione
(x
Q
x
P
)(y y
P
) = (y
Q
y
P
)(x x
P
)
e, se si sa che x
Q
,= x
P
, si pu`o scrivere
equivalentemente
y y
P
=
y
Q
y
P
x
Q
x
P
(x x
P
).
Semirette, segmenti, semipiani
Se invece di una retta occorre descrivere una semiretta, baster`a delimitare
linsieme di variabilit`a della x o della y: per esempio, la semiretta bisettrice
del primo quadrante (x, y) R
2
: x, y 0 `e descritta dallequazione
y = x, x 0, oppure y = x, x > 0
a seconda che si consideri la semiretta chiusa, ossia comprendente il suo
estremo, oppure aperta, cio`e senza lestremo.
Analogamente, il segmento (chiuso) di estremi P e Qsulla retta r di equazione
ax +by +c = 0 `e descritto (supponendo x
P
< x
Q
) dalle condizioni
ax +by +c = 0, x
P
x x
Q
.
(Se risultasse x
P
> x
Q
si scriver`a invece x
Q
x x
P
; se poi x
P
= x
Q
, sar`a
necessariamente y
P
< y
Q
oppure y
P
> y
Q
e scriveremo allora le limitazioni
y
P
y y
Q
oppure y
Q
y y
P
.)
67
Se il segmento lo si vuole aperto, o semichiuso a destra, o semichiuso a
sinistra, occorrer`a rendere strette una o laltra o entrambe le disuguaglianze.
Se una retta r ha equazione ax + by + c = 0 e se P / r, si ha ovviamente
ax
p
+by
P
+c ,= 0. I due insiemi

+
= (x, y) R
2
: ax +by +c 0,

= (x, y) R
2
: ax +by +c 0
sono i due semipiani (chiusi) delimitati da r (se li si vuole aperti basta met-
tere le disuguaglianze strette). Per disegnarli, basta tracciare la retta r, poi
scegliere un punto P fuori di r e vedere il segno dellespressione ax
P
+by
P
+c:
se `e positivo, il semipiano contenente P sar`a
+
, se `e negativo sar`a

. Ad
esempio, il semipiano
+
relativo alla retta
10x 6y + 7 = 0 `e quello che sta al di
sotto: infatti la retta incontra lasse y nel
punto (0,
7
6
) e quindi lorigine, che appartie-
ne a
+
, sta sotto la retta.
Lintersezione di due rette non parallele `e un
punto, le cui coordinate si ottengono metten-
do a sistema le equazioni delle due rette: il
fatto che le pendenze delle rette siano diverse
garantisce la risolubilit`a del sistema.
Se invece le rette sono parallele, il sistema
avr`a innite soluzioni o nessuna soluzione a
seconda che le rette siano coincidenti o no.
Lintersezione di due semipiani `e un angolo convesso, cio`e minore dellango-
lo piatto; un angolo concavo (maggiore dellangolo piatto) si ottiene invece
facendo lunione di due semipiani. Un triangolo si ottiene intersecando tre
68
(opportuni) semipiani; ogni poligono convesso di n lati si ottiene come inter-
sezione di n semipiani. I poligoni non convessi si realizzano tramite opportune
unioni e intersezioni di semipiani.
Rette e segmenti in forma parametrica
Consideriamo il segmento S di estremi (distinti) A = (x
A
, y
A
) e B = (x
B
, y
B
)
e supponiamo, per ssare le idee, che sia x
A
< x
B
e y
B
,= y
A
. Come sappiamo,
si ha
S =
_
(x, y) R
2
: y y
A
=
y
B
y
A
x
B
x
A
(x x
A
), x [x
A
, x
B
]
_
.
Se P = (x, y) S, si ha, per ragioni di similitudine,
[P A[
[B A[
=
x x
A
x
B
x
A
=
y y
A
y
B
y
A
[0, 1].
Poniamo
t =
[P A[
[B A[
:
poiche P S, si ha t [0, 1]. Le coordinate x, y di P vericano allora
_
x = x
A
+t(x
B
x
A
)
y = y
A
+t(y
B
y
A
).
Quindi ogni P S si rappresenta nella forma sopra descritta, con un oppor-
tuno t [0, 1]. Viceversa, sia P = (x, y) dato dal sistema sopra scritto, per
un certo t [0, 1]: allora si ha
xx
A
x
B
x
A
=
yy
A
y
B
y
A
= t, cosicche P appartiene
alla retta passante per A e B; daltra parte, essendo x x
A
= t(x
B
x
A
),
si ha 0 x x
A
x
B
x
A
, ossia x [x
A
, x
B
]. Pertanto P appartiene al
segmento S.
Il sistema
_
x = x
A
+t(x
B
x
A
)
y = y
A
+t(y
B
y
A
),
t [0, 1]
fornisce le equazioni parametriche del segmento S. Alle stesse equazioni si
perviene, come `e facile vericare, quando x
A
> x
B
(basta scambiare i ruoli
di A e B ed eettuare la sostituzione s = (1 t)), ed anche quando y
A
= y
B
69
(segmento orizzontale) oppure x
A
= x
B
e y
A
,= y
B
(segmento verticale). In
forma vettoriale si pu`o scrivere, in modo equivalente,
S = P R
2
: P = A +t(B A), t [0, 1].
In modo analogo, il sistema
_
x = x
A
+t(x
B
x
A
)
y = y
A
+t(y
B
y
A
),
t R,
ovvero, in forma vettoriale,
P = A +t(B A), t R,
d`a le equazioni parametriche della retta per A e B. Il vettore B A pu`o
essere interpretato come la velocit`a di avanzamento lungo la retta, mentre il
parametro t rappresenta il tempo di percorrenza: allistante t = 0 ci troviamo
in A, allistante t = 1 transitiamo in B, per valori t > 1 ci spingiamo oltre
B mentre per t < 0 siamo dallaltra parte, oltre A.
Parallelismo e perpendicolarit`a
Due rette r, r

sono parallele se e solo se hanno lo stesso coeciente angola-


re, cosicche le rispettive equazioni cartesiane, a parte uneventuale costante
moltiplicativa, dieriscono solamente per il termine noto. Se le rette hanno
equazioni ax + by + c = 0 e a

x + b

y + c

= 0, esse sono parallele se e solo


se il sistema costituito dalle due equazioni non ha soluzioni (in tal caso le
rette sono parallele e distinte) oppure ne ha innite (e allora le due rette
coincidono). Ci`o equivale alla condizione
ab

ba

= 0
(esercizio 1.11.1), la quale esprime appunto il fatto che il sistema costituito
dalle equazioni delle due rette non `e univocamente risolubile.
Se le due rette sono scritte in forma parametrica:
r = X = P +tQ, t R, r

= X = A +tB, t R,
esse risultano parallele se e solo se esiste R 0 tale che Q = B
(esercizio 1.11.13).
Due segmenti PQ, AB, dunque di equazioni parametriche
PQ = X = P+t(QP), t [0, 1], AB = X = A+t(BA), t [0, 1],
70
sono paralleli se le rette che li contengono sono parallele: quindi se e solo se
QP `e proporzionale a B A.
Una retta r `e parallela ad un segmento PQ se `e parallela alla retta che lo
contiene.
Scriviamo ora lequazione cartesiana di una retta r

perpendicolare ad una
retta r assegnata.
`
E chiaro che se r `e orizzontale allora r

`e verticale, e se r `e
verticale allora r

`e orizzontale. Supponiamo r obliqua: se P e Q sono punti


distinti di r, sappiamo che la pendenza di r `e m =
y
P
y
Q
x
P
x
Q
; se ora P

e Q

sono punti distinti di r

, costruiamo i punti T e T

di intersezione delle rette


parallele agli assi passanti rispettivamente per P, Q e per P

, Q

, come si `e
fatto in precedenza. I triangoli rettangoli PTQ e P

sono ancora simili,


ma le coppie di cateti sono scambiate e si ha
QT : PT = P

: Q

,
da cui
y
Q
y
P

x
Q
x
P

=
x
Q
x
P
y
Q
y
P
=
1
m
,
e in denitiva la pendenza di r

`e m

=
1
m
.
Di conseguenza, se r ha equazione del tipo ax + by + c = 0, le rette per-
pendicolari a r hanno equazioni della forma bx + ay + k = 0, con k R
arbitrario.
Vediamo ora come si esprime la perpendicolarit`a fra segmenti. Consideria-
mo due segmenti OP, OQ con un vertice nellorigine O, ove P = (x
P
, y
P
) e
Q = (x
Q
, y
Q
) sono punti distinti e diversi da O. Il fatto che OP sia perpendi-
colare ad OQ si pu`o descrivere in termini di distanza: signica che O, fra tutti
71
i punti della retta r contenente OQ, `e quello situato a minima distanza da P.
Traduciamo questo in termini di coordina-
te: poiche i punti tQ, al variare di t R,
descrivono la retta r, deve aversi
[P[ [P tQ[ t R.
Elevando al quadrato i due membri si ricava,
per denizione di distanza,
x
2
P
+y
2
P
(x
P
tx
Q
)
2
+ (y
P
ty
Q
)
2
=
= x
2
P
+y
2
P
2t(x
P
x
Q
+y
P
y
Q
) +t
2
(x
2
Q
+y
2
Q
) t R,
ovvero
t
2
(x
2
Q
+y
2
Q
) 2t(x
P
x
Q
+y
P
y
Q
) 0 t R.
Ci`o `e possibile se e solo se il discriminante di questo polinomio di secondo
grado `e non positivo: dunque deve essere
(x
p
x
Q
+y
P
y
Q
)
2
0,
ossia
x
P
x
Q
+y
P
y
Q
= 0.
Questa condizione `e pertanto equivalente alla perpendicolarit`a dei segmenti
OP e OQ. Essa dipende solo dalle coordinate di P e di Q: dunque esprime
una propriet`a che riguarda intrinsecamente i punti P e Q, e che `e naturale
prendere come denizione di ortogonalit`a fra vettori di R
2
(e non pi` u fra
segmenti di R
2
).
Denizione 1.11.3 Diciamo che due vettori P = (x
P
, y
P
) e Q = (x
Q
, y
Q
)
di R
2
sono fra loro ortogonali, se i segmenti OP e OQ sono perpendicolari,
ossia se risulta
x
P
x
Q
+y
P
y
Q
= 0.
Due segmenti qualunque PQ e AB sono perpendicolari se e solo se i vettori
QP e B A sono ortogonali, ossia se e solo se
(x
Q
x
P
)(x
B
x
A
) + (y
Q
y
P
)(y
B
y
A
) = 0.
Consideriamo ancora due rette r, r

, scritte stavolta in forma parametrica:


r = X = P +tQ, t R, r

= X = A +tB, t R.
72
Allora la direzione di r `e quella del vettore Q e la direzione di r

`e quella del
vettore B: perci`o esse sono perpendicolari se e solo se Q e B sono vettori
ortogonali, vale a dire se e solo se x
Q
x
B
+y
Q
y
B
= 0.
Supponiamo invece, nuovamente, che r, r

siano scritte in forma cartesiana:


r = (x, y) : ax +by +c = 0, r

= (x, y) : a

x +b

y +c

= 0,
e consideriamo le rette ,

parallele a r ed a r

e passanti per lorigine:


= (x, y) : ax +by = 0,

= (x, y) : a

x +b

y = 0.
Dalla denizione 1.11.3 segue subito che `e linsieme dei vettori che sono
ortogonali al vettore dei suoi coecienti (a, b), mentre

`e, analogamente,
linsieme dei vettori che sono ortogonali a (a

, b

); se ne deduce che e

(e
quindi anche r e r

) sono fra loro perpendicolari se e solo se i vettori (a, b) e


(a

, b

) sono fra loro ortogonali, cio`e se e solo se


aa

+bb

= 0.
Ritroviamo cos` il fatto che le equazioni di r e r

sono, a meno di un fattore


di proporzionalit`a, della forma
r = (x, y) : ax +by +c = 0, r

= (x, y) : bx ay +c

= 0.
Si noti che comunque si ssi U = (u, v) r, la retta r descrive linsieme
dei vettori X = (x, y) tali che X U `e ortogonale al vettore dei coecienti
A = (a, b): infatti, essendo U r si ha c = (au +bv), da cui
(x u)a + (y v)b = ax +by +c = 0.
Esempio 1.11.4 La retta r di
equazione x y = 0 `e la bi-
settrice degli assi coordinati. La
perpendicolare a r passante per
(2, 5) `e la retta r

di equazione
(x + 2) (y 5) = 0, ovvero,
pi` u semplicemente, x + y 3 =
0. La parallela a r passante per
(1, 4) `e la retta r

di equazio-
ne (x + 1) (y + 4) = 0, ossia
x y 3 = 0.
73
Prodotto scalare
In R
2
, oltre alla somma ed al prodotto per scalari, `e denita unaltra ope-
razione fra vettori: il prodotto scalare, che a due vettori assegnati fa cor-
rispondere una quantit`a scalare, vale a dire un numero reale, e che come
vedremo ha un rilevante signicato geometrico.
Denizione 1.11.5 Siano P = (x
P
, y
P
), Q = (x
Q
, y
Q
) punti di R
2
. La
quantit`a
x
P
x
Q
+y
P
y
Q
si chiama prodotto scalare fra P e Q e si indica con P Q.
Le propriet`a del prodotto scalare sono le seguenti: per ogni P, Q, R R
2
si
ha
(i) P P = [P[
2
;
(ii) P Q = Q P;
(iii) (P +Q) R = P R +Q R;
(iv) [P Q[ [P[ [Q[.
Le prime tre propriet`a sono immediata conseguenza della denizione; la quar-
ta `e una riformulazione della disuguaglianza di Cauchy-Schwarz.
Vale anche il seguente sviluppo del binomio:
[P Q[
2
= [P[
2
+[Q[
2
2 P Q P, Q R
2
(esercizio 1.11.8).
Dalla denizione di prodotto scalare e dalla denizione 1.11.3 segue che due
vettori P e Q sono fra loro ortogonali se e solo se P Q = 0.
Ma il signicato geometrico del prodotto scalare non `e tutto qui: data una
retta r per lorigine, di equazione ax+by = 0, il vettore Q = (a, b) appartiene
al semipiano
+
= (x, y) R
2
: ax + by 0, come si verica immedia-
tamente. Poiche il segmento OQ `e perpendicolare alla retta, si deduce che

+
`e linsieme dei vettori P tali che i segmenti OP e OQ formano un angolo
acuto, mentre

= (x, y) R
2
: ax + by 0 `e linsieme dei vettori P
tali che langolo fra i segmenti OP e OQ `e ottuso. Daltra parte, si ha, per
denizione di prodotto scalare,

+
= P R
2
: P Q 0,

= P R
2
: P Q 0;
74
se ne deducono le equivalenze

QOP acuto P Q > 0,

QOP retto P Q = 0,

QOP ottuso P Q < 0.


Distanza di un punto da una retta
Sia r una retta di equazione ax +by +c = 0, e sia U = (x
U
, y
U
) un punto di
R
2
. Vogliamo calcolare la distanza del punto U dalla retta r, ossia il minimo
delle distanze UP al variare di P r; denoteremo tale distanza con d(U, r).
Supponiamo naturalmente U / r, altrimenti la distanza cercata `e 0. Con-
sideriamo la retta r

passante per U e perpendicolare a r: essa intersecher`a


r in un punto Q, le cui coordinate (x, y) si determinano, come sappiamo,
risolvendo il sistema
_
ax +by +c = 0
b(x x
U
) +a(y y
U
) = 0,
`
E facile, anche se un po laborioso, dedurre che
x
Q
=
ac +b
2
x
U
aby
U
a
2
+b
2
, y
Q
=
bc abx
U
+a
2
y
U
a
2
+b
2
.
Dato che la minima distanza UP si ottiene per P = Q, ci baster`a determinare
UQ. Sviluppando con pazienza i calcoli, si trova
UQ
2
= (x
U
x
Q
)
2
+ (y
U
y
Q
)
2
=
=
1
(a
2
+b
2
)
2
_
_
x
U
(a
2
+b
2
) +ac b
2
x
U
+aby
U
_
2
+
+
_
y
U
(a
2
+b
2
) +bc +abx
U
a
2
y
U
_
2
_
=
=
1
(a
2
+b
2
)
2
_
a
2
(ax
U
+by
U
+c)
2
+b
2
(ax
U
+by
U
+c)
2

=
=
(ax
U
+by
U
+c)
2
a
2
+b
2
,
75
da cui
d(U, r) = UQ =
[ax
U
+by
U
+c[

a
2
+b
2
.
Quindi, ad esempio, la distanza del punto (32, 48) dalla retta di equazione
x 2y 99 = 0 `e semplicemente
[32 96 99[

1 + 4
=
163

5
.
Lineare indipendenza
Siano A, B R
2
. Come sappiamo, la somma A+B `e il vettore di componenti
(x
A
+y
A
, x
B
+y
B
), e la sua posizione nel piano si determina mediante la regola
del parallelogrammo, il cui nome deriva dal fatto che nel parallelogrammo di
lati OA e OB il quarto vertice `e A +B. Consideriamo linsieme
M = P R
2
: , R : P = A +B,
che `e il luogo dei quarti vertici di tutti i parallelogrammi costruiti su multipli
dei vettori A e B. Le espressioni A+B, al variare di , R, si chiamano
combinazioni lineari dei vettori A e B: quindi M `e linsieme dei vettori P
che sono combinazioni lineari di A e B.
`
E chiaro che O M: per ottenere O
basta scegliere = = 0. A seconda di come si ssano A e B, pu`o capitare
che questo sia lunico modo di ottenere O, o possono invece esistere altri
valori (non nulli) di e tali che A +B = O.
Denizione 1.11.6 Due vettori A, B di R
2
si dicono linearmente indipen-
denti se ogni combinazione lineare nulla di A e B ha necessariamente en-
trambi i coecienti nulli: in altre parole, se vale limplicazione
A +B = O = = = 0.
I due vettori si dicono linearmente dipendenti se non sono linearmente indi-
pendenti, ossia se esistono , R, non entrambi nulli, tali che A+B =
O.
`
E chiaro che A e B sono linearmente dipendenti se e solo se sono allineati con
lorigine; in questo caso linsieme M coincide con la retta per A e B. Quando
invece A e B non sono allineati con O (e in particolare sono entrambi non
nulli), si pu`o agevolmente mostrare che M = R
2
. Sia infatti P = (x, y) R
2
76
e proviamo che esistono e tali che P = A+B. Questa uguaglianza si
pu`o tradurre nel sistema
_
x
A
+x
B
= x
y
A
+y
B
= y
le cui incognite sono e . Risolvendo si
trovano e :
=
yx
B
xy
B
x
B
y
A
y
B
x
A
, =
xy
A
yx
A
x
B
y
A
y
B
x
A
,
il che dimostra che P M, a patto per`o che risulti x
B
y
A
y
B
x
A
,= 0. Ma
se fosse x
B
y
A
y
B
x
A
= 0, posto C = (y
B
, x
B
) avremmo A C = 0, nonche
B C = 0. Di conseguenza, sia A che B apparterrebbero alla retta di equa-
zione y
B
x +x
B
y = 0, cio`e sarebbero allineati con lorigine: ci`o `e assurdo.
In denitiva, data una qualunque coppia di vettori A, B linearmente indipen-
denti, le combinazioni lineari di tali vettori generano tutto il piano R
2
; in tal
caso ogni P R
2
si pu`o scrivere in uno ed un sol modo come combinazione
lineare di A e B (esercizio 1.11.24).
Esercizi 1.11
1. Dimostrare che il sistema
_
ax +by +c = 0
a

x +b

y +c

= 0
`e risolubile univocamente se e solo se risulta ab

ba

,= 0; in tal caso
se ne scriva la soluzione (x, y).
2. Determinare la retta passante per (2, 1) e perpendicolare alla retta di
equazione 4x 3y + 12 = 0.
3. Determinare la retta passante per (0, 0) e per il centro della circonfe-
renza di equazione x
2
+y
2
2x +y = 0.
4. Si calcoli la distanza del punto (3, 2) dalla retta di equazione 4x
3y + 12 = 0.
5. Si suddivida il segmento di estremi (1, 2) e (2, 1) in quattro parti di
egual lunghezza mediante i tre punti P, Q, R. Si calcolino le coordinate
di tali punti.
77
6. Dati P = (2, 5) e Q = (4, 13), trovare le coordinate di un punto R sul
segmento PQ tale che [P R[ = 2 [QR[.
7. Sia R = (2, 3) il punto medio del segmento PQ, ove P = (7, 5).
Determinare le coordinate di Q.
8. Dimostrare che per ogni P, Q R
2
si ha
[P Q[
2
= [P[
2
+[Q[
2
2 P Q.
9. Provare che il triangolo di vertici (2, 1), (4, 2) e (5, 1) `e isoscele.
10. Provare che il triangolo di vertici (3, 3), (1, 3) e (11, 1) `e rettangolo.
11. Calcolare la lunghezza della mediana uscente dal punto A relativa al
triangolo ABC, ove A = (1, 1), B = (0, 6), C = (10, 2).
12. Scrivere lequazione dellasse del segmento di estremi (0, 2) e (2, 1) (las-
se di un segmento `e il luogo dei punti che sono equidistanti dai vertici
del segmento).
13. Si provi che le rette di equazioni parametriche X = P + tQ, t R e
X = A + sB, s R sono fra loro parallele se e solo se esiste R,
non nullo, tale che Q = B.
14. Si provi che le rette di equazioni ax + by + c = 0 e a

x + b

y + c

= 0
sono fra loro parallele se e solo se esiste R 0 tale che a

= a e
b

= b.
15. Si provi che le rette di equazioni ax+by +c = 0 e a

x+b

y +c

= 0 sono
fra loro perpendicolari se e solo se esiste R 0 tale che a = b

,
b = a

.
16. Si provi che le rette di equazioni X = P + tQ, t R, e ax + by + c =
0 sono fra loro perpendicolari se e solo se i vettori Q e (a, b) sono
proporzionali, e sono parallele se e solo se i vettori Q e (b, a) sono
proporzionali.
78
17. Si considerino i luoghi dei punti di R
2
descritti dalle seguenti equazioni:
(i) x
2
+y
2
1 = 0, (v) x
2
+y
2
+xy = 0,
(ii) x
2
+y
2
= 0, (vi) x
2
y
2
= 0,
(iii) x
2
+y
2
+ 1 = 0, (vii) x
2
+y
2
+ 2x + 2y + 2 = 0,
(iv) x
2
+y
2
+ 2xy = 0, (viii) (x
2
1)
2
+y
2
= 0,
e si riconosca quale delle precedenti equazioni rappresenta:
(a) nessun punto, (d) una retta,
(b) un punto, (e) due rette,
(c) due punti, (f) una circonferenza.
18. Si verichi che ogni angolo convesso `e lintersezione di due semipiani.
19. Si provi che ogni triangolo in R
2
`e lintersezione di tre semipiani.
20. Si provi che ogni quadrilatero in R
2
`e lintersezione di quattro semipiani.
21. Vericare che gli insiemi
A = (x, y) R
2
: [x[ 1, [y[ 1, B = (x, y) R
2
: [x[ +[y[ 1
sono quadrati; determinarne i vertici e le lunghezze dei lati.
22. Siano a, b R tali che a
2
+ b
2
= 1. La funzione R : R
2
R
2
, denita
da
R(x, y) = (, ), = ax +by, = bx +ay,
denisce una rotazione del piano (attorno allorigine). Si provi che:
(i) si ha
2
+
2
= x
2
+y
2
per ogni (x, y) R
2
;
(ii) posto U = R(1, 0), V = R(0, 1), le rette per O, U e per O, V for-
mano un sistema di coordinate ortogonali monometriche orientato
positivamente;
(iii) posto (

) = R(x

, y

), si ha (

)
2
+ (

)
2
= (x x

)
2
+
(y y

)
2
per ogni (x, y), (x

, y

) R
2
.
23. Siano a, b R tali che a
2
+ b
2
= 1. La funzione S : R
2
R
2
, denita
da
S(x, y) = (, ), = ax +by, = bx ay,
denisce una simmetria del piano (rispetto a una retta). Si provi che:
79
(i) si ha
2
+
2
= x
2
+y
2
per ogni (x, y) R
2
;
(ii) posto U = S(1, 0), V = S(0, 1), le rette per O, U e per O, V for-
mano un sistema di coordinate ortogonali monometriche orientato
negativamente;
(iii) posto (

) = S(x

, y

), si ha (

)
2
+ (

)
2
= (x x

)
2
+
(y y

)
2
per ogni (x, y), (x

, y

) R
2
;
(iv) i punti (x, y) della bisettrice dellangolo formato dallasse x e dalla
retta bx ay = 0 soddisfano la relazione S(x, y) = (x, y).
24. Si provi che se A, B sono vettori linearmente indipendenti in R
2
, allora
per ogni P R
2
esiste ununica coppia di numeri reali , tali che
P = A +B.
1.12 Numeri complessi
Una delle possibili motivazioni per ampliare il campo dei numeri reali con lin-
troduzione dei numeri complessi `e il fatto che nellambito di R non `e possibile
risolvere certe equazioni algebriche (cio`e equazioni della forma P(x) = 0, con
P(x) polinomio a coecienti reali e x variabile reale). Ad esempio, lequa-
zione x
2
1 = 0 ha le soluzioni reali x = 1, ma lequazione x
2
+1 = 0 non
`e risolubile in R. Per risolvere questa ed altre equazioni algebriche occorre
dunque aggiungere nuovi numeri allinsieme dei numeri reali: il primo di essi
`e la quantit`a (certamente non reale) che indichiamo con i, a cui attribuiamo
per denizione la propriet`a seguente:
i
2
= 1.
Il numero i `e detto unit`a immaginaria (per pure ragioni storiche: non `e me-
no reale di

2, ne pi` u immaginario di

3). Si osservi allora che lequazione


x
2
+ 1 = 0 ha le soluzioni x = i.
Se per`o vogliamo che anche con laggiunta di questo nuovo numero sia pos-
sibile fare addizioni e moltiplicazioni e restino valide le regole di calcolo vere
in R, dovremo anche aggiungere tutti i numeri che si generano facendo inte-
ragire il numero i con se stesso o con i numeri reali mediante tali operazioni:
dunque nellinsieme allargato di numeri dovremo includere quelli della forma
a +ib (a, b R),
80
ed anche, pi` u generalmente,
a
0
+a
1
i +a
2
i
2
+ +a
n
i
n
(a
0
, a
1
, a
2
, . . . , a
n
R; n N),
cio`e tutti i polinomi P(x) a coecienti reali calcolati nel punto x = i.
Fortunatamente, le regole di calcolo e la denizione di i ci dicono che
i
0
= 1 i
1
= i, i
2
= 1 i
3
= i,
i
4
= 1, i
5
= i, i
6
= 1, i
7
= i,
i
4n
= 1, i
4n+1
= i, i
4n+2
= 1, i
4n+3
= i n N,
e quindi `e suciente prendere polinomi di grado al pi` u 1. In denitiva,
introduciamo linsieme dei numeri complessi C, denito da
C = a +ib : a, b R;
in altre parole, assegnare un numero complesso a + ib equivale ad assegnare
una coppia (a, b) di numeri reali. La quantit`a i, meglio scritta come 0 + i1,
appartiene a C perche corrisponde alla scelta (a, b) = (0, 1).
Introduciamo in C le operazioni di somma e prodotto in modo formalmente
identico a R:
(a +ib) + (c +id) = (a +c) +i(b +d),
(a +ib) (c +id) = ac +iad +ibc +i
2
bd = (ac bd) +i(ad +bc).
Si vede subito che gli assiomi di R relativi a somma e prodotto valgono
ancora; in particolare lelemento neutro per la somma `e 0 + 0i, lelemento
neutro per il prodotto `e 1 + 0i, lopposto di a + ib `e (a) + i(b), ovvero
a ib. Vale la legge di annullamento del prodotto:
(a +ib)(0 +i0) = (a 0 b 0) +i(a 0 +b 0) = 0 +i0 a +ib C.
La corrispondenza che ad ogni numero reale a associa la coppia (a, 0) = a+
i0 `e chiaramente biunivoca tra R e il sottoinsieme di C costituito dalle coppie
con secondo elemento nullo; inoltre essa preserva la somma e il prodotto, nel
senso che (a) + (a

) = (a + a

) e (a)(a

) = (aa

) per ogni a, a

R.
`
E naturale allora identicare le coppie (a, 0) = a + i0 con i corrispondenti
numeri reali a, ottenendo la rappresentazione semplicata a + i0 = a per
ogni a R; analogamente scriveremo ib anziche 0+ib. Si noti che la legge di
annullamento del prodotto in C ci dice che, nelle notazioni semplicate, deve
essere i0 = 0. In questa maniera si pu`o scrivere R C, o pi` u precisamente
R = a +ib C : b = 0.
81
Se a + ib ,= 0 (cio`e `e non nullo a, oppure `e non nullo b, od anche sono non
nulli entrambi), si pu`o agevolmente vericare che il reciproco di a +ib `e
1
a +ib
=
a ib
(a +ib)(a ib)
=
a ib
a
2
i
2
b
2
=
a ib
a
2
+b
2
=
a
a
2
+b
2
i
b
a
2
+b
2
.
In denitiva, in C valgono le stesse propriet`a algebriche di R.
Non altrettanto si pu`o dire delle propriet`a di ordinamento: in C non `e possi-
bile introdurre un ordinamento che sia coerente con le regole di calcolo valide
per R. Infatti, se ci`o fosse possibile, per il numero i si avrebbe i > 0, op-
pure i < 0 (non i = 0, in quanto i
2
= 1): in entrambi i casi otterremmo
1 = i
2
> 0, il che `e assurdo. Per questa ragione non ha senso scrivere disu-
guaglianze tra numeri complessi, ne parlare di estremo superiore o inferiore
di sottoinsiemi di C.
Dal momento che assegnare un numero complesso equivale ad assegnare una
coppia di numeri reali, vi `e una ovvia corrispondenza biunivoca fra C e R
2
,
che associa ad a + ib la coppia (a, b).
`
E naturale allora rappresentare i nu-
meri complessi su un piano cartesiano: il piano complesso, o piano di Gauss.
Lasse delle ascisse `e detto asse reale, quello delle ordinate `e detto asse im-
maginario. Visualizzeremo i numeri complessi z = a + ib C come vettori
di coordinate (a, b); nel seguito faremo sistematicamente uso di questa iden-
ticazione. Essa, fra laltro, ci permette di rappresentare la somma di due
numeri complessi, ed anche il prodotto z, con R e z C, esattamente
come si `e fatto in R
2
(paragrafo 1.11).
Invece la rappresentazione graca del prodotto z w, con z, w C, non ha
un analogo in R
2
; come vedremo, tale rappresentazione sar`a possibile con
luso della forma trigonometrica dei numeri complessi, che introdurremo pi` u
avanti.
Se z = a+ib C, il numero reale a `e detto parte reale di z, mentre il numero
82
reale b `e detto parte immaginaria di z; si scrive
a = Rez, b = Imz,
da cui
z = Rez +i Imz z C.
Se z = a + ib C, il coniugato di z `e il numero complesso z denito da
z = a ib. Si ha quindi
Rez = Rez, Imz = Imz,
cio`e
z = Rez i Imz z C.
Dunque z `e il simmetrico di z rispetto allas-
se reale. Invece, il simmetrico di z rispetto
allasse immaginario `e il numero z.
Invertendo le relazioni di z e z in funzione di Rez e Imz, si ricava
Rez =
z +z
2
, Imz =
z z
2i
,
ed in particolare
z R Imz = 0 z = z = Rez,
z = 0 Rez = Imz = 0.
Vediamo le propriet`a delloperazione di coniugio, la dimostrazione delle quali
`e una semplice verica:
z = z, z +w = z +w, zw = z w,

_
1
z
_
=
1
z
,
_
z
w
_
=
z
w
.
Ad esempio, si ha
i = i, i = i, 1 = 1,
1 = 1, 5 3i = 5 + 3i,
_
1
i
_
=
1
i
= i.
83
Se in C non vi `e un buon ordinamento, c`e per`o il modo di valutare quanto
un numero complesso sia grande: si pu`o misurare la sua distanza, intesa nel
senso di R
2
, dallorigine, cio`e dal punto 0.
Denizione 1.12.1 Il modulo di un numero complesso z = a + ib `e il
numero reale non negativo
[z[ =

a
2
+b
2
=
_
(Rez)
2
+ (Imz)
2
.
Il modulo di z `e dunque la distanza del punto (a, b) R
2
dal punto (0, 0)
R
2
; ovvero, `e la lunghezza del segmento di estremi 0 e z del piano complesso,
cio`e dellipotenusa del triangolo rettangolo di vertici 0, Rez, z. Dalla deni-
zione segue subito, per ogni z C,
[z[ Rez [z[, [z[ Imz [z[.
Si noti che queste sono disuguaglianze
tra numeri reali, non tra numeri com-
plessi!
In particolare, lequazione [z[ = 1 rap-
presenta la circonferenza di centro 0 e
raggio 1 nel piano complesso.
Vediamo le propriet`a del modulo di
numeri complessi:
Proposizione 1.12.2 Risulta per ogni z, w C:
(i) z z = [z[
2
;
(ii) [z[ 0, e [z[ = 0 se e solo se z = 0;
(iii) [z[ = [z[ = [ z[;
(iv) [z[ [w[ = [zw[;
(v) (subadditivit`a) [z +w[ [z[ +[w[;
(vi) [[z[ [w[[ [z w[;
(vii) se z ,= 0, allora

1
z

=
1
[z[
e

w
z

=
[w[
[z[
.
84
Dimostrazione Per (i) si ha
z z = (a +ib)(a ib) = a
2
i
2
b
2
= a
2
+b
2
= [z[
2
.
Le propriet`a (ii) e (iii) sono evidenti.
Proviamo (iv): usando (i) si ha
[zw[
2
= z w z w = (zz) (ww) = [z[
2
[w[
2
,
da cui la tesi estraendo la radice quadrata.
Dimostriamo (v): usando (i) e (iv), si ha
[z +w[
2
= (z +w)(z +w) = zz +wz +zw +ww =
= [z[
2
+ 2Re(zw) +[w[
2
[z[
2
+ 2[zw[ +[w[
2
=
= [z[
2
+[w[
2
+ 2[z[[w[ = ([z[ +[w[)
2
,
da cui la tesi estraendo la radice quadrata.
Per (vi) osserviamo che, grazie a (v), si ha
[z[ = [(z w) +w[ [z w[ +[w[, [w[ = [(w z) +z[ [z w[ +[z[,
cosicche
[z w[ [z[ [w[ [z w[;
ne segue la tesi, per lesercizio 1.9.4.
Proviamo (vii): si ha

1
z

2
=
1
z

_
1
z
_
=
1
zz
=
1
[z[
2
,
da cui la prima uguaglianza; la seconda segue da (iv) e dalla prima.
Il numero
Prima di introdurre la forma trigonometrica dei numeri complessi, conviene
parlare, appunto, di trigonometria. Preliminare a tutta la questione `e il pro-
blema di dare una denizione il pi` u possibile rigorosa del numero reale .
Il nostro punto di partenza sar`a larea dei triangoli, che supponiamo ele-
mentarmente nota (met`a del prodotto base per altezza!), insieme con le sue
basilari propriet`a, e cio`e:
85
se un triangolo `e incluso in un altro triangolo, allora larea del primo `e
non superiore allarea del secondo;
se due triangoli sono congruenti, allora essi hanno la stessa area;
larea di una gura costituita da due triangoli disgiunti o adiacenti `e
pari alla somma delle aree dei due triangoli.
Fissato un intero n 3, consideriamo un poligono regolare T di n lati,
inscritto nel cerchio B(0, 1) del piano complesso. I vertici di T sono numeri
complessi w
0
, w
1
, . . . , w
n1
di modulo unitario. Denotiamo con O, W
i
,W

i
,
Z
i
i punti del piano corrispondenti ai numeri complessi 0, w
i
, w

i
=
w
i
+w
i1
2
,
z
i
=
w
i
+w
i1
|w
i
+w
i1
|
.
Calcoliamo larea a(T) di T: il triangolo OW
i1
W
i
`e isoscele con base W
i
W
i1
e altezza OW

i
; quindi
a(T) =
n

i=1
a(OW
i1
W
i
) =
=
n

i=1
1
2
[w

i
[ [w
i
w
i1
[ =
=
n

i=1
1
4
[w
i
w
i1
[ [w
i
+w
i+1
[.
Invece il perimetro (T) del poligono T `e semplicemente la somma delle
lunghezze dei segmenti W
i1
W
i
: quindi
(T) =
n

i=1
[w
i
w
i1
[.
Si noti che, essendo

w
i
+w
i1
2

< 1, si ha
2a(T) < (T).
Daltra parte, detto T

il poligono regolare inscritto di 2n lati, di vertici w


0
,
z
0
, w
1
, z
1
, . . . , w
n1
, z
n1
, w
n
w
0
, si riconosce facilmente che larea di T

`e data dalla somma delle aree degli n quadrilateri OW


i1
Z
i
W
i
; poiche
a(OW
i1
Z
i
W
i
) = 2a(OZ
i
W
i
) = 2
_
1
2
[w
i
w
i1
[
2
[z
i
[
_
=
1
2
[w
i
w
i1
[,
86
si ottiene
a(T

) =
1
2
(T).
In particolare, si deduce facilmente:
Proposizione 1.12.3 Risulta
supa(T) : T poligono regolare inscritto in B(0, 1) =
=
1
2
sup(T) : T poligono regolare inscritto in B(0, 1).
Consideriamo ora un poligono regolare Q di n lati circoscritto al cerchio
B(0, 1). Indichiamo con v
0
, v
1
, . . . , v
n1
i vertici di Q e con z
0
, z
1
, . . . , z
n1
i
punti in cui Q tocca la circonferenza S(0, 1). Come prima, denotiamo con O,
V
i
, Z
i
i punti del piano corrispondenti ai numeri complessi 0, v
i
, z
i
. Larea
di Q `e data da
a(Q) =
n

i=1
a(OV
i1
V
i
) =
n

i=1
1
2
[z
i
[ [v
i
v
i1
[ =
n

i=1
1
2
[v
i
v
i1
[,
mentre il perimetro di Q `e
semplicemente
(Q) =
n

i=1
[v
i
v
i1
[.
Dunque
a(Q) =
1
2
(Q).
Pertanto:
Proposizione 1.12.4 Risulta
infa(Q) : Q poligono regolare circoscritto a B(0, 1) =
=
1
2
inf(Q) : Q poligono regolare circoscritto a B(0, 1).
Adesso notiamo che per ogni poligono regolare T inscritto in B(0, 1) e per
ogni poligono regolare Q circoscritto a B(0, 1) si ha, evidentemente, T
B(0, 1) Q e quindi a(T) < a(Q). Ci`o mostra che i due insiemi numerici
a(T) : T poligono regolare inscritto in B(0, 1),
87
a(Q) : Q poligono regolare circoscritto a B(0, 1)
sono separati: quindi per lassioma di completezza esiste almeno un elemento
separatore fra i due insiemi. Proveremo adesso che i due insiemi sono anche
contigui, e che quindi lelemento separatore `e in eetti unico.
Proposizione 1.12.5 Per ogni > 0 esistono due poligoni regolari T e Q,
uno inscritto e laltro circoscritto a B(0, 1), tali che
a(Q) a(T) < .
Dimostrazione Fissato n 2,
siano T
n
e Q
n
poligoni regola-
ri di 2
n
lati, il primo inscritto e
il secondo circoscritto al cerchio
B(0, 1). Denotando con v
i
i ver-
tici di T
n
e con v

i
quelli di Q
n
,
possiamo supporre che la posizio-
ne di Q
n
rispetto a T
n
sia tale
che risulti
v

i
|v

i
|
= v
i
per ciascun
vertice.
Allora utilizzando le formule precedenti in questo caso si trova
a(T
n
) = 2
n
[v
i
v
i1
[ [v
i
+v
i1
[
4
, a(Q
n
) = 2
n
[v
i
v
i1
[
[v
i
+v
i1
[
,
da cui
a(Q
n
) a(T
n
) = 2
n
[v
i
v
i1
[ [v
i
+v
i1
[
_
4
[v
i
+v
i1
[
2
1
_
=
= 4a(T
n
)
_
4
[v
i
+v
i1
[
2
1
_
.
Osserviamo adesso che, indicando con
n
la lunghezza del lato del poligono
regolare inscritto T
n
, si ha
n
= [v
i
v
i1
[ e quindi, essendo [v
1
[ = [v
i1
[ = 1,
[v
i
+v
i1
[
2
= 2+2 Re v
i
v
i1
= 2+(2[v
i
v
i1
[
2
) = 4[v
i
v
i1
[
2
= 4
2
n
;
di conseguenza
a(Q
n
) a(T
n
) = 4a(T
n
)

2
n
4
2
n
< a(Q
2
)
4
2
n
4
2
n
.
88
Al crescere di n, il lato
n
`e sempre pi` u piccolo e, in particolare,
inf
n2

n
= 0;
ne segue che, ssato ]0, 4[, esiste 2 sucientemente grande in modo
che
2

< /2 < 2; se ne deduce allora


a(Q

) a(T

) < a(Q
2
)
4
2

4
2

< 4
/2
4 2
= .
Ci`o prova la tesi.
Dalle proposizioni precedenti segue che esiste un unico numero reale, che de-
notiamo con , il quale `e lunico elemento separatore fra linsieme delle aree
di tutti i poligoni regolari inscritti e linsieme delle aree di tutti i poligoni re-
golari circoscritti al cerchio B(0, 1). Si noti che, a maggior ragione, `e anche
lelemento separatore fra linsieme delle aree di tutti i poligoni inscritti (non
necessariamente regolari) e linsieme delle aree di tutti i poligoni circoscritti
al cerchio B(0, 1) (non necessariamente regolari). Ovvie considerazioni geo-
metriche ci inducono a denire larea di B(0, 1) attribuendole il valore . In
altre parole:
Denizione 1.12.6 Il numero reale `e larea del cerchio B(0, 1), ed `e
quindi dato da
= a(B(0, 1)) = supa(T) : T poligono inscritto in B(0, 1) =
= infa(Q) : Q poligono circoscritto a B(0, 1).
Si noti che `e compreso fra 2 e 4 (le aree del quadrato inscritto e di quello
circoscritto).
Dal fatto che larea di un poligono regolare circoscritto al cerchio B(0, 1) `e
la met`a del suo perimetro, anche linsieme dei perimetri dei poligoni regolari
inscritti in B(0, 1) e quello dei perimetri dei poligoni regolari circoscritti a
B(0, 1) hanno un unico elemento separatore, il quale coincide esattamente
con 2 in virt` u della proposizione 1.12.4. A maggior ragione, 2 `e anche
lelemento separatore fra linsieme dei perimetri dei poligoni inscritti (non
necessariamente regolari) e quello dei perimetri dei poligoni circoscritti a
B(0, 1) (non necessariamente regolari). Nuovamente, evidenti considerazio-
ni geometriche ci portano a denire il perimetro della circonferenza S(0, 1)
attribuendole il valore 2. Si ha dunque:
89
Corollario 1.12.7 Il perimetro della circonferenza S(0, 1) `e dato da
(S(0, 1)) = sup(T) : T poligono inscritto in B(0, 1) =
= inf(Q) : Q poligono circoscritto a B(0, 1) = 2.
Osservazione 1.12.8 In modo del tutto analogo, per ogni r > 0 si deni-
scono larea del cerchio B(0, r) come
a(B(0, r)) = supa(T) : T poligono inscritto in B(0, r) =
= infa(Q) : Q poligono circoscritto a B(0, r)
e il perimetro della circonferenza S(0, r) come
(S(0, r)) = sup(T) : T poligono inscritto in B(0, r) =
= inf(Q) : Q poligono circoscritto a B(0, r).
Se T `e un poligono inscritto o circoscritto con
vertici v
i
, e T
r
`e il poligono i cui vertici sono
rv
i
, per ovvie ragioni di similitudine risulta
a(T
r
) = r
2
a(T), (T
r
) = r (T);
pertanto si ha
a(B(0, r)) = r
2
a(B(0, 1)) = r
2
,
(S(0, r)) = r (S(0, 1)) = 2r.
Dunque il cerchio B(0, r) ha area r
2
e perimetro 2r, come era da aspettarsi.
Area dei settori e lunghezza degli archi
Ogni coppia di numeri complessi v, w non nulli individua sulla circonferenza
S(0, 1) due punti, V e W, corrispondenti ai numeri complessi
v
|v|
e
w
|w|
; questi
punti formano con lorigine O due angoli. Prescindendo dallampiezza, attri-
buiamo unorientazione a tali angoli: diciamo che V OW `e positivo se larco
`e percorso da V a W in verso antiorario; diciamo che V OW `e negativo se
larco `e percorso da V a W in verso orario.
`
E chiaro che V OW `e positivo se
e solo se WOV `e negativo.
90
Denotiamo le intersezioni di S(0, 1) con le regioni interne ai due angoli ri-
spettivamente con
+
(v, w) e

(v, w); si tratta evidentemente di due archi:

+
(v, w) va da V a W in verso antiorario, cio`e con orientazione positiva,
mentre

(v, w) va da V a W in verso orario, cio`e con orientazione negati-


va. Agli archi positivamente orientati attribuiremo una lunghezza positiva,
a quelli negativamente orientati una lunghezza negativa. Analogamente, ai
corrispondenti settori circolari

+
(v, w) = z C : z = t, t [0, 1],
+
(v, w),

(v, w) = z C : z = t, t [0, 1],

(v, w),
attribuiremo unarea rispettivamente positiva e negativa.
Notiamo esplicitamente che, per denizione,

(v, w) =

_
v
[v[
,
w
[w[
_
,

(v, w) =

_
v
[v[
,
w
[w[
_
v, w C 0 :
quindi non sar`a restrittivo riferirsi ad archi

(v, w) relativi a numeri v, w C


con [v[ = [w[ = 1.
Fissiamo dunque v, w S(0, 1). Considereremo linee spezzate inscritte o cir-
coscritte a
+
(v, w). Una linea spezzata `e formata da una sequenza nita
ordinata di vertici e dai segmenti che li congiungono; ci limiteremo a spez-
zate con primo vertice v e ultimo vertice w. Una tale spezzata `e inscritta in

+
(v, w) se tutti i suoi vertici appartengono a
+
(v, w); `e invece circoscritta
se tutti i suoi vertici, tranne il primo e lultimo, sono esterni a B(0, 1) e tutti i
suoi segmenti sono tangenti esternamente a
+
(v, w), ossia toccano tale arco
senza attraversarlo. Considereremo anche i settori
P
associati a spezzate
91
P inscritte o circoscritte: detti v
0
v, v
1
, . . . , v
n1
, v
n
w i vertici di P,
il settore
P
`e lunione degli n triangoli OV
i1
V
i
(ove al solito O, V
i
sono i
punti del piano corrispondenti ai numeri complessi 0, v
i
).
Ci`o premesso, con considerazioni analoghe a quelle svolte per il cerchio
B(0, 1) e per la circonferenza S(0, 1), si ottiene che
supa(
P
) : P spezzata inscritta in
+
(v, w) =
=
1
2
sup(P) : P spezzata inscritta in
+
(v, w) =
=
1
2
inf(Q) : Q spezzata circoscritta a
+
(v, w) =
= infa(
Q
) : Q spezzata circoscritta a
+
(v, w).
Siamo cos` indotti alla seguente
Denizione 1.12.9 Siano v, w C 0. La lunghezza dellarco positiva-
mente orientato
+
(v, w) `e il numero reale non negativo
(
+
(v, w)) = sup(P) : P spezzata inscritta in
+
(v, w) =
= inf(Q) : Q spezzata circoscritta a
+
(v, w).
Larea del settore positivamente orientato
+
(v, w) `e il numero reale non
negativo
a(
+
(v, w)) = supa(
P
) : P spezzata inscritta in
+
(v, w) =
= infa(
Q
) : Q spezzata circoscritta a
+
(v, w) =
=
1
2
(
+
(v, w)).
La lunghezza dellarco negativamente orientato

(v, w) `e il numero reale


non positivo
(

(v, w)) = 2 +(
+
(v, w)).
Larea del settore negativamente orientato

(v, w) `e il numero reale non


positivo
a(

(v, w)) = +a(


+
(v, w)).
Una fondamentale propriet`a delle lunghezze e delle aree sopra denite `e la
loro additivit`a. A questo proposito vale la seguente
92
Proposizione 1.12.10 Siano v, w, z C 0. Se
z
|z|

+
(v, w), allora
(
+
(v, w)) = (
+
(v, z)) +(
+
(z, w)),
a(
+
(v, w)) = a(
+
(v, z)) +a(
+
(z, w)).
Dimostrazione Fissiamo > 0. Per denizione, esistono due spezzate
P, P

, luna inscritta in
+
(v, z) e laltra inscritta in
+
(z, w), tali che
(
+
(v, z)) < (P) (
+
(v, z)), (
+
(z, w)) < (P

) (
+
(z, w)),
Detta P

la spezzata i cui vertici sono tutti quelli di P seguiti da tutti quelli


di P

, `e chiaro che P

`e inscritta in
+
(v, w); inoltre si ha (P) + (P

) =
(P

) (
+
(v, w)). Quindi
(
+
(v, z)) +(
+
(z, w) 2 < (P

) (
+
(v, w)).
Larbitrariet`a di prova che
(
+
(v, z)) +(
+
(z, w) (
+
(v, w)).
Per provare la disuguaglianza inversa, sia > 0 e sia P una spezzata inscritta
a
+
(v, w) tale che
(
+
(v, w)) < (P) (
+
(v, w)).
Se la spezzata P non ha come vertice il punto z, esisteranno due vertici
consecutivi v
i1
, v
i
tali che z
+
(v
i1
, v
i
); allora, sostituendo al segmento
V
i1
V
i
i due segmenti V
i1
Z e ZV
i
, si ottiene una nuova spezzata P

inscritta
a
+
(v, w) tale che (P

) > (P). Inoltre tale spezzata `e lunione di due


spezzate P

e P

, luna formata da tutti i vertici fra v e z (inclusi) e inscritta


in
+
(v, z), laltra formata da tutti i vertici fra z e w (inclusi) e inscritta in

+
(z, w). Si ha allora
(
+
(v, w)) < (P) < (P

) = (P

) +(P

) (
+
(v, z)) +(
+
(z, w)).
Nuovamente, larbitrariet`a di prova che
(
+
(v, w)) (
+
(v, z)) +(
+
(z, w)).
La prima parte della tesi `e provata. La seconda parte segue subito ricordando
che larea di un settore `e la met`a della lunghezza dellarco corrispondente.
93
Corollario 1.12.11 Se v, w
+
(1, i), allora
[v w[ < [(
+
(1, v)) (
+
(1, w))[

2[v w[.
Dimostrazione Anzitutto notiamo che si ha v
+
(1, w) oppure w

+
(1, v); se siamo ad esempio nel secondo caso, allora per la proposizione
1.12.10
(
+
(1, v)) (
+
(1, w)) = (
+
(w, v)),
cosicche la prima disuguaglian-
za `e banale. Per provare la se-
conda, denotiamo, al solito, con
O, V, W, Z i punti corrispondenti
ai numeri complessi 0, v, w, v +w,
e tracciamo la bisettrice dellan-
golo V OW; sia U il punto di in-
tersezione delle perpendicolari ai
segmenti OV e OW condotte da
V e W rispettivamente. La spez-
zata P di vertici V, U, W `e allo-
ra circoscritta a
+
(v, w) e la sua
lunghezza `e
(P) = [v u[ +[u w[ = 2[u v[ = 2
[v w[
[v +w[
;
ma poiche [v + w[ `e la lunghezza della diagonale maggiore OZ del rombo
OV ZW, tale quantit`a `e certamente non inferiore a

2 (la diagonale del


quadrato di lato OV ). Si ottiene allora
(
+
(v, w)) (P)

2[v w[.
Il corollario appena dimostrato ci permette di enunciare il seguente fonda-
mentale risultato, che `e conseguenza dellassioma di completezza di R.
Teorema 1.12.12 Per ogni [0, 2[ esiste un unico numero complesso
w, di modulo unitario, tale che
(
+
(1, w)) = 2a(
+
(1, w)) = .
La funzione g(w) = (
+
(1, w)) `e bigettiva da S(0, 1) in [0, 2[ ed `e surgettiva
da C0 in [0, 2[. Se w C0, il numero = (
+
(1, w)) si dice misura
in radianti dellangolo individuato dai punti 0, 1,
w
|w|
.
94
Dimostreremo il teorema 1.12.12 pi` u
avanti nel corso, utilizzando la teoria
delle funzioni continue.
Un radiante `e quindi, per denizione,
la misura dellunico angolo (orientato
in verso antiorario) il cui corrisponden-
te arco della circonferenza unitaria ha
lunghezza 1; un angolo misura ra-
dianti se e solo se larco corrispondente
su S(0, 1) ha lunghezza e il settore
corrispondente ha area

2
.
In particolare, allora, langolo piatto misura (radianti), langolo retto

2
, langolo sotteso da un lato del poligono regolare di N lati misura
2
N
;
il segno davanti alla misura dipende dal verso di rotazione.
Naturalmente, facendo pi` u di un giro in verso antiorario le aree e le lunghezze
darco crescono di 2, 4, eccetera, mentre se il verso `e orario esse decrescono
di 2, 4, eccetera. Daltra parte dopo una rotazione di + 2k, con
k intero arbitrario, lestremo dellarco `e lo stesso di quello relativo ad una
rotazione di : ad ogni w C 0 corrispondono dunque le innite misure
+ 2k, k Z. Possiamo allora dare la seguente
Denizione 1.12.13 Sia w C0, e sia [0, 2[ la misura in radianti
dellarco
+
(1, w). Ognuno degli inniti numeri + 2k, k Z, si chiama
argomento del numero complesso w e si denota con arg w; il numero , cio`e
lunico fra gli argomenti di w che appartiene a [0, 2[, si chiama argomento
principale di w.
Si osservi che arg w denota uno qualsiasi degli inniti argomenti di w, quindi
`e una quantit`a denita a meno di multipli interi di 2.
Funzioni trigonometriche
Sulla base del teorema 1.12.12 e della conseguente denizione 1.12.13, siamo
in grado di introdurre le funzioni trigonometriche. Infatti, ssato [0, 2[,
tale risultato ci permette di scegliere w C 0 tale che arg w = ; in
particolare,
w
|w|
`e lunico elemento di S(0, 1) il cui argomento `e , cio`e che
verica
l
_

+
_
1,
w
[w[
__
= 2a
_

+
_
1,
w
[w[
__
= .
95
Le coordinate di
w
|w|
, vale a dire Re
w
|w|
e Im
w
|w|
, sono quindi funzioni di . Ha
senso perci`o la seguente denizione delle funzioni coseno e seno:
Denizione 1.12.14 Per ogni [0, 2[ si pone
cos = Re
w
[w[
, sin = Im
w
[w[
,
ove w C0 `e un qualsiasi nu-
mero complesso tale che arg w =
.
In particolare, un generico nume-
ro complesso non nullo w si pu`o
scrivere in forma trigonometrica:
w = (cos +i sin ),
ove = [w[ e = arg w.
Poiche ad un numero complesso z di argomento principale [0, 2[ corri-
spondono anche gli argomenti +2k, occorre che le funzioni coseno e seno
siano periodiche di periodo 2: esse cio`e devono vericare le relazioni
cos( + 2) = cos , sin( + 2) = sin R.
Immediata conseguenza della denizione sono poi le seguenti propriet`a:
[ cos [ 1, [ sin [ 1, cos
2
+ sin
2
= 1 R.
Poiche i punti z e z sono simmetrici rispet-
to allasse reale, ad essi corrispondono angoli
opposti: dunque il seno ed il coseno di angoli
opposti devono vericare
cos () = Re
z
[z[
= Re
z
[z[
= cos ,
sin () = Im
z
[z[
= Im
z
[z[
= sin .
96
Si verica poi facilmente, utilizzando le simmetrie illustrate nelle gure sot-
tostanti, che
cos
_

2

_
= sin , sin
_

2

_
= cos R,
cos
_

2
+
_
= sin , sin
_

2
+
_
= cos R,
cos ( ) = cos , sin ( ) = sin R,
cos ( +) = cos , sin ( +) = sin R.
Pi` u in generale si ha:
Proposizione 1.12.15 Per ogni , R valgono le formule di addizione
cos ( ) = cos cos + sin sin ,
cos ( +) = cos cos sin sin ,
sin ( ) = sin cos cos sin ,
sin ( +) = sin cos + cos sin .
97
Dimostrazione Siano z, w numeri complessi di modulo 1, con arg z = e
arg w = : ci`o signica che nel piano il punto z ha coordinate (cos , sin )
mentre il punto w ha coordinate (cos , sin ). Calcoliamo la quantit`a [zw[
2
:
si ha
[z w[
2
= (cos cos )
2
+ (sin sin )
2
.
Daltra parte, [z w[ rappresenta la lunghezza del segmento di estremi z e w,
quindi tale quantit`a non cambia se cambiamo sistema di riferimento. Sceglia-
mo due nuovi assi ortogonali x

, y

tali che la semiretta positiva dellasse x

coincida con la semiretta uscente da 0 che contiene w. Dato che [z[ = [w[ = 1,
le coordinate di w in questo nuovo sistema sono (1, 0) mentre quelle di z sono
(cos ( ), sin ( )). Pertanto
[z w[
2
= (cos ( ) 1)
2
+ (sin ( ))
2
.
Confrontando fra loro le due espressioni e svolgendo i calcoli, si ricava facil-
mente la prima uguaglianza.
La seconda uguaglianza segue dalla prima scambiando con :
cos ( ()) = cos cos () + sin sin () = cos cos sin sin .
Per la terza e quarta uguaglianza si osservi che, per quanto gi`a provato,
sin ( ) = cos
_
+

2
_
=
= cos
_
+

2
_
cos sin
_
+

2
_
sin =
= sin cos cos sin ,
98
sin ( +) = cos
_
+ +

2
_
=
= cos
_
+

2
_
cos + sin
_
+

2
_
sin =
= sin cos + cos sin .
I graci delle funzioni coseno e seno sono illustrati qui sotto.
Si noti che il graco del seno si ottiene da quello del coseno mediante una tra-
slazione di +

2
lungo lasse x, dato che, come sappiamo, cos = sin ( +

2
).
Osservazione 1.12.16 Ovvie considerazioni di similitudine implicano che,
poiche il generico punto di S(0, 1) corrisponde al numero complesso cos +
i sin , al generico punto di S(0, r) corrisponder`a il numero r cos +ir sin .
Completiamo queste brevi note
di trigonometria introducendo la
funzione tangente.
Denizione 1.12.17 Se R
e ,=

2
+k, k Z, poniamo
tan =
sin
cos
.
Questa funzione non `e denita nei
punti dove si annulla il coseno, ed
`e periodica di periodo ; il suo
graco `e riportato qui accanto.
99
Vale questa importante disuguaglianza:
Proposizione 1.12.18 Risulta
cos x <
sin x
x
< 1 x
_

2
,

2
_
0;
di conseguenza si ha
sup
nN
+
sin
a
n
a
n
= 1 a R 0.
Dimostrazione Fissiamo x

0,

2
_
e siano O lorigine ed E, B i punti
corrispondenti ai numeri 1 e cos x +i sin x; sia poi T il punto di incontro tra
la perpendicolare ad OE passante per E ed il prolungamento di OB, e H il
punto dincontro con OE della perpendicolare ad OE passante per B. Dato
che i triangoli OHB e OET sono simili, si ha
[H[ : [E[ = [B H[ : [T E[,
da cui
[T E[ =
[B H[ [E[
[H[
=
sin x
cos x
= tan x.
Daltra parte, il triangolo OEB `e contenuto nel settore di vertici O,E,B il
quale a sua volta `e contenuto nel triangolo OET: ne segue, calcolando le tre
aree,
1
2
sin x <
1
2
x <
1
2
tan x,
da cui la tesi quando x

0,

2
_
.
Se x

2
, 0
_
, per quanto gi`a visto si ha
cos x = cos (x) <
sin (x)
x
< 1;
dato che
sin (x)
x
=
sin x
x
, si ha la tesi anche in questo caso. Inne, se x =

2
la tesi `e banale.
Sia ora a > 0. Essendo
0 1 cos
2
a
n
= sin
2
a
n
<
a
2
n
2
n N
+
,
100
si ottiene (dato che cos
a
n
> 0 per n >
2a

)
1 sup
nN
+
sin
a
n
a
n
sup
nN
+
cos
a
n
sup
n>2a/
_
1
a
2
n
2
_1
2
= 1.
Seno e coseno in coordinate
Fissiamo due punti P, Q R
2
, diversi dallorigine O. Consideriamo langolo
convesso

POQ, orientato da P a Q: la sua ampiezza, misurata in radian-
ti, `e un numero
PQ
[, ]. Vogliamo esprimere i numeri reali cos
PQ
,
sin
PQ
, che denoteremo direttamente con cos

POQ e sin

POQ, in termini
delle coordinate di P e Q.
Supponiamo dunque P = (x
P
, y
P
) e Q =
(x
Q
, y
Q
), e poniamo per comodit`a E = (1, 0).
Siano
P
e
Q
le misure in radianti degli an-
goli convessi orientati

EOP,

EOQ; `e facile
vericare che risulta

PQ
=
_

P
se [
Q

P
[ < ,

P
+ 2 se
Q

P
,

P
2 se
Q

P
.
Di conseguenza, utilizzando le formule di addizione (proposizione 1.12.15), si
ottiene
cos

POQ = cos (
Q

P
) =
= cos
Q
cos
P
+ sin
Q
sin
P
=
101
=
x
Q
_
x
2
Q
+y
2
Q
x
P
_
x
2
P
+y
2
P
+
y
Q
_
x
2
Q
+y
2
Q
y
P
_
x
2
P
+y
2
P
,
sin

POQ = sin (
Q

P
) =
= sin
Q
cos
P
cos
Q
sin
P
=
=
y
Q
_
x
2
Q
+y
2
Q
x
P
_
x
2
P
+y
2
P

x
Q
_
x
2
Q
+y
2
Q
y
P
_
x
2
P
+y
2
P
.
Queste sono le espressioni del coseno e del seno che cercavamo. Si noti che,
di conseguenza,
cos

POQ =
P Q
[P[ [Q[
, sin

POQ =
1
[P[ [Q[
det
_
x
P
x
Q
y
P
y
Q
_
,
ove il determinante della matrice
_
a
b
_
`e, per denizione, il numero a b.
Vale allora la seguente importante
Proposizione 1.12.19 Siano P, Q R
2
O.
(i) Risulta
P Q = [P[ [Q[ cos

POQ;
(ii) detto T il parallelogrammo di vertici O, P, Q e P +Q, la sua area a(T)
`e data da
a(T) = [P[ [Q[ [ sin

POQ[ = [x
P
y
Q
y
P
x
Q
[.
Dimostrazione (i) Segue dai discorsi precedenti.
(ii) La base di T misura [P[ e la sua altezza misura [Q[ sin [

POQ[; poiche
[

POQ[ , si ha sin [

POQ[ = [ sin

POQ[, da cui la tesi.
Se ne deduce immediatamente:
Corollario 1.12.20 Se P, Q R
2
, il triangolo T di vertici O, P, Q ha area
a(T ) =
1
2
[x
P
y
Q
y
P
x
Q
[.
102
Naturalmente, per traslazione si vede
che, se P, Q, R sono punti di R
2
, larea
del triangolo T di vertici P, Q, R `e data
da
a(T ) =
1
2

det
_
x
Q
x
P
x
R
x
P
y
Q
y
P
y
R
y
P
_

.
Forma trigonometrica dei numeri complessi
Se z = a + ib `e un numero complesso non nullo, esso pu`o essere individua-
to, oltre che dalle sue coordinate cartesiane (a, b), anche per mezzo del suo
modulo e del suo argomento (denizione 1.12.13): infatti, ricordando la de-
nizione 1.12.14, posto = [z[ e = arg z vale la relazione
z = (cos +i sin ).
Questa `e la scrittura di z in forma tri-
gonometrica. Si noti che, noti e , si
ha
_
a = cos
b = sin ,
mentre, noti a e b, si ha
=

a
2
+b
2
,
_
cos =
a

sin =
b

,
il che equivale, come `e giusto, a determinare a meno di multipli interi di
2.
La forma trigonometrica dei numeri complessi `e utile per rappresentare geo-
metricamente il prodotto in C. Siano infatti z, w C: se uno dei due numeri
`e 0, allora il prodotto fa 0 e non c`e niente da aggiungere. Se invece z, w sono
entrambi non nulli, scrivendoli in forma trigonometrica,
z = (cos +i sin ), w = r(cos +i sin ),
otteniamo che
zw = r(cos +i sin )(cos +i sin ) =
103
= r[(cos cos sin sin ) +i(sin cos + cos sin )] =
= r[cos ( +) +i sin ( +)].
Dunque zw `e quel numero complesso che ha per modulo il prodotto dei
moduli e per argomento la somma degli argomenti. In particolare si ha la
formula
arg (zw) = arg z + arg w + 2k, k Z.
Ovviamente si ha anche
zw = r[cos ( ) +i sin ( )];
scelto poi w = z, troviamo
z
2
= r
2
(cos 2 +i sin 2),
e pi` u in generale vale la formula di de Moivre:
z
n
= r
n
(cos +i sin )
n
= r
n
(cos n +i sin n) R, n N.
Da questa formula, utilizzando lo sviluppo di Newton per il binomio (valido
ovviamente anche in campo complesso, trattandosi di una relazione algebrica)
`e possibile dedurre delle non banali relazioni trigonometriche che esprimono
sin n e cos n in termini di sin e cos (esercizio 1.12.13).
Altre formule trigonometriche, che seguono facilmente dalle formule di addi-
zione, sono illustrate negli esercizi 1.12.6, 1.12.7 e 1.12.8.
Radici n-sime di un numero complesso
Fissato w C, vogliamo trovare tutte le soluzioni dellequazione z
n
= w
(con n intero maggiore di 1). Ricordiamo che proprio lesigenza di risolvere
le equazioni algebriche ci ha motivato ad introdurre i numeri complessi.
Se w = 0, naturalmente lunica soluzione `e z = 0; se w ,= 0, risulta ancora
utile usare la forma trigonometrica. Scriviamo w = r(cos + i sin ), e sia
z = (cos +i sin ) lincognita: anche sia z
n
= w bisogner`a avere

n
= r (uguagliando i moduli),
n = + 2k, k Z (uguagliando gli argomenti),
cio`e
_
= r
1
n
(radice n-sima reale positiva)
=
+2k
n
, k Z.
104
Sembra dunque che vi siano innite scelte per , cio`e innite soluzioni z.
Per`o, mentre le prime n scelte di k (k = 0, 1, . . . , n 1) forniscono n valori
di compresi fra 0 e 2 (ossia
0
=

n
,
1
=
+2
n
, . . . ,
n1
=
+2(n1)
n
), le
scelte k n e k 1 danno luogo a valori di che si ottengono da quelli
gi`a trovati traslandoli di multipli interi di 2: infatti

n
=
+ 2
n
=
0
+ 2,
n+1
=
+ 2(n + 1)
n
=
1
+ 2,
ed in generale per j = 0, 1, . . . , n 1

mn+j
=
+ 2(mn +j)
n
=
j
+ 2m m Z.
In denitiva, le innite scelte possibili per forniscono solo n scelte distinte
per z, e cio`e
z
j
= r
1
n
_
cos
+ 2j
n
+i sin
+ 2j
n
_
, j = 0, 1, . . . , n 1.
Quindi ogni numero complesso
w ,= 0 ha esattamente n radici
n-sime distinte z
0
, z
1
, . . . , z
n1
che sono tutte e sole le soluzioni
dellequazione z
n
= w. I nume-
ri z
0
, . . . ,z
n1
giacciono tutti sul-
la circonferenza di centro 0 e rag-
gio [w[
1
n
; ciascuno forma un an-
golo di
2
n
con il precedente, co-
sicche essi sono i vertici di un po-
ligono regolare di n lati inscritto
nella circonferenza.
Largomento del primo vertice z
0
si trova dividendo per n largomento princi-
pale di w, cio`e lunico che sta in [0, 2[. Se, in particolare, w `e reale positivo,
si avr`a arg z
0
=
1
n
arg w = 0, quindi z
0
`e reale positivo ed `e la radice n-sima
reale positiva di w. Dunque, se w `e reale positivo, la sua radice n-sima reale
positiva w
1
n
`e una delle n radici n-sime complesse di w (e tra queste ci sar`a
anche w
1
n
se n `e pari).
105
Esercizi 1.12
1. Calcolare le quantit`a
(1 i)
24
,
_
1
i
_
67
,
_
1 +i
1 i
_
45
,
_
i + 2i
1 2i
_
5
,
1 +i
[1 +i[
.
2. Quanti gradi sessagesimali misura un angolo di 1 radiante?
3. Calcolare le aree del poligono regolare di n lati inscritto nella circonfe-
renza di raggio 1 e di quello circoscritto alla medesima circonferenza.
4. Dimostrare che:
(i) (

(v, w)) = (
+
(w, v)) per ogni v, w C 0;
(ii) (

(1, w)) = (
+
(1, w) per ogni w C 0;
(iii) (
+
(i, w)) = (
+
(1, iw)) per ogni w
+
(i, 1);
(iv) (
+
(1, w)) = (
+
(1, w)) per ogni w
+
(1, 1).
5. Completare la seguente tabella:
x 0

6

2
2
3
3
4
5
6
cos x
sin x
tan x
x
7
6
5
4
4
3
3
2
5
3
7
4
11
6
cos x
sin x
tan x
106
6. Dimostrare le formule di bisezione:
cos
2
x
2
=
1 + cos x
2
, sin
2
x
2
=
1 cos x
2
x R.
7. Dimostrare le formule di duplicazione:
cos 2x = cos
2
x sin
2
x, sin 2x = 2 sin x cos x x R.
8. (i) Dimostrare le formule di Werner:
_

_
sin ax sin bx =
1
2
[cos(a b)x cos(a +b)x]
cos ax cos bx =
1
2
[cos(a b)x + cos(a +b)x]
sin ax cos bx =
1
2
[sin(a b)x + sin(a +b)x].
a, b, x R.
(ii) Dedurre le formule di prostaferesi:
_

_
cos + cos = 2 cos
+
2
cos

2
cos cos = 2 sin
+
2
sin

2
sin + sin = 2 sin
+
2
cos

2
sin sin = 2 cos
+
2
sin

2
.
, R.
9. Provare che
[ cos cos [ [ [, [ sin sin [ [ [ , R.
10. Dimostrare le relazioni
tan( +) =
tan +tan
1tan tan
, tan( ) =
tan tan
1+tan tan
,
tan
2
2
=
1cos
1+cos
, tan 2 =
2 tan
1tan
2

per tutti gli , R per i quali le formule hanno senso.


11. Dimostrare che se R (2k + 1)
kZ
si ha
sin =
2 tan

2
1 + tan
2
2
cos =
1 tan
2
2
1 tan
2
2
.
107
12. Provare che
tan + tan =
sin(+)
cos cos
, tan tan =
sin()
cos cos
,
1
tan
+
1
tan
=
sin(+)
sin sin
,
1
tan

1
tan
=
sin()
sin sin
per tutti gli , R per i quali le formule hanno senso.
13. Utilizzando la formula del binomio, dimostrare che per ogni R e
per ogni n N
+
si ha
cos n =
[
n
2
]

h=0
_
n
2h
_
(1)
h
sin
2h
cos
n2h
,
sin n =
[
n1
2
]

h=0
_
n
2h + 1
_
(1)
h
sin
2h+1
cos
n2h1
,
ove [x] denota la parte intera del numero reale x, cio`e [x] = maxk
Z : k x.
14. Dimostrare che
1
2
+
N

n=1
cos nx =
sin
_
N +
1
2
_
x
2 sin
x
2
x R 0, N N
+
.
[Traccia: usare le formule di Werner con a =
1
2
e b = n.]
15. Calcolare:
cos

12
, sin
5
12
, tan

8
, cos
5
8
, sin
7
8
, tan
11
12
.
16. (Teorema di Carnot) Sia ABC un triangolo. Detto langolo opposto
al vertice A, si provi che
a
2
= b
2
+c
2
2bc cos .
17. (Teorema dei seni) Sia ABC un triangolo. Detti , e gli angoli
opposti ai vertici A, B e C, si provi che
a
sin
=
b
sin
=
c
sin
.
108
18. Risolvere le equazioni:
(i) 3 sin x

3 cos x = 0, (ii) sin x + (2 +

3) cos x = 1,
(iii) 2 sin
2
x sin x = 1, (iv) sin
4
x 4 sin
2
x cos
2
x + 3 cos
4
x = 0,
(v) sin x + 3[ sin x[ = 2, (vi) cos
4
x 4 sin
2
x cos
2
x + 3 sin
4
x = 0.
19. Risolvere le disequazioni:
(i) sin x <
1
2
, (ii) 4 sin x tan x
3
cos x
> 0,
(iii) cos x >
1

2
, (iv)
_
tan x >

3
sin x >
1
2
,
(v)

2 sin x 1

2 sin x + 1
> 0, (vi) sin x + (

2 1) cos x >

2 1.
20. Determinare larea dei triangoli di vertici:
(i) (0, 0), (2, 5), (4, 2), (ii) (1, 1), (2, 6), (1, 3).
21. Scrivere in forma trigonometrica i numeri complessi:
1 +i, 3 3i,

2,

3 +i, 1 +

3i,
1 i

3 i
,
7
1 +i
.
22. Calcolare:
(i) le radici seste di 1; (ii) le radici quadrate di i;
(iii) le radici quarte di 1 +

3i; (iv) le radici ottave di i.


23. Dimostrare che se z R le radici n-sime di z sono a due a due coniugate.
24. Siano z
1
, . . . , z
n
le radici n-sime di 1 che sono diverse da 1. Provare che
tali numeri sono le soluzioni dellequazione
n1

k=0
z
k
= 0.
109
25. Provare che la somma delle n radici n-sime di un qualunque numero
complesso z `e uguale a 0.
26. Risolvere in C le seguenti equazioni:
(i) z
4
2iz
2
+ 3 = 0, (ii) z
4
= z
3
,
(iii) z
3
izz, (iv) z[z[ 2Rez = 0,
(v) [z + 2[ [z 2[ = 2, (vi) z
3
= arg z +

6
,
(vii) z[z[
2
+[z[z
2
zz
2
= 1, (viii) z
2
= i[z[

2,
(ix) [z
2
+ 1[
2
+[z
2
1[
2
= 8z
2
6, (x) z +[z[ = 3i + 2,
(xi) z
5
iz
3
z = 0, (xii) z
6
= arg z + arg z
2
.
27. Risolvere in C i seguenti sistemi:
(i)
_
[z
2
+ 1[ = 1
Rez =
1
2
[z[
2
,
(ii)
_
zw
2
= 1
z
2
+w
4
= 2,
(iii)
_
[z +i 1[ = 2
[z[
2
3[z[ + 2 = 0,
(iv)
_
z
2
w
3
= 1 +i
z
4
[w[
2
= 3i,
(v)
_
z
2
w = i 1
[z[w
2
+ 2z = 0,
(vi)
_
z
3
w
3
1 = 0
z
2
w + 1 = 0.
28. Si provi che se z
1
, z
2
, z
3
C, se [z
1
[ = [z
2
[ = [z
3
[ = 1 e z
1
+z
2
+z
3
= 0,
allora i punti z
1
, z
2
, z
3
sono i vertici di un triangolo equilatero. Cosa
succede nel caso di quattro punti soggetti ad analoghe condizioni?
29. Provare che larea del triangolo di vertici 0, z, w `e data da
1
2
Im(zw).
[Traccia: ridursi con una rotazione al caso arg w = 0.]
30. Provare che le equazioni della forma
z +z +c = 0, C, c R,
rappresentano le rette nel piano complesso.
31. Provare che le equazioni della forma
[z[
2
z z +c = 0, C, c R, c < [[
2
,
rappresentano le circonferenze nel piano complesso.
110
32. Siano a, b C: disegnare il luogo dei numeri z C tali che
[z a[ >
1
2
[z b[.
33. Sia z C con [z[ = 1. Si verichi che (z 1)(z + 1) `e immaginario
puro e si interpreti geometricamente questo fatto.
111
Capitolo 2
Successioni
2.1 Limiti di successioni
Si usa il termine successione per indicare una sequenza interminabile di
elementi presi ordinatamente da un certo insieme. Pi` u precisamente:
Denizione 2.1.1 Sia X un insieme. Una successione a valori in X `e una
funzione a : N X. Gli elementi a(0), a(1), a(2), eccetera, si dicono termini
della successione e si denotano pi` u brevemente con a
0
, a
1
, a
2
, e cos` via. Nel
termine generico a
n
`e contenuta la legge di formazione della successione. La
successione a : N X si denota con a
n

nN
o anche semplicemente con
a
n
, confondendola impropriamente con linsieme dei suoi termini.
A noi interesseranno per lo pi` u successioni a valori reali o complessi. Molto
spesso sar`a utile considerare successioni denite non su tutto N ma solo per
tutti i numeri naturali maggiori di un intero ssato, cio`e funzioni a : n
N : n n
0
X.
Esempi 2.1.2 (1)
1
n
`e una successione reale, denita solo per n N
+
: si
ha a
1
= 1, a
2
= 1/2, a
3
= 1/3, . . . , a
n
= 1/n per ogni n N
+
.
(2) Se q C `e un numero ssato, q
n
`e una successione complessa (reale se
q R) ed i suoi termini sono 1, q, q
2
, q
3
, eccetera. In particolare: se q = 1
la successione vale costantemente 1; se q = 1 la successione prende solo i
valori 1 e 1 alternativamente, innite volte; se q = i, analogamente, a
n

assume ciclicamente i quattro valori 1, i, 1, i.


(3) n! `e la successione reale 1, 1, 2, 6, 24, 120, 720, 5040, 40320, . . . , che
112
cresce molto rapidamente al crescere dellindice n.
(4) a
n
=

n
k=0
q
k
, con q C ssato, `e una successione i cui termini, come
sappiamo, sono (esempio 1.6.4 (4))
a
n
=
_
1q
n+1
1q
se q ,= 1,
n se q = 1.
(5) La legge di formazione di una successione pu`o essere data induttivamente
anziche in modo esplicito: ad esempio
_
a
0
= 1 se n = 0
a
n
= 1 +
1
a
n1
se n 1,
`e una successione denita per ricorrenza, ove ciascun elemento (salvo a
0
) `e
denito in termini del precedente; si ha
a
0
= 1, a
1
= 2, a
2
=
3
2
, a
3
=
5
3
, a
4
=
8
5
, a
5
=
13
8
, a
6
=
21
13
,
e possiamo calcolarne quanti vogliamo, ma non `e facile determinare una legge
esplicita che esprima il termine generale a
n
in funzione solo di n.
A noi interesser`a il comportamento di una data successione per valori molto
grandi di n. A questo scopo `e fondamentale la nozione di limite:
Denizione 2.1.3 Sia a
n
C, sia L C. Diciamo che L `e il limite
della successione a
n
al tendere di n a +, oppure che la successione a
n

converge a L per n che tende a +, se vale la condizione seguente:


> 0 N : [a
n
L[ < n > .
Ci`o signica che comunque si ssi un margine di errore > 0, si pu`o trovare
una soglia al di l`a della quale per ogni indice n il corrispondente elemento
a
n
dierisce da L (in modulo) per meno di . In tal caso scriveremo
lim
n
a
n
= L, oppure a
n
L per n .
Osservazioni 2.1.4 (1) Se la successione a
n
`e reale e L `e reale, la deni-
zione di limite non cambia di una virgola: naturalmente il modulo [a
n
L[
diventa un valore assoluto.
113
(2) Nella denizione non cambia nulla se si concede alla soglia di essere
un numero reale anziche un numero naturale: limportante `e che per tutti
gli indici n N che sono maggiori di valga la disuguaglianza [a
n
L[ < .
In particolare, non `e aatto necessario scegliere il minimo possibile: ci`o
oltretutto pu`o complicare terribilmente i conti.
(3) La condizione [a
n
L[ < `e tanto pi` u vincolante e signicativa quan-
to pi` u `e piccolo; minore `e , pi` u saremo costretti a scegliere una soglia
grande. Si noti che la condizione, apparentemente meno forte,
esiste un numero K > 0 tale che per ogni > 0 si pu`o trovare una soglia
per cui risulta [a
n
L[ < K per ogni n >
`e equivalente a dire che lim
n
a
n
= L: infatti il numero K `e un arbitrario
numero positivo esattamente come lo era , per cui non c`e perdita di gene-
ralit`a.
Nel caso di successioni reali, c`e anche la nozione di successione divergente a
+ oppure :
Denizione 2.1.5 Sia a
n
R. Diciamo che la successione a
n
ha limite
+ per n +, ovvero che essa diverge positivamente per n +, se
M > 0 N : a
n
> M n > .
Analogamente, diciamo che la successione a
n
ha limite per n +,
ovvero essa diverge negativamente per n +, se
M > 0 N : a
n
< M n > .
In altre parole, la successione `e divergente se, ssato un numero M arbitra-
riamente grande, esiste sempre una soglia al di l`a della quale tutti i termini
della successione sono ancora pi` u grandi di M (se il limite `e +), ovvero
ancora pi` u piccoli di M (se il limite `e ).
Esempi 2.1.6 (1) lim
n
1
n
= 0. Infatti, ssato > 0, la relazione [
1
n
0[ =
1
n
< `e vericata non appena n >
1

. Quindi la denizione `e soddisfatta se


si sceglie =
1

; se si vuole N, si potr`a prendere =


_
1

+ 1.
(2) lim
n
n
n10
= 1 (questa successione `e denita per n 11). Infatti, dato
> 0 si ha

n
n 10
1

<
n
n 10
1 < n > 10
_
1 +
1

_
,
114
per cui basta scegliere = 10
_
1 +
1

_
, o anche =
20

(purche sia 1).


(3) Se q C e [q[ < 1, allora lim
n
q
n
= 0. Infatti dato > 0 si ha
[q
n
[ = [q[
n
< se e solo se n > log
|q|
(si ricordi che la funzione log
|q|
`e
decrescente essendo [q[ < 1). Se, invece, [q[ 1 e q / [1, +[, la successione
q
n
non ha limite (esercizio 2.1.7). Osserviamo per`o che se q R e q 1
lim
n
q
n
=
_
1 se q = 1
+ se q > 1.
Ci`o `e evidente se q = 1; se q > 1 basta osservare che q
n
> M se e solo se
n > log
q
M, dato che la funzione log
q
stavolta `e crescente.
(4) Per ogni q C con [q[ < 1 si ha lim
n

n
k=0
q
k
=
1
1q
. Infatti

k=0
q
k

1
1 q

1 q
n+1
1 q

1
1 q

=
[q[
n+1
[1 q[
,
quindi

k=0
q
k

1
1 q

=
[q[
n+1
[1 q[
< n + 1 > log
|q|
([1 q[).
Ma anche senza questo calcolo esplicito, che oltretutto non `e sempre possi-
bile, si poteva osservare che, per lesempio 2.1.6 (3), si ha lim
n
q
n
= 0;
quindi esiste certamente un tale che [q
n+1
[ < [1 q[ per ogni n > . Di
conseguenza risulta, per tutti gli n superiori a quel ,

k=0
q
k

1
1 q

=
[q[
n+1
[1 q[
< .
(5) lim
n
n! = +. Infatti, ovviamente n! > M non appena, ad esempio,
n > M.
(6) Si ha
lim
n
log
b
n =
_
+ se b > 1
se 0 < b < 1.
Infatti se M > 0 risulta
_
log
b
n > M n > b
M
se b > 1,
log
b
n < M n > b
M
se 0 < b < 1.
115
(7) Se a > 0, si ha lim
n
a
1/n
= 1. La cosa `e evidente se a = 1, perche
in tal caso addirittura [a
1/n
1[ = [1 1[ = 0 per ogni n N
+
. Se a > 1,
ricordando lesempio 1.8.3 (1) abbiamo che inf
nN
+ a
1/n
= 1; dunque, dato
> 0 esiste N tale che
1 < a
1/
< 1 +.
Daltra parte, essendo a > 1 si ha a
1/n
< a
1/
per n > : dunque a maggior
ragione
[a
1/n
1[ = a
1/n
1 < n > ,
che `e la tesi. Inne se 0 < a < 1 si ha
1
a
> 1 e quindi, per quanto gi`a provato,
per ogni > 0 esiste tale che

_
1
a
_
1/n
1

=
_
1
a
_
1/n
1 < n > ;
dunque, moltiplicando per a
1/n
,
[1 a
1/n
[ = 1 a
1/n
< a
1/n
< n > ,
e la tesi `e provata anche in questo caso.
(8) Non `e chiaro a priori se la successione n
1/n
abbia limite per n :
lesponente tende a rimpicciolire il numero, la base tende ad accrescerlo.
Osserviamo intanto che n
1/n
1 per ogni n N
+
; daltra parte, se per
ogni n 2 applichiamo la disuguaglianza delle medie (teorema 1.8.2) agli n
numeri positivi a
1
= . . . = a
n2
= 1, a
n1
= a
n
=

n, si ottiene
n
1
n
=
_
n

k=1
a
k
_1
n
<
1
n
n

k=1
a
k
= 1 +
2

n

2
n
< 1 +
2

n
.
Da qui segue che, per ogni ssato > 0, risulta
n
1
n
< 1 + purche
2

n
< ,
ossia purche n > 4/
2
. In conclusione,
lim
n
n
1/n
= 1.
116
Osservazione 2.1.7 Se una certa propriet`a p(n) `e vericata per ogni nume-
ro naturale maggiore di una data soglia (ossia, in altri termini, se essa vale
per tutti i naturali salvo al pi` u un numero nito), diremo che tale propriet`a
`e vera denitivamente. Cos`, nellesempio 2.1.6 (8) si ha per ogni > 0
2

n
< denitivamente,
in quanto, come si `e visto, tale condizione `e vera per tutti gli n > 4/
2
.
Analogamente, la denizione di limite pu`o essere riformulata come segue: si
ha lim
n
a
n
= L se e solo se per ogni > 0 risulta [a
n
L[ < denitiva-
mente, e si ha lim
n
a
n
= + oppure lim
n
a
n
= se per ogni M > 0
risulta a
n
> M denitivamente, oppure a
n
< M denitivamente.
Successioni limitate
Unimportante classe di successioni `e quella delle successioni limitate (che
non signica dotate di limite!).
Denizione 2.1.8 (i) Sia a
n
una successione reale o complessa. Diciamo
che a
n
`e limitata se esiste M > 0 tale che
[a
n
[ M n N.
(ii) Sia a
n
una successione reale. Diciamo che a
n
`e limitata superior-
mente (oppure limitata inferiormente) se esiste M R tale che
a
n
M n N oppure a
n
M n N.
Ovviamente, una successione reale `e limitata se e solo se `e limitata sia
superiormente che inferiormente. Inoltre, ricordando che
max[Rez[, [Imz[ [z[ [Rez[ +[Imz[ z C,
deduciamo che una successione complessa a
n
`e limitata se e solo se le due
successioni reali Rea
n
, Ima
n
sono entrambe limitate.
Proposizione 2.1.9 Ogni successione convergente `e limitata; il viceversa `e
falso.
117
Dimostrazione Sia lim
n
a
n
= L. Allora, scelto = 1, esiste N tale
che
[a
n
L[ < 1 n > ;
quindi se n > si ha
[a
n
[ = [a
n
L +L[ [a
n
L[ +[L[ < 1 +[L[,
mentre se n = 0, 1, 2, . . . , risulta evidentemente
[a
n
[ max[a
k
[ : k N, k .
In denitiva tutti i numeri [a
n
[ sono non superiori alla quantit`a
M = max1 +[L[, [a
0
[, [a
1
[, . . . , [a

[.
La successione (1)
n
mostra che il viceversa `e falso.
Per le successioni reali divergenti si ha un risultato della stessa natura (eser-
cizio 2.1.8).
Propriet`a algebriche dei limiti
Proviamo anzitutto lunicit`a del limite:
Proposizione 2.1.10 Il limite di una successione reale o complessa, se esi-
ste, `e unico.
Dimostrazione Supponiamo per assurdo che a
n
converga a L ed anche
a M, con L ,= M; supponiamo L e M entrambi niti. Fissato tale che
0 < <
1
2
[L M[, si ha per ipotesi
[a
n
L[ < denitivamente, [a
n
M[ < denitivamente;
quindi, scegliendo un n che superi la maggiore delle due soglie, si ha anche
[L M[ = [L a
n
+a
n
M[ [L a
n
[ +[a
n
M[ < 2 < [L M[,
e questo `e assurdo. Pertanto deve essere L = M.
Lasciamo al lettore diligente lanalisi dei casi in cui L, o M, `e .
Vediamo ora come si comportano i limiti rispetto alle operazioni algebriche.
118
Teorema 2.1.11 Siano a
n
, b
n
successioni reali o complesse. Se a
n
L
e b
n
M per n , con L e M niti, allora:
(i) a
n
+b
n
L +M per n ;
(ii) a
n
b
n
L M per n .
Supposto inoltre M ,= 0, si ha:
(iii)
1
b
n

1
M
per n ;
(iv)
a
n
b
n

L
M
per n .
Dimostrazione (i)-(ii) Fissato > 0, si ha
[a
n
L[ < denitivamente, [b
n
M[ < denitivamente;
quindi risulta denitivamente
[a
n
+b
n
L M[ [a
n
L[ +[b
n
M[ < 2,
e ci`o prova (i), tenuto conto dellosservazione 2.1.4 (3). Inoltre
[a
n
b
n
LM[ = [a
n
b
n
Lb
n
+Lb
n
LM[
[a
n
L[ [b
n
[ +[L[ [b
n
M[ < ([b
n
[ +[L[).
Daltra parte, la successione b
n
, essendo convergente, `e limitata da una
costante K > 0, in virt` u della proposizione 2.1.9; ne segue
[a
n
b
n
LM[ < (K +[L[) denitivamente,
il che prova (ii), tenuto nuovamente conto dellosservazione 2.1.4 (3).
(iii) Osserviamo anzitutto che b
n
`e denitivamente diversa da 0 essendo
M ,= 0, ed anzi si ha [b
n
[ C > 0 denitivamente (esercizio 2.1.9). Quindi
per ogni > 0 si ha

1
b
n

1
M

=
[M b
n
[
[b
n
[ [M[
<

C[M[
denitivamente,
da cui la tesi.
(iv) Segue da (ii) e (iii).
Per un analogo risultato nel caso di successioni (reali) divergenti si rimanda
allesercizio 2.1.18.
119
Limiti e ordinamento
Vediamo adesso come si comportano i limiti rispetto alla struttura dordine
di R.
Teorema 2.1.12 (di confronto) Siano a
n
, b
n
successioni reali. Se
a
n
L e b
n
M per n , e se
a
n
b
n
denitivamente,
allora si ha L M.
Dimostrazione Supponiamo, per ssare le idee, che L, M R e, per as-
surdo, che L > M; scegliamo 0 < <
1
2
(L M). Sia la soglia tale
che
a
n
b
n
, [L a
n
[ < , [M b
n
[ < n > .
Per tali n si ha anche
L < a
n
b
n
< M +,
da cui 0 < L M < 2 per ogni > 0. Ci`o `e assurdo, per il lemma
dellarbitrariet`a di (lemma 1.10.1).
Il caso L = oppure M = `e analogo.
Esercizi 2.1
1. Si provi che si ha lim
n
a
n
= L, con L C, se e solo se risulta
lim
n
(a
n
L) = 0.
2. Sia a
n
C. Si provi che a
n
ha limite L C se e solo se le due
successioni reali Rea
n
e Ima
n
convergono entrambe, con limiti ReL
e ImL rispettivamente.
3. Si provi che se a
n
L, allora [a
n
[ [L[.
`
E vero il viceversa?
4. Si provi che se a
n
0 e b
n
`e limitata, allora a
n
b
n
0.
5. Dimostrare che se a
n
L, allora
lim
n
(a
n+1
a
n
) = 0.
`
E vero il viceversa?
120
6. Dimostrare che se a
n
L e L ,= 0, allora
lim
n
a
n+1
a
n
= 1.
`
E vero il viceversa? Che succede se L = 0?
7. Si dimostri che se q C, [q[ 1 e q ,= 1 allora la successione q
n
non
ha limite.
8. Provare che se a
n
`e una successione reale divergente, allora a
n
non
`e limitata, ma che il viceversa `e falso.
9. (Teorema della permanenza del segno) Sia a
n
C. Provare che:
(i) se lim
n
a
n
,= 0, allora esiste > 0 tale che
[a
n
[ denitivamente;
(ii) se a
n
R e se lim
n
a
n
> 0, allora esiste > 0 tale che
a
n
denitivamente.
10. Provare che
lim
n
n
a
n
= 0 a > 1,
e dedurre che
lim
n
n
b
a
n
= 0 a > 1, b R.
11. Provare che
lim
n
log
a
n
n
= 0 a > 0, a ,= 1,
e dedurre che
lim
n
log
a
n
n
b
= 0 a > 0, a ,= 1, b > 0.
12. Provare che
lim
n
a
n
n!
= 0 a > 1.
121
13. Provare che
lim
n
n!
n
n
= 0.
14. Provare che
lim
n
n

n
a
= 1 a R.
15. Provare che
lim
n
n

n! = +.
[Traccia: ricordare lesercizio 1.6.16.]
16. Calcolare, se esistono:
(i) lim
n
n

2
n
+ 3
n
, (ii) lim
n
n
_
(2)
n
+ 3
n
, (iii) lim
n
n
_
2
n
+ (1)
n+1
.
17. Calcolare, se esiste, lim
n
a
n
, ove a
n
= 1 se n `e pari e a
n
= 2
n
se n
`e dispari.
18. Siano a
n
e b
n
successioni reali. Dimostrare che:
(i) se a
n
+ e b
n
`e limitata inferiormente, allora a
n
+b
n
+;
(ii) se a
n
e b
n
`e limitata superiormente, allora a
n
+b
n
;
(iii) se a
n
+ e b
n
K > 0 denitivamente, allora a
n
b
n
+;
(iv) se a
n
+ e b
n
K < 0 denitivamente, allora a
n
b
n
;
(v) se a
n
e b
n
K > 0 denitivamente, allora a
n
b
n
;
(vi) se a
n
e b
n
K < 0 denitivamente, allora a
n
b
n
+;
(vii) se a
n
+ oppure a
n
, allora 1/a
n
0;
(viii) se a
n
0 e a
n
,= 0 denitivamente, allora 1/[a
n
[ + (questo
vale anche se a
n
C);
(ix) se a
n
0 e a
n
> 0 denitivamente, allora 1/a
n
+;
(x) se a
n
0 e a
n
< 0 denitivamente, allora 1/a
n
;
(xi) negli altri casi, cio`e per le cosiddette forme indeterminate seguenti:
(a) + (per il limite di a
n
+ b
n
quando a
n
+ e b
n

),
(b) 0 () (per il limite di a
n
b
n
quando a
n
0 e b
n
),
122
(c)

(per il limite di
an
bn
quando a
n
e b
n
),
(d)
0
0
(per il limite di
an
bn
quando a
n
0 e b
n
0),
si mostri con esempi che il corrispondente limite pu`o essere un
numero reale qualunque, oppure , oppure pu`o non esistere.
19. (Teorema dei carabinieri) Siano a
n
, b
n
, c
n
successioni reali tali
che a
n
b
n
c
n
denitivamente. Si provi che se a
n
L e c
n
L
(con L R oppure L = ), allora b
n
L.
20. Calcolare, se esistono, i seguenti limiti:
(i) lim
n
_

4n sin 3
n
8

n
_
, (ii) lim
n
ncos
1
n
,
(iii) lim
n
_

n + 1

n
_
, (iv) lim
n
nsin
2
1

n
,
(v) lim
n
_
2n
n
_
, (vi) lim
n
2
n
2
n!,
(vii) lim
n
(4
n
+ 10
n
11
n
), (viii) lim
n
_
3
n+1
3

n
2
+1
_
.
21. Dimostrare che se a
n
R, a
n
L e L > 0, allora
lim
n
k

a
n
=
k

L k N
+
, lim
n
n

a
n
= 1.
22. Si provi che se a
n
L, L C, allora
lim
n
1
n
n1

k=0
a
k
= L.
`
E vero il viceversa? Che succede se a
n
R e L = ?
23. Si provi che se a
n
]0, [ e a
n
L, con L [0, [, allora
lim
n
n

_
n1

k=0
a
k
= L.
`
E vero il viceversa? Che succede se L = +?
24. Sia b
n
una successione di numeri positivi tale che b
n
b, con b > 0.
Si provi che b
x
n
b
x
per ogni x R.
123
2.2 Serie
Le serie numeriche sono semplicemente successioni reali o complesse di tipo
particolare, che per`o, per la loro importanza pratica e teorica, meritano una
trattazione a parte.
Data una successione a
n
reale o complessa, andiamo a costruire una nuova
successione s
n
in questo modo:
_
s
0
= a
0
s
n+1
= s
n
+a
n+1
n N.
Si ha dunque
s
n
=
n

k=0
a
k
n N.
Denizione 2.2.1 La successione s
n
sopra denita si chiama serie degli
a
k
e si indica con il simbolo

a
k
(o, pi` u pedantemente, con

k=0
a
k
, quando
si voglia precisare qual `e lindice iniziale: si possono infatti considerare anche
serie del tipo

k=1
a
k
,

k=50
a
k
,

k=p
a
k
con p N ssato ad arbitrio).
I numeri a
k
si dicono termini della serie ed i numeri s
n
si dicono somme
parziali della serie.
Si noti che nel denire una serie ed il simbolo che la indica non si `e fatto
alcun riferimento alla convergenza della successione s
n
, che pu`o benissimo
non vericarsi.
Denizione 2.2.2 Si dice che la serie

a
k
`e convergente ad un numero
(reale o complesso) L se la successione delle sue somme parziali s
n
`e con-
vergente ed ha limite L; in tal caso il numero L si dice somma della serie e
si scrive
L = lim
n
n

k=0
a
k
=

k=0
a
k
.
Come si vede, c`e una certa ambiguit`a, perche lo stesso simbolo

k=0
a
k
viene usato sia per indicare la serie (convergente o no), sia per indicarne la
somma (se convergente). Purtroppo si tratta di una notazione di uso ormai
consolidato, e non possiamo evitare di adottarla; sar`a comunque chiaro di
volta in volta dal contesto del discorso in quale dei due sensi va inteso il
simbolo

k=0
a
k
.
124
Osservazione 2.2.3 Una serie `e dunque una particolare successione, co-
struita a partire da unaltra successione assegnata. Per`o il punto di vista
si pu`o anche capovolgere: ogni successione a
n
pu`o essere vista come una
serie

b
k
, con b
n
opportuna. Basta infatti denire
_
b
0
= a
0
b
n+1
= a
n+1
a
n
n N,
ed `e facile vericare che allora
a
n
=
n

k=0
b
k
n N,
cio`e a
n
coincide con la serie

b
k
.
Successioni e serie sono dunque concetti del tutto equivalenti. Tuttavia le
serie si presentano spesso in modo naturale nelle applicazioni (geometriche,
siche, meccaniche, ecc.); inoltre la teoria delle serie `e per molti aspetti pi` u
maneggevole ed articolata di quella delle successioni. Ad esempio, vi sono
svariati criteri di uso molto semplice che garantiscono la convergenza delle
serie, i cui analoghi per le successioni non sono altrettanto comodi dal punto
di vista pratico.
Nel caso di serie reali si pu`o dare anche la nozione di serie divergente:
Denizione 2.2.4 Diciamo che la serie reale

b
k
`e divergente positiva-
mente, oppure divergente negativamente, se le sue somme parziali s
n
forma-
no una successione che tende a +, oppure a , per n . In tal caso
si scrive

k=0
a
k
= +, oppure

k=0
a
k
= .
Denizione 2.2.5 Diciamo che la serie

a
k
(reale o complessa) `e inde-
terminata se la successione delle sue somme parziali s
n
non ha limite per
n .
Esempi 2.2.6 (1) (Serie geometrica) Sia q C. Se [q[ < 1, allora

k=0
q
k
=
1
1 q
(esempio 2.1.6 (4)). Se [q[ 1 e q ,= 1, la serie `e indeterminata in virt` u
dellesercizio 2.1.7, mentre se q = 1 la serie diverge positivamente.
125
(2) Risulta

k=1
1
k(k+1)
= 1. Infatti
s
n
=
n

k=1
1
k(k + 1)
=
n

k=1
_
1
k

1
k + 1
_
= 1
1
n + 1
1 per n .
Questo `e un esempio di serie telescopica: sono telescopiche le serie che si
presentano nella forma

(b
k
b
k+1
), cosicche s
n
= b
0
b
n+1
. Ci`o in eet-
ti accade sempre, tenuto conto dellosservazione 2.2.3, ma si parla di serie
telescopiche soltanto quando questo modo di vederle porta ad una concreta
semplicazione della situazione.
(3) (Serie armonica) La serie

k=1
1
k
si chiama serie armonica perche cia-
scun termine (salvo il primo) `e la media armonica del predecessore e del
successore (la media armonica di due numeri positivi a,b `e il numero
2
1/a+1/b
;
si veda anche lesercizio 1.8.4). Osservando che i termini
1
k
sono positivi e
decrescenti, si ha
s
2n
s
n
=
2n

k=n+1
1
k

n
2n
=
1
2
n N
+
.
Ne segue che la serie armonica non pu`o essere convergente, perch`e in tal caso
esisterebbe L R tale che [s
n
L[ <
1
4
denitivamente; ma allora, scelto n
abbastanza grande, dedurremmo
1
2
s
2n
s
n
[s
2n
L[ +[L s
n
[ <
1
4
+
1
4
=
1
2
,
il che `e assurdo. In eetti la stima precedente mostra che per ogni ssato
m N e per ogni n 2
m
si ha
s
n
s
2
m = s
1
+ (s
2
s
1
) + (s
4
s
2
) + (s
8
s
4
) + + (s
2
m s
2
m1) =
= 1 +
m

k=1
(s
2
k s
2
k1) 1 +
m

k=1
1
2
= 1 +
m
2
,
e ci`o prova che s
n
(denizione 2.2.4), ossia che la serie armonica `e
divergente positivamente.
Osservazione 2.2.7 Sia

k=0
a
k
una serie convergente con somma L. Al-
lora sottraendo s
m
ad entrambi i membri delluguaglianza

k=0
a
k
= L si
126
ottiene che per ogni m N la serie

k=m+1
a
k
`e convergente e

k=m+1
a
k
= L s
m
m N.
In particolare, facendo tendere m a +, si deduce che per ogni serie

a
k
convergente si ha
lim
m

k=m
a
k
= 0.
La serie

k=m
a
k
si chiama resto m-simo della serie

k=0
a
k
.
Vediamo ora una condizione necessaria per la convergenza di una serie.
Proposizione 2.2.8 Se

a
k
`e una serie convergente, allora i suoi termini
a
n
formano una successione innitesima, ossia risulta a
n
0 per n ;
il viceversa `e falso.
Dimostrazione Se L `e la somma della serie, ssato > 0 esiste N tale
che [s
n
L[ < per ogni n > . Quindi
[a
n
[ = [s
n
s
n1
[ [s
n
L[ +[L s
n1
[ < 2 n > + 1,
cio`e a
n
0 per n .
La serie armonica (esempio 2.2.6 (3)) `e una serie che non converge, benche i
suoi termini
1
n
formino una successione innitesima.
Osservazione 2.2.9 Lanalogo della proposizione precedente per le succes-
sioni si pu`o enunciare nel modo seguente (vedere esercizio 2.1.5): se a
n
`e
una successione convergente, allora
lim
n
(a
n
a
n+1
) = 0,
ma il viceversa `e falso, come mostra la successione

n.
Esercizi 2.2
1. Provare che se

a
n
e

b
n
sono serie convergenti, anche la serie

(a
n
+b
n
) `e convergente e

n=0
(a
n
+b
n
) =

n=0
a
n
+

n=0
b
n
;
127
si provi anche che per ogni C la serie

(a
n
) `e convergente e

n=0
(a
n
) =

n=0
a
n
.
Si generalizzino questi enunciati, per quanto possibile, al caso di serie
reali divergenti.
2. (criterio del confronto) Siano

a
n
e

b
n
serie reali tali che 0 a
n

b
n
per ogni n N.
(i) Si provi che se

b
n
converge, allora

a
n
converge e

n=0
a
n

n=0
b
n
; in quale caso vale luguaglianza?
(ii) Si provi che se

a
n
diverge, allora

b
n
diverge.
3. Sia

a
n
una serie a termini reali non negativi. Si dimostri che

n=0
a
n
< +

n=0
a
n
1 +a
n
< +.
4. Sia

a
n
una serie a termini reali non negativi. Si dimostri che se

a
n
`e convergente, allora

(a
n
)
p
`e convergente per ogni p 1.
5. Sia a
n
C. Si provi che se

a
2m
e

a
2m+1
sono convergenti, allora

a
n
`e convergente e

n=0
a
n
=

m=0
a
2m
+

m=0
a
2m+1
;
`e vero il viceversa?
6. Sia a
n
C. Si provi che se

[a
n
[
2
`e convergente, allora

an
n
`e
convergente, ma che il viceversa `e falso.
7. (i) Si provi che ogni numero razionale ha uno sviluppo decimale perio-
dico (eventualmente di periodo nullo).
128
(ii) Viceversa, sia x un numero reale con sviluppo decimale periodico, il
cui antiperiodo sia un intero a = a
1
. . . a
p
di p cifre e il cui periodo
sia un intero b = b
1
. . . b
q
con q cifre. Si provi che
x [x] =
a
10
p
+
b
10
p

n=1
1
10
qn
;
dedurre che x `e un numero razionale, il quale si pu`o scrivere sotto
forma di frazione (la frazione generatrice di x), il cui denominatore
`e fatto da q cifre 9 seguite da p cifre 0, e il cui numeratore `e la
dierenza fra lintero a
1
. . . a
p
b
1
. . . b
q
e lintero b
1
. . . b
q
.
2.3 Successioni monotone
Unimportante classe di successioni reali `e quella delle successioni monot`one
(e non mon`otone!).
Denizione 2.3.1 Sia a
n
R. Diciamo che a
n
`e monotona crescente
se si ha
a
n+1
a
n
n N.
Diciamo che a
n
`e monotona decrescente se si ha
a
n+1
a
n
n N.
Diciamo che a
n
`e strettamente crescente o strettamente decrescente se
la corrispondente disuguaglianza `e stretta per ogni n N. In entrambi i
casi precedenti, la successione si dir`a strettamente monot`ona. Inne di-
ciamo che a
n
`e denitivamente monotona (crescente o decrescente) se la
corrispondente disuguaglianza `e vera soltanto da una certa soglia in poi.
Esempi 2.3.2 (1)
1
n
, n sono successioni strettamente decrescenti.
(2) (n + 1)!,
n1
n
sono successioni strettamente crescenti.
(3)
_
1 +
x
n
_
n
`e una successione crescente per ogni x 1 (strettamente,
se x ,= 0), ed `e denitivamente crescente per x < 1 (esempio 1.8.3 (2)).
(4) Le somme parziali di una serie a termini di segno costante formano
una successione monotona: crescente se il segno `e positivo, decrescente se `e
negativo.
129
Il comportamento allinnito delle successioni monotone `e particolarmente
semplice. Si ha infatti:
Proposizione 2.3.3 Sia a
n
R una successione monotona. Allora essa
ha limite e si ha
lim
n
a
n
=
_
_
_
sup
nN
a
n
] , +] se a
n
`e crescente,
inf
nN
a
n
[, +[ se a
n
`e decrescente.
In particolare, una successione monotona `e convergente se e solo se `e limi-
tata.
Dimostrazione Proveremo la tesi solamente nel caso in cui a
n
`e de-
crescente, lasciando laltro caso al lettore. Sia L lestremo inferiore della
successione a
n
, e supponiamo dapprima che L R: allora, come sappiamo
(proposizione 1.5.10), si ha
L a
n
n N,
> 0 N : L a

< L +.
Poiche a
n
`e decrescente, deduciamo
L a
n
a

< L + n ,
da cui segue che a
n
L per n +. Se invece L = , allora a
n
non
ha minoranti e quindi
M > 0 N : a

< M;
per la decrescenza di a
n
segue che
a
n
a

< M n ,
cio`e a
n
per n +.
Lultima propriet`a `e banale: se a
n
`e monotona e limitata, allora ha estremo
superiore ed estremo inferiore niti, e quindi ha limite nito coincidente
con uno dei due, cio`e `e convergente; viceversa, ogni successione convergente
`e limitata per la proposizione 2.1.9 (si noti che questo `e vero anche se la
successione non `e monotona).
Tornando alle serie, la proposizione precedente ci dice che per provare la
convergenza delle serie a termini positivi `e suciente far vedere che le somme
parziali sono limitate superiormente: e questo `e spesso abbastanza facile.
130
Esempi 2.3.4 (1) (Serie armonica generalizzata) Per > 0 consideriamo
la serie

n=1
1
n

.
Se = 1, essa si riduce alla serie armonica e, come si `e visto nellesempio
2.2.6 (3), `e divergente (positivamente). Dunque per ogni ]0, 1[ si ha a
maggior ragione
s
n
=
n

k=1
1
k

>
n

k=1
1
k
+ per n +,
cio`e la serie diverge positivamente. Se = 2, tenuto conto dellesempio 2.2.6
(2), si ha
s
n
=
n

k=1
1
k
2
< 1 +
n

k=2
1
k(k 1)
= 1 +
n1

h=1
1
h(h + 1)
2 per n +,
e per il teorema di confronto (teorema 2.1.12) la serie converge ed ha somma
inferiore a 2. Se > 2, a maggior ragione,
s
n
=
n

k=1
1
k

<
n

k=1
1
k
2
e, per confronto con il caso = 2, la serie converge (con somma minore di
2).
Resta il caso ]1, 2[: analogamente a quanto fatto per la serie armonica,
andiamo a stimare la dierenza s
2n
s
n
: si ha
s
2n
s
n
=
2n

k=n+1
1
k


n
(n + 1)

n N
+
;
quindi, ssato m N
+
e scelto n = 2
m
, la disuguaglianza precedente implica
s
n
= s
2
m = 1 +
m

k=1
(s
2
k s
2
k1) 1 +
m

k=1
2
k1
(2
k1
+ 1)

<
< 1 +
m

k=1
1
2
(k1)(1)
< 1 +
1
1 2
(1)
.
131
Dato che m 2
m
per ogni m N, si conclude che
s
m
s
2
m < 1 +
1
1 2
(1)
m N
+
,
e pertanto la serie `e convergente. In denitiva, la serie armonica generalizzata
ha il seguente comportamento:

n=1
1
n

_
converge se > 1
diverge a + se 1.
(2) (Serie esponenziale) Consideriamo la serie

n=0
1
n!
,
che `e convergente in quanto
s
n
=
n

k=0
1
k!
2 +
n

k=2
1
k(k 1)
3 per n +.
Questa serie `e un caso particolare della serie esponenziale

z
n
n!
, z C, che
verr`a analizzata in seguito.
Stabiliamo adesso unimportante relazione che ci dar`a modo di denire il
fondamentale numero reale e.
Proposizione 2.3.5 Risulta

k=0
1
k!
= lim
n
_
1 +
1
n
_
n
.
Dimostrazione Notiamo che il limite a destra esiste perche la successione
(1 +
1
n
)
n
`e crescente (esempio 1.8.3 (2)). Inoltre si ha, utilizzando la formula
di Newton (teorema 1.7.1),
_
1 +
1
n
_
n
=
n

k=0
_
n
k
_
1
n
k
n N
+
;
132
quindi, per ogni n N
+
,
_
1 +
1
n
_
n
= 1 +
n

k=1
n(n 1) . . . (n k + 1)
k! n
k
=
= 1 +
n

k=1
1
k!

n
n

n 1
n
. . .
n k + 1
n

n

k=0
1
k!
,
da cui, per il teorema di confronto (teorema 2.1.12),
lim
n
_
1 +
1
n
_
n

k=0
1
k!
.
Daltra parte, per ogni ssato m N
+
si ha
m

k=0
1
k!
= 1 +
m

k=1
1
k!
lim
n
_
n
n
n 1
n
. . .
n k + 1
n
_
=
= 1 + lim
n
m

k=1
1
k!
n
n
n 1
n
. . .
n k + 1
n
= lim
n
m

k=0
_
n
k
_
1
n
k
;
aumentando nellultimo termine il numero degli addendi da m (che `e sso)
a n (che `e pi` u grande, dato che sta tendendo a +) si ottiene
m

k=0
1
k!
lim
n
n

k=0
_
n
k
_
1
n
k
= lim
n
_
1 +
1
n
_
n
m N
+
,
da cui nalmente, facendo tendere anche m a +,

k=0
1
k!
lim
n
_
1 +
1
n
_
n
,
il che prova luguaglianza richiesta.
Denizione 2.3.6 Indichiamo con e il numero reale denito dalla proposi-
zione 2.3.5, ossia poniamo
e =

k=0
1
k!
= lim
n
_
1 +
1
n
_
n
.
133
Il numero e si chiama numero di Nepero e riveste unimportanza fondamentale
in tutta la matematica. Esso `e un irrazionale (esercizio 2.3.1) ed `e compreso
fra 2 e 3: infatti
2 =
1

k=0
1
k!
<

k=0
1
k!
< 2 +

k=2
1
k(k 1)
= 3.
Il logaritmo in base e si dice logaritmo naturale e si scrive indierentemente
log
e
x = log x = ln x.
Esercizi 2.3
1. Provare che

n=m+1
1
n!
<
1
m m!
m N
+
,
e dedurne che e `e irrazionale.
[Traccia: se fosse e = p/q con p, q N
+
primi tra loro, avremmo per
ogni m N la disuguaglianza 0 <
p
q

m
n=0
1
n!
<
1
mm!
; moltiplicando
per q m! e scegliendo m > q, si deduca un assurdo.]
2. Dimostrare che se b > 1 si ha

n=2
1
nlog
b
n
= +,

n=2
1
n(log
b
n)

< + > 1.
[Traccia: stimare s
2n
s
n
per n = 2
k
, analogamente a quanto fatto
per la serie armonica e per la serie armonica generalizzata negli esempi
2.2.6 (3) e 2.3.4 (1).]
3. Sia a
n
una successione decrescente di numeri positivi. Provare che
se

a
n
`e convergente, allora lim
n
n a
n
= 0, ma che il viceversa `e
falso.
4. Si provi che le successioni
_
1 +
1
n
_
n+1
e
_
1
1
n+1
_
n
sono decrescenti e
se ne calcolino i limiti.
5. Calcolare, se esistono,
lim
n
_
1 +
1
n
2
_
n
, lim
n
_
1 +
1
n
_
n
2
.
134
6. Provare che
lim
n
_
n
2
1
n(1 +n
2
)
_ 1

n
= 1.
7. Dimostrare le disuguaglianze
1
n + 1
< log
_
1 +
1
n
_
<
1
n
,
1
n 1
< log
_
1
1
n
_
<
1
n
n N
+
,
e dedurre che
lim
n
log
_
1 +
1
n
_
1
n
= 1, lim
n
log
_
1
1
n
_
1
n
= 1.
8. (identit`a di Abel) Siano a
1
, . . . , a
n
, b
1
, . . . , b
n
, b
n+1
numeri complessi.
Posto s
k
=

k
h=1
a
h
, si provi che
n

k=1
a
k
b
k
= s
n
b
n+1

k=1
s
k
(b
k+1
b
k
).
9. Determinare il comportamento delle seguenti serie:
(i)

n=1
_
1 cos
1
n
_
, (ii)

n=1
sin
1
n
, (iii)

n=1
log n
n
3
,
(iv)

n=0
n(n 1)
(n + 1)(n + 2)
2
, (v)

n=2
1
(log n)
log n
, (vi)

n=1
n
n
(n!)
2
,
(vii)

n=1
[7 + 3(1)
n
]
n
2
3n
, (viii)

n=0
1
4

1 +n
3
, (ix)

n=0
n + 2
n
1 +n
3
,
(x)

n=1
_
n + 1
n(1 +n
2
)
_

n
, (xi)

n=1
_
n 1

n
_
n
, (xii)

n=1
(1)
n
40
1
n
.
10. Si verichi lidentit`a
n!
(n +k)!
=
1
k 1
_
n!
(n +k 1)!

(n + 1)!
(n +k)!
_
n N, k 2,
135
e se ne deduca che

n=0
n!
(n +k)!
=
1
(k 1)(k 1)!
k 2,
ossia

n=0
1
_
n+k
n
_ = 1 +
1
k 1
k 2.
11. Si provi che se a > 1 la serie

(a
1/n
2
1) `e convergente mentre la serie

(a
1/n
1) `e divergente. Che succede se 0 < a 1?
[Traccia: si utilizzi lidentit`a (a
1/k
1)

k1
h=0
a
h/k
= a 1.]
12. Sia a
n
denita per ricorrenza dalle relazioni
_
_
_
a
0
= 1
a
n+1
=
a
n
+a
n
n N,
ove `e un ssato numero positivo. Si provi che a
n
`e decrescente e se
ne calcoli il limite; si deduca che la serie

a
n
`e convergente se > 1
e divergente se 0 < 1.
[Traccia: si trovi unespressione esplicita per a
n
.]
13. Sia F
n
la successione dei numeri di Fibonacci, deniti da
_
F
0
= 0, F
1
= 1,
F
n+2
= F
n+1
+F
n
n N;
si determini il comportamento della serie

1
Fn
.
14. Si provi che risulta
1
n + 1
<

k=n+1
1
k
2
<
1
n
n N
+
.
136
2.4 Criteri di convergenza per le serie
Come si `e gi`a accennato in precedenza, spesso `e facile accertare la convergenza
di una serie senza conoscerne la somma. Ci`o `e reso possibile da alcuni comodi
criteri che forniscono condizioni sucienti per la convergenza delle serie. I pi` u
semplici di questi criteri riguardano le serie reali a termini di segno costante,
ad esempio positivi; il pi` u semplice in assoluto `e il criterio del confronto, una
versione del quale si trova nellesercizio 2.2.2:
Proposizione 2.4.1 (criterio del confronto) Siano

a
n
,

b
n
due se-
rie reali, e supponiamo che risulti
0 a
n
b
n
denitivamente;
in tal caso, se

b
n
converge allora

a
n
converge, mentre se

a
n
diverge
a + allora

b
n
diverge a +.
Dimostrazione Sia N tale che 0 a
n
b
n
per ogni n : allora
0

n=m
a
n

n=m
b
n
m ,
cosicche i due enunciati seguono facilmente tenendo conto dellosservazione
2.2.7.
Si ha poi:
Proposizione 2.4.2 (criterio del rapporto) Sia

a
n
una serie con ter-
mini denitivamente positivi. Se esiste ]0, 1[ tale che
a
n+1
a
n
denitivamente,
allora la serie

a
n
`e convergente. Il viceversa `e falso.
Dimostrazione Sia N tale che a
n
> 0 per ogni n ed inoltre
a
n+1
a
n
n ;
allora si ha
a
n
= a


n1

k=
a
k+1
a
k
a


n1

k=
= a


n
n ,
137
cio`e
a
n

a


n
n .
Dal criterio del confronto, essendo ]0, 1[, segue che

a
n
`e convergente.
Viceversa, la serie

1/n
2
`e una serie convergente, e malgrado ci`o non verica
le ipotesi del criterio del rapporto: infatti
a
n+1
a
n
=
n
2
(n + 1)
2
1 per n +,
e quindi non esiste alcun ]0, 1[ che possa soddisfare lipotesi richiesta.
Osservazione 2.4.3 Si noti che nellipotesi del criterio del rapporto non
basta richiedere che sia
a
n+1
a
n
< 1 denitivamente:
infatti questa condizione `e meno restrittiva ed esistono serie divergenti che
la soddisfano: per esempio la serie armonica

1
n
.
Esempi 2.4.4 (1) La serie

n!
n
n
`e convergente: infatti
a
n+1
a
n
=
(n+1)!
(n+1)
n+1
n!
n
n
=
_
n
n + 1
_
n
=
1
_
1 +
1
n
_
n

1
e
per n +,
cosicche si ha denitivamente
a
n+1
a
n
<
1
e
+ < 1
pur di scegliere 0 < < 1
1
e
.
(2) La serie

b
n
`e convergente per ogni R e per ogni b [0, 1[: infatti
a
n+1
a
n
=
_
n + 1
n
_

b b per n ,
e quindi si ha denitivamente
a
n+1
a
n
b + < 1
138
pur di scegliere 0 < < 1 b.
(3) La serie esponenziale

x
n
n!
`e convergente per ogni x > 0: infatti
a
n+1
a
n
=
x
n + 1
0 per n +,
cosicch`e per qualunque ]0, 1[ si ha
a
n+1
a
n
denitivamente.
(4) La serie

n=0
_
n +k
k
_
1/2
`e a termini positivi, ma luso del criterio del rapporto non d`a informazioni
sul suo comportamento: infatti
a
n+1
a
n
=
_
n + 1
n +k + 1
_
1/2
1 per n +,
quindi la serie potrebbe convergere o divergere. Tuttavia se k 3 si ha
a
n
=

k!n!
(n +k)!

k!
(n +k)(n +k 1)(n +k 2)

k!
n
3/2
n N
+
,
quindi la serie converge per il criterio del confronto; se invece k = 2, e a
maggior ragione se k = 0 o k = 1, si vede subito che la serie diverge per
confronto con la serie armonica.
Proposizione 2.4.5 (criterio della radice) Sia

a
n
una serie a termini
non negativi. Se esiste ]0, 1[ tale che
n

a
n
denitivamente,
allora la serie

a
n
`e convergente; se invece esistono inniti valori di n per
i quali
n

a
n
1,
allora la serie

a
n
`e positivamente divergente.
139
Dimostrazione Dalla prima ipotesi segue che si ha
a
n

n
denitivamente,
quindi

a
n
converge per il criterio del confronto, essendo ]0, 1[.
Se invece vale la seconda ipotesi, allora si ha a
n
1 per inniti valori di n:
quindi la serie

a
n
diverge a +.
Osservazione 2.4.6 Si noti che, come per il criterio del rapporto, nellipo-
tesi del criterio della radice non basta richiedere che sia
n

a
n
< 1 denitivamente,
in quanto questa condizione meno restrittiva `e vericata da alcune serie
divergenti: per esempio la serie armonica

1
n
.
Esempi 2.4.7 (1) La serie

3
n
4
n
1
`e convergente, perche
_
3
n
4
n
1
_1
n
=
3
4
_
1
1 4
n
_1
n

3
4
per n +,
cosicche, scelto 0 < <
1
4
, si ha
_
3
n
4
n
1
_1
n
<
3
4
+ < 1 denitivamente.
(2) La serie
_
1
1
n
_
n
2
`e convergente: infatti, essendo
_
1
1
n
_
n
crescente,
_
_
1
1
n
_
n
2
_1
n
=
_
1
1
n
_
n

1
e
n N
+
.
(3) La serie
_
3
4
+
1
2
cos n

2
_
n
`e a termini positivi e diverge a + perche il
termine generale a
n
`e
a
n
=
_

_
_
3
4
_
n
se n `e dispari,
_
5
4
_
n
se n `e multiplo di 4,
_
1
4
_
n
se n `e pari ma non `e multiplo di 4,
cosicche
n

a
n
1 per inniti indici n.
140
(4) La serie

n=1
_
n
2
1
n(1 +n
2
)
_

n
`e a termini positivi ma il criterio della radice non d`a informazioni sulla
convergenza, in quanto
n

a
n
=
_
n
2
1
n(1 +n
2
)
_ 1

n
1 per n
(esercizio 2.3.6); quindi per ogni ]0, 1[ si ha denitivamente
<
n

a
n
< 1.
Tuttavia, in virt` u del criterio del confronto la serie `e convergente poiche
_
n
2
1
n(1 +n
2
)
_

_
1
n
_

1
n
2
n 4.
Il criterio di convergenza di uso pi` u facile e frequente `e il seguente:
Proposizione 2.4.8 (criterio del confronto asintotico) Siano

a
n
e

b
n
due serie a termini denitivamente positivi, e supponiamo che esista
L = lim
n
a
n
b
n
[0, +].
Allora:
(i) se L ]0, +[, le due serie hanno lo stesso comportamento;
(ii) se L = 0, la convergenza di

b
n
implica la convergenza di

a
n
;
(iii) Se L = +, la divergenza di

b
n
implica la divergenza di

a
n
.
Dimostrazione (i) Sia L > 0 e sia ]0, L[. Allora si ha
0 < L <
a
n
b
n
< L + denitivamente,
quindi
b
n
(L ) < a
n
< b
n
(L +) denitivamente,
e la tesi segue dal criterio del confronto.
(ii) Fissato > 0 si ha denitivamente a
n
b
n
, da cui la tesi.
(iii) Fissato M > 0, si ha denitivamente Mb
n
< a
n
, da cui la tesi.
141
Esempi 2.4.9 (1) La serie

n=1
n
2
+ 3

n 4
2n
3

n + 1
converge perche confrontandola con

n
3/2
, che `e convergente, si ha
lim
n
n
2
+3

n4
2n
3

n+1
1
n
3/2
=
1
2
.
(2) La serie

1
n
(cos n
2
+

n) `e divergente a + perche confrontandola con

n
1/2
, che `e divergente, si ha
lim
n
cos n
2
+

n
= 1.
(3) La serie

n
3+(1)
n
`e convergente perche a confronto con

n
3/2
d`a
lim
n
n
3/2
n
3(1)
n
= 0.
(4) Consideriamo la serie

n=2
1
n(log n)

,
ove 1. Notiamo che si ha, per ogni > 0,
1
n
1+
<
1
n(log n)

<
1
n
denitivamente
in quanto lim
n
n

(log n)

= + (esercizio 2.1.11). Quindi siamo in un caso


intermedio fra

1
n
(divergente) e

1
n
1+
(convergente), ed il criterio del
confronto asintotico non d`a alcun aiuto. Tuttavia le somme parziali della
serie vericano
s
2n
s
n
=
2n

k=n+1
1
k(log k)


n
(n + 1)(log(n + 1))


1
(log n)

n 2,
s
2n
s
n
=
2n

k=n+1
1
k(log k)


n
2n(log(2n))

=
1
2
1
(log(2n))

n 2;
142
di conseguenza, con lo stesso ragionamento usato per la serie armonica e per
la serie armonica generalizzata (esempi 2.2.6 (3) e 2.3.4 (1)), se 1 si ha
per ogni m 2 e per ogni n 2
m
s
n
s
2
m =
1
2(log 2)

+
m

k=2
(s
2
k s
2
k1)

1
2(log 2)

+
1
2
m

k=2
1
(log 2
k
)

=
1
2(log 2)

k=1
1
k

,
mentre se > 1 si ha per ogni n 2
s
n
s
2
n =
1
2(log 2)

+
n

k=2
(s
2
k s
2
k1)

1
2(log 2)

+
1
2
n

k=2
1
(log 2
k1
)

=
1
(log 2)

_
1
2
+
n1

h=1
1
h

_
.
Dal comportamento della serie armonica generalizzata si deduce che

n=2
1
n(log n)

_
converge se > 1,
diverge a + se 1.
Esercizi 2.4
1. Determinare il comportamento delle seguenti serie:
(i)

n=1
1
n
1+1/n
, (ii)

n=1
1
(n!)
1/n
, (iii)

n=2
1
log n!
,
(iv)

n=0
e

n
, (v)

n=1
log
_
1 +
1
n
2
_
, (vi)

n=2
log
_
1
1
n
2
_
,
(vii)

n=0
2
n
e

n
, (viii)

n=2
2

n
(log n)
n
, (ix)

n=1
tan
2
1
n
,
(x)

n=1
n

n! n

n
, (xi)

n=1
n

n
(

n)
n
, (xii)

n=1
10
n!n
n
.
143
2. (criterio di Raabe) Sia

a
n
una serie a termini positivi. Si provi che
se esiste K > 1 tale che
n
_
a
n
a
n+1
1
_
K n N
+
,
allora la serie converge, mentre se risulta
n
_
a
n
a
n+1
1
_
1 n N
+
,
allora la serie diverge a +.
[Traccia: nel primo caso, posto d = K 1, si mostri che a
n+1

1
d
(na
n
(n + 1)a
n+1
), e che quindi le somme parziali

n
k=1
a
k+1
non
superano
a
1
d
; nel secondo caso si verichi che a
n+1

a
1
n+1
.]
3. Si determini il comportamento delle seguenti serie:
(i)

n=1
1 4 7 . . . (3n 2)
3 6 9 . . . (3n)
, (ii)

n=1
_
1 4 7 . . . (3n 2)
3 6 9 . . . (3n)
_
2
.
[Traccia: utilizzare il criterio di Raabe.]
4. Vericare che il criterio di Raabe implica la divergenza della serie
armonica.
5. Si provi che esiste un numero reale ]0, 1[, detto costante di Eulero,
tale che
lim
n
_
n

k=1
1
k
log n
_
= .
[Traccia: utilizzare il risultato dellesercizio 2.3.7.]
6. Quanti addendi occorre sommare anche risulti
n

k=1
1
k
100?
7. Siano a
0
< a
1
< a
2
< . . . i numeri naturali che, scritti in cifre decimali,
non contengono la cifra 0. Provare che
n

k=1
1
a
k
< 90.
144
[Traccia: si determini quanti sono i numeri di n cifre fra le quali non
c`e lo 0, e si osservi che essi sono tutti maggiori di 10
n1
. . .]
8. Si provi che
n

k=1
cos
x
2
k
=
sin x
2
n
sin
x
2
n
n N
+
, x R 0,
e di conseguenza si calcoli la somma della serie

k=1
log cos
x
2
k
, x R.
9. Si consideri la successione denita da
_
a
0
=
a
n+1
= max
1
2
a
n
, a
n
1 n N.
ove R.
(i) Si provi che a
n
`e monotona e innitesima per ogni R.
(ii) Si determini il comportamento della serie

a
n
al variare di in
R.
10. Discutere la convergenza della serie

n=1
a
log n
n
al variare del parametro
a > 0.
11. Provare che

n=3
1
n(log n)(log log n)

_
converge se > 1,
diverge a + se 1.
12. Sia a
n
]0, +[. Si provi che
lim
n
a
n+1
a
n
= L = lim
n
n

a
n
= L,
e se ne deduca che il criterio della radice implica il criterio del rapporto.
145
2.5 Assoluta convergenza
Per le serie a termini complessi, o a termini reali di segno non costante,
i criteri di convergenza sin qui visti non sono applicabili. Lunico criterio
generale, rozzo ma ecace, `e quello della convergenza assoluta.
Denizione 2.5.1 Sia

a
n
una serie a termini reali o complessi. Diciamo
che la serie `e assolutamente convergente se la serie

[a
n
[ `e convergente.
Si noti che per vericare la convergenza assoluta di una serie i criteri visti in
precedenza sono tutti validi perche

[a
n
[ `e una serie a termini positivi. Na-
turalmente, come suggerisce il loro nome, le serie assolutamente convergenti
sono convergenti: vale infatti la seguente
Proposizione 2.5.2 Ogni serie assolutamente convergente `e convergente.
Dimostrazione Sia

[a
n
[ convergente, e supponiamo dapprima che gli a
n
siano tutti reali. Poniamo
b
n
= [a
n
[ a
n
n N :
chiaramente si ha 0 b
n
2[a
n
[ per ogni n, cosicche

b
n
`e convergente per
il criterio del confronto. Essendo
a
n
= [a
n
[ b
n
n N,
la serie

a
n
converge perche dierenza di serie convergenti (esercizio 2.2.1).
Supponiamo adesso che gli a
n
siano numeri complessi. Dalle relazioni
[Rez[ [z[, [Imz[ [z[ z C
segue, per il criterio del confronto, che le due serie reali

Rea
n
e

Ima
n
sono assolutamente convergenti; quindi, per quanto gi`a dimostrato, esse con-
vergono. Dunque, applicando alle somme parziali

n
k=0
a
k
il risultato delle-
sercizio 2.1.2, si ottiene che la serie

a
n
=

Rea
n
+i

Ima
n
`e convergente.
Come vedremo fra poco, il viceversa della proposizione precedente `e falso:
esistono serie convergenti che non sono assolutamente convergenti.
Per le serie a termini reali di segno alterno c`e uno speciale criterio di con-
vergenza.
146
Proposizione 2.5.3 (criterio di Leibniz) Sia a
n
una successione reale
decrescente ed innitesima. Allora la serie

(1)
n
a
n
`e convergente e si ha

n=m+1
(1)
n
a
n

a
m+1
m N.
Dimostrazione Siano s
n
le somme parziali della serie

n=0
(1)
n
a
n
; se n
`e pari, n = 2m, dalla decrescenza di a
n
segue che
s
2m+2
= s
2m
a
2m+1
+a
2m+2
s
2m
s
2
s
0
,
mentre se n `e dispari, n = 2m + 1, si ha analogamente
s
2m+1
= s
2m1
+a
2m
a
2m+1
s
2m1
s
3
s
1
.
Inoltre per la positivit`a degli a
n
s
2m+1
= s
2m
a
2m+1
s
2m
m N;
in denitiva
s
1
s
2m1
s
2m+1
s
2m
s
2m2
s
0
m N
+
.
Dunque le successioni s
2m+1

mN
e
s
2m

mN
sono monotone (crescente la
prima e decrescente la seconda) e li-
mitate; quindi convergono entrambe e,
posto
D = lim
m
s
2m+1
, P = lim
m
s
2m
,
dal teorema di confronto (teorema
2.1.12) si ha s
1
D P s
0
.
Daltra parte, essendo s
2m+1
s
2m
= a
2m+1
per ogni m N, dallipotesi
che a
n
`e innitesima, passando al limite per m , si ottiene D = P.
Poniamo allora S = D = P, e proviamo che la serie

n=0
(1)
n
a
n
ha somma
S. Per ogni > 0 si ha
[s
2m
S[ < denitivamente, [s
2m+1
S[ < denitivamente;
147
quindi se n `e abbastanza grande, pari o dispari che sia, risulter`a [s
n
S[ < ,
e pertanto s
n
S per n .
Notiamo poi che si ha
s
2m+1
S s
2m+2
s
2m
m N,
da cui se n `e pari, n = 2m,
0 s
n
S = s
2m
S s
2m
s
2m+1
= a
2m+1
= a
n+1
,
mentre se n `e dispari, n = 2m + 1,
0 S s
n
= S s
2m+1
s
2m+2
s
2m+1
= a
2m+2
= a
n+1
;
in ogni caso
[s
n
S[ a
n+1
n N,
e ci`o prova la tesi.
Osservazione 2.5.4 Il criterio di Leibniz `e ancora vero per le serie che ne
vericano le ipotesi soltanto denitivamente: ad esempio, la serie potreb-
be essere a termini di segno alterno solo da un certo indice in poi, ed i
termini stessi, in valore assoluto, potrebbero essere decrescenti solo da un
certo altro indice in poi. In questo caso, per`o, la stima [s
n
S[ a
n+1
va
opportunamente modicata.
Esempi 2.5.5 (1) La serie

(1)
n
n
`e convergente perche
1
n
`e una succes-
sione decrescente ed innitesima. Questo `e un esempio di serie convergente
ma non assolutamente convergente (dato che la serie dei valori assoluti `e la
serie armonica).
(2) La serie

(1)
n
n
100
2
n
`e convergente perche n
100
2
n
`e innitesima e
denitivamente decrescente (esercizio 2.5.6).
(3) La serie

(1)
n 10
n
n
10
n+1
non converge: il suo termine generale non `e in-
nitesimo.
(4) La serie

sin nx
n
2
converge per ogni x R: infatti `e assolutamente con-
vergente, per confronto con la serie

1
n
2
.
(5) Quando nessun criterio di convergenza `e applicabile, non rimane che ten-
tare uno studio diretto della serie e delle sue somme parziali, con il quale,
148
in certi casi, si riesce a determinarne il comportamento. Consideriamo ad
esempio la serie

n=1
(1)
n(n+1)
2
n
,
che non `e assolutamente convergente. Essa non `e a segni alterni: infatti si
ha
n(n+1)
2
=

n
k=1
k (esercizio 1.6.12), per cui la parit`a dellesponente di 1
cambia quando si somma un intero dispari e non cambia quando si somma
un intero pari. Il risultato `e che la sequenza dei segni `e 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, . . .
Per studiare il comportamento della serie, analizziamone direttamente le som-
me parziali: se N `e pari, N = 2m, si ha (dato che gli interi
2m(2m+1)
2
=
2m
2
+m e
(2m1)2m
2
= 2m
2
m hanno la stessa parit`a di m)
s
2m
=
2m

n=1
(1)
n(n+1)
2
n
=
= 1
1
2
+
1
3
+
1
4

1
5

1
6
+ +
(1)
m
2m1
+
(1)
m
2m
=
=
m

h=1
(1)
h
_
1
2h 1

1
2h
_
.
Questultima espressione `e la somma parziale m-sima di una serie che verica
le ipotesi del criterio di Leibniz e quindi `e convergente. Perci`o la successione
s
2m
converge ad un numero reale S. Se ora N `e dispari, N = 2m+1, si ha
s
2m+1
= s
2m
+
(1)
(2m+1)(2m+2)
2
2m + 1
S per m ;
quindi s
2m+1
converge anchessa a S. Se ne deduce, come nella dimostra-
zione del criterio di Leibniz, che lintera successione s
n
converge a S, e che
quindi la serie data `e convergente.
(6) Come ultimo esempio consideriamo la serie

n=1
z
n
n
, ove z `e un para-
metro complesso: utilizzando il criterio del rapporto si vede subito che essa
converge assolutamente quando [z[ < 1, mentre certamente non converge,
non essendo innitesimo il suo termine generale, quando [z[ > 1. Quando
[z[ = 1 non vi `e convergenza assoluta, ma la serie potrebbe convergere in certi
punti: ci`o `e vero, come sappiamo (esempio 2.5.5 (1)), per z = 1, mentre
149
non `e vero per z = 1. Cosa succede per gli altri z di modulo unitario?
Consideriamo le somme parziali
s
n
=
n

k=1
z
k
k
, n N
+
,
ove z C e [z[ = 1. Utilizziamo lidentit`a di Abel (esercizio 2.3.8), secondo
la quale se n N
+
e se a
1
, . . . , a
n
, b
1
, . . . , b
n
, b
n+1
sono numeri complessi,
allora
n

k=1
a
k
b
k
=
n
b
n+1

k=1

k
(b
k+1
b
k
),
ove
k
=

k
h=1
a
h
. Scegliamo
a
k
= z
k
, b
k
=
1
k
,
ed osserviamo che se z ,= 1 si ha

k
=
k

h=1
z
h
=
z(1 z
k
)
1 z
, [
k
[
2
[1 z[
k N
+
;
quindi la successione
k

kN
+ `e limitata. Sostituendo nellidentit`a di Abel
otteniamo per [z[ = 1, z ,= 1,
s
n
=
n

k=1
z
n
n
=

n
n + 1

n

k=1

k
_
1
k + 1

1
k
_
=

n
n + 1
+
n

k=1

k
k(k + 1)
.
Il primo addendo nellultimo membro tende a 0 per n , in virt` u della
limitatezza delle
k
; il secondo addendo `e la somma parziale di una serie as-
solutamente convergente, per confronto con la serie

1
k(k+1)
. Se ne conclude
che le somme parziali s
n
formano una successione convergente, e in denitiva
la serie

z
n
n
converge per ogni z di modulo unitario ad eccezione del punto
z = 1.
150
Esercizi 2.5
1. Determinare il comportamento delle seguenti serie:
(i)

n=0
n(1)
n
n
2
+ 1
, (ii)

n=5
(1)
n
2n 101
, (iii)

n=47
(1)
n
2 + sin n
,
(iv)

n=1
(1)
n
n
3/7
, (v)

n=1
(1)
n
(
n

3 1), (vi)

n=1
2 + (1)
n
n
2
,
(vii)

n=1
(1)
n
n
1/n
, (viii)

n=0
(sin(sin n))
n
, (ix)

n=0
_
sin(n + 1)
n
2
+ 1
_
n
.
2. Determinare per quali x R convergono, e per quali x R convergono
assolutamente, le seguenti serie:
(i)

n=0
x
n
n + 1
, (ii)

n=1
x
n
sin
1
n
, (iii)

n=0
n
n + 1
(x 1)
n
,
(iv)

n=1
sin
n
x
n
, (v)

n=0
(2)
n
e
nx
, (vi)

n=1
(log x)
n
2

n
,
(vii)

n=1
x
1/n
n
1+1/n
, (viii)

n=0
x

n
, (ix)

n=0
log
_
1 +
x
n
2
_
,
(x)

n=1
(n!)
3
x
n
n(3n)!
, (xi)

n=0
n
3
(4x)
n
2

n!
, (xii)

n=0
sin
3x
n
2
+ 1
.
3. Quanti addendi occorre sommare per approssimare la somma della serie

n=0
(1)
n
2n+1
con un errore minore di
1
100
?
4. Provare che la serie

n=1
(1)
n 2n+1
n(n+1)
`e convergente e calcolarne la
somma.
5. Per quali R la serie
1
1
2

+
1
3

1
4

+
1
5

1
6

+ +
1
2n 1

1
(2n)

+
`e convergente?
151
6. Si provi che la successione n

n
`e denitivamente decrescente per
ogni R e > 1.
7. Sia x un numero reale. Si provi che:
lim
n
sin nx x = k, k Z;
lim
n
cos nx x = 2k, k Z.
[Traccia: si supponga che L = lim
n
sin nx esista: usando la formula
di duplicazione per il seno si mostri dapprima che L = 0 oppure L =

3
2
; poi, usando la formula di addizione per sin(n+1)x, si deduca che
se L = 0 allora x `e multiplo di , mentre se L ,= 0 allora cos x =
1
2
: da
qui si ricavi un assurdo.]
8. Si consideri la successione denita per ricorrenza da
_
_
_
a
0
= 0
a
n+1
= (a
n
)
2
+
1
4
n N.
(i) Provare che a
n
`e crescente e limitata e calcolarne il limite L.
(ii) Provare che la serie

(L a
n
)
2
`e convergente e determinarne la
somma.
(iii) Discutere il comportamento per n della successione a
n

quando il valore di a
0
`e un numero > 0 qualsiasi, anziche 0.
9. Descrivere il comportamento delle seguenti serie:
(i)

n=0
1
n +i
, (ii)

n=1
sin(n/4)
n
, (iii)

n=0
(1)
n
i
n
2n + 1
, (iv)

n=1

n +in
n
2
in
.
10. Stabilire il comportamento della serie

n=1
z
n

n
sul bordo del cerchio di
convergenza.
[Traccia: utilizzare il procedimento dellesempio 2.5.5 (6).]
152
2.6 Successioni di Cauchy
Unimportante propriet`a delle successioni reali o complesse, strettamente
legata alla nozione di limite, `e quella espressa dalla denizione che segue.
Denizione 2.6.1 Sia a
n
una successione reale o complessa. Diciamo
che a
n
`e una successione di Cauchy se vale la condizione seguente:
N : [a
n
a
m
[ < n, m > .
Come si vede, la condizione di Cauchy `e molto vicina alla denizione di suc-
cessione convergente: invece che chiedere ai numeri a
n
di essere denitiva-
mente vicini al limite L, si chiede loro di avvicinarsi gli uni agli altri (sempre
denitivamente). Ma il legame con la nozione di limite `e strettissimo; infatti:
Proposizione 2.6.2 Sia a
n
una successione reale o complessa. Allora
a
n
`e una successione di Cauchy se e solo se essa `e convergente.
Dimostrazione Se a
n
converge al numero complesso L allora, per de-
nizione,
> 0 N : [a
n
L[ <

2
n > .
Quindi per ogni n, m > si ha
[a
n
a
m
[ [a
n
L[ +[L a
m
[ <

2
+

2
= ,
e quindi vale la condizione di Cauchy. Viceversa, supponiamo che valga la
condizione di Cauchy: allora, scelto = 2
k
, con k N, si ha che
k N
k
N : [a
n
a
m
[ < 2
k
n, m
k
,
e non `e restrittivo supporre che
k
>
k1
per ogni k 1: basta eventualmen-
te sostituire la k-sima soglia
k
con la soglia

k
= 1 + max
j
: 0 j k.
In particolare, avremo
[a

k+1
a

k
[ < 2
k
k N.
Di conseguenza la serie

(a

h+1
a

h
) `e assolutamente convergente; pertanto
lim
k
a

k
= lim
k
_
a

0
+
k1

h=0
_
a

h+1
a

h
_
_
= a

0
+

h=0
(a

h+1
a

h
) = L;
153
in altre parole, la sottosuccessione a

k
, ottenuta da a
n
prendendo solo
gli indici n della forma
k
e scartando tutti gli altri, `e convergente.
Proviamo adesso che lintera successione a
n
converge a L: ssato > 0, e
scelto k in modo che risulti [a

k
L[ <

2
ed anche 2
k
<

2
, dalla condizione
di Cauchy segue che
[a
n
L[ [a
n
a

k
[ +[a

k
L[ < 2
k
+

2
<

2
+

2
= n >
k
,
da cui la tesi.
Osservazioni 2.6.3 (1) Nel caso di una serie

a
n
di numeri reali o com-
plessi, la condizione di Cauchy si applica alle sue somme parziali ed equivale,
per quanto visto, alla convergenza della serie. Essa ha la forma
> 0 N : [s
n
s
m
[ =

k=m+1
a
k

< n > m ,
ovvero
> 0 N :

m+p

k=m+1
a
k

< m , p N
+
.
(2) Lequivalenza tra la condizione di Cauchy e la convergenza `e una pro-
priet`a legata allinsieme ambiente: `e vera per successioni in R o in C, ma
non `e vera in generale. Ad esempio, se ci limitiamo allambiente dei numeri
razionali, ci sono successioni a
n
Q le quali sono di Cauchy, ma non con-
vergono in Q. (Naturalmente ci`o non toglie che esse abbiano limite in R!)
Un facile esempio `e la successione
_
1 +
1
n
_
n
, che converge al numero reale e,
il quale non `e razionale (esercizio 2.3.1).
Esercizi 2.6
1. Si provi che ogni successione di Cauchy `e limitata, ma che il viceversa
`e falso.
2. Si provi che se una successione di Cauchy ha una sottosuccessione con-
vergente ad un certo valore L C, allora lintera successione ha limite
L.
154
3. Data una successione reale a
n
, per ogni k N poniamo L
k
=
sup
nk
a
n
e
k
= inf
nk
a
n
. Provare che:
(i) L
k

kN
`e decrescente,
k

kN
`e crescente, e
h
L
k
+
per ogni h, k N.
(ii) Posto L = lim
k
L
k
e = lim
k

k
, si ha L +;
i numeri L e sono chiamati massimo limite e minimo limite della
successione a
n
; si scrive L = maxlim
n
a
n
e = minlim
n
a
n
,
o anche L = limsup
n
a
n
e = liminf
n
a
n
.
(iii) Si ha L = se e solo se esiste = lim
n
a
n
, e in tal caso
= L = ;
(iv) limsup
n
a
n
= r R se e solo se
(a) per ogni > 0 esiste N tale che a
n
< r + per ogni n ,
(b) per ogni > 0 si ha r < a
n
per inniti numeri n N.
(v) liminf
n
a
n
= R se e solo se
(a) per ogni > 0 esiste N tale che a
n
> per ogni n ,
(b) per ogni > 0 si ha + > a
n
per inniti numeri n N.
4. Provare che da ogni successione reale a
n
si possono estrarre due sotto-
successioni che tendono rispettivamente al massimo limite e al minimo
limite di a
n
.
2.7 Serie di potenze
Una serie di potenze `e una serie della forma

n=0
a
n
z
n
,
ove a
n
`e una arbitraria successione reale o complessa (ssata) e z `e un
parametro complesso (variabile). Quindi per ogni scelta di z C si ha una
serie numerica che potr`a convergere oppure no; la somma della serie sar`a
dunque una funzione di z, denita sullinsieme dei numeri z tali che la serie
`e convergente. Le somme parziali
s
n
(z) =
n

k=0
a
k
z
k
155
sono quindi polinomi nella variabile z (cio`e combinazioni lineari nite di
monomi, vale a dire di potenze di z). I numeri a
k
si dicono coecienti della
serie di potenze.
Osservazione 2.7.1 Quando z = 0, il primo termine della serie di potenze,
a
0
0
0
, non ha senso; per z ,= 0 esso `e a
0
1 = a
0
. Allora conveniamo di porre
a
0
z
0
= a
0
anche quando z = 0; avremo quindi, per denizione,

n=0
a
n
z
n
= a
0
+a
1
z +a
2
z
2
+. . . +a
n
z
n
+. . . z C.
Chiaramente allora ogni serie di potenze converge quando z = 0, con somma
a
0
. Il nostro obiettivo `e trovare condizioni che implichino la convergenza
della serie di potenze in altri punti z ,= 0, e caratterizzare linsieme di tali z.
Osservazione 2.7.2 Pi` u in generale si possono considerare serie di potenze
della forma

n=0
a
n
(z z
0
)
n
,
con z
0
C ssato; ma con il cambiamento di variabile y = z z
0
ci si
riconduce immediatamente al caso in cui z
0
= 0, e quindi basta considerare
questo caso.
Lambito naturale delle serie di potenze `e il campo complesso; ci`o non toglie
che talvolta sia interessante considerare serie di potenze reali, cio`e di variabile
reale: per queste ultime verr`a usata la variabile x al posto della z, scrivendole
nella forma

n=0
a
n
x
n
.
Esempi 2.7.3 (1) La serie geometrica

n=0
z
n
`e una serie di potenze (ove
a
n
= 1 per ogni n N) che converge assolutamente per [z[ < 1 con somma
1
1z
e non converge per [z[ 1.
(2) Ogni polinomio

N
n=0
a
n
z
n
`e una serie di potenze in cui a
n
= 0 per ogni
n > N, e ovviamente tale serie converge per ogni z C.
(3) La serie esponenziale

n=0
z
n
n!
converge assolutamente per ogni z C
grazie al criterio del rapporto; calcoleremo la sua somma fra breve.
(4) La serie

n=0
n!z
n
converge per z = 0 e non converge per alcun z
C 0.
156
(5) La serie

n=1
z
n
n
converge per tutti gli z C tali che [z[ 1 e z ,= 1,
mentre non converge per z = 1 e per [z[ > 1 (esempio 2.5.5 (6)).
Vediamo qualche criterio di convergenza.
Proposizione 2.7.4 Se i termini a
n
z
n
di una serie di potenze sono limitati
per [z[ = R, ossia esiste K > 0 per cui risulta
[a
n
[R
n
K n N,
allora

a
n
z
n
`e assolutamente convergente in ogni punto z C con [z[ < R.
Dimostrazione Se [z[ < R possiamo scrivere
[a
n
z
n
[ = [a
n
[R
n
_
[z[
R
_
n
K

z
R

n
n N,
da cui la tesi per confronto con la serie geometrica di ragione
|z|
R
< 1.
Corollario 2.7.5 Se una serie di po-
tenze

n=0
a
n
z
n
converge in un pun-
to z
1
C 0, essa converge asso-
lutamente in ogni punto z C con
[z[ < [z
1
[; se la serie non converge in
un punto z
2
C, essa non converge (ed
anzi la serie dei moduli diverge a +)
in ogni z C con [z[ > [z
2
[.
Dimostrazione La prima parte dellenunciato segue dalla proposizione pre-
cedente, perche, per ipotesi, la successione a
n
z
n
1
`e innitesima e quindi limi-
tata. Se poi la serie convergesse in un punto z con [z[ > [z
2
[, per la parte gi`a
dimostrata avremmo la convergenza assoluta nel punto z
2
, il che `e assurdo.
Esempi 2.7.6 (1) I termini della serie di potenze

n=0
n1
n+1
z
n
sono limitati
per [z[ = 1. Quindi la serie converge assolutamente per [z[ < 1. Daltra
parte essa non pu`o convergere per [z[ 1 perche il termine generale non `e
innitesimo.
157
(2) La serie

n=0
nz
n
, pur non avendo i termini limitati per [z[ = 1, `e
assolutamente convergente per [z[ < 1, come mostra il criterio del rapporto,
mentre non converge per [z[ 1.
I risultati e gli esempi precedenti fanno pensare che linsieme dei numeri
z C tali che la serie

a
n
z
n
`e convergente somigli ad un cerchio di centro
lorigine, e motivano la seguente
Denizione 2.7.7 Il raggio di convergenza di una serie di potenze

a
n
z
n
`e il numero (appartenente a [0, +])
R = sup
_
[z[ : z C e

n=0
a
n
z
n
`e convergente
_
.
Il cerchio di convergenza della serie `e il cerchio di centro 0 e raggio pari al
raggio di convergenza:
B
R
= z C : [z[ < R.
Si noti che B

= C e B
0
= . Se la serie `e reale, si parla di intervallo di
convergenza ] R, R[; risulta ovviamente ] R, R[= B
R
R.
Teorema 2.7.8 Sia R il raggio di convergenza della serie di potenze

a
n
z
n
.
Allora:
(i) se R = 0, la serie converge solo per z = 0;
(ii) se R = +, la serie converge assolutamente per ogni z C;
(iii) se 0 < R < +, la serie converge assolutamente per ogni z B
R
e
non converge per ogni z C con [z[ > R;
(iv) nulla si pu`o dire in generale sulla convergenza della serie nei punti
z C con [z[ = R.
Dim (i) Se la serie convergesse in z ,= 0 avremmo R = 0 < [z[, contro la
denizione di raggio di convergenza.
(ii) Sia
A =
_
[z[ : z C e

n=0
a
n
z
n
`e convergente
_
,
158
cosicche sup A = R = +. Sia z C; poiche [z[ non `e un maggiorante di A,
esiste z
1
C tale che [z
1
[ > [z[ e [z
1
[ A, ossia

a
n
z
n
1
`e convergente. Dal
corollario 2.7.5 segue che

[a
n
z
n
[ `e convergente, cio`e la tesi.
(iii) Sia A denito come prima. Fissiamo z C con [z[ < R; poiche [z[ non
`e un maggiorante di A, esiste z
1
C tale che [z[ < [z
1
[ < R e [z
1
[ A, ossia

a
n
z
n
1
`e convergente. Dal corollario 2.7.5 segue che

[a
n
z
n
[ `e convergente.
Fissiamo ora z C con [z[ > R: se la serie convergesse nel punto z, avremmo
z A e quindi [z[ R, il che `e assurdo.
(iv) Lultima aermazione `e provata dai seguenti esempi: le tre serie

n=0
z
n
,

n=1
z
n
n
2
,

n=1
z
n
n
hanno tutte raggio di convergenza 1; tuttavia:


z
n
non converge in alcun punto z C con [z[ = 1,


z
n
n
2
converge assolutamente in tutti gli z C con [z[ = 1,


z
n
n
converge (non assolutamente) in ogni z C con [z[ = 1, salvo
che in z = 1 (esempio 2.5.5 (6)).
Come si determina il raggio di convergenza di una serie di potenze? Spesso
`e utile il seguente criterio:
Proposizione 2.7.9 Sia

a
n
z
n
una serie di potenze. Se esiste il limite
lim
n
n
_
[a
n
[ = L,
allora il raggio di convergenza della serie `e
R =
_

_
+ se L = 0
1/L se 0 < L <
0 se L = +.
Dimostrazione Sia, al solito, A = [z[ : z C e

a
n
z
n
`e convergente.
Utilizziamo il criterio della radice: per n si ha
n
_
[a
n
z
n
[ =
n
_
[a
n
[[z[ L[z[.
159
Dunque se L = 0 la serie `e assolutamente convergente per ogni z C, cio`e
A = [0, +[ e pertanto R = +. Se L = +, la serie non converge per
nessun z C 0, quindi A = 0 e R = 0. Se 0 < L < +, la serie `e
assolutamente convergente per gli z C tali che [z[ <
1
L
, mentre non converge
per gli z C tali che [z[ >
1
L
; la prima asserzione dice che [0, 1/L[ A,
la seconda dice che A]1/L, [= . Perci`o [0, 1/L[ A [0, 1/L], ossia
R = 1/L.
La pi` u generale versione della proposizione 2.7.9 `e esposta nellesercizio 2.7.1.
Esempi 2.7.10 (1) La serie

z
n
ha raggio di convergenza 1 qualunque
sia R: infatti
lim
n
n

= 1 R.
(2) Se b > 0, la serie

(bz)
n
ha raggio di convergenza 1/b: infatti ovviamente
lim
n
n

b
n
= b.
(3) Per calcolare il raggio di convergenza della serie

(nz)
n
n!
il criterio prece-
dente `e poco utile, perche richiede di calcolare il non facile limite
lim
n
n
_
n
n
n!
= lim
n
n
n

n!
.
Utilizziamo invece il criterio del rapporto: dato che (denizione 2.3.6)
lim
n
n! (n + 1)
n+1
[z[
n+1
(n + 1)! n
n
[z[
n
= lim
n
_
n + 1
n
_
n
[z[ = e[z[,
avremo che la serie converge assolutamente per tutti gli z C per cui ri-
sulta e[z[ < 1, mentre non potr`a convergere, essendo il suo termine generale
denitivamente crescente in modulo, per gli z C tali che e[z[ > 1. Se ne
deduce che R = 1/e.
Si noti che dalla relazione
lim
n
n! (n + 1)
n+1
(n + 1)! n
n
= e
e dallesercizio 2.4.12 segue che
n
n

n!
e, ossia
lim
n
n

n!
n
=
1
e
:
si confronti questo risultato con la stima dellesercizio 1.6.16.
160
La serie esponenziale
Come sappiamo, la serie esponenziale

n=0
z
n
n!
converge assolutamente in
ogni punto z C; ci proponiamo di calcolarne la somma. Ricordiamo che se
z = 1 la somma della serie `e, per denizione, il numero e.
Teorema 2.7.11 Per ogni z = x +iy C si ha:
lim
n
_
1 +
z
n
_
n
=

n=0
z
n
n!
= e
x
(cos y +i sin y).
In particolare risulta
cos y =

h=0
(1)
h
y
2h
(2h)!
, sin y =

h=0
(1)
h
y
2h+1
(2h + 1)!
y R.
Dimostrazione Fissiamo z = x +iy C. Possiamo scrivere
_
1 +
z
n
_
n
=
_
1 +
x
n
+i
y
n
_
n
=
=
_
1 +
x
n
_
n
_
1 +i
y
n
1 +
x
n
_
n
=
_
1 +
x
n
_
n
_
1 +i
y
n +x
_
n
.
1
o
passo: calcoliamo il limite della successione reale
_
1 +
x
n
_
n
per un
arbitrario x R.
Come sappiamo, tale successione `e sicuramente crescente non appena n >
[x[ (esempio 1.8.3 (2)).
`
E chiaro che se x = 0 la successione ha limite 1.
Supponiamo x > 0 e poniamo
k
n
=
_
n
x
_
, n N;
chiaramente k
n
k
n+1
e k
n
+ per n . Possiamo scrivere
_
1 +
x
n
_
n
=
_
_
1 +
1
n/x
_
n/x
_
x
,
e osservando che k
n
n/x < k
n
+ 1, deduciamo
_
1 +
1
k
n
+ 1
_
kn
<
_
1 +
1
n/x
_
n/x
<
_
1 +
1
k
n
_
kn+1
n N.
161
Per il teorema dei carabinieri, ricaviamo
lim
n
_
1 +
1
n/x
_
n/x
= e;
dallesercizio 2.1.24 segue allora
lim
n
_
_
1 +
1
n/x
_
n/x
_
x
= e
x
x > 0.
Sia ora x < 0. Possiamo scrivere
_
1 +
x
n
_
n
=
_
_
1
1
n/[x[
_
n/|x|
_
|x|
,
e ponendo stavolta k
n
=
_
n
|x|
_
si ha
_
1
1
k
n
_
kn+1
<
_
1
1
n/[x[
_
n/|x|
<
_
1
1
k
n
+ 1
_
kn
n N,
da cui
lim
n
_
1
1
n/[x[
_
n
=
1
e
e, per lesercizio 2.1.24,
lim
n
_
_
1
1
n/[x[
_
n/|x|
_
|x|
=
_
1
e
_
|x|
= e
x
x < 0.
In denitiva
lim
n
_
1 +
x
n
_
n
= e
x
x R.
2
o
passo: calcoliamo il limite della successione complessa
b
n
=
_
1 +i
y
n +x
_
n
.
Poniamo
c
n
= 1 +i
y
n +x
= [c
n
[(cos
n
+i sin
n
)
162
ove
n
] /2, /2[ dato che la parte reale di c
n
`e positiva. Allora dalla
formula di de Moivre (paragrafo 1.12) si ottiene
b
n
= [c
n
[
n
(cos n
n
+i sin n
n
).
Valutiamo il modulo di b
n
, cio`e [c
n
[
n
: si ha per n sucientemente grande (in
modo che n +x n/2)
1 [b
n
[ =
_
1 +
y
2
(n +x)
2
_n
2

_
1 +
y
2
(n/2)
2
_n
2
=
_
_
1 +
4y
2
n
2
_
n
2
_ 1
2n

_
e
4y
2
_ 1
2n
,
e per il teorema dei carabinieri
lim
n
[c
n
[
n
= 1.
Valutiamo ora largomento di b
n
, cio`e n
n
: anzitutto, dato che
[c
n
[ cos
n
= 1, [c
n
[ sin
n
=
y
n +x
,
si ha tan
n
=
y
n+x
0 per n .
Notiamo adesso che dalla proposizione 1.12.18 segue che
cos x
[ sin x[
[x[
1 x ] /2, /2[0;
inoltre ricordiamo che (esercizio 1.12.9)
[ cos x 1[ [x[ x R.
Dal fatto che tan
n
`e innitesima si ricava allora

n
0, cos
n
1,

n
tan
n
1 per n ,
e di conseguenza
n
n
= (ntan
n
)

n
tan
n
=
ny
n +x


n
tan
n
y per n ,
163
da cui nalmente
cos n
n
+i sin n
n
cos y +i sin y per n .
Pertanto si conclude che
lim
n
b
n
= lim
n
[c
n
[
n
(cos n
n
+i sin n
n
) = cos y +i sin y.
Dai primi due passi della dimostrazione deduciamo che
lim
n
_
1 +
z
n
_
n
= e
x
(cos y +i sin y).
3
o
passo: mostriamo che la somma della serie

n=0
z
n
n!
coincide col prece-
dente limite.
Ripeteremo, con qualche modica, la dimostrazione della proposizione 2.3.5.
Fissiamo m N: allora si ha
lim
n
1
n
k
_
n
k
_
= lim
n
n(n 1) . . . (n k + 1)
n
k
k!
=
1
k!
per k = 0, 1, 2, . . . , m.
Quindi se z C possiamo scrivere
m

k=0
z
k
k!
= lim
n
m

k=0
_
n
k
_
z
k
n
k
m N.
Daltra parte se n > m si ha, per la formula del binomio (teorema 1.7.1)
m

k=0
_
n
k
_
z
k
n
k
=
n

k=0
_
n
k
_
z
k
n
k

n

k=m+1
_
n
k
_
z
k
n
k
=
_
1 +
z
n
_
n

k=m+1
_
n
k
_
z
k
n
k
,
quindi per n > m si deduce

k=0
_
n
k
_
z
k
n
k

_
1 +
z
n
_
n

k=m+1
_
n
k
_
z
k
n
k

k=m+1
_
n
k
_
[z[
k
n
k
=
n

k=m+1
[z[
k
k!
n
n

n 1
n
. . .
n k + 1
n

k=m+1
[z[
k
k!
;
164
pertanto quando n segue che

k=0
z
k
k!
lim
n
_
1 +
z
n
_
n

lim
n
m

k=0
_
n
k
_
z
k
n
k
lim
n
_
1 +
z
n
_
n

=
= lim
n

k=0
_
n
k
_
z
k
n
k

_
1 +
z
n
_
n

k=m+1
[z[
k
k!
m N
+
.
Adesso facciamo tendere anche m a +: tenuto conto dellosservazione 2.2.7,
si ottiene

k=0
z
k
k!
lim
n
_
1 +
z
n
_
n

lim
m

k=m+1
[z[
k
k!
= 0,
cio`e la tesi del 3
o
passo. Il teorema `e completamente dimostrato.
La funzione complessa z = x + iy e
x
(cos y + i sin y) `e una estensione a C
della funzione esponenziale reale e
x
. Essa si chiama esponenziale complessa
e si indica con e
z
. Dunque, per denizione e per quanto dimostrato,
e
z
= e
Rez
(cos Imz +i sin Imz) =

n=0
z
n
n!
= lim
n
_
1 +
z
n
_
n
z C.
In particolare, scegliendo z = iy immaginario puro, si ha la formula di Eulero
e
iy
= cos y +i sin y y R,
ed anche
e
iy
=

n=0
i
n
y
n
n!
= lim
N
2N

n=0
i
n
y
n
n!
y R;
poiche i
2h
= (1)
h
e i
2h+1
= i(1)
h
, decomponendo la somma in indici pari
ed indici dispari si trova
e
iy
= lim
N
_
N

h=0
(1)
h
y
2h
(2h)!
+i
N1

h=0
(1)
h
y
2h+1
(2h + 1)!
_
,
e dato che le somme parziali a secondo membro si riferiscono a due serie che
sono entrambe assolutamente convergenti per ogni y R, si deduce
cos y +i sin y =

h=0
(1)
h
y
2h
(2h)!
+i

h=0
(1)
h
y
2h+1
(2h + 1)!
y R.
165
Inne, uguagliando fra loro parti reali e parti immaginarie, si ottengono gli
sviluppi in serie per le funzioni seno e coseno:
cos y =

h=0
(1)
h
y
2h
(2h)!
y R,
sin y =

h=0
(1)
h
y
2h+1
(2h + 1)!
y R.
Il teorema `e completamente dimostrato.
Esercizi 2.7
1. Sia

a
n
z
n
una serie di potenze. Si provi che, posto
L = limsup
n
n
_
[a
n
[
(si veda lesercizio 2.6.3, il raggio di convergenza R della serie `e dato
da
R =
_

_
+ se L = 0
1/L se 0 < L <
0 se L = +.
2. Determinare il raggio di convergenza delle seguenti serie di potenze:
(i)

n=0
z
n!
, (ii)

n=0
z
n
n + 2
n
, (iii)

n=0
_
i
2 +i
_
n
z
n
,
(iv)

n=0
2
n
2
z
n
, (v)

n=1
3
n
7
n
4
n
3
n
z
n
, (vi)

n=0
_
n
2n + 1
_
2n1
z
n
,
(vii)

n=1
z
n
n
n
n
, (viii)

n=0
3

n
z
n
, (ix)

n=0
[(2)
n
+ 1]z
n
,
(x)

n=0
n!
n
n
z
n
, (xi)

n=0
(n!)
2
(2n)!
z
n
2
, (xii)

n=1
(2n 1) . . . 3 1
2n . . . 4 2
z
n
.
166
3. Dimostrare le seguenti uguaglianze, specicando per quali z C sono
vere:
(i)

n=0
(1)
n
z
n
=
1
1 +z
; (ii)

n=0
z
2n
=
1
1 z
2
;
(iii)

n=0
(1)
n
z
2n
=
1
1 +z
2
; (iv)

n=1
i
n
z
2n
=
iz
2
1 iz
2
.
4. Sia

a
n
una serie convergente: si provi che il raggio di convergenza
della serie di potenze

a
n
z
n
`e non inferiore a 1.
5. (i) Trovare il raggio di convergenza R della serie

n=0
(n + 1)z
2n
.
(ii) Posto R
n
(z) =

k=n
(k + 1)z
2k
, si verichi che
(1 z
2
)R
n
(z) = nz
2n
+
z
2n
1 z
2
z C con [z[ < R.
(iii) Si calcoli per [z[ < R la somma della serie.
6. (i) Determinare il raggio di convergenza R della serie di potenze

n=1
1
n
3 5 7 . . . (4n 1) (4n + 1)
4
2
8
2
. . . (4n 4)
2
(4n)
2
x
n
;
(ii) vericare che
1
n

3(4n + 1)
4(4n)
< a
n
<
1
n
n N
+
;
(iii) descrivere il comportamento della serie nei punti x = R e x = R.
7. Sia F
n
la successione dei numeri di Fibonacci (esercizio 2.3.13).
(i) Determinare il raggio di convergenza R della serie

n=0
F
n
z
n
.
(ii) Detta S(z) la somma della serie, provare che (1 z z
2
)S(z) = z,
ossia
S(z) =
z
1 z z
2
z C con [z[ < R.
167
8. Trovare due serie di potenze nella variabile z che abbiano come som-
me, nei rispettivi cerchi di convergenza di cui si troveranno i raggi, le
funzioni
F(z) =
1
z
2
+ 4z + 3
, G(z) =
1
z
2
+z + 1
.
9. Sia R il raggio di convergenza di

n=0
a
n
z
n
: provare che anche le serie

n=1
1
n
a
n
z
n
,

n=0
na
n
z
n
,

n=0
a
n+m
z
n
(con m N ssato)
hanno raggio di convergenza R.
10. Trovare il raggio di convergenza della serie

a
n
z
n
, ove a
n
`e data da
_
a
0
= 1/2
a
n+1
= a
n
(1 a
n
) n N.
11. Le funzioni coseno iperbolico e
seno iperbolico sono denite da
cosh x =
e
x
+e
x
2
, x R,
sinh x =
e
x
e
x
2
, x R.
Provare che
cosh x =

n=0
x
2n
(2n)!
x R,
sinh x =

n=0
x
2n+1
(2n + 1)!
x R.
168
12. Si provino le seguenti relazioni che legano fra
loro le funzioni iperboliche sinh x e cosh x, e che
sono valide per ogni x, y R:
(i) cosh
2
x sinh
2
x = 1;
(ii) cosh(x +y) = cosh x cosh y + sinh x sinh y,
(iii) sinh(x +y) = sinh x cosh y + cosh x sinh y.
13. Calcolare la somma delle seguenti serie, specicando per quali z C
esse sono convergenti:
(i)

n=0
(1)
n
z
2n
n!
, (ii)

n=0
z
3n+2
n!
, (iii)

n=1
z
n1
(n + 1)!
.
14. Calcolare la somma delle seguenti serie, specicando per quali x R
esse sono convergenti:
(i)

n=0
(1)
n
x
n
(2n)!
, (ii)

n=0
(1)
n
x
4n
(2n + 1)!
, (iii)

n=2
x
3n
(2n 3)!
.
15. Siano , R. Si provi che se x ] 1, 1[ si ha

n=0
x
n
cos( +n) =
cos x cos( )
1 2x cos +x
2
,

n=0
x
n
sin( +n) =
sin x sin( )
1 2x cos +x
2
.
169
16. Calcolare la somma delle seguenti serie, ove , R:
(i)

n=0
cos( +n)
n!
, (ii)

n=0
sin( +n)
n!
,
(iii)

n=0
(1)
n
cos( +n)
(2n)!
, (iv)

n=0
(1)
n
sin( +n)
(2n)!
,
(v)

n=0
cos( +n)
(2n + 1)!
, (vi)

n=0
sin( +n)
(2n + 1)!
,
(vii)

n=0
(5i)
n
cos( 3n)
(2n + 2)!
, (viii)

n=0
(5i)
n
sin( 3n)
(2n + 2)!
.
17. Determinare la parte reale e la parte immaginaria dei seguenti numeri:
e
1i
, e
32i
, e
(1+i)
4
, ie
|1+2i|
, e
i(i1)
.
18. Determinare il luogo dei punti z C in cui ciascuna delle due funzioni
f(z) = e
z
, g(z) = e
z
2
assume valori reali, ed il luogo ove ciascuna assume valori puramente
immaginari.
19. Determinare il luogo dei punti z C in cui ciascuna delle due funzioni
g(z) = e
z
2
, h(z) = e
z
3
ha modulo unitario.
20. Fissato k N
+
, si consideri la serie

n=0
e
2in/k
z
n+1+(1)
n
e se ne determini linsieme di convergenza. Qual`e la somma?
170
2.8 Riordinamento dei termini di una serie
Cosa succede se si modica lordine degli addendi di una serie? Le propriet`a
di convergenza si mantengono o si alterano?
Intanto bisogna intendersi sul signicato di questa operazione: ad esempio,
sommare i termini in ordine inverso ha senso solo per somme nite. Andia-
mo allora a chiarire con una denizione ci`o che intendiamo quando parliamo
di riordinamento dei termini di una serie.
Denizione 2.8.1 a termini reali o complessi, e sia : N N una funzione
bigettiva, cio`e sia iniettiva che surgettiva: in altre parole, per ogni k N
esiste uno ed un solo n N tale che (n) = k. Posto b
n
= a
(n)
per ogni
n N, la serie

n=0
b
n
si dice riordinamento della serie

n=0
a
n
.
Osservazioni 2.8.2 (1) Nella serie

n=0
b
n
ciascun termine a
k
compare
esattamente una volta, e cio`e quando n =
1
(k), ossia quando n assume
lunico valore n
k
N tale che (n
k
) = k. Quindi

n=0
b
n
ha esattamente
gli stessi addendi di

k=0
a
k
.
(2) Se

n=0
b
n
`e un riordinamento di

n=0
a
n
(costruito mediante la cor-
rispondenza biunivoca ), allora, viceversa,

n=0
a
n
`e un riordinamento di

n=0
b
n
(mediante la corrispondenza biunivoca
1
, inversa di ).
Il risultato che segue risponde alla domanda iniziale.
Teorema 2.8.3 (di Dirichlet) Sia

a
n
una serie reale o complessa asso-
lutamente convergente. Allora ogni suo riordinamento

b
n
`e assolutamente
convergente ed ha la stessa somma:

n=0
a
n
=

n=0
b
n
.
Se

a
n
non `e assolutamente convergente, allora nessun riordinamento lo `e.
Si osservi che, di conseguenza, per ogni serie

a
n
e per ogni suo riordina-
mento

b
n
si ha

n=0
[a
n
[ =

n=0
[b
n
[
(questo valore potr`a essere nito o +).
171
Dimostrazione Con le stesse considerazioni fatte alla ne della dimostra-
zione della proposizione 2.5.2, si verica che possiamo limitarci al caso di
serie a termini reali. Supponiamo dapprima a
n
0 per ogni n N, e siano
S =

n=0
a
n
, s
n
=
n

k=0
a
k
,
n
=
n

k=0
b
k
.
Per ipotesi, si ha s
n
S per ogni n N; inoltre, posto
m
n
= max(0), (1), . . . , (n),
si ha

n
=
n

k=0
a
(k)

mn

h=0
a
h
= s
mn
S n N,
cosicche

b
n
`e convergente ed ha somma non superiore a S. Daltra par-
te, essendo

a
n
a sua volta un riordinamento di

b
n
, con ragionamento
simmetrico si ha che
S

n=0
b
n
,
e dunque si ha luguaglianza.
Passiamo ora al caso generale: come si `e fatto nella dimostrazione della
proposizione 2.5.2, poniamo

n
= [a
n
[ a
n
,
n
= [b
n
[ b
n
n N,
cosicche
0
n
2[a
n
[, 0
n
2[b
n
[ n N.
La serie

n
`e a termini positivi e converge per il criterio del confronto;
dunque, per la parte gi`a dimostrata, il suo riordinamento

n
`e convergente
e si ha luguaglianza

n=0

n
=

n=0

n
.
Inoltre, sempre in virt` u della parte gi`a dimostrata, poiche la serie

[a
n
[ `e
convergente, il suo riordinamento

[b
n
[ `e convergente e

n=0
[a
n
[ =

n=0
[b
n
[,
172
cosicche

b
n
`e assolutamente convergente. Ne segue

n=0
b
n
=

n=0
[b
n
[

n=0

n
=

n=0
[a
n
[

n=0

n
=

n=0
a
n
.
Notiamo inne che se

a
n
non `e assolutamente convergente, non pu`o esserlo
nemmeno

b
n
, perche se fosse

[b
n
[ < +, per la parte gi`a dimostrata
dedurremmo

[a
n
[ =

[b
n
[ < +, essendo

a
n
un riordinamento di

b
n
.
Osservazione 2.8.4 Per le serie

a
n
assolutamente convergenti si ha una
propriet`a di riordinamento ancora pi` u forte di quella espressa dal teorema di
Dirichlet: se A e B sono sottoinsiemi disgiunti di N, la cui unione `e tutto N,
allora

n=0
a
n
=

nA
a
n
+

nB
a
n
(esercizio 2.8.1). Si noti che questa propriet`a non pu`o valere senza lipotesi
di assoluta convergenza: se A `e linsieme dei numeri naturali pari e B quello
dei numeri naturali dispari, la serie

n=0
(1)
n
n+1
si decomporrebbe in due serie
divergenti a + ed a , la cui addizione non avrebbe senso.
Se una serie

a
n
`e convergente, ma non assolutamente convergente, lope-
razione di riordinamento pu`o alterare il valore della somma, come `e mostrato
dal seguente
Esempio 2.8.5 La serie

n=0
(1)
n
n+1
`e convergente ad un numero reale S
(che `e uguale a log 2, come vedremo pi` u avanti), ma non `e assolutamente
convergente. Si ha quindi
1
1
2
+
1
3

1
4
+
1
5

1
6
+
1
7

1
8
+. . . = S,
e dividendo per 2
1
2

1
4
+
1
6

1
8
+
1
10

1
12
+
1
14

1
16
+. . . =
S
2
.
Consideriamo ora la serie

n=0
c
n
= 0 +
1
2
+ 0
1
4
+ 0 +
1
6
+ 0
1
8
+ 0 +. . . ;
173
il suo termine generale `e dunque
c
n
=
_
_
_
0 se n `e pari

(1)
(n+1)/2
n + 1
se n `e dispari
.
Tale serie `e convergente con somma S/2, in quanto le sue somme parziali di
indice 2N + 1 coincidono con quelle di indice N della serie
1
2

(1)
n
n+1
: ossia
0 +
1
2
+ 0
1
4
+ 0 +
1
6
+ 0
1
8
+ 0 +
1
10
+ 0
1
12
+ 0 +. . . =
S
2
.
Sommando ora questa serie con la serie

n=0
(1)
n
n+1
si trova
(0 + 1) +
_
1
2

1
2
_
+
_
0 +
1
3
_
+
_

1
4

1
4
_
+
_
0 +
1
5
_
+
+
_
1
6

1
6
_
+
_
0 +
1
7
_
+
_

1
8

1
8
_
+. . . =
_
S
2
+S
_
,
ovvero
1 + 0 +
1
3

1
2
+
1
5
+ 0 +
1
7

1
4
+
1
9
+ 0 +
1
11

1
6
+
1
13
+ 0 +. . . =
3S
2
.
Adesso notiamo che la serie

b
n
che si ottiene da questa sopprimendo i
termini nulli (che sono quelli di indici 1, 5, 9, . . . , 4n + 1, . . . ) converge alla
stessa somma
3S
2
: infatti, le sue somme parziali di indice 3N + 1 coincidono
con le somme parziali di indice 4N +1 della serie contenente anche i termini
nulli. Tuttavia la serie

b
n
, cio`e
1 +
1
3

1
2
+
1
5
+
1
7

1
4
+
1
9
+
1
11

1
6
+
1
13
+. . . ,
`e evidentemente un riordinamento della serie

n=0
(1)
n
n+1
, che convergeva a
S. Non `e dicile vericare che la corrispondenza biunivoca fra gli indici
delle due serie `e data da
_
_
_
(3n) = 4n
(3n + 1) = 4n + 2
(3n + 2) = 2n + 1
n N.
Per le serie non assolutamente convergenti vale questo risultato ancora pi` u
drastico:
174
Teorema 2.8.6 (di Riemann) Sia

a
n
una serie reale convergente, ma
non assolutamente convergente. Allora:
(i) per ogni L R esiste un riordinamento di

a
n
che ha somma L;
(ii) esiste un riordinamento di

a
n
che diverge positivamente;
(iii) esiste un riordinamento di

a
n
che diverge negativamente;
(iv) esiste un riordinamento di

a
n
che `e indeterminato.
Dimostrazione (i) Osserviamo anzitutto che la serie

a
n
contiene inniti
termini strettamente positivi e inniti termini strettamente negativi, altri-
menti essa avrebbe termini denitivamente a segno costante e quindi, essendo
convergente, sarebbe anche assolutamente convergente. Poniamo
p
n
= maxa
n
, 0, q
n
= maxa
n
, 0 n N,
cosicche
p
n
0, q
n
0, p
n
q
n
= a
n
, p
n
+q
n
= [a
n
[ n N;
inoltre a
n
coincide o con p
n
(e allora q
n
= 0), o con q
n
(e allora p
n
= 0).
Essendo in particolare
N

n=0
a
n
=
N

n=0
p
n

n=0
q
n
,
N

n=0
[a
n
[ =
N

n=0
p
n
+
N

n=0
q
n
N N,
dallipotesi sulla serie

a
n
si deduce

n=0
p
n
=

n=0
q
n
= +
(altrimenti, se entrambe queste due serie fossero convergenti, otterremmo che

[a
n
[ converge, mentre se convergesse solo una delle due otterremmo che

a
n
diverge).
Daltra parte, essendo 0 p
n
[a
n
[ e 0 q
n
[a
n
[ per ogni n N, si ha
anche
lim
n
p
n
= lim
n
q
n
= 0.
Ci`o premesso, ssiamo L R. Costruiremo adesso una serie, che si otterr`a
riordinando i termini di

a
n
, e che soddisfer`a la tesi: essa sar`a formata da
175
un certo numero di p
n
, seguiti da un certo numero di q
n
, poi ancora da un
po di p
n
, poi di nuovo da un po di q
n
, e cos` di seguito, in modo da oscil-
lare attorno al valore L prescelto. A questo scopo andiamo a costruire due
opportune successioni crescenti di indici, m
n

nN
+ e k
n

nN
+, e formiamo
la serie
m
1

n=0
p
n

k
1

n=0
q
n
+
m
2

n=m
1
+1
p
n

k
2

n=k
1
+1
q
n
+. . . +
m
h

m
h1
+1
p
n

k
h

n=k
h1
+1
q
n
+. . . ;
denoteremo con s
n
la sua n-sima somma parziale.
Fissiamo due successioni
n
e
n
, entrambe convergenti a L e tali che

n
< L <
n
: ad esempio prenderemo senzaltro
n
= L
1
n
e
n
= L +
1
n
.
Deniamo adesso gli indici m
n
e k
n
: m
1
`e il minimo numero naturale m
per cui

m
n=0
p
n
> L + 1, mentre k
1
`e il minimo numero naturale k per cui

m
1
n=0
p
n

k
n=0
q
n
< L 1. Questi indici esistono per la divergenza delle
serie

p
n
e

q
n
. In generale, avendo costruito m
h
e k
h
come i minimi indici
maggiori rispettivamente di m
h1
e k
h1
tali che
_

_
m
1

n=0
p
n

k
1

n=0
q
n
+. . . +
m
h

m
h1
+1
p
n
> L +
1
h
,
m
1

n=0
p
n

k
1

n=0
q
n
+. . . +
m
h

m
h1
+1
p
n

k
h

n=k
h1
+1
q
n
< L
1
h
,
deniremo m
h+1
e k
h+1
come i minimi indici maggiori rispettivamente di m
h
e k
h
tali che
_

_
m
1

n=0
p
n

k
1

n=0
q
n
+. . . +
m
h+1

m
h
+1
p
n
> L +
1
h + 1
,
m
1

n=0
p
n

k
1

n=0
q
n
+. . . +
m
h+1

m
h
+1
p
n

k
h+1

n=k
h
+1
q
n
< L
1
h + 1
.
Nuovamente, tali indici esistono in virt` u della divergenza di

p
n
e

q
n
.
Indichiamo con
n
e
n
le somme parziali della serie cos` costruita, cio`e s
n
,
i cui ultimi termini sono rispettivamente p
mn
e q
kn
: in altre parole,

n
= s
m
1
+k
1
+...+mn
,
n
= s
m
1
+k
1
+...+mn+kn
.
176
Allora otteniamo, per la minimalit`a di m
n
e k
n
,

n
p
mn
L +
1
n
<
n
,
n
< L
1
n

n
+q
kn
,
cosicche
n
L e
n
L per n . Daltra parte, consideriamo una
generica somma parziale s
n
: esister`a un unico indice h tale che sia vera una
delle due relazioni
m
1
+k
1
+. . . m
h
n m
1
+k
1
+. . . +m
h
+k
h
,
oppure
m
1
+k
1
+. . . m
h
+k
h
n m
1
+k
1
+. . . +m
h
+k
h
+m
h+1
;
ne segue

h
s
n

h
, oppure
h
s
n

h+1
,
e dunque anche s
n
converge a L per n . Ci`o prova (i).
(ii)-(iii)-(iv) Questi enunciati si provano in modo del tutto simile: basta
scegliere le successioni
n
e
n
entrambe divergenti a +, o entrambe
divergenti a , o convergenti a due valori L
1
e L
2
con L
1
< L
2
.
Raggruppamento dei termini di una serie
Vale la propriet`a associativa per i termini di una serie? Si possono mettere
le parentesi per racchiudere un numero nito di addendi, senza alterare la
somma? Vediamo.
Denizione 2.8.7 Sia

n=0
a
n
una serie reale o complessa. Sia inoltre
k
n
una successione strettamente crescente di numeri naturali. Posto
b
0
=
k
0

h=0
a
h
, b
n
=
kn

h=k
n1
+1
a
h
n N
+
,
si dice che la serie

b
n
`e ottenuta da

a
n
raggruppandone i termini.
Esempio 2.8.8 La serie

n=1
1
2n(2n1)
`e ottenuta da

n=1
(1)
n+1
n
raggrup-
pandone i termini a due a due: in questo caso k
n
`e denita da k
n
=
2n.
177
Il risultato che segue stabilisce che il raggruppamento dei termini di una serie
`e unoperazione del tutto lecita.
Teorema 2.8.9 Sia

a
n
una serie reale o complessa, e sia

b
n
una serie
ottenuta da

a
n
raggruppandone i termini. Se

a
n
`e convergente, allora
anche

b
n
lo `e e in tal caso le due serie hanno la stessa somma. Se

a
n
`e assolutamente convergente, allora anche

b
n
lo `e e in tal caso si ha

n=0
[b
n
[

n=0
[a
n
[.
Dimostrazione Per m, n N poniamo s
m
=

m
k=0
a
k
e
n
=

n
k=0
b
k
; si
ha allora, per denizione di b
h
,

n
= s
k
0
+
n

h=1
_
s
k
h
s
k
h1
_
= s
kn
n N.
Poiche s
n
`e per ipotesi convergente ad un numero S, dato > 0 si avr`a
[s
n
S[ < per tutti gli n maggiori di un certo . Ma allora, essendo k
n
n,
sar`a anche [
n
S[ = [s
kn
S[ < per ogni n > , cio`e
n
S per n .
Se poi

n=0
[a
n
[ < , allora a maggior ragione, per la parte gi`a dimostrata,

n=0
[b
n
[
k
0

h=0
[a
h
[ +

n=1
kn

h=k
n1
+1
[a
h
[ =

h=0
[a
h
[ < +.
Osservazioni 2.8.10 (1) Il teorema vale anche nel caso di serie reali diver-
genti (esercizio 2.8.2).
(2) Non mantiene la convergenza, al contrario, loperazione inversa al rag-
gruppamento, che consiste nelleliminare eventuali parentesi presenti: ad
esempio, la serie
(1 1) + (1 1) + (1 1) + (1 1) +. . .
converge ed ha somma 0, mentre la serie
1 1 + 1 1 + 1 1 + 1 1 +. . .
`e indeterminata. In generale, si pu`o scrivere luguaglianza

n=0
(a
n
+b
n
) =

n=0
a
n
+

n=0
b
n
178
solo quando ciascuna delle due serie

a
n
e

b
n
`e convergente; in tal caso
luguaglianza `e conseguenza dellesercizio 2.2.1. Pi` u generalmente, si veda
lesercizio 2.8.3 .
Esercizi 2.8
1. Sia

a
n
una serie assolutamente convergente. Si provi che se A e B
sono sottoinsiemi disgiunti di N tali che A B = N, allora

n=0
a
n
=

nA
a
n
+

nB
a
n
.
2. Provare il teorema 2.8.9 nel caso di due serie reali divergenti a +
oppure divergenti a .
3. Sia

n=0
a
n
una serie reale o complessa, sia k
n
N una successione
strettamente crescente e siano
b
0
=
k
0

h=0
a
h
, b
n
=
kn

h=k
n1
+1
a
h
n N.
Si provi che se

n=0
b
n
`e convergente, e se
lim
n
kn

h=k
n1
+1
[a
h
[ = 0,
allora

n=0
a
n
`e convergente.
4. (i) Per n, k N
+
siano a
nk
numeri non negativi. Si dimostri che se

n=1
_

k=1
a
nk
_
= S,
allora si ha anche

k=1
_

n=1
a
nk
_
= S.
179
(ii) Vericare che il risultato di (i) `e falso se gli a
nk
hanno segno
variabile, utilizzando i seguenti a
nk
:
a
nk
=
_

_
1 se k = n, n N
+

2
n1
1
2
n
1
se k = n + 1, n N
+
0 altrimenti.
2.9 Moltiplicazione di serie
A prima vista il problema di moltiplicare fra loro due serie sembra irrilevante.
Fare il prodotto di due serie signica moltiplicare tra loro le successioni delle
rispettive somme parziali; se queste convergono a S
1
e S
2
, il loro prodotto
converger`a a S
1
S
2
. Dov`e il problema?
Il punto `e che noi vogliamo ottenere, come risultato del prodotto di due serie,
una nuova serie. Il motivo di questo desiderio `e legato alla teoria delle serie
di potenze: due serie di potenze hanno per somma una funzione denita
sul cerchio di convergenza di ciascuna serie; il prodotto di tali funzioni `e
una nuova funzione, denita sul pi` u piccolo dei due cerchi di convergenza, e
della quale si vorrebbe conoscere uno sviluppo in serie di potenze che ad essa
converga. Dunque si vuole trovare una serie di potenze che sia il prodotto
delle due serie di potenze date, ed abbia per somma il prodotto delle somme.
Scrivendo il prodotto di due polinomi

N
n=0
a
n
z
n
e

M
n=0
b
n
z
n
(con N M) `e
naturale raggruppare i termini con la stessa potenza z
n
: quindi si metteranno
insieme i prodotti a
0
b
n
, a
1
b
n1
, . . . , a
n1
b
1
, a
n
b
0
. Il polinomio prodotto sar`a
quindi (ponendo a
n
= 0 per n = N + 1, . . . , M)
N

n=0
_
n

k=0
a
k
b
nk
_
z
n
.
Passando dai polinomi alle serie di potenze o, pi` u in generale, parlando di
serie numeriche, siamo indotti alla seguente
Denizione 2.9.1 Date due serie

n=0
a
n
e

n=0
b
n
reali o complesse, la
serie

n=0
c
n
, ove
c
n
=
n

k=0
a
k
b
nk
n N,
si dice prodotto di Cauchy delle due serie.
180
Si potrebbe sperare di dimostrare che se

n=0
a
n
e

n=0
b
n
sono convergenti,
allora la serie prodotto

n=0
c
n
`e convergente, magari con somma uguale al
prodotto delle somme. Ma non `e cos`, come mostra il seguente esempio: se
a
n
= b
n
=
(1)
n

n + 1
n N,
allora
c
n
= (1)
n
n

k=0
1

k + 1

n k + 1
n N,
e quindi
[c
n
[
n

k=0
1

n + 1

n + 1
=
n + 1
n + 1
= 1 n N,
per cui c
n
non `e innitesima e

c
n
non pu`o convergere. Si ha per`o questo
risultato:
Teorema 2.9.2 (di Cauchy) Se le serie

n=0
a
n
e

n=0
b
n
sono assoluta-
mente convergenti, allora il loro prodotto di Cauchy

n=0
c
n
`e assolutamente
convergente; inoltre

n=0
c
n
=
_

n=0
a
n
_

n=0
b
n
_
.
Dimostrazione Si consideri la serie

n=0
d
n
, la cui legge di formazione `e
illustrata dallo schema che segue:
a
0
b
0
a
1
b
0
a
2
b
0
a
n
b
0


a
0
b
1
a
1
b
1
a
2
b
1
a
n
b
1


a
0
b
2
a
1
b
2
a
2
b
2
a
n
b
2



a
0
b
n
a
1
b
n
a
2
b
n
a
n
b
n


181
Si ha dunque

n=0
d
n
= a
0
b
0
+a
0
b
1
+a
1
b
1
+a
1
b
0
+a
0
b
2
+a
1
b
2
+a
2
b
2
+a
2
b
1
+a
2
b
0
+
+ . . . +a
0
b
n
+a
1
b
n
+. . . +a
n
b
n
+a
n
b
n1
+. . . +a
n
b
1
+a
n
b
0
+. . .
Tale serie converge assolutamente, in quanto per ogni n 2 si ha
n

k=0
[d
k
[
n
2
1

k=0
[d
k
[ =
_
n1

k=0
[a
k
[
_

_
n1

k=0
[b
k
[
_

k=0
[a
k
[
_

k=0
[b
k
[
_
< .
Dunque

k=0
d
k
`e convergente ad un numero S. Daltra parte, posto A =

k=0
a
k
e B =

k=0
b
k
, considerando la somma parziale della serie

d
k
di
indice n
2
1 si ha per n
n
2
1

k=0
d
k
=
_
n1

k=0
a
k
_

_
n1

k=0
b
k
_
A B.
Ne segue S = AB perche ogni sottosuccessione di una successione conver-
gente deve convergere allo stesso limite.
Dalla serie

k=0
d
k
, riordinando i termini per diagonali, si ottiene la serie
a
0
b
0
+a
0
b
1
+a
1
b
0
+a
0
b
2
+a
1
b
1
+a
2
b
0
+. . . +a
0
b
n
+a
1
b
n1
+. . . +a
n
b
0
+. . . ,
la quale per il teorema di Dirichlet (teorema 2.8.3) `e assolutamente conver-
gente ed ha somma AB. Ma raggruppandone opportunamente i termini si
ottiene proprio la serie prodotto di Cauchy di

k=0
a
k
e

k=0
b
k
, che dunque
per il teorema 2.8.9 `e una serie assolutamente convergente con somma AB.
Osservazione 2.9.3 Se le serie

a
n
e

b
n
hanno indice iniziale 1, anziche
0, nella denizione di prodotto di Cauchy occorrer`a prendere
c
n
=
n

k=1
a
k
b
nk+1
n N
+
, anziche c
n
=
n

k=0
a
k
b
nk
n N.
Esempi 2.9.4 (1) Moltiplicando per se stessa la serie geometrica
1
1 z
=

n=0
z
n
, [z[ < 1,
182
si ottiene, sempre per [z[ < 1,
1
(1 z)
2
=

n=0
_
n

k=0
z
k
z
nk
_
=

n=0
(n + 1)z
n
;
da qui si ricava anche

n=0
nz
n
=

n=0
(n+1)z
n

n=0
z
n
=
1
(1 z)
2

1
1 z
=
z
(1 z)
2
, [z[ < 1.
(2) Come sappiamo si ha, posto z = x +iy,
e
z
= e
x+iy
= e
x
(cos y +i sin y) =

n=0
z
n
n!
z C.
Calcoliamo e
z
e
w
con la regola della moltiplicazione di serie: il termine
generale della serie prodotto ha la forma
n

k=0
1
k!
1
(n k)!
z
k
w
nk
=
1
n!
n

k=0
_
n
k
_
z
k
w
nk
=
(z +w)
n
n!
;
dunque
e
z
e
w
=

n=0
(z +w)
n
n!
= e
z+w
z, w C.
Pertanto lesponenziale complessa mantiene le propriet`a algebriche delle-
sponenziale reale. Si noti che e
z
= e
z+2i
per ogni z C, cio`e la funzione
esponenziale `e periodica di periodo 2i; in particolare, e
z
non `e una funzione
iniettiva su C.
Esercizi 2.9
1. Provare che se

n=0
a
n
z
n
= f(z) per [z[ < 1, allora posto A
n
=

n
k=0
a
k
si ha

n=0
A
n
z
n
=
f(z)
1 z
per [z[ < 1.
183
2. Dimostrare che se [z[ < 1 si ha

n=0
_
n +k
k
_
z
n
=
1
(1 z)
k+1
k N.
[Traccia: utilizzare lesercizio 1.7.1 (iv).]
3. Vericare che per [z[ < 1 si ha

k=0
n
2
z
n
=
z
2
+z
(1 z)
3
.
4. Poniamo per ogni n N

n
= a
0
b
n
+. . . a
n
b
n
+a
n
b
n1
+. . . +a
n
b
1
+a
n
b
0
.
Si provi che se

n=0
a
n
= A e

n=0
b
n
= B, allora

n=0

n
= AB.
5. Per y R si verichi la relazione sin 2y = 2 sin y cos y, utilizzando gli
sviluppi in serie di potenze del seno e del coseno.
[Traccia: si verichi preliminarmente che risulta
2
2n
= (1 + 1)
2n
(1 1)
2n
=
n

k=0
_
2n + 1
2k
_
n N.]
6. Dimostrare, usando le serie di potenze, le relazioni
cos
2
x + sin
2
x = 1 x R,
sin(x +y) = sin x cos y + sin y cos x x, y R.
7. Determinare il prodotto di Cauchy della serie

(1)
n
n+1
per se stessa. La
serie che cos` si ottiene `e convergente?
8. Sia

n=0
c
n
= (

n=0
2
n
) (

n=0
3
n
): calcolare esplicitamente c
n
e
provare che
3
n
c
n
2
n
n N.
184
Capitolo 3
Funzioni
3.1 Spazi euclidei R
m
e C
m
Inizia qui la seconda parte del corso, in cui si passa dal discreto al conti-
nuo: lo studio delle successioni e delle serie lascer`a il posto allanalisi delle
propriet`a delle funzioni di variabile reale o complessa. Ci occuperemo comun-
que ancora, qua e l`a, di successioni e serie, in particolare di serie di potenze.
Fissiamo m N
+
e consideriamo gli insiemi R
m
e C
m
, cio`e i prodotti
cartesiani di R e C per se stessi m volte:
R
m
= x = (x
1
, . . . , x
m
) : x
i
R, i = 1, . . . , m,
C
m
= z = (z
1
, . . . , z
m
) : z
i
C, i = 1, . . . , m.
Introduciamo un po di terminologia. Indicheremo in neretto (x, z, a, b,
eccetera) i punti generici, o vettori, di R
m
e di C
m
. Su tali insiemi sono de-
nite le operazioni di somma e di prodotto per scalari che li rendono entrambi
spazi vettoriali:
a +b = (a
1
+b
1
, . . . , a
m
+b
m
) a, b R
m
(oppure a, b C
m
),
a = (a
1
, . . . , a
m
) R, a R
m
(oppure C, a C
m
).
Naturalmente, per m = 2 lo spazio R
m
si riduce al piano cartesiano R
2
mentre per m = 1 lo spazio C
m
si riduce al piano complesso C. Come
sappiamo, R
2
`e identicabile con C mediante la corrispondenza biunivoca
z = x +iy; similmente, per ogni m 1 possiamo identicare gli spazi R
2m
e
185
C
m
, associando al generico punto x = (x
1
, x
2
, . . . , x
2m1
, x
2m
) R
2m
il punto
z = (z
1
, . . . z
m
) C
m
, ove
z
j
= x
2j1
+ix
2j
j = 1, . . . , m.
Estenderemo a m dimensioni tutta la struttura geometrica di R
2
.
Prodotto scalare
In R
m
e in C
m
`e denito un prodotto scalare fra vettori:
a b =
m

i=1
a
i
b
i
a, b R
m
,
a b =
m

i=1
a
i
b
i
a, b C
m
.
Si noti che, essendo R
m
C
m
e x = x per ogni x reale, il prodotto scalare
dello spazio C
m
, applicato a vettori di R
m
, coincide col prodotto scalare dello
spazio R
m
. Dunque il prodotto scalare associa ad ogni coppia di vettori di
C
m
un numero complesso e ad ogni coppia di vettori di R
m
un numero reale.
Se a b = 0, i due vettori a e b si dicono ortogonali. Il signicato geometrico
del prodotto scalare, nel caso reale, `e illustrato nellesercizio 3.1.1.
Notiamo che il prodotto scalare di R
m
`e una applicazione lineare nel primo
e nel secondo argomento, ossia risulta
_
(a +b) c = a c + b c
a (b +c) = a b + a c
, R, a, b, c R
m
;
invece il prodotto scalare di C
m
`e lineare nel primo argomento ed antilineare
nel secondo argomento, ossia
_
(a +b) c = a c + b c
a (b +c) = a b + a c
, C, a, b, c C
m
(le veriche sono ovvie).
186
Norma euclidea
La norma euclidea di un vettore z C
m
`e il numero reale non negativo
[z[
m
=

_
m

i=1
[z
i
[
2
=

z z,
essendo z = (z
1
, . . . , z
m
); la norma di un vettore x R
m
`e la stessa cosa,
ossia
[x[
m
=

_
m

i=1
[x
i
[
2
=

x x.
La norma `e lanalogo del modulo in C e del valore assoluto in R. Le propriet`a
fondamentali della norma sono le seguenti:
(i) (positivit`a) [z[
m
0 per ogni z C
m
, e [z[
m
= 0 se e solo se z = 0;
(ii) (omogeneit`a) [z[
m
= [[ [z[
m
per ogni C e z C
m
;
(iii) (subadditivit`a) [z +w[
m
[z[
m
+[w[
m
per ogni z, w C
m
.
Le prime due propriet`a sono ovvie dalla denizione; la terza `e meno evidente,
e per dimostrarla `e necessario premettere la seguente
Proposizione 3.1.1 (disuguaglianza di Cauchy-Schwarz) Risulta
[a b[ [a[
m
[b[
m
a, b C
m
.
Dimostrazione Ripetiamo largomentazione svolta nella dimostrazione del
teorema 1.9.3. Per ogni a, b C
m
e per ogni t R si ha
0 [a +tb[
2
m
=
m

j=1
(a
j
+tb
j
)(a
j
+tb
j
) =
=
m

j=1
a
j
a
j
+ 2tRe
m

j=1
a
j
b
j
+t
2
m

j=1
b
j
b
j
=
= a a + 2tRe a b +t
2
b b = [a[
2
m
+ 2tRe a b +t
2
[b[
2
m
;
dal momento che il trinomio di secondo grado allultimo membro `e sempre
non negativo, il suo discriminante deve essere non positivo, cio`e
(Re a b)
2
[a[
2
m
[b[
2
m
a, b C
m
.
187
Passando alle radici quadrate, ci`o prova la tesi nel caso del prodotto scalare
di R
m
, poiche in tal caso Re a b = a b. Nel caso del prodotto scalare di C
m
osserviamo che il numero complesso a b avr`a un argomento [0, 2[, e si
potr`a dunque scrivere, ricordando la denizione di esponenziale complessa,
a b = [a b[(cos +i sin ) = [a b[e
i
;
ma allora sostituendo a con e
i
a avremo, per la linearit`a del prodotto scalare
nel primo argomento,
(e
i
a) b = e
i
(a b) = [a b[
m
,
e pertanto, per quanto dimostrato sopra,
[a b[
2
m
= (Re [a b[
m
)
2
=
_
Re
_
(e
i
a) b
_
2

[e
i
a[
2
m
[b[
2
m
= [e
i
[
2
[a[
2
m
[b[
2
m
= [a[
2
m
[b[
2
m
a, b C
m
,
cio`e la tesi.
Dimostriamo la subadditivit`a della norma: per la disuguaglianza di Cauchy-
Schwarz si ha
[a +b[
2
m
= [a[
2
m
+ 2Re a b +[b[
2
m
[a[
2
m
+ 2[a b[ +[b[
2
m

[a[
2
m
+ 2[a[
m
[b[
m
+[b[
2
m
= ([a[
m
+[b[
m
)
2
.
Osservazione 3.1.2 Si noti che se a, b R
m
, allora vale luguaglianza
[a +b[
2
m
= [a[
2
m
+[b[
2
m
se e solo se a e b sono vettori fra loro ortogonali.
Distanza euclidea
Tramite la norma si pu`o dare la nozione di distanza fra due vettori di R
m
o
di C
m
.
Denizione 3.1.3 Una distanza, o metrica, su un insieme non vuoto X `e
una funzione d : X X [0, [ con queste propriet`a:
(i) (positivit`a) d(x, y) 0 per ogni x, y X, d(x, y) = 0 se e solo se x = y;
188
(ii) (simmetria) d(x, y) = d(y, x) per ogni x, y X;
(iii) (disuguaglianza triangolare) d(x, y) d(x, z) +d(z, y) per ogni x, y, z
X.
Se su X `e denita una distanza d, la coppia (X, d) `e detta spazio metrico.
La nozione di spazio metrico `e molto importante e generale, e la sua portata
va molto al di l`a del nostro corso. Si pu`o vericare assai facilmente che la
funzione
d(x, y) = [x y[
m
x, y C
m
(oppure x, y R
m
)
`e una distanza su C
m
(oppure su R
m
), che si chiama distanza euclidea: le
propriet`a (i), (ii) e (iii) sono evidenti conseguenze delle condizioni (i), (ii) e
(iii) relative alla norma euclidea. La distanza euclidea gode inoltre di altre
due propriet`a legate alla struttura vettoriale di R
m
e C
m
:
(iv) (invarianza per traslazioni) d(x +v, y +v) = d(x, y) per ogni x, y, v
C
m
(oppure R
m
),
(v) (omogeneit`a) d(x, y) = [[d(x, y) per ogni C e x, y C
m
(oppure
R e x, y R
m
).
Notiamo che d(0, x) = [x[
m
per ogni x C
m
; inoltre se m = 1, come gi`a
sappiamo, posto z = x +iy per ogni z C, si ha [z[ =
_
x
2
+y
2
= [(x, y)[
2
,
ossia C e R
2
, dal punto di vista metrico, sono la stessa cosa.
Per un qualunque spazio metrico si denisce la palla di centro x
0
X e
raggio r > 0 come linsieme B(x
0
, r) = x X : d(x, x
0
) < r; quindi la
palla di centro x
0
R
m
e raggio r `e
B(x
0
, r) = x R
m
: [x x
0
[
m
< r,
mentre analogamente la palla di centro z
0
C
m
e raggio r > 0 sar`a
B(z
0
, r) = z C
m
: [z z
0
[
m
< r.
Nel caso m = 1 la palla B(x
0
, r) di R `e lintervallo ]x
0
r, x
0
+ r[ mentre la
palla B(z
0
, r) di C `e il disco z C : [z z
0
[ < r. Un intorno di un punto
x
0
in R
m
o in C
m
`e un insieme U tale che esista una palla B(x
0
, r) contenuta
in U. Ogni palla di centro x
0
`e essa stessa un intorno di x
0
; talvolta per`o
`e comodo usare intorni di x
0
pi` u generali delle palle (ad esempio intorni di
189
forma cubica, se m = 3).
Una successione x
n
R
m
(oppure C
m
) converge ad un elemento x R
m
(o C
m
) se
lim
n
[x
n
x[
m
= 0,
cio`e se per ogni > 0 esiste N tale che x
n
B(x, ) per ogni n . Si
noti che, essendo
[x
i
n
x
i
[ [x
n
x[
m

m

j=1
[x
j
n
x
j
[, i = 1, . . . , m,
la condizione lim
n
x
n
= x equivale alle m relazioni
lim
n
x
i
n
= x
i
, i = 1, 2, . . . , m.
Aperti e chiusi
Deniremo adesso alcune importanti classi di sottoinsiemi di R
m
. Tutto ci`o
che verr`a detto in questo paragrafo si pu`o ripetere in modo completamente
analogo per C
m
.
Denizione 3.1.4 Sia A R
m
. Diciamo che A `e un insieme aperto se `e
intorno di ogni suo punto, ossia se per ogni x
0
A esiste r > 0 tale che
B(x
0
, r) A (il raggio r dipender`a ovviamente dalla posizione di x
0
in A).
Gli insiemi aperti formano una famiglia chiusa rispetto a certe operazioni
insiemistiche:
Proposizione 3.1.5 Lunione di una famiglia qualsiasi di aperti `e un aper-
to. Lintersezione di una famiglia nita di aperti `e un aperto.
Dimostrazione Se A
i

iI
`e una famiglia di aperti, e x

iI
A
i
, vi sar`a
un indice j I tale che x A
j
; quindi esiste r > 0 tale che B(x, r) A
j

iI
A
i
. Pertanto

iI
A
i
`e un aperto.
Se A
1
, . . . , A
k
`e una famiglia nita di aperti e x

k
i=1
A
i
, allora per ogni
i fra 1 e k vi sar`a r
i
> 0 tale che B(x, r
i
) A
i
; posto r = minr
1
, . . . , r
k
, si
ha r > 0 e B(x, r)

k
i=1
B(x, r
i
)

k
i=1
A
i
.
190
Esempi 3.1.6 (1) Sono aperti in R:
, R, ]a, b[, ] , a[, ]b, +[, R 34, R Z,
]0, 1[]2, 4[, ]0, 1[
1
n

nN
+;
non sono aperti in R:
N, Z, Q, R Q, [a, b[, [a, b], ]a, b], ] , a], [b, +[,

1
n

nN
+, [0, 1]
1
n

nN
+.
(2) Sono aperti in R
2
:
R
2
, , (x, y) R
2
: y > 0, (x, y) R
2
: [x[ +[y[ < 1,
R
2
(0, 0), B((x, y), r);
non sono aperti in R
2
:
R 0, (0, y) : y > 0, (x, y) R
2
: y 0,
(x, y) R
2
: x y, (x, y) R
2
: 1 x
2
+y
2
< 2.
Denizione 3.1.7 Sia F R
m
. Diciamo che F `e un insieme chiuso in R
m
se il suo complementare F
c
`e un aperto.
Si ha subito la seguente propriet`a:
Proposizione 3.1.8 Lintersezione di una famiglia qualsiasi di chiusi `e un
chiuso. Lunione di una famiglia nita di chiusi `e un chiuso.
Dimostrazione Se F
i

iI
`e una famiglia di chiusi, allora tutti i comple-
mentari F
c
i
sono aperti, quindi per la proposizione precedente
_
iI
F
i
_
c
=

iI
F
c
i
`e un aperto e dunque

iI
F
i
`e chiuso. Se F
1
, . . . , F
k
`e una
famiglia nita di chiusi, allora per la proposizione precedente si ha che
_

k
i=1
F
i
_
c
=

k
i=1
F
c
i
`e un aperto e quindi

k
i=1
F
i
`e chiuso.
Gli insiemi chiusi hanno una importante caratterizzazione che `e la seguente:
Proposizione 3.1.9 Sia F R
m
. Allora F `e chiuso se e solo se per ogni
successione x
n
F, convergente ad un punto x R
m
, risulta x F.
191
Dimostrazione Supponiamo che F sia chiuso e sia x
n
F tale che
x
n
x per n ; si deve provare che x F. Se fosse x F
c
, dato che
F
c
`e aperto esisterebbe una palla B(x, r) contenuta in F
c
; ma siccome x
n
tende a x, denitivamente si avrebbe x
n
B(x, r) F
c
, contro lipotesi che
x
n
F per ogni n. Dunque x F.
Supponiamo viceversa che F contenga tutti i limiti delle successioni che sono
contenute in F, e mostriamo che F
c
`e aperto. Se non lo fosse, vi sarebbe
un punto x F
c
per il quale ogni palla B(x, r) interseca (F
c
)
c
, cio`e F;
quindi, scegliendo r = 1/n, per ogni n N
+
esisterebbe un punto x
n

B(x, 1/n) F. La successione x
n
, per costruzione, sarebbe contenuta in
F, e convergerebbe a x dato che [x x
n
[
m
< 1/n. Ma allora, per ipotesi,
il suo limite x dovrebbe stare in F: assurdo perche x F
c
. Dunque F
c
`e
aperto e F `e chiuso.
Esempi 3.1.10 (1) Sono chiusi in R:
R, , [a, b], [a, +[, ] , b],
_
1
n
_
nN
+
0, 65, N, Z;
non sono chiusi in R:
[a, b[, ]a, b[, ]a, b], ] , a[, ]b, +[,
_
1
n
_
nN
+
, Q, R Q.
(2) Sono chiusi in R
2
:
R
2
, , (x, y) R
2
: x
2
+y
2
1, R 0,
(x, y) R
2
: x = 0, y 0, (x, y) R
2
: 1 [x[ +[y[ 3;
non sono chiusi in R
2
:
(x, y) R
2
: 0 < x
2
+y
2
1, (x, y) R
2
: x = 0, y > 0,
(x, y) R
2
: 1 [x[ +[y[ < 3, Q
2
, R
2
Q
2
.
Si noti che esistono insiemi aperti ma non chiusi, insiemi chiusi ma non
aperti, insiemi ne aperti ne chiusi ed insiemi sia aperti che chiusi (vedere
per`o lesercizio 3.1.18).
192
Punti daccumulazione
Nella teoria dei limiti di funzioni `e di basilare importanza la denizione che
segue.
Denizione 3.1.11 Sia E R
m
, sia x
0
R
m
. Diciamo che x
0
`e un
punto daccumulazione per E se esiste una successione x
n
E x
0
che
converge a x
0
.
La condizione che x
n
non prenda mai il valore x
0
serve ad evitare il caso in cui
x
n
`e denitivamente uguale a x
0
; si vuole cio`e che intorno a x
0
si accumulino
inniti punti distinti della successione. E infatti `e immediato vericare che
x
0
`e un punto daccumulazione per E se e solo se ogni palla B(x
0
, r) contiene
inniti punti di E. Notiamo anche che un punto di accumulazione per E pu`o
appartenere o non appartenere a E: ad esempio, 0 `e punto di accumulazione
per
1
n

nN
+, ma 0 ,=
1
n
per ogni n, mentre 1/2 `e punto daccumulazione per
linsieme [0, 1] al quale appartiene.
Mediante i punti daccumulazione si pu`o dare unaltra caratterizzazione degli
insiemi chiusi:
Proposizione 3.1.12 Sia E R
m
. Allora E `e chiuso se e solo se E
contiene tutti i propri punti daccumulazione.
Dimostrazione Se E `e chiuso, e x `e un punto daccumulazione per E, allora
esiste x
n
E x E tale che x
n
x per n ; per la proposizione
3.1.9 si ottiene x E.
Viceversa, supponiamo che E contenga tutti i suoi punti daccumulazione e
prendiamo una successione x
n
E convergente a x: dobbiamo mostrare
che x E, e la tesi seguir`a nuovamente dalla proposizione 3.1.9. Il fatto che
x E `e evidente nel caso in cui x
n
`e denitivamente uguale a x; in caso
contrario esisteranno inniti indici n per i quali si ha x
n
,= x: i corrispon-
denti inniti valori x
n
sono dunque una successione contenuta in E x e
convergente a x. Perci`o x `e punto daccumulazione per E, e di conseguenza
x E.
Il fondamentale teorema che segue garantisce lesistenza di punti daccumu-
lazione per una vastissima classe di insiemi. Diamo anzitutto la seguente
Denizione 3.1.13 Un insieme E R
m
si dice limitato se esiste K 0
tale che
[x[
m
K x E.
193
Dunque un insieme E R
m
`e limitato se e solo se esiste una palla B(0, K)
che lo contiene.
Teorema 3.1.14 (di Bolzano-Weierstrass) Ogni sottoinsieme innito e
limitato di R
m
possiede almeno un punto daccumulazione.
Dimostrazione Supponiamo dapprima m = 1. Faremo uso del seguente
risultato:
Proposizione 3.1.15 Da ogni successione reale `e possibile estrarre una sot-
tosuccessione monotona.
Dimostrazione Sia a
n
R una successione. Poniamo
G = n N : a
m
< a
n
m > n;
allora G sar`a nito (eventualmente vuoto) oppure innito.
Supponiamo G nito: allora esiste n
0
N tale che n / G per ogni n n
0
,
ossia risulta
n n
0
m > n : a
m
a
n
.
Perci`o, essendo n
0
/ G, esiste n
1
> n
0
tale che a
n
1
a
n
0
e in particolare
n
1
/ G; esister`a allora n
2
> n
1
tale che a
n
2
a
n
1
, e cos` induttivamente si
costruisce una sequenza crescente di interi n
k
tale che a
n
k+1
a
n
k
per ogni
k N. La corrispondente sottosuccessione a
n
k
a
n
, per costruzione, `e
monotona crescente.
Supponiamo invece che G sia innito: poiche ogni sottoinsieme di N ha
minimo (esercizio 1.6.10), possiamo porre successivamente
n
0
= min G, n
1
= min(Gn
0
), . . . , n
k+1
= min(Gn
0
, n
1
, . . . , n
k
), . . .
ottenendo una sequenza crescente di interi n
k
G e dunque tali che a
m
< a
n
k
per ogni m > n
k
; in particolare a
n
k+1
< a
n
k
per ogni k. La corrispondente
sottosuccessione a
n
k
a
n
`e perci`o monotona decrescente.
Corollario 3.1.16 Ogni successione limitata in R ha una sottosuccessione
convergente.
Dimostrazione La sottosuccessione monotona della proposizione preceden-
te `e limitata per ipotesi, dunque convergente (proposizione 2.3.3).
Il corollario appena dimostrato prova anche il teorema nel caso m = 1: se
194
un insieme E `e innito e limitato, esso contiene una successione limitata e
costituita tutta di punti distinti, la quale, per il corollario, ha una sottosuc-
cessione convergente; il limite di questa sottosuccessione `e evidentemente un
punto daccumulazione per E.
Passiamo ora al caso m > 1. Sia x
n
una successione (costituita tutta di
punti distinti) contenuta in E e proviamo che esiste una sottosuccessione che
converge: il suo limite sar`a il punto daccumulazione cercato.
Poiche x
n
`e limitata, le successioni reali x
1
n
, x
2
n
,. . . , x
m
n
sono li-
mitate. Allora, per il caso m = 1 gi`a visto, esiste una sottosuccessione
x
n,(1)
x
n
tale che x
1
n,(1)
converge ad un limite x
1
R; da x
n,(1)

possiamo estrarre una ulteriore sottosuccessione x


n,(2)
tale che x
1
n,(2)
x
1
(perch`e estratta dalla successione x
1
n,(1)
che gi`a convergeva a x
1
) ed inoltre
x
2
n,(2)
converge ad un limite x
2
R. Continuando ad estrarre ulteriori sotto-
successioni x
n,(3)
x
n,(2)
, x
n,(4)
x
n,(3)
, . . . , dopo m passi otterre-
mo una sottosuccessione x
n,(m)
di tutte le precedenti, tale che x
1
n,(m)
x
1
,
x
2
n,(m)
x
2
, . . . , x
m
n,(m)
x
m
in R. Ne segue che, posto x = (x
1
, . . . , x
m
),
la successione x
n,(m)
, che `e una sottosuccessione di x
n
, converge a x in
R
m
.
Osservazioni 3.1.17 (1) Il punto daccumulazione costruito nel teorema di
Bolzano-Weierstrass non `e in generale unico!
(2) I punti daccumulazione di un insieme E sono i limiti delle successioni di
E che non sono denitivamente costanti.
Esempi 3.1.18 (1) Linsieme N `e innito ma non limitato in R, ed `e privo
di punti di accumulazione.
(2) 1 `e un insieme limitato in R ma non innito, ed `e privo di punti di
accumulazione.
(3) La successione (1)
n
+
1
n
costituisce un insieme innito e limitato in
R che ha i due punti daccumulazione +1 e 1.
Dal teorema di Bolzano-Weierstrass segue la seguente importante caratteriz-
zazione dei sottoinsiemi chiusi e limitati di R
m
.
Teorema 3.1.19 Sia E R
m
. Allora E `e chiuso e limitato se e solo se
da ogni successione contenuta in E si pu`o estrarre una sottosuccessione che
converge ad un elemento di E.
195
Dimostrazione Sia E limitato e chiuso. Sia x
n
una successione contenu-
ta in E; se essa gi`a converge ad un punto x R
m
, ogni sua sottosuccessione
converger`a ancora a x, il quale apparterr`a al chiuso E in virt` u della propo-
sizione 3.1.9. Se non converge, essa `e comunque limitata: per il teorema di
Bolzano-Weierstrass avr`a una sottosuccessione x
n
convergente ad un ele-
mento x R
m
; poiche E contiene x
n
ed `e chiuso, deve essere x E.
Viceversa, se ogni successione contenuta in E ha una sottosuccessione che
converge ad un punto di E, allora in particolare E contiene il limite di ogni
successione convergente in esso contenuta, e quindi E `e chiuso per la proposi-
zione 3.1.9. Inoltre se E non fosse limitato allora per ogni n N
+
esisterebbe
x
n
E tale che [x
n
[
m
> n; ma nessuna sottosuccessione della successione
x
n
cos` costruita potrebbe convergere, essendo illimitata. Ci`o contraddice
lipotesi fatta su E, e quindi E `e limitato.
Osservazione 3.1.20 Gli insiemi E tali che ogni successione contenuta in E
ha una sottosuccessione che converge ad un elemento di E si dicono compatti;
quindi il teorema precedente caratterizza i sottoinsiemi compatti di R
m
.
Esempi 3.1.21 Sono compatti in R:
3, [a, b], [a, b] [c, d], 0
_
1
n
_
nN
+
, (1)
nN
;
non sono compatti in R:
] , a], ]a, b], ]a, b[, [b, +[,
_
1
n
_
nN
+
, Q [0, 1], N, Z.
Esercizi 3.1
1. Si provi che se a, b R
m
0 allora a b = [a[
m
[b[
m
cos , ove `e
langolo convesso fra i due vettori.
[Traccia: Dati a, b in R
m
0
e detto liperpiano (m 1)-
dimensionale ortogonale a b e
passante per a, si osservi che se
0 il piano interseca il seg-
mento di estremi 0 e b in un pun-
to della forma b con 0, e si
avr`a (a b) b = 0.
196
Dunque, da una parte si ha a b = [b[
2
m
e dallaltra [b[
m
= [a[
m
cos .
Discorso analogo se 0, lavorando con b al posto di b.]
2. Provare che |x|
1
=

m
i=1
[x
i
[ e |x|

= max[x
i
[ : i = 1, . . . , m
sono norme in R
m
e in C
m
, ossia sono funzioni positive, omogenee e
subadditive a valori in [0, +[.
3. Descrivere le palle B(0, r) per le distanze
d
1
(a, b) = |a b|
1
e d

(a, b) = |a b|

,
ove le norme | |
1
e | |

sono quelle dellesercizio precedente.


4. Si provi che se x
0
R
m
e r 0 linsieme
B(x
0
, r) = x R
m
: [x x
0
[
m
r
`e chiuso in R
m
(esso si chiama palla chiusa di centro x
0
e raggio r).
5. Si provi che ogni sottoinsieme di R chiuso e limitato inferiormente ha
minimo, e che ogni sottoinsieme di R chiuso e limitato superiormente
ha massimo. Vi `e un risultato analogo in R
m
e C
m
?
6. Provare che se A `e aperto in C, allora A R `e aperto in R. Vale il
viceversa?
7. Provare che se F `e chiuso in C allora F R `e chiuso in R. Vale il
viceversa?
8. Sia x
n
R
m
. Dimostrare o confutare i seguenti enunciati:
(i) se esiste x = lim
n
x
n
, allora x `e punto daccumulazione per x
n
;
(ii) se x `e punto daccumulazione per x
n
, allora esiste lim
n
x
n
= x.
9. Sia E R un insieme limitato superiormente e sia x = sup E. Provare
che se x / E allora x `e punto daccumulazione per E. Cosa pu`o
succedere se x E?
10. Se E R
m
(oppure E C
m
) e x E, diciamo che x `e interno a E
se E `e un intorno di x. Linsieme dei punti interni a E si chiama parte
interna di E e si indica con

E.
197
(i) Si provi che

E `e il pi` u grande insieme aperto contenuto in E.


(ii) Determinare

E quando E = z C : 1 [z[ 2, [arg z[ /3.


11. Se E R
m
e x R
m
(oppure E C
m
e x C
m
), diciamo che x
`e aderente a E se ogni palla B(x, r) interseca E. Linsieme dei punti
aderenti a E si chiama chiusura di E e si indica con E.
(i) Si provi che E `e il pi` u piccolo insieme chiuso contenente E.
(ii) Si provi che E contiene tutti i punti daccumulazione per E.
(iii) Determinare E quando E = i, i z = re
i/4
: 0 < r <

2.
12. Se E R
m
(oppure E C
m
), si chiama frontiera di E, e si indica con
E, linsieme dei punti aderenti a E che non sono interni a E: in altre
parole, si denisce E = E

E.
(i) Si provi che E = EE
c
, che E `e chiuso e che risulta E = EE,

E = E E.
(ii) Determinare E quando E = i, i z = re
i/4
: 0 < r <

2.
13. Se E R
m
(oppure E C
m
) e x E, x si dice punto isolato per E
se esiste una palla B(x, r) tale che B(x, r) E = x. Provare che un
punto aderente a E o `e punto daccumulazione per E, oppure `e punto
isolato per E.
14. Sia E =

kN
_
k
1
k+1
, k +
1
k+1
_
. Determinare:
(i) la chiusura di E,
(ii) la frontiera di E,
(iii) la parte interna di E.
15. Se E R
m
(oppure E C
m
), il diametro di E `e denito da
diam E = sup[x y[
m
: x, y E.
Posto Q
m
= x R
m
: 0 x
i
1 per i = 1, . . . , m, provare che
diam Q
m
=

m.
16. Dimostrare che risulta E =
_

(E
c
)
_
c
,

E=
_
E
c
_
c
.
198
17. (i) Esibire una successione x
n
Q che sia limitata e che non abbia
alcuna sottosuccessione convergente in Q.
(ii) Esibire un sottoinsieme di Q innito, limitato e privo di punti
daccumulazione in Q.
18. Dimostrare che gli unici sottoinsiemi di R
m
che sono simultaneamente
aperti e chiusi sono R
m
e .
[Traccia: per assurdo, sia A aperto e chiuso in R
m
tale che A ,= e
A ,= R
m
; allora B = A
c
verica le stesse condizioni. Scelti a A e
b B, siano
C = t R : a +t(b a) A, D = t R : a +t(b a) B;
allora C e D sono non vuoti, C D = R e C D = . Si provi che C
e D sono aperti, e quindi anche chiusi, in R. In questo modo ci siamo
ricondotti al caso m = 1. Adesso poniamo M = t 0 : [0, t] C.
Si provi che M `e non vuoto, contenuto in C e limitato superiormente;
posto = sup M, si provi che deve essere C D, il che `e assurdo.]
19. Sia E = x R : p(x), ove p(x) `e una generica propriet`a. Si dimostri
che:
(i) linsieme E `e chiuso se e solo se per ogni x
n
che converge a x vale
limplicazione
p(x
n
) denitivamente vera = p(x) vera;
(ii) linsieme E `e aperto se e solo se per ogni x
n
che converge a x
vale limplicazione
p(x) vera = p(x
n
) denitivamente vera.
20. Sia A R
m
. La proiezione di A lungo lasse x
i
`e linsieme
A
i
= x R : y A : y
i
= x.
Si provi che A `e limitato se e solo se le sue proiezioni A
1
, . . . , A
m
sono
insiemi limitati in R.
21. Sia E R
m
. Il derivato di E `e linsieme di tutti i punti di accumula-
zione per E; esso si indica con E.
199
(i) Si provi che E `e un insieme chiuso.
(ii) Si determinino E e E

E
quando E =

kN
_
k
1
k+1
, k +
1
k+1
_
.
22. (Insieme di Cantor) Dividiamo [0, 1] in tre parti uguali ed asportiamo
lintervallo aperto centrale di ampiezza 1/3. Dividiamo ciascuno dei due
intervalli chiusi residui in tre parti uguali e rimuoviamo i due intervalli
aperti centrali di ampiezza 1/9. Per ciascuno dei quattro intervalli resi-
dui ripetiamo la stessa procedura: al passo n-simo, avremo 2
n
intervalli
chiusi I
k,n
(k = 1, . . . , 2
n
), di ampiezza 3
n
, di cui elimineremo le parti
centrali aperte J
k,n
di ampiezza 3
n1
. Linsieme
C = [0, 1]

_
n=0
2
n
_
k=1
J
k,n
si chiama insieme ternario di Cantor.
(i) Si provi che C `e chiuso e privo di punti interni.
(ii) Si dimostri che tutti i punti di C sono punti daccumulazione per
C.
(iii) Si calcoli la lunghezza complessiva degli intervalli J
k,n
rimossi.
3.2 Funzioni reali di m variabili
Sia A un sottoinsieme di R
m
, oppure di C
m
; considereremo funzioni f de-
nite su A a valori reali. Introduciamo anzitutto un po di terminologia, che
daltronde `e analoga a quella usata per le successioni.
Denizione 3.2.1 Diciamo che una funzione f : A R `e limitata supe-
riormente in A se linsieme immagine di f, cio`e
f(A) = t R : x A : f(x) = t
`e limitato superiormente; in ogni caso si pone
sup
A
f =
_
sup f(A) se f(A) `e limitato superiormente,
+ se f(A) non `e limitato superiormente.
200
Similmente, diciamo che f `e limitata inferiormente in A se linsieme f(A) `e
limitato inferiormente; in ogni caso si pone
inf
A
f =
_
inf f(A) se f(A) `e limitato inferiormente,
se f(A) non `e limitato inferiormente.
Diciamo inne che f `e limitata in A se `e sia limitata superiormente che
inferiormente in A.
Potr`a accadere che sup
A
f, quando `e un numero reale, sia un valore assunto
dalla funzione, cio`e sia un elemento di f(A), oppure no; se esiste x A
tale che f(x) = sup
A
f, diremo che x `e un punto di massimo per f in A, e
scriveremo f(x) = max
A
f. Analogamente, se inf
A
f `e un elemento di f(A),
cio`e esiste x A tale che f(x) = inf
A
f, diremo che x `e un punto di minimo
per f in A, e scriveremo f(x) = min
A
f.
Esempi 3.2.2 (1) La funzione f : R R denita da f(x) =
|x|
1+|x|
`e limitata:
infatti si ha 0 f(x) 1 per ogni x R. Risulta anzi 0 = inf
R
f e
1 = sup
R
f; si noti che 0 `e il minimo, raggiunto nel punto di minimo 0, mentre
1 non appartiene a f(R) e la funzione f non ha massimo. Osserviamo anche
che f `e pari, ossia f(x) = f(x) per ogni x R: il suo graco `e quindi
simmetrico rispetto allasse y.
(2) La funzione f : R R denita da f(x) =
x
1+|x|
coincide con la precedente
per x 0, mentre `e la precedente cambiata di segno per x < 0: si tratta di
una funzione dispari, ossia f(x) = f(x) per ogni x R, ed il suo graco
`e simmetrico rispetto allorigine.
201
Risulta in particolare 1 = sup
R
f, 1 = inf
R
f e f non ha ne massimo ne
minimo.
(3) La funzione f(x, y) =
_
x
2
+y
2
`e denita su R
2
, `e illimitata supe-
riormente ed `e limitata inferiormente da 0. Si ha sup f = +, mentre
inf f = min f = 0.
(4) La funzione parte intera, denita per ogni x R da
[x] = maxk Z : k x,
non `e limitata ne inferiormente, ne superiormente, cosicche sup f = + e
inf f = ; il suo graco presenta dei salti di ampiezza 1 in corrispon-
denza di ciascun punto di ascissa intera.
(5) La funzione f(x) =
x
|x|
`e denita per x reale non nullo e assume solo
i valori 1. Quindi 1 = max f = sup f, 1 = min f = inf f. Si noti che
questa funzione ha inniti punti di massimo e inniti punti di minimo.
(6) La funzione f(x) =
_
1 [x[
2
m
`e denita sulla palla unitaria di R
m
, cio`e
B = x R
m
: [x[
m
1,
a valori in R. Essa ha massimo 1 (raggiunto per x = 0) e minimo 0 (raggiunto
nei punti della frontiera di B).
202
Funzioni continue
La nozione di funzione continua `e strettamente legata allidea intuitiva della
consequenzialit`a fra causa ed eetto. Ci aspettiamo che piccole variazioni di
input provochino piccole variazioni di output: ad esempio, quando si pigia il
pedale dellacceleratore, piccoli incrementi di pressione del piede producono
piccoli aumenti di velocit`a della macchina. Comunque nella nostra esperien-
za ci sono anche esempi di fenomeni di tipo impulsivo: piccoli aumenti di
pressione del dito su un interruttore causano, oltre una certa soglia, un dra-
stico aumento dellintensit`a della luce presente in una stanza. Chiameremo
continue quelle funzioni y = f(x) per le quali variando di poco la grandezza
x si ottiene una piccola variazione della quantit`a y. Pi` u precisamente:
Denizione 3.2.3 Sia A un sottoinsieme di R
m
, oppure di C
m
, sia f : A
R e sia x
0
A. Diciamo che f `e continua nel punto x
0
se per ogni > 0
esiste un > 0 tale che
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < .
Diciamo che f `e continua in A se `e continua in ogni punto di A.
Osservazioni 3.2.4 (1) La continuit`a di una funzione `e un fatto locale: essa
pu`o esserci o no a seconda del punto x
0
che si considera. Per un generico
punto x
0
A i casi sono due: o x
0
`e punto daccumulazione per A (denizione
3.1.11), oppure x
0
`e punto isolato di A, nel senso che esiste un intorno B(x
0
, )
di x
0
tale che A B(x
0
, ) = x
0
(esercizio 3.1.13). Nel secondo caso, ogni
funzione f : A R `e continua in x
0
, poiche qualunque sia > 0 risulta
x A, [x x
0
[
m
< = x = x
0
= [f(x) f(x
0
)[ = 0 < .
203
Nel primo caso, che `e lunico interessante, la denizione di continuit`a di una
funzione si riconduce a quella pi` u generale di limite di funzione, che daremo
fra poco.
(2) Se f : R
2
R `e continua in un punto (x
0
, y
0
), allora le funzioni x
f(x, y
0
) e y f(x
0
, y) sono continue rispettivamente nei punti x
0
e y
0
. Si
noti per`o che il viceversa `e falso: esistono funzioni f(x, y) tali che f(, y) `e
continua per ogni y, f(x, ) `e continua per ogni x, ma f non `e continua per
ogni (x, y) (si veda lesercizio 3.2.10).
Non tutte le funzioni pi` u importanti sono continue! Vediamo qualche esempio
di funzione continua e discontinua.
Esempi 3.2.5 (1) Tutte le funzioni ani sono continue. Si tratta delle
funzioni f : R
m
R della forma
f(x) = a x +b =
m

i=1
a
i
x
i
+b,
ove a R
m
e b R sono assegnati. Fissato x
0
R
m
e scelto > 0, si ha
[f(x) f(x
0
)[ = [a x +b a x
0
b[ = [a (x x
0
)[;
utilizzando la disuguaglianza di Cauchy-Schwarz (proposizione 3.1.1) si ot-
tiene
[f(x) f(x
0
)[ [a[
m
[x x
0
[
m
.
204
Quindi se a ,= 0 basta prendere 0 < <

|a|m
per avere
[x x
0
[
m
< = [f(x) f(x
0
)[ [a[
m
[x x
0
[
m
< [a[
m
< ;
daltronde se a = 0 si ha f(x) = b per ogni x R
m
, e la continuit`a `e ovvia.
(2) La somma di una serie di potenze con raggio di convergenza R > 0 `e
una funzione continua sul disco B(0, R) = z C : [z[ < R. Sia infatti
f(z) =

n=0
a
n
z
n
per [z[ < R: ssati z
0
con [z
0
[ < R e > 0, scegliamo un
numero positivo < R[z
0
[, cosicche risulta B(z
0
, ) B(0, R). Allora per
ogni z B(z
0
, ) si ha
[f(z) f(z
0
)[ =

n=0
a
n
z
n

n=0
a
n
z
n
0

n=1
a
n
(z
n
z
n
0
)

=
=

n=1
a
n
(z z
0
)(z
n1
+z
n2
z
0
+. . . +zz
n2
0
+z
n1
0
)

n=1
[a
n
[[z z
0
[([z[
n1
+[z[
n2
[z
0
[ +. . . +[z[[z
0
[
n2
+[z
0
[
n1
)

n=1
[a
n
[[z z
0
[
_
n([z
0
[ +)
n1

=
[z z
0
[
[z
0
[ +

n=1
n[a
n
[([z
0
[ +)
n
.
Dato che la serie di potenze

na
n
z
n
ha ancora raggio di convergenza R
(esercizio 2.7.9), otteniamo che la serie allultimo membro `e convergente, con
somma uguale a un numero che dipende da z
0
e da , cio`e da z
0
e da R; in
particolare, esiste K > 0 tale che
[f(z) f(z
0
)[ K[z z
0
[ z B(z
0
, ).
Adesso basta scegliere positivo e minore sia di che di /K, e si ottiene
[z z
0
[ < = [f(z) f(z
0
)[ < ,
e ci`o prova la continuit`a di f in z
0
.
(3) Come conseguenza dellesempio precedente, le funzioni trigonometriche
cos x e sin x sono continue su R, mentre lesponenziale e
z
`e continua su C (e
in particolare su R). Se a > 0, anche la funzione a
x
`e continua su R, essendo
a
x
= e
xlog a
=

n=0
(log a)
n
x
n
n!
x R.
205
(4) La funzione parte intera f(x) = [x] `e continua in ogni punto x / Z ed
`e discontinua in ogni punto x Z. Infatti, scelto x / Z, sia = minx
[x], [x + 1] x: allora qualunque sia > 0 si ha
[t x[ < = [t] = [x] = [[t] [x][ = 0 < .
Daltra parte se x Z allora, scelto ]0, 1] si ha
[[t] [x][ = [[t] x[ = 1 t ]x 1, x[,
quindi `e impossibile trovare un > 0 per cui si abbia
[t x[ < = [[t] [x][ < .
(5) Se b > 0 e b ,= 1, la funzione logaritmo di base b `e continua in ]0, +[.
Sia infatti x
0
> 0: se ]0, x
0
[ e [x x
0
[ < , si ha, supponendo ad esempio
x < x
0
:
[ log
b
x log
b
x
0
[ =

log
b
x
x
0

= [ log
b
e[ log
x
0
x
= [ log
b
e[ log
_
1 +
_
x
0
x
1
__
.
Notiamo ora che vale limportante disuguaglianza
log(1 +t) t t > 1 :
essa segue dalla crescenza del logaritmo e dal fatto, vericabile direttamente
se t 0 e con il criterio di Leibniz (proposizione 2.5.3) se 1 < t < 0, che
1 +t

n=0
t
n
n!
= e
t
t > 1.
Da tale disuguaglianza ricaviamo
[ log
b
x log
b
x
0
[ [ log
b
e[
_
x
0
x
1
_
= [ log
b
e[
x
0
x
x
[ log
b
e[

x
0

;
quindi, ssato > 0, baster`a prendere abbastanza piccolo per ottenere che
lultimo membro sia minore di . Nel caso in cui sia x
0
< x, il calcolo `e del
tutto simile.
206
Esercizi 3.2
1. Siano f : A R
m
R e g : B R R, con f(A) B; sia x
0
A e
sia y
0
= f(x
0
). Si provi che se f `e continua in x
0
e se g `e continua in
y
0
, allora la funzione composta g f(x) = g(f(x)) `e continua in x
0
.
2. Descrivere le funzioni f : A R
m
R che in un ssato punto
x
0
A vericano le seguenti propriet`a, parenti della denizione di
continuit`a:
(i) esiste > 0 tale che per ogni > 0 risulta
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < ;
(ii) esiste > 0 tale che per ogni > 0 risulta
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < ;
(iii) per ogni > 0 e per ogni > 0 risulta
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < ;
(iv) esistono > 0 e > 0 tali che risulta
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < .
3. (Permanenza del segno) Sia f : A R
m
R una funzione continua
in un punto x
0
A. Si provi che se f(x
0
) > 0, allora esiste una palla
B(x
0
, R) tale che f(x) > 0 per ogni x B(x
0
, R) A.
4. Si provi che la funzione
f(x) =
_
_
_
sin
1
x
se x R 0
se x = 0
`e discontinua nel punto 0, qualunque sia R.
5. Si provi che sono funzioni continue le combinazioni lineari di funzioni
continue ed i prodotti di funzioni continue.
207
6. Si provi che se f `e continua in x
0
e f(x
0
) ,= 0, allora
1
f
`e continua in
x
0
.
[Traccia: usare lesercizio 3.2.3.]
7. Sia R. Provare che la funzione f(x) = x

`e continua su [0, +[
(se 0) oppure su ]0, +[ (se < 0).
8. (Funzioni a valori vettoriali) Sia A un sottoinsieme di R
m
, sia x
0

A e sia f : A R
m
R
n
una funzione: la funzione (vettoriale) f
associa ad ogni vettore x = (x
1
, . . . , x
m
) A un altro vettore f(x) =
(f
1
(x), . . . , f
n
(x)) R
n
. Diciamo che f `e continua in x
0
se per ogni
> 0 esiste > 0 tale che
x A, [x x
0
[
m
< = [f(x) f(x
0
)[
n
< .
Provare che f `e continua in x
0
se e solo se le sue n componenti scalari
f
1
, . . . , f
n
sono continue in x
0
.
9. Sia B una palla di R
m
oppure di C
m
, sia f : B R una funzione
continua. Per ogni coppia di elementi ssati a, b B, provare che la
funzione
g(t) = f(ta + (1 t)b), t [0, 1],
`e ben denita e continua.
10. Sia f : R
2
R la funzione seguente:
f(x, y) =
_
_
_
4(x
2
y)(2y x
2
)
y
2
0 se y > 0
0 se y 0.
Si provi che:
(i) f `e continua in R
2
(0, 0);
(ii) f `e discontinua in (0, 0);
(iii) per ogni y R, f(, y) `e continua su R;
(iv) per ogni x R, f(x, ) `e continua su R.
208
11. Sia A R
m
e siano f, g due funzioni reali limitate denite in A. Si
provi che
sup
A
(f +g) sup
A
f + sup
A
g, inf
A
(f +g) inf
A
f + inf
A
g,
sup
A
(f) =
_
sup
A
f se 0
inf
A
f se 0,
inf
A
(f) =
_
inf
A
f se 0
sup
A
f se 0.
3.3 Limiti
Estendiamo ora al caso delle funzioni reali la nozione di limite, che ci `e gi`a
nota nel caso delle successioni. Sia A un sottoinsieme di R
m
oppure di C
m
,
sia f : A R, sia x
0
un punto daccumulazione per A.
Denizione 3.3.1 Sia L R. Diciamo che L `e il limite di f(x) per x che
tende a x
0
in A, e scriviamo
lim
xx
0
, xA
f(x) = L,
se per ogni > 0 esiste > 0 tale che
x A x
0
, [x x
0
[
m
< = [f(x) L[ < .
Se, in particolare, L = 0, si dice che f `e innitesima per x x
0
.
Se linsieme A coincide con R
m
(o con C
m
), oppure `e sottinteso dal contesto,
si scrive pi` u semplicemente
lim
xx
0
f(x) anziche lim
xx
0
, xA
f(x).
Si noti che in generale x
0
non appartiene ad A, e che x
0
non `e tra i valori
di x che sono coinvolti nella denizione di limite. Quindi, anche se per caso
si avesse x
0
A, non `e lecito far prendere alla variabile x il valore x
0
. Ad
esempio, consideriamo la funzione
pippo(x) =
_
19 se x R 130
237 se x = 130 :
il punto 130 `e di accumulazione per R, e benche risulti pippo(130) = 237, si
ha
lim
x130
pippo(x) = 19.
Il limite di una funzione pu`o essere anche :
209
Denizione 3.3.2 Diciamo che f(x) tende a +, oppure a , per x
x
0
in A, se per ogni M > 0 esiste > 0 tale che
x A x
0
, [x x
0
[
m
< = f(x) > M,
oppure
x A x
0
, [x x
0
[
m
< = f(x) < M.
In tal caso scriviamo
lim
xx
0
, xA
f(x) = +, oppure lim
xx
0
, xA
f(x) = .
Nel caso m = 1 e A R, in particolare, si pu`o fare anche il limite destro, op-
pure il limite sinistro, per x x
0
; nella denizione 3.3.1 questo corrisponde
a prendere come A la semiretta ]x
0
, +[ oppure la semiretta ] , x
0
[. Si
scrive in tali casi
lim
xx
+
0
f(x) = L, oppure lim
xx

0
f(x) = ,
e ci`o corrisponde a dire che per ogni > 0 esiste > 0 tale che
x
0
< x < x
0
+ = [f(x) L[ < ,
oppure
x
0
< x < x
0
= [f(x) [ < .
Inne, sempre nel caso m = 1 e A R, se A `e illimitato superiormente,
oppure inferiormente, si pu`o fare il limite per x +, oppure per x :
si avr`a
lim
x+
f(x) = L, oppure lim
x
f(x) = ,
se per ogni > 0 esiste M > 0 tale che
x > M = [f(x) L[ < , oppure x < M = [f(x) [ < .
Esempi 3.3.3 (1) Si ha
lim
x+
a
x
=
_

_
+ se a > 1
1 se a = 1
0 se 0 < a < 1,
lim
x
a
x
=
_

_
0 se a > 1
1 se a = 1
+ se 0 < a < 1;
lim
x+
log
b
x =
_
+ se b > 1
se 0 < b < 1,
lim
x0
+
log
b
x =
_
se b > 1
+ se 0 < b < 1.
210
(2) Se x
0
Z, risulta
lim
xx

0
[x] = x
0
1, lim
xx
+
0
[x] = x
0
;
in particolare, se x
0
Z il limite di [x] per x x
0
non esiste (esercizio 3.3.3).
Si ha per`o
lim
x+
[x] = +, lim
x
[x] = .
(I lettori sono invitati a vericare tutte queste aermazioni!)
Osservazione 3.3.4 I limiti sono legati alla continuit`a nel modo seguente.
Sia f : A R, sia x
0
un punto di accumulazione per A. Il punto x
0
pu`o
appartenere o non appartenere ad A. Se x
0
A, si ha che
f continua in x
0
lim
xx
0
f(x) = L R e L = f(x
0
).
Se invece, caso pi` u interessante, x
0
/ A, allora il fatto che il limite esista nito
equivale a dire che possiamo estendere la funzione f allinsieme A x
0
in
modo che lestensione sia continua in x
0
: basta assegnarle in tale punto il
valore del limite. In altre parole, denendo
f(x) =
_
f(x) se x A
L se x = x
0
,
si ha che
lim
xx
0
f(x) = L f `e continua in x
0
(si confronti con losservazione 3.2.4 (1)).
Esempi 3.3.5 (1) Risulta
lim
x0
sin x
x
= 1;
ci`o segue dalle disuguaglianze
cos x
sin x
x
1 x R 0
211
e dal fatto che il primo e il terzo membro tendono a 1 per x 0 (esempio
3.2.5 (3); si veda anche lesercizio 3.3.8). Dunque la funzione
f(x) =
_
_
_
sin x
x
se x R 0
1 se x = 0
`e continua nel punto 0. Daltronde questo si poteva vedere anche ricordando
che, per il teorema 2.7.11,
sin x =

n=0
(1)
n
x
2n+1
(2n + 1)!
x R,
da cui
sin x
x
=

n=0
(1)
n
x
2n
(2n + 1)!
x R 0;
la serie di potenze a secondo membro ha raggio di convergenza innito, ed
in particolare ha somma uguale a 1 per x = 0. La sua somma in R `e dunque
la funzione f, la quale risulta continua in virt` u dellesempio 3.2.5 (2).
(2) Proviamo che
lim
x0
1 cos x
x
2
=
1
2
.
Si ha (teorema 2.7.11)
cos x =

n=0
(1)
n1
x
2n
(2n)!
x R,
da cui
1 cos x
x
2
=

n=1
(1)
n
x
2n2
(2n)!
x R 0.
La serie a secondo membro ha raggio di convergenza innito e nel punto 0
ha somma uguale a 1/2; ne segue che la somma della serie, cio`e la funzione
f(x) =
_

_
1 cos x
x
2
se x R 0
1
2
se x = 0
212
`e continua per x = 0, e ci`o prova la tesi.
Si noti che la stessa conclusione si poteva ottenere pi` u semplicemente, osser-
vando che
1 cos x
x
2
=
1 cos
2
x
x
2
(1 + cos x)
=
_
sin x
x
_
2
1
1 + cos x
,
da cui, per lesempio precedente e per la continuit`a del coseno, esempio 3.2.5
(3),
lim
x0
1 cos x
x
2
=
1
2
.
(3) In modo analogo, utilizzando la serie esponenziale, si prova che
lim
x0
a
x
1
x
= log a a > 0.
I limiti per funzioni di m variabili (m > 1) costituiscono un problema al-
quanto dicile, pi` u che nel caso di una sola variabile: `e spesso pi` u facile
dimostrare che un dato limite non esiste, piuttosto che provarne lesistenza
quando esso esiste. Il motivo `e che in presenza di pi` u variabili il punto x
pu`o avvicinarsi al punto daccumulazione x
0
da varie direzioni, lungo una
qualunque retta o anche lungo traiettorie pi` u complicate. Gli esempi che
seguono illustrano alcune delle possibili situazioni.
Esempi 3.3.6 (1) Vediamo se esiste il limite
lim
(x,y)(0,0)
x
2
y
2
x
2
+y
2
.
Osservato che x
2
x
2
+y
2
per ogni (x, y) R
2
, risulta
x
2
y
2
x
2
+y
2
y
2
[(x, y)[
2
2
e quindi il limite proposto esiste e vale 0.
(2) Esaminiamo ora lesistenza del limite
lim
(x,y)(0,0)
xy
x
2
+y
2
.
213
In questo caso sia il numeratore che il denominatore sono polinomi di secondo
grado: se ci avviciniamo allorigine lungo la retta y = kx, si ottiene
xy
x
2
+y
2
=
k
1 +k
2
.
Quindi la funzione che stiamo esaminando assume valore costante su ogni
retta per lorigine, ma la costante cambia da retta a retta: ci`o signica che
in ogni intorno dellorigine la funzione assume tutti i valori
k
1+k
2
con k R,
ossia tutti i valori compresi nellintervallo ] 1, 1[. Dunque essa non ha limite
per (x, y) (0, 0).
(3) Come si comporta la funzione
yx
2
y
2
+x
4
per (x, y) (0, 0)? Se, come
nellesempio precedente, ci restringiamo alle rette y = kx, otteniamo i valori
yx
2
y
2
+x
4
=
kx
3
k
2
x
2
+x
4
=
kx
k
2
+x
2
i quali, per (x, y) (0, 0), tendono a 0 qualunque sia k R. Dunque il limite
della funzione per (x, y) (0, 0), se esiste, deve essere 0. Daltra parte, se
ci si restringe alle parabole y = mx
2
, si ottiene il valore costante
yx
2
y
2
+x
4
=
m
m
2
+ 1
che varia da parabola a parabola. Di conseguenza, anche in questo caso, il
limite della funzione non esiste.
Dagli esempi precedenti si conclude che non esiste una ricetta sicura e uni-
versale per stabilire lesistenza o la non esistenza di un limite in pi` u variabili:
ogni caso va studiato a parte.
Osservazione 3.3.7 Nel caso speciale m = 2 esiste un metodo abbastanza
ecace in molti casi, basato sullutilizzo delle coordinate polari. Poniamo
_
x = r cos
y = r sin ,
r 0, [0, 2].
Geometricamente, nel piano xy la quantit`a r `e la distanza del punto (x, y)
dallorigine, mentre il numero `e lampiezza dellangolo che il segmento di
estremi (0, 0) e (x, y) forma con il semiasse positivo delle ascisse (orientato
in verso antiorario).
214
Si noti che la corrispondenza
(r, ) (x, y) non `e biunivo-
ca: tutte le coppie (0, ) rap-
presentano lorigine, e le coppie
(r, 0) e (r, 2) rappresentano lo
stesso punto sul semiasse posi-
tivo delle ascisse. Lapplicazio-
ne (r, ) (x, y) trasforma ret-
tangoli del piano r in settori di
corone circolari del piano xy.
Naturalmente, ricordando la corrispondenza (x, y) x + iy, denita fra R
2
e C, la quale `e bigettiva e preserva le distanze, si vede immediatamente
che la rappresentazione in coordinate polari `e la trasposizione in R
2
della
rappresentazione in forma trigonometrica dei numeri complessi.
Consideriamo allora un limite della forma
lim
(x,y)(0,0)
f(x, y),
ove f `e una funzione reale denita in un intorno di (0, 0), salvo al pi` u (0, 0).
Vale il seguente risultato:
Proposizione 3.3.8 Risulta
lim
(x,y)(0,0)
f(x, y) = L R
se e solo se valgono le seguenti condizioni:
215
(i) per ogni [0, 2] esiste il limite, indipendente da ,
lim
r0
+
f(r cos , r sin ) = L;
(ii) Tale limite `e uniforme rispetto a , vale a dire che per ogni > 0 esiste
> 0 tale che
[f(r cos , r sin ) L[ < r ]0, [, [0, 2].
Dimostrazione Supponiamo che f(x, y) L per (x, y) (0, 0): allora,
per denizione, ssato > 0 esiste > 0 tale che
[f(x, y) L[ < (x, y) B((0, 0), ).
Dato che (r cos , r sin ) B((0, 0), ) per ogni r ]0, [ e per ogni
[0, 2], otteniamo
[f(r cos , r sin ) L[ < r ]0, [, [0, 2],
cosiche valgono (i) e (ii).
Viceversa, per ogni punto (x, y) B((0, 0), ), posto r cos = x e r sin = y,
si ha r ]0, [ e dunque, per (i) e (ii),
[f(x, y) L[ = [f(r cos , r sin ) L[ < ;
ne segue f(x, y) L.
Esempi 3.3.9 (1) Consideriamo il limite
lim
(x,y)(0,0)
2(x
2
+y
2
)
log[1 + (x
2
+y
2
)]
.
Utilizzando le coordinate polari si ha
lim
r0
+
2r
2
ln(1 +r
2
)
= 2,
ed il limite `e ovviamente uniforme rispetto a , dato che tale variabile `e
sparita. Si conclude che il limite cercato `e 2.
216
(2) Consideriamo il limite molto simile
lim
(x,y)(0,0)
2(x
2
+ 3y
2
)
ln[1 + (4x
2
+y
2
)]
.
Con la stessa procedura arriviamo a
lim
r0
+
2r
2
(cos
2
+ 3 sin
2
)
ln[1 +r
2
(4 cos
2
+ sin
2
)]
= 2
cos
2
+ 3 sin
2

4 cos
2
+ sin
2

= 2
1 + 2 sin
2

3 cos
2
+ 1
,
e questo limite dipende da . Ne segue che il limite proposto non esiste.
Il teorema-ponte
Il collegamento fra i limiti di successioni ed i limiti di funzioni `e fornito dal
teorema che segue, il quale ci dar`a modo di dedurre senza colpo ferire tutta
la teoria dei limiti di funzioni dai corrispondenti risultati gi`a dimostrati nel
capitolo 2 per le successioni.
Teorema 3.3.10 (teorema-ponte) Sia A un sottoinsieme di R
m
oppure
di C
m
, sia f : A R e sia x
0
un punto di accumulazione per A. Sia inoltre
L R oppure L = . Si ha
lim
xx
0
f(x) = L
se e solo se per ogni successione x
n
A x
0
, convergente a x
0
per
n , risulta
lim
n
f(x
n
) = L.
Dimostrazione (=) Sia ad esempio L R e supponiamo che f(x) L
per x x
0
; sia poi x
n
una successione contenuta in A x
0
che tende a
x
0
per n . Per ipotesi, ssato > 0, esiste > 0 tale che
x B(x
0
, ) (A x
0
) = [f(x) L[ < ;
daltra parte, poiche x
n
x
0
, esiste N tale che
n = [x
n
x
0
[
m
< .
Inoltre, dato che x
n
,= x
0
per ogni n, si ha
x
n
B(x
0
, ) (A x
0
) n ,
217
e pertanto
[f(x
n
) L[ < n .
Ci`o prova che f(x
n
) L per n . Se L = la tesi si prova in modo
del tutto simile.
(=) Supponiamo che L R, e che si abbia lim
n
f(x
n
) = L per qualun-
que successione x
n
contenuta in A x
0
tendente a x
0
per n . Se,
per assurdo, non fosse vero che f(x) tende a L per x x
0
, esisterebbe > 0
tale che per ogni > 0 si troverebbe un punto x

A x
0
per il quale
avremmo
[x

x
0
[
m
< ma [f(x

) L[ .
Scegliendo = 1/n, potremmo allora costruire una successione x
n
A
x
0
tale che
[x
n
x
0
[
m
<
1
n
ma [f(x
n
) L[ n N
+
.
Si avrebbe perci`o che x
n
A x
0
, x
n
x
0
ma f(x
n
) non tenderebbe
a L, contro lipotesi. Dunque
lim
xx
0
f(x) = L.
Il caso L = `e del tutto analogo.
Osservazioni 3.3.11 (1) Il teorema-ponte vale anche nel caso in cui m = 1,
A R e x (esercizio 3.3.11).
(2) Dal teorema-ponte si deduce che una funzione f : A R `e continua nel
punto x
0
A se e solo se per ogni successione x
n
A convergente a x
0
risulta
lim
n
f(x
n
) = f(x
0
).
Esempio 3.3.12 Calcoliamo il limite notevole
lim
y0
log
b
(1 +y)
y
,
ove b > 0, b ,= 1. Utilizzeremo il teorema-ponte. Sia y
n
una successione
innitesima tale che y
n
,= 0 per ogni n. Posto, per ogni n, x
n
= log
b
(1 +y
n
),
risulta
y
n
= b
xn
1,
218
e quindi
log
b
(1 +y
n
)
y
n
=
x
n
b
xn
1
;
dalle propriet`a di y
n
segue (per la continuit`a del logaritmo, esempio 3.2.5
(5)) che x
n
`e innitesima e che x
n
,= 0 per ogni n. Tenuto conto dellesem-
pio 3.3.5 (3) e del teorema-ponte, otteniamo
lim
n
log
b
(1 +y
n
)
y
n
= lim
n
x
n
b
xn
1
=
1
log b
,
e pertanto, ancora dal teorema-ponte,
lim
y0
log
b
(1 +y)
y
=
1
log b
.
Per un altro modo di calcolare tale limite si veda lesercizio 3.3.10.
Dal teorema-ponte e dai corrispondenti risultati esposti nel teorema 2.1.11
seguono le usuali propriet`a algebriche dei limiti:
Proposizione 3.3.13 Sia A un sottoinsieme di R
m
oppure di C
m
, sia x
0
un punto daccumulazione per A e siano f, g : A R funzioni tali che
lim
xx
0
f(x) = L, lim
xx
0
g(x) = M,
con L, M R. Allora:
(i) lim
xx
0
[f(x) +g(x)] = L +M;
(ii) lim
xx
0
[f(x)g(x)] = LM;
(iii) se M ,= 0, lim
xx
0
f(x)
g(x)
=
L
M
.
Si tenga ben presente che nei casi in cui L, oppure M, o entrambi, valgono 0
e , ci si pu`o imbattere in forme indeterminate del tipo +, 0(),
0/0, /; in tutti questi casi pu`o succedere letteralmente di tutto (esercizi
3.3.15, 3.3.16, 3.3.17 e 3.3.18).
219
Esercizi 3.3
1. Si provi che la funzione f(x) =
x
|x|
non ha limite per x 0 (in R); si
provi poi che, analogamente, la funzione f(x) =
x
|x|m
non ha limite per
x 0 (in R
m
).
2. Calcolare, se esistono, i seguenti limiti:
lim
x2
x
2
, lim
x4
1
x
, lim
x0
1
x
, lim
x0
1
[x[
, lim
x0

1
x
, lim
x3
6
x
6
3
x 3
.
3. Sia f :]a, b[R, sia x
0
]a, b[. Provare che
lim
xx
0
f(x) = L lim
xx

0
f(x) = L e lim
xx
+
0
f(x) = L.
4. Dimostrare che
lim
xx
0
f(x) = L = lim
xx
0
[f(x)[ = [L[;
`e vero il viceversa?
5. In quali punti x
0
R la funzione
h(x) =
_
1 se x Q
0 se x R Q
ha limite?
6. Posto
f(x) =
_
x se x Q
_
[x[ se x R Q,
calcolare, se esistono, i limiti
lim
x+
f(x), lim
x
f(x).
7. (Teorema di permanenza del segno) Sia f : A R, sia x
0
un punto
daccumulazione per A. Si provi che se
lim
xx
0
f(x) > 0
allora esiste una palla B(x
0
, R) tale che
f(x) > 0 x B(x
0
, R) (A x
0
).
220
8. (Monotonia dei limiti) Siano f, g : A R, sia x
0
un punto daccumu-
lazione per A. Si provi che se f(x) g(x) in una palla B(x
0
, R) x
0
,
allora si ha
lim
xx
0
f(x) lim
xx
0
g(x),
sempre che tali limiti esistano.
9. Provare che il limite di una funzione in un punto, se esiste, `e unico.
10. (Limiti di funzioni composte) Sia f : A R
m
R, sia x
0
un punto
daccumulazione per A e sia
lim
xx
0
f(x) = y
0
R.
Sia poi B R tale che B f(A) e supponiamo che y
0
sia punto
daccumulazione per B. Sia inne g : B R tale che
lim
yy
0
g(y) = L [, +].
Si provi che se vale una delle due condizioni seguenti:
(a) y
0
B e g `e continua in y
0
, oppure
(b) f(x) ,= y
0
in un intorno di x
0
,
allora
lim
xx
0
g(f(x)) = L.
Si provi inoltre che ci`o `e falso in generale se non valgono ne (a) ne (b).
11. Enunciare e dimostrare il teorema-ponte nel caso in cui A R sia
illimitato superiormente o inferiormente e x tenda a + oppure .
12. Calcolare, se esistono, i seguenti limiti:
lim
x0
tan x
x
, lim
x0
1 cos x
sin
2
x
, lim
x0
sin x x
x
3
, lim
x0
sin x tan x
x
3
cos x
.
221
13. Calcolare, se esistono, i seguenti limiti:
(i) lim
x1
_
x + 1
x 2
_
2
, (ii) lim
x2
sin x
x 2
, (iii) lim
x1
_
1
x + 1

1
(x + 1)
2
_
,
(iv) lim
x0
3x
1 e
2x
, (v) lim
x+
x
1/x
, (vi) lim
x
_
1
1
x
_
3x
,
(vii) lim
x+
3x
1 e
2x
, (viii) lim
x0
+
x
x
, (ix) lim
x+
log(1 +x
3
)
x
2
,
(x) lim
x0
+
sin

x
x
, (xi) lim
x0
+
x
1/x
, (xii) lim
x+
_
1
1
x
_
3x
.
14. Dimostrare che
lim
x0
+
x

log x = 0 > 0, lim


x+
log x
x

= 0 > 0.
15. Si costruiscano quattro coppie di funzioni f(x), g(x) tali che:
(a) valga lim
xx
0
f(x) = + e lim
xx
0
g(x) = ,
(b) per il limite della dierenza f(x) g(x) valga una delle seguenti
quattro situazioni:
lim
xx
0
[f(x) g(x)] = +, lim
xx
0
[f(x) g(x)] = ,
lim
xx
0
[f(x) g(x)] = R, lim
xx
0
[f(x) g(x)] non esiste.
16. Analogamente allesercizio 3.3.15, si forniscano esempi che illustrino
tutti i casi possibili per il limite di f(x)g(x) quando lim
xx
0
f(x) = 0
e lim
xx
0
g(x) = .
17. Analogamente allesercizio 3.3.15, si forniscano esempi che illustrino
tutti i casi possibili per il limite di
f(x)
g(x)
quando lim
xx
0
f(x) = 0 e
lim
xx
0
g(x) = 0.
18. Analogamente allesercizio 3.3.15, si forniscano esempi che illustrino
tutti i casi possibili per il limite di
f(x)
g(x)
quando lim
xx
0
f(x) = e
lim
xx
0
g(x) = .
222
19. Sia I un intervallo di R e sia f : I R una funzione. Diciamo che f `e
crescente in I se
x, x

I, x < x

= f(x) f(x

);
diciamo che f `e strettamente crescente in I se
x, x

I, x < x

= f(x) < f(x

).
Diciamo poi che f `e decrescente, oppure strettamente decrescente, in I,
se
x, x

I, x < x

= f(x) f(x

) oppure f(x) > f(x

).
Una funzione crescente, o decrescente, in I si dir`a monotona; una fun-
zione strettamente crescente, o strettamente decrescente, in I si dir`a
strettamente monotona. Si provi che se f `e monotona in I allora per
ogni x
0

I
esistono (niti) i limiti destro e sinistro
f(x
+
0
) = lim
xx
+
0
f(x), f(x

0
) = lim
xx

0
f(x),
e che
_
f(x

0
) f(x
0
) f(x
+
0
) se f `e crescente
f(x

0
) f(x
0
) f(x
+
0
) se f `e decrescente.
20. Sia A un sottoinsieme di R
m
o di C
m
, sia x
0
un punto di A e sia
f : A R una funzione. Il massimo limite ed il minimo limite di f
per x x
0
sono i numeri m, [, +] cos` deniti:
m = lim
r0
+
sup
xB(x
0
,r)
f(x), = lim
r0
+
inf
xB(x
0
,r)
f(x);
essi si denotano con le scritture
m = limsup
xx
0
f(x), = liminf
xx
0
f(x).
Si verichi che
(i) liminf
xx
0
f(x) limsup
xx
0
f(x);
223
(ii) si ha liminf
xx
0
f(x) = limsup
xx
0
f(x) se e solo se esiste, nito
o innito, lim
xx
0
f(x), ed in tal caso
liminf
xx
0
f(x) = limsup
xx
0
f(x) = lim
xx
0
f(x).
21. Calcolare, se esistono, i seguenti limiti:
lim
(x,y)(0,0)
sin xy
x
2
+y
2
, lim
(x,y)(0,0)
1 cos xy
x
2
+y
2
, lim
(x,y)(0,0)
e
(x+y)
2
1
_
x
2
+y
2
,
lim
(x,y)(0,0)
x
2
y
2
x
2
+y
4
, lim
(x,y)(0,0)
x
2
y
x
2
y
, lim
(x,y)(0,0)
y
2
+x +y
x
2
+x +y
.
22. (i) Posto f(x, y) =
x
2
x
2
+y
2
, si provi che esistono, e sono diversi fra loro,
i due limiti
lim
y0
_
lim
x0
f(x, y)
_
, lim
x0
_
lim
y0
f(x, y)
_
.
(ii) Posto invece f(x, y) =
xy
x
2
+y
2
, si provi che i due limiti esistono e
sono uguali, ma che non esiste il
lim
(x,y)(0,0)
f(x, y).
(iii) Posto inne
f(x, y) =
_
y sin
1
x
+x sin
1
y
se x ,= 0 e y ,= 0
0 se x = 0 oppure y = 0,
si provi che esiste il terzo limite, ma non i primi due.
3.4 Propriet`a delle funzioni continue
Le funzioni continue a valori reali hanno svariate propriet`a legate allordina-
mento di R. Il primo risultato riguarda funzioni denite su insiemi compatti
(osservazione 3.1.20), i quali, visto che consideriamo funzioni denite in R
m
o C
m
, sono limitati e chiusi (teorema 3.1.19).
224
Teorema 3.4.1 (di Weierstrass) Sia A R
m
(oppure A C
m
) un insie-
me compatto non vuoto, e sia f : A R una funzione continua. Allora f `e
limitata in A ed assume massimo e minimo su A.
Dimostrazione Sia L = sup
A
f; pu`o essere L = +, oppure L R. In
ogni caso dalle propriet`a dellestremo superiore segue che esiste y
n
f(A)
tale che y
n
L per n : infatti, se L = +nessun n N `e maggiorante
per f(A) e quindi esiste y
n
f(A) tale che y
n
> n, mentre se L R nessun
numero della forma L
1
n
`e maggiorante per f(A) e quindi esiste y
n
f(A)
tale che L
1
n
< y
n
L.
Poiche y
n
f(A), per ogni n esiste x
n
A tale che f(x
n
) = y
n
. La
successione x
n
`e dunque contenuta in A. Dato che A `e compatto, esiste
una sottosuccessione x
n
k
estratta da x
n
che converge per k ad un
punto x A: essendo f continua, si deduce che f(x
n
k
) = y
n
k
converge a
f(x) per k .
Daltra parte, poiche y
n
k
`e una sottosuccessione della successione y
n
che
convergeva a L, anche y
n
k
deve tendere a L per k . Per lunicit`a del
limite (esercizio 3.3.9), si ha L = f(x). In particolare, essendo f a valori in
R, si ha L R e dunque f `e limitata superiormente; inoltre L f(A), cio`e
L `e un massimo.
In modo del tutto analogo si prova che f `e limitata inferiormente e che ha
minimo in A.
Osservazioni 3.4.2 (1) Il pun-
to di massimo, cos` come quello
di minimo, non `e necessariamente
unico!
(2) Il teorema di Weierstrass `e
falso se togliamo una qualunque
delle sue ipotesi:
linsieme A = [0, [ `e chiuso ma non limitato e la funzione f(x) = x `e
continua in A ma non limitata;
linsieme A =]0, 1] `e limitato ma non chiuso e la funzione f(x) =
1
x
`e
continua ma non limitata;
nellinsieme compatto A = [0, 2] la funzione f(x) = x [x] non `e
continua e non ha massimo.
225
Il risultato che segue riguarda funzioni denite su una palla B(x
0
, R) di R
m
o di C
m
.
Teorema 3.4.3 (di esistenza degli zeri) Sia f : B(x
0
, R) R una fun-
zione continua, e supponiamo che esistano a
1
, b
1
B(x
0
, R) tali che f(a
1
) <
0, f(b
1
) > 0. Allora esiste almeno un punto x B(x
0
, R) tale che f(x) = 0.
Dimostrazione Supponiamo dapprima m = 1 e B(x
0
, R) R, cosicche
B(x
0
, R) =]x
0
R, x
0
+ R[ (il fatto che tale intervallo sia aperto non ha
comunque nessuna importanza nellargomento che segue). Si ha f(a
1
) < 0 <
f(b
1
) e possiamo anche supporre che a
1
< b
1
, perche in caso contrario basta
considerare f al posto di f.
Dividiamo in due parti uguali lintervallo [a
1
, b
1
] mediante il punto medio
1
2
(a
1
+ b
1
): se f si annulla proprio in tale punto abbiamo nito e la tesi `e
provata, altrimenti per uno (ed uno solo) dei due intervalli [a
1
,
1
2
(a
1
+ b
1
)],
[
1
2
(a
1
+b
1
), b
1
] si avr`a la stessa situazione di partenza, ossia la f sar`a negativa
nel primo estremo e positiva nel secondo. Indicheremo tale intervallo con
[a
2
, b
2
]: dunque abbiamo costruito un intervallo [a
2
, b
2
] tale che
[a
2
, b
2
] [a
1
, b
1
], b
2
a
2
=
1
2
(b
1
a
1
), f(a
2
) < 0 < f(b
2
).
In modo analogo si divide in due parti uguali lintervallo [a
2
, b
2
]: se f si
annulla nel punto medio
1
2
(a
2
+ b
2
) abbiamo nito, altrimenti si va avanti.
Ci sono due possibilit`a:
(1) dopo un numero nito di suddivisioni, si trova che la f si annulla proprio
nelln-simo punto medio
1
2
(a
n
+b
n
) e in tal caso la tesi `e provata;
(2) per ogni n N
+
si costruisce un intervallo [a
n
, b
n
] tale che
[a
n
, b
n
] [a
n1
, b
n1
], b
n
a
n
=
1
2
(b
n1
a
n1
), f(a
n
) < 0 < f(b
n
).
Consideriamo, nel caso (2), le due successioni a
n
e b
n
: esse sono limita-
te, perche contenute in ]x
0
R, x
0
+ R[, e monotone, crescente la prima e
decrescente la seconda. Siano allora
= lim
n
a
n
, L = lim
n
b
n
:
poiche a
n
< b
n
per ogni n, sar`a L; dato che b
n
a
n
= 2
n+1
(b
1
a
1
) 0,
sar`a = L.
226
Poniamo x = = L e proviamo che x `e il punto cercato. Dalle disuguaglianze
f(a
n
) < 0 < f(b
n
) e dalla continuit`a di f otteniamo, per n , f(x)
0 f(x), ossia f(x) = 0. La tesi `e provata nel caso m = 1.
Se m > 1, o anche se m = 1 e B(x
0
, R) C, ci si riconduce al caso precedente
introducendo la funzione
g(t) = f(ta
1
+ (1 t)b
1
), t [0, 1].
I punti ta
1
+ (1 t)b
1
per t [0, 1] descrivono, come sappiamo (paragrafo
1.11), il segmento di estremi a
1
e b
1
: quindi sono contenuti in B(x
0
, R).
Inoltre g `e continua (esercizio 3.2.1), e verica g(0) = f(b
1
) > 0, g(1) =
f(a
1
) < 0. Per la parte gi`a dimostrata, esiste t

[0, 1] tale che g(t

) = 0;
posto allora x

= t

a
1
+(1 t

)b
1
, si ottiene x

B(x
0
, R) e f(x

) = 0. La
tesi `e provata.
Osservazione 3.4.4 Il teorema di esistenza degli zeri vale in ipotesi molto
pi` u generali sullinsieme di denizione di f: basta che esso sia connesso, cio`e
non fatto di due o pi` u pezzi staccati; pi` u rigorosamente, un sottoinsieme
E di R
m
o di C
m
`e connesso se non `e possibile trovare due aperti non vuoti e
disgiunti A e B tali che E = (AB)E. Si pu`o far vedere che un sottoinsieme
E di R
m
o di C
m
`e connesso se, dati due punti a, b E, ci si pu`o muovere
con continuit`a da a a b (non necessariamente in modo rettilineo) senza mai
uscire dallinsieme E.
Se f `e continua in A ma A non `e connesso, il teorema 3.4.3 `e ovviamente
falso: per esempio, la funzione f : [0, 1] [2, 3] R denita da
f(x) =
_
1 se 0 x 1
1 se 2 x 3
`e continua, prende valori sia positivi che negativi ma non `e mai nulla.
Dal teorema di esistenza degli zeri segue senza troppa fatica un risultato assai
pi` u generale:
Corollario 3.4.5 (teorema dei valori intermedi) Se A `e un sottoinsie-
me connesso di R
m
o di C
m
e se f : A R `e continua, allora f assume tutti
i valori compresi fra il suo estremo superiore e il suo estremo inferiore.
Dimostrazione Sia y ] inf
A
f, sup
A
f[; dobbiamo provare che esiste x
A tale che f(x) = y. Dato che inf
A
f < y < sup
A
f, per le propriet`a
dellestremo superiore e dellestremo inferiore esistono a, b A tali che
inf
A
f f(a) < y < f(b) sup
A
f.
227
Poniamo ora g(x) = f(x) y: la funzione g `e continua e verica g(a) < 0 <
g(b). Poiche A `e connesso, per il teorema di esistenza degli zeri esiste x A
tale che g(x) = 0, ossia f(x) = y. La tesi `e provata.
Siamo ora in grado di dimostrare il teorema 1.12.12 relativo alla misura
in radianti degli angoli orientati, enunciato nel paragrafo 1.12, e che qui
richiamiamo:
Teorema 1.12.12 Per ogni [0, 2[ esiste un unico numero complesso w,
di modulo unitario, tale che
(
+
(1, w)) = 2a(
+
(1, w)) = .
La funzione g(w) = (
+
(1, w)) `e bigettiva da S(0, 1) in [0, 2[ ed `e surgettiva
da C0 in [0, 2[. Se w C0, il numero = (
+
(1, w)) si dice misura
in radianti dellangolo individuato dai punti 0, 1,
w
|w|
.
Dimostrazione Useremo le notazioni stabilite nel paragrafo 1.12. Poniamo
g(w) = (
+
(1, w)) = 2 a(
+
(1, w)), w
+
(1, i).
Dal corollario 1.12.11 segue che
[v w[ < [(
+
(1, v)) (
+
(1, w))[

2[v w[ v, w
+
(1, i);
ci`o mostra che g :
+
(1, i) [0, /2] `e continua e iniettiva. Inoltre, larco

+
(1, i) `e un insieme connesso. In particolare,
g(1) = (
+
(1, 1)) = 0, g(i) = (
+
(1, i)) =
1
4
(S(0, 1)) =

2
;
quindi, per il teorema dei valori intermedi, g `e anche surgettiva. Notiamo che
la disuguaglianza sopra scritta ci dice che linversa g
1
: [0, /2]
+
(1, i) `e
pure continua.
La funzione g(w) = (
+
(1, w)) `e poi ben denita per ogni w S(0, 1), a
valori in [0, 2[; verichiamo che essa `e ancora continua (salvo che nel punto
1) e surgettiva. A questo scopo osserviamo che, in virt` u della proposizione
1.12.10 e dellesercizio 1.12.4, per w
+
(i, 1) si ha
g(w) = (
+
(1, w)) = (
+
(1, i)) +(
+
(i, w)) =
=

2
+(
+
(1, iw)) =

2
+g(iw).
228
Poiche iw
+
(1, i), per quanto gi`a dimostrato (e per la continuit`a di
w iw) la funzione w g(iw) `e continua, e vale /2 nel punto w = i;
dunque g `e continua su
+
(1, 1) e, in particolare, g(1) = .
Se, inne, w
+
(1, 1) 1, allora
g(w) = (
+
(1, w)) = (
+
(1, 1)) +(
+
(1, w)) =
= +(
+
(1, w)) = +g(w);
essendo w
+
(1, 1), la funzione w g(w) `e continua; dunque anche
g : S(0, 1) 1 [0, 2[ `e continua. Poiche inoltre g assume il valore nel
punto w = 1, si ricava
sup
wS(0,1)
g(w) = sup
z
+
(1,1)
g(z) + = 2.
Ci`o prova che g : S(0, 1) [0, 2[ `e surgettiva. Osserviamo che
lim
w

(1,i), w1
g(w) = 2, lim
w
+
(1,i), w1
g(w) = 0,
cosicche g `e discontinua nel punto 1 S(0, 1).
Il teorema 1.12.12 `e completamente dimostrato.
Funzioni continue invertibili
Consideriamo una funzione f : A R R continua e iniettiva; ci chiediamo
se anche la funzione inversa f
1
: f(A) A `e continua.
Si vede facilmente che in generale
la risposta `e no: ad esempio, sia
A = [0, 1]]2, 3] e sia
f(x) =
_
x se x [0, 1]
x 1 se x ]2, 3].
Chiaramente, f `e iniettiva e
f(A) = [1, 2]. Determiniamo la
funzione inversa f
1
risolvendo ri-
spetto a x lequazione y = f(x).
Si ha
y = f(x) =
_
x se x [0, 1]
x 1 se x ]2, 3].
x =
_
y se y [0, 1]
y + 1 se y ]1, 2],
229
e il graco di f
1
si ottiene per
simmetria rispetto alla bisettrice
y = x (osservazione 1.3.1). Si ri-
conosce allora che f `e continua
in tutti i punti, compreso x = 1,
mentre f
1
`e discontinua nel pun-
to x = f(1) = 1.
Sotto opportune ipotesi sullinsie-
me A, per`o, lesistenza e la con-
tinuit`a di f
1
sono garantite dal
seguente risultato.
Teorema 3.4.6 Sia I un intervallo di R (limitato o no). Se f : I R `e
continua e iniettiva, allora:
(i) f `e strettamente monotona;
(ii) f(I) `e un intervallo;
(iii) f
1
: f(I) I `e ben denita e continua.
Dimostrazione (i) Sia [a, b] un arbitrario sottointervallo di I. Confron-
tiamo f(a) e f(b): se si ha f(a) < f(b), proveremo che f `e strettamente
crescente in [a, b], mentre se f(a) > f(b) proveremo che f `e strettamente
decrescente in [a, b]; leventualit`a f(a) = f(b) `e vietata dalliniettivit`a di f.
Supponiamo ad esempio f(a) < f(b) (il caso opposto `e del tutto analogo).
Siano c, d punti di [a, b] tali che c < d e ammettiamo, per assurdo, che sia
f(c) f(d). Consideriamo le funzioni (ovviamente continue)
x(t) = a +t(c a), y(t) = b +t(d b), t [0, 1].
Osserviamo che
f(x(0)) = f(a) < f(b) = f(y(0)), f(x(1)) = f(c) f(d) = f(y(1)).
Quindi, introdotta la funzione
F(t) = f(y(t)) f(x(t)), t [0, 1],
F `e una funzione continua (esercizio 3.2.1) tale che F(0) > 0 F(1). Per
il teorema di esistenza degli zeri (teorema 3.4.3), esister`a allora un punto
230
t

]0, 1] tale che F(t

) = 0, ossia f(x(t

)) = f(y(t

)): essendo f iniettiva si


deduce x(t

) = y(t

), cio`e t

(d c) + (1 t

)(b a) = 0. Dato che b > a e


d > c, ci`o `e assurdo.
Pertanto f(c) < f(d) e dunque f `e strettamente crescente in [a, b].
Se ora [a
1
, b
1
] `e un intervallo tale che [a, b] [a
1
, b
1
] I, la f `e strettamente
crescente anche in [a
1
, b
1
]: se infatti fra a
1
e a vi fosse un punto x
1
con
f(x
1
) f(a), per il teorema dei valori intermedi f assumerebbe lo stesso
valore in un altro punto x a, violando cos` liniettivit`a. Per larbitrariet`a
di [a
1
, b
1
] I, si ottiene allora che f `e strettamente crescente in I.
(ii) Per il teorema dei valori intermedi (corollario 3.4.5) si ha
_
inf
I
f, sup
I
f
_
f(I),
mentre, per denizione di estremo superiore ed estremo inferiore,
f(I)
_
inf
I
f, sup
I
f
_
.
Dunque f(I) `e un intervallo (che indicheremo con J) di estremi inf
I
f e
sup
I
f: esso pu`o comprendere, o no, uno o entrambi gli estremi.
(iii) Anzitutto, f
1
`e ovviamente ben denita su J ed `e una funzione stretta-
mente monotona (crescente se f `e crescente, decrescente se f `e decrescente),
e f
1
(J) = I. Sia y
0
un punto interno a J, e poniamo
= lim
yy

0
f
1
(y), L = lim
yy
+
0
f
1
(y);
questi limiti esistono certamente poiche f
1
`e monotona. Inoltre si ha
(esercizio 3.3.19)
f
1
(y
0
) L se f `e crescente,
f
1
(y
0
) L se f `e decrescente.
Dimostriamo che = L: dato che f `e continua nei punti e L, si ha
f() = lim
yy

0
f(f
1
(y)) = lim
yy

0
y = y
0
, f(L) = lim
yy
+
0
f(f
1
(y)) = lim
yy
+
0
y = y
0
,
cosicche f() = f(L) e dunque, per liniettivit`a, = L = f
1
(y
0
), cio`e
lim
yy
0
f
1
(y) = f
1
(y
0
)).
231
Quindi f
1
`e continua in y
0
.
Se y
0
`e un estremo di J, largomento sopra esposto si ripete in modo ancor
pi` u semplice.
Osservazione 3.4.7 Il teorema precedente `e di gran lunga il caso pi` u im-
portante, ma la continuit`a di f
1
si ottiene anche nel caso in cui la funzio-
ne continua ed iniettiva f sia denita su un insieme A compatto: vedere
lesercizio 3.4.1.
Esempi 3.4.8 (1) La funzione f(x) = sin x `e continua ma non certo iniet-
tiva; tuttavia la sua restrizione allintervallo [/2, /2] `e iniettiva, essendo
strettamente crescente. La funzione inversa di tale restrizione si chiama ar-
coseno e si scrive f
1
(y) = arcsin y. Essa `e denita su [1, 1], `e a valori in
[/2, /2] ed `e continua per il teorema 3.4.6. Si noti che
sin(arcsin x) = x x [1, 1],
arcsin(sin x) = (1)
k
(x k) x
_

2
+k,

2
+k

, k Z.
(2) La restrizione della funzione cos x allintervallo [0, ] `e continua e stret-
tamente decrescente, quindi iniettiva. Linversa di tale restrizione si chiama
arcocoseno e si scrive arccos x; essa `e denita su [1, 1], `e a valori in [0, ] ed
`e continua per il teorema 3.4.6. Si noti che
cos(arccos x) = x x [1, 1],
arccos(cos x) = (1)
k
(x (k +
1
2
)) +

2
x [k, (k + 1)], k Z.
232
(3) La restrizione della funzione
tan x allintervallo ] /2, /2[ `e
continua e strettamente crescente,
quindi iniettiva (ed anche surgetti-
va su R). Linversa di tale restrizio-
ne si chiama arcotangente e si scrive
arctan x; essa `e denita su R, `e a va-
lori in ] /2, /2[ ed `e continua per
il teorema 3.4.6. Si noti che
tan(arctan x) = x x R,
arctan(tan x) = x k
x
_

2
+k,

2
+k
_
, k Z.
(4) Sia b > 0, b ,= 1. La funzione log
b
x, che `e linversa della funzione con-
tinua b
x
, `e continua per il teorema 3.4.6, ma lo sapevamo gi`a (esempio 3.2.5
(5)).
(5) Se n N, la funzione x
2n+1
`e continua e strettamente crescente su R,
dunque `e iniettiva (ed anche surgettiva su R). La funzione inversa `e quindi
233
denita e continua su R, a valori in R ed `e la funzione radice (2n + 1)-sima:
x = y
1
2n+1
y = x
2n+1
.
La radice (2n + 1)-sima ora denita `e il prolungamento a tutto R della fun-
zione y y
1
2n+1
, che fu introdotta per y 0 nel paragrafo 1.8.
Ricordiamo a questo proposito che in campo complesso le radici (2n+1)-sime
di un numero reale y sono 2n + 1: una `e reale, ed `e y
1
2n+1
, le altre 2n non
sono reali e sono a due a due coniugate (esercizio 1.12.23).
Esercizi 3.4
1. Sia f : R R continua e tale che
lim
x
f(x) < 0, lim
x+
f(x) > 0.
Provare che esiste x R tale che f(x) = 0.
2. Sia f una funzione continua denita in [0, 1] a valori in Q, tale che
f(0) = 23. Si calcoli f(e 2).
3. Sia f : [a, b] [a, b] continua. Si provi che f ha almeno un punto sso,
cio`e esiste x
0
[a, b] tale che f(x
0
) = x
0
.
234
4. Supponiamo che la temperatura allequatore sia, ad un dato istante,
una funzione continua della longitudine. Si dimostri che esistono in-
nite coppie di punti (P, P

) situati lungo lequatore, tali che la tempe-


ratura in P e la temperatura in P

siano uguali fra loro; si provi inoltre


che una almeno di tali coppie `e formata da due localit`a diametralmente
opposte.
5. Stabilire se le seguenti funzioni sono invertibili oppure no:
(i) f(x) = x +e
x
, x R; (ii) f(x) = e
x
x, x R;
(iii) f(x) = x
2
+x, x R; (iv)f(x) = sin
x
1+|x|
, x R;
(v) f(x) = arctan
3
x, x R; (vi) f(x) = x
3
x, x R;
(vii) f(x) = sin
3
x, x [

2
,

2
], (viii) f(x) = sin x
3
, x [

2
,

2
].
6. Sia f : A R R continua e iniettiva. Se A `e compatto, si provi che
f
1
`e continua.
[Traccia: si mostri che per ogni y
n

nN
f(A), convergente ad un
ssato y f(A), risulta f
1
(y
n
) f
1
(y).]
7. Sia f(x) = x
3
+ x + 1, x R. Si provi che f : R R `e bigettiva e si
calcoli, se esiste, il limite
lim
y+
f
1
_
3y
y + 4
_
.
8. Provare che
arcsin x + arccos x =

2
x [1, 1],
arctan x + arctan
1
x
=
_
/2 se x > 0,
/2 se x < 0.
9. Dimostrare la relazione
arctan u arctan v = arctan
u v
1 +uv
per ogni u, v R con [ arctan u arctan v[ <

2
.
[Traccia: utilizzare la formula di sottrazione per la funzione tangente.]
235
10. Provare che
arctan
1
n
2
+n + 1
= arctan
1
n
arctan
1
n + 1
n N
+
,
e calcolare di conseguenza la somma della serie

n=1
arctan
1
n
2
+n+1
.
11. (i) Trovare una funzione continua f : R R tale che per ogni c R
lequazione f(x) = c abbia esattamente tre soluzioni.
(ii) Provare che non esiste alcuna funzione continua f : R R tale
che per ogni c R lequazione f(x) = c abbia esattamente due
soluzioni.
(iii) Per quali n N `e vero che esiste una funzione continua f : R R
tale che per ogni c R lequazione f(x) = c abbia esattamente n
soluzioni?
12. (i) Provare che per ogni k Z lequazione tan x = x ha nellintervallo
]k /2, k +/2[ una e una sola soluzione x
k
.
(ii) Dimostrare che
lim
k
_
x
k
k +

2
_
= 0, lim
k+
_
x
k
k

2
_
= 0.
13. (i) Provare che per ogni n N
+
i graci delle due funzioni e
x
e x
n
si incontrano nel primo quadrante in un unico punto (x
n
, y
n
), con
x
n
, y
n
]0, 1[.
(ii) Provare che la successione x
n
`e crescente e che la successione
y
n
`e decrescente.
(iii) Calcolare i limiti
lim
n
x
n
, lim
n
y
n
.
14. Provare che la funzione f(x) = arccos
x1
x
`e iniettiva sullinsieme A dove
`e denita; determinare limmagine f(A) e scrivere la funzione inversa
f
1
.
15. (i) Vericare che le relazioni
tan x =
1
x
, k < x < (k + 1), k Z,
deniscono univocamente una successione reale x
k

kZ
.
236
(ii) Provare che
0 < x
k+1
x
k
< k N, lim
k+
(x
k
k) = 0.
(iii) Per quali > 0 la serie

k=0
(x
k
k)

`e convergente?
3.5 Asintoti
Sia [a, b] un intervallo di R e sia x
0
]a, b[. Data una funzione f : [a, b]
x
0
R, si dice che la retta di equazione x = x
0
`e un asintoto verticale di
f per x x
+
0
, oppure per x x

0
, se risulta
lim
xx
+
0
f(x) = , oppure lim
xx

0
f(x) = .
Data una funzione reale f denita sulla semiretta ] , a], oppure sulla
semiretta [a, +[, si dice che la retta di equazione y = px + q `e un asintoto
obliquo di f (ovvero un asintoto orizzontale di f quando p = 0) per x ,
oppure per x +, se risulta
lim
x
[f(x) px q] = 0, oppure lim
x+
[f(x) px q] = 0.
Per scoprire se una data funzione f ha un asintoto obliquo, ad esempio, per
x +, bisogna controllare lesistenza di tre limiti, e cio`e vericare se:
(i) lim
x+
f(x) = ;
(ii) lim
x+
f(x)
x
= p R 0;
(iii) lim
x+
[f(x) px] = q R.
Se i tre limiti esistono, allora lasintoto `e la retta di equazione y = px + q.
Viceversa, se f ha, per x +, lasintoto obliquo di equazione y = px +q,
allora ovviamente valgono (i), (ii) e (iii).
Invece, per vedere se la funzione f ha un asintoto orizzontale per x +,
`e necessario e suciente che si abbia
lim
x+
f(x) = L R.
237
Esercizi 3.5
1. Determinare, se esistono, gli asintoti delle seguenti funzioni:
(i)

1 +x
2
, (ii) log x, (iii)
x
4
+ 1
x
3
, (iv) arcsin
x
2
x
2
+ 1
,
(v)
_
x + 1
x 1
, (vi) e
1/x
, (vii) [x 2[, (viii) arctan
e
x
e
x
1
,
(ix)
sin x
x
, (x) x log x, (xi)
_
[x
2
1[, (xii) arccos e
2|x|+x
.
2. Sia f : [a, +[ R tale che
f(x)
x
p per x +, con p R 0.
La funzione f ha necessariamente un asintoto obliquo per x +?
238
Capitolo 4
Calcolo dierenziale
4.1 La derivata
Sia f :]a, b[R una funzione e sia G R
2
il suo graco:
G = (x, y) R
2
: x [a, b], y = f(x).
Fissiamo x
0
]a, b[: vogliamo dare un
signicato preciso alla nozione intui-
tiva di retta tangente a G nel punto
P = (x
0
, f(x
0
)) (sempre che tale ret-
ta esista).
Consideriamo un altro punto Q = (x
0
+
h, f(x
0
+ h)) G, ove h `e un numero
reale abbastanza piccolo da far s` che
x
0
+h ]a, b[. Tracciamo la retta secan-
te il graco passante per P e Q: come
si verica facilmente, essa ha equazione
y = f(x
0
) +
f(x
0
+h) f(x
0
)
h
(xx
0
).
Al tendere di h a 0, se f `e continua in x
0
il punto Q tende, lungo il graco
G, al punto P; dunque lintuizione geometrica ci dice che la retta secante
tende verso una posizione limite che `e quella della retta tangente a G in
P; ma lintuizione geometrica ci dice anche che questa posizione limite pu`o
non esistere.
239
Diamo allora la seguente denizione che ci permetter`a di attribuire un signi-
cato preciso al termine retta tangente.
Denizione 4.1.1 Sia f :]a, b[ R e sia x
0
]a, b[. Diciamo che f `e
derivabile nel punto x
0
se il rapporto incrementale di f in x
0
, ossia la
quantit`a
f(x
0
+h) f(x
0
)
h
,
ha limite nito per h 0. Tale limite si chiama derivata di f in x
0
e si
indica col simbolo f

(x
0
), oppure Df(x
0
):
f

(x
0
) = Df(x
0
) = lim
h0
f(x
0
+h) f(x
0
)
h
.
Diciamo poi che f `e derivabile in ]a, b[ se f `e derivabile in ogni punto di
]a, b[.
Osservazioni 4.1.2 (1) Con notazione equivalente, f `e derivabile nel punto
x
0
se e solo se esiste nito il limite
lim
xx
0
f(x) f(x
0
)
x x
0
.
(2) Dire che f `e derivabile nel punto x
0
]a, b[ `e equivalente alla seguente
aermazione: esistono un numero reale L ed una funzione h (h) denita
in un intorno U di 0, tali che
(a) lim
h0
(h) = 0, (b) f(x
0
+h) f(x
0
) = Lh +h (h) per h U.
240
Infatti se f `e derivabile in x
0
basta porre L = f

(x
0
) e
(h) =
f(x
0
+h) f(x
0
)
h
f

(x
0
)
per ottenere (a) e (b) con U =]a, b[; viceversa se valgono (a) e (b) allora,
dividendo in (b) per h e passando al limite per h 0, in virt` u di (a) si
ottiene che f `e derivabile in x
0
con f

(x
0
) = L.
Dallosservazione 4.1.2 (2) segue che se f `e derivabile in x
0
allora lincremento
di f, ossia la quantit`a f(x
0
+h) f(x
0
), `e somma di due addendi: il primo,
f

(x
0
)h, varia linearmente con h, mentre il secondo, h(h), `e un innitesimo
di ordine superiore per h tende ancora a 0.
La quantit`a h (h), che tende a 0
pi` u rapidamente di h per h 0,
`e lerrore che si commette volendo
approssimare, in un intorno di x
0
,
lincremento di f con la sua parte
lineare f

(x
0
)h. Questa approssi-
mazione corrisponde a sostituire
al graco di f, in un intorno di
(x
0
, f(x
0
)), quello della funzione
ane
g(x) = f(x
0
) +f

(x
0
)(x x
0
),
il cui graco `e la retta per (x
0
, f(x
0
)) di coeciente angolare f

(x
0
). Si noti
che questa retta, fra tutte le rette passanti per (x
0
, f(x
0
)), `e quella che rea-
lizza la miglior approssimazione rettilinea del graco di f nellintorno di tale
punto. Infatti, scelta una qualunque retta passante per (x
0
, f(x
0
)), quindi di
equazione
y = g
m
(x) = f(x
0
) +m(x x
0
)
e coeciente angolare m R, si verica facilmente che risulta
lim
xx
0
(f(x) g
m
(x)) = 0 m R,
ma che daltra parte si ha
lim
xx
0
f(x) g
m
(x)
x x
0
= f

(x
0
) m m R,
241
e che quindi
lim
xx
0
f(x) g
m
(x)
x x
0
= 0 m = f

(x
0
) g
m
(x) g(x).
Le considerazioni precedenti giusticano la seguente
Denizione 4.1.3 Sia f :]a, b[ R una funzione derivabile nel punto x
0

]a, b[. La retta di equazione y = f(x
0
) + f

(x
0
)(x x
0
) si chiama retta
tangente nel punto (x
0
, f(x
0
)).
La derivata f

(x
0
) `e dunque il coeciente angolare della retta che meglio
approssima il graco di f in (x
0
, f(x
0
)), e quindi ne misura la pendenza,
ossia la rapidit`a con cui f cresce o decresce intorno a tale punto.
Chiarito il signicato geometrico della derivata, vediamo ora il nesso fra
derivabilit`a e continuit`a.
Proposizione 4.1.4 Sia f :]a, b[ R e sia x
0
]a, b[. Se f `e derivabile in
x
0
, allora f `e continua in x
0
. Il viceversa `e falso.
Dimostrazione Dallosservazione 4.1.2 (2) segue subito che
lim
h0
f(x
0
+h) = lim
xx
0
f(x) = f(x
0
),
e ci`o prova la continuit`a. Viceversa, la funzione f(x) = [x[ `e continua su R,
ma scelto x
0
= 0 si ha
f(h) f(0)
h
=
[h[ 0
h
=
_
1 se h > 0
1 se h < 0,
quindi il limite del rapporto incrementale di f nel punto 0 non esiste.
Esempi 4.1.5 (1) Sia n N e consideriamo la funzione f(x) = x
n
. Per
ogni x
0
R si ha
f(x) f(x
0
)
x x
0
=
x
n
x
n
0
x x
0
=
_

_
0 se n = 0
1 se n = 1
n1

k=0
x
nk
x
k
0
se n > 1,
242
cosicche quando x x
0
ricaviamo
f

(x
0
) =
_

_
0 se n = 0
1 se n = 1
nx
n1
0
se n > 1
_

_
= nx
n1
0
n N.
In denitiva, scrivendo x al posto di x
0
, troviamo che
Dx
n
= nx
n1
x R, n N
(intendendo, nel caso x = 0 e n = 1, che la derivata vale 1).
(2) La derivata `e unapplicazione lineare: ci`o signica che se f e g sono due
funzioni derivabili nel punto x, e se e sono due numeri reali, allora la
funzione f +g `e derivabile nel punto x e
(f +g)

(x) = f

(x) +g

(x).
In particolare, quindi, da (1) segue che ogni polinomio `e derivabile in R: se
P(x) =
N

k=0
a
k
x
k
, x R,
allora
P

(x) =
N

k=1
k a
k
x
k
x R.
(3) Prodotti e quozienti di funzioni derivabili (questi ultimi, naturalmente,
nei punti dove sono deniti) sono funzioni derivabili (esercizi 4.1.2, 4.1.3 e
4.1.4).
(4) Se n N
+
, la funzione f(x) = x
n
`e denita per x ,= 0 ed `e derivabile
in tutti questi punti. Infatti si ha per ogni x ,= 0 e h ,= 0 tale che x +h ,= 0:
(x +h)
n
x
n
h
=
x
n
(x +h)
n
h x
n
(x +h)
n
,
e per quanto visto nellesempio (1),
lim
h0
(x +h)
n
x
n
h
= lim
h0
(x +h)
n
x
n
h

1
(x +h)
n
x
n
=
nx
n1
x
2n
,
243
ossia
Dx
n
= n x
n1
x ,= 0.
(5) Fissato k N
+
, la funzione f(x) = x
1/k
`e denita per x 0 ed `e
derivabile per ogni x > 0. Infatti, per tutti gli h ,= 0 tali che x +h > 0 si ha
(x +h)
1/k
x
1/k
h
=
1

k1
j=0
(x +h)
(k1j)/k
x
j/k
,
da cui
Dx
1/k
= lim
h0
(x +h)
1/k
x
1/k
h
=
1
k x
(k1)/k
=
1
k
x
1
k
1
x > 0.
(6) Sia r Q 0. La funzione f(x) = x
r
, denita per x 0 se r > 0 e
per x > 0 se r < 0, `e derivabile in ogni punto x > 0. Infatti, supponiamo
dapprima r > 0: posto r = p/q, con p, q N
+
e primi fra loro, si ha per ogni
x > 0 e h ,= 0 tale che x +h > 0:
(x +h)
r
x
r
h
=
(x +h)
p/q
x
p/q
h
=
=
1
h
[(x +h)
1/q
x
1/q
]
p1

j=0
(x +h)
(p1j)/q
x
j/q
,
da cui, grazie a (5),
Dx
r
= lim
h0
(x +h)
r
x
r
h
=
1
q
x
1
q
1
p x
p1
q
=
p
q
x
p
q
1
= r x
r1
x > 0.
Se invece r < 0, possiamo scrivere, come in (4),
(x +h)
r
x
r
h
=
(x +h)
|r|
x
|r|
h
=
x
|r|
(x +h)
|r|
h(x +h)
|r|
x
|r|
da cui
lim
h0
(x +h)
r
x
r
h
=
[r[x
|r|1
x
2|r|
= [r[ x
|r|1
= r x
r1
x > 0.
Abbiamo perci`o
Dx
r
= r x
r1
x > 0, r Q.
244
(7) Fissato b > 0, la funzione esponenziale f(x) = b
x
`e derivabile in ogni
punto x R. Infatti per ogni h ,= 0 si ha
b
x+h
b
x
h
= b
x
b
h
1
h
,
da cui (esempio 3.3.5 (3))
Db
x
= b
x
log b x R,
e in particolare, se la base dellesponenziale `e il numero b = e,
De
x
= e
x
x R.
(8) Le funzioni seno e coseno sono derivabili in ogni punto di R: infatti, per
ogni x R e h ,= 0 si ha dalle formule di prostaferesi (esercizio 1.12.8)
sin(x +h) sin x
h
=
2
h
cos
2x +h
2
sin
h
2
,
cos(x +h) cos x
h
=
2
h
sin
2x +h
2
sin
h
2
,
da cui
Dsin x = cos x x R, Dcos x = sin x x R.
Per avere un quadro completo delle tecniche di derivazione occorre imparare
a derivare le funzioni composte e le funzioni inverse. Ci`o `e quanto viene
esposto nei risultati che seguono.
Teorema 4.1.6 (di derivazione delle funzioni composte) Siano f :
]a, b[ R e g :]c, d[ R funzioni derivabili, tali che f(]a, b[) ]c, d[. Allora
la funzione composta g f :]a, b[R `e derivabile e
(g f)

(x) = g

(f(x)) f

(x) x ]a, b[.


Dimostrazione Fissiamo x ]a, b[ e poniamo y = f(x). Poiche f `e
derivabile in x, si ha per [h[ abbastanza piccolo (osservazione 4.1.2 (2))
f(x +h) f(x) = f

(x) h +h (h), ove lim


h0
(h) = 0.
245
Similmente, poiche g `e derivabile in y, si ha per [k[ abbastanza piccolo
g(y +k) g(y) = g

(y) k +k (k), ove lim


k0
(k) = 0.
Fissiamo h (sucientemente piccolo), e scegliamo k = f(x +h) f(x): dato
che f `e continua in x (proposizione 4.1.4), risulta k 0 quando h 0; anzi,
essendo f derivabile in x, si ha pi` u precisamente che
k
h
f

(x) non appena


h 0. Quindi
g f(x +h) g f(x) = g(f(x +h)) g(f(x)) = g(y +k) g(y) =
= g

(y) k +k (k) = g

(y)(f(x +h) f(x)) +k (k) =


= g

(f(x)) (f

(x) h +h (h)) +k (k) =


= h
_
g

(f(x)) f

(x) +g

(f(x)) (h) +
k
h
(k)
_
.
Ora, ponendo
(h) = g

(f(x)) (h) +
k
h
(k),
si ha che
lim
h0
(h) = g

(f(x)) 0 +f

(x) 0 = 0,
e pertanto abbiamo ottenuto, per [h[ sucientemente piccolo,
g f(x +h) g f(x) = g

(f(x)) f

(x) h +h (h)
con (h) 0 per h 0. La tesi segue allora allosservazione 4.1.2 (2).
Esempi 4.1.7 (1) De
x
2
= e
x
2
(2x) = 2xe
x
2
per ogni x R.
(2) D

1 +x
2
= D(1 +x
2
)
1/2
=
1
2
(1 +x
2
)
1/2
(2x) =
x

1+x
2
per ogni x R.
(3) D
_
sin
_
e
cos x
2
__
= cos
_
e
cos x
2
_
e
cos x
2
(sin x
2
) 2x per ogni x R.
Teorema 4.1.8 (di derivazione delle funzioni inverse) Sia f :]a, b[
R strettamente monotona e derivabile. Se f

(x) ,= 0 in ogni punto x ]a, b[,


allora la funzione inversa f
1
: f(]a, b[) ]a, b[ `e derivabile e si ha
(f
1
)

(y) =
1
f

(f
1
(y))
y f(]a, b[).
246
Dimostrazione Ricordiamo anzitutto che f(]a, b[) `e un intervallo, che de-
notiamo con J, e che f
1
`e continua su J per il teorema 3.4.6, essendo per
ipotesi f derivabile e dunque continua in ]a, b[.
Ci`o premesso, siano y J e k ,= 0 tale che y + k J. Allora sar`a y = f(x)
e y + k = f(x + h) per opportuni punti x, x + h ]a, b[; avremo quindi
x = f
1
(y), x + h = f
1
(y + k) e dunque h = f
1
(y + k) f
1
(y); in
particolare, h ,= 0 essendo f
1
iniettiva. Potremo perci`o scrivere
f
1
(y +k) f
1
(y)
k
=
h
f(x +h) f(x)
,
e notiamo che da k ,= 0 segue f(x + h) ,= f(x), quindi la scrittura ha senso.
Se k 0, la continuit`a di f
1
implica che h 0, da cui
h
f(x +h) f(x)

1
f

(x)
;
se ne deduce che
lim
k0
f
1
(y +k) f
1
(y)
k
=
h
f(x +h) f(x)
=
1
f

(x)
=
1
f

(f
1
(y))
e la tesi `e provata.
Osservazione 4.1.9 Il teorema precedente ci dice che il coeciente ango-
lare della retta tangente al graco di f
1
(pensata come funzione della x,
dunque con x e y scambiati rispetto alle notazioni del teorema: y = f
1
(x)
invece che x = f
1
(y)), nel generico punto (f(a), a), `e il reciproco del coe-
ciente angolare della retta tangente al graco di f nel punto corrispondente
(a, f(a)). Ci`o `e naturale, dato che i due graci sono simmetrici rispetto alla
bisettrice y = x.
247
Esempi 4.1.10 (1) La funzione sin x `e bigettiva e derivabile nellintervallo
_

2
,

2

, ma la derivata si annulla agli estremi. Limmagine dellintervallo


aperto

2
,

2
_
`e ] 1, 1[; quindi, per il teorema 4.1.8, la funzione arcoseno `e
derivabile in ] 1, 1[ e si ha per x ] 1, 1[:
D(arcsin x) =
1
(Dsin)(arcsin x)
=
1
cos arcsin x
=
(poiche arcsin x `e un numero compreso fra /2 e /2)
=
1
_
1 sin
2
arcsin x
=
1

1 x
2
.
Similmente, poiche la funzione coseno ha derivata diversa da 0 nellintervallo
]0, [ la cui immagine `e ] 1, 1[, la funzione arcocoseno `e derivabile in tale
intervallo e si ha per x ] 1, 1[
D(arccos x) =
1
(Dcos)(arccos x)
=
1
sin arccos x
=
(poiche arccos x `e un numero compreso fra 0 e )
=
1

1 cos
2
arccos x
=
1

1 x
2
.
Tenuto conto dellesercizio 3.4.8, il secondo risultato era deducibile dal primo.
(2) Sia x R. Essendo
D(tan t) =
1
cos
2
t
= 1 + tan
2
t t
_

2
.

2
_
,
troviamo
D(arctan x) =
1
(Dtan)(arctan x)
=
1
1 + tan
2
arctan x
=
1
1 +x
2
.
(3) Sia b un numero positivo e diverso da 1. Allora per ogni x > 0 si ha,
indicando (per comodit`a di notazione) con exp
b
(x) la funzione esponenziale
b
x
,
D(log
b
x) =
1
(exp
b
)

(log
b
x)
=
1
b
log
b
x
log b
=
1
x log b
.
248
Ci`o si poteva ottenere anche direttamente, utilizzando lesempio 3.3.12:
lim
h0
log
b
(x +h) log
b
x
h
= lim
h0
1
h
log
b
x +h
x
=
1
x
lim
h0
log
b
_
1 +
h
x
_
h
x
=
=
1
x
lim
t0
log
b
(1 +t)
t
=
1
x log b
.
Osserviamo che, in particolare, per b = e si ha
D(log x) =
1
x
x > 0.
Derivazione delle serie di potenze
Unaltra importante classe di funzioni derivabili `e quella delle somme di serie
di potenze. Si ha infatti:
Teorema 4.1.11 Sia

n=0
a
n
x
n
una serie di potenze con raggio di conver-
genza R > 0. Detta f(x) la sua somma, la funzione f `e derivabile in ]R, R[
e risulta
f

(x) =

n=1
n a
n
x
n1
x ] R, R[.
Dunque le serie di potenze si derivano termine a termine, come se fossero dei
polinomi.
Dimostrazione Anzitutto osserviamo che la serie

n=1
na
n
x
n1
ha ancora
raggio di convergenza R (esercizio 2.7.9). Di conseguenza, anche la serie

n=2
n(n 1)a
n
x
n2
(che interverr`a nel seguito) ha raggio di convergenza
R.
Adesso, ssati x ]R, R[ e h R sucientemente piccolo in valore assoluto,
in modo che [x[ +[h[ <
1
2
([x[ +R) , calcoliamo il rapporto incrementale di f
nel punto x:
f(x +h) f(x)
h
=
1
h

n=0
a
n
[(x +h)
n
x
n
] =
(usando la formula di Newton, teorema 1.7.1)
=
1
h

n=1
a
n
_
n

k=0
_
n
k
_
x
k
h
nk
x
n
_
=
1
h

n=1
a
n
_
n1

k=0
_
n
k
_
x
k
h
nk
_
=
249
=

n=1
a
n
_
n1

k=0
_
n
k
_
x
k
h
nk1
_
(isolando nella somma interna lultimo termine, che `e anche lunico
quando n = 1)
=

n=1
n a
n
x
n1
+

n=2
a
n
_
n2

k=0
_
n
k
_
x
k
h
nk1
_
.
Poniamo

(
h) =

n=2
a
n
n2

k=0
_
n
k
_
x
k
h
nk1
, [h[ <
1
2
(R [x[) :
se proveremo che (h) 0 per h 0, seguir`a la tesi del teorema.
In eetti si ha
[(h)[

n=2
[a
n
[
_
n2

k=0
_
n
k
_
[x[
k
[h[
nk1
_
=
= [h[

n=2
[a
n
[
_
n2

k=0
_
n
k
_
[x[
k
[h[
nk2
_
,
e tenendo conto che per k = 0, 1, . . . , n 2 risulta
_
n
k
_
=
n(n 1)
(n k)(n k 1)
_
n 2
k
_

n(n 1)
2 1
_
n 2
k
_
,
si ottiene
[(h)[ [h[

n=2
[a
n
[
_
n2

k=0
n(n 1)
2
_
n 2
k
_
[x[
k
[h[
nk2
_
=
=
[h[
2

n=2
n(n 1)[a
n
[([x[ +[h[)
n2

[h[
2

n=2
n(n 1)[a
n
[
_
[x[ +R
2
_
n2
.
Dato che la serie allultimo membro `e convergente per quanto osservato
allinizio della dimostrazione, si deduce che (h) 0 per h 0.
250
Esempi 4.1.12 (1) Dagli sviluppi in serie di potenze di e
x
, sin x, cos x
(teorema 2.7.11), derivando termine a termine si ritrovano le note formule
(esempio 4.1.5 (8))
De
x
= e
x
, Dsin x = cos x, Dcos x = sin x x R.
(2) Similmente, dagli sviluppi in serie di cosh x e sinh x (esercizio 2.7.12), si
deducono facilmente le relazioni
Dsinh x = cosh x, Dcosh x = sinh x x R,
le quali del resto seguono ancor pi` u semplicemente dalle identit`a
sinh x =
e
x
e
x
2
, cosh x =
e
x
+e
x
2
x R.
(3) Derivando la serie geometrica

n=0
x
n
, il teorema precedente ci dice che

n=1
nx
n1
=

n=0
Dx
n
= D

n=0
x
n
= D
1
1 x
=
1
(1 x)
2
x ] 1, 1[.
(4) Derivando la serie

n=1
nx
n1
, ancora per il teorema precedente si ha

n=2
n(n 1)x
n2
=

n=1
D(nx
n1
) = D

n=1
nx
n1
=
= D
1
(1 x)
2
=
2
(1 x)
3
x ] 1, 1[.
Iterando questo procedimento di derivazione, troviamo dopo m passi:

n=m
n(n 1) . . . (n m + 1)x
nm
=
m!
(1 x)
m+1
x ] 1, 1[.
Dividendo per m! otteniamo

n=m
_
n
m
_
x
nm
=
1
(1 x)
m+1
x ] 1, 1[,
e posto n m = h, si ha anche, equivalentemente,

h=0
_
m +h
h
_
x
h
=
1
(1 x)
m+1
x ] 1, 1[.
251
Esercizi 4.1
1. Sia f : R R una funzione pari, ossia tale che f(x) = f(x) per ogni
x R. Se f `e derivabile in 0, si provi che f

(0) = 0.
2. Si provi che se f e g sono funzioni derivabili in x
0
, allora fg `e derivabile
in x
0
e
(fg)

(x
0
) = f

(x
0
)g(x
0
) +f(x
0
)g

(x
0
).
[Traccia: si scriva il rapporto incrementale di fg in x
0
nella forma
f(x)f(x
0
)
xx
0
g(x) +f(x
0
)
g(x)g(x
0
)
xx
0
.]
3. Sia g derivabile in x
0
con g(x
0
) ,= 0. Si provi che
1
g
`e derivabile in x
0
e
_
1
g
_

(x
0
) =
g

(x
0
)
g(x
0
)
2
.
4. Siano f e g funzioni derivabili in x
0
con g(x
0
) ,= 0. Si provi che
f
g
`e
derivabile in x
0
e
_
f
g
_

(x
0
) =
f

(x
0
)g(x
0
) f(x
0
)g

(x
0
)
g(x
0
)
2
.
5. Data la funzione
f(x) =
_
x
2
se x 4
ax +b se x < 4,
determinare a, b R in modo che f sia derivabile nel punto x
0
= 4.
6. Sia f derivabile in ]a, b[. Si scriva lequazione della retta perpendicolare
al graco di f nel punto (x
0
, f(x
0
)).
7. Sia f derivabile in ]a, b[. Provare che la funzione g(x) = f(x + ) `e
derivabile in

,
b

_
e che
g

(x) = f

(x +) x
_
a

,
b

_
.
252
8. Sia f : [0, [ R una funzione continua. Consideriamo il prolunga-
mento pari di f, denito da
F(x) =
_
f(x) se x 0,
f(x) se x < 0,
e il prolungamento dispari di f, denito da
G(x) =
_
f(x) se x 0,
f(x) se x < 0.
Provare che:
(i) F `e continua su R;
(ii) F `e derivabile in 0 se e solo se
lim
h0
+
f(h) f(0)
h
= 0,
e in tal caso F

(0) = 0;
(iii) G `e continua in 0 se e solo se f(0) = 0;
(iv) G `e derivabile in 0 se e solo se f(0) = 0 e inoltre
lim
h0
+
f(h) f(0)
h
= L R,
e in tal caso G

(0) = L.
9. Scrivere la derivata delle seguenti funzioni, nei punti dove essa esiste:
(i) f(x) = sin

x, (ii) f(x) = x
2
x[x[,
(iii) f(x) =

x
2
4, (iv) f(x) = log
x
3,
(v) f(x) = x[x
2
1[, (vi) f(x) = arcsin [2x [,
(vii) f(x) = e
|x|
, (viii) f(x) = [ cos x[,
(ix) f(x) = [[x + 2[ [x
3
[[, (x) f(x) =
_
1
_
[x[.
253
10. Le funzioni
f(x) = (x 2[x[)
2
, g(x) =
_
x sin
1
x
se x ,= 0
0 se x = 0
sono derivabili in R?
11. Sia f :]a, b[R monotona crescente e derivabile; si provi che f

(x) 0
per ogni x R. Se f `e strettamente crescente, `e vero che f

(x) > 0 in
R?
12. Si provi che f(x) = 4x + log x, x > 0, `e strettamente crescente ed ha
inversa derivabile, e si calcoli (f
1
)

(4).
13. Si verichi che la funzione sinh x `e bigettiva su R e se ne scriva la funzio-
ne inversa (che si chiama settore seno iperbolico per motivi che saranno
chiari quando sapremo fare gli integrali, e si indica con settsinhy). Si
provi poi che
D(settsinh y) =
1
_
1 +y
2
y R.
14. Si verichi che la restrizione della funzione cosh x allintervallo [0, +[
`e bigettiva fra [0, +[ e [1, +[, e se ne scriva la funzione inversa (che
si chiama settore coseno iperbolico e si indica con settcosh y). Si provi
poi che
D(settcosh y) =
1
_
y
2
1
y > 1.
15. Calcolare, dove ha senso, la derivata delle seguenti funzioni:
(i) f(x) = x
x
, (ii) f(x) = (x log x)
sin

x
,
(iii) f(x) = log sin

x, (iv) f(x) = 3
3
x
,
(v) f(x) = arccos
_
1x
2
x
2
, (vi) f(x) = log [ log [x[[,
(vii) f(x) = x
1/x
, (viii) f(x) =
sin x x cos x
cos x +x sin x
,
(ix) f(x) = log
x
(2
x
x
2
), (x) f(x) = arctan
_
1cos x
1+cos x
.
254
16. Scrivere lequazione della tangente allellisse denita da
x
2
a
2
+
y
2
b
2
= 1
(ove a e b sono ssati numeri reali non nulli) nel generico punto (x
0
, y
0
).
17. Scrivere lequazione della tangente alliperbole denita da
x
2
a
2

y
2
b
2
= 1
(ove a e b sono ssati numeri reali non nulli) nel generico punto (x
0
, y
0
).
18. Scrivere lequazione della tangente alla parabola denita da
y ax
2
= 0
(ove a `e un ssato numero reale) nel generico punto (x
0
, y
0
).
19. Si provi che per ogni a R lequazione x
3
+x
5
= a ha ununica soluzione
reale x = x
a
. Si provi poi che la funzione g(a) = x
a
`e continua su R,
e si dica in quali punti `e derivabile. Si calcolino inne, se esistono, i
valori g

(2) e g

(2).
4.2 Derivate parziali
Vogliamo estendere loperazione di derivazione alle funzioni di pi` u variabili.
Se A `e un aperto di R
m
e f : A R `e una funzione, il graco di f `e un
sottoinsieme di R
m+1
: vorremmo determinare quali condizioni assicurano che
esso sia dotato di piano tangente (m-dimensionale) in un suo punto.
Denizione 4.2.1 Sia A un aperto di R
m
, sia x
0
A, sia f : A R. La
derivata parziale i-sima di f nel punto x
0
(i = 1, . . . , m) `e il numero reale
lim
h0
f(x
0
+he
i
) f(x
0
)
h
(ove e
i
`e il vettore con tutte le componenti nulle tranne la i-sima che vale 1),
sempre che tale limite esista nito. Indicheremo le derivate parziali di f in
x
0
con uno qualunque dei simboli
f
x
i
(x
0
), D
i
f(x
0
), f
x
i (x
0
) (i = 1, . . . , m).
255
Le regole di calcolo per le derivate parziali sono semplicissime: basta conside-
rare le altre variabili (quelle rispetto alle quali non si deriva) come costanti.
Esempio 4.2.2 Per ogni (x, y) R
2
con [x[ > [y[ si ha

x
_
x
2
y
2
=
x
_
x
2
y
2
,

y
_
x
2
y
2
=
y
_
x
2
y
2
.
Sfortunatamente, a dierenza di ci`o che accade con le funzioni di una sola
variabile, una funzione pu`o avere le derivate parziali in un punto senza essere
continua in quel punto. La ragione `e che lesistenza di D
1
f(x
0
),. . . ,D
m
f(x
0
)
fornisce informazioni sul comportamento della restrizione di f alle rette pa-
rallele agli assi x
1
,. . . ,x
m
e passanti per x
0
; daltra parte, come sappiamo
(esercizi 3.3.21 e 3.3.22), il comportamento di f pu`o essere molto dierente
se ci si avvicina a x
0
da unaltra direzione.
Esempio 4.2.3 Consideriamo in R
2
la parabola di equazione y = x
2
: posto
G = (x, y) R
2
: 0 < y < x
2
, H = (x, y) R
2
: y x
2
,
L = (x, y) R
2
: y 0,
ed osservato che G `e disgiunto da H L e che G H L = R
2
, deniamo
f(x, y) =
_
1 se (x, y) G
0 se (x, y) H L.
Questa funzione non `e continua nello-
rigine, poiche
f(0, 0) = 0, f
_
1
n
,
1
n
3
_
= 1 n N
+
.
Tuttavia le due derivate parziali di f
nellorigine esistono:
f
x
(0, 0) = lim
h0
f(h, 0) f(0, 0)
h
= 0,
f
y
(0, 0) = lim
h0
f(0, h) f(0, 0)
h
= 0.
Qual`e, allora, lestensione giusta della nozione di derivata al caso di funzio-
ni di pi` u variabili? Sotto quali ipotesi il graco di una funzione di 2,3,. . . ,m
variabili ha piano tangente in un suo punto?
256
Denizione 4.2.4 Sia A un aperto di R
m
, sia f : A R e sia x
0
A.
Diciamo che f `e dierenziabile nel punto x
0
se esiste a R
m
tale che
lim
h0
f(x
0
+h) f(x
0
) a h
[h[
m
= 0.
Diciamo che f `e dierenziabile in A se `e dierenziabile in ogni punto di A.
Osserviamo che in questa denizione lincremento h `e un (piccolo) vettore
non nullo di R
m
di direzione arbitraria: dunque linformazione fornita sul
comportamento di f intorno al punto x
0
`e ben pi` u completa di quella fornita
dallesistenza delle derivate parziali. E infatti:
Proposizione 4.2.5 Sia A un aperto di R
m
, sia f : A R e sia x
0
A.
Se f `e dierenziabile in x
0
, allora:
(i) f `e continua in x
0
(e il viceversa `e falso);
(ii) esistono le derivate parziali D
i
f(x
0
) e si ha
D
i
f(x
0
) = a
i
, i = 1, . . . , m
(e il viceversa `e falso).
Di conseguenza, il vettore a nella denizione 4.2.4 `e univocamente determi-
nato (quando esiste).
Dimostrazione (i) Si ha
f(x
0
+h) f(x
0
) = [f(x
0
+h) f(x
0
) a h] +a h;
per h 0 il primo termine `e innitesimo a causa della dierenziabilit`a,
mentre il secondo `e innitesimo per la disuguaglianza di Cauchy-Schwarz
(proposizione 1.9.3). Quindi lim
h0
[f(x
0
+h)f(x
0
)] = 0, ossia f `e continua
in x
0
.
(ii) Dalla denizione di dierenziabilit`a, prendendo h = t e
i
, si ricava
lim
t0
f(x
0
+t e
i
) f(x
0
) t a e
i
[t[
= 0;
moltiplicando per la quantit`a limitata
|t|
t
(cio`e per 1), si ottiene
D
i
f(x
0
) = lim
t0
f(x
0
+t e
i
) f(x
0
)
t
= a e
i
, i = 1, . . . , m.
257
La funzione f(x) = [x[
m
`e continua su tutto R
m
(in virt` u della disuguaglianza
[[x[
m
[x
0
[
m
[ [xx
0
[
m
, a sua volta conseguenza della propriet`a triangolare
della norma), ma non `e dierenziabile nellorigine: infatti, se esistesse a R
m
tale che
f(h) f(0) a h
[h[
m
=
[h[
m
a h
[h[
m
= 1 a
h
[h[
m
0 per h 0,
scegliendo h = te
i
con t > 0 otterremmo a
i
= 1, mentre scegliendo h = te
i
con t < 0 dedurremmo a
i
= 1. Ci`o `e contraddittorio e dunque il viceversa
di (i) `e falso.
La funzione dellesempio 4.2.3 mostra che il viceversa di (ii) `e anchesso falso:
tale funzione infatti ha le derivate parziali in (0, 0) ma, non essendo continua
in tale punto, a causa di (i) non pu`o essere ivi dierenziabile.
Denizione 4.2.6 Se f : A R ha le derivate parziali nel punto x
0
, il
vettore
_
f
x
1
(x
0
), . . . ,
f
x
m
(x
0
)
_
R
m
si chiama gradiente di f nel punto x
0
e si indica con gradf(x
0
), o con
f(x
0
).
Osservazione 4.2.7 La condizione che f sia dierenziabile in x
0
equivale
alla propriet`a seguente: esiste una funzione (h), denita in un intorno U di
0 e innitesima per h 0, tale che
f(x
0
+h) f(x
0
) gradf(x
0
) h = [h[
m
(h) h U.
Si noti che quando m = 1 la dierenziabilit`a in un punto x
0
equivale alla
derivabilit`a in x
0
(osservazione 4.1.2 (2)); in tal caso il gradiente `e un vettore
a una sola componente, cio`e una quantit`a scalare (vale a dire, `e un numero:
precisamente il numero f

(x
0
)).
Piano tangente
La nozione di dierenziabilit`a `e ci`o che ci vuole anche il graco di una
funzione abbia piano tangente.
258
Denizione 4.2.8 Sia A un aperto di R
m
, sia f : A R, e supponiamo
che f sia dierenziabile in un punto x
0
A. Il piano (m-dimensionale) in
R
m+1
, passante per (x
0
, f(x
0
)), di equazione
x
m+1
= f(x
0
) + gradf(x
0
) (x x
0
)
`e detto piano tangente al graco di f nel punto (x
0
, f(x
0
)).
Osservazione 4.2.9 Laggettivo tangente nella denizione `e giusticato
dal fatto seguente: il generico piano passante per (x
0
, f(x
0
)) ha equazione
x
m+1
=
a
(x) = f(x
0
) +a (x x
0
)
con a ssato vettore di R
m
. Quindi, per ciascuno di tali piani, ossia per ogni
a R
m
, vale la relazione
lim
xx
0
[f(x)
a
(x)] = 0.
Il piano tangente `e lunico fra questi piani per il quale vale la condizione pi` u
forte
lim
xx
0
f(x)
a
(x)
[x x
0
[
m
= 0.
Ci`o `e conseguenza della proposizione 4.2.5 (ii).
Esempio 4.2.10 Scriviamo lequazione del piano tangente al graco della
funzione
f(x, y) = x
2
+y
2
nel punto (1, 2, f(1, 2)). Si ha
f(1, 2) = 5, e inoltre
f
x
(x, y) = 2x,
f
y
(x, y) = 2y,
da cui
f
x
(1, 2) = 2,
f
y
(1, 2) =
4. Ne deriva che il piano cercato ha
equazione
z = 5 2(x + 1) + 4(y 2),
ovvero z = 2x + 4y 5.
259
Derivate direzionali
Le derivate parziali di una funzione f in un punto x
0
sono i limiti dei rapporti
incrementali delle restrizioni di f alle rette per x
0
parallele agli assi coordi-
nati; ma queste m direzioni non hanno nulla di speciale rispetto alle innite
altre direzioni, ciascuna delle quali `e individuata da un vettore v R
m
di
norma unitaria (gli assi cartesiani corrispondono ai vettori v = e
i
). La retta
per x
0
parallela al vettore v `e linsieme dei punti di R
m
di coordinate
x = x
0
+tv, t R.
Denizione 4.2.11 Sia A un aperto di R
m
, sia f : A R, sia x
0
A. La
derivata direzionale di f in x
0
secondo la direzione v (con v R 0) `e il
numero reale
lim
t0
f(x
0
+tv) f(x
0
)
t
,
se tale limite esiste nito. Essa si indica con i simboli
f
v
(x
0
), D
v
f(x
0
).
260
La derivata D
v
f(x
0
) rappresenta la derivata in x
0
della restrizione di f alla
retta per x
0
parallela a v: essa dunque rappresenta la pendenza, nel punto
(x
0
, f(x
0
)), del graco di tale restrizione, cio`e dellintersezione del graco di
f con il piano parallelo allasse x
m+1
che contiene la retta per x
0
parallela a
v.
Osservazioni 4.2.12 (1) Se f `e dierenziabile in x
0
allora esiste in x
0
la
derivata di f secondo ogni direzione v, e si ha
f
v
(x
0
) = gradf(x
0
) v
(esercizio 4.2.8).
(2) Lesistenza di tutte le derivate direzionali di f in x
0
non implica la
dierenziabilit`a di f in x
0
. Ci`o segue nuovamente dallesempio 4.2.3: si vede
facilmente che quella funzione, discontinua in (0, 0), ha in tale punto tutte
le derivate direzionali nulle. Il motivo `e che le sue discontinuit`a hanno luogo
lungo la parabola y = x
2
, la quale attraversa tutte le rette per (0, 0) prima
che queste raggiungano lorigine.
(3) La nozione di derivata direzionale ha senso per ogni vettore v R
m
0,
ma `e particolarmente signicativa quando v `e una direzione unitaria, ossia
quando [v[
m
= 1. Si noti che se v `e un vettore unitario e R 0, dalla
denizione 4.2.11 segue subito che
f
(v)
=
f
v
.
Esempio 4.2.13 La funzione f(x, y) =
_
x
2
y
2
ha derivate parziali nel-
laperto A = (x, y) R
2
: [x[ > [y[. Fissato v = (
1

5
,
2

5
), calcoliamo
D
v
f in un generico punto (x, y) A: si ha
D
v
f(x, y) = gradf(x, y) v =
1

5
f
x
(x, y)
2

5
f
y
(x, y) =
=
1

5
x
_
x
2
y
2

5
_

y
_
x
2
y
2
_
=
1

5
x + 2y
_
x
2
y
2
.
261
Curve di livello
Sia f : A R una funzione dierenziabile nellaperto Adi R
m
. Consideriamo
le curve di livello di f, cio`e gli insiemi (eventualmente, ma non sempre, vuoti)
Z
c
= x A : f(x) = c.
In realt`a si tratta di curve vere e proprie solo quando m = 2, ossia f `e una
funzione di due sole variabili; altrimenti si dovrebbe parlare di superci di
livello ((m1)-dimensionali).
Vogliamo far vedere che se Z
c
`e non vuoto e se il gradiente di f `e non nullo nei
punti di Z
c
, allora in tali punti esiste il piano (m1)-dimensionale tangente
a Z
c
e tale piano `e ortogonale al gradiente di f (se m = 2 esister`a ovviamente
la retta tangente a Z
c
, che sar`a ortogonale a gradf).
Anzitutto, osserviamo che fra tutti i vettori unitari v, la derivata direzio-
nale D
v
f(x
0
) `e massima quando v ha direzione e verso coincidenti con
gradf(x
0
), ed `e minima quando v ha direzione coincidente con gradf(x
0
)
ma verso opposto: infatti, dallosservazione 4.2.12 (1) e dalla disuguaglianza
di Cauchy-Schwarz segue che
[D
v
f(x)[ = [gradf(x) v[ [gradf(x)[
m
v R
m
con [v[
m
= 1,
e si ha [D
v
f(x)[ = [gradf(x)[
m
scegliendo rispettivamente
v =
gradf(x)
[gradf(x)[
m
e v =
gradf(x)
[gradf(x)[
m
.
Dunque, sempre che gradf(x) ,= 0, la direzione individuata da questo vettore
`e quella di massima pendenza del graco di f nel punto (x, f(x)).
Ci`o premesso, ssiamo x
0
Z
c
e consideriamo un qualunque piano (m
1)-dimensionale passante per x
0
, quindi di equazione
a (x x
0
) = 0,
con a R
m
0. Se x `e un altro punto di Z
c
, la sua distanza dal piano ,
che denotiamo con d(x, ), `e data da
d(x, ) = inf[x

x[
m
: x

= [x x
0
[
m
[ cos [,
ove `e langolo fra i vettori x x
0
e a, ossia (proposizione 1.12.19)
cos =
(x x
0
) a
[x x
0
[
m
[a[
m
;
262
quindi
d(x, ) =
[(x x
0
) a[
[a[
m
.
Se ne deduce che quando x Z
c
e x x
0
si ha
d(x, ) 0 a R
m
.
Ma se in particolare si sceglie a = gradf(x
0
), cosicche `e il piano per x
0
ortogonale al gradiente di f in x
0
, allora
d(x, ) =
[(x x
0
) gradf(x
0
)[
[gradf(x
0
)[
m
.
Daltra parte, poiche f `e dierenziabile in x
0
si ha
f(x) f(x
0
) = gradf(x
0
) (x x
0
) +(x x
0
),
ove la funzione `e denita in un intorno di 0 e verica
lim
h0
(h)
[h[
m
= 0,
da cui, essendo f(x) = f(x
0
) = c, otteniamo
d(x, )
[x x
0
[
m
=
[(x x
0
) gradf(x
0
)[
[x x
0
[
m
[gradf(x
0
)[
m
=
=
[(x x
0
)[
[x x
0
[
m
[gradf(x
0
)[
m
0 per x Z
c
e x x
0
.
Pertanto se a = gradf(x
0
) non solo la distanza fra x e `e innitesima quan-
263
do x x
0
in Z
c
, ma addirittura tale distanza resta innitesima quando viene
divisa per [x x
0
[
m
. Ci`o mostra, in accordo con losservazione 4.2.9, che il
piano (m1)-dimensionale per x
0
perpendicolare a gradf(x
0
) `e il piano tan-
gente a Z
c
in x
0
.
In particolare, gradf(x
0
) `e ortogonale a Z
c
in x
0
; di conseguenza, se v `e una
direzione tangente alla curva di livello Z
c
nel punto x Z
c
, si ha
f
v
(x) = gradf(x) v = 0
in quanto, come abbiamo visto, v `e ortogonale a gradf(x). Ci`o corrisponde
allintuizione: se ci muoviamo lungo una curva di livello, il valore di f resta
costante e quindi la derivata in una direzione tangente a tale curva deve
essere nulla.
Esercizi 4.2
1. Determinare i punti (x, y) R
2
in cui esistono le derivate parziali delle
seguenti funzioni:
(i) f(x, y) = [xy[, (ii) f(x, y) = [x y[(x +y),
(iii) f(x, y) =
_
x
2
+[y[, (iv) f(x, y) = x arcsin xy,
(v) f(x, y) = log
_
1 +

xy
_
, (vi) f(x, y) = sin
1
xy
,
(vii) f(x, y) = y
x
+x
y
, (viii) f(x, y) = arctan
x +y
x y
,
(ix) f(x, y) =
xy
x
2
+y
2
, (x) f(x, y) = tan e
|xy|
.
2. Determinare i punti (x, y) R
2
in cui le seguenti funzioni sono die-
renziabili:
(i) f(x, y) = [ log x
2
y[, (ii) f(x, y) =
_
_
_
xy

x
2
+y
2
se (x, y) ,= (0, 0)
0 se (x, y) = (0, 0),
(iii) f(x, y) = [xy[, (iv) f(x, y) = x
_
1 +[ sin y[.
3. Per quali > 0 la funzione [xy[

`e dierenziabile in (0, 0)?


264
4. Per quali , > 0 la funzione
f(x, y) =
_

_
[x[

[y[

x
2
+y
2
se (x, y) ,= (0, 0)
0 se (x, y) = (0, 0)
`e dierenziabile in (0, 0)?
5. Scrivere le equazioni dei piani tangenti ai graci delle seguenti funzioni
nei punti a anco indicati:
(i) f(x, y) = arctan(x + 2y) in
_
1, 0,

4
_
,
(ii) f(x, y) = sin x cos y in
_

3
,

6
,
3
4
_
.
6. Determinare i punti del graco di f(x, y) = x
2
y
2
tali che il piano
tangente in tali punti passi per il punto (0, 0, 4).
7. Sia f : R
m
R denita da
f(x) = [x[
4
m
3x v,
ove v =

m
i=1
e
i
= (1, 1, . . . , 1). Si provi che f `e dierenziabile in R
m
e
se ne calcolino le derivate parziali D
i
f.
8. (i) Provare che se f `e una funzione dierenziabile nel punto x
0
allora
esiste
f
v
(x
0
) per ogni v R
m
0 e che
f
v
(x
0
) = gradf(x
0
) v.
(ii) Si calcolino le derivate direzionali sotto specicate:
(a) D
v
(x +y)
3
, ove v =
_
1

2
,
1

2
_
;
(b) D
v
x b, ove v = b (con b ,= 0).
9. Disegnare approssimativamente le curve di livello delle seguenti funzio-
ni:
(i) f(x, y) = x
2
y
2
, (ii) f(x, y) = e
xy
2
,
(iii) f(x, y) = sin(x
2
+y
2
), (iv) f(x, y) =
xy
x
2
+y
2
,
(v) f(x, y) =
y
2
x
2
y
2
+x
2
, (vi) f(x, y) = log
[x[
[y[
.
265
4.3 Propriet`a delle funzioni derivabili
Esponiamo alcuni risultati relativi a funzioni derivabili denite su un inter-
vallo di R, risultati che, come vedremo, hanno svariate applicazioni.
Teorema 4.3.1 (di Rolle) Sia f : [a, b] R una funzione continua in
[a, b] e derivabile in ]a, b[. Se f(a) = f(b), allora esiste ]a, b[ tale che
f

() = 0.
Dunque, se f(a) = f(b) in almeno un punto (, f()) del graco di f la
tangente al graco `e orizzontale.
Dimostrazione Se f `e costante in [a, b], allora f

(x) = 0 per ogni x [a, b] e


la tesi `e provata. Supponiamo dunque che f non sia costante in [a, b]; poiche
f `e continua in [a, b], per il teorema di Weierstrass (teorema 3.1.14) f assume
massimo M e minimo m su [a, b], e si ha necessariamente m < M. Dato che
f(a) = f(b), almeno uno tra i valori m e M `e assunto in un punto interno
ad ]a, b[; se ad esempio si ha m = f(), allora, scelto h R in modo che
x +h [a, b], risulta
f( +h) f()
h
_
0 se h > 0
0 se h < 0,
dato che il numeratore `e sempre non negativo. Passando al limite per h 0,
si ottiene f

() = 0.
Corollario 4.3.2 (teorema di Cauchy) Siano f, g : [a, b] R funzioni
continue in [a, b] e derivabili in ]a, b[, con g

,= 0 in ]a, b[. Allora esiste


266
]a, b[ tale che
f

()
g

()
=
f(b) f(a)
g(b) g(a)
.
Si noti che risulta g(b) g(a) ,= 0 in virt` u dellipotesi g

,= 0 e del teorema
di Rolle.
Dimostrazione Basta applicare il teorema di Rolle alla funzione
h(x) = f(x)[g(b) g(a)] g(x)[f(b) f(a)].
Il risultato pi` u importante `e per`o il seguente:
Corollario 4.3.3 (teorema di Lagrange) Sia f : [a, b] R una funzione
continua in [a, b] e derivabile in ]a, b[. Allora esiste ]a, b[ tale che
f

() =
f(b) f(a)
b a
.
Dunque in almeno un punto
(, f()) del graco di f la tan-
gente al graco `e parallela al-
la retta passante per i punti
(a, f(a)) e (b, f(b)), lequazione
della quale `e
y = f(a) +
f(b) f(a)
b a
(x a).
Dimostrazione Basta applicare il teorema di Cauchy con g(x) = x.
Vediamo alcune applicazioni del teorema di Lagrange.
Proposizione 4.3.4 Sia f :]a, b[ R una funzione derivabile. Allora f `e
costante in ]a, b[ se e solo se risulta f

(x) = 0 per ogni x ]a, b[.


Dimostrazione Se f `e costante in ]a, b[ allora ovviamente f

= 0 in ]a, b[.
Viceversa, sia f

= 0 in ]a, b[. Fissiamo un punto x


0
in ]a, b[, ad esempio
x
0
=
a+b
2
, e sia x un altro punto di ]a, b[: per ssare le idee, supponiamo
x ]a, x
0
[. Per il teorema di Lagrange applicato nellintervallo [x, x
0
], esiste
]x, x
0
[ tale che
f

() =
f(x
0
) f(x)
x
0
x
;
267
ma per ipotesi f

() = 0, e quindi f(x) = f(x


0
) per ogni x ]a, x
0
[. In modo
perfettamente analogo si prova che f(x) = f(x
0
) per ogni x ]x
0
, b[. Dunque
f `e costante in ]a, b[.
Con laiuto della proposizione precedente possiamo scrivere alcune funzioni
elementari come somme di serie di potenze in opportuni intervalli.
Esempi 4.3.5 (1) (Serie logaritmica) La funzione log(1 +x) `e derivabile in
] 1, +[, e si ha
Dlog(1 +x) =
1
1 +x
x ] 1, +[;
daltra parte, come sappiamo (esempio 2.2.6 (1)),
1
1 +x
=

n=0
(1)
n
x
n
x ] 1, 1[.
Ora si riconosce subito che
(1)
n
x
n
= D
(1)
n
n + 1
x
n+1
n N, x R;
quindi dal teorema di derivazione delle serie di potenze (teorema 4.1.11)
otteniamo

n=0
(1)
n
x
n
= D
_

n=0
(1)
n
n + 1
x
n+1
_
x ] 1, 1[.
Pertanto possiamo scrivere
Dlog(1 +x) = D
_

n=0
(1)
n
n + 1
x
n+1
_
x ] 1, 1[.
La funzione derivabile
g(x) = log(1 +x)

n=0
(1)
n
n + 1
x
n+1
ha dunque derivata nulla in ] 1, 1[, e quindi per la proposizione precedente
`e costante in tale intervallo. Ma per x = 0 si ha g(0) = (log 1) 0 = 0,
cosicche g `e nulla su ] 1, 1[: in altre parole
log(1 +x) =

n=0
(1)
n
n + 1
x
n+1
=

k=1
(1)
k
k
x
k
x ] 1, 1[.
268
Si noti che la serie a secondo membro soddisfa, per x [0, 1[, le ipotesi del
criterio di Leibniz (proposizione 2.5.3); dunque

log(1 +x)
N

n=0
(1)
n
n + 1
x
n+1

x
N+1
N + 1

1
N + 1
x [0, 1[, n N.
Per x 1 si ricava allora

log 2
N

n=0
(1)
n
n + 1

1
N + 1
N N,
cosicche luguaglianza gi`a scritta vale anche per x = 1:
log(1 +x) =

n=0
(1)
n
n + 1
x
n+1
=

k=1
(1)
k1
k
x
k
x ] 1, 1].
(2) (Serie dellarcotangente) La funzione arctan x `e derivabile in R, e si ha
Darctan x =
1
1 +x
2
x R.
Si ha inoltre
1
1 +x
2
=

n=0
(1)
n
x
2n
= D
_

n=0
(1)
n
2n + 1
x
2n+1
_
x ] 1, 1[.
Procedendo come nellesempio precedente si deduce
arctan x =

n=0
(1)
n
2n + 1
x
2n+1
x ] 1, 1[,
ed applicando nuovamente il criterio di Leibniz si trova stavolta che la stessa
uguaglianza vale in entrambi gli estremi x = 1:
arctan x =

n=0
(1)
n
2n + 1
x
2n+1
x [1, 1].
(3) (Serie binomiale) Consideriamo la funzione (1+x)

, ove `e un parametro
reale ssato, la quale `e derivabile in ] 1, +[. Proveremo che
(1 +x)

n=0
_

n
_
x
n
x ] 1, 1[,
269
ove
_

n
_
=
_
1 se n = 0
(1)...(n+1)
n!
se n > 0.
I numeri
_

n
_
si chiamano coecienti binomiali generalizzati; se N essi
coincidono con gli usuali coecienti binomiali quando 0 n , mentre
sono tutti nulli quando n . La serie
_

n
_
x
n
`e detta serie binomiale e
quando N essa si riduce alla formula di Newton per il binomio (1 +x)

.
Per provare la formula sopra scritta cominciamo con losservare che il raggio
di convergenza della serie
_

n
_
x
n
`e 1, come si verica facilmente mediante
il criterio del rapporto. Sia g(x) la somma, per ora incognita, di tale serie in
] 1, 1[: dobbiamo provare che g(x) = (1 +x)

per ogni x ] 1, 1[.


Mostriamo anzitutto che
(1 +x)g

(x) = g(x) x ] 1, 1[.


In eetti, per il teorema di derivazione delle serie di potenze (teorema 4.1.11)
si ha
(1 +x)g

(x) = (1 +x)D
_

n=0
_

n
_
x
n
_
= (1 +x)

n=1
n
_

n
_
x
n1
=
=

n=1
n
_

n
_
x
n1
+

n=1
n
_

n
_
x
n
=
=

k=0
(k + 1)
_

k + 1
_
x
k
+

k=1
k
_

k
_
x
k
=
= +

k=1
(k + 1)
_

k + 1
_
x
k
+

k=1
k
_

k
_
x
k
=
= +

k=1
_
(k + 1)
_

k + 1
_
+k
_

k
__
x
k
;
daltra parte risulta per ogni k 1
(k + 1)
_

k + 1
_
+k
_

k
_
=
= (k + 1)
( 1) . . . ( k)
(k + 1)!
+k
( 1) . . . ( k + 1)
k!
=
=
( 1) . . . ( k + 1)
k!
( k +k) =
_

k
_
,
270
cosicche
(1+x)g

(x) = +

k=1

k
_
x
k
=
_
1 +

k=1
_

k
_
x
k
_
= g(x) x ]1, 1[.
Consideriamo allora la derivata del prodotto g(x)(1 +x)

: si ha
D
_
g(x)(1 +x)

_
= g

(x)(1 +x)

g(x)(1 +x)
1
=
= (1 +x)
1
[(1 +x)g

(x) g(x)] = 0 x ] 1, 1[;


per la proposizione 4.3.4 si deduce
g(x)(1 +x)

= costante x ] 1, 1[,
e poiche g(0) = 1, si conclude che
(1 +x)

= g(x) =

n=0
_

n
_
x
n
x ] 1, 1[,
che `e ci`o che volevamo dimostrare.
Concludiamo il paragrafo illustrando uninteressante propriet`a di cui godono
tutte le funzioni derivate, ossia tutte le funzioni g : [a, b] R tali che
g = f

per qualche funzione f derivabile in [a, b]: tali funzioni, pur non
essendo necessariamente continue, hanno la propriet`a dei valori intermedi.
Vale infatti il seguente
Teorema 4.3.6 (di Darboux) Sia f : [a, b] R una funzione derivabile
e poniamo M = sup
[a,b]
f

, m = inf
[a,b]
f

. Allora per ogni k ]m, M[ esiste


x
0
[a, b] tale che f

(x
0
) = k.
Dimostrazione Fissato k ]m, M[, esistono y ]m, k[ e z ]k, M[ tali che
y = f

(c) e z = f

(d), con c, d [a, b]. Indichiamo con I lintervallo chiuso


di estremi c, d (non sappiamo se `e c < d o il contrario): ovviamente I `e
contenuto in [a, b]. Posto h(x) = f(x) kx, la funzione h `e derivabile e
quindi continua in I; quindi assume massimo e minimo in I, in due punti x
0
e
0
. Poiche
h

(c) = f

(c) k < 0, h

(d) = f

(d) k > 0,
se risulta c < d, utilizzand lesercizio 4.3.3 si deduce che il punto di massimo
x
0
non pu`o coincidere ne con c, ne con d; se invece `e c > d, analogamente
271
si ricava che il punto di minimo
0
non pu`o coincidere ne con c, ne con d.
In denitiva vi `e sempre un punto x, interno ad I, nel quale la funzione h
assume massimo oppure minimo: si ha dunque h

(x) = 0, ovvero f

(x) = k.
Esercizi 4.3
1. Sia f : R R una funzione derivabile tale che
lim
x+
f(x) lim
x
f(x) = R;
provare che esiste R tale che f

() = 0.
2. Siano f, g : [a, +[ R funzioni derivabili, con g

,= 0 in [a, +[; se
esistono niti i limiti
lim
x+
f(x) = , lim
x+
g(x) = ,
si dimostri che esiste > a tale che
f

()
g

()
=
f(a)
g(a)
.
3. Sia f : [a, b] R una funzione derivabile. Se x
0
[a, b] `e un punto di
massimo per f e
0
`e un punto di minimo per f, si provi che
f

(x
0
)
_
_
_
0 se x
0
= a
= 0 se a < x
0
< b
0 se x
0
= b,
f

(
0
)
_
_
_
0 se
0
= a
= 0 se a <
0
< b
0 se
0
= b.
4. Sia f :]a, b[R una funzione derivabile. Se esiste nito il limite
lim
xa
+
f

(x) = ,
si provi che f `e prolungabile con continuit`a nel punto a, che f `e deri-
vabile in tale punto e che f

(a) = .
[Traccia: si provi che per ogni > 0 esiste > 0 tale che [f(x)
f(y)[ < per ogni x, y [a, a + [, e se ne deduca la continuit`a delle-
stensione di f; poi si provi che la stessa propriet`a vale per f

e se ne
deduca la derivabilit`a di f ed il fatto che f

(a) = .]
272
5. Sia f : R R una funzione derivabile tale che f(0) = 0 e [f

(x)[
[f(x)[ per ogni x R; provare che f `e identicamente nulla in R.
[Traccia: se x
0
`e punto di massimo per f in I = [
1
2
,
1
2
], si provi che
esiste I tale che [f

(x)[ [f

()[ [x
0
[ per ogni x I; se ne deduca
che f `e costante, quindi nulla, in I. Poi ci si allarghi a [1, 1], [
3
2
,
3
2
],
eccetera. . . ]
6. Si provi che lequazione x
1000
+ax +b = 0 ha al pi` u due soluzioni reali
per ogni scelta di a e b in R.
7. Si provi che lequazione x
999
+ ax + b = 0 ha al pi` u tre soluzioni reali
per ogni scelta di a e b in R, ed al pi` u una per ogni scelta di a 0 e
b R.
8. Si provi che
log
_
1 +x
1 x
=

n=0
x
2n+1
2n + 1
x ] 1, 1[;
scelto x =
1
2m+1
se ne deduca che
log
m + 1
m
=
2
2m + 1

n=0
1
2n + 1
1
(2m + 1)
2n
m N
+
.
9. Si provi che la serie

n=1
_
e
_
1 +
1
n
_
n
_
`e divergente, mentre la serie

n=1
_
e
_
1 +
1
n
2
_
n
2
_
`e convergente.
10. Si provi che

1 +x = 1 +

n=1
(1)
n1
(2n 3)!!
(2n)!!
x
n
x ] 1, 1[,
ove si `e indicato con m!! il prodotto di tutti i naturali fra 1 e m aventi
la stessa parit`a di m, e si `e posto m!! = 1 per m 0.
273
11. Determinare una serie di potenze la cui somma sia

2 x
2
in un
opportuno intervallo di centro 0.
12. Provare che valgono gli sviluppi in serie di potenze
arcsin x =

n=0
_
1/2
n
_
(1)
n
2n + 1
x
2n+1
=
=

n=0
(2n 1)!!
(2n)!!
(1)
n
2n + 1
x
2n+1
x [1, 1],
settsinh x = log
_
x +

1 +x
2
_
=

n=0
_
1/2
n
_
1
2n + 1
x
2n+1
=
=

n=0
(2n 1)!!
(2n)!!
1
2n + 1
x
2n+1
x ] 1, 1[.
[Traccia: ripetere il ragionamento fatto per log(1 +x) e arctan x negli
esempi 4.3.5.]
13. Sia R. Si provi che la serie binomiale
_

n
_
x
n
:
(i) converge assolutamente per x = 1, se 0;
(ii) converge puntualmente per x = 1 e non converge per x = 1, se
1 < < 0;
(iii) non converge per x = 1, se 1.
[Traccia: se 1 si provi che

n
_

_

n+1
_

; se 1 si provi
che

n
_


c
n(n1)
per ogni n sucientemente grande e c costante
opportuna; se [[ < 1 si osservi che

_

n+1
_

<

n
_

, e sfruttando le
relazioni


k1
< log
_
1

k
_
<

k
]0, 1[, k N
+
,
log
n
2
<

n
k=2
1
k
< log n n 2,
si deduca che

n
_

= [[

n
k=2

1
+1
k

e che c n
1
<

n
_

<
c

n
1
per ogni n 2 e per opportune costanti c, c

.]
274
14. Si verichi che
x
2
log(1+x) x per ogni x [0, 1]; se ne deduca, uti-
lizzando le disuguaglianze fra media armonica, geometrica e aritmetica
(teorema 1.8.2 ed esercizio 1.8.4), che
_
n
2 log(n + 1)
_
n
< n! <
_
n + 1
2
_
n
n N
+
.
Si confronti questo risultato con quello ottenuto nellesempio 2.7.10 (3).
4.4 Condizioni sucienti per la dierenziabi-
lit`a
Torniamo alle funzioni di pi` u variabili: con lausilio del teorema di Lagrange
si pu`o provare la dierenziabilit`a di unampia classe di tali funzioni.
Teorema 4.4.1 (del dierenziale totale) Sia A un aperto di R
m
, sia
x
0
A e sia f : A R una funzione con le seguenti propriet`a:
(i) vi `e una palla B(x
0
, r) A tale che esistano le derivate parziali D
i
f(x),
i = 1, . . . , m, in ogni punto x B(x
0
, r);
(ii) le derivate parziali D
i
f sono continue in x
0
.
Allora f `e dierenziabile nel punto x
0
.
Dimostrazione Facciamo la dimostrazione nel caso m = 2: il caso generale
`e del tutto analogo ma formalmente pi` u complicato (esercizio 4.4.2). Poniamo
dunque (x
0
, y
0
) = x
0
, (h, k) = h, e sia = [h[
2
. Se < r, ossia h
2
+k
2
< r
2
,
allora i punti (x
0
, y
0
+ k) e (x
0
+ h, y
0
+ k) appartengono ancora a B(x
0
, r).
Dobbiamo provare che
lim
0
1

_
f(x
0
+h, y
0
+k) f(x
0
, y
0
)
f
x
(x
0
, y
0
)h
f
y
(x
0
, y
0
)k
_
= 0.
Osserviamo che
f(x
0
+h, y
0
+k) f(x
0
, y
0
) =
= [f(x
0
+h, y
0
+k) f(x
0
, y
0
+k)] + [f(x
0
, y
0
+k) f(x
0
, y
0
)] ,
275
ed applicando il teorema di Lagrange alle due funzioni
t f(t, y
0
+k), t compreso fra x
0
e x
0
+h,
t f(x
0
, t), t compreso fra y
0
e y
0
+k,
otteniamo
f(x
0
+h, y
0
+k) f(x
0
, y
0
) =
f
x
(, y
0
+k)h +
f
y
(x
0
, )k,
ove `e un punto opportuno compreso fra x
0
e x
0
+h, e `e un punto opportuno
compreso fra y
0
e y
0
+k. Quindi
1

f(x
0
+h, y
0
+k) f(x
0
, y
0
)
f
x
(x
0
, y
0
)h
f
y
(x
0
, y
0
)k

[h[

f
x
(, y
0
+k)
f
x
(x
0
, y
0
)

+
[k[

f
y
(x
0
, )
f
y
(x
0
, y
0
)

f
x
(, y
0
+k)
f
x
(x
0
, y
0
)

f
y
(x
0
, )
f
y
(x
0
, y
0
)

;
quando 0 si ha h 0 e k 0, dunque x
0
e y
0
: perci`o lultimo
membro tende a 0 in virt` u della continuit`a delle derivate parziali di f nel
punto (x
0
, y
0
). Ne segue la tesi.
Osserviamo che il teorema precedente esprime una condizione suciente per
la dierenziabilit`a di f in x
0
: nellesercizio 4.4.1 si esibisce una funzione che
`e dierenziabile benche non soddis le ipotesi del teorema del dierenziale
totale.
Esercizi 4.4
1. Provare che la funzione
f(x, y) =
_
y
2
cos
1
y
se x R, y ,= 0
0 se x R, y = 0
`e dierenziabile nel punto (0, 0), ma non soddisfa in tale punto le ipotesi
del teorema del dierenziale totale.
2. Dimostrare il teorema del dierenziale totale nel caso generale (funzioni
di m variabili anziche di due).
276
3. Sia A un cono di R
m
(cio`e un insieme tale che se x A allora tx A
per ogni t > 0). Una funzione f : A R si dice omogenea di grado
R se verica lidentit`a
f(tx) = t

f(x) t > 0, x A.
Provare che:
(i) se f `e dierenziabile in A, allora le derivate parziali D
i
f sono
funzioni omogenee di grado 1;
(ii) vale lidentit`a di Eulero
gradf(x) x = f(x) x A.
4. Sia H una matrice reale e simmetrica mm. Si verichi che la funzione
(v) = Hv v `e una funzione omogenea di grado 2 su R
m
(essa si
chiama forma quadratica associata alla matrice H), e se ne calcoli il
gradiente.
5. Si consideri la funzione f : R
2
R cos` denita:
f(x, y) =
_
0 se x R, y = 0
y e
(
xy
y
)
2
se x R, y ,= 0.
(i) Si verichi che f `e continua in R
2
.
(ii) Si provi che esistono le derivate parziali di f in ogni punto di R
2
.
(iii) Si scriva il vettore gradf(0, 0).
(iv) Si dimostri che f non `e dierenziabile nellorigine, mentre lo `e negli
altri punti di R
2
.
6. Si consideri la funzione f : R
2
(x, y) : y = 0 R cos` denita:
f(x, y) =
_

_
x log y
2
y
2
1
se x R, y ,= 1
x se x R, y = 1.
(i) Determinare linsieme dei punti ove f `e continua.
277
(ii) Determinare linsieme dei punti ove esistono le derivate parziali e
calcolare tali derivate.
(iii) Determinare linsieme dei punti ove f `e dierenziabile e calcolarne
il dierenziale.
7. Sia f una funzione dierenziabile con derivate parziali continue in R
2
,
e tale che
f(x, y) = 0 (x, y) ,
ove = (x, y) R
2
: x = y.
(i) Provare che
f
x
(x, y) =
f
y
(x, y) (x, y) .
(ii) Provare che la funzione
g(x, y) =
f(x, y)
x y
, (x, y) R
2

`e estendibile con continuit`a a R
2
.
4.5 Dierenziabilit`a di funzioni composte
Estenderemo al caso di funzioni di pi` u variabili il teorema di derivazione delle
funzioni composte (teorema 4.1.6). Cominciamo dal caso pi` u semplice: sia A
un aperto di R
m
, sia f : A R una funzione, e sia u : [a, b] A una funzione
a valori vettoriali: ci`o signica che u(t) `e un vettore (u
1
(t), . . . , u
m
(t)) di
R
m
, il quale appartiene ad A per ogni scelta di t [a, b]. Ha dunque senso
considerare la funzione composta F(t) = f(u(t)), che `e denita su [a, b] a
valori in R.
Teorema 4.5.1 Nelle ipotesi sopra dette, se f `e dierenziabile in A e u `e
derivabile in [a, b] (ossia le funzioni u
1
,. . . ,u
m
sono derivabili in [a, b]), allora
F = f u `e derivabile in [a, b] e si ha
F

(t) = ([gradf] u(t)) u

(t) =
m

i=1
(D
i
f)(u(t)) (u
i
)

(t) t [a, b].


278
Dimostrazione Le u
i
sono funzioni derivabili: quindi, ssato t [a, b], per
ogni k R tale che t +k [a, b] si pu`o scrivere
u
i
(t +k) u
i
(t) = (u
i
)

(t) k +k w
i
(k), i = 1, . . . , n,
ove le funzioni w
i
sono innitesime per k 0; ossia, in forma vettoriale,
u(t +k) u(t) = u

(t) k +k w(k),
ove [w(k)[
m
0 per k 0.
Daltra parte, essendo la funzione f dierenziabile nel punto u(t), dallos-
servazione 4.2.7 segue, prendendo come incremento vettoriale h la quantit`a
u(t +k) u(t), che
f(u(t +k)) f(u(t)) [gradf(u(t))] [u(t +k) u(t)] =
= [u(t +k) u(t)[
m
(u(t +k) u(t)),
ove (h) `e un innitesimo per h 0. Ne segue
F(t +k) F(t) [gradf(u(t))] u

(t) k =
= [gradf(u(t))] w(k) k +[u(t +k) u(t)[
m
(u(t +k) u(t)) =
= [gradf(u(t))] w(k) k +[(u

(t) +w(k)) k[
m
(u(t +k) u(t));
poiche
lim
k0

1
k
[gradf(u(t)) w(k) k +[(u

(t) +w(k)) k[
m
(u(t +k) u(t))]

lim
k0
[[gradf(u(t))[
m
[w(k)[
m
+[u

(t) +w(k)[
m
[(u(t +k) u(t))[] = 0,
si conclude che
lim
k0
F(t +k) F(t)
k
= [gradf(u(t))] u

(t).
Il risultato che segue prova la dierenziabilit`a delle funzioni composte nel
caso pi` u generale.
Teorema 4.5.2 Sia A un aperto di R
m
, sia B un aperto di R
p
e conside-
riamo due funzioni f : A R e g : B A. Se f `e dierenziabile in A
e se g `e dierenziabile in B (ossia le componenti scalari g
1
, . . . , g
m
di g
279
sono dierenziabili in B), allora la funzione composta F(x) = f(g(x)) =
f(g
1
(x), . . . , g
m
(x)) `e dierenziabile in A e risulta
F
x
j
(x) =
m

k=1
f
y
k
(g(x))
g
k
x
j
(x) x B, j = 1, . . . , p.
Dimostrazione Basta ripetere la dimostrazione precedente considerando le
funzioni x
j
g(x) e x f(x).
Esempi 4.5.3 (1) (coordinate polari in R
2
) Poniamo, come si `e fatto nel-
losservazione 3.3.7,
_
x = r cos
y = r sin ,
r 0, [0, 2].
Se f(x, y) `e una funzione dierenziabile, posto u(r, ) = f(r cos , r sin ) si
ha
u
r
(r, ) =
f
x
(r cos , r sin ) cos +
f
y
(r cos , r sin ) sin ,
u

(r, ) =
f
x
(r cos , r sin )r sin +
f
y
(r cos , r sin )r cos ,
e in particolare
[[gradf](r cos , r sin )[
2
2
=
=
_
u
r
(r, )
_
2
+
1
r
2
_
u

(r, )
_
2
r > 0, [0, 2].
(2) (coordinate polari in R
3
) Poniamo
_
_
_
x = r sin cos
y = r sin sin
z = r cos ,
r 0, [0, 2], [0, 2].
La quantit`a r rappresenta la distanza del punto P = (x, y, z) dallorigine
O; il numero `e la colatitudine, ossia langolo convesso che il segmento
OP forma con il segmento ON, ove N `e il polo nord (0, 0, r); inne, il
numero `e la longitudine, cio`e langolo (orientato) fra la semiretta delle
x 0 e la proiezione di OP sul piano xy. Come nel caso bi-dimensionale,
280
la corrispondenza (r, , ) = (x, y, z) non `e biunivoca poiche tutte le terne
(0, , ) rappresentano lorigine, tutte le terne (r, 0, ) e (r, 0, ) rappresenta-
no i due poli (0, 0, r) e (0, 0, r) rispettivamente, ed inne le terne (r, , 0)
e (r, , 2) rappresentano lo stesso punto sul piano xz. Lapplicazione tra-
sforma parallelepipedi dello spazio r in settori sferici dello spazio xyz.
Se f(x, y, z) `e una funzione dierenziabile e v = f , si puo vericare che
(omettendo, per brevit`a, la dipendenza delle funzione dalle variabili):
v
r
=
_
f
x

_
sin cos +
_
f
y

_
sin sin +
_
f
z

_
cos ,
v

=
_
f
x

_
r cos cos +
_
f
y

_
r cos sin
_
f
z

_
r sin ,
v

=
_
f
x

_
r sin sin +
_
f
y

_
r sin cos .
In particolare si verica facilmente che
[[gradf] [
2
3
=
_
v
r
_
2
+
1
r
2
_
v

_
2
+
1
r
2
sin
2

_
v

_
2
per ogni r > 0, ]0, [, [0, 2].
Esercizi 4.5
1. Scrivere la derivata rispetto a t delle funzioni composte f(u(t)) seguen-
ti:
(a) f(x, y) = x
2
+y
2
, u(t) = (1 +t, 1 t);
(b) f(x, y) = (x
2
+y
2
)
2
, u(t) = (cos t, sin t);
(c) f(x, y) = log(x
2
y
2
), u(t) = (cos t, sin t) con 0 < t <

4
;
(d) f(x, y) =
xy
x
2
+y
4
, u(t) = (3t
2
, 2t) con t ,= 0.
2. Sia A un aperto di R
m
e sia f : A R una funzione dierenziabile. Se
x, y A, e se tutto il segmento I di estremi x e y `e contenuto in A, si
provi che
f(x) f(y) = gradf(v) (x y),
281
ove v `e un punto opportuno del segmento I.
[Traccia: si applichi il teorema di Lagrange alla funzione F(t) = f(x+
t(y x)), 0 t 1.]
3. Sia f : [0, [R una funzione derivabile; posto
u(x) = f
_
[x[
2
m
_
, x R
m
,
si provi che u `e dierenziabile in R
m
e se ne calcoli il gradiente.
4.6 Derivate successive
Sia f :]a, b[ R una funzione derivabile. Allora per ogni x ]a, b[ esiste la
derivata f

(x): dunque resta denita la funzione derivata f

:]a, b[ R. Se
questa funzione `e a sua volta derivabile in ]a, b[, la sua derivata (f

si dice
derivata seconda di f e si indica con i simboli
f

(x), D
2
f(x),
d
2
f
dx
2
(x)
(la f

, per analogia, si dir`a derivata prima di f). In particolare


f

(x) = lim
h0
f

(x +h) f

(x)
h
x ]a, b[.
Analogamente si deniscono, quando `e possibile, la derivata terza, quarta,
. . . , n-sima di f, che si indicano con f
(3)
, f
(4)
, . . . , f
(n)
; si ha
f
(k)
(x) = lim
h0
f
(k1)
(x +h) f
(k1)
(x)
h
x ]a, b[, k = 1, . . . , n.
In tal caso si dice che f `e derivabile n volte in ]a, b[.
Esempi 4.6.1 (1) Se f(x) = x
2
+ 3x + 2, si ha f

(x) = 2x + 3, f

(x) = 2,
f
(n)
(x) = 0 per ogni n > 2.
(2) Se f(x) = x[x[, si ha f

(x) = 2[x[ e
f

(x) =
_
2 se x > 0
2 se x < 0,
mentre f

(0) non esiste.


282
(3) Se f(x) = b
x
, si ha f
(n)
(x) = b
x
(log b)
n
per ogni n N
+
.
Per le funzioni di pi` u variabili valgono considerazioni analoghe. Sia f : A
R, ove A `e un aperto di R
m
; se f `e dierenziabile in A, allora esistono le m
derivate parziali prime D
i
f(x), i = 1, . . . , m. Se ciascuna di queste funzioni,
a sua volta, `e dierenziabile in A, esisteranno le m
2
derivate parziali seconde
D
j
(D
i
f)(x), i, j = 1, . . . , m; per tali funzioni useremo i simboli
D
j
D
i
f(x), f
x
j
x
i (x),

2
f
x
j
x
i
(x),
e se i = j
D
2
j
f(x), f
x
j
x
j (x),

2
f
x
j
2
(x).
In generale, f avr`a m
k
derivate parziali k-sime (se queste esistono tutte).
Denizione 4.6.2 Diciamo che una funzione f `e di classe C
k
in A, e scri-
viamo f C
k
(A), se f possiede tutte le derivate parziali no allordine k
incluso, e inoltre f e le sue derivate sono continue in A; in particolare,
denotiamo con C
0
(A), o semplicemente con C(A), linsieme delle funzioni
continue in A. Poniamo inoltre
C

(A) =

k=0
C
k
(A).
In modo analogo si denisce C
k
(]a, b[) nel caso di funzioni di una sola varia-
bile.
Esempi 4.6.3 (1) Ogni polinomio in m variabili `e una funzione di classe
C

(R
m
).
(2) La funzione f(x) = [x[
k+1/2
`e di classe C
k
, ma non di classe C
k+1
, su R.
(3) Le somme di serie di potenze reali sono funzioni di classe C

sullinter-
vallo aperto di convergenza. In generale possono esistere le derivate seconde
D
i
D
j
f e D
j
D
i
f di una funzione f di m variabili, ma queste due derivate
possono essere diverse fra loro: un esempio `e fornito nellesercizio 4.6.5. Tut-
tavia sotto ipotesi assai ragionevoli vale il seguente risultato sullinvertibilit`a
dellordine di derivazione:
Teorema 4.6.4 (di Schwarz) Sia A un aperto di R
m
, sia x
0
A e sia
f : A R una funzione tale che le derivate D
i
D
j
f e D
j
D
i
f esistano in un
intorno di x
0
e siano continue in x
0
. Allora risulta D
i
D
j
f(x
0
) = D
j
D
i
f(x
0
).
283
Dimostrazione Si vedano gli esercizi 4.6.6 e 4.6.7.
Di conseguenza, se f : A R `e di classe C
2
sullaperto A R
m
, la sua
matrice Hessiana, denita da
H(x) =
_

_
D
2
1
f(x) D
1
D
m
f(x)


D
m
D
1
f(x) D
2
m
f(x)
_

_
, x A,
`e una matrice mm reale e simmetrica; ritorneremo a parlare di essa quando
studieremo i massimi e i minimi di funzioni di pi` u variabili (paragrafo 4.11).
Principio di identit`a delle serie di potenze
Per i polinomi vale il principio di identit`a, ben noto in algebra, secondo il
quale due polinomi che coincidono per ogni valore della variabile devono avere
gli stessi coecienti. Le serie di potenze condividono questa fondamentale
propriet`a: in altre parole, i loro coecienti sono univocamente determinati
dalla somma della serie. Ci`o `e conseguenza del seguente
Teorema 4.6.5 Sia

n=0
a
k
x
k
una serie di potenze reale con raggio di con-
vergenza R > 0, e sia f(x) la sua somma per [x[ < R. Allora:
(i) f appartiene a C

(] R, R[) (cio`e esiste f


(n)
(x) per ogni n N e per
ogni x ] R, R[);
(ii) risulta
f
(n)
(x) =

k=n
k(k 1) . . . (k n + 1)a
k
x
kn
x ] R, R[;
(iii) in particolare,
a
n
=
f
(n)
(0)
n!
n N,
ove f
(0)
signica f.
Dimostrazione Dal teorema 4.1.11 sappiamo che f `e derivabile e che
f

(x) =

k=1
ka
k
x
k1
x ] R, R[.
284
Ma allora f

`e a sua volta somma di una serie di potenze in ] R, R[:


applicando nuovamente il teorema 4.1.11 segue che f

`e derivabile e che
f

(x) =

k=2
k(k 1)a
k
x
k2
x ] R, R[.
Iterando il procedimento si ottengono (i) e (ii). In particolare, scegliendo
x = 0 nella serie di f
(n)
, tutti gli addendi con k > n spariscono e pertanto
f
(n)
(0) = n(n 1) . . . (n n + 1)a
n
= n! a
n
.
Corollario 4.6.6 (principio di identit`a delle serie di potenze) Siano

n=0
a
n
x
n
e

n=0
b
n
x
n
due serie di potenze reali con raggi di convergenza
R, R

> 0. Posto r = minR, R

, se risulta

n=0
a
n
x
n
=

n=0
b
n
x
n
x ] r, r[,
allora si ha a
n
= b
n
per ogni n N.
Dimostrazione Basta applicare il teorema 4.6.5 alla serie dierenza, cio`e

(a
n
b
n
)x
n
, la quale per ipotesi ha somma 0 in ] r, r[.
Esercizi 4.6
1. Sia f :]a, b[ R e supponiamo che f sia derivabile due volte in ]a, b[.
Siano x
1
, x
2
, x
3
punti di ]a, b[, con x
1
< x
2
< x
3
e f(x
1
) = f(x
2
) =
f(x
3
). Si provi che esiste ]x
1
, x
3
[ tale che f

() = 0.
2. Sia f :]a, b[R derivabile due volte in ]a, b[. Si provi che
f

(x) = lim
h0
f(x +h) +f(x h) 2f(x)
h
2
x ]a, b[.
3. Calcolare f
(n)
(x) per ogni n N
+
nei casi seguenti:
(i) f(x) = log
b
x, (ii) f(x) = cos bx, (iii) f(x) = b
x
, (iv) f(x) = x
b
.
285
4. Si dimostri la formula di Leibniz per la derivata n-sima di un prodotto:
D
n
(fg)(x) =
n

k=0
_
n
k
_
D
k
f(x) D
nk
g(x).
[Traccia: si ragioni per induzione.]
5. Sia f : R
2
R la funzione cos` denita:
f(x, y) =
_
_
_
y
2
arctan
x
y
se y ,= 0, x R
0 se y = 0, x R.
Si provi che f
xy
(0, 0) = 0 e f
yx
(0, 0) = 1.
6. Sia A un aperto di R
2
, sia (x
0
, y
0
) A e sia f : A R tale che f
xy
e f
yx
esistano in un intorno di (x
0
, y
0
) e siano continue in tale punto.
Posto
A(h, k) = f(x
0
+h, y
0
+k) f(x
0
+h, y
0
) f(x
0
, y
0
+k) +f(x
0
, y
0
),
si provi che esiste , intermedio fra x
0
e x
0
+h, tale che
A(h, k) = h[f
x
(, y
0
+k) f
x
(, y
0
)];
si provi poi che esiste , intermedio fra y
0
e y
0
+k, tale che
A(h, k) = hk f
yx
(, ).
Inne, in modo analogo si verichi che esistono

, intermedio fra y
0
e
y
0
+k, e

, intermedio fra x
0
e x
0
+h, tali che
A(h, k) = hk f
xy
(

),
e se ne deduca il teorema di Schwarz nel caso m = 2.
[Traccia: si applichi opportunamente il teorema di Lagrange.]
7. Si generalizzi largomentazione dellesercizio precedente al caso di m
variabili, provando che se f : A R `e tale che D
i
D
j
f e D
j
D
i
f esistano
in un intorno di x
0
A e siano continue in tale punto, allora esse
coincidono nel punto x
0
.
[Traccia: ci si riconduca al caso di due variabili osservando che il
ragionamento coinvolge solo le due variabili x
i
e x
j
.]
286
8. Sia f C
k
(A), con A aperto di R
m
. Si verichi che le derivate distinte
di f di ordine k sono
_
n+k1
k
_
.
9. Sia
f(x, y) =
_
x y se x > 0, y R
x ye
x
2
se x 0, y R.
(i) Si verichi che f `e dierenziabile in R
2
.
(ii) Si calcolino f
xy
(0, 0) e f
yx
(0, 0).
10. Sia f : R R di classe C

. Se esiste n N
+
tale che f
(n)
0, si
provi che f `e un polinomio di grado non superiore a n.
11. Si provi che se
f(x) =

n=0
a
n
x
n
, x ] R, R[,
allora per ogni x
0
] R, R[ la funzione f `e somma di una serie di
potenze di centro x
0
in ]x
0
r, x
0
+r[, ove r = R [x
0
[.
[Traccia: usando la formula di Newton per il binomio, si scriva x
n
=
[(x x
0
) +x
0
]
n
e
f(x) =

n=0
a
n
[(x x
0
) +x
0
]
n
=

n=0
a
n

k=0
_
n
k
_
x
nk
0
(x x
0
)
k
=
(poiche la somma `e estesa agli indici (k, n) N
2
con n k)
=

k=0
_

n=k
a
n
_
n
k
_
x
nk
0
_
(x x
0
)
k
=
=

k=0
_

n=k
n(n 1) . . . (n k + 1)a
n
x
nk
0
_
(x x
0
)
k
=
(per il teorema 4.6.5)
=

k=0
1
k!
f
(k)
(x
0
)(x x
0
)
k
.
Occorre per`o vericare la validit`a della terza uguaglianza: cio`e, bisogna
vericare che se a
nk
: n, k N, n k `e una famiglia di numeri reali
287
o complessi tali che

n=0
_
n

k=0
[a
nk
[
_
= L < +,
allora le serie

n=k
a
nk
per ogni k N,

n=0
_

k=0
a
nk
_
,

k=0
_

n=k
a
nk
_
sono assolutamente convergenti e si ha

n=0
_

k=0
a
nk
_
=

k=0
_

n=k
a
nk
_
.
A questo scopo si utilizzi lesercizio 2.8.4.]
4.7 Confronto di innitesimi e inniti
Nel calcolo di limiti di funzioni di una variabile, il pi` u delle volte ci si trova
a dover determinare leettivo comportamento di una forma indeterminata
del tipo 0/0 oppure /. A questo scopo `e utile la seguente terminologia.
Siano f, g funzioni denite in un intorno di x
0
, ove x
0
R oppure x
0
= ,
e innitesime per x x
0
, cio`e (denizione 3.3.1) tali che
lim
xx
0
f(x) = lim
xx
0
g(x) = 0.
Supporremo, per semplicit`a, che f e g siano diverse da 0 in un intorno di x
0
(salvo al pi` u x
0
).
Diremo che f `e un innitesimo di ordine superiore a g per x x
0
(oppure,
equivalentemente, che g `e un innitesimo di ordine inferiore a f per x x
0
)
se
lim
xx
0
f(x)
g(x)
= 0;
in tal caso useremo la scrittura
f(x) = o(g(x)) per x x
0
,
288
che si legge f `e o-piccolo di g per x x
0
.
Diciamo che f e g sono innitesimi dello stesso ordine per x x
0
se esiste
R 0 tale che
lim
xx
0
f(x)
g(x)
= .
Esempi 4.7.1 (1) sin
2
x `e un innitesimo per x 0 di ordine superiore a
x, dello stesso ordine di x
2
, e di ordine inferiore a x
3
, in quanto
lim
x0
sin
2
x
x
= 0, lim
x0
sin
2
x
x
2
= 1, lim
x0
x
3
sin
2
x
= 0.
(2) e
x
`e un innitesimo per x + di ordine superiore a x
n
qualunque
sia n N
+
, in quanto
lim
x+
e
x
x
n
= 0 n N
+
.
(3) 1/ log x `e un innitesimo per x 0
+
di ordine inferiore a x

qualunque
sia > 0, in quanto
lim
x0
+
x

log x = 0 > 0.
(4) Se f `e derivabile in x
0
, allora losservazione 4.1.2 (2) ci dice che
f(x) f(x
0
) f

(x
0
)(x x
0
) = o(x x
0
) per x x
0
.
(5) Dire che f(x) = o(1) per x x
0
signica semplicemente che f(x) `e un
innitesimo per x x
0
.
(6)
`
E facile costruire due innitesimi non confrontabili fra loro: tali sono ad
esempio, per x 0, le funzioni f(x) = x e g(x) = x(2 + sin
1
x
).
Osservazione 4.7.2 Accanto alla notazione o-piccolo esiste anche l O-
grande: se f e g sono innitesimi per x x
0
, la scrittura
f(x) = O(g(x)) per x x
0
(che si legge f(x) `e O-grande di g(x) per x x
0
) signica che esiste K > 0
tale che
[f(x)[ K[g(x)[ in un intorno di x
0
.
Dunque
f(x) = o(g(x)) per x x
0
= f(x) = O(g(x)) per x x
0
,
ma il viceversa `e falso: basta pensare a due innitesimi dello stesso ordine.
289
Il risultato che segue aiuta a semplicare il calcolo del limite di una forma
indeterminata 0/0.
Proposizione 4.7.3 (principio di sostituzione degli innitesimi) Sia-
no f, g, , funzioni innitesime per x x
0
, diverse da 0 per x ,= x
0
(con
x
0
R oppure x
0
= ). Se
(x) = o(f(x)) e (x) = o(g(x)) per x x
0
,
e se esiste (nito o innito) il limite
lim
xx
0
f(x)
g(x)
,
allora si ha anche
lim
xx
0
f(x) +(x)
g(x) +(x)
= lim
xx
0
f(x)
g(x)
.
Dimostrazione Basta osservare che
f(x) +(x)
g(x) +(x)
=
f(x)
g(x)

1 +
(x)
f(x)
1 +
(x)
g(x)
,
e che il secondo fattore tende a 1 per x x
0
.
Esempi 4.7.4 (1) Si ha, in base al principio di sostituzione,
lim
x0
sin x x
2
x +x

x
= lim
x0
sin x
x
= 1.
(2) Calcoliamo (se esiste) il limite
lim
x0
sin x x + log(1 +x
2
)
x
2
.
La funzione log(1 + x
2
) `e un innitesimo per x 0 di ordine superiore
sia rispetto a sin x, sia rispetto a x; tuttavia essa non `e un innitesimo di
ordine superiore a (sin x x), in quanto (sin x x) `e dello stesso ordine di
x
3
(esercizio 3.3.12) mentre log(1 + x
2
) `e dello stesso ordine di x
2
. Sarebbe
perci`o sbagliato concludere che il limite proposto coincide con
lim
x0
sin x x
x
2
= 0;
290
esso invece coincide con
lim
x0
log(1 +x
2
)
x
2
= 1.
Discorsi analoghi, come ora vedremo, valgono per gli inniti per x x
0
, cio`e
per le funzioni f denite in un intorno di x
0
(salvo al pi` u x
0
) e tali che
1
f(x)
sia innitesimo per x x
0
.
Siano f, g due inniti per x x
0
: diciamo che f `e un innito di ordine
superiore a g per x x
0
, ovvero che g `e un innito di ordine inferiore a f
per x x
0
, se
lim
xx
0
g(x)
f(x)
= 0;
in tal caso useremo ancora la scrittura
g(x) = o(f(x)) per x x
0
.
Diciamo che f e g sono inniti dello stesso ordine per x x
0
se esiste un
numero reale ,= 0 tale che
lim
xx
0
g(x)
f(x)
= .
Si noti che, in conseguenza delle denizioni di o-piccolo e O-grande, f `e
un innito di ordine superiore a g per x x
0
se e solo se 1/f `e un innitesimo
di ordine superiore a 1/g per x x
0
.
Esempi 4.7.5 (1)

1 +x
3
`e un innito di ordine superiore a x per x
+, in quanto
lim
x+
x

1 +x
3
= 0.
(2) tan x `e un innito dello stesso ordine di
1
+2x
per x

2
+
, in quanto
lim
x/2
+
( + 2x) tan x = lim
x/2
+
2
_

2
+x
_
sin x
cos x
=
= lim
x/2
+
2
_

2
+x
_
sin
_

2
+x
_ sin x = 2.
(3) Le funzioni
1
x
e
1
x
(2 + sin
1
x
) sono inniti non confrontabili per x 0.
291
Proposizione 4.7.6 (principio di sostituzione degli inniti) Siano f,
g, , funzioni innite per x x
0
, ove x
0
R oppure x
0
= . Se
(x) = o(f(x)) e (x) = o(g(x)) per x x
0
,
e se esiste (nito o innito) il limite
lim
xx
0
f(x)
g(x)
,
allora si ha anche
lim
xx
0
f(x) +(x)
g(x) +(x)
= lim
xx
0
f(x)
g(x)
.
Dimostrazione Analoga a quella del principio di sostituzione degli inni-
tesimi.
Un utile strumento per lo studio delle forme indeterminate (non il pi` u im-
portante, per`o: spesso `e pi` u utile la formula di Taylor, come mostreranno
lesempio 4.8.4 (2) e lesercizio 4.8.7) `e il seguente
Teorema 4.7.7 (di de lHopital) Sia x
0
[a, b] e siano f, g funzioni de-
rivabili in ]a, b[x
0
. Se:
(i) f e g sono entrambe innitesimi, oppure inniti, per x x
0
;
(ii) g

,= 0 in un intorno di x
0
(salvo al pi` u in x
0
);
(iii) esiste, nito o innito, il limite
lim
xx
0
f

(x)
g

(x)
,
allora
lim
xx
0
f(x)
g(x)
= lim
xx
0
f

(x)
g

(x)
.
Dimostrazione Consideriamo il caso in cui
lim
xx
0
f(x) = lim
xx
0
g(x) = 0.
Anzitutto, prolunghiamo oppure ri-deniamo f e g nel punto x
0
ponendo
f(x
0
) = g(x
0
) = 0. (Ci`o `e necessario se f e g non sono denite in x
0
, come
292
ad esempio nel caso di
1cos x
x
nel punto 0, oppure se f e g sono denite in
x
0
con valori non nulli, e quindi sono discontinue in tale punto.) In questo
modo, f e g risultano continue in ]a, b[x
0
e derivabili in ]a, b[x
0
.
Dobbiamo calcolare il limite di
f(x)
g(x)
per x x
0
. Detto il limite di
f

(x)
g

(x)
per
x x
0
, e supposto per ssare le idee R, per ogni > 0 esiste > 0 tale
che
0 < [x x
0
[ < =

(x)
g

(x)

< .
Sia x ]a, b[ tale che 0 < [x x
0
[ < , e supponiamo ad esempio x < x
0
:
allora f e g soddisfano le ipotesi del teorema di Cauchy (teorema 4.3.2)
nellintervallo [x, x
0
]; quindi esiste ]x, x
0
[ tale che
f(x)
g(x)
=
f(x) f(x
0
)
g(x) g(x
0
)
=
f

()
g

()
.
Ma [ x
0
[ < [x x
0
[ < e dunque

f(x)
g(x)

()
g

()

< .
Ci`o prova che
f(x)
g(x)
converge a per x x
0
. Discorso analogo se = e
se x > x
0
.
Passiamo ora a considerare il caso in cui f e g sono inniti per x x
0
. In
questo caso la dimostrazione `e meno semplice.
Proveremo la tesi solamente nel caso in cui R; per il caso = si
rimanda allesercizio 4.7.4.
Fissati due punti distinti x, ]a, b[x
0
, entrambi minori o entrambi mag-
giori di x
0
, per il teorema di Cauchy possiamo scrivere
f(x) f()
g(x) g()
=
f

()
g

()
,
con opportuno punto intermedio fra x e . Questa scrittura ha senso se i
punti x, sono sucientemente vicini a x
0
: in tal caso infatti vale lipotesi
(ii), che assicura liniettivit`a di g. La relazione sopra scritta equivale, con
facili calcoli, a
f(x)
g(x)
=
1
g()
g(x)
1
f()
f(x)
f

()
g

()
,
293
scrittura che a sua volta ha senso per x sucientemente vicino a x
0
, visto
che f e g tendono a per x x
0
.
Sia ora > 0 e sia

]0, 1[ un altro numero, che sseremo in seguito. Per


lipotesi (iii), esiste > 0 tale che

(u)
g

(u)

<

per u ]a, b[, 0 < [u x


0
[ < .
Scegliamo = x
0


2
, a seconda che sia x > x
0
o x < x
0
. Allora quando
0 < [x x
0
[ < si avr`a anche 0 < [ x
0
[ < , e dunque

()
g

()

<

.
Adesso osserviamo che, con la nostra scelta di , si ha
lim
xx
0
1
g()
g(x)
1
f()
f(x)
= 1,
e dunque esiste ]0, ] tale che

1
g()
g(x)
1
f()
f(x)
1

<

per 0 < [x x
0
[ < .
Valutiamo allora

f(x)
g(x)

quando 0 < [x x
0
[ < : si ha

f(x)
g(x)

1
g()
g(x)
1
f()
f(x)
f

()
g

()

1
g()
g(x)
1
f()
f(x)
1

()
g

()

()
g

()

([[ +

) +

.
Essendo

< 1, deduciamo

f(x)
g(x)

< ([[ + 2)

per 0 < [x x
0
[ < ,
294
e scegliendo inne



||+2
si conclude che

f(x)
g(x)

< per 0 < [x x


0
[ < ,
che `e la tesi.
Osservazioni 4.7.8 (1) Il teorema di de LHopital vale anche nel caso di
rapporti di innitesimi, o di inniti, per x x
+
0
, o per x x

0
, o anche per
x . Le dimostrazioni sono essenzialmente analoghe (esercizio 4.7.4).
(2) La soppressione di una qualunque delle tre ipotesi rende falso il teorema:
si vedano gli esercizi 4.7.2 e 4.7.3.
(3) In pratica la sostituzione di
f
g
con
f

porta sovente ad unulteriore forma


indeterminata. In questi casi, se le tre ipotesi (i)-(ii)-(iii) sono ancora sod-
disfatte, si pu`o applicare il teorema di de LHopital alle funzioni f

e g

, e
considerare i limiti per x x
0
di
f

, poi di
f
(3)
g
(3)
, eccetera, nche non si trova
un n N
+
tale che
lim
xx
0
f
(n)
(x)
g
(n)
(x)
= ;
si avr`a allora (e solo allora, cio`e solo quando tale limite esiste)
lim
xx
0
f
(n1)
(x)
g
(n1)
(x)
= lim
xx
0
f
(n2)
(x)
g
(n2)
(x)
= . . . = lim
xx
0
f(x)
g(x)
= .
Esempio 4.7.9 Si ha, usando due volte il teorema di de LHopital,
lim
x0
cos 2x cos x
x
2
= lim
x0
2 sin 2x + sin x
2x
= lim
x0
4 cos 2x + cos x
2
=
3
2
.
Esercizi 4.7
1. Nellenunciato del teorema di de LHopital, nel caso del confronto di
due innitesimi non si fa lipotesi che la funzione g sia diversa da 0 in
un intorno di x
0
(salvo al pi` u x
0
): si provi che ci`o `e conseguenza delle
altre ipotesi del teorema.
2. Posto f(x) = log x e g(x) = x, si verichi che
lim
x0
+
f(x)
g(x)
,= lim
x0
+
f

(x)
g

(x)
.
Come mai?
295
3. Calcolare, se esistono, i limiti
(a) lim
x+
x + sin x
x
, (b) lim
x0
x
2
sin 1/x
sin x
.
4. Dimostrare il teorema di de LHopital nel caso in cui
f

(x)
g

(x)
per
x x
0
, e nel caso di forme indeterminate 0/0 e / per x .
5. Calcolare, se esistono, i seguenti limiti:
(i) lim
x0
+
(arctan x)
tan x
; (ii) lim
x/4

2 sin x cos x
log sin 2x
;
(iii) lim
x0
+
log
x
(e
x
1); (iv) lim
x+
log(1 + 2e
x
)

1 +x
2
;
(v) lim
x1
x x
x
1 x log x
; (vi) lim
x0
tan x log sin x;
(vii) lim
x0
_
1
x
_
tan x
; (viii) lim
x0
_
1
1 cos x

2
x
2
_
;
(ix) lim
x0
arcsin x x
x arctan x
; (x) lim
x1
+
(log x) log log x;
(xi) lim
x0
+
(tan x)e
1/x
; (xii) lim
x0
_
1
x
2

1
tan
2
x
_
;
(xiii) lim
x0
(1 +x
2
)
1
sin
2
x
; (xiv) lim
x0
(1 +x)
1/x

1 +x e
x
2
;
(xv) lim
x0
+
_
log x
x
_
x
; (xvi) lim
x1
(1 x) tan
x
2
;
(xvii) lim
x0
+
(e
x
1)
x
; (xviii) lim
x1

(log x)
2/3
+ (1 x
2
)
3/4
(sin(x 1))
2/3
;
(xix) lim
x0
_
tan x
x
_
1/x
; (xx) lim
x0
log(1 +x +x
2
) + log(1 x +x
2
)
sin
2
x
.
6. Sia f : [a, b] R una funzione continua, sia x
0
]a, b[ e supponiamo che
f sia derivabile in ]a, b[x
0
. Si provi che se esiste lim
xx
0
f

(x) = R,
allora f `e derivabile anche nel punto x
0
, con f

(x
0
) = .
296
7. Sia f : [a, +[R una funzione derivabile. Si provi che se
lim
x+
f

(x) = a R, lim
x
(f(x) ax) = b R.
allora f ha lasintoto obliquo di equazione y = ax +b per x +.
`
E
vero il viceversa?
4.8 Formula di Taylor
Consideriamo una funzione f :]a, b[R e ssiamo un punto x
0
]a, b[. Come
sappiamo, se f `e continua allora
f(x) f(x
0
) = o(1) per x x
0
,
mentre se f `e derivabile allora
f(x) f(x
0
) f

(x
0
)(x x
0
) = o(x x
0
) per x x
0
.
Il risultato che segue generalizza questa propriet`a di approssimabilit`a.
Teorema 4.8.1 (formula di Taylor) Sia f una funzione derivabile k volte
in ]a, b[, ove k N, e sia x
0
]a, b[. Allora esiste un unico polinomio P
k
(x)
di grado al pi` u k, tale che
f(x) P
k
(x) = o
_
(x x
0
)
k
_
per x x
0
;
tale polinomio `e
P
k
(x) =
k

n=0
1
n!
f
(n)
(x
0
)(x x
0
)
n
e si chiama k-simo polinomio di Taylor di f di centro x
0
.
Dimostrazione Se k = 0 si vede immediatamente che P
0
(x) = f(x
0
) `e
lunico polinomio che verica la tesi. Possiamo quindi supporre k 1.
Tutto il ragionamento `e basato sul seguente lemma:
Lemma 4.8.2 Sia g :]a, b[ R una funzione derivabile k volte, con k 1,
e sia x
0
]a, b[. Si ha
g(x) = o
_
(x x
0
)
k
_
per x x
0
se e solo se
g(x
0
) = g

(x
0
) = g

(x
0
) = . . . = g
(k)
(x
0
) = 0.
297
Dimostrazione del lemma (=) Poiche, per ipotesi, per h = 0, 1, . . . , k1
la funzione g
(h)
(x) `e innitesima per x x
0
, usando ripetutamente il teorema
di de LHopital (teorema 4.7.7) si ha la catena di implicazioni
lim
xx
0
g(x)
(x x
0
)
k
= =
= lim
xx
0
g

(x)
k(x x
0
)
k1
= = . . . = lim
xx
0
g
(k1)
(x)
k!(x x
0
)
= ;
ma questultimo limite vale 0, poiche, per denizione di derivata k-sima,
g
(k1)
(x)
k!(x x
0
)
=
1
k!
g
(k1)
(x) g
(k1)
(x
0
)
x x
0

1
k!
g
(k)
(x
0
) = 0 per x x
0
.
(=) Deniamo
Z = h N : 0 h k, g
(h)
(x
0
) ,= 0 :
dobbiamo provare che Z = . Dallipotesi
lim
xx
0
g(x)
(x x
0
)
k
= 0
si deduce in particolare che g(x) deve essere innitesima per x x
0
, quindi
g(x
0
) = 0 e pertanto 0 / Z. Supponiamo per assurdo che Z non sia vuoto:
allora esso avr`a un minimo p 1, e si avr`a dunque
g(x
0
) = g

(x
0
) = = g
(p1)
(x
0
) = 0, g
(p)
(x
0
) ,= 0.
Consideriamo allora la forma indeterminata g(x)/(x x
0
)
p
: per il teorema
di de lHopital,
lim
xx
0
g(x)
(x x
0
)
p
= lim
xx
0
g

(x)
p(x x
0
)
p1
= = lim
xx
0
g
(p1)
(x)
p!(x x
0
)
=
g
(p)
(x
0
)
p!
,= 0,
mentre invece, per ipotesi,
lim
xx
0
g(x)
(x x
0
)
p
= lim
xx
0
g(x)
(x x
0
)
k
(x x
0
)
kp
= 0.
Ci`o `e assurdo e pertanto Z = .
298
Dimostriamo ora la formula di Taylor. Sia P(x) un arbitrario polinomio di
grado k, che possiamo sempre scrivere nella forma
P(x) =
k

n=0
a
n
(x x
0
)
n
(esercizio 4.8.1). Applicando il lemma 4.8.2 alla funzione f(x)P(x), avremo
f(x) P(x) = o
_
(x x
0
)
k
_
per x x
0

f
(n)
(x
0
) = P
(n)
(x
0
) per n = 0, 1, . . . , k;
daltra parte si vede subito che
P(x
0
) = a
0
, P

(x
0
) = a
1
, P

(x
0
) = 2a
2
. . . , P
(k)
(x
0
) = k! a
k
,
e dunque
f(x) P(x) = o
_
(x x
0
)
k
_
per x x
0

a
n
=
1
n!
f
(n)
(x
0
) per n = 0, 1, . . . , k,
cio`e P(x) P
k
(x).
Osservazioni 4.8.3 (1) Il grado del k-simo polinomio di Taylor P
k
(x) `e al
pi` u k; `e esattamente k se e solo se f
(k)
(x
0
) ,= 0.
(2) Il (k + 1)-simo polinomio di Taylor (ammesso che esista, cio`e che f sia
derivabile k + 1 volte) si ottiene dal k-simo semplicemente aggiungendo un
termine:
P
k+1
(x) = P
k
(x) +
1
(k + 1)!
f
(k+1)
(x
0
)(x x
0
)
k+1
.
(3) Se f `e derivabile k + 1 volte in ]a, b[, si pu`o precisare meglio il modo di
tendere a 0 del resto di Taylor, ossia della dierenza f(x)P
k
(x) per x x
0
:
si ha in tal caso
f(x) P
k
(x) =
1
(k + 1)!
f
(k+1)
()(x x
0
)
k+1
,
ove `e un opportuno punto compreso fra x e x
0
. Questo risultato potrebbe
chiamarsi teorema di Lagrange di grado k+1. Se in particolare la funzione
f
(k+1)
`e limitata, esso ci dice che
f(x) P
k
(x) = O
_
(x x
0
)
k+1
_
per x x
0
.
299
Per provare il teorema di Lagrange di grado k +1, basta applicare ripetu-
tamente il teorema di Cauchy (teorema 4.3.2):
f(x) P
k
(x)
(x x
0
)
k+1
=
f

(
1
) P

k
(
1
)
(k + 1)(
1
x
0
)
k
= . . . =
=
f
(k)
(
k
) P
(k)
k
(
k
)
(k + 1)!(
k
x
0
)
=
f
(k+1)
()
(k + 1)!
,
ove
1
`e intermedio fra x e x
0
,
2
`e intermedio fra
1
e x
0
, . . . ,
k
`e intermedio
fra
k1
e x
0
, e inne `e intermedio fra
k
e x
0
; nellultimo passaggio si `e
usato il fatto che P
k
ha grado non superiore a k e dunque P
(k+1)
k
0.
(4) Per scrivere il k-simo polinomio di Taylor di una data funzione f non `e
sempre obbligatorio calcolare le derivate di f nel punto x
0
; talvolta conviene
invece far uso della sua propriet`a di miglior approssimazione: se riusciamo
a trovare un polinomio P, di grado non superiore a k, tale che
f(x) P(x) = o
_
(x x
0
)
k
_
per x x
0
,
necessariamente esso sar`a il k-
simo polinomio di Taylor cerca-
to. Ad esempio, data f(x) =
sin x
5
, chi `e il suo quattordicesi-
mo polinomio di Taylor di centro
0? Ricordando che
lim
t0
sin t t
t
3
=
1
6
(esercizio 3.3.12), avremo anche
lim
x0
sin x
5
x
5
x
15
=
1
6
(esercizio 3.3.10); in particolare
sin x
5
x
5
= O(x
15
) = o(x
14
)
per x 0, e dunque P
14
(x) = x
5
. Naturalmente si ha anche P
13
(x) =
P
12
(x) = . . . = P
5
(x) = x
5
, mentre, essendo
sin x
5
= O(x
5
) = o(x
4
) per x 0,
300
si ha P
4
(x) = P
3
(x) = P
2
(x) = P
1
(x) = P
0
(x) = 0.
Vediamo adesso quali sono le strettissime relazioni che intercorrono fra la
somma f(x) di una serie di potenze, la serie stessa e i polinomi di Taylor
della funzione f. Supponiamo che risulti
f(x) =

n=0
a
n
x
n
, x ] R, R[,
ove R ]0, +]. Come sappiamo (teorema 4.1.11), si ha
a
n
=
1
n!
f
(n)
(0) n N,
e dunque per ogni k N la somma parziale k-sima della serie coincide con il
k-simo polinomio di Taylor di f di centro 0. Abbiamo perci`o per ogni k N,
in virt` u della formula di Taylor,
f(x) P
k
(x) =

n=k+1
a
n
x
n
= o(x
k
) per x 0.
Le somme parziali di una serie di potenze godono quindi di una duplice
propriet`a:
(a) in quanto tali, esse vericano, per denizione di serie convergente,
lim
k
_
f(x)
k

n=0
a
n
x
n
_
= 0 x ] R, R[,
cio`e forniscono unapprossimazione globale del graco di f in ] R, R[
tanto pi` u accurata quanto pi` u k `e grande;
(b) in quanto polinomi di Taylor di centro 0, vericano
lim
xx
0
1
x
k
_
f(x)
k

n=0
a
n
x
n
_
= 0 k N,
cio`e forniscono unapprossimazione locale del graco di f nellintorno
di 0 tanto pi` u accurata quanto pi` u x `e vicino a 0.
301
Si noti che esistono funzioni di classe C

, per le quali dunque i P


k
(x) sono
deniti per ogni k N, e (per denizione) soddisfano la condizione
lim
xx
0
f(x) P
k
(x)
(x x
0
)
k
= 0 k N,
e che tuttavia vericano per ogni x ,= x
0
lim
k
[f(x) P
k
(x)] ,= 0
(esercizio 4.8.8).
Osserviamo inne che luso della formula di Taylor `e utilissimo nel calcolo
dei limiti di forme indeterminate, come mostrano i seguenti esempi.
Esempi 4.8.4 (1) Per calcolare il limite
lim
x0
e
x
2
/2
cos x x
2
x
2
si pu`o osservare che per x 0 risulta
e
x
2
/2
= 1 +
x
2
2
+ o(x
2
), cos x = 1
x
2
2
+ o(x
3
),
e che dunque
e
x
2
/2
cos x x
2
= o(x
2
) per x 0;
pertanto
lim
x0
e
x
2
/2
cos x x
2
x
2
= lim
x0
o(x
2
)
x
2
= 0.
Invece per calcolare il limite
lim
x0
e
x
2
/2
cos x x
2
x
4
occorre scrivere anche i termini del quarto ordine: poiche
e
x
2
/2
cos x x
2
=
=
_
1 +
x
2
2
+
x
4
8
+ o(x
4
)
_

_
1
x
2
2
+
x
4
24
+ o(x
5
)
_
x
2
=
=
x
4
12
+ o(x
4
),
302
si ha
lim
x0
e
x
2
/2
cos x x
2
x
4
= lim
x0
x
4
12
+ o(x
4
)
x
4
=
1
12
.
(2) Per il limite
lim
x0

1 + sin
2
x

1 +x
2
sin x
4
luso del teorema di de LHopital appare poco pratico, perche derivando nu-
meratore e denominatore compaiono espressioni alquanto complicate. Invece,
usando la formula di Taylor, per x 0 risulta (esempio 4.3.5 (3))
sin x
4
= x
4
+ o(x
11
),

1 +x
2
= 1 +
1
2
x
2

1
8
x
4
+ O(x
5
),
_
1 + sin
2
x = 1 +
1
2
sin
2
x
1
8
sin
4
x + o(sin
5
x) =
= 1 +
1
2
_
x
1
6
x
3
+ o(x
4
)
_
2

1
8
_
x + o(x
2
)
_
4
=
= 1 +
1
2
_
x
2

1
3
x
4
_

1
8
x
4
+ o(x
5
) =
= 1 +
1
2
x
2

7
24
x
4
+ o(x
5
),
e pertanto, grazie al principio di sostituzione degli innitesimi,
lim
x0

1 + sin
2
x

1 +x
2
sin x
4
= lim
x0

_
7
24

1
8
_
x
4
+ o(x
5
)
x
4
+ o(x
11
)
=
1
6
.
Formula di Taylor per funzioni di pi` u variabili
La formula di Taylor si pu`o enunciare anche per le funzioni di m variabili.
A questo scopo occorre introdurre alcune comode notazioni. Un vettore p a
componenti intere non negative, ossia un elemento di N
m
, si chiama multi-
indice. Dato un multi-indice p, di componenti (p
1
, ..., p
m
), si deniscono
loperatore di derivazione D
p
D
p
= D
p
1
1
D
p
2
2
. . . D
pm
m
,
303
ed il monomio x
p
x
p
= (x
1
)
p
1
. . . (x
m
)
pm
.
Inoltre si pone
p! = p
1
! . . . p
m
! .
Altre notazioni di uso comune sono quelle che seguono: se p, q N
m
, si
scrive q p se risulta q
i
p
i
per i = 1, . . . , m; in tal caso si denisce
_
p
q
_
=
_
p
1
q
1
_
. . .
_
p
m
q
m
_
.
Ci`o premesso, vale un risultato del tutto analogo al caso delle funzioni di una
sola variabile (teorema 4.8.1).
Teorema 4.8.5 (formula di Taylor in pi` u variabili) Sia f una funzio-
ne di classe C
k
denita in un aperto A di R
m
, ove k N, e sia x
0
A.
Allora esiste un unico polinomio P
k
(x) di grado al pi` u k, tale che
f(x) P
k
(x) = o
_
[x x
0
[
k
m
_
per x x
0
;
tale polinomio `e
P
k
(x) =

|p|k
1
p!
D
p
f(x
0
)(x x
0
)
p
e si chiama k-simo polinomio di Taylor di f di centro x
0
.
Dimostrazione Se k = 0 non c`e niente da dimostrare: il polinomio P
0
`e
la costante f(x
0
). Sia dunque k 1. Fissata una generica direzione v, per
> 0 sucientemente piccolo `e certamente ben denita la funzione
F(t) = f(x
0
+tv), t [, ].
Essa `e di classe C
k
e si ha
F

(t) =
m

i=1
D
i
f(x
0
+tv)v
i
,
F

(t) =
m

i,j=1
D
j
D
i
f(x
0
+tv)v
i
v
j
,
304
e in generale, per 1 h k,
F
(h)
(t) =
m

i
1
,...,i
h
=1
D
i
1
. . . D
i
h
f(x
0
+tv)v
i
1
. . . v
i
h
.
La seconda somma si pu`o scrivere nella forma
F

(t) =

|p|=2
2!
p!
D
p
f(x
0
+tv)v
p
:
infatti, in virt` u del teorema di Schwarz (teorema 4.6.4), le derivate D
i
D
j
,
ossia le D
p
con p = e
i
+e
j
, compaiono due volte, mentre le D
2
i
, ossia le D
p
con p = 2e
i
, compaiono una volta sola. Similmente, per 1 h k risulta
F
(h)
(t) =

|p|=h
h!
p!
D
p
f(x
0
+tv)v
p
:
questo si vede osservando che, se [p[ = h, la quantit`a h!/p! `e il numero dei
modi in cui si pu`o ripartire un insieme di k elementi in m sottoinsiemi aventi
rispettivamente p
1
, . . . , p
m
elementi (infatti, il problema `e analogo a quello
di distribuire h palline in m urne, mettendone p
1
nelle prima urna, p
2
nella
seconda, . . . , p
m
nellm-sima: possiamo metterne p
1
nella prima urna in
_
h
p
1
_
modi, p
2
nella seconda urna in
_
hp
1
p
2
_
modi, . . . , p
m1
nella penultima urna
in
_
hp
1
...p
m2
p
m1
_
modi, e inne ci resta un solo modo di mettere le residue p
m
palline nellultima urna. Il numero di modi complessivo `e allora il prodotto
dei binomiali, cio`e
m1

j=1
(h p
1
. . . p
j1
)!
(p
j
)!(h p
1
. . . p
j1
p
j
)!
=
h!
(p
1
)!(p
2
)! (p
m
)!
=
h!
p!
.
Scriviamo adesso la formula di Taylor per F nel punto t = 0: per il teorema
4.8.1 risulta
F(t) =
k

h=0
F
(h)
(0)
h!
t
h
+R
k
(t), t [, ],
dove R
k
(t) `e una funzione tale che
lim
t0
R
k
(t)
t
k
= 0.
305
Sostituendo le espressioni trovate per le derivate di F, e ponendo x = x
0
+tv
con [t[ , otteniamo
f(x) = F(t) =
k

h=0
t
h
h!

|p|=h
h!
p!
D
p
f(x
0
)
_
x x
0
t
_
p
+R
k
(t),
ovvero
f(x) =

|p|h
1
p!
D
p
f(x
0
)(x x
0
)
p
+R
k
([x x
0
[
m
).
Proviamo lunicit`a del k-simo polinomio di Taylor di f: sia P(x) un altro
polinomio di grado al pi` u k, sviluppato secondo le potenze di x x
0
, che
verica la tesi. Allora, posto Q = P
k
P, possiamo scrivere
Q(x) =

|p|k
c
p
(x x
0
)
p
, lim
xx
0
Q(x)
[x x
0
[
k
m
= 0.
Ne deduciamo che, posto x = x
0
+tv,
lim
t0
Q(x
0
+tv)
t
k
= 0 v R
m
con [v[
m
= 1.
Si ha dunque, per ogni v R
m
con [v[
m
= 1,
0 = lim
t0
Q(x
0
+tv)
t
k
= lim
t0
k

h=0

|p|=h
c
p
t
hk
v
p
,
e questo implica, come `e immediato vericare,

|p|=h
c
p
v
p
= 0 v R
m
con [v[ = 1, h 0, 1, . . . , k,
da cui, per omogeneit`a,

|p|=h
c
p
x
p
= 0 x R
m
, h 0, 1, . . . , k.
Da queste relazioni segue
q! c
q
= D
q

|p|=h
c
p
x
p
= 0 q N
m
con [q[ = h, h 0, 1, . . . , k,
ossia Q(x) 0. Ci`o prova che P = P
k
.
306
Esercizi 4.8
1. Sia P(x) =

k
n=0
a
n
x
n
un polinomio. Si provi che per ogni x
0
R
esistono unici b
0
, b
1
,. . . ,b
k
R tali che
P(x) =
k

h=0
b
h
(x x
0
)
h
x R.
[Traccia: scrivere x = (x x
0
) +x
0
e usare la formula di Newton per
il binomio.]
2. Scrivere il decimo polinomio di Taylor di centro 0 per le funzioni:
(a) x sin x
2
; (b) x sin
2
x; (c) log(1 + 3x
3
); (d)

1 2x
4
.
3. Scrivere il k-simo polinomio di Taylor di centro

4
per le funzioni sin x
e cos x.
4. Sia f(x) = x +x
4
; scrivere tutti i polinomi di Taylor di f di centro 1.
5. Si calcoli una approssimazione di sin 1 a meno di 10
4
.
6. Scrivere il secondo polinomio di Taylor di centro 0 per la funzione
f(x) = log(1 +e
x
)
x
2
, e calcolare il limite
lim
x0
f(x) P
2
(x)
x
4
.
307
7. Calcolare, usando la formula di Taylor, i seguenti limiti:
(i) lim
x0
log cos x
x
2
; (ii) lim
x0
+
x sin
2

x sin
2
x
x
2
;
(iii) lim
x0
_
1
x tan x

1
x
2
_
; (iv) lim
x0
1 cos x + log cos x
x
4
;
(v) lim
x0
cosh
2
x 1 x
2
x
4
; (vi) lim
x0
1
x
2
_
sin x
x

x
sin x
_
;
(vii) lim
x0
_
sin 2x
2x
_ 1
x
2
; (viii) lim
x0
sin x(5
x
2
x
)
sin x log(1 x)
;
(ix) lim
x0
e
sin x
1 x
x
2
; (x) lim
x+
_
2x
2
x
3
log
_
1 + sin
2
x
__
;
(xi) lim
n
n
2/n
1
log n
1/n
; (xii) lim
n
n
2
_
1
1 +e
1/n

2n 1
4n
_
;
(xiii) lim
n
n
1/n
1
log n
1/n
; (xiv) lim
n
_
(n
4
+n
3
+ 1)
1/4
n
_
;
(xv) lim
x0
+
(cos x)
log x
; (xvi) lim
x1
x
1
1x
e
x
x 1
.
8. Sia f : R R la funzione denita da
f(x) =
_
e

1
x
2
se x ,= 0
0 se x = 0.
Provare che:
(i) f `e innite volte derivabile in R;
(ii) per ogni k N il k-simo polinomio di Taylor di f di centro 0 `e
P
k
(x) 0;
308
(iii) per ogni R > 0 non esiste alcuna serie di potenze cha abbia somma
uguale a f(x) in ] R, R[.
[Traccia: si provi per induzione che
f
(n)
(x) =
_
Q
n
(x)e

1
x
2
se x ,= 0
0 se x = 0,
ove Q
n
(x) `e unopportuna funzione razionale, cio`e `e il quoziente di due
polinomi.]
9. Sia f C
k
[a, b] una funzione invertibile; provare che f
1
`e di classe
C
k
.
10. Posto f(x) = x + e
x
, si verichi che la funzione inversa f
1
esiste e
se ne scrivano esplicitamente il secondo e terzo polinomio di Taylor di
centro 1.
11. Si determini il terzo polinomio di Taylor di centro (0, 0) per le funzioni
f
1
(x, y) =
cos x
cos y
, f
2
(x, y) = ye
xy
, f
3
(x, y) = log
1 +x
2
1 +y
2
.
12. Provare che se f `e una funzione di classe C
k+1
in un aperto A di R
m
, e
se x
0
A, allora il k-simo resto di Taylor di f pu`o essere scritto nella
forma
f(x) P
k
(x) =

|p|=k+1
D
p
f(u)(x x
0
)
p
,
ove u `e un punto del segmento di estremi x
0
e x.
[Traccia: applicare il teorema di Lagrange di grado k + 1 alla
funzione F(t) = f(x
0
+t(x x
0
)).]
13. Dimostrare la formula di Leibniz per la derivata di ordine p N
m
del
prodotto di due funzioni:
D
p
(fg) =

qp
_
p
q
_
D
q
fD
pq
g.
[Traccia: Ragionare per induzione su [p[...]
309
4.9 Massimi e minimi relativi per funzioni di
una variabile
La forma del graco di una funzione f nellintorno di un punto `e strettamente
legata al comportamento delle derivate di f in tale punto. Andiamo ad
analizzare la questione, cominciando dal caso delle funzioni di una variabile.
Proposizione 4.9.1 Sia f : [a, b] R una funzione derivabile. Allora:
(i) f `e crescente in [a, b] se e solo se f

0 in [a, b];
(ii) f `e decrescente in [a, b] se e solo se f

0 in [a, b];
(iii) se f

> 0 in [a, b] allora f `e strettamente crescente in [a, b], ma il


viceversa `e falso;
(iv) se f

< 0 in [a, b] allora f `e strettamente decrescente in [a, b], ma il


viceversa `e falso.
Dimostrazione (i) Se f `e crescente in [a, b], allora ssato x
0
[a, b] si
ha f(x) f(x
0
) se x > x
0
e f(x) f(x
0
) se x < x
0
; quindi il rapporto
incrementale di f in x
0
`e sempre non negativo. Facendone il limite per
x x
0
si ottiene f

(x
0
) 0 per ogni x
0
[a, b].
Viceversa, sia f

0 in [a, b] e siano x

, x

[a, b] con x

< x

. Applicando il
teorema di Lagrange (teorema 4.3.3) nellintervallo [x

, x

] si trova che esiste


]x

, x

[ tale che
f(x

) f(x

)
x

= f

() 0,
da cui segue f(x

) f(x

). Quindi f `e crescente.
(ii) Segue da (i) applicata a f.
(iii) Si ottiene ragionando come nel viceversa di (i), osservando che stavolta
si ha f

() > 0.
(iv) Segue da (iii) applicata a f.
Inne, il viceversa di (iii) e (iv) `e falso perche le funzioni x
3
sono stretta-
mente monotone in R ma hanno derivata prima che si annulla in 0.
Denizione 4.9.2 Sia A un sottoinsieme di R
m
, ove m N
+
, e sia f : A
R una funzione qualunque; sia x
0
A. Diciamo che x
0
`e punto di massimo
310
relativo (oppure punto di minimo relativo) per f, se esiste un intorno U di
x
0
in R
m
tale che
f(x) f(x
0
) x U A (oppure f(x) f(x
0
) x U A).
Naturalmente, i punti di
massimo (minimo) di f so-
no anche punti di massimo
(minimo) relativo, mentre il
viceversa non `e vero. La -
gura accanto illustra il caso
m = 1, A = [a, b].
Teorema 4.9.3 (di Fermat) Sia f : [a, b] R una funzione derivabile, e
sia x
0
]a, b[. Se x
0
`e punto di massimo o di minimo relativo per f, allora
f

(x
0
) = 0. Il viceversa `e falso.
Dimostrazione Si ragiona come nella dimostrazione del teorema di Rolle
(teorema 4.3.1): se x
0
`e punto di massimo relativo esiste un intorno I di x
0
tale che
f(x) f(x
0
)
x x
0
_
0 se x I]a, x
0
[
0 se x I]x
0
, b],
quindi passando al limite per x x
0
si trova f

(x
0
) = 0. Lesempio f(x) =
x
3
, con x
0
= 0, mostra che il viceversa `e falso.
Discorso analogo per i punti di minimo relativo.
Osserviamo che se il punto di massimo o di minimo relativo `e un estremo
dellintervallo, la precedente proposizione non vale (esercizio 4.9.6).
Il seguente risultato caratterizza i punti di massimo e di minimo relativo per
funzioni di una variabile.
Teorema 4.9.4 Sia f : [a, b] R una funzione derivabile due volte, e sia
x
0
]a, b[. Valgono i seguenti fatti:
(i) se x
0
`e punto di massimo relativo per f, allora f

(x
0
) = 0 e f

(x
0
) 0,
ma il viceversa `e falso;
(ii) se x
0
`e punto di minimo relativo per f, allora f

(x
0
) = 0 e f

(x
0
) 0,
ma il viceversa `e falso;
311
(iii) se f

(x
0
) = 0 e f

(x
0
) < 0, allora x
0
`e punto di massimo relativo per
f, ma il viceversa `e falso;
(iv) se f

(x
0
) = 0 e f

(x
0
) > 0, allora x
0
`e punto di minimo relativo per f,
ma il viceversa `e falso.
Dimostrazione (i) Gi`a sappiamo (proposizione 4.9.3) che f

(x
0
) = 0; pro-
viamo che f

(x
0
) 0. Supponendo, per assurdo, che f

(x
0
) > 0, per il
teorema di permanenza del segno (esercizio 3.2.3) risulta
f

(x) f

(x
0
)
x x
0
=
f

(x)
x x
0
> 0
in un intorno I di x
0
, e dunque
f

(x)
_
< 0 se x I [a, x
0
[
> 0 se x I]x
0
, b].
Ma allora, per la proposizione 4.9.1, f decresce in I [a, x
0
[ e cresce in
I]x
0
, b[, cosicche x
0
non pu`o essere un punto di massimo relativo per f.
(ii) Analogo a (i).
(iii) Lo stesso ragionamento di (i) mostra che se f

(x
0
) < 0 e f

(x
0
) = 0,
allora f cresce in I [a, x
0
[ e decresce in I [x
0
, b[, e quindi x
0
`e punto di
massimo relativo.
(iv) Analogo a (iii).
Inne, la funzione f(x) = x
4
nel punto 0 verica f

(0) = 0 e f

(0) = 0,
ma 0 non `e punto di massimo relativo (il che rende falso il viceversa di (i)),
ed `e, anzi, punto di minimo assoluto, il che rende falso il viceversa di (iv).
La funzione f(x) = x
4
nel punto 0 rende falsi i viceversa degli altri due
enunciati.
Esercizi 4.9
1. Determinare, se esistono, il massimo ed il minimo delle seguenti funzioni
sugli insiemi indicati:
(i) [x
2
1[, x [2, 12]; (ii)

1 + sin e
x
, x 0;
(iii) log(e
x
x), x [1, 1]; (iv) 14x
2/3
x
2
, x [5, 5];
(v) e
x
4
sin x
1/4
, x 0; (vi) arctan x
x
1 +x
2
, x R.
312
2. Fra tutti i rettangoli inscritti in una circonferenza, determinare quello
di area massima.
3. Fra tutti i cilindri a base rotonda inscritti in una sfera, determinare
quello di volume massimo.
4. Dimostrare che per ogni x, y 0 si ha
(x+y)
p
2
p1
(x
p
+y
p
) se p 1, (x+y)
p
x
p
+y
p
se 0 p 1.
5. Provare che:
(i) x e

1/x
> 1 x > 0;
(ii) 2 sin x + tan x > 3x x ]0, /2[;
(iii)
2x
2 x
2
> tan x x ]0,

2[;
(iv) 0
arctan x
x

1
1 +x
2

x
2
1 +x
2
x R.
6. Provare che se f C
1
[a, b] e se f ha un massimo (minimo) relativo nel-
lestremo a, allora f

(a) 0 (f

(a) 0). Enunciare lanalogo risultato


nel caso in cui f ha un massimo (minimo) relativo nellestremo b.
4.10 Forme quadratiche
Nel caso delle funzioni di pi` u variabili, le condizioni perche un punto x
0
sia di massimo o di minimo relativo per una funzione f sono opportune
generalizzazioni di quelle del teorema 4.9.4, e coinvolgono, in luogo di f

e
di f

, il gradiente di f e la matrice Hessiana (cio`e la matrice delle derivate


seconde) di f nel punto x
0
; per enunciare tali condizioni, `e per`o necessario
uno studio preliminare delle cosiddette forme quadratiche in R
m
.
Data una matrice A = a
ij
, m m, reale e simmetrica, la funzione :
R
m
R denita da
(v) = Av v =
m

i,j=1
a
ij
v
i
v
j
, v R
m
,
`e detta forma quadratica associata ad A.
Una forma quadratica `e dunque un polinomio di secondo grado in m variabili,
313
privo di termini di grado inferiore; viceversa, un qualunque polinomio di
questo tipo `e una forma quadratica la cui matrice associata A = a
ij
`e
univocamente determinata dai coecienti del polinomio (esercizio 4.10.4).
In particolare, risulta
(tv) = t
2
(v) t R, v R
m
,
cosicche `e una funzione omogenea di grado 2 (esercizio 4.4.3). Inoltre,
ovviamente, si ha C

(R
m
); verichiamo che risulta
grad(v) = 2Av v R
m
.
In eetti, indicato con
ij
il generico elemento della matrice identit`a I (co-
sicche
ij
= 0 se i ,= j e
ij
= 1 se i = j), se k = 1, 2, . . . , m si ha per ogni
v R
m
:
D
k
(v) =
m

i,j=1
a
ij
D
k
(v
i
v
j
) =
m

i,j=1
a
ij
_

ik
v
j
+v
i

jk
_
=
=
m

j=1
a
kj
v
j
+
m

i=1
a
ik
v
i
=
m

j=1
a
kj
v
j
+
m

j=1
a
jk
v
j
= 2
m

j=1
a
jk
v
j
= 2(Av)
k
.
Denizione 4.10.1 Una forma quadratica : R
m
R si dice:
denita positiva, se (v) > 0 per ogni v R
m
0;
denita negativa, se (v) < 0 per ogni v R
m
0;
semidenita positiva, se (v) 0 per ogni v R
m
;
semidenita negativa, se (v) 0 per ogni v R
m
;
indenita, se assume sia valori positivi che negativi.
Esempi 4.10.2 Poniamo
A
1
=
_
1 0
0 1
_
, A
2
=
_
1 0
0 1
_
, A
3
=
_
0 0
0 1
_
,
A
4
=
_
1 0
0 0
_
, A
5
=
_
1 0
0 1
_
,
314
e indichiamo con
1
,
2
,
3
,
4
e
5
le forme quadratiche corrispondenti:

1
(x, y) = x
2
+y
2
,
2
(x, y) = x
2
y
2
,
3
(x, y) = y
2
,

4
(x, y) = x
2
,
5
(x, y) = x
2
+y
2
.
Allora
1
`e denita positiva,
2
`e denita negativa,
3
`e semidenita positiva,

4
`e semidenita negativa,
5
`e indenita.
Qualunque sia la matrice A reale e simmetrica, la forma quadratica associata
ad A, essendo una funzione di classe C

, per il teorema di Weierstrass assume


massimo M
0
e minimo m
0
sulla frontiera della palla unitaria di R
m
, la quale
`e un insieme compatto. Esistono dunque v
0
, w
0
tali che
m
0
= (v
0
) (v) (w
0
) = M
0
v .
Dato che `e una funzione omogenea di grado 2, possiamo scrivere
(v) = [v[
2
m

_
v
[v[
m
_
v R
m
0,
e di conseguenza si ottiene
m
0
[v[
2
m
(v) M
0
[v[
2
m
v R
m
.
Osserviamo ora che un numero complesso si dice autovalore per la matrice
A se esiste un vettore x C
m
0 (detto autovettore relativo allautovalore
) tale che Ax = x. Dato che tale equazione vettoriale `e un sistema lineare
omogeneo nelle incognite x
1
, . . . , x
m
, lesistenza di una sua soluzione x ,= 0,
ossia il fatto che sia autovalore per la matrice A, equivale alla condizione
det(A I) = 0. Quindi gli autovalori di A sono le m soluzioni (in C,
ciascuna contata con la sua molteplicit`a) dellequazione det(A I) = 0.
Si vede facilmente, per`o, che se A `e reale e simmetrica tutti i suoi autovalori
sono reali: infatti se Ax = x con x C
m
0, allora moltiplicando
scalarmente per x (rispetto al prodotto scalare di C
m
) si ha, essendo A reale
e simmetrica:
[x[
2
m
= Ax x = x A

x = x Ax = Ax x,
ove A

= b
ij
`e la matrice i cui elementi sono b
ij
= a
ji
. In particolare Ax x
`e un numero reale e quindi =
Ax x
|x|
2
m
`e reale. Si noti che, di conseguenza,
lautovettore x appartiene a R
m
dato che il sistema Ax = x `e a coecienti
reali.
315
Proposizione 4.10.3 Sia A una matrice m m reale e simmetrica e sia
la forma quadratica associata ad A. I numeri m
0
= (v
0
) = min

e
M
0
= (w
0
) = max

, ove = v R
m
: [v[
m
= 1, sono rispettivamente
il minimo ed il massimo autovalore di A. In particolare si ha
m
0
[v[
2
m
(v) M
0
[v[
2
m
v R
m
.
Dimostrazione Consideriamo la funzione F : R
m
R denita da
F(v) =
(v)
[v[
2
m
.
In virt` u dellomogeneit`a di , si ha
m
0
= F(v
0
) F(v) F(w
0
) = M
0
v R
m
0.
Dallesercizio 4.11.3 segue che
gradF(v
0
) = gradF(w
0
) = 0;
daltra parte se k = 1, . . . , m si ha per ogni v R
m
0:
D
k
F(v) =
D
k
(v)[v[
2
m
(v)D
k
[v[
2
m
[v[
4
m
=
= 2
(Av)
k
[v[
2
m

(v) 2v
k
[v[
4
m
=
2
[v[
2
m
_
(Av)
k
F(v)v
k
_
,
ossia
gradF(v) =
2
[v[
2
m
(Av F(v)v) v R
m
0.
Dunque, ricordando che v
0
, w
0
,
0 = gradF(v
0
) = Av
0
F(v
0
)v
0
= Av
0
m
0
v
0
,
0 = gradF(w
0
) = Aw
0
F(w
0
)w
0
= Aw
0
M
0
w
0
.
Ci`o prova che m
0
, M
0
sono autovalori di A. Resta da far vedere che se `e
autovalore di A risulta m
0
M
0
: sia u
0
R
m
0 tale che Au
0
= u
0
;
moltiplicando scalarmente per u
0
otteniamo
(u
0
) = Au
0
u
0
= [u
0
[
2
m
e pertanto
m
0
[u
0
[
2
m
(u
0
) = [u
0
[
2
m
M
0
[u
0
[
2
m
.
Dato che u
0
,= 0, ne segue la tesi.
316
Corollario 4.10.4 La forma quadratica , generata da una matrice reale e
simmetrica A, `e:
denita positiva, se e solo se tutti gli autovalori di A sono positivi;
denita negativa, se e solo se tutti gli autovalori di A sono negativi;
semidenita positiva, se e solo se tutti gli autovalori di A sono non
negativi;
semidenita negativa, se e solo se tutti gli autovalori di A sono non
positivi;
indenita, se e solo se A ha sia autovalori positivi, sia autovalori
negativi.
Dimostrazione Se `e denita positiva, si ha (v) > 0 per ogni v
R
m
0; in particolare m
0
= min

`e positivo, e quindi tutti gli autovalori


di A, che per la proposizione 4.10.3 sono non inferiori a m
0
, sono positivi.
Viceversa, se tutti gli autovalori di A sono positivi, il minimo m
0
della forma
quadratica su `e positivo in quanto, sempre per la proposizione 4.10.3,
m
0
`e un autovalore di A. Per omogeneit`a, si ha allora (v) m
0
[v[
2
m
> 0
per ogni v R
m
0, ossia `e denita positiva.
Discorso analogo per le altre propriet`a.
Osservazione 4.10.5 Una forma quadratica `e semidenita positiva e non
denita positiva se e solo se il minimo autovalore di A `e esattamente 0. Simil-
mente, una forma quadratica `e semidenita negativa e non denita negativa
se e solo se il massimo autovalore di A `e esattamente 0.
Due criteri pratici per stabilire la natura di una forma quadratica senza
calcolare gli autovalori della matrice (impresa dicoltosa quando m > 2)
sono descritti negli esercizi 4.10.2 e 4.10.3.
Esercizi 4.10
1. Sia A = a
ij
una matrice m m, sia v C
m
. Provare che [Av[
m

|A| [v[
m
, ove
|A| =

_
m

i,j=1
[a
ij
[
2
.
[Traccia: utilizzare la disuguaglianza di Cauchy-Schwarz.]
317
2. Sia A =
_
a b
b c
_
con a, b, c R, e sia la forma quadratica associata
ad A:
(x, y) = ax
2
+ 2bxy +cy
2
.
Si provi che:
(i) `e denita positiva se e solo se ac b
2
> 0, a > 0, c > 0;
(ii) `e denita negativa se e solo se ac b
2
> 0, a < 0, c < 0;
(iii) `e semidenita positiva se e solo se ac b
2
0, a 0, c 0;
(iv) `e semidenita negativa se e solo se ac b
2
0, a 0, c 0;
(v) `e indenita se e solo se ac b
2
< 0.
3. Sia A una matrice m m reale e simmetrica, siano
1
, . . . ,
m
i suoi
autovalori (non necessariamente tutti distinti). Si provi che:
(i) risulta
(1)
m
det(A I) =
m

i=1
(
i
) =
m
+
m

i=1
a
i

mi
C,
ove
a
1
=
m

i=1

i
, a
2
=

1i<jm

j
,
a
3
=

1i<j<hm

h
, . . . a
m
= (1)
m
m

i=1

i
;
(ii) la forma quadratica (v) = Av v `e:
denita negativa se e solo se a
i
> 0 per i = 1, . . . , m;
denita positiva se e solo se (1)
i
a
i
> 0 per i = 1, . . . , m;
semidenita negativa se e solo se a
i
0 per i = 1, . . . , m;
semidenita positiva se e solo se (1)
i
a
i
0 per i = 1, . . . , m;
indenita in tutti gli altri casi.
4. Sia P(v) un polinomio di secondo grado in R
m
, privo di termini di
grado inferiore. Provare che P(v) `e la forma quadratica associata alla
matrice A di coecienti a
ij
=
1
2
D
i
D
j
P.
318
5. Determinare, al variare del parametro a R, la natura delle seguenti
forme quadratiche:
(i) (x, y, z) = x
2
+ 2axy +y
2
+ 2axz +z
2
,
(ii) (x, y, z, t) = 2x
2
+ay
2
z
2
t
2
+ 2xz + 4yt + 2azt.
4.11 Massimi e minimi relativi per funzioni
di pi` u variabili
Per le funzioni di pi` u variabili la ricerca dei massimi e dei minimi relativi si
basa su risultati che sono in stretta analogia con quelli validi per funzioni di
una variabile (teorema 4.9.4). Si ha infatti:
Teorema 4.11.1 Sia f C
2
(A), ove A `e un aperto di R
m
, e sia x
0
A.
Valgono i seguenti fatti:
(i) se x
0
`e un punto di massimo relativo per f, allora gradf(x
0
) = 0 e la
forma quadratica associata alla matrice Hessiana H(x
0
) `e semidenita
negativa, ma il viceversa `e falso;
(ii) se x
0
`e un punto di minimo relativo per f, allora gradf(x
0
) = 0 e la
forma quadratica associata alla matrice Hessiana H(x
0
) `e semidenita
positiva, ma il viceversa `e falso;
(iii) se gradf(x
0
) = 0 e se la forma quadratica associata a H(x
0
) `e denita
negativa, allora x
0
`e punto di massimo relativo per f, ma il viceversa
`e falso;
(iv) se gradf(x
0
) = 0 e se la forma quadratica associata a H(x) `e denita
positiva, allora x
0
`e punto di minimo relativo per f, ma il viceversa `e
falso.
Premettiamo alla dimostrazione del teorema due risultati che useremo ripe-
tutamente anche in seguito.
319
Lemma 4.11.2 Sia B(x
0
, r) una palla
di R
m
e sia f C
2
(B(x
0
, r)). Fissato
un punto x B(x
0
, r), la funzione F :
[1, 1] R denita da
F(t) = f (x
0
+t(x x
0
))
`e di classe C
2
e risulta
F

(t) = gradf (x
0
+t(x x
0
)) (x x
0
) t [1, 1],
F

(t) = H (x
0
+t(x x
0
)) (x x
0
) (x x
0
) t [1, 1].
Dimostrazione Poiche f `e di classe C
2
in A, per il teorema di derivazione
delle funzioni composte (teorema 4.1.6) si ha F C
2
[1, 1] e
F

(t) =
m

i=1
f
x
i
(x
0
+t(x x
0
)) (x
i
x
i
0
) =
= gradf (x
0
+t(x x
0
)) (x x
0
),
F

(t) =
m

i,j=1

2
f
x
i
x
j
(x
0
+t(x x
0
)) (x
i
x
i
0
)(x
j
x
j
0
) =
= H (x
0
+t(x x
0
)) (x x
0
) (x x
0
).
Ci`o prova la tesi.
Lemma 4.11.3 Sia B(x
0
, r) una palla di R
m
e sia f C
2
(B(x
0
, r)). Per
ogni x B(x
0
, r) esiste ]0, 1[ tale che
f(x) = f(x
0
) + gradf(x
0
) +
1
2
H(x
0
+(x x
0
))(x x
0
) (x x
0
).
Dimostrazione Consideriamo nuovamente la funzione F : [1, 1] R
denita da
F(t) = f (x
0
+t(x x
0
)) .
Per il teorema di Lagrange di grado 2 (osservazione 4.8.3 (3)) esiste ]0, 1[
tale che
F(1) = F(0) +F

(0) +
1
2
F

().
320
Sostituendo in questa espressione i valori di F, F

e F

forniti dal lemma


4.11.2, si ha la tesi.
Dimostrazione del teorema 4.11.1 (i) Sia x
0
un punto di massimo rela-
tivo per f e sia B(x
0
, r) una palla contenuta in A. Fissato arbitrariamente
x B(x
0
, r), la funzione
F(t) = f (x
0
+t(x x
0
)) , t [1, 1],
`e di classe C
2
e ha massimo nel punto t = 0: per il teorema 4.9.1 si ha dunque
F

(0) = 0, F

(0) 0. Dal lemma 4.11.2 otteniamo


F

(0) = gradf(x
0
) (x x
0
) = 0, F

(0) = H(x
0
)(x x
0
) (x x
0
) 0.
Dato che x era stato scelto arbitrariamente in B(x
0
, r), il vettore v = xx
0
`e un arbitrario elemento di B(0, r); moltiplicando per [0, [, e scrivendo
nuovamente v al posto di v, le due relazioni precedenti equivalgono a
gradf(x
0
) v = 0, H(x
0
)v v 0 v R
m
.
La prima di queste due condizioni, scelto v = gradf(x
0
), dice che f ha gra-
diente nullo nel punto x
0
; la seconda condizione dice che la forma quadratica
associata a H(x
0
) `e semidenita negativa. Ci`o prova (i).
(ii) Analoga a (i).
(iii) Sia gradf(x
0
) = 0 e H(x
0
)v v < 0 per ogni v R
m
0. Allora gli
autovalori di H(x
0
) sono tutti negativi ed in particolare, detto il massimo
di essi, si ha (proposizione 4.10.3)
H(x
0
)v v [v[
2
m
v R
m
.
Sia r > 0 tale che B(x
0
, r) A: proviamo che se r `e abbastanza piccolo si
ha anche
H(x)v v

2
[v[
2
m
v R
m
, x B(x
0
, r).
Infatti se x B(x
0
, r) abbiamo
H(x)v v = [H(x) H(x
0
)]v v +H(x
0
)v v

[H(x) H(x
0
)]v v

[v[
2
m
;
321
daltra parte, utilizzando lesercizio 4.10.1, si trova

[H(x) H(x
0
)]v v

|H(x) H(x
0
)| [v[
2
m
,
ove
|H(x) H(x
0
)| =

_
m

i,j=1
[D
i
D
j
f(x) D
i
D
j
f(x
0
)[
2
.
Dunque, per la continuit`a delle derivate seconde di f, lultimo membro `e
minore di

2
[v[
2
m
se r `e sucientemente piccolo.
Fissato ora arbitrariamente x B(x
0
, r), per il lemma 4.11.3 possiamo
scrivere, ricordando che gradf(x
0
) = 0,
f(x) f(x
0
) =
1
2
H(x
0
+(x x
0
))(x x
0
) (x x
0
),
ove `e un punto opportuno fra 0 e 1: dunque x
0
+(xx
0
) B(x
0
, r). Per
come abbiamo scelto r si ha allora
H(x
0
+(x x
0
))(x x
0
) (x x
0
)

2
[x x
0
[
2
m
,
e pertanto si ottiene
f(x) f(x
0
) <

4
[x x
0
[
2
m
< 0 x B(x
0
, r).
Ci`o prova che x
0
`e punto di massimo relativo.
(iv) Analogo a (iii).
Inne, il viceversa di (ii) `e falso: infatti la funzione f(x, y) = x
2
y
4
ha
gradiente nullo nellorigine e Hessiana H(0, 0) =
_
2 0
0 0
_
, cosicche la forma
quadratica associata `e semidenita positiva, ma lorigine non `e punto di
minimo relativo perche f(0, 0) = 0 e f(0, y) < 0 per ogni y R 0. La
funzione f rende falso il viceversa di (i). Le funzioni (x
4
+ y
4
) rendono
falsi i viceversa di (iv) e (iii), in quanto nellorigine hanno rispettivamente
minimo e massimo assoluto pur avendo le matrici Hessiane nulle.
Osservazione 4.11.4 Un punto x
0
tale che gradf(x
0
) = 0 si dice punto
stazionario per f. Se x
0
`e stazionario per f, il piano tangente al graco
322
di f in (x
0
, f(x
0
)) `e orizzontale, ossia ortogonale allasse x
n+1
. Un punto
stazionario pu`o non essere ne di massimo ne di minimo relativo: in tal caso
esso si dice punto di sella. Ci`o accade se la forma H(x
0
)v v `e indenita, ma
non solo, come mostra lesempio della funzione f(x, y) = x
2
y
4
visto sopra,
in cui la forma `e semidenita.
Esempio 4.11.5 Sia f(x, y) = 2x
3
+ x
2
+ y
2
, (x, y) R
2
. Cerchiamo gli
eventuali massimi e minimi relativi di f. I punti stazionari si ottengono dal
sistema
_
f
x
(x, y) = 6x
2
+ 2x = 0
f
y
(x, y) = 2y = 0,
le cui soluzioni sono (x, y) = (0, 0) oppure (x, y) = (
1
3
, 0). Poiche f
xx
(x, y) =
12x + 2, f
xy
(x, y) = f
yx
(x, y) = 0, f
yy
(x, y) = 2, si ha
H(0, 0) =
_
2 0
0 2
_
, H
_

1
3
, 0
_
=
_
2 0
0 2
_
;
quindi le rispettive forme quadratiche sono denita positiva la prima e inde-
nita la seconda. Conclusione: (0, 0) `e punto di minimo relativo e (
1
3
, 0) `e
punto di sella.
Esercizi 4.11
1. Dato un foglio rettangolare di cartone, ritagliare da esso 4 quadrati in
modo da costruire una scatola parallelepipeda di volume massimo.
2. Fra tutti i coni circolari circoscritti ad una sfera, determinare quello di
supercie laterale minima.
3. Provare che se A `e un aperto di R
m
, se f : A R `e una funzione
dierenziabile e se f ha un massimo o minimo relativo in x
0
A,
allora x
0
`e punto stazionario per f, cio`e gradf(x
0
) = 0; si mostri anche
che il viceversa `e falso.
4. (Teorema di Rolle multidimensionale) Sia K R
m
un insieme compat-
to con parte interna non vuota e sia f continua su K e dierenziabile
nei punti interni di K. Provare che se f `e costante su K allora esiste
un punto stazionario per f interno a K.
[Traccia: adattare la dimostrazione del teorema di Rolle (teorema
4.3.1).]
323
5. Determinare, se esistono, i massimi ed i minimi relativi delle seguenti
funzioni:
(i) f(x, y) = [y[ arctan(xe
y
) in A = (x, y) R
2
: max[x[, [y[ 1;
(ii) f(x, y) = x
2
y
2
sul chiuso delimitato dal triangolo di vertici (0, 0),
(3, 1), (1, 3).
6. Determinare il triangolo inscritto in un cerchio che ha area massima.
7. Dati tre punti A, B, C ai vertici di un triangolo equilatero, determinare
un quarto punto P in modo che la somma delle distanze di P da A, B, C
sia minima.
8. Dati k punti (x
i
, y
i
) R
2
con ascisse distinte, trovare una retta y =
ax +b tale che lerrore quadratico totale
E(a, b) =
k

j=1
[ax
j
+b y
j
[
2
sia minimo.
9. Determinare la minima distanza in R
3
del punto (1, 2, 3) dalla retta r
di equazioni
x =
y
3
=
z
2
.
10. Determinare la minima distanza fra le rette r
1
e r
2
di R
3
denite
rispettivamente da
x 1 =
y 2
3
=
z 2
2
,
x
4
= y =
z
2
.
11. Trovare i massimi relativi ed assoluti (se esistono) delle seguenti fun-
324
zioni:
(i) x
2
(x y), (ii) x
4
+y
4
4xy,
(iii) (x
2
+y
2
)e
x
2
y
2
, (iv) cos x sinh y,
(v) sin(x +y) cos(x y), (vi) x
2
(y 1)
3
(z + 2)
2
,
(vii)
1
x
+
1
y
+
1
z
+xyz (con x, y, z > 0), (viii)
1 +x y
_
1 +x
2
+y
2
,
(ix) cos x + cos y + cos(x +y), (x) xy
_
1 x
2
y
2
,
(xi) x +
y
2
4x
+
x
2
y
+
2
z
(con x, y, z > 0), (xii) e
x3y
e
y+2x
,
(xiii) x
2
log(1 +y) +x
2
y
2
, (xiv) (x
2
+ 3xy
2
+ 2y
4
)
2
,
(xv) 2x
4
x
2
e
y
+e
4y
, (xvi)
x
2
+ 2y
x
2
+y
2
+ 1
.
4.12 Convessit`a
Unimportante propriet`a geometrica degli insiemi di R
m
, che si descrive bene
analiticamente, `e quella della convessit`a.
Denizione 4.12.1 Un sottoinsieme K di R
m
oppure di C
m
si dice convesso
se per ogni coppia di punti u, v K si ha (1t)u+tv K per ogni t [0, 1].
In altre parole: K `e convesso se e solo se, dati due punti di K, il segmento
che li unisce `e interamente contenuto in K.
Ad esempio, sono convesse le palle B(x
0
, r), sia aperte che chiuse. Se K R
`e facile vedere che K `e convesso se e solo se K `e un intervallo (limitato o no,
o eventualmente ridotto a un solo punto).
La nozione di convessit`a si applica anche alle funzioni f : K R, ove K `e
un sottoinsieme convesso di R
m
o di C
m
.
Denizione 4.12.2 Sia K un convesso di R
m
o di C
m
. Una funzione f :
K R si dice convessa se risulta
f ((1 t)u +tv) (1 t)f(u) +tf(v) t [0, 1], u, v K.
La funzione f si dice concava se f `e convessa; dunque f `e concava in K se
e solo se
f ((1 t)u +tv) (1 t)f(u) +tf(v) t [0, 1], u, v K.
325
Linterpretazione geometrica `e la se-
guente: per ogni t [0, 1], il punto
(x, y) R
m+1
di coordinate x = (1
t)u+tv, y = (1t)f(u)+tf(v) appar-
tiene al segmento di estremi (u, f(u),
(v, f(v)); la condizione di convessit`a
dice che il valore f(x) non supera y.
Quindi il graco della restrizione di f al
segmento di estremi u e v sta al di sot-
to della retta che congiunge gli estremi
(u, f(u)) e (v, f(v)) del graco.
Osservazioni 4.12.3 (1) Si vede facilmente che f `e convessa se e solo se il
suo sopragraco
E = (x, y) R
m+1
: x K, y f(x)
`e un insieme convesso. Infatti se f `e convessa e (u, ), (v, ) E, allora per
ogni t [0, 1]
f ((1 t)u +tv) (1 t)f(u) +tf(v) (1 t) +t,
cio`e il punto (1 t)(u, ) + t(v, ) appartiene ad E; dunque E `e convesso.
Viceversa, se E `e convesso allora, scelti in particolare due punti del tipo
(u, f(u)) e (v, f(v)), per ogni t [0, 1] il punto (1 t)(u, f(u)) +t(v, f(v))
deve stare in E: quindi
(1 t)f(u) +tf(v) f ((1 t)u +tv) ,
cio`e f `e convessa.
(2) Una funzione convessa su K `e necessariamente continua nei punti interni
a K (se esistono). Dimostriamo questo fatto per m = 1, rinviando alleserci-
zio 4.12.9 per il caso generale.
Sia dunque K = [a, b] e sia x
0
]a, b[: se ad esempio x > x
0
, esistono unici
t, s ]0, 1[ tali che
x = (1 t)x
0
+tb, x
0
= (1 s)x +sa;
infatti risulta
t =
x x
0
b x
0
, s =
x
0
x
a x
.
326
Dalla denizione di convessit`a si ha
f(x) (1 t)f(x
0
) +tf(b), f(x
0
) (1 s)f(x) +sf(a),
o, equivalentemente,
f(x) f(x
0
) t (f(b) f(x
0
)) , f(x
0
) f(x)
s
1 s
(f(a) f(x
0
)) .
Daltronde, quando x x
+
0
si ha anche t 0
+
e s 0
+
, e quindi f(x)
f(x
0
).
Il discorso `e del tutto analogo se x < x
0
. Ci`o prova la continuit`a di f.
Se la funzione f : K R ha un po pi` u di regolarit`a, si possono dare altre
caratterizzazioni della convessit`a.
Teorema 4.12.4 Sia f una funzione reale dierenziabile, denita su un
insieme convesso K R
m
. Allora f `e convessa se e solo se
f(x) f(x
0
) + gradf(x
0
) (x x
0
) x, x
0
K.
In altre parole, f `e convessa se e solo se
il suo graco sta sopra tutti i suoi piani
(m-dimensionali) tangenti.
Dimostrazione (=) Supponiamo
che valga la disuguaglianza sopra scrit-
ta. Siano x
1
e x
2
due punti distinti di K
e sia x
0
= tx
1
+(1 t)x
2
con t [0, 1].
Posto h = x
1
x
0
, risulta
x
2
=
x
0
tx
1
1 t
= x
0

t
1 t
h.
Dalle relazioni, vere per ipotesi,
f(x
1
) f(x
0
) + gradf(x
0
) h,
f(x
2
) f(x
0
) + gradf(x
0
)
_

t
1 t
h
_
,
segue, moltiplicando la prima per t e sommandola alla seconda moltiplicata
per 1 t:
tf(x
1
) + (1 t)f(x
2
) f(x
0
),
327
che `e la denizione di convessit`a.
(=) Supponiamo f convessa. Siano x, x
0
K. Posto h = x x
0
, per
lipotesi di convessit`a si ha
f(x
0
+th) = f((1 t)x
0
+tx) (1 t)f(x
0
) +tf(x) =
= f(x
0
) +t (f(x
0
+h) f(x
0
)) t [0, 1],
da cui, sempre per t [0, 1],
f(x
0
+th) f(x
0
) t gradf(x
0
) h t (f(x
0
+h) f(x
0
) gradf(x
0
) h) .
Dividendo per t ]0, 1] segue
f(x
0
+th) f(x
0
) t gradf(x
0
) h
t
f(x
0
+h) f(x
0
) gradf(x
0
) h,
e inne dalla dierenziabilit`a, facendo tendere t a 0, si ricava
0 f(x
0
+h) f(x
0
) gradf(x
0
) h,
che `e la tesi.
Teorema 4.12.5 Sia f una funzione reale di classe C
2
, denita su un in-
sieme convesso K R
m
. Allora f `e convessa se e solo se, detta H(x) la
matrice Hessiana di f, la forma quadratica associata (v) = H(x)v v `e
semidenita positiva per ogni x K.
Dimostrazione (=) Supponiamo che sia semidenita positiva per ogni
x K. Poiche f `e di classe C
2
, dal lemma 4.11.3 si ricava
f(x) f(x
0
) gradf(x
0
) (xx
0
) =
1
2
H (x
0
+(x x
0
)) (xx
0
) (xx
0
),
ove `e un opportuno punto fra 0 e 1. Per ipotesi, il secondo membro `e non
negativo per ogni x, x
0
K, e dunque
f(x) f(x
0
) gradf(x
0
) (x x
0
) 0 x, x
0
K.
Dal teorema 4.12.4 segue che f `e convessa.
(=) Viceversa, sia f convessa in K e supponiamo dapprima che K sia
un aperto. Se, per assurdo, in un punto x
0
K la forma (v) non fosse
328
semidenita positiva, esisterebbe un vettore v ,= 0 tale che H(x
0
)v v <
0. Poiche le derivate seconde di f sono continue, ragionando come nella
dimostrazione del teorema 4.11.1 (iii) troveremmo una palla B(x
0
, r) K
tale che
H(x)v v < 0 x B(x
0
, r).
Poniamo
h =
r
2[v[
m
v;
allora h B(0, r), quindi posto x = x
0
+h si ha:
x
0
+(x x
0
) B(x
0
, r) ]0, 1[,
x x
0
=
r
2[v[
m
v,
e pertanto
H (x
0
+(x x
0
)) (x x
0
) (x x
0
) =
=
_
r
2[v[
m
_
2
H (x
0
+(x x
0
)) v v < 0 ]0, 1[.
Ne segue, applicando nuovamente il lemma 4.11.3, che
f(x) f(x
0
) gradf(x
0
) (x x
0
) =
=
1
2
H (x
0
+(x x
0
)) (x x
0
) (x x
0
) < 0,
e per il teorema 4.12.4 ci`o contraddice la convessit`a di f.
Se K non `e aperto, con largomentazione precedente si prova che la forma
H(x)v v `e semidenita positiva per ogni x interno a K. Daltra parte se
x K esiste una successione di punti x
n
interni a K che converge a x; dato
che
H(x
n
)v v 0 v R
m
, n N,
al limite per n si ottiene
H(x)v v 0 v R
m
,
cio`e la forma `e semidenita positiva, In denitiva si ha che la forma `e
semidenita positiva in tutti i punti di K, interni o no.
329
Osservazione 4.12.6 Se m = 1 il teorema precedente vale assumendo so-
lamente lesistenza, e non la continuit`a, della derivata seconda di f. In altre
parole, se f : [a, b] R `e derivabile due volte, allora f `e convessa se e solo
se f

0 in [a, b]. Infatti, se f `e convessa allora dal teorema 4.12.4 segue,


per ogni x, x
0
[a, b],
f(x) f(x
0
) +f

(x
0
)(x x
0
), f(x
0
) f(x) +f

(x)(x
0
x),
e sommando queste due relazioni si deduce
f

(x
0
)(x x
0
) +f

(x)(x
0
x) 0 x, x
0
[a, b],
ossia
(f

(x) f

(x
0
)) (x x
0
) 0 x, x
0
[a, b].
In particolare, se x < x
0
allora f

(x) f

(x
0
), ossia f

`e crescente. Per la
proposizione 4.9.1, ci`o equivale a dire che f

0 in [a, b].
Viceversa, sia f

0 in [a, b], cosicche per la proposizione 4.9.1 f

`e crescente;
allora per il teorema di Lagrange si ha, per un opportuno punto compreso
fra x e x
0
,
f(x) f(x
0
) = f

()(x x
0
).
Pertanto se x > x
0
si ha > x
0
e dunque f

() f

(x
0
), da cui
f(x) f(x
0
) f

(x
0
)(x x
0
);
se invece x < x
0
, si ha < x
0
e dunque f

() f

(x
0
), da cui segue nuova-
mente la precedente disuguaglianza. Dal teorema 4.12.4 segue allora che f `e
convessa in [a, b].
Notiamo che una funzione reale f, di classe
C
2
, denita su [a, b], pu`o cambiare la con-
cavit`a (cio`e passare da concava a convessa o
viceversa) soltanto nei punti in cui f

`e nul-
la. I punti in cui f cambia la concavit`a, nei
quali quindi il graco di f attraversa la retta
tangente, si dicono punti di esso.
Dunque, se f `e di classe C
2
e x
0
`e punto di esso per f, allora f

(x
0
) = 0. Si
noti che il viceversa `e falso: la funzione f(x) = x
4
ha derivata seconda nulla
nel punto 0, eppure `e convessa in R e quindi 0 non `e punto di esso per f.
330
Esercizi 4.12
1. Si provi che esistono funzioni convesse in [a, b] discontinue nei punti
estremi.
2. Sia f : [a, b] R. Si provi che:
(i) f `e convessa se e solo se per ogni u, v, w [a, b] con u < v < w
risulta
f(v)
w v
w u
f(u) +
v u
w u
f(w);
(ii) f `e convessa se e solo se per ogni u, v, w [a, b] con u < v < w
risulta
f(v) f(u)
v u

f(w) f(u)
w u

f(w) f(v)
w v
;
(iii) f `e convessa se e solo se per ogni x [a, b] il rapporto incrementale
h
f(x +h) f(x)
h
, h [a x, 0[]0, b x],
`e una funzione crescente.
3. Se f : [a, b] R `e convessa, si provi che per ogni x ]a, b[ esistono la
derivata destra e la derivata sinistra
D

f(x) = lim
h0

f(x +h) f(x)


h
, D
+
f(x) = lim
h0
+
f(x +h) f(x)
h
;
si verichi che D

f(x) D
+
f(x) e si mostri con un esempio che tali
numeri possono essere diversi fra loro.
4. Sia f : [a, b] R continua. Si provi che f `e convessa se e solo se
f
_
u +v
2
_

1
2
(f(u) +f(v)) u, v [a, b].
[Traccia: una parte dellenunciato `e ovvia. Per laltra, si deduca che
vale la denizione di convessit`a per ogni t della forma k2
h
con h N e
k = 0, 1, . . . , 2
h
; si passi al caso generale t [0, 1] usando la continuit`a.]
331
5. Siano p, q > 1 tali che
1
p
+
1
q
= 1. Si provi che
xy
x
p
p
+
x
q
q
x, y 0.
Traccia: per x, y > 0 si scriva xy = e
log xy
e si sfrutti la convessit`a
della funzione esponenziale.]
6. Sia f : [a, b] R convessa e derivabile. Se ]a, b[ `e un punto tale che
f

() = 0, si provi che `e un punto di minimo assoluto per f in [a, b].


Il punto `e necessariamente unico?
7. Sia f : R R convessa e tale che
lim
x+
f(x) = +, lim
x
f(x) = +.
Si provi che f ha minimo su R. Il punto di minimo `e necessariamente
unico? Che succede se f `e continua ma non convessa?
8. Sia f : K R convessa, ove K R
m
`e un insieme convesso. Provare
che per ogni c R linsieme di sottolivello K
c
= x K : f(x) c,
se non vuoto, `e convesso.
9. Sia f una funzione convessa, denita su un insieme K R
m
convesso.
(i) Sia x
0
un punto interno a K e sia C un cubo m-dimensionale di
centro x
0
e lato 2 contenuto in K; sia poi V linsieme dei 2
m
vertici di C. Posto M = max
vV
f(v), si provi che f(x) M per
ogni x C.
(ii) Se x B(x
0
, ), siano x
0
u i punti a distanza da x
0
sulla retta
per x
0
e x: si provi che, posto t =
1
[x x
0
[
m
, risulta
f(x) tM + (1 t)f(x
0
), f(x
0
)
1
1 +t
(f(x) +tM) .
(iii) Se ne deduca che f `e continua in x
0
.
10. Sia f : [0, [ R una funzione convessa di classe C
1
, con f

(0) > 0.
Si provi che f(x) + per x +, e che esiste nito il limite
lim
x+
x
f(x)
.
332
11. (Disuguaglianza di Jensen) Sia f : R R una funzione convessa. Si
provi che per ogni n N
+
e per ogni x
1
, x
2
, . . . , x
n
R risulta
f
_
x
1
+x
2
+. . . +x
n
n
_

f(x
1
) +f(x
2
) +. . . +f(x
n
)
n
.
[Traccia: si provi dapprima la disuguaglianza per n = 2
k
; nel caso
generale si ponga m = 2
k
n: per quanto gi`a dimostrato si ha
f
_
x
1
+x
2
+. . . +x
n
+mx
2
k
_

f(x
1
) +f(x
2
) +. . . +f(x
n
) +mf(x)
2
k
per ogni x
1
, . . . , x
n
, x R. Si scelga x =
x
1
+...+xn
n
.]
12. Tracciare un graco qualitativo delle seguenti funzioni, considerando
linsieme di denizione A, i limiti alla frontiera di A, la crescenza, la
convessit`a, i punti di massimo e di minimo relativo, i punti di esso,
gli asintoti, il valore di f

nei punti limite e nei punti di esso:


(i) [[x
3
[ 1[, (ii)
[x + 3[
3
x
2
, (iii)
2[x[ x
2
+x
x + 1
,
(iv) e
x

x 1, (v)
_
x
2

8
x
, (vi)
_
5 +
1
x
2
_
2

8
x
3
,
(vii)
_
[x
2
10x[, (viii)
log x
1 + log x
, (ix) x
2/3
(x 1)
1/3
,
(x) log
x
2
[x
2
+ 2[
, (xi) x e
1
log x
, (xii) log x log
2
x,
(xiii) e
x(log |x|1)
, (xiv) e
x
x1
, (xv) maxx
2
, 5x 4,
(xvi) arccos
1
1 x
, (xvii) x
1
x
1
, (xviii) x + 4 arctan
_
[x 1[,
(xix)
_
[x[ 1
x
2
+ 1
, (xx) sin

x
2
+ 1
, (xxi) log(x + sin x),
(xxii)
[1 log x[
x
, (xxiii) e
1/x
, (xxiv) x + arcsin
2x
x
2
+ 1
.
333
Capitolo 5
Calcolo integrale
5.1 Lintegrale
Sia f : [a, b] R una funzione limitata. Vogliamo determinare larea con
segno della regione del piano xy delimitata dal graco di f e dallasse x,
considerando cio`e positiva larea della parte sopra lasse x e negativa larea
della parte sotto lasse x. Esplicitamente, considereremo positiva larea della
regione
(x, y) R
2
: x [a, b], f(x) 0, y [0, f(x)],
e negativa larea della regione
(x, y) R
2
: x [a, b] : f(x) 0, y [f(x), 0].
Prima di tutto, per`o, oc-
correr`a dare un senso a ci`o
che si vuole calcolare: riu-
sciremo a denire larea del-
le regioni sopra descritte per
mezzo di un procedimento
di approssimazione della re-
gione che ci interessa me-
diante unioni nite di ret-
tangoli adiacenti (per i qua-
li larea `e quella elemen-
tarmente denita: base per
altezza).
334
Il primo passo da compiere a questo scopo `e quello di introdurre la nozione
di suddivisione dellintervallo [a, b].
Denizione 5.1.1 Una suddivisione, o partizione, dellintervallo [a, b] `e un
insieme nito di punti = x
0
, x
1
, . . . , x
N
tale che
a = x
0
< x
1
< . . . < x
N1
< x
N
= b.
I punti x
i
si dicono nodi della suddivisione .
Gli intervalli [x
i1
, x
i
], delimitati da due nodi consecutivi di una ssata sud-
divisione di [a, b], saranno le basi dei rettangoli che useremo per le nostre
approssimazioni.
Date due suddivisioni

di [a, b], diciamo che

`e pi` u ne di

se si ha

, cio`e se

si ottiene da

aggiungendo altri nodi. Naturalmente, in


generale, data una coppia di suddivisioni

, nessuna delle due sar`a pi` u -


ne dellaltra: pensiamo per esempio a

= a,
a+b
2
, b e

= a,
2a+b
3
,
a+2b
3
, b.
Per`o, ssate

, `e sempre possibile trovare una terza suddivisione che


`e pi` u ne di entrambe: basta prendere =

.
Esempio 5.1.2 Le pi` u semplici suddivisioni di [a, b] sono quelle equispazia-
te: per N N
+
ssato, si ha

N
= x
i
, 0 i N, ove x
i
= a +
i
N
(b a);
in particolare, se N = 1 si ha la suddivisione banale
1
= a, b.
Introduciamo adesso le nostre aree approssimate per eccesso e per difetto.
Denizione 5.1.3 Sia f : [a, b] R limitata. La somma superiore di f
relativa alla suddivisione di [a, b] `e il numero
S(f, ) =
N

i=1
M
i
(x
i
x
i1
), ove M
i
= sup
[x
i1
,x
i
]
f.
La somma inferiore di f relativa alla suddivisione di [a, b] `e il numero
s(f, ) =
N

i=1
m
i
(x
i
x
i1
), ove m
i
= inf
[x
i1
,x
i
]
f.
335
Osserviamo che S(f, ) e s(f, ) sono numeri reali ben deniti grazie al fatto
che stiamo supponendo f limitata: altrimenti qualcuno fra i numeri M
i
o m
i
potrebbe essere innito.
Ci aspettiamo che inttendo sempre di pi` u i nodi, le somme superiori ed in-
feriori forniscano una approssimazione sempre pi` u accurata dellarea della
regione che ci interessa. E in eetti si ha:
Proposizione 5.1.4 Sia f : [a, b] R una funzione limitata. Se

sono suddivisioni di [a, b], e `e una terza suddivisione pi` u ne di entrambe,


allora
s(f,

) s(f, ) S(f, ) S(f,

).
Dimostrazione La disuguaglianza centrale `e evidente, per denizione di
somma superiore e inferiore. Proviamo la prima (la terza `e analoga). Il pas-
saggio da

a consiste nellaggiungere un numero nito di nuovi nodi, il che


si pu`o vedere come una sequenza nita di aggiunte di un singolo nodo. Dun-
que baster`a provare che se si ottiene da

= x
0
, x
1
, . . . , x
N
aggiungendo
il nodo x ]x
k1
, x
k
[, allora s(f,

) s(f, ). La quantit`a a secondo mem-


bro si ottiene da quella al primo membro rimpiazzandone il k-simo addendo
m
k
(x
k
x
k1
) con i due addendi
inf
[x
k1
,x]
f (x x
k1
) + inf
[x,x
k
]
f (x
k
x);
daltra parte, per denizione di m
k
si ha
m
k
inf
[x
k1
,x]
f, m
k
inf
[x,x
k
]
f,
e quindi
m
k
(x
k
x
k1
) = m
k
(x
k
x +x x
k1
)
inf
[x
k1
,x]
f (x x
k1
) + inf
[x,x
k
]
f (x
k
x),
336
da cui s(f,

) s(f, ).
Il fatto che le approssimazioni migliorino sempre quando si inttiscono i nodi
ci porta a denire le approssimazioni ottimali per eccesso e per difetto
dellarea che ci interessa.
Denizione 5.1.5 Sia f : [a, b] R una funzione limitata. L integrale
superiore di f su [a, b] `e il numero
I
+
(f) = inf

S(f, ).
L integrale inferiore di f su [a, b] `e il numero
I

(f) = sup

s(f, ).
Osservazione 5.1.6 Gli integrali superiore ed inferiore di f sono numeri
reali ben deniti, e si ha
inf
[a,b]
f (b a) I

(f) I
+
(f) sup
[a,b]
f (b a).
Infatti, indicata con
1
la suddivisione banale a, b, per la proposizione
precedente si ha, per qualunque coppia di suddivisioni

,
inf
[a,b]
f (b a) = s(f,
1
) s(f,

) S(f,

) S(f,
1
) = sup
[a,b]
f (b a),
da cui la tesi passando allestremo superiore rispetto a

e allestremo infe-
riore rispetto a

.
Arrivati a questo punto, sarebbe bello che le approssimazioni ottimali per
eccesso e per difetto coincidessero: questo ci permetterebbe di denire in
modo non ambiguo larea (con segno) della regione
(x, y) R
2
: x [a, b], f(x) 0, y [0, f(x)]
(x, y) R
2
: x [a, b], f(x) 0, y [f(x), 0].
Sfortunatamente, in generale si ha I

(f) < I
+
(f), come mostra il seguente
337
Esempio 5.1.7 Si consideri la funzione di Dirichlet
(x) =
_
1 se x [0, 1] Q,
0 se x [0, 1] Q.
Questa funzione, il cui graco non `e disegnabile, `e limitata in [0, 1] e per ogni
suddivisione = x
0
, x
1
, . . . , x
N
di [0, 1] si ha, in virt` u della densit`a in R di
Q e di R Q:
m
k
= inf
[x
k1
,x
k
]
= 0, M
k
= sup
[x
k1
,x
k
]
= 1, k = 1, . . . , N;
quindi per ogni suddivisione si ha s(, ) = 0, S(, ) = 1 e pertanto
I

() = 0, I
+
() = 1.
La nostra procedura di approssimazione non `e quindi applicabile a tutte le
funzioni limitate, ma soltanto a quelle che vericano la propriet`a descritta
nella seguente fondamentale denizione.
Denizione 5.1.8 Sia f : [a, b] R una funzione limitata. Diciamo che f
`e integrabile secondo Riemann in [a, b], e scriveremo f 1(a, b), se risulta
I

(f) = I
+
(f).
In tal caso, l integrale di f su [a, b] `e il numero reale I

(f) = I
+
(f), che si
indicher`a con il simbolo
_
b
a
f(x)dx:
_
b
a
f(x) dx = I

(f) = I
+
(f).
Il senso di questo simbolo `e quello di ricordarci che si fa il limite di somme
nite (da cui il segno
_
, che `e una S stilizzata) di aree di rettangolini,
la cui base `e un intervallo dellasse x centrato nel punto x di ampiezza pic-
colissima pari a dx, e la cui altezza `e un intervallo dellasse y di lunghezza
pari a [f(x)[, presa col segno di f(x).
Come si `e visto, esistono funzioni limitate non integrabili: sorge quindi le-
sigenza di determinare esempi, e possibilmente intere classi, di funzioni inte-
grabili; analizzeremo questo problema nel paragrafo 5.3.
Prima di tutto conviene fornire un criterio di integrabilit`a di grande utilit`a,
che segue direttamente dalla denizione.
338
Proposizione 5.1.9 Sia f : [a, b] R una funzione limitata: f `e integrabile
secondo Riemann in [a, b] se e solo se per ogni > 0 esiste una suddivisione
di [a, b] tale che
S(f, ) s(f, ) < .
Dimostrazione (=) Fissato > 0, per denizione di estremo superiore
ed estremo inferiore esistono due suddivisioni

di [a, b] tali che


_
b
a
f(x) dx

2
< s(f,

)
_
b
a
f(x) dx S(f,

) <
_
b
a
f(x) dx +

2
;
scelta allora una suddivisione pi` u ne di

, si ha per la proposizione
5.1.4
_
b
a
f(x) dx

2
< s(f, )
_
b
a
f(x) dx S(f, ) <
_
b
a
f(x) dx +

2
,
e ci`o implica la tesi.
(=) Fissato > 0 e scelta una suddivisione come nellipotesi, si ha
0 I
+
(f) I

(f) S(f, ) s(f, ) < ,


da cui I
+
(f) = I

(f) per larbitrariet`a di .


Si noti che il criterio precedente permette di stabilire se una funzione `e inte-
grabile, ma non d`a informazioni su quanto valga il suo integrale: il problema
del calcolo esplicito degli integrali verr`a arontato pi` u avanti (paragrafo 5.5).
Dimostriamo adesso unimportante caratterizzazione dellintegrabilit`a che ha
interesse sia teorico che pratico. Premettiamo una denizione:
Denizione 5.1.10 Data una suddivisione = x
0
, x
1
, . . . , x
N
di [a, b],
l ampiezza di `e il numero
[[ = max
1iN
(x
i
x
i1
).
`
E chiaro che se

`e una suddivisione pi` u ne di , allora risulta [

[ [[; il
viceversa naturalmente non `e vero (se
3
e
4
sono suddivisioni equispaziate
con 3 e 4 nodi rispettivamente, allora [
4
[ < [
3
[ ma nessuna delle due `e pi` u
ne dellaltra).
339
Teorema 5.1.11 Sia f : [a, b] R una funzione limitata. Si ha f 1(a, b)
se e solo se esiste un numero reale A dotato della propriet`a seguente: per ogni
> 0 si pu`o trovare un > 0 tale che
[[ < = [S(f, ) A[ < , [s(f, ) A[ < .
In tal caso, si ha A =
_
b
a
f(x) dx.
Dimostrazione (=) Fissato > 0, dallipotesi segue per ogni suddivisione
con [[ <
0 S(f, ) s(f, ) [S(f, ) A[ +[A s(f, )[ < 2,
e quindi f `e integrabile in virt` u della proposizione 5.1.9; inoltre, scelta una
suddivisione con [[ < , avremo
[I
+
(f) A[ [I
+
(f) S(f, )[ +[S(f, ) A[ < 2,
da cui A = I
+
(f) =
_
b
a
f(x) dx.
(=) Poiche f `e integrabile, ssato > 0 esiste una suddivisione
0
=
x
0
, x
1
, . . . , x
N
di [a, b] tale che
_
b
a
f(x) dx

2
< s(f,
0
) S(f,
0
) <
_
b
a
f(x) dx +

2
.
Poniamo K = sup
[a,b]
[f[ e ssiamo =

4NK
. Sia = t
0
, t
1
, . . . , t
m
una
qualunque suddivisione di [a, b] tale che [[ < . Supponiamo (per semplicit`a)
che nessun nodo x
j
di
0
coincida con qualcuno dei nodi t
i
di . Consideriamo
gli insiemi
A = i 1, . . . , m : ]t
i1
, t
i
[ non contiene alcun nodo x
j
,
B = i 1, . . . , m : ]t
i1
, t
i
[ contiene almeno un nodo x
j
,
e osserviamo che B ha al pi` u N elementi. Consideriamo poi la suddivisione

=
0
, i cui nodi sono i t
i
e gli x
j
: tali nodi delimitano intervalli del tipo
[t
i1
, t
i
] (quando lindice i appartiene ad A), oppure dei tipi [t
i1
, x
j
], [x
j
, t
i
]
ed eventualmente [x
j
, x
j+1
] (quando lindice i appartiene a B). Denotiamo
con I
ij
gli intervalli corrispondenti ad indici i B, indicando con
ij
la loro
340
ampiezza (per ogni i B ce ne sar`a un certo numero nito k
i
); poniamo
inoltre
M
i
= sup
[t
i1
, t
i
]
f, M
ij
= sup
I
ij
f.
Si ha allora
S(f,

) =

iA
M
i
(t
i
t
i1
) +

iB
k
i

j=1
M
ij

ij
.
Daltra parte, gli intervalli I
ij
con i B ssato e j = 1, . . . , k
i
ricoprono
[t
i1
, t
i
]: quindi

iB
k
i

j=1
M
ij

ij

iB
K(t
i
t
i1
) K

iB
KN =

4
,
da cui

iA
M
i
(t
i
t
i1
) = S(f,

iB
k
i

j=1
M
ij

ij
S(f,

) +

4
.
Pertanto possiamo scrivere
S(f, ) =

iA
M
i
(t
i
t
i1
) +

iB
M
i
(t
i
t
i1
)
S(f,

) +

4
+

iB
K(t
i
t
i1
) S(f,

) +

2

S(f,
0
) +

2

_
b
a
f(x) dx +.
In modo analogo si prova che
s(f, )
_
b
a
f(x) dx ,
e quindi il numero A =
_
b
a
f(x) dx verica la condizione richiesta.
Corollario 5.1.12 Sia f : [a, b] R una funzione limitata. Si ha f
1(a, b) se e solo se per ogni > 0 esiste N
+
tale che
S(f,
N
) s(f,
N
) < N ,
ove
N
`e la suddivisione equispaziata con nodi x
k
= a +
k
N
(b a), k =
0, 1, . . . , N.
341
Dimostrazione (=) La tesi segue dal teorema 5.1.11 quando [
N
[ =
ba
N
<
.
(=) Fissato > 0, dallipotesi si deduce, scelto N ,
I
+
(f) I

(f) S(f,
N
) s(f,
N
) < ,
e dunque I
+
(f) = I

(f).
Osservazione 5.1.13 Dal corollario precedente segue che in eetti per ca-
ratterizzare lintegrale di Riemann sono sucienti le suddivisioni equispazia-
te, e si ha
_
b
a
f(x) dx = lim
N
S(f,
N
) = lim
N
s(f,
N
) f 1(a, b).
Di conseguenza, se per ogni i = 1, . . . , N si ssa a piacere un numero t
i

[x
i1
, x
i
], la quantit`a
N

i=1
f(t
i
)(x
i
x
i1
),
che `e detta somma di Riemann di f, converge a
_
b
a
f(x) dx per N , gra-
zie al teorema dei carabinieri (esercizio 2.1.19). Su questo fatto si basano le
pi` u semplici formule di quadratura per il calcolo approssimato degli integrali.
Esercizi 5.1
1. Si provi che
_
b
a
x dx =

2
(b
2
a
2
),
_
b
a
x
2
dx =

3
(b
3
a
3
).
2. (Teorema della media) Si provi che se f 1(a, b), allora
inf
[a,b]
f
1
b a
_
b
a
f(x) dx sup
[a,b]
f,
e che se f `e anche continua in [a, b] allora esiste [a, b] tale che
f() =
1
b a
_
b
a
f(x) dx.
342
3. Sia f 1(a, b) e sia g una funzione che dierisce da f soltanto in
un numero nito di punti di [a, b]. Si provi che g 1(a, b) e che gli
integrali di f e di g in [a, b] coincidono. Che succede se f e g dieriscono
su un insieme numerabile x
n
, n N [a, b]?
4. Utilizzando solo la denizione di (denizione 1.12.6), dedurre che
_
1
1

1 x
2
dx =

2
.
[Traccia: si verichi che la met`a
dellarea del poligono regolare di 2n
lati inscritto nel cerchio di raggio
1 `e compresa fra s(

1 x
2
,
n
) e
S(

1 x
2
,
n
), ove
n
`e la suddi-
visione di [1, 1] i cui nodi sono le
proiezioni sullasse x dei vertici del
poligono.]
5. Sia f una funzione limitata in [a, b], tale che [f[ 1(a, b); `e vero che
f 1(a, b)?
5.2 Propriet`a dellintegrale
Lintegrabilit`a `e una propriet`a stabile rispetto alle operazioni algebriche fra
funzioni. Per provare questo fatto, `e utile introdurre la nozione di oscilla-
zione di una funzione in un intervallo.
Denizione 5.2.1 Sia f : [a, b] R una funzione limitata. Se I `e un
intervallo contenuto in [a, b], l oscillazione di f in I `e il numero reale
osc(f, I) = sup
I
f inf
I
f.
Osservazioni 5.2.2 (1) Il criterio di integrabilit`a espresso nella proposizio-
ne 5.1.9 si pu`o riformulare nel modo seguente: f `e integrabile in [a, b] se e
solo se per ogni > 0 esiste una suddivisione = x
0
, x
1
, . . . , x
N
di [a, b]
tale che
N

i=1
osc(f, [x
i1
, x
i
]) (x
i
x
i1
) < .
343
(2) Anche la denizione di continuit`a di una funzione (denizione 3.2.3) pu`o
essere espressa tramite loscillazione. Si ha in eetti che f `e continua in un
punto x
0
[a, b] se e solo se, posto I

= [x
0
, x
0
+] [a, b], risulta
lim
0
+
osc(f, I

) = 0.
(3) Si verica facilmente che se f, g sono funzioni limitate in [a, b] e `e un
numero reale, allora per ogni intervallo I [a, b] si ha, come conseguenza
dellesercizio 3.2.11,
osc(f +g, I) osc(f, I) + osc(g, I), osc(f, I) = [[osc(f, I).
Dallultima delle osservazioni precedenti si deduce la linearit`a dellintegrale:
Proposizione 5.2.3 Siano f, g 1(a, b) e sia R. Allora f + g, f
1(a, b) e
_
b
a
(f +g)(x) dx =
_
b
a
f(x) dx+
_
b
a
g(x) dx,
_
b
a
(f)(x) dx =
_
b
a
f(x) dx.
Dimostrazione Poiche f e g sono integrabili, ssato > 0 esistono due
suddivisioni

di [a, b] tali che


S(f,

) s(f,

) < , S(g,

) s(g,

) < .
Scelta unaltra suddivisione pi` u ne di entrambe, si ha a maggior ragione
(proposizione 5.1.4)
S(f, ) s(f, ) < , S(g, ) s(g, ) < ,
da cui, per losservazione 5.2.2(3),
S(f +g, ) s(f +g, ) =
N

i=1
osc(f +g, [x
i1
, x
i
]) (x
i
x
i1
)

i=1
osc(f, [x
i1
, x
i
]) (x
i
x
i1
) +
N

i=1
osc(g, [x
i1
, x
i
]) (x
i
x
i1
) =
= S(f, ) s(f, ) +S(g, ) s(g, ) < 2,
mentre
S(f, ) s(f, ) = [[[S(f, ) s(f, )] < [[.
344
Ne segue che f +g e f sono integrabili. Adesso notiamo che
_
b
a
(f +g)(x) dx
_
b
a
f(x) dx
_
b
a
g(x) dx
S(f +g, ) s(f, ) s(g, )
S(f, ) +S(g, ) s(f, ) s(g, ) < 2,
_
b
a
(f +g)(x) dx
_
b
a
f(x) dx
_
b
a
g(x) dx
s(f +g, ) S(f, ) S(g, )
s(f, ) +s(g, ) S(f, ) S(g, ) > 2,
il che ci fornisce la maggiorazione

_
b
a
(f +g)(x) dx
_
b
a
f(x) dx
_
b
a
g(x) dx

< 2 > 0,
ossia
_
b
a
(f +g)(x) dx =
_
b
a
f(x) dx +
_
b
a
g(x) dx.
Similmente, osservando che
S(f, ) =
_
S(f, ) se 0
s(f, ) se 0,
s(f, ) =
_
s(f, ) se 0
S(f, ) se 0,
`e immediato dedurre che, qualunque sia R,

_
b
a
(f)(x) dx
_
b
a
f(x) dx

< [[ > 0,
e che quindi
_
b
a
(f)(x) dx =
_
b
a
f(x) dx R.
Utilizzando le propriet`a delloscillazione, si ottiene anche la seguente
Proposizione 5.2.4 Siano f, g 1(a, b). Si ha:
345
(i) f g 1(a, b);
(ii) se inf
[a,b]
[g[ > 0, allora
f
g
1(a, b);
(iii) f g, f g 1(a, b), ove f g(x) = maxf(x), g(x), f g(x) =
minf(x), g(x).
Dimostrazione Si rimanda agli esercizi 5.2.1, 5.2.2 e 5.2.3.
Unaltra importante propriet`a dellintegrale `e la sua monotonia:
Proposizione 5.2.5 Siano f, g 1(a, b). Se si ha f(x) g(x) per ogni
x [a, b], allora
_
b
a
f(x) dx
_
b
a
g(x) dx.
Dimostrazione Basta notare che, per ipotesi, per ogni suddivisione di
[a, b] si ha
s(f, ) s(g, ),
e poi passare allestremo superiore rispetto a .
Corollario 5.2.6 Se f 1(a, b), allora [f[ 1(a, b) e

_
b
a
f(x) dx

_
b
a
[f(x)[ dx.
Dimostrazione Si verica facilmente che [f(x)[ = f(x) 0 f(x) 0 per
ogni x [a, b]; quindi [f[ 1(a, b) per la proposizione 5.2.4. Essendo poi
[f(x)[ f(x) [f(x)[, per monotonia (proposizione 5.2.5) si ottiene

_
b
a
[f(x)[ dx
_
b
a
f(x) dx
_
b
a
[f(x)[ dx,
da cui la tesi.
Proviamo inne ladditivit`a dellintegrale rispetto allintervallo di integrazio-
ne:
Proposizione 5.2.7 Sia f : [a, b] R una funzione limitata e sia c ]a, b[
un punto ssato. Allora
f 1(a, b) f 1(a, c) 1(c, b),
e in tal caso
_
b
a
f(x) dx =
_
c
a
f(x) dx +
_
b
c
f(x) dx.
346
Dimostrazione La dimo-
strazione `e ovvia, se si pen-
sa al signicato geometri-
co dellintegrale come area
con segno. Per una dimo-
strazione formale si rimanda
allesercizio 5.2.5.
Per i discorsi che seguiranno, `e utile dare senso allintegrale
_
b
a
f(x) dx anche
nel caso in cui a b.
Denizione 5.2.8 Sia f una funzione reale denita in un intervallo [c, d].
(i) Se a [c, d], poniamo
_
a
a
f(x) dx = 0.
(ii) Se a, b [c, d] con a > b, poniamo (notando che f 1(b, a) grazie alla
proposizione precedente)
_
b
a
f(x) dx =
_
a
b
f(x) dx.
Lutilit`a di questa convenzione sta nel seguente risultato di additivit`a:
Proposizione 5.2.9 Sia f 1(a, b). Allora
_
v
u
f(x) dx =
_
w
u
f(x) dx +
_
v
w
f(x) dx u, v, w [a, b].
Dimostrazione Si tratta di una noiosa ma facile verica che fa uso del-
la proposizione precedente e consiste nellanalizzare tutti i possibili casi:
u < v < w, v < w < u, w < u < v, u < w < v, v < u < w, w < v < u,
u = v, v = w, u = w.
Anche il risultato di monotonia espresso dal corollario 5.2.6 pu`o essere pre-
cisato alla luce della convenzione sopra descritta:
Corollario 5.2.10 Sia f 1(a, b). Allora

_
v
u
f(x) dx

_
v
u
[f(x)[ dx

u, v [a, b].
347
Dimostrazione Se u < v, il secondo membro `e
_
v
u
[f(x)[ dx e la tesi segue
dal corollario 5.2.6. Se u = v la disuguaglianza si riduce a 0 0, quindi `e
vera. Se u > v, il primo membro coincide con

_
u
v
f(x) dx

mentre il secondo
diventa
_
u
v
[f(x)[dx, e quindi ci si riduce al primo caso gi`a provato.
Osservazione 5.2.11 Sia A un sottoinsieme di R. La funzione
I
A
(x) =
_
1 se x A
0 se x / A
si chiama funzione caratteristica, o indicatrice, di A. Se A`e limitato, e se [a, b]
`e un qualunque intervallo contenente A, la funzione I
A
pu`o essere integrabile
secondo Riemann in [a, b] oppure no, come mostra lesempio 5.1.7. Se A `e un
intervallo [c, d], `e immediato vericare che I
A
1(a, b) e che
_
b
a
I
A
dx = dc.
Questo suggerisce un modo per attribuire una misura a una vasta classe
di sottoinsiemi limitati di R: quelli la cui corrispondente funzione indicatrice
`e integrabile, e che potremo chiamare insiemi misurabili. In altre parole, se
A `e limitato, se [a, b] A e se I
A
1(a, b), deniamo la misura di A come
segue:
m(A) =
_
b
a
I
A
dx.
Dato che I
A
`e nulla fuori di A, `e chiaro che questa denizione non dipende
dalla scelta dellintervallo [a, b]. Dalle propriet`a dellintegrale segue imme-
diatamente che m() = 0, che m `e additiva sugli insiemi misurabili disgiunti
(ossia m(A B) = m(A) + m(B)), e che in particolare m `e monotona (cio`e
m(A) m(B) se A B).
Esercizi 5.2
1. Si provi che se f, g 1(a, b) allora fg 1(a, b).
[Traccia: si verichi che
osc(fg, I) osc(f, I) sup
I
[g[ + osc(g, I) sup
I
[f[.]
2. Si provi che se f, g 1(a, b) e inf
[a,b]
[g[ = m > 0, allora
f
g
1(a, b).
[Traccia: grazie allesercizio precedente, basta provare la tesi quando
f 1; si provi che osc(1/g, I)
1
m
2
osc(g, I).]
348
3. Si verichi che per ogni f, g : [a, b] R si ha
f g = g + (f g) 0, f g = f +g f g;
dedurne che se f, g 1(a, b) allora f g, f g 1(a, b).
[Traccia: si osservi che basta vericare che f 0 1(a, b), e si provi
che risulta osc(f 0, I) osc(f, I).]
4. Se A `e un sottoinsieme di R
m
o di C
m
, una funzione f : A R
si dice lipschitziana (dal nome del matematico tedesco Lipschitz) se
esiste L > 0 tale che
[f(x) f(y)[ L[x y[
m
x, y A
(il pi` u piccolo numero L che soddisfa la denizione si chiama costante
di Lipschitz di f). Si provi che se f 1(a, b) e : R R `e una
funzione lipschitziana, allora f 1(a, b).
[Traccia: si provi che osc( f, I) L osc(f, I).]
5. Dimostrare la proposizione 5.2.7.
6. Si calcoli, se esiste, la misura dellinsieme
A =

_
n=0
[2
2n1
, 2
2n
[.
7. Dimostrare che linsieme ternario di Cantor (esercizio 3.1.22) `e misu-
rabile, e calcolarne la misura.
5.3 Alcune classi di funzioni integrabili
Utilizzando il criterio fornito dalla proposizione 5.1.9 si determina facilmente
una prima importante classe di funzioni integrabili: quella delle funzioni
monotone.
Teorema 5.3.1 Sia f : [a, b] R una funzione monotona. Allora f `e
integrabile su [a, b].
349
Dimostrazione Osserviamo anzitutto che f `e limitata, in quanto dalla
monotonia segue
f(x) [f(a), f(b)] se f `e crescente, f(x) [f(b), f(a)] se f `e decrescente.
Consideriamo le suddivisioni equispaziate
N
, con nodi x
i
= a +
i
N
(b a)
(esempio 5.1.2). Supponendo ad esempio f crescente, si ha
S(f,
N
) =
N

i=1
f(x
i
)(x
i
x
i1
), s(f,
N
) =
N

i=1
f(x
i1
)(x
i
x
i1
),
cosicche
S(f,
N
) s(f,
N
) =
N

i=1
[f(x
i
) f(x
i1
)](x
i
x
i1
) =
=
N

i=1
[f(x
i
) f(x
i1
)]
b a
N
= [f(b) f(a)]
b a
N
.
Quindi, ssato > 0, il criterio di integrabilit`a (proposizione 5.1.9) `e soddi-
sfatto se si sceglie N abbastanza grande.
Uniforme continuit`a
Il nostro prossimo obiettivo `e quello di dimostrare lintegrabilit`a delle funzioni
continue su un intervallo compatto. A questo scopo conviene introdurre la
nozione di uniforme continuit`a, la quale, come suggerisce il nome, `e una
propriet`a pi` u restrittiva della continuit`a.
Ricordiamo che se A `e un sottoinsieme di R
m
(oppure di C
m
) e f : A R `e
una funzione, dire che f `e continua in A signica che
x
0
A, > 0 > 0 : [f(x) f(x
0
)[ < x A con [xx
0
[
m
< .
Denizione 5.3.2 Sia A un sottoinsieme di R
m
(o di C
m
) e sia f : A R
una funzione. Diciamo che f `e uniformemente continua in A se
> 0 > 0 : [f(x) f(x
0
)[ < x A, x
0
A con [xx
0
[
m
< .
350
Come si vede, nella denizione di uniforme continuit`a si `e spostata la stringa
x
0
A dallinizio alla ne della frase. Questo fa s` che il numero di
cui si prescrive lesistenza sia sottoposto ad una richiesta pi` u forte: esso deve
garantire che sia [f(x) f(x
0
)[ < non solo per ogni x vicino ad un ssato
punto x
0
, ma per ogni coppia di punti x, x
0
fra loro vicini, in qualunque parte
di A essi si trovino. In denitiva: il numero deve dipendere da , ma non
da x
0
.
La denizione di uniforme continuit`a si esprime bene facendo intervenire
loscillazione di f (denizione 5.2.1): f `e uniformemente continua in A se e
solo se per ogni > 0 esiste > 0 tale che risulti
osc(f, B) = sup
B
f inf
B
f
per ogni palla B A che abbia raggio non superiore a , ovunque si trovi il
suo centro.
Esempi 5.3.3 (1) Siano A = [0, [ e f(x) = x
2
. Per ogni intervallo I
a
=
[a, a +] si ha
osc(f, I
a
) = (a +)
2
a
2
= 2a +
2
;
dunque f, pur essendo continua in [0, [, non `e uniformemente continua in
tale semiretta in quanto, ssato > 0 e comunque preso > 0, risulta, per
valori di a sucientemente grandi,
osc(f, I
a
) = 2a +
2
.
(2) Ogni funzione lipschitziana in un insieme A `e uniformemente continua
in A: dato > 0, basta scegliere = /L, ove L `e la costante di Lipschitz di
f. In particolare, le funzioni f : R R derivabili con derivata limitata sono
uniformemente continue, in quanto per il teorema di Lagrange esse risultano
lipschitziane con costante L sup
R
[f

[. Si noti che in generale le funzioni


appartenenti a C
1
(R) non sono ne lipschitziane ne uniformemente continue,
come mostra lesempio della funzione f(x) = x
2
.
Luniforme continuit`a di una funzione f si pu`o interpretare geometricamente
nel modo seguente: si consideri un rettangolo R, di base 2 ed altezza 2,
centrato in un punto del graco di f; si ha continuit`a uniforme se per qua-
lunque > 0 vi `e una base > 0 tale che, facendo scorrere il rettangolo R
lungo il graco di f, il graco non intersechi mai i due lati orizzontali del
rettangolo.
351
Come abbiamo visto, non tutte le funzioni continue sono uniformemente
continue; tuttavia vale il seguente importante risultato:
Teorema 5.3.4 (di Heine-Cantor) Sia f una funzione reale, denita su
un sottoinsieme compatto A di R
m
o di C
m
. Se f `e continua in A, allora f
`e uniformemente continua in A.
Dimostrazione Supponiamo per assurdo che f non sia uniformemente con-
tinua in A: allora, negando la denizione 5.3.2, troviamo che esiste > 0
tale che, qualunque sia > 0, possiamo determinare due punti x, x
0
A che
vericano [x x
0
[
m
< , ma [f(x) f(x
0
)[
m
. Scegliendo allora = 1/k,
con k N
+
, per ogni k troveremo x
k
, x

k
A tali che
[x
k
x

k
[
m
<
1
k
, [f(x
k
) f(x

k
)[ .
Le due successioni x
k
e x

k
cos` costruite sono costituite da punti del
compatto A. Per denizione di insieme compatto (osservazione 3.1.20), esiste
una sottosuccessione x
kn
x
k
che converge ad un punto x A; la
corrispondente sottosuccessione x

kn
x

k
converge anchessa a x, dato
che [x
kn
x

kn
[
m
< 1/k
n
0 per n . Ma allora, essendo f continua nel
punto x, si deve avere f(x
kn
) f(x) e f(x

kn
) f(x) per n , il che `e
assurdo perche [f(x
kn
) f(x

kn
)[ per ogni n.
Osservazione 5.3.5 Il teorema di Heine-Cantor vale se A `e compatto, ossia
limitato e chiuso (teorema 3.1.19 e osservazione 3.1.20): il risultato `e falso
se A non `e limitato, come mostra lesempio 5.3.3 (1), ed anche se A non `e
chiuso, come mostra lesempio della funzione f(x) = 1/x, x ]0, 1] (si veda
lesercizio 5.3.4).
Integrabilit`a delle funzioni continue
Proviamo ora lintegrabilit`a delle funzioni continue su un intervallo [a, b].
Notiamo che ogni funzione continua f : [a, b] R `e necessariamente limitata
352
(per il teorema di Weierstrass) e uniformemente continua (per il teorema di
Heine-Cantor).
Teorema 5.3.6 Ogni funzione continua f : [a, b] R `e integrabile in [a, b].
Dimostrazione Sia > 0. Poiche f `e uniformemente continua, esiste > 0
tale che
x, x

[a, b], [x x

[ < = [f(x) f(x

)[ <

b a
.
Prendiamo, per ogni N N
+
, le suddivisioni equispaziate
N
i cui nodi sono
x
i
= a +
i
N
(b a), i = 0, 1, . . . , N. Se scegliamo N >
ba

, avremo
x
i
x
i1
=
b a
N
< , i = 1, . . . , N.
Valutiamo la quantit`a S(f,
N
) s(f,
N
): si ha
S(f,
N
) s(f,
N
) =
N

i=1
_
max
[x
i1
,x
i
]
f min
[x
i1
,x
i
]
f
_
(x
i
x
i1
) =
=
N

i=1
[f(
i
) f(
i
)]
b a
N
,
ove
i
e
i
sono rispettivamente punti di massimo e di minimo per f nel-
lintervallo [x
i1
, x
i
]. Poiche, ovviamente, [
i

i
[ x
i
x
i1
< , avremo
f(
i
) f(
i
) <

ba
, e dunque
S(f,
N
) s(f,
N
) <
N

i=1

b a

b a
N
= N >
b a

.
Per la proposizione 5.1.9 si conclude che f `e integrabile in [a, b].
Osservazione 5.3.7 Pi` u in generale, risultano integrabili in [a, b] le funzioni
che sono limitate in [a, b] e continue salvo che in un numero nito di punti
x
1
, . . . , x
k
[a, b]. La dimostrazione di questo fatto, benche formalmente
un po pesante, non `e aatto dicile, e per essa si rimanda allesercizio 5.3.5
La classe 1(a, b) `e considerevolmente ampliata dal seguente risultato:
353
Teorema 5.3.8 Sia f 1(a, b) e poniamo M = sup
[a,b]
f, m = inf
[a,b]
f. Se
: [m, M] R `e una funzione continua, allora f 1(a, b).
Dimostrazione Fissato > 0, sia ]0, [ tale che
t, s [m, M], [t s[ < = [(t) (s)[ < ;
tale esiste poiche `e uniformemente continua in [m, M] in virt` u del teorema
di Heine-Cantor.
Poiche f 1(a, b), esiste una suddivisione = x
0
, x
1
, . . . , x
N
di [a, b] tale
che
S(f, ) s(f, ) <
2
.
Posto I
i
= [x
i1
, x
i
], consideriamo gli insiemi
A = i 1, . . . , N : osc(f, I
i
) < ,
B = i 1, . . . , N : osc(f, I
i
) .
Si ha allora, posto K = sup
[m,M]
[[,
osc( f, I
i
) < i A, osc( f, I
i
) 2K i B,
Quindi

iB
(x
i
x
i1
)

iB
osc(f, I
i
)(x
i
x
i1
) S(f, ) s(f, ) <
2
ovvero

iB
(x
i
x
i1
) < .
Da ci`o segue
S( f, ) s( f, ) =
=

iA
osc( f, I
i
)(x
i
x
i1
) +

iB
osc( f, I
i
)(x
i
x
i1
)
(b a) + 2K < (b a + 2K),
cio`e la tesi.
354
Esercizi 5.3
1. Sia f : R R una funzione continua, e supponiamo che f abbia
asintoti obliqui per x . Provare che f `e uniformemente continua
in R.
2. Esibire una funzione f : R R limitata e di classe C

, ma non
uniformemente continua su R.
3. Si provi che [x

[ [x y[

per ogni x, y 0 e per ogni [0, 1];


se ne deduca che se [0, 1[ la funzione f(x) = x

`e uniformemente
continua in [0, [, ma non `e lipschitziana in tale semiretta.
4. Si provi che per ogni > 0 la funzione f(x) = x

non `e uniformemente
continua in ]0, 1].
5. Dimostrare che ogni funzione limitata in [a, b], e continua salvo che in
un numero nito di punti, `e integrabile in [a, b].
5.4 Il teorema fondamentale del calcolo inte-
grale
Se f `e una funzione integrabile secondo Riemann in un intervallo [a, b], sap-
piamo dalla proposizione 5.2.7 che si ha anche f 1(a, x) per ogni x [a, b].
Quindi possiamo denire la funzione
F(x) =
_
x
a
f(t) dt, x [a, b],
che si chiama funzione integrale della f. Si noti, di passaggio, che non `e
lecito scrivere
_
x
a
f(x) dx: la variabile di integrazione non va confusa con gli
estremi dellintervallo di integrazione, esattamente come nelle sommatorie si
scrive

n
k=0
a
k
e non

n
n=0
a
n
.
Analizziamo le propriet`a della funzione integrale F.
Proposizione 5.4.1 Se f 1(a, b), allora la sua funzione integrale F `e
continua, anzi lipschitziana, in [a, b], e risulta F(a) = 0.
355
Dimostrazione Ovviamente F(a) =
_
a
a
f(x) dx = 0. Proviamo che F `e
lipschitziana (esempio 5.3.3 (2)). Siano x, x

[a, b] con, ad esempio, x < x

:
per la proposizione 5.2.9 ed il corollario 5.2.10 si ha
[F(x) F(x

)[ =

_
x
a
f(t) dt
_
x

a
f(t) dt

_
x
x

f(t) dt

_
x
x

[f(t)[ dt

;
scelta la suddivisione banale
1
= x, x

dellintervallo I = [x, x

], si ottiene,
per denizione di integrale,
[F(x) F(x

)[

_
x
x

[f(t)[ dt

S([f[,
1
) = sup
I
[f[ [x x

[.
Ne segue la tesi.
Teorema 5.4.2 (teorema fondamentale del calcolo integrale) Sia f
una funzione continua in [a, b]. Allora la sua funzione integrale F `e derivabile
in [a, b] e si ha
F

(x) = f(x) x [a, b].


Dimostrazione Fissiamo x
0
[a, b]. Per ogni x [a, b] x
0
consideriamo
il rapporto incrementale di F in x
0
:
F(x) F(x
0
)
x x
0
=
1
x x
0
_
x
x
0
f(t) dt.
Poiche f `e continua in x
0
, ssato > 0 esister`a > 0 tale che
[t x
0
[ < = [f(t) f(x
0
)[ < .
Quindi possiamo scrivere (essendo
_
x
x
0
c dt = c(x x
0
) per ogni costante c)
F(x) F(x
0
)
x x
0
=
1
x x
0
_
x
x
0
[f(t) f(x
0
) +f(x
0
)] dt =
=
1
x x
0
_
x
x
0
[f(t) f(x
0
)] dt +f(x
0
).
Se ora x x
0
, il primo termine allultimo membro `e innitesimo: infatti non
appena [x x
0
[ < avremo, per la monotonia dellintegrale,

1
x x
0
_
x
x
0
[f(t) f(x
0
)] dt


1
[x x
0
[

_
x
x
0
[f(t) f(x
0
)[ dt

1
[x x
0
[

_
x
x
0
dt

= .
356
Pertanto
lim
xx
0
F(x) F(x
0
)
x x
0
= f(x
0
) x
0
[a, b],
e ci`o prova la tesi.
Osservazioni 5.4.3 (1) La continuit`a di f `e essenziale nel teorema prece-
dente: vedere lesercizio 5.4.1.
(2) Nella dimostrazione precedente in eetti si `e provato un risultato pi` u
preciso: se f 1(a, b) e f `e continua in un punto x
0
, allora F `e derivabile
in quel punto, con F

(x
0
) = f(x
0
).
Perche il teorema fondamentale del calcolo integrale ha questo nome? Perche,
come presto scopriremo, per mezzo di esso `e possibile calcolare una gran
quantit`a di integrali: gi`a questo lo rende un teorema basilare. Ma la sua
importanza `e ancora maggiore per il fatto che esso mette in relazione fra
loro lintegrale e la derivata, cio`e due operazioni i cui signicati geometrici
sembrano avere ben poca relazione fra di loro: il calcolo di unarea delimitata
da un graco e la nozione di retta tangente a tale graco. In realt`a, in un
certo senso, lintegrazione e la derivazione sono due operazioni luna inversa
dellaltra.
Per capire meglio come stanno le cose, `e necessario introdurre la nozione di
primitiva di una data funzione.
Denizione 5.4.4 Sia f : [a, b] R una funzione qualunque. Diciamo
che una funzione G : [a, b] R `e una primitiva di f se G `e derivabile in
[a, b] e se risulta G

(x) = f(x) per ogni x [a.b]. Linsieme delle primitive


di una funzione f si chiama integrale indenito di f e si indica talvolta
con lambiguo simbolo
_
f(x) dx (il quale quindi rappresenta un insieme di
funzioni e non una singola funzione).
Non tutte le funzioni sono dotate di primitive (esercizio 5.4.1); per`o, se ne
esiste una allora ne esistono innite: infatti se G `e una primitiva di f, allora
G + c `e ancora una primitiva di f per ogni costante c R. Daltra parte,
sappiamo dal teorema fondamentale del calcolo integrale che ogni funzione f
continua su [a, b] ha una primitiva: la sua funzione integrale F.
Corollario 5.4.5 Se f `e continua in [a, b] e G `e unarbitraria primitiva di
f, allora si ha
_
y
x
f(t) dt = G(y) G(x) x, y [a, b].
357
Dimostrazione Sia F(x) =
_
x
a
f(t) dt la funzione integrale di f. Allora si
ha F

= G

= f in [a, b], e in particolare (F G)

= 0 in [a, b]. Quindi F G


`e una funzione costante in [a, b] (proposizione 4.3.4), ossia esiste c R tale
che G(x) = F(x) +c per ogni x [a, b]. Ne segue
G(y) G(x) = F(y) F(x) =
_
y
x
f(t) dt x, y [a, b].
Osservazioni 5.4.6 (1) Si suole scrivere [G(t)]
y
x
in luogo di G(y) G(x).
(2) La dimostrazione precedente mostra, pi` u in generale, che se f ha una
primitiva F, allora ogni altra primitiva G di f `e della forma G(x) = F(x)+c:
in altre parole, se F `e una assegnata primitiva di f si ha
_
f(x) dx = F +c, c R.
Dunque per calcolare lintegrale
_
y
x
f(t) dt occorre determinare una primitiva
G di f (per poi calcolarla negli estremi dellintervallo), il che corrisponde
essenzialmente a fare loperazione inversa della derivazione. Per questa ope-
razione non ci sono purtroppo ricette prestabilite, come invece accade per
il calcolo delle derivate: vi sono funzioni continue molto semplici, quali ad
esempio e
x
2
oppure
sin x
x
, le cui primitive (che esistono, per il teorema fon-
damentale del calcolo integrale) non sono esprimibili in termini di funzioni
elementari; il che, peraltro, non impedisce di calcolarne gli integrali con qua-
lunque precisione prestabilita, utilizzando formule di quadratura o scrivendo
le primitive come somme di opportune serie di potenze.
`
E utile a questo punto riportare la seguente tabella di primitive note:
358
integrando primitiva
x
p
(p ,= 1)
x
p+1
p + 1
x
1
log [x[
e
x
( ,= 0)
e
x

cos x sin x
sin x cos x
cosh x sinh x
sinh x cosh x
integrando primitiva

n=0
a
n
x
n

n=0
1
n + 1
a
n
x
n+1
1
1 +x
2
arctan x
1

1 x
2
arcsin x
1

1 +x
2
log
_
x +

1 +x
2
_
1
cos
2
x
tan x
1
sin
2
x

1
tan x
Esercizi 5.4
1. Si consideri la funzione segno di x, denita da
f(x) = sgn(x) =
_
_
_
1 se 0 < x 1
0 se x = 0
1 se 1 x < 0.
(i) Si calcoli
_
x
0
f(t) dt per ogni x [1, 1].
(ii) Si provi che f non ha primitive in [1, 1].
2. Provare che esistono funzioni f discontinue in R, ma dotate di primitive.
[Traccia: posto F(x) = x sin(1/x) per x ,= 0 e F(0) = 0, si verichi
che F `e derivabile e si prenda f = F

.]
3. Si dica sotto quali ipotesi si ha:
(i)
d
dx
_
x
a
f(t) dt = f(x), (ii)
_
x
a
f

(t) dt = f(x) f(a).


359
4. Sia f una funzione continua in R.
(i) Si provi che se e sono funzioni derivabili su R, allora
d
dx
_
(x)
(x)
f(t) dt = f((x))

(x) f((x))

(x) x R.
(ii) Calcolare
d
dx
_
2x
x
f(t) dt,
d
dx
_
x
2
x
f(t) dt,
d
dx
sin
__
3
x
2
x
f(t) dt
_
.
[Traccia: si tratta di derivare opportune funzioni composte.]
5. Sia f una funzione continua e non negativa in [a, b]. Si provi che se
_
b
a
f(x) dx = 0, allora f 0 in [a, b], e che la conclusione `e falsa se si
toglie una qualunque delle ipotesi.
6. Sia f : R R continua e tale che f(x) R per x . Si provi
che
lim
x
1
x
_
x
0
f(t) dt = .
7. Determinare le primitive delle funzioni arcsin x, arctan x, settsinh x.
8. Sia f : R R una funzione periodica di periodo T > 0, cio`e tale che
f(x + T) = f(x) per ogni x R. Provare che se f 1(0, T) allora
f 1(a, a +T) per ogni a R e
_
a+T
a
f(t) dt =
_
T
0
f(t) dt a R.
5.5 Metodi di integrazione
Non esiste una procedura standard per il calcolo delle primitive e quindi degli
integrali. I metodi che esporremo adesso servono a trasformare gli integrali
(e non a calcolarli), naturalmente con la speranza che dopo la trasformazione
lintegrale risulti semplicato e calcolabile.
360
Integrazione per parti
Il metodo di integrazione per parti nasce come conseguenza della formula per
la derivata di un prodotto: poiche
D(f(x)g(x)) = f

(x)g(x) +f(x)g

(x),
avremo
f

(x)g(x) = D(f(x)g(x)) f(x)g

(x),
cosicche, integrando i due membri su [a, b], si ottiene per ogni coppia di
funzioni f, g C
1
[a, b] la seguente formula di integrazione per parti:
_
b
a
f

(x)g(x) dx = [f(x)g(x)]
b
a

_
b
a
f(x)g

(x) dx.
Con questa formula, lintegrale
_
b
a
f

(x)g(x) dx si trasforma nellintegrale


_
b
a
f(x)g

(x) dx: se sappiamo calcolare questo, sapremo calcolare anche lal-


tro.
Esempi 5.5.1 (1) Consideriamo lintegrale
_
b
a
x sin x dx. Si ha, con f

(x) =
sin x e g(x) = x,
_
b
a
x sin xdx = [x(cos x)]
b
a

_
b
a
1 (cos x) dx = [x cos x + sin x]
b
a
,
e in particolare una primitiva di x sin x `e x cos x + sin x. In modo analogo
si calcola lintegrale
_
b
a
x cos xdx.
(2) Per il calcolo di
_
b
a
x
2
e
x
dx si ha, con f

(x) = e
x
, g(x) = x
2
,
_
b
a
x
2
e
x
dx =
_
x
2
e
x

b
a

_
b
a
2xe
x
dx =
(con unaltra integrazione per parti)
=
_
x
2
e
x
2xe
x

b
a
+ 2
_
b
a
e
x
dx =
_
x
2
e
x
2xe
x
+ 2e
x

b
a
,
e in particolare una primitiva di x
2
e
x
`e (x
2
2x + 2)e
x
.
361
(3) Calcoliamo
_
b
a
e
x
cos xdx. Si ha, con f

(x) = e
x
e g(x) = cos x,
_
b
a
e
x
cos xdx = [e
x
cos x]
b
a
+
_
b
a
e
x
sin xdx =
(integrando nuovamente per parti)
= [e
x
cos x +e
x
sin x]
b
a

_
b
a
e
x
cos xdx;
quindi
2
_
b
a
e
x
cos xdx = [e
x
cos x +e
x
sin x]
b
a
,
e inne
_
b
a
e
x
cos xdx =
1
2
[e
x
cos x +e
x
sin x]
b
a
.
In particolare, una primitiva di e
x
cos x `e
1
2
e
x
(cos x+sin x). Si noti che strada
facendo abbiamo indirettamente calcolato anche
_
b
a
e
x
sin xdx =
1
2
[e
x
cos x +e
x
sin x]
b
a
.
Osserviamo inoltre che avremmo potuto anche integrare per parti prendendo
g(x) = e
x
e f

(x) = cos x.
(4) Per lintegrale
_
b
a

1 x
2
dx notiamo prima di tutto che deve essere
[a, b] [1, 1] anche lintegrando sia ben denito. Si ha, con f

(x) = 1 e
g(x) =

1 x
2
,
_
b
a

1 x
2
dx =
_
x

1 x
2
_
b
a
+
_
b
a
x
2

1 x
2
dx =
=
_
x

1 x
2
_
b
a
+
_
b
a
x
2
1 + 1

1 x
2
dx =
=
_
x

1 x
2
_
b
a

_
b
a

1 x
2
dx +
_
b
a
1

1 x
2
dx;
quindi
2
_
b
a

1 x
2
dx =
_
x

1 x
2
_
b
a
+
_
b
a
1

1 x
2
dx =
_
x

1 x
2
+ arcsin x
_
b
a
362
e inne
_
b
a

1 x
2
dx =
1
2
_
x

1 x
2
+ arcsin x
_
b
a
.
In particolare, una primitiva di

1 x
2
`e
1
2
_
x

1 x
2
+ arcsin x

.
In modo analogo si pu`o calcolare lintegrale
_
b
a

1 +x
2
dx.
Osservazione 5.5.2 Se [a, b] = [1, 1], dallultimo degli esempi precedenti
segue
_
1
1

1 x
2
dx =
1
2
(arcsin 1 arcsin(1)) =

2
;
questa `e larea del semicerchio unitario, in accordo con la denizione del
numero (denizione 1.12.6). Si osservi che abbiamo ritrovato il risultato
dellesercizio 5.1.4.
Integrazione per sostituzione
Il metodo di integrazione per sostituzione `e glio della formula che fornisce
la derivata delle funzioni composte: poiche
D(g (x)) = g

((x))

(x),
scegliendo g(y) =
_
y
a
f(t) dt (con f funzione continua in [a, b]) si ha, per il
teorema fondamentale del calcolo integrale,
D
_
(x)
a
f(t) dt = f((x))

(x),
e quindi
_
v
u
f((x))

(x) dx =
_
_
(x)
a
f(t) dt
_
v
u
=
_
(v)
a
f(t) dt
_
(u)
a
f(t) dt.
Pertanto si ottiene per ogni coppia di funzioni f C[a, b], C
1
[c, d], con
a valori in [a, b], la seguente formula di integrazione per sostituzione:
_
v
u
f((x))

(x) dx =
_
(v)
(u)
f(t) dt u, v [c, d].
363
Il signicato `e il seguente: la variabile x [c, d] dellintegrale di sinistra
viene sostituita dalla variabile t [a, b] nellintegrale di destra, mediante
il cambiamento di variabile t = (x); le lunghezze innitesime dx e dt
sono legate dalla relazione dt =

(x)dx, la quale `e coerente col fatto che da


t = (x) segue
dt
dx
=

(x).
La formula di integrazione per sostituzione si pu`o leggere al contrario: se
: [c, d] [a, b] `e invertibile, si ha
_

1
(q)

1
(p)
f((x))

(x) dx =
_
q
p
f(t) dt p, q [a, b].
Si noti che, in realt`a, anche sia valida questa formula non `e aatto neces-
sario che sia invertibile: se u, v, w, z sono punti di [c, d] tali che (u) =
(w) = p, (v) = (z) = q (dunque non `e iniettiva), si ha
_
v
u
f((x))

(x) dx =
_
_
(x)
a
f(t) dt
_
v
u
=
_
(v)
(u)
f(t) dt =
_
q
p
f(t) dt =
=
_
(z)
(w)
f(t) dt =
_
_
(x)
a
f(t) dt
_
z
w
=
_
z
w
f((x))

(x) dx.
Esempi 5.5.3 (1) Nellintegrale
_
b
a
x
3

1 +x
2
dx poniamo x
2
= t, da cui
dt = 2xdx: si ha allora
_
b
a
x
3

1 +x
2
dx =
_
b
2
a
2
1
2
t

1 +t dt =
1
2
_
b
2
a
2
(t + 1 1)

1 +t dt =
=
1
2
_
b
2
a
2
_
(1 +t)
3/2
(1 +t)
1/2
_
dt =
1
2
_
2
5
(1 +t)
5/2

2
3
(1 +t)
3/2
_
b
2
a
2
=
=
1
2
_
2
5
(1 +x
2
)
5/2

2
3
(1 +x
2
)
3/2
_
b
a
.
(2) Nellintegrale
_
b
a
e

x
dx bisogna supporre [a, b] ]0, +[, in modo che
lintegrando sia ben denito e limitato. Posto

x = t, da cui dt =
1
2

x
dx, si
ha
_
b
a
e

x
dx =
_

b

a
2e
t
dt =
_
2e
t

a
=
_
2e

x
_
b
a
.
(3) Sappiamo gi`a calcolare lintegrale
_
1
0

1 x
2
dx (esempio 5.5.1 (4)), ma
ora useremo un altro metodo. Qui leggiamo la formula di integrazione per
364
sostituzione al contrario: poniamo x = sin t, da cui dx = cos t dt; quando x
descrive [0, 1], si ha t [0, /2], oppure t [/2, ], o anche t [, 5/2] (e
innite altre scelte sono possibili): se si `e scelto per la variabile t lintervallo
[0, /2], si ottiene
_
1
0

1 x
2
dx =
_
/2
0
_
1 sin
2
t cos t dt =
(essendo cos t > 0 in [0, /2])
=
_
/2
0
cos
2
t dt = (integrando per parti)
=
1
2
[t sin t cos t]
/2
0
=

4
.
Se invece scegliamo per la t lintervallo [/2, ], otteniamo la stessa cosa:
_
1
0

1 x
2
dx =
_
/2

_
1 sin
2
t cos t dt =
(essendo cos t < 0 in [/2, ])
=
_
/2

(cos
2
t) dt =
_

/2
cos
2
t dt =

4
.
Il lettore pu`o vericare per suo conto, prestando attenzione al segno di cos t,
che anche scegliendo per la t lintervallo [, 5/2] il risultato dellintegrazione
`e lo stesso.
(4) Nellintegrale
_
b
a

1 +x
2
dx poniamo x = sinh t, da cui dx = cosh t dt, e
ricordiamo che la funzione inversa del seno iperbolico `e settsinh x = log(x +

1 +x
2
), x R. Si ha allora
_
b
a

1 +x
2
dx =
_
settsinh b
settsinh a
cosh
2
t dt;
con due integrazioni per parti si ottiene
_
b
a

1 +x
2
dx =
1
2
[t + sinh t cosh t]
settsinh b
settsinh a
=
1
2
_
settsinh x +x

1 +x
2
_
b
a
.
In modo analogo si calcola lintegrale
_
b
a

x
2
1 dx, sempre che si abbia
[a, b]] 1, 1[= .
Nellesercizio 5.5.7 si fornisce una giusticazione dei nomi seno iperbolico,
coseno iperbolico e settore seno iperbolico.
365
Esercizi 5.5
1. Calcolare i seguenti integrali ([x] denota la parte intera di x):
_
11
4
[x] dx,
_
1
1
max
_
x,

x
1
2

_
dx,
_
5
10
x[x[ dx,
_
8
5
[[x] +x[ dx,
_

minsin x, cos x dx,


_
6
0
(x
2
[x
2
]) dx.
2. Calcolare
_
10
10
f(x) dx, ove
f(x) =
_

_
3 se x [10, 7]
1 se x ] 7, 1]
10 se x ]1, 5[
1000 se x = 5
8 se x ]5, 10].
3. Determinare larea della regione piana delimitata da:
(i) la retta y = x e la parabola y = x
2
;
(ii) le parabole y
2
= 9x e x
2
= 9y;
(iii) lellisse
x
2
9
+ 4y
2
= 1;
(iv) le rette y = x, y = x, y = 2x 5.
4. Calcolare le primitive di x
n
e
x
per ogni n N.
5. Calcolare i seguenti integrali
_
/2
/2
cos
2
9xdx,
_
/2
/2
sin
2
10xdx,
_
/4
0
tan x dx,
_
0
3
2
x
dx,
_
100
1
log x
x
dx,
_

0
sin x cos xdx,
_
10
0
x + 2
1 +x
2
dx,
_
2
0
8
x/3
dx.
366
6. Si provi che se m, n N
+
si ha
_

cos mx sin nxdx = 0,


_

cos mx cos nxdx =


_

sin mx sin nx dx =
_
0 se m ,= n
se m = n.
7. (i) Siano O = (0, 0), A = (1, 0) e P = (cos t, sin t). Si provi, calcolando
un opportuno integrale, che larea del settore circolare OAP della
gura a sinistra `e uguale a t/2.
(ii) Sia inoltre Q = (cosh t, sinh t). Si provi, analogamente, che larea
del settore iperbolico OAQ della gura a destra `e pari a t/2.
8. Provare che se f `e una funzione continua in [a, b] si ha
_
x
a
__
t
a
f(s) ds
_
dt =
_
x
a
(x s)f(s) ds.
9. Provare che se f 1(0, a) si ha
_
a
0
f(t) dt =
_
a
0
f(a t) dt,
e utilizzando questo risultato si calcoli lintegrale
_

0
x sin x
1 + cos
2
x
dx.
367
10. Sia

n=0
a
n
x
n
una serie di potenze con raggio di convergenza R > 0.
Provare che la serie `e integrabile termine a termine in ogni intervallo
[a, b] contenuto in ] R, R[, cio`e che risulta
_
b
a

n=0
a
n
x
n
dx =

n=0
_
b
a
a
n
x
n
dx =

n=0
_
1
n + 1
a
n
x
n+1
_
b
a
.
11. Calcolare i seguenti integrali:
_
3
2
2x + 1
3x 1
dx,
_
1
0
dx
x
2
+x + 1
,
_
1
0
sinh
2
xdx,
_
/2
/4
dx
sin x
,
_
1
0

e
x
1 dx,
_
1
1/2
x log
2
xdx,
_
e
1

x log xdx,
_
1
1
e
e
x
+x
dx,
_
1
0
x arctan x
2
dx,
_
1
0
x arctan
2
xdx,
_
10
0
x
2
(1 +x
2
)
2
dx,
_
4
3
sin log xdx,
_
1
0
e
x
2
e
x
+ 1
dx,
_
2
2
x
7
cosh
3
x
4
dx,
_
2e
e
log log x
x
dx.
12. Dimostrare che se f `e una funzione continua e non negativa in [a, b],
allora
lim
n
__
b
a
f(x)
n
dx
_
1/n
= max
[a,b]
f.
13. Sia f : [a, b] R una funzione di classe C
m+1
. Si esprima il resto di
Taylor in forma integrale, ossia si dimostri che per ogni x, x
0
[a, b] si
ha
f(x) =
m

n=0
1
n!
f
(n)
(x
0
)(x x
0
)
n
+
_
x
x
0
(x t)
m
m!
f
(m+1)
(t) dt.
[Traccia: per x [a, b] ssato si consideri la funzione
g(t) = f(x)
m

n=0
1
n!
f
(n)
(t)(x t)
n
, t [a, b],
e si applichi la formula g(x) g(x
0
) =
_
x
x
0
g

(t) dt.]
368
14. Posto I
n
=
_
/2
0
sin
n
xdx, si provi che
I
n
=
n 1
n
I
n2
n 2;
se ne deduca che
I
2n
=
(2n 1)!!
(2n)!!

2
n N
+
, I
2n+1
=
(2n)!!
(2n + 1)!!
n N,
ove k!! denota il prodotto di tutti i numeri naturali non superiori a k
aventi la stessa parit`a di k.
15. (i) Sia f
n
una successione di funzioni integrabili secondo Riemann
su [a, b]. Provare che se esiste una funzione f : [a, b] R tale che
lim
n
sup
x[a,b]
[f
n
(x) f(x)[ = 0,
allora
lim
n
_
b
a
f
n
(x) dx =
_
b
a
f(x) dx.
(ii) Si verichi che
lim
n
_
1
0
nx
n
dx ,=
_
1
0
lim
n
nx
n
dx.
Come mai?
16. (Irrazionalit`a di ) Si consideri lintegrale
I
n
=
2
n!
_
2
0
_

2
4
t
2
_
n
cos t dt, n N.
(i) Si verichi che I
n
> 0 per ogni n N.
(ii) Si provi per induzione che I
n+1
= (4n + 2)I
n

2
I
n1
per ogni
n N
+
.
(iii) Se ne deduca che I
n
= P
n
(
2
), ove P
n
`e un opportuno polinomio,
di grado al pi` u n, a coecienti interi.
(iv) Supposto per assurdo che
2
sia un razionale della forma p/q, si
provi che q
n
P
n
(
2
) Z
+
e che, daltra parte, lim
n
q
n
I
n
= 0.
369
(v) Si concluda che `e irrazionale.
17. (Irrazionalit`a di , bis) Supposto che risulti =
p
q
, con p, q Q
+
, si
consideri per ogni n N il polinomio
P
n
(x) =
x
n
(p qx)
n
n!
.
(i) Si verichi che P
n
(x) > 0 per ogni x ]0, [.
(ii) Si mostri che D
k
P
n
(0) e D
k
P
n
() sono numeri interi per ogni k N.
(iii) Posto a
n
=
_

0
P
n
(x) sin xdx, si osservi che 0 < a
n
<
C
n
n!
per ogni
n N, ove C `e unopportuna costante;
(iv) integrando 2n volte per parti, si provi che a
n
Z per ogni n N,
ottenendo cos` un assurdo.
5.6 Formula di Stirling
La formula di Stirling `e una stima che descrive in modo molto preciso il
comportamento asintotico della successione n!
nN
, e che `e di grande im-
portanza sia teorica che applicativa. La sua dimostrazione, non banale ma
nemmeno troppo dicile, richiede luso di molti degli strumenti del calcolo
che abbiamo n qui analizzato. Naturalmente, il risultato espresso dalla for-
mula di Stirling implica quello dellesempio 2.7.10(3) e, a maggior ragione,
quello degli esercizi 1.6.16 e 4.3.14.
Teorema 5.6.1 (formula di Stirling) Risulta

2n
_
n
e
_
n
e
1
12(n+1)
< n! <

2n
_
n
e
_
n
e
1
12n
n N
+
.
Dimostrazione Dividiamo largomentazione in quattro passi.
1
o
passo Proviamo che esiste A > 0 tale che
A

n
_
n
e
_
n
e
1
12(n+1)
< n! < A

n
_
n
e
_
n
e
1
12n
n N
+
,
cosicche, in particolare
lim
n
n!

n
_
n
e
_
n
= A.
370
Consideriamo a questo scopo la successione
a
n
=
n!

n
_
e
n
_
n
, n N
+
,
e osserviamo anzitutto che, come `e immediato vericare,
a
n
a
n+1
=
1
e
_
1 +
1
n
_
n+
1
2
n N
+
.
Daltra parte, ricordando lesercizio 4.3.8, si ha
log
_
1 +
1
n
_
n+
1
2
=
_
n +
1
2
_
log
_
1 +
1
n
_
=
=
2n + 1
2
log
n + 1
n
=

k=0
1
2k + 1
1
(2n + 1)
2k
.
Ne segue (esempio 2.2.6 (1))
1+
1
3
1
(2n + 1)
2
< log
_
1 +
1
n
_
n+
1
2
< 1+
1
3

k=1
1
(2n + 1)
2k
= 1+
1
3
1
(2n+1)
2
1
1
(2n+1)
2
,
e dunque
e
1+
1
3
1
4n
2
+4n+1
<
_
1 +
1
n
_
n+
1
2
< e
1+
1
3
1
4n
2
+4n
;
in particolare, essendo 4(n + 1)(n + 2) > 4n
2
+ 4n + 1, otteniamo
e
1+
1
12(n+1)(n+2)
<
_
1 +
1
n
_
n+
1
2
< e
1+
1
12n(n+1)
.
Questa doppia diseguaglianza pu`o essere riscritta nella forma
e
1
12(n+1)
e
1
12(n+2)
<
a
n
a
n+1
<
e
1
12n
e
1
12(n+1)
.
Ci`o mostra che la successione a
n
e

1
12(n+1)
`e strettamente decrescente (oltre
che limitata, essendo positiva) e quindi ha limite A 0, mentre la successione
a
n
e

1
12n
`e strettamente crescente e converge necessariamente allo stesso
371
limite A, visto che e
1
12n
1: in particolare risulta A > 0 e si ha, come si
voleva,
Ae
1
12(n+1)
< a
n
< Ae
1
12n
n N
+
.
Per denizione di a
n
, ci`o prova il 1
o
passo.
2
o
passo Proviamo la relazione

2
= lim
n
(2n)!!
2
(2n + 1)!!(2n 1)!!
.
Consideriamo la successione
_
_
/2
0
sin
m
xdx
_
mN
: si verica agevolmente
(esercizio 5.5.14) che
_
/2
0
sin
m
xdx =
m1
m
_
/2
0
sin
m2
xdx m 2,
e da questa uguaglianza segue induttivamente, sempre per lesercizio 5.5.14,
_
/2
0
sin
2n
xdx =
(2n 1)!!
(2n)!!

2
n N
+
,
_
/2
0
sin
2n+1
xdx =
(2n)!!
(2n + 1)!!
n N.
Quindi, dividendo la prima equazione per la seconda e rimaneggiando i
termini, si ottiene

2
=
(2n)!!
2
(2n + 1)!!(2n 1)!!
_
/2
0
sin
2n
xdx
_
/2
0
sin
2n+1
xdx
n N
+
.
Daltra parte risulta per ogni n N
+
1 <
_
/2
0
sin
2n
xdx
_
/2
0
sin
2n+1
xdx
=
2n + 1
2n
_
/2
0
sin
2n
xdx
_
/2
0
sin
2n1
xdx

2n + 1
2n
= 1 +
1
2n
,
il che implica

2
= lim
n
(2n)!!
2
(2n + 1)!!(2n 1)!!
_
/2
0
sin
2n
xdx
_
/2
0
sin
2n+1
xdx
= lim
n
(2n)!!
2
(2n + 1)!!(2n 1)!!
.
372
Ci`o prova il 2
o
passo.
3
o
passo Dimostriamo che

= lim
n
2
2n
(n!)
2
(2n)!

n
.
Dal 2
o
passo deduciamo

2
= lim
n
2
2
4
2
. . . (2n 2)
2
(2n)
2
3
2
5
2
. . . (2n 1)
2
(2n + 1)
= lim
n
2
2
4
2
. . . (2n 2)
2
2n
3
2
5
2
. . . (2n 1)
2
,
e dunque

= lim
n

2
2 4 . . . (2n 2)

2n
3 5 . . . (2n 1)
=
= lim
n

2
2
2
4
2
. . . (2n 2)
2
(2n)
2
(2n)!

2n
= lim
n
2
2n
(n!)
2
(2n)!

n
.
Il 3
o
passo `e provato.
4
o
passo Concludiamo la dimostrazione: Dal 1
o
passo abbiamo
A = lim
n
n!

n
_
e
n
_
n
;
daltronde risulta, come `e facile vericare,
2
2n
(n!)
2
(2n)!

n
=
a
2
n
a
2n

2
,
e pertanto dai passi 3 e 1 segue

= lim
n
a
2
n
a
2n

2
=
A

2
,
ovvero A =

2.
Il 1
o
passo implica allora la validit`a della formula di Stirling.
Esercizi 5.6
1. Si calcoli
lim
n
n! e
n+
1
12n
n
n+
1
2
.
373
2. Di quante cifre `e formato (in base 10) il numero 1000! ?
[Traccia: detto N il numero di cifre cercato, si osservi che deve essere
10
N1
1000! < 10
N
e si faccia uso della formula di Stirling nonche di
una buona calcolatrice...]
5.7 Integrali impropri
La teoria dellintegrazione secondo Riemann si riferisce a funzioni limitate
su intervalli limitati di R. Se manca una di queste condizioni, si deve pas-
sare ai cosiddetti integrali impropri. Ci limiteremo a considerare tre casi:
(i) lintegrale su un intervallo limita-
to di funzioni non limitate (ad
esempio:
_
1
0
log xdx);
(ii) lintegrale su intervalli non limitati
di funzioni limitate (ad esempio:
_

0
e
x
dx);
(iii) le due cose insieme, ossia lin-
tegrale su intervalli non limita-
ti di funzioni non limitate (ad
esempio:
_

0
e

x
dx).
Denizione 5.7.1 (i) Sia f :]a, b] R tale che f 1(c, b) per ogni c
374
]a, b[. Se esiste il limite (nito o innito)
lim
ca
+
_
b
c
f(x) dx,
esso viene detto integrale improprio di f su [a, b] e indicato col simbolo
_
b
a
f(x) dx; in tal caso la funzione f viene detta integrabile in senso
improprio su [a, b]. Se lintegrale improprio di f `e nito, la funzioen f
si dice sommabile in [a, b].
(ii) Sia f : [a, [R tale che f 1(a, c) per ogni c > a. Se esiste il limite
(nito o innito)
lim
c
_
c
a
f(x) dx,
esso viene detto integrale improprio di f su [a, [ e indicato col simbolo
_

a
f(x) dx; in tal caso la funzione f viene detta integrabile in senso
improprio su [a, [. Se lintegrale improprio di f `e nito, la funzione
f si dice sommabile su [a, [.
In entrambi i casi (i) e (ii), lintegrale improprio di f, se esiste, si dice
convergente o divergente a seconda che sia nito o innito.
Modiche opportune di questa denizione permettono di trattare i casi in cui
f ha una singolarit`a nel punto b, anziche in a, oppure `e denita su ] , a],
anziche su [a, [.
Tutto questo riguarda i casi (i) e (ii). Per il caso (iii), ci limitiamo a dire
che lintegrale andr`a spezzato in due integrali di tipo (i) e (ii), e che esso
avr`a senso se e solo se: (a) hanno senso entrambi i gli integrali, e (b) ha
senso farne la somma. Ad esempio, lintegrale
_

0
e

x
dx va inteso come
_
b
0
e

x
dx+
_

b
e

x
dx, ove b `e un arbitrario numero positivo; naturalmente
il valore dellintegrale non dipender`a dal modo in cui `e stato spezzato, cio`e
non dipender`a dal punto b.
Esempio 5.7.2 Calcoliamo i tre integrali citati allinizio: si ha per ogni
c > 0
_
1
c
log xdx = (integrando per parti)
= [x log x]
1
c

_
1
c
1 dx = [x log x x]
1
c
= 1 c log c +c,
375
da cui

_
1
0
log xdx = lim
c0
+
(1 c log c +c) = 1.
Analogamente, per ogni c > 0 si ha
_
c
0
e
x
dx = [e
x
]
c
0
= e
c
+ 1,
cosicche

_

0
e
x
dx = lim
c+
(e
c
+ 1) = 1.
Inne, scelto b = 1 risulta per ogni c ]0, 1[ e per ogni d > 1:
_
1
c
e

x
dx =
_
2e

x
_
1
c
= 2e
1
+ 2e
c
,
_
d
1
e

x
dx =
_
2e

x
_
d
1
= 2e
d
+ 2e
1
;
dunque

_
1
0
e

x
dx = 2e
1
+ 2,
_

1
e

x
dx = 2e
1
,
da cui

_

0
e

x
dx = 2.
Si noti che se nel calcolo del terzo integrale avessimo scelto b = 37, avremmo
ottenuto ugualmente
_

0
e

x
dx = lim
c0
+
_
37
c
e

x
dx + lim
d+
_
d
37
e

x
dx =
= lim
c0
+
_
2e

x
_
37
c
+ lim
d+
_
2e

x
_
d
37
=
= lim
c0
+
(2e

37
+ 2e

c
) + lim
d+
(2e

d
+ 2e

37
) = 2.
Osservazioni 5.7.3 (1) Consideriamo un integrando f, denito in ]a, b] op-
pure in [a, [, e supponiamo che f sia integrabile secondo Riemann in ogni
sottointervallo chiuso e limitato contenuto nellintervallo di denizione. Sia
376
F una primitiva di f, anchessa denita in ]a, b] oppure in [a, [. Lesistenza
dellintegrale improprio di f in [a, b], o in [a, [, equivale allesistenza del
limite di F(c) per c a
+
o per c . Infatti, ad esempio,
_
b
a
f(x) dx = lim
ca
+
_
b
c
f(x) dx = lim
ca
+
[F(x)]
b
c
= F(b) lim
ca
+
F(c),
e laltro caso `e analogo. Nellesempio 5.7.2 quindi si poteva pi` u rapidamente
scrivere, sottintendendo la notazione [G(x)]
b
a
= lim
xb
G(x) lim
xa
G(x),
_
1
0
log xdx = [x log x x]
1
0
= 1,
_

0
e
x
dx =
_
e
x

0
= 1,
_

0
e

x
dx =
_
2e

x
_

0
= 2.
(2) Se f e g sono due funzioni sommabili su un intervallo limitato [a, b]
(oppure su una semiretta), allora anche f + g e f, per ogni R, sono
sommabili e per i relativi integrali impropri vale la relazione
_
b
a
[f(x)+g(x)] dx =
_
b
a
f(x) dx+
_
b
a
g(x) dx,
_
b
a
(f(x)) dx =
_
b
a
f(x) dx.
La verica `e immediata sulla base della denizione. Si noti che lanalogo
enunciato per funzioni soltanto integrabili in senso improprio `e falso: se ad
esempio
_
b
a
f(x) dx = + e
_
b
a
g(x) dx = , la funzione f + g non `e in
generale integrabile in senso improprio e comunque la prima delle relazioni
precedenti non ha senso. Lo stesso vale per la seconda relazione, nel caso
= 0.
Non sempre gli integrali impropri sono calcolabili esplicitamente: `e dunque
importante stabilire criteri sucienti a garantire lintegrabilit`a e la sommabi-
lit`a di una funzione. Si noti lanalogia con ci`o che succede con le serie, di cui
`e interessante conoscere la convergenza anche quando non se ne sa calcolare
la somma.
Anzitutto, se f ha segno costante, il suo integrale improprio ha sempre senso:
377
Proposizione 5.7.4 Sia f : [a, [ una funzione di segno costante. Se f
1(a, c) per ogni c > a, allora f `e integrabile in senso improprio su [a, [,
(con integrale convergente o divergente).
Dimostrazione Per ipotesi, la funzione integrale F(x) =
_
x
a
f(t) dt `e de-
nita per ogni x > a. Tale funzione `e monotona, in quanto se x < y si
ha
F(y) F(x) =
_
y
x
f(t) dt =
_
0 se f 0 in [a, [
0 se f 0 in [a, [.
Dunque esiste il limite
lim
c
F(c) = lim
c
_
c
a
f(t) dt,
cio`e f ha integrale improprio su [a, [.
Osservazione 5.7.5 Analogamente, una funzione f :]a, b] R, di segno
costante, tale che f 1(c, b) per ogni c ]a, b[, `e integrabile in senso im-
proprio su [a, b] (con integrale convergente o divergente). La dimostrazione
`e esattamente la stessa.
Lesempio che segue `e fondamentale per il successivo teorema di confronto.
Esempio 5.7.6 La funzione f :]0, [ R denita da f(x) = x

, ove
`e un ssato numero positivo, `e certamente integrabile in senso improprio in
]0, [, essendo sempre positiva. Verichiamo che tale integrale `e divergente,
decomponendolo in
_
1
0
x

dx +
_

1
x

dx. Si ha
_
1
0
x

dx =
_

_
[log x]
1
0
= +
_
x
1
1
_
1
0
=
_
1
1
+
se = 1
se 0 < < 1
se > 1.
_

1
x

dx =
_

_
[log x]

1
= +
_
x
1
1
_

1
=
_
+
1
1
se = 1
se 0 < < 1
se > 1.
Sommando i due addendi, lintegrale
_

0
x

dx diverge in tutti i casi. Si noti


tuttavia che
_
1
0
x

dx < < 1;
_

1
x

dx < > 1.
378
Le funzioni x

(e le loro analoghe (x a)

) si prestano assai bene come


termini di confronto per stabilire la sommabilit`a o la non sommabilit`a di
funzioni pi` u complicate. Tale possibilit`a `e garantita dal seguente
Teorema 5.7.7 (di confronto) Siano f, g : [a, [R funzioni integrabili
secondo Riemann in ogni intervallo [a, c] [a, [, e supponiamo che g sia
non negativa e sommabile su [a, [. Se risulta [f(x)[ g(x) per ogni x a,
allora anche f `e sommabile su [a, [ e si ha

_

a
f(x) dx

_

a
[f(x)[ dx
_

a
g(x) dx.
Dimostrazione Supponiamo dapprima f 0: allora, per ogni c > a, grazie
alla monotonia dellintegrale si ha
0
_
c
a
f(x) dx
_
c
a
g(x) dx.
Poiche f, essendo non negativa, ha certamente integrale improprio al pari di
g, al limite per c troviamo
0
_

a
f(x) dx
_

a
g(x) dx,
e dato che g `e sommabile, tale risulta anche f.
Supponiamo ora f di segno variabile. Per ogni c > a possiamo scrivere

_
c
a
f(x) dx

_
c
a
[f(x)[ dx
_
c
a
g(x) dx.
Basta ora provare che f `e sommabile: una volta fatto ci`o, infatti, la stima
precedente, passando al limite per c , ci dir`a che

_

a
f(x) dx

_

a
[f(x)[ dx
_

a
g(x) dx < .
A questo scopo `e suciente scrivere
f(x) = [f(x)[ ([f(x)[ f(x)),
e osservare che [f[ `e sommabile, come si `e visto, e che, per la parte gi`a
dimostrata, lo stesso vale per [f[ f, essendo 0 [f[ f 2[f[. La
sommabilit`a di f segue dunque dallosservazione 5.7.3 (2).
379
Osservazioni 5.7.8 (1) Un risultato analogo vale ovviamente nel caso di
funzioni denite su ]a, b] e integrabili in ogni [c, b] ]a, b].
(2) Se [f[ `e integrabile in senso improprio (su [a, [ o su [a, b]), allora anche
f lo `e: basta applicare il teorema precedente scegliendo g = [f[. Vale anche
il viceversa: se f `e integrabile in senso improprio, allora f, e quindi [f[,
`e integrabile secondo Riemann in ogni sottointervallo chiuso e limitato, e
dunque [f[, avendo segno costante, `e integrabile in senso improprio. Non
altrettanto si pu`o dire per la sommabilit`a: se [f[ `e sommabile, anche f lo `e,
sempre per il teorema precedente; per`o, come vedremo fra poco, il viceversa
`e falso.
Esempi 5.7.9 (1) Lintegrale
_

e
x
2
dx, che esiste certamente, per la pa-
rit`a dellintegrando `e uguale a 2
_

0
e
x
2
dx (esercizio 5.7.1). Inoltre
e
x
2

_
1 se 0 x 1
e
x
se x 1,
cosicche lintegrale proposto `e convergente:
_

0
e
x
2
dx
_
1
0
1 dx +
_

1
e
x
dx = 2.
(2) Nellintegrale
_

0
sin

xe
x
dx la funzione integranda non ha segno co-
stante, per`o si ha
[ sin

xe
x
[ e
x
x 0,
e la funzione e
x
`e sommabile in [0, [. Ne segue che lintegrale proposto
esiste nito.
(3) Proviamo che la funzione f(x) =
sin x
x
`e sommabile su [0, [, mentre
lintegrale improprio di [f[ in [0, [ `e divergente. Si noti che in questo caso
losservazione 5.7.8 (2) e il teorema di confronto non sono applicabili, e la
sommabilit`a di f va dimostrata in maniera diretta.
Anzitutto, come sappiamo (esempio 3.3.5 (1)), la funzione f `e prolungabile
con continuit`a in 0, col valore 1. Si ha, scegliendo 1 cos x come primitiva
di sin x, e integrando per parti:
_
c
0
sin x
x
dx =
_
1 cos x
x
_
c
0
+
_
c
0
1 cos x
x
2
dx =
1 cos c
c
+
_
c
0
1 cos x
x
2
dx
380
ove si `e usato il fatto che anche
1cos x
x
`e prolungabile con continuit`a in 0, col
valore 0 (esempio 3.3.5 (2)). Dunque per c si ha, essendo non negativo
lintegrando allultimo membro:
lim
c
_
c
0
sin x
x
dx =
_

0
1 cos x
x
2
dx.
Questo limite `e nito per il teorema di confronto, essendo
1 cos x
x
2

_
1/2 se 0 < x 1 (per il criterio di Leibniz)
2/x
2
se x > 1.
Daltra parte per lintegrale improprio di

sin x
x

, che esiste certamente, si ha


_

0

sin x
x

dx = lim
k
_
k
0

sin x
x

dx = lim
k
k

h=0
_
(h+1)
h
[ sin x[
x
dx =
=

h=0
_
(h+1)
h
[ sin x[
x
dx =

h=0
_

0
sin t
t +h
dt

h=0
1
(h + 1)
_

0
sin t dt =
2

h=0
1
h + 1
= .
Esercizi 5.7
1. Sia f integrabile secondo Riemann oppure sommabile su [a, a]. Si pro-
vi che se f `e una funzione pari, ossia f(x) = f(x), allora
_
a
a
f(x) dx =
2
_
a
0
f(x) dx, mentre se f `e una funzione dispari, ossia f(x) = f(x),
allora
_
a
a
f(x) dx = 0.
2. Discutere lesistenza e la convergenza dei seguenti integrali impropri:
_
1
0
e
sin(1/x)

x
dx,
_

0
arctan x
x
_
[1 x[
dx,
_

e
x
e
x
2

dx,
_

1 +x
2

1 +x
4
x
2
+x
4
dx,
_
1
0
sin 2x
x(x 1/2)(x 1)
dx,
_

1
cos e
x
+ sin x
x

x 1
dx.
381
3. Discutere lesistenza ed eventualmente calcolare i seguenti integrali
impropri:
_

2
dx
x log x log log x
,
_
3/2
0
(tan x)
2/3
(sin x)
1/3
dx,
_

1
_
1
x

1
tan x
_
dx,
_
3/2
0
(tan x)
4/3
(sin x)
1/3
dx,
_
1
0
arccos x
_
(1 x
2
) arcsin x
dx,
_
1
1
3x
2
+ 2
x
5/3
dx,
_

1
log x

x(1 +

x)
2
dx,
_
3
0
dx
_
x
3
(3 x)
,
_
2
0
dx
_
x(2 x)
,
_

1
dx
x
2

x
2
1
,
_
3
0
x
x
3
+ 1
dx,
_
10
0
_
1 +
1
x
dx,
_

2
dx
x

x
2
4
,
_

1
dx
e
2x
e
x
,
_

dx
(1 +x
2
)
2
,
_

[x[
5
e
x
2
dx.
4. (Criterio integrale di convergenza per le serie) Sia f : [1, [ R una
funzione non negativa e decrescente. Si provi che lintegrale improprio
_

1
f(x) dx e la serie

n=1
f(n) sono entrambi convergenti o entrambi
divergenti.
5. Dimostrare che
_
1
0
arctan x
x
dx =

n=0
(1)
n
(2n + 1)
2
.
6. Dimostrare che
_
1
0
log x log(1 x) dx =

n=1
1
n(n + 1)
2
.
382
[Traccia: utilizzando lo sviluppo di Taylor di log(1 x), si verichi
che per ogni ]0, 1[ si ha
_
1
0
log x log(1 x) dx =

n=1
_
(1 )
n+1
n(n + 1)
2

(1 )
n+1
log(1 )
n(n + 1)
_
e poi si passi al limite per 0.]
7. Dimostrare che

n=N+1
1
n
2
<
1
N
N N
+
.
8. (Integrali di Fresnel) Provare che i due integrali impropri
_

0
sin(x
2
) dx,
_

0
cos(x
2
) dx
sono convergenti.
9. Provare che lintegrale improprio
_

0
x cos(x
4
) dx
`e convergente, benche lintegrando non sia nemmeno limitato in [0, [.
10. (Integrale di Frullani) Sia f una funzione continua in [0, [, tale che
lintegrale improprio
_

a
f(x)
x
dx
sia convergente per ogni a > 0. Provare che se , sono numeri positivi
si ha
lim
a0
+
_

a
f(x) f(x)
x
dx = f(0) log

;
dedurne che
_

0
e
x
e
x
x
dx = log

,
_

0
cos x cos x
x
dx = log

.
383
11. Calcolare
_
/2
0
log sin xdx,
_
/2
0
log cos xdx.
[Traccia: utilizzare le formule di duplicazione.]
12. (Funzione di Eulero) Si consideri la funzione :]0, [ R denita
dallintegrale improprio
(p) =
_

0
x
p1
e
x
dx.
(i) Vericare che (p) `e un numero reale e che (p + 1) = p(p) per
ogni p > 0.
(ii) Provare che `e derivabile in ]0, [, con

(p) =
_

0
x
p1
log xe
x
dx.
(iii) Provare che `e una funzione convessa di classe C

.
[Traccia: per (ii), si stimi la dierenza
(p +h) (p)
h

_

0
x
p1
log xe
x
dx
utilizzando il teorema di Lagrange; per (iii), si verichi che

(p) > 0.]


384
Capitolo 6
Equazioni dierenziali
6.1 Generalit`a
Una equazione dierenziale `e unidentit`a che lega fra di loro, per ogni valore
della variabile x in un dato insieme, i valori della funzione incognita y(x) e
quelli delle sue derivate y

(x), y

(x), eccetera. Unequazione dierenziale `e


detta ordinaria quando la variabile x appartiene a un intervallo di R, mentre
`e detta alle derivate parziali allorche la variabile x `e un elemento di R
m
(e in tal caso nellequazione compariranno le derivate parziali D
i
u, D
i
D
j
u,
eccetera). Non ci addentreremo comunque in questo vastissimo campo.
Unequazione dierenziale ordinaria `e dunque unequazione funzionale del
tipo
f(x, y(x), y

(x), y

(x), . . . , y
(m)
(x)) = 0, x I,
ove f `e una funzione continua nei suoi m + 2 argomenti, I `e un intervallo
(eventualmente illimitato) di R e y `e la funzione incognita. Lordine del-
lequazione dierenziale `e il massimo ordine di derivazione che vi compare:
nellesempio sopra scritto lordine `e m.
Unequazione dierenziale `e detta in forma normale se si presenta nella forma
y
(m)
(x) = g(x, y(x), y

(x), . . . , y
(m1)
(x)), x I,
cio`e se `e risolta rispetto alla derivata di grado massimo dellincognita y.
In particolare, unequazione del primo ordine in forma normale `e del tipo
y

(x) = g(x, y(x)), x I.


385
Perche si va ad esplorare lenorme universo delle equazioni dierenziali? Per-
che esse saltano fuori in modo naturale non appena si formula un qualunque
tipo, anche molto semplice, di modello matematico per descrivere fenomeni
sici, chimici, biologici, economici, eccetera.
Accanto alle equazioni `e utile considerare anche sistemi dierenziali
f(x, u(x), u

(x)) = 0, x I,
eventualmente in forma normale
u

(x) = g(x, u(x)), x I,


ove stavolta lincognita `e una funzione u : I R
m
. Il motivo di questo
allargamento del tiro `e il fatto che ogni equazione dierenziale di ordine m
pu`o essere trasformata, in modo equivalente, in un sistema di m equazioni
dierenziali del primo ordine, il quale `e, in linea generale, pi` u semplice da
trattare. Infatti, se y C
m
(I) risolve lequazione
f(x, y, y

, . . . , y
(m)
) = 0, x I
(`e consuetudine omettere dallincognita y la variabile indipendente x), intro-
ducendo le m funzioni
u
0
(x) = y(x), u
1
(x) = y

(x), . . . , u
m1
(x) = y
(m1)
(x),
si ottiene una funzione u = (u
0
, u
1
, . . . u
m1
) C
1
(I, R
m
) che risolve il
sistema dierenziale
_

_
(u
0
)

= u
1
(u
1
)

= u
2
. . . . . . . . .
(u
m2
)

= u
m1
f(x, u
0
, u
1
, . . . , u
m1
, (u
m1
)

) = 0.
Viceversa, se u = (u
0
, u
1
, . . . , u
m1
) C
1
(I, R
m
) `e soluzione del sistema, `e
facile vericare che, posto y = u
0
, si ha y C
m
(I) e tale funzione risolve
lequazione dierenziale originaria.
Si noti che se lequazione dierenziale era in forma normale,
y
(m)
= g(x, y, y

, . . . , y
(m1)
),
386
allora lultima equazione del sistema diventa
(u
m1
)

= g(x, u
0
, u
1
, . . . , u
m1
),
e quindi anche il sistema `e in forma normale.
Tutte le equazioni dierenziali sono risolubili? Naturalmente no! Un esempio
banale `e il seguente:
1 +y
2
+ (y

)
2
= 0.
Limportanza delle equazioni in forma normale sta nel fatto che, al contrario,
esse sono sempre risolubili ed anzi hanno uninnit`a di soluzioni: questo si
vede gi`a esaminando la pi` u semplice, e cio`e
y

= f(x), x [a, b],


le cui soluzioni sono
y(x) =
_
x
a
f(t) dt +c, x [a, b],
ove c `e una costante arbitraria.
Nel seguito, considereremo solamente equazioni e sistemi in forma normale.
Problema di Cauchy
Un modo per selezionare una delle innite soluzioni di una equazione dieren-
ziale in forma normale del primo ordine `e quello di prescrivere alla soluzione
di assumere, in un determinato punto x
0
I, un pressato valore y
0
R. Si
formula cos` il problema di Cauchy:
_
y

= g(x, y), x I,
y(x
0
) = y
0
.
Poiche assegnare g(x, y(x)) signica prescrivere il coeciente angolare della
retta tangente al graco della soluzione y(x) nel suo punto (x, y(x)), risolvere
il problema di Cauchy signica determinare una funzione il cui graco passi
per un ssato punto (x
0
, y
0
) e del quale sia prescritta punto per punto la
pendenza.
Per i sistemi del primo ordine in forma normale il problema di Cauchy ha la
forma seguente:
_
y

= g(x, y), x I,
y(x
0
) = y
0
.
387
Per unequazione dierenziale di ordine m, linsieme delle soluzioni dipender`a
in generale da m costanti arbitrarie: il problema di Cauchy `e in tal caso
_
y
(m)
= g(x, y, . . . , y
(m1)
), x I,
y(x
0
) = y
0
, y

(x
0
) = y
1
, . . . y
(m1)
(x
0
) = y
m1
,
ove y
0
, y
1
, . . . , y
m1
sono m numeri assegnati.
Il teorema di esistenza e unicit`a
Per equazioni e sistemi del primo ordine in forma normale vi `e un fonda-
mentale risultato che garantisce, perlomeno localmente, la risolubilit`a del
problema di Cauchy: in altre parole, si dimostra che vi `e ununica soluzione
locale, ovvero che la soluzione del problema `e denita almeno in un intorno
del punto iniziale x
0
.
Per formulare questo enunciato occorrono alcune premesse. Consideriamo il
sistema
u

= g(x, u), x I,
sotto le seguenti ipotesi:
(i) g : A R
m
`e una assegnata funzione continua, denita su un aperto
A R
m+1
;
(ii) la funzione g `e localmente lipschitziana in A rispetto alla variabile vet-
toriale u, uniformemente rispetto a x: pi` u precisamente, per ogni
compatto K A esiste una costante H
K
0 tale che
[g(x, y) g(x, u)[
m
H
K
[y u[
m
(x, y), (x, u) K.
Fissiamo un punto (x
0
, u
0
) A e consideriamo il problema di Cauchy
_
u

= g(x, u)
u(x
0
) = u
0
.
Dato che A `e aperto, esister`a un cilindro (m+ 1)-dimensionale compatto R,
di centro (x
0
, u
0
), tutto contenuto in A. Esso sar`a della forma
R = (x, u) R
m+1
: [x x
0
[ a, [u u
0
[
m
b.
388
Poiche g `e continua nel compatto R, in virt` u del teorema di Weierstrass
(teorema 3.4.1) esister`a M 0 tale che
[g(x, u)[
m
M (x, u) R;
inoltre, per (ii), esiste H 0 tale che
[g(x, y) g(x, u)[
m
H[y u[
m
(x, y), (x, u) R.
Si ha allora il seguente teorema di esistenza e unicit`a locale:
Teorema 6.1.1 Sotto le ipotesi (i) e (ii), sia (x
0
, u
0
) A, e siano R il
cilindro e M, H le costanti sopra denite. Allora esistono un intervallo
J = [x
0
h, x
0
+ h], con 0 < h a, e ununica funzione u : J R
m
di
classe C
1
, tali che
u

(x) = g(x, u(x)) x J, u(x


0
) = u
0
;
inoltre il graco di u `e tutto contenuto in R, cio`e si ha
[u(x) u
0
[
m
b x J.
Prima di dimostrare il teorema facciamo qualche considerazione. Anzitut-
to, le ipotesi di regolarit`a formulate sulla funzione g sono ottimali: infatti,
389
benche sia possibile provare lesistenza di soluzioni del problema di Cauchy
supponendo solamente g continua in A, `e facile vedere con esempi che in
mancanza dellipotesi di locale lipschitzianit`a viene a cadere lunicit`a della
soluzione.
Esempio 6.1.2 Sia m = 1. Il problema di Cauchy
_
u

= u
2/3
u(0) = 0
ha la soluzione u = 0, le innite
altre u

(x) = (x )
3
/27, come
`e facile vericare, ed altre anco-
ra. Il secondo membro g(x, u) =
u
2/3
, che `e denito su R
2
, `e ov-
viamente continuo ma non veri-
ca la propriet`a di locale lipschi-
tzianit`a. Sia infatti K un intorno
di (x
0
, 0) R
2
: se esistesse H 0
tale che
[y
2/3
u
2/3
[ H[y u[ (x, y), (x, u) K,
scelti (x, u) = (x
0
, 0) e (x, y) = (x
0
,
1
n
), con n N
+
, avremmo (x
0
,
1
n
) K
denitivamente, da cui
1
n
2/3

H
n
denitivamente,
cio`e n H
3
denitivamente, il che `e assurdo.
Dimostrazione del teorema 6.1.1 Ci limiteremo, per semplicit`a, a pro-
vare la tesi nel caso di una singola equazione (m = 1).
1
o
passo Trasformiamo il problema di Cauchy in una equazione integrale
equivalente.
Se u C
1
(J) risolve il problema di Cauchy
_
u

= g(x, u), x J,
u(x
0
) = u
0
,
390
allora ssato x J possiamo integrare i due membri fra x
0
e x, ottenendo
lequazione integrale
u(x) = u
0
+
_
x
x
0
g(t, u(t)) dt, x J.
Viceversa se u C
0
(J) risolve questa equazione, allora anzitutto u(x
0
) = u
0
;
inoltre, essendo g e u funzioni continue, il secondo membro `e di classe C
1
e
quindi u C
1
(J). Possiamo allora derivare entrambi i membri dellequazione
integrale, ottenendo
u

(x) = g(x, u(x)) x J.


Quindi u risolve il problema di Cauchy. Ci`o prova lequivalenza richiesta.
2
o
passo Risolviamo lequazione integrale con il metodo delle approssima-
zioni successive.
Sia h = mina, b/M. Deniamo la seguente successione di funzioni u
n
:
_

_
u
0
(x) u
0
,
u
n+1
(x) = u
0
+
_
x
x
0
g(t, u
n
(t)) dt n N,
x J.
Si vericano per induzione i seguenti fatti:
sup
xJ
[u
n
(x) u
0
[ b n N,
[u
n+1
(x) u
n
(x)[ M
H
n
(n + 1)!
[x x
0
[
n+1
x J, n N.
La prima relazione `e ovvia per n = 0; supponendo che essa valga per un certo
n, si ha (essendo (t, u
n
(t)) R per ogni t J)
sup
xJ
[u
n+1
(x) u
0
[ = sup
xJ

_
x
x
0
g(t, u
n
(t)) dt

sup
xJ
M[x x
0
[ Mh b.
Dunque la relazione vale per n+1 e pertanto, per induzione, `e vera per ogni
n N.
La seconda disuguaglianza vale per n = 0, dato che
[u
1
(x) u
0
[ =

_
x
x
0
g(t, u
0
) dt

M[x x
0
[ x J;
391
se poi essa vale per un certo n, allora risulta (essendo (t, u
n
(t)), (t, u
n1
(t))
R per ogni t J)
[u
n+1
(x) u
n
(x)[ =

_
x
x
0
[g(t, u
n
(t)) g(t, u
n1
(t))] dt

_
x
x
0
H[u
n
(t) u
n1
(t)[ dt

_
x
x
0
MH
n
[t x
0
[
n
n!
dt

=
= M
H
n
(n + 1)!
[x x
0
[
n+1
x J.
Dunque la disuguaglianza vale anche per n + 1, cosicche, per induzione, `e
vera per ogni n N.
In particolare, la relazione appena provata implica che
sup
xJ
[u
n+1
(x) u
n
(x)[ MH
n
h
n+1
(n + 1)!
n N,
e quindi, per ogni m > n,
sup
xJ
[u
m
(x) u
n
(x)[
m1

k=n
sup
xJ
[u
k+1
(x) u
k
(x)[ M
m1

k=n
H
k
h
k+1
(k + 1)!
.
Dato che la serie M

k=0
H
k
h
k+1
(k+1)!
`e convergente, la stima appena ottenuta
mostra che per ogni x J la successione numerica u
n
(x) `e di Cauchy in R
(denizione 2.6.1). Pertanto esiste
u(x) = lim
n
u
n
(x) x J,
e anzi la convergenza `e uniforme in J, nel senso che (esercizio 6.1.4)
lim
n
sup
xJ
[u
n
(x) u(x)[ = 0;
per di pi` u, nellesercizio 6.1.5 si dimostra che la funzione limite u `e continua
in J.
Adesso vogliamo passare al limite per n nella relazione che denisce la
successione u
n
. Il primo membro tende ovviamente a u(x); per il secondo
membro si ha, in virt` u delle ipotesi fatte su g,

_
x
x
0
g(t, u
n
(t)) dt
_
x
x
0
g(t, u(t)) dt

392

_
x
x
0
[g(t, u
n
(t)) g(t, u(t))[ dt

_
x
x
0
H[u
n
(t) u(t)[ dt

Hhsup
tJ
[u
n
(t) u(t)[,
e lultimo membro tende a 0 per n . In denitiva con il passaggio al
limite per n otteniamo che la funzione u risolve lequazione integrale
u(x) = u
0
+
_
x
x
0
g(t, u(t)) dt, x J.
Notiamo anche che dalla prima delle due disuguaglianze provate per induzio-
ne segue, al limite per n ,
sup
xJ
[u(x) u
0
[ b.
ci`o conclude la dimostrazione del 2
o
passo e del teorema 6.1.1.
Osservazioni 6.1.3 (1) La dimostrazione del teorema 6.1.1 nel caso dei
sistemi (m > 1) funziona in modo assolutamente analogo, facendo uso della
norma euclidea [ [
m
al posto del valore assoluto. Lunica novit`a sta nel
fatto che occorre scrivere lequazione integrale in forma vettoriale, e a questo
scopo `e necessario introdurre lintegrale di funzioni v a valori in R
m
. Esso si
denisce come segue:
_
x
x
0
v(t) dt =
__
x
x
0
v
1
(t) dt, . . . ,
_
x
x
0
v
m
(t) dt
_
R
m
.
Per questi integrali vettoriali vale la disuguaglianza

_
x
x
0
v(t) dt

_
x
x
0
[v(t)[
m
dt x
0
, x con x
0
< x.
Essa si dimostra cos`: per ogni y R
m
si ha, per denizione di prodotto
scalare (paragrafo 3.1):
_
x
x
0
v(t) dt y =
m

i=1
_
x
x
0
v
i
(t) dt y
i
=
_
x
x
0
m

i=1
v
i
(t)y
i
dt =
_
x
x
0
v(t) y dt;
quindi per la disuguaglianza di Cauchy-Schwarz (proposizione 3.1.1)

_
x
x
0
v(t) dt y

_
x
x
0
[v(t)[
m
[y[
m
dt y R
m
.
393
Scegliendo y =
_
x
x
0
v(t) dt, si conclude che

_
x
x
0
v(t) dt

2
m

_
x
x
0
[v(t)[
m
dt

_
x
x
0
v(t) dt

m
,
e quindi si ottiene la disuguaglianza cercata. Con questo strumento si pu`o
ripetere tutta la dimostrazione fatta nel caso m = 1 estendendola al caso dei
sistemi.
(2) Ai ni della risoluzione delle equazioni dierenziali, come vedremo, `e
utile estendere lintegrazione al caso di funzioni complesse, anziche reali. Sia
f : [a, b] C una funzione limitata. Allora le due funzioni reali Re f(x) e
Im f(x) sono limitate. Se queste funzioni sono integrabili su [a, b], diremo
che f `e integrabile su [a, b] e porremo per denizione
_
b
a
f(x) dx =
_
b
a
Re f(x) dx +i
_
b
a
Imf(x) dx.
Per lintegrale di funzioni complesse valgono tutte le usuali regole algebri-
che e di calcolo, ma non le propriet`a legate allordinamento. Vale per`o la
fondamentale relazione (fra numeri reali)

_
b
a
f(x) dx

_
b
a
[f(x)[ dx;
ricordando che C `e isomorfo ed isometrico a R
2
, questa relazione si dimostra
come nel caso di funzioni a valori vettoriali.
A titolo di esempio, calcoliamo lintegrale di e
ix
su [0, a]:
_
a
0
e
ix
dx =
_
a
0
cos xdx +i
_
a
0
sin xdx = sin a i(cos a 1) =
= i(e
ia
1) =
1
i
(e
ia
1) =
_
e
ix
i
_
a
0
.
Dipendenza continua dal dato iniziale
A complemento del teorema di esistenza e unicit`a conviene fare qualche ulte-
riore considerazione. Nelle applicazioni e in particolare nellapprossimazione
numerica delle soluzioni di equazioni e sistemi dierenziali `e di capitale im-
portanza che a piccole variazioni del dato iniziale u
0
(ad esempio causate
394
da errori di misura) corrispondano piccole variazioni della soluzione corri-
spondente, perche senza questa propriet`a verrebbe a mancare il presupposto
stesso del procedimento di approssimazione. Si vuole, in altre parole, che
la soluzione del problema di Cauchy dipenda con continuit`a dal valore ini-
ziale u
0
. In eetti, se (x
0
, u
0
) e (x
0
, y
0
) sono punti di A (di uguale ascissa)
sucientemente vicini, allora le soluzioni dei due problemi di Cauchy
_
u

= g(x, u), x J,
u(x
0
) = u
0
_
y

= g(x, y), x J

,
y(x
0
) = y
0
vericano la diseguaglianza
[u(x) y(x)[
m
C[u
0
y
0
[
m
x J

,
ove J

`e un opportuno intervallo di centro x


0
contenuto in J J

e C `e
unopportuna costante. Infatti, utilizzando le equazioni integrali equivalenti,
posto J

= [x
0
h, x
0
+h] si ha
[u(x) y(x)[
m
=

u
0
y
0
+
_
x
x
0
[g(t, u(t)) g(t, y(t))] dt

[u
0
y
0
[
m
+H

_
x
x
0
[u(t) y(t)[
m
dt

[u
0
y
0
[
m
+Hh sup
tJ

[u(t) y(t)[
m
,
da cui
(1 hH) sup
tJ

[u(t) y(t)[
m
[u
0
y
0
[
m
e quindi la tesi quando h `e sucientemente piccolo in modo che hH < 1.
Prolungamento delle soluzioni
Il teorema 6.1.1 ha carattere locale, e non d`a informazioni su quanto grande
sia linsieme J di denizione della soluzione. Daltra parte, se il graco della
soluzione passa per un punto (x
1
, u
1
) A, tale punto pu`o essere preso come
nuovo punto iniziale e ancora il teorema 6.1.1 garantisce che la soluzione pu`o
essere prolungata ulteriormente in un intorno di x
1
. Si pu`o cos` pensare di
prolungare la soluzione procedendo per passi successivi. Si ha in eetti:
395
Teorema 6.1.4 Nelle ipotesi del teorema 6.1.1, sia R un arbitrario cilindro
chiuso e limitato incluso in A e contenente (x
0
, u
0
) come punto interno.
Allora la soluzione locale u del problema di Cauchy
_
u

= g(x, u),
u(x
0
) = u
0
pu`o essere univocamente estesa a un intervallo chiuso [x
1
, x
2
], con x
1
< x
0
<
x
2
, in modo che i punti (x
1
, u(x
1
)) e (x
2
, u(x
2
)) appartengano alla frontiera
di R.
Dimostrazione Sia Q un cilindro chiuso e limitato di R
m+1
tale che R
Q A, e siano M, H 0 tali che
[g(x, u)[
m
M (x, u) Q,
[g(x, y) g(x, u)[
m
H[y u[
m
(x, y), (x, u) Q.
Prendiamo poi a, b > 0 sucientemente piccoli in modo che
(x, u) R
m+1
: [x x
0
[ a, [u u
0
[
m
b Q (x
0
, u
0
) R,
e scegliamo inne un numero h > 0 tale che
h < min
_
a,
b
M
_
.
Allora si pu`o ripetere la dimostrazione del teorema 6.1.1 ottenendo, per ogni
punto iniziale (x
0
, u
0
) R una soluzione locale denita almeno nellintervallo
[x
0
h, x
0
+h]. Adesso osserviamo che il numero h non dipende dalla scelta
del punto (x
0
, u
0
) R: `e chiaro allora che procedendo per passi successivi
linsieme di denizione della soluzione del problema di Cauchy si allunga, ad
ogni passo, di h e che quindi dopo un numero nito di tappe intermedie il
graco della soluzione raggiunger`a la frontiera di R.
Lunicit`a del prolungamento `e poi ovvia.
Notiamo che nel teorema 6.1.4 `e essenziale che R sia un rettangolo chiuso e
limitato e non, ad esempio, una striscia innita o un semispazio. Per esempio,
se m = 1 il problema di Cauchy
_
u

= 1 +u
2
u(0) = 0,
396
che ha secondo membro regolare in tutto R
2
, ha come unica soluzione la
funzione u(x) = tan x, la quale non `e prolungabile al di fuori dellintervallo

2
,

2
_
. Quindi non avremmo potuto, nel teorema 6.1.4, prendere come R
la striscia
_

2
,

2

R.
Fino a che punto la soluzione locale del problema di Cauchy `e prolungabile?
In termini un po grossolani si pu`o dire che il prolungamento `e possibile no
a che il graco della soluzione giace nellaperto A ove `e denito il secondo
membro g. Per formalizzare questa idea, ssato (x
0
, u
0
) A, introduciamo
la famiglia (x
0
, u
0
) costituita da tutti gli intervalli J contenenti x
0
come
punto interno, tali che il problema di Cauchy di punto iniziale (x
0
, u
0
) abbia
soluzione u
J
() denita su tutto J: il teorema 6.1.1 ci dice che questa famiglia
non `e vuota. Sia ora J
0
lintervallo unione di tutti gli intervalli J (x
0
, u
0
),
e deniamo per x J
0
:
u(x) = u
J
(x) se x J e J (x
0
, u
0
).
Questa denizione ha senso perche due soluzioni u
J
, u
I
coincidono su J I
per unicit`a. Resta cos` denita in tutto J
0
ununica soluzione del problema
di Cauchy che, per costruzione, non `e ulteriormente estendibile: essa viene
chiamata soluzione massimale.
Soluzione globale
Supponiamo che la funzione g(x, u) sia denita su una striscia [c, d] R
m
,
sia ivi continua e lipschitziana nella variabile u uniformemente rispetto a x,
ossia
[g(x, y) g(x, u)[
m
H[y u[
m
(x, y), (x, u) [c, d] R
m
.
Allora si ha:
Teorema 6.1.5 Nelle ipotesi sopra dette, per ogni (x
0
, u
0
) [c, d] R
m
la
soluzione del problema di Cauchy
_
u

= g(x, u)
u(x
0
) = u
0
`e globale, cio`e `e denita nellintero intervallo [c, d].
397
Dimostrazione Si ripete la dimostrazione del teorema 6.1.1, provando che
per ogni (x
0
, u
0
) [c, d] R
m
e per h sucientemente piccolo le approssima-
zioni successive u
n
(x) vericano
sup
xJ
[u
m
(x) u
n
(x)[
m
M
m1

kn
H
k
h
k
(k + 1)!
m > n,
ove M = max
x[c,d]
[g(x, u
0
)[
m
. Se ne deduce che le u
n
convergono ad una
funzione continua u denita su J, che risolve il problema di Cauchy. Essendo
h indipendente dalla scelta di (x
0
, u
0
), la soluzione si pu`o prolungare a tutto
[c, d] con un numero nito di iterazioni.
Questo risultato `e importante perche copre il caso dei sistemi lineari, in cui
g(x, u) = A(x)u +b(x),
con A(x) matrice mm a coecienti continui in [c, d] e b funzione continua
su [c, d]. Dunque le soluzioni di equazioni e sistemi dierenziali lineari di
qualsiasi ordine (a coecienti continui) esistono in tutto lintervallo su cui
sono deniti i coecienti.
Esercizi 6.1
1. Trasformare lequazione dierenziale
y

+ sin x y

cos x y

+y = x
in un sistema di tre equazioni del primo ordine.
2. Trasformare il sistema
_
u

= 2u v +x
v

= 3u +v x
in una equazione dierenziale del secondo ordine.
3. Determinare tutte le soluzioni (di classe C
1
in qualche intervallo) del-
lequazione dierenziale (y

)
2
= 1.
398
4. Sia f
n
una successione di funzioni denite su un intervallo [a, b].
Supponiamo che
sup
x[a,b]
[f
n+1
(x) f
n
(x)[ a
n
n N,
e che la serie

n=0
a
n
sia convergente. Si provi che esiste una funzione
f : [a, b] R tale che f
n
f uniformemente in [a, b], ossia tale che
lim
n
sup
x[a,b]
[f
n
(x) f(x)[ = 0.
5. Sia f
n
una successione di funzioni continue denite su un intervallo
[a, b]. Supponiamo che esista una funzione f : [a, b] R tale che
f
n
f uniformemente in [a, b] (vedere lesercizio precedente). Si provi
che f `e continua in [a, b].
6.2 Alcuni tipi di equazioni del primo ordine
Come risolvere le equazioni dierenziali? Come scriverne esplicitamente le
soluzioni? Una risposta esaustiva `e impossibile, ma per certe classi di equa-
zioni si pu`o fornire qualche metodo pratico. Esamineremo in dettaglio due
tipi di equazioni che sono i pi` u importanti nella pratica, rimandando lo studio
degli altri tipi agli esercizi 6.2.5, 6.2.6 e 6.2.7.
Equazioni a variabili separabili
Le equazioni a variabili separabili sono equazioni (non lineari, in generale)
della forma
y

= f(x)g(y), x I,
dove f `e una funzione continua sullintervallo I e g `e una funzione continua su
un altro intervallo J. Necessariamente, una soluzione y di questa equazione
dovr`a essere denita in I (o in un sottointervallo di I) a valori in J. La
tecnica risolutiva `e la seguente:
1
o
passo Si cercano gli eventuali punti y
0
J nei quali si ha g(y
0
) = 0: per
ciascuno di questi punti la funzione costante
y(x) = y
0
, x I,
399
`e soluzione dellequazione.
2
o
passo Si cercano le soluzioni non costanti y, denite in qualche sottoin-
tervallo I

I e a valori in qualche sottointervallo J

J nel quale si abbia


g ,= 0; se y(x) `e una di queste soluzioni, sar`a g(y(x)) ,= 0 per ogni x I

;
quindi dividendo lequazione per g(y(x)) si ottiene
1
g(y(x))
y

(x) = f(x), x I

.
3
o
passo Si calcolano le primitive dei due membri di tale identit`a: indicando
con F una primitiva di f in I

e con una primitiva di


1
g
in J

, si ricava
(y(x)) = F(x) +c, x I

,
dove c `e una costante arbitrariamente scelta.
4
o
passo Si osserva che

=
1
g
,= 0 in J

per ipotesi, per cui `e strettamente


monotona in J

(proposizione 4.9.1). Se ne deduce, per il teorema 3.4.6, che


esiste la funzione inversa
1
, e la relazione precedente diventa
y(x) =
1
(F(x) +c), x I

.
Si noti che y(x) J

per ogni x I

, come richiesto, e che y verica


eettivamente lequazione dierenziale perche per ogni x I

si ha
y

(x) = (
1
)

(F(x) +c)F

(x) =
1

(
1
(F(x) +c))
f(x) =
= g(
1
(F(x) +c))f(x) = g(y(x))f(x).
Osserviamo che il 3
o
passo si pu`o meglio memorizzare se si utilizza la nota-
zione y

=
dy
dx
e si passa formalmente da
1
g(y)
dy
dx
= f(x) a
dy
g(y)
= f(x)dx, per
poi integrare i due membri il primo rispetto a y e il secondo rispetto a x.
Questo `e per`o un articio formale: a rigor di termini, si integrano entrambi
i membri rispetto a x, con la dierenza che a sinistra si fa il cambiamento di
variabile y = y(x).
Si badi bene che questo procedimento non esaurisce in generale linsieme del-
le soluzioni: vi possono essere altri tipi di soluzioni, come illustra il secondo
degli esempi che seguono.
Esempi 6.2.1 (1) Consideriamo lequazione y

= x(1 +y
2
). Qui le funzioni
f(x) = x e g(y) = 1 + y
2
sono denite su tutto R e la g non `e mai nulla.
400
Dividendo per 1 +y
2
si trova
y

1 +y
2
= x,
dy
1 +y
2
= x dx,
e integrando
arctan y(x) =
x
2
2
+c.
Dunque
y(x) = tan
_
x
2
2
+c
_
, c R.
Si osservi che ciascuna soluzione `e denita non su tutto R ma solo nel sot-
toinsieme descritto dalla disuguaglianza [
x
2
2
+ c[ <

2
, perche solo per tali x
la quantit`a
x
2
2
+ c appartiene allimmagine della funzione arcotangente. Ad
esempio, se c = 0 si ha x ]

[, mentre se c = si hanno i due in-


tervalli ]

3,

[ e ]

3[ (si tratta dunque di due distinte soluzioni,


denite su intervalli disgiunti).
(2) Nellequazione y

=

y si ha f(x) 1 in I = R e g(y) =

y in
J = [0, [. Lunica soluzione costante `e y(x) = 0, x R; le soluzioni a valori
in J

=]0, [ si ottengono dividendo per



y con i passaggi che seguono:
y

y
= 1,
dy

y
= dx,
2
_
y(x) = x +c
(il che implica x +c > 0); si trova dunque
y(x) =
_
x +c
2
_
2
, x ] c, +[.
Ma lequazione ha altre soluzioni: ad esempio, per ogni ssato R, la
funzione
y

(x) =
_

_
0 se x <
_
x +
2
_
2
se x
401
`e di classe C
1
in R e verica lequazione dierenziale su tutto R. Essa non fa
parte di quelle gi`a trovate, perche non `e identicamente nulla e non `e a valori
in ]0, [.
(3) Per lequazione y

= x/y, la funzione f(x) = x `e denita su R mentre


la g(y) = 1/y `e denita su R 0: quindi cerchiamo soluzioni y(x) ,= 0. Col
solito metodo si trova
yy

= x,
y dy = x dx,
y
2
2
=
x
2
2
+c,
y(x)
2
= x
2
+ 2c = x
2
+c

;
ci`o implica c

= y
2
+x
2
> 0. In conclusione,
y(x) =

x
2
, x ]

[.
Le soluzioni hanno per graci delle semicirconferenze di raggi

, con c

arbitrario numero positivo. Si osservi che, dopo aver scritto lequazione nella
forma simmetrica y dy = x dx, abbiamo ricavato x
2
+y
2
= c

, che `e lequa-
zione dellintera circonferenza di centro (0, 0) e raggio

. In eetti lequa-
zione in forma simmetrica `e risolta anche dalle funzioni x(y) =
_
c

y
2
,
y ]

[, ottenute esplicitando la variabile x in funzione della y. Le-


quazione x
2
+ y
2
= c

(in termini generali, lequazione (y) + F(x) = c


ottenuta nel 3
o
passo rappresenta una curva del piano la quale, localmen-
te (ossia nellintorno di ogni suo ssato punto), `e graco di una funzione
y(x), oppure x(y), ciascuna delle quali `e soluzione della forma simmetrica
dellequazione dierenziale.
Equazioni lineari del primo ordine
Le equazioni lineari del primo ordine, come sappiamo, hanno la forma se-
guente:
y

= a(x)y +b(x), x I,
ove a e b, detti coecienti dellequazione, sono funzioni continue in I. Sia
y una soluzione dellequazione: se A `e una primitiva della funzione a in I,
moltiplicando i due membri dellequazione per e
A(x)
si ottiene
e
A(x)
b(x) = e
A(x)
(y

(x) a(x)y(x)) =
d
dx
_
e
A(x)
y(x)
_
, x I;
402
dunque e
A(x)
y(x) `e una primitiva di e
A(x)
b(x) in I. Quindi, scelto arbitra-
riamente x
0
I, esister`a c R per cui
e
A(x)
y(x) =
_
x
x
0
e
A(t)
b(t) dt +c, x I,
ossia la funzione y(x) `e data da
y(x) = e
A(x)
__
x
x
0
e
A(t)
b(t) dt +c
_
, x I.
Viceversa, se y `e una funzione di questo tipo (con x
0
I e c R ssati),
allora per ogni x I si ha
y

(x) = a(x)e
A(x)
__
x
x
0
e
A(t)
b(t) dt +c
_
+e
A(x)
_
e
A(x)
b(x)
_
=
= a(x)y(x) +b(x),
cio`e y risolve lequazione dierenziale.
Si noti che se b(x) 0 (nel qual caso lequazione si dice omogenea) linsieme
delle soluzioni `e ce
A(x)
, c R ed `e quindi uno spazio vettoriale di dimen-
sione 1, generato dallelemento e
A(x)
. Se b(x) , 0, linsieme delle soluzioni
`e uno spazio ane, cio`e un traslato dello spazio vettoriale precedente: la
traslazione `e ottenuta sommando la funzione e
A(x)
_
x
x
0
e
A(t)
b(t) dt, che `e essa
stessa una soluzione dellequazione non omogenea.
Si osservi anche che la scelta di una diversa primitiva, A(x) + , di a, non
altera linsieme delle soluzioni. Analogamente, la scelta di un diverso punto
x
1
I come primo estremo nellintegrale ha leetto di modicare la costante
c, che diventa c +
_
x
1
x
0
e
A(t)
b(t) dt: ma dato che c varia in R, nuovamente
linsieme delle soluzioni non cambia.
Esempio 6.2.2 Consideriamo lequazione y

= 2xy + x
3
. Una primitiva
della funzione 2x `e x
2
. Moltiplichiamo lequazione per e
x
2
: si ottiene
d
dx
_
e
x
2
y(x)
_
= x
3
e
x
2
.
Calcoliamo una primitiva di x
3
e
x
2
: con facili calcoli
_
x
0
t
3
e
t
2
dt =
x
2
+ 1
2
e
x
2
+
1
2
.
403
Dunque
e
x
2
y(x) =
x
2
+ 1
2
e
x
2
+
1
2
+c =
x
2
+ 1
2
e
x
2
+c

,
e le soluzioni dellequazione proposta sono le funzioni
y(x) =
x
2
+ 1
2
+ce
x
2
, c R.
Se imponiamo ad esempio la condizione di Cauchy y(33) = 700, troviamo
facilmente la corrispondente costante c:
c = 155e
1089
,
e dunque ununica soluzione, in accordo con il teorema 6.1.1.
Si osservi che non sempre i calcoli per risolvere unequazione dierenziale
possono essere esplicitamente svolti, perche talvolta le primitive non sono
esprimibili in forma chiusa: ad esempio la semplicissima equazione y

= e
x
2
ha le soluzioni y(x) = c +
_
x
0
e
t
2
dt.
Esercizi 6.2
1. Provare che il problema di Cauchy
_
y

=
_
1 y
2
y(0) = 1
ha innite soluzioni; disegnare il graco di alcune di esse.
2. Risolvere le seguenti equazioni dierenziali:
(i) y

= xy
2
, (ii) y

= y
2/3
, (iii) y

=
x
1 + log y
,
(iv) y

= log x sin y, (v) y

= x
_
1 +
1
y
_
, (vi) xyy

= y 1,
(vii) y

=
log x cos y
x sin 2y
, (viii) y

=
x xy
2
y +x
2
y
, (ix) y

= e
y+e
y
.
404
3. Determinare linsieme delle soluzioni delle seguenti equazioni dieren-
ziali:
(i) y

=
xy
1 +x
2
+x 2, (ii) y

= 2xy +xe
x
,
(iii) y

= tan x y + sin x, (iv) y

=
2
x
y +x,
(v) y

=
y
1 x
2
+ 1 x, (vi) y

=
y
x

e
x
x
.
4. Sia y(x) una soluzione dellequazione dierenziale
y

= a(x)y +b(x), x > 0,


e si supponga che sia a(x) c < 0 e lim
x+
b(x) = 0. Si dimostri
che
lim
x+
y(x) = 0.
5. (Equazioni di Bernoulli) Si consideri lequazione dierenziale
y

= p(x)y +q(x)y

,
ove `e un numero reale diverso da 0 e da 1. Mediante la sostituzione
v(x) = y(x)
1
, si verichi che lequazione dierenziale diventa lineare
nellincognita v(x). Utilizzando questo metodo si risolvano le equazioni
(i) y

= 2y 3y
2
, (ii) y

= 2xy +x
3
y
3
, (iii) y

=
xy
3
+x
2
y
2
.
6. (Equazioni non lineari omogenee) Utilizzando la sostituzione v(x) =
y(x)
x
, si verichi che unequazione dierenziale della forma y

= g(
y
x
),
con g assegnata funzione continua, diventa a variabili separabili nel-
lincognita v(x). Si utilizzi questo metodo per risolvere le equazioni
(i) y

= 2
x
y
, (ii) y

=
y
x
+
_
1 +
y
2
x
2
, (iii) x
2
y

= y
2
+xy + 4x
2
.
7. (Equazioni di Riccati) Data lequazione dierenziale
y

= a(x)y
2
+b(x)y +c(x), x I,
405
si supponga di conoscerne una soluzione (x). Si verichi che con la so-
stituzione y(x) = (x) +
1
v(x)
, lequazione diventa lineare nellincognita
v(x). Utilizzando questo metodo, si risolva lequazione
y

= y
2
xy + 1.
8. Risolvere i seguenti problemi di Cauchy:
(i)
_
y

= 3x
2
y
4
y(1) = 0,
(ii)
_
4x
3/2
yy

= 1 y
2
y(1) = 2,
(iii)
_
_
_
y

=
y
2
1
x
2
1
y(0) = 0,
(iv)
_
_
_
y

=
y
2
+ 1
x
2
+ 1
y(0) =

3,
(v)
_

xy

y sin

x = 0
y(
2
) = 9,
(vi)
_
y

= x(y
3
y)
y(0) = 1,
(vii)
_
2xyy

= y
2
x
2
+ 1
y(1) = 1,
(viii)
_
y

=
_
(1 +y)(1 +x
2
)
y(0) = 1.
6.3 Equazioni lineari del secondo ordine
Consideriamo unequazione dierenziale lineare del secondo ordine: essa ha
la forma
y

+a
1
(x)y

+a
0
(x)y = f(x), x I,
dove a
0
, a
1
e f sono funzioni continue nellintervallo I R. Accanto a questa
equazione consideriamo anche lequazione omogenea
y

+a
1
(x)y

+a
0
(x)y = 0, x I,
Come nel caso delle equazioni lineari del primo ordine, `e immediato vericare
che linsieme delle soluzioni dellequazione omogenea `e uno spazio vettoriale.
Esso, come vedremo, ha dimensione 2 (pari allordine dellequazione). Lin-
sieme delle soluzioni dellequazione non omogenea sar`a ancora uno spazio
ane, ottenibile dallo spazio vettoriale precedente per mezzo di una trasla-
zione. In eetti, detto V
f
linsieme delle soluzioni dellequazione con secondo
406
membro f, e detto V
0
linsieme delle soluzioni nel caso f = 0, si ha, avendo
ssato un elemento v V
f
,
V
f
= u
0
+v : u
0
V
0
.
Infatti, se u V
f
allora u v V
0
, poiche
(u v)

+a
1
(x)(u v)

+a
0
(x)(u v) = f f = 0, x I;
dunque, posto u
0
= u v, si ha u = u
0
+ v con u
0
V
0
. Viceversa, se
u = u
0
+v con u
0
V
0
, allora
u

+a
1
(x)u

+a
0
(x)u =
= (u
0
+v)

+a
1
(x)(u
0
+v)

+a
0
(x)(u
0
+v) = 0 +f = f, x I,
cio`e u V
f
.
Pertanto, per determinare completamente V
f
baster`a caratterizzare comple-
tamente V
0
e trovare un singolo, arbitrario elemento di V
f
.
(a) Caratterizzazione di V
0
. Proviamo anzitutto che lo spazio vettoriale
V
0
ha dimensione 2. Fissato un punto x
0
I, consideriamo i due problemi
di Cauchy
_
y

+a
1
(x)y

+a
0
(x)y = 0
y(x
0
) = 1, y

(x
0
) = 0,
_
y

+a
1
(x)y

+a
0
(x)y = 0
y(x
0
) = 0, y

(x
0
) = 1.
Essi sono univocamente risolubili (per il teorema 6.1.1 e losservazione 6.1.3,
dopo averli trasformati in problemi di Cauchy per sistemi lineari del primo
ordine); inoltre le soluzioni sono denite su tutto lintervallo I in virt` u del
teorema 6.1.5. Denotiamo tali soluzioni con y
1
(x) e y
2
(x).
Dimostriamo che y
1
e y
2
sono linearmente indipendenti, ossia che se
1
e

2
sono costanti tali che
1
y
1
(x) +
2
y
2
(x) 0 in I, allora necessariamente

1
=
2
= 0. La funzione
1
y
1
(x) +
2
y
2
(x) `e lunica soluzione del problema
di Cauchy
_
y

+a
1
(x)y
1
+a
0
(x)y = 0
y(x
0
) =
1
, y

(x
0
) =
2
;
quindi se tale soluzione `e identicamente nulla, deve essere
1
= 0 e
2
= 0.
Proviamo ora che le funzioni y
1
e y
2
generano V
0
, ossia che ogni elemento
u V
0
`e combinazione lineare di y
1
e y
2
. Fissata una funzione u V
0
,
407
poniamo v(x) = u(x
0
)y
1
(x) + u

(x
0
)y
2
(x): allora v `e soluzione del problema
di Cauchy
_
y

+a
1
(x)y
1
+a
0
(x)y = 0
y(x
0
) = u(x
0
), y

(x
0
) = u

(x
0
),
problema che `e risolto anche da u: per unicit`a, deve essere u v, e pertanto
u
1
y
1
+
2
y
2
con
1
= u(x
0
) e
2
= u

(x
0
), ossia u `e combinazione lineare
di y
1
e y
2
. Le due funzioni y
1
e y
2
formano in denitiva una base dello spazio
vettoriale V
0
.
Abbiamo cos` individuato la struttura di V
0
: osserviamo per`o che in generale
non si riesce a determinare esplicitamente una base y
1
, y
2
di V
0
.
Se lequazione dierenziale lineare ha coecienti costanti, ossia a
0
(x) a
0
e
a
1
(x) a
1
, `e invece possibile, e anzi facile, trovare esplicitamente le funzioni
y
1
e y
2
, cercandole di forma esponenziale (perche le esponenziali x e
x
sono le uniche funzioni che hanno le proprie derivate multiple di loro stesse).
Sia dunque y(x) = e
x
, con numero da determinare: imponendo che y V
0
,
si ha
0 = y

+a
1
y

+a
0
y = e
x
(
2
+a
1
+a
0
),
e poiche e
x
,= 0 si deduce che deve essere radice del polinomio caratteristico
P() =
2
+a
1
+a
0
, ossia deve essere
2
+a
1
+a
0
= 0. Si hanno allora tre
casi possibili:
1
o
caso: 2 radici reali distinte
1
e
2
.
Ci sono dunque due soluzioni e

1
x
e e

2
x
. Esse sono linearmente indipendenti
perche, supposto ad esempio
1
,= 0, si ha
c
1
e

1
x
+c
2
e

2
x
0 = e

1
x
(c
1
+c
2
e

1
)x
) 0 =
= c
1
+c
2
e
(
2

1
)x
0 = (derivando)
= c
1
(
2

1
)e
(
2

1
)x
0 = (essendo
2
,=
1
)
= c
1
= 0 = c
1
= c
2
= 0.
Dunque
V
0
= c
1
e

1
x
+c
2
e

2
x
: c
1
, c
2
R.
2
o
caso: una radice reale doppia (che `e uguale a a
1
/2).
Una soluzione `e e
x
; unaltra soluzione `e xe
x
: infatti
D(xe
x
) = e
x
(1 +x), D
2
(xe
x
) = e
x
(
2
x + 2),
408
da cui
D
2
(xe
x
) +a
1
D(xe
x
) +a
0
xe
x
=
= e
x
_

2
x + 2 +a
1
(1 +x) +a
0
x
_
=
= e
x
_
(
2
+a
1
+a
0
)x + (2 +a
1
)
_
=
(essendo 2 +a
1
= 0)
= e
x
0 = 0.
Le due soluzioni sono linearmente indipendenti perche
c
1
xe
x
+c
2
e
x
0 = e
x
(c
1
x+c
2
) 0 = c
1
x+c
2
0 = c
1
= c
2
= 0.
Dunque
V
0
= c
1
xe
x
+c
2
e
x
: c
1
, c
2
R.
3
o
caso: due radici complesse coniugate
1
= a +ib e
2
= a ib.
Abbiamo due soluzioni e

1
x
e e

2
x
, che sono linearmente indipendenti (stesso
calcolo fatto nel 1
o
caso) ma sono a valori complessi, mentre a noi interessano
le soluzioni reali. Si osservi per`o che, essendo e
(aib)x
= e
ax
(cos bx i sin bx),
possiamo scrivere
c
1
e

1
x
+c
2
e

2
x
= e
ax
(c
1
(cos bx +i sin bx) +c
2
(cos bx i sin bx)) =
= (c
1
+c
2
)e
ax
cos bx +i(c
1
c
2
)e
ax
sin bx =
= c

1
e
ax
cos bx +c

2
e
ax
sin bx,
ove c

1
= c
1
+c
2
e c

2
= i(c
1
c
2
). Scegliendo le costanti c

1
e c

2
reali, si trovano
tutte le soluzioni reali. In denitiva
V
0
= c
1
e
ax
cos bx +c
2
e
ax
sin bx : c
1
, c
2
R.
(b) Determinazione di un elemento di V
f
. Sia y
1
, y
2
una base per
V
0
(comunque determinata). Cercheremo una soluzione dellequazione non
omogenea nella forma seguente:
v(x) = v
1
(x)y
1
(x) +v
2
(x)y
2
(x),
con v
1
e v
2
funzioni da scegliere opportunamente. Questo metodo, non a
caso, si chiama metodo di variazione della costanti arbitrarie: se v
1
e v
2
409
sono costanti, allora v V
0
; se sono funzioni, ossia costanti che variano, si
cerca di fare in modo che v V
f
.
Sostituendo v, v

e v

nellequazione dierenziale, bisogna imporre che


v

+a
1
(x)v

+a
0
(x)v = (v

1
y
1
+ 2v

1
y

1
+v
1
y

1
+v

2
y
2
+ 2v

2
y

2
+v
2
y

2
)+
+a
1
(x)(v

1
y
1
+v
1
y

1
+v

2
y
2
+v
2
y

2
) +a
0
(x)(v
1
y
1
+v
2
y
2
) = f(x).
Da qui, utilizzando il fatto che y
1
, y
2
V
0
, si deduce
(v

1
y
1
+ 2v

1
y

1
+v

2
y
2
+ 2v

2
y

2
) +a
1
(x)(v

1
y
1
+v

2
y
2
) = f(x),
ossia
_
d
dx
(v

1
y
1
+v

2
y
2
) + (v

1
y

1
+v

2
y

2
)
_
+a
1
(x)(v

1
y
1
+v

2
y
2
) = f(x).
Questa equazione `e certamente soddisfatta se si impongono le seguenti due
condizioni:
_
v

1
y
1
+v

2
y
2
= 0 in I,
v

1
y

1
+v

2
y

2
= f in I.
Si tratta di un sistema algebrico lineare nelle incognite v

1
e v

2
, con coecienti
y
1
, y
2
, y

1
, y

2
. Il determinante di questo sistema `e
det
_
y
1
(x) y
2
(x)
y

1
(x) y

2
(x)
_
= y
1
(x)y

2
(x) y

1
(x)y
2
(x) = D(x).
Proviamo che D(x) ,= 0 per ogni x I: si ha D(x
0
) = y
1
(x
0
)y

2
(x
0
)
y

1
(x
0
)y
2
(x
0
) = 1, e
D

(x) = y

1
y

2
+y
1
y

2
y

1
y
2
y

1
y

2
= y
1
y

2
y

1
y
2
=
= y
1
(a
1
(x)y

2
a
0
(x)y
2
) (a
1
(x)y

1
a
0
(x)y
1
)y
2
=
= a
1
(x)(y
1
y

2
y

1
y
2
) = a
1
(x)D(x);
quindi D(x) `e soluzione del problema di Cauchy
_
D

= a
1
(x)D
D(x
0
) = 1,
per cui D(x) = e
R
x
x
0
a
1
(t)dt
; in particolare, D(x) ,= 0 per ogni x I.
Dunque, per ogni x I il sistema sopra scritto ha determinante dei coef-
cienti non nullo e pertanto `e univocamente risolubile: ci`o ci permette di
410
determinare le funzioni v

1
e v

2
. Inne si scelgono due primitive arbitrarie
v
1
e v
2
, e la funzione v corrispondente, per costruzione, apparterr`a a V
f
. In
conclusione, otteniamo
V
f
= v +v
0
: v
0
V
0
= (c
1
+v
1
)y
1
+ (c
2
+v
2
)y
2
: c
1
, c
2
R.
Da questa descrizione di V
f
si vede anche che una diversa scelta delle primitive
di v

1
e v

2
non modica linsieme V
f
.
Esempio 6.3.1 Consideriamo lequazione dierenziale
y

+y =
cos x
sin x
, x ]0, [.
Risolviamo dapprima lequazione dierenziale omogenea: il polinomio carat-
teristico `e
2
+ 1, e le sue radici sono i. Quindi
V
0
= c
1
cos x +c
2
sin x : c
1
, c
2
R.
Per trovare una soluzione dellequazione non omogenea che abbia la forma
v(x) = v
1
(x) cos x +v
2
(x) sin x
dobbiamo imporre le condizioni
_
_
_
v

1
(x) cos x +v

2
(x) sin x = 0
v

1
(x) sin x +v

2
(x) cos x =
cos x
sin x
.
Risolvendo il sistema si trova
v

1
(x) = cos x, v

2
(x) =
1
sin x
sin x.
Dunque, ad esempio,
v
1
(x) = sin x, v
2
(x) = log
_
tan
x
2
_
+ cos x
e inne
v(x) = sin x cos x +
_
log
_
tan
x
2
_
+ cos x
_
sin x = sin x log
_
tan
x
2
_
.
In denitiva, tutte le soluzioni dellequazione proposta sono date da
V
f
=
_
c
1
cos x +
_
c
2
+ log
_
tan
x
2
__
sin x : c
1
, c
2
R
_
.
411
Osservazione 6.3.2 Il metodo di variazione della costanti arbitrarie `e molto
importante dal punto di vista della teoria, ma sul piano pratico comporta
spesso calcoli lunghi e complessi. Un metodo pi` u ecace, anche se meno
generale, `e il metodo dei coecienti indeterminati, applicabile solo per
equazioni a coecienti costanti con secondi membri f di tipo speciale. Questo
metodo `e illustrato nellesercizio 6.3.1.
Esercizi 6.3
1. (Metodo dei coecienti indeterminati) Si consideri lequazione dieren-
ziale lineare a coecienti costanti
y

+a
1
y

+a
0
y = f(x) P(x)e
x
,
ove P `e un polinomio e C. Si cerchi un elemento v V
f
della
forma v(x) = x
m
Q(x)e
x
, dove Q `e un polinomio dello stesso grado
di P, mentre m vale 0, o 1, o 2 a seconda che non sia radice del
polinomio caratteristico, oppure sia radice semplice, oppure sia radice
doppia. Si osservi che il metodo copre anche i casi in cui f contiene
le funzioni seno e coseno. Si applichi il metodo per determinare le
soluzioni dellequazione
y

+ 2ky

+y = x
2
e
x
,
con k ssato numero reale.
2. (Principio di sovrapposizione) Si verichi che se v V
f
e w V
g
, allora
v+w V
f+g
. Si utilizzi questo fatto per trovare linsieme delle soluzioni
dellequazione
y

2y

+y = cos x + sin
x
2
.
[Traccia: si utilizzino le identit`a cos t =
e
it
+e
it
2
, sin t =
e
it
e
it
2i
e il
metodo dei coecienti indeterminati (esercizio 6.3.1).]
3. Risolvere le equazioni dierenziali seguenti:
(i) y

2y

+ 2y = 0, (ii) y

+ 4y = tan 2x,
(iii) y

y = xe
x
, (iv) y

+ 6y

+ 9y = e
x
/x,
(v) y

+y = x cos x, (vi)y

+ 4y

+ 4y = e
x
+e
x
,
(vii) y

2y

+ 2y = x cos x, (viii) y

3y

+ 2y = 2x
3
,
(ix) y

+ 4y

= x
2
+ 1, (x) y

+y

+y = e
x
.
412
4. (Equazioni di Eulero) Si provi che le equazioni della forma
x
2
y

+xa
1
y

+a
0
y = 0
hanno soluzioni del tipo y(x) = x

, con C. Si risolva con questo


metodo lequazione x
2
y

+xy

y = 3.
413
Indice analitico
O-grande, 289
o-piccolo, 288, 290
o(1), 289
additivit`a
dellarea, 92
dellintegrale, 345
addizione, 10
alfabeto greco, 1
angolo
acuto, 74
concavo, 68
convesso, 68, 196, 280
orientato, 90, 280
ottuso, 74
aperto, 190
applicazione
antilineare, 186
lineare, 186, 243
arco
di circonferenza, 91
orientato, 91
area
con segno, 333
del cerchio, 89, 90
del semicerchio, 362
del triangolo, 102
di un poligono regolare, 86, 342
di un settore
circolare, 366
iperbolico, 366
orientato, 91, 92, 228
argomento, 95
principale, 95
ascissa, 43, 61
asintoto
obliquo, 237, 354
orizzontale, 237
verticale, 237
asse
delle ascisse, 61
delle ordinate, 61
di un segmento, 78
immaginario, 82
reale, 82
assioma
di completezza, 15, 17, 18
di continuit`a, 15
assiomi dei numeri reali, 10
assoluta convergenza, 146
autovalore, 315, 316
autovettore, 315
base
del logaritmo, 56
dellesponenziale, 47
di uno spazio vettoriale, 407
cerchio, 64
di convergenza, 158
chiuso, 191, 193
chiusura, 198
circonferenza, 64
codominio, 55
di una funzione, 7
coeciente
414
angolare, 66, 241
binomiale, 32
generalizzato, 270
coecienti
di una equazione dierenziale, 397,
401
di una serie di potenze, 156
colatitudine, 280
combinazione lineare, 76, 207
complementare, 3, 191
componenti scalari, 208
coniugato di un numero complesso, 83
coniugio, 83
cono, 276
convergenza
assoluta, 146
uniforme, 391
coordinate, 61
cartesiane, 61
polari
in R
2
, 214, 280
in R
3
, 280
coppia di numeri reali, 61, 81, 82
corrispondenza biunivoca, 8, 171
coseno, 96
in coordinate, 102
iperbolico, 168
costante
di Eulero, 144
di Lipschitz, 348
criterio
del confronto, 128, 137
del confronto asintotico, 141
del rapporto, 137, 145, 160
della radice, 139, 145, 159
di integrabilit`a, 338
di Leibniz, 147, 206, 269
di Raabe, 144
integrale, 381
curva di livello, 262
denitivamente, 117
densit`a
dei razionali, 26, 50
derivata, 240
n-sima, 282
destra, 330
direzionale, 260
prima, 282
seconda, 282
sinistra, 330
derivate
parziali, 255
k-sime, 283
seconde, 282
derivato, 199
determinante, 102, 409
diametro di un insieme, 198
dierenza, 11
fra insiemi, 3
direzione, 61
di massima pendenza, 262
unitaria, 261
disco, 64
discriminante, 42, 45, 72
distanza, 188, 197
di un punto da una retta, 75
euclidea, 189
euclidea in R
2
, 63
in R, 43
disuguaglianza
delle medie, 39, 116
di Cauchy-Schwarz, 45, 63, 187,
204, 317
di Bernoulli, 35, 36, 56
di Jensen, 332
triangolare, 63, 189
divisione, 11
dominio di una funzione, 7
elemento
415
di un insieme, 1
neutro, 10, 81
separatore, 15
ellisse, 255
equazione
algebrica, 80
di una retta, 66
dierenziale, 384
a coecienti costanti, 407, 411
a variabili separabili, 398
alle derivate parziali, 384
di Bernoulli, 404
di Eulero, 412
di Riccati, 404
in forma normale, 384
lineare del 1
o
ordine, 401
lineare del 2
o
ordine, 405
lineare non omogenea, 402, 408
lineare omogenea, 402, 405
non lineare omogenea, 404
ordinaria, 384
integrale, 389
equazioni parametriche
di un segmento, 69
di una retta, 70
errore quadratico, 323
esponente, 47
estensione di una funzione, 211
estremo
inferiore, 16
di una funzione, 201
superiore, 15, 16
di una funzione, 200
fattoriale, 22
forma
indeterminata, 122, 219, 288, 301
quadratica, 277, 313
denita negativa, 314, 316
denita positiva, 314, 316
indenita, 314, 316
semidenita negativa, 316
semidenita positiva, 314, 316,
327
semidenita negativa, 314
trigonometrica, 96, 103
di un numero complesso, 104
formula
del binomio, 33, 55, 104, 132, 249,
306
di de Moivre, 104, 163
di Eulero, 165
di Leibniz, 285, 309
di Stirling, 369
di Taylor, 297, 304
formule
di addizione, 97
di bisezione, 107
di de Morgan, 6
di duplicazione, 107
di prostaferesi, 107, 245
di quadratura, 341, 357
di Werner, 107
frazione
generatrice, 129
in base b, 30
frontiera, 198
funzione, 7, 200
di Eulero, 383
a valori vettoriali, 208, 278
ane, 204, 241
arcocoseno, 232
arcoseno, 232
arcotangente, 233
bigettiva, 8, 171
biunivoca, 8
caratteristica, 347
composta, 7, 207
concava, 325
continua, 203, 208
416
in un punto, 203, 343
convessa, 325
coseno, 96
coseno iperbolico, 168
crescente, 223, 309
decrescente, 223, 309
derivabile, 240
in un punto, 240
derivata, 282
di classe C
k
, 283
di classe C

, 283
di Dirichlet, 337
dierenziabile, 257
in un punto, 257
discontinua, 204
dispari, 201, 380
esponenziale, 47, 51, 183, 331
complessa, 165, 183, 188
identit`a, 8
indicatrice, 347
innita, 290
innitesima, 209, 288
iniettiva, 7, 55
integrabile
in senso improprio, 374
secondo Riemann, 337, 339
integrale, 354, 355
inversa, 8, 56, 229
invertibile, 8
limitata, 201, 333
inferiormente, 201
superiormente, 200
lipschitziana, 348, 354
localmente lipschitziana, 387
logaritmo, 56
monotona, 223, 348
omogenea, 276, 313
pari, 201, 380
parte intera, 202, 365
periodica, 96, 183, 359
primitiva, 356
radice (2n + 1)-sima, 234
razionale, 308
segno, 358
seno, 96
seno iperbolico, 168
settore coseno iperbolico, 254
settore seno iperbolico, 254
strettamente
crescente, 55, 223, 309
decrescente, 55, 223, 309
monotona, 55, 223
surgettiva, 8
tangente, 99
uniformemente continua, 349
vettoriale, 208
funzioni iperboliche, 169, 366
gradiente, 258
graco
di una funzione, 239
graco di una funzione, 7
identit`a
di Abel, 135, 150
di Eulero, 277
immagine, 7
di una funzione, 7
incremento, 241, 257
innitesimi
dello stesso ordine, 288
non confrontabili, 289
innitesimo, 288
di ordine
inferiore, 288
superiore, 241, 288
inniti dello stesso ordine, 291
innito, 290
di ordine
inferiore, 290
superiore, 290
417
insieme, 1
aperto, 190
chiuso, 191, 193, 197
chiuso e limitato, 195
compatto, 196, 232, 314, 351
complementare, 3, 191
connesso, 227
convesso, 324
degli interi, 4, 25
dei complessi, 4, 81
dei naturali, 3, 21
dei naturali non nulli, 3
dei razionali, 4, 25
dei reali, 4, 9
denso, 26
di Cantor, 200
di sottolivello, 331
nito, 2
immagine, 200
induttivo, 21
innito, 2, 194
limitato, 13, 193, 194
inferiormente, 13, 197
superiormente, 13, 197
misurabile, 347
ternario di Cantor, 200
universo, 2
vuoto, 3
insiemi
disgiunti, 3
separati, 14, 50
integrale, 337
di Fresnel, 382
di Frullani, 382
di funzioni vettoriali, 392
improprio, 374
convergente, 374
divergente, 374
indenito, 356
inferiore, 336
superiore, 336
integrazione
per parti, 360
per sostituzione, 362
intersezione, 3
intervallo, 12
di convergenza, 158
intorno, 189
invarianza per traslazioni, 63, 189
iperbole, 255
iperpiano, 196
ortogonale, 196
irrazionalit`a
di , 368, 369
di

2, 18
di e, 134
legge di annullamento del prodotto, 11
lemma dellarbitrariet`a di , 47
limite
allinnito, 210
destro, 210, 223
di una funzione, 209, 217
composta, 221
di una successione, 113, 190
sinistro, 210, 223
linea spezzata, 91
logaritmo, 56
naturale, 134
longitudine, 280
lunghezza
di un arco orientato, 92, 228
maggiorante, 13
massimo
di un insieme, 14, 197
di una funzione, 201
massimo limite
di una funzione, 223
di una successione, 155, 166
matrice, 102, 277
418
Hessiana, 283
media
aritmetica, 39
armonica, 42, 126
geometrica, 39, 42
metodo
dei coecienti indeterminati, 411
delle approssimazioni successive,
390
di variazione delle costanti arbitra-
rie, 408
metrica, 188
minimo
di un insieme, 14, 194, 197
di una funzione, 201
minimo limite
di una funzione, 223
di una successione, 155
minorante, 13
misura
di un insieme, 347
in radianti, 94, 228
modulo
di un numero complesso, 84
di un numero reale, 43
di un vettore, 64
moltiplicazione, 10
monomio, 156
monotonia
dellintegrale, 345
della misura, 347
multi-indice, 303
negazione, 5
nodi di una suddivisione, 334
norma, 197
di un vettore, 187
euclidea, 187
numero
0, 10
1, 10
, 89, 342, 362
e, 133, 161
complesso, 4, 81
di Fibonacci, 136, 167
di Nepero, 133, 161
dispari, 29
intero, 4, 25
irrazionale, 4, 31
naturale, 3, 21
negativo, 11
pari, 29
positivo, 11
razionale, 4, 25
reale, 4, 10
omogeneit`a
della distanza euclidea, 189
della norma, 187
omotetia, 64
opposto, 10, 81
ordinamento, 82
dei reali, 11
ordinata, 61
ordine di unequazione dierenziale, 384
orientazione, 43, 61
negativa, 61, 80
positiva, 61, 79
origine, 43, 61
ortogonalit`a, 72
oscillazione, 342, 350
palla, 189, 197
chiusa, 197
parabola, 255
parte
immaginaria, 83
intera, 202
interna, 197
reale, 82
partizione, 334
419
pendenza, 66, 242
perimetro
della circonferenza, 89, 90
di un poligono, 86
piano, 60
cartesiano, 8, 82, 185
complesso, 82, 185
di Gauss, 82
tangente, 259, 264
polinomio, 156, 243
caratteristico, 407
di Taylor, 297, 304
positivit`a
della distanza, 188
della norma, 187
potenza di un numero reale, 24, 33
primitiva, 356
principio
dei cassetti, 28
di identit`a
dei polinomi, 284
delle serie di potenze, 285
di induzione, 22, 30
di sostituzione
degli innitesimi, 289
degli inniti, 291
di sovrapposizione, 411
problema di Cauchy, 386, 406
prodotto
cartesiano, 5, 7, 61, 185
di Cauchy, 180
di numeri complessi, 81
di numeri reali, 10
per scalari, 62, 185
scalare, 74, 186, 392
progressione geometrica, 24
proiezione
di un insieme, 199
di un punto su una retta, 61
prolungamento
di una funzione, 234
dispari, 253
pari, 253
propriet`a
associativa, 10
commutativa, 10
dei numeri reali, 9
della distanza, 188
della norma, 187
di Archimede, 26
di miglior approssimazione, 300
distributiva, 10
punto
aderente, 198
daccumulazione, 193, 194, 203, 209,
217
di esso, 329
di frontiera, 198
di massimo, 201, 310
relativo, 310, 311, 318
di minimo, 201, 310
relativo, 310, 311, 319
di sella, 322
sso, 234
interno, 197
isolato, 198, 203
stazionario, 322
quadrato di un numero reale, 12
quanticatori esistenziali, 4
radiante, 95
radice
(2n + 1)-sima, 234
n-sima, 36, 48
di un numero complesso, 104
di un polinomio, 407
quadrata, 17, 18
raggio di convergenza, 158, 159, 166
raggruppamento dei termini di una se-
rie, 177, 182
420
rapporto incrementale, 240, 330
reciproco, 10, 82
regola del parallelogrammo, 62
resto
di Taylor, 299, 367
di una serie, 127, 165
restrizione di una funzione, 214, 232,
233, 256
retta, 43, 65
per due punti, 67
tangente, 242
rette
parallele, 70
perpendicolari, 71, 72
riordinamento di una serie, 171
rotazione, 64, 79
salto di una funzione, 202
segmenti
paralleli, 70
perpendicolari, 71, 72
segmento, 67, 281
semipiano, 68
semiretta, 67
seno, 96
in coordinate, 102
iperbolico, 168
serie, 124
armonica, 126, 143
generalizzata, 131, 143
binomiale, 269
convergente, 124
assolutamente, 146
del settore seno iperbolico, 274
dellarcoseno, 273
dellarcotangente, 269
di potenze, 155
divergente negativamente, 125
divergente positivamente, 125
esponenziale, 132, 139, 156, 161, 183
geometrica, 125, 156, 182
indeterminata, 125
logaritmica, 268
telescopica, 126
settore
associato a una spezzata, 92
circolare, 91, 366
orientato, 91
iperbolico, 366
sferico, 280
sezione di R, 19
simbolo
+, 12, 18
, 12, 18
di appartenenza, 2
di doppia implicazione, 4
di implicazione, 4
di inclusione, 2
di inclusione propria, 2
di non appartenenza, 2
di non uguaglianza, 2
di prodotto, 23
di somma, 22
di uguaglianza, 2
di uguaglianza approssimata, 35
simmetria, 64, 79
della distanza, 189
sistema
di riferimento, 43, 61
dierenziale, 385
del primo ordine, 385
in forma normale, 386
lineare, 397
lineare, 409
soluzione
globale, 396
locale, 387
massimale, 396
somma
di numeri complessi, 81
421
di numeri reali, 10
di Riemann, 341
di una serie, 124
di potenze, 205
di una serie di potenze, 249, 284,
357
di vettori, 62, 185
inferiore, 334
parziale, 124
di una serie di potenze, 301
superiore, 334
sopragraco, 325
sottoinsieme, 2
sottosuccessione, 154, 182, 194
sottrazione
fra numeri, 11
fra vettori, 62
spazio
C
m
, 185
R
m
, 185
ane, 402
metrico, 189
vettoriale, 62, 185
spezzata, 91
circoscritta, 91
inscritta, 91
subadditivit`a
del modulo, 84
del valore assoluto, 44
della norma, 187
successione, 112
convergente, 113, 190
crescente, 129
decrescente, 129
denita per ricorrenza, 113
denitivamente monotona, 129
di Cauchy, 153, 391
di Fibonacci, 136, 167
divergente negativamente, 114
divergente positivamente, 114
innitesima, 127
limitata, 117, 194
limitata inferiormente, 117
limitata superiomente, 117
monotona, 129, 194
strettamente crescente, 129
strettamente decrescente, 129
strettamente monotona, 129
suddivisione, 334
equispaziata, 334, 340, 349
pi` u ne, 334
tangente, 99
teorema
dei carabinieri, 123, 162, 341
dei seni, 108
dei valori intermedi, 227
del dierenziale totale, 275
della media, 341
di permanenza del segno, 121, 207,
220, 311
di Bolzano-Weierstrass, 194
di Carnot, 108
di Cauchy, 181, 266, 292, 299
di confronto
per integrali, 378
per serie, 131
di confronto per serie, 120, 133
di Darboux, 271
di de lHopital, 292, 295
di derivazione
delle funzioni composte, 245, 278
delle funzioni inverse, 246
delle serie di potenze, 249, 268,
270
di dierenziabilit`a
delle funzioni composte, 279
di Dirichlet, 171, 182
di esistenza degli zeri, 226
di esistenza e unicit`a locale, 388
422
di Fermat, 310
di Heine-Cantor, 351
di Lagrange, 267, 275, 309
di grado k + 1, 299, 320
di Pitagora, 188
di Riemann, 175
di Rolle, 266, 323
multidimensionale, 323
di Schwarz, 283, 286
di Weierstrass, 225, 314
di Weirestrass, 266
fondamentale del calcolo integrale,
355
ponte, 217, 221
termini
di una serie, 124
di una successione, 112
traslazione, 63, 402
triangolo di Tartaglia, 32
unicit`a del limite, 118, 221
unione, 3
unit` a
di misura, 43
immaginaria, 4, 80
valore assoluto, 43
vettore, 62, 82, 185
vettori
linearmente dipendenti, 76
linearmente indipendenti, 76
ortogonali, 72, 186
423
Appunti di Analisi convessa
Paolo Acquistapace
6 luglio 2009
Indice
1 Spazi vettoriali topologici 1
1.1 Insiemi convessi . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Funzionale di Minkowski . . . . . . . . . . . . . . . . . . . . . 3
1.3 Topologie su uno spazio vettoriale . . . . . . . . . . . . . . . . 8
1.4 Completezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5 Operatori lineari e continui . . . . . . . . . . . . . . . . . . . . 23
1.6 Topologie deboli . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.7 Separazione di insiemi convessi . . . . . . . . . . . . . . . . . . 41
1.8 Punti estremi di insiemi convessi . . . . . . . . . . . . . . . . . 51
2 Funzioni convesse 56
2.1 Generalit`a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.2 Semicontinuit`a . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.3 Funzioni convesse semicontinue inferiormente . . . . . . . . . . 62
2.4 Funzioni convesse continue . . . . . . . . . . . . . . . . . . . . 72
2.5 Funzioni coniugate . . . . . . . . . . . . . . . . . . . . . . . . 76
2.6 Problemi di ottimizzazione . . . . . . . . . . . . . . . . . . . . 81
3 Calcolo in spazi di Banach 96
3.1 Integrale di Bochner . . . . . . . . . . . . . . . . . . . . . . . 96
3.2 Dierenziale di Frech`et . . . . . . . . . . . . . . . . . . . . . . 103
3.3 Dierenziale di Gateaux . . . . . . . . . . . . . . . . . . . . . 106
3.4 Loperatore di superposizione . . . . . . . . . . . . . . . . . . 108
3.5 Derivate successive . . . . . . . . . . . . . . . . . . . . . . . . 117
3.6 Massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . 121
3.7 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . 124
3.8 Variet`a tangente ad una curva di livello . . . . . . . . . . . . . 130
3.9 Massimi e minimi vincolati . . . . . . . . . . . . . . . . . . . . 135
i
4 Calcolo delle variazioni 140
4.1 Funzionali del calcolo delle variazioni . . . . . . . . . . . . . . 140
4.2 Lemmi fondamentali del calcolo delle variazioni . . . . . . . . 143
4.3 Equazione di Eulero . . . . . . . . . . . . . . . . . . . . . . . 147
4.4 Integrali primi . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.5 Condizione di Legendre . . . . . . . . . . . . . . . . . . . . . . 158
4.6 Il problema isoperimetrico . . . . . . . . . . . . . . . . . . . . 160
4.7 Geodetiche su una supercie . . . . . . . . . . . . . . . . . . . 163
5 Sottodierenziale 173
5.1 Denizione e propriet`a . . . . . . . . . . . . . . . . . . . . . . 173
5.2 Funzioni convesse sottodierenziabili . . . . . . . . . . . . . . 178
5.3 Regolarizzata di una funzione convessa . . . . . . . . . . . . . 187
6 Disequazioni variazionali 195
6.1 Problemi variazionali con vincoli convessi . . . . . . . . . . . . 195
6.2 Forme bilineari . . . . . . . . . . . . . . . . . . . . . . . . . . 197
6.3 Operatori monotoni . . . . . . . . . . . . . . . . . . . . . . . . 203
6.4 Filo elastico teso sopra un ostacolo . . . . . . . . . . . . . . . 211
7 Multifunzioni 219
7.1 Nomenclatura . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
7.2 Punti ssi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
7.3 Punti di sella . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
7.4 Teoria dei giochi . . . . . . . . . . . . . . . . . . . . . . . . . 236
7.5 Selezioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
7.6 Inclusioni dierenziali . . . . . . . . . . . . . . . . . . . . . . . 255
7.7 Multifunzioni monotone . . . . . . . . . . . . . . . . . . . . . 256
7.8 Alcune multifunzioni massimali monotone . . . . . . . . . . . 263
7.9 Inclusioni funzionali . . . . . . . . . . . . . . . . . . . . . . . . 273
Bibliograa 285
Indice analitico 287
ii
Capitolo 1
Spazi vettoriali topologici
1.1 Insiemi convessi
Questo corso `e dedicato alla descrizione, necessariamente sommaria, di alcuni
aspetti e metodi dellanalisi non lineare, con particolare riguardo a qualcuna
delle sue innumerevoli applicazioni.
Lanalisi convessa `e il principale argomento di cui ci occuperemo. Esso per
certi versi `e il pi` u vicino alle tematiche di analisi funzionale lineare svolte nel
primo modulo: frequentemente, infatti, i risultati dellanalisi convessa sono
le prime, naturali estensioni a casi non lineari di propriet`a gi`a dimostrate ed
analizzate nel caso lineare.
Ricordiamo, per cominciare, la nozione di insieme convesso.
Denizione 1.1.1 Sia X uno spazio vettoriale su R o su C. Un sottoinsie-
me E X si dice convesso se si ha
x + (1 )x

E [0, 1], x, x

E.
Osservazione 1.1.2 Le intersezioni, nite od innite, di insiemi convessi
sono insiemi convessi. Inoltre se E, F X sono convessi, allora gli insiemi
E = x X : x = y, y E ( R oppure C),
E +F = x X : x = u +v, u E, v F
sono convessi.
1
Inoltre, se X, Y sono spazi vettoriali e se F : X Y `e unapplicazione
lineare, allora valgono le implicazioni seguenti:
A X convesso = F(A) Y convesso,
B Y convesso = F
1
(B) X convesso.
Denizione 1.1.3 Sia E un sottoinsieme dello spazio vettoriale X. L
inviluppo convesso di E `e linsieme
co(E) =
_
n

k=1

k
x
k
: n N
+
, x
k
E,
k
0,
n

k=1

k
= 1
_
.
Dunque co(E) `e il pi` u piccolo insieme convesso contenente E.
Esercizi 1.1
1. Sia X uno spazio vettoriale e sia U
t

t]a,b[
una famiglia di sottoinsiemi
convessi di X tale che U
t
U
s
per t s. Si mostri che

t]a,b[
U
t
`e un
insieme convesso.
2. Sia X uno spazio vettoriale. Si provi che:
(i) se U X e , > 0 si ha U + U ( + )U con inclusione
stretta in generale;
(ii) un sottoinsieme U X `e convesso se e solo se U+U = (+)U
per ogni , > 0.
3. Sia X uno spazio vettoriale. Un sottoinsieme U di X si dice radiale, od
assorbente, se 0 U e se per ogni x X esiste > 0 tale che x U
per ogni ]0, [. Si provi che le propriet`a U `e convesso e contiene
0 e U `e radiale sono fra loro indipendenti.
4. Un sottoinsieme E di uno spazio vettoriale X si dice bilanciato, o
cerchiato, se risulta E E per [[ 1. Si provi che:
(i) un convesso che contiene lorigine non `e necessariamente bilanciato;
(ii) un insieme bilanciato contiene lorigine ma non `e necessariamente
convesso;
2
(iii) un insieme radiale non `e necessariamente bilanciato;
(iv) un insieme bilanciato non `e necessariamente radiale.
5. Si determini linviluppo convesso dei seguenti insiemi:
(i) E = (x, y) R
2
: [x[ 1, [y[ 1, xy = 0;
(ii) E = (x, y) R
2
: y e
x
;
(iii) E = z C : z = e
i
, Z.
6. Sia X uno spazio vettoriale. Si mostri che
t(U V ) = tU tV, t(U V ) = tU tV t R, U, V X.
7. Determinare linviluppo convesso del sottoinsieme di R
2
costituito dai
punti (k, 1/[k[), k Z 0.
1.2 Funzionale di Minkowski
Ad ogni sottoinsieme E di uno spazio vettoriale X possiamo associare una
funzione reale p
E
denita su X, dotata di interessanti propriet`a che sono par-
ticolarmente signicative, come vedremo, allorche E `e un convesso contenente
lorigine.
Denizione 1.2.1 Sia E un sottoinsieme dello spazio vettoriale X. Il fun-
zionale di Minkowski di E `e la funzione p
E
: X [0, ] denita da
p
E
(x) = inf > 0 : x tE t
(con la convenzione che p
E
(x) = + quando linsieme a secondo membro `e
vuoto).
Si osservi che il numero p
E
(x) `e lestremo inferiore di una semiretta, even-
tualmente vuota: pu`o benissimo succedere, in eetti, che sia p
E
(x) = +
per qualche x. Ad esempio, se E = y con y ,= 0, si ha p
E
(x) = +
per ogni x X; se invece E `e il semidisco di R
2
di centro (0, 0) e raggio 1
contenuto nel semipiano y 0, allora p
E
(x, y) = + se e solo se y < 0. Ha
interesse, perci`o, sapere per quali insiemi E il funzionale p
E
`e nito su X.
3
Proposizione 1.2.2 Sia X uno spazio vettoriale, sia E X. Risulta
p
E
(x) < per ogni x X se e solo se E `e radiale, ossia se e solo se
0 E e per ogni x X esiste > 0 tale che x E per qualunque ]0, [
(esercizio 1.1.3).
Dimostrazione (=) Sia p
E
(x) < per ogni x X. Dalle propriet`a
dellestremo inferiore segue che x tE per ogni t > p
E
(x); pertanto x E
per ogni <
1
p
E
(x)
(intendendo < +se p
E
(x) = 0). In particolare 0 tE
per ogni t > p
E
(0) e pertanto 0 = 0/t E. Ci`o prova che E `e radiale.
(=) Sia x X. Per ipotesi si ha x
1

E per ogni ]0, [, ossia x tE


per ogni t >
1

. Ci`o prova che p


E
(x)
1

< .
Vediamo ora le principali propriet`a del funzionale di Minkowski.
Proposizione 1.2.3 Sia E un sottoinsieme dello spazio vettoriale X. Val-
gono i fatti seguenti:
(i) 0 E se e solo se p
E
(0) = 0;
(ii) se x ,= 0, allora p
E
(x) = 0 se e solo se x : > 0 E;
(iii) si ha p
E
(x) = p
E
(x) per ogni > 0 e per ogni x X;
(iv) se e
i
E = E per ogni R, allora p
E
(x) = [[p
E
(x) per ogni
C 0 e per ogni x X;
(v) se E `e convesso, allora p
E
(x +x

) p
E
(x) +p
E
(x

) per ogni x, x

X.
Dimostrazione (i) Basta osservare che se t > 0 si ha 0 tE se e solo se
0 E.
(ii) Sia x ,= 0; per denizione si ha p
E
(x) = 0 se e solo se x tE per ogni
t > 0, ossia se e solo se x E per ogni > 0.
(iii) Se p
E
(x) = +, allora chiaramente p
E
(x) = +. Se invece p
E
(x) <
+, si ha
p
E
(x) = inf > 0 : x tE t =
= inf
_
> 0 : x sE s

_
=
= inf > 0 : x sE s = p
E
(x).
4
(iv) Proviamo anzitutto che p
E
(e
i
x) = p
E
(x) per ogni x X e R.
Dallipotesi segue facilmente che p
E
(x) = + se e solo se p
E
(e
i
x) = +.
Se invece queste quantit`a sono nite, se t > p
E
(x) si ha x tE e quindi
e
i
x e
i
(tE) = t(e
i
E) = tE t > p
E
(x),
da cui p
E
(e
i
x) p
E
(x). Scambiando i ruoli di x e e
i
x si ottiene laltra
disuguaglianza.
Se ora = [[e
i
C 0, si ha, usando (iii),
p
E
(x) = p
E
([[e
i
x) = [[p
E
(e
i
x) = [[p
E
(x),
da cui la tesi.
(v) Possiamo supporre che p
E
(x) e p
E
(x

) siano entrambi niti. Poiche E


`e convesso, si ha E + E = ( + )E per ogni , 0 (esercizio 1.1.2).
Poiche risulta x tE per ogni t > p
E
(x) e x

sE per ogni s > p


E
(x

), si
deduce x +x

(t +s)E per ognuno di tali t, s; quindi x +x

E per ogni
> p
E
(x) +p
E
(x

). Ci`o implica p
E
(x +x

) p
E
(x) +p
E
(x

).
Osservazione 1.2.4 Se lo spazio X `e reale, la propriet`a (iv) della proposi-
zione precedente vale per ogni R0 supponendo solamente che linsieme
E sia simmetrico, ossia E = E.
Una nozione che useremo spesso nel seguito `e quella di seminorma: le se-
minorme sono importanti perche, come vedremo, consentono di costruire
topologie dotate di buone propriet`a.
Denizione 1.2.5 Una seminorma nello spazio vettoriale X `e una funzione
p : X [0, [ tale che
(i) p(x) = [[p(x) per ogni R (oppure per ogni C) e per ogni
x X;
(ii) p(x +x

) p(x) +p(x

) per ogni x, x

X.
Osservazione 1.2.6 Dalla denizione segue immediatamente che ogni semi-
norma p su X verica p(0) = 0 e [p(x)p(x

)[ p(xx

) per ogni x, x

X.
In particolare, ogni seminorma verica p(0) = 0, ma non `e detto che valga
limplicazione p(x) = 0 = x = 0; ci`o vale se e solo se p `e una norma su
X. Inoltre si verica subito che se p `e una seminorma su X allora gli insiemi
U
c
= x X : p(x) < c, c > 0,
5
sono convessi e radiali, nonche bilanciati, ossia tali che U
c
U
c
per [[ 1
(esercizio 1.1.4).
Esempio 1.2.7 Se E `e un sottoinsieme dello spazio vettoriale X che `e ra-
diale, bilanciato e convesso, allora il funzionale di Minkowski p
E
`e una semi-
norma su X in virt` u della proposizione 1.2.3.
`
E vero anche il viceversa: se p
`e una seminorma sullo spazio vettoriale X, allora (esercizio 1.2.6) p coincide
col funzionale di Minkowski p
U
, ove
U = x X : p(x) < 1.
Esercizi 1.2
1. Si forniscano esempi di insiemi contenenti lorigine che siano:
(a) convessi ma non radiali;
(b) radiali ma non convessi;
(c) convessi ma non bilanciati;
(d) bilanciati ma non convessi;
(e) bilanciati ma non radiali;
(f) radiali ma non bilanciati.
2. Si consideri il funzionale di Minkowski del sottoinsieme E = B(0, 1)
1 di C. Si provi che valgono le relazioni
p
E
(z) = [[p
E
(z) C, z C
benche si abbia e
i
E ,= E per ,= 2k, k Z.
3. Si consideri il funzionale di Minkowski del sottoinsieme E = B(0, 1)
z C : [z[ = 2 di C. Si provi che
p
E
(z +z

) p
E
(z) +p
E
(z

) z, z

C
benche linsieme E non sia convesso.
4. Si provi che se E `e un sottoinsieme convesso dello spazio vettoriale X
che contiene 0, allora
p
E
(x) = infr > 0 : x rE x X;
6
si dia anche un esempio di sottoinsieme E X tale che 0 E ma per
il quale risulti, per almeno un x X,
infr > 0 : x rE < p
E
(x).
5. Si provi che se X `e uno spazio vettoriale, e se U V X, allora p
U

p
V
. Se ne deduca che se U
i

iI
`e unarbitraria famiglia di sottoinsiemi
di X, allora
p
T
iI
U
i
= sup
iI
p
U
i
, p
S
iI
U
i
= inf
iI
p
U
i
.
6. Sia p una seminorma denita sullo spazio vettoriale X. Posto per c > 0
U
c
= x X : p(x) < c,
si provi che p
Uc
(x) =
p(x)
c
per ogni x X.
7. Sia X uno spazio vettoriale, sia E X. Si provi che
x X : p
E
(x) < 1 E,
e che inoltre se E `e convesso e 0 E, allora
E x X : p
E
(x) 1.
8. Sia X uno spazio normato. Se U `e un intorno di 0, si provi che esiste
M 0 tale che p
U
(x) M|x|
X
per ogni x X.
9. Si determini il funzionale di Minkowski p
E
nei casi seguenti:
(i) X spazio normato, E = X;
(ii) X spazio normato, E = B(0, r);
(iii) X = R
2
, E = (x, y) R
2
: ax + by c, con a, b R e c > 0
ssati;
(iv) X = R
2
, E = (x, y) R
2
: x
2
+y
2
1, y 0;
(v) X =
2
, E = x = x
n

nN
: [x
j
[ 1, con j N ssato.
7
1.3 Topologie su uno spazio vettoriale
In molte applicazioni dellanalisi non lineare gli spazi di Banach non sono
sucientemente generali. Ad esempio, per ottenere lesistenza di soluzioni
per certi problemi, occorrono risultati di compattezza che valgono in molti
di questi spazi soltanto se si fa uso di topologie pi` u deboli di quella indotta
dalla norma; rispetto a tali topologie lo spazio perde la sua struttura metri-
ca, mantenendo solo quella di spazio vettoriale topologico, in cui lunico
requisito richiesto `e la continuit`a delle operazioni di somma e prodotto per
scalari rispetto alla topologia.
`
E quindi utile fare un esame sommario delle
caratteristiche di questi spazi.
Denizione 1.3.1 Uno spazio vettoriale topologico `e uno spazio vettoria-
le X dotato di una topologia , rispetto alla quale sono continue le due
applicazioni
(x, y) x +y da X X in X,
(, x) x da R X in X, oppure da C X in X.
Da questa denizione segue subito che le traslazioni x x+x
0
e le omotetie
x x, con x
0
X e C 0 ssati, sono omeomorsmi di X in
se.
`
E anche chiaro che la topologia di uno spazio vettoriale topologico `e
univocamente individuata se si ssano gli intorni U di 0: gli intorni di ogni
altro punto x ,= 0 sono semplicemente gli insiemi traslati x +U.
Osservazione 1.3.2 In un qualunque spazio vettoriale topologico, ogni in-
torno U di 0 contiene un intorno W di 0 che `e bilanciato. Infatti, per la
continuit`a del prodotto, esistono > 0 ed un intorno V di 0 tali che V U
per [[ < ; quindi, posto
W =
_
||<
V,
risulta W U, e W `e ovviamente bilanciato. Si noti che W `e anche radiale
(esercizio 1.3.1). Se lintorno U `e anche convesso, non `e detto che anche W
lo sia; tuttavia in tal caso `e facile vericare che linsieme co(W) `e ancora
un intorno di 0 che `e contenuto in U, convesso, radiale, nonche bilanciato in
virt` u dellesercizio 1.3.10.
La proposizione che segue caratterizza gli spazi vettoriali topologici che sono
di Hausdor.
8
Proposizione 1.3.3 Sia X uno spazio vettoriale topologico, sia U
i

iI
un
sistema fondamentale di intorni dellorigine. Lo spazio X `e di Hausdor se
e solo se

iI
U
i
= 0.
Dimostrazione (=) Sia X di Hausdor: allora se x
0
,= 0 esiste un intorno
U
i
tale che x
0
/ U
i
, e quindi x
0
/

iI
U
i
.
(=) Sia x
0
,= 0: per ipotesi esiste i I tale che x
0
/ U
i
. Poiche lap-
plicazione (x, y) x y `e continua, esiste j I tale che x y U
i
per
ogni x, y U
j
; ci`o signica che U
j
U
j
U
i
. Se ne deduce che U
j
`e di-
sgiunto da x
0
+U
j
: infatti in caso contrario troveremmo x
1
, x
2
U
j
tali che
x
0
+x
1
= x
2
, da cui x
0
= x
2
x
1
U
j
U
j
U
i
, cosa che non `e. Quindi x
0
e 0 hanno intorni disgiunti. Per traslazione, due arbitrari punti distinti x, x

hanno intorni disgiunti.


Denizione 1.3.4 Uno spazio vettoriale topologico X si dice localmente
convesso se esiste un sistema fondamentale di intorni di 0 costituito da
insiemi convessi.
Gli spazi vettoriali topologici localmente convessi sono importanti perche la
loro topologia pu`o essere caratterizzata mediante una famiglia di seminorme,
il che ne rende pi` u comodo lo studio.
Sia p
i

iI
una famiglia arbitraria di seminorme denite su uno spazio vet-
toriale X: vediamo ora come esse generino una topologia che rende
X uno spazio vettoriale topologico localmente convesso. Fissati k N
+
e
i
1
, . . . , i
k
I, deniamo per x X ed > 0
V
i
1
,...,i
k
,
(x) = X : p
i
h
( x) < per h = 1, . . . , k.
Gli insiemi V
i
1
,...,i
k
,
(x) sono convessi (osservazione 1.2.6), ed `e facile consta-
tare che per ogni x X la famiglia
1(x) = V
i
1
,...,i
k
,
(x) : k N
+
, i
1
, . . . , i
k
I, > 0,
verica gli assiomi relativi ad un sistema fondamentale di intorni di x; quindi
esiste una ed una sola topologia su X rispetto alla quale, per ogni x X,
1(x) `e un sistema fondamentale di intorni di x. Rispetto a questa topologia
le applicazioni (, x) x e (x, y) x + y sono continue, come facile
conseguenza delle relazioni
p
i
(x) = [[p
i
(x), p
i
(x +y) p
i
(x) +p
i
(y);
9
dunque la topologia rende X uno spazio vettoriale topologico localmente
convesso.
Si noti che tutte le seminorme p
i
sono automaticamente continue rispetto
a , a causa della disuguaglianza [p
i
(x) p
i
(y)[ p
i
(x y). Vale anche il
viceversa: se (X, ) `e uno spazio vettoriale topologico localmente convesso,
esiste una famiglia di seminorme su X che genera la topologia . Infatti,
sia U
i

iI
un sistema fondamentale di intorni convessi di 0 nella topologia
, che possiamo sempre supporre bilanciati e radiali (osservazione 1.3.2): i
funzionali di Minkowski p
U
i
ad essi associati sono seminorme (esempio 1.2.7),
che vericano, in virt` u dellesercizio 1.3.2,
x X : p
U
i
(x) < 1 U
i
x X : p
U
i
(x) 1,
e quindi generano .
Vi `e un facile criterio, basato sulle seminorme, per stabilire se un dato spazio
vettoriale topologico `e di Hausdor o no. Esso `e espresso dallenunciato che
segue.
Proposizione 1.3.5 Sia X uno spazio vettoriale, sia p
i

iI
una famiglia
di seminorme denite su X. La topologia generata dalle p
i
`e di Hausdor se
e solo se le p
i
separano i punti, ossia per ogni x X 0 esiste i I tale
che p
i
(x) > 0.
Dimostrazione Per la proposizione 1.3.3, X `e di Hausdor se e solo se
lintersezione di tutti gli intorni
V
i
1
,...,i
k
,
= x X : p
i
h
(x) < per h = 1, . . . , k,
al variare di k N
+
, i
1
, . . . , i
k
I, ed > 0, `e uguale a 0. Poiche tale
intersezione coincide con

iI
p
1
i
(0), X `e di Hausdor se e solo se non vi `e
alcun x ,= 0 tale che p
i
(x) = 0 per ogni i I. Ci`o prova la tesi.
Alcuni spazi vettoriali topologici di Hausdor sono particolarmente impor-
tanti perche su di essi `e possibile denire una metrica:
Proposizione 1.3.6 Sia X uno spazio vettoriale topologico localmente con-
vesso e di Hausdor. Allora X `e metrizzabile se e solo se esiste un sistema
fondamentale di intorni di 0 che `e numerabile.
Lipotesi di locale convessit`a sarebbe superua, ma semplica la dimostra-
zione, e daltronde `e il caso che pi` u ci interessa.
10
Dimostrazione
`
E chiaro che se X `e metrizzabile allora le palle di centro 0 e
raggio
1
n
formano un sistema fondamentale di intorni di 0 che `e numerabile.
Viceversa, sia U
n

nN
un sistema fondamentale di intorni di 0 numerabile
e fatto di intorni convessi, bilanciati e radiali (osservazione 1.3.2). Allora, in
virt` u dellesercizio 1.2.7, gli insiemi x X : p
Un
(x) < 1 costituiscono un
sistema fondamentale di intorni di 0 equivalente a quello degli U
n
. Perci`o,
denendo
d(x, y) =

n=0
2
n
p
Un
(x y)
1 +p
Un
(x y)
x, y X,
si ottiene una distanza su X che induce la topologia data.
Osservazione 1.3.7 Si noti che la distanza sopra denita `e invariante per
traslazioni, cio`e d(x + z, y + z) = d(x, y) per ogni x, y, z X. Questa
propriet`a non `e automatica: ad esempio, nellinsieme R, che `e uno spazio
vettoriale topologico metrizzabile con lovvia distanza d(x, y) = [x y[, vi
`e la distanza equivalente (x, y) = [ arctan x arctan y[ che induce la stessa
topologia ma non `e invariante per traslazioni.
Esercizi 1.3
1. Sia X uno spazio vettoriale topologico. Si provi che ogni intorno di 0
`e radiale.
2. Sia X uno spazio vettoriale topologico e sia U un convesso contenente
lorigine. Si provi che:
(i) se U `e aperto, allora U = x X : p
U
(x) < 1;
(ii) se U `e chiuso, allora U = x X : p
U
(x) 1.
3. Sia X uno spazio vettoriale topologico. Si provi che se U `e un intorno
di 0, allora U `e un intorno di 0 per ogni ,= 0.
4. Sia X uno spazio vettoriale topologico e sia U un intorno di 0. Si provi
che X =

s>0
sV .
5. Sia X uno spazio vettoriale topologico. Si provi che per ogni intorno
U di 0 esiste un altro intorno V di 0 tale che V +V U.
6. Si provi che in ogni spazio vettoriale topologico lorigine ha un sistema
fondamentale di intorni chiusi.
11
7. Sia X uno spazio vettoriale topologico. Si provi che se A X `e un
aperto, allora il suo inviluppo convesso co(A) `e aperto.
8. Sia E un sottoinsieme di uno spazio vettoriale X e sia una qualun-
que topologia su X (che lo renda uno spazio vettoriale topologico).
Linviluppo convesso chiuso di E `e il pi` u piccolo insieme convesso e
chiuso che contiene E. Si verichi che esso coincide con co(E).
9. Sia X uno spazio vettoriale topologico, sia K un convesso non vuoto di
X. Si provi che

K,= se e solo se le chiusure di

K e di K coincidono.
10. Sia W un insieme bilanciato in uno spazio vettoriale topologico X. Si
provi che co(W) `e bilanciato.
1.4 Completezza
Sia X uno spazio vettoriale topologico. Andiamo a denire la nozione di
completezza dello spazio X. Le nozioni di successione di Cauchy e di succes-
sione convergente (a valori in X) sono ben note: x
n
x in X se per ogni
intorno U di 0 esiste N tale che x
n
x U per ogni n > ; x
n
`e di
Cauchy in X se per ogni intorno U di 0 esiste N tale che x
n
x
m
U per
ogni n, m > . Utilizzando la continuit`a della somma in X si ottiene anche
che ogni successione convergente `e di Cauchy. Se la topologia di X `e generata
da una famiglia di seminorme p
j

jJ
, si vede facilmente che x
n
x in X
se e solo se si ha p
j
(x
n
x) 0 in R per ogni seminorma p
j
.
Cominciamo con il caso in cui 0 ha un sistema fondamentale di intorni
numerabile.
Denizione 1.4.1 Sia X uno spazio vettoriale topologico tale che 0 abbia
un sistema fondamentale di intorni numerabile. Diciamo che X `e completo
se ogni successione di Cauchy in X converge ad un elemento di X.
Nel caso generale, eliminando lipotesi che 0 abbia un sistema fondamentale
di intorni numerabile, la completezza di X si fonda sul concetto di successione
generalizzata, o net.
Denizione 1.4.2 Un insieme diretto, o ltrante, `e un insieme (I, ) par-
zialmente ordinato, con la propriet`a che per ogni i, j I esiste h I con
h i e h j. Una successione generalizzata, o net, a valori in un insieme
X `e una famiglia x
i

iI
di punti di X, ove I `e un insieme ltrante.
12
Esempi 1.4.3 (1) Poiche N `e un insieme ltrante, ogni successione x
n

contenuta in un ssato insieme X `e un net a valori in X.


(2) La famiglia | degli intorni di 0 in un arbitrario spazio topologico `e un in-
sieme ltrante rispetto allordinamento parziale dellinclusione rovesciata:
se U, V |, si denisce U V se U V . Quindi ogni famiglia di punti
della forma x
U

UU
`e un net a valori in X.
(3) Un ordinamento parziale in R
2
`e dato da
(x, y) (x

, y

) x < x

oppure x = x

e y y

.
Con questo ordinamento, R
2
`e un insieme ltrante e ogni funzione f : R
2

X denisce il net f(x, y)


(x,y)R
2 a valori in X.
Denizione 1.4.4 Sia X uno spazio vettoriale topologico. Diciamo che un
net x
i

iI
contenuto in X converge ad un punto x X se per ogni intorno
U di 0 esiste i
0
I tale che x
i
x U per ogni i I, i i
0
. Il net `e di
Cauchy in X se per ogni intorno U di 0 esiste i
0
I tale che x
i
x
j
U
per ogni i, j I, i, j i
0
.
Nuovamente, ogni net convergente `e di Cauchy. Se la topologia di X `e
generata da una famiglia di seminorme p
j

jJ
, un net x
i

iI
X converge
allelemento x in X se e solo se per ogni j J il net p
j
(x
i
x)
iI
R `e
innitesimo (tende a 0).
Denizione 1.4.5 Uno spazio vettoriale topologico X si dice completo se
ogni net di Cauchy in X converge ad un elemento x di X.
Denizione 1.4.6 Uno spazio vettoriale topologico localmente convesso, di
Hausdor, completo `e detto spazio di Frech`et.
Vediamo ora alcuni esempi importanti di spazi vettoriali topologici, completi
e non.
Esempio 1.4.7 Ogni spazio normato `e uno spazio vettoriale topologico lo-
calmente convesso e di Hausdor; le palle B(0,
1
n
) costituiscono un sistema
fondamentale numerabile di intorni di 0 convessi. Se lo spazio normato `e
completo, esso `e uno spazio di Frech`et.
Esempio 1.4.8 Consideriamo per p ]0, 1[ lo spazio
13

p
=
_
x = x
n

nN
C : (x) =

n=0
[x
n
[
p
<
_
;
la disuguaglianza (a + b)
p
a
p
+ b
p
, valida per ogni a, b 0, mostra che
p
`e uno spazio vettoriale, e che la quantit`a
d(x, y) = (x y) =

n=0
[x
n
y
n
[
p
, x, y
p
,
`e una distanza su
p
; si noti che (x) non `e una norma perche (x) =
[[
p
(x).
`
E chiaro che somma ed il prodotto per scalari sono applicazioni
continue rispetto a questa distanza; quindi
p
`e uno spazio vettoriale topolo-
gico di Hausdor, ed `e anche uno spazio metrico completo (esercizio 1.4.6).
Tuttavia
p
non `e localmente convesso (e quindi non `e uno spazio di Frech`et).
Infatti in caso contrario, posto B(r) = x
p
: (x) r, esisterebbe un
intorno convesso W di 0 tale che W B(1); scelto m N
+
in modo che
B(m
p
) W, utilizzando lomotetia x mx si deduce
B(1) = mB(m
p
) mW mB(1) = B(m
p
) B(m).
Consideriamo daltronde la famiglia e
(n)

nN
, ove e
(n)
`e la successione che
ha tutte la componenti nulle tranne la n-sima che vale 1. Si ha e
(n)
B(1),
quindi e
(n)
appartiene al convesso mW per ogni n N. Pertanto anche
g
(n)
=
1
n
n1

k=0
e
(k)
appartiene a mW per ogni n N
+
. Daltra parte
(g
(n)
) = n
1p
per n ,
mentre, essendo mW B(m), dovrebbe aversi (g
(n)
) m per ogni n N
+
.
Ci` o `e assurdo.
Esempio 1.4.9 Sia un aperto non vuoto di R
N
; ssato m N, consideria-
mo lo spazio C
m
() delle funzioni che sono continue su insieme con le loro
derivate no allordine m incluso. Se K
n

nN
`e una successione strettamente
crescente di compatti (ossia K
n

Kn+1
), la cui unione `e , ponendo
14
p
n
(f) = sup
Kn

||m
[D

f[
si ottiene una famiglia numerabile di seminorme che separano le funzioni di
C
m
(): infatti se f ,= 0 esiste certamente un n N per il quale p
n
(f) >
0. Dunque, per ogni m N, C
m
() `e uno spazio vettoriale topologico
localmente convesso, di Hausdor, metrizzabile; in particolare, la topologia
`e indipendente dalla scelta della successione di compatti K
n
, e si ha f
n

f in C
m
() se e solo se per ogni compatto K si ha D

f
n
D

f
uniformemente in K per ogni multi-indice N
N
con [[ m. Da noti
teoremi sulla convergenza uniforme segue che C
m
() `e uno spazio di Frech`et.
Esempio 1.4.10 Consideriamo lo spazio C

() delle funzioni innitamente


derivabili denite sullaperto non vuoto R
N
. Ovviamente C

()
C
m
() per ogni m N; se vogliamo, come `e naturale, che questa immersione
sia continua, occorre mettere su C

() una topologia tale che per ogni


m N e per ogni compatto K gli insiemi
_
_
_
f C

() : sup
K

||m
[D

f[ <
_
_
_
, > 0,
siano -intorni di 0. La meno ne topologia per cui questo accade si pu`o
costruire nel modo seguente: si sceglie una successione strettamente crescente
di compatti K
n

nN
che invada , e si introduce la famiglia numerabile di
seminorme p
mn

m,nN
cos` denite:
p
mn
(f) = sup
Kn

||m
[D

f[.
Poiche, ovviamente, queste seminorme separano gli elementi di C

(), la
topologia da esse generata `e localmente convessa e di Hausdor; in particolare
C

() `e metrizzabile. Si ha f
n
f in C

() se e solo se per ogni compatto


K e per ogni N
N
si ha D

f
n
D

f uniformemente in K. Si
conclude che C

() `e uno spazio di Frech`et immerso con continuit`a in tutti


gli spazi C
m
().
Esempio 1.4.11 Questo esempio `e meno facile ma pi` u importante. Per
m N sia C
m
0
() lo spazio delle funzioni f C
m
() il cui supporto `e
compatto nellaperto R
N
. Osserviamo che se K `e un ssato compatto
contenuto in , allora il sottospazio C
m
K
(), costituito dalle funzioni di C
m
0
()
che hanno supporto contenuto in K, `e uno spazio di Banach con la norma
15
p
m
K
(f) = sup
K

||m
[D

f[;
inoltre, se K e K

sono compatti tali che K K

, limmersione natu-
rale C
m
K
() C
m
K
() `e unisometria di C
m
K
() su un sottospazio chiuso di
C
m
K
(). Notiamo poi che, ovviamente,
C
m
0
() =
_
K compatto
C
m
K
().
Introduciamo su C
m
0
() la topologia indotta dalla famiglia di seminorme
costruite nel modo seguente: considerato linsieme c
+
0
delle successioni in-
nitesime di numeri positivi, e ssata una successione crescente di compatti
K
n

nN
tale che K
0
= e

nN
K
n
= , per ogni successione a = a
n

nN

c
+
0
si denisce la seminorma
p
a
(f) = sup
N
sup
x\K
1
a

||m
[D

f(x)[.
Si noti che in eetti, essendo K
0
= , p
a
`e una norma. In particolare, la
famiglia p
a

ac
+
0
denisce su C
m
0
() una topologia localmente convessa e
di Hausdor. Il motivo per il quale si considera lintera famiglia p
a

ac
+
0
anziche una singola norma `e chiarito dal risultato seguente:
Proposizione 1.4.12 La topologia sopra descritta `e la pi` u ne topologia
localmente convessa nello spazio C
m
0
() rispetto alla quale, per ogni compatto
K , limmersione C
m
K
() C
m
0
() `e continua.
Dimostrazione Per provare la tesi dobbiamo mostrare che gli intorni del-
lorigine nella topologia sopra denita sono tutti e soli gli insiemi convessi
dotati della propriet`a che per ogni compatto K la loro intersezione con
lo spazio C
m
K
() `e un intorno convesso dellorigine in C
m
K
().
A questo scopo basta considerare il sistema fondamentale di intorni dellori-
gine della forma V
a
= f C
m
0
() : p
a
(f) < 1. Sia quindi a = a

c
+
0
:
si ha
V
a
=
_
_
_
f C
m
0
() :

||m
[D

f(x)[ < a

x K

, N
_
_
_
,
16
e quindi
V
a
C
m
K
() =
_
f C
m
K
() :

||m
[D

f(x)[ < a
j
x K
j
, j = 0, 1, . . . , 1
_
.
In particolare
f C
m
K
() : p
m
K
(f) < mina
0
, a
1
, . . . , a
1
V
a
C
m
K
(),
cio`e V
a
C
m
K
() `e un intorno convesso dellorigine in C
m
K
() per ogni N.
Viceversa, sia W C
m
0
() un convesso tale che, per ogni N, WC
m
K
()
sia un intorno dellorigine in C
m
K
(): proviamo che esiste una successione
a c
+
0
tale che W V
a
.
Poiche W C
m
K
+2
() `e intorno di 0 in C
m
K
+2
(), risulta
W C
m
K
+2
() f C
m
K
+2
() : p
m
K
+2
(f) <

,
ove =

`e un opportuno elemento di c
+
0
. Sia

N
una partizione
dellunit`a di classe C
m
associata al ricoprimento di costituito dalle corone
aperte

K+2
K

. Scrivendo una generica f C


m
0
() in forma di somma
(necessariamente nita, in realt`a)
f =

=0
2
1
(2
+1

f),
dalla convessit`a di W seguir`a f W purche si abbia 2
+1

f W per ogni
N. Osserviamo che per ogni N esiste C

> 0 tale che, per qualsiasi


f C
m
0
(),
sup
\K

||m
[D

f[ a

= sup

2
+1

||m
[D

f)[ C

in virt` u del fatto che

`e nulla su K

. Scegliamo la successione a = a

in modo che sia C

<

per ogni N: allora se f V


a
, per ogni N
si ha 2
+1

f C
m
K
+2
() e p
m
K
+2
(2
+1

f) <

, ossia 2
+1

f W. In
denitiva W contiene lintorno V
a
e pertanto `e un intorno convesso dellorigine
in C
m
0
(). Ci`o prova la tesi.
17
Teorema 1.4.13 Sia un aperto di R
N
, e sia m N. Valgono i seguenti
fatti:
(i) C
m
0
() non `e metrizzabile;
(ii) C
m
0
() `e uno spazio di Frech`et.
Dimostrazione (i) Basta far vedere che per ogni sottofamiglia numerabi-
le V
a
(n)
nN
del sistema V
a
esiste un intorno V
a
che non contiene alcun
elemento della sottofamiglia. Possiamo supporre che per ogni n N la suc-
cessione a
(n)
= a
(n)


N
sia decrescente e contenuta in ]0, 1[. Per ogni j N
sia
a
j
=
j

n,=0
a
(n)

e poniamo a = a
j

jN
: la successione a `e un elemento di c
+
0
e inoltre a
j
<
a
(n)
j
per ogni j N e n j. Sia, per assurdo, V
a
(n) V
a
: se f C
m
0
() ha
supporto contenuto in

Kn+1
K
n
, e se la quantit`a
C = sup

||m
[D

f[
`e sucientemente grande, allora la funzione g =
1
C+1
a
(n)
n
f appartiene a V
a
(n)
ma non a V
a
.
(ii) Sia f
i

iI
un net di Cauchy in C
m
0
(). Allora per ogni successione
innitesima a di numeri positivi esiste i
a
I tale che

||m
[D

f
i
(x) D

f
j
(x)[ < a

x K

, N, i, j i
a
.
Proviamo ora il seguente
Lemma 1.4.14 Se f
i

iI
`e un net di Cauchy in C
m
0
(), allora esistono un
compatto K e un indice i
0
I tali che il supporto di tutte le f
i
, per
i i
0
, `e contenuto in K.
Dimostrazione Supponiamo, per assurdo, che la tesi del lemma non sia
vera: allora per ogni N
+
e per ogni i I esisteranno una funzione
18
f
j
,i
f
j

ji
e un punto x
,i
K

tali che f
j
,i
(x
,i
) ,= 0. Per ogni i I
consideriamo linsieme
W
i
=
_
g C
m
0
() : [g(x
,i
)[ <
1

[f
j
,i
(x
,i
)[ N
+
_
e scegliamo una successione a
(i)
= a
(i)


N
c
+
0
con a
(i)

<
1

[f
j
,i
(x
,i
)[ per
ogni N
+
; allora si ha per ogni i I
V
a
(i) =
_
_
_
g C
m
0
() :

||m
[D

g(x)[ < a
(i)

x K

, N
_
_
_
W
i
.
Dunque, per ogni i I linsieme W
i
`e un intorno di 0 e inoltre f
j
,i
/ W
i
per ogni N
+
. Pertanto
f
j

ji
/ W
i
> 0, i I.
Daltra parte, in virt` u dellesercizio 1.4.2, per ogni i I esistono h
i
I e

i
> 0 tali che f
j
W
i
per ogni >
i
e per ogni j h
i
: in altre parole,
f
j

jh
i
W
i
>
i
, i I.
Le ultime due propriet`a si contraddicono luna con laltra e ci`o prova il lemma.
Dal lemma 1.4.14 segue subito che esistono un compatto K e un indice
i
o
I tali che il net f
i

ii
0
`e di Cauchy rispetto alla norma di C
m
K
(),
e quindi converge in tale norma a una funzione f C
m
K
(). Ma allora
f C
m
0
(); inoltre, per ogni successione a
n
c
+
0
si ha denitivamente
rispetto a i

||m
[D

f
i
(x) D

f(x)[ < a
n
x K
n
, n N;
infatti se N `e tale che K K

avremo

||m
[D

f
i
(x) D

f(x)[ = 0 < a
n
x K
n
, n , i i
0
,
mentre per n = 0, 1, . . . 1 le condizioni corrispondenti, in numero nito,
saranno soddisfatte denitivamente rispetto a i. Quindi f
i
f in C
m
0
().
19
Esempio 1.4.15 In modo sostanzialmente analogo si prova che lo spazio
C

0
() delle funzioni di classe C

aventi supporto compatto nellaperto


R
N
`e uno spazio di Frech`et rispetto alla topologia denita dalla seguente
famiglia di seminorme: ssata una successione di compatti K
n
con K
0
=
e

nN
K
n
= , per ogni successione a c
+
0
e per ogni successione divergente
m = m

N
di interi positivi si pone
p
m,a
(f) = sup
N
sup
x\K
1
a

||m
[D

f(x)[.
Questa topologia `e la pi` u ne tra quelle che rendono continue tutte le im-
mersioni C

K
() C

(), ove C

K
() `e il sottospazio di C

() formato
dalle funzioni il cui supporto `e contenuto nel compatto K . La verica
di queste propriet`a `e analoga alla dimostrazione della proposizione 1.4.12 e
del teorema 1.4.13.
Gli spazi C

0
() e C

K
() sono anche comunemente denotati con T() e
T
K
().
Esempio 1.4.16 Sia o(R
N
) lo spazio di Schwartz delle funzioni di classe
C

a decrescenza rapida: f o(R


N
) se e solo se
x [x[
k
D

f(x) L

(R
N
) N
N
, k N.
Deniamo in o(R
N
) la famiglia di seminorme
p
m,k
(f) = sup
||m
sup
xR
N
(1 +[x[)
k
[D

f(x)[, m, k N.
`
E chiaro che queste seminorme separano i punti di o(R
N
), e che tale spazio
`e localmente convesso e metrizzabile. Si noti che esso `e un sottospazio di
C

(R
N
), ma che la sua topologia `e strettamente pi` u ne di quella indotta
da C

(R
N
): infatti una successione f
n
o(R
N
) converge a 0 in o(R
N
)
se e solo se le successioni x [x[
k
D

f
n
(x) convergono a 0 uniformemente
in R
N
, qualunque sia k N e N
N
. In particolare tutte le derivate di
f
n
convergono uniformemente a 0 in R
N
e ci`o implica immediatamente che
f
n
0 in C

(R
N
).
Proviamo che lo spazio o(R
N
) `e completo. Sia f
n
una successione di Cau-
chy in o(R
N
): allora f
n
`e anche una successione di Cauchy in C

(R
N
) e
quindi converge in C

(R
N
) a una funzione f C

(R
N
). Dobbiamo provare
20
che f o(R
N
) e che f
n
f in o(R
N
).
Fissiamo m, k N e > 0: esiste un indice =
m,k
N tale che
p
m,k
(f
n
f
h
) n, h ;
scelto h = , ne segue p
m,k
(f
n
) + p
m,k
(f

) = C
m,k
per ogni n , e in
particolare
sup
||m
[D

f
n
(x)[ C
m,k
(1 +[x[)
k
x R
N
, n .
Poiche, in virt` u della convergenza delle f
n
in C

(R
N
), le derivate di f
n
convergono uniformemente sui compatti alle corrispondenti derivate di f, si
deduce che
sup
||m
[D

f(x)[ C
m,k
(1 +[x[)
k
x R
N
e pertanto f o(R
N
). Ma dalla condizione di Cauchy sopra scritta dedu-
ciamo anche
sup
||m
[D

(f
n
f
h
)(x)[ (1 +[x[)
k
x R
N
, n, h ,
e per h ricaviamo facilmente
p
m,k
(f
n
f) < n .
Per larbitrariet`a di m e k si ha dunque f
n
f in o(R
N
). Ci`o prova che
o(R
N
) `e uno spazio di Frech`et.
Esercizi 1.4
1. Un sottoinsieme B di uno spazio vettoriale topologico X si dice limitato
se per ogni intorno U di 0 esiste > 0 tale che B U per ogni > .
Si provi che:
(i) se A e B sono limitati, allora A +B `e limitato;
(ii) se A `e limitato e t R, allora tA `e limitato;
(iii) se A `e limitato allora A `e limitato.
21
2. Sia X uno spazio vettoriale topologico e sia x
i

iI
un net di Cauchy
contenuto in X.
(i) Si provi che per ogni intorno W di 0 esistono > 0 e i
0
I tali che
x
i

ii
0
W per ogni > .
(ii) Si mostri con un esempio che x
i

iI
non `e necessariamente limitato
in X.
[Traccia: per (i) si supponga, come `e sempre possibile, che W sia
bilanciato e si determini un altro intorno V di 0 tale che V + V W;
si mostri poi che esiste i
0
I tale che x
i
x
i
0
+ V per ogni i i
0
. Si
scelga adesso s > 1 in modo che x
i
0
sV (esercizio 1.3.4), e si deduca
che x
i
tW per ogni t > s e i i
0
.]
3. Sia X linsieme delle funzioni misurabili f : [0, 1] R, con la topologia
generata dalla famiglia di seminorme p
x
(f) = [f(x)[ al variare di x
[0, 1]. Si provi che f
n
f in X se e solo se f
n
f puntualmente in
[0, 1].
4. Sia (X, ) lo spazio vettoriale topologico denito nellesercizio pre-
cedente, e sia la topologia su X indotta dalla pseudo-metrica
seguente:
d(f, g) =
_
1
0
[f(x) g(x)[
1 +[f(x) g(x)[
dx
(si noti che d non `e una distanza, ma denisce una topologia compatibile
con le operazioni dello spazio vettoriale X). Si provi che:
(i) lapplicazione identica i : (X, ) (X, ) trasforma insiemi -
limitati in insiemi -limitati;
(ii) se f
n

nN
X e f
n
0 rispetto a , allora f
n
0 rispetto a ;
(iii) lapplicazione i, tuttavia, non `e continua.
Se ne deduca che 0 non ha un sistema fondamentale di intorni nume-
rabile nella topologia e che quindi (X, ) non `e metrizzabile.
5. Nello spazio C(R) si considerino le seminorme
p
n
(f) = sup
[n,n]
[f[, n N
+
,
22
e la distanza indotta
d(f, g) =

n=1
2
n
p
n
(f g)
1 +p
n
(f g)
.
Posto f(x) = max0, 1 [x[, g(x) = 100f(x 2) e h(x) =
1
2
(f(x) +
g(x)), si calcolino d(f, 0), d(g, 0) e d(h, 0) e si concluda che la palla di
centro 0 e raggio
1
2
non `e convessa, benche lo spazio metrico (C(R), d)
sia localmente convesso.
6. Dimostrare che per p ]0, 1[ lo spazio metrico
p
`e completo.
7. Sia x
i

iI
un net in uno spazio topologico X; sia poi
i

iI
un net di
numeri reali tali che [
i
[ K per ogni i I. Si provi che se x
i
0 in
X, allora
i
x
i
0 in X.
8. Sia X uno spazio vettoriale topologico. Si provi che:
(i) se A, B sono sottoinsiemi compatti di X, allora A+B `e compatto;
(ii) se A `e compatto e B `e chiuso, allora A +B `e chiuso;
(ii) se A e B sono chiusi, non `e detto che A +B sia chiuso.
9. Si provi che i sottoinsiemi compatti di uno spazio vettoriale topologico
sono limitati.
1.5 Operatori lineari e continui
Siano X, Y spazi vettoriali topologici. Descriveremo brevemente alcune pro-
priet`a che sono equivalenti alla continuit`a di un operatore lineare f : X Y .
Anzitutto, `e chiaro che f `e continuo se e solo se `e continuo nel punto 0 X.
Unaltra facile caratterizzazione `e fornita dalla seguente
Proposizione 1.5.1 Siano X, Y spazi vettoriali topologici, sia f : X Y
lineare. Allora f `e continua se e solo se per ogni net x
i

iI
convergente a 0
in X il net fx
i

iI
converge a 0 in Y .
Dimostrazione (=) Sia U un arbitrario intorno di 0 in Y . Per continuit`a,
esiste un intorno V di 0 in X tale che f(V ) U. Sia x
i

iI
X un net
convergente a 0 in X: per denizione, esiste i
0
I tale che x
i
V per ogni
23
i I, i i
0
. Dunque, fx
i
U per ogni i I, i i
0
e pertanto il net
fx
i

iI
converge a 0 in Y .
(=) Sia 1 la famiglia degli intorni di 0 X. Se f non fosse continua,
esisterebbe un intorno U di 0 in Y tale che per qualunque V 1 potremmo
trovare x
V
V per cui fx
V
/ U. Ma allora il net x
V

V V
convergerebbe a
0 in X, senza che il net fx
V

V V
converga a 0 in Y , il che contraddirebbe
lipotesi.
Nel caso speciale che f sia lineare da X a R (oppure C), vale la seguente
caratterizzazione:
Teorema 1.5.2 Sia X uno spazio vettoriale topologico e sia f : X C un
funzionale lineare. Sono fatti equivalenti:
(i) f `e continuo;
(ii) ker f (il nucleo di f) `e chiuso in X;
(iii) esiste un intorno U di 0 in X tale che f[
U
`e limitato, ossia esiste
M > 0 tale che [fx[ < M per ogni x U.
Dimostrazione (i)= (ii) ker f `e limmagine inversa del chiuso 0 C,
e quindi `e chiuso in X perche f `e continua.
(ii)= (iii) Se f 0, la tesi `e evidente. Altrimenti, deve essere ker f ,= X,
quindi A = (ker f)
c
`e un aperto non vuoto. Scelto x A, sia U un intorno
di 0 in X tale che x + U A; possiamo supporre che U sia bilanciato
(osservazione 1.3.2). Allora si ha
f(U) =
_
||1
f(U) =
_
||1
f(U),
quindi f(U), essendo bilanciato in C, `e un disco di centro 0. Dunque f(U) `e
un disco limitato, oppure f(U) `e tutto C. Se, per assurdo, fosse f(U) = C,
esisterebbe y U tale che fy = fx, ossia x+y ker f; ma ci`o `e impossibile
perche x +y x +U A.
(iii)= (i) Sia [fx[ < M per ogni x U, con U intorno di 0 in X. Allora,
ssato > 0, linsieme W =

M
U `e intorno di 0 (in quanto lapplicazione
x x `e un omeomorsmo), e si ha [fx[ < per ogni x W. Ci`o prova
che f `e continua in 0.
Nel caso in cui le topologie negli spazi X, Y siano generate da seminorme, la
24
continuit`a di un operatore lineare si pu`o descrivere in un modo particolar-
mente comodo, che generalizza la nozione di limitatezza per operatori lineari
fra spazi normati.
Teorema 1.5.3 Siano X, Y spazi vettoriali topologici, con topologie generate
dalle famiglie di seminorme p
i

iI
e q
j

jJ
rispettivamente. Sia f : X Y
un operatore lineare; allora f `e continuo se e solo se per ogni j J esistono
K
j
> 0, n
j
N
+
e i
1
, . . . , i
n
j
I tali che
q
j
(fx) K
j
max
1hn
j
p
i
h
(x) x X.
Dimostrazione (=) Per ipotesi, per ogni ssato j J esistono K
j
> 0,
n
j
N
+
e i
1
, . . . , i
n
j
I per i quali
q
j
(fx) K
j
max
1hn
j
p
i
h
(x) x X.
Sia > 0. Sia U un intorno di 0 Y , che sar`a della forma
U = U
j
1
,...,jm,
=
m

s=1
q
1
js
([0, [),
e consideriamo linsieme
V = x X : p
i
h
(x) <

K
js
, h = 1, . . . , n
js
, s = 1, . . . , m,
il quale `e un intorno di 0 X. Allora la disuguaglianza precedente mostra
che fx U per ogni x V . Quindi f `e continuo nel punto 0 X.
(=) Siano > 0, j J ed U = q
1
j
([0, [). Poiche f `e continua, esiste un
intorno W di 0 tale che f(W) U, ossia esistono > 0 e i
1
, . . . , i
n
I tali
che
x X, max
1hn
p
i
h
(x) < = q
j
(fx) < .
Sia ora z X e poniamo
w =

max
1hn
p
i
h
(z) +
z,
dove `e un arbitrario numero positivo (questo numero serve a dar senso
alla frazione nel caso che si abbia p
i
h
(z) = 0 per h = 1, . . . , n). Allora
p
i
h
(w) =

max
1hn
p
i
h
(z) +
p
i
h
(z);
25
quindi
max
1hn
p
i
h
(w) < ,
da cui
q
j
(fw) < ,
ossia
q
j
(fz) =
max
1hn
p
i
h
(z) +

q
j
(fw) <

_
max
1hn
p
i
h
(z) +
_
.
Questa relazione vale per ogni > 0; ne segue la tesi prendendo n
j
= n e
K
j
=

.
Quando X e Y sono spazi normati, la continuit`a di un operatore f : X Y
equivale alla sua limitatezza; una condizione analoga (ma non identica!) vale
anche nel caso di due spazi vettoriali topologici: ricordiamo che la nozione di
sottoinsieme limitato in uno spazio vettoriale topologico `e stata introdotta
nellesercizio 1.4.1.
Proposizione 1.5.4 Siano X, Y spazi vettoriali topologici, sia f : X Y
un operatore lineare. Se f `e continuo, allora f `e limitato, ossia trasforma
insiemi limitati di X in insiemi limitati di Y .
Si noti che il viceversa di questa implicazione `e falso (esercizio 1.4.4), ma `e
vero sotto opportune ipotesi di metrizzabilit`a (esercizio 1.5.1).
Dimostrazione Sia U un intorno di 0 Y : per continuit`a, esiste un intorno
V di 0 X tale che f(V ) U. Sia E limitato in X: per denizione esiste
> 0 tale che E V per ogni > ; ne segue
f(E) f(V ) = f(V ) U > .
Per larbitrariet`a di U, f(E) `e limitato.
Consideriamo ora lo spazio vettoriale dei funzionali lineari e continui su uno
spazio vettoriale topologico.
Denizione 1.5.5 Il duale di uno spazio vettoriale topologico (X, ) `e lo
spazio vettoriale X

dei funzionali lineari e continui su X, ossia degli opera-


tori lineari e continui da X in R (oppure da X in C).
26
Si noti che la continuit`a di un operatore lineare su X dipende dalla topologia
, quindi X

dipende a sua volta da e dovremmo denotarlo con X

; tuttavia
se si pensa ssata, la notazione X

non si presta ad equivoci.


Di per se, X

`e uno spazio vettoriale privo di una propria topologia naturale


(salvo che nel caso in cui X sia uno spazio normato). I sottoinsiemi di X

determinano altre topologie su X, diverse da : infatti si osserva anzitutto


che ogni applicazione lineare : X C individua su X la seminorma
p

(x) = [x[, x X; di conseguenza, ssato un arbitrario sottoinsieme B di


X

, la topologia indotta da B su X `e la topologia generata dalla famiglia di


seminorme p

B
e si indica con (X, B). In particolare, quando B = X

si ha la topologia debole su X, cio`e (X, X

), che viene spesso denotata con


w (benche dipenda anche, attraverso X e X

, da ); essa verr`a ampiamente


descritta nel paragrafo che segue.
Si possono denire in modo analogo svariate topologie su X

che lo rendono
uno spazio vettoriale topologico localmente convesso: infatti per ogni x X
la funzione q
x
() = [x[, X

, `e una seminorma su X

; quindi, ssato un
sottoinsieme D di X, la famiglia di seminorme q
x

xD
genera una topologia
su X

. che si denota con (X

, D). In particolare `e importante la topologia


debole* (X

, X) (si legge debole-star), che si ottiene scegliendo D = X,


e che verr`a analizzata nel prossimo paragrafo.
Unaltra importante topologia su X

`e la topologia forte, che `e generata dalla


pi` u ricca famiglia di seminorme p
A

AA
denite da
p
A
(f) = sup
xA
[fx[ f X

,
ove / `e la famiglia dei sottoinsiemi limitati di X. Queste seminorme sono
ben denite in virt` u della proposizione 1.5.4.
Ovviamente, la topologia forte `e pi` u ne di quella debole*; in particolare,
allorche X `e uno spazio di Banach la topologia forte `e quella indotta dalla
norma di X

.
Esempio 1.5.6 Consideriamo lo spazio C

0
(), altrimenti detto T(), in-
trodotto nellesempio 1.4.15. Il suo duale si denota con T

() e gli elementi
del duale si chiamano distribuzioni su . Dalla denizione delle seminorme
p
m,a
`e facile dimostrare (esercizio 1.5.3) che un funzionale lineare T denito
su T() `e una distribuzione se e solo se per ogni compatto K esistono
due costanti C > 0 e m N tali che
[Tf[ C

||m
sup
xK
[D

f(x)[ f T
K
().
27
Nel caso = R
N
, lo spazio T(R
N
) `e immerso con continuit`a nello spazio di
Schwartz o(R
N
) introdotto nellesempio 1.4.16; dunque il duale dello spazio
di Schwartz, che si denota con o

(R
N
), `e immerso con continuit`a in T

(R
N
).
Gli elementi di o

(R
N
) si dicono distribuzioni temperate.
Esercizi 1.5
1. Siano X, Y spazi vettoriali topologici e supponiamo che X sia metriz-
zabile, con distanza d tale che d(kx, 0) k d(x, 0) per ogni k N e
per ogni x X. Sia inoltre f : X Y unapplicazione lineare che
trasforma insiemi limitati di X in insiemi limitati di Y . Si provino i
seguenti fatti:
(i) se x
n

nN
X e x
n
0 in X, allora fx
n

nN
`e limitata in Y ;
(ii) se x
n

nN
X e x
n
0 in X, allora esiste
n

nN
]0, [ tale
che
n
e
n
x
n
0 in X;
(iii) se x
n

nN
X e x
n
0 in X, allora fx
n
0 in Y ;
(iv) f `e continua.
2. Sullo spazio vettoriale X = C[0, 1] deniamo il seguente sistema fon-
damentale di intorni di 0:
V
n,k
=
_
f X : m
_
x [0, 1] : [f(x)[ <
1
n
_
1
1
k
_
, n, k N
+
,
ove m `e la misura di Lebesgue.
(i) Si verichi che X `e uno spazio vettoriale topologico metrizzabile.
(ii) Si mostri che X

= 0, ossia lunico funzionale lineare e continuo


su X `e quello identicamente nullo.
[Traccia: per (ii), ssato F X

, si determini un V
n,k
tale che [F(f)[ <
1 per ogni f V
n,k
. Quindi si utilizzi una partizione dellunit`a con
funzioni
j
aventi supporto in intervalli di ampiezza minore di
1
k
, e si
osservi che per ogni f X e R si ha
j
f V
n,k
. Si mostri inne
che F(f) = 0 sfruttando larbitrariet`a di .]
28
3. Si provi che un funzionale lineare T : T() C `e una distribuzione se
e solo se per ogni compatto K esistono C > 0 e m N tali che
[Tf[ C

||m
sup
xK
[D

f(x)[ f T
K
().
1.6 Topologie deboli
In uno spazio vettoriale topologico (X, ), come abbiamo visto, `e possibile
denire, accanto alla sua topologia naturale, unaltra topologia meno ne: la
topologia debole. Questo paragrafo `e dedicato alla descrizione delle sue nu-
merose propriet`a, che hanno particolare rilevanza, sia teorica che applicativa,
nel caso speciale in cui X `e uno spazio di Banach.
Denizione 1.6.1 Sia X uno spazio vettoriale topologico. Si chiama topo-
logia debole su X la topologia generata dalla famiglia di seminorme p

cos` denite:
p

(x) = [x[ x X.
La topologia debole si denota con i simboli w (weak) oppure (X, X

).
Dunque un sistema fondamentale di w-intorni di 0 `e dato dagli insiemi della
forma
V

1
,...,n,
= x X : [
i
x[ , i = 1, . . . , n,
al variare di n N
+
, > 0 e
1
, . . . ,
n
X

. Ripetiamo ancora che la


topologia debole dipende dalla topologia originaria di cui `e dotato X at-
traverso la scelta dei funzionali di X

: cambiando cambia lo spazio X

dei
funzionali lineari -continui.
Dalla denizione segue che la topologia debole w `e la meno ne topologia su
X che rende continui tutti i funzionali X

; poiche tutti gli elementi di


X

sono continui per la topologia naturale di X, la topologia debole `e meno


ne di questultima. Tuttavia, se X ha dimensione nita le due topologie
coincidono (esercizio 1.6.7). In particolare, ogni insieme debolmente chiuso
(cio`e chiuso rispetto a w) `e chiuso, mentre il viceversa non `e vero in generale.
Ad esempio, nello spazio di Banach
2
linsieme = x
2
: |x|
2
= 1
`e chiuso ma non debolmente chiuso: infatti, ricordando che la successione
e
(n)

nN
`e contenuta in e converge debolmente a 0 in
2
, si deduce che 0
appartiene alla chiusura debole di perche ogni suo w-intorno della forma
V

1
,...,p,
contiene necessariamente qualcuno degli e
(n)
.
29
Se X `e uno spazio normato, da un noto corollario del teorema di Hahn-
Banach segue che per ogni x X 0 esiste X

tale che (x) ,= 0;


quindi la topologia debole rende X uno spazio vettoriale topologico local-
mente convesso e di Hausdor. Se in particolare X `e uno spazio di Banach
riessivo, allora (X, w) `e completo (esercizio 1.6.4). In generale, 0 non ha un
sistema fondamentale di intorni numerabile e lo spazio (X, w) non `e metriz-
zabile: si veda a questo proposito lesercizio 1.6.15.
Il duale X

di uno spazio vettoriale topologico X `e esso stesso uno spazio


vettoriale topologico (localmente convesso) con una delle due topologie (de-
bole* e forte) introdotte alla ne del paragrafo precedente. La denizione di
topologia debole si applica ovviamente anche al caso di X

: `e quella generata
dalle seminorme p

X
cos` denite:
p

() = [[ X

.
Naturalmente, lo spazio X

cambia a seconda che si scelga di mettere su X

la topologia forte, oppure la topologia debole* (o altre ancora di cui non ci


occuperemo). Richiamiamo la denizione di topologia debole*:
Denizione 1.6.2 Sia X uno spazio vettoriale topologico, sia X

il suo dua-
le. Si chiama topologia debole* su X

la topologia generata dalla famiglia di


seminorme p
x

xX
cos` denite:
p
x
() = [x[ X

.
La topologia debole* si denota con i simboli w

oppure (X

, X).
Un sistema fondamentale di w

-intorni di 0 `e fatto dagli insiemi della forma


V
x
1
,...,xn,
= X

: [x
i
[ , i = 1, . . . , n.
Dato che, ovviamente, per ogni X

0 esiste x X tale che x ,= 0,


le seminorme p
x
separano i punti di X

e dunque (X

, w

) `e uno spazio
vettoriale topologico localmente convesso e di Hausdor. Se in particolare X
`e uno spazio di Banach, lo spazio (X

, w

) `e anche completo (esercizio 1.6.4).


Quando X `e uno spazio di Banach, ricordando come `e denita limmersione
canonica J : X X

, possiamo scrivere le seminorme che generano la


topologia (X

, X) nel modo seguente:


p
x
() = [x[ = [J
x
[ X

.
30
Quindi, la topologia debole* (X

, X) `e la meno ne topologia su X

che
rende continui tutti i funzionali J
x
J(X), mentre, per denizione, tutti gli
elementi di X

sono continui su X

per la topologia (X

, X

) (la topo-
logia debole relativa alla topologia indotta dalla norma di X

). Ne segue
che su X

la topologia debole* (X

, X) `e meno ne della topologia debole


(X

, X

), che a sua volta `e meno ne di quella indotta dalla norma di X

.
Le due topologie deboli su X

coincidono se e solo se J(X) = X

, ossia se
e solo se X `e riessivo.
Come si `e gi`a osservato, le topologie deboli in spazi normati sono impor-
tanti perche permettono di ottenere buoni teoremi di compattezza. Ne de-
scriveremo adesso i principali, insieme ad alcuni risultati di metrizzabilit`a
strettamente collegati.
Teorema 1.6.3 (di Banach-Alaoglu) Sia X uno spazio normato e sia B

la palla unitaria chiusa di X

. Allora B

`e compatta nella topologia debole*


(X

, X).
Dimostrazione Per ogni x X denotiamo con I
x
lintervallo chiuso reale
[|x|
X
, |x|
X
]. Consideriamo il prodotto cartesiano
P =

xX
I
x
,
munito della topologia prodotto . Allora P, essendo prodotto di compatti,
`e -compatto; denotando i suoi elementi con f(x)
xX
, possiamo descrivere
tale insieme nel modo seguente:
P = f : X C : [f(x)[ |x|
X
x X.
Poiche B

P X

, B

eredita due topologie indotte, una da (X

, w

) e
una da (P, ). Proveremo che:
(a) B

`e chiuso in (P, ),
(b) w

coincide con su B

.
Da (a) seguir`a che B

`e -compatto, e da (b) dedurremo che B

`e w

-
compatto, ossia la tesi.
Proviamo dapprima (b). Siano n N
+
, x
1
, . . . , x
n
X,
1
, . . . ,
n
> 0 e
g
0
B

: consideriamo i due insiemi


W
1
= g X

: [gx
i
g
0
x
i
[ <
i
, i = 1, . . . , n,
31
W
2
= f P : [f(x
i
) g
0
x
i
[ <
i
, i = 1, . . . , n;
W
1
e W
2
sono generici intorni di g
0
nelle topologie w

e rispettivamente.
Dato che, banalmente, W
1
B

= W
2
B

, la propriet`a (b) `e provata.


Proviamo adesso (a). Sia f
0
un elemento della chiusura di B

in (P, ):
proveremo che f
0
: X C `e lineare. Dati x, y X, , C ed > 0,
linsieme
U = f P : [f(x) f
0
(x)[ < , [f(y) f
0
(y)[ < ,
[f(x +y) f
0
(x +y)[ <
`e intorno di f
0
in (P, ). Poiche f
0
`e -aderente a B

, esiste f B

U.
Usando la linearit`a di f, ne segue
[f
0
(x +y) f
0
(x) f
0
(y)[ =
= [(f
0
f)(x +y) (f
0
f)(x) (f
0
f)(y)[ <
< (1 +[[ +[[),
e per larbitrariet`a di otteniamo che f
0
`e lineare.
Resta da far vedere che f
0
B

: ssati > 0 e x X con |x|


X
1, sia
V = g P : [g(x) f
0
x[ < .
Dato che V `e un -intorno di f
0
, esiste g B

V ; dunque si ha
[f
0
x[ [f
0
x gx[ +[gx[ < +|x|
X
+ 1,
e per larbitrariet`a di , ricaviamo
[f
0
x[ 1 x X con |x|
X
1.
Si conclude che f
0
B

, e ci`o prova (a).


Teorema 1.6.4 (di Eberlein-Smulyan) Sia X uno spazio di Banach ri-
essivo, e sia B la palla unitaria chiusa di X. Allora B `e compatta nella
topologia debole (X, X

).
Dimostrazione Sia U
i

iI
un ricoprimento w-aperto di B: per ogni i I
e per ogni x U
i
esiste un w-intorno V di x, della forma
V = y X : [
i
(x y)[ < , i = 1, . . . , k,
32
che `e contenuto in U
i
. Applichiamo limmersione canonica J : X X

, che
per ipotesi `e unisometria bigettiva: otteniamo che per ogni i I e per ogni
J
x
J(U
i
) linsieme
J(V ) = J
y
X

: [J
x

i
J
y

i
[ < , i = 1, . . . , k
`e contenuto in J(U
i
). Ma J(V ) `e un intorno di J
x
nella topologia debole*
su X

, e dunque J(U
i
)
iI
`e un ricoprimento w

-aperto di J(B), cio`e della


palla unitaria chiusa di X

. Per il teorema di Banach-Alaoglu (teorema


1.6.3), J(B) `e w

-compatta in X

, quindi esiste un sottoricoprimento nito


J(U
i
h
)
1hm
di J(B). Di conseguenza, U
i
h

1hm
`e un sottoricoprimento
nito di B, estratto dal ricoprimento w-aperto originale U
i

iI
. Pertanto B
`e w-compatta.
Corollario 1.6.5 Sia X uno spazio normato. Allora:
(i) i limitati di X

sono debolmente* relativamente compatti;


(ii) se X `e uno spazio di Banach riessivo, allora i limitati di X sono
debolmente relativamente compatti.
Dimostrazione Basta osservare che ogni limitato `e incluso in una palla
chiusa, ed applicare i due teoremi precedenti.
La topologia debole su uno spazio normato non `e metrizzabile in generale,
come abbiamo visto (esercizio 1.6.15); per`o vale il seguente risultato:
Teorema 1.6.6 Sia X uno spazio normato e sia B

la palla unitaria chiusa


di X

. Allora X `e separabile se e solo se la topologia indotta su B

dalla
topologia debole* di X

`e metrizzabile.
Dimostrazione (=) Sia X separabile: ssata una successione x
n

nN
densa nella palla unitaria B di X, poniamo
d(f, g) =

n=0
2
n
[fx
n
gx
n
[, f, g B

.
`
E chiaro che d `e una distanza su B

e che `e invariante per traslazioni. Quindi


per provare la tesi sar`a suciente mostrare che:
(a) ogni palla Q

= f B

: d(f, 0) < contiene B

U, ove U `e un
opportuno intorno di 0 in (X

, X);
33
(b) ogni intorno U di 0 in (X

, X) contiene una palla Q

, con opportuno.
Proviamo (a): ssato un arbitrario > 0, sia N N tale che 2
N
<

4
.
Scegliamo
U =
_
f X

: [fx
k
[ <

4
, k = 0, . . . , N 1
_
;
allora se f B

U si ha
d(f, 0) =
N1

n=0
2
n
[fx
n
[ +

n=N
2
n
[fx
n
[ <

4
N1

n=0
2
n
+

n=N
2
n
|f|
X
< ,
cio`e f Q

. Quindi B

U Q

.
Proviamo (b): ssati > 0 e y
1
, . . . , y
m
X 0, poniamo
U = f X

: [fy
i
[ < , i = 1, . . . , m
e cerchiamo Q

tale che Q

U. Poiche x
n

nN
`e densa in B, esistono
n
1
, . . . , n
m
N tali che
_
_
_
_
y
i
|y
i
|
X
x
n
i
_
_
_
_
X
<

2K
per i = 1, . . . , m, ove K = max
1im
|y
i
|
X
.
Siano N = max
1im
n
i
ed =
2
N

2K
; si ha per ogni f Q

e per ogni
i = 1, . . . , m
2
n
i
[fx
n
i
[ d(f, 0) < ,
da cui
[fx
n
i
[ < 2
n
i
2
N
<

2K
.
Pertanto per ogni i = 1, . . . , m si ha, ricordando che |f|
X
= 1,
[fy
i
[
|y
i
|
X

f
_
y
i
|y
i
|
X
x
n
i
_

+[fx
n
i
[ <

2K
+

2K
=

K
ed inne
[fy
i
[ <

K
|y
i
|
X
, i = 1, . . . , m.
Ci` o prova che f U, ossia Q

U.
(=) Supponiamo che (B

, w

) sia metrizzabile; allora 0 ha un sistema


34
fondamentale di intorni numerabile U
n

nN
, e si pu`o supporre che tali U
n
siano della forma
U
n
= B

: [x[ <
n
x A
n
,
ove A
n
`e un sottoinsieme nito di X. Poniamo A =

nN
A
n
: dato che
A `e numerabile, il sottospazio chiuso X
0
X generato da A `e separabile.
Supponiamo ora che esista x X X
0
: per un corollario del teorema di
Hahn-Banach, vi `e un funzionale X

, di norma unitaria, tale che x ,= 0


e z = 0 per ogni z X
0
. Ci`o signica che U
n
per ogni n N, e questo
implica che 0, contraddicendo il fatto che x ,= 0. Pertanto deve essere
X
0
= X e dunque X `e separabile.
Unanaloga propriet`a di metrizzabilit`a vale negli spazi di Banach che hanno
duale separabile.
Teorema 1.6.7 Sia X uno spazio di Banach e sia B la palla unitaria chiusa
di X. Allora X

`e separabile se e solo se la topologia indotta su B dalla


topologia debole di X `e metrizzabile.
Dimostrazione (=) Sia X

separabile: allora `e noto che anche X `e sepa-


rabile; dunque, per il teorema precedente, la palla unitaria B

di X

, munita
della topologia debole*, `e metrizzabile. Inoltre B

`e w

-compatta in virt` u
del teorema di Banach-Alaoglu. Perci`o, dato che gli spazi metrici compatti
sono separabili, (B

, w

) `e separabile. Sia f
n

nN
+ una successione densa in
(B

, w

), e deniamo la distanza
d(x, y) =

n=1
2
n
[f
n
(x y)[, x, y B.
Proviamo che lo spazio metrico (B, d) coincide con lo spazio (B, w).
Sia i : (B, w) (B, d) lidentit`a: essa `e continua, poiche ssata arbitraria-
mente una palla B(x
0
, ), esiste N

N tale che per il w-intorno


V = x B : [f
n
(x x
0
)[ < /2 , n N

risulta per ogni x V


d(x, x
0
)

nN

2
n
[f
n
(x y)[ +

n>N

2
n
<

nN

2
n
/2 +/2 < .
35
Dunque lapplicazione i `e biunivoca e continua dallo spazio compatto (B, w)
nello spazio di Hausdor (B, d): dunque `e un omeomorsmo, e in particolare
(B, d) = (B, w).
(=) Proviamo anzitutto due lemmi.
Lemma 1.6.8 Sia X uno spazio vettoriale e siano g, f
1
, . . . , f
m
: X C
funzionali lineari. Risulta

m
i=1
ker f
i
ker g se e solo se esistono
1
, . . . ,
m

C tali che g =

m
i=1

i
f
i
.
Dimostrazione (=) Evidente.
(=) Sia F loperatore lineare da X in C
m
dato da Fx = (f
1
x, . . . , f
m
x), e
deniamo h : R(F) C nel modo seguente:
h(z) = gx z = Fx R(F).
Questa denizione `e ben posta perche se z = Fx = Fy si ha xy ker F =

m
i=1
ker f
i
e quindi, per ipotesi, gx = gy. Per il teorema di Riesz, applicato
allo spazio di Hilbert R(F), esiste un unico elemento v R(F) tale che
hz = z v per ogni z R(F). Ne segue che il funzionale H : C
m
C,
Hz = z v per ogni z C
m
, estende h. In particolare, allora,
gx = h(Fx) = H(Fx) = Fx v =
m

i=1
f
i
x v
i
x X,
ovvero si ha la tesi con
i
= v
i
.
Lemma 1.6.9 Sia X uno spazio di Banach e sia B la palla unitaria chiusa di
X. Detta J : X X

limmersione canonica, linsieme J(B) `e (X

, X

)-
denso nella palla unitaria chiusa B

di X

.
Dimostrazione Sia, per assurdo, B

J(B)
w

, ove J(B)
w

`e la chiusura
di J(B) rispetto a (X

, X

). Esiste allora, per il teorema di Hahn-Banach,


un funzionale f : X

C lineare e (X

, X

)-continuo tale che


f ,= 0, f = 0 J(B)
w

.
Dimostriamo che esiste X

tale che
f = X

,
36
ovvero, in altri termini, proviamo che esiste X

tale che f = J

, es-
sendo J

limmersione canonica di X

nel proprio biduale. Ci`o implicher`a


0 = fJ
x
= J
x
= x per ogni x B, e quindi per linearit`a dedurremo = 0;
ma questo `e assurdo essendo = f ,= 0.
Per provare lasserzione osserviamo che, essendo f (X

, X

)-continua, esi-
ste un intorno di 0 X

della forma U = X

: [
i
[ < , i =
1, . . . , m tale che [f[ < 1 per ogni U. Adesso, se

m
i=1
ker J

i
, os-
sia
i
= 0 per i = 1, . . . m, allora per ogni k N si ha k[f[ = [f(k)[ < 1,
da cui f = 0: ci`o mostra che

m
i=1
ker J

i
ker f. Ne segue, per il lemma
1.6.8, che esistono
1
, . . . ,
m
C tali che f =

m
i=1

i
J

i
. Dunque, posto
=

m
i=1

i
, abbiamo provato che f = J

, ossia lasserzione sopra scritta.


Ci` o conclude la dimostrazione del lemma.
Dimostriamo la seconda implicazione del teorema. Sia (B, w) metrizzabi-
le: allora la topologia w ha come base dintorni di 0 la famiglia numerabile
U
n

nN
, con
U
n
= x X : [x[ <
n
A
n
,
ove
n
> 0 e A
n
`e un sottoinsieme nito di X

. Il sottospazio chiuso X

generato dallunione degli A


n
`e separabile: vogliamo provare che X

= X

, e
che pertanto X

`e separabile.
Supponiamo per assurdo che esista X

: allora
d = inf
X

| |
X
> 0.
Per uno dei corollari del teorema di Hahn-Banach, esiste X

tale che
||
X
=
1
d
, = 1, [
X
= 0.
Consideriamo linsieme U = x B : [x[ < d/2, che `e un w-intorno di 0
in B: esiste allora n N tale che V U
n
. Gli insiemi
V
n
= X

: [[ <
n
A
n
, V = X

: [[ < d/2
sono (X

, X

)-intorni di 0 X

. Poiche d B

, per il lemma 1.6.9


esiste x
1
B tale che J
x
1
d V
n
V , ossia
[x
1
[ = [d J
x
1
[ <
n
A
n
, [d x
1
[ = [d J
x
1
[ < d/2 .
Ma allora [x
1
[ > d/2: dunque si ha x
1
U
n
V , il che `e assurdo essendo
U
n
V . Ne segue X

= X

e dunque la tesi.
37
Proviamo inne il seguente risultato, che va confrontato con quello delleser-
cizio 1.6.14:
Teorema 1.6.10 Sia X uno spazio normato con X

separabile, e sia M
X un insieme limitato. Allora la chiusura debole di M coincide con la
chiusura debole sequenziale di M, cio`e con linsieme
M
s
= x X : x
n
M : x
n
x.
Dimostrazione
`
E facile vericare che M
s
`e contenuto nella chiusura debole
di M. Per provare linclusione opposta faremo uso del seguente
Lemma 1.6.11 Sia X uno spazio normato, sia M X limitato e sia u X
un elemento della chiusura debole di M. Allora esiste un sottoinsieme al pi` u
numerabile M
0
M tale che u appartiene alla chiusura debole di M
0
.
Dimostrazione Sia B

la palla unitaria chiusa di X

e sia
B

n
= B

(n volte).
Per m, n N
+
e f = (f
1
, . . . , f
n
) B

n
consideriamo il w-intorno
U
m,n,f
(u) =
_
v X : [f
j
(v u)[ <
1
m
, j = 1, . . . , n
_
.
Per ipotesi, per ogni m, n N
+
e f B

n
esiste v M tale che v U
m,n,f
(u).
Riscriviamo questa aermazione in modo diverso: per ogni m, n N
+
e
v M sia
W
m,n,v
= f B

n
: v U
m,n,f
(u);
allora possiamo dire che per ogni m, n N
+
linsieme B

n
`e ricoperto dalla
famiglia W
m,n,v

vM
.
Ora osserviamo che i W
m,n,v
sono aperti in B

n
per la topologia indotta dalla
topologia debole* di (X

)
n
; infatti se f W
m,n,v
linsieme
_
g B

n
: [f
i
(u v) g
i
(u v)[ <
1
m
max
1jn
[f
j
(u v)[, i = 1, . . . , n
_
`e un intorno di f in tale topologia che `e contenuto in W
m,n,v
. Poiche, per il
teorema di Banach-Alaoglu (teorema 1.6.3), B

`e debolmente* compatto in
38
X

, anche B

n
`e debolmente* compatto in (X

)
n
. Quindi esiste una sotto-
famiglia nita di W
m,n,v

vM
che `e ancora un ricoprimento di B

n
: in altre
parole, esiste un sottoinsieme nito S
m,n
M tale che
f = (f
1
, . . . , f
n
) B

n
v S
m,n
: [f
j
(v u)[ <
1
m
per j = 1, . . . , n.
Posto M
0
=

m,nN
+
S
m,n
, M
0
`e numerabile; essendo contenuto in M, `e
anche limitato in X. Per denizione di M
0
, per ogni f B

n
esiste v M
0
tale che v U
m,n,f
(u): dunque u appartiene alla chiusura debole di M
0
.
Riprendiamo la dimostrazione del teorema 1.6.10. Sia u X un elemento
della chiusura debole di M in X. Sia M
0
il sottoinsieme numerabile di M
determinato dal lemma 1.6.11: dunque u appartiene alla chiusura debole
di M
0
in X. Poiche M
0
`e limitato, esiste una palla chiusa B
R
di X, di
raggio R opportuno, tale che M
0
B
R
. Essendo X

separabile per ipotesi,


per il teorema 1.6.7 la topologia debole su B
R
`e indotta da una distanza.
Poiche negli spazi metrici la chiusura di un insieme coincide con la chiusura
sequenziale, deduciamo che u appartiene alla chiusura debole sequenziale di
M
0
, da cui in particolare la tesi.
Esercizi 1.6
1. Sia X uno spazio vettoriale topologico, sia : X C lineare. Si provi
che X

se e solo se `e w-continua.
2. Sia X uno spazio normato, sia : X

C lineare. Si provi che


X

se e solo se `e w-continua (ove w `e la topologia debole su


X

), e che J(X) se e solo se `e w

-continua.
3. Per ogni t [a, b] sia F
t
: C[a, b] R denito da F
t
(f) = f(t) per ogni
f C[a, b]. Si provi che lapplicazione t F
t
`e continua da [a, b] in
((C[a, b])

, w

).
4. Sia X uno spazio di Banach. Si provi che:
(i) (X

, w

) `e uno spazio vettoriale topologico completo;


(ii) se lo spazio X `e riessivo, allora anche (X, w) `e uno spazio vetto-
riale topologico completo.
39
5. Si provi che se X `e lo spazio normato (c
00
, | |

2), allora (X

, w

) `e uno
spazio vettoriale topologico non completo.
[Traccia: si considerino i funzionali T
k
: c
00
R deniti da T
k
x =

k
j=0
jx
j
. . . ]
6. Si provi che se X `e lo spazio normato (c
0
, | |

), allora (X, w) `e uno


spazio vettoriale topologico non completo.
[Traccia: ssato x

c
0
, si consideri la successione x
(n)
ove
x
(n)
= x
0
, x
1
, . . . , x
n1
, x
n
, 0, 0, . . .. . . ]
7. Sia X uno spazio normato. Si provi che la topologia debole di X
coincide con quella indotta dalla norma se e solo se X ha dimensione
nita.
8. Sia X uno spazio normato, sia E un sottoinsieme di X. Si provi che E
`e limitato in X se e solo se E `e w-limitato.
9. Sia X uno spazio normato, sia F un sottoinsieme di X

. Si provi che
F `e limitato in X

se e solo se F `e w

-limitato.
10. Sia X uno spazio normato e sia B la palla unitaria chiusa di X. Si
provi che J(B) `e w

-denso nella palla unitaria chiusa B

di X

(qui
w

`e la topologia debole* di X

).
Traccia: Sia B

e sia V = X

: [[ < : si osservi
che [||
X
, ||
X
] e che (B) ] ||
X
, ||
X
[, e si deduca
che esiste x B tale che J
x
V .]
11. Si provi che C[a, b] `e w

-denso in L

(a, b).
12. Si provi che la palla unitaria chiusa di c
0
non `e w-compatta.
13. Sia (X, ) uno spazio vettoriale topologico. Se lorigine ha un sistema
fondamentale di intorni numerabile, si provi che per ogni sottoinsieme
E X la chiusura debole di E e la chiusura debole sequenziale di E
coincidono.
14. Siano X =
2
e E = e
(m)
+ me
(n)
: m, n N, m n. Si dimostri
che:
(i) la chiusura debole sequenziale di E `e E e
(m)

mN
;
(ii) la chiusura debole di E contiene anche 0.
40
15. Si provi che nello spazio vettoriale topologico (
2
, w) lorigine non ha un
sistema fondamantale di intorni numerabile; se ne deduca che (
2
, w)
non `e metrizzabile.
16. Sia (X, ) uno spazio vettoriale topologico. Denotando con X
w
lo spazio
vettoriale X dotato della topologia debole relativa a , si provi che
(X
w
)
w
= X
w
, cio`e che la topologia debole relativa alla topologia debole
coincide con questa.
1.7 Separazione di insiemi convessi
Iniziamo il paragrafo con lestensione agli spazi vettoriali topologici del teo-
rema di Hahn-Banach. Di questo risultato fondamentale conosciamo una
versione inutilmente restrittiva, in cui lambiente `e uno spazio normato. In
eetti, senza cambiare una virgola della dimostrazione relativa a quel caso,
si prova il seguente enunciato pi` u generale:
Teorema 1.7.1 (di Hahn-Banach, caso reale) Sia X uno spazio vetto-
riale reale, sia p : X R una funzione subadditiva e positivamente omogenea
(ossia, tale che p(x) = p(x) e p(x + y) p(x) + p(y) per ogni > 0 e
x, y X); siano poi M un sottospazio di X e f : M R un funzionale li-
neare tale che fx p(x) per ogni x M. Allora esiste un funzionale lineare
F : X R tale che F[
M
= f e Fx p(x) per ogni x X.
Se X `e uno spazio vettoriale complesso, il teorema di Hahn-Banach vale nella
forma seguente:
Teorema 1.7.2 (di Hahn-Banach, caso complesso) Sia X uno spazio
vettoriale complesso, sia p : X R una funzione subadditiva e positivamente
omogenea; siano poi M un sottospazio di X e f : M C un funzionale
lineare tale che Re fx p(x) per ogni x M. Allora esiste un funzionale
lineare F : X C tale che F[
M
= f e Re Fx p(x) per ogni x X.
Dimostrazione Ci ricondurremo alla dimostrazione del caso reale mediante
le seguenti osservazioni di immediata verica. Se F : X C `e un funzionale
lineare, allora U = Re F : X R `e un funzionale R-lineare (ossia `e additivo
e U(x) = Ux per ogni R). Viceversa, se U : X R `e R-lineare, allora
il funzionale F : X C denito da
Fx = Ux iU(ix), x X,
41
`e lineare su X e, naturalmente, Re F = U.
Nelle ipotesi del teorema, allora, il funzionale u = Re f verica le ipote-
si del teorema nel caso reale (teorema 1.7.1). Quindi esiste un funzionale
U : X R, R-lineare, tale che U[
M
= u e Ux p(x) per ogni x X. Ne
segue che il funzionale Fx = Ux iU(ix) `e lineare su X e soddisfa la tesi.
Del teorema di Hahn-Banach esiste una versione geometrica altrettanto im-
portante e utile, che si esprime in termini di separazione di insiemi convessi
mediante gli insiemi di livello di opportuni funzionali lineari. Si hanno due
enunciati abbastanza simili: entrambi si dimostrano sfruttando lenunciato
algebrico, cio`e il teorema 1.7.2 (si noti che il teorema 1.7.2, che riguarda il
caso complesso, si riduce automaticamente al teorema 1.7.1, relativo al caso
reale, quando lo spazio X `e reale).
Teorema 1.7.3 (di Hahn-Banach, 1
a
forma geometrica) Sia X uno
spazio vettoriale topologico, e siano K, H sottoinsiemi non vuoti, convessi e
disgiunti di X, con K aperto. Allora esiste un funzionale lineare F : X C,
continuo e non nullo, tale che
sup
K
Re F inf
H
Re F .
Dimostrazione Cominciamo con un caso particolare.
Lemma 1.7.4 Sia X uno spazio vettoriale topologico reale, sia K un con-
vesso aperto e non vuoto di X e sia x
0
X K. Allora esiste un funzionale
lineare F : X R, continuo e non nullo, tale che
Fx < Fx
0
x K.
Dimostrazione Supponiamo dapprima che 0 K. Allora si ha x
0
,= 0,
quindi possiamo denire un funzionale lineare f sul sottospazio M = [x
0
]
ponendo
f(tx
0
) = t t R.
Essendo il convesso K aperto e contenente lorigine, si vede facilmente che,
detto p
K
il funzionale di Minkowski di K, si ha p
K
(x) < +per ogni x X.
Inoltre risulta
f(tx
0
) = t p
K
(tx
0
) t R :
infatti ci`o `e ovvio quando t 0, e daltra parte, essendo x
0
/ K, se t > 0 si
ha tx
0
/ tK e dunque, per denizione, p
K
(tx
0
) t.
42
Per il teorema 1.7.1 esiste un funzionale lineare F : X R tale che F[
M
= f
e F p
K
in X. Ricordando che p
K
(x) < 1 per ogni x K (esercizio 1.3.2),
si deduce
Fx p
K
(x) < 1 = fx
0
= Fx
0
x K
e in particolare il funzionale F non `e identicamente nullo. Resta da provare
che F `e continuo: si ha F < 1 su K, da cui anche F > 1 sul convesso K.
Di conseguenza,
[Fx[ < 1 x K (K).
Cos` F risulta limitato sullintorno K (K) di 0. Dal teorema 1.5.2 segue
che F `e continuo.
Supponiamo ora che 0 / K. Sia y
0
K e consideriamo il traslato K y
0
,
che `e un convesso aperto contenente 0. Per quanto gi`a provato, esiste un
funzionale lineare, continuo e non nullo F : X R tale che
Fy < F(x
0
y
0
) y K y
0
,
ossia
Fx = F(x y
0
) +Fy
0
< F(x
0
y
0
) +Fy
0
= Fx
0
x K.
Ci` o prova la tesi del lemma.
Torniamo alla dimostrazione del teorema 1.7.3. Poniamo
C = K H = x y : x K, y H;
C `e un convesso aperto non vuoto, e 0 / C perche H e K sono disgiunti.
Applicando il lemma 1.7.4 con x
0
= 0 e K = C, si ottiene lesistenza di un
funzionale R-lineare, continuo e non nullo U : X R tale che Uz < 0 per
ogni z C, ossia
Ux < Uy x K, y H.
Posto Fx = Ux iU(ix), il funzionale F : X C `e lineare, continuo e non
nullo, e verica la tesi.
Vi `e una versione stretta del teorema di separazione 1.7.3, che `e la seguente:
Teorema 1.7.5 (di Hahn-Banach, 2
a
forma geometrica) Sia X uno
spazio vettoriale topologico localmente convesso di Hausdor, e siano K, H
convessi non vuoti e disgiunti di X, con K chiuso e H compatto. Allora
esiste un funzionale F : X C lineare, continuo e non nullo tale che
sup
K
Re F < inf
H
Re F.
43
Dimostrazione Premettiamo il seguente lemma.
Lemma 1.7.6 Se B `e un compatto in uno spazio topologico di Hausdor Z,
allora ogni net z
i

iI
B ha almeno un punto di accumulazione z B.
Dimostrazione Poniamo I
i
= j I : i < j e A
i
= z
j
: j I
i
:
dunque A
i
B per ogni i I. Stiamo cercando un punto z B tale che
per ogni intorno U di z e per ogni i I esista z
j
A
i
U; cio`e stiamo
cercando un punto z B che appartenga a tutte le chiusure A
i
, i I. Dato
che, per denizione di net, si ha

n
h=1
A
i
h
,= per ogni sottoinsieme nito
i
1
, . . . i
n
I, a maggior ragione risulta
n

h=1
A
i
h
,= i
1
, . . . i
n
I,
e per la compattezza di B si ottiene

iI
A
i
,= .
Dunque esiste un punto z

iI
A
i
B. Tale z appartiene anche a B
poiche B, essendo compatto nello spazio di Hausdor Z, `e chiuso. Ci`o prova
il lemma.
Proviamo il teorema 1.7.5. Sia U
i

iI
un sistema fondamentale di intorni di
0, con gli U
i
aperti e convessi. Per ogni i I poniamo H
i
= H+U
i
; allora H
i
`e un convesso aperto. Dimostriamo che esiste i
0
I tale che KH
i
= per
ogni i I, i i
0
. In caso contrario, per ogni k I esisterebbe i
k
k per cui
K H
i
k
,= , ossia esisterebbero x
i
k
K e y
i
k
H tali che x
i
k
y
i
k
U
i
k
.
Quindi il net x
i
k
y
i
k

kI
convergerebbe a 0 in X. Daltronde, essendo
H compatto, il lemma 1.7.6 ci dice che il net y
i
k

kI
H avrebbe un
punto di accumulazione y H. Poiche x
i
k
y
i
k
0, il punto y sarebbe di
accumulazione anche per il net x
i
k

kI
K; ma essendo K chiuso, dovrebbe
essere y K, il che `e assurdo perche H e K sono disgiunti. Lasserzione
precedente `e provata.
Pertanto i convessi H
i
0
e K vericano le ipotesi del teorema 1.7.3: quindi
esiste un funzionale G : X C lineare, continuo e non nullo tale che
sup
H
Re G+ sup
U
i
0
Re G = sup
H
i
0
Re G inf
K
Re G.
44
Osserviamo che sup
U
i
0
Re G > 0: infatti, essendo G non identicamente nullo,
esiste z X 0 tale che Re Gz ,= 0; per la continuit`a delle omotetie,
esister`a R0 per cui z U
i
0
e Re G(z) > 0. Quindi sup
U
i
0
Re G > 0
e pertanto
sup
H
Re G < inf
K
Re G.
Posto F = G, si ha allora la tesi.
Vogliamo ora riformulare i teoremi 1.7.3 e 1.7.5 in termini pi` u geometrici. A
questo scopo ci occorre anzitutto una caratterizzazione dei sottospazi di uno
spazio vettoriale topologico X che sono luogo di zeri di funzionali lineari su
X.
Denizione 1.7.7 Sia X uno spazio vettoriale e sia M un sottospazio di
X. Diciamo che M `e massimale se non vi `e alcun sottospazio Y di X che
verichi le inclusioni proprie M Y X.
Proposizione 1.7.8 Sia X uno spazio vettoriale e sia M un sottospazio di
X. Allora M `e massimale se e solo se esiste un funzionale lineare f su X
tale che M = ker f. In tal caso il funzionale f `e unico a meno di costanti
moltiplicative.
Dimostrazione (=) Se M = ker f con f : X C lineare, allora ovvia-
mente M `e un sottospazio di X. Se Y `e un sottospazio di X che contiene
propriamente M, ssiamo y
0
Y M: allora per ogni x X possiamo
scrivere, essendo fy
0
,= 0,
x =
_
x
fx
fy
0
y
0
_
+
fx
fy
0
y
0
;
ma a secondo membro il primo addendo `e un elemento di M, quindi di Y ,
ed il secondo addendo sta in Y . Ci`o mostra che X Y , ossia X = Y .
(=) Sia M un sottospazio massimale. Se M = X, allora il funzionale
identicamente nullo ha M come luogo di zeri. Se M X, ssiamo z
0

X M: allora il sottospazio [z
0
, M] contiene propriamente M, e quindi
deve coincidere con X. Quindi ogni elemento x X si pu`o decomporre (in
modo unico) nella forma
x = u +z
0
, u M, C.
45
Deniamo il funzionale f nel modo seguente:
f(u +z
0
) = .
Chiaramente f `e ben denito e lineare; inoltre ker f = M.
Resta da vericare che se M = ker f = ker g, con f e g funzionali lineari su
X, allora g `e multiplo di f; e in eetti se z
0
X M, allora
x
fx
fz
0
z
0
ker f = ker g x X,
da cui
g
_
x
fx
fz
0
z
0
_
= 0 x X,
ossia
gx =
gz
0
fz
0
fx x X.
Ci` o prova la tesi.
Osservazione 1.7.9 Se M `e un sottospazio massimale dello spazio vetto-
riale topologico X, allora M `e chiuso in X oppure denso in X. Infatti, M
`e un sottospazio che contiene M: se M = M, allora M `e chiuso; se invece
M M, allora per la massimalit`a di M si ha M = X, ossia M `e denso in
X.
Corollario 1.7.10 Sia X uno spazio vettoriale topologico e sia f un funzio-
nale lineare su X. Allora ker f `e chiuso in X oppure denso in X a seconda
che f sia continuo oppure no.
Dimostrazione Se f `e continuo, allora ker f = f
1
(0) `e limmagine inversa
di un chiuso di C e quindi `e chiuso.
Se f non `e continuo, proviamo che ker f `e denso in X. Sia x X: se fx = 0,
abbiamo gi`a nito, per cui possiamo supporre che fx ,= 0. Sia U = x+V un
intorno di x tale che V sia un intorno bilanciato di 0. Per il teorema 1.5.2, U
contiene un punto y tale che [fy[ > [fx[. Scegliamo t =
fx
fy
; allora, essendo
[t[ < 1 si ha ty V e quindi x + ty U. Daltra parte, x + ty ker f e ci`o
prova la tesi.
Adesso introduciamo la nozione di iperpiano.
46
Denizione 1.7.11 Sia X uno spazio vettoriale topologico. Un iperpiano
ane di X `e un insieme della forma
= x X : Re fx = k, k R,
ove f `e un funzionale lineare su X.
Si noti che se X `e reale, ogni iperpiano ane `e il traslato di un sottospazio
massimale: infatti se f : X R `e lineare e non identicamente nullo, e
= x X : fx = k, k R, allora si ha = x X : fx = 0 + x
0
, ove
x
0
`e scelto in modo che fx
0
= k. Osserviamo che ci`o `e falso se X `e complesso
(esercizio 1.7.7).
Osservazione 1.7.12 Dal corollario 1.7.10 segue che un iperpiano ane `e
chiuso o denso in X a seconda che il corrispondente funzionale sia continuo
o no. Un iperpiano ane chiuso `e anche detto variet`a ane. Si noti che ogni
iperpiano ane chiuso della forma = x X : Re fx = k, con k reale,
divide X in due semispazi chiusi

+
= x X : Re fx k,

= x X : Re fx k.
I teoremi di Hahn-Banach 1.7.3 e 1.7.5 si possono allora riformulare nel modo
seguente.
Corollario 1.7.13 Sia X uno spazio vettoriale topologico.
(i) Se K, H sono convessi non vuoti e disgiunti in uno spazio vettoriale
topologico X, con K aperto, allora esiste un iperpiano ane chiuso
che separa H e K (nel senso che H e K sono contenuti uno in
+
ed
uno in

).
(ii) Se lo spazio vettoriale topologico X `e localmente convesso di Hausdor,
e se K, H sono convessi non vuoti disgiunti con K chiuso e H compatto,
allora esiste un iperpiano ane chiuso che separa strettamente H
e K (ossia H e K sono contenuti nei due semispazi aperti individuati
da ).
Vediamo altre propriet`a geometriche degli insiemi convessi.
Denizione 1.7.14 Sia X uno spazio vettoriale topologico, sia K X. Un
iperpiano di appoggio per K `e un iperpiano ane chiuso tale che:
47
(i) K ,= ,
(ii) K `e contenuto in uno dei due semispazi chiusi individuati da .
Un punto x K si dice punto di appoggio di su K.
Corollario 1.7.15 Sia X uno spazio vettoriale topologico, sia K un convesso
di X con parte interna non vuota. Allora ogni x
0
K `e punto di appoggio
su K di qualche iperpiano ane chiuso.
Dimostrazione Gli insiemi x
0
e

K sono convessi disgiunti di X, con

K
aperto. Per il teorema 1.7.3, esiste un funzionale lineare e continuo F : X
C tale che
Re Fx
0
Re Fx x

K;
quindi, per continuit`a,
Re Fx
0
Re Fx x

K,
il che implica, per lesercizio 1.3.9,
Re Fx
0
Re Fx x K.
Pertanto, posto = Re Fx
0
, liperpiano ane chiuso = u X : Re Fu =
`e di appoggio per K e x
0
`e punto di appoggio di su K.
Corollario 1.7.16 Sia X uno spazio vettoriale topologico localmente con-
vesso di Hausdor. Se K X `e un convesso chiuso non vuoto, allora K `e
lintersezione di tutti i semispazi chiusi che lo contengono.
Dimostrazione Sia H lintersezione di tutti i semispazi chiusi contenenti
K: ovviamente K H. Sia x
0
H: se fosse x
0
/ K, i convessi x
0

e K sarebbero disgiunti, con x


0
compatto e K chiuso. Per il teorema
1.7.5, esisterebbe un iperpiano ane chiuso che separa strettamente i due
convessi; quindi fra i due semispazi chiusi individuati da ce ne sarebbe uno
contenente K ma non il punto x
0
, contro lipotesi x
0
H.
Dai risultati precedenti deduciamo facilmente questa importante propriet`a:
Corollario 1.7.17 Sia X uno spazio vettoriale topologico localmente con-
vesso di Hausdor. Se K `e un convesso di X, allora K `e chiuso se e solo se
K `e w-chiuso.
48
Dimostrazione Poiche la topologia debole `e meno ne di quella naturale di
X, ogni insieme w-chiuso `e necessariamente chiuso.
Viceversa, supponiamo che K sia chiuso. Per il corollario 1.7.16, K `e lin-
tersezione di tutti i semispazi chiusi che lo contengono. Ma un semispazio
chiuso ha la forma x X : Re Fx k, con F X

e k R; dato che w
`e la meno ne topologia che rende continui gli elementi di X

, ogni insieme
della forma sopra scritta `e w-chiuso, essendo la controimmagine del chiuso
] , k] R mediante lapplicazione w-continua Re F. Dunque ogni semi-
spazio chiuso `e w-chiuso, e dunque H, essendo intersezione di w-chiusi, `e un
insieme w-chiuso.
Corollario 1.7.18 Sia X uno spazio normato, sia x
n

nN
una successione
contenuta in X, e sia x X tale che x
n
x in X. Allora esiste una
successione v
n

nN
, costituita da combinazioni convesse degli x
n
, tale che
|v
n
x|
X
0.
Dimostrazione Poiche x
n
x, per ogni n N il punto x appartiene alla
chiusura debole dellinsieme

k=n
x
k
, ed a maggior ragione alla chiusura
debole del suo inviluppo convesso. Ma, ovviamente, questultimo insieme
`e un convesso w-chiuso, quindi anche chiuso nella topologia indotta dalla
norma. In denitiva,
x co
_

_
k=n
x
k

_
n N.
Perci`o si pu`o costruire una successione v
n

nN
tale che v
n
x in X e
v
n
co (

k=n
x
k
) per ogni n N. Ciascun v
n
, per denizione, `e della
forma
v
n
=
qn

k=pn

(n)
k
x
k
,
(n)
k
[0, 1],
qn

k=pn

(n)
k
= 1, n p
n
q
n
.
Ci` o prova la tesi.
Concludiamo il paragrafo con un altro risultato di compattezza negli spazi
di Banach: questa propriet`a `e stabile nel passaggio da un insieme qualunque
al suo inviluppo convesso.
Proposizione 1.7.19 (teorema di Mazur) Sia K un sottoinsieme relati-
vamente compatto di uno spazio di Banach X. Allora co(K) `e compatto.
49
Dimostrazione Basta dimostrare che co(K) `e totalmente limitato. Sia >
0: poiche K, essendo relativamente compatto, `e totalmente limitato, esistono
z
1
, . . . , z
n
K tali che
K
n
_
i=1
B
_
z
i
,

2
_
.
Poniamo H = coz
1
, . . . , z
n
; allora H `e compatto in X, perche `e limmagine
del compatto a [0, 1]
n
:

n
1=1
a
i
= 1 mediante lapplicazione continua
(a) =

n
i=1
a
i
z
i
. Dunque H `e totalmente limitato e pertanto esistono
v
1
, . . . v
m
H tali che
H
m
_
j=1
B
_
v
j
,

2
_
.
Sia ora y co(K), ossia y =

p
r=1

r
y
r
, con y
r
K,

p
r=1

r
= 1 e

r
0; sia i
r
1, . . . m un indice tale che y
r
B(z
ir
,

2
). Allora, posto
u =

p
r=1

r
z
ir
, si ha u H e
|y u|
X
=
_
_
_
_
_
p

r=1

r
(y
r
z
ir
)
_
_
_
_
_
X

r=1

r
|y
r
z
ir
|
X
<

2
,
e dunque
co(K)
_
uH
B
_
u,

2
_

m
_
j=1
B(v
j
, ) ,
da cui la tesi, essendo v
1
, . . . v
m
H co(K).
Esercizi 1.7
1. Sia X uno spazio vettoriale topologico localmente convesso di Hau-
sdor. Se x X 0, si provi che esiste un funzionale lineare e
continuo F : X C tale che Fx ,= 0.
2. Sia X uno spazio vettoriale topologico localmente convesso di Hausdor
e sia M un sottospazio proprio di X. Se x / M, si provi che esiste un
funzionale lineare e continuo F : X C tale che Re Fx = 1 e F[
M
= 0.
3. Sia X uno spazio vettoriale topologico localmente convesso di Hau-
sdor, e sia B un sottoinsieme chiuso, convesso e bilanciato di X. Se
x
0
/ B, si provi che esiste un funzionale lineare e continuo F : X C
tale che [Re F[ 1 su B e Re Fx
0
> 1.
50
4. Nello spazio L
2
(1, 1) si consideri il sottoinsieme K

= f C[1, 1] :
f(0) = , R. Si verichi che ciascun K

`e convesso e denso in
L
2
(1, 1), e si provi che per ,= gli insiemi K

e K

sono disgiunti
ma non sono separati da alcun iperpiano ane.
5. Vericare che i due insiemi
K = (x, y) R
2
: y 0, H = (x, y) R
2
: y e
x

sono convessi chiusi disgiunti di R


2
, che non possono essere separati
strettamente da alcun funzionale F (R
2
)

.
6. Sia X uno spazio vettoriale topologico reale. Si provi che ogni iperpiano
ane chiuso in X R `e della forma
M = (x, t) X R : fx +t = ,
ove f `e un funzionale lineare e continuo su X e , sono numeri reali.
Si mostri poi che se ,= 0, allora M `e un opportuno traslato del graco
di un funzionale X

, ossia esiste y X R tale che M si pu`o


scrivere nella forma
M = y +(x, x) : x X.
7. Sia X uno spazio vettoriale topologico complesso e sia f X

0.
Si mostri che se k R linsieme P = x X : Re fx = k non `e il
traslato di alcun sottospazio di X.
8. Si estenda il teorema di Mazur al caso in cui X `e uno spazio vettoriale
topologico completo e metrizzabile.
9. Sia X uno spazio topologico di Hausdor. Si provi che un sottoinsieme
A di X `e compatto se e solo se ogni net x
i

iI
A ha almeno un
punto di accumulazione x A.
1.8 Punti estremi di insiemi convessi
Ogni insieme convesso K in uno spazio vettoriale X `e, ovviamente, linviluppo
convesso di se stesso; ci chiediamo se sia possibile individuare un sottoinsieme
H K minimale del quale K sia linviluppo convesso. Per rispondere a
questa domanda `e importante la nozione di punto estremo.
51
Denizione 1.8.1 Sia X uno spazio vettoriale e sia K un sottoinsieme con-
vesso e non vuoto di X. Un punto x
0
K si dice punto estremo di K se
linsieme K x
0
`e convesso.
In altre parole, un punto x
0
K `e estremo per K se non vi `e alcuna coppia
di punti distinti x, y K tali che si abbia x + (1 )y = x
0
per qualche
]0, 1[, cosicche togliere x
0
non distrugge la convessit`a di K.
Uno dei pi` u profondi risultati relativi agli insiemi convessi e compatti `e il
seguente
Teorema 1.8.2 (di Krein-Milman) Sia X uno spazio vettoriale topolo-
gico localmente convesso di Hausdor e sia K X un insieme compatto,
convesso e non vuoto. Allora, detto K
e
linsieme dei punti estremi di K, si
ha:
(i) K
e
`e non vuoto;
(ii) K = co(K
e
).
Dimostrazione (i) Indichiamo con / la classe di tutti i sottoinsiemi chiusi
e non vuoti A K tali che
x, y K, ]0, 1[, x + (1 )y A = x, y A.
Poiche K /, la classe / `e non vuota (ed `e costituita da insiemi compatti,
essendo K compatto). Consideriamo su di essa lordinamento parziale dato
dallinclusione rovesciata:
A
1
A
2
A
1
A
2
A
1
, A
2
/.
Osserviamo che se / / `e un insieme totalmente ordinato, allora linsieme

AA
A `e non vuoto, essendo intersezione di una famiglia decrescente di
compatti; inoltre applicando la denizione di / si vede subito che

AA
A `e
un elemento di /, ed `e evidentemente un maggiorante per /. Per il lemma
di Zorn, deduciamo che esiste almeno un elemento massimale A
1
/.
Aermiamo che ogni elemento massimale A
1
/ contiene esattamente un
punto. Infatti, supposto per assurdo x, y A
1
e x ,= y, per il teorema 1.7.5
possiamo trovare un funzionale lineare e continuo F X

tale che, posto


G = Re F, sia Gx < Gy. Poniamo
A
0
= u A
1
: Gu = inf
A
1
G;
52
allora A
0
,= perche il funzionale continuo G ha minimo sul compatto A
1
.
Daltra parte, A
0
/: infatti, se u, v K e u + (1 )v A
0
per qualche
]0, 1[, si ha intanto u, v A
1
(in quanto A
1
/); di conseguenza, essendo
inf
A
1
G = inf
A
1
G+(1) inf
A
1
G Gu+(1)Gv = G(u+(1)v) = inf
A
1
G,
si deduce che Gu = Gv = inf
A
1
G, ossia u, v A
0
. Ci`o mostra appunto che
A
0
/. Ma, dato che y A
1
A
0
, otteniamo che A
0
`e contenuto propria-
mente in A
1
, ossia A
1
A
0
e A
1
,= A
0
, il che contraddice la massimalit`a di
A
1
. Si conclude che A
1
ha al pi` u un elemento; ma siccome A
1
/, deve
essere A
1
,= e pertanto A
1
ha esattamente un elemento. Tale elemento, per
denizione di /, `e un punto estremo di K. Ci`o prova (i).
(ii) Essendo K un convesso chiuso contenente K
e
, `e chiaro che K
co(K
e
); proviamo laltra inclusione. Supponiamo per assurdo che esista
z K co(K
e
). Per il teorema 1.7.5, esiste un funzionale lineare e continuo
F X

tale che, posto G = Re F, risulta


Gz < infGu : u co(K
e
).
Posto
K
0
= x K : Gx = inf
K
G,
chiaramente K
0
`e un chiuso non vuoto disgiunto da K
e
ed inoltre si ha,
ragionando come in precedenza,
x, y K, ]0, 1[, x + (1 )y K
0
= x, y K
0
,
ossia K
0
appartiene alla classe / introdotta allinizio della dimostrazione.
Inoltre K
0
, essendo compatto e convesso, ha punti estremi in virt` u della
parte (i) gi`a provata.
Mostriamo adesso che ogni punto estremo di K
0
`e punto estremo di K. Sia
x
0
(K
0
)
e
: in particolare, x
0
K
0
e quindi Gx
0
= inf
K
G. Se fosse x
0
/ K
e
esisterebbero u, v K e ]0, 1[ tali che u + (1 )v = x
0
. Ma allora,
con lormai consueto ragionamento, deduciamo inf
K
G = Gx
0
= Gu = Gv,
cio`e u, v K
0
; questo contraddice il fatto che x
0
`e punto estremo di K
0
. Si
conclude quindi che x
0
K
e
.
Abbiamo cos` ottenuto (K
0
)
e
K
0
K
e
= , e ci`o `e impossibile. Pertanto
K co(K
e
) e la tesi `e dimostrata.
53
Esercizi 1.8
1. Sia K un convesso non vuoto in uno spazio vettoriale topologico lo-
calmente convesso di Hausdor. Si provi che K
e
K; si fornisca
un esempio in cui vale linclusione stretta ed un esempio in cui vale
luguaglianza.
2. Se K `e un poliedro convesso in R
N
, si provi che K
e
coincide con
linsieme dei vertici di K.
3. Si consideri linsieme K R
3
cos` denito:
K = co(1, 0, 1), (1, 0, 1), (cos , sin , 0) : [0, 2].
Si determini K
e
e si mostri che K `e compatto mentre K
e
non lo `e.
4. Per ogni p [1, [ sia
B
p
= f L
p
(0, 1) : |f|
p
1.
Si provi che (B
1
)
e
= , mentre
(B
p
)
e
= f L
p
(0, 1) : |f|
p
= 1 p ]1, [.
5. Posto
B = f C([0, 1], C) : |f|

1, B

= B C([0, 1], R),


si provi che
B
e
= f C([0, 1], C) : [f(t)[ = 1 t [0, 1], B

e
= 1.
6. Si determini B
e
, ove B = f L

(0, 1) : |f|

1.
7. Sia S un sottoinsieme non vuoto di R
N
. Si provi che ogni x co(S) `e
combinazione convessa di al pi` u N + 1 punti di S.
[Traccia: Se x co(S), sar`a x =

m
i=1

i
x
i
, con
i
[0, 1],

m
i=1

i
=
1, x
i
S e m N
+
. Se m N + 1 non c`e niente da dimostrare;
altrimenti sar`a m > N + 1 e potremo assumere
i
> 0 per ogni i =
1, . . . , m. Si verichi che esistono
1
, . . . ,
m1
non tutti nulli, tali che

m1
i=1

i
(x
i
x
m
) = 0, ossia

m
i=1

i
x
i
= 0, ove
m
=

m1
i=1

i
.
54
Si determini ora R tale che: (a)
i

i
0 per i = 1, . . . , m;
(b) esiste j 1, . . . , m per cui
j

j
= 0. Se ne deduca che x
`e combinazione convessa di x
1
, . . . , x
m
con coecienti
i

i
, i =
1, . . . m, uno dei quali `e nullo: dunque x `e combinazione convessa di
m 1 elementi di S. Iterando questo argomento un numero nito di
volte si ricavi la tesi.]
8. Provare che se K `e un convesso compatto e non vuoto di R
N
, allora
ogni x K `e combinazione convessa di al pi` u N + 1 punti estremi di
K.
55
Capitolo 2
Funzioni convesse
2.1 Generalit`a
Le funzioni convesse hanno un ruolo fondamentale nei problemi di minimo e
nel calcolo delle variazioni. Questo capitolo `e dedicato alla descrizione delle
loro principali propriet`a.
Denizione 2.1.1 Sia X uno spazio vettoriale. Una funzione f : X R =
[, +] si dice convessa se risulta
f((1 t)x +ty) (1 t)f(x) +tf(y) t [0, 1]
per ogni coppia di punti x, y X per i quali il secondo membro sia ben
denito (ossia non risulti f(x) = f(y) = ). Se, limitatamente agli x, y
per i quali ha senso, la disuguaglianza `e stretta per ogni t ]0, 1[ e x ,= y,
la funzione si dice strettamente convessa. La funzione si dice concava, o
strettamente concava, se f `e convessa o strettamente convessa.
Abbiamo ammesso tra i valori di una funzione convessa anche . Ci sono
almeno due buone ragioni per ammettere il valore +. La prima `e che se
U X `e un insieme convesso e se f : U R `e una funzione convessa (cio`e
vale la disuguaglianza di convessit`a per ogni t [0, 1] e x, y U), allora
lestensione
f(x) =
_
f(x) se x U
+ se x / U
risulta convessa: quindi possiamo limitarci a considerare funzioni convesse
denite su tutto X. La seconda ragione `e la seguente: introducendo la
56
funzione indicatrice di un insieme E X,
I
E
(x) =
_
0 se x E
+ se x / E,
si ha che E `e convesso in X se e solo se I
E
`e una funzione convessa su X:
dunque lo studio degli insiemi convessi pu`o attuarsi tramite lo studio delle
funzioni convesse.
Invece le funzioni convesse che assumono il valore sono alquanto patologi-
che: se f `e convessa e se f(x
0
) = , allora su ogni semiretta x
0
+tv, t > 0
il comportamento di f `e il seguente: o essa vale costantemente +, o vale
costantemente , oppure per un opportuno t
0
> 0 si avr`a f(x
0
+tv) =
per 0 t < t
0
e f(x
0
+ tv) = + per t > t
0
, mentre f(x
0
+ t
0
v) sar`a un
qualunque valore in R. Questa aermazione segue facilmente utilizzando la
disuguaglianza di convessit`a.
Per sgombrare il campo da certe patologie, sono utili le denizioni che seguo-
no.
Denizione 2.1.2 Sia X uno spazio vettoriale. Una funzione f : X R
si dice propria se f(x) > per ogni x X ed esiste x X per cui
f(x) < +.
Denizione 2.1.3 Sia X uno spazio vettoriale e sia f : X R una fun-
zione. Il dominio di f `e linsieme
D(f) = x X : f(x) < +.
Dunque se f `e convessa e propria si ha D(f) = x X : f(x) R. Inoltre,
se f `e convessa, D(f) `e un sottoinsieme convesso di X.
Esempio 2.1.4 In uno spazio vettoriale X sono funzioni convesse e proprie:
i funzionali lineari, i funzionali di Minkowski di insiemi convessi e radiali, le
seminorme.
Osservazione 2.1.5 Se f : X R `e convessa, allora gli insiemi di sottoli-
vello
E

= x X : f(x) , R,
sono convessi. Il viceversa `e falso, come mostra lesempio della funzione x
3
in R. Se f : X R `e una funzione i cui insiemi di sottolivello sono convessi,
essa si dice quasi convessa; f si dir`a quasi concava se f `e quasi convessa.
57
Denizione 2.1.6 Sia X uno spazio vettoriale, sia f : X R. L epigra-
co di f `e il sottoinsieme di X R cos` denito:
epi(f) = (x, t) X R : f(x) t =
_
R
(E

[, +[).
La stretta parentela fra insiemi convessi e funzioni convesse `e evidenziata
dalla seguente
Proposizione 2.1.7 Sia X uno spazio vettoriale. Una funzione f : X R
`e convessa se e solo se il suo epigraco `e convesso in X R.
Dimostrazione (=) Siano (x, t), (y, s) epi(f): allora in particolare ne
f(x), ne f(y) valgono + e quindi si pu`o sicuramente scrivere la disugua-
glianza di convessit`a. Pertanto, per ogni [0, 1] si ha
f((1 )x +y) (1 )f(x) +f(y) (1 )t +s,
ossia
(1 )(x, t) +(y, s) epi(f) [0, 1],
il che mostra che epi(f) `e convesso.
(=) Se almeno uno fra f(x) e f(y) vale +, la disuguaglianza di convessit`a,
se ha senso, `e ovvia. Se f(x) e f(y) sono entrambi reali, allora i punti (x, f(x))
e (y, f(y)) appartengono a epi(f), e quindi si ha, per ipotesi,
((1 )x +y, (1 )f(x) +f(y)) epi(f) [0, 1],
cio`e
f((1 )x +y) (1 )f(x) +f(y) [0, 1].
Inne se almeno uno fra f(x) e f(y) vale , ad esempio f(x) = (ma
nessuno dei due vale +), per ogni u R e per ogni v [f(y), +[ si ha
(x, u), (y, v) epi(f) e dunque come prima otteniamo
f((1 )x +y) (1 )u +v u R, v [f(y), +[,
da cui per u ricaviamo f((1 )x + y) = , ossia f verica la
relazione di convessit`a anche in questo caso.
58
Esercizi 2.1
1. Sia X uno spazio vettoriale e sia f : X R convessa. Si provi che se
: R R `e crescente e convessa, allora f `e convessa su X.
2. Si provi che lestremo superiore di una famiglia arbitraria di funzioni
convesse `e una funzione convessa.
3. Sia X uno spazio vettoriale e sia f : X R una funzione qualunque.
Si provi che f `e convessa su X se e solo se per ogni x, v X il rapporto
incrementale
t
f(x +tv) f(x)
t
, t R 0,
`e una funzione crescente.
4. Sia X uno spazio vettoriale. Si provi che se f : X R `e convessa,
allora linsieme x X : f(x) = `e convesso mentre in generale
linsieme x X : f(x) = + non lo `e.
5. Sia X uno spazio di Hilbert. Si provi che x |x|
2
X
`e una fun-
zione strettamente convessa, mentre x |x|
X
`e convessa ma non
strettamente convessa.
6. Sia X uno spazio vettoriale topologico. Se f : X R `e continua, si
provi che f `e convessa se e solo se
f
_
x +y
2
_

1
2
f(x) +
1
2
f(y) x, y X.
7. Sia X uno spazio vettoriale. Si provi che linsieme delle funzioni con-
vesse `e un convesso dello spazio vettoriale Y = f : X R, ed `e
chiuso rispetto alla convergenza puntuale.
2.2 Semicontinuit`a
Una fondamentale propriet`a funzionale, di grande importanza nei problemi
di minimo, `e la semicontinuit`a.
59
Denizione 2.2.1 Sia X uno spazio topologico e sia f : X R. Diciamo
che f `e semicontinua inferiormente nel punto x
0
X se si ha
f(x
0
) liminf
xx
0
f(x).
Diciamo che f `e semicontinua superiormente nel punto x
0
X se si ha
f(x
0
) limsup
xx
0
f(x).
La funzione f si dice semicontinua inferiormente, o superiormente, in X se
lo `e in ogni punto di X.
Ricordiamo che, detta |(x
0
) la famiglia degli intorni di x
0
, si ha per deni-
zione
liminf
xx
0
f(x) = sup
V U(x
0
)
inf
yV \{x
0
}
f(y), limsup
xx
0
f(x) = inf
V U(x
0
)
sup
yV \{x
0
}
f(y).
`
E facile vericare che f `e semicontinua inferiormente in x
0
se e solo se f `e
semicontinua superiormente in x
0
; inoltre f `e continua in x
0
se e solo se f `e
semicontinua sia inferiormente che superiormente in x
0
. Vale poi la seguente
caratterizzazione:
Proposizione 2.2.2 Sia X uno spazio topologico e sia f : X R. I
seguenti fatti sono equivalenti:
(i) f `e semicontinua inferiormente in X;
(ii) gli insiemi di sottolivello E

= x X : f(x) sono chiusi per ogni


R;
(iii) epi(f) `e chiuso in X R.
Dimostrazione (i) = (ii) Proviamo che E
c

`e aperto. Sia x
0
/ E

, ossia
f(x
0
) > ; scelto ]0, f(x
0
) [, per ipotesi esiste V |(x
0
) tale che
f(x) f(x
0
) > per ogni x V x
0
. Ci`o `e ovviamente vero anche
per x = x
0
, il che mostra che V E
c

; pertanto E
c

`e aperto.
(ii) = (iii) Proviamo che epi(f)
c
`e aperto. Sia (x
0
, ) / epi(f), ossia
f(x
0
) > ; scelto ]0, f(x
0
) [, poiche x
0
appartiene allaperto E
c
+
esiste V |(x
0
) tale che f(x) > + per ogni x V . Dunque, per
60
ogni (x, ) V ] , + [ si ha a maggior ragione f(x) > , ossia
V ] , +[ epi(f)
c
. Ci`o mostra che epi(f)
c
`e aperto.
(iii) = (i) Proviamo che f `e semicontinua inferiormente in un generico
punto x
0
X. Sia < f(x
0
): allora (x
0
, ) appartiene allaperto epi(f)
c
,
cosicche esistono V |(x
0
) ed > 0 tali che V ] , +[ epi(f)
c
; ci`o
signica f(x) > per ogni x V e per ogni ] , + [. Ne segue
inf
V
f + > , ed a maggior ragione
sup
V U(x
0
)
inf
V \{x
0
}
f > .
Per larbitrariet`a di , otteniamo liminf
xx
0
f(x) f(x
0
).
Corollario 2.2.3 Lestremo superiore di unarbitraria famiglia di funzioni
semicontinue inferiormente `e una funzione semicontinua inferiormente.
Dimostrazione Sia f
i

iI
una famiglia di funzioni semicontinue inferior-
mente nello spazio topologico X. Per ogni x
0
X e per ogni i I si
ha
f
i
(x
0
) sup
V U(x
0
)
inf
xV \{x
0
}
f
i
(x);
quindi
f
i
(x
0
) sup
V U(x
0
)
inf
xV \{x
0
}
sup
iI
f
i
(x),
ed inne
sup
iI
f
i
(x
0
) sup
V U(x
0
)
inf
xV \{x
0
}
sup
iI
f
i
(x),
che `e la tesi.
Per le funzioni semicontinue vale met`a del classico teorema di Weierstrass.
Proposizione 2.2.4 Sia X uno spazio topologico di Hausdor e sia f : X
R una funzione semicontinua inferiormente in X. Se K X `e un insieme
compatto, oppure sequenzialmente compatto, allora f ha minimo su K.
Naturalmente, se vogliamo che il minimo di f su K sia nito, dovremo ri-
chiedere che in K si abbia f ,= + e f > .
Dimostrazione Se f + su K, allora inf
K
f = min
K
f = +. Al-
trimenti, sar`a = inf
K
f < +; esiste allora una successione x
n
K
tale che f(x
n
) per n . Supponendo K sequenzialmente compatto,
61
esiste una sottosuccessione x
n
k
x
n
che converge ad un punto x K;
per semicontinuit`a, si conclude che f(x) liminf
k
f(x
n
k
) = , ossia
f(x) = = min
K
f.
Se invece K `e compatto, sia > 0: esiste N tale che f(x
n
) < + per
ogni n . Utilizzando il lemma 1.7.6 otteniamo che la successione x
n

n
ha un punto daccumulazione x K: ci`o signica che per ogni U |(x)
esiste un indice n
U
tale che x
n
U
U. Ne segue che il net x
n
U

UU(x)
converge a x. Scelto U |(x) in modo che inf
yU
f(y) > liminf
yx
f(y) , per
semicontinuit`a si conclude che
f(x) inf
yU
f(y) + f(x
n
U
) + + 2,
da cui f(x) = .
Esercizi 2.2
1. Sia X uno spazio topologico. Si provi che un sottoinsieme E di X
`e chiuso se e solo se la sua funzione indicatrice I
E
`e semicontinua
inferiormente su X.
2. Esibire un esempio di funzione f : R R che non `e semicontinua
inferiormente ne superiormente in alcun punto.
3. Sia X uno spazio topologico e sia f : X R una funzione semicontinua
inferiormente. Si verichi che se x
n
`e una successione contenuta in
X che converge a un punto x X, allora
f(x) liminf
n
f(x
n
).
2.3 Funzioni convesse semicontinue inferior-
mente
Sia X uno spazio vettoriale topologico: le funzioni convesse da X in R che
sono semicontinue inferiormente hanno un quadro pi` u ricco di propriet`a e
rivestono grande importanza nelle applicazioni.
Tutti gli enunciati che daremo hanno una versione simmetrica relativa alle
funzioni concave e semicontinue superiormente, di cui per brevit`a non parle-
remo; osserviamo tuttavia che sono proprio le funzioni concave e semicontinue
62
superiormente quelle maggiormente usate nelle applicazioni alleconomia.
Prima di tutto, osserviamo che, fra le funzioni convesse, quelle semicontinue
inferiormente presentano meno patologie. Infatti:
Proposizione 2.3.1 Sia X uno spazio vettoriale topologico e sia f : X R
una funzione convessa e semicontinua inferiormente. Se esiste x
0
X tale
che f(x
0
) = , allora [f(x)[ = + per ogni x X.
Dimostrazione Se esistesse y
0
X tale che f(y
0
) R, allora per convessit`a
avremmo
f(x
0
+ (1 )y
0
) f(x
0
) + (1 )f(y
0
) = ,
e quando 0 otterremmo, per semicontinuit`a,
f(y
0
) liminf
0
f(x
0
+ (1 )y
0
) = liminf
0
() = .
In particolare, dunque, se una funzione convessa e semicontinua inferiormente
assume un valore reale, allora non assume il valore .
Le funzioni convesse e semicontinue inferiormente possiedono la seguente
propriet`a, di fondamentale importanza per le applicazioni.
Proposizione 2.3.2 Sia X uno spazio vettoriale topologico localmente con-
vesso di Hausdor. Se f : X R `e convessa e semicontinua inferiormente,
allora f `e semicontinua inferiormente per la topologia debole di X.
Dimostrazione Per ipotesi, il convesso epi(f) `e chiuso in X R; quindi,
per il corollario 1.7.17, esso `e anche w-chiuso in X R. I funzionali lineari e
continui su X R sono tutti e soli quelli della forma
(x, t) x +t, (x, t) X R,
con X

e R

= R (esercizio 2.3.8); quindi lo spazio topologico


(X R, w) coincide con lo spazio prodotto (X, w) R. Dunque epi(f) `e
chiuso in (X, w) R e pertanto f `e semicontinua inferiormente in X relati-
vamente a w.
Dalla proposizione precedente discendono alcuni criteri per lesistenza del
minimo, su opportuni insiemi, di una funzione convessa e semicontinua infe-
riormente.
63
Teorema 2.3.3 Sia X uno spazio di Banach riessivo e sia f : X R una
funzione convessa e semicontinua inferiormente. Se K `e un sottoinsieme
limitato, debolmente chiuso e non vuoto di X, allora f ha minimo su K.
Se f `e propria su K, tale minimo `e nito. Se inne K `e convesso e f `e
strettamente convessa, il punto di minimo `e unico.
Dimostrazione Se f + su K, allora min
K
f = inf
K
f = +. Al-
trimenti, sar`a = inf
K
f < +; scegliamo una successione x
n
K
tale che f(x
n
) per n . Poiche K `e debolmente chiuso, esso `e
chiuso nonche limitato: essendo X riessivo, per il teorema di Eberlein-
Smulyan (pi` u precisamente per il corollario 1.6.5) K `e debolmente com-
patto; quindi esiste x
n
k
x
n
tale che x
n
k
x K per k .
Poiche f `e w-semicontinua inferiormente (proposizione 2.3.2), otteniamo
f(x) liminf
k
f(x
n
k
) = .
Se f `e anche propria in K, la relazione f(x) = mostra che > e
quindi il minimo di f `e nito.
Inne se K `e convesso e f `e strettamente convessa, siano x
1
e x
2
due distinti
punti di minimo per f in K: allora essendo f(x
1
) = f(x
2
) = , la stretta
convessit`a implica
f
_
x
1
+x
2
2
_
<
1
2
f(x
1
) +
1
2
f(x
2
) = ,
il che `e assurdo.
Corollario 2.3.4 Sia X uno spazio di Banach riessivo e sia f : X R
una funzione convessa e semicontinua inferiormente. Se risulta
lim
x
f(x) = +,
allora f ha minimo su ogni sottoinsieme debolmente chiuso non vuoto H
X. Se f `e anche propria in H, tale minimo `e nito. Se inoltre H `e convesso
e f `e strettamente convessa, il punto di minimo `e unico.
Dimostrazione Se f + su H, allora min
H
f = inf
H
f = +. Altri-
menti, ssato un numero reale M > inf
H
f, per ipotesi si avr`a f(x) > M per
|x| > r, con r opportuno; dunque inf
H
f = inf
HB(0,r)
f, e quindi ci siamo
ridotti al caso del teorema precedente. Ne segue la tesi.
64
Osservazione 2.3.5 Il risultato del teorema 2.3.3 e quindi del corollario
2.3.4 si estendono al caso delle funzioni quasi convesse, denite nellosserva-
zione 2.1.5: si veda in proposito lesercizio 2.3.5.
Stabiliamo adesso un lemma di separazione fra lepigraco di una funzione
convessa ed un convesso disgiunto; le due forme di questo enunciato, che
seguono dalle due forme geometriche del teorema di Hahn-Banach, verranno
usate ripetutamente nel seguito.
Lemma 2.3.6 (i) Sia X uno spazio vettoriale topologico, sia f : X R
una funzione convessa e sia B X R un insieme convesso non vuoto. Se

epi(f),= , B

epi(f)= ed esistono

D(f) e s R tali che (, s) B,


allora si possono trovare G X

e > 0 tali che, posto = Re G, risulti


y +s x +t (y, s) B, (x, t) epi(f).
(ii) Sia X uno spazio vettoriale topologico localmente convesso di Hausdor
e sia f : X R una funzione convessa, semicontinua inferiormente e tale
che f(x) > per ogni x X. Se (y, s) / epi(f), allora si possono trovare
G X

e > 0 tali che, posto = Re G, risulti


y +s < infx +t : (x, t) epi(f).
Dimostrazione (i) Poiche

epi(f) e B sono convessi non vuoti disgiunti ed


il primo `e aperto, per il teorema 1.7.3 esiste un funzionale lineare e continuo
su X R, non nullo, che li separa: in altre parole, in virt` u del corollario
1.7.13 e dellesercizio 1.7.6, esistono R e G : X C lineare e continuo,
non entrambi nulli e tali che, posto = Re G,
supy +s : (y, s) B infx +t : (x, t)

epi(f).
Questa disuguaglianza, per continuit`a, diventa
supy +s : (y, s) B infx +t : (x, t)

epi(f),
e poiche, per lesercizio 1.3.9, risulta

epi(f) = epi(f),
65
deduciamo in particolare
y +s x +t (y, s) B, (x, t) epi(f).
Dimostriamo che si ha necessariamente > 0.
`
E chiaro che non pu`o essere
< 0 perche in tal caso per t +dedurremmo che il primo membro della
disuguaglianza vale . Daltronde, se fosse = 0, la sarebbe non nulla;
prendendo (, s) B con

D(f) e scegliendo y = , la disuguaglianza si


ridurrebbe a
x x D(f).
Dato che `e un punto interno a D(f), si potrebbe prendere un intorno
bilanciato V di 0 tale che +V D(f): quindi scegliendo x = v, v V ,
ricaveremmo
0 v v V,
il che, per linearit`a, implicherebbe 0: ma ci`o `e assurdo, e pertanto deve
essere > 0.
(ii) Se f +, allora epi(f) `e vuoto e la tesi `e ovvia: supponiamo perci`o
che esista z X tale che f(z) R. Gli insiemi epi(f) e (y, s) sono
convessi non vuoti e disgiunti in X R; inoltre il secondo `e compatto ed
il primo `e chiuso in quanto f `e semicontinua inferiormente. Per il teorema
1.7.5, esiste un funzionale lineare e continuo su XR, non nullo, che li separa
strettamente: dunque esistono R e G : X C lineare e continuo, non
entrambi nulli e tali che, posto = Re G,
y +s < x +t (x, t) epi(f).
Se fosse < 0, lultimo membro della disuguaglianza sarebbe e ci`o `e
assurdo; dunque si ha, intanto, 0. Supponiamo dapprima che sia f(y)
R: allora (y, f(y)) epi(f) e quindi, scegliendo x = y e t = f(y) ricaviamo
s < f(y), da cui necessariamente > 0. Se invece f(y) = +, pu`o essere
ancora > 0, e in tal caso abbiamo concluso, oppure = 0: mostreremo che
in questo caso si possono comunque modicare e G prendendo positivo.
Supponiamo dunque = 0, cosicche
y < x x D(f).
Siccome f(z) R, esiste u R tale che (z, u) / epi(f), e come abbiamo
appena visto, in questa situazione esistono

G X

e > 0 tali che, posto


66
= Re

G,
z +u < = infx +t : (x, t) epi(f).
Scegliamo c > 0 abbastanza grande da far s` che
s < c( y) + y.
Allora risulta
(c +)y +s < +c (c +)x +t (x, t) epi(f),
da cui, posto G = cG+

G e = Re G = c +, si ha
y +s < infx +t : (x, t) epi(f).
La tesi `e provata anche in questo caso.
Le funzioni convesse e semicontinue inferiormente hanno la propriet`a di essere
approssimabili dal basso con funzioni ani.
Proposizione 2.3.7 Sia X uno spazio vettoriale topologico localmente con-
vesso di Hausdor e sia f : X R una funzione convessa, semicontinua
inferiormente e tale che f(x) > per ogni x X. Allora:
(i) f ha una funzione ane minorante g, ossia esistono b R e G : X C
lineare e continuo, tali che f(x) g(x) = Re Gx +b per ogni x X;
(ii) f `e linviluppo delle sue funzioni ani minoranti, ossia
f(x) = supg(x) : g `e una funzione ane, g f in X x X.
Dimostrazione Anzitutto, se f + si ha f(x) = + = sup
nN
n e (i),
(ii) sono ovvie.
Se invece esiste z X tale che f(z) R, in particolare epi(f) `e un convesso
chiuso non vuoto; sia allora y X e sia a ] , f(y)[: proveremo che esiste
una funzione ane g, minorante f, tale che a < g(y). Ci`o prover`a la tesi.
Dato che (y, a) / epi(f), applicando il lemma 2.3.6 (ii) troviamo G : X C
lineare e continuo e > 0 tali che, posto = Re G,
y +a < = infx +t : (x, t) epi(f).
67
Perci`o, posto g(x) =
1

x +

, si ha
a < g(y), g(x) f(x) x D(f),
e a maggior ragione
g(x) f(x) x X,
che `e quanto si voleva.
Se f `e una funzione qualunque su uno spazio vettoriale topologico X, `e pos-
sibile considerare la pi` u grande funzione convessa semicontinua inferiormente
e minore di f. Pi` u precisamente:
Denizione 2.3.8 Sia X uno spazio vettoriale topologico e sia f : X R
una funzione. La regolarizzata semicontinua di f `e linviluppo delle funzioni
convesse e semicontinue inferiormente minoranti di f, ossia `e la funzione
f(x) = supg(x) : g : X R, g `e convessa
e semicontinua inferiormente, g f in X, x X.
Notiamo che esistono sempre funzioni convesse e semicontinue minoranti di
f: ad esempio, g(x) . Dunque f `e sempre ben denita.
`
E immediato
vericare che f(x) f(x) per ogni x X; si noti poi che per lesercizio 2.1.2
f `e convessa, e per il corollario 2.2.3 f `e semicontinua inferiormente.
Il caso pi` u signicativo in cui si applica la denizione 2.3.8 `e quello in cui la
funzione f di partenza `e gi`a convessa. In tal caso si ha:
Proposizione 2.3.9 Sia X uno spazio vettoriale topologico, sia f : X R
convessa, e sia f la sua regolarizzata semicontinua. Allora:
(i) epi(f) = epi(f);
(ii) se x
0
X e liminf
xx
0
f(x) < +, allora f(x
0
) = liminf
xx
0
f(x);
(iii) f `e semicontinua inferiormente in un punto x
0
X se e solo se risulta
f(x
0
) = f(x
0
).
Si noti che se la condizione liminf
xx
0
f(x) < `e violata, la propriet`a (ii)
non vale in generale: ad esempio per la funzione I
{0}
in R si ha I
{0}
(0) =
I
{0}
(0) = 0 < + = liminf
x0
I
{0}
(x).
Dimostrazione (i) Poiche f `e semicontinua inferiormente e f f, epi(f)
`e chiuso e contiene epi(f): quindi epi(f) epi(f).
68
Proviamo che, viceversa, epi(f) epi(f). Mostreremo che epi(f) = epi(g),
con g funzione convessa, semicontinua inferiormente e tale che g f in
X; da ci`o, per denizione di f, seguir`a che g f e dunque che epi(f) =
epi(g) epi(f). Osserviamo a questo scopo che per ogni x X linsieme
epi(f)(xR) `e sempre una semiretta (eventualmente vuota, o coincidente
con tutto R): infatti se (x, t) epi(f) esiste un net (x
i
, t
i
)
iI
epi(f) tale
che x
i
x in X e t
i
t in R; quindi, ssato > t si trover`a i
0
I
per cui risulta t
i
per i i
0
. Di conseguenza avremo f(x
i
) t
i
,
cio`e (x
i
, ) epi(f), per ogni i i
0
, e quindi passando al limite otteniamo
(x, ) epi(f). In altre parole, abbiamo mostrato che
(x, t) epi(f) = (x, ) epi(f) > t.
Possiamo allora denire la funzione g nel modo seguente:
g(x) =
_
+ se epi(f) (x R) = ,
inft R : (x, t) epi(f) altrimenti.
`
E facile vericare che epi(g) = epi(f), e dunque epi(g) `e chiuso; essendo la
chiusura del convesso epi(f), epi(g) `e anche convesso e, ovviamente, contiene
epi(f). Ne segue che g `e semicontinua inferiormente e convessa, e che g f
in X. Ci`o prova (i).
(ii) Poiche f `e semicontinua inferiormente e f f in X, si ha
f(x
0
) liminf
xx
0
f(x) liminf
xx
0
f(x) x
0
X.
Proviamo la disuguaglianza opposta. Per la parte gi`a provata, f(x
0
) < +.
Sia t ]f(x
0
), +[: allora (x
0
, t) epi(f) = epi(f). Quindi, se U
i
I
i

iI
`e
un sistema fondamentale di intorni di (x
0
, t) in X R, per ogni i I esiste
un punto (x
i
, t
i
) (U
i
I
i
) epi(f). Se risulta x
i
,= x
0
per inniti indici
i I, essendo f(x
i
) t
i
deduciamo che liminf
xx
0
f(x) t.
Se invece risulta x
i
= x
0
denitivamente, allora otteniamo f(x
0
) t
i
deni-
tivamente, da cui f(x
0
) t; in questo caso, daltronde, `e facile provare che
liminf
xx
0
f(x) f(x
0
). Infatti, posto per comodit`a = liminf
xx
0
f(x),
ssato > 0 esiste un intorno V di 0, che possiamo supporre bilanciato, tale
che
< inf
yV \{0}
f(x
0
+y) .
69
Per denizione di estremo inferiore, si pu`o anche trovare un punto V 0
in modo che
inf
yV \{0}
f(x
0
+y) f(x
0
+) +.
Sia ora ]0, 1]; poiche V `e bilanciato, si ha V . Dunque, per convessit`a,
f(x
0
+) = f((1 )x
0
+(x
0
+))
(1 )f(x
0
) +f(x
0
+)
(1 )f(x
0
) +( +) < +.
Per 0
+
, si deduce f(x
0
), e per larbitrariet`a di si ricava
f(x
0
).
Abbiamo cos` ottenuto, in tutti i casi, che liminf
xx
0
f(x) t per ogni
t > f(x
0
): dunque liminf
xx
0
f(x) f(x
0
) e (ii) `e provata.
(iii) La relazione f(x
0
) = f(x
0
) implica
f(x
0
) liminf
xx
0
f(x) liminf
xx
0
f(x).
Supponiamo viceversa che f sia semicontinua inferiormente in x
0
. Se f(x
0
) =
+, allora essendo f f si ha a maggior ragione f(x
0
) = + = f(x
0
).
Se invece f(x
0
) < +, allora per ogni t > f(x
0
) risulta (x
0
, t) epi(f) =
epi(f): quindi esiste un net (x
i
, t
i
)
iI
epi(f) tale che x
i
x in X e
t
i
t in R. Se x
i
,= x
0
per inniti indici avremo di conseguenza
f(x
0
) liminf
i
f(x
i
) liminf
i
t
i
= t t > f(x
0
),
mentre, nel caso in cui sia x
i
= x
0
denitivamente, la stessa relazione segue
in modo ancora pi` u semplice. In denitiva, per larbitrariet`a di t, otteniamo
f(x
0
) f(x
0
). Ci`o implica luguaglianza.
Esercizi 2.3
1. Esibire una funzione convessa, semicontinua inferiormente, non propria
e non identicamente uguale ne a +, ne a .
2. Esibire una funzione convessa, propria e non semicontinua inferiormen-
te in almeno un punto.
70
3. Esibire una funzione convessa, propria, semicontinua inferiormente ma
non continua in almeno un punto.
4. Sia X uno spazio di Banach. Si verichi che una funzione convessa,
semicontinua inferiormente e propria pu`o non avere minimo su X.
5. Sia X uno spazio di Banach riessivo, sia K X un convesso non
vuoto, chiuso e limitato e sia f : K R una funzione quasi convessa e
semicontinua inferiormente. Si provi che f ha minimo su K.
6. Sia X uno spazio di Hilbert e poniamo
J(x) =
1
2
|x|
2
(z, x), x X,
ove z `e un ssato elemento di X. Si provi che:
(i) J `e una funzione strettamente convessa, continua e nita;
(ii) J(x) per |x| ;
(iii) J ha minimo su X ed il punto di minimo `e z;
(iv) se K X `e un convesso chiuso, allora J ha minimo su K ed
il punto di minimo u `e lunica soluzione in K della disequazione
variazionale
Re (u, v u) Re (z, v u) v K.
[Traccia: per (iv) si usi la condizione
_
d
dt
J(tv + (1 t)u)

t=0
0.]
7. Sia H uno spazio di Hilbert, sia e
k

kN
+ un sistema ortonormale
completo e sia F = B(0, 1) B(0,
1
2
). Posto
f(x) = I
F
(x) +

k=1
[(x, e
k
)
H
[
k
x X,
si provi che f `e una funzione semicontinua inferiormente che non ha
minimo nel chiuso limitato F.
8. Sia X uno spazio vettoriale topologico reale. Si provi che i funzionali
lineari su X R sono tutti e soli quelli della forma (x, t) Gx + t,
con R e G : X C lineare. Si verichi poi che i funzionali lineari
e continui su X R sono tutti e soli quelli della forma precedente con
R e G : X C lineare e continuo.
71
9. Sia f una funzione convessa su uno spazio vettoriale topologico X, e
sia f la sua regolarizzata semicontinua. Se liminf
xx
0
f(x) < + per
ogni x
0
X, si provi che
x X : f(x) =

>
x X : f(x) R.
2.4 Funzioni convesse continue
Vediamo qualche condizione che assicuri la continuit`a di una funzione conves-
sa. Cominciamo con un lemma che verr`a usato sistematicamente nel seguito
del paragrafo.
Lemma 2.4.1 Sia X uno spazio vettoriale topologico, sia f : X R con-
vessa. Se z
0
X e f `e limitata superiormente in un intorno di z
0
, allora f
`e continua in z
0
.
Dimostrazione Per ipotesi, esiste K > 0 ed esiste un intorno bilanciato V
di 0 tale che f(y) K per ogni y z
0
+V . Sia ]0, 1[: se x V , si ha
f(z
0
+x) = f
_
(1 )z
0
+
_
z
0
+
x

__

(1 )f(z
0
) +f
_
z
0
+
x

_
(1 )f(z
0
) +K.
Da qui segue intanto che se f(z
0
) = , allora f in z
0
+V , e dunque
f `e continua in z
0
. Quindi possiamo supporre che f(z
0
) > ; in questo
caso, per sottrazione otteniamo
f(z
0
+x) f(z
0
) ([f(z
0
)[ +K) x V.
Daltra parte, se x V si ha
f(z
0
) = f
_
1
2
(z
0
+x) +
1
2
(z
0
x)
_

1
2
f(z
0
+x) +
1
2
f(z
0
x),
da cui, osservando che se x V anche x V ,
f(z
0
) f(z
0
+x) f(z
0
x) f(z
0
) ([f(z
0
)[ +K) x V ;
quindi si conclude che
[f(z
0
+x) f(z
0
)[ ([f(z
0
)[ +K) x V,
cosicche f `e continua in z
0
.
72
Teorema 2.4.2 Sia X uno spazio vettoriale topologico e sia f : X R
convessa e propria. Sono fatti equivalenti:
(i)

D(f) `e non vuoto e f `e continua in ogni punto di

D(f);
(ii) esiste z
0

D(f) tale che f `e continua in z


0
;
(iii) esiste z
0
D(f) tale che f `e limitata superiormente in un intorno di
z
0
.
Dimostrazione (i) = (ii) Ovvio.
(ii) = (iii) Poiche f `e continua nel punto z
0

D(f), si ha f(z
0
) R
ed esiste un intorno bilanciato V di 0 tale che f(y) < f(z
0
) + 1 per ogni
y z
0
+V . Quindi f `e limitata superiormente in un intorno di z
0
.
(iii) = (i) Per ipotesi esiste un intorno bilanciato V di 0 tale che f(y)
K < + per ogni y z
0
+ V ; in particolare, z
0

D(f). Sia z un arbitrario


punto di

D(f): allora esiste t > 0 tale che z

= z + t(z z
0
) D(f).
Consideriamo lintorno W = z+
t
t+1
V di z: per ogni u W si ha u = z+
t
t+1
y
con y V , da cui, essendo z =
1
t+1
(z

+tz
0
), otteniamo per ogni y V , ossia
per ogni u W,
f(u) = f
_
1
t + 1
(z

+tz
0
) +
t
t + 1
y
_
= f
_
1
t + 1
z

+
t
t + 1
(z
0
+y)
_

1
1 +t
f(z

) +
t
t + 1
f(z
0
+y)
1
t + 1
[f(z

)[ +
t
t + 1
K.
Dunque f `e limitata superiormente nellintorno W di z. Per il lemma 2.4.1,
f `e continua nel punto z.
Corollario 2.4.3 Sia X uno spazio vettoriale topologico e sia f : X R
convessa e propria. Se f `e semicontinua superiormente in un punto x
0

D(f), allora f `e continua in

D(f).
Dimostrazione Dallipotesi segue che + > f(x
0
) limsup
xx
0
f(x),
quindi esiste un intorno V di x
0
tale che
sup
V
f f(x
0
) + 1 < +.
73
Dal teorema 2.4.2 segue la tesi.
Dai risultati precedenti segue che in relazione alla continuit`a le funzioni con-
vesse hanno un comportamento analogo a quello delle funzioni lineari: la
continuit`a equivale alla continuit`a in un singolo punto ed alla locale limi-
tatezza nellintorno di un singolo punto. La dierenza sta nel fatto che la
continuit`a non `e globale in X, ma solo in

D(f). Se per`o si considerano solo


funzioni convesse nite, allora

D(f)= D(f) = X e lanalogia `e perfetta.


Vediamo ora qualche situazione particolare in cui sulla continuit`a delle fun-
zioni convesse si pu`o dire qualcosa di pi` u.
Teorema 2.4.4 Sia X uno spazio di Banach e sia f : X R una funzione
convessa e semicontinua inferiormente. Allora f `e continua su X.
Dimostrazione Fissato x
0
X, baster`a provare che f `e limitata superior-
mente in un intorno di x
0
. Sia
A = x X : f(x
0
x) [f(x
0
)[ + 1;
poiche f `e convessa e semicontinua inferiormente, A `e convesso e chiuso;
inoltre 0 A ed A `e simmetrico. Se x X si ha, scelto un intero n >
maxf(x
0
+ x) f(x
0
), f(x
0
x) f(x
0
) (il che `e possibile essendo f a
valori in R),
f
_
x
0

1
n
x
_
= f
__
1
1
n
_
x
0
+
1
n
(x
0
x)
_

_
1
1
n
_
f(x
0
) +
1
n
f(x
0
x) =
= f(x
0
) +
1
n
[f(x
0
x) f(x
0
)] [f(x
0
)[ + 1.
Dunque, con questa scelta di n si ha x nA. Ci`o prova che X =

nN
+
nA.
Dato che X `e uno spazio di Banach, il teorema di Baire ci dice che esiste
N
+
tale che A ha parte interna non vuota: dunque esiste una palla
B(y
0
, r) contenuta in A. Quindi, se w B(0, r) si ha y
0
w A, ed
essendo A simmetrico abbiamo anche y
0
w A. Poiche A `e convesso,
deduciamo poi che w =
1
2
(w + y
0
) +
1
2
(w y
0
) A; si conclude pertanto
che B(0, r) A, ossia B(0,
r

) A. Per denizione di A, ci`o signica che f


`e limitata superiormente in B(x
0
,
r

). Ne segue la tesi.
74
Proposizione 2.4.5 Sia X uno spazio normato e sia f : X R convessa.
Se f `e limitata in una palla B(x
0
, r), allora f `e localmente lipschitziana in
B(x
0
, r).
Dimostrazione Sia x B(x
0
, r) e sia > 0 tale che B(x, 2) B(x
0
, r);
proveremo che f `e lipschitziana in B(x, ). Per ipotesi, N
x
= sup
B(x,2)
[f[ <
. Se x
1
, x
2
B(x, ), poniamo d = |x
1
x
2
| e x
3
= x
2
+

d
(x
2
x
1
). Allora
x
3
B(x, 2) e x
2
=

d+
x
1
+
d
d+
x
3
; quindi per convessit`a deduciamo
f(x
2
)

d +
f(x
1
) +
d
d +
f(x
3
),
da cui
f(x
2
) f(x
1
)
d
d +
[f(x
3
) f(x
1
)]
d

[f(x
3
) f(x
1
)[
2N
x

|x
1
x
2
|.
Scambiando i ruoli di x
1
e x
2
, si conclude che
[f(x
2
) f(x
1
)[
2N
x

|x
1
x
2
|.
Inne enunciamo un risultato di dierenziabilit`a, dovuto a Mazur, valido in
spazi di Banach separabili, la dimostrazione del quale sar`a fornita nel capitolo
5.
Teorema 2.4.6 (di Mazur) Sia X uno spazio di Banach separabile, sia
D X un aperto convesso non vuoto e sia f : D R una funzione convessa
e continua. Allora f `e G-dierenziabile in un insieme D
0
D, denso in D,
che `e unione numerabile di aperti densi.
Esercizi 2.4
1. Sia X uno spazio vettoriale topologico di dimensione nita. Se f : X
R `e convessa e propria, si provi che f `e continua su

D(f).
[Traccia: Se x
0

D(f), si ssi un cubo C di centro x


0
contenuto in
D(f), e si osservi che ogni x C `e combinazione convessa dei vertici
x
i
del cubo; se ne deduca che f(x) maxf(x
i
) per ogni x C e di
qui si ricavi la tesi.]
75
2. Sia X uno spazio vettoriale topologico e sia K X un convesso con-
tenente 0. Si provi che il funzionale di Minkowski p
K
`e una funzione
continua se e solo se 0

K.
3. Sia X uno spazio normato. Esibire una funzione f : X R continua,
ma non w-continua.
2.5 Funzioni coniugate
La nozione di funzione coniugata (relativa ad una funzione assegnata) `e assai
utile nelle applicazioni ai problemi di ottimizzazione, specialmente nel caso in
cui la funzione assegnata sia convessa. Si pu`o comunque denire la coniugata
di una funzione qualunque.
Denizione 2.5.1 Sia X uno spazio normato reale e sia f : X R. La
coniugata, o polare, di f `e la funzione f

: X

R cos` denita:
f

() = sup
xX
x f(x) X

.
Osservazioni 2.5.2 (1) La denizione ha sempre senso, in quanto x `e un
numero reale per ogni x X; risulta f

() b se e solo se la funzione ane


x x b `e minorante di f.
(2) La funzione f

`e sempre convessa e w

-semicontinua inferiormente, per-


che `e lestremo superiore di funzioni che, rispetto alla variabile , sono con-
vesse e w

-semicontinue inferiormente.
(3) Pu`o capitare che sia f

+: ad esempio, se X = R e f(x) = e
x
,
si ha f

(y) = sup
xR
yx + e
x
= + per ogni y R

= R. Per`o quan-
do f `e convessa ci`o non pu`o accadere (sotto certe ipotesi), come mostra la
proposizione che segue.
Proposizione 2.5.3 Sia X uno spazio normato reale e sia f : X R una
funzione convessa, semicontinua inferiormente e propria. Allora la coniugata
f

`e propria.
Dimostrazione Per ipotesi, D(f) `e non vuoto, quindi scelto x D(f) si ha
f

() xf(x) > . Inoltre, per la proposizione 2.3.7, esistono X

e b R tali che f(x) x + b per ogni x X: dunque, per losservazione


precedente, f

() b, cosicche f

`e propria.
76
Osservazione 2.5.4
`
E utile precisare la seguente propriet`a: si ha f

() >
per ogni X

se e solo se f non `e identicamente uguale a +. La


dimostrazione si lascia al lettore (esercizio 2.5.1).
Il termine coniugata di f si giustica sulla base della seguente propriet`a:
Proposizione 2.5.5 (disuguaglianza di Young) Sia X uno spazio nor-
mato reale e sia f : X R. Se f

`e la coniugata di f, si ha
f

() x f(x) X

, x X.
In particolare, se f `e propria la disuguaglianza acquista la forma simmetrica
x f(x) +f

() X

, x X.
Dimostrazione La prima forma della disuguaglianza `e banale conseguenza
della denizione di f

. Per la seconda basta osservare che se f `e propria,


allora f

> per losservazione 2.5.4, e quindi la somma f(x) + f

() `e
sempre ben denita.
Esempi 2.5.6 (1) Sia X = R. Fissato p ]1, [, poniamo
f(x) =
[x[
p
p
, x R.
Allora
f

(y) = sup
xR
_
yx
[x[
p
p
_
=
[y[
q
q
y R,
ove
1
p
+
1
q
= 1. Infatti, f

(y) [y[
q
/q per la disuguaglianza di Young classica,
e vale luguaglianza, come si verica facilmente, quando x = sgn(y) [y[
q/p
.
(2) Sia X = R e sia f(x) = [x[. Allora
f

(y) = sup
xR
yx [x[ =
_
0 se [y[ 1,
+ se [y[ > 1.
(3) Sia X = R e sia f(x) = e
x
. Allora si trova facilmente che
f

(y) = sup
xR
yx e
x
=
_
_
_
+ se y < 0,
0 se y = 0,
y(log y 1) se y > 0.
77
(4) Sia X uno spazio normato reale e sia U un sottoinsieme non vuoto di
X. Per la funzione I
U
si ha
I

U
() = sup
xX
x I
U
(x) = sup
xU
x;
la funzione I

U
si chiama funzione di supporto di U. Essa `e positivamente
omogenea e subadditiva; inoltre vale lequivalenza
U x X : x I

U
() .
Le propriet`a della funzione coniugata sono raccolte nella seguente
Proposizione 2.5.7 Sia X uno spazio normato reale e siano f, g, f
i
: X
R. Allora:
(i) f

(0) = inf
xX
f(x);
(ii) se f g, allora f

;
(iii) (inf
iI
f
i
)

= sup
iI
f

i
;
(iv) (sup
iI
f
i
)

inf
iI
f

i
;
(v) (f)

() = f

) per ogni X

e per ogni > 0;


(vi) posto f
u
(x) = f(x u), si ha f

u
() = f

() + u per ogni X

e
per ogni u X.
Dimostrazione Sono tutte facili conseguenze della denizione 2.5.1.
Possiamo anche considerare la bipolare di f, ossia la coniugata di f

: sar`a
la funzione f

: X

R denita da
f

() = sup
X

() X

.
La funzione f

`e convessa e semicontinua inferiormente rispetto alla topo-


logia debole* di X

. Se calcoliamo f

nel punto = J
x
, ove x X e J `e
limmersione canonica di X in X

, si ha per la disuguaglianza di Young


f

(J
x
) = sup
X

x f

() f(x) x X.
Tuttavia, sotto opportune ipotesi, f

(J
x
) coincide con f(x).
78
Teorema 2.5.8 (di Fenchel-Moreau) Sia X uno spazio normato reale e
sia f : X R propria. Allora si ha f

(J
x
) = f(x) per ogni x X se e solo
se f `e convessa e semicontinua inferiormente.
Dimostrazione (=) Sappiamo che f

`e convessa e semicontinua inferior-


mente per la topologia debole* di X

; quindi f

J `e convessa e semiconti-
nua inferiormente per la topologia debole di X. Essendo f(x) = f

(J
x
) per
ogni x X, tale `e anche f e a maggior ragione si ha la tesi.
(=) Poiche f

(J
x
) f(x), la tesi `e banale se f

(J
x
) = +. Inoltre, sic-
come f `e propria, f

non `e identicamente + e di conseguenza f

>
(osservazione 2.5.4). Perci`o dobbiamo provare che se f

(J
x
) R, allora
f

(J
x
) = f(x).
Supponiamo, per assurdo, che esista x
0
X tale che f

(J
x
0
) < f(x
0
). Al-
lora (x
0
, f

(J
x
0
)) non appartiene al convesso chiuso epi(f); dunque, per il
lemma 2.3.6 (ii), esistono X

, > 0 e R tali che


x
0
+f

(J
x
0
) < = inf
(x,t)epi(f)
x +t.
Osservato che
= inf
(x,t)epi(f)
x +t = inf
xD(f)
x +f(x) =
= sup
xD(f)
x f(x) = (f)

() = f

_
,
dividendo la disuguaglianza precedente per si ricava
1

x
0
+f

(J
x
0
) < f

_
.
Questa relazione contraddice la disuguaglianza di Young: essendo f

> ,
deve infatti essere

x
0
= J
x
0
_

_
f

(J
x
0
) +f

_
.
Osservazione 2.5.9 Se X `e uno spazio normato reale e f : X R `e
una funzione convessa che non `e semicontinua inferiormente, allora f

(J
x
)
coincide con f(x), ove f `e la regolarizzata semicontinua di f introdotta nella
denizione 2.3.8. Infatti, f

J `e convessa, semicontinua inferiormente e


minorante di f: quindi, per denizione di regolarizzata semicontinua, si ha
79
f

J f. Daltra parte, se g `e una funzione convessa, semicontinua


inferiormente e minorante di f, dalla proposizione 2.5.7 segue g

e
g

. Ma dal teorema di Fenchel-Moreau otteniamo


g(x) = g

(J
x
) f

(J
x
) x X,
e quindi, per larbitrariet`a di g, deduciamo f f

J.
Esempio 2.5.10 Sia X uno spazio normato reale. Se U `e un sottoinsieme
non vuoto di X, consideriamo la funzione indicatrice I
U
(si veda lesem-
pio 2.5.6 (4)). Losservazione precedente ci dice che I

U
J = I
U
; daltra
parte, poiche il minimo convesso chiuso contenente U `e co(U), si riconosce
facilmente che I
U
= I
co(U)
. Abbiamo cos` provato che
I

U
(J
x
0
) = I
co(U)
(x
0
) x
0
X,
e naturalmente risulta in generale I
co(U)
(x) < I
U
(x), salvo che U non sia
un convesso chiuso di X; in questo caso, come `e giusto, I
U
`e convessa e
semicontinua inferiormente.
Esercizi 2.5
1. Sia X uno spazio normato e sia f : X R. Si provi che la coniugata
f

non assume il valore se e solo se f non `e identicamente uguale


a +.
2. Sia X uno spazio normato. Si calcoli f

quando f X

.
3. Sia X = R. Determinare le coniugate delle funzioni:
f
1
(x) = cosh x, f
2
(x) = maxe
x
, e
x
,
f
3
(x) =
_
log x se x > 0
+ se x 0,
f
4
(x) =
_
cos x se [x[ < 1
+ se [x[ 1.
4. Vericare con un esempio che in generale si ha
minf

1
, f

2
, = (maxf
1
, f
2
)

.
5. Sia X = R. Per ogni n N
+
si calcoli la coniugata della funzione
f
n
(x) =
n
_
1 +[x[
n
.
80
6. Sia X = R
N
. Si calcoli la coniugata della funzione f(x) =
1
2
(Qx, x)
R
N,
ove Q `e una matrice N N denita positiva.
7. Sia X uno spazio normato e sia H : R R una funzione convessa e
semicontinua inferiormente. Posto F(x) = H(|x|
X
) per ogni x X e
G() = H

(||
X
) per ogni X

, si provi che F

= G.
8. Sia X uno spazio normato e sia A X un convesso contenente 0. Se
p
A
`e il funzionale di Minkowski di A, si provi che
p

A
= I
{X

:I

A
()1}
.
9. Sia X uno spazio di Banach riessivo e sia U un sottoinsieme non
vuoto, convesso e limitato di X. Si provi che si ha I

U
() = se e
solo se il semipiano x X : x contiene U e liperpiano ane
x X : x = `e di appoggio per U.
10. Sia U = (x, y) R
2
: x > 0, xy < 1. Si verichi che I

U
(0, 1) = 0,
che U `e contenuto nel semipiano y 0 ma che la retta y = 0 non `e di
appoggio per U.
11. Si consideri in L
1
(R) il convesso limitato U = co(
[n,n+1]

nZ
). Posto
F =
_
R
e
x
2
(x)dx per ogni L
1
(R), si provi che risulta I

U
(F) =
0, che U L
1
(R) : F 0 ma che il semispazio L
1
(R) :
F 0 non `e di appoggio per U.
12. Sia X uno spazio normato e siano U, V convessi non vuoti contenuti
in X. Si provi che U V se e solo se I

U
I

V
, dove I

U
e I

V
sono le
rispettive funzioni di supporto (esempio 2.5.6 (4)).
2.6 Problemi di ottimizzazione
Le funzioni coniugate mostrano tutta la loro utilit`a nei problemi di ottimiz-
zazione che coinvolgono funzioni convesse. In questo paragrafo illustriamo
alcuni esempi relativi a questa vasta tematica.
Ci occuperemo del problema
min
uX
F(u)
81
ove F : X R`e una funzione convessa, semicontinua inferiormente e propria
e X `e uno spazio normato reale; cercheremo di caratterizzare i punti di
minimo attraverso delle opportune relazioni di estremalit`a. A questo scopo
sar`a conveniente immergere il problema sopra descritto in una famiglia di
problemi del tipo
min
uX
(u, p)
ove p `e un parametro che varia in un altro spazio normato reale Y , e `e
unaltra funzione convessa, semicontinua inferiormente e propria in X Y ,
tale che (u, 0) = F(u) per ogni u X.
Cominciamo con alcuni fatti preliminari.
Lemma 2.6.1 Siano X, Y spazi normati reali e sia : X Y R una
funzione convessa. Allora la funzione
h(y) = inf
uX
(u, y), y Y,
`e convessa.
Dimostrazione Siano p, q Y tali che non risulti h(p) = h(q) = . Se
h(p) oppure h(q) vale +, la disuguaglianza di convessit`a `e ovvia; supponia-
mo dunque h(p) < + e h(q) < +. Fissiamo a > h(p) e b > h(q): allora
esistono u, v X tali che
h(p) (u, p) < a, h(q) (v, q) < b.
Dunque per ogni ]0, 1[ si ha
h(p + (1 )q) = inf
wX
(w, p + (1 )q)
(u + (1 )v, p + (1 )q)
(u, p) + (1 )(v, q) a + (1 )b,
e per larbitrariet`a di a > h(p) e b > h(q) si ottiene la disuguaglianza di
convessit`a.
Lemma 2.6.2 Nelle ipotesi del lemma 2.6.1, la coniugata della funzione
h(y) = inf
uX
(u, y) `e data da
h

() =

(0, ) Y

,
ove

`e la coniugata di , ossia

(, ) = sup
uX, yY
u +y (u, y) X

, Y

.
82
Dimostrazione Si ha
h

() = sup
yY
y h(y) = sup
yY
y inf
uX
(u, y) =
= sup
yY
_
y + sup
uX
(u, y)
_
=
= sup
yY
sup
uX
y (u, y) =

(0, ).
Ci`o premesso, ssiamo le nostre ipotesi, che varranno per tutto il resto del
paragrafo. Sono dati due spazi normati reali X e Y , e una funzione :
XY R convessa, semicontinua inferiormente e propria, tale che (u, 0) =
F(u) per ogni u X. Chiameremo problema primale quello che consiste
nel trovare il minimo di F su X; diremo invece problema duale il problema
di massimizzazione seguente:
max
Y

(0, ).
Osservazione 2.6.3 Per il lemma 2.6.2 e per denizione di bipolare, risulta
sup
Y

(0, ) = sup
Y

() = h

(J
0
) h(0) = inf
uX
(u, 0),
e tale quantit`a non vale +, essendo F = (, 0) propria; potrebbe per`o
valere , come mostra lesempio di (u, y) = u y +e
uy
in X Y = R
2
:
in questo caso si ha infatti h(y) e h

() +.
Andiamo ad analizzare le relazioni fra il problema primale e il problema duale,
cercando condizioni che assicurino la risolubilit`a di entrambi: scopriremo che
questo comporter`a anche luguaglianza inf
uX
(u, 0) = sup
Y

(0, ).
Denizione 2.6.4 Nelle ipotesi precedenti, diciamo che il problema primale
`e normale se h(0) = inf
uX
(u, 0) R e se la funzione h `e semicontinua
inferiormente nel punto 0 Y .
Denizione 2.6.5 Nelle ipotesi precedenti, diciamo che il problema primale
`e stabile se h(0) R e se esiste Y

tale che h(y) h(0) + y per ogni


y Y .
Come vedremo pi` u avanti nel corso, la condizione di stabilit`a equivale alla
sottodierenziabilit`a di h nel punto 0.
83
Proposizione 2.6.6 Nelle ipotesi precedenti, il problema primale `e normale
se e solo se
sup
Y

(0, ) = inf
uX
(u, 0) R.
Dimostrazione Supponiamo che il problema primale sia normale. Sia h la
regolarizzata semicontinua di h: si ha, per il lemma 2.6.2, per losservazione
2.5.9, per la proposizione 2.3.9 (iii) e per ipotesi,
sup
Y

(0, ) = h

(J
0
) = h(0) = h(0) = inf
uX
(u, 0) R.
Viceversa, se queste quantit`a coincidono e sono nite, allora h

(J
0
) = h(0) =
h(0) R e quindi il problema primale `e normale in virt` u della proposizione
2.3.9 (iii).
Proposizione 2.6.7 Nelle ipotesi precedenti, il problema primale `e stabile
se e solo se esso `e normale e il problema duale ha soluzione.
Dimostrazione Se il problema primale `e stabile, allora esiste
0
Y

tale
che h(y) h(0) +
0
y per ogni y Y ; ne segue
liminf
y
Y
0
h(y) h(0),
quindi h `e semicontinua inferiormente in 0. Inoltre per ogni Y

si ha,
grazie al lemma 2.6.2,

(0, ) = h

() = J
0
h

() h

(J
0
) = h(0) h(y)
0
y y Y,
da cui

(0, ) inf
yY
h(y)
0
y = h

(
0
) =

(0,
0
) Y

.
Ci` o prova che
max
Y

(0, ) =

(0,
0
).
Viceversa, se il problema primale `e normale e il problema duale ha soluzione

0
, allora
h

(
0
) h

() Y

,
da cui
h

(
0
) = sup
Y

() = h

(J
0
) = h(0),
84
e dunque
h(0) = h

(
0
)
0
y +h(y) y Y :
ci`o mostra che il problema primale `e stabile.
Osservazione 2.6.8 Di fatto, lipotesi che il problema primale sia normale `e
irrinunciabile se vogliamo che esso abbia minimo nito; con lipotesi ulteriore
che il problema primale sia stabile, otteniamo la risolubilit`a del problema
duale, e lunica cosa che resta da fare `e provare lesistenza del minimo per il
problema primale. Lipotesi di stabilit`a `e dunque naturale.
Un semplice criterio di stabilit`a per il problema primale `e il seguente:
Lemma 2.6.9 Oltre alle ipotesi precedenti, supponiamo che h(0) > e
che esista u
0
X tale che la funzione y (u
0
, y) sia continua in 0, con
(u
0
, 0) R. Allora il problema primale `e stabile.
Dimostrazione Poiche (u
0
, ) `e continua e nita in 0, essa `e limitata in un
opportuno intorno aperto V di 0 da una costante K. Dunque
h(y) = inf
uX
(u, y) (u
0
, y) K y V,
per cui h, essendo convessa e limitata superiormente in un intorno di 0, `e
continua e nita in tale punto (lemma 2.4.1).
Adesso notiamo che (0, h(0)) appartiene alla frontiera di epi(h) in Y R, e
che epi(h) ha parte interna non vuota poiche contiene laperto V ]K, +[.
Per il lemma 2.3.6 (i), esistono Y

e > 0 tali che


0 +h(0) y +t (y, t) epi(h),
e in particolare, scelti y D(h) e t > h(y), e posto
0
=

,
h(0)
0
y +t y D(h), t > h(y).
Per larbitrariet`a di t > h(y) e per il fatto che h(0) R, deduciamo che h `e
propria e che
h(0) +
0
y h(y) y Y.
Ci` o mostra che il problema primale `e stabile.
Veniamo ora alla questione dellesistenza del minimo per il problema primale,
e soprattutto alla sua caratterizzazione mediante opportune condizioni di
estremalit`a.
85
Teorema 2.6.10 Nelle ipotesi del lemma 2.6.9, se u X `e punto di minimo
per il problema primale e Y

`e punto di massimo per il problema duale,


allora u e vericano la relazione di estremalit`a
( u, 0) +

(0, ) = 0.
Viceversa, se u X e Y

soddisfano tale relazione, allora


( u, 0) = min
uX
(u, 0) = max
Y

(0, ) =

(0, ) R.
Dimostrazione Per il lemma 2.6.9 il problema primale `e stabile: quindi, se
u minimizza il problema primale e massimizza il problema duale, allora
( u, 0) = min
uX
(u, 0) = max
Y

(0, ) =

(0, ) R,
cosicche ( u, 0) +

(0, ) = 0.
Viceversa, dalla stabilit`a del problema primale segue
inf
uX
(u, 0) = max
Y

(0, ) R.
Dunque, essendo
( u, 0) inf
uX
(u, 0) = max
Y

(0, )

(0, ) = ( u, 0),
si ha immediatamente la tesi.
Corollario 2.6.11 Oltre alle ipotesi del lemma 2.6.9, supponiamo che:
(i) X sia uno spazio di Banach riessivo;
(ii) lim
u
X

(u, 0) = +.
Allora il problema primale ha minimo, il problema duale ha massimo e vale
la relazione di estremalit`a.
Dimostrazione Basta osservare che, per il corollario 2.3.4 ed il lemma 2.6.9
il problema primale ha soluzione ed `e stabile; per la proposizione 2.6.7 anche
il problema duale ha soluzione. La tesi segue allora dal teorema precedente.
Vi `e un altro modo di caratterizzare i punti di minimo del problema primale
e i punti di massimo del problema duale: essi si ottengono come punti di
sella di unopportuna funzione: la lagrangiana.
86
Denizione 2.6.12 La funzione lagrangiana del problema primale `e la fun-
zione L : X Y

R cos` denita:
L(u, ) = inf
yY
(u, y) y u X, Y

.
In altre parole, per ogni ssato u X, L(u, ) `e data da
L(u, ) = inf
yY
(u, y) y = sup
yY
y (u, y) = [(u, )]

(),
cio`e `e lopposta della coniugata di (u, ).
Lemma 2.6.13 Nelle ipotesi del lemma 2.6.1, si ha:
(i) L(u, ) `e concava e semicontinua superiormente in Y

per ogni
u X;
(ii) u L(u, ) `e convessa in X per ogni Y

.
Dimostrazione (i) Per u X ssato, [(u, )]

`e convessa e semicontinua
inferiormente, quindi L(u, ) = [(u, )]

`e concava e semicontinua superior-


mente.
(ii) Fissato Y

, L(, ) `e lestremo inferiore delle funzioni convesse


(u, y) (u, y) y; quindi la convessit`a di L(, ) segue con lo stesso ar-
gomento usato nella dimostrazione del lemma 2.6.1.
Tramite la funzione lagrangiana, i problemi primale e duale si possono ri-
formulare come problemi di minimax: si tratta di un punto di vista che
ritroveremo pi` u avanti nel corso, parlando della teoria dei giochi.
Scrivendo

(, ) = sup
uX, yY
u +y (u, y) =
= sup
uX
_
u + sup
yY
y (u, y)
_
= sup
uX
u L(u, ),
ricaviamo

(0, ) = sup
uX
L(u, ) = inf
uX
L(u, ),
e quindi il problema duale si scrive nella forma maximin
sup
Y

inf
uX
L(u, ).
87
Similmente, poiche `e convessa e semicontinua inferiormente,
(u, y) = ([(u, )]

J) (y) =
= sup
Y

y [(u, )]

() = sup
Y

y +L(u, ),
da cui
(u, 0) = sup
Y

L(u, ).
Pertanto il problema primale si scrive nella forma minimax
inf
uX
sup
Y

L(u, ).
Osservazione 2.6.14
`
E immediato vericare che
sup
Y

inf
uX
L(u, ) inf
uX
sup
Y

L(u, ) :
infatti
L(u, ) sup
Y

L(u, ) u X, Y

,
da cui
inf
uX
L(u, ) inf
uX
sup
Y

L(u, ) Y

e quindi la tesi. Ritroviamo cos` il risultato dellosservazione 2.6.3.


Denizione 2.6.15 Diciamo che ( u, ) X Y

`e punto di sella per la


funzione lagrangiana L se risulta
L( u, ) L( u, ) L(u, ) u X, Y

.
Teorema 2.6.16 Nelle ipotesi del lemma 2.6.9, sia ( u, ) X Y

. Sono
fatti equivalenti:
(i) ( u, ) `e punto di sella per la lagrangiana L,
(ii) u minimizza il problema primale, massimizza il problema duale e
min
uX
(u, 0) = max
Y

(0, ) R.
88
Dimostrazione Ricordiamo anzitutto che, per i calcoli fatti in precedenza,
inf
uX
L(u, ) =

(0, ), sup
Y

L( u, ) = ( u, 0).
Supponiamo che valga (i): allora si ha

(0, ) = min
uX
L(u, ) = L( u, ) = max
Y

L( u, ) = ( u, 0) R,
da cui segue subito la relazione di estremalit`a ( u, 0) +

(0, ) = 0; dal
teorema 2.6.10 segue (ii).
Supponiamo viceversa che valga (ii): essendo

(0, ) = inf
uX
L(u, ) L( u, ), ( u, 0) = sup
Y

L( u, ) L( u, ),
la relazione di estremalit`a, che vale in virt` u del teorema 2.6.10, implica
L( u, ) = inf
uX
L(u, ) = sup
Y

L( u, ),
cosicche ( u, ) `e punto di sella per L.
Corollario 2.6.17 Nelle ipotesi del lemma 2.6.9, sia u X. Allora u mini-
mizza il problema primale se e solo se esiste Y

tale che ( u, ) sia punto


di sella per la lagrangiana L.
Dimostrazione Se tale esiste, la tesi segue dal teorema 2.6.16. Viceversa,
se u minimizza il problema primale, poiche esso `e stabile il problema duale
ha una soluzione Y

e si ha
inf
uX
(u, 0) = sup
Y

(0, ) R.
Dunque ( u, ) `e punto di sella per L in virt` u del teorema 2.6.16.
Esempio 2.6.18 Consideriamo un caso particolare della situazione conside-
rata n qui: prendiamo la funzione F della forma
F(u) = f(u) +g(u), u X,
ove `e un ssato operatore lineare e continuo da X in Y , mentre f : X R
e g : Y R sono funzioni convesse, semicontinue inferiormente e proprie.
Faremo le ipotesi seguenti:
89
(a) X `e uno spazio di Banach riessivo e Y `e uno spazio normato (entrambi
reali);
(b) lim
u
X

[f(u) +g(u)] = +,
(c) esiste un punto u
0
X tale che i numeri f(u
0
) e g(u
0
) siano entrambi
niti e che g sia continua nel punto u
0
.
Allora, scegliendo
(u, y) = f(u) +g(u y) (u, y) X Y,
per ogni Y

si ha, denotando con

L(Y

, X

) loperatore aggiunto
di ,

(0, ) = sup
uX
sup
yY
y f(u) g(u y) = [posto u y = p]
= sup
uX
sup
pY
(u p) f(u) g(p) =
= sup
uX
sup
pY
(

)u p f(u) g(p) =
= sup
uX
(

)u f(u) + sup
pY
p g(p) =
= f

) +g

().
Le ipotesi fatte su f e g garantiscono che sono soddisfatte le ipotesi del
corollario 2.6.11. La condizione di estremalit`a diventa
f( u) +g( u) +f

) +g

( ) = 0;
ma poiche, per la disuguaglianza di Young,
f( u) +f

) (

) u, g( u) +g

( ) ( u) = (

) u,
la relazione di estremalit`a si scinde nel sistema seguente:
f( u) +f

) = (

) u = g( u) g

( ).
Le soluzioni u, di questo sistema risolvono i problemi primale e duale:
f( u) +g( u) = min
uX
f(u) +g(u) =
= max
Y

) g

() = f

) g

( ).
90
La funzione lagrangiana `e data da
L(u, ) = inf
yY
f(u) +g(u y) y =
= inf
pY
f(u) +g(p) (u) +p =
= f(u) (

)u + inf
pY
p +g(p) =
= f(u) (

)u sup
pY
p g(p) = f(u) (

)u g

(),
e il punto ( u, ) `e di sella per L. Questo ce lo dice il teorema 2.6.16, ma si
pu` o vedere direttamente: dal sistema che esprime le relazioni di estremalit`a,
utilizzando la disuguaglianza di Young, segue infatti
L( u, ) = f( u) (

) u g

( ) = f

) g

( )
f(u) (

)u g

( ) = L(u, ) u X,
e similmente
L( u, ) = f( u) (

) u g

( ) = f( u) +g( u)
f( u) ( u) g

() = L( u, ) Y

.
Esempio 2.6.19 Siano X, Y spazi di Banach reali con X riessivo. Sia C
un cono di Y (ci`o signica che C + C C e tC C per ogni t 0) che
supponiamo non vuoto, convesso, chiuso e tale che C (C) = 0. Esso
induce una relazione dordine parziale su Y , denita per y, z Y da
y z z y C
(le veriche sono ovvie). Per costruzione risulta C = y Y : 0 y, mentre
C = y Y : y 0. Il cono duale `e il cono di Y

denito da
C

= Y

: y 0 y C,
e scriveremo 0 se e solo se C

. Si verica facilmente (esercizio 2.6.2)


che
C = y Y : y 0 C

.
Sia K un convesso chiuso non vuoto di X e sia J : X R una funzione
convessa, semicontinua inferiormente e propria, tale che D(J) = K. Sia inne
91
B : X Y un operatore non necessariamente lineare, convesso rispetto alla
relazione su Y :
B(y + (1 )z) B(y) + (1 )B(z) y, z X, [0, 1].
Supponiamo che valgano le seguenti condizioni:
(a) per ogni C

lapplicazione u (B(u)) `e semicontinua inferior-


mente in K;
(b) linsieme x K : B(x)

C
`e non vuoto;
(c) risulta infJ(u) : u K, B(u) 0 R;
(d) si ha lim
u
X
, B(u)0
J(u) = +.
Il nostro problema primale sar`a
min
uK, B(u)0
J(u),
e sceglieremo la funzione cos` denita:
(u, y) = J(u) +I
C
(y B(u)) =
_
J(u) se u K e B(u) y
+ altrimenti.
Occorre vericare che le ipotesi del corollario 2.6.11 sono soddisfatte.
`
E
immediato vericare, grazie a (c), che e (, 0) sono proprie. Proviamo che
`e convessa e semicontinua inferiormente: posto
E = (u, y) X Y : u K, B(u) y,
si pu`o scrivere
(u, y) = J(u) +I
E
(u, y),
e quindi, ricordando che J `e convessa e semicontinua inferiormente, basta far
vedere che E `e un convesso chiuso in X Y . Dato che
E =

(u, y) X Y : u K, (B(u) y) 0,
in virt` u di (a) linsieme E `e intersezione di convessi chiusi e quindi `e un
convesso chiuso.
92
Inne, la condizione di stabilit`a del problema primale segue da (b): infatti,
scelto u
0
K tale che B(u
0
)

C
, esiste un intorno V di 0 Y tale che
B(u
0
) y 0 per ogni y V : ne segue (u
0
, y) = J(u
0
) per ogni y V ,
cosicche y (u
0
, y) `e nita e continua nel punto 0. Notiamo anche che (d)
implica lesistenza del minimo per il problema primale.
Si ha allora, procedendo come nellesempio 2.6.18,

(0, ) = sup
uX
sup
yY
y J(u) I
C
(y B(u)) = [y B(u) = p]
= sup
uK
sup
pY
(B(u)) +p J(u) I
C
(p) =
= sup
uK
(B(u)) J(u) +I

C
();
notando poi che, come si verica facilmente,
I

C
() = sup
0y
y = I
C
() Y

,
si conclude che

(0, ) = sup
uK
(B(u)) J(u) +I
C
().
Quindi il problema duale `e
max
Y

_
inf
uK
J(u) (B(u)) I
C
()
_
= max
C

inf
uK
J(u) (B(u)).
La condizione di estremalit`a `e
J( u) +I
C
(B( u)) + sup
uK
(B(u)) J(u) +I
C
( ) = 0;
essa implica u K, B( u) 0, C

(da cui (B( u)) 0) e


J( u) + sup
uK
(B(u)) J(u) = 0.
Poiche, per denizione,
J( u) + sup
uK
(B(u)) J(u) (B( u)) 0,
93
la relazione di estremalit`a implica le semplici condizioni
u K, B( u) 0, 0; (B( u)) = 0,
le quali tuttavia non sono equivalenti alla relazione di estremalit`a: ad esempio
esse sono soddisfatte per = 0, ma non `e detto che il funzionale 0 Y

massimizzi

(0, ).
La lagrangiana `e data da
L(u, ) = inf
yY
J(u) +I
C
(y B(u)) y =
= inf
pY
J(u) +I
C
(p) (B(u)) p =
= J(u) (B(u)) + inf
pY
I
C
(p) p =
= J(u) (B(u)) sup
pY
p I
C
(p) =
= J(u) (B(u)) I

C
().
La relazione di estremalit`a, come sappiamo, equivale al fatto che ( u, ) `e
punto di sella per L, cosa che, volendo, si pu`o anche vericare direttamente
senza troppa fatica.
Esercizi 2.6
1. Sia X uno spazio normato, e sia K X un convesso chiuso non vuoto.
Si provi che
d(x
0
, K) = max

X
=1
x
0
I

K
() x
0
K.
2. Sia Y uno spazio di Banach, sia C un cono di Y che supponiamo non
vuoto, convesso, chiuso e tale che C (C) = 0. Detto C

il cono
duale di Y

rispetto alla relazione dordine indotta da C, si verichi


che C coincide con y Y : y 0 C

.
[Traccia: per la seconda inclusione si ragioni per assurdo utilizzando
il teorema di Hahn-Banach.]
3. (Teorema di Karush-Kuhn-Tucker) Per ogni k N
+
si introduca in R
k
lordinamento indotto dal cono
k
= x R
k
: x
i
0, i = 1, . . . , k.
94
Sia poi A = a
ij
una matrice reale mn. Fissati c R
n
, b R
m
, si
consideri il problema primale
min
uV
c, u)
n
, V = u R
n
: u 0, Au b.
(i) Posto (u, y) = c, u)
n
+ I
n
(u) + I
m
(b + y Au), si provi che il
problema duale `e
max
yW
b, y)
m
, W = y R
m
: y 0,
t
Ay c.
(ii) Si scriva la lagrangiana e si determini la relazione di estremalit`a.
(iii) Supponendo inoltre che b 0, che c
i
> 0 per i = 1, . . . , n e che
linsieme u
n
: (Au)
i
< b
i
, i = 1, . . . , m sia non vuoto, si
verichi che esiste un punto di minimo u per il problema primale
e che esiste un punto di massimo y per il problema duale; se ne
deduca che per ogni i = 1, . . . , m vale la seguente alternativa:
(A u)
i
< b
i
e y
i
= 0 oppure (A u)
i
= b
i
e y
i
0.
95
Capitolo 3
Calcolo in spazi di Banach
3.1 Integrale di Bochner
Nel capitolo precedente abbiamo visto, sotto opportune ipotesi, alcuni risul-
tati di esistenza del minimo di funzioni convesse in spazi di Banach. Ma per
trovare eettivamente i punti di minimo, occorre saper fare le derivate di
questo tipo di funzioni. Questo capitolo `e dedicato allestensione delle usuali
propriet`a del calcolo dierenziale al caso di funzioni tra spazi normati.
Preliminare a questo studio, per`o, `e una breve descrizione della teoria del-
lintegrazione per funzioni a valori in uno spazio di Banach, limitandoci per
semplicit`a al caso di funzioni denite in un intervallo [a, b] R.
Sia dunque X uno spazio di Banach (reale o complesso): denoteremo con
| | la norma in X e considereremo funzioni f : [a, b] X.
Denizione 3.1.1 Indichiamo con o(X) lo spazio vettoriale delle funzioni
semplici, ossia delle funzioni : [a, b] X della forma
(t) =
k

i=1
x
i

A
i
(t), t [a, b],
ove k N
+
, x
i
X, e gli A
i
sono sottoinsiemi di [a, b] misurabili (secondo
Lebesgue) e fra loro disgiunti.
Denizione 3.1.2 Se o(X), =

k
i=1
x
i

A
i
, l integrale di su [a, b]
`e lelemento di X
_
b
a
(t) dt =
k

i=1
x
i
m(A
i
) .
96
Osservazione 3.1.3 Lintegrale su o(X) gode delle usuali propriet`a: in par-
ticolare `e lineare, e in luogo della monotonia (che non ha senso nel generico
spazio di Banach X) si ha la disuguaglianza
_
_
_
_
_
b
a
(t) dt
_
_
_
_

_
b
a
|(t)|dt o(X).
Si noti che |()| `e una funzione semplice su [a, b], a valori reali.
Passiamo ad introdurre le funzioni misurabili a valori in X.
Denizione 3.1.4 Una funzione f : [a, b] X `e detta fortemente misura-
bile se esiste una successione
n

nN
o(X) tale che

n
(t) f(t) in X t [a, b].
La funzione f `e detta debolmente misurabile se per ogni F X

la funzione
reale o complessa t Ff(t) `e misurabile (secondo Lebesgue).
`
E facile vericare che ogni funzione fortemente misurabile `e debolmente mi-
surabile; il viceversa `e falso, come mostra lesercizio 3.1.1. Inoltre si vede
immediatamente che se f `e fortemente misurabile allora la funzione reale
t |f(t)| `e misurabile secondo Lebesgue.
Denizione 3.1.5 Sia f : [a, b] X una funzione fortemente misurabile.
Diciamo che f `e sommabile su [a, b] se si ha
_
b
a
|f(t)|dt < +.
Osserviamo che ogni funzione semplice `e sommabile.
Vediamo ora come denire lintegrale di una funzione sommabile, il quale sar`a
un elemento di X; naturalmente per le funzioni semplici la nuova denizione
di integrale dovr`a corrispondere alla vecchia. Prima di tutto stabiliamo la
seguente
Proposizione 3.1.6 Sia f : [a, b] X fortemente misurabile. I seguenti
fatti sono equivalenti:
(i) f `e sommabile;
(ii) esiste
n

nN
o(X) tale che
_
b
a
|f(t)
n
(t)|dt 0 per n .
97
Dimostrazione (ii)= (i) Per ipotesi esiste N tale che
_
b
a
|f(t)
n
(t)|dt < 1 n ;
quindi
_
b
a
|f(t)|dt
_
b
a
|f(t)

(t)|dt +
_
b
a
|

(t)|dt 1 +K < ,
ove K `e unopportuna costante. Pertanto f `e sommabile.
(i) = (ii) Poiche f `e fortemente misurabile, esiste
n

nN
+ o(X) tale
che
n
(t) f(t) in X per ogni t [a, b]. Deniamo

n
(t) =
_
0 se
n
(t) = 0,
n(t)
n(t)
h
n
(t) se
n
(t) ,= 0,
ove la funzione h
n
: [a, b] R `e data da
h
n
(t) =
_
n se |f(t)| n
k1
2
n
se
k1
2
n
|f(t)| <
k
2
n
(k = 1, 2, . . . , n2
n
).
Si verica facilmente che
n

nN
+ o(X) e che |
n
(t)| |f(t)| per ogni
t [a, b]; proviamo che si ha

n
(t) f(t) in X t [a, b].
In eetti, se f(t) = 0 si ha
n
(t) = 0 per denizione. Se invece f(t) ,= 0,
esister`a N
+
tale che |f(t)| 2

: quindi per n risulta


n
(t) ,= 0 e
dalla denizione di
n
(t) segue
lim
n

n
(t) = lim
n

n
(t)
|
n
(t)|
h
n
(t) =
f(t)
|f(t)|
|f(t)| = f(t).
Poiche inoltre |
n
(t) f(t)| 2|f(t)|, dato che f `e sommabile la conver-
genza `e dominata. Ne segue la tesi.
Siamo ora in grado di denire lintegrale di una funzione f : [a, b] X
sommabile. Infatti, per la proposizione 3.1.6 esiste
n

nN
o(X) tale che
98
lim
n
_
b
a
|f(t)
n
(t)|dt = 0. Ne segue che la successione
_
_
b
a

n
(t)dt
_
nN
`e di Cauchy in X, in quanto
_
_
_
_
_
b
a

n
(t) dt
_
b
a

m
(t) dt
_
_
_
_

_
b
a
|
n
(t)
m
(t)|dt

_
b
a
|
n
(t) f(t)|dt +
_
b
a
|f(t)
m
(t)|dt 0 per n, m .
Essendo X completo, tale successione converge in X ed `e naturale richiedere
che il suo limite, per denizione, sia lintegrale su [a, b] della funzione f.
In altre parole, deniamo lintegrale di una funzione sommabile nel modo
seguente:
Denizione 3.1.7 Sia X uno spazio di Banach, sia f : [a, b] X somma-
bile. L integrale (di Bochner) di f in [a, b] `e lelemento di X
_
b
a
f(t) dt = lim
n
_
b
a

n
(t) dt,
ove il limite `e fatto nella norma di X e
n

nN
`e una qualunque successione
di funzioni semplici tale che lim
n
_
b
a
|f(t)
n
(t)|dt = 0.
La denizione non dipende dalla scelta delle funzioni approssimanti
n
:
infatti, se
n

nN
`e unaltra successione in o(X) tale che
lim
n
_
b
a
|f(t)
n
(t)|dt = 0,
allora evidentemente
lim
n
_
_
_
_
_
b
a

n
(t) dt
_
b
a

n
(t) dt
_
_
_
_
lim
n
_
b
a
|
n
(t)
n
(t)|dt = 0.
Lintegrale di Bochner gode di tutte le propriet`a usuali: ad esempio, se si
denisce
_
a
b
f(t) dt =
_
b
a
f(t) dt,
`e facile dedurre (esercizio 3.1.2) che risulta
_
q
p
f(t) dt =
_
r
p
f(t) dt +
_
q
r
f(t) dt p, q, r [a, b].
99
Si ha anche, come facile conseguenza della denizione,
_
_
_
_
_
b
a
f(t) dt
_
_
_
_

_
b
a
|f(t)|dt.
Introduciamo adesso gli spazi L
p
per funzioni a valori in X.
Denizione 3.1.8 Se 1 p < denotiamo con L
p
(a, b; X) lo spazio delle
funzioni f : [a, b] X fortemente misurabili tali che
_
b
a
|f(t)|
p
dt < . Se
p = denotiamo con L

(a, b; X) lo spazio delle funzioni f : [a, b] X


fortemente misurabili e tali che supess
t[a,b]
|f(t)| < .
Si verica facilmente, riconducendosi al caso di funzioni da [a, b] in R, che
gli spazi L
p
(a, b; X), 1 p , sono spazi normati con le usuali rispettive
norme:
|f|
L
p
(a,b;X)
=
__
b
a
|f(t)|
p
dt
_
1
p
, |f|
L

(a,b;X)
= supess
t[a,b]
|f(t)|
(si veda lesercizio 3.1.6).
Inoltre, con la stessa dimostrazione che si fa nel caso X = R, si ottiene che
tali spazi sono di Banach. Quando X `e riessivo, si sa anche caratterizzare,
in analogia col caso scalare, il duale di L
p
(a, b; X):
Teorema 3.1.9 (di Riesz-Fischer) Sia X uno spazio di Banach riessivo
e sia p [1, [. Allora (L
p
(a, b; X))

`e isomorfo ed isometrico a L
q
(a, b; X

),
ove
1
p
+
1
q
= 1; in altre parole, per ogni F (L
p
(a, b; X))

esiste ununica
funzione g L
q
(a, b; X

) tale che
(i) Ff =
_
b
a
g(t), f(t))dt f L
p
(a, b; X);
(ii) |F|
(L
p
(a,b;X))
= |g|
L
q
(a,b;X

)
.
(In (i), la notazione g(t), f(t)) indica lazione del funzionale g(t) X

sullelemento f(t) X.)


Si osservi che lo spazio C([a, b], X) delle funzioni continue da [a, b] in X `e
contenuto (propriamente) in tutti gli spazi L
p
(a, b; X) (esercizio 3.1.3). In
particolare, vale il seguente enunciato:
Proposizione 3.1.10 Sia X uno spazio di Banach. Se f C([a, b], X),
allora la funzione F(t) =
_
t
a
f(s)ds appartiene a C
1
([a, b], X) e F

(t) = f(t)
per ogni t [a, b].
100
Dimostrazione Se t, t +h [a, b], si ha
_
_
_
_
F(t +h) F(t)
h
f(t)
_
_
_
_
=
_
_
_
_
1
h
_
t+h
t
[f(s) f(t)]dt
_
_
_
_

1
[h[

_
t+h
t
|f(s) f(t)|ds

,
ed in virt` u della continuit`a di f, lultimo membro `e innitesimo per h 0.
Corollario 3.1.11 Sia X uno spazio di Banach. Se f C
1
([a, b], X) risulta
f(t) = f(s) +
_
t
s
f

(r) dr t, s [a, b].


Dimostrazione Fissato s [a, b], la funzione
(t) = f(t)
_
t
s
f

(r) dr, t [a, b],


appartiene a C
1
([a, b], X) ed ha derivata nulla per la proposizione precedente.
Perci`o, ssato X

, la funzione reale o complessa g(t) = (t) ha ancora


derivata nulla, perche, in virt` u della linearit`a e continuit`a di ,
lim
h0
g(t +h) g(t)
h
=
_
lim
h0
(t +h) (t)
h
_
= 0.
Dunque, g `e costante su [a, b]; ne segue ((t) (s)) = 0 per ogni t [a, b]
e per ogni X

. Per il teorema di Hahn-Banach, ssato t [a, b] si pu`o


scegliere tale che ((t)(s)) = |(t)(s)|; si conclude che (t) = (s)
per ogni t [a, b]. Essendo (s) = f(s), si ha la tesi.
Esercizi 3.1
1. Sia X = L

(a, b) e sia f : [a, b] X denita da


f(t) =
[a,t]
t [a, b].
Si provino i seguenti fatti:
101
(i) Per ogni funzionale positivo F X

la funzione reale t Ff(t) `e


crescente.
(ii) La funzione f `e debolmente misurabile.
(iii) Se
n

nN
o(X), allora
n
(t) : t [a, b], n N `e un
sottoinsieme al pi` u numerabile di X.
(iv) Se g : [a, b] X `e fortemente misurabile, allora g(t) : t [a, b]
`e un sottoinsieme quasi separabile di X, ovvero esiste un insieme
B
0
[a, b] di misura nulla, tale che g(t) : t [a, b] B
0
`e
separabile.
(v) La funzione f non `e fortemente misurabile.
2. Sia X uno spazio di Banach. Si provi che se f : [a, b] X `e sommabile,
allora
_
q
p
f(t) dt =
_
r
p
f(t) dt +
_
q
r
f(t) dt p, q, r [a, b].
3. Sia X uno spazio di Banach. Si provi che ogni funzione continua f :
[a, b] X `e fortemente misurabile.
4. Sia X uno spazio di Banach. Si provi che una funzione f : [a, b] X `e
fortemente misurabile se e solo se esiste una successione f
n
di funzioni
fortemente misurabili che converge a f puntualmente q.o. in [a, b].
5. Sia X uno spazio di Banach, sia p [1, ] e sia q lesponente coniugato
di p. Se f L
p
(a, b; X) e g L
q
(a, b; X

), si provi la disuguaglianza di
Holder:
_
b
a
[g(t), f(t))[ dt |f|
L
p
(a,b,X)
|g|
L
q
(a,b;X

)
.
6. Sia X uno spazio di Banach e sia p [1, [. Se f, g L
p
(a, b; X), si
dimostri la disuguaglianza di Minkowski:
__
b
a
|f(t) +g(t)|
p
dt
_
1
p

__
b
a
|f(t)|
p
dt
_
1
p
+
__
b
a
|g(t)|
p
dt
_
1
p
.
102
3.2 Dierenziale di Frech`et
Veniamo ora alla generalizzazione delle usuali propriet`a del calcolo dieren-
ziale.
Denizione 3.2.1 Siano X, Y spazi normati e sia un aperto di X. Una
funzione f : Y si dice dierenziabile secondo Frech`et nel punto x
0

(pi` u brevemente, F-dierenziabile in x
0
) se esiste un operatore A L(X, Y )
tale che risulti
lim
h
X
0
|f(x
0
+h) f(x
0
) Ah|
Y
|h|
X
= 0.
Loperatore A si dice dierenziale di Frech`et di f in x
0
e si scrive A = f

(x
0
).
Osservazione 3.2.2 Il dierenziale di Frech`et di f, se esiste, `e unico. Infatti
se B L(X, Y ) verica la stessa denizione, risulter`a
lim
h
X
0
|f(x
0
+h) f(x
0
) Bh|
Y
|h|
X
= 0;
per dierenza, deduciamo
lim
h
X
0
|Ah Bh|
Y
|h|
X
= 0.
Dunque, ssato > 0, si avr`a per |h| < , con opportuno,
|Ah Bh|
Y
|h|
X
< ,
e per linearit`a
|(A B)u|
Y
u X con |u|
X
1.
Ci` o prova che |A B|
L(X,Y )
, e dunque A = B per larbitrariet`a di .
Si noti che la denizione di dierenziabilit`a secondo Frech`et dipende solo
dalla topologia di X e di Y , ed `e invariante rispetto al passaggio a norme
equivalenti.
`
E anche evidente che ogni funzione F-dierenziabile `e continua
(esercizio 3.2.1).
La regola di calcolo per il dierenziale di funzioni composte `e valida anche
nel contesto degli spazi normati. Si ha infatti:
103
Proposizione 3.2.3 Siano X, Y, Z spazi normati; siano un aperto di X,
un aperto di Y , e siano f : , g : Z. Se f `e F-dierenziabile in
un punto x
0
e g `e F-dierenziabile nel punto y
0
= f(x
0
), allora g f `e
F-dierenziabile in x
0
e si ha
(g f)

(x
0
) = g

(y
0
) f

(x
0
).
Dimostrazione Per ipotesi si ha
lim
h
X
0
|(h)|
Y
|h|
X
= 0, ove (h) = f(x
0
+h) f(x
0
) f

(x
0
)h,
lim
k
Y
0
|(k)|
Z
|k|
Y
= 0, ove (k) = g(y
0
+k) g(y
0
) g

(y
0
)k.
Scegliamo k = f(x
0
+ h) f(x
0
) ed osserviamo che se |h|
X
0 allora
|k|
Y
0. Si ha
g(f(x
0
+h)) g(f(x
0
)) = g(y
0
+k) g(y
0
) = g

(y
0
)k +(k) =
= g

(y
0
)[f

(x
0
)h +(h)] +(f

(x
0
)h +(h));
posto (h) = g

(y
0
)[(h)] +(f

(x
0
)h +(h)), si ricava
lim
h
X
0
|(h)|
Z
|h|
X
lim
h
X
0
|g

(y
0
)|
L(Y,Z)
|(h)|
Y
|h|
X
+
+ lim
h
X
0
|(k)|
Z
|h|
X
.
Daltra parte se |h|
X
0 si ha
|(k)|
Z
|h|
X
= o(1)
|k|
Y
|h|
X
o(1)
_
|f

(x
0
)|
L(X,Y )
+
|(h)|
Y
|h|
X
_
0.
Pertanto, |(h)|
Z
= o(|h|
X
) e la relazione
g f(x
0
+h) g f(x
0
) g

(y
0
) f

(x
0
)h = (h)
ci d`a la tesi.
Esempi 3.2.4 (1) Se f(x) `e costante in , allora f

(x
0
) = 0 per ogni
x
0
.
(2) Se f L(X, Y ), allora f

(x
0
) = f per ogni x
0
X.
(3) Se f : X Y Z `e unapplicazione bilineare e continua, allora f `e
F-dierenziabile in ogni (x
0
, y
0
) XY , e f

(x
0
, y
0
) `e lapplicazione lineare
(h, k) f(h, y
0
) +f(x
0
, k).
104
Concludiamo il paragrafo con la seguente
Denizione 3.2.5 Siano X, Y spazi normati e sia un aperto di X. Se f :
Y `e una funzione F-dierenziabile in ogni punto x
0
, lapplicazione
f

: L(X, Y ) `e detta derivata prima di f. Se f

`e continua su , diremo
che f `e di classe C
1
su .
Esercizi 3.2
1. Si verichi che ogni funzione F-dierenziabile in un punto x
0
`e continua
in x
0
, e che il viceversa non `e vero.
2. Sia : R R una funzione derivabile. Se X `e uno spazio normato
e f : X R `e una funzione F-dierenziabile, si provi che f `e
F-dierenziabile e
( f)

(x) =

(f(x))f

(x) x X.
3. Sia X uno spazio con prodotto scalare. Si provi che la funzione f(x) =
|x|
2
`e F-dierenziabile in X, mentre la funzione g(x) = |x| `e F-
dierenziabile soltanto in X 0.
4. Siano X = R
N
e Y = R; si verichi che la denizione 3.2.5 relativa a
funzioni f : X Y si riduce a quella usuale.
5. Vericare che i seguenti funzionali a valori in R sono F-dierenziabili
negli spazi a anco indicati, e scriverne la derivata di Frech`et:
(i) J(y) =
_
b
a
[y(x)
2
+y

(x)
2
2y(x) sin x] dx, X = C
1
[a, b];
(ii) J(y) =
_
b
a
y

(x)
2
x
3
dx, X = C
1
[a, b] (a > 0);
(iii) J(y) =
_
b
a
[16y(x)
2
y

(x)
2
+x
3
] dx, X = C
2
[a, b];
(iv) J(y) =
_
b
a
[2xy(x) y

(x)
2
] dx, X = C
3
[a, b].
6. In uno spazio di Hilbert, le proiezioni su convessi chiusi sono applica-
zioni F-dierenziabili?
105
3.3 Dierenziale di Gateaux
La nozione di dierenziabilit`a secondo Gateaux `e lestensione del concetto
di derivata direzionale. Si tratta quindi di una propriet`a meno forte della
F-dierenziabilit`a.
Denizione 3.3.1 Siano X, Y spazi normati, sia un aperto di X. Una
funzione f : Y si dice dierenziabile secondo Gateaux nel punto x
0

(pi` u brevemente, G-dierenziabile in x
0
) se esiste un operatore A L(X, Y )
tale che
lim
t0
_
_
_
_
1
t
[f(x
0
+tv) f(x
0
)] Av
_
_
_
_
Y
= 0 v X.
Loperatore A si dice dierenziale di Gateaux di f in x
0
e si scrive A =
f

G
(x
0
).
Si noti che in questa denizione si richiede non solo che esista la derivata di
f in x
0
secondo qualunque direzione v X, ma anche che la dipendenza di
tale derivata da v sia lineare: ci`o non `e sempre vero (esercizio 3.3.3).
Per lunicit`a del limite, il G-dierenziale di f in x
0
`e unico (se esiste); lap-
plicazione x
0
f

G
(x
0
) si chiama derivata di Gateaux di f.
`
E noto da esempi elementari che gi`a nel caso X = R
2
, Y = R unapplica-
zione G-dierenziabile pu`o non essere continua e quindi, a maggior ragione,
non essere F-dierenziabile (esercizio 3.2.1). Per`o dalle denizioni si vede
subito che se f `e una funzione F-dierenziabile in x
0
, allora f `e anche G-
dierenziabile in x
0
ed in tal caso si ha f

G
(x
0
) = f

(x
0
).
La seguente proposizione generalizza il classico teorema di Lagrange.
Proposizione 3.3.2 Siano X, Y spazi normati, sia un aperto di X, sia
f : Y una funzione G-dierenziabile in . Se x
1
e x
2
sono punti di
tali che lintero segmento di estremi x
1
, x
2
sia contenuto in , allora
|f(x
2
) f(x
1
)|
Y
sup
t[0,1]
|f

G
((1 t)x
1
+tx
2
)|
L(X,Y )
|x
2
x
1
|
X
.
Si noti che il secondo membro della disuguaglianza potrebbe valere +(eser-
cizio 3.3.2).
Dimostrazione Consideriamo la funzione F : [0, 1] R denita da
F(t) = [f((1 t)x
1
+tx
2
)], t [0, 1],
106
ove `e un ssato elemento di Y

. Essa `e derivabile, perche, posto x(t) =


(1 t)x
1
+tx
2
, risulta
lim
h0
F(t +h) F(t)
h
= lim
h0
[f(x(t) +h(x
2
x
1
)) f(x(t))]
h
=
=
_
lim
h0
f(x(t) +h(x
2
x
1
)) f(x(t))
h
_
= [f

G
(x(t))(x
2
x
1
)].
Per il teorema di Lagrange si ha
[f(x
2
)] [f(x
1
)] = F(1) F(0) = F

() = [f

G
(x())(x
2
x
1
)]
con ]0, 1[ opportuno. Di conseguenza
[[f(x
2
)] [f(x
1
)][ ||
Y
|f

G
(x())|
L(X,Y )
|x
2
x
1
|
X
,
e scegliendo tale che ||
Y
= 1 e [f(x
2
) f(x
1
)] = |f(x
2
) f(x
1
)|
Y
, si
ottiene la tesi.
Il risultato che segue fornisce una condizione suciente per la F-dierenzia-
bilit`a ed `e la generalizzazione del classico teorema del dierenziale totale.
Corollario 3.3.3 Siano X, Y spazi normati, sia un aperto di X. Se f :
Y `e una funzione G-dierenziabile, e se inoltre f

G
: L(X, Y )
`e continua nel punto x
0
, allora f `e F-dierenziabile in x
0
e f

(x
0
) =
f

G
(x
0
).
Dimostrazione Esiste un intorno U di 0 X nel quale `e denita la funzione
(h) = f(x
0
+h) f(x
0
) f

G
(x
0
)h, h U.
Questa funzione `e G-dierenziabile, perche tali sono gli addendi che la com-
pongono (esercizio 3.3.1), e si ha

G
(h) = f

G
(x
0
+h) f

G
(x
0
) h U.
Poiche (0) = 0, dalla proposizione 3.3.2 otteniamo
|(h)|
Y
sup
t[0,1]
|f

G
(x
0
+th) f

G
(x
0
)|
L(X,Y )
|h|
X
,
e dunque, per la continuit`a di f

G
in x
0
, si ha
lim
h
X
0
|(h)|
Y
|h|
X
= 0.
107
Esercizi 3.3
1. Siano X, Y spazi normati. Si verichi che se f : X Y `e una funzione
G-dierenziabile, allora per ogni x X la funzione g(h) = f(x + h) `e
a sua volta G-dierenziabile con g

G
(h) = f

G
(x +h).
2. Sia f : R R denita da
f(x) =
_
0 se x = 0,
[x[
3/2
sin
1
|x|
se x ,= 0.
Si provi che f `e derivabile in ogni punto di R, ma che
sup
x[1,1]
[f

(x)[ = +.
3. Si provi che la funzione f : R
2
R, denita da
f(x, y) =
_
0 se [y[ [x[,
sgn(y)
_
y
2
x
2
se [y[ > [x[,
(x, y) R
2
,
non `e G-dierenziabile in (0, 0), benche abbia tutte le derivate direzio-
nali in tale punto.
4. Posto X = L
1
(a, b), si provi che lapplicazione f |f|
1
non `e in
generale G-dierenziabile.
[Traccia: si consideri la derivata nel punto
I
secondo la direzione
J
,
ove I e J sono intervalli disgiunti di ]a, b[.]
5. Sia X uno spazio normato e sia f : X R una funzione convessa e
G-dierenziabile. Si provi che
f(x
0
+v) f(x
0
) +f

G
(x
0
)v x
0
, v X.
[Traccia: si utilizzi la crescenza del rapporto incrementale nella dire-
zione v (esercizio 2.1.3).]
3.4 Loperatore di superposizione
Esaminiamo in dettaglio un esempio interessante e non banale di funzione
F-dierenziabile.
Sia R
N
un aperto di misura di Lebesgue nita (limitato o no) e sia
f : R R una funzione tale che:
108
(i) x f(x, t) `e misurabile in per ogni t R;
(ii) esiste un insieme misurabile
0
tale che m(
0
) = 0 e t f(x, t)
`e continua su R per ogni x
0
.
Poniamo
[(u)](x) = f(x, u(x)), x ;
per comprensibili ragioni, lapplicazione u (u) si chiama operatore di
superposizione.
Si tratta ora di scegliere lo spazio in cui far variare le funzioni u. Osserviamo
anzitutto che se u : R `e misurabile, allora (u) `e a sua volta misurabile.
Infatti, questo `e vero quando u `e una funzione semplice (se u =

k
i=1

E
i
,
con gli E
i
disgiunti e

k
i=1
E
i
= , si ha (u) =

k
i=1
f(,
i
)
E
i
e dunque
(u) `e misurabile); poi, se u `e misurabile e u
n
`e una successione di fun-
zioni semplici che converge ad u puntualmente in , allora (u) `e il limite
puntuale in
0
, dunque q.o. in , delle funzioni misurabili (u
n
), e dunque
`e misurabile in virt` u della completezza della misura di Lebesgue.
Vale inoltre la seguente propriet`a:
Lemma 3.4.1 Nelle ipotesi precedenti, se u
n
`e una successione di funzioni
misurabili su tale che u
n
u in misura, allora (u
n
) (u) in misura.
Dimostrazione Sia > 0; dobbiamo provare che
lim
n
m(x
0
: [(u
n
)(x) (u)(x)[ > ) = 0.
Per ogni k N
+
consideriamo linsieme

k
=
_
x
0
: [f(x, u(x)) f(x, t)[ t
_
u(x)
1
k
, u(x) +
1
k
__
.
Non `e evidente che linsieme
k
sia misurabile: la dimostrazione di questo
fatto `e tratteggiata nellesercizio 3.4.1. Risulta inoltre
k

k+1
e, per
la continuit`a di f rispetto alla variabile t, si ha

k=1

k
=
0
; essendo
m(
0
) = m() < , se ne deduce, in virt` u della misurabilit`a di
k
, che
m(
0

k
) 0 per k . Dunque, ssato > 0, esiste k N
+
(che
pensiamo dora in poi ssato) tale che m(
0

k
) < /2.
Deniamo ora per ogni n N linsieme
A
n
=
_
x
0
: [u
n
(x) u(x)[
1
k
_
;
109
poiche u
n
u in misura, si ha lim
n
m(
0
A
n
) = 0 e dunque esiste n N
tale che
m(
0
A
n
) <

2
n n.
Daltra parte, se x A
n

k
si ha u
n
(x) [u(x) 1/k, u(x) +1/k] e quindi
[(u
n
)(x) (u)(x)[ ; ne segue, per ogni n n,
m(x
0
: [(u
n
)(x) (u)(x)[ > )
m(
0
(A
n

k
)) m(
0
A
n
) +m(
0

k
)

2
+

2
= ,
cio`e la tesi.
Una conseguenza del lemma precedente `e la continuit`a delloperatore su
opportuni spazi L
p
.
Proposizione 3.4.2 Supponiamo che, in aggiunta alle ipotesi precedenti,
esistano p, q 1 tali che
[f(x, t)[ a(x) +b[t[
p/q
per q.o. x , t R,
ove a L
q
(), con a 0, e b 0. Allora loperatore di superposizione
manda con continuit`a L
p
() in L
q
().
Dimostrazione Anzitutto, se u L
p
() si ha (u) L
q
() perche
_

[f(x, u(x))[
q
dx 2
q1
__

a(x)
q
dx +b
q
_

[u(x)[
p
dx
_
;
dobbiamo provare la continuit`a di . Sia u
n
L
p
() una successione tale
che u
n
u in L
p
(): occorre mostrare che (u
n
) (u) in L
q
(). Dato
che, in particolare, u
n
u in misura, il lemma 3.4.1 ci dice che (u
n
) (u)
in misura. Inoltre vale la seguente stima:
[(u
n
)(x) (u)(x)[
q
2
q1
_
[(u
n
)(x)[
q
+[(u)(x)[
q
_

4
q1
_
a(x)
q
+b
q
[u
n
(x)[
p
+a(x)
q
+b
q
[u(x)[
p
_

4
q1
_
2a(x)
q
+ 2
p1
b
q
[u
n
(x) u(x)[
p
+ (2
p1
+ 1)b
q
[u(x)[
p
_

c
p,q
_
a(x)
q
+[u
n
(x) u(x)[
p
+[u(x)[
p
_
.
110
Sia allora > 0: esiste n N tale che |u
n
u|
p
L
p
()
< per ogni n n;
quindi, per lassoluta continuit`a dellintegrale e per la stima precedente, esiste
> 0 per cui si ha
m(E) < , n n =
_
E
[(u
n
) (u)[
q
dx 3c
p,q
.
Scegliamo ora > 0 tale che
q
< ; posto
E
n
= x : [(u
n
)(x) (u)(x)[ ,
sar`a m(E
n
) < per ogni n n n. Ne segue, nalmente,
_

[(u
n
) (u)[
q
dx =
=
_
En
[(u
n
) (u)[
q
dx +
_
\En
[(u
n
) (u)[
q
dx
3c
p,q
+
q
m() < C n n,
e ci`o prova la tesi.
Vediamo ora quali ulteriori condizioni garantiscono la F-dierenziabilit`a del-
lapplicazione .
Teorema 3.4.3 Supponiamo che f soddis tutte le ipotesi della proposizione
3.4.2 con p > 2 e q =
p
p1
. Supponiamo inoltre che la funzione
f
t
esista e
verichi le seguenti condizioni:
(i) x
f
t
(x, t) `e misurabile in per ogni t R;
(ii) t
f
t
(x, t) `e continua su R per q.o. x ;
(iii) vale la disuguaglianza

f
t
(x, t)

(x) +[t[
p2
per q.o. x , t R,
ove L
p
p2
() e 0.
Allora loperatore di superposizione : L
p
() L
q
() `e F-dierenziabile
in ogni punto u L
p
() e
[

(u)v](x) =
f
t
(x, u(x))v(x), x , v L
p
().
111
Dimostrazione Anzitutto, osserviamo che lapplicazione denita da
(u)(x) =
f
t
(x, u(x)), x , u L
p
()
manda con continuit`a L
p
() in L
p
p2
() in virt` u della proposizione 3.4.2;
quindi, per la disuguaglianza di Holder con esponenti p1 e
p1
p2
, se v L
p
()
si ha (u)v L
q
() e
|(u)v|
L
q
()
|(u)|
L
p
p2
()
|v|
L
p
()
.
Poniamo adesso per u, v L
p
()
(v) = (u +v) (u) (u)v;
allora
|(v)|
q
L
q
()
=
=
_

f(x, u(x) +v(x)) f(x, u(x))


f
t
(x, u(x))v(x)

q
dx =
=
_

_
1
0
_
f
t
(x, u(x) +v(x))
f
t
(x, u(x))
_
v(x) d

q
dx ;
dunque, posto
z(x) =
_
1
0
_
f
t
(x, u(x) +v(x))
f
t
(x, u(x))
_
d,
si ha
|(v)|
q
L
q
()
=
_

[z(x)v(x)[
q
dx |z|
q
L
p
p2
()
|v|
q
L
p
()
.
Valutiamo adesso la norma |z|
L
p
p2
()
. Usando ancora una volta la disugua-
glianza di Holder ed il teorema di Tonelli, si trova
_

[z[
p
p2
dx
_

_
1
0

f
t
(x, u(x) +v(x))
f
t
(x, u(x))

p
p2
ddx =
=
_
1
0
|(u +v) (u)|
p
p2
L
p
p2
()
d.
112
Per la continuit`a dellapplicazione , lintegrando allultimo membro tende
a 0 per |v|
L
p
()
0. Daltronde, in virt` u dellipotesi (iii), per |v|
L
p
()
1
esso `e dominato dalla costante
c
p
_
||
p
p2
L
p
p2
()
+
p
p2
(|u|
p
L
p
()
+ 1)
_
(che ovviamente `e una funzione sommabile in [0, 1] rispetto a ); ne segue,
per il teorema di Lebesgue, che |z|
L
p
p2
()
0 per |v|
L
p
()
0. Ci`o prova
che
lim
v
L
p
()
0
|(v)|
L
q
()
|v|
L
p
()
= 0.
Abbiamo cos` provato la F-dierenziabilit`a di sugli spazi L
p
con p > 2. Se
p = 2 vale un risultato pi` u debole:
Teorema 3.4.4 Supponiamo che f verichi tutte le ipotesi della proposizio-
ne 3.4.2 con p = 2 e q = 2. Supponiamo inoltre che la funzione
f
t
esista e
verichi le seguenti condizioni:
(i) x
f
t
(x, t) `e misurabile in per ogni t R;
(ii) t
f
t
(x, t) `e continua su R per q.o. x ;
(iii) vale la disuguaglianza

f
t
(x, t)

M per q.o. x , t R,
ove M 0.
Allora loperatore di superposizione : L
2
() L
2
() `e G-dierenziabile
in ogni u L
2
() e
[

G
(u)v](x) = [(u)v](x) =
f
t
(x, u(x))v(x), x , v L
2
().
Dimostrazione Sia v L
2
(). Per ,= 0 e per q.o. x si ha
1

_
[(u +v)](x) [(u)](x)
_
[(u)](x)v(x) =
= v(x)
_
1
0
_
f
t
(x, u(x) +tv(x))
f
t
(x, u(x))
_
dt.
113
Se 0, si ha tv(x) 0 per ogni t [0, 1] e per q.o. x ; quindi,
utilizzando la continuit`a di
f
t
(x, ), per q.o. x lintegrando a secondo
membro converge puntualmente a 0 per 0. Esso `e anche dominato dalla
costante 2M, e quindi il teorema di Lebesgue implica che
lim
0
_
1

_
[(u +v)](x) [(u)](x)
_
[(u)](x)v(x)
_
= 0 per q.o. x .
Dato che si ha anche

_
[(u +v)](x) [(u)](x)
_
[(u)](x)v(x)

2
(2M)
2
[v(x)[
2
q.o. in ,
unaltra applicazione del teorema di Lebesgue porta a concludere che
lim
0
_
_
_
_
1

_
[(u +v)](x) [(u)](x)
_
[(u)](x)v(x)
_
_
_
_
2
L
2
()
= 0,
che `e la tesi.
Il risultato del teorema precedente si pu`o ulteriormente precisare: se p = q =
2, lapplicazione `e F-dierenziabile in un punto ssato di L
p
() soltanto nel
caso in cui la funzione f(x, t) `e ane rispetto alla variabile t (e naturalmente
in questo caso la sar`a F-dierenziabile in ogni punto).
Teorema 3.4.5 Siano p = q = 2. Nelle stesse ipotesi del teorema 3.4.4, se
loperatore di superposizione `e F-dierenziabile in un punto u
0
L
2
(),
allora la funzione f `e necessariamente della forma
f(x, t) = h(x) +tk(x) per q.o. x , t R,
ove h L
2
() e k L

() sono funzioni opportune.


Dimostrazione Anzitutto notiamo che

(u
0
), che esiste per ipotesi, deve
coincidere con

G
(u
0
), che esiste per il teorema 3.4.4 e coincide con (u
0
).
Per ogni x sia B(x,
x
) una palla contenuta in . Poniamo per x e

x
v
,x
() =
B(x,)
(), ,
con R ssato: chiaramente, qualunque sia x , v
,x
0 in L
2
() per
0; quindi dallipotesi segue che, posto
(v
,x
) = (u
0
+v
,x
) (u
0
) (u
0
)v
,x
,
114
risulta per ogni x
lim
0
|(v
,x
)|
L
2
()
|v
,x
|
L
2
()
= 0.
Daltra parte, osservato che
|(v
,x
)|
2
L
2
()
|v
,x
|
2
L
2
()
=
1
[[
2

1
m(B(x, ))

_
B(x,)
_
f(, u
0
() +) f(, u
0
())
f
t
(, u
0
())
_
2
d,
si ha anche
lim
0
|(v
,x
)|
2
L
2
()
|v
,x
|
2
L
2
()
=
1
[[
2

f(x, u
0
(x) +) f(x, u
0
(x))
f
t
(x, u
0
(x))

2
in ogni punto x che sia punto di Lebesgue per la funzione integranda;
quindi tale uguaglianza vale per q.o. x . Pi` u precisamente, metten-
do insieme i due risultati otteniamo che per ogni R esiste un insieme
misurabile A

con m( A

) = 0, tale che

f(x, u
0
(x) +) f(x, u
0
(x))
f
t
(x, u
0
(x))

= 0 x A

.
Facendo variare in Q otteniamo, per intersezione numerabile, un insieme
misurabile A , con m( A) = 0, tale che

f(x, u
0
(x) +) f(x, u
0
(x))
f
t
(x, u
0
(x))

= 0 x A, Q;
dato che f `e continua (anzi di classe C
1
) nella variabile t, la relazione
precedente implica che

f(x, u
0
(x) +) f(x, u
0
(x))
f
t
(x, u
0
(x))

= 0 x A, R.
Posto t = u
0
(x) + , con x A, t `e un arbitrario numero reale: otteniamo
cos`
f(x, t) = f(x, u
0
(x)) +
f
t
(x, u
0
(x))(t u
0
(x)) x A, t R.
Ne segue la tesi, prendendo le funzioni
h(x) = f(x, u
0
(x))
f
t
(x, u
0
(x))u
0
(x), k(x) =
f
t
(x, u
0
(x)).
Si noti che h L
2
() e k L

(), come richiesto.


115
Esercizi 3.4
1. Sia f una funzione vericante le ipotesi elencate allinizio del paragrafo
3.4 e sia u : R una funzione misurabile. Per , r > 0 poniamo

,r
= x
0
: [f(x, u(x)) f(x, t)[ per [t u(x)[ r.
Si provi che:
(i) linsieme
,r
coincide con
x
0
: [f(x, u(x)) f(x, q)[ q Q con [q u(x)[ r;
(ii) se u `e una funzione semplice, allora
,r
`e misurabile;
(iii) se u `e arbitraria, se u
n
`e una successione di funzioni semplici che
converge puntualmente a u in , e se poniamo

n
,r
= x
0
: [f(x, u
n
(x)) f(x, t)[ per [t u
n
(x)[ r,
allora risulta

,r
=

hN
+
limsup
n

n
+
1
h
,r
=

hN
+

mN

_
n=m

n
+
1
h
,r
,
cosicche
,r
`e misurabile per ogni , r > 0.
2. Sia f una funzione vericante le ipotesi della proposizione 3.4.2 con
1
p
+
1
q
= 1. Si provi che il funzionale
J(u) =
_

_
u(x)
0
f(x, t) dtdx, u L
p
(),
`e F-dierenziabile in tutti i punti di L
p
(), con
J

(u)v =
_

f(x, u(x))v(x) dx v L
p
().
116
3.5 Derivate successive
Vediamo brevemente come si possono introdurre le derivate successive di una
applicazione f fra spazi normati.
Denizione 3.5.1 Siano X, Y spazi normati, sia un aperto di X e sia
f : Y una funzione F-dierenziabile. Se la derivata di Frech`et f

:
L(X, Y ) `e F-dierenziabile in un punto x
0
, lapplicazione [f

(x
0
)
L(X, L(X, Y )) `e detta dierenziale secondo di f in x
0
, e si denota con f

(x
0
).
Se f

`e F-dierenziabile in , lapplicazione f

: L(X, L(X, Y )) `e detta


derivata seconda di f; se essa `e continua, la funzione f si dir`a di classe C
2
in .
Esempi 3.5.2 (1) Se f L(X, Y ), allora f

(x
0
) = f per ogni x
0
X, e
f

(x
0
) = 0 per ogni x
0
X.
(2) Sia X = C[a, b], e poniamo f(g) = g
2
per ogni g X, ossia [f(g)](t) =
g(t)
2
per ogni t [a, b]. La funzione f applica C[a, b] in se, e si verica
facilmente che essa `e F-dierenziabile in ogni punto g
0
C[a, b], con
[f

(g
0
)h](t) = 2g
0
(t)h(t), t [a, b], h C[a, b].
Si ha poi, per ogni k C[a, b],
f

(g
0
+h)k f

(g
0
)k = 2(g
0
+h)k 2g
0
k = 2hk,
e dunque
[f

(g
0
)h]k = 2hk h, k C[a, b].
Lapplicazione f

`e dunque bilineare su C[a, b]C[a, b]. Questo non `e casuale,


come mostra la proposizione che segue.
Proposizione 3.5.3 Siano X, Y spazi normati. Lo spazio L(X, L(X, Y )) `e
isomorfo ed isometrico allo spazio L
2
(X, Y ) delle applicazioni : XX Y
bilineari e continue, munito della norma
||
L
2
(X,Y )
= sup
h
X
, k
X
1
|(h, k)|
Y
.
Dimostrazione Sia L(X, L(X, Y )) e siano h, k X. Allora h
L(X, Y ) e [h]k Y . La dipendenza di [h]k da h e k `e ovviamente bilineare,
nonche continua: quindi esiste L
2
(X, Y ) tale che
(h, k) = [h]k h, k X,
117
e risulta
||
L
2
(X,Y )
= sup
h
X
, k
X
1
|(h, k)|
Y
= sup
h
X
, k
X
1
|[h]k)|
Y
=
= sup
h
X
1
|h|
L(X,Y )
= ||
L(X,L(X,Y ))
.
Dunque, esiste una corrispondenza i : L(X, L(X, Y )) L
2
(X, Y ), denita
da i() = , che `e unisometria lineare. Resta da far vedere che i `e anche
surgettiva. Sia dunque L
2
(X, Y ) e consideriamo per ogni ssato h X
lapplicazione
h
: X Y denita da
h
k = (h, k) per ogni k X;
ovviamente,
h
L(X, Y ) per ogni h X. La corrispondenza h
h
`e
unapplicazione lineare : X L(X, Y ), che `e anche continua perche per
ogni h X si ha
|h|
L(X,Y )
= |
h
|
L(X,Y )
= sup
kX\{0}
|
h
k|
Y
|k|
X
=
= sup
kX\{0}
|(h, k)|
Y
|k|
X
||
L
2
(X,Y )
|h|
X
.
Dunque L(X, L(X, Y )), e naturalmente
i()(h, k) = [h]k =
h
k = (h, k) h, k X.
In denitiva, si pu`o sempre vedere la derivata seconda (calcolata in un punto)
come una forma bilineare continua su X X.
In modo analogo, denendo induttivamente la derivata n-sima come la de-
rivata prima di f
(n1)
: L
n1
(X, Y ), si trova che tale derivata n-sima,
calcolata in un punto x
0
, `e unapplicazione n-lineare f
(n)
(x
0
) L
n
(X, Y ),
dove per ogni n N
+
lo spazio L
n
(X, Y ) `e la classe delle applicazioni di X
n
in Y n-lineari e continue, con la norma
||
Ln(X,Y )
= sup|(h
1
, . . . , h
n
)|
Y
: |h
i
|
X
1 per i = 1, . . . n.
Vediamo inne come si scrive la formula di Taylor (arrestata al secondo
ordine, per semplicit`a) nel caso di applicazioni fra spazi normati.
Proposizione 3.5.4 Siano X, Y spazi normati, sia un aperto di X e sia
f : Y di classe C
2
. Se x
0
e se B(x
0
, R) , allora per ogni
h B(0, R) si ha
f(x
0
+h) = f(x
0
) +f

(x
0
)h +
1
2
[f

(x
0
)h]h +(h),
118
ove : B(0, R) Y `e una funzione tale che
lim
h
X
0
|(h)|
Y
|h|
2
X
= 0.
Dimostrazione Sia h B(0, R). Fissato Y

, la funzione reale
g
h
(t) = (f(x
0
+th)), t [1, 1],
`e di classe C
2
: infatti per la proposizione 3.2.3 si ha
g

h
(t) = (f

(x
0
+th)h) t [1, 1],
g

h
(t) = ([f

(x
0
+th)h]h) t [1, 1],
ed inoltre g

h
e g

h
sono funzioni continue, essendo f di classe C
2
.
Dalla formula di Taylor per la funzione g
h
segue
(f(x
0
+h) f(x
0
)) = g
h
(1) g
h
(0) = g

h
(0) +
1
2
g

h
(
h
)
ove
h
`e un punto opportuno in ]0, 1[. Ne segue
(f(x
0
+h) f(x
0
)) = (f

(x
0
)h) +
1
2
([f

(x
0
+
h
h)h]h) =
= (f

(x
0
)h) +
1
2
([f

(x
0
)h]h) +((h)),
ove
(h) =
1
2
[(f

(x
0
+
h
h) f

(x
0
))h]h.
Dunque

_
f(x
0
+h) f(x
0
) f

(x
0
)h
1
2
[f

(x
0
)h]h
_

[((h))[ ||
Y
|(h)|
Y
.
Per larbitrariet`a di Y

, si ricava
_
_
_
_
f(x
0
+h) f(x
0
) f

(x
0
)h
1
2
[f

(x
0
)h]h
_
_
_
_
Y
|(h)|
Y
.
Poiche, per la continuit`a di f

,
lim
h
X
0
|(h)|
Y
|h|
2
X
= 0,
si ha la tesi.
119
Esempio 3.5.5 Sia H uno spazio di Hilbert (reale, per semplicit`a), e si
consideri la funzione
F(x) = |x|
4
|x|
2
, x H.
Poiche
F(x +h) F(x) = (|x +h|
2
|x|
2
)(|x +h|
2
+|x|
2
1) =
= (2(x, h) +|h|
2
)(|x +h|
2
+|x|
2
1),
si vede subito che la funzione F `e dierenziabile secondo Frech`et e F

(x) =
(4|x|
2
2)x, ossia
(F

(x), h) = (4|x|
2
2)(x, h) h H.
Analogamente,
F

(x +k) F

(x) = 4(|x +k|


2
|x|
2
)x + (4|x +k|
2
2)k,
da cui `e facile dedurre che anche F

`e dierenziabile secondo Frech`et in H e


(F

(x)k, h) = (4|x|
2
2)(k, h) + 8(x, k)(x, h) k, h H.
Esercizi 3.5
1. Siano X, Y spazi normati, sia un aperto di X e sia f : Y una
funzione di classe C
2
.
(i) Fissato x
0
, si provi che, posto
(h, k) = f(x
0
+h+k)f(x
0
+k)f(x
0
+h)+f(x
0
), h, k X,
se |h|
X
e |k|
X
sono sucientemente piccole si ha
|(h, k) [f

(x
0
)h]k|
Y
(|h|
X
+ 2|k|
X
)|k|
X
,
|(h, k) [f

(x
0
)k]h|
Y
(2|h|
X
+|k|
X
)|h|
X
.
(ii) Si provi che per |h|
X
e |k|
X
abbastanza piccole si ha anche
|[f

(x
0
)h]k [f

(x
0
)k]h|
Y
2(|h|
2
X
+|h|
X
|k|
X
+|k|
2
X
).
120
(iii) Si concluda che lapplicazione f

(x
0
) : L
2
(X, Y ) `e simme-
trica, ossia
[f

(x
0
)h]k = [f

(x
0
)k]h h, k X.
2. Siano X, Y, Z spazi normati. sia un aperto di X Y e sia f :
Z una funzione. Le derivate parziali f
x
(x
0
, y
0
) e f
y
(x
0
, y
0
) sono cos`
denite:
f
x
(x
0
, y
0
) = [f(, y
0
)]

(x
0
), f
y
(x
0
, y
0
) = [f(x
0
, )]

(y
0
).
(i) Si verichi che se f `e F-dierenziabile in (x
0
, y
0
) allora esistono
f
x
(x
0
, y
0
) e f
y
(x
0
, y
0
), e si ha
f
x
(x
0
, y
0
)h = [f

(x
0
, y
0
)](h, 0) h X,
f
y
(x
0
, y
0
)k = [f

(x
0
, y
0
)](0, k) k Y.
(ii) Si provi che se f `e di classe C
2
, allora
[f
xy
(x
0
, y
0
)h]k = [f

(x
0
, y
0
)(h, 0)](0, k) (h, k) X Y,
[f
yx
(x
0
, y
0
)k]h = [f

(x
0
, y
0
)(0, k)](h, 0) (h, k) X Y.
(iii) Si deduca che se f `e di classe C
2
le applicazioni bilineari f
xy
(x
0
, y
0
)
e f
yx
(x
0
, y
0
) coincidono, cio`e che
[f
xy
(x
0
, y
0
)](h, k) = [f
yx
(x
0
, y
0
)](k, h) (h, k) X Y.
3. Sia J : X R un funzionale di classe C
2
denito sullo spazio normato
X. Si scriva la derivata seconda del funzionale E(x) = e
J(x)
.
3.6 Massimi e minimi relativi
Analizziamo brevemente alcune condizioni necessarie o sucienti per lesi-
stenza di punti di massimo o di minimo relativo nel caso di funzionali deniti
su spazi normati. Come vedremo, si tratta di facili generalizzazioni delle
analoghe condizioni che valgono in R
N
.
Proposizione 3.6.1 Sia X uno spazio normato, sia un aperto di X e sia
f : R una funzione G-dierenziabile. Se x
0
`e un punto di massimo
o di minimo locale per f, allora f

G
(x
0
) = 0.
121
Dimostrazione Supponiamo ad esempio che x
0
sia punto di massimo locale;
allora esiste un intorno U di x
0
tale che
f(x) f(x
0
) x U.
Se v X allora si ha x
0
+tv U per [t[ < , con sucientemente piccolo;
quindi
f(x
0
+tv) f(x
0
)
t
_
0 se < t < 0,
0 se 0 < t < .
Per t 0 ne segue f

G
(x
0
)v = 0 per ogni v X, cio`e la tesi.
Questa condizione, benche soltanto necessaria per lesistenza del minimo, `e
la pi` u utile nelle applicazioni al calcolo delle variazioni che vedremo nel pros-
simo paragrafo.
Vediamo ora unaltra condizione legata al comportamento della derivata
seconda.
Proposizione 3.6.2 Sia X uno spazio normato, sia un aperto di X e sia
f : R una funzione di classe C
2
. Se x
0
`e punto di massimo relativo,
allora
[f

(x
0
)v]v 0 v X.
Se x
0
`e punto di minimo relativo, si ha invece
[f

(x
0
)v]v 0 v X.
Dimostrazione Supponiamo ad esempio che x
0
sia punto di massimo locale.
Sia > 0 tale che B(x
0
, ) . Fissato v X 0, dalla formula di
Taylor (proposizione 3.5.4), osservato che si ha f

(x
0
) = 0 per la proposizione
precedente, otteniamo
f(x
0
+tv) f(x
0
)
t
2
2
[f

(x
0
)v]v = (tv) t
_


|v|
X
,

|v|
X
_
,
dove la funzione (x)/|x|
2
X
`e innitesima per |x|
X
0. Dunque, se [t[ `e
sucientemente piccolo si deduce
0 f(x
0
+tv) f(x
0
) = t
2
_
1
2
[f

(x
0
)v]v +|v|
2
X
(tv)
|tv|
2
X
_
.
Dividendo per t
2
e facendo tendere t a 0 si ottiene la tesi.
Questa condizione necessaria, lievemente raorzata, diventa suciente.
122
Proposizione 3.6.3 Sia X uno spazio normato, sia un aperto di X e sia
f : R una funzione di classe C
2
. Se in un punto x
0
si ha f

(x
0
) = 0
e [f

(x
0
)v]v c|v|
2
X
per ogni v X, con c > 0, allora x
0
`e punto di
massimo relativo per f. Se invece si ha f

(x
0
) = 0 e [f

(x
0
)v]v c|v|
2
X
per
ogni v X, allora x
0
`e punto di minimo relativo per f.
Dimostrazione Supponiamo che f

(x
0
) = 0 e [f

(x
0
)v]v c|v|
2
X
per ogni
v X, con c > 0. Dalla formula di Taylor (proposizione 3.5.4) segue che
f(x
0
+v) f(x
0
) =
1
2
[f

(x
0
)v]v +(v)

c
2
|v|
2
X
_
1
2
c
(v)
|v|
2
X
_
v X 0.
Poiche (v)/|v|
2
X
`e innitesima per |v|
X
0, se `e sucientemente piccolo
si deduce che f(x
0
+v) f(x
0
) per |v|
X
< . Quindi x
0
`e punto di massimo
relativo.
Esempio 3.6.4 Riconsideriamo la funzione F dellesempio 3.5.5: risulta
F

(0) = 0, F

(0) = 2I,
dove I : H H `e lapplicazione identit`a. Per la proposizione 3.6.3, lorigine `e
punto di massimo relativo per F (come era facile prevedere, ponendo t = |x|
e studiando la funzione g(t) = t
4
t
2
).
Incontreremo esempi pi` u signicativi pi` u avanti nel corso, nellambito del
calcolo della variazioni. Va comunque osservato che la condizione suciente
fornita dalla proposizione 3.6.3 `e troppo restrittiva per le applicazioni.
Esercizi 3.6
1. Sia F :
2
R denito da
F(x) =

n=1
_
[x
n
[
2
n
[x
n
[
4
_
, x
2
.
Si provi che si ha F

(0) = 0 e (F

(0)u, u)

2 > 0 per ogni u


2
0, e
che tuttavia 0 non `e un punto di minimo relativo per F.
123
3.7 Funzioni implicite
Siano X, Y, Z spazi di Banach e sia F : X Y Z unapplicazione. Ci
poniamo il problema di sapere sotto quali ipotesi lequazione
F(x, y) = 0
denisce implicitamente il graco di una funzione y : X Y tale che
F(x, y(x)) = 0. La soluzione di questo problema si otterr`a, come vedre-
mo, sotto ipotesi del tutto analoghe a quelle classiche del teorema del Dini
in R
2
od in R
n+m
.
Teorema 3.7.1 (delle funzioni implicite) Siano X, Y, Z spazi di Bana-
ch, sia (x
0
, y
0
) X Y e sia V W un intorno di tale punto. Sia poi
F : V W Z una funzione dotata delle seguenti propriet`a:
(i) F `e continua in (x
0
, y
0
) e F(x
0
, y
0
) = 0;
(ii) per ogni x V esiste la derivata di Frech`et F
y
(x, y) della funzione
y F(x, y) in ogni punto y W, ed inoltre (x, y) F
y
(x, y) `e
continua in (x
0
, y
0
);
(iii) esiste linversa F
y
(x
0
, y
0
)
1
L(Z, Y ).
Allora esistono , > 0 tali che per ogni x B(x
0
, ) lequazione F(x, y) = 0
ha ununica soluzione y B(y
0
, ): in particolare, esiste : B(x
0
, )
B(y
0
, ) per cui risulta
x B(x
0
, ), y B(y
0
, ), F(x, y) = 0 y = (x).
Inoltre `e continua in x
0
; se poi F `e anche continua in V W, allora `e
continua in B(x
0
, ). Inne, se F C
1
(V W, Z) allora C
1
(B(x
0
, ), Y )
e si ha

(x) = F
y
(x, (x))
1
F
x
(x, (x)) x B(x
0
, ).
Osserviamo che, quando F `e dierenziabile secondo Frech`et, gli operatori
F
y
(x, y) e F
x
(x, y) sono le derivate parziali della funzione F, denite nelleser-
cizio 3.5.2, ed appartengono rispettivamente a L(Y, Z) e L(X, Z). Notiamo
anche che se F `e di classe C
1
lipotesi (iii) implica che gli operatori F
y
(x, y)
hanno inversa continua per ogni (x, y) in un opportuno intorno di (x
0
, y
0
)
124
(esercizi 3.7.1 e 3.7.2).
Dimostrazione Anzitutto, non `e restrittivo supporre che sia V = B(x
0
,
0
)
e W = B(y
0
,
0
). Per ogni x B(x
0
,
0
) consideriamo lapplicazione T
(x)
:
B(y
0
,
0
) Y denita da
T
(x)
(y) = y F
y
(x
0
, y
0
)
1
F(x, y).
Lequazione F(x, y) = 0 equivale a T
(x)
(y) = y; dunque occorre cercare un
punto sso di T
(x)
per ogni x sucientemente vicino a x
0
. Osserviamo che
T
(x)
`e F-dierenziabile in ogni punto y B(y
0
,
0
) e
T

(x)
(y) = I F
y
(x
0
, y
0
)
1
F
y
(x, y) = F
y
(x
0
, y
0
)
1
[F
y
(x
0
, y
0
) F
y
(x, y)];
quindi, per la continuit`a di F
y
in (x
0
, y
0
), ssato q ]0, 1[ esistono ]0,
0
]
ed ]0,
0
[ tali che
|x x
0
|
X
< , |y y
0
|
Y
= |T

(x)
(y)|
L(Y )
q.
Di conseguenza, per la proposizione 3.3.2 si ha per ogni y, y

B(y
0
, )
|T
(x)
(y)T
(x)
(y

)|
Y
sup
s[0,1]
|T

(x)
((1s)y+sy

)|
L(Y )
|yy

|
Y
q|yy

|
Y
.
Dunque T
(x)
`e una contrazione in B(y
0
, ). Inoltre, per la continuit`a di F in
(x
0
, y
0
), in corrispondenza di e q esiste ]0,
0
] tale che
|xx
0
|
X
< = |T
(x)
(y
0
)y
0
|
Y
= |F
y
(x
0
, y
0
)
1
F(x, y
0
)|
Y
<
1
2
(1q).
Sia allora = min, : per ogni x B(x
0
, ), lapplicazione T
(x)
manda
B(y
0
, ) in se, anzi in B(y
0
, ), poiche
|T
(x)
(y) y
0
|
Y
|T
(x)
(y) T
(x)
(y
0
)|
Y
+|T
(x)
(y
0
) y
0
|
Y

q|y y
0
|
Y
+
1
2
(1 q) <
< q +(1 q) = y B(y
0
, ).
Pertanto, per il teorema delle contrazioni, per ogni x B(x
0
, ) lapplicazione
T
(x)
ha un unico punto sso (x) B(y
0
, ). In particolare, T
(x
0
)
(y
0
) = y
0
e
125
quindi (x
0
) = y
0
. Inoltre, la funzione : B(x
0
, ) B(y
0
, ) `e continua in
x
0
perche
|(x) (x
0
)|
Y
= |T
(x)
((x)) y
0
|
Y

|T
(x)
((x)) T
(x)
(y
0
)|
Y
+|T
(x)
(y
0
) y
0
|
Y

q|(x) y
0
|
Y
+|F
y
(x
0
, y
0
)
1
F(x, y
0
)|
Y
,
da cui
(1q)|(x) (x
0
)|
Y
|F
y
(x
0
, y
0
)
1
F(x, y
0
)|
Y
0 per |xx
0
|
X
0.
Supponiamo ora che F sia continua in B(x
0
, ) B(y
0
,
0
). Allora, con un
calcolo analogo al precedente, per ogni x, x

B(x
0
, ) si ha
|(x) (x

)|
Y
= |T
(x)
((x)) T
(x

)
((x

))|
Y

|T
(x)
((x)) T
(x)
((x

))|
Y
+|T
(x)
((x

)) T
(x

)
((x

))|
Y

q|(x) (x

)|
Y
+|F
y
(x
0
, y
0
)
1
|
L(Z,Y )
|F(x, (x

)) F(x

, (x

))|
Z
(si noti che, peraltro, F(x

, (x

)) = 0); da qui, per |x x

|
X
0 si ottiene
(1 q)|(x) (x

)|
Y

|F
y
(x
0
, y
0
)
1
|
L(Z,Y )
|F(x, (x

)) F(x

, (x

))|
Z
0.
Supponiamo inne che F sia di classe C
1
. Allora F
x
(x, y) L(X, Z) e
F
y
(x, y) L(Y, Z) per ogni (x, y) B(x
0
, )B(y
0
,
0
), e possiamo supporre,
come osservato in precedenza, che in ogni punto (x, y) di tale intorno risulti
F
y
(x, y)
1
L(Z, Y ). Fissiamo x B(x
0
, ) e poniamo per comodit`a y =
(x). Osserviamo che F
x
(, y) `e limitata in unopportuna palla B(x, )
B(x
0
, ), in virt` u della relazione di continuit`a
|F
x
(x, y) F
x
(x, y|
L(X,Z)
1 per |x x|
X
< ;
dalla stima precedente e dalla proposizione 3.3.2 segue allora
|(x) (x)|
Y

C
1 q
sup
s[0,1]
|F
x
((1 s)x +sx, (x))|
L(X,Z)
|x x|
X

K|x x|
X
x B(x, ).
126
Per ipotesi, esiste F
y
(x, y)
1
L(Z, Y ); quindi, usando la F-dierenziabilit`a
di F in (x, y), si ha
_
_
_(x) (x) +
_
F
y
(x, y)
1
F
x
(x, y)
_
(x x)
_
_
_
Y
=
=
_
_
_F
y
(x, y)
1
_
F
y
(x, y)((x) (x)) +F
x
(x, y)(x x)
__
_
_
Y

|F
y
(x, y)
1
|
L(Z,Y )
_
|F(x, (x)) F(x, (x))|
Z
+
+|(x x, (x) (x))|
Z
_
.
Essendo
|(x x, (x) (x))|
Z
= o(|x x|
X
+|(x) (x)|
X
)
o((1 +K)|x x|
X
),
tale relazione ci dice che `e F-dierenziabile nel punto x, e che la sua
derivata `e F
y
(x, y)
1
F
x
(x, y); ma, per ipotesi e per lesercizio 3.7.2, questa
derivata `e continua rispetto alla variabile x, e ci`o prova la tesi.
Osservazione 3.7.2 La formula che fornisce la derivata della funzione im-
plicita dipende solo da F
x
, F
y
e stessa. Quindi, se si suppone che F sia
di classe C
m
in V W, m 1, si pu`o derivare tale formula, ottenendo cos`
che anche `e di classe C
m
, e ricavando una formula per la derivata
(m)
in
termini delle derivate di F no allordine m e di no allordine m1.
Esempio 3.7.3 Tra le numerose applicazioni del teorema delle funzioni im-
plicite, ne illustriamo una di fondamentale importanza nello studio delle
equazioni dierenziali in spazi di Banach: la regolarit`a delle soluzioni rispetto
ai dati iniziali. Consideriamo il problema di Cauchy
_
u

(t) = f(t, u(t)), t [t


0
, T],
u(t
0
) = u
0
ove u
0
X e f : [t
0
, T] X X, essendo X uno spazio di Banach. Suppo-
niamo che f sia continua, insieme con la sua derivata di Frech`et rispetto alla
seconda variabile, in [t
0
, T]X; assumiamo anche che tale derivata sia unifor-
memente continua nella seconda variabile. Per questo problema di cauchy si
ha esistenza ed unicit`a locale della soluzione, ossia esiste t
1
= t
1
(u
0
) ]t
0
, T],
dipendente dalla scelta di u
0
, ed esiste ununica funzione u C
1
([t
0
, t
1
], X)
127
per cui u(t
0
) = u
0
e lequazione `e vericata in ogni punto di [t
0
, t
1
]: questo
fatto si dimostra nello stesso modo con cui si prova il caso scalare, vale a dire
trasformando il problema nellequazione integrale equivalente
u(t) = u
0
+
_
t
t
0
f(s, u(s)) ds, t [t
0
, T],
e risolvendo questultima in [t
0
, t
1
] con il metodo delle approssimazioni suc-
cessive.
Deniamo la seguente funzione F:
[F(u
0
, u)](t) = u(t) u
0

_
t
t
0
f(s, u(s)) ds, t [t
0
, ],
ove `e un ssato punto di ]t
0
, T]. Questa funzione `e denita su X
C
1
([t
0
, ], X), a valori in C
1
([t
0
, ], X), ed `e continua, come `e facile veri-
care; essa `e anche di classe C
1
, in voirt` u delluniforme continuit`a di f
u
, ed in
particolare si ha
F
u
0
(u
0
, u)x = x x X,
[F
u
(u
0
, u)g](t) = g(t)
_
t
t
0
[f
u
(s, u(s))]g(s) ds, t [t
0
, ], g C
1
([t
0
, ], X).
Verichiamo che F
u
(u
0
, u) : C
1
([t
0
, ], X) C
1
([t
0
, ], X) `e invertibile. Fis-
sata g C
1
([t
0
, ], X), lequazione F
u
(u
0
, u)h = g (nellincognita h) equivale
allequazione integrale
h(t)
_
t
t
0
[f
u
(s, u(s))]h(s) ds = g(t), t [t
0
, ],
che a sua volta equivale al problema di Cauchy
_
h

(t) = f
u
(t, u(t))h(t) +g

(t), t [t
0
, ],
h(t
0
) = g(t
0
).
Questo problema `e lineare, a coecienti continui: con lo stesso metodo che
si usa nel caso scalare, si dimostra che esso ha soluzione unica globale, ossia
denita nello stesso intervallo in cui sono deniti i coecienti (nel nostro
caso, [t
0
, ]), e dipendente con continuit`a dai dati. Esiste dunque ununica
h C
1
([t
0
, ], X) tale che F
u
(u
0
, u)h = g, e la sua norma in C
1
([t
0
, ], X) `e
controllata dalla norma del secondo membro g nello stesso spazio. Questo
128
fatto ci dice che loperatore F
u
(u
0
, u) ha inverso continuo in C
1
([t
0
, ], X).
Sono dunque vericate per la funzione F tutte le ipotesi del teorema delle
funzioni implicite nellintorno di un arbitrario punto (u
0
, u) dello spazio X
C
1
([t
0
, ], X), nel quale risulti F(u
0
, u) = 0, ossia tale che u verichi, nell
intervallo [t
0
, ],
_
u

(t) = f(t, u(t)), t [t


0
, ],
u(t
0
) = u
0
Pertanto, scelto = t
1
(u
0
), per il teorema 3.7.1 esistono un intorno V di u
0
in X ed un intorno W di u in C
1
([t
0
, t
1
], X) tali che lequazione F(u
0
, u) = 0
ha soluzione unica in W per ogni x V , che dipende in modo C
1
da u
0
. In
altre parole, per ogni u
0
in V la soluzione u del problema di Cauchy
_
u

(t) = f(t, u(t)), t [t


0
, t
1
],
u(t
0
) = u
0
,
che `e appunto la funzione u = (u
0
) denita implicitamente dallequazione
F(u
0
, u) = 0, dipende in modo C
1
del dato iniziale u
0
.
Osservazione 3.7.4 In modo analogo si pu`o dimostrare che la soluzione del
problema di Cauchy dipendente da un parametro
_
u

(t) = f(t, u(t), ), t [t


0
, T], R ssato,
u(t
0
) = u
0
,
sotto le ipotesi precedenti e supponendo inoltre che la derivata f

sia conti-
nua, `e dierenziabile con continuit`a rispetto al parametro .
Esercizi 3.7
1. Siano X, Y spazi di Banach. Provare che linsieme
1 = A L(X, Y ) : A
1
L(Y, X)
`e aperto in L(X, Y ).
[Traccia: ssati A, B 1, si provi che A
1
= B
1
(I(AB)A
1
) e si
deduca che se la norma |AB|
L(X,Y )
`e sucientemente piccola, allora
A
1
(I (A B)A
1
)
1
=

n=0
A
1
[(A B)A
1
]
n
`e eettivamente
linverso di B.]
129
2. Siano X, Y, Z spazi di Banach e sia A(z) L(X, Y ) una famiglia di
operatori dipendenti da una variabile z Z. Se z A(z) `e di classe
C
1
in una palla B(z
0
, R) e se esiste A(z
0
)
1
L(Y, X), si provi che:
(i) esiste A(z)
1
in tutti i punti z di unopportuna palla B(z
0
, r)
B(z
0
, R);
(ii) che lapplicazione z A(z)
1
`e a sua volta di classe C
1
in B(z
0
, r),
e che la derivata di tale applicazione in un ssato punto z
B(z
0
, r) `e lelemento di L(Z, L(Y, X)) cos` denito:
(A()
1
)

(z)h = A(z
0
)
1
[A

(z)h]A(z
0
)
1
h Z.
3. Con riferimento allenunciato del teorema 3.7.1, sia : B(x
0
, )
B(y
0
, ) la funzione denita implicitamente dallequazione F(x, y) = 0.
Supponendo F di classe C
2
, si calcoli

(x) in termini delle derivate


prime e seconde di F, nonche di e

.
4. Con riferimento alla dimostrazione del teorema 3.7.1, si denisca per
ogni n N
_
y
0
(x) = y
0
y
n+1
(x) = T
(x)
(y
n
(x)), n N,
x B(x
0
, );
si provi che per ogni x B(x
0
, ) la successione y
n
(x)
nN
converge
in Y al punto sso dellapplicazione T
(x)
.
5. Si dimostri il risultato di esistenza ed unicit`a locale per il problema di
Cauchy
_
u

(t) = f(t, u(t)), t [t


0
, T],
u(t
0
) = u
0
in uno spazio di Banach X. Si provi anche che se il secondo membro `e
lineare o ane rispetto a u, la soluzione `e globale.
3.8 Variet`a tangente ad una curva di livello
DallAnalisi II sappiamo che se F `e una funzione reale di classe C
1
denita
su R
2
, e Z `e linsieme dei suoi zeri oppure una sua qualunque altra curva di
130
livello, allora in ogni punto P
0
= (x
0
, y
0
) Z nel quale il gradiente di F sia
non nullo esiste la retta r tangente a Z in P
0
. Lequazione di r `e
F
x
(x
0
, y
0
)(x x
0
) +F
y
(x
0
, y
0
)(y y
0
) = 0,
ovvero F(P
0
) (P P
0
) = 0; in altre parole, si ha P r se e solo se il
vettore P P
0
appartiene al nucleo dellapplicazione lineare v F(P
0
) v.
La retta r `e l unica fra quelle passanti per P
0
per la quale risulti
lim
PP
0
, PZ
d(P, r)
[P P
0
[
2
= 0.
Una situazione analoga si ha, sotto opportune ipotesi, nel caso di una funzione
F : X Y di classe C
1
, allorche X e Y sono spazi di Banach.
Teorema 3.8.1 (di Lyusternik) Siano X, Y spazi di Banach e sia F :
X Y una applicazione di classe C
1
. Sia Z
0
= x X : F(x) = 0,
e ssato x
0
Z
0
, supponiamo che il sottospazio T
0
= ker F

(x
0
) sia non
banale e deniamo la variet`a ane T
x
0
= x
0
+ T
0
. Se loperatore lineare
F

(x
0
) : X Y `e surgettivo, allora valgono le seguenti propriet`a:
(i) lim
xx
0
, xZ
0
d(x, T
x
0
)
|x x
0
|
X
= 0,
(ii) lim
vx
0
, vTx
0
d(v, Z
0
)
|v x
0
|
X
= 0.
Se, in particolare, il sottospazio chiuso T
0
`e complementabile in X, ossia
esiste un sottospazio chiuso S
0
X tale che X = T
0
S
0
, allora esiste un
intorno U di x
0
ed un omeomorsmo : T
x
0
U Z
0
U, di classe C
1
, tali
che
lim
vx
0
, vTx
0
|v (v)|
X
|v x
0
|
X
= 0, lim
xx
0
, xZ
0
|x
1
(x)|
X
|x x
0
|
X
= 0.
La variet`a ane T
x
0
`e dunque tangente alla curva di livello Z
0
nel punto
x
0
. Si osservi che se X `e uno spazio di Hilbert allora T
0
`e sempre comple-
mentabile: basta prendere S
0
= T

0
.
Osserviamo che il teorema di Lyusternik `e falso quando ker F

(x
0
) = 0.
Ad esempio, se Y = X, x
0
= 0 e F(x) = x per ogni x X, si ha
T
0
= ker F

(x
0
) = ker I = 0 e Z
0
= 0: in questo caso ne (i), ne (ii)
131
hanno senso.
Dimostrazione Ci limitiamo per semplicit`a a provare la tesi nel caso com-
plementabile (per il caso generale si vedano gli esercizi 3.8.1 e 3.8.2).
Sia dunque T
0
,= 0 e X = T
0
S
0
. Osserviamo che se x = h+g con h T
0
e g S
0
, la norma |x|
X
`e equivalente alla norma |h|
X
+|g|
X
: infatti lap-
plicazione (h, g) h + g `e lineare, continua e bigettiva da T
0
S
0
su X, e
dunque per il teorema dellapplicazione aperta essa `e un isomorsmo.
Per ogni x X scriviamo x x
0
= h + g, con h T
0
e g S
0
. Allora
lequazione F(x) = 0 equivale a
(h, g)
def
= F(x
0
+h +g) = 0,
ed `e soddisfatta per (h, g) = (0, 0). Vogliamo applicare a questa equazione
il teorema delle funzioni implicite (teorema 3.7.1). Osserviamo che `e di
classe C
1
, che

g
(0, 0) = F

(x
0
)[
S
0
e che tale applicazione `e bigettiva: infatti
se g S
0
e F

(x
0
)g = 0, allora g S
0
T
0
= 0. Daltra parte, ssato
y Y , possiamo scegliere, in virt` u dellipotesi di surgettivit`a, un elemento
v X tale che F

(x
0
)v = y: scrivendo v = h + g, con h T
0
e g S
0
,
otteniamo perci`o y = F

(x
0
)(h + g) = F

(x
0
)g = F

(x
0
)[
S
0
g. In denitiva,
F

(x
0
)[
S
0
`e un isomorsmo fra S
0
e Y .
Per il teorema delle funzioni implicite, esistono un intorno V di 0 in T
0
, un
intorno W di 0 in S
0
ed unapplicazione : V W di classe C
1
, tali che
(0) = 0 e
(h, g) = 0, (h, g) V W g = (h).
Inoltre si ha

(h) =
g
(h, (h))
1

h
(h, (h)) per ogni h V ; in partico-
lare

(0) =
g
(0, 0)
1
F

(x
0
)[
T
0
= 0.
Siano U = x
0
+ V + W e = x
0
+ V : U `e un intorno di x
0
in X, mentre
`e intorno di x
0
in T
x
0
. Consideriamo lapplicazione : X denita da
(v) = v +(v x
0
), v .
Posto x = (v), risulta x UZ
0
: infatti, detto h = vx
0
si ha h V , da cui
(h) W, x = v+(vx
0
) = x
0
+h+(h) U e F(x) = (h, (h)) = 0. In
denitiva manda in U Z
0
ed `e continua, come composizione di funzioni
continue. Si ha anche, in particolare, (x
0
) = x
0
+(0) = x
0
.
132
Verichiamo che `e bigettiva. Se (v) = (v

), allora posto h = v x
0
e h

= v

x
0
abbiamo x
0
+ h + (h) = x
0
+ h

+ (h

), da cui h h

=
(h

) (h) T
0
S
0
= 0; ne segue h = h

e dunque v = v

. Se poi
x U Z
0
, si ha x = x
0
+h +g, con h V e g W, e F(x) = (h, g) = 0:
quindi g = (h), e detto v = x
0
+h otteniamo x = v +(v x
0
) = (v).
Quindi, esiste
1
; proviamo che
1
`e continua. Se x = x
0
+ h + g e
x

= x
0
+h

+g

sono punti di UZ
0
, allora
1
(x) = hx
0
e
1
(x

) = h

x
0
,
da cui
|
1
(x)
1
(x

)|
X
= |h h

|
X
|h h

|
X
+|g g

|
X
c|x x

|
X
.
Inne, per v e v x
0
si ha
|(v) v|
X
= |(v x
0
)|
X
=
= |(v x
0
) (0)

(0)(v x
0
)|
X
= o(|v x
0
|
X
),
mentre per x U Z
0
e x x
0
, posto v =
1
(x), si ha anche v x
0
ed
inoltre
|
1
(x) x|
X
|x x
0
|
X
=
|v (v)|
X
|x x
0
|
X
=
=
|v (v)|
X
|v x
0
|
X

|
1
(x)
1
(x
0
)|
X
|x x
0
|
X
c
o(|v x
0
|
X
)
|v x
0
|
X
.
Ci` o prova lultima parte dellenunciato.
Esempio 3.8.2 Siano X = L
2
(a, b), Y = R e F(g) = |g|
2
2
per ogni g X.
Fissata g X con |g|
2
2
= > 0, determiniamo la variet`a tangente alla curva
di livello Z = f X : F(f) = . La derivata di Frech`et F

(g) `e
F

(g)h = 2(g, h)
2
h X,
e tale applicazione `e ovviamente surgettiva da X su R. Si ha
ker F

(g) = [g]

e dunque, per il teorema di Lyusternik,


T
g
= g + ker F

(g) = g + [g]

,
il che era prevedibile data la simmetria circolare della curva di livello Z.
133
Esercizi 3.8
1. Si dimostri lenunciato (i) del teorema 3.8.1 nel caso generale.
[Traccia: si introduca in X la relazione di equivalenza h
1
h
2

h
1
h
2
T
0
, e si osservi che F

(x
0
) induce un operatore A : X/T
0
Y ,
denito da A[h] = F

(x
0
)k per ogni k [h], il quale `e bigettivo e
continuo: dunque A
1
L(Y, X/T
0
). Ci`o premesso, sia > 0 e sia
> 0 tale che per |x x
0
|
X
< risulti
|F(x) F(x
0
) F

(x
0
)(x x
0
)|
X


2|A
1
|
L(Y,X/T
0
)
|x x
0
|
X
;
se ne deduca, per x = x
0
+d Z
0
,
|d|
X
= |[d]|
X/T
0


2
|d|
X
,
da cui
|d|
X
, g [d] B(0, 2|[d]|
X/T
0
) = |g|
X
|d|
X
.
Da qui si ricavi la tesi.]
2. Si dimostri lenunciato (ii) del teorema 3.8.1 nel caso generale.
[Traccia: posto c = |A
1
|
L(Y,X/T
0
)
, si ssi

0,
1
4c

, e si determini
> 0 tale che si abbia |F

(x) F

(x
0
)|
L(X,Y )
per |x x
0
|
X
,
e che inoltre per |k|
X
, |h|
X
risulti
|F(x
0
+k) F(x
0
+h) F

(x
0
)(k h)|
X
|k h|
X
.
Ci`o premesso, ssato v = x
0
+ h T
x
0
, si ponga g
0
= 0, [h
1
] =
A
1
F(x
0
+h), e si scelga g
1
[h
1
] con |g
1
|
X
2|[h
1
]|
X/T
0
; poi, noti
[h
i
] e g
i
per i = 1, . . . , n, si ponga [h
n+1
] = [h
n
] A
1
F(x
0
+h+g
n
) e si
scelga g
n+1
[h
n+1
] con |g
n+1
g
n
|
X
2|[h
n+1
] [h
n
]|
X/T
0
. Si mostri
che esiste

0,

2

tale che |g
1
|
X
min,
1
2
|h|
X
; poi si dimostrino
per induzione le seguenti disuguaglianze:
|g
n
|
X

n1

k=0
2
k
|g
1
|
X
,
|[h
n+1
] [h
n
]|
X/T
0
2
n1
|g
1
|
X
, |g
n+1
g
n
|
X
2
n
|g
1
|
X
.
Si concluda che esistono g X e [d] X/T
0
tali che |g
n
g|
X
0 e
|[h
n
] [d]|
X/T
0
0. Si deduca inne che x = x
0
+ h + g Z
0
e che
|v x|
X
= |g|
X
2|h|
X
= 2|v x
0
|
X
.]
134
3.9 Massimi e minimi vincolati
Siano X, Y spazi di Banach e siano F : X R, : X Y funzioni
assegnate. Ci poniamo il problema di trovare il minimo o il massimo di F sul
vincolo costituito dallinsieme Z = x X : (x) = 0. Otterremo risultati
analoghi al caso dei vincoli in R
N
. Il risultato che segue `e una versione
generalizzata del metodo dei moltiplicatori di Lagrange.
Teorema 3.9.1 Siano X, Y spazi di Banach reali e siano F : X R,
: X Y funzioni di classe C
1
. Sia Z = x X : (x) = 0, ssiamo
x
0
Z e supponiamo che lapplicazione lineare

(x
0
) abbia immagine chiusa
in Y . Se x
0
`e punto di massimo relativo, o di minimo relativo, per F[
Z
, allora
esistono
0
R e Y

, non entrambi nulli, tali che

0
F

(x
0
) +

(x
0
)

= 0.
Si osservi che luguaglianza sopra scritta `e fra elementi di X

; in particolare,

(x
0
)

`e loperatore aggiunto di

(x
0
), denito da

(x
0
)

(x
0
) Y

.
Nelle applicazioni ha interesse soprattutto il caso in cui
0
,= 0, che si rea-
lizza, come vedremo dalla dimostrazione, quando

(x
0
) `e unapplicazione
surgettiva.
Nel caso particolare in cui X = R
N
e Y = R
k
(N > k), il funzionale (R
k
)

`e della forma x x, con R


k
; la derivata F

(x
0
) (R
N
)

si esprime
come x gradF(x
0
) x, e la derivata

(x
0
) L(R
N
, R
k
) `e la matrice Ja-
cobiana (k N) di nel punto x
0
. Quindi la tesi del teorema si riduce al
fatto che esistono
0
,
1
, . . . ,
k
R tali che

0
F
x
j
(x
0
) +
k

i=1

i
x
j
(x
0
) = 0, j = 1, . . . , N.
Se la matrice Jacobiana di in x
0
ha rango massimo, allora Z `e una variet`a,
e in particolare

(x
0
) `e surgettiva. In questo caso, come si `e detto, possiamo
scegliere
0
,= 0: si ritrova cos` lusuale regola dei moltiplicatori di Lagrange.
Dimostrazione Sia K limmagine di

(x
0
): per ipotesi, K `e un sottospazio
chiuso di Y . Distinguiamo i due casi K ,= Y e K = Y .
135
Se K ,= Y , per il teorema di Hahn-Banach esiste Y

0 tale che
[
K
= 0. Ne segue
[

(x
0
)

](x) = (

(x
0
)x) = 0 x X,
e quindi si ha la tesi del teorema scegliendo
0
= 0.
Supponiamo invece K = Y : osserviamo che se ker

(x
0
) = 0 allora

(x
0
)
`e un isomorsmo fra X e Y , quindi

(x
0
)

`e un isomorsmo fra Y

e X

:
pertanto scelto = [

(x
0
)

]
1
F

(x
0
) si ha subito F

(x
0
) +

(x
0
)

= 0
e la tesi `e provata con
0
= 1. Altrimenti sar`a ker

(x
0
) ,= 0: in
tal caso applichiamo a il teorema di Lyusternik (teorema 3.8.1). Posto
T
x
0
= x
0
+ ker

(x
0
), per la condizione (ii) si ha
lim
vx
0
, vTx
0
d(v, Z)
|v x
0
|
X
= 0.
Scegliamo v = x
0
+th, ove t R 0 e h `e un ssato elemento di ker

(x
0
)
con norma unitaria; allora
lim
t0
d(x
0
+th, Z)
[t[
= 0.
Per ogni ssato t ,= 0 esiste x
t
Z tale che, posto r(t) = x
0
+thx
t
, risulta
|x
0
+th x
t
|
X
d(x
0
+th, Z) +t
2
; quindi si ha anche
lim
t0
|r(t)|
X
[t[
= 0.
Di conseguenza r(0) = 0 e r

(0) = 0. Sia ora


f(t) = F(x
t
) = F(x
0
+th r(t)), t R :
per lipotesi fatta su F la funzione f : R R ha un punto di massimo o di
minimo relativo in t = 0, e pertanto 0 = f

(0) = F

(x
0
)(hr

(0)) = F

(x
0
)h.
Se ne deduce, per linearit`a,
F

(x
0
)h = 0 h ker

(x
0
).
A questo punto ci serve un lemma di analisi funzionale.
Lemma 3.9.2 Siano X, Y spazi di Banach e sia A L(X, Y ) surgettivo.
Allora
R(A

) = X

: x = 0 x ker A.
136
Prima di dimostrare il lemma, concludiamo la dimostrazione del teorema
3.9.1: poiche F

(x
0
) ha valore nullo in ogni punto di ker

(x
0
), il lemma ci
garantisce che F

(x
0
) R(

(x
0
)

), e quindi esiste Y

tale che F

(x
0
) =

(x
0
)

. Ne segue la tesi del teorema scegliendo


0
= 1.
Dimostrazione del lemma 3.9.2 Sia R(A

): allora = A

, con
Y

, da cui x = (Ax) = (0) = 0 per ogni x ker A.


Viceversa, sia X

tale che x = 0 per ogni x ker A; cerchiamo Y

tale che = A

. Per ipotesi, ker ker A; ssato y Y , e scelti x, x

X
tali che Ax = Ax

= y (tali punti esistono perche A `e surgettivo), avremo


x x

ker A e dunque x = x

. In altri termini, `e costante sullinsieme


A
1
(y).
`
E lecito allora denire : Y R nel modo seguente:
(y) = x x A
1
(y),
ed ovviamente `e un funzionale lineare. Proviamo che `e continuo: se G `e
un aperto di R, si ha

1
(G) = y Y : y G = Ax : x X, x G =
= Ax X : x G = A
1
(G).
Poiche `e continua,
1
(G) `e un aperto di X, mentre A
1
(G) `e aperto in Y
in quanto A `e unapplicazione aperta (essendo lineare, continua e surgettiva).
Ne segue che
1
(G) `e aperto in Y e pertanto `e continuo, ossia Y

.
Per denizione, si ha x = (Ax) = A

(x) per ogni x X, cio`e = A

.
Osservazione 3.9.3 La condizione necessaria per lesistenza di un massimo
o di un minimo vincolato espressa dal teorema 3.9.1 (nel caso
0
= 1) dice
che `e nullo il dierenziale di Frech`et in X Y

della funzione
H(x, ) = F(x) +((x)).
Infatti si verica senza dicolt`a che
H

(x, )(h, ) = F

(x)h +(

(x)h) +((x)) =
= [F

(x) +

(x)

]h +((x)),
quindi tale dierenziale `e nullo se e solo se
_
[F

(x) +

(x)

]h = 0 h X
((x)) = 0 Y

,
137
ossia se e solo se
_
F

(x) +

(x)

= 0
(x) = 0.
Esempio 3.9.4 Sia H uno spazio di Hilbert. Vogliamo determinare i punti
di massimo e di minimo della funzione F(x) = (x, y) sullinsieme
K = x H : |x| = 1, (x, z) = 0,
ove y, z sono ssati elementi di H.
Posto X = H, Y = R
2
e
: H R
2
, (x) =
_
|x|
2
1, (x, z)
_
x H,
il nostro problema `e quello di trovare il massimo ed il minimo di F sul
vincolo K = x H : (x) = 0. Naturalmente si pu`o supporre che z ed y
siano linearmente indipendenti (cosicche in particolare z ,= 0), poiche in caso
contrario avremmo F[
K
= 0 e quindi ci sarebbe ben poco da dire.
Questo problema si risolve facilmente con considerazioni geometriche, ma
vogliamo mostrare come la sua risoluzione sia possibile tramite il teorema
3.9.1. Per applicare tale teorema occorre vericare che limmagine di

(x) `e
chiusa in R
2
; in eetti non `e dicile vericare che ci`o `e vero, ed anzi, poiche
z ,= 0, lapplicazione

(x) `e surgettiva per ogni x K in virt` u dellesercizio


3.9.3.
Sia allora x un punto di massimo relativo o di minimo relativo per F[
K
: per il
teorema 3.9.1 esistono R e (R
2
)

= R
2
tali che F

(x)+

(x)

= 0,
e dalla dimostrazione del teorema 3.9.1 segue che si pu`o scegliere = 1; in
altre parole, posto = (, ), si ha
(y, v) + 2(x, v) +(z, v) = 0 v H,
il che implica (scrivendo in luogo di 2)
y = x +z.
Dai due vincoli |x|
2
= 1 e (x, z) = 0 segue subito, essendo z ,= 0, che
= (y, x), =
(y, z)
|z|
2
,
138
e di conseguenza, con facili calcoli,
x =
y
(y,z)
z
2
z
_
_
_y
(y,z)
z
2
z
_
_
_
.
`
E anche facile vericare che, come era prevedibile, i punti trovati sono addi-
rittura punti di minimo e di massimo assoluti per F sullinsieme K.
Esercizi 3.9
1. Sia H uno spazio di Hilbert reale e sia A L(H). Posto f(x) =
(Ax, x)
H
, si provi che se x
0
`e punto di massimo o di minimo relativo
per la restrizione di f allinsieme B = x H : |x|
H
= 1, allora
esiste R tale che Ax
0
+A

x
0
= 2x
0
.
2. Nelle stesse ipotesi dellesercizio precedente, supponiamo anche che A
sia autoaggiunto. Si provi che se x
0
`e punto di massimo assoluto per f
su B, allora Ax
0
= |A|
L(H)
x
0
, cosicche max
B
f = |A|
L(H)
.
3. Sia H uno spazio di Hilbert e siano y, z H. Si provi che lapplicazione
: H R
2
, denita da (v) = ((v, y), (v, z)), ha immagine chiusa; si
provi che essa coincide con R
2
se e solo se i vettori y, z sono linearmente
indipendenti.
139
Capitolo 4
Calcolo delle variazioni
4.1 Funzionali del calcolo delle variazioni
In questo capitolo ci limiteremo ad alcuni cenni su una problematica che `e
vastissima ed alla quale sono dedicati interi scaali di biblioteche ed innu-
merevoli articoli di ricerca. Il problema principale del calcolo delle variazioni
`e la minimizzazione di funzionali dipendenti da variabili che si muovono in
spazi di funzioni; la scelta degli spazi in cui cercare la soluzione di un pro-
blema di minimo `e in genere parte integrante del problema stesso.
Limitandoci al caso di funzioni di una sola variabile, considereremo soprat-
tutto il seguente problema tipico: si vuole minimizzare un funzionale della
forma
J(y) =
_
b
a
F(x, y(x), y

(x))dx
nella classe delle y C
1
[a, b] soggette (eventualmente) a certe condizioni
negli estremi a, b. Dunque la classe X delle funzioni ammissibili `e un sot-
tospazio (lineare od ane) di C
1
[a, b]. Supporremo, come ipotesi minima,
che lintegrando F sia di classe C
1
nei suoi argomenti (x, y, p) [a, b] R
2
.
Senza grosse complicazioni, incontreremo anche funzionali che dipendono da
funzioni a valori in R
m
: in tal caso la F sar`a di classe C
1
in [a, b] R
2m
.
Verichiamo anzitutto che nelle ipotesi fatte, il funzionale J `e dierenziabile.
Proposizione 4.1.1 Sia J(y) =
_
b
a
F(x, y(x), y

(x))dx per y C
1
[a, b]. Se
F C
1
([a, b] R
2
), allora il funzionale J `e F-dierenziabile in C
1
[a, b], e
140
per ogni v C
1
[a, b] si ha
J

(y)v =
_
b
a
_
F
y
(x, y(x), y

(x)) v(x) +F
p
(x, y(x), y

(x)) v

(x)
_
dx.
Dimostrazione Sia y C
1
[a, b]. Per ogni v C
1
[a, b] possiamo scrivere
J(y +v) J(y) =
=
_
b
a
_
F(x, y(x) +v(x), y

(x) +v

(x)) F(x, y(x), y

(x))
_
dx =
=
_
b
a
_
1
0
d
dt
F(x, y(x) +tv(x), y

(x) +tv

(x)) dtdx =
=
_
b
a
_
1
0
_
F
y
(x, y(x) +tv(x), y

(x) +tv

(x)) v(x) +
+F
p
(x, y(x) +tv(x), y

(x) +tv

(x)) v

(x)
_
dtdx;
applicando il teorema della media, per ogni x [a, b] esiste un opportuno

x
]0, 1[ tale che lultimo membro si pu`o riscrivere come
_
b
a
_
F
y
(x, y(x) +
x
v(x), y

(x) +
x
v

(x)) v(x)+
+F
p
(x, y(x) +
x
v(x), y

(x) +
x
v

(x)) v

(x)
_
dx.
Pertanto possiamo decomporre lincremento J(y +v) J(y) nella forma
J(y +v) J(y) =
=
_
b
a
_
F
y
(x, y(x), y

(x)) v(x) +F
p
(x, y(x), y

(x)) v

(x)
_
dx +
+
_
b
a
_
[F
y
(x, y(x) +
x
v(x), y

(x) +
x
v

(x)) F
y
(x, y(x), y

(x))] v(x) +
+[F
p
(x, y(x) +
x
v(x), y

(x) +
x
v

(x)) F
p
(x, y(x), y

(x))] v

(x)
_
dx.
Verichiamo che il secondo integrale `e innitesimo per |v|
C
1
[a,b]
0. Le de-
rivate di F sono per ipotesi continue; ssato M > 0 tale che M > 2|y|
C
1
[a,b]
,
esse sono uniformemente continue nel compatto [a, b] [M, M] [M, M].
141
Pertanto, dato > 0, esiste ]0, M/2[ per cui, se |v|
C
1
[a,b]
< , allora

_
b
a
_
[F
y
(x, y(x) +
x
v(x), y

(x) +
x
v

(x)) F
y
(x, y(x), y

(x))] v(x)+
+[F
p
(x, y(x) +
x
v(x), y

(x) +
x
v

(x)) F
p
(x, y(x), y

(x))] v

(x)
_
dx



_
b
a
[[v(x)[ +[v

(x)[]dx (b a)|v|
C
1
[a,b]
.
Ci` o prova la tesi.
Osservazioni 4.1.2 (1) Nel caso in cui F C
1
([a, b] R
2m
), la derivata di
Frech`et di J assume esattamente la stessa forma, con lunica dierenza che
nellintegrale i prodotti F
y
v +F
p
v

sono prodotti scalari in R


m
.
(2) Se F C
2
([a, b] R
2
), con procedimento analogo si pu`o dimostrare che
il funzionale J `e dierenziabile due volte e che
[J

(y)v]w =
_
b
a
_
F
yy
(x, y(x), y

(x))v(x)w(x) +
+ F
yp
(x, y(x), y

(x))[v(x)w

(x) +w(x)v

(x)] +
+ F
pp
(x, y(x), y

(x))v

(x)w

(x)
_
dx.
Un analogo risultato vale nel caso in cui F C
2
([a, b]R
2m
) (esercizio 4.1.1).
Esercizi 4.1
1. Dimostrare che se F C
2
([a, b] R
2m
) allora il funzionale
J(y) =
_
b
a
F(x, y(x), y

(x))dx, y C
1
([a, b], R
m
)
`e dierenziabile due volte e che
[J

(y)v]w =
_
b
a
_
F
yy
(x, y(x), y

(x))v(x) w(x) +
+ F
yp
(x, y(x), y

(x))v(x) w

(x) +
+ F
yp
(x, y(x), y

(x))w(x) v

(x) +
+ F
pp
(x, y(x), y

(x))v

(x) w

(x)
_
dx.
142
2. Fissata una curva regolare
0
C
1
[a, b], R
N
), si provi che il funzionale
lunghezza darco J() =
_
b
a
[

(t)[
N
dt `e F-dierenziabile due volte
nello spazio C
1
([a, b], R
N
) per =
0
, mentre `e semicontinuo inferior-
mente, ma non continuo, in C
1
[a, b], R
N
) rispetto alla topologia indotta
dalla norma uniforme.
4.2 Lemmi fondamentali del calcolo delle va-
riazioni
Per trovare i punti di minimo del funzionale J introdotto nel paragrafo pre-
cedente, cercheremo anzitutto di utilizzare la condizione necessaria espressa
dalla proposizione 3.6.1. A questo scopo, `e chiaro che le migliori informazioni
per la determinazione dei punti di minimo si hanno quando si `e in grado di
dedurre condizioni necessarie legate allintegrando F. Per procurarci que-
ste informazioni sono utilissimi i seguenti lemmi, globalmente denominati
lemmi fondamentali del calcolo delle variazioni.
Lemma 4.2.1 Sia C([a, b], R
N
) tale che
_
b
a
(x) (x) dx = 0 C
1
0
([a, b], R
N
);
allora = 0 in [a, b].
Ricordiamo che C
1
0
([a, b], R
N
) = C
1
([a, b], R
N
) : (a) = (b) = 0.
Dimostrazione Basta provare, in virt` u della continuit`a di , che (x) = 0
per ogni x ]a, b[. Se in un punto x
0
]a, b[ fosse (x
0
) ,= 0, allora esiste una
componente i 1, . . . , N tale che
i
(x
0
) ,= 0 (e possiamo supporre che sia

i
(x
0
) > 0). Quindi, sempre per continuit`a, esiste [x
1
, x
2
] [a, b] tale che

i
(x) > 0 per ogni x [x
1
, x
2
].
Scegliamo una funzione C
1
0
([a, b], R
N
) nel modo seguente: la componente
i-esima di `e

i
(x) =
_
(x x
1
)
2
(x
2
x)
2
se x [x
1
, x
2
],
0 se x [a, b] [x
1
, x
2
],
143
mentre se j ,= i, poniamo
j
(x) = 0 per ogni x [a, b].
`
E chiaro che
C
1
0
[a, b]. Allora dallipotesi segue
0 =
_
b
a
(x) (x) dx =
_
x
2
x
1

i
(x)(x x
1
)
2
(x
2
x)
2
dx > 0,
il che `e assurdo. Dunque `e nulla su [a, b].
Lemma 4.2.2 Sia C([a, b], R
N
) tale che
_
b
a
(x)

(x) dx = 0 C
1
0
([a, b], R
N
);
allora `e costante in [a, b].
Dimostrazione Deniamo
c =
1
b a
_
b
a
() d, (x) =
_
x
a
[() c] d, x [a, b];
allora C
1
0
([a, b], R
N
) per la scelta di c. Poiche

(x) = (x) c, si ha
dallipotesi
_
b
a
[(x) c[
2
N
dx =
_
b
a
((x) c)

(x) dx = 0 c [(b) (a)] = 0,


da cui la tesi.
Lemma 4.2.3 Siano , C([a, b], R
N
) tali che
_
b
a
[(x) (x) +(x)

(x)] dx = 0 C
1
0
([a, b], R
N
);
allora C
1
([a, b], R
N
) e

= in [a, b].
Dimostrazione Poniamo A(x) =
_
x
a
() d, x [a, b]; allora per ogni
C
1
0
([a, b], R
N
) si ha, usando lipotesi ed integrando per parti,
0 =
_
b
a
[(x) (x) +(x)

(x)] dx =
_
b
a
[A(x) +(x)]

(x) dx,
e dal lemma 4.2.2 segue che A+ `e costante in [a, b]. Dunque, = A+c
C
1
([a, b], R
N
) e

= A

= in [a, b].
Deniamo lo spazio
C
2
0
([a, b], R
N
) = C
2
([a, b], R
N
) : (a) = (b) =

(a) =

(b) = 0.
I due lemmi che seguono costituiscono la generalizzazione dei due precedenti.
144
Lemma 4.2.4 Sia C([a, b], R
N
) tale che
_
b
a
(x)

(x) dx = 0 C
2
0
([a, b], R
N
);
allora `e un polinomio di grado non superiore a 1 in [a, b].
Dimostrazione Poniamo
(x) =
_
x
a
(x )[() c d( a)]d, x [a, b],
e cerchiamo c, d R
N
tali che C
2
0
([a, b], R
N
). Con facili calcoli si trova
che occorre scegliere
c =
2
(b a)
2
__
b
a
() d
3
b a
_
b
a
(b )() d
_
,
d =
6
(b a)
2
__
b
a
() d
2
b a
_
b
a
(b )() d
_
.
Con questa scelta si ottiene
_
b
a
[(x) c d(x a)[
2
N
dx =
=
_
b
a
((x) c d(x a))

(x) dx =
= 0 c [

(b)

(a)] d(b a)

(b) +d [(b) (a)] = 0,


cio`e la tesi.
Lemma 4.2.5 Siano , , C([a, b], R
N
) tali che risulti, per ogni
C
2
0
([a, b], R
N
),
_
b
a
[(x) (x) +(x)

(x) +(x)

(x)] dx = 0;
allora C
1
([a, b], R
N
),

C
1
([a, b], R
N
) e (

= in [a, b].
145
Dimostrazione Deniamo
A(x) =
_
x
a
(x )() d, B(x) =
_
x
a
() d, x [a, b].
Dallipotesi, integrando per parti, segue
0 =
_
b
a
[(x) (x) +(x)

(x) +(x)

(x)] dx =
=
_
b
a
(A(x) B(x) +(x))

(x) dx C
2
0
([a, b], R
N
).
Per il lemma 4.2.4, si ha (x)+A(x)B(x) = c+d(xa) per ogni x [a, b];
quindi, per dierenza, C
1
([a, b], R
N
) e

= d A

+ in [a, b]. Da qui


ricaviamo

= dA

C
1
([a, b], R
N
) e (

= in [a, b]. Ne segue


la tesi.
Esercizi 4.2
1. Si enunci e si dimostri la generalizzazione del lemma 4.2.4 al caso
dellequazione
_
b
a
(x)
(n)
(x) dx = 0 C
n
0
([a, b], R
N
),
ove
C
n
0
([a, b], R
N
) = C
n
([a, b], R
N
) :

(k)
(a) =
(k)
(b) = 0 per k = 0, 1, . . . , n 1.
2. Si enunci e si dimostri la generalizzazione del lemma 4.2.5 al caso
dellequazione
_
b
a
n

k=0

k
(x)
(k)
(x) dx = 0 C
n
0
([a, b], R
N
).
3. Si dimostri il lemma 4.2.1 supponendo L
1
(a, b), anziche
C([a, b], R
N
).
[Traccia: ssato > 0, si ssi g C
0
[a, b] tale che |g|
1
< e se ne
146
deduca che

_
b
a
gdt

< ||

per ogni C
0
[a, b]). Per stimare |g|
1
,
si denisca K
1
= t [a, b] : g(t) , K
2
= t [a, b] : g(t) e
K = K
1
K
2
. Si scelga una funzione C
0
[a, b] tale che [[ 1, = 1
su K
1
e = 1 su K
2
: osservato che in [a, b] K si ha [g[ [g[ < ,
si provi che |g|
1
+ (b a), e si concluda che ||
1
< (2 +b a)
per ogni > 0.]
4. Si dimostri il lemma 4.2.1 supponendo L
1
(a, b; R
N
), anziche
C([a, b], R
N
).
[Traccia: si utilizzi lesercizio precedente.]
5. Si dimostrino i lemmi 4.2.2, 4.2.3, 4.2.4 e 4.2.5 supponendo le funzioni
, , in L
1
(a, b; R
N
) anziche in C([a, b], R
N
).
6. Sia X uno spazio di Banach e siano u, v L
p
(a, b; X), 1 < p < . Se
risulta
_
b
a
[u(t)(t) +v(t)

(t)] dt = 0 C

0
(]a, b[, R),
si provi che v `e derivabile q.o. e che v

(t) = u(t) q.o. in [a, b].


[Traccia: si ssi X

e si osservi che
_
b
a
[u(t)(t)+v(t)

(t)] dt =
0 per ogni C

0
(]a, b[, R); se ne deduca che (
_
b
s
u(t)dt + v(s)
v(b)) = 0 per ogni s [a, b]. Fissato s e scelto opportunamente , si
mostri che v(s) +
_
b
s
u(t)dt = v(b) e si ricavi la tesi.]
4.3 Equazione di Eulero
Veniamo al risultato principale del calcolo delle variazioni: i punti di mini-
mo o di massimo relativo del funzionale J sono soluzioni di una equazione
dierenziale che `e legata soltanto allintegrando F.
Teorema 4.3.1 Sia F C
1
([a, b] R
2
) e sia J il funzionale denito da
J(y) =
_
b
a
F(x, y(x), y

(x))dx
nella classe X = y C
1
[a, b] : y(a) = A, y(b) = B. Se y
0
`e un punto
di minimo relativo, o di massimo relativo, per J in X, allora y
0
`e soluzione
147
dellequazione dierenziale
d
dx
F
p
(x, y(x), y

(x)) = F
y
(x, y(x), y

(x)) in [a, b],


che `e detta equazione di Eulero del funzionale J.
Dimostrazione Supponiamo che y
0
sia punto di minimo locale. Possiamo
scrivere, in virt` u della proposizione 4.1.1,
J

(y
0
)v =
_
b
a
_
F
y
(x, y
0
(x), y

0
(x)) v(x) +F
p
(x, y
0
(x), y

0
(x)) v

(x)
_
per ogni v C
1
[a, b]. Poiche in particolare si ha y
0
+ v X per ogni
v C
1
0
[a, b], ripetendo largomentazione usata per provare la proposizione
3.6.1 si ricava
J

(y
0
)v =
_
b
a
_
F
y
(x, y
0
(x), y

0
(x)) v(x) +F
p
(x, y
0
(x), y

0
(x)) v

(x)
_
dx = 0
per ogni v C
1
0
[a, b]. Dal lemma 4.2.3 segue allora la tesi.
Osservazioni 4.3.2 (1) Le soluzioni dellequazione di Eulero di un funzio-
nale J si dicono estremali del funzionale J nella classe X. Un punto y
0
X `e
unestremale per J se e solo se J

(y
0
)v = 0 per ogni v C
1
0
[a, b]. Non `e detto,
in generale, che unestremale sia punto di massimo o di minimo relativo per
J.
(2) Se per`o il funzionale J, oltre che F-dierenziabile, `e anche convesso, al-
lora ogni estremale di J `e punto di minimo assoluto per J: infatti in virt` u
dellesercizio 3.3.5 si ha
J(y
0
+v) J(y
0
) +J

(y
0
)v = J(y
0
) v C
1
0
[a, b].
Se inoltre J `e strettamente convesso, il punto di minimo `e unico.
Una condizione che assicura la convessit`a di J `e la convessit`a dellintegrando
F nelle variabili (y, p) R
2
(esercizio 4.3.5).
(3) Quando F C
1
([a, b], R
2m
), lequazione di Eulero `e un sistema di m
equazioni della forma
d
dx
F
p
i
(x, y(x), y

(x)) = F
y
i
(x, y(x), y

(x)) in [a, b], i = 1, . . . , m.


148
Esempio 4.3.3 Dati due punti A, B R
N
, e ssati a, b R con a < b,
vogliamo determinare le curve regolari : [a, b] R
N
il cui sostegno ha per
estremi i punti A e B ed ha lunghezza minima; chiaramente, ci aspettiamo
di trovare il segmento di estremi A e B. Dobbiamo determinare il punto di
minimo assoluto del funzionale
J() =
_
b
a
[

[
N
dt
nella classe X = C
1
([a, b], R
N
) : [

[
N
,= 0, (a) = A, (b) = B. Poiche
si suppone [

[
N
,= 0, la funzione integranda F(t, y, p) = [p[
N
`e di classe C
1
,
anzi C

, ed in particolare F
p
i
(t, y, p) = p
i
/[p[
N
e F
y
i
= 0. Dunque, se una
curva realizza il minimo di J, per il teorema 4.3.1 essa deve soddisfare
lequazione di Eulero, cio`e il sistema seguente:
d
dt

i
(t)
[

(t)[
N
= 0 t [a, b], i = 1, . . . , N,
da cui

i
(t)
[

(t)[
N
= c
i
t [a, b], i = 1, . . . , N.
Questa relazione esprime il fatto che il versore tangente alla curva `e lo stesso
in ogni punto e vale c = (c
1
, . . . , c
N
); ovviamente, [c[
N
= 1. Del resto,
integrando fra a e b troviamo
B A =
_
b
a

(t) dt = c
_
b
a
[

(t)[
N
dt = c J(),
da cui, come era da aspettarsi, J() = [B A[
N
, e di conseguenza
c =
B A
[B A[
N
.
Dunque il versore tangente alla curva ha in ogni punto la direzione di BA;
quindi il sostegno di `e il segmento AB. Le equazioni parametriche di
sono
(t) = A +
B A
[B A[
N
_
t
a
[

()[
N
d t [a, b].
Si noti che la nostra impostazione del problema fornisce innite curve solu-
zioni, tutte parametrizzate su [a, b] ed aventi come sostegno il segmento di
149
estremi A e B; il passaggio dalluna allaltra avviene tramite cambiamenti di
parametro : [a, b] [a, b] di classe C
1
, i quali non alterano il funzionale
lunghezza ma solo la velocit`a istantanea di percorrenza del segmento AB.
In questo caso, la condizione necessaria ci ha permesso di trovare i punti di
minimo. Si noti che non abbiamo dimostrato che le curve del tipo sopra
scritto siano punti di minimo del funzionale J; tuttavia questo fatto (molto
verosimile, del resto!) segue osservando che J `e convesso e ricordando los-
servazione 4.3.2 (2). Pi` u semplicemente ancora, esso pu`o essere vericato nel
modo seguente: per ogni curva : [a, b] R
N
di estremi A, B, si ha
J() =
_
b
a
[

(t)[
N
dt

_
b
a

(t) dt

N
= [(b) (a)[
N
= [B A[
N
,
mentre per valeva luguaglianza.
Esercizi 4.3
1. Trovare le estremali dei seguenti funzionali in C
1
[a, b]:
(i) J(y) =
_
b
a
[y(x)
2
+y

(x)
2
+ 2y(x)e
x
]dx,
(ii) J(y) =
_
b
a
[y(x)
2
y

(x)
2
2y(x) cosh x]dx,
(iii) J(y) =
_
b
a
y

(x)[1 +x
2
y

(x)]dx,
(iv) J(y) =
_
b
a
[x
2
y

(x)
2
+ 2y(x)
2
+ 2xy(x)]dx.
2. Risolvere lequazione di Eulero del funzionale
J(y) =
_
b
a
f(x)
_
1 +y

(x)
2
dx, y C
1
[a, b],
ove f(x) > 0 `e una funzione assegnata, considerando in particolare i
casi f(x) =

x e f(x) = x.
3. Determinare, se esiste, il minimo del funzionale
_
1
0
_
1
2
y

(x)
2
+y(x)y

(x) +y

(x) +y(x)
_
dx
in C
1
[0, 1] ed in y C
1
[0, 1] : y(0) = y(1) = 0.
150
4. (Problemi ad estremi variabili) Si provi che se y
0
`e unestremale per il
funzionale
J(y) =
_
b
a
F(x, y(x), y

(x))dx
nella classe X = y C
1
[a, b] : y(a) [A
1
, A
2
], y(b) [B
1
, B
2
], allora
y
0
verica, oltre allequazione di Eulero, le condizioni agli estremi
F
p
(a, y
0
(a), y

0
(a)) = 0, F
p
(b, y
0
(b), y

0
(b)) = 0.
5. Si provi che se F(x, y, p) `e di classe C
1
ed `e convessa rispetto a (y, p),
allora il funzionale J(y) =
_
b
a
F(x, y(x), y

(x))dx `e convesso. Si provi


anche che la stretta convessit`a di F in (y, p) implica la stretta convessit`a
di J.
4.4 Integrali primi
Molto spesso lo studio e la risoluzione dellequazione di Eulero di un funziona-
le sono tuttaltro che agevoli. In certi casi particolari, tuttavia, la struttura
dellequazione `e tale da semplicare la situazione: ci`o accade ad esempio
allorche lequazione possiede un integrale primo, cio`e si riesce a ricavare
unequazione dierenziale pi` u semplice della quale ogni estremale deve essere
soluzione. Vale a questo proposito la seguente
Proposizione 4.4.1 Sia J(y) =
_
b
a
F(x, y(x), y

(x))dx, con F C
1
([a, b]
R
2
). Se lintegrando F `e di classe C
2
e non dipende dalla variabile x, ossia
F = F(y, p) C
2
(R
2
), allora ogni estremale y di J verica anche lequazione
F(y(x), y

(x)) y

(x)F
p
(y(x), y

(x)) = c x [a, b],


ove c `e una costante. Si dice che lequazione qui scritta `e un integrale primo
dellequazione di Eulero.
Si noti che la presenza di un integrale primo permette di abbassare il grado
dellequazione dierenziale da risolvere.
Dimostrazione Sia y unestremale dellequazione di Eulero
d
dx
F
p
(y(x), y

(x)) = F
y
(y(x), y

(x)).
151
Osserviamo anzitutto che se in un punto x [a, b] si ha F
pp
(y(x), y

(x)) ,= 0,
allora in quel punto esiste la derivata seconda y

(x). Infatti, utilizzando il


teorema di Lagrange,
F
y
(y(x), y

(x)) = lim
h0
1
h
[F
p
(y(x +h), y

(x +h)) F
p
(y(x), y

(x))] =
= lim
h0
1
h
[F
py
(
h
,
h
)(y(x +h) y(x)) +F
pp
(

h
,

h
)(y

(x +h) y

(x))]
ove (
h
,
h
), (

h
,

h
) sono punti opportuni nel segmento di estremi (y(x), y

(x))
e (y(x + h), y

(x + h)). Nelluguaglianza precedente, quando h 0 il


primo termine allultimo membro converge a F
py
(y(x), y

(x))y

(x); quindi
anche il secondo converge: indichiamo il suo limite con G(x). Siccome
F
pp
(y(x), y

(x)) ,= 0, si ha che
y

(x) = lim
h0
y

(x +h) y

(x)
h
=
F
y
(y(x), y

(x)) F
py
(y(x), y

(x))y

(x)
F
pp
(y(x), y

(x))
,
cosicche G(x) = y

(x)F
pp
(y(x), y

(x)) nei punti in cui F


pp
(y(x), y

(x)) ,= 0.
Ci` o prova lasserzione precedente. In denitiva, vale lequazione
0 = F
y
(y(x), y

(x))
d
dx
F
p
(y(x), y

(x)) =
= F
y
(y(x), y

(x)) F
py
(y(x), y

(x))y

(x) G(x)
in ogni punto x [a, b].
Daltra parte, calcolando il rapporto incrementale della quantit`a
F(y(x), y

(x)) y

(x)F
p
(y(x), y

(x)),
152
si ottiene, decomponendo opportunamente,
1
h
_
F(y(x +h), y

(x +h)) y

(x +h)F
p
(y(x +h), y

(x +h))
F(y(x), y

(x)) +y

(x)F
p
(y(x), y

(x))
_
=
=
1
h
[F(y(x +h), y

(x +h)) F(y(x), y

(x +h))] +
+
1
h
[F(y(x), y

(x +h)) F(y(x), y

(x))]

1
h
[y

(x +h) y

(x)]F
p
(y(x +h), y

(x +h))

1
h
y

(x)[F
p
(y(x +h), y

(x +h)) F
p
(y(x), y

(x +h))]

1
h
y

(x)[F
p
(y(x), y

(x +h)) F
p
(y(x), y

(x))] =
= I + II + III + IV + V.
Quando h 0 si ha:
I = o(1) +F
y
(y(x), y

(x))y

(x),
IV = o(1) F
py
(y(x), y

(x))y

(x)
2
;
inoltre, in virt` u del teorema di Lagrange,
II = o(1) +F
p
(y(x), y

(x))
y

(x +h) y

(x)
h
,
III = o(1) F
p
(y(x), y

(x))
y

(x +h) y

(x)
h
,
e inne
V = o(1) G(x)y

(x),
quantit`a che ha sempre senso per quanto osservato in precedenza. Si conclude
allora, sommando i cinque termini e ricordando lequazione precedentemente
ottenuta, che

d
dx
[F(y(x), y

(x)) y

(x)F
p
(y(x), y

(x))] =
= F
y
(y(x), y

(x))y

(x) F
py
(y(x), y

(x))y

(x)
2
G(x)y

(x) =
= 0 x [a, b],
e ci`o prova la tesi.
153
Esempio 4.4.2 Vogliamo trovare una curva cartesiana y C
1
[a, b], stret-
tamente positiva, con valori ssati negli estremi, la cui rotazione attorno
allasse x generi una supercie di area minima. Fissati dunque A, B > 0,
cerchiamo una funzione y(x) che renda minimo il funzionale
J(y) = 2
_
b
a
y(x)
_
1 +y

(x)
2
dx
nella classe
X = y C
1
[a, b] : y(a) = A, y(b) = B, y(x) > 0 x [a, b].
Se y X, allora se v C
1
0
[a, b] si ha y + v X, purche la norma |v|
C
1
[a,b]
sia sucientemente piccola. Quindi, se y
0
`e punto di minimo per J, varr`a
lequazione di Eulero: essendo
F(x, y, p) = y
_
1 +p
2
, F
p
(x, y, p) =
yp
_
1 +p
2
, F
y
=
_
1 +p
2
,
avremo
d
dx
y(x)y

(x)
_
1 +y

(x)
2
=
_
1 +y

(x)
2
x [a, b].
Questa equazione `e piuttosto complicata: fortunatamente per`o lintegrando
F non dipende dalla variabile x e quindi, per la proposizione 4.4.1, si ha
lintegrale primo
y(x)
_
1 +y

(x)
2

y(x)y

(x)
2
_
1 +y

(x)
2
= c x [a, b],
ossia, semplicando,
y(x)
_
1 +y

(x)
2
= c x [a, b].
Se c = 0 otteniamo y(x) = 0, non ammissibile. Se invece c ,= 0, per risol-
vere lequazione dierenziale introduciamo una variabile ausiliaria t = t(x),
ponendo
y

(x) = sinh t(x), ossia t(x) = log(y

(x) +
_
1 +y

(x)
2
).
154
Si ha allora
y(x) = c
_
1 +y

(x)
2
= c
_
1 + sinh
2
t(x) = c cosh t(x) x [a, b];
inoltre
sinh t(x) = y

(x) =
d
dx
c cosh t(x) = c sinh t(x) t

(x),
da cui t(x) = 0 oppure t

(x) =
1
c
. Il primo caso corrisponde a y(x) = c, non
ammissibile se A ,= B; nel secondo caso segue che t(x) `e invertibile e linversa
x(t) verica x

(t) = c, per cui x(t) = ct+d. Quindi t =


x(t)d
c
, ed in denitiva
y(x) = c cosh t(x) = c cosh
x d
c
, x [a, b].
`
E facile vericare che queste funzioni risolvono eettivamente lequazione dif-
ferenziale.
Abbiamo cos` ottenuto come estremali delle catenarie; le corrispondenti su-
perci di rotazione si chiamano catenoidi. Occorre ora imporre le condizioni
agli estremi:
y(a) = c cosh
a d
c
= A, y(b) = c cosh
b d
c
= B;
da queste si dovrebbero ricavare le costanti c, d. Si trovano due, una o nessuna
soluzione a seconda di come sono scelti i valori A, B (vedere lesercizio 4.4.2).
Anche in questo caso non abbiamo dimostrato che le estremali sono in eetti
punti di minimo del funzionale: questo comunque `e vero poiche il funzionale
`e convesso nella regione y > 0, p R.
Esempio 4.4.3 Uno dei problemi che storicamente hanno motivato la na-
scita del calcolo delle variazioni `e il problema della brachistocrona: dati due
punti (a, A), (b, B) in R
2
con A > B, si cerca una curva cartesiana tale che
un punto materiale vincolato a muoversi lungo vada dal primo al secondo
estremo impiegando un tempo minimo.
Possiamo ssare lorigine delle coordinate in modo che a = 0 e B = 0, e
supporre che il punto abbia massa unitaria. Per il principio di conservazio-
ne dellenergia, ssato x [0, b] e detti y(x) lordinata del punto e v(x) il
modulo della sua velocit`a, si avr`a
1
2
v(x)
2
+gy(x) = gA,
155
ove g `e la costante di gravitazione; quindi
v(x) =
_
2g(A y(x)).
Poiche il vettore velocit`a `e tangente al graco di in ogni punto, lo spazio
s percorso lungo `e pari a vt, dove t `e il tempo impiegato. Dunque, il
funzionale da minimizzare, cio`e il tempo totale per andare dal primo estremo
al secondo lungo `e dato dallintegrale curvilineo
J(y) = T =
_

1
v
ds =
_
b
0
_
1 +y

(x)
2
_
2g(A y(x))
dx.
La classe delle funzioni ammissibili `e
X = y C[0, b] C
1
]0, b] : y(0) = A, y(b) = 0, 0 < y(x) < A x ]0, b[.
Si noti che a priori non possiamo prendere y C
1
[0, b], perche la soluzione
potrebbe avere pendenza nel punto iniziale. Lintegrando `e
F(y, p) =
_
1 +p
2
_
2g(A y)
,
quindi non dipende da x; si ha poi
F
y
(y, p) =
_
1 +p
2
2

2g(A y)
3/2
, F
p
(y, p) =
p
_
2g(A y)(1 +p
2
)
.
Si noti che se y X allora y + v X per ogni v C
1
0
[0, b[ sucientemente
piccola (in particolare, v deve annullarsi in un intorno sinistro di b). Dunque,
possiamo dire che vale lequazione di Eulero (dapprima soltanto in ]0, b ],
con arbitrario, e poi di conseguenza in ]0, b]); anzi, per la proposizione 4.4.1,
esiste lintegrale primo
_
1 +y

(x)
2
_
2g(A y(x))

(x)
2
_
2g(A y(x))(1 +y

(x)
2
)
= c x ]0, b],
che, dopo semplicazioni, diventa
_
2g(A y(x))(1 +y

(x)
2
) =
1
c
x ]0, b].
156
Quadrando e ponendo u(x) = A y(x), si ottiene
u(x)(1 +u

(x)
2
) = K x ]0, b].
Come nellesempio 4.4.2, introduciamo la variabile ausiliaria t(x) mediante
la relazione
u

(x) =
1
tan
t(x)
2
, x ]0, b]
(si noti che t(x) ,= 0 per ogni x ]0, b]). Con procedura analoga, troviamo
per ogni x ]0, b]
u(x) =
K
1 +u

(x)
2
=
K
1 +
1
tan
2
t(x)
2
=
K
2
(1 cos t(x)),
da cui
1
tan
t(x)
2
= u

(x) =
K
2
sin t(x) t

(x)
e dunque
t

(x) =
2
K
1
sin t(x) tan
t(x)
2
=
1
K sin
2 t(x)
2
=
2
K(1 cos t(x))
x ]0, b].
Perci`o t(x) `e invertibile e linversa x(t) verica
x

(t) =
K
2
(1 cos t),
da cui x(t) =
K
2
(t sin t); ne segue che la curva (x, u(x)) `e data, in forma
parametrica, da
x(t) =
K
2
(t sin t), u(x(t)) =
K
2
(1 cos t).
Si tratta quindi di un arco di cicloide. Tornando alla funzione originaria y,
essa `e data da
x(t) =
K
2
(t sin t), y(x(t)) = A
K
2
(1 cos t).
Questa curva, che `e ancora una cicloide, passa per il punto (0, A) in corrispon-
denza del valore t = 0; passer`a per laltro estremo (b, 0) in corrispondenza di
un certo valore t
0
> 0 tale che
x(t
0
) = b =
K
2
(t
0
sin t
0
), y(x(t
0
)) = 0 = A
K
2
(1 cos t
0
).
157
Il valore t
0
e la costante K si determinano risolvendo questo sistema. Si
noti che la curva trovata `e ammissibile, ossia `e cartesiana ed appartiene a X,
anche se non `e possibile ricavare unespressione esplicita per y(x).
Si pu`o vericare che il funzionale J `e convesso nella regione y X, p R,
cosicche le estremali trovate sono in eetti punti di minimo del funzionale.
Esercizi 4.4
1. Si determini una curva C[0, b] C
1
]0, b], con (0) = A, tale che
un punto materiale vincolato a muoversi lungo , soggetto soltanto alla
forza di gravit`a, raggiunga la retta x = b in tempo minimo. Si provi
che nel punto di contatto con tale retta la curva ottimale ha tangente
orizzontale.
[Traccia: con riferimento alle notazioni dellesempio 4.4.3, si verichi
che imponendo la condizione F
p
(y(b), y

(b)) = 0 si trova t
0
= e K =
2b/.]
2. Si consideri il problema dellesempio 4.4.2 con [a, b] = [1, 1] e A =
B > 0.
(i) Si provi che se vi `e unestremale della forma
y(x) = c cosh
_
x
c
+
_
, ( R, c > 0),
allora deve essere = 0 e B = c cosh
1
c
.
(ii) Se ne deduca che, posto = min
t>0
t cosh
1
t
, si hanno due estremali
di tale forma se B > , unestremale di tale forma se B = e
nessuna estremale di tale forma se 0 < B < .
4.5 Condizione di Legendre
Descriviamo brevemente una ulteriore condizione necessaria per lesistenza
di unestremale, legata stavolta alla derivata seconda del funzionale J.
Proposizione 4.5.1 Sia J(y) =
_
b
a
F(x, y(x), y

(x))dx, con F C
2
([a, b]
R
2
). Se y `e punto di minimo locale per J nella classe X = y C
1
[a, b] :
y(a) = A, y(b) = B, allora
F
pp
(x, y(x), y

(x)) 0 x [a, b].


158
Se y `e punto di massimo locale, allora
F
pp
(x, y(x), y

(x)) 0 x [a, b].


Questa condizione `e detta condizione necessaria di Legendre.
Dimostrazione Supponiamo che y sia punto di minimo locale. Se in un
punto x
0
]a, b[ fosse F
pp
(x
0
, y(x
0
), y

(x
0
)) < 0, allora avremmo
F
pp
(x, y(x), y

(x)) < 0 x [x
0
, x
0
+],
con e numeri positivi opportuni. Consideriamo la funzione
u(x) =
_
sin
2 (xx
0
)

se [x x
0
[ ,
0 altrimenti.
Se `e sucientemente piccolo, si ha u C
1
0
[a, b] e con calcoli elementari si
vede che
|u|
2
L
2
(a,b)
=
_
x
0
+
x
0

sin
4
(x x
0
)

dx =

sin
4
t dt =
3
4
.
|u

|
2
L
2
(a,b)
=
_
x
0
+
x
0

2
sin
2
2(x x
0
)

dx =

2
_
2
2
sin
2
t dt =

2

.
Adesso calcoliamo la derivata seconda del funzionale J: per losservazione
4.1.2 (2) si ha
[J

(y)v]w =
_
b
a
_
F
yy
(x, y(x), y

(x))v(x)w(x) +
+ F
yp
(x, y(x), y

(x))[v(x)w

(x) +w(x)v

(x)] +
+ F
pp
(x, y(x), y

(x))v

(x)w

(x)
_
dx.
Quindi, sostituendo u al posto di v e w ed utilizzando le stime precedenti, si
ottiene
[J

(y)u]u =
_
x
0
+
x
0

_
F
yy
(x, y(x), y

(x))u(x)
2
+
+ 2F
yp
(x, y(x), y

(x))u(x)u

(x) +F
pp
(x, y(x), y

(x))u

(x)
2
_
dx

3
4
|F
yy
(, y(), y

())|
L

(a,b)
+
+

3|F
py
(, y(), y

())|
L

(a,b)

=
= c
1
+c
2

c
3

,
159
ove c
1
, c
2
e c
3
sono costanti positive. Se `e sucientemente piccolo, si ottiene
allora
[J

(y)u]u < 0,
il che `e assurdo, in quanto per la proposizione 3.6.2 dovrebbe essere
[J

(y)v]v 0 v C
1
[a, b].
Osservazione 4.5.2 Nel caso di un funzionale denito su C
1
([a, b], R
m
), se
F C
2
([a, b] R
2m
) la condizione necessaria di Legendre assume la for-
ma seguente: per ogni x [a, b], la matrice F
p
i
p
j
(x, y(x), y

(x))
i,j=1,...,m
`e
semi-denita positiva quando y `e punto di minimo locale, ed `e semidenita
negativa quando y `e punto di massimo locale.
Esercizi 4.5
1. Fissata c R, si consideri il funzionale
J(u) =
_
1
0
[u

(x)
2
+cu(x)
2
]dx, u C
1
0
[0, 1].
(i) Si trovino le estremali di J.
(ii) Si verichi che J

`e costante e verica la condizione di Legendre


in ogni punto di C
1
0
[0, 1].
(iii) Si provi che 0 `e punto di minimo assoluto per J se e solo se
c
2
.
(iv) Si mostri che se c <
2
si ha inf J = .
4.6 Il problema isoperimetrico
Dedichiamo questo paragrafo allanalisi di un problema classico, vale a dire
il problema isoperimetrico, che `e il seguente: fra tutte le curve chiuse di
classe C
1
in R
2
aventi lunghezza assegnata L, si vuole determinare quella che
delimita la regione di area massima.
Ricordando che per ogni dominio D R
2
con frontiera di classe C
1
vale la
formula
m
2
(D) =
1
2
_
+D
(x dy y dx),
160
ove lorientazione positiva su D `e quella antioraria, occorrer`a massimizzare
la funzione
F() =
1
2
_
+
(x dy y dx)
fra tutte le curve chiuse in R
2
, di classe C
1
. Fissiamo un intervallo [a, b] e
scegliamo X = C
1
([a, b], R
2
); cercheremo il massimo del funzionale F() =
1
2
_
b
a
(xy

yx

)dt sullinsieme
Z =
_
X : (a) = (b),
_
b
a
[

[
2
dt = L
_
.
Si tratta di un problema di massimo con vincolo: quindi andiamo ad applicare
il teorema 3.9.1. Poniamo Y = R e () =
_
b
a
[

[
2
dt L. Denotiamo con
() = (x(), y()) una generica curva appartenente a X; se h() = (u(), v())
`e un altro elemento di X si ha
F

() h = F

(x(), y()) (u(), v()) =


=
1
2
_
b
a
[(y

u yu

) + (xv

v)]dt =
=
1
2
_
b
a
__
y

_
h +
_
y
x
_
h

_
dt h X,
e anche

() h =
_
b
a

[
2
dt h X.
Si noti che

() non esiste in generale se la curva non `e una curva regolare:


quindi dovremo escludere eventuali soluzioni non regolari. Osserviamo che,
al contrario, se `e una curva regolare allora

() : X R `e un funzionale
surgettivo: se si sceglie h = r, con X, al variare di r R la quantit`a

() r = r
_
b
a
[

[dt = r() descrive tutto R. Dunque, per il teorema


3.9.1, se `e punto di massimo di F su Z, esiste R

= R tale che
F

() h + [

()

] h = 0 h X,
ossia
1
2
_
b
a
_
(y

u yu

) + (x

v +xv

) +
x

+y

_
x
2
+y
2
_
dt = 0 (u(), v()) X.
161
Dato che u e v variano indipendentemente nella classe delle funzioni w
C
1
[a, b] con w(a) = w(b), scegliendo prima luna e poi laltra uguale a 0
lequazione si scinde nel sistema
_

_
_
b
a
_
y

u yu

+
x

x
2
+y
2
_
dt = 0
_
b
a
_
x

v +xv

+
y

x
2
+y
2
_
dt = 0
(u(), v()) X.
Dal lemma 4.2.3 segue
_

_
d
dt
_
y +
x

x
2
+y
2
_
y

= 0
d
dt
_
x +
y

x
2
+y
2
_
+x

= 0
in [a, b],
da cui, integrando,

_
x
2
+y
2
= 2(c
1
+y),
y

_
x
2
+y
2
= 2(c
2
x) in [a, b].
Se ne deduce, quadrando e sommando,

2
4
= (c
1
+y(t))
2
+ (c
2
x(t))
2
t [a, b].
Ci` o prova che i punti di massimo di F in Z sono circonferenze di raggio
||
2
e, naturalmente, centro (c
2
, c
1
) arbitrario. Dato che la circonferenza deve
avere lunghezza L, si ricava L = [[; dunque le curve di lunghezza L che
delimitano una regione di area massima, se esistono, sono le circonferenze
di raggio
L
2
. I metodi qui illustrati non ci permettono di dedurre che le
circonferenze eettivamente risolvono il nostro problema; di questo fatto pe-
raltro esiste una dimostrazione di tipo geometrico, non banale ma del tutto
elementare.
Esercizi 4.6
1. Dati due punti distinti A, B R
2
, sia
0
una ssata curva regolare di
estremi A e B, il cui sostegno giaccia in uno dei due semipiani indivi-
duati dalla retta passante per A e per B. Fra tutte le curve di ssata
lunghezza , aventi per estremi A e B ed il cui sostegno non interseca
quello di
0
, si determini quella che insieme a
0
delimita una regione
di area massima.
162
4.7 Geodetiche su una supercie
In questo paragrafo ci occupiamo della determinazione delle curve geodetiche,
ossia di minima lunghezza, giacenti su una supercie regolare assegnata. Si
tratta di un problema classico e piuttosto intricato, di fondamentale impor-
tanza in geometria dierenziale; cercheremo di arontarlo con i metodi dei
paragra precedenti.
Sia dunque R
3
una supercie regolare connessa, di equazione g(x, y, z) =
0, e supponiamo che g sia di classe C
3
(questo fatto ci servir`a in seguito);
dati due punti distinti A, B , si cerca la curva (regolare)
0
giacente su
, di estremi A e B, che abbia lunghezza minima. Non `e detto a priori che
tale curva esista, ne che sia unica.
Fissiamo [a, b] R e consideriamo curve : [a, b] di classe C
1
.
Dobbiamo minimizzare il funzionale
J() =
_
b
a
[

[
3
dt
sullinsieme K = C
1
([a, b], R
3
) : (a) = A, (b) = B, sotto il vinco-
lo che sia contenuta in , ossia sotto la condizione g((t)) = 0 per ogni
t [a, b]. Abbiamo a disposizione il teorema 3.9.1, che fornisce una condizio-
ne necessaria anche una ssata curva
0
sia una geodetica di ; ma occorre
che linsieme dove `e denita la funzione da minimizzare sia uno spazio di Ba-
nach, mentre nel nostro caso K `e soltanto una variet`a ane di C
1
([a, b], R
3
).
Conviene allora porre =
0
+ , in modo che la curva appartenga allo
spazio di Banach X = C
1
0
([a, b], R
3
). Poniamo poi Y = C
1
[a, b], e deniamo
le funzioni F : X R e : X Y nel modo seguente:
F() =
_
b
a
[

0
+

[
3
dt, () = g (
0
+),
cosicche il fatto che
0
sia una geodetica di di estremi A, B signica che 0 `e
punto di minimo per la restrizione di F al vincolo Z = X : () = 0.
Verichiamo le ipotesi del teorema 3.9.1. Anzitutto, avendo supposto
0
regolare, sia F che sono F-dierenziabili in un intorno di = 0, con
F

() =
_
b
a

0
+

0
+

[
3

dt,

() = g(
0
+) X.
Verichiamo che

(0) : X Y `e un operatore surgettivo: poiche la su-


percie `e regolare, si ha g(
0
(t)) ,= 0 per ogni t [a, b]. Essendo [a, b]
163
compatto, esiste > 0 tale che
[g(
0
)(t)[
3
t [a, b].
Quindi, posto
A
i
=
_
t [a, b] : [D
i
g(
0
(t))[ >

2

3
_
, i = 1, 2, 3,
la terna A
1
, A
2
, A
3
`e un ricoprimento aperto di [a, b]. Sia
1
,
2
,
3

una partizione dellunit`a di classe C

associata a tale ricoprimento (ossia

i
C

0
(A
i
),
i
0, e

3
i=1

i
1). Allora, se v `e un arbitrario elemento
di Y , scelta h = (h
1
, h
2
, h
3
) ove h
i
=
v
i
D
i
g(
0
)
, si ha h X e

(0)h = g(
0
) h =
3

i=1
D
i
g(
0
)h
i
=
3

i=1

i
v = v,
il che mostra la surgettivit`a di

(0).
Per il teorema 3.9.1, esiste Y

= (C
1
[a, b])

tale che
F

(0)h +(

(0)h) = 0 h X.
Per interpretare questa uguaglianza occorre caratterizzare lo spazio duale
(C
1
[a, b])

.
Lemma 4.7.1 Lo spazio (C
1
[a, b])

`e costituito dai funzionali della forma


f = f(a) +f

f C
1
[a, b],
dove R e (C[a, b])

, ossia =
+

, con
+
e

misure di
Lebesgue-Stieltjes associate a funzioni p
+
, p

: [a, b] R crescenti e continue


a sinistra.
Dimostrazione
`
E chiaro che ogni funzionale della forma sopra scritta
appartiene a (C
1
[a, b])

.
Viceversa, sia (C
1
[a, b])

. Consideriamo il funzionale [
M
, ove M =
f C
1
[a, b] : f(a) = 0. Osserviamo che loperatore A =
d
dt
: M C[a, b]
`e bigettivo e continuo, perche se C[a, b] vi `e una ed una sola funzione
f M tale che f

= , e precisamente f(t) =
_
t
0
(s)ds. Per il lemma
3.9.2, loperatore aggiunto A

: (C[a, b])

`e a sua volta surgettivo:


164
quindi esiste (C[a, b])

tale che A

= [
M
. Il funzionale `e della forma
=
+

con
+
e

misure di Lebesgue-Stieltjes su [a, b] associate a


funzioni p
+
, p

crescenti e continue a sinistra in [a, b].


Se ora f C
1
[a, b], possiamo scrivere f = f(a) + g, con g M; ne segue,
indicando con I(t) la funzione costantemente uguale a 1,
f = f(a) + (A

)g = f(a)I +g

.
Scelto = I, si ha la tesi del lemma.
Possiamo ora interpretare lidentit`a fornita dal teorema 3.9.1. Supporremo
per`o che la curva geodetica
0
sia di classe C
2
, come del resto `e pratica
comune in geometria dierenziale, dove non `e mai utile fare economia nella
regolarit`a. Lequazione F

(0)h + (

(0)h) = 0, valida per ogni h X,


diventa, tenuto conto dellespressione di dedotta dal lemma 4.7.1,
_
b
a

0
h

0
[
3
dt +g(
0
(a)) h(a) +
_
b
a
d
dt
[g(
0
(t)) h(t)]d = 0 h X,
ove il simbolo d `e una forma compatta per indicare d
+
d

. E poiche
h(a) = 0, si ha pi` u semplicemente
_
b
a

0
h

0
[
3
dt +
_
b
a
d
dt
[g(
0
(t)) h(t)]d = 0 h X.
Adesso vorremmo integrare per parti il secondo termine del primo membro,
sfruttando il fatto che g `e di classe C
3
e
0
di classe C
2
. A questo scopo `e
fondamentale la seguente generalizzazione della formula di integrazione per
parti:
Lemma 4.7.2 Sia p : [a, b] R una funzione crescente e continua a sini-
stra, e sia la corrispondente misura di Lebesgue-Stieltjes. Allora per ogni
f AC[a, b] si ha
_
b
a
f d = f(b)p(b) f(a)p(a)
_
b
a
f

p dt.
Dimostrazione La formula `e vera quando p AC[a, b]: basta infatti osser-
vare che in tal caso fp AC[a, b], scrivere la formula che lega fp allintegrale
della sua derivata ed osservare che d = p

(t)dt.
Nel caso generale, esiste una successione p
n
AC[a, b] tale che ogni p
n
165
`e crescente in [a, b] e p
n
(t) p(t) puntualmente in [a, b] (basta ad esempio
prendere le convoluzioni p
n
, ove
n
(t) = n(nt), con C

(R), 0,
(t) = 0 per [t[ 1 e
_
1
1
(t)dt = 1). Allora si ha
([x, y[) = p(y) p(x) = lim
n
[p
n
(y) p
n
(x)] = lim
n
_
y
x
p

n
dt.
Di conseguenza, per ogni funzione costante a tratti, =

N
k=1

[c
k
,d
k
[
, si
ha
_
b
a
d =
N

k=1

k
([c
k
, d
k
[) = lim
n
N

k=1

k
_
d
k
c
k
p

n
dt = lim
n
_
b
a
p

n
dt.
Vogliamo ottenere la stessa relazione quando `e una funzione crescente ed
assolutamente continua. Scegliamo una successione
k
di funzioni costanti
a tratti tale che
k
e
k
(t) (t) uniformemente in [a, b]; si ha allora
_
b
a

k
d = lim
n
_
b
a

k
p

n
dt lim
n
_
b
a
p

n
dt k N,
da cui
_
b
a
d = lim
k
_
b
a

k
d lim
n
_
b
a
p

n
dt.
Daltra parte, ssato > 0 e scelto k sucientemente grande,
lim
n
_
b
a
p

n
dt limsup
n
_
b
a
(
k
)p

n
dt + lim
n
_
b
a

k
p

n
dt
lim
n
[p
n
(b) p
n
(a)] +
_
b
a

k
d
[p(b) p(a)] +
_
b
a
d.
Per larbitrariet`a di , si deduce che
_
b
a
d = lim
n
_
b
a
p

n
dt
per ogni funzione assolutamente continua e crescente; per dierenza, questa
relazione vale per ogni AC[a, b].
166
Sia nalmente f AC[a, b]: possiamo scrivere, utilizzando il teorema di
Lebesgue,
_
b
a
f d = lim
n
_
b
a
fp

n
dt =
= lim
n
_
f(b)p
n
(b) f(a)p
n
(a)
_
b
a
f

p
n
dt
_
=
= f(b)p(b) f(a)p(a)
_
b
a
f

p dt,
e ci`o prova la tesi.
Consideriamo ora le funzioni h C
2
0
(]a, b[, R
3
), che costituiscono un sotto-
spazio denso in X: allora per tali h, tenendo conto del lemma 4.7.2 (applicato
separatamente alle misure
+
e

), la condizione necessaria per il minimo


vincolato si pu`o scrivere nella forma seguente:
_
b
a

0
h

0
[
3
dt
_
b
a
d
2
dt
2
[g(
0
(t)) h(t)] p(t) dt,
da cui, sviluppando le derivate,
_
b
a
_
p[g(
0
)]

h +
_

0
[

0
[
3
2p[g(
0
)]

_
h

pg(
0
) h

_
dt = 0.
Utilizzando il lemma 4.2.5, otteniamo le seguenti informazioni: anzitutto,
pg(
0
) C
1
([a, b], R
3
), il che implica p C
1
[a, b] essendo g(
0
) di
classe C
2
e diverso da 0; in secondo luogo, la funzione

0
[

0
[
3
2p[g(
0
)]

+ (p[g(
0
)])

0
[

0
[
3
p[g(
0
)]

+p

[g(
0
)]
deve essere in C
1
([a, b], R
3
): ci`o implica, per dierenza, che p

[g(
0
)] `e di
classe C
1
e dunque p C
2
[a, b]. La terza informazione `e la relazione
d
dt
_

0
[

0
[
3
p[g(
0
)]

+p

[g(
0
)]
_
= p[g(
0
)]

in [a, b],
dalla quale, svolgendo le derivate (lecito, visto che sappiamo che p C
2
[a, b]),
ricaviamo, dopo alcune semplicazioni,
d
dt

0
[

0
[
3
+p

g(
0
) = 0 in [a, b].
167
Questo `e il sistema dierenziale che caratterizza le geodetiche: esso ci dice
che, lungo la geodetica
0
, la normale principale alla curva (ossia la derivata
del versore tangente

0
|

0
|
3
) `e parallela alla normale alla supercie , che `e
il vettore g. Se, in particolare, rappresentiamo la curva
0
mediante il
parametro lunghezza darco s, e poniamo = p

, il sistema acquista la
forma pi` u semplice

0
(s) (s)g(
0
(s)) = 0.
Questo sistema, che pure costituisce soltanto una condizione necessaria per
lesistenza di geodetiche, permette in molti casi concreti di calcolarle esplici-
tamente (esempi 4.7.3 e 4.7.4, nonche esercizio 4.7.1).
Naturalmente, resta il problema di provare lesistenza di almeno una geode-
tica. Dimostreremo che esiste almeno una geodetica nella classe delle curve
lipschitziane su [a, b] (ossia assolutamente continue in [a, b] con derivata es-
senzialmente limitata).
Osserviamo prima di tutto che, essendo una supercie regolare e connes-
sa, vi `e almeno una curva regolare : [a, b] di estremi A e B; posto
M = |

, linsieme
N = AC([a, b], ) : (a) = A, (b) = B,

(a, b; R
3
), |

M
`e dunque un sottoinsieme non vuoto dello spazio
Z = AC([a, b], R
3
) :

(a, b; R
3
)
che `e di Banach con la norma
||
Z
= ||

+|

.
Proviamo che N `e compatto in Z: per ogni N si ha
[(t)[
3
[(a)[
3
+
_
t
a
[

()[
3
d [A[
3
+M(b a) < t [a, b],
[(t) (s)[
3
=

_
t
s

(r) dr

M[t s[ s, t [a, b],


e dunque le funzioni di N costituiscono una famiglia equicontinua ed equi-
limitata. Per il teorema di Ascoli-Arzel`a, N `e relativamente compatto ri-
spetto alla convergenza uniforme; la compattezza in Z si ottiene osservan-
do che se
n

nN
N e
n
uniformemente, allora otteniamo anche
168
[(t) (s)[
3
M[t s[ e quindi `e assolutamente continua: inoltre la sua
derivata, che esiste quasi ovunque, `e limitata da M, il che mostra che N.
Osserviamo adesso che il funzionale lunghezza F() =
_
b
a
[

(t)[
3
dt `e ovvia-
mente continuo su Z (e addirittura semicontinuo inferiormente rispetto alla
convergenza uniforme in virt` u dellesercizio 4.1.2); quindi F, che evidente-
mente `e limitato inferiormente, ha minimo sul compatto N, ossia esiste una
geodetica in N.
Resta aperto il delicato problema della regolarit`a: sappiamo che esiste una
geodetica lipschitziana, ma la condizione necessaria da noi dimostrata in pre-
cedenza vale solo per geodetiche di classe C
2
. Questa questione `e per`o al di
l`a della portata degli strumenti che abbiamo.
Esempio 4.7.3 Consideriamo il caso della supercie sferica di raggio r, cen-
trata per semplicit`a nellorigine. Si ha g(x, y, z) = x
2
+y
2
+z
2
r
2
, e dunque
il sistema che caratterizza le geodetiche assume la forma

(s) = 2(s)(s),
dove abbiamo scritto per comodit`a in luogo di
0
. Moltiplicando scalar-
mente per (s) otteniamo
d
ds
((s),

(s))
3
[

(s)[
2
3
= ((s),

(s))
3
= 2(s)[(s)[
2
3
,
daltra parte si ha [(s)[
3
= r, [

(s)[
3
= 1 ed inoltre ((s),

(s))
3
=
1
2
d
ds
[(s)[
2
3
= 0. Quindi lequazione si riduce a 1 = 2(s)r
2
, il che si-
gnica (s)
1
2r
2
; in particolare, `e indipendente da s. Arriviamo cos` al
sistema

(s) = 2(s) =
1
r
2
(s).
Scegliamo i punti A, B: non `e restrittivo scegliere uno dei due il pi` u comoda-
mente possibile dal punto di vista dei calcoli, mentre il secondo deve essere
generico. Poniamo quindi
A = (r, 0, 0), B = (x
0
, y
0
, z
0
).
Risolvendo il sistema si trova
_

_
x(s) = P cos
s
r
+Qsin
s
r
y(s) = Rcos
s
r
+S sin
s
r
z(s) = T cos
s
r
+U sin
s
r
,
169
con P, Q, R, S, T, U costanti da determinare. Imponendo che (0) = A si
trova subito P = r, R = 0 e T = 0; dallidentit`a [

(s)[
3
= 1, ponendo
dapprima s = 0, si trova con facili calcoli Q
2
+S
2
+U
2
= r
2
, e di conseguenza,
con s ,= 0, si deduce Q = 0 e S
2
+U
2
= r
2
. In denitiva
_

_
x(s) = r cos
s
r
y(s) = S sin
s
r
z(s) = U sin
s
r
,
da cui ricaviamo
y(s)
S
=
z(s)
U
,
ossia la curva giace sul piano di equazione UySz = 0. Questo piano passa
per lorigine (contiene anzi lasse x), e dunque taglia la supercie sferica in
un cerchio massimo. Ne segue che la geodetica `e necessariamente un arco
di cerchio massimo.
Esempio 4.7.4 Consideriamo il caso di un cilindro, con asse che possiamo
supporre coincidente con lasse z. Avremo perci`o g(x, y, z) = x
2
+y
2
r
2
. Il
sistema delle geodetiche diventa
_
_
_
x

(s) = 2(s)x(s)
y

(s) = 2(s)y(s)
z

(s) = 0.
Scegliamo i punti A = (r, 0, 0) e B = (x
0
, y
0
, z
0
). Moltiplicando la prima
equazione per x(s), la seconda per y(s), e sommando, otteniamo
x(s)x

(s) +y(s)y

(s) = 2(s)(x(s)
2
+y(s)
2
),
ed osservato che xx

+ yy

= (xx

+ yy

(x
2
+ y
2
) = (x
2
+ y
2
) (per-
che dallequazione x
2
+ y
2
= r
2
segue xx

+ yy

= 0), deduciamo 2(s) =


r
2
(x

(s)
2
+y

(s)
2
). Daltronde, risolvendo la terza equazione si ha z

(s) = c
e z(s) = cs +d, con d = 0 (per come `e stato scelto A); quindi
(s) =
x

(s)
2
+y

(s)
2
2r
2
=
1 z

(s)
2
2r
2
=
1 c
2
2r
2
,
quindi nuovamente non dipende da s. Si noti che, necessariamente, [c[ 1.
Le prime due equazioni del sistema diventano allora
x

(s) =
1 c
2
r
2
x(s), y

(s) =
1 c
2
r
2
y(s),
170
da cui
x(s) = P cos

1 c
2
r
s +Qsin

1 c
2
r
s,
y(s) = Rcos

1 c
2
r
s +S sin

1 c
2
r
s.
Dalla condizione iniziale ricaviamo P = r e R = 0, mentre dallidentit`a
x(s)x

(s) + y(s)y

(s) = 0, scelto s = 0, segue che Q = 0; di conseguenza


S
2
r
2
= 0, ossia S = r. In denitiva
_

_
x(s) = r cos

1c
2
r
s,
y(s) = r sin

1c
2
r
s,
z(s) = cs,
ove la costante c [1, 1] dipende dalla scelta del punto B. Queste sono
le equazioni di unelica cilindrica; nel caso particolare in cui c = 0 si ha un
arco di cerchio orizzontale, mentre quando c = 1 si ottiene un segmento
verticale.
Esercizi 4.7
1. (Geodetiche su un cono) Dato il cono di equazione z = a
_
x
2
+y
2
,
ove a > 0, sia (s) = (x(s), y(s), z(s)) una geodetica di estremi A =
(x
0
, y
0
, a
_
x
2
0
+y
2
0
) e B = (x
1
, y
1
, a
_
x
2
1
+y
2
1
), espressa in funzione del
parametro lunghezza darco.
(i) Si scrivano le equazioni dierenziali soddisfatte da x(s), y(s), z(s).
(ii) Si provi che
d
2
ds
2
[(s)[
2
3
= 2,
d
2
ds
2
z(s)
2
=
2a
2
1 +a
2
.
(iii) Si deduca che
z(s)
2
=
a
2
1 +a
2
s
2
+bs +c,
con b, c costanti univocamente individuate dalle condizioni
z(0) = a
_
x
2
0
+y
2
0
, z() = a
_
x
2
1
+y
2
1
.
171
(iv) Scritte x(s) e y(s) nella forma
x(s) =
1
a
z(s) cos (s), y(s) =
1
a
z(s) sin (s),
si verichi che
_
a[cos (s) x

(s) + sin (s) y

(s)] = z

(s)
a[sin (s) x

(s) cos (s) y

(s)] = z(s)

(s),
e se ne deduca che

(s) = 2
z

(s)

(s)
z(s)
.
(v) Si concluda che
(s) =
0
+ (
1

0
)
_
s
0
dr
z(r)
2
_

0
dr
z(r)
2
,
dove
0
e
1
sono individuati dalle relazioni
cos
0
=
x
0
_
x
2
0
+y
2
0
, sin
0
=
y
0
_
x
2
0
+y
2
0
,
cos
1
=
x
1
_
x
2
1
+y
2
1
, sin
1
=
y
1
_
x
2
1
+y
2
1
.
172
Capitolo 5
Sottodierenziale
5.1 Denizione e propriet`a
Se occorre minimizzare un funzionale che non `e dierenziabile, i metodi ed i
risultati visti nei capitoli precedenti non sono utilizzabili. Vi sono per`o altre
tecniche, legate a generalizzazioni del concetto di derivata, che funzionano
in questi contesti pi` u generali. La pi` u importante di tali generalizzazioni,
nellottica dei problemi di minimo ed in stretta relazione con la convessit`a, `e
la nozione di sottodierenziabilit`a.
Denizione 5.1.1 Sia X uno spazio normato reale e sia f : X R. Di-
ciamo che f `e sottodierenziabile nel punto x
0
X se esiste unapplicazione
ane : X R tale che
(x) f(x) x X, (x
0
) = f(x
0
).
Se f `e denita in un aperto U X, diremo che f `e sottodierenziabile nel
punto x
0
U se lo `e lestensione di f che vale + in X U.
Osservazione 5.1.2 Dalla sottodierenziabilit`a di una funzione f in un
punto x
0
seguono subito due fatti. Il primo, banale ma importante, `e che
f(x
0
) R; il secondo `e che esiste X

tale che
f(x) f(x
0
) +(x x
0
) x X.
Infatti, se (x) = x + b `e lapplicazione ane che verica la denizione di
sottodierenziabilit`a, si ha per ogni x X
f(x) (x) = (xx
0
) +x
0
+b = (xx
0
) +(x
0
) = (xx
0
) +f(x
0
);
173
si noti che, di conseguenza, f `e semicontinua inferiormente nel punto x
0
.
Denizione 5.1.3 Sia X uno spazio normato reale e sia f : X R. Se f
`e sottodierenziabile in x
0
, ogni X

tale che
f(x) f(x
0
) +(x x
0
) x X
si chiama sottogradiente di f in x
0
; linsieme dei sottogradienti di f in x
0
si
chiama sottodierenziale di f in x
0
e si indica col simbolo f(x
0
).
Osservazione 5.1.4 Se non esistono sottogradienti di f in x
0
, evidente-
mente f(x
0
) = ; questo accade certamente se f(x
0
) = , ma pu`o anche
capitare in un punto x
0
in cui f(x
0
) R, ad esempio se f `e una funzio-
ne concava su R. Se X

, si ha f(x
0
) se e solo se f(x
0
) R
e f(x) f(x
0
) + (x x
0
) per ogni x X. In particolare, f(x
0
) `e un
sottoinsieme convesso (eventualmente vuoto) di X

.
Esempi 5.1.5 (1) Sia X uno spazio normato reale e sia f : X R convessa
e G-dierenziabile; allora si ha f(x
0
) = f

G
(x
0
) per ogni x
0
X. Infatti,
se f(x
0
) si ha, per losservazione precedente,
f(x
0
+tv) f(x
0
) t v t R 0, v X;
dividendo per t si ottiene per t 0
_
f

G
(x
0
)v v se t 0
+
,
f

G
(x
0
)v v se t 0

,
da cui f

G
(x
0
) = . Viceversa, poiche f `e convessa, il suo rapporto incremen-
tale in una qualunque direzione v X `e crescente (esercizio 2.1.3): quindi,
scegliendo v = x x
0
, si ottiene
f(x) f(x
0
) = f(x
0
+v) f(x
0
) f

G
(x
0
)v = f

G
(x
0
)(x x
0
) x X,
da cui f

G
(x
0
) f(x
0
).
(2) Sia X uno spazio normato reale. Calcoliamo il sottodierenziale f(0),
dove f(x) = |x|
X
. Per denizione si ha f(0) se e solo se |x|
X
x
per ogni x X; scrivendo x al posto di x otteniamo anche |x|
X
x,
quindi f(0) se e solo se ||
X
1.
Vediamo adesso alcune propriet`a del sottodierenziale.
174
Proposizione 5.1.6 Sia X uno spazio normato reale e sia f : X R.
Per ogni x
0
X il sottodierenziale f(x
0
) `e un sottoinsieme convesso e
debolmente* chiuso di X

; in particolare, f(x
0
) `e chiuso in X

. Se, inoltre,
f `e continua in x
0
, allora f(x
0
) `e debolmente* compatto.
Dimostrazione Se f(x
0
) = , allora f(x
0
) = e quindi la tesi `e provata.
Sia dunque f(x
0
) R: allora la convessit`a di f(x
0
) segue dallosservazione
5.1.4. Proviamo che f(x
0
) `e debolmente* chiuso: se / f(x
0
), esiste
x X tale che f(x
0
) +(x x
0
) f(x) =
0
> 0; ssato lintorno
U =
_
X

: [( )(x x
0
)[ <

0
2
_
,
si ha / f(x
0
) per ogni U, in quanto
f(x
0
) +(x x
0
) f(x) f(x
0
) +(x x
0
) f(x)

0
2
=

0
2
> 0.
Dunque il complementare di f(x
0
) `e aperto nella topologia debole*.
Supponiamo adesso che f sia continua in x
0
: scelto = 1, esiste > 0 tale
che [f(x) f(x
0
)[ 1 per |x x
0
|
X
. Sia allora f(x
0
): dalla
relazione
(x x
0
) f(x) f(x
0
) x X
segue subito
[(x x
0
)[ [f(x) f(x
0
)[ 1 per |x x
0
|
X
,
e quindi, scelto x = x
0
+u, con |u|
X
1,
[u[ 1 per |u|
X
1.
ci`o signica che
||
X

1

f(x
0
).
Dunque f(x
0
) `e un sottoinsieme w

-chiuso e limitato in X

; pertanto, in
virt` u del teorema di Banach-Alaoglu (teorema 1.6.3), f(x
0
) `e w

-compatto.
Osservazione 5.1.7 Dalla dimostrazione precedente segue facilmente che
se f `e lipschitziana in una palla B(x
0
, ) di uno spazio normato reale X, con
costante di Lipschitz M, allora per x B(x
0
, /2) i sottodierenziali f(x)
sono insiemi equilimitati dalla costante M.
175
Limportanza della nozione di sottodierenziale in relazione ai problemi di
minimo `e ben evidenziata dalla seguente
Proposizione 5.1.8 Sia X uno spazio normato reale e sia f : X R. Se
x
0
X, risulta
f(x
0
) = min
xX
f(x) R
se e solo se 0 f(x
0
).
Dimostrazione
`
E una diretta conseguenza della denizione di sottodie-
renziale.
Il sottodierenziale di una funzione ha una chiara parentela con la bipolare
(della stessa funzione), introdotta nel paragrafo 2.5. Il legame fra questi due
oggetti viene messo in luce dalla proposizione che segue (si veda anche il
teorema 2.5.8).
Proposizione 5.1.9 Sia X uno spazio normato reale e sia f : X R. Si
ha:
(i) se f(x
0
) ,= , allora f(x
0
) = f

(J
x
0
);
(ii) se f(x
0
) = f

(J
x
0
), allora f(x
0
) = (f

J)(x
0
).
Dimostrazione (i) Sia una funzione ane tale che (x) f(x) per
ogni x X e (x
0
) = f(x
0
); allora, essendo in particolare convessa e
semicontinua inferiormente, per losservazione 2.5.9 si ha (x) f

(J
x
)
f(x) per ogni x X; in particolare, per x = x
0
si ottiene f

(J
x
0
) = (x
0
) =
f(x
0
).
(ii) Supponiamo che f

(J
x
0
) = f(x
0
). Se f(x
0
) = , allora f

(J
x
0
) =
e quindi f(x
0
) = (f

J)(x
0
) = . Se invece f(x
0
) R (il che
non esclude che f(x
0
) sia ugualmente vuoto!), sia f(x
0
): allora per
denizione
f(x) f(x
0
) +(x x
0
) = f

(J
x
0
) +(x x
0
) x X;
poiche x f

(J
x
0
) + (x x
0
) `e una funzione ane, dunque convessa e
semicontinua inferiormente, si deduce
f

(J
x
) f

(J
x
0
) +(x x
0
) x X,
176
da cui (f

J)(x
0
).
Se, viceversa, (f

J)(x
0
), allora
f(x) f

(J
x
) f

(J
x
0
) +(x x
0
) = f(x
0
) +(x x
0
) x X,
cio`e f(x
0
).
Unaltra caratterizzazione del sottodierenziale `e fornita dal seguente risul-
tato:
Proposizione 5.1.10 Sia X uno spazio normato reale e sia f : X R.
Fissati X

e x
0
X, risulta f(x
0
) se e solo se f(x
0
) R e
f(x
0
) +f

() = x
0
; in particolare, in tal caso si ha f

() R.
Dimostrazione Per losservazione 5.1.4, si ha f(x
0
) se e solo se f(x
0
)
R e
f(x) f(x
0
) +(x x
0
) x X,
ovvero, moltiplicando per 1, se e solo se f(x
0
) R e
f

() = sup
xX
x f(x) = x
0
f(x
0
).
In particolare, se f(x
0
) questa relazione implica f

() R.
Corollario 5.1.11 Sia X uno spazio normato reale, sia f : X R e siano
x
0
X e X

. Si ha: f(x
0
) se e solo se J
x
0
f

() e f(x
0
) =
f

(J
x
0
).
Dimostrazione (=) Sia f(x
0
); allora f(x
0
) R e, per la propo-
sizione 5.1.9, si ha f(x
0
) = f

(J
x
0
). Dalla proposizione 5.1.10 otteniamo
allora f

() R e
x
0
= f(x
0
) +f

() = f

(J
x
0
) +f

(),
da cui, sempre per la proposizione 5.1.10 (applicata stavolta a f

nel punto
) segue J
x
0
f

().
(=) Sia J
x
0
f

(): per la proposizione 5.1.10 si ha f

() R e
f

(J
x
0
) +f

() = J
x
0
, da cui, tenuto conto dellipotesi f(x
0
) = f

(J
x
0
),
f(x
0
) +f

() = f

(J
x
0
) +f

() = J
x
0
= x
0
.
Quindi f(x
0
) R ed inne, invocando ancora una volta la proposizione
5.1.10, si conclude che f(x
0
).
177
Esercizi 5.1
1. Sia X uno spazio normato reale e sia f : X R. Provare che
(f)(x
0
) = f(x
0
) 0, x
0
X.
2. Sia X uno spazio normato reale e siano f, g : X R. Provare che
(f +g)(x
0
) f(x
0
) +g(x
0
);
si mostri che linclusione `e in generale stretta.
3. Fissato > 0, si determini f(0), ove f(x) = [x[

, x R.
4. Sia X uno spazio di Banach reale e sia K un sottoinsieme convesso e
chiuso di X. Si provi che, posto
N
K
(x
0
) = X

: (x x
0
) 0 x K,
risulta
I
K
(x
0
) =
_
N
K
(x
0
) se x
0
K
se x
0
/ K.
Nel caso X = R
N
, si interpreti geometricamente questo risultato.
(Linsieme N
K
(x
0
) si chiama cono normale a K in x
0
.)
5. Sia g L

(a, b) e poniamo f(x) =


_
x
a
g(t)dt. Si provi che f(x)
coincide con lintervallo (eventualmente vuoto) [g

(x), g
+
(x)], ove
g

(x) = sup
a<x
1
x
_

x
g(t) dt, g
+
(x) = inf
x<b
1
x
_

x
g(t) dt.
5.2 Funzioni convesse sottodierenziabili
La nozione di sottodierenziale, come si `e gi`a osservato, `e particolarmente
importante ed utile quando si considerano funzioni convesse. Per semplicit`a,
considereremo solamente funzioni a valori in ] , +]. Innanzi tutto, il
sottodierenziale di una funzione convessa `e quasi sempre non vuoto, come
mostra la proposizione che segue.
178
Proposizione 5.2.1 Sia f : X ] , +] una funzione convessa su uno
spazio normato reale X. Se esiste x
0
D(f) tale che f `e continua in x
0
,
allora si ha f(x) ,= per ogni x

D(f) e, in particolare, f(x


0
) ,= .
Dimostrazione Poiche f non assume il valore , si ha f(x
0
) R; la
continuit`a di f implica allora che f `e limitata in un intorno U di x
0
, da
cui U D(f) e pertanto x
0

D(f). Per il teorema 2.4.2, si deduce che f


`e continua in ogni punto di

D(f) ed `e limitata in un opportuno intorno di


ciascun punto di

D(f).
Ci`o premesso, sia x

D(f). Adoperiamo un ragionamento gi`a impiegato


nella dimostrazione del lemma 2.6.9: linsieme epi(f) `e convesso in X R;
proviamo che esso ha parte interna non vuota. Sia V un intorno aperto di x
tale che [f()[ K per ogni V : allora V ]K, +[ `e un aperto contenuto
in epi(f), cosicche per ogni t > K il punto (x, t) `e interno ad epi(f). Si osservi
inoltre che (x, f(x)) epi(f), in quanto (x, f(x) ) / epi(f) per ogni
> 0: in particolare, (x, f(x)) /

epi(f).
Dunque, per il lemma 2.3.6 (i), esistono X

e t > 0 tali che


x +tf(x) = +ta (, a) epi(f).
Dividendo per t e scegliendo a = f(), troviamo

t


t
f() X,

t


t
x = f(x).
Per sottrazione si ottiene

t
( x) +f(x) f() X,
e dunque

t
f(x). Abbiamo cos` provato che f(x) ,= per ogni
x

D(f). Poiche x
0

D(f), in particolare f(x


0
) ,= .
Osserviamo che se f assume anche il valore , il risultato della proposi-
zione precedente non `e vero (esercizio 5.2.1).
Vediamo ora come `e strutturato il sottodierenziale di una funzione convessa.
Teorema 5.2.2 Sia f : X ] , +] una funzione convessa su uno
spazio normato reale X. Allora, posto per ogni x D(f) e v X
D
+
f(x, v) = lim
h0
+
f(x +hv) f(x)
h
, D

f(x, v) = lim
h0

f(x +hv) f(x)


h
,
179
si ha per x D(f) e v X
f(x) = X

: v D
+
f(x, v) v X =
= X

: v D

f(x, v) v X.
Inoltre, se esiste x
0
D(f) tale che f `e continua in x
0
, allora per ogni
x

D(f) e per ogni v X risulta


D
+
f(x, v) = supv : f(x), D

f(x, v) = infv : f(x).


Dimostrazione Per lesercizio 2.1.3, per ogni x D(f) i rapporti incremen-
tali di f lungo unarbitraria direzione v X sono crescenti e quindi i limiti
D

f(x, v) esistono, niti od inniti, con D

f(x, v) D
+
f(x, v).
Dimostriamo le inclusioni (). Sia x D(f) e sia f(x): si ha
f() f(x) ( x) X,
quindi
f(x +tv) f(x) t v t R 0, v X.
Dividendo per t otteniamo per t 0
+
e t 0

D
+
f(x, v) v D

f(x, v) v X.
Viceversa, se X

verica la prima di queste due disuguaglianze, allora


per la crescenza dei rapporti incrementali di f si ha a maggior ragione
f(x +v) f(x) v v X,
da cui, posto v = x, si deduce
f() f(x) +( x) X,
ossia f(x). Se invece verica la seconda delle due disuguaglianze
precedenti, allora analogamente
v f(x) f(x v) v X,
e posto v = x si arriva nuovamente alla conclusione che f(x). Ci`o
prova le inclusioni ().
180
Proviamo la seconda parte della tesi. Per la proposizione 5.2.1, f(x) `e non
vuoto per ogni x

D(f).
`
E chiaro che per ogni v X si ha
D
+
f(x, v) supv : f(x), D

f(x, v) infv : f(x);


dimostriamo le disuguaglianze opposte. Fissiamo x

D(f). Essendo f con-


tinua in x
0
, per il teorema 2.4.2 f `e continua in ogni punto di

D(f), quindi
f `e limitata in unopportuna palla B(x, 2); per la proposizione 2.4.5, f `e
localmente lipschitziana in B(x, 2) e pertanto esiste K 0 tale che
K|v|
X
f(x v) f(x) D

f(x, v)
D
+
f(x, v) f(x +v) f(x) K|v|
X
v B(0, ).
Dato che le funzioni v D

f(x, v) sono positivamente omogenee (oltre che


convesse), deduciamo che la stessa relazione vale per ogni v X, ossia
K|v|
X
D

f(x, v) D
+
f(x, v) K|v|
X
v X.
Fissato v X 0, andiamo ora a costruire un sottogradiente f(x)
che verichi luguaglianza v = D
+
f(x, v): ci`o mostrer`a che
D
+
f(x, v) supv : f(x).
Consideriamo il funzionale y D
+
f(x, y), che `e positivamente omogeneo e
convesso, e deniamo un funzionale lineare : [v] R ponendo
(tv) = t D
+
f(x, v) t R.
Si ha (tv) D
+
f(x, tv) per ogni t R: infatti ci`o `e banale se t 0,
mentre se t < 0 possiamo scrivere, in virt` u della relazione D
+
f(x, v) =
D

f(x, v),
(tv) = ([t[v) =
= D
+
f(x, [t[v) = D
+
f(x, tv) = D

f(x, tv) D
+
f(x, tv).
Per il teorema di Hahn-Banach esiste : X R tale che
(tv) = (tv) t R, y D
+
f(x, y) y X.
181
Si ha X

, perche
[y[ = maxy, (y) maxD
+
f(x, y), D
+
f(x, y) K|y|
X
y X.
Di conseguenza, f(x) per la caratterizzazione gi`a dimostrata. Inoltre,
per costruzione, v = D
+
f(x, v).
Lanaloga disuguaglianza relativa a D

f(x, v) segue utilizzando nuovamente


la relazione D

f(x, v) = D
+
f(x, v).
Vediamo ora la relazione fra sottodierenziabilit`a e G-dierenziabilit`a di
funzioni convesse: andiamo a completare il risultato dellesempio 5.1.5 (1).
Proposizione 5.2.3 Sia X uno spazio normato reale, sia f : X] ,+]
una funzione convessa e propria; sia inoltre x
0
D(f).
(i) Se f `e G-dierenziabile in x
0
, allora f `e sottodierenziabile in x
0
e
f(x
0
) = f

G
(x
0
).
(ii) Se f `e continua in x
0
e f(x
0
) =
0
, allora f `e G-dierenziabile in
x
0
e f

G
(x
0
) =
0
.
Dimostrazione (i) Basta ripetere il ragionamento utilizzato nellesempio
5.1.5 (1).
(ii) Dal teorema 5.2.2 segue, per ogni v X,
D
+
f(x
0
, v) = supv : f(x
0
) =
0
v,
D

f(x
0
, v) = infv : f(x
0
) =
0
v,
e dunque esiste la derivata di Gateaux f

G
(x
0
)v =
0
v per ogni v X.
Dimostriamo adesso il teorema di Mazur (teorema 2.4.6), che qui richiamia-
mo:
Teorema 2.4.6 (di Mazur) Sia X uno spazio di Banach separabile, sia
D X un aperto convesso non vuoto e sia f : D R una funzione conves-
sa e continua. Allora f `e G-dierenziabile in un insieme D
0
D, denso in
D, che `e unione numerabile di aperti densi.
Dimostrazione Sia
D
0
= x D : f

G
(x),
182
e dimostriamo che D D
0
`e unione numerabile di insiemi chiusi in D.
Sia x
n

nN
+ una successione densa nella palla unitaria B di X. Per ogni
n, m N
+
poniamo
A
nm
=
_
x D : , f(x) : ( )(x
n
)
1
m
_
.
Osserviamo che, per la proposizione 5.2.3, f

G
(x) non esiste se e solo se f(x)
contiene almeno due elementi distinti: dato che due elementi distinti di C

devono assumere valori distinti in almeno un punto della palla unitaria B,


dalla densit`a di x
n

nN
+ si ricava facilmente che
D D
0
=
_
n,mN
+
A
nm
.
Basta allora provare che ciascun A
nm
`e chiuso in D. Sia dunque z
k

kN

A
nm
una successione convergente ad un elemento z D, e proviamo che
z A
nm
. Per ogni k esistono
k
,
k
f(z
k
) tali che (
k

k
)(x
n
)
1
m
. Notiamo adesso che, per la proposizione 2.4.5, f `e lipschitziana in una
palla B(z, ); losservazione 5.1.7 ci dice allora che i sottodierenziali f(z
k
)
sono equilimitati per ogni k k
0
, ove k
0
`e la soglia a partire dalla quale
si ha z
k
B(z, /2). Quindi esiste M 0 tale che |
k
|
X
, |
k
|
X
M
per ogni k N
+
. Per debole* compattezza, possiamo supporre, a meno di
sottosuccessioni, che
k

e
k

in X

. Pertanto
(y z) = lim
k

k
(y z
k
) lim
k
[f(y) f(z
k
)] = f(y) f(z) y X,
cio`e f(z); analogamente si vede che f(z). Inoltre
( )(x
n
) = lim
k
(
k

k
)(x
n
)
1
m
,
il che prova che z A
nm
e dunque A
nm
`e chiuso in D.
Dimostriamo adesso che D A
nm
`e denso in D: da ci`o seguir`a che anche
DD
0
=

n,mN
+
[DA
nm
] `e denso in D, concludendo cos` la dimostrazione.
Sia x
0
D. Per ogni n sia I
n
= s R : x
0
+ sx
n
D: I
n
`e un intervallo
aperto non vuoto. La funzione f
1
(r) = f(x
0
+rx
n
), r I
n
, `e derivabile salvo
al pi` u un insieme numerabile di punti (esercizio 5.2.5): dunque esiste una
successione di punti della forma x

h
= x
0
+ r
h
x
n
, convergente a x
0
, tale che
f

1
(r
h
) esiste per ogni h N. Ne segue che se , f(x

h
) le restrizioni
183
di e allo spazio [x
n
] appartengono a f
1
(r
h
) per ogni h, ed essendo
f
1
(r
h
) = f

1
(r
h
) si deduce x
n
= x
n
. Ci`o mostra che x

h
/ A
nm
per ogni
m N
+
, e che quindi il punto x
0
`e approssimabile da punti x

h
D A
nm
.
La tesi `e cos provata.
Proviamo inne due risultati che estendono al caso di spazi normati due ben
note caratterizzazioni della convessit`a per funzioni derivabili su R.
Proposizione 5.2.4 Sia X uno spazio normato reale, sia K X un con-
vesso non vuoto e sia f : K R una funzione G-dierenziabile. Allora f `e
convessa se e solo se
f() f(x) +f

G
(x)( x) , x K.
Dimostrazione Sia f convessa: dopo averla prolungata a tutto X ponendola
uguale a + nei punti di X K, siamo nelle ipotesi della proposizione
5.2.3; ne segue f(x) = f

G
(x) per ogni x K, e da qui segue subito la
disuguaglianza cercata.
Viceversa, applichiamo la disuguaglianza alle coppie di punti (u, (1)u+v)
e (v, (1 )u +v), con u, v K e [0, 1]: si ottiene
f(u) f((1 )u +v) +f

G
((1 )u +v)(u v),
f(v) f((1 )u +v) + (1 )f

G
((1 )u +v)(v u).
Moltiplichiamo la prima disuguaglianza per (1 ) e la seconda per , e poi
sommiamo: il risultato `e
(1 )f(u) +f(v) f((1 )u +v),
cosicche f `e convessa.
Proposizione 5.2.5 Sia X uno spazio normato reale, sia K X un con-
vesso non vuoto e sia f : K R una funzione G-dierenziabile. Allora f
`e convessa se e solo se il suo dierenziale di Gateaux f

G
: K X

`e un
operatore monotono, ossia
[f

G
(u) f

G
(v)](u v) 0 u, v K.
Dimostrazione Sia f convessa: ssati u, v K, per la proposizione 5.2.4 si
ha
f(v) f(u) +f

G
(u)(v u), f(u) f(v) +f

G
(v)(u v);
184
sommando queste due disuguaglianze si ha
0 f

G
(u)(v u) +f

G
(v)(u v),
da cui la monotonia di f

G
.
Viceversa, sia f

G
monotono. Fissati u, v K, poniamo
() = f((1 )u +v), [0, 1].
Chiaramente `e derivabile e

() = f

G
((1 )u +v)(v u) [0, 1];
dalla monotonia di f

G
segue che se < si ha

()

() =
_
f

G
((1 )u +v) f

G
((1 )u +v)
_
(v u) =
=
1

_
f

G
((1 )u +v) f

G
((1 )u +v)
_

_
[(1 )u +v] [(1 )u +v]
_
0.
In altre parole,

: R R `e crescente: ne segue che `e convessa in [0, 1].


Pertanto
f((1 )u +v) = () (1 )(0) +(1) = (1 )f(u) +f(v),
cio`e f `e convessa su K.
Osservazione 5.2.6 Con lo stesso ragionamento usato nella prima parte
della dimostrazione precedente, `e facile dedurre la seguente propriet`a: se X
`e uno spazio normato reale e se f : X R `e una funzione convessa, allora si
ha
( )(u v) 0 f(u), f(v)
(talvolta naturalmente potr`a succedere che i sottodierenziali in questione
siano vuoti). Si esprime questo fatto dicendo che il sottodierenziale `e mo-
notono, quantunque esso non sia un operatore da X in X

; ci`o trover`a piena


giusticazione pi` u avanti, nel pi` u ampio contesto delle multifunzioni.
185
Esercizi 5.2
1. Si costruisca una funzione f : R R convessa, tale che 0

D(f) e f
sia continua in 0, ma risulti f(x) = per ogni x

D(f).
2. Sia K un convesso non vuoto dello spazio normato reale X, e sia f :
K R una funzione G-dierenziabile. Si provi che f `e strettamente
convessa se e solo se
f(v) > f(u) +f

G
(u)(v u) u, v K con u ,= v.
3. Sia X uno spazio normato reale e siano f, g : X ] , +] convesse
e proprie. Se esiste x
0
D(f) D(g) tale che f `e continua in x
0
, si
provi che risulta
(f +g)(x) = f(x) +g(x) x D(f) D(g).
[Traccia: si osservi che, per lesercizio 5.1.2, basta provare linclusione
(). Fissato x D(f) D(g), sia X

tale che f() + g()


( x) +f(x) +g(x) per ogni X. Si deniscano
C = (, a) X R : f() f(x) ( x) a,
D = (, b) X R : b g(x) g();
si mostri che C e D sono convessi e che

D = , con

C ,= . Si
applichi il lemma 2.3.6 ai convessi D e

C, e si deduca che esistono


X

, t > 0 e R tali che


+tb +ta (, b) D, (, a) C.
Scegliendo = e a = f() f(x) ( x) e b = g(x) g(), si
ricavi la relazione
g(x) g()

t


t
f() f(x) ( x) X.
Si concluda che = x e che

t
g(x),

t
f(x).]
186
4. Siano X, Y spazi normati reali, sia L(X, Y ) e sia f : Y ]
, +] una funzione convessa; supponiamo che esista y
0
D(f) tale
che f `e continua in y
0
. Si provi che
f (x) =

(f(x)) x
1
(D(f)).
[Traccia: Linclusione () `e facile. Per dimostrare laltra, si ssi
f (x), e si denisca
L = (, ( x) +f(x)) Y R : X.
Si provi che L `e convesso ed `e disgiunto dal convesso (non vuoto)

epi(f);
si determini un funzionale non nullo (, t) (Y R)

che separi i due


convessi, si mostri che t > 0 e si deduca che

t
f(x) e che
=

t
).]
5. Sia f : [a, b] R una funzione convessa. Si provi che f `e derivabile in
[a, b] N, ove N `e un insieme al pi` u numerabile.
[Traccia: Si utilizzi la ben nota relazione
f(v) f(u)
v u

f(w) f(u)
w u

f(w) f(v)
w v
per a u < v < w b
per dimostrare che
D
+
f(u) D

f(v) D
+
f(v) D

f(w) per a u < v < w b;


se ne deduca che se f non `e derivabile in x
0
allora x
0
`e un punto di
discontinuit`a della funzione crescente x D
+
f(x)...]
5.3 Regolarizzata di una funzione convessa
Vi `e un modo canonico di approssimare le funzioni convesse, valido in ogni
spazio di Hilbert reale ed assai utile in molte applicazioni, che andiamo ad
illustrare.
Sia H uno spazio di Hilbert reale e sia f : H ] , +] una funzione
convessa, semicontinua inferiormente e propria. Per ogni > 0 ed ogni
x H, consideriamo la funzione
g
,x
(y) =
1
2
|x y|
2
H
+f(y), y H.
187
Si vede immediatamente che g
,x
`e strettamente convessa, semicontinua infe-
riormente e propria.
Lemma 5.3.1 Nelle ipotesi sopra scritte, comunque si ssino > 0 e x H,
la funzione g
,x
ha un unico punto di minimo in H. Inoltre, un punto x
0
H
`e il punto di minimo di g
,x
se e solo se risulta
1

(x x
0
) f(x
0
).
Dimostrazione In virt` u della proposizione 2.3.7, esiste una funzione ane
tale che f in H, ossia esistono z H e b R tali che
g
,x
(y) =
1
2
|x y|
2
H
+f(y)
1
2
|x y|
2
H
+ (z, y)
H
+b y H.
Ne segue che g
,x
(y) + per |y|
H
. Dunque, per il corollario 2.3.4,
la funzione g
,x
ha almeno un punto di minimo in H. Poiche inoltre g
,x
`e
strettamente convessa, il punto di minimo `e unico.
Supponiamo che x
0
H sia tale che
1

(x x
0
) f(x
0
). Allora, per
denizione di sottodierenziale, f(x
0
) R e
f(y) f(x
0
)
1

(x x
0
, y x
0
)
H

(x x
0
, y x
0
)
H

1
2
|y x
0
|
2
H
=
=
1
2
(2x 2x
0
y +x
0
, y x
0
)
H
=
=
1
2
(x x
0
+x y, y x +x x
0
)
H
=
=
1
2
_
|x x
0
|
2
H
|x y|
2
H
_
;
ne segue che g
,x
ha minimo nel punto x
0
.
Viceversa, sia x
0
H lunico punto di minimo di g
,x
: allora, ssato y H
e scelto z = (1 t)x
0
+ ty, con t ]0, 1[, utilizzando la convessit`a di f ed
osservando che x z = x x
0
t(y x
0
), si pu`o scrivere
t[f(y) f(x
0
)] f(z) f(x
0
)

1
2
_
|x x
0
|
2
H
|x z|
2
H
_
=
=
t

(x x
0
, y x
0
)
H

t
2
2
|x
0
y|
2
H
t ]0, 1[,
188
da cui, dividendo per t e passando al limite per t 0
+
,
f(y) f(x
0
)
1

(x x
0
, y x
0
)
H
y H.
Ci` o mostra che
1

(xx
0
), o meglio il funzionale z
1

(xx
0
, z)
H
, appartiene
a f(x
0
). Il lemma `e provato. Si noti che lintero enunciato poteva anche
dedursi dallesercizio 5.2.3).
Indicheremo con y
,x
lunico punto di minimo della funzione g
,x
.
Ci` o premesso, andiamo a denire la regolarizzata di una funzione convessa.
Denizione 5.3.2 Sia f : H ] , +] una funzione convessa, semi-
continua inferiormente e propria su uno spazio di Hilbert reale H. Fissato
> 0, la regolarizzata di f `e la funzione cos` denita:
f

(x) = min
yH
g
,x
(y) = g
,x
(y
,x
), x H.
Naturalmente, la regolarizzata f

di una funzione f convessa, semicontinua


inferiormente e propria `e cosa diversa dalla regolarizzata semicontinua f di
una funzione convessa f, introdotta con la denizione 2.3.8.
Vediamo ora le principali propriet`a della regolarizzata f

.
Proposizione 5.3.3 Sia f : H ] , +] una funzione convessa, semi-
continua inferiormente e propria su uno spazio di Hilbert reale H. Per ogni
> 0 sia f

la regolarizzata di f. Allora:
(i) f

`e convessa, assume valori reali e verica


f(y
,x
) f

(x) f(x) x H;
(ii) f

`e F-dierenziabile in H e
f

(x) =
1

(x y
,x
) x H;
(iii) posto D = x H : f(x) ,= , si ha
_
_
_
_
1

(x y
,x
)
_
_
_
_
H
min|y|
H
: y f(x) x D;
189
(iv) linsieme D `e convesso e
lim
0
+
|y
,x
P
D
(x)|
H
= 0 x H;
(v) risulta
lim
0
+
f

(x) = f(x) x H.
Dimostrazione (i) Anzitutto, f

(x), essendo un minimo, `e un numero reale.


Per ogni x H si ha poi, per denizione,
f(y
,x
)
1
2
|x y
,x
|
2
H
+f(y
,x
) = f

(x) = min
yH
g
,x
(y) g
,x
(x) = f(x).
Proviamo la convessit`a di f

: per ogni x, x

H e [0, 1] si ha
f

(x + (1 )x

) = g
,x+(1)x
(y
,x+(1)x
)
g
,x+(1)x
(y
,x
+ (1 )y
,x
) =
=
1
2
|(x y
,x
) + (1 )(x

y
,x
)|
2
H
+f(y
,x
+ (1 )y
,x
)

1
2
_
|x y
,x
|
2
H
+ (1 )|x

y
,x
|
2
H

+
+f(y
,x
) + (1 )f(y
,x
) =
= g
,x
(y
,x
) + (1 )g
,x
(y
,x
) = f

(x) + (1 )f

(x

).
(ii) Proviamo anzitutto la disuguaglianza
_
_
_
_
1

(x y
,x
)
1

(x

y
,x
)
_
_
_
_
H

|x x

|
H
x, x

H.
In virt` u del lemma 5.3.1, si ha =
1

(xy
,x
) f(y
,x
) e

=
1

(x

y
,x
)
f(y
,x
); ne segue, essendo x = y
,x
+ e x

= y
,x
+

, e tenendo conto
dellosservazione 5.2.6,
(

, x x

)
H
= (

, (

))
H
+ (

, y
,x
y
,x
)
H
|

|
2
H
,
da cui la tesi.
Ci` o premesso, osservato che risulta, per denizione di sottodierenziale,
f(y
,x
) f(y
,x
) (, y
,x
y
,x
)
H
,
190
possiamo scrivere
f

(x

) f

(x) = f(y
,x
) +
1
2
|x

y
,x
|
2
H
f(y
,x
)
1
2
|x y
,x
|
2
H


2
(|

|
2
H
||
2
H
) + (, y
,x
y
,x
)
H
=
=

2
(|

|
2
H
||
2
H
) + (, x

x)
H
(,

)
H
,
da cui
f

(x

) f

(x) (, x

x)
H


2
_
|

|
2
H
||
2
H
2(,

)
H
_
=
=

2
_
|

|
2
H
+||
2
H
2(,

)
H
_
=
=

2
|

|
2
H
0.
Daltra parte, scambiando i ruoli di x e x

abbiamo anche
f

(x) f

(x

) (

, x x

)
H
0,
e quindi, in virt` u della disuguaglianza dimostrata preliminarmente,
f

(x

) f

(x) (, x

x)
H
=
= f

(x

) f

(x) (

, x

x)
H
+ (

, x

x)
H

(

, x

x)
H

1

|x

x|
2
H
.
Ne segue
0 f

(x

) f

(x) (, x

x)
H

1

|x

x|
2
H
,
cosicche f

`e F-dierenziabile in ogni x H, con f

(x) = =
1

(x y
,x
).
Ci` o prova (ii).
(iii) Dal lemma 5.3.1 segue che
1

(x y
,x
) f(y
,x
). Quindi
f(z) f(y
,x
)
1

(x y
,x
, z y
,x
)
H
z H,
da cui, scelto z = x, ricaviamo
1

|x y
,x
|
2
H
f(x) f(y
,x
) (y, x y
,x
)
H
y f(x).
191
Ne segue
_
_
_
_
1

(x y
,x
)
_
_
_
_
2
H

_
y,
1

(x y
,x
)
_
H
y f(x),
e ci`o implica la tesi, essendo linsieme |y|
H
: y f(x) non vuoto, chiuso
e limitato inferiormente in R.
(iv) Sia x H. Mostriamo anzitutto che linsieme y
,x

]0,1]
`e limitato in
H. Fissiamo u D e v f(u): ad esempio potremmo prendere u = y
1,x
e
v = x y
1,x
. Allora per il lemma 5.3.1 e losservazione 5.2.6 si ha
(x y
,x
v, y
,x
u)
H
0 u D, v f(u).
Ne segue la seguente fondamentale disuguaglianza:
|y
,x
|
2
H
(x, y
,x
u)
H
+ (y
,x
, u)
H
(v, y
,x
u)
H
.
Da questa relazione `e facile dedurre una disequazione di secondo grado del
tipo
|y
,x
|
2
H
A|y
,x
|
H
+B,
la quale implica la limitatezza di |y
,x
|
H
.
Pertanto linsieme y
,x

]0,1]
`e debolmente relativamente compatto nello
spazio di Hilbert H ed `e contenuto nel convesso chiuso K = co(D). Sia
n

una successione contenuta in ]0, 1] e tendente a 0, tale che y


n,x
x
0
in H;
allora x
0
K. Passando al minimo limite nella disuguaglianza fondamentale,
e ricordando che liminf
n0
|y
n,x
|
H
|x
0
|
H
, si ricava
(x x
0
, u x
0
)
H
0 u D;
per chiusura, per convessit`a e per densit`a, si deduce
(x x
0
, u x
0
)
H
0 u K.
Ma questa disequazione `e precisamente quella che caratterizza la proiezione
sul convesso chiuso K: quindi x
0
coincide con P
K
(x). Dato che lo stesso
ragionamento si pu`o fare per qualunque successione
n
contenuta in ]0, 1]
ed innitesima, concludiamo che y
,x
P
K
(x) per 0.
Adesso osserviamo che dalla disuguaglianza fondamentale segue, al limite per
0,
limsup
0
|y
,x
|
2
H
(x, P
K
(x) u)
H
+ (P
K
(x), u)
H
u D,
192
e ancora una volta questa relazione si estende ad ogni u K. Scegliendo
u = P
K
(x), si deduce
limsup
0
|y
,x
|
2
H
|P
K
(x)|
2
H
liminf
0
|y
,x
|
2
H
,
e quindi |y
,x
|
H
|P
K
(x)|
H
per 0. Essendo anche y
,x
P
K
(x), per
una nota propriet`a della convergenza debole si conclude che y
,x
P
K
(x) in
H per 0.
Inne, essendo y
,x
D, si ha P
K
(x) D per ogni x H, e quindi
K = R(P
K
) D. Ma per denizione di K si ha ovviamente D K; dunque
K = D e pertanto D, coincidendo col suo inviluppo convesso, `e esso stesso
convesso.
(v) Osserviamo prima di tutto che se 0 <

< risulta
f

(x) = inf
yH
_
1
2

|x y|
2
H
+f(y)
_
inf
yH
_
1
2
|x y|
2
H
+f(y)
_
= f

(x);
dunque esiste il limite di f

(x) per 0 e tenuto conto di (i) e (iii) si ha,


essendo f semicontinua inferiormente,
f(P
D
(x)) liminf
0
f(y
,x
) lim
0
f

(x) f(x) x H.
Se x D, questa relazione fornisce subito la tesi. Se invece x / D, allora
d = dist(x, D) > 0: quindi
1
2
|x y
,x
|
2
H

d
2
2
,
e pertanto
f(x) lim
0
f

(x) liminf
0
d
2
2
+f(P
D
(x)) = +,
da cui, ugualmente, la tesi.
Osservazione 5.3.4 Nelle ipotesi della proposizione 5.3.3, si vede facilmente
che D(f) coincide con D, ove D = x H : f(x) ,= . Infatti se x / D
si `e visto nella dimostrazione di (v) che f(x) = + e quindi x / D(f);
pertanto D(f) D e dunque D(f) D. Daltra parte, losservazione 5.1.2
ci dice che D D(f), il che implica D D(f).
193
Esercizi 5.3
1. Sia H uno spazio di Hilbert reale e sia f : H ] , +] una funzio-
ne convessa, semicontinua inferiormente e propria. Si provi che esiste
sempre almeno un punto x
0
tale che f(x
0
) ,= .
2. Sia H uno spazio di Hilbert reale e sia f : H ], +] una funzione
convessa, semicontinua inferiormente e propria. Detto y
,x
il punto di
minimo della funzione y
1
2
|xy|
2
H
+f(y), si provi la disuguaglianza
|y
,x
y
,x
|
H
2|x x

|
H
x, x

H.
3. Si calcoli esplicitamente la regolarizzata f

nei casi seguenti:


(a) H = R
N
, f(x) = [x[
2
N
;
(b) H = R, f(x) = dist(x, [a, b]);
(c) H spazio di Hilbert, f funzione ane;
(d) H spazio di Hilbert, f = I
K
, K convesso chiuso di H;
(e) H spazio di Hilbert, f(x) = dist(x, K), K convesso chiuso di H.
194
Capitolo 6
Disequazioni variazionali
6.1 Problemi variazionali con vincoli convessi
Negli spazi di Banach riessivi le funzioni convesse e semicontinue inferior-
mente hanno minimo sui chiusi limitati ed anche, sotto ipotesi convenienti, su
quelli non limitati (teorema 2.3.3 e corollario 2.3.4). Una caratteristica tipica
di questo genere di problemi (ossia dei problemi di minimizzazione di funzio-
nali convessi su vincoli a loro volta convessi) `e la possibilit`a di caratterizzare
i punti di minimo come soluzioni di opportune disequazioni variazionali. Il
prototipo di tali disequazioni `e quello che contraddistingue la proiezione su
un convesso chiuso in uno spazio di Hilbert reale: u = P
K
(x) se e solo se u `e
il punto di minimo in K della funzione v |x v|
2
X
, e ci`o accade se e solo
se
u K, (u x, v u)
X
0 v K
(esercizio 2.3.6). Pi` u in generale si ha il seguente risultato:
Teorema 6.1.1 Sia X uno spazio normato reale, sia K X un convesso
non vuoto, e sia f : K R convessa e G-dierenziabile, con f

G
: K X

continua. Allora sono fatti equivalenti:


(i) u K e f(u) = min
vK
f(v);
(ii) u K e f

(u)(v u) 0 per ogni v K;


(iii) u K e f

(v)(v u) 0 per ogni v K.


195
Si noti che f `e di classe C
1
per il corollario 3.3.3, quindi la notazione f

anziche f

G
`e giusticata.
Dimostrazione (i) = (ii) Per ogni v K e ]0, 1[ si ha f(u)
f(u +(v u)); quindi
1

[f(u +(v u)) f(u)] 0 ]0, 1[.


Per 0
+
si ottiene f

(u)(v u) 0 per ogni v K. Si osservi che in


questa implicazione non si `e usata lipotesi di convessit`a.
(ii) = (i) Poiche f `e convessa, i rapporti incrementali di f sono crescenti
(esercizio 2.1.3); quindi, se u K verica (ii) si ha
f(v) f(u)
1

[f(u +(v u)) f(u)] f

(u)(v u) 0 v K.
(ii) = (iii) Per la proposizione 5.2.5 f

`e un operatore monotono, cio`e


[f

(v) f

(u)](v u) 0 u, v K;
quindi se u K verica (ii) si ottiene immediatamente che vale anche (iii).
(iii) = (ii) Se w K e ]0, 1[, scegliamo in (iii) v = (1 )u +w: si
trova
f

((1 )u +w)((w u)) 0,


e dopo aver diviso per , per 0 si ottiene (ii) in virt` u della continuit`a
di f

(si noti che tale ipotesi viene sfruttata esclusivamente qui).


Nei prossimi paragra vedremo risultati pi` u generali ed incontreremo altri
esempi di disequazioni variazionali.
Esercizi 6.1
1. Sia K R
N
un convesso chiuso non vuoto e sia A un aperto di R
N
contenente K. Si provi che se f : A R `e una funzione di classe C
1
che ha minimo in K nel punto x
0
, allora
gradf(x
0
) (x x
0
) 0 x K;
si deduca che se x
0

K
allora (ovviamente) gradf(x
0
) = 0.
196
2. Siano f
1
, . . . f
k
funzioni convesse di classe C
1
denite su R
N
; posto
K = x R
N
: f
i
(x) 0, i = 1, . . . , k,
si supponga che

K
,= e che gradf
i
(x) ,= 0 per ogni x K e per ogni
i = 1, . . . , k. Sia poi F : K R
N
una funzione continua. Se in un
punto x
0
K risulta
F(x
0
) (x x
0
) 0 x K,
si provi che esistono
1
, . . . ,
k
0 tali che
F(x
0
) +
k

i=1

i
gradf
i
(x
0
) = 0;
i
f
i
(x
0
) = 0, i = 1, . . . , k
(i numeri
i
si dicono moltiplicatori di Lagrange).
[Traccia: lunico caso non banale `e quando x
0
K e F(x
0
) ,= 0.
In questo caso si provi preliminarmente che il cono normale N
K
(x
0
)
(denito nellesercizio 5.1.4) `e dato da
N
K
(x
0
) =
_

iI

i
gradf
i
(x
0
),
i
0
_
,
ove I = i 1, . . . , k : f
i
(x
0
) = 0 (a tale scopo si ragioni per assurdo
utilizzando il teorema di Hahn-Banach). Ci`o premesso, si osservi che
liperpiano F(x
0
) (xx
0
) = 0 `e di appoggio per K in x
0
e se ne deduca
il risultato.]
6.2 Forme bilineari
Consideriamo un caso speciale, ma importante, del teorema 6.1.1. Sia X uno
spazio di Banach reale riessivo e sia a : XX R una forma bilineare, ossia
unapplicazione lineare separatamente nei suoi due argomenti. Supponiamo
che la forma a sia simmetrica (ovvero verichi a(u, v) = a(v, u) per ogni
u, v X), continua (cio`e esista M 0 tale che
[a(u, v)[ M|u|
X
|v|
X
u, v X)
197
e coerciva (ossia esista > 0 tale che
a(u, u) |u|
2
X
u X).
Fissato X

, il funzionale
f(u) = a(u, u) 2u, u X,
verica le condizioni del teorema 6.1.1. Infatti f `e F-dierenziabile perche
per ogni u, v K si ha
f(v) f(u) = a(v u, u) +a(u, v u) +a(v u, v u) 2(v u) =
= 2a(u, v u) 2(v u) +a(v u, v u),
cosicche
f

(u)w = 2a(u, w) 2w, w X, u X.


Si noti che f

: X X

`e continua, anzi lipschitziana:


[[f

(v) f

(u)]w[ = [2a(v u, w)[ 2M|v u|


X
|w|
X
w X,
da cui |f

(v) f

(u)|
X
2M|u v|
X
. Poi, f `e strettamente convessa:
infatti si ha
a(v u, v u) 0, a(v u, v u) = 0 v = u,
da cui 2a(u, v) a(u, u) + a(v, v) con luguaglianza se e solo se u = v; ne
segue, per ogni ]0, 1[,
a((1 )u +v, (1 )u +v) =
= (1 )
2
a(u, u) + 2(1 )a(u, v) +
2
a(v, v)
(1 )
2
a(u, u) +(1 )[a(u, u) +a(v, v)] +
2
a(v, v) =
= (1 )a(u, u) +a(v, v),
con luguaglianza se e solo se u = v. Pertanto u a(u, u) `e strettamente
convessa e dunque tale `e anche f. Inne, f(u) tende a + per |u|
X
,
in quanto
f(u) |u|
2
X
2||
X
|u|
X
= |u|
X
[|u|
X
2||
X
].
198
Possiamo allora concludere che f ha minimo unico in ogni chiuso convesso
non vuoto contenuto in X. Per il teorema 6.1.1, per ogni convesso chiuso non
vuoto K X esiste un unico u K che risolve la disequazione variazionale
a(u, v u) (v u) v K,
od equivalentemente
a(v, v u) (v u) v K.
Si noti che se K `e limitato, per avere la sola esistenza di punti di minimo
basta che la forma a(u, v) sia continua, simmetrica e non negativa.
Osservazione 6.2.1 Lequivalenza fra il problema di minimo e la risolubi-
lit`a della disequazione variazionale nella situazione precedente `e dovuta alla
simmetria della forma bilineare: quando a non `e simmetrica, un punto u `e
di minimo per u a(u, u) 2u in K se e solo se verica
a(u, v u) +a(v u, u) (v u) v K,
e questa disequazione variazionale non `e equivalente alla precedente.
`
E interessante osservare che, anche quando la forma bilineare non `e simme-
trica, la disequazione variazionale
a(u, v u) (v u) v K,
`e risolubile, come mostra il risultato che segue: naturalmente la soluzione di
essa non sar`a, in generale, punto di minimo per u a(u, u) 2u.
Proposizione 6.2.2 Sia X uno spazio di Banach reale riessivo e sia a :
X X R una forma bilineare, continua e coerciva. Se K X `e un
convesso chiuso non vuoto, e se X

, allora esiste un unico u K tale


che
a(u, v u) (v u) v K,
o equivalentemente
a(v, v u) (v u) v K.
199
Dimostrazione Per lequivalenza fra le due formulazioni della disequazione
variazionale, rimandiamo allesercizio 6.2.1.
Poniamo
(u, v) =
a(u, v) +a(v, u)
2
, (u, v) =
a(u, v) a(v, u)
2
;
le forme bilineari e sono la parte simmetrica e la parte antisimmetrica di
a.
`
E chiaro che `e simmetrica, continua e coerciva con le stesse costanti
di a, mentre `e continua (e (u, v) = (v, u) per ogni u, v X). Sia la
costante di coercivit`a di a ed ; sia poi
N = sup
u,vX\{0}
[(u, v)[
|u|
X
|v|
X
.
e deniamo per ogni t [0, 1]
a
t
(u, v) = (u, v) +t(u, v);
anche la forma a
t
`e coerciva con la stessa costante . Dimostreremo fra poco
il seguente
Lemma 6.2.3 Nelle ipotesi precedenti, sia [0, 1[ tale che per ogni
X

esista un unico u K per cui


a

(u, v u) (v u) v K.
Allora la stessa propriet`a vale per ogni t
_
, +

N
_
.
Da questo lemma segue subito la tesi della proposizione 6.2.2: infatti la
disequazione variazionale
a

(u, v u) (v u) v K
`e risolubile per = 0 (perche la forma a
0
= `e simmetrica); quindi ripetute
applicazioni del lemma ci danno la risolubilit`a per ogni
_
0,

N
_
, per ogni

_
0,
2
N
_
, per ogni
_
0,
3
N
_
, eccetera, nche dopo un numero nito di
passi avremo la risolubilit`a per ogni [0, 1]. Dato che a
1
= a, avremo la
tesi.
Dimostrazione del lemma 6.2.3 Fissato t
0

_
0,

N
_
, sia t [, + t
0
].
Riscriviamo la disequazione variazionale associata a t nel modo seguente:
a

(u, v u) (t )(u, v u) +(v u) v K.


200
Per ogni w X sia
w
il funzionale denito da

w
(v) = (t )(w, v) +v, v X;
allora
w
X

e
|
w
|
X
(t )N|w|
X
+||
X
.
Quindi, per ipotesi, esiste un unico u K tale che
a

(u, v u)
w
(v u) v K;
poiche u `e funzione di w, scriviamo u = (w). Proviamo che : X K `e
una contrazione: se w
1
, w
2
X e u
1
= (w
1
), u
2
= (w
2
), si ha
|u
2
u
1
|
2
X
a

(u
2
u
1
, u
2
u
1
) =
= a

(u
2
, u
2
u
1
) a

(u
1
, u
2
u
1
)

w
2
(u
2
u
1
)
w
1
(u
2
u
1
) = (
w
2

w
1
)(u
2
u
1
)
|
w
2

w
1
|
X
|u
2
u
1
|
X
.
Poiche
w
2

w
1
= (t )(w
2
w
1
, ), dalla relazione precedente segue
|u
2
u
1
|
X

t

|(w
2
w
1
, )|
X

(t )N

|w
2
w
1
|
X

t
0
N

|w
2
w
1
|
X
;
dato che t
0
<

N
, `e una contrazione.
Essendo X uno spazio di Banach, lapplicazione : X K ha un unico
punto sso w K: lequazione w = (w) signica
a

(w, v w) (t )(w, v w) +(v w) v K,


cio`e w risolve la disequazione variazionale relativa alla forma a
t
.
Osservazione 6.2.4 Se X `e uno spazio di Hilbert reale, ogni forma bilineare
a : X X R continua individua univocamente, in virt` u del teorema di
Riesz-Frech`et, un operatore A L(X) tale che
a(u, v) = (Au, v)
X
u, v X.
201
Le propriet`a della forma a si traducono in corrispondenti propriet`a dellope-
ratore A: in eetti, a `e simmetrica se e solo se A `e autoaggiunto, a `e non
negativa se e solo se A `e monotono, ed inne a `e coerciva se e solo se A
`e anchesso coercivo, nel senso che (Au, u)
X
|u|
2
X
per ogni u X. Si
noti che ci`o implica |Au|
X
|u|
X
per ogni u X, ma che questultima
propriet`a non implica la coercivit`a delloperatore A e della forma a (esercizio
6.2.2).
Corollario 6.2.5 (teorema di Lax-Milgram) Sia X uno spazio di Hil-
bert reale e sia A L(X) un operatore coercivo, ossia tale che
(Au, u)
X
|u|
2
X
u X,
con > 0. Allora per ogni X esiste un unico u X tale che Au = .
Dimostrazione La forma bilineare a(u, v) = (Au, v)
X
verica tutte le ipotesi
della proposizione 6.2.2 sul convesso K = X. Quindi esiste un unico u X
tale che
(Au, v u)
X
(, v u)
X
v X,
e scegliendo v = u w, con w X, si trova
(Au, w)
X
(, w)
X
w X,
ossia
(Au, w)
X
= (, w)
X
w X.
Ci` o prova che Au = .
Esercizi 6.2
1. Sia X uno spazio di Banach reale riessivo e sia a : X X R una
forma bilineare, continua e coerciva. Se K X `e un convesso chiuso
non vuoto, e se X

, si provi che un elemento u K risolve la


disequazione variazionale
a(u, v u) (v u) v K,
se e solo se risolve questaltra:
a(v, v u) (v u) v K.
202
2. Sia H uno spazio di Hilbert reale e sia a : H H R una forma
bilineare continua e simmetrica. Si dia un esempio in cui loperatore A
ad essa associato verica |Au|
X
|u|
X
per ogni u X senza che a
sia coerciva.
3. Stabilire per quali p, q, r, s R la forma quadratica
a(u, v) =
_
1
0
[pu

+qu

v +ruv

+suv] dx
`e coerciva sullo spazio di Hilbert H = u AC[0, 1] : u

L
2
(0, 1),
rispetto alla norma naturale |u|
H
=
_
|u|
2
L
2
(0,1)
+|u

|
2
L
2
(0,1)
.
6.3 Operatori monotoni
Losservazione 6.2.4 lascia intuire che per una forma bilineare la propriet`a
di monotonia delloperatore associato `e un buon surrogato della coercivit`a
della forma, con lulteriore vantaggio, come gi`a sappiamo, che la nozione di
operatore monotono ha senso anche nel caso di operatori non lineari. In
eetti vi `e una ricca teoria che riguarda le disequazioni variazionali in cui
compaiono operatori monotoni, e che trova applicazione in problemi non
lineari con vincoli convessi. Uno dei pi` u semplici risultati in questo ambito `e
la seguente facile generalizzazione dellenunciato del teorema 6.1.1:
Teorema 6.3.1 Sia X uno spazio di Banach reale riessivo, sia K X un
convesso chiuso non vuoto e sia f : K ], +] una funzione della forma
f = f
1
+ f
2
, con f
1
e f
2
funzioni convesse e semicontinue inferiormente;
supponiamo inoltre che f
1
sia G-dierenziabile, con f

1
: K X

continua,
e che f
2
sia propria. Allora sono fatti equivalenti:
(i) u K e f(u) = min
vK
f(v);
(ii) u K e f

1
(u)(v u) f
2
(u) f
2
(v) per ogni v K;
(iii) u K e f

1
(v)(v u) f
2
(u) f
2
(v) per ogni v K.
Dimostrazione Si tratta di una sostanziale ripetizione della dimostrazione
del teorema 6.1.1.
(i) = (ii) Poiche f
1
`e a valori in R (essendo G-dierenziabile) e f
2
`e
203
propria, si ha f(u) R. Poiche f(u) f((1 )u +v) per ogni ]0, 1] e
per ogni v K, dalla convessit`a di f
2
segue
f(u) = f
1
(u) +f
2
(u) f
1
((1 )u +v) +f
2
((1 )u +v)
f
1
((1 )u +v) + (1 )f
2
(u) +f
2
(v).
Mettendo a sinistra i termini contenenti f
1
e a destra quelli contenenti f
2
, e
dividendo per , si trova
1

[f
1
((1 )u +v) f
1
(u)] f
2
(u) f
2
(v);
per 0
+
si ottiene (ii).
(ii) = (i) Per la crescenza dei rapporti incrementali di f
1
e per ipotesi,
f
1
(v) f
1
(u) f

1
(u)(v u) f
2
(u) f
2
(v) v K,
cio`e f(v) f(u) per ogni v K.
(ii) = (iii) Facile conseguenza della monotonia di f

1
.
(iii) = (ii) Se v = (1 )u +w, con ]0, 1] e w K, si ha da (iii)
f

1
((1 )u +w)(w u) f
2
(u) f
2
((1 )u +w),
e per la convessit`a di f
2
f

1
((1)u+w)(wu) f
2
(u)(1)f
2
(u)f
2
(w) = [f
2
(u)f
2
(w)];
dividendo per ed utilizzando la continuit`a di f

1
, per 0
+
si ottiene (ii).
Esempio 6.3.2 Sia X uno spazio di Hilbert reale. Poniamo, per un ssato
x X,
f
1
(u) =
1
2
|u x|
2
X
, f
2
(u) = (u) u X,
ove : X ] , +] `e una funzione convessa, semicontinua inferiormente
e propria. Osserviamo che f = f
1
+ f
2
tende a + per |u|
X
: infatti,
ha una minorante ane (proposizione 2.3.7), cio`e esistono y X e R
per cui (u) (y, u)
X
+ per ogni u X; ne segue
204
f(u)
1
2
|u x|
2
X
|y|
X
|u|
X
[[ + per |u|
X
.
Per il corollario 2.3.4, f ha un unico punto di minimo su X, essendo stretta-
mente convessa. In particolare, per il teorema 6.3.1, esiste un unico u K
tale che
(u x, v u)
X
(u) (v) v X.
Tale u, evidentemente, dipende dal pressato x; scriviamo dunque u = p

(x).
Lapplicazione p

: X D() si chiama applicazione di prossimit`a (relativa


alla prescelta).
Se, ad esempio, K `e un convesso chiuso non vuoto di X, e scegliamo
(u) = I
K
(u) =
_
0 se u K
+ se u / K,
allora non `e dicile vedere che p

= P
K
(la proiezione sul convesso K).
Osserviamo che p

`e continua, anzi lipschitziana: infatti se x


1
, x
2
X e
u
1
= p

(x
1
), u
2
= p

(x
2
), sostituendo u
1
e u
2
nella disequazione variazionale
risolta rispettivamente da u
2
e u
1
, si ottiene
(u
1
x
1
, u
2
u
1
)
X
(u
1
) (u
2
),
(u
2
x
2
, u
1
u
2
)
X
(u
2
) (u
1
);
sommando le due relazioni deduciamo
(x
1
x
2
, u
1
u
2
)
X
|u
1
u
2
|
2
X
0,
da cui
|u
1
u
2
|
2
X
(x
1
x
2
, u
1
u
2
)
X
|x
1
x
2
|
X
|u
1
u
2
|
X
,
e quindi
|u
1
u
2
|
X
= |p

(x
1
) p

(x
2
)|
X
|x
1
x
2
|
X
.
Il pi` u importante risultato nella teoria delle disequazioni variazionali `e il
teorema che segue.
Teorema 6.3.3 (di Lions-Stampacchia) Sia X uno spazio di Banach
reale riessivo, sia g : X ] , +] una funzione convessa, semicontinua
inferiormente e propria, e sia A : X X

un operatore (non necessaria-


mente lineare) tale che:
205
(i) A `e demicontinuo (cio`e continuo rispetto alla topologia debole* di X

sui sottospazi di X nito-dimensionali);


(ii) A `e monotono;
(iii) esiste v
0
D(g) per cui
lim
v
X

A(v)(v v
0
) +g(v)
|v|
X
= +.
Allora per ogni X

esiste u D(g) tale che


A(u)(v u) +g(v) g(u) (v u) v X.
Inoltre se A `e strettamente monotono, ossia [A(v) A(u)](v u) > 0 per
ogni u, v X con u ,= v, allora la soluzione della disequazione variazionale
`e unica.
Lipotesi (ii) signica che se Y X `e un sottospazio nito-dimensionale,
allora per ogni ssato u X la funzione reale y A(y)u `e continua.
Dimostrazione Proveremo la tesi in tre passi.
1
o
passo: dim(X) < e D(g) limitato in X.
Poiche X ha dimensione nita, X X

R
N
e la dualit`a fra X e X

`e
espressa dal prodotto scalare di R
N
. Si noti che A : R
N
R
N
`e continua.
Risulta
u D(g), A(u)(v u) +g(v) g(u) (v u) v X
se e solo se
u D(g), (u (u + A(u)), v u)
X
+g(v) g(u) 0 v X,
ossia se e solo se
u = p
g
(u + A(u)),
ove p
g
`e lapplicazione di prossimit`a relativa a g, denita nellesempio 6.3.2.
Poiche D(g) `e convesso e limitato, D(g) `e convesso e compatto. La restrizione
a D(g) della funzione
r(u) = p
g
(u + A(u)), u X,
206
manda D(g) in se, anzi addirittura in D(g), ed `e continua; per il teorema
di Brouwer, esiste almeno un punto sso u = r(u) D(g). Tale punto sso
risolve, per costruzione, la disequazione variazionale.
2
o
passo: dim(X) < .
Per r > 0 deniamo g
r
: X ] , +] nel modo seguente:
g
r
(u) = g(u) +I
{uX:u
X
r}
(u) =
_
g(u) se |u|
X
r
+ se |u|
X
> r.
La funzione g
r
`e convessa e semicontinua inferiormente; se r > |v
0
|
X
, essa
`e anche propria con dominio D(g
r
) u X : |u|
X
r, dunque limitato.
Quindi, per il 1
o
passo, esiste u
r
D(g
r
) tale che
(A(u
r
), v u
r
)
X
+g
r
(v) g
r
(u
r
) (v u
r
) v X.
Se r > |v
0
|
X
, scegliendo v = v
0
otteniamo g
r
(v
0
) = g(v
0
) < e
(A(u
r
), v
0
u
r
)
X
+g(v
0
) g(u
r
) (, v
0
u
r
)
X
,
da cui
(A(u
r
), u
r
v
0
)
X
+g(u
r
)
|u
r
|
X

1
|u
r
|
X
[(, u
r
v
0
)
X
+g(v
0
)].
Quindi se per una successione r
k
si avesse |u
r
k
|
X
, dallipotesi
(iii) dedurremmo che il primo membro della disuguaglianza tenderebbe a +
per k , mentre il secondo sarebbe limitato. Ci`o `e assurdo e pertanto
esiste K > 0 tale che
sup
r>0
|u
r
|
X
= K < .
Poiche X ha dimensione nita, deduciamo che esiste una successione u
rn

estratta dalla famiglia u


r

r>0
tale che u
rn
u per n . Dallipotesi (i)
segue che A(u
rn
) A(u) in X

X. Passando al limite per n nella


relazione
(A(u
rn
), v u
rn
)
X
+g
rn
(v) g
rn
(u
rn
) (, v u
rn
)
X
v X
e tenendo conto che denitivamente risulta g
rn
(u
rn
) = g(u
rn
) e g
rn
(v) = g(v)
per ogni v X, si ottiene
(A(u), v u)
X
+g(v) + limsup
n
(g(u
rn
) (, v u)
X
v X,
207
da cui, per la semicontinuit`a inferiore di g,
(A(u), v u)
X
+g(v) +g(u) (, v u)
X
v X,
che `e la tesi del 2
o
passo.
3
o
passo: caso generale. Sia 1 la famiglia dei sottospazi M X nito-
dimensionali e contenenti v
0
. Per il 2
o
passo, per ogni M 1 esiste u
M

D(g) M tale che
A(u
M
)(v u
M
) +g(v) g(u
M
) (v u
M
) v M.
Scelto v = v
0
M, ripetendo largomentazione svolta nel 2
o
passo si deduce
sup
MV
|u
M
|
X
= K < .
A questo punto ci serve un lemma per mettere la disequazione variazionale
in forma pi` u comoda.
Lemma 6.3.4 Nelle ipotesi precedenti, se M `e un sottospazio di X, per un
elemento u M D(g) i seguenti fatti sono equivalenti:
(i) A(u)(v u) +g(v) g(u) (v u) per ogni v M;
(ii) A(v)(v u) +g(v) g(u) (v u) per ogni v M.
Dimostrazione Si fa esattamente come nella dimostrazione (ii) (iii)
dei teoremi 6.1.1 e 6.3.1; nella parte (=) si usa lipotesi di monotonia di A,
mentre nella parte (=) si utilizza la demicontinuit`a di A.
Continuiamo la dimostrazione del teorema di Lions-Stampacchia. Sia v X
e poniamo
S(v) = u D(g) : |u|
X
K, A(v)(v u) +g(v) g(u) (v u).
Linsieme S(v) `e un convesso chiuso (eventualmente vuoto) di X, in quanto
g `e convessa e semicontinua inferiormente. Quindi S(v) `e debolmente chiuso.
Essendo anche limitato, dalla riessivit`a di X segue che S(v) `e debolmente
compatto. Se dimostriamo che

vX
S(v) ,= ,
208
allora esiste u X tale che |u|
X
K e
A(v)(v u) +g(v) g(u) (v u) v X;
dal lemma 6.3.4 seguir`a che u risolve la disequazione variazionale e ci`o prover`a
lenunciato principale del teorema.
Per mostrare che gli S(v) hanno intersezione non vuota, trattandosi di insiemi
w-chiusi contenuti nella palla w-compatta B(0, K), `e suciente far vedere
che vale la propriet`a dellintersezione nita, ossia che per ogni N N
+
e
per ogni v
1
, . . . , v
N
X si ha

N
i=1
S(v
i
) ,= . Ma, ssati v
1
, . . . , v
N
X e
posto M
N
= [v
0
, v
1
, . . . , v
N
], si ha M
N
1 e quindi, per il 2
o
passo, esiste
u
N
M
N
D(g) tale che
A(u
N
)(v u
N
) +g(v) g(u
N
) (v u
N
) v M
N
,
ossia, per il lemma 6.3.4,
A(v)(v u
N
) +g(v) g(u
N
) (v u
N
) v M
N
.
Se in questa relazione sostituiamo v = v
i
, i = 1, . . . N, otteniamo che
u
N

N
i=1
S(v
i
). Ci`o, come si `e osservato, prova la tesi del 3
o
passo.
Resta da provare lunicit`a della soluzione quando A `e strettamente mono-
tono. Se u
1
, u
2
sono due soluzioni della disequazione variazionale, possiamo
sostituire ciascuno dei due nella disequazione vericata dallaltro: sommando
le due relazioni si ottiene
[A(u
1
) A(u
2
)](u
2
u
1
) 0.
Daltra parte, se u
1
,= u
2
deve aversi [A(u
1
) A(u
2
)](u
2
u
1
) < 0: ne segue
u
1
= u
2
.
Vediamo ora alcuni casi particolari del teorema di Lions-Stampacchia.
Corollario 6.3.5 Sia X uno spazio di Banach reale riessivo e sia K X
un convesso chiuso contenente lorigine; sia inoltre A : X X

un operatore
demicontinuo, monotono e tale che
lim
v
X

A(v)v
|v|
X
= +.
Allora per ogni X

esiste u K tale che


A(u)(v u) (v u) v K.
209
Dimostrazione Basta porre g = I
K
(la funzione indicatrice di K) e v
0
= 0,
ed applicare il teorema 6.3.3.
Corollario 6.3.6 Sia X uno spazio di Banach reale riessivo e sia A : X
X

un operatore demicontinuo, monotono e tale che


lim
v
X

A(v)v
|v|
X
= +.
Allora A `e surgettivo.
Dimostrazione Fissato X

, si applichi il corollario precedente con


K = X: si ottiene lesistenza di un u X tale che
A(u)(v u) (v u) v X.
Scelto v = u w con w X, si deduce
(A(u) )w = 0 w X,
cio`e A(u) = .
Osservazione 6.3.7 Se g `e convessa, semicontinua inferiormente e propria,
un elemento u X risolve la disequazione variazionale
A(u)(v u) +g(v) g(u) (v u) v X
se e solo se, per denizione di sottodierenziale, A(u) g(u). In
particolare, u risolve
u K, A(u)(v u) (v u) v K
se e solo se A(u) I
K
(u).
Esercizi 6.3
1. Si verichi che ogni applicazione di prossimit`a `e un operatore monoto-
no.
210
2. Sia X uno spazio di Banach reale riessivo, sia g : X ] , +]
una funzione convessa, semicontinua inferiormente e propria, e sia K
un convesso chiuso di X tale che KD(g) ,= . Sia inoltre A : X X

un operatore demicontinuo, monotono e tale che esista v


0
D(g) K
per cui
lim
v
X

A(v)(v v
0
) +g(v)
|v|
X
= +.
Si provi che per ogni X

esiste almeno un u K tale che


A(u)(v u) +g(v) g(u) (v u) v K.
6.4 Filo elastico teso sopra un ostacolo
Come applicazione della teoria delle disequazioni variazionali, consideriamo
un lo elastico teso fra due estremi di ascisse a e a, con a > 0 ssato, e
vincolato a stare al di sopra di un ostacolo (x). La congurazione u(x)
assunta dal lo sar`a tale da minimizzare lenergia in gioco, che, in assenza di
forze esterne, `e descritta dal funzionale
J(u) =
1
2
_
a
a
[p(x)u

(x)
2
+q(x)u(x)
2
]dx,
dove p(x) `e la densit`a del lo nel punto di ascissa x e q(x) `e il coeciente di
elasticit`a del lo nello stesso punto; il primo termine nellintegrale `e lenergia
potenziale dovuta alla sua massa, mentre il secondo `e lenergia di deforma-
zione elastica immagazzinata dal lo.
Supporremo p, q, C[a, a] con p > 0 e q 0 in [a, a]; anche lostacolo
non interferisca col lo nei punti di ssaggio, supporremo anche (a) < 0
e (a) < 0. Il problema `e quello di trovare una funzione u che minimizzi il
funzionale J nellinsieme delle funzioni per le quali esso ha senso, e che sono
in ogni punto non inferiori a (x).
Come spazio ambiente `e naturale scegliere
X = u AC[a, a] : u

L
2
(a, a), u(a) = u(a) = 0,
che `e uno spazio di Hilbert con il prodotto scalare
(u, v)
X
=
_
a
a
[u(x)v(x) +u

(x)v

(x)]dx u, v X.
211
La classe delle funzioni ammissibili `e descritta dallinsieme
K = u X : u(x) (x) x [a, a].
Per riuscire a minimizzare J bisogner`a vericare che K `e un convesso chiuso
e che J verica le ipotesi del teorema 2.3.3 o del corollario 2.3.4.
Proviamo anzitutto il seguente
Lemma 6.4.1 Nelle ipotesi precedenti, risulta
|u|
L
2
(a,a)

2a|u|
C[a,a]
2a|u

|
L
2
(a,a)
2a|u|
X
u X.
Dimostrazione Se u X si ha

_
a
a
[u[
2
dx

2a|u|
C[a,a]
=

2a sup
x[a,a]
[u(x) u(a)[ =
=

2a sup
x[a,a]

_
x
a
u

(t) dt

2a|u

|
L
2
(a,a)
2a|u|
X

2a .
`
E facile vedere che K `e un convesso. Esso `e ovviamente chiuso in C[a, a]
(con la norma uniforme) e quindi `e anche chiuso in X in virt` u della stima
fornita dal lemma precedente. Grazie alla limitatezza delle funzioni p e q, `e
chiaro che J `e continuo rispetto alla norma di X; inoltre risulta
lim
u
X

J(u) = + :
per provare ci`o, notiamo che
J(u) min
[a,b]
p |u

|
2
L
2
(a,a)
;
daltronde se |u|
X
allora si ha anche |u

|
L
2
(a,a)
, poiche al-
trimenti otterremmo, dal lemma 6.4.1, che nemmeno |u|
L
2
(a,a)
potrebbe
tendere allinnito, contro lipotesi |u|
X
. Si verica anche, facilmente,
che il funzionale J `e strettamente convesso.
Dal corollario 2.3.4 segue che J ha un unico punto di minimo u sul convesso
K. Poiche J `e dierenziabile secondo Frech`et, con
J

(u)h =
_
a
a
[p(x)u

(x)h

(x) +q(x)u(x)h(x)]dx h X,
212
per il teorema 6.1.1 il punto di minimo u `e lunica soluzione della disequazione
variazionale
u K, J

(u)(v u) 0 v K.
Vogliamo ora trovare le eventuali ulteriori propriet`a di regolarit`a del punto
di minimo vincolato u. A questo scopo conviene anzitutto analizzare il com-
portamento delloperatore J

: X X

, che in questo caso `e ovviamente


lineare e che denoteremo con A.
Lemma 6.4.2 Sia u il punto di minimo di J su K e sia Au = J

(u), cosicche
Au(v) =
_
a
a
(pu

+quv) dx v X.
Allora il funzionale Au X

verica le seguenti propriet`a:


(i) Au `e positivo, ossia
Au(g) 0 g X con g 0 in [a, a];
(ii) Au `e nullo sul complementare E = [a, a] D dellinsieme di contatto
D = x ] a, a[ : u(x) = (x), nel senso che
Au(g) = 0 g X con g = 0 in D.
Dimostrazione (i) Sia g X una funzione non negativa. Allora, posto
v = u + g, si ha v K; quindi, utilizzando la disequazione variazionale
soddisfatta da u, si ricava
Au(g) = J

(u)g = J

(u)(v u) 0.
(ii) Sia g X nulla in D: se g 0, ovviamente Au(g) = 0. Altrimenti, il
supporto di g sar`a un compatto contenuto in E, sul quale la funzione continua
u deve avere un minimo necessariamente positivo. Di conseguenza, si
ha v = u + tg K per [t[ <

g
e dunque, ancora dalla disequazione
variazionale,
t(Au)(g) = Au(tg) = J

(u)(v u) 0 per [t[ <



|g|

:
dato che il segno di t `e arbitrario, ci`o signica Au(g) = 0.
La prossima tappa, che `e il punto chiave di tutto il discorso, consiste nelle-
stendere il funzionale Au ad un elemento di (C[a, a])

. Preliminare a ci`o `e
il seguente risultato:
213
Lemma 6.4.3 Sia u il punto di minimo di J su K e sia Au il funzionale
denito nel lemma precedente. Allora esiste M 0 tale che
[Au(g)[ M|g|
L

(D)
g X,
ove D = x [a, a] : u(x) = (x).
Dimostrazione Supponiamo per assurdo che la tesi non sia vera: allora per
ogni j N
+
esiste g
j
X tale che |g
j
|
L

(D)

1
j
e [Au(g
j
)[ = 1. Notando
che D `e un compatto contenuto in ] a, a[, possiamo ssare una funzione
C
1
0
(] a, a[) tale che 0 1 e = 1 su D. Per ogni j N
+
sia poi

j
> 0 tale che
[g
j
(x)[
2
j
per d(x, D) = inf
yD
[x y[ <
j
,
e ssiamo per ogni j N
+
una funzione
j
C
1
0
(] a, a[) tale che
0
j
,
j
= 1 su D,
j
= 0 per d(x, D)
j
.
Allora [g
j

j
[
2
j
in [a, a], cosicche, utilizzando le propriet`a (i) e (ii) del
lemma 6.4.2, risulta
1 = [Au(g
j
)[ = [Au(g
j

j
) +Au(g
j
(1
j
))[ =
= [Au(g
j

j
)[ Au([g
j
[
j
)
2
j
Au().
Per j si ottiene lassurdo.
Corollario 6.4.4 Sia u il punto di minimo di J su K e sia Au il funzionale
denito nel lemma 6.4.2. Allora esiste ununica misura nita , denita su
una -algebra contenente i boreliani di [a, a], tale che
Au(g) =
_
a
a
g d g X;
inoltre `e concentrata sullinsieme di contatto D.
Dimostrazione Dal lemma 6.4.3 segue, in particolare,
[Au(g)[ M|g|
L

(D)
M|g|
C[a,a]
g X;
214
da qui `e facile dedurre, per densit`a, che il funzionale A si pu`o estendere a tutto
C[a, a] mantenendo valida la stessa disuguaglianza: infatti, se u C[a, a]
e se u
n
X converge uniformemente a u in [a, a], allora la disuguaglianza
precedente, applicata a u
n
u
m
, ci dice che Au
n
`e una successione di
Cauchy in C[a, a] e quindi converge ad una funzione v C[a, a]. Posto
Au = v, si vede subito che la denizione `e ben posta, e pertanto otteniamo
unestensione di A allo spazio C[a, a] che continua a vericare la relazione
precedente. Per la caratterizzazione del duale (C[a, a])

, esiste una misura


di Lebesgue-Stieltjes , denita su una -algebra contenente i boreliani di
[a, a] e associata a una funzione m(x) crescente e continua a sinistra in
[a, a], tale che
Au(g) =
_
a
a
g d g X.
Per quanto visto in precedenza, tale misura verica anche

_
a
a
g d

M|g|
L

(D)
g C[a, a].
Ci` o implica che `e concentrata sullinsieme D.
Inoltre la misura `e univocamente determinata: se
1
`e unaltra misura con
le stesse propriet`a, si ha infatti
_
D
gd =
_
a
a
gd = Au(g) =
_
a
a
gd
1
=
_
D
gd
1
g X
da cui, per densit`a,
_
D
gd =
_
D
gd
1
g C(D),
ossia =
1
.
Analizziamo nalmente le propriet`a di regolarit`a del punto di minimo u, sotto
opportune ipotesi sullostacolo .
Proposizione 6.4.5 Sia u il punto di minimo di J su K e sia E = x
[a, a] : u(x) > (x). Allora pu

C
1
(E) e (pu

+qu = 0 in E; se inoltre
lostacolo ha le derivate destra e sinistra

(x
+
) e

(x

), e se risulta

(x
+
)

(x

) in ogni punto x [a, a], allora la funzione u `e derivabile


in ogni punto di [a, a].
215
Questo enunciato ci dice che lipotesi chiave per avere la derivabilit`a di u in
[a, a] `e che i punti angolosi dellostacolo siano rivolti verso il basso, ossia
non siano punti di massimo locale: se ad esempio uno di quei punti fosse di
massimo assoluto per , esso, fatalmente, sarebbe un punto angoloso di u.
Dimostrazione Partiamo dalla relazione dimostrata nel lemma 6.4.4:
Au(g) =
_
a
a
g d g X,
e ricordiamo che la misura `e associata ad una funzione m : [a, a] R
crescente, continua a sinistra e nulla per x = a. Dal lemma 4.7.2 segue,
integrando per parti,
Au(g) =
_
a
a
g d =
_
a
a
g

mdx g X.
Dunque, ricordando la denizione del funzionale Au,
_
a
a
[(pu

+m)g

+qug] dx = 0 g X.
Applichiamo ora il lemma 4.2.3 alla funzione pu

+ m, nella versione pi` u


generale dellesercizio 6.4.2: si noti infatti che a priori pu

+ m `e soltanto
sommabile in [a, a], e non continua. Si ottiene che
[p(x)u

(x) +m(x)]

= q(x)u(x) q.o. in [a, a],


e in particolare pu

+ m C
1
[a, a]. Ma poiche `e concentrata su D =
[a, a] E, in ogni componente connessa di E la funzione m `e costante,
cosicche la derivata m

esiste ed `e nulla. Ne segue pu

C
1
(E) e (pu

= qu
in E.
Osserviamo poi che si ha, per unopportuna costante c,
u

(x) =
m(x)
p(x)
+
c
p(x)

1
p(x)
_
x
a
q(t)u(t)dt x [a, a].
e quindi u

ha limiti destro e sinistro in ogni punto, con


u

(x
+
) u

(x

) =
m(x
+
) m(x

)
p(x)
0 x ] a, a[;
216
in particolare u

`e continua nei punti di E.


Daltra parte, nei punti di D la funzione u ha minimo uguale a 0, da cui
(u )

(x
+
) 0 (u )

(x

) x D.
Dunque, per lipotesi fatta su ,
u

(x
+
)

(x
+
)

(x

) u

(x

) x D,
e pertanto
u

(x
+
) = u

(x

) x D.
Ci` o prova che u `e derivabile anche nei punti di D.
Esercizi 6.4
1. Si provi che nello spazio X = u AC[a, b] : u(a) = u(b) = 0 la
quantit`a |u

|
L
2
(a,b)
`e una norma equivalente alla norma naturale
|u|
X
=
_
|u|
2
L
2
(a,b)
+|u

|
2
L
2
(a,b)
.
2. Si provino queste generalizzazioni dei lemmi 4.2.1, 4.2.2 e 4.2.3:
(i) Sia L
1
(a, b) tale che
_
b
a
(x) (x) dx = 0 C
1
0
[a, b];
allora = 0 q.o. in [a, b].
(ii) Sia L
1
(a, b) tale che
_
b
a
(x)

(x) dx = 0 C
1
0
[a, b];
allora esiste c R tale che = c q.o. in [a, b].
(iii) Siano , L
1
(a, b) tali che
_
b
a
[(x) (x) +(x)

(x)] dx = 0 C
1
0
[a, b];
allora AC[a, b] con

= q.o. in [a, b].


217
3. Si supponga che lostacolo sia una funzione assolutamente continua
in [a, a]; si provi che se il funzionale
A(v) =
_
a
a
(p

+qv) dx, v X,
`e positivo, allora linsieme di contatto D `e un intervallo.
[Traccia: Si ragioni per assurdo, supponendo che esistano s, t D
e x [s, t] tali che u(x) > (x): posto v(x) = (x) per x [s, t] e
v(x) = u(x) per x [a, a] [s, t], si verichi che v K e che v u;
si deduca che [A Au](v u) 0 e che di conseguenza ( u)

= 0
in [s, t]. Di qui si arrivi allassurdo.]
218
Capitolo 7
Multifunzioni
7.1 Nomenclatura
Le multifunzioni, o funzioni multivoche, sono applicazioni che ad ogni punto
associano un insieme. Esse rivestono grande importanza in svariati problemi
della matematica applicata, e comprendono entro il proprio ambito, genera-
lizzandone la portata, la teoria delle disequazioni variazionali e dei problemi
al contorno per equazioni dierenziali.
Denizione 7.1.1 Siano X, Y insiemi. Una multifunzione `e unapplicazio-
ne F : X T(Y ). Linsieme F(x), per un ssato x X, `e il valore o
l immagine di x. Gli insiemi
D(F) = x X : F(x) ,= , R(F) = F(X) =
_
xX
F(x)
sono rispettivamente il dominio e l immagine di F. Il graco di F `e linsieme
G(F) = (x, y) X Y : y F(x).
Se A `e un sottoinsieme di X, l immagine di A mediante F `e linsieme
F(A) =
_
xA
F(x);
se B `e un sottoinsieme di Y , la controimmagine di B mediante F `e linsieme
F
1
(B) = x X : F(x) B ,= .
219
Osservazione 7.1.2 Se K `e un sottoinsieme di X e F : K T(Y ) `e una
multifunzione con dominio D(F) K, possiamo sempre estendere F ad una
multifunzione F : X T(Y ), ponendo
F(x) =
_
se x / K,
F(x) se x K.
Si ottiene in questo modo una multifunzione denita su tutto X, tale che
D(F) = D(F) K.
Quindi nel seguito, quando ci far`a comodo, potremo supporre di aver a che
fare con multifunzioni denite su tutto X.
Osservazione 7.1.3 Ogni multifunzione F : X T(Y ) `e univocamente
determinata dal suo graco G(F), nel senso che lapplicazione F G(F) `e
iniettiva ed anche surgettiva su T(X Y ). Infatti liniettivit`a `e pressocche
ovvia, mentre per la surgettivit`a basta osservare che ogni X Y `e il
graco della multifunzione J : X T(Y ) cos` denita:
J(x) = y Y : (x, y) x X.
Denizione 7.1.4 Sia F : X T(Y ) unarbitraria multifunzione. La sua
inversa `e la multifunzione F
1
: Y T(X) denita da:
F
1
(y) = x X : y F(x) y Y.
`
E facile vericare che D(F
1
) = R(F) e R(F
1
) = D(F); inoltre per ogni
x X e per ogni y Y si ha
(x, y) G(F) (y, x) G(F
1
).
Si noti che, coerentemente con la denizione di controimmagine mediante F,
risulta
F
1
(B) = x X : F(x) B ,= =
_
yB
F
1
(y) B Y.
Osservazione 7.1.5 Ad ogni funzione F : X Y corrisponde la multifun-
zione F : X T(Y ) denita da F(x) = F(x). In tal caso la multifunzione
F
1
`e semplicemente limmagine inversa (in senso insiemistico) della funzione
F, ossia
F
1
(y) = F
1
(y) = x X : F(x) = y y Y.
220
Esempi 7.1.6 (1) Se X `e uno spazio normato e f : X R `e una funzione
ssata, il sottodierenziale di f `e una multifunzione f : X T(X

), il cui
dominio `e linsieme dei punti in cui f `e sottodierenziabile.
Si osservi che se X `e riessivo e f `e convessa, semicontinua inferiormente e
propria, allora dal corollario 5.1.11 segue che
f(x) x J
1
f

() x X, X

,
ove J : X X

`e limmersione canonica; ne segue che le due multifunzioni


f : X T(X

) e J
1
f

: X

T(X) hanno dominio non vuoto e sono


una linversa dellaltra.
(2) Sia X uno spazio di Banach; per ogni x X poniamo
F(x) = X

: x = |x|
2
X
= ||
2
X
.
Il teorema di Hahn-Banach ci garantisce che F(x) ,= per ogni x X; quindi
la multifunzione F ha per dominio tutto X. Essa si chiama applicazione di
dualit`a.
Riprenderemo in esame questi esempi pi` u avanti.
Andiamo ora a denire le nozioni di semicontinuit`a e di continuit`a per multi-
funzioni, che sono sostanzialmente dierenti da quelle analoghe relative alle
funzioni. La continuit`a per una multifunzione non ha una naturale de-
nizione: se si prova ad estendere alle multifunzioni qualcuna delle svariate
caratterizzazioni di questa propriet`a valide per le funzioni, si ottengono con-
dizioni non pi` u equivalenti fra loro. Bisogna dunque fare una scelta fra le
varie possibilit`a, e la bont`a di tale scelta sar`a giusticata dalla sua utilit`a
nelle applicazioni.
Denizione 7.1.7 Siano X, Y spazi topologici e sia F : X T(Y ) una
multifunzione. Diciamo che F `e semicontinua superiormente nel punto x
0

X se per ogni aperto A F(x
0
) esiste un intorno U di x
0
in X tale che
F(U) A.
Diciamo che F `e semicontinua superiormente in X se F `e semicontinua
superiormente in ogni punto di X.
Si noti che se F `e una funzione questa denizione si riduce alla usuale nozione
di continuit`a.
221
Denizione 7.1.8 Siano X, Y spazi topologici e sia F : X T(Y ) una
multifunzione. Diciamo che F `e semicontinua inferiormente nel punto x
0

X se per ogni y
0
F(x
0
) e per ogni intorno N di y
0
in Y esiste un intorno
U di x
0
in X tale che
F(x) N ,= x U.
Diciamo che F `e semicontinua inferiormente in X se F `e semicontinua
inferiormente in ogni punto di X.
Anche questa denizione, allorche F `e una funzione, si riduce a quella di
continuit`a, in quanto la condizione F(x) N ,= diventa F(x) N.
Denizione 7.1.9 Siano X, Y spazi topologici e sia F : X T(Y ) una
multifunzione. Diciamo che F `e continua nel punto x
0
X se F `e sia
semicontinua superiormente che semicontinua inferiormente nel punto x
0
.
Diciamo che F `e continua in X se F `e continua in ogni punto di X.
Esempio 7.1.10 Siano F, G : R T(R) denite da:
F(x) =
_
[1, 1] se x = 0
0 se x ,= 0,
G(x) =
_
0 se x = 0
[1, 1] se x ,= 0.
Allora si verica facilmente che F `e semicontinua superiormente in R, ma
non `e semicontinua inferiormente nel punto 0, mentre G `e semicontinua
inferiormente in R ma non `e semicontinua superiormente nel punto 0.
Come vedremo, la semicontinuit`a superiore `e una propriet`a importante nello
studio dei punti ssi delle multifunzioni, mentre la semicontinuit`a inferiore
`e utile per costruire selezioni di multifunzioni. Negli esercizi 7.1.1 e 7.1.2
sono esposte caratterizzazioni di questi due tipi di semicontinuit`a che, in
qualche modo, motivano la scelta degli attributi superiore ed inferiore
loro assegnati.
Esercizi 7.1
1. Siano X, Y spazi topologici. Si provi che una multifunzione F : X
T(Y ) `e semicontinua superiormente se e solo se F
1
(B) `e chiuso in X
per ogni chiuso B Y .
222
2. Siano X, Y spazi topologici. Si provi che una multifunzione F : X
T(Y ) `e semicontinua inferiormente se e solo se F
1
(A) `e aperto in X
per ogni aperto A Y .
3. Siano X, Y, Z spazi topologici e siano F : X T(Y ) e G : Y T(Z)
due multifunzioni. Deniamo la multifunzione composta G F cos`:
G F(x) =
_
yF(x)
G(y) x X.
Si provi che se F e G sono semicontinue superiormente allora G
F `e semicontinua superiormente, e che se F e G sono semicontinue
inferiormente allora G F `e semicontinua inferiormente.
4. Siano X, Y spazi metrici e sia F : X T(Y ) una multifunzione. Si
provi che:
(i) se F `e semicontinua superiormente e F(x) `e chiuso in Y per ogni
x X, allora il graco G(F) `e chiuso in X Y ;
(ii) se il graco G(F) `e chiuso in X Y ed Y `e compatto, allora F `e
semicontinua superiormente;
(iii) la multifunzione F : R T(R
2
), denita da
F() = (x, y) R
2
: y = x R,
ha graco chiuso in R
3
, F() `e chiuso in R
2
per ogni R, ma F
non `e semicontinua superiormente nel punto 0.
5. Si provi che la multifunzione F : R T(R
2
) denita da
F() = (x, y) R
2
: y = R
`e semicontinua inferiormente ma non semicontinua superiormente.
7.2 Punti ssi
Lesistenza di punti ssi per le multifunzioni `e una propriet`a di grande
importanza nelle applicazioni, come cercheremo di mostrare nel seguito.
223
Denizione 7.2.1 Sia X un insieme e sia F : X T(X) una multifun-
zione. Diciamo che un elemento x X `e un punto sso per F se si ha
x F(x).
Il primo risultato sui punti ssi di multifunzioni `e una generalizzazione del
classico teorema delle contrazioni di Banach. Introduciamo anzitutto una
nozione di distanza fra insiemi.
Denizione 7.2.2 Sia (X, d) uno spazio metrico. La quantit`a
D(A, B) = max
_
sup
aA
d(a, B), sup
bB
d(b, A)
_
, A, B X,
si chiama metrica di Hausdor.
Ricordiamo che d(a, B) = inf
bB
d(a, b).
`
E abbastanza facile vericare che la
funzione D `e una distanza sullinsieme ( dei sottoinsiemi chiusi e limitati di
X (esercizio 7.2.1).
Si ha il seguente risultato:
Teorema 7.2.3 Sia (X, d) uno spazio metrico completo, sia M un sottoin-
sieme non vuoto e chiuso di X, e sia F : X T(M) una multifunzione con
D(F) M, tale che F(x) sia chiuso per ogni x M. Se esiste k ]0, 1[ tale
che
D(F(x), F(y)) k d(x, y) x, y M,
allora F ha almeno un punto sso.
Si osservi che non possiamo aspettarci lunicit`a del punto sso: se ad esempio
F(x) = M per ogni x X, e M ha pi` u di un elemento, le ipotesi del teorema
sono banalmente vericate e tutti i punti di M sono punti ssi per F.
Dimostrazione Fissiamo h ]k, 1[ e sia x
0
D(F). Scegliamo x
1
F(x
0
)
tale che d(x
0
, x
1
) > 0 (se tale x
1
non esiste, vuol dire che F(x
0
) = x
0
,
cosicche in particolare x
0
`e un punto sso di F ed abbiamo nito). Essendo
x
1
F(x
0
) M D(F), si ha F(x
1
) ,= . Allora
d(x
1
, F(x
1
)) sup
aF(x
0
)
d(a, F(x
1
))
D(F(x
0
), F(x
1
)) k d(x
0
, x
1
) < h d(x
0
, x
1
);
quindi, per denizione di d(x
1
, F(x
1
)), esiste x
2
F(x
1
) tale che
d(x
1
, x
2
) < h d(x
0
, x
1
).
224
Se d(x
2
, x
1
) = 0, allora x
2
= x
1
F(x
1
), e x
1
`e un punto sso di F; altrimenti,
sar`a d(x
2
, x
1
) > 0 e possiamo iterare questo procedimento. Se non si trova
un punto sso dopo un numero nito di passi, si costruir`a una successione
x
n
tale che
x
n+1
F(x
n
) M, d(x
n
, x
n+1
) < h
n
d(x
0
, x
1
) n N.
`
E facile riconoscere che x
n
`e una successione di Cauchy contenuta nel chiuso
M; per la completezza di X essa converge ad un elemento x M. Ne segue
d(x
n+1
, F(x)) D(F(x
n
), F(x)) k d(x
n
, x) 0 per n ,
da cui x F(x) = F(x), che `e la tesi.
Osservazione 7.2.4 Non `e dicile vericare che nelle ipotesi del teorema
precedente la multifunzione F `e semicontinua inferiormente, ma non `e in
generale semicontinua superiormente: lo `e, ad esempio, nei punti x tali che
F(x) `e compatto (si vedano gli esercizi 7.2.2 e 7.2.3).
Uno dei pi` u importanti teoremi di punto sso per le multifunzioni `e quello
che segue; da esso discendono come corollari molti dei classici risultati di
punto sso per funzioni.
Teorema 7.2.5 (di Kakutani) Sia X uno spazio vettoriale topologico lo-
calmente convesso di Hausdor, sia K un sottoinsieme non vuoto, convesso
e compatto di X, e sia F : K T(K) una multifunzione semicontinua supe-
riormente e tale che F(x) sia non vuoto, convesso e chiuso per ogni x K.
Allora F ha almeno un punto sso.
Prima di dimostrare questo teorema vediamo alcune delle sue conseguenze.
Corollario 7.2.6 (teorema di Tikhonov) Sia X uno spazio vettoriale to-
pologico localmente convesso di Hausdor, sia K un sottoinsieme non vuoto,
convesso e compatto di X, e sia F : K K unapplicazione continua. Allora
F ha almeno un punto sso.
Dimostrazione Poiche F : K K `e continua, la multifunzione F(x) =
F(x) `e semicontinua superiornmente e verica le ipotesi del teorema 7.2.5.
Quindi esiste x K tale che x F(x), ossia x = F(x).
225
Corollario 7.2.7 (teorema di Schauder) Sia X uno spazio di Banach e
sia M un sottoinsieme non vuoto, convesso, chiuso e limitato di X. Se
F : M M `e unapplicazione continua e compatta (ossia trasforma insiemi
limitati in insiemi relativamente compatti), allora F ha almeno un punto
sso.
Dimostrazione Per ipotesi, linsieme F(M) `e relativamente compatto: dun-
que, per il teorema di Mazur (teorema 1.7.19), linsieme K = co(F(M)) `e
convesso e compatto; inoltre K M perche M `e un convesso chiuso che con-
tiene F(M). Consideriamo la restrizione F[
K
: questa applicazione verica le
ipotesi del teorema di Tikhonov (corollario 7.2.6). Quindi esiste x K M
tale che F(x) = x.
Il teorema di Schauder pu`o essere generalizzato alle multifunzioni come segue:
Corollario 7.2.8 Sia X uno spazio di Banach e sia M un sottoinsieme
non vuoto, convesso e chiuso di X. Sia F : M T(M) una multifunzione
semicontinua superiormente, tale che F(M) sia relativamente compatto e che
F(x) sia convesso, chiuso e non vuoto per ogni x M; allora F ha almeno
un punto sso.
Dimostrazione Sia K = co(F(M)); K `e un convesso compatto non vuoto
contenuto in M. La restrizione F[
K
`e a valori in T(K): infatti se x K
allora F(x) `e un convesso chiuso contenuto in F(M), e quindi in K. Dun-
que, per il teorema 7.2.5, F[
K
ha un punto sso; ne segue che anche F ha un
punto sso.
Dimostrazione del teorema 7.2.5 Proviamo anzitutto la seguente pro-
posizione, che fornisce la tesi del teorema sotto dierenti ipotesi e che ha
interesse di per se.
Proposizione 7.2.9 Sia X uno spazio vettoriale topologico di Hausdor,
sia K X non vuoto, convesso e compatto, e sia F : K T(K) una
multifunzione (non necessariamente semicontinua superiormente) tale che:
(i) F(x) `e non vuoto e convesso per ogni x K;
(ii) F
1
(y) `e aperto in K per ogni y K.
Allora F ha almeno un punto sso.
226
Si verica facilmente che la condizione (ii) implica la semicontinuit`a inferiore
di F: dunque siamo in ipotesi diverse da quelle del teorema di Kakutani.
Dimostrazione La famiglia di aperti F
1
(y)
yK
`e un ricoprimento di K:
infatti, se x K, scelto y F(x), si ha y K e, per denizione, x F
1
(y).
Dato che K `e compatto, K `e ricoperto da una unione nita

n
i=1
F
1
(y
i
),
con y
1
, . . . , y
n
K. Sia f
i
una partizione dellunit`a associata a F
1
(y
i
),
i = 1, . . . , n (essa esiste perch`e il compatto K, essendo di Hausdor, `e pa-
racompatto e in particolare `e normale, ossia tale che due chiusi disgiunti
possiedono intorni disgiunti). Poniamo
p(x) =
n

i=1
f
i
(x)y
i
x K
0
= co(y
1
, . . . y
n
) K.
Il convesso K
0
`e contenuto in uno spazio al pi` u n-dimensionale, vale a dire
quello generato dai vettori y
1
, . . . , y
n
, ed `e compatto. Lapplicazione p `e
continua e p(K
0
) K
0
in quanto

n
i=1
f
i
(x) = 1. Per il teorema di Brouwer
p ha un punto sso x K
0
. Basta allora dimostrare che p(x) F(x) per
ogni x K
0
, per dedurre che x `e un punto sso di F in K
0
K.
Sia x K
0
: poiche

n
i=1
f
i
(x) = 1 su K, esiste almeno un j 1, . . . , n per
il quale f
j
(x) ,= 0. Per ciascun indice j tale che f
j
(x) ,= 0 si ha x F
1
(y
j
)
e quindi y
j
F(x). Ne segue, essendo F(x) convesso,
p(x) =
n

i=1
f
i
(x)y
i
=

j: f
j
(x)=0
f
j
(x)y
j
F(x),
da cui la tesi.
La dimostrazione del teorema 7.2.5 prosegue introducendo una disequazione
variazionale.
Proposizione 7.2.10 Sia X uno spazio vettoriale topologico di Hausdor,
sia K X non vuoto, convesso e compatto, e sia T : K X

continua
rispetto alla topologia forte di X

. Allora la disequazione variazionale


[T(x
0
)](x
0
x) 0 x K
ha soluzione x
0
K.
Dimostrazione Ragioniamo per assurdo: se cos` non fosse, per ogni x
0
K
troveremmo un elemento x K tale che [T(x
0
)](x
0
x) < 0. Consideriamo
227
la multifunzione F : K T(K) denita nel modo seguente:
F(x
0
) = x K : [T(x
0
)](x
0
x) < 0 x
0
K.
Chiaramente F(x
0
) `e non vuoto e convesso. Proviamo che F
1
(x) `e aperto
in K per ogni x K: per denizione di controimmagine di F si ha
F
1
(x) = x
0
X : [T(x
0
)](x
0
x) < 0.
Sia x
i

iI
un net contenuto in K F
1
(x) che converge ad un elemento
x K in X; allora vale la relazione
[T(x
i
)](x
i
x) 0 i I.
Quindi possiamo scrivere
[T(x)](x x) =
= [T(x)](x x
i
) + [T(x) T(x
i
)](x
i
x) + [T(x
i
)](x
i
x)
[T(x)](x x
i
) + [T(x) T(x
i
)](x
i
x) i I.
Passando al limite rispetto ad i, il primo termine allultimo membro tende
a 0 perche T(x) X

. Notiamo poi che K, essendo compatto, `e limitato


in X (esercizio 1.4.9). Poiche (v. paragrafo 1.5) la topologia forte di X

`e
generata dalle seminorme p
A
() = sup
yA
[y[, con A sottoinsieme limitato
di X, dalla continuit`a di T rispetto a tale topologia e dalla limitatezza di
K K si deduce, passando al limite rispetto ad i,
[[T(x
i
) T(x)](x
i
x)[ p
KK
(T(x
i
) T(x)) 0;
quindi si conclude che
[T(x)](x x) 0,
ossia x K F
1
(x). Ci`o prova che F
1
(x) `e aperto.
Sono allora vericate le ipotesi della proposizione 7.2.9, e pertanto esiste un
punto sso x
0
K per F; quindi, per denizione di F(x
0
), otteniamo
0 = [T(x
0
)](x
0
x
0
) < 0,
il che `e assurdo.
Il teorema di Kakutani si deduce immediatamente dal risultato che segue:
228
Proposizione 7.2.11 (teorema di Browder) Sia X uno spazio vettoriale
topologico localmente convesso di Hausdor, sia K X non vuoto, convesso
e compatto; sia inoltre F : K T(X) una multifunzione semicontinua
superiormente, tale che F(x) sia chiuso, convesso e non vuoto per ogni x
K. Supponiamo inoltre che si abbia
(a) per ogni x K esistono y F(x), u K, > 0 tali che y =
x +(u x),
oppure
(b) per ogni x K esistono y F(x), u K, < 0 tali che y =
x +(u x).
Allora F ha almeno un punto sso.
Il teorema 7.2.5 corrisponde allipotesi (a): infatti nel caso del teorema di
Kakutani si ha F(x) K e quindi, ssato y F(x), si pu`o scegliere u = y e
= 1. Pertanto avremo provato il teorema 7.2.5 se proveremo il teorema di
Browder.
Dimostrazione Supponiamo che valga la condizione (a) e ragioniamo per
assurdo. Assumiamo che F sia priva di punti ssi: ci`o signica che x / F(x)
per ogni x K.
Linsieme x `e convesso e compatto, mentre F(x) `e convesso e chiuso. Per
il teorema di Hahn-Banach (teorema 1.7.5) esiste un funzionale w(x) X

tale che
w(x)x < inf
yF(x)
w(x)y ;
quindi, per continuit`a, esiste un intorno W
x
di x tale che
sup
zWx
w(x)z < inf
yF(x)
w(x)y .
Posto
U
x
= y X : sup
zWx
w(x)z < w(x)y,
U
x
`e un aperto contenente F(x). Adesso per ogni x K deniamo
N
x
= v K : w(x)(v y) < 0 y F(v),
e proviamo che N
x
`e un intorno di x. Dato che F `e semicontinua supe-
riormente, in corrispondenza dellaperto U
x
F(x) esiste un intorno V
x
di
229
x, aperto in K e che non `e restrittivo supporre contenuto in W
x
, tale che
F(v) U
x
per ogni v V
x
; ci`o signica che
sup
zWx
w(x)z < w(x)y y F(v), v V
x
.
A maggior ragione, quindi,
w(x)(v y) < 0 y F(v), v V
x
,
e dunque V
x
N
x
.
Poiche K `e compatto, esistono x
1
, . . . , x
n
K tali che K =

n
i=1
V
x
i
; sce-
gliamo una partizione dellunit`a f
i
associata a V
x
i
(nuovamente, ci`o `e
possibile perche K `e compatto e di Hausdor, dunque paracompatto), e
poniamo
r(x) =
n

i=1
f
i
(x)w(x
i
), x K.
`
E facile vericare che la funzione r : K X

`e continua rispetto alla


topologia forte di X

; proviamo che
r(x)(x y) < 0 y F(x).
Per ogni indice i tale che f
i
(x) > 0 (e di tali indici ce n`e almeno uno) si ha
x V
x
i
N
x
i
; quindi, per denizione di N
x
i
,
w(x
i
)(x y) < 0 y F(x),
ed a maggior ragione, sommando su i, si ottiene r(x)(x y) < 0.
Adesso osserviamo che r e K vericano le ipotesi della proposizione 7.2.10:
quindi esiste x K tale che
r(x)(x v) 0 v K.
Da qui dedurremo lassurdo. Infatti, il punto x sar`a interno a K oppure sulla
frontiera di K. Se x `e interno a K, allora per ogni ssato z X esiste > 0
tale che xz K; se nella disequazione variazionale prendiamo v = xz,
otteniamo r(x)z = 0, e per larbitrariet`a di z si ricava r(x) 0, contro il
fatto che r(x)(x y) < 0 per y F(x). Se invece x K, entra in gioco la
condizione (a): esistono y F(x), u K e > 0 tali che y = x +(u x).
Scelto v = u, la disequazione variazionale ci dice che r(x)(x u) 0, da cui
230
r(x)(x y) 0; ma dato che y F(x), deve essere invece r(x)(x y) < 0.
Ci` o prova lassurdo.
Se si assume la condizione (b) in luogo della (a), si sceglie con il teorema
1.7.5 un funzionale w(x) X

tale che
w(x)x > sup
yF(x)
w(x)y ,
e si ripete tutta largomentazione con la disuguaglianza > in luogo di <.
Esercizi 7.2
1. Dimostrare che la metrica di Hausdor denisce una distanza sulla
classe dei sottoinsiemi chiusi e limitati di uno spazio metrico (X, d).
2. Sia (X, d) uno spazio metrico e sia F : X T(X) una multifunzione
con le seguenti propriet`a:
(i) F(x) `e chiuso e non vuoto per ogni x X;
(ii) esiste k ]0, 1[ per cui
D(F(x), F(x

)) k d(x, x

) x, x

X,
ove D `e la metrica di Hausdor. Si provi che F `e semicontinua infe-
riormente in ogni punto, e che `e semicontinua superiormente nei punti
x X tali che F(x) `e compatto.
3. Sia F : R
2
T(R
2
) denita da
F(x, y) =
_
,
x
2
_

_
,
y
2
_
(x, y) R
2
.
Si provi che F non `e semicontinua superiormente in alcun punto, benche
risulti
D(F(x, y), F(x

, y

))
1
2
_
(x x

)
2
+ (y y

)
2
(x, y), (x

, y

) R
2
.
231
7.3 Punti di sella
Vogliamo applicare la teoria dei punti ssi di multifunzioni allesistenza di
punti di sella per funzioni denite sul prodotto di spazi di Banach; il teorema
che dimostreremo trover`a a sua volta applicazione nella teoria dei giochi. In
accordo con la denizione 2.6.15, poniamo:
Denizione 7.3.1 Siano A, B insiemi non vuoti, e sia f : AB R una
funzione. Diciamo che (x
0
, y
0
) AB `e punto di sella per la funzione f se
f(x
0
, y) f(x
0
, y
0
) f(x, y
0
) (x, y) A B,
oppure se
f(x
0
, y) f(x
0
, y
0
) f(x, y
0
) (x, y) A B.
Dunque un punto (x
0
, y
0
) A B `e di sella per f se e solo se
max
yB
f(x
0
, y) = f(x
0
, y
0
) = min
xA
f(x, y
0
)
oppure
min
yB
f(x
0
, y) = f(x
0
, y
0
) = max
xA
f(x, y
0
).
Dato che i punti di sella per f sono di sella anche per f, a meno di cambiare
segno alla f si pu`o sempre supporre, e cos` faremo nel seguito, che in un punto
di sella (x
0
, y
0
) si abbia
f(x
0
, y) f(x
0
, y
0
) f(x, y
0
) (x, y) A B.
Ad esempio, se A = B = R il punto (0, 0) sar`a di sella per la funzione
f(x, y) = x
2
y
2
(e non, in base alla nostra convenzione, per la sua opposta).
Si noti che la nozione di punto di sella che ci interessa qui `e molto pi` u
restrittiva di quella utilizzata nel calcolo dierenziale: ad esempio, la funzione
g : R
2
R denita da
g(x, y) = (1 x
2
/2)(1 2x
2
)
ha nellorigine un punto stazionario che non `e ne di massimo, ne di minimo
relativo (essendo g(x, x
2
) < 0 < g(0, y) per ogni x, y ,= 0), ma che non `e di
sella secondo la denizione 7.3.1 poiche
g(0, y) > g(0, 0) y ,= 0, g(x, 0) > g(0, 0) x ,= 0.
Inoltre consideremo solamente punti di sella globali: per quelli locali baster`a
restringere la funzione ad un opportuno intorno del punto (x
0
, y
0
).
232
Proposizione 7.3.2 Siano A, B insiemi non vuoti, sia f : A B R
una funzione. La f possiede un punto di sella in A B se e solo se la
funzione x sup
yB
f(x, y) ha minimo in A, la funzione y inf
xA
f(x, y)
ha massimo in B, e
min
xA
sup
yB
f(x, y) = max
yB
inf
xA
f(x, y) = R.
In tal caso, se (x
0
, y
0
) `e punto di sella per f si ha f(x
0
, y
0
) = .
Dimostrazione Anzitutto deniamo per comodit`a
(x) = sup
yB
f(x, y), (y) = inf
xA
f(x, y),
ed osserviamo che, come nellosservazione 2.6.14, `e facile vericare che
sup
yB
inf
xA
f(x, y) = sup
yB
(y) inf
xA
(x) = inf
xA
sup
yB
f(x, y).
Notiamo che un punto (x
0
, y
0
) A B `e punto di sella per f se e solo se
(x
0
) = max
yB
f(x
0
, y) = f(x
0
, y
0
) = min
xA
f(x, y
0
) = (y
0
);
quindi se f ha un punto di sella (x
0
, y
0
) dalla relazione precedente segue
inf
xA
(x) (x
0
) = (y
0
) sup
yB
(y)
e pertanto vale luguaglianza
inf
xA
(x) = sup
yB
(y).
Detto tale valore, si ha necessariamente f(x
0
, y
0
) = .
Viceversa, supponiamo che abbia minimo nel punto x
0
A e che abbia
massimo nel punto y
0
B, con
(x
0
) = min
xA
(x) = max
yB
(y) = (y
0
) = .
Allora il punto (x
0
, y
0
) `e di sella per f poiche
f(x
0
, y) (x
0
) = = f(x
0
, y
0
) = (y
0
) f(x, y
0
) x A, y B.
La tesi `e provata.
Dimostriamo ora il seguente teorema, la cui importanza applicativa sar`a
evidenziata nel prossimo paragrafo:
233
Teorema 7.3.3 (del minimax, o di von Neumann) Siano X, Y spazi
di Banach riessivi, e siano A X, B Y non vuoti, convessi, chiusi e
limitati. Sia inoltre f : A B R una funzione tale che:
(i) x f(x, y) `e quasi convessa e semicontinua inferiormente per ogni
y B;
(ii) y f(x, y) `e quasi concava e semicontinua superiormente per ogni
x A.
Allora f ha un punto di sella in A B.
Ricordiamo (osservazione 2.1.5) che f `e quasi convessa se i suoi insiemi di
sottolivello sono convessi, e che f `e quasi concava se f `e quasi convessa,
ossia gli insiemi di sopralivello di f, vale a dire F

= x A : f(x) ,
sono convessi.
Dimostrazione Poniamo
a = min
xA
max
yB
f(x, y), b = max
yB
min
xA
f(x, y);
grazie alla proposizione 7.3.2, baster`a provare che i numeri a e b esistono e
coincidono.
Fissato y B, la funzione x f(x, y) `e quasi convessa e semicontinua
inferiormente in A, e per losservazione 2.3.5 ha minimo in A in un punto
z(y) A:
f(z(y), y) = min
xA
f(x, y) y B.
Poniamo ora
h(y) = f(z(y), y), y B,
e mostriamo che h `e quasi convessa e semicontinua inferiormente in B.
Fissato t R, consideriamo gli insiemi
H = y B : h(y) t, G(w) = y B : f(z(w), y) t, w B.
Osserviamo che H G(w) per ogni w B, essendo f(z(y), y) f(z(w), y)
per ogni w, y B; inoltre G(w) `e convesso e chiuso, in quanto la funzione
y f(z(w), y) `e quasi convessa e semicontinua inferiormente. Proviamo
che H `e chiuso: se y
n
H e y
n
y in B, allora si ha y G(w) per ogni
w B; in particolare y G(y), ossia y H. Proviamo che H `e convesso:
234
se y, v H e ]0, 1[, allora posto u = (1 )y + v si ha u G(w) per
ogni w B; in particolare u G(u), ossia u H. Essendo H convesso e
chiuso, si deduce che h `e quasi convessa e semicontinua inferiormente per la
proposizione 2.2.2. Pertanto, dallosservazione 2.3.5 segue che h ha minimo
m sul convesso chiuso e limitato B; posto b = m, si ha
b = min
yB
_
min
xA
f(x, y)
_
= max
yB
min
xA
f(x, y).
In modo analogo si prova che esiste il numero a. Inoltre risulta
min
xA
f(x, y) min
xA
max
yB
f(x, y) = a y B,
da cui la disuguaglianza b a.
Proviamo ora che a b. Consideriamo le topologie deboli su X e su Y ,
ssiamo > 0 e introduciamo la multifunzione T : A B T(A B)
denita da
T(x, y) = (u, v) A B : f(u, y) < b +, f(x, v) > a .
Si ha T(x, y) ,= perche min
uA
f(u, y) b e max
vB
f(x, v) a; inoltre
T(x, y) `e convesso in virt` u delle ipotesi fatte su f. Proviamo che per ogni
(u, v) AB linsieme T
1
(u, v) `e aperto nello spazio X Y , munito della
topologia prodotto delle due topologie deboli su X e su Y (si noti che XY
`e uno spazio vettoriale topologico localmente convesso di Hausdor, e che
A B `e compatto e convesso in tale spazio). Si ha infatti
T
1
(u, v) = (x, y) A B : (u, v) T(x, y) =
= (x, y) A B : f(u, y) < b +, f(x, v) > a =
= x A : f(x, v) > a y B : f(u, y) < b +;
dal momento che x A : f(x, v) a e y B : f(u, y) b + sono
convessi chiusi, dunque debolmente chiusi, in A ed in B rispettivamente, essi
sono anche debolmente chiusi in X ed in Y , cosicche i loro complementari
sono debolmente aperti in X ed in Y . Pertanto il loro prodotto cartesiano `e
aperto nel prodotto X Y .
In denitiva, la multifunzione T verica le ipotesi della proposizione 7.2.9
nello spazio XY munito del prodotto delle topologie deboli: pertanto esiste
235
un punto sso per T, ossia esiste (x
0
, y
0
) AB tale che (x
0
, y
0
) T(x
0
, y
0
),
ossia
a < f(x
0
, y
0
) < b +.
Quindi a < b + 2, ed essendo arbitrario si conclude che a b.
Per la proposizione 7.3.2, esiste un punto di sella per f in A B.
Esercizi 7.3
1. Siano A = B = 1, 2, 3 e siano F
1
, F
2
: A B R le funzioni i cui
valori sono deniti dalle matrici
F
1
=
_
_
1 2 0
0 2 0
2 3 1
_
_
, F
2
=
_
_
1 3 0
1 1 0
0 0 1
_
_
.
Vericare che F
1
ha punti di sella (quanti?) mentre F
2
non ne ha.
2. Siano A, B insiemi non vuoti, e sia f : A B R una funzione.
`
E
vero che che se (x
0
, y
0
) A B verica
f(x
0
, y
0
) = min
xA
max
yB
f(x, y) = max
yB
min
xA
f(x, y),
allora (x
0
, y
0
) `e necessariamente un punto di sella per f oppure per
f?.
7.4 Teoria dei giochi
Consideriamo un gioco fra due giocatori P e Q: per vincere a questo gioco,
P e Q hanno a disposizione due insiemi di strategie A e B. Ogni x A
ed ogni y B costituiscono una possibile mossa, o sequenza di mosse,
del gioco per P e per Q; se P sceglie la strategia x e Q sceglie la strategia
y vi sono due funzioni di utilit`a f
P
(x, y) e f
Q
(x, y) che rappresentano la
vincita (o la perdita, se negative) per P e per Q conseguenti alla strategia
scelta. Nel caso pi` u semplice, che `e quello dei cosiddetti giochi a somma
zero, si ha f
P
(x, y) = f
Q
(x, y), il che signica che la funzione di utilit`a
g(x, y) = f
Q
(x, y) rappresenta simultaneamente il guadagno di Q e la per-
dita di P (se positiva), o viceversa la perdita di Q e il guadagno di P (se
negativa).
236
Nei giochi a somma zero esiste un criterio soddisfacente per scegliere la
strategia migliore relativa a ciascun giocatore.
Denizione 7.4.1 La coppia (x
0
, y
0
) A B si dice coppia strategica
ottimale se (x
0
, y
0
) `e punto di sella per la funzione di utilit`a g in A B.
Dalla proposizione 7.3.2 segue:
Proposizione 7.4.2 Siano A, B insiemi non vuoti e sia g : A B R la
funzione di utilit`a di un gioco a somma zero con insiemi di strategie A e B.
Esiste una coppia strategica ottimale relativa alla funzione g se e solo se
min
xA
sup
yB
g(x, y) = max
yB
inf
xA
g(x, y) = ;
in tal caso, se (x
0
, y
0
) `e una coppia strategica ottimale, allora g(x
0
, y
0
) = .
Il numero si dice valore del gioco.
Interpretiamo il risultato della proposizione precedente: ciascun giocatore
gioca con una strategia volta ad ottimizzare il proprio interesse (cos` si sup-
pone). Poiche g(x, y) rappresenta ci`o che guadagna Q ed insieme ci`o che
perde P, chiaramente P punta a minimizzare g mentre Q punta a massimiz-
zare g. Supponiamo, per ssare le idee, che il valore del gioco sia positivo. Se
P sceglie la mossa x
0
, il guadagno di Q sar`a, nella migliore delle ipotesi, pari
al pi` u a max
yB
g(x
0
, y); la scelta della strategia y
0
garantisce a Q esattamen-
te tale guadagno, poiche g(x
0
, y
0
) = max
yB
g(x
0
, y). Simmetricamente, se
Q opta per la mossa y
0
, la perdita di P sar`a, nella migliore delle ipotesi, pari
a min
xA
g(x, y
0
); scegliendo la mossa x
0
, P avr`a la certezza di non perdere
di pi` u, in quanto g(x
0
, y
0
) = min
xA
g(x, y
0
).
Pi` u in generale, se P gioca una mossa qualunque x, Q sa che, giocando
bene, pu`o arrivare a una vincita al pi` u uguale a max
yB
g(x, y); daltron-
de Q non pu`o impedire a P di rendere minima tale vincita riducendola
a min
xA
max
yB
g(x, y) (ossia a g(x
0
, y
0
)). Tuttavia, se Q sceglie y
0
, ot-
terr`a una vincita g(x, y
0
) che superer`a comunque tale stima pessimistica.
Similmente, ad una mossa qualsiasi y da parte di Q, P potr`a risponde-
re in modo ottimale perdendo soltanto min
xA
g(x, y), ma non potr`a farci
niente se la mossa di Q era tale da massimizzare tale perdita elevandola a
max
yB
min
xA
g(x, y); per`o se P sceglie x
0
la sua perdita sar`a g(x
0
, y), cio`e
comunque inferiore al valore precedente.
Tutto questo mostra che la coppia strategica ottimale (x
0
, y
0
) garantisce un
237
bilanciamento ottimale degli interessi contrapposti dei due giocatori.
Il valore assunto da g nel punto (x
0
, y
0
), ossia il valore del gioco (che `e uni-
vocamente determinato anche se la coppia strategica ottimale non `e unica,
in virt` u della proposizione 7.4.2), ci dice se il gioco `e equo oppure no: se
g(x
0
, y
0
) = 0, e se i giocatori giocano entrambi in modo ottimale, nessuno
dei due vincer`a ne perder`a; se g(x
0
, y
0
) > 0, il gioco `e squilibrato a favore
di Q, che scegliendo una strategia ottimale guadagner`a comunque, mentre se
g(x
0
, y
0
) < 0 il favorito dal gioco sar`a P.
Esempio 7.4.3 (pari o dispari) I giocatori P e Q dichiarano ciascuno un
numero: se la somma dei numeri `e pari, P vince 1 euro, se `e dispari P perde
1 euro; per Q avviene lopposto. Le strategie di P e Q sono A = B = p, d,
e la funzione di utilit`a g = f
Q
= f
P
`e
g(p, d) = g(d, p) = 1, g(p, p) = g(d, d) = 1.
Si verica subito che
min
xA
max
yB
g(x, y) = 1, max
yB
min
xA
g(x, y) = 1,
cosicche non esistono strategie ottimali. La cosa non sorprende, perche A e
B non sono convessi!
Per applicare la teoria precedente al caso di insiemi di strategie niti, bisogna
introdurre una versione probabilistica del gioco. Si assume che il gioco (a
somma zero) sia stato giocato molte volte, e che i giocatori P e Q scelgano
le loro strategie sulla base di ssate probabilit`a, o meglio di frequenze di
successi: se le strategie di P e Q sono E = E
1
, . . . , E
N
e F = F
1
, . . . , F
M
,
e se g(E
i
, F
j
) `e la funzione di utilit`a risultante dalle scelte E
i
e F
j
, supporremo
che P scelga la mossa E
i
con probabilit`a p
i
, e che Q scelga la mossa F
j
con
probabilit`a q
j
. Poniamo allora
A =
_
p R
N
: 0 p
i
1,
N

i=1
p
i
= 1
_
,
B =
_
q R
M
: 0 q
j
1,
M

j=1
q
j
= 1
_
;
un elemento p A rappresenta dunque la strategia di P consistente nello
scegliere la mossa E
1
con probabilit`a p
1
, la mossa E
2
con probabilit`a p
2
,
eccetera.
238
Denizione 7.4.4 Ogni coppia (p, q) A B si dice coppia strategica
mista. La quantit`a
L(p, q) =
N

i=1
M

j=1
g(E
i
, F
j
)p
i
q
j
`e la speranza di vincita per il giocatore Q.
La funzione L(p, q) esprime il valore statisticamente probabile di vincita per
Q, misurato dopo molte mani del gioco.
Denizione 7.4.5 Una coppia (p
0
, q
0
) A B `e una coppia strategica
mista ottimale se (p
0
, q
0
) `e punto di sella per la funzione L(p, q).
Dunque una coppia (p
0
, q
0
) `e ottimale se
L(p
0
, q) L(p
0
, q
0
) L(p, q
0
) (p, q) A B.
Si ha allora questo risultato:
Teorema 7.4.6 Nelle ipotesi precedenti esiste almeno una coppia strategica
mista ottimale (p
0
, q
0
), e si ha
L(p
0
, q
0
) = min
pA
max
qB
L(p, q) = max
qB
min
pA
L(p, q).
Dimostrazione Scelti X = R
N
e Y = R
M
, basta applicare il teorema del
minimax (teorema 7.3.3) alla funzione L(p, q) che, essendo lineare in p e q, `e
continua, nonche simultaneamente concava e convessa in ciascuna variabile
sui convessi A e B, i quali sono limitati e chiusi.
Esempio 7.4.7 Nel caso del gioco pari o dispari (esempio 7.4.3), le mosse
sono E
1
= F
1
= p, E
2
= F
2
= d, le strategie miste sono
A = B = p = (p
1
, p
2
) : p
1
, p
2
[0, 1], p
1
+p
2
= 1
e la funzione di utilit`a `e
g(E
i
, F
j
) =
_
1 se E
i
= F
j
1 se E
i
,= F
j
;
la funzione speranza di vincita `e
239
L(p, q) =
2

i,j=1
g(E
i
, F
j
)p
i
q
j
= p
1
q
1
p
2
q
2
+p
1
q
2
+p
2
q
1
= (p
1
p
2
)(q
1
q
2
).
Si vede subito che un punto di sella `e (p, q) con p = q = (
1
2
,
1
2
), e il valore del
gioco `e, come potevamo aspettarci,
L(p, q) =
_
1
2

1
2
__
1
2

1
2
_
= 0.
Si noti che (p, q) `e lunico punto di sella per L: infatti se (p

, q

) `e un altro
punto di sella, deve essere L(p

, q

) = 0, e quindi si ha p

1
= p

2
oppure q

1
= q

2
,
da cui p

= p oppure q

= p. Ma se p

= p = (
1
2
,
1
2
), dalle relazioni
0 = L(p, q

) = L(p

, q

) L(p, q

) p A,
scegliendo p = (
1
4
,
3
4
) oppure p = (
3
4
,
1
4
) si deduce 0
1
2
(q

1
q

2
), e quindi
q

= p = (
1
2
,
1
2
). In modo analogo, se q

= (
1
2
,
1
2
) si deduce p

= q = (
1
2
,
1
2
).
In denitiva, il gioco `e equo e la strategia ottimale per entrambi i giocatori
`e quella di dichiarare un numero pari con probabilit`a
1
2
e un numero dispari
con probabilit`a
1
2
. (In eetti, trattandosi di un gioco essenzialmente di for-
tuna, i due giocatori, mediamente, vinceranno ciascuno con probabilit`a
1
2
, e
il guadagno di ciascuno sar`a mediamente nullo.)
Per i giochi non a somma zero la teoria `e meno semplice. Per mostrare quello
che pu`o accadere, `e utile considerare il seguente
Esempio 7.4.8 (dilemma dei prigionieri) Sono stati arrestati dalla po-
lizia due malfattori che devono scontare un anno di prigione ciascuno per un
reato minore. Il procuratore sospetta che i due siano stati complici in un
reato maggiore, punibile con ulteriori cinque anni di reclusione, ma non `e in
grado di provarlo. Nel tentativo di incriminarli per il delitto maggiore, egli
fa a ciascuno di loro, separatamente, la seguente promessa: se accuser`a il
socio del reato maggiore, gli verr`a abbuonato lanno di galera per il crimine
minore, e se poi il socio non lo accuser`a del delitto maggiore (nel qual caso
dovr`a invece scontare i relativi 5 anni), sar`a liberato.
La situazione pu`o essere descritta come un gioco fra i due malfattori P e
Q. Entrambi possono scegliere fra le due strategie di accusare laltro (a) o
di non accusarlo (n); le corrispondenti funzioni di utilit`a si deniscono co-
me lopposto degli anni da scontare (in modo da dover essere massimizzate).
Quindi risulter`a:
f
P
(a, a) = 5, f
P
(a, n) = 0, f
P
(n, a) = 6, f
P
(n, n) = 1;
240
f
Q
(a, a) = 5, f
Q
(a, n) = 6, f
Q
(n, a) = 0, f
Q
(n.n) = 1.
Si riconosce immediatamente che la coppia strategica consistente nellaccu-
sarsi a vicenda fornisce un esito peggiore per tutti e due rispetto alla scelta di
omert`a per entrambi. Eppure, ciascun malfattore, che non si da dellaltro,
nota che la scelta di accusare laltro gli arrecher`a il benecio di scontare,
in qualunque caso, un anno in meno: infatti, se laltro non lo accusa uscir`a
subito invece di star dentro un anno, mentre se laltro lo accusa a sua volta,
sconter`a 5 anni anziche 6. Il risultato nale `e che entrambi i rei si accuse-
ranno, e dunque staranno in galera per 5 anni: con la strategia omertosa,
invece, se la sarebbero cavata con un anno per ciascuno.
Come si vede, la strategia omertosa, che da un punto di vista cooperativo `e
la soluzione migliore, non lo `e dal punto di vista individuale: anche in pre-
senza di un accordo clandestino fra i malfattori per tacere entrambi, nessuno
dei due pu`o avere la garanzia che, non accusando laltro, costui mantenga la
parola di non accusarlo a sua volta; `e troppo grande il rischio di beccarsi 6
anni vedendo laltro uscire di galera.
Lidea che la razionalit`a individuale preceda quella collettiva, fenomeno tipico
dei giochi non cooperativi (in cui non c`e possibilit`a di accordi o alleanze fra
i giocatori), `e alla base della nozione di equilibrio di Nash.
Denizione 7.4.9 La coppia (x
0
, y
0
) AB si dice punto di equilibrio di
Nash se per ogni altra strategia (x, y) A B valgono le disuguaglianze
f
P
(x
0
, y
0
) f
P
(x, y
0
), f
Q
(x
0
, y
0
) f
Q
(x
0
, y).
In altre parole, un punto di equilibrio di Nash `e una coppia di strategie che
massimizza lutilit`a di un singolo giocatore quando lavversario si attiene
alla strategia data. Il senso `e questo: a P conviene scegliere la strategia
x
0
, perche ci`o invoglier`a Q a scegliere y
0
onde massimizzare f
Q
, e in questo
modo P massimizzer`a f
P
. Il discorso `e simmetrico dal punto di vista di
Q. Il guaio `e che lesistenza di un punto di equilibrio di Nash non esclude
aatto che possa esistere una coppia strategica (x, y) per la quale risulti
f
P
(x, y) > f
P
(x
0
, y
0
) e f
Q
(x, y) > f
Q
(x
0
, y
0
): `e precisamente ci`o che accade
nel dilemma dei prigionieri con la strategia della non accusa reciproca.
Osservazioni 7.4.10 (1) Se il gioco `e a somma zero (ossia f
Q
= f
P
= g),
allora un punto (x
0
, y
0
) fornisce un equilibrio di Nash se e solo se esso `e punto
241
di sella per la funzione g. Infatti dalla denizione 7.4.9 segue subito, per ogni
(x, y) A B,
g(x
0
, y) = f
Q
(x
0
, y) f
Q
(x
0
, y
0
) = f
P
(x
0
, y
0
) f
P
(x, y
0
) = g(x, y
0
)
cosicche (x
0
, y
0
) `e punto di sella per g; il viceversa `e del tutto analogo.
(2) Nellesempio del dilemma dei prigionieri `e facile vericare che lunico
punto di equilibrio di Nash `e la strategia dellaccusa reciproca.
Teorema 7.4.11 Siano X, Y spazi di Banach e siano A X, B Y non
vuoti, convessi e compatti. Siano f, g : AB R funzioni continue tali che
x f(x, y) sia concava per ogni y B e y g(x, y) sia concava per ogni
x X. Allora esiste un punto di equilibrio di Nash (x
0
, y
0
) A B per le
funzioni f e g.
Dimostrazione Introduciamo la funzione F : (A B) (A B) R,
denita da
F(p, q) = f(p
1
, q
2
) +g(q
1
, p
2
) p, q A B,
e osserviamo che F `e continua, nonche concava in p per ogni ssato q. Per
questa funzione vale il seguente
Lemma 7.4.12 Nelle ipotesi precedenti, esiste q
0
A B tale che
max
pAB
F(p, q
0
) = F(q
0
, q
0
).
Dimostrazione La disuguaglianza `e banale per ogni q
0
AB. Ragio-
niamo per assurdo, ammettendo che per ogni q A B esista p A B
per cui risulti F(p, q) > F(q, q). Poniamo
G
p
= q A B : F(p, q) > F(q, q), p A B :
linsieme G
p
`e aperto in AB, e per lipotesi fatta si ha AB

pAB
G
p
.
Linsieme AB `e compatto nello spazio XY , quindi esistono p
1
, . . . , p
k

A B tali che A B

k
i=1
G
p
i
. Deniamo adesso le funzioni

i
(q) = maxF(p
i
, q) F(q, q), 0, q A B, i = 1, . . . , k,
242
le quali sono continue e non negative; osserviamo che per ogni q A B
esiste i 1, . . . k tale che q G
p
i
e dunque
i
(q) > 0. Normalizziamo le

i
ponendo

i
(q) =

i
(q)

k
j=1

j
(q)
,
cosicche

k
i=1

i
(q) = 1 per ogni q A B. Posto (q) =

k
i=1

i
(q)p
i
,
lapplicazione manda il convesso AB in se ed `e continua. Poiche AB
`e compatto, per il teorema di Tikhonov (teorema 7.2.6) esiste un punto sso
q

A B per . Si ha dunque q

k
i=1

i
(q

)p
i
, da cui per concavit`a
F(q

, q

) = F
_
k

i=1

i
(q

)p
i
, q

i=1

i
(q

)F(p
i
, q

).
Daltra parte, se
i
(q

) > 0 si ha F(p
i
, q

) > F(q

, q

), e ci`o implica
F(q

, q

)
k

i=1

i
(q

)F(p
i
, q

) >
k

i=1

i
(q

)F(q

, q

) = F(q

, q

),
il che `e assurdo. Il lemma `e provato.
Torniamo alla dimostrazione del teorema 7.4.11. Per il lemma, esiste q
0

A B tale che
max
pAB
F(p, q
0
) = F(q
0
, q
0
).
Posto (x
0
, y
0
) = q
0
, si ha allora
f(x, y
0
) +g(x
0
, y) f(x
0
, y
0
) +g(x
0
, y
0
) (x, y) A B;
scegliendo x = x
0
si deduce g(x
0
, y) g(x
0
, y
0
) per ogni y B, mentre
scegliendo y = y
0
si trova f(x, y
0
) f(x
0
, y
0
) per ogni x A. Pertanto
(x
0
, y
0
) `e punto di equilibrio di Nash.
Esercizi 7.4
1. Si analizzi, come si `e fatto negli esempi 7.4.3 e 7.4.7, il gioco sasso-
carta-forbici: due giocatori P e Q scelgono simultaneamente S, C o
F. Tenuto conto che il sasso spunta le forbici, le forbici tagliano la
243
carta e la carta nasconde il sasso, e che il gioco vuole essere a somma
zero, si consideri la seguente funzione di utilit`a per il giocatore Q:
S C F
S 0 1 1
C 1 0 1
F 1 1 0
Si provi che il gioco, nella sua versione probabilistica, `e equo e che ad
entrambi i giocatori conviene alternare le tre mosse con probabilit`a
1
3
ciascuna.
2. Siano A = E
1
, . . . , E
N
e B = F
1
, . . . , F
M
le strategie di un gioco
a somma zero per due giocatori P e Q, e si supponga che la funzione
di utilit`a g del giocatore Q non abbia punti di sella. Si provi che Q,
giocando intelligentemente, pu`o garantirsi un guadagno non inferiore a
v = max
j
min
i
g(E
i
, F
j
), e che similmente P, giocando con astuzia, non
permetter`a a tale guadagno di superare v = min
i
max
j
g(E
i
, F
j
).
3. (Battaglia fra i sessi) Due innamorati U e D devono decidere come
passare la serata: seguendo i rispettivi stereotipi culturali, U vorrebbe
andare alla partita di calcio mentre D preferirebbe andare a ballare, ma
soprattutto entrambi desiderano trascorrere la serata assieme. Indicate
con c e b le corrispondenti scelte, deniamo quindi le funzioni di utilit`a
f
U
e f
D
nel modo seguente (in verticale le scelte di U, in orizzontale
quelle di D):
(f
U
, f
D
) :
b (2, 2) (1, 2)
c (2, 1) (1, 1)
c b
Si determinino i punti di equilibrio di Nash per questo gioco.
7.5 Selezioni
Luso di una multifunzione si presta a rappresentare unincertezza nella de-
terminazione del valore di una data funzione f: dato x, pu`o capitare che il
valore f(x) sia noto solo approssimativamente, e quindi si conosca solo un
insieme F(x) al quale f(x) certamente appartiene. Una selezione f di una
244
multifunzione F `e un modo di scegliere per ogni x, in assenza di pi` u precise
informazioni, un possibile valore f(x) tra tutti quelli ammissibili, cio`e fra gli
elementi di F(x).
Denizione 7.5.1 Siano W, M insiemi non vuoti e sia F : W T(M)
una multifunzione. Una selezione di F `e unapplicazione m : W M tale
che m(w) F(w) per ogni w W.
Unovvia condizione necessaria anche almeno una selezione esista `e che si
abbia F(w) ,= per ogni w W; in questo caso, lesistenza di una selezione
`e sempre e comunque garantita dallassioma della scelta. Il problema che ci
poniamo, e che `e importante nelle applicazioni, `e quello di costruire selezioni
dotate di particolari propriet`a: quando W e M sono insiemi niti, ci inte-
resseranno selezioni iniettive; quando W `e uno spazio misurato e M `e, ad
esempio, R, vorremo trovare selezioni misurabili; quando W e M sono spazi
topologici, andremo in cerca di selezioni continue.
Cominciamo dal caso di insiemi niti.
Teorema 7.5.2 (del matrimonio) Siano W, M insiemi non vuoti, con W
nito; sia F : W T(M) una multifunzione. Allora esiste una selezione
iniettiva m : W M se e solo se risulta
#S #F(S) S W,
ove #S `e la cardinalit`a di S.
Prima di dimostrare il teorema, vediamo come esso si applica al problema
del matrimonio. Vi `e un certo insieme W ,= di donne ed un certo insieme
M ,= di uomini; lobiettivo `e far sposare pi` u donne possibile. Per`o il matri-
monio deve aver luogo fra individui compatibili, o amici (mutuamente
attraenti). La multifunzione F `e l amicizia: ad ogni donna w W viene
associato linsieme F(w) M dei suoi amici di sesso maschile, tra i quali ella
dovr`a scegliersi lo sposo. La condizione #S #F(S) dice che un arbitrario
insieme di donne non `e pi` u grosso dellinsieme di tutti gli amici di esse; in
particolare `e escluso il caso in cui due donne debbono per forza litigarsi lo
stesso uomo. La selezione m : W M `e il matrimonio: m(w) `e il marito
scelto da w nella cerchia dei suoi amici; m deve essere iniettiva per garantire
la monogamia dei maschi. Il teorema 7.5.2 dice allora che tutte le donne
possono sposarsi.
Dimostrazione
`
E chiaro che la condizione #S #F(S) per ogni S W `e
245
necessaria per lesistenza di una selezione iniettiva: infatti se questa esiste si
ha
#S = #m(S) #F(S) S W.
Proviamo che la condizione `e anche suciente. Ragioneremo per induzione
sulla cardinalit`a di W.
Se #W = 1, c`e un unico elemento w W, al quale possiamo associare un
qualsiasi elemento F(w) (per ipotesi, #F(w) 1); posto m(w) = ,
abbiamo nito.
Fissato n > 1, supponiamo di sapere che se #W < n ogni multifunzione
G : W T(M) abbia una selezione iniettiva m : W M; consideriamo il
caso #W = n e la multifunzione F. Vi sono due sottocasi:
(I) #S < #F(S) per ogni S W non vuoto;
(II) esiste S

W, non vuoto, tale che #S

= #F(S

).
Nel caso (I), scegliamo w W e F(w), e deniamo m(w) = . Resta
da denire m sullinsieme W w, che `e non vuoto e per il quale quindi si
ha, per ipotesi,
n 1 = #W w < #F(W w).
Consideriamo la multifunzione F
1
: W w T(M ), denita da
F
1
(w) = F(w) w W w.
Dalla denizione di F
1
segue che
F
1
(S) = F(S) S W w,
ed in particolare
#F
1
(S) #F(S) 1 #S S W w.
Dunque, per ipotesi induttiva, la multifunzione F
1
ha una selezione iniettiva
m
1
: W w M , e si ha m
1
(w) F
1
(w) F(w) per ogni w
W w. La funzione
m(w) =
_
se w = w
m
1
(w) se w ,= w
246
`e la selezione di F cercata.
Nel caso (II), essendo #S

< #W, per ipotesi induttiva esiste una selezione


iniettiva m

: S

F(S

). Resta da denire la selezione su W S

. A questo
scopo consideriamo la multifunzione F
1
: W S

T(M F(S

)) denita da
F
1
(w) = F(w) F(S

) w W S

.
A priori F
1
(w) potrebbe essere vuoto per qualche w; dimostreremo che si ha,
al contrario,
#S #F
1
(S) S W S

(cosicche, in particolare, 1 #F
1
(w) per ogni w W S

). Infatti, se per
assurdo esistesse T W S

tale che #T > #F


1
(T), allora dallinclusione
F(S

T) F(S

) (F(T) F(S

))
dedurremmo
#F(S

T) #F(S

) + #(F(T) F(S

)) =
= #S

+ #F
1
(T) < #S

+ #T = #(S

T),
il che contraddirebbe lipotesi #S #F(S) per ogni S W.
Pertanto possiamo applicare lipotesi induttiva alla multifunzione F
1
: si ot-
tiene che F
1
ha una selezione iniettiva m
1
: W S

M F(S

), e si ha
m
1
(w) F
1
(w) F(w) per ogni w W S

. Posto
m(w) =
_
m

(w) se w S

m
1
(w) se w W S

,
m `e la selezione di F cercata. Dunque vale la tesi del teorema quando
#W = n, e ci`o conclude la dimostrazione.
Passiamo ora al caso degli spazi misurati (in una situazione particolarmente
semplice).
Teorema 7.5.3 (di Kuratowski e Ryll-Nardzewski) Sia [a, b] R, sia
X uno spazio di Banach separabile e sia F : [a, b] T(X) una multifunzione
tale che:
(i) F(t) `e non vuoto e chiuso in X per ogni t [a, b];
(ii) F
1
(A) `e misurabile secondo Lebesgue per ogni aperto A X.
247
Allora F ha una selezione f : [a, b] X fortemente misurabile.
Dimostrazione Sia D = c
j

jN
X un sottoinsieme numerabile e denso:
allora a maggior ragione, D `e denso in X anche rispetto alla distanza
d
X
(x, y) =
|x y|
1 +|x y|
x, y X.
In questa dimostrazione lavoreremo con la distanza d
X
in luogo della norma
di X: notiamo che d
X
(x, y) < 1 per ogni x, y X. Inoltre, deniamo
B(x, r) = y X : d
X
(x, y) < r x X, r > 0,
d
X
(x, A) = inf
yA
d
X
(x, y) x X, A X.
Utilizzando la successione c
j
, dimostriamo il seguente
Lemma 7.5.4 Nelle ipotesi del teorema, esiste una successione
n

nN
di
funzioni da [a, b] in X con le seguenti propriet`a:
(a)
n
`e fortemente misurabile;
(b) d
X
(
n
(t), F(t)) < 2
n
per ogni t [a, b];
(c) d
X
(
n
(t),
n1
(t)) < 2
1n
per ogni t [a, b].
Dimostrazione Fissiamo c
j
0
D: ovviamente si ha d
X
(c
j
0
, F(t)) < 1 per
ogni t [a, b], cosicche, posto
0
(t) = c
j
0
, `e evidente che
0
verica (a) e
(b).
Fissato p N
+
, supponiamo che siano gi`a state costruite
0
,
1
, . . . ,
p1
vericanti (a) e (b); andiamo a denire una funzione
p
con le stesse pro-
priet`a.
Poniamo
A
j,p
= F
1
(B(c
j
, 2
p
))
1
p1
(B(c
j
, 2
1p
)) j N,
E
0,p
= A
0,p
, E
j,p
= A
j,p

j1
_
k=0
E
k,p
j N
+
,
ed osserviamo che, ovviamente, gli E
j,p
sono tutti disgiunti; proviamo, preli-
minarmente, che risulta

j=0
E
j,p
= [a, b].
248
Sia t [a, b]; poiche d
X
(
p1
(t), F(t)) < 2
1p
, esister`a un punto
p,t
F(t)
tale che d
X
(
p1
(t),
p,t
) < 2
1p
. Adesso scegliamo un numero tale che
0 < <
1
2 +|
p1
(t)
p,t
|
X
,
il che equivale, come `e facile vericare, alla condizione
|
p1
(t)
p,t
|
X
1 +|
p1
(t)
p,t
|
X
<
1
2
|
p1
(t)
p,t
|
X
1 +|
p1
(t)
p,t
|
X
.
Posto
p,t
=
p1
(t) + (1 )
p,t
, si ha allora
d
X
(
p,t
,
p,t
) <
1
2
d
X
(
p1
(t),
p,t
) < 2
p
.
Per densit`a, esister`a c
jp
D tale che
d
X
(c
jp
,
p,t
) < 2
p
d
X
(
p,t
,
p,t
).
Da questa relazione segue
d
X
(c
jp
, F(t)) d
X
(c
jp
,
p,t
) d
X
(c
jp
,
p,t
) +d
X
(
p,t
,
p,t
) < 2
p
,
e anche
d
X
(
p1
(t), c
jp
) d
X
(
p1
(t),
p,t
) +d
X
(
p,t
, c
jp
) <
< d
X
(
p1
(t),
p,t
) + 2
p
d
X
(
p,t
,
p,t
)
2
p
+d
X
(
p1
(t),
p,t
) < 2
p
+ 2
p
= 2
1p
.
Pertanto, dalla denizione degli A
j,p
segue che t A
jp,p
. Di conseguenza, o
t E
jp,p
oppure t E
i,p
per qualche i < j
p
; in ogni caso sar`a t

j=0
E
j,p
,
come si voleva.
Deniamo allora la funzione
p
: [a, b] X nel modo seguente:

p
(t) = c
j
t E
j,p
, j N.
Ora osserviamo che ciascun E
j,p
`e misurabile secondo Lebesgue: infatti sono
misurabili gli A
j,p
, a causa dellipotesi (ii) e della forte misurabilit`a di
p1
.
Dunque, essendo

p
(t) = lim
n
n

j=0
c
j

E
j,p
(t) t [a, b],
249
la funzione
p
`e limite puntuale di funzioni semplici e pertanto `e fortemente
misurabile, ossia verica (a). Proviamo che
p
verica anche (b). Sia t
[a, b]; esiste j tale che t E
j,p
A
j,p
. Ci`o signica tre cose:

p
(t) = c
j
, d
X
(
p1
(t), c
j
) < 2
1p
, x F(t) : d
X
(x, c
j
) < 2
p
.
Da questi fatti segue
d
X
(
p
(t), F(t)) d
X
(c
j
, x) < 2
p
, d
X
(
p
(t),
p1
(t)) < 2
1p
,
e dunque, qualsiasi sia t [a, b], `e soddisfatta non solo la propriet`a (b) (il
che conclude il passo induttivo) ma anche la (c). Dunque la successione
n

verica (a) e (b), per induzione, e anche (c), per costruzione. Il lemma 7.5.4
`e dimostrato.
Il teorema di Kuratowski e Ryll-Nardzewski si dimostra ora facilmente. La
propriet`a (c) del lemma 7.5.4 mostra che
n
converge puntualmente in
X a una funzione f che, dunque, `e fortemente misurabile (esercizio 3.1.4).
Inoltre, dalla (b) del lemma segue d
X
(f(t), F(t)) = 0, ed essendo F(t) chiuso
si conclude che f(t) F(t). Ci`o prova il teorema 7.5.3.
Inne esaminiamo il caso degli spazi topologici.
Teorema 7.5.5 (di Michael) Sia X uno spazio topologico paracompatto,
sia Y uno spazio di Banach e sia F : X T(Y ) una multifunzione semi-
continua inferiormente e tale che F(x) sia non vuoto, chiuso e convesso per
ogni x X. Allora F ha una selezione continua f : X Y .
Si noti che se F `e semicontinua superiormente anziche inferiormente il teo-
rema non `e vero: ad esempio la multifunzione F : R T(R) denita
da
F(x) =
_
_
_
0 se x > 0
[0, 1] se x = 0
1 se x < 0
`e semicontinua superiormente, non `e semicontinua inferiormente in x = 0
e, pur vericando gli insiemi F(x) le ipotesi richieste, F `e priva di selezioni
continue.
Dimostrazione Tutto si basa sul seguente lemma di approssimazione:
250
Lemma 7.5.6 Sia W uno spazio topologico paracompatto, sia M uno spazio
di Banach e sia G : W T(M) una multifunzione semicontinua inferior-
mente, tale che G(w) sia non vuoto e convesso per ogni w W. Allora per
ogni > 0 esiste una funzione continua g : W M che verica
d(g(w), G(w)) < w W.
Dimostrazione Fissiamo unarbitraria selezione m : W M della multi-
funzione G (costruibile, ad esempio, con lassioma della scelta). Poiche G `e
semicontinua inferiormente, ssati w W ed > 0 esiste un intorno aperto
U(w) di w in W tale che
G(x) B(m(w), ) ,= x U(w).
Poiche W `e paracompatto, il ricoprimento U(w)
wW
ha un ranamento
V
i

iI
localmente nito: ci`o signica che per ogni i I esiste w
i
W
tale che V
i
U(w
i
), ed inoltre ogni w W ha un intorno che interseca un
numero nito di intorni V
i
. Sia f
i

iI
una partizione dellunit`a associata al
ricoprimento V
i
: poniamo allora
g(x) =

i
f
i
(x)m(w
i
) x W;
la somma `e nita per ogni ssato x W, quindi g `e ben denita ed `e continua
perche tali sono le f
i
. Inoltre se f
i
(x) > 0 si ha x V
i
U(w
i
) e dunque,
per denizione di U(w
i
),
d(m(w
i
), G(x)) < .
Ne segue che g(x) `e una combinazione convessa di elementi di G(x)+B(0, 1);
poiche per ipotesi G(x) `e convesso, anche tale insieme `e convesso e pertanto
g(x) G(x) +B(0, 1). Ci`o prova il lemma.
Proviamo il teorema di Michael. Utilizzando il lemma 7.5.6, per ogni n N
andiamo a costruire una funzione continua g
n
: X Y con le seguenti
propriet`a:
d(g
n
(x), F(x)) < 2
n
x X,
|g
n
(x) g
n1
(x)|
X
< 2
2n
x X.
La costruzione ricalca quella usata nella dimostrazione del lemma 7.5.4. Se
n = 0, basta applicare il lemma 7.5.6 con M = X, W = Y , = 1 e G = F,
251
e poi prendere g
0
= g. Se sono state costruite g
0
, g
1
, . . . , g
n1
, consideriamo
la multifunzione G
n
: X T(Y ) denita da
G
n
(x) = F(x) B(g
n1
(x), 2
1n
);
per ipotesi induttiva, G
n
(x) `e non vuoto e convesso per ogni x X.
Proviamo che G
n
`e semicontinua inferiormente: ssato x X, sia y G
n
(x)
e sia N un intorno di y in Y . Osservato che y B(g
n1
(x), 2
1n
), sia > 0
tale che B(y, ) N B(g
n1
(x), 2
1n
), cosicche |y g
n1
(x)|
Y
< 2
1n
;
allora, essendo F semicontinua inferiormente, esiste un intorno U
1
di x in
X tale che F(v) B(y,

2
) ,= per ogni v U
1
. Daltra parte, essendo
g
n1
continua, esiste un altro intorno U
2
di x in X tale che g
n1
(U
2
)
B(g
n1
(x),

2
). Di conseguenza, posto U = U
1
U
2
, se v U linsieme
F(v) B(y,

2
) contiene almeno un elemento z, e si ha
|z g
n1
(v)|
Y

|z y|
Y
+|y g
n1
(x)|
Y
+|g
n1
(x) g
n1
(v)|
Y
<
<

2
+ 2
1n
+

2
= 2
1n
,
cosicche z G
n
(v) B(y,

2
) G
n
(v) N. Ci`o prova che G
n
(v) N ,= per
ogni v U, e dunque G
n
`e semicontinua inferiormente.
Possiamo perci`o applicare il lemma 7.5.6 con W = X, M = Y , G = G
n
e
= 2
n
, trovando una funzione continua g
n
: X Y tale che
d(g
n
(x), G
n
(x)) < 2
n
x X;
ne segue che, per costruzione, g
n
soddisfa alle due condizioni richieste, le
quali per induzione sono vere per ogni n.
La successione g
n
cos` costruita `e di Cauchy rispetto alla convergenza uni-
forme: poiche Y `e uno spazio di Banach, essa converge ad una funzione
continua f : X Y ; questa funzione `e una selezione di F in quanto per ogni
x X si ha d(f(x), F(x)) = 0 e F(x) `e chiuso.
Nel caso speciale in cui Y `e uno spazio di Hilbert e la multifunzione F `e
continua, il teorema 7.5.5 si pu`o migliorare e precisare.
Teorema 7.5.7 Sia X uno spazio topologico, sia Y uno spazio di Hilbert e
sia F : X T(Y ) una multifunzione continua e tale che F(x) sia non vuoto,
252
convesso e chiuso per ogni x X. Allora la proiezione di 0 sul convesso F(x),
ossia la funzione
f : X Y, f(x) = P
F(x)
(0) x X,
`e una selezione continua di F. Essa viene chiamata selezione minimale di
F.
Dimostrazione Poiche F `e continua, F `e sia semicontinua superiormente
che inferiormente; in particolare, ssati > 0 e x
0
X, esiste un intorno U
di x
0
in X con le seguenti propriet`a:
F(x) F(x
0
) +B(0, 1) x U,
F(x) B(f(x
0
), ) ,= x U,
ove f(x) = P
F(x)
(0).
Sia dunque x U: per ogni y F(x), scelto y
0
F(x
0
) tale che |y y
0
|
Y
<
, dalla minimalit`a di |f(x
0
)|
Y
si deduce
|y|
Y
|y
0
|
Y
|f(x
0
)|
Y
,
e dunque, ancora per minimalit`a,
|f(x)|
Y
|f(x
0
)|
Y
x U;
dalla seconda relazione si ricava invece, scelto y F(x) B(f(x
0
), ),
|f(x)|
Y
|y|
Y
|f(x
0
)|
Y
+ x U.
Ci` o prova che per ogni x U il vettore f(x) appartiene alla corona S

di
centro 0 e raggi |f(x
0
)|
Y
; ne segue
f(x) S

[F(x
0
) +B(0, 1)] x U.
Daltra parte, per ogni y S

[F(x
0
) +B(0, 1)] F(x), con x U, risulta,
posto y = y
0
+z ove y
0
F(x
0
) e z B(0, 1):
|f(x
0
) y|
2
Y
= |f(x
0
)|
2
Y
+|y|
2
Y
2(f(x
0
), y)
Y

|f(x
0
)|
2
Y
+ (|f(x
0
)|
Y
+)
2
2(f(x
0
), y
0
+z)
Y
=
= 2|f(x
0
)|
2
Y
+[2|f(x
0
)|
Y
2(f(x
0
), z)
Y
+] 2(f(x
0
), y
0
)
Y

2(f(x
0
), f(x
0
) y
0
)
Y
+ 4|f(x
0
)|
Y
+
2
.
253
Dalla disequazione variazionale di cui, per denizione, f(x
0
) `e soluzione,
concludiamo che si ha
|f(x
0
) y|
2
Y
4|f(x
0
)|
Y
+
2
,
ed in particolare, scelto y = f(x) con x U, si ottiene
|f(x
0
) f(x)|
Y
< c x U.
Ci` o prova che x f(x) `e continua; ovviamente, poi, f(x) = P
F(x)
(0) F(x),
e quindi f `e una selezione di F.
Esercizi 7.5
1. Sia X uno spazio topologico paracompatto, sia Y uno spazio di Banach
e sia F : X T(Y ) una multifunzione semicontinua inferiormente, tale
che F(x) sia non vuoto, chiuso e convesso per ogni x X. Si provi che
per ogni x
0
X e per ogni y
0
F(x
0
) esiste una selezione continua
f
0
: X Y di F, tale che f
0
(x
0
) = y
0
.
2. Nelle ipotesi dellesercizio precedente, sia : X T(Y ) unaltra mul-
tifunzione tale che F(x)(x) ,= per ogni x X; supponiamo inoltre
che il suo graco G() sia aperto in XY . Si provi che per ogni x
0
X
e per ogni y
0
F(x
0
) (x
0
) esistono un intorno U di x
0
in X ed una
funzione continua f : U Y , tali che f(x
0
) = y
0
e f(x) F(x) (x)
per ogni x U.
3. Nelle ipotesi dellesercizio precedente, si supponga inoltre che F(x)
(x) sia convesso per ogni x X. Si costruisca una selezione continua
di F .
[Traccia: utilizzando lesercizio 7.5.2, per ogni x X e z F(x) si
trovino un intorno U
x
di x in X ed una funzione continua f
x
: U
x
Y
tali che f
x
(x) = z e f
x
(v) F(v) (v) per ogni v U
x
; si costruisca
un ranamento localmente nito V
i
U
x
i
di U
x

xX
, si ssi
una partizione dellunit`a g
i
ad esso associata e si provi che f(v) =

i
g
i
(v)f
x
i
(v) `e la selezione cercata.]
4. Sia B la palla unitaria chiusa di R
2
. Per ogni x B 0 siano

x
,
x
deniti dalla relazione x = (
x
cos
x
,
x
sin
x
) e si denisca la
254
multifunzione F : B T(B) nel modo seguente:
F(x) =
_
B se x = 0,
(cos , sin ) : [
x
[ (1
x
)] se x ,= 0.
Provare che:
(i) F : B T(B) `e continua;
(ii) F(x) `e compatto per ogni x B;
(iii) F non ha alcuna selezione continua.
[Traccia: per (iii), ragionare per assurdo, utilizzando il teorema di
Brouwer ed il fatto che F(x) = x per ogni x B.]
7.6 Inclusioni dierenziali
Consideriamo una multifunzione F denita su un aperto U R
N+1
, a valori
in T(R
N
). Vogliamo determinare una funzione x : R R
N
, con derivata
continua, che sia soluzione dellinclusione dierenziale
_
x

(t) F(t, x(t)), t R,


x(t
0
) = x
0
,
ove (t
0
, x
0
) `e un ssato punto di U. Il senso della questione `e il seguente:
la multifunzione F associa agli stati x(t) di un sistema linsieme delle sue
possibili velocit`a. Si modellano in questo modo, attraverso le inclusioni dif-
ferenziali, quei sistemi dinamici nei quali la complessit`a o la grandezza `e tale
da non consentire una completa descrizione dei fenomeni e delle interazio-
ni presenti, generando dunque un certo grado di indeterminazione. Svariati
esempi di sistemi di questo tipo compaiono in biologia, in economia e nelle
scienze sociali.
Una semplice applicazione del teorema di Michael (teorema 7.5.5) porta al
seguente risultato:
Teorema 7.6.1 Sia U R
N+1
un aperto, sia F : U T(R
N
) una multi-
funzione semicontinua inferiormente, tale che F(t, x) sia non vuoto, chiuso
e convesso per ogni (t, x) U. Fissato (t
0
, x
0
) U, valgono i seguenti fatti:
255
(i) esiste una funzione x di classe C
1
, denita in un intorno J di t
0
, a valori
in R
N
, tale che
_
x

(t) F(t, x(t)), t J,


x(t
0
) = x
0
;
(ii) esistono un intervallo aperto I =]a, b[ contenente t
0
ed una funzione x
C
1
(I) che risolve linclusione dierenziale sopra scritta nellintervallo
I e che `e massimale: ci`o signica che si ha a = oppure a R e
(t, x(t)) U quando t a
+
; un enunciato analogo vale per lestremo
b.
Dimostrazione Per il teorema 7.5.5, esiste una selezione continua f di F.
Allora si pu`o considerare il problema di Cauchy
_
x

(t) = f(t, x(t)), t J,


x(t
0
) = x
0
;
questo problema di Cauchy ha soluzione in virt` u del teorema di esistenza
di Peano, valido quando f `e continua nella coppia (t, x). Ogni soluzione di
questo problema `e una soluzione dellinclusione dierenziale, e verica la (ii)
se opportunamente prolungata.
Esercizi 7.6
1. Sia F : R
2
T(R) denita da F(t, x) = 1, 1. Determinare le
soluzioni dellinclusione dierenziale
x

(t) F(t, x(t)), x(0) = 0.


2. Sia F : R
2
T(R) denita da F(t, x) = [[t[, [t[]. Determinare le
soluzioni dellinclusione dierenziale
x

(t) F(t, x(t)), x(0) = 0.


7.7 Multifunzioni monotone
La nozione di monotonia, per le multifunzioni cos` come per gli operatori, `e
molto utile nelle applicazioni: `e una propriet`a che in un certo senso sostituisce
256
la continuit`a o la semicontinuit`a.
Cominciamo col denire la monotonia per insiemi. In questo paragrafo e nei
successivi faremo uso della notazione , u)
X
, gi`a usata nel paragrafo 3.1,
in luogo di quella usuale (u) per indicare lazione del funzionale X

sullelemento u X.
Denizione 7.7.1 Sia X uno spazio di Banach. Se X `e reale, un insieme
S X X

si dice monotono se si ha
, u v)
X
0 (u, ), (v, ) S.
Se X `e complesso, linsieme S `e monotono se
Re , u v)
X
0 (u, ), (v, ) S.
Un insieme S X X

si dice massimale monotono se `e monotono e se


non esiste alcun insieme monotono S

X X

tale che S S

.
Ad esempio, se X = R (cosicche X

= R) un insieme S R
2
`e monotono se
(y y

) (xx

) 0 per ogni (x, y), (x

, y

) S, ovvero se vale limplicazione


(x, y), (x

, y

) S, x x

= y y

.
In particolare, in R
2
il segmento di estremi (0, 0) e (1, 1) `e un insieme mono-
tono ma non massimale monotono; lo stesso segmento, unito alle semirette
verticali 0] , 0] e 1 [1, [, `e un insieme massimale monotono,
mentre il segmento di estremi (0, 1) e (1, 0) non `e un insieme monotono.
Passiamo ora a denire la monotonia per multifunzioni.
Denizione 7.7.2 Sia X uno spazio di Banach e sia A : X T(X

)
una multifunzione. Diciamo che A `e monotona se il suo graco G(A) `e un
sottoinsieme monotono di X X

. Diciamo che A `e massimale monotona


se G(A) `e massimale monotono in X X

.
Osservazione 7.7.3
`
E facile vericare che se X `e uno spazio di Banach una
multifunzione A : X T(X

) `e massimale monotona se e solo se `e monotona


e
(u, ) X X

, Re , u v)
X
0 (v, ) G(A) =
= (u, ) G(A).
257
`
E chiaro che la denizione di monotonia per multifunzioni si riduce a quella
usuale (vedere la proposizione 5.2.5) nel caso in cui la multifunzione sia ad
un sol valore, cio`e sia una funzione. In particolare, un operatore monotono
A : D(A) X X

`e massimale monotono se e solo se


(u, ) X X

, Re A(v), u v)
X
0 v D(A) =
= u D(A) e A(u) = .
Ad esempio, se X = X

= R ogni funzione crescente f : R R `e monotona,


e se `e anche continua allora `e massimale monotona (esercizio 7.7.2). Se invece
la funzione crescente f ha un salto nel (solo) punto x
0
R, risulta massimale
monotona la multifunzione F : R T(R
2
) denita da
F(x) =
_
f(x) se x ,= x
0
,
[f(x

0
), f(x
+
0
)] se x = x
0
.
Vediamo alcune propriet`a delle multifunzioni massimali monotone, la cui
fondamentale importanza applicativa sar`a chiara nel seguito.
Proposizione 7.7.4 Sia X uno spazio di Banach e sia A : X T(X

)
una multifunzione. Detta J : X X

limmersione canonica, si ha che A `e


monotona, oppure massimale monotona, se e solo se J A
1
: X

T(X

)
`e monotona, oppure massimale monotona.
Dimostrazione Per denizione di graco e di multifunzione inversa si ha
G(J A
1
) = (, ) : (J A
1
)() = (, J
x
) : x A
1
() =
= (, J
x
) : (, x) G(A
1
) = (, J
x
) : (x, ) G(A);
`e facile allora riconoscere che G(A) `e monotono in X X

se e solo se lo `e
G(J A
1
) in X

.
Sia poi G(J A
1
) massimale monotono e sia, per assurdo, S un insieme
monotono tale che G(A) S X X

; allora `e immediato vericare che


linsieme
S

= (, J
x
) : (x, ) S
`e un insieme monotono tale che G(J A
1
) S

. Il viceversa `e
analogo.
Proposizione 7.7.5 Sia X uno spazio di Banach e sia A : X T(X

) una
multifunzione massimale monotona. Allora per ogni u X linsieme A(u) `e
convesso e chiuso per la topologia debole* di X

.
258
Dimostrazione Supporremo X reale, ma quando X `e complesso il calcolo
`e del tutto analogo. Sia u X e siano , A(u). Se t ]0, 1[, poniamo

t
= (1 t) +t e mostriamo che
t
A(u). Per ogni (v, ) G(A) si ha

t
, u v)
X
= (1 t) , u v)
X
+t , u v)
X
0,
dunque (u,
t
) G(A) per losservazione 7.7.3; pertanto
t
A(u) e A(u) `e
convesso.
Proviamo che A(u) `e debolmente* chiuso in X

. Sia / A(u): per denizio-


ne si ha (u, ) / G(A), e per losservazione 7.7.3 deve esistere (v, ) G(A)
tale che
= , u v)
X
< 0.
Poniamo
U = X

: [ , u v)
X
[ < .
Linsieme U `e aperto nella topologia debole* di X

, e se U si ha
, u v)
X
= , u v) + , u v)
X
< = 0.
Dunque (u, ) / G(A) per ogni U, ossia risulta U A(u) = . Ci`o prova
che A(u)
c
`e w

-aperto, il che signica che A(u) `e debolmente* chiuso.


Consideriamo ora multifunzioni ad un sol valore: questo corrisponde ad ope-
ratori A : D(A) X X

, ove il dominio di A `e linsieme degli u X per


i quali la multifunzione corrispondente ad A assume valore A(u) ,= .
Proposizione 7.7.6 Sia X uno spazio di Banach riessivo e sia A : D(A)
X X

un operatore monotono ed emicontinuo, ossia continuo sui sotto-


spazi mono-dimensionali rispetto alla topologia debole* di X

. Se D(A) = X,
allora A `e massimale monotono.
Lipotesi di emicontinuit`a signica che per ogni u, v, w X la funzione reale
t A(u +tv)w `e continua.
Dimostrazione Sia (u, ) X X

tale che
Re A(v), u v)
X
0 v X.
In virt` u dellosservazione 7.7.3, baster`a provare che A(u) = . Scegliamo
v = u tw, con t > 0 e w X: si ha
Re A(u tw), tw)
X
0 w X, t > 0,
259
e dividendo per t
Re A(u tw), w)
X
0 w X;
per t 0
+
si deduce, grazie allemicontinuit`a di A, che
Re A(u), w)
X
0 w X,
e scrivendo w in luogo di w si conclude che
Re A(u), w)
X
= 0 w X.
In modo analogo, scegliendo v = u itw, si dimostra che
Im A(u), w)
X
= 0 w X.
Ne segue che = A(u).
Teorema 7.7.7 (di Minty) Sia X uno spazio di Hilbert e sia A : D(A)
X X un operatore monotono. Allora A `e massimale monotono se e solo
se loperatore I +A `e surgettivo, ove I : X X `e lidentit`a.
Questo risultato spiega limportanza della propriet`a di massimale monotonia:
essa garantisce la surgettivit`a delloperatore I +A e quindi la risolubilit`a di
equazioni della forma u+A(u) = g, con A massimale monotono e g assegna-
ta. Vedremo nel seguito che molti operatori che compaiono nelle applicazioni
sono in eetti massimali monotoni.
Dimostrazione (=) Proveremo questa implicazione pi` u avanti, come co-
rollario di un pi` u generale teorema di Browder (corollario 7.9.7).
(=) Sia R(I +A) = X. Vale il seguente
Lemma 7.7.8 Nelle ipotesi del teorema 7.7.7, sia I + A surgettivo; allora
per ogni > 0 loperatore I + A `e bigettivo e linverso (I + A)
1
`e un
operatore non espansivo, ossia lipschitziano con costante uguale a 1.
Dimostrazione Se u, v D(A) si ha, grazie alla monotonia di A,
|(I +A)(u) (I +A)(v)|
2
X
=
= |u v|
2
X
+
2
|A(u) A(v)|
2
X
+ 2Re (A(u) A(v), u v)
X

|u v|
2
X
;
260
quindi I + A `e iniettivo per ogni > 0. In particolare, I + A `e bigettivo e
(I +A)
1
`e non espansivo. Sia ora >
1
2
: ssato w X, risolvere rispetto a
u lequazione u + A(u) = w equivale a trovare u D(A) tale che A(u) =
w u, ossia u +A(u) = u +
1

(w u), ed inne (I +A)(u) = u +


1

(w u).
Quindi si cerca u D(A) tale che
u = (I +A)
1
_
u +
1

(w u)
_
= L
w
(u).
Dobbiamo dunque trovare un punto sso u D(A) per loperatore L
w
, ove
w X `e ssato. Dato che (I +A)
1
`e non espansivo, risulta per u, v X
|L
w
(u) L
w
(v)|
X
=
=
_
_
_
_
(I +A)
1
_
u +
1

(w u)
_
(I +A)
1
_
v +
1

(w v)
__
_
_
_
X

_
_
_
_
_
u +
1

(w u)
_

_
v +
1

(w v)
__
_
_
_
X
=
=

1
1

|u v|
X
;
poiche [1
1

[ < 1, loperatore L
w
`e una contrazione nello spazio di Hilbert
X, con valori in D(A). Per il teorema delle contrazioni esiste un unico punto
sso u D(A). Pertanto, per ogni w X vi `e un unico u D(A) tale che
u +A(u) = w, ossia loperatore I +A `e bigettivo per ogni >
1
2
.
Se ripetiamo questa argomentazione con I +A al posto di I +A, ove >
1
2
,
otteniamo la bigettivit`a di I + A per ogni >

2
, e quindi per ogni >
1
4
.
Iterando questo procedimento, si ha la tesi del lemma per ogni > 2
n
, con
n arbitrario, e dunque il lemma `e provato.
Torniamo alla dimostrazione del teorema di Minty. Sia (u, w) X X tale
che
Re (w A(v), u v)
X
0 v D(A);
poniamo v
t
= (I +A)
1
(u +w +tz), ove t > 0 e z X. Poiche
Re (w A(v
t
), u v
t
)
X
0, Re (u v
t
, u v
t
)
X
= |u v
t
|
2
X
0,
sommando si ha
Re (tz, u v
t
)
X
= Re (w +u A(v
t
) v
t
, u v
t
)
X
0,
261
da cui, dividendo per t,
Re (z, u (I +A)
1
(u +w +tz))
X
= (z, u v
t
)
X
0,
e per t 0
+
Re (z, u (I +A)
1
(u +w))
X
0 z X.
Similmente, ponendo stavolta v
t
= (I +A)
1
(u +w +itz), si ottiene
Im(z, u (I +A)
1
(u +w))
X
0 z X.
Per larbitrariet`a di z, ci`o implica u = (I +A)
1
(u +w), ovvero u +A(u) =
u+w, e dunque A(u) = w. Per losservazione 7.7.3 si conclude che loperatore
A `e massimale monotono.
Esercizi 7.7
1. Sia X uno spazio di Banach e sia A : X T(X

) una multifunzione
monotona. Provare che A
1
e A (con > 0) sono monotone; provare
anche che sono monotone la chiusura di A, denita da
A(x) = chiusura debole di A(x) in X

e linviluppo convesso chiuso di A, cio`e


co(A)(x) = co(A(x)).
2. Provare che ogni funzione f : R R continua e crescente `e unappli-
cazione massimale monotona.
3. Sia F : R R crescente. Si provi che la multifunzione f, denita da
f(x) = [f(x

), f(x
+
)] per ogni x R, `e massimale monotona. Si provi
anche che ogni multifunzione massimale monotona g : R T(R) `e di
questo tipo.
4. Sia X uno spazio di Hilbert. Se J : X X `e una contrazione, si
verichi che I +J `e monotona, ove I `e lidentit`a su X.
262
5. Sia X uno spazio di Hilbert e sia A : X X un operatore monotono.
Se / : L
2
(a, b; X) L
2
(a, b; X) `e denito da
[/(u)]() = A(u()) u L
2
(a, b; X),
si provi che / `e monotono.
6. Sia X uno spazio di Banach riessivo, e sia A : X T(X

) una multi-
funzione monotona ed emicontinua, ossia tale che per ogni u, v X la
multifunzione t A(tu+(1 t)v), da [0, 1] in T(X

) sia semicontinua
superiormente rispetto alla topologia debole di X. Supponiamo anche
che A(u) sia convesso e debolmente chiuso in X

per ogni u X. Si
provi che se (u, ) D(A) X

e se
Re , u v)
X
0 (v, ) D(A),
allora (u, ) G(A).
[Traccia: supponendo / A(u), si faccia uso del teorema di Hahn-
Banach (teorema 1.7.1).]
7. Sia X uno spazio di Banach riessivo, e sia A : X T(X

) una
multifunzione monotona, emicontinua e tale che A(u) sia non vuoto,
convesso e chiuso in X

per ogni u X. Si provi che A `e massimale


monotono.
[Traccia: utilizzare lesercizio precedente.]
7.8 Alcune multifunzioni massimali monoto-
ne
Raggruppiamo in questo paragrafo alcuni esempi signicativi di multifunzioni
o di operatori massimali monotoni.
Esempio 7.8.1 (applicazioni di dualit`a) Sia X uno spazio di Banach:
consideriamo lapplicazione di dualit`a introdotta nellesempio 7.1.6 (2), che
`e denita per ogni x X da
F(x) = X

: , x)
X
= |x|
2
X
= ||
2
X
.
Le propriet`a elementari di questa multifunzione sono raggruppate nel seguen-
te
263
Lemma 7.8.2 Sia X uno spazio di Banach (reale o complesso). Lapplica-
zione di dualit`a F sopra denita verica:
(i) F(x) `e un convesso chiuso non vuoto di X

per ogni x X;
(ii) si ha F(x) = F(x) per ogni C e per ogni x X;
(iii) F `e monotona;
(iv) se X `e riessivo, allora

xX
F(x) = X

;
(v) se X `e uno spazio di Hilbert, allora F(x) = x per ogni x X.
Dimostrazione (i) F(x) `e ovviamente chiuso, ed `e non vuoto in virt` u del
teorema di Hahn-Banach. Proviamo la convessit`a: se , F(x) e ]0, 1[,
allora
(1)+, x)
X
= (1), x)
X
+, x)
X
= (1)|x|
2
X
+|x|
2
X
= |x|
2
X
da cui
|(1 ) +|
X
|x|
X
;
daltronde
|(1 ) +|
X
(1 )||
X
+||
X
= |x|
X
,
e dunque (1 ) + F(x).
(ii) La tesi `e conseguenza del fatto, di immediata verica, che F(x)
se e solo se (1/) F(x).
(iii) Dobbiamo provare che
Re , x y)
X
0 x, y X, F(x), F(y).
In eetti, poiche , x)
X
= |x|
2
X
= ||
2
X
e , y)
X
= |y|
2
X
= ||
2
X
si ha
Re , x y)
X
= Re (, x)
X
, y)
X
, x)
X
+, y)
X
)
|x|
2
X
2|x|
X
|y|
X
+|y|
2
X
= (|x|
X
|y|
X
)
2
0.
(iv) Sia X riessivo: ssato X

, per il teorema di Hahn-Banach esiste


un elemento X

, che sar`a della forma = J


x
con x X, tale che
, x)
X
= J
x
, )
X
= ||
X
, |x|
X
= |J
x
|
X
= 1.
264
Ne segue che lelemento y = tx, ove t = ||
X
, verica
, y)
X
= ||
2
X
= |y|
2
X
,
cio`e F(y).
(v) Sia X uno spazio di Hilbert. Se x = 0, allora per denizione F(0) = 0.
Se invece x ,= 0 e z, w F(x) X

= X, si ha
(z, x)
X
= |z|
2
X
= |x|
2
X
= |w|
2
X
= (w, x)
X
,= 0.
Quindi, essendo 2|x|
2
X
= (z+w, x)
X
|z+w|
X
|x|
X
, si deduce |z+w|
X

2|x|
X
= |z|
X
+|w|
X
, ovvero |z + w|
X
= |z|
X
+|w|
X
. Ci`o implica che
esiste > 0 tale che w = z; dalla relazione (w, x)
X
= (z, x)
H
= (w, x)
H
,=
0 segue = 1 e quindi w = z. Pertanto F(x) ha un solo elemento. Dato che,
ovviamente, x F(x), si conclude che F(x) = x.
Proposizione 7.8.3 Sia X uno spazio di Banach reale o complesso. Lap-
plicazione di dualit`a F sopra denita `e massimale monotona.
Dimostrazione Sia (x, ) X X

tale che
Re , x y)
X
0 y X, F(y),
e proviamo che F(x); dallosservazione 7.7.3 seguir`a che F `e massimale
monotona.
Cominciamo col provare che ||
X
|x|
X
. Sia v
n

nN
una successione
di elementi di X tale che |v
n
|
X
= 1 e , v
n
)
X
||
X
per n (ed
in particolare Im, v
n
)
X
0). Scegliamo nella disuguaglianza precedente
y = x +tv
n
, con t > 0: poiche ||
X
= |x +tv
n
|
X
e |v
n
|
X
= 1 otteniamo
tRe , v
n
)
X
= Re , x y)
X
Re , x y)
X
=
= Re , tv
n
)
X
t|x +tv
n
|
X
,
da cui, dividendo per t,
Re , v
n
)
X
|x +tv
n
|
X
t > 0.
Se t 0
+
ricaviamo Re , v
n
)
X
|x|
X
per ogni n N; inne per n
si conclude che ||
X
|x|
X
.
265
Adesso mostriamo che Re, x)
X
= |x|
2
X
e che quindi |x|
X
||
X
. Ci`o
implicher`a F(x) e dunque la tesi. Sappiamo che risulta
Re , x)
X
Re , x)
X
+ Re , y)
X
|y|
2
X
y X, F(y).
Scegliamo y = x, con R: allora essendo F(x) = F(x), sar`a
= con F(x). Quindi , x)
X
= , x)
X
= |x|
2
X
e pertanto
Re , x)
X
|x|
2
X
+Re , x)
X

2
|x|
2
X
R.
Se ,= 1, dividendo per 1 otteniamo
Re , x)
X
|x|
2
X
< 1, Re , x)
X
|x|
2
X
> 1.
Al limite rispettivamente per 1

e per 1
+
deduciamo Re , x)
X
=
|x|
2
X
, il che `e quanto si voleva.
Esempio 7.8.4 (derivata seconda) Sia A loperatore u u

, denito
sullo spazio di Hilbert X = L
2
(a, b), con dominio
D(A) = u C
1
[a, b] : u

AC[a, b], u

L
2
(a, b), u(a) = u(b) = 0
(ma funzionano altrettanto bene le condizioni u

(a) = u

(b) = 0, oppure
u(a) = u

(b) = 0, oppure u

(a) = u(b) = 0).


Verichiamo che A `e monotono: se u D(A), integrando per parti (il che `e
lecito, dato che u e u

sono assolutamente continue) si ha


(Au, u)
X
=
_
b
a
(u

)u dx = [u

u]
b
a
+
_
b
a
[u

[
2
dx =
_
b
a
[u

[
2
dx 0,
ed essendo A lineare, la monotonia `e provata.
Verichiamo che A `e massimale monotono: per il teorema di Minty, basta
provare che R(I +A) = L
2
(a, b). Ed infatti, se f L
2
(a, b) il problema
_
u

+u = f in [a, b]
u(a) = u(b) = 0
ha lunica soluzione
u(x) =
_
b
a
sinh(b s) f(s) ds
sinh(b a)
sinh(x a)
_
x
a
sinh(x s) f(s) ds.
266
Esempio 7.8.5 (derivata prima) Sia H uno spazio di Hilbert, che iden-
ticheremo, al solito, con il suo duale H

, e poniamo, per un ssato T >


0,
X = L
2
(0, T; H)
(si veda il paragrafo 3.1). Esso `e uno spazio di Hilbert con il prodotto scalare
(f, g)
X
=
_
b
a
(f(t), g(t))
H
dt f, g X.
Nel lemma che segue vengono dimostrate alcune propriet`a importanti per il
seguito.
Lemma 7.8.6 Sia H uno spazio di Hilbert. Fissato T > 0, sia X =
L
2
(0, T; H) e sia Y lo spazio costituito da tutte le funzioni u : [0, T] H
appartenenti a X e tali che u `e derivabile q.o. in [0, T], u

X, e vale la
formula
u(t) u(s) =
_
t
s
u

() d s, t [0, T].
Allora:
(i) Y `e uno spazio di Hilbert con il prodotto scalare
(u, v)
Y
= (u, v)
X
+ (u

, v

)
X
;
(ii) C
1
([0, T], H) `e denso in Y ;
(iii) Y `e incluso con continuit`a in C([0, T], H);
(iv) vale la formula di integrazione per parti
(u(t), v(t))
H
(u(s), v(s))
H
=
=
_
t
s
[(u

(r), v(r))
H
+ (v

(r), u(r))
H
] dr u, v Y.
Dimostrazione (i) Anzitutto, lo spazio Y non si riduce a 0, dato che
contiene le funzioni costanti f(t) v, con v H. Sia u
n
una successione
di Cauchy in Y : poiche X `e completo, esistono u, v X tali che
u
n
u in L
2
(0, T; H), u

n
v in L
2
(0, T : H).
267
Per la continuit`a del prodotto scalare, per ogni C

0
(]0, T[, H) si ha
d
dt
(u
n
(t), (t))
H
= (u

n
(t), (t))
H
+ (u
n
(t),

(t))
H
q.o. in [0, T],
da cui, integrando,
_
T
0
(u

n
(t), (t))
H
dt =
_
T
0
(u
n
(t),

(t))
H
dt
e per n
_
T
0
(v(t), (t))
H
dt +
_
T
0
(u(t),

(t))
H
dt = 0 C(]0, T[, H).
Utilizzando unopportuna generalizzazione del lemma 4.2.3 (esercizio 7.8.1),
si deduce che
u

(t) = v(t) q.o. in [0, T],


e ci`o prova che u Y e che u
n
u in Y ; quindi Y `e completo.
(ii) Sia u Y ; estendiamo la u fuori di [0, T] in modo qualunque, ad
esempio ponendola uguale a 0 fuori di [0, T]. Sia C

0
(R) una funzione
non negativa, nulla fuori di [1, 1] e tale che
_
1
1
(t)dt = 1; poniamo per
> 0:
u

(t) =
_
R
u(t )()d =
1

_
R
u(s)
_
t s

_
ds, t [0, T].
Le funzioni u

sono in C
1
([0, T], H) con
u

(t) =
1

2
_
R
u(s)

_
t s

_
ds =
=
1

_
R
u

(s)
_
t s

_
ds =
_
R
u

(t )()d t [0, T].


268
Si ha allora
|u

u|
2
X
=
_
T
0
_
_
_
_
1

_
R
[u(s) u(t)]
_
t s

_
ds
_
_
_
_
2
H
dt

_
T
0
_
_
R
|u(s) u(t)|
H
_
1


_
t s

__1
2
+
1
2
ds
_
2
dt

_
T
0
__
R
|u(s) u(t)|
2
H
1


_
t s

_
ds
_ __
R
1


_
t s

_
ds
_
dt =
=
_
T
0
_
R
|u(t ) u(t)|
2
H
()ddt =
=
_
1
1
_
T
0
|u(t ) u(t)|
2
H
dt ()d,
e quando 0
+
risulta u

u in virt` u della continuit`a in L


2
delle trasla-
zioni e del teorema di Lebesgue.
In modo del tutto analogo,
|u

|
2
H

_
1
1
_
T
0
|u

(t ) u

(t)|
2
H
dt ()d 0 per 0
+
.
Ci` o prova che C
1
([0, T], H) `e denso in Y .
(iii) Sia u C
1
([0, T], H) e sia t
0
[0, T] un punto di minimo per |u()|
H
,
cosicche
|u(t
0
)|
H

1
T
_
T
0
|u(s)|
H
ds.
Allora si ha per ogni t [0, T]
|u(t)|
2
H
= |u(t
0
)|
2
H
+
_
t
t
0
d
ds
|u(s)|
2
H
ds =
= |u(t
0
)|
2
H
+ 2
_
t
t
0
(u

(s), u(s))
H
ds

_
1
T
_
T
0
|u(s)|
H
ds
_
2
+ 2|u

|
X
|u|
X

1
T
|u|
2
X
+ 2|u

|
X
|u|
X
2|u|
2
Y
,
269
da cui
|u|
C([0,T],H)
2|u|
Y
u C
1
([0, T], H).
Questa stima, in virt` u della densit`a (gi`a provata) di C
1
([0, T], H) in Y ,
si estende a tutte le funzioni u Y , mostrando cos` che Y `e incluso in
C([0, T], H) e che tale inclusione `e continua.
(iv) La formula di integrazione per parti vale quando u, v C
1
([0, T], H):
infatti
(u(t), v(t))
H
(u(s), v(s))
H
=
=
_
t
s
d
dr
(u(r), v(r))
H
dr =
_
t
s
[(u

(r), v(r))
H
+ (u(r), v

(r))
H
] dr;
dato che C
1
([0, T], H) `e denso in Y , e che Y `e immerso con continuit`a in
C([0, T], H), si ottiene che C
1
([0, T], H) `e anche denso nello spazio Y munito
della norma di C([0, T], H). Quindi la formula precedente si estende per den-
sit`a a tutte le funzioni u, v Y . Il lemma 7.8.6 `e completamente dimostrato.
Dopo tutte queste premesse, deniamo nalmente il dominio delloperatore
derivata prima
d
dx
. Abbiamo due opzioni:
D(L
1
) = u Y : u(0) = 0, L
1
u = u

u D(L
1
);
D(L
2
) = u Y : u(0) = u(T), L
2
u = u

u D(L
2
).
Proposizione 7.8.7 Sotto le ipotesi del lemma 7.8.6, per i = 1, 2 gli opera-
tori L
i
: D(L
i
) X X

sopra deniti sono massimali monotoni.


Dimostrazione Ovviamente, L
i
`e lineare; inoltre se u D(L
i
) si ha
L
i
u, u)
X
=
_
T
0
(u

(t), u(t))
H
dt =
1
2
_
T
0
d
dt
|u(t)|
2
H
dt =
=
1
2
_
|u(T)|
2
H
|u(0)|
2
H

0,
e ci`o prova la monotonia di L
i
, i = 1, 2.
Proviamo che L
i
`e massimale monotono: in virt` u del teorema di Minty (teo-
rema 7.7.7) baster`a provare che lequazione u+L
i
u = f ha soluzione per ogni
f L
2
(0, T; H). Tale equazione equivale a uno dei due problemi di Cauchy
_
u +u

= f in [0, T]
u(0) = 0
oppure
_
u +u

= f in [0, T]
u(0) = u(T)
270
Tali problemi hanno rispettivamente le soluzioni
u
1
(t) =
_
t
0
e
(ts)
f(s) ds,
u
2
(t) =
e
t
1 e
T
_
T
0
e
(Ts)
f(s) ds +
_
t
0
e
(ts)
f(s) ds,
il che prova la massimale monotonia di L
1
e L
2
.
Esempio 7.8.8 (sottodierenziale) Il sottodierenziale di una funzione
f : X R, ove X `e uno spazio di Banach, `e una multifunzione f : X
T(X

). Se f `e convessa, a valori in ] , +], semicontinua inferiormente


e propria, tale multifunzione `e massimale monotona, come vedremo. Questo
fatto `e vero per qualunque spazio di Banach, ma per semplicit`a ci limiteremo
a considerare il caso pi` u facile in cui X `e uno spazio di Hilbert.
Teorema 7.8.9 (di Rockafellar) Sia X uno spazio di Hilbert e sia f :
X ] , +] una funzione convessa, semicontinua inferiormente e pro-
pria. Allora f : X T(X

) `e massimale monotono ed inoltre il suo


dominio verica D(f) = D(f).
Dimostrazione Come anticipato nellosservazione 5.2.6, f `e monotono.
Proviamo adesso che R(I + f) = X per ogni > 0. Questo non implica
ancora la tesi: infatti il teorema di Minty (teorema 7.7.7) `e applicabile solo
alle funzioni; tuttavia questa propriet`a ci servir`a nel corso della dimostrazio-
ne.
Sia y un arbitrario punto di X: ssato > 0, consideriamo la funzione
g
,y
(x) = f(x) +
1
2
|x y|
2
X
, x X,
gi`a introdotta nel paragrafo 5.3. Per il lemma 5.3.1, essa ha un unico punto
di minimo x
0
X, e si ha
1

(y x
0
) f(x
0
); ci`o signica
y (I +f)(x
0
),
che `e quanto si voleva.
Proviamo che f `e massimale monotono. Siano u, w X tali che
(w x, u v)
X
0 v D(f), x f(v);
271
se proveremo che u D(f) e che w f(u), avremo dimostrato la tesi in
virt` u dellosservazione 7.7.3.
Consideriamo, per t > 0 e z X ssati, lelemento u + w + tz X: poiche
R(I +f) = X, esiste v
t
D(f) tale che
u +w +tz (I +f)(v
t
);
in altri termini possiamo scrivere
u +w +tz = v
t
+
t
,
t
f(v
t
).
Ora osserviamo che, per come sono stati scelti u, w,
(tz, u v
t
)
X
= (u v
t
+w
t
, u v
t
)
X
=
= |u v
t
|
2
X
+ (w
t
, u v
t
)
X
|u v
t
|
2
X
0,
il che implica, intanto, |u v
t
|
X
t|z|
X
e quindi v
t
u per t 0
+
.
Inoltre, applicando nuovamente la propriet`a R(I+f) = X, esiste v D(f)
tale che u +w (I +f)(v), cio`e
u +w v f(v).
Dimostriamo adesso il seguente facile
Lemma 7.8.10 Nelle ipotesi del teorema 7.8.9, siano w, v D(f): allora
|w v|
2
X
|w v +(x y)|
2
X
> 0, x f(w), y f(v).
Dimostrazione Basta osservare che
|wv+(xy)|
2
X
= |wv|
2
X
+
2
|xy|
2
X
+2(wv, xy)
X
|wv|
2
X
.
Scegliamo nel lemma
= 1, w = v
t
, x = u +w +tz v
t
, y = u +w v;
si ottiene
|v
t
v|
2
X
|v
t
v + (u +w +tz v
t
) (u +w v)|
2
X
= t
2
|z|
2
X
da cui v
t
v per t 0
+
. Ma allora u = v, cio`e
w f(u).
Ci` o dimostra che f `e massimale monotono.
Inne, la relazione D(f) = D(f) `e stata dimostrata nellosservazione 5.3.4.
272
Esercizi 7.8
1. Sia H uno spazio di Hilbert e siano u L
p
(0, T; H) e v L
q
(0, T; H)
(
1
p
+
1
q
= 1). Se risulta
_
T
0
[(

(t), u(t))
H
+ (v(t), (t))
H
] dt = 0 C

0
(]0, T[, H),
si provi che u `e derivabile q.o. a valori in H e che u

= v q.o. in [0, T].


2. Sia H uno spazio di Hilbert e sia K un convesso chiuso non vuoto
contenuto in H. Detta I
K
la funzione indicatrice di K, introdotta nel
capitolo 2, si provi che
(I +I
K
)
1
(v) = P
K
(v) v H,
ove P
K
`e la proiezione sul convesso K.
7.9 Inclusioni funzionali
Sia X uno spazio di Banach, sia K X un convesso chiuso non vuoto e
siano A, B : K T(X

) due multifunzioni, con A massimale monotona. La


multifunzione B rappresenta una perturbazione di A. Fissato un elemento
b X

, vogliamo studiare l inclusione funzionale


_
u K
b A(u) +B(u).
ove u `e lincognita. Il senso di questa scrittura `e il seguente: si cerca un
elemento u K tale che il funzionale b si possa scrivere come b = v + w,
con v A(u) e w B(u). Gli esempi che seguono forniscono alcune delle
numerose motivazioni che inducono a questo studio.
Esempio 7.9.1 (equazioni integrali) Unequazione integrale della forma
u(x) +
_

k(x, y)f(y, u(y))dy = g(x), x ,


ove `e un aperto di R
n
e g L
p
() `e una funzione assegnata, si pu`o mettere
nella forma astratta seguente:
u +KF(u) = g,
273
dove F(u) = f(, u()), Kv =
_

k(, y)v(y)dy. Utilizzando la multifunzione


K
1
, si pu`o scrivere anche
F(u) K
1
(g u),
ovvero
0 K
1
(g u) F(u).
Questa `e uninclusione funzionale che rientra nel nostro schema.
Esempio 7.9.2 (equazioni di evoluzione del 1
o
ordine) Si considerino
i problemi
_
u

+B(u) = f
u(0) = 0,
_
u

+B(u) = f
u(0) = u(T),
dove B `e un operatore, lineare o no, di L
p
(0, T; X) in se, ed f `e un ssato
elemento di L
p
(0, T; X) (X `e uno spazio di Banach). Utilizzando i risultati
dellesempio 7.8.5, i due problemi si riscrivono cos`:
f = L
i
u +B(u), i = 1, 2,
e questo `e un caso particolare della nostra inclusione funzionale.
Esempio 7.9.3 (problemi di minimo) Il problema di minimizzare una
funzione f : X R, ove X `e uno spazio di Banach, equivale per la
proposizione 5.1.8 alla condizione
0 f(u),
che `e ancora uninclusione funzionale.
Esempio 7.9.4 (disequazioni variazionali) Se X `e uno spazio di Bana-
ch, B : X X

`e un operatore (lineare o no) e X

, la disequazione
variazionale sul convesso chiuso K X
_
u K,
B(u) , v u)
X
0 v K
si traduce, in virt` u dellosservazione 6.3.7, nellinclusione funzionale
I
K
(u) +B(u) se K X,
= B(u) se K = X.
274
Pi` u in generale, se : X ], +] `e una funzione convessa, semicontinua
inferiormente e propria, la disequazione variazionale
B(u) , v u)
X
+(v) (u) 0 v X
equivale allinclusione funzionale
(u) +B(u).
Nella teoria delle inclusioni funzionali `e di fondamentale importanza il se-
guente risultato:
Teorema 7.9.5 (di Browder) Sia X uno spazio di Banach riessivo, e sia
b X

. Supponiamo che:
(i) K X sia un convesso chiuso non vuoto;
(ii) A : K T(X

) sia una multifunzione massimale monotona;


(iii) B : K X

sia unapplicazione limitata (ossia trasforma limitati


in limitati), demicontinua (ossia debolmente continua sui sottospazi
nito-dimensionali) e monotona;
(iv) nel caso che K sia illimitato, esistano u
0
D(A),
0
A(u
0
) e r > 0
tali che
B(u) +
0
, u u
0
)
X
> b, u u
0
)
X
u K con |u|
X
> r.
Allora esiste u D(A) che verica linclusione funzionale b A(u) +B(u).
Prima di dimostrare il teorema, segnaliamo i seguenti corollari di dimostra-
zione immediata.
Corollario 7.9.6 Sia X uno spazio di Banach riessivo. Supponiamo vere
le ipotesi (i), (ii) e (iii) del teorema 7.9.5; supponiamo poi che, nel caso che
K sia illimitato, esista u
0
D(A) tale che
B(u), u u
0
)
X
|u|
X
+ per u K, |u|
X
+.
Allora R(A +B) = X

.
275
Corollario 7.9.7 Sia X uno spazio di Hilbert e sia A : X T(X) una
multifunzione massimale monotona. Allora R(I +A) = X.
Si noti che in particolare il corollario 7.9.7 dimostra la seconda implicazione
del teorema 7.7.7.
Dimostrazione del teorema 7.9.5 Cominciamo con alcune osservazio-
ni preliminari. Anzitutto, come `e naturale aspettarsi, si ha D(A) ,= :
altrimenti avremmo G(A) = , cosicche denendo ad esempio
A(x) =
_
0 se x = 0
se x ,= 0,
la multifunzione A sarebbe unestensione propria e monotona di A, contrad-
dicendo la massimale monotonia di A.
Osserviamo anche che possiamo supporre u
0
= 0 e
0
= 0, ossia:
(a) che 0 D(A) e 0 A(0);
(b) che se K `e illimitato la propriet`a (iv) sia vera per u
0
= 0 e = 0.
Infatti nessuna di queste due richieste `e restrittiva: linclusione funzionale
u K, b A(u) +B(u)
equivale, posto v = u u
0
, allinclusione funzionale
v K u
0
, b A(v +u
0
)
0
+B(v +u
0
) +
0
.
Ne segue che, denendo A(v) = A(v +u
0
)
0
e B(v) = B(v +u
0
) +
0
, le
multifunzioni A e B vericano le ipotesi del teorema con K, u
0
e
0
rimpiaz-
zati rispettivamente da K u
0
, 0 X e 0 X

; inoltre 0 A(0). Quindi


valgono (a) e (b). Supporremo pertanto nel seguito che u
0
= 0 D(A) con

0
= 0 A(0) K.
La dimostrazione vera e propria `e alquanto articolata e si divide in vari passi.
1
o
passo: conversione dellinclusione funzionale in una disequazione varia-
zionale equivalente.
Proviamo che per un elemento u K si ha
_
u D(A)
b A(u) +B(u)

_
u K
b B(u) , u v)
X
0 (v, ) G(A).
276
Infatti, se vale linclusione funzionale allora (u, bB(u)) G(A) e quindi, per
monotonia, si ottiene la disequazione variazionale; viceversa, dalla validit`a
di questultima segue che (v, b B(u)) `e un elemento di X X

che verica
la condizione dellosservazione 7.7.3: dato che A `e massimale monotona, si
deduce (u, b B(u)) G(A), cosicche concludiamo che u verica linclusione
funzionale.
2
o
passo: stima a priori per le soluzioni della disequazione variazionale.
Se K `e limitato non c`e niente da dimostrare: K sar`a incluso in una palla di
centro 0 e raggio r e quindi se u risolve la disequazione variazionale risulter`a
|u|
X
r.
Se K `e illimitato e u K `e soluzione, allora poiche (0, 0) G(A) si ha
b B(u), u)
X
0.
Daltra parte lipotesi (iv) dice che esiste r > 0 per cui
b B(u), u)
X
< 0 per u K, |u|
X
> r;
dunque deve essere |u|
X
r.
3
o
passo: risoluzione della disequazione variazionale in dimensione nita.
Sia 1 linsieme di tutti i sottospazi nito-dimensionali di X. Sia Y 1, e
consideriamo la disequazione variazionale
u
Y
K Y, b B(u
Y
) , u
Y
v)
X
0 (v, ) G(A) con v Y.
Per R > 0 e Y 1, poniamo
K
R
= v K Y : |v|
X
R, G
R
= (v, ) G(A) : v K
R
,
e studiamo la disequazione variazionale in K
R
:
u
R
K
R
, b B(u
R
) , u
R
v)
X
0 (v, ) G
R
.
Poiche K
R
`e un convesso chiuso di Y e Y ha dimensione nita, questa
disequazione variazionale ha soluzione u
R
K
R
in virt` u del lemma che segue.
Lemma 7.9.8 Sia X uno spazio di Banach, sia K un convesso compatto non
vuoto di X; siano poi M K X

un insieme monotono e T : K X

unapplicazione w-continua. Allora esiste u K che risolve la disequazione


variazionale
T(u) f, u v)
X
0 (v, f) M.
277
Dimostrazione Supponiamo per assurdo che non vi sia alcuna soluzione in
K: allora per (v, f) M poniamo
U(v, f) = u K : T(u) f, u v)
X
< 0.
Linsieme U(v, f) `e aperto in K: infatti K U(v, f) `e chiuso, come segue
facilmente dalla w-continuit`a di T. Inoltre, poiche nessun u K risolve la
disequazione variazionale, si ha
K =
_
(v,f)M
U(v, f);
per compattezza, esistono (v
i
, f
i
) M, i = 1, . . . , m, tali che
K =
m
_
i=1
U(v
i
, f
i
).
Sia
i

1im
una partizione dellunit`a associata al ricoprimento U(v
i
, f
i
).
Poniamo K
1
= cov
1
, . . . , v
m
e deniamo
p : K
1
K
1
, p(u) =
m

j=1

j
(u)v
j
u K
1
,
q : K
1
X

, q(u) =
m

i=1

i
(u)f
i
u K
1
.
Dato che p `e continua, per il teorema di Brouwer esiste u K
1
K tale che
p(u) = u. Deniamo le quantit`a

ij
= T(u) f
i
, u v
j
)
X
;
dalla monotonia di M si ha

ij
+
ji
= T(u) f
i
, u v
j
)
X
+T(u) f
j
, u v
i
)
X
=
=
jj
+f
j
f
i
, u v
j
)
X
+
ii
+f
i
f
j
, u v
i
)
X
=
=
jj
+
ii
+f
j
f
i
, v
i
v
j
)
X

jj
+
ii
.
278
Ne segue
0 = T(u) q(u), u p(u))
X
=
=
m

i,j=1

i
(u)(T(u) f
i
),
j
(u)(u v
j
))
X
=
=
m

i,j=1

i
(u)
j
(u)
ij
=
m

i,j=1

i
(u)
j
(u)

ij
+
ji
2

i,j=1

i
(u)
j
(u)

jj
+
ii
2
.
Daltra parte, se
i
(u)
j
(u) > 0 allora u U(v
i
, f
i
) U(v
j
, f
j
) e quindi

jj
< 0,
ii
< 0: ne segue che gli addendi non nulli di questa somma sono
negativi e, visto che u K, essi non sono tutti nulli. Ci`o `e assurdo.
Applicando il lemma precedente, come gi`a osservato si ha che per ogni R > 0
la disequazione variazionale
u
R
K
R
, b B(u
R
) , u
R
v)
X
0 (v, ) G
R
ha soluzione. Sia S
R
linsieme delle soluzioni:
S
R
= u K
R
: b B(u) , u v)
X
0 (v, ) G
R
.
Oltre che non vuoto, S
R
`e limitato: infatti per ogni u S
R
si ha necessa-
riamente |u|
X
r (altrimenti, per lipotesi (iv), scegliendo (v, ) = (0, 0)
avremmo b B(u), u)
X
< 0, in contraddizione con la disequazione varia-
zionale). Poiche B `e demicontinuo, S
R
`e chiuso; dato che dimY < , S
R
`e
compatto. Inoltre
r R < R

= G
R
G
R
= S
R
S
R
,
cosicche S
R

Rr
`e una famiglia di compatti che ha la propriet`a dellinterse-
zione nita. Pertanto
u
Y

Rr
S
R
;
di conseguenza u
Y
K e
b B(u
Y
) , u
Y
v)
X
0 (v, ) G
R
, R r.
279
Quindi u
Y
`e soluzione della disequazione variazionale in Y . Si noti che
|u
Y
|
X
r per ogni Y 1.
4
o
passo: passaggio al limite quando Y invade X.
Per Z 1 deniamo
M
Z
= (u, B(u)) K X

: Y 1, Y Z tale che
b B(u) , u v)
X
0 (v, ) G(A) con v Y .
Osserviamo che se Z, W 1 e Z W, allora per denizione M
Z
M
W
.
Proveremo che
(u, )

ZV
M
Z
w
(ove M
Z
w
`e la chiusura debole di M
Z
), e che il corrispondente u risolve la
disequazione variazionale originaria.
Poiche loperatore B `e limitato, se (u, B(u)) M
Z
si ha |u|
X
r e dunque
|B(u)|
X
K
r
, con K
r
costante opportuna; quindi esiste una palla chiusa
S X X

tale che
_
ZV
M
Z
S.
Poiche X `e riessivo, tali sono X

e XX

; quindi S `e debolmente compat-


ta. Essendo M
Z
w
debolmente chiuso e contenuto in S, M
Z
w
`e debolmente
compatto e
_
ZV
M
Z
w
S.
Siano ora Z
1
, . . . , Z
m
1: posto W = [Z
1
, . . . , Z
m
] (il minimo sottospazio
contenente gli Z
i
), avremo M
W

m
i=1
M
Z
i
, da cui
M
W
w

i=1
M
Z
i
w

i=1
M
Z
i
w
.
Quindi, per la propriet`a dellintersezione nita, esiste (u, )

ZV
M
Z
w
.
5
o
passo: alcuni lemmi ausiliari.
Lemma 7.9.9 Nelle ipotesi del teorema 7.9.5, se (u, )

ZV
M
Z
w
allora
per ogni Z 1 esiste una successione (u
n
, B(u
n
)) M
Z
tale che u
n
u
in X e B(u
n
) in X

. In particolare, u K.
280
Dimostrazione Poiche M
Z
`e limitato in K X

, la sua chiusura debole


coincide con la sua chiusura debole sequenziale in virt` u del lemma 1.6.10.
Lemma 7.9.10 Nelle ipotesi del teorema 7.9.5, sia (u, )

ZV
M
Z
w
;
allora esiste (v, ) G(A) tale che
b , u v)
X
0.
Dimostrazione Altrimenti avremmo b , u v)
X
> 0 per ogni
(v, ) G(A); quindi otterremmo u D(A) e b A(u) per la mas-
simale monotonia di A. Ma allora, scelti v = u e = b , dedurremmo
0 > 0.
Lemma 7.9.11 Sia X uno spazio di Banach, sia K X un convesso chiuso
non vuoto e sia B : K X

un operatore monotono ed emicontinuo (ossia


debolmente continuo sulle rette). Allora B `e pseudomonotono, cio`e verica
la propriet`a seguente:
u
n
K, u
n
u, limsup
n
B(u
n
), u
n
u)
X
0 =
= B(u), u v)
X
liminf
n
B(u
n
), u
n
v)
X
v K.
Dimostrazione Sia u
n
K tale che
u
n
u in X, limsup
n
B(u
n
), u
n
u)
X
0.
Per monotonia
B(u), u
n
u)
X
B(u
n
), u
n
u)
X
n N,
e poiche u
n
u si deduce
lim
n
B(u
n
), u
n
u)
X
= 0.
Ancora per monotonia,
B(v), u
n
v)
X
B(u
n
), u
n
v)
X
n N, v K,
e per n
B(v), u v)
X
liminf
n
B(u
n
), u
n
v)
X
v K.
281
Adesso, ssato w K, scegliamo v = u +(w u), con ]0, 1]: si trova
B(u +(w u)), (u w))
X

liminf
n
[B(u
n
), u
n
u)
X
+B(u
n
), u w)
X
] =
= liminf
n
B(u
n
), u w)
X
=
= lim
n
B(u
n
), u u
n
)
X
+liminf
n
B(u
n
), u
n
w)
X
=
= liminf
n
B(u
n
), u
n
w)
X
.
Dividendo per e usando lemicontinuit`a di B, si deduce per 0
+
B(u), u w)
X
liminf
n
B(u
n
), u
n
w)
X
w K,
e ci`o prova la tesi.
6
o
passo: calcolo nale.
Sia (u, )

ZV
M
Z
w
. Per il lemma 7.9.10, esiste (v, ) G(A) tale che
b , u v)
X
0.
Sia Y 1 tale che v Y . Dimostreremo che
b B(u) , u v)
X
0 (v, ) G(A) con v Y ;
per larbitrariet`a di Y , ci`o prover`a che u `e soluzione della disequazione va-
riazionale originaria.
Per il lemma 7.9.9, esiste (u
n
, B(u
n
)) M
Y
tale che u
n
u in X e
B(u
n
) in X

; si ha, per denizione di M


Y
,
b B(u
n
) , u
n
v)
X
0 (v, ) G(A) con v Y.
Scriviamo questa relazione nella forma
B(u
n
), u
n
u)
X
b, v u
n
)
X
+B(u
n
), v u)
X
(v, ) G(A) con v Y.
Scelto (v, ) = (v, ), si trova per n
limsup
n
B(u
n
), u
n
u)
X

b, v u)
X
+, v u)
X
= b , u v)
X
0.
282
Dal lemma 7.9.10 deduciamo che B `e pseudomonotono; quindi
B(u), u v)
X
liminf
n
B(u
n
), u
n
v)
X
v K Y,
e usando la disequazione variazionale vericata da u
n
, otteniamo per ogni
(v, ) G(A) con v Y
B(u), u v)
X
liminf
n
b , u
n
v)
X
= b , u v)
X
.
Pertanto
b B(u) , u v)
X
0 (v, ) G(A) con v Y, Y 1,
cio`e la tesi. Il teorema 7.9.5 `e cos` provato.
Esercizi 7.9
1. Sia X uno spazio di Banach. Se B : X X

`e monotono ed emicon-
tinuo, si provi che B `e pseudomonotono.
2. Sia X uno spazio di Banach. Se B : X X

`e tale che
x
n
x in X = B(x
n
) B(x) in X

,
si provi che B `e pseudomonotono.
3. Sia X uno spazio nito-dimensionale. Se B L(X, X

), si provi che
B `e pseudomonotono.
4. Sia X uno spazio di Banach riessivo. Se A : X X

e B : X X

sono pseudomonotoni, si provi che A +B `e pseudomonotono.


5. Sia X uno spazio di Banach riessivo. Se A : X X

`e monotono ed
emicontinuo, e B : X X

`e tale che
x
n
x in X = B(x
n
) B(x) in X

,
si provi che A +B `e pseudomonotono.
6. Sia X uno spazio di Banach. Si provi che ogni operatore A : X X

lineare e monotono `e continuo.


283
7. Sia X uno spazio di Banach riessivo. Se A : X X

`e monotono ed
emicontinuo, si provi che A `e demicontinuo.
8. Sia X uno spazio di Banach. Si provi che se A : X X

`e tale che
x
n
x in X = A(x
n
) A(x) in X

,
allora A `e un operatore compatto, ossia trasforma insiemi limitati in
insiemi relativamente compatti; si mostri che se A `e lineare, allora vale
anche il viceversa.
9. Sia X uno spazio di Banach. Se A : X X

`e pseudomonotono
e B : X X

`e monotono ed emicontinuo, si provi che A + B `e


pseudomonotono.
10. Sia X uno spazio di Banach. Se A : X X

`e pseudomonotono e
B : X X

`e tale che
x
n
x in X = B(x
n
) B(x) in X

,
si provi che A +B `e pseudomonotono.
284
Bibliograa
[1] A. Andreotti, Lezioni sugli spazi vettoriali topologici, Ist. Mat. L.Tonelli,
Pisa 1965.
[2] J. P. Aubin, A. Cellina, Dierential inclusions. Set-valued maps and viability
theory, Springer Verlag, Berlin 1984.
[3] J. P. Aubin, H. Frankowska, Set-valued analysis, Birkhauser, Boston 1990.
[4] C. Baiocchi, A. Capelo, Disequazioni variazionali e quasi-variazionali. Appli-
cazioni a problemi di frontiera libera, Pitagora ed., Bologna 1976.
[5] V. Barbu, Th. Precupanu, Convexity and optimization in Banach spaces, D.
Reidel Publ. Comp., Dordrecht 1986.
[6] H. Brezis, Analyse fonctionnelle. Theorie et applications, Masson, Paris 1983.
[7] H. Brezis, Operateurs maximaux monotones et semi-groupes de contractions
dans les espaces de Hilbert, North-Holland Publ. Comp., Amsterdam 1973.
[8] E. Burger, Introduction to the theory of games, Prentice Hall, Englewood
Clis 1963.
[9] K. Deimling, Nonlinear functional analysis, Springer Verlag, Berlin 1985.
[10] N. Dunford, J. T. Schwartz, Linear operators, Interscience Publ., New York
1958.
[11] H. G. Eggleston, Convexity, Cambridge Univ. Press, Cambridge 1977.
[12] I. Ekeland, R.Temam, Analyse convexe et probl`emes variationnels, Dunod,
Paris 1974.
[13] I. M. Gelfand, S. V. Fomin, Calculus of variations, Prentice-Hall, Englewood
Clis 1963.
285
[14] E. Hille, R. S. Phillips, Functional analysis and semigroups, Amer. Math.
Soc., New York 1957.
[15] J.-B. Hiriart-Urruty, C. Lemarechal, Fundamentals of convex analysis,
Springer Verlag, Berlin 2001.
[16] D. Kinderlehrer, G. Stampacchia, An introduction to variational inequalities
and their applications, Academic Press, London 1980.
[17] A. N. Kolmogorov, S. V. Fomin, Elementi di teoria delle funzioni e di analisi
funzionale, Mir, Mosca 1980.
[18] G. Prodi, A. Ambrosetti, Analisi non lineare, Scuola Norm. Sup., Pisa 1973.
[19] T. Parthasarathy, T. E. S. Raghavan, Some topics in two-person games,
Elsevier, New York 1971.
[20] R. T. Rockafellar, R. J.-B. Wets, Variational analysis, Springer Verlag, Berlin
1988.
[21] W. Rudin, Functional analysis, McGraw-Hill, New York 1973.
[22] H. Sagan, Introduction to the calculus of variations, McGraw-Hill, New York
1969.
[23] F. Treves, Topological vector spaces, distributions and kernels, Academic
Press, New York 1967.
[24] J. L. Troutman, Variational calculus with elementary convexity, Springer
Verlag, Berlin 1983.
[25] E. Zeidler, Nonlinear functional analysis and its applications, Vol. I - IIA -
IIB, Springer Verlag, Berlin 1984.
286
Indice analitico
applicazione
n-lineare, 118
bilineare, 104, 117
continua, 117
simmetrica, 121
compatta, 226
di dualit`a, 221, 263
di prossimit`a, 205
assioma della scelta, 251
battaglia fra i sessi, 244
bipolare, 78, 176
brachistocrona, 155
catenoide, 155
chiusura
debole, 38
sequenziale, 38
di una multifunzione, 262
cicloide, 157
combinazione convessa, 54, 75
condizione
di estremalit`a, 86
di Legendre, 159, 160
coniugata di una funzione, 76
cono, 91
duale, 91
normale, 178, 197
controimmagine, 219
coppia strategica
mista, 239
ottimale, 239
ottimale, 237
curva di livello, 131
derivata
n-sima, 118
di Gateaux, 106
parziale, 121
prima, 105
seconda, 117
dierenziale
di Frech`et, 103
di funzioni composte, 104
di Gateaux, 106
secondo, 117
dilemma dei prigionieri, 240
disequazione
variazionale, 71, 195, 199, 206, 227,
274, 277
distribuzione, 27, 29
temperata, 28
disuguaglianza
di Holder, 102
di Minkowski, 102
di Young, 77
dominio
di una funzione, 57, 73
di una multifunzione, 219
duale
di C
1
[a, b], 164
di L
p
(a, b; X), 100
di uno spazio vettoriale topologico,
26, 30
elica cilindrica, 171
287
epigraco, 58, 60
equazione
di Eulero, 148
di evoluzione
del 1
o
ordine, 274
integrale, 273
equilibrio di Nash, 241
estremale, 148, 151
famiglia di seminorme, 9
che separano i punti, 10
lo elastico, 211
forma
bilineare, 197
coerciva, 198
continua, 118, 197
simmetrica, 197
formula
di integrazione per parti, 165
di Taylor, 118
funzionale, 140, 142
di Minkowski, 3, 57
lineare, 24, 57, 71
continuo, 24, 71
limitato, 24
lunghezza darco, 143, 149
funzione
a decrescenza rapida, 20
ane, 67
bipolare, 78, 176
concava, 56
coniugata, 76, 78
convessa, 56, 184
debolmente misurabile, 97
di classe C
1
, 105
di classe C
2
, 117
di supporto, 78, 81
di utilit`a, 236
dierenziabile
secondo Frech`et, 103
secondo Gateaux, 106
fortemente misurabile, 97
indicatrice, 57, 62, 80, 210, 273
lagrangiana, 87
lipschitziana, 75
localmente lipschitziana, 75
multivoca, 219
polare, 76
propria, 57
quasi concava, 57, 234
quasi convessa, 57, 65, 234
semicontinua inferiormente, 60
semicontinua superiormente, 60
semplice, 96
sommabile, 97
sottodierenziabile, 173
strettamente concava, 56
strettamente convessa, 56
geodetiche, 163
sul cilindro, 170
sul cono, 171
sulla sfera, 169
gioco, 236
a somma zero, 236, 238
battaglia fra i sessi, 244
del pari o dispari, 238, 239
dilemma dei prigionieri, 240
equo, 238
non cooperativo, 241
sasso-carta-forbici, 243
graco
di un funzionale lineare, 51
di una multifunzione, 219
immagine
di una multifunzione, 219
in un punto, 219
inclusione
dierenziale, 255
funzionale, 273, 275
288
rovesciata, 13, 52
insieme
assorbente, 2
bilanciato, 2
cerchiato, 2
convesso, 1, 57
debolmente chiuso, 29
di sopralivello, 234
di sottolivello, 57, 60, 234
diretto, 12
ltrante, 12
limitato, 21
massimale monotono, 257
monotono, 257
radiale, 2
simmetrico, 5
totalmente limitato, 50
integrale
di Bochner, 99
di funzioni semplici, 96
di una funzione sommabile, 99
primo, 151
inversa di una multifunzione, 220
inviluppo
convesso, 2
convesso chiuso
di un insieme, 12
di una multifunzione, 262
di una famiglia di funzioni, 67, 68
iperpiano
ane, 47
chiuso, 47
denso, 47
di appoggio, 47, 81, 197
lemmi fondamentali del calcolo delle va-
riazioni, 143146, 148, 162, 167,
216, 217, 268
massimi e minimi
relativi, 121
vincolati, 135
metodo
dei moltiplicatori, 135, 161, 164
metrica
di Hausdor, 224, 231
moltiplicatori di Lagrange, 197
multifunzione, 219
composta, 223
continua, 222
emicontinua, 263
inversa, 220, 221, 258
massimale monotona, 257, 263, 273,
276
monotona, 257
semicontinua inferiormente, 222
semicontinua superiormente, 221
net, 12
convergente, 13
di Cauchy, 13
norma
in L
p
(a, b; X), 100
in L

(a, b; X), 100


in L
2
(X, Y ), 117
in L
n
(X, Y ), 118
nucleo di un funzionale lineare, 24, 45,
46
operatore
aggiunto, 135
coercivo, 202
compatto, 284
demicontinuo, 206, 275
derivata
prima, 267, 270
seconda, 266
di superposizione, 109
emicontinuo, 259, 281
lineare, 23, 25
continuo, 23, 25
limitato, 26
289
lipschitziano, 260
massimale monotono, 258, 260, 263
monotono, 184, 203, 206, 259
non espansivo, 260
pseudomonotono, 281, 283
strettamente monotono, 206
ostacolo, 211
pari o dispari, 238, 239
parte
antisimmetrica, 200
simmetrica, 200
polare di una funzione, 76
poliedro convesso, 54
problema
ad estremi variabili, 151
del matrimonio, 245
di Cauchy, 127, 129, 130
di massimo
con vincolo, 135
di minimax, 87
di minimo, 61, 64, 140, 176, 274
con vincolo, 135, 163, 195, 211
duale, 83
isoperimetrico, 160
primale, 83
normale, 83
stabile, 83
punto
di appoggio, 48
di equilibrio di Nash, 241
di massimo, 86
relativo, 121123, 147, 159, 160
vincolato, 135, 137, 138
di minimo, 53, 64, 86, 149, 154, 158,
176, 188, 205, 234
relativo, 121123, 147, 158, 160
vincolato, 135, 137, 138, 167, 195,
196, 199, 212
di sella, 88, 232
estremo, 52
sso
di una funzione, 207, 225, 226
di una multifunzione, 222, 224
226
rapporto incrementale, 59, 180
regolarizzata
di una funzione convessa, 189
semicontinua, 68, 79, 84
relazione
dordine associata a un cono, 91
di estremalit`a, 86
selezione, 222, 245
continua, 245, 250, 254
fortemente misurabile, 248
iniettiva, 245
minimale, 253
misurabile, 245
seminorma, 5, 57
semispazio
aperto, 47
chiuso, 47
separazione
di insiemi convessi, 42, 65
separazione stretta
di insiemi convessi, 47, 65
sottodierenziale, 174, 221, 271
di una funzione convessa, 179
sottogradiente, 174
sottospazio
complementabile, 131
massimale, 45
chiuso, 46
denso, 46
spazio
C([a, b], X), 100
C
m
(), 14
C
m
0
(), 15
C
m
K
(), 15
290
C

(), 15
L
2
(0, T; H), 267
L
p
(a, b; X), 100
L

(a, b; X), 100

p
, 13
L
2
(X, Y ), 117
L
n
(X, Y ), 118
di Frech`et, 13
di Schwartz, 20
vettoriale topologico, 8
localmente convesso, 9
completo, 12, 13
di Hausdor, 8, 10
metrizzabile, 10
speranza di vincita, 239
strategia, 236
successione
convergente, 12
di Cauchy, 12
generalizzata, 12
supercie di rotazione di area minima,
154
teorema
del dierenziale totale, 107
del matrimonio, 245
del minimax, 234, 239
delle contrazioni, 224
delle funzioni implicite, 124, 132
di Banach-Alaoglu, 31, 175
di Browder
sui punti ssi, 229
sulle inclusioni funzionali, 260, 275
di Eberlein-Smulyan, 32
di Fenchel-Moreau, 79
di Hahn-Banach, 41
1
a
forma geometrica, 42, 47
2
a
forma geometrica, 43, 47
di Kakutani, 225
di Karush-Kuhn-Tucker, 94
di Krein-Milman, 52
di Kuratowski e Ryll-Nardzewski, 247
di Lagrange, 106
di Lax-Milgram, 202
di Lions-Stampacchia, 205
di Lyusternik, 131, 134, 136
di Mazur
sugli inviluppi convessi, 49, 226
sulle funzioni convesse, 75, 182
di Michael, 250, 255
di Minty, 260, 266, 276
di Peano, 256
di Riesz-Fischer, 100
di Rockafellar, 271
di Schauder, 226
di Tikhonov, 225
di von Neumann, 234
di Weierstrass, 61
topologia
(X, B), 27
(X, X

), 27, 29
(X

, X), 27, 30
debole, 27, 29, 235
debole*, 27, 30, 258
forte, 27, 227
indotta
da un sottoinsieme di X, 27
da un sottoinsieme di X

, 27
da una famiglia di seminorme, 9,
27, 29
valore
di un gioco, 237
di una multifunzione in un punto,
219
variet`a
ane, 47, 131
tangente, 131
vertice di un poliedro, 54, 75
291
Appunti del corso di
Analisi funzionale
Paolo Acquistapace
17 ottobre 2007
Indice
1 Misura di Lebesgue in R 1
1.1 Motivazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Lunghezza degli intervalli . . . . . . . . . . . . . . . . . . . . 2
1.3 Misura esterna di Lebesgue . . . . . . . . . . . . . . . . . . . 3
1.4 Insiemi misurabili secondo Lebesgue . . . . . . . . . . . . . . . 7
1.5 Misurabilit`a degli intervalli . . . . . . . . . . . . . . . . . . . . 13
1.6 Insieme di Cantor . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.7 Propriet`a della misura di Lebesgue . . . . . . . . . . . . . . . 17
1.8 Un insieme non misurabile . . . . . . . . . . . . . . . . . . . . 22
2 Misure 25
2.1 Spazi misurati . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Misura di Lebesgue in R
N
. . . . . . . . . . . . . . . . . . . . 31
2.3 Misure esterne di Hausdor . . . . . . . . . . . . . . . . . . . 32
2.4 Misure di Hausdor . . . . . . . . . . . . . . . . . . . . . . . . 36
2.5 Dimensione di Hausdor . . . . . . . . . . . . . . . . . . . . . 39
2.6 La misura H
N
in R
N
. . . . . . . . . . . . . . . . . . . . . . . 43
3 Funzioni misurabili 48
3.1 Denizione e propriet`a . . . . . . . . . . . . . . . . . . . . . . 48
3.2 Funzioni essenzialmente limitate . . . . . . . . . . . . . . . . . 54
3.3 Lo spazio L

. . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.4 Misurabilit`a e continuit`a . . . . . . . . . . . . . . . . . . . . . 59
3.5 Convergenza in misura . . . . . . . . . . . . . . . . . . . . . . 64
4 Lintegrale 69
4.1 Integrale di funzioni semplici . . . . . . . . . . . . . . . . . . . 69
4.2 Integrale di funzioni misurabili . . . . . . . . . . . . . . . . . . 73
i
4.3 Passaggio al limite sotto il segno di integrale . . . . . . . . . . 83
4.4 Confronto fra integrale di Riemann ed integrale di Lebesgue . 89
4.5 Assoluta continuit`a . . . . . . . . . . . . . . . . . . . . . . . . 99
4.6 Lo spazio L
1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.7 Teoremi di densit`a in L
1
. . . . . . . . . . . . . . . . . . . . . 106
5 Misure prodotto 113
5.1 Rettangoli misurabili . . . . . . . . . . . . . . . . . . . . . . . 113
5.2 Insiemi misurabili in X Y . . . . . . . . . . . . . . . . . . . 115
5.3 Teoremi di integrazione successiva . . . . . . . . . . . . . . . . 121
5.4 Completamento delle misure prodotto . . . . . . . . . . . . . . 128
6 Derivazione 136
6.1 Teorema fondamentale del calcolo integrale . . . . . . . . . . . 136
6.2 Punti di Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.3 Derivabilit`a delle funzioni monotone . . . . . . . . . . . . . . . 143
6.4 Funzioni a variazione limitata . . . . . . . . . . . . . . . . . . 150
6.5 Funzioni assolutamente continue . . . . . . . . . . . . . . . . . 153
6.6 Cambiamento di variabile . . . . . . . . . . . . . . . . . . . . 161
6.7 Cambiamento di variabili . . . . . . . . . . . . . . . . . . . . . 166
6.8 Appendice: dimostrazione del teorema di Brouwer . . . . . . . 174
7 Spazi di Banach 179
7.1 Norme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
7.2 Prodotti scalari . . . . . . . . . . . . . . . . . . . . . . . . . . 183
7.3 Operatori lineari e continui . . . . . . . . . . . . . . . . . . . . 189
8 Spazi di Hilbert 199
8.1 Proiezioni su convessi chiusi . . . . . . . . . . . . . . . . . . . 199
8.2 Il duale di uno spazio di Hilbert . . . . . . . . . . . . . . . . . 208
8.3 Sistemi ortonormali . . . . . . . . . . . . . . . . . . . . . . . . 215
8.4 Trasformata di Fourier . . . . . . . . . . . . . . . . . . . . . . 227
9 Spazi L
p
239
9.1 La norma di L
p
. . . . . . . . . . . . . . . . . . . . . . . . . . 239
9.2 Il duale di L
p
. . . . . . . . . . . . . . . . . . . . . . . . . . . 250
ii
10 Operatori lineari 259
10.1 Estensione di funzionali lineari . . . . . . . . . . . . . . . . . . 259
10.2 Uniforme limitatezza di operatori . . . . . . . . . . . . . . . . 267
10.3 Applicazioni aperte . . . . . . . . . . . . . . . . . . . . . . . . 272
10.4 Operatore aggiunto . . . . . . . . . . . . . . . . . . . . . . . . 279
10.5 Riessivit`a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
10.6 Convergenze deboli . . . . . . . . . . . . . . . . . . . . . . . . 289
10.7 Compattezza . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
11 Teoria spettrale 299
11.1 Spettro e risolvente . . . . . . . . . . . . . . . . . . . . . . . . 299
11.2 Operatori compatti . . . . . . . . . . . . . . . . . . . . . . . . 304
11.3 Operatori compatti in spazi di Hilbert . . . . . . . . . . . . . 311
11.4 Lalternativa di Fredholm . . . . . . . . . . . . . . . . . . . . 321
11.5 Lequazione di Sturm - Liouville . . . . . . . . . . . . . . . . . 328
11.6 Risolubilit`a dellequazione di Sturm - Liouville . . . . . . . . 333
11.7 Rappresentazione delle soluzioni . . . . . . . . . . . . . . . . . 336
Bibliograa 345
Indice analitico 347
iii
Capitolo 1
Misura di Lebesgue in R
1.1 Motivazioni
La teoria della misura e dellintegrazione secondo Riemann, concettualmente
semplice e soddisfacente per molti aspetti, non `e tuttavia cos` essibile da
consentire certe operazioni che pure appaiono naturali: ad esempio, si ha
lim
n
_
A
f
n
(x) dx =
_
A
lim
n
f
n
(x) dx
solo se A`e limitato e se vi `e convergenza uniforme delle f
n
; se A
n
`e una suc-
cessione di insiemi misurabili disgiunti, la loro unione non `e necessariamente
misurabile, ne, tanto meno, vale in generale la relazione
m
_
_
nN
A
n
_
=

nN
m(A
n
);
inne, le quantit`a
_
A
[f(x)[dx ,
__
A
[f(x)[
2
dx
_1
2
non sono norme sullo spazio delle funzioni Riemann integrabili 1(A), perche
manca loro la propriet`a di annullarsi se e solo se f `e identicamente nulla (la
f potrebbe essere non nulla in un numero nito di punti).
Vi sono poi altre, e pi` u importanti, motivazioni a posteriori: la teoria del-
lintegrazione secondo Lebesgue ha dato lavvio ad enormi sviluppi nellanalisi
1
funzionale, nella teoria della probabilit`a, ed in svariatissime applicazioni (ri-
soluzione di equazioni dierenziali, calcolo delle variazioni, ricerca operativa,
sica matematica, matematica nanziaria, biomatematica, ed altre ancora).
Esporremo la teoria della misura di Lebesgue seguendo la presentazione in-
trodotta da Caratheodory, che `e quella che pi` u facilmente si estende, come
vedremo, al caso di misure astratte denite su insiemi arbitrari.
Esercizi 1.1
1. Esibire una successione di funzioni f
n
denite su [a, b], Riemann
integrabili in [a, b], puntualmente convergenti in [a, b], e tali che
lim
n
_
b
a
f
n
(x) dx ,=
_
b
a
lim
n
f
n
(x) dx.
2. Esibire una successione di sottoinsiemi A
n
di R, misurabili secondo
Riemann e disgiunti, tali che la loro unione non sia misurabile secondo
Riemann.
1.2 Lunghezza degli intervalli
Il punto di partenza, come `e naturale, `e lattribuzione di una lunghezza agli
intervalli della retta reale.
Denizione 1.2.1 Sia I un intervallo di R. La sua lunghezza l(I) `e data
da
l(I) =
_
b a se ]a, b[ I [a, b],
+ se I `e illimitato.
La funzione l(I) associa ad ogni intervallo di R un numero in [0, +] (si
noti che, in particolare, l() e l(a) valgono 0). Vogliamo estendere tale
funzione a sottoinsiemi di R pi` u generali, in modo da poterli misurare.
Sarebbe auspicabile poter denire una funzione di insieme m che verichi le
seguenti propriet`a:
1. m(E) `e denita per ogni E R;
2. m(I) = l(I) per ogni intervallo I;
2
3. (numerabile additivit`a) se E
n

nN
`e una famiglia numerabile di insiemi
disgiunti, allora
m
_
_
nN
E
n
_
=

nN
m(E
n
);
4. (invarianza per traslazioni) per ogni x R e per ogni E R si ha
m(x +E) = m(E), ove x +E = y R : y x E.
Sfortunatamente si pu`o dimostrare (si veda lesercizio 2.1.8) che non `e pos-
sibile soddisfare simultaneamente queste richieste: se si vogliono mantenere
le propriet`a 2, 3 e 4 non si potranno misurare tutti i sottoinsiemi di R; se,
al contrario, si vuole mantenere la propriet`a 1, occorrer`a indebolire qualcuna
delle altre, ad esempio sostituire la 3 con la seguente:
3
t
. (numerabile subadditivit`a) se E
n

nN
`e una famiglia numerabile di
sottoinsiemi di R, allora
m
_
_
nN
E
n
_

nN
m(E
n
).
Considerazioni geometriche ci inducono a considerare irrinunciabili le pro-
priet`a 2, 3 e 4: di conseguenza, come si vedr`a, la classe degli insiemi misu-
rabili sar`a un sottoinsieme proprio di T(R).
Esercizi 1.2
1. Si provi che la famiglia delle unioni nite di intervalli di R aperti a
destra `e unalgebra, ossia `e una classe contenente linsieme vuoto e
chiusa rispetto allunione ed al passaggio al complementare.
2. Si verichi che la famiglia delle unioni nite di intervalli aperti di R
non `e unalgebra.
1.3 Misura esterna di Lebesgue
Cominciamo ad attribuire ad ogni sottoinsieme di R una misura esterna
che goda delle propriet`a 1, 2, 3
t
e 4 del paragrafo 1.2.
3
Denizione 1.3.1 Se E R, la misura esterna m

(E) `e data da
m

(E) = inf
_

nN
l(I
n
) : E
_
nN
I
n
, I
n
intervalli aperti
_
.
Dalla denizione seguono subito le seguenti propriet`a:
Proposizione 1.3.2 Si ha:
(i) m

(E) 0 E R;
(ii) m

() = m

(x) = 0 x R;
(iii) (monotonia) se E F allora m

(E) m

(F).
Dimostrazione (i) Evidente.
(ii) Per ogni > 0 si ha x ]x , x + [; questo intervallo ha
lunghezza 2 e ricopre x e . Quindi, per denizione,
m

() 2, m

(x) 2 > 0,
da cui la tesi.
(iii) Se E F, ogni ricoprimento I
n
di F costituito da intervalli aperti `e
anche un ricoprimento di E, da cui
m

(E)

nN
l(I
n
);
per larbitrariet`a del ricoprimento di F, si ottiene la tesi.
Verichiamo ora la propriet`a 2:
Proposizione 1.3.3 Se I R `e un intervallo, allora m

(I) = l(I).
Dimostrazione Supponiamo dapprima I = [a, b]. Per ogni > 0 lintervallo
]a , b +[ ricopre I, e quindi per denizione si ha
m

(I) l(]a , b +[) = b a + 2 > 0,


da cui m

(I) b a.
Per provare la disuguaglianza opposta, sia I
n

nN
un ricoprimento di I co-
stituito da intervalli aperti; poiche I `e compatto, esister`a un sottoricopri-
mento nito I
n
1
, . . . , I
nm
. Eliminando eventualmente qualcuno degli I
n
k
,
4
possiamo supporre che gli I
n
k
siano tutti distinti fra loro, ed inoltre che il
ricoprimento sia minimale, nel senso che togliendo un I
n
k
gli intervalli residui
non ricoprano pi` u [a, b].
Ordiniamo gli intervalli I
n
k
=]a
k
, b
k
[ in modo che
a
1
< a
2
< a
3
< < a
m
;
si noti che non pu`o aversi a
k
= a
k+1
, poiche in tal caso si avrebbe I
n
k
I
n
k+1
se b
k
< b
k+1
e linclusione contraria se b
k
> b
k+1
: quindi potremmo eliminare
uno dei due intervalli. Avremo poi a
1
< a < b
1
, perche se fosse b
1
a
potremmo eliminare I
n
1
, e possiamo supporre b
1
b, perche da b < b
1
segue
[a, b] I
n
1
e in tal caso si ha direttamente l(I) = ba < b
1
a
1

nN
l(I
n
),
che `e ci`o a cui vogliamo arrivare). Risulta anche
a
1
< a a
2
< b
1
< b
2
:
infatti se fosse b
2
b
1
potremmo eliminare I
n
2
, se fosse b
1
a
2
risulterebbe
b
1
[a, b]

m
k=1
I
n
k
, e se fosse a
2
< a potremmo eliminare I
n
1
.
Ragionando in modo analogo troviamo che
a
k1
< a
k
< b
k1
< b
k
, k = 3, 4, . . . , m1,
ed inne per lindice m avremo
a
m1
< a
m
< b
m1
b < b
m
.
Pertanto

nN
l(I
n
)
m

k=1
l(I
n
k
) =
m

k=1
(b
k
a
k
) >
> (b b
m1
) +
m1

k=2
(b
k
b
k1
) + (b
1
a) = b a.
Dallarbitrariet`a del ricoprimento segue m

(I) b a = l(I).
Sia ora I tale che I = [a, b]. Poiche per ogni ]0,
ba
2
[ si ha [a + , b ]
I [a, b], dalla monotonia di m

e da quanto gi`a dimostrato segue


b a 2 m

(I) b a
_
0,
b a
2
_
,
5
e quindi m

(I) = b a = l(I).
Inne, se I `e illimitato, per ogni n N esiste un intervallo J
n
di lunghezza
n contenuto in I: quindi, per monotonia,
m

(I) m

(J
n
) = l(J
n
) = n n N,
cio`e m

(I) = + = l(I).
Verichiamo ora che m

gode della propriet`a 3


t
del paragrafo 1.2.
Proposizione 1.3.4 La misura esterna m

`e numerabilmente subadditiva.
Dimostrazione Sia E
n
una successione di sottoinsiemi di R: dobbiamo
provare che
m

_
_
nN
E
n
_

nN
m

(E
n
).
Ci` o `e ovvio se la serie a secondo membro `e divergente; supponiamo quindi che
essa sia convergente, cosicche in particolare m

(E
n
) < per ogni n N. Per
denizione di misura esterna, ssato > 0 esiste un ricoprimento I
kn

kN
di E
n
costituito di intervalli aperti, tale che

kN
l(I
kn
) < m

(E
n
) +

2
n+1
.
La famiglia I
kn

k,nN
`e allora un ricoprimento di

nN
E
n
costituito di
intervalli aperti, e si ha
m

_
_
nN
E
n
_

k,nN
l(I
kn
)

nN
_
m

(E
n
) +

2
n+1
_
=

nN
m

(E
n
) + ;
dallarbitrariet`a di segue la tesi.
Inne osserviamo che m

verica anche la propriet`a 4 del paragrafo 1.2:


infatti la lunghezza degli intervalli `e ovviamente invariante per traslazioni;
ne segue facilmente, usando la denizione, che anche m

`e invariante per
traslazioni.
Come vedremo in seguito, la misura esterna non verica invece la propriet`a
3 del paragrafo 1.2, ed anzi non `e nemmeno nitamente additiva su T(R)
(esercizio 1.8.4). Sar`a per`o numerabilmente additiva su una sottoclasse molto
vasta di T(R).
6
Esercizi 1.3
1. Sia t R 0. Posto tE = x R :
x
t
E, si provi che
m

(tE) = [t[m

(E).
2. Dimostrare che la funzione di insieme m

non cambia se nella deni-


zione 1.3.1 si fa uso, anziche di intervalli I
n
aperti, di intervalli I
n
di
uno dei seguenti tipi:
(a) intervalli I
n
chiusi;
(b) intervalli I
n
aperti a destra;
(c) intervalli I
n
qualunque;
(d) intervalli I
n
ad estremi razionali.
3. Si dimostri che ogni aperto di R `e unione al pi` u numerabile di intervalli
aperti disgiunti.
4. Si provi che ogni aperto non vuoto di R ha misura esterna strettamente
positiva.
5. Si provi che ogni sottoinsieme numerabile di R ha misura esterna nulla.
6. Per ogni > 0 si costruisca un aperto A R, denso in R, tale che
m

(A) < .
7. Sia E R un insieme di misura esterna strettamente positiva. Si provi
che per ogni > 0 esiste un intervallo I tale che m

(EI) > (1)l(I).


[Traccia: ssato > 0, si prenda un aperto A contenente E, tale che
m

(A) < m

(E) + ; si utilizzi lesercizio 1.3.3 e si verichi che per


sucientemente piccolo, uno almeno degli intervalli che compongono A
verica necessariamente la tesi.]
1.4 Insiemi misurabili secondo Lebesgue
Introduciamo adesso una classe di sottoinsiemi di R sulla quale la funzione
m

`e numerabilmente additiva (propriet`a 3 del paragrafo 1.2).


7
Denizione 1.4.1 Un insieme E R `e detto misurabile (secondo Lebesgue)
se per ogni insieme A R si ha
m

(A) = m

(A E) +m

(A E
c
).
Indicheremo con / la classe dei sottoinsiemi misurabili di R.
Un sottoinsieme E di R `e dunque misurabile se, ssato un arbitrario insieme
test A R, esso viene decomposto bene da E, nel senso che la misura
esterna di A `e additiva sulle due parti A E e A E
c
. Si noti che per la
subadditivit`a di m

si ha sempre
m

(A) m

(A E) +m

(A E
c
),
quindi la disuguaglianza signicativa `e quella opposta.
Osservazione 1.4.2 Dalla denizione segue subito che E `e misurabile se e
solo se lo `e E
c
; quindi / `e chiusa rispetto al passaggio al complementare.
Inoltre `e facile vedere che R, sono insiemi misurabili.
Pi` u in generale:
Proposizione 1.4.3 Se E R e m

(E) = 0, allora E `e misurabile.


Dimostrazione Per ogni insieme test A R si ha
m

(A) m

(A E) +m

(A E
c
)
in quanto m

(A E) m

(E) = 0. Ne segue la tesi.


La classe / `e chiusa anche rispetto allunione; si ha infatti:
Proposizione 1.4.4 Se E, F R sono misurabili, allora EF `e misurabile.
Dimostrazione Sia A un insieme test. Poich`e E `e misurabile,
m

(A) = m

(A E) +m

(A E
c
);
poich`e F `e misurabile, scelto come insieme test A E
c
si ha
m

(A E
c
) = m

(A E
c
F) +m

(A E
c
F
c
) =
= m

(A E
c
F) +m

(A (E F)
c
),
8
e dunque
m

(A) = m

(A E) +m

(A E
c
F) +m

(A (E F)
c
);
daltra parte, essendo
(A E) (A E
c
F) = A (E F),
la subadditivit`a di m

implica che
m

(A E) +m

(A E
c
F) m

(A (E F)),
da cui nalmente
m

(A) m

(A (E F)) +m

(A (E F)
c
).
Ci` o prova la misurabilit`a di E F.
Corollario 1.4.5 Se E, F R sono misurabili, allora E F ed E F sono
misurabili.
Dimostrazione Se E, F /, allora E
c
, F
c
/; per la proposizione
precedente, E
c
F
c
/ e quindi E F = (E
c
F
c
)
c
/. Di qui segue
E F = E F
c
/.
La classe / contiene linsieme vuoto ed `e chiusa rispetto alle operazioni di
unione, intersezione e dierenza; in particolare, /`e unalgebra (v. esercizio
1.2.1).
Osservazione 1.4.6 Se E, F sono insiemi misurabili e disgiunti, si ha
m

(E F) = m

(E) +m

(F),
come si verica applicando la denizione 1.4.1 ad E e scegliendo come insieme
test E F. Di conseguenza, se E, F / ed E F, vale luguaglianza
m

(F E) +m

(E) = m

(F),
e, se m

(E) < ,
m

(F E) = m

(F) m

(E).
Nel caso di N insiemi misurabili disgiunti si ha, pi` u generalmente:
9
Lemma 1.4.7 Siano E
1
, . . . , E
N
misurabili e disgiunti. Allora per ogni in-
sieme A R si ha
m

_
A
N
_
n=1
E
n
_
=
N

n=1
m

(A E
n
).
Dimostrazione Ragioniamo per induzione. Se N = 1 non c`e niente da di-
mostrare. Supponiamo che la tesi sia vera per N insiemi misurabili disgiunti,
e consideriamo N + 1 insiemi E
1
, . . . , E
N+1
/ fra loro disgiunti. Poiche
E
N+1
`e misurabile, scegliendo come insieme test A

N+1
n=1
E
n
, si ha
m

_
A
N+1
_
n=1
E
n
_
=
= m

_
A
_
N+1
_
n=1
E
n
_
E
N+1
_
+m

_
A
_
N+1
_
n=1
E
n
_
E
c
N+1
_
=
= m

(A E
N+1
) +m

_
A
N
_
n=1
E
n
_
;
ma, per ipotesi induttiva,
m

_
A
N
_
n=1
E
n
_
=
N

n=1
m

(A E
n
),
da cui
m

_
A
N+1
_
n=1
E
n
_
= m

(A E
N+1
) +
N

n=1
m

(A E
n
) =
=
N+1

n=1
m

(A E
n
).
Grazie al lemma precedente, siamo in grado di provare che la classe /
`e chiusa rispetto allunione numerabile (e quindi rispetto allintersezione
numerabile).
Proposizione 1.4.8 Se E
n

nN
/, allora

nN
E
n
/.
10
Dimostrazione Anzitutto, scriviamo

nN
E
n
come unione numerabile di
insiemi misurabili e disgiunti: basta porre
F
0
= E
0
, F
n+1
= E
n+1

n
_
k=0
F
k
n N
per avere che gli F
n
sono disgiunti, stanno in / e vericano
_
nN
F
n
=
_
nN
E
n
.
Sia A R un insieme test: per ogni N N possiamo scrivere, grazie al
lemma precedente,
m

(A) = m

_
A
N
_
n=0
F
n
_
+m

_
A
_
N
_
n=0
F
n
_
c
_
=
=
N

n=0
m

(A F
n
) +m

_
A
N

n=0
F
c
n
_

n=0
m

(A F
n
) +m

_
A

n=0
F
c
n
_
=
=
N

n=0
m

(A F
n
) +m

_
A
_

_
n=0
F
n
_
c
_
.
Se N , in virt` u della numerabile subadditivit`a di m

otteniamo
m

(A)

n=0
m

(A F
n
) +m

_
A
_

_
n=0
F
n
_
c
_

_
A

_
n=0
F
n
_
+m

_
A
_

_
n=0
F
n
_
c
_
.
Ci` o prova che

nN
F
n
=

nN
E
n
`e misurabile.
Dunque la classe / contiene linsieme vuoto ed `e chiusa rispetto allunione
numerabile ed al passaggio al complementare. Una famiglia di insiemi dotata
di queste propriet`a si chiama -algebra, o trib` u; /`e pertanto una -algebra
di sottoinsiemi di R.
Proviamo nalmente che m

`e numerabilmente additiva su /.
11
Proposizione 1.4.9 Se E
n

nN
/ e gli E
n
sono fra loro disgiunti,
allora si ha
m

_
_
nN
E
n
_
=

nN
m

(E
n
).
Dimostrazione Poiche m

`e numerabilmente subadditiva, la disuguaglianza


() `e evidente; proviamo laltra. Per ogni N N si ha, utilizzando la
monotonia di m

ed il lemma 1.4.7 con A = R,


m

_
_
nN
E
n
_
m

_
N
_
n=0
E
n
_
=
N

n=0
m

(E
n
),
da cui per N
m

_
_
nN
E
n
_

n=0
m

(E
n
).
Esercizi 1.4
1. Per ogni [0, ] si determini una successione di aperti A
n
di R
tali che
A
n
A
n+1
, m

(A
n
) = n N, m

nN
A
n
_
= .
2. Sia E R con m

(E) = 0 e sia f : R R una funzione derivabile


con derivata limitata. Si provi che f(E) ha misura esterna nulla. Si
provi poi lo stesso risultato supponendo f C
1
(R).
3. Sia E un sottoinsieme di R. La densit`a di E nel punto x R `e il limite
lim
h0
+
1
2h
m

(E]x h, x +h[).
(i) Tale limite esiste sempre?
(ii) Si provi che linsieme
_
x R 0 : cos
1
x
>
1
2
_
ha densit`a
1
3
nel punto x = 0.
12
[Traccia: per (i) si consideri E =

n=0
[2
2n1
, 2
2n
]; per (ii), detto E
linsieme in questione, si verichi che
1
h
m

(E [0, h[) `e uguale a


1
6h

n=k+1
1
n
2

1
36
se
3
(6k+5)
< h <
3
(6k+1)
, ed `e uguale a
1
6h

n=k+1
1
n
2

1
36
+ 1
3
h(6k + 1)
se
3
(6k+1)
h
3
(6k1)
. Se h 0
+
(e quindi k ), si provi che
il termine con la serie tende a
1
3
.]
4. Sia T una -algebra di sottoinsiemi di R. Si provi che T `e nita, op-
pure T contiene una innit`a pi` u che numerabile di elementi.
[Traccia: se, per assurdo, fosse T = E
n

nN
con gli E
n
tutti distinti,
si costruisca una successione F
n

nN
T di insiemi disgiunti; dopodi-
che, posto T
t
= F
n

nN
, si metta T(T
t
) in corrispondenza biunivoca
con T(N).]
1.5 Misurabilit`a degli intervalli
La classe degli insiemi misurabili non avrebbe limportanza che ha, se non
contenesse gli intervalli di R: questo `e ci`o che andiamo a dimostrare.
Proposizione 1.5.1 Gli intervalli di R sono misurabili secondo Lebesgue.
Dimostrazione Sappiamo gi`a che R =
c
`e misurabile. Osserviamo poi che
ogni intervallo non aperto `e lunione di un intervallo aperto e di uno o due
punti, e dunque `e misurabile se lo sono tutti gli intervalli aperti; inoltre, dato
che ogni intervallo aperto limitato ]a, b[ `e lintersezione delle due semirette
aperte ] , b[ e ]a, +[, baster`a provare che sono misurabili le semirette
aperte. Inne, essendo ]a, +[
c
=] , a[a, sar`a in denitiva suciente
mostrare che ] , b[ / per ogni b R.
Sia dunque A R un insieme test. Se m

(A) = , la disuguaglianza da
provare, ossia
m

(A) m

(A] , b[) +m

(A [b, +[)
13
`e evidente. Se invece m

(A) < , per denizione ssato > 0 esiste un


ricoprimento I
n
di A, fatto di intervalli aperti, tale che

nN
l(I
n
) < m

(A) +.
Poniamo
I
t
n
= I
n
] , b[, I
tt
n
= I
n
[b, +[;
chiaramente
l(I
t
n
) +l(I
tt
n
) = l(I
n
) n N,
quindi

nN
l(I
t
n
) +

nN
l(I
tt
n
) < m

(A) +.
Dato che I
t
n
e I
tt
n
ricoprono rispettivamente A] , b[ e A [b, +[,
per la numerabile subadditivit`a di m

si ottiene a maggior ragione


m

(A] , b[) +m

(A [b, +[) < m

(A) +,
e la tesi segue per larbitrariet`a di .
Corollario 1.5.2 Gli aperti ed i chiusi di R sono misurabili secondo Lebe-
sgue.
Dimostrazione Basta ricordare lesercizio 1.3.3.
Naturalmente la -algebra / contiene molti altri insiemi: indicando con /
la famiglia degli aperti di R, dovr`a stare in / tutto ci`o che si ottiene da /
con unioni ed intersezioni numerabili. La pi` u piccola -algebra che contiene
/ (ossia lintersezione di tutte le -algebre contenenti /: si vede subito che
essa stessa `e una -algebra) si indica con B ed i suoi elementi si chiamano
boreliani. Si dice che B `e la -algebra generata da /. Vedremo in seguito
(esercizio 3.1.8) che / contiene propriamente B.
Esercizi 1.5
1. Si verichi che linsieme
_
x
_
0,
1

_
: sin
1
x
> 0
_
`e misurabile e se ne calcoli la misura esterna.
14
2. Sia E linsieme dei numeri di [0, 1] che possiedono uno sviluppo decimale
ove non compare mai la cifra 9. Si dimostri che E `e misurabile e se ne
calcoli la misura esterna.
3. Per ogni x [0, 1] sia
n

nN
+ la successione delle cifre decimali di
x (scegliendo lo sviluppo innito nei casi di ambiguit`a). Si calcoli la
misura di Lebesgue dei seguenti insiemi:
(a) E = x [0, 1] :
n
`e dispari per ogni n N
+
,
(b) F = x [0, 1] :
n
`e denitivamente dispari,
(c) G = x [0, 1] :
n
`e dispari per inniti indici n N
+
.
1.6 Insieme di Cantor
Per rendersi conto di quanto la nozione di misurabilit`a secondo Lebesgue
sia generale, e di quanto la misura esterna si discosti dallidea intuitiva di
estensione di un insieme, `e utile considerare lesempio che segue.
Sia ]0,
1
3
]. Dallintervallo [0, 1] togliamo i punti dellintervallo aperto I
1
1
di
centro
1
2
e ampiezza ; dai due intervalli chiusi rimasti togliamo i due interval-
li aperti I
2
1
, I
2
2
che hanno come centri i punti medi e ampiezza
2
; dai quattro
intervalli chiusi residui togliamo i quattro intervalli aperti I
3
1
, I
3
2
, I
3
3
, I
3
4
con
centri nei punti medi ed ampiezza
3
; al passo k-simo toglieremo dai 2
k1
in-
tervalli chiusi residui le 2
k1
parti centrali aperte di ampiezza
k
. Procedendo
in questa maniera per ogni k N
+
, ci`o che resta alla ne `e linsieme
C

= [0, 1]

_
k=1
2
k1
_
j=1
I
k
j
,
il quale `e chiuso, quindi misurabile; la sua misura `e (proposizione 1.4.9)
m(C

) = 1

k=1
2
k1

j=1

k
= 1
1
2

k=1
(2)
k
=
1 3
1 2
.
Si noti che C

`e privo di punti interni: infatti per ogni k N


+
esso non pu`o
contenere intervalli di ampiezza superiore a 2
k
(perche con il solo passo k-
simo si lasciano 2
k
intervalli disgiunti di uguale ampiezza che non ricoprono
[0, 1]: tale ampiezza quindi `e minore di 2
k
). In particolare, C

`e totalmente
15
sconnesso, cio`e la componente connessa di ogni punto x C

`e x. Inoltre
C

`e perfetto, ossia tutti i suoi punti sono punti daccumulazione per C

:
infatti se x C

allora per ogni k N


+
il punto x sta in uno dei 2
k
intervalli
residui del passo k-simo, per cui gli estremi di tale intervallo sono punti di
C

che distano da x meno di 2


k
.
Per = 1/3, linsieme C
1/3
(che `e quello eettivamente introdotto da Cantor)
ha misura nulla. Esso si pu`o costruire anche nel modo seguente: per ogni
x [0, 1] consideriamo lo sviluppo ternario
x =

k=1

k
3
k
,
k
0, 1, 2.
Tale sviluppo non `e sempre unico: ad esempio,
1
3
si scrive come 0.02 oppure
come 0.1.
`
E facile vericare che C
1/3
`e costituito dai numeri x [0, 1] che
ammettono uno sviluppo ternario in cui non compare mai la cifra 1. Cos`,
1
3
C
1/3
mentre
1
2
= 0.1 / C
1/3
(perche lo sviluppo di
1
2
`e unico).
Linsieme C
1/3
, pur avendo misura esterna nulla, `e pi` u che numerabile: se
infatti si avesse C
1/3
= x
(n)

nN
, con
x
(n)
=

k=1

(n)
k
3
k
,
(n)
k
0, 2,
allora scegliendo
y =

k=1

k
3
k
,
n
=
_
0 se
(n)
n
= 2
2 se
(n)
n
= 0,
avremmo y C
1/3
ma y ,= x
(n)
per ogni n, dato che la n-sima cifra ternaria
di y `e diversa da quella di x
(n)
(per una stima della distanza [y x
(n)
[ si veda
lesercizio 1.6.1). Ci`o `e assurdo.
Esercizi 1.6
1. Con riferimento allargomentazione che mostra la non numerabilit`a di
C
1/3
, si provi che [y x
(n)
[ 3
n
.
2. Si costruisca un insieme misurabile E R, tale che
0 < m

(E) < , m

(E I) < l(I)
per ogni intervallo aperto non vuoto I.
16
3. Si mostri che / ha la stessa cardinalit`a di T(R).
4. La funzione caratteristica
C

degli insiemi di Cantor C

, denita da

(x) =
_
1 se x C

0 se x / C

,
`e Riemann integrabile su [0, 1]?
1.7 Propriet`a della misura di Lebesgue
Anzitutto, deniamo la misura di Lebesgue in R:
Denizione 1.7.1 La funzione di insieme
m = m

[
/
: / [0, +]
si chiama misura di Lebesgue.
Dalle proposizioni 1.3.2 e 1.4.9 segue che m `e monotona, numerabilmente
additiva ed invariante per traslazioni, con m() = 0. Queste propriet`a (tran-
ne linvarianza per traslazioni, legata alla geometria di R) saranno i requisiti
richiesti per denire le misure in spazi astratti.
Vediamo adesso come si comporta la misura di Lebesgue rispetto alle succes-
sioni monotone di insiemi misurabili.
Proposizione 1.7.2 Sia E
n

nN
una successione di insiemi misurabili.
(i) Se E
n
E
n+1
, allora
m
_
_
nN
E
n
_
= lim
n
m(E
n
).
(ii) Se E
n
E
n+1
e se esiste n
0
N tale che m(E
n
0
) < , allora
m
_

nN
E
n
_
= lim
n
m(E
n
).
17
Dimostrazione (i) Poniamo
F
0
= E
0
, F
n+1
= E
n+1
E
n
n N.
Allora si ha
E
N
=
N
_
n=0
F
n
,
_
nN
E
n
=
_
nN
F
n
,
e gli F
n
sono misurabili e disgiunti. Quindi, usando la numerabile additivit`a
di m,
m
_
_
nN
E
n
_
= m
_
_
nN
F
n
_
=

nN
m(F
n
) = lim
N
N

n=0
m(F
n
) =
= lim
N
m
_
N
_
n=0
F
n
_
= lim
N
m(E
N
).
(ii) Poniamo F
n
= E
n
0
E
n
per ogni n > n
0
. Allora gli F
n
sono misurabili
e F
n
F
n+1
; inoltre

_
n=n
0
F
n
= E
n
0

n=n
0
E
n
.
Per (i) e per losservazione 1.4.6 abbiamo
m(E
n
0
) m
_

n=n
0
E
n
_
= m
_

_
n=n
0
F
n
_
=
= lim
n
m(F
n
) = lim
n
[m(E
n
0
) m(E
n
)] = m(E
n
0
) lim
n
m(E
n
).
Ne segue la tesi poiche, ovviamente,

n=n
0
E
n
=

nN
E
n
.
Osserviamo che lipotesi che esista n
0
N tale che m(E
n
0
) < `e essenziale
nellenunciato (ii): se E
n
= [n, [, si ha E
n
E
n+1
, m(E
n
) = per ogni
n, ma lintersezione degli E
n
, essendo vuota, ha misura nulla.
Diamo ora unimportante caratterizzazione degli insiemi misurabili: sono
quegli insiemi E che dieriscono poco, in termini di m

, sia dagli aperti


(contenenti E), sia dai chiusi (contenuti in E).
18
Proposizione 1.7.3 Sia E un sottoinsieme di R. Sono fatti equivalenti:
(i) E /;
(ii) per ogni > 0 esiste un aperto A E tale che m

(A E) < ;
(iii) esiste un boreliano B E tale che m

(B E) = 0;
(iv) per ogni > 0 esiste un chiuso C E tale che m

(E C) < ;
(v) esiste un boreliano D E tale che m

(E D) = 0.
Dimostrazione Proveremo le due catene di implicazioni
(i) = (ii) = (iii) = (i), (i) = (iv) = (v) = (i).
(i) = (ii) Supponiamo dapprima m(E) < . Per denizione di m

,
ssato > 0 esiste un ricoprimento I
n
di E fatto di intervalli aperti, tale
che

nN
l(I
n
) < m(E) +,
cosicche, posto A =

nN
I
n
, laperto A verica, per subadditivit`a numera-
bile,
m(A) < m(E) +;
dal fatto che m(E) < segue allora (osservazione 1.4.6)
m(A E) = m(A) m(E) < .
Sia ora m(E) = . Prendiamo un ricoprimento di R fatto di intervalli
limitati e disgiunti: ad esempio
I
2n
= [2n, 2n + 2[, I
2n+1
= [2n 2, 2n[, n = 0, 1, 2, . . . .
Posto E
n
= E I
n
, si ha m(E
n
) < ; quindi, per quanto gi`a dimostrato,
esistono degli aperti A
n
E
n
tali che
m(A
n
E
n
) <

2
n+1
n N.
Linsieme A =

nN
A
n
`e un aperto contenente E, e poiche
A E =
_
nN
A
n

_
kN
E
k

_
nN
(A
n
E
n
),
19
si conclude che
m(A E) <

nN
m(A
n
E
n
) < .
(ii) = (iii) Per ogni n sia A
n
un aperto contenente E, tale che
m

(A
n
E) <
1
n + 1
;
linsieme B =

nN
A
n
`e un boreliano contenente E e si ha, per monotonia,
m

(B E) m

(A
n
E) <
1
n + 1
n N,
cio`e m

(B E) = 0.
(iii) = (i) Scrivendo E = B(BE), la tesi segue dal fatto che linsieme B
`e misurabile perche boreliano, mentre linsieme BE `e misurabile avendo, per
ipotesi, misura esterna nulla (proposizione 1.4.3). Dunque E `e misurabile.
(i) = (iv) = (v) = (i) Queste implicazioni si dimostrano facilmente
applicando ad E
c
gli enunciati gi`a dimostrati.
Le propriet`a (ii) (v) della proposizione precedente si sintetizzano dicendo
che la misura di Lebesgue `e una misura regolare.
Esercizi 1.7
1. Dimostrare che se E, F sono sottoinsiemi misurabili di R, si ha
m(A B) +m(A B) = m(A) +m(B).
2. Si provi che per ogni successione E
n

nN
T(R) tale che E
n
E
n+1
risulta
m

_
_
nN
E
n
_
= lim
n
m

(E
n
).
[Traccia: una disuguaglianza `e banale. Per laltra, si pu`o supporre
lim
n
m

(E
n
) < ; scelto un aperto A
n
E
n
in modo che m(A
n
) <
m

(E
n
) + 2
n1
, sia F
n
=

n
k=0
A
k
; si mostri per induzione che
m(F
n
) < m

(E
n
) +

n
k=0
2
k1
. Poiche m(F
n
) m
_
kN
A
k
_
, se
ne deduca che m

_
nN
E
n
_
lim
n
m

(E
n
) +.]
20
3. Sia E
n
una successione di insiemi misurabili di R. Linsieme E
t
degli
x R tali che x E
n
per inniti valori di n si chiama massimo limite
della successione E
n
e si scrive E
t
= limsup
n
E
n
, mentre linsieme
E
tt
degli x R tali che x E
n
denitivamente si chiama minimo limite
di E
n
e si scrive E
tt
= liminf
n
E
n
.
(i) Si verichi che
limsup
n
E
n
=

n=0

_
m=n
E
m
, liminf
n
E
n
=

_
n=0

m=n
E
m
.
(ii) Si provi che
m
_
liminf
n
E
n
_
liminf
n
m(E
n
),
e che se m(

n=0
E
n
) < allora
m
_
limsup
n
E
n
_
limsup
n
m(E
n
).
(iii) Si mostri che la seconda disuguaglianza `e in generale falsa se
m(

n=0
E
n
) = .
(iv) Si verichi che liminf
n
E
n
limsup
n
E
n
e si provi che
se la successione E
n
`e monotona rispetto allinclusione, allora
liminf
n
E
n
= limsup
n
E
n
.
4. Provare che se E / `e un insieme di misura positiva, allora per ogni
t [0, m(E)] esiste un insieme boreliano B
t
E tale che m(B
t
) = t.
5. Sia E un sottoinsieme di R. Si provi che esiste un boreliano B, in-
tersezione numerabile di aperti, che contiene E ed `e tale che m(B) =
m

(E).
6. Sia E un sottoinsieme di R con m

(E) < . Si provi che E `e misurabile


secondo Lebesgue se e solo se
m

(E) = supm(B) : B B, B E.
Si mostri anche che se m

(E) = lenunciato precedente `e falso.


21
7. Sia E R un insieme tale che m

(E) < . Si provi che E `e misurabile


secondo Lebesgue se e solo se per ogni > 0 esiste una famiglia nita
di intervalli disgiunti I
1
, . . . , I
N
tali che
m

_
E
N
_
i=1
I
i
_
< ,
ove AB = (AB) (BA) `e la dierenza simmetrica fra gli insiemi
A, B R.
[Traccia: per la necessit`a, approssimare E con aperti dallesterno e
ricordare che ogni aperto `e unione al pi` u numerabile di intervalli di-
sgiunti. Per la sucienza: (a) selezionare un aperto A E tale
che m(A) < m

(E) + ; (b) posto F = A


_

N
i=1
I
i
_
, vericare che
m

(F E) < ; (c) utilizzando le inclusioni A E (A F) (F E)


e E F (E F), provare che m

(A E) < 3.]
1.8 Un insieme non misurabile
La -algebra / degli insiemi Lebesgue misurabili `e molto vasta, ma non
esaurisce la classe di tutti i sottoinsiemi di R. Tuttavia, per esibire un insieme
non misurabile non si pu`o fare a meno del seguente
Assioma della scelta Per ogni insieme non vuoto X esiste una funzione
di scelta f : T(X) X tale che f(E) E per ogni E T(X) .
In altre parole, lassioma della scelta dice che `e possibile selezionare, per
mezzo della funzione f, esattamente un elemento da ciascun sottoinsieme di
X. La cosa sarebbe banale se X avesse cardinalit`a nita, e facile se X fosse
numerabile (esercizio 1.8.5), ma per insiemi di cardinalit`a pi` u alta questa
propriet`a non `e altrimenti dimostrabile.
Linsieme che andiamo a costruire fu introdotto da Vitali. Consideriamo in
[0, 1] la relazione di equivalenza
x y x y Q.
Vi `e uninnit`a pi` u che numerabile di classi di equivalenza, ognuna delle
quali contiene uninnit`a numerabile di elementi. Costruiamo un insieme
V prendendo, grazie allassioma della scelta, esattamente un elemento da
ciascuna classe di equivalenza: V `e un sottoinsieme pi` u che numerabile di
22
[0, 1].
Sia ora q
n

nN
una numerazione di Q[1, 1], e sia V
n
= V +q
n
. Notiamo
che V
n
V
m
= se n ,= m: infatti se x V
n
V
m
allora x = a +q
n
= b +q
m
con a, b V ; di qui segue a b = q
m
q
n
Q, da cui (per come `e stato
costruito V ) a = b. Ne deduciamo q
n
= q
m
, ed inne n = m. Notiamo anche
che valgono le inclusioni
[0, 1]

_
n=0
V
n
[1, 2],
e quindi, per la monotonia di m

,
1 m

_
n=0
V
n
_
3.
Se V fosse misurabile secondo Lebesgue, anche i suoi traslati V
n
sarebbero
misurabili ed avrebbero la stessa misura; per ladditivit`a numerabile di m si
ricaverebbe
m
_

_
n=0
V
n
_
=

n=0
m(V
n
) =

n=0
m(V ) =
_
0 se m(V ) = 0
+ se m(V ) > 0,
e ci`o contraddice il fatto che la misura di

n=0
V
n
`e compresa fra 1 e 3.
Pertanto V non pu`o essere misurabile.
Esercizi 1.8
1. Dimostrare che per ogni ]0, +] esiste un sottoinsieme U [0, [,
non misurabile secondo Lebesgue, tale che m

(U) = .
2. Dato un insieme misurabile E R di misura positiva, si provi che
esiste un sottoinsieme W E che non `e Lebesgue misurabile.
3. Sia V
n
= V +q
n
, come nella costruzione dellinsieme non misurabile di
Vitali. Posto E
n
=

m=n
V
m
, si provi che
m

(E
n
) < , E
n
E
n+1
n N, lim
n
m

(E
n
) > m

n=0
E
n
_
.
23
4. Siano V, W sottoinsiemi di R non misurabili, disgiunti e tali che V W
sia misurabile. Si provi che se m(V W) < allora
m(V W) < m

(V ) +m

(W).
5. Dato un insieme numerabile X, si costruisca una funzione di scelta per
X.
24
Capitolo 2
Misure
2.1 Spazi misurati
La misura di Lebesgue `e il modello concreto a cui si ispira la nozione astratta
di misura che stiamo per introdurre. Lo studio delle misure astratte ha svaria-
te applicazioni in analisi funzionale, in probabilit`a, in calcolo delle variazioni
ed in altri campi ancora.
Denizione 2.1.1 Uno spazio misurabile `e una coppia (x, T), ove X `e un
insieme e T `e una -algebra di sottoinsiemi di X. I sottoinsiemi di X che
appartengono a T si dicono misurabili.
Uno spazio misurato `e una terna (X, T, ), ove X `e un insieme, T `e una
-algebra di sottoinsiemi di X, e : T [0, ] `e una misura, ossia una
funzione di insieme tale che
(i) () = 0,
(ii) se E
n

nN
T `e una successione di insiemi disgiunti, allora

_
_
nN
E
n
_
=

nN
(E
n
).
Lo spazio misurato si dice completo, e la misura si dice completa, se ogni
sottoinsieme di un insieme di T di misura nulla `e a sua volta in T (ed ha
misura nulla, come seguir`a dalla proposizione 2.1.4).
Lo spazio misurato si dice nito, e la misura si dice nita, se si ha (X) <
+; si dice -nito, e si dice -nita, se X `e unione numerabile di insiemi
misurabili di misura nita.
25
Osservazione 2.1.2 Se nella denizione 2.1.1 si sceglie in (ii) E
n
= per
ogni n N, si deduce che () = 0 oppure () = +. Dunque la condizione
(i) non `e in generale conseguenza di (ii).
Vediamo qualche esempio.
Esempi 2.1.3 (1) (R, /, m) `e uno spazio misurato completo e -nito.
Pure (R, B, m[
B
) `e uno spazio misurato; esso `e ancora -nito ma non `e
completo, perche non tutti i sottoinsiemi di un boreliano di misura nulla
sono boreliani, come vedremo pi` u in l`a. La misura m[
B
`e detta misura di
Borel.
(2) Se A R `e un insieme misurabile secondo Lebesgue, la funzione (E) =
m(AE) `e una misura su /; (R, /, ) `e uno spazio misurato -nito, ed `e
nito se e solo se m(A) < . Tutti gli insiemi disgiunti da A hanno misura
nulla, quindi in generale questo spazio misurato non `e completo. Si dice che
la misura `e concentrata sullinsieme A.
(3) (Misura di Lebesgue-Stieltjes) Sia g : R R una funzione crescente e
continua a sinistra, cio`e tale che lim
xx

0
g(x) = g(x
0
) per ogni x
0
R. Ripe-
tiamo la procedura seguita per costruire la misura di Lebesgue su R, con luni-
ca dierenza di attribuire agli intervalli una diversa lunghezza: precisamente,
deniamo la lunghezza l
g
sugli intervalli aperti a destra, ponendo
l
g
([a, b[) = g(b) g(a),
e convenendo di porre g() = lim
x
g(x).
Poi introduciamo la misura esterna

g
su T(R) in analogia con il caso di m

,
cio`e denendo

g
(E) = inf
_

nN
l
g
(I
n
) : E
_
nN
I
n
, I
n
intervalli aperti a destra
_
.
Dopo aver provato, in perfetta analogia con il caso di m

, che

g
`e monotona
e numerabilmente subadditiva, si introduce la classe /
g
degli insiemi
g
-
misurabili:
/
g
= E R :

g
(A) =

g
(A E) +

g
(A E
c
) A R.
Si verica, come per il caso della misura di Lebesgue, che /
g
`e una -algebra
contenente i boreliani, ed inne si denisce la misura di Lebesgue-Stieltjes
g
26
come la restrizione di

g
alla classe /
g
. Si dimostra allora, senza modiche
rispetto al caso di m, che (R, /
g
,
g
) `e uno spazio misurato completo e -
nito (`e nito se e solo se la funzione g `e limitata su R).
Questa stessa costruzione si pu`o fare in un ssato intervallo [a, b] R per
ogni funzione g : [a, b[R crescente e continua a sinistra (e non `e restrittivo
supporre che g(a) = 0): la corrispondente misura di Lebesgue-Stieltjes sar`a
nita quando lim
tb
g(t) < +, mentre sar`a -nita allorche tale limite
vale +. Nel primo caso, ponendo
g
(b) = 0, la misura
g
viene estesa a
tutto [a, b], o pi` u precisamente alla -algebra /
g
T([a, b]) denita da
/
g
= /
g
E b : E /
g
.
Ritroveremo questa famiglia di misure pi` u avanti nel corso.
(4) Sia X un insieme innito, e poniamo per ogni E T(X)
n(E) =
_
#(E) se E `e un insieme nito
+ se E `e un insieme innito,
ove #(E) denota la cardinalit`a di E. (X, T(X), n) `e uno spazio misurato;
esso `e completo, ed `e -nito se e solo se X `e numerabile.
(5) (Misura di Dirac) Sia X un insieme non vuoto, sia x X. Per ogni
E T(X) poniamo

x
(E) =
_
0 se x / E
1 se x E.
(X, T(X),
x
) `e uno spazio misurato completo e nito.
(6) Uno spazio misurato (X, T, ) tale che (X) = 1 si chiama spazio proba-
bilizzato, la misura si chiama probabilit`a e gli elementi di T sono gli eventi.
Il numero (E) [0, 1] `e la probabilit`a che levento E si realizzi; se in parti-
colare (E) = 1 si dice che levento E `e vericato quasi certamente.
(7) Sia a
n

nN
una successione di numeri non negativi tali che la serie

nN
a
n
sia convergente. Per ogni E T(N) sia
(E) =

nE
a
n
.
(N, T(N), ) `e uno spazio misurato completo e nito. Se si normalizza la
successione a
n
ponendo
p
n
=
a
n

kN
a
k
,
27
la misura (E) =

nE
p
n
`e una probabilit`a discreta.
(8) Sia X un insieme pi` u che numerabile, e sia
T = E X : E, oppure E
c
, `e numerabile;
si verica subito che T `e una -algebra. Per E T poniamo
(E) =
_
0 se E `e numerabile
+ se E
c
`e numerabile.
`
E facile vericare che `e una misura; lo spazio misurato (X, T, ) `e completo
ma non -nito.
Si estendono al caso astratto le tipiche propriet`a dimostrate nel caso della
misura di Lebesgue. In particolare:
Proposizione 2.1.4 Sia (X, T, ) uno spazio misurato. Allora `e mono-
tona su T, cio`e (E) (F) per E, F T ed E F.
Dimostrazione Essendo F = E (F E), la tesi segue dalladditivit`a e
positivit`a di .
Proposizione 2.1.5 Sia (X, T, ) uno spazio misurato e sia E
n

nN
T.
(i) Se E
n
E
n+1
per ogni n, allora

_
_
nN
E
n
_
= lim
n
(E
n
).
(ii) Se E
n
E
n+1
per ogni n, ed esiste n
0
N tale che (E
n
0
) < , allora

nN
E
n
_
= lim
n
(E
n
).
Dimostrazione Come nel caso della misura di Lebesgue (proposizione
1.7.2).
28
Esercizi 2.1
1. Sia (X, T, ) uno spazio misurato non completo. Si consideri la famiglia
T
0
= E = A B : A T, B B
0
, ove B
0
T e (B
0
) = 0,
e si provi che T
0
`e una -algebra. Si denisca poi

0
(A B) = (A) E = A B T
0
;
si verichi che
0
`e ben denita, che
0
[
T
= , che
0
`e una misura su
T
0
e che (X, T
0
,
0
) `e uno spazio misurato completo. Si mostri inoltre
che se (X, T, ) `e -nito, anche (X, T
0
,
0
) `e -nito.
2. Sia X un insieme pi` u che numerabile, sia T la -algebra dellesempio
2.1.3 (8), e deniamo per E T
(E) =
_
0 se E `e numerabile
1 se E
c
`e numerabile.
Si provi che (X, T, ) `e uno spazio misurato completo e nito.
3. Sia
n
una successione di misure denite su una -algebra T, tale
che
n
(E)
n+1
(E) per ogni n N e per ogni E T. Si provi che
la funzione
(E) = lim
n

n
(E) E T
`e una misura su T.
4. Sia X un insieme e sia X
n
una famiglia di sottoinsiemi disgiunti di X
la cui unione `e X. Per ogni n N sia T
n
una -algebra di sottoinsiemi
di X
n
. Posto
T =
_
_
nN
E
n
: E
n
T
n
_
,
si provi che T `e una -algebra di sottoinsiemi di X.
5. Sia (X, T, ) uno spazio misurato. Se A, B, C sono elementi di T con
A C e B C, e se (A) = (C) < , si mostri che
(A B) = (B).
29
6. Sia (X, T, ) uno spazio misurato nito. Deniamo su T la relazione
E F (E F) = 0,
ove E F = (E F) (F E) `e la dierenza simmetrica fra E ed F
denita nellesercizio 1.7.7.
(i) Si verichi che `e una relazione di equivalenza.
(ii) Posto = T/ , si provi che
d(E, F) = (E F)
`e una distanza su .
(iii) Si dimostri che (, d) `e uno spazio metrico completo.
[Traccia: per (iii), data una successione di Cauchy E
n
, si provi
che per unopportuna sottosuccessione E
n
k
si ha (E
m
E
n
k
) < 2
k
per ogni m > n
k
, e se ne deduca che (E
n
k
E) 0 per k ,
ove E = limsup
k
E
n
k
(v. esercizio 1.7.3); a questo scopo, pu`o essere
utile notare che

k=m
(E
n
k
E
n
h
) (E
nm
E
n
h
)

k=m+1
(E
n
k
E
n
k1
).]
7. Per ogni n N sia
E
n
=
_
z = re
i
C : 0 r 1, /
_
kZ
](s
n
+ 2k), (s
n+1
+ 2k)[
_
,
ove s
0
= 0, s
n
=

n
k=1
1
k
. Determinare gli insiemi limsup
n
E
n
e
liminf
n
E
n
.
8. Si provi che non si pu`o costruire alcuna misura su R in modo che
valgano le propriet`a 1, 2, 3 e 4 del paragrafo 1.2.
9. Sia : / [0, ] una misura tale che:
(i) ([0, 1]) = [0, +[, (ii) `e invariante per traslazioni.
Si provi che = m, ove m `e la misura di Lebesgue.
30
2.2 Misura di Lebesgue in R
N
Per denire la misura di Lebesgue in R
N
occorre ripetere la procedura svolta
nel Capitolo 1 e riassunta nellesempio 2.1.3 (3). Si denisce anzitutto il vo-
lume N-dimensionale dei parallelepipedi R =

N
i=1
I
i
, ove gli I
i
sono intervalli
di R:
v
N
(R) =
N

i=1
l(I
i
),
con la convenzione che 0 = 0, necessaria ad attribuire volume nullo, ad
esempio, ai sottospazi k-dimensionali di R
N
.
Poi si introduce la misura esterna N-dimensionale m

N
di un arbitrario insie-
me E R
N
:
m

N
(E) = inf
_

nN
v
N
(R
n
) : E
_
nN
R
n
, R
n
parallelepipedi aperti
_
.
Si osserva che la denizione di m

N
non cambia se i ricoprimenti sono fatti
con parallelepipedi qualsiasi anziche aperti, e si verica che m

N
estende v
N
,
ed `e monotona, nulla sullinsieme vuoto, numerabilmente subadditiva ed in-
variante per traslazioni.
A questo punto si introduce la classe /
N
degli insiemi misurabili:
/
N
= E R
N
: m

N
(A) = m

N
(A E) +m

N
(A E
c
) A R
N
,
la quale `e una -algebra contenente i parallelepipedi, e quindi anche gli aperti
ed i chiusi. Dunque /
N
contiene la -algebra B
N
dei boreliani di R
N
.
Si denisce inne la misura di Lebesgue in R
N
come la restrizione di m

N
a
/
N
:
m
N
(E) = m

N
(E) E /
N
,
e si dimostra che m
N
`e numerabilmente additiva. Quindi (R
N
, /
N
, m
N
)
`e uno spazio misurato che risulta completo e -nito. Tutte queste cose si
provano esattamente come nel caso della misura di Lebesgue unidimensionale.
Ritroveremo poi la misura m
N
come misura prodotto di N copie della
misura di Lebesgue m, e ci`o ci permetter`a di dare una formula per il calcolo
degli integrali multipli come integrali semplici iterati.
31
Esercizi 2.2
1. Si denisca
1 = E F : E, F /.
(i) Si verichi che 1 non `e unalgebra, ma che la famiglia / costituita
dalle unioni nite di elementi di 1 lo `e.
(ii) Detta / / la -algebra generata da / (ossia la minima -
algebra che contiene /), si provi che se A // allora
x R : (x, y) A / y R,
y R : (x, y) A / x R.
(iii) Si provi che la -algebra //`e contenuta propriamente in /
2
.
2. Dimostrare che
m

N
(tE) = t
N
m

N
(E) E R
N
, t 0.
2.3 Misure esterne di Hausdor
La misura di Lebesgue in R
N
non fa distinzioni fra i suoi sottoinsiemi mi-
surabili di misura nulla: un iperpiano (N 1)-dimensionale, il sostegno di
una curva, una k-variet`a sono tutti insiemi trascurabili rispetto a m
N
. Le
misure di Hausdor H
p
(ove p > 0) permettono invece di catalogare gli
insiemi di misura nulla attribuendo loro una dimensione che pu`o essere
intera (1 per il sostegno di una curva, k per le k-variet`a) od anche non intera
nel caso di certi insiemi frattali (esempio 2.5.3).
Come la misura di Lebesgue, le misure di Hausdor si costruiscono tramite
i ricoprimenti: tuttavia la nozione base non `e quella di volume, ma quella di
diametro di un insieme.
Denizione 2.3.1 Se E R
N
, il diametro di E `e il numero (eventualmente
+)
diam E =
_
0 se E =
sup[x y[
N
: x, y E se E ,= .
32
Per denire le misure di Hausdor bisogna ancora una volta cominciare dalle
misure esterne. Siano p, > 0 e consideriamo per ogni E R
N
le quantit`a
H

p,
(E) = inf
_

nN
(diam U
n
)
p
: E
_
nN
U
n
, U
n
aperti, diam U
n
<
_
.
Per misurare bene gli insiemi frastagliati quelli che contano sono i ricopri-
menti con diametri piccoli: infatti pi` u `e piccolo, pi` u la quantit`a H

p,
(E) `e
grande, essendo lestremo inferiore di un insieme pi` u piccolo. La valutazione
ottimale della misura di E si otterr`a al limite per 0
+
(vedere anche
lesercizio 2.3.5).
Denizione 2.3.2 Sia p > 0. La misura esterna di Hausdor H

p
(E) `e la
quantit`a
H

p
(E) = lim
0
+
H

p,
(E) = sup
>0
H

p,
(E) E R
N
.
Si noti che, in eetti, la denizione di H

p
dipende anche da N, cio`e dalla
dimensione dello spazio ambiente, perche coinvolge luso di aperti di R
N
;
daltronde questo fatto `e irrilevante, nel senso che le misure esterne di Hau-
sdor di indice p costruite su R
N
e su R
M
coincidono per p minN, M
(esercizio 2.3.2). Nel seguito, comunque, prenderemo in considerazione solo
i sottoinsiemi di R
N
, con N ssato.
Come conseguenza immediata della denizione si ha:
Proposizione 2.3.3 Sia p > 0. Allora:
(i) H

p
(E) 0 E R
N
;
(ii) H

p
() = H

p
(x) = 0 x R
N
;
(iii) H

p
`e monotona.
Dimostrazione (i) Evidente.
(ii) Un ricoprimento di e di x `e la famiglia costituita dalla sola palla
B(x,

3
) il cui diametro `e minore di ; dunque
lim
0
+
H

p,
() = lim
0
+
H

p,
(x) = 0.
(iii) Se E F, ogni ricoprimento che concorre a denire H

p,
(F) concorre
anche a denire H

p,
(E); quindi H

p,
(E) H

p,
(F) per ogni > 0, da cui
H

p
(E) H

p
(F).
33
Proposizione 2.3.4 Sia p > 0. Allora:
(i) H

p
(E +x) = H

p
(E) x R
N
, E R
N
;
(ii) H

p
(tE) = t
p
H

p
(E) t > 0, E R
N
.
Dimostrazione Si verica facilmente che
H

p,
(E +x) = H

p,
(E), H

p,
(tE) = t
p
H

p,

t
(E) > 0,
da cui la tesi per 0
+
.
Si verica inoltre (esercizio 2.3.4) che la denizione di H

p
(E) non cambia se
i ricoprimenti di E si prendono qualsiasi, anziche costituiti da aperti. Inne:
Proposizione 2.3.5 Sia p > 0. Allora H

p
`e numerabilmente subadditiva.
Dimostrazione Si prova, esattamente come per la misura esterna di Lebe-
sgue, che
H

p,
_
_
nN
E
n
_

nN
H

p,
(E
n
) E
n

nN
T(R
N
);
osservando poi che
H

p,
(E) H

p
(E) > 0, E R
N
,
al limite per 0
+
si ha la tesi.
Esercizi 2.3
1. Siano A, B sottoinsiemi di R
N
. Si provi che se A B ,= , allora
diam A B diam A + diam B.
2. Siano N, M N
+
con N < M, e sia p N. Si provi che per ogni
sottoinsieme E R
N
le misure esterne di Hausdor di indice p costruite
su R
N
e su R
M
coincidono.
3. Si provi che per ogni p > 0 i sottoinsiemi numerabili di R
N
hanno
misura esterna H

p
nulla.
34
4. Si provi che la quantit`a H

p
(E) non cambia se si considerano ricopri-
menti di E costituiti da insiemi arbitrari anziche aperti.
[Traccia: indicando con H

p,
(E) la quantit`a ottenuta con luso di ri-
coprimenti fatti di insiemi arbitrari, si osservi che H

p,
(E) H

p,
(E);
daltra parte, se V
n
`e un arbitrario ricoprimento di E con 0 <
diam V
n
< e tale che

nN
(diam V
n
)
p
< H

p,
(E) + , si conside-
ri laperto U
n,k
= x R
N
: dist(x, V
n
) <
1
k
e si provi che per k = k
n
opportuno si ha diam U
n,kn
((diam V
n
)
p
+2
n1
)
1/p
. Pertanto il rico-
primento aperto U
n,kn
`e tale che

nN
(diam U
n,kn
)
p
H

p,
(E)+2);
se ne deduca la tesi.]
5. Si consideri la denizione di H

p,
nel caso p = 0, con lavvertenza di
porre H

0,
() = 0 e di prendere ricoprimenti niti o numerabili, ma con
aperti non vuoti. Si descriva la misura esterna H

0
.
6. Sia
H

p
(E) = inf
_

nN
(diam U
n
)
p
: E
_
nN
U
n
_
;
si provi che H

p
(E) H

p
(E) per ogni E R
N
, ma che in generale non
vale luguaglianza.
7. Dimostrare che H

1
(E) = m

(E) per ogni E R.


[Traccia: si verichi che m

(E) H

1
(E) . Per provare laltra disugua-
glianza si consideri dapprima il caso in cui E `e un intervallo limitato, e
poi si passi al caso generale usando la numerabile subadditivit`a di H

1
.]
8. Siano E, F R
N
tali che
dist(E, F) = inf[x y[
N
: x E, y F > 0.
Si provi che
H

p
(E F) = H

p
(E) +H

p
(F).
[Traccia: si provi che vale luguaglianza per la funzione H

p,
, non
appena `e sucientemente piccolo.]
9. Sia S il segmento di estremi x, y, con x, y R
N
ssati. Si provi che
H

p
(S) =
_
_
_
0 se p > 1
[x y[
N
se p = 1
+ se 0 < p < 1.
35
10. Sia B = x R
2
: [x[
2
= 1. Si dia una stima dallalto e dal basso per
H

1
(B).
11. Si provi che se E R
N
allora H

N+
(E) = 0 per ogni > 0.
12. Sia (X, d) uno spazio metrico. Se E X `e un insieme non vuoto, il
diametro di E `e denito, analogamente al caso di R
N
, da
diam(E) = sup
x,yE
d(x, y).
(i) Se A
n

nN
`e una successione di sottoinsiemi di X tale che A
n

A
n+1
per ogni n N, si provi che
diam
_
_
nN
A
n
_
= lim
n
diam(A
n
).
(ii) Se A
n

nN
`e una successione di sottoinsiemi di X tale che A
n

A
n+1
per ogni n N, si provi che
diam
_

nN
A
n
_
lim
n
diam(A
n
).
(iii) Si trovi un esempio in cui A
n
A
n+1
per ogni n N e
diam
_

nN
A
n
_
< lim
n
diam(A
n
).
2.4 Misure di Hausdor
Introduciamo adesso gli insiemi misurabili rispetto alla misura di Hausdor
di indice p.
Denizione 2.4.1 La classe degli insiemi H
p
-misurabili `e
H
p
= E R
N
: H

p
(A) = H

p
(A E) +H

p
(A E
c
) A R
N
.
Naturalmente, in questa denizione quella che conta `e la disuguaglianza ().
Come si `e fatto per la classe /, si verica che H
p
`e una -algebra e che la
misura di Hausdor di indice p, denita da H
p
= H

p
[
1p
, `e numerabilmente
additiva sugli elementi di H
p
. Inoltre, H
p
contiene i boreliani di R
N
: ci`o `e
conseguenza della seguente
36
Proposizione 2.4.2 I parallelepipedi di R
N
sono elementi di H
p
per ogni
p > 0.
Dimostrazione Ogni parallelepipedo P R
N
pu`o scriversi come unio-
ne numerabile di parallelepipedi chiusi e limitati; quindi basta provare che
ogni parallelepipedo chiuso e limitato, dunque del tipo P =

N
i=1
[a
i
, b
i
],
appartiene a H
p
. Poniamo
P
n
=
N

i=1
_
a
i

1
n + 1
, b
i
+
1
n + 1
_
, n N,
e sia A un insieme test. Occorre provare la disuguaglianza
H

p
(A) H

p
(A P) +H

p
(A P
c
),
che `e ovvia se H

p
(A) = ; supporremo quindi H

p
(A) < .
Notiamo che, detto A
n
= A P
c
n
, si ha
A
n
A
n+1
, dist(A
n
, P) > 0 n N,
_
nN
A
n
= A P
c
.
Dunque, per la monotonia di H

p
e per lesercizio 2.3.8,
H

p
(A) H

p
((A P) A
n
) = H

p
(A P) +H

p
(A
n
) n N,
da cui, essendo A
n
A
n+1
per ogni n,
H

p
(A) H

p
(A P) + lim
n
H

p
(A
n
).
Mostriamo che
lim
n
H

p
(A
n
) H

p
(A P
c
);
ci`o prover`a la relazione
H

p
(A) H

p
(A P) +H

p
(A P
c
),
e quindi la tesi.
Poniamo D
n
= A
n+1
A
n
: allora per ogni n N si ha luguaglianza
A P
c
= A
n

_
k=n
D
k
,
37
e dunque, per la numerabile subadditivit`a di H

p
,
H

p
(A P
c
) H

p
(A
n
) +

k=n
H

p
(D
k
) n N.
Vericheremo fra poco che la serie

k=0
H

p
(D
k
) `e convergente; quindi pas-
sando al limite per n si ricava
H

p
(A P
c
) lim
n
H

p
(A
n
),
come si voleva.
Proviamo la convergenza della serie

k=0
H

p
(D
k
): scriviamo
m

k=0
H

p
(D
k
) =
[
m
2
]

k=0
H

p
(D
2k
) +
[
m1
2
]

k=0
H

p
(D
2k+1
), m N,
ed osserviamo che dist(D
k
, D
k+2
) > 0 per ogni k N. Quindi utilizzando
nuovamente lesercizio 2.3.8 otteniamo
[
m
2
]

k=0
H

p
(D
2k
) = H

p
_
_
_
[
m
2
]
_
k=0
D
2k
_
_
_
,
[
m1
2
]

k=0
H

p
(D
2k+1
) = H

p
_
_
_
[
m1
2
]
_
k=0
D
2k+1
_
_
_
.
Essendo inoltre
_
_
_
[
m
2
]
_
k=0
D
2k
_
_
_

_
_
_
[
m1
2
]
_
k=0
D
2k+1
_
_
_
=
m
_
k=0
D
k
A
m+1
A,
si deduce nalmente che

m
k=0
H

p
(D
k
) H

p
(A) < .
La misurabilit`a del parallelepipedo P `e completamente dimostrata.
Esercizi 2.4
1. Sia : [a, b] R
N
una curva semplice di classe C
1
con sostegno .
Si provi che H
1
e che H
1
() = ().
[Traccia: si osservi anzitutto che `e chiuso, quindi sta in H
1
. Per
provare (), ssato > 0 si mostri che se : a = t
0
< t
1
< . . . <
38
t
m
= b `e una suddivisione di [a, b] sucientemente ne, allora si ha
[(t
i
) (t
i1
)[
N
< e, per ogni i, la palla B
i
di centro
(t
i
)+(t
i1
)
2
e diametro [(t
i
) (t
i1
)[
N
contiene
i
= ([t
i1
, t
i
]). Se ne deduca
che se `e piccolo si ha H
1,
() (). Per provare , ssato > 0 si
determini > 0 ed un ricoprimento U
n
di con diam U
n
< , tale che

n
diam U
n
< H
1
() +. Si estragga un opportuno sottoricoprimento
nito U
n
1
, . . . , U
nm
e si costruisca una suddivisione : a = t
0
<
t
1
< . . . < t
m
= b tale che

m
i=1
[(t
i
) (t
i1
)[
N


m
i=1
diam U
n
i
;
si concluda, utilizzando la continuit`a di
t
, che se `e sucientemente
piccolo si ha () H
1
() + 2.]
2.5 Dimensione di Hausdor
Analizziamo adesso il comportamento di H

p
al variare di p > 0. Notiamo
anzitutto che, per lesercizio 2.3.11, H

N+
(E) = 0 per ogni E R
N
e per
ogni > 0; quindi ci interessano i valori di p compresi fra 0 e N.
Proposizione 2.5.1 Sia E R
N
e sia p ]0, N]. Risulta:
(i) se H

p
(E) < , allora H

q
(E) = 0 per ogni q ]p, N];
(ii) se H

p
(E) > 0, allora H

q
(E) = per ogni q ]0, p[.
Dimostrazione Sia U
n
un ricoprimento aperto di E. Se s > r > 0 e se
diam U
n
< si ha

nN
(diam U
n
)
s
<
sr

nN
(diam U
n
)
r
,
cosicche
H

s,
(E)
sr
H

r,
(E) s > r > 0.
I due enunciati seguono allora facilmente, scegliendo r = p e s = q nel primo
caso, r = q e s = p nel secondo.
Dunque, per ogni E R
N
la funzione p H

p
(E) decresce con p, nel
senso che, se non `e identicamente H

p
(E) = 0, esiste p
0
]0, N] tale che
H

p
(E)
_
_
_
= se p ]0, p
0
[
[0, ] se p = p
0
= 0 se p > p
0
.
Questo comportamento di H

p
ci induce alla seguente
39
Denizione 2.5.2 Si chiama dimensione di Hausdor di un sottoinsieme E
di R
N
, e si indica con dim
H
(E), il numero
dim
H
(E) = infp > 0 : H

p
(E) = 0.
Ovviamente, la dimensione di Hausdor di un sottoinsieme di R
N
`e compresa
fra 0 e N (estremi inclusi).
Esempio 2.5.3 Calcoliamo la dimensione di Hausdor dellinsieme di Can-
tor C = C
1/3
introdotto nel paragrafo 1.6. Anzitutto osserviamo che si ha
C = C
1
C
2
, con C
1
e C
2
copie di C rimpicciolite di un fattore
1
3
: pre-
cisamente si ha C
1
=
1
3
C e C
2
= C
1
+
2
3
. Per la proposizione 2.3.4(ii) si
deduce H
p
(C) = H
p
(C
1
) + H
p
(C
2
) =
2
3
p
H
p
(C), e quindi se H
p
(C) ]0, [
deve essere
2
3
p
= 1, cio`e p =
log 2
log 3
.
Poniamo allora D =
log 2
log 3
. Proveremo che D `e davvero la dimensione di Hau-
sdor di C facendo vedere che H
D
(C) = 1.
Sia > 0: poiche dist(C
1
, C
2
) > 0, risulta per omotetia e traslazione
H

D,/3
(C) = H

D,/3
(C
1
) +H

D,/3
(C
2
) =
= H

D,/3
(
1
3
C) +H

D,/3
(C
1
+
2
3
) =
=
1
3
D
H

D,
(C) +
1
3
D
H

D,
(C) = H

D,
(C).
Ci` o implica che la quantit`a H

D,
(C) non dipende da , e pertanto H
D
(C) =
lim
0
+ H

D,
(C) = H

D,1
(C). Scegliendo il ricoprimento costituito dal singolo
aperto ] , 1 + [ si vede immediatamente che H

D,1
(C) 1 + 2 per ogni
> 0: si conclude che H
D
(C) 1.
Dimostriamo che H
D
(C) 1. A questo scopo, sia > 0. Fissato > 0,
esiste un ricoprimento aperto U
n

nN
di C tale che
diam(U
n
) < n N,

n=0
(diam(U
n
))
D
< H

D,
(C) +.
Andiamo a costruire un ricoprimento aperto nito W
1
, . . . , W
N
di C (con
diam(W
i
) non necessariamente minore di ), tale che
1
N

i=1
(diam(W
i
))
D

n=0
(diam(U
n
))
D
.
40
Fatto ci`o, la tesi si otterr`a osservando che
1

n=0
(diam(U
n
))
D
< H

D,
(C) H
D
(C) > 0.
Per costruire i W
i
, anzitutto estraiamo da U
n

nN
, per compattezza, un
sottoricoprimento nito U
t
1
, . . . , U
t
h
; si pu`o anche supporre che esso sia
minimale, nel senso che, togliendo uno degli U
t
j
, gli altri non ricoprono pi` u
C. Consideriamo laperto U
t
1
U
t
2
: se esso `e non vuoto, sostituiamo la coppia
U
t
1
, U
t
2
con il singolo aperto V
1
= U
t
1
U
t
2
. Si ha allora, essendo 0 < D < 1,
(diam(V
1
))
D
(diam(U
t
1
) + diam(U
t
2
))
D
(diam(U
t
1
))
D
+ (diam(U
t
2
))
D
;
iterando questo argomento con la coppia V
1
, U
t
3
, e cos` via, si genera un
nuovo ricoprimento nito V
1
, . . . , V
N
di C, fatto di aperti disgiunti, tale
che
N

k=1
(diam(V
k
))
D

n=0
(diam(U
n
))
D
.
Adesso osserviamo che laperto

N
k=1
V
k
contiene C, e che C =

k=0
C
k
,
ove C
k
`e ci`o che resta dopo il k-simo passo nella costruzione dellinsieme
di Cantor: ricordiamo che C
k
=

2
k
j=1
J
k
j
, ove gli J
k
J
sono intervalli chiusi
disgiunti, di ampiezza 3
k
, tali che dist(J
k
j
, J
k
j+1
) 3
k
; in particolare si ha
C
k
C
k+1
per ogni k N.
Un facile ragionamento mostra che deve esistere N tale che

N
k=1
V
k
C

.
Poiche C

ha 2

componenti connesse, e gli aperti V


k
sono disgiunti, ciascuna
componente connessa di C

deve essere coperta da un singolo V


k
, cosicche si
ha necessariamente N 2

.
Daltra parte, se un ssato V
k
ricopre J

j
J

j+1
, si avr`a in particolare
diam(V
k
) diam(J

j
) + diam(J

j+1
) + dist(J

j
, J

j+1
) 3
1
.
Sostituiamo allora V
k
con una coppia di aperti disgiunti W
1
e W
2
, tali che
W
1
J

j
, W
2
J

j+1
, diam(W
1
) < 3

+, diam(W
2
) < 3

+,
ove > 0 `e scelto in modo che si abbia
(diam(W
1
))
D
+ (diam(W
2
))
D
< (diam(V
k
))
D
.
41
Ci`o `e possibile poiche, scelto ]0, diam(V
k
) 3
1
[, si verica facilmente
che vale la relazione
(diam(W
1
))
D
+ (diam(W
2
))
D
< 2(3

+)
D
< (3
1
+)
D
< (diam(V
k
))
D
pur di prendere ]0, 2
1/D
[.
In questo modo si rimpiazzano tutti gli aperti V
k
che contengono pi` u di un
intervallo J

j
. Si ottiene cos` una famiglia W
1
, . . . , W
M
di aperti disgiunti,
tali che
M

h=1
(diam(W
h
))
D

k=1
(diam(V
k
))
D

n=0
(diam(U
n
))
D
.
Inoltre, dato che ognuno dei W
h
contiene esattamente uno dei J

j
, deve essere
M = 2

; pertanto
2

h=1
(diam(W
h
))
D

h=1
(diam(J

j
))
D
=
2

h=1
3
D
= 2

3
D
= 1.
Ci` o prova che

n=0
(diam(U
n
))
D

h=1
(diam(W
h
))
D
1
e quindi, come si `e osservato, si ha H
D
(C) 1.
Esercizi 2.5
1. Si provi che per ogni E R
N
si ha
dim
H
(E) =
_
0 se H

p
(E) = 0 p > 0
supp > 0 : H

p
(E) = +. altrimenti.
2. Si dimostri che se E
n

nN
T(R)
N
), allora
dim
H
_
_
nN
E
n
_
= sup
nN
dim
H
(E
n
).
42
3. Sia f : R
N
R
m
una funzione -holderiana, ossia tale che
[f(x) f(x
t
)[
m
K[x x
t
[
N
x, x
t
R
N
.
Si provi che se E R
N
allora
dim
H
(f(E))
1

dim
H
(E).
Se ne deduca che se f : R
N
R
N
`e bi-lipschitziana, ossia
K
1
[x x
t
[
N
[f(x) f(x
t
)[
N
K
2
[x x
t
[
N
x, x
t
R
N
,
allora per ogni E R
N
si ha dim
H
(f(E)) = dim
H
(E).
4. Si provi che se E R
N
`e tale che dim
H
(E) < 1, allora E `e totalmente
sconnesso.
[Traccia: ssati x, x
t
E, si consideri la funzione f(z) = [z x[
N
e si
osservi che, per lesercizio precedente, dim
H
(f(E)) < 1; si utilizzi inne
il fatto che f(E)
c
`e denso in R per costruire due diverse componenti
connesse che contenenti rispettivamente x e x
t
.]
5. Fissato s ]0, 1[, si consideri linsieme
s
costruito, analogamente al ca-
so dellinsieme di Cantor descritto nel paragrafo 1.6, nel modo seguente:
al primo passo si toglie da [0, 1] un intervallo centrale di ampiezza s;
nei passi successivi si toglie da ciascun intervallino residuo di lunghezza
d la parte centrale di ampiezza pari a sd. Si provi che m(
s
) = 0 e che
dim
H
(
s
) =
log 2
log
2
1s
.
[Traccia: adattare largomentazione relativa allesempio 2.5.3.]
2.6 La misura H
N
in R
N
Dato un insieme misurabile E R
N
, che relazione c`e fra la sua misura di
Hausdor H
N
e la sua misura di Lebesgue m
N
? Vedremo ora che le due
quantit`a coincidono a meno di una costante moltiplicativa.
43
Teorema 2.6.1 Esiste una costante
N
tale che per ogni insieme E R
N
si ha
H

N
(E) =
N
m

N
(E).
Tale costante vale

N
=
_
2

_
N

_
N
2
+ 1
_
,
ove `e la funzione di Eulero:
(p) =
_

0
x
p1
e
x
dx, p > 0.
Dimostrazione Proveremo solo lesistenza della costante
N
, senza cal-
colarla esattamente, perche ci`o richiede strumenti troppo sosticati per noi
(salvo che quando N = 1, nel qual caso si rimanda allesercizio 2.3.7).
Sia C
0
= [0, 1[
N
. Fissato > 0 e scelto n >

, possiamo ricoprire C
0
con
n
N
cubi della forma
N

i=1
_
r
i
1
n
,
r
i
n
_
(r
1
, . . . , r
N
1, 2, . . . n).
Dato che tali cubi hanno diametro

N
n
< , ricordando lesercizio 2.3.4
otteniamo H

N,
(C
0
) (

N)
N
per ogni > 0, e dunque
H
N
(C
0
) (

N)
N
.
Sia ora U
n

nN
un arbitrario ricoprimento di C
0
con diam U
n
< : ciascun
U
n
pu`o essere ricoperto da una palla di diametro pari a 2 diam U
n
, e quindi
da un cubo C
n
di lato 2 diam U
n
e con gli spigoli paralleli agli assi coordinati.
Dato che
C
0

_
nN
U
n

_
nN
C
n
,
avremo
1 = m
N
(C
0
)

nN
m
N
(C
n
) =

nN
2
N
(diam U
n
)
N
,
ossia

nN
(diam U
n
)
N
2
N
.
44
Per larbitrariet`a del ricoprimento, concludiamo che H
N,
(C
0
) 2
N
, e
quindi
H
N
(C
0
) 2
N
.
In particolare

N
=
N
m
N
(C
0
) = H
N
(C
0
)
_
2
N
, (

N)
N
_
]0, [.
Grazie al fatto che H
N
e m
N
sono invarianti per traslazioni ed omogenee di
grado N rispetto alle omotetie, otteniamo anche
H
N
(C) =
N
m
N
(C)
per ogni cubo C con gli spigoli paralleli agli assi coordinati di R
N
.
Adesso sia A un aperto di R
N
: esiste un ricoprimento di A fatto di cubi
disgiunti C
j
, ognuno dei quali `e del tipo
N

i=1
_
r
i
1
2
m
,
r
i
2
m
_
(r
1
, . . . , r
N
Z, m N).
Un modo di costruire tale ricoprimento `e descritto nellesercizio 2.6.1. Si ha
allora, grazie alla numerabile additivit`a di H
N
e m
N
,
H
N
(A) =

jN
H
N
(C
j
) =
N

jN
m
N
(C
j
) =
N
m
N
(A)
per ogni aperto A di R
N
.
Sia ora B un boreliano di R
N
della forma
B =

nN
A
n
, A
n
aperti,
e non `e restrittivo supporre che A
n
A
n+1
. Se m
N
(B) < +, utilizzando
la denizione di misura esterna, `e chiaro che possiamo scrivere B come in-
tersezione numerabile di aperti A
t
n
di misura m
N
nita; di conseguenza, per
monotonia si ha H
N
(B) H
N
(A
t
n
) =
N
m
N
(A
t
n
) < . La proposizione
2.1.5 ci autorizza allora a concludere che
H
N
(B) = lim
n
H
N
(A
t
n
) =
N
lim
n
m
N
(A
t
n
) =
N
m
N
(B).
45
Se invece m
N
(B) = , posto B
m
= B]m, m[
N
, i B
m
vericano la relazione
precedente e quindi, al limite per m , si ottiene luguaglianza
H
N
(B) =
N
m
N
(B)
per ogni boreliano B che sia intersezione numerabile di aperti.
Inne, sia E R
N
: per lesercizio 2.6.2, si possono trovare due boreliani B
1
e B
2
contenenti E, entrambi intersezione numerabile di aperti, tali che
H
N
(B
1
) = H

N
(E), m
N
(B
2
) = m

N
(E),
da cui, posto B = B
1
B
2
, si ha che B `e un boreliano contenente E che `e
ancora intersezione numerabile di aperti, e per il quale risulta
H

N
(E) = H
N
(B) =
N
m
N
(B) =
N
m

N
(E).
Ci` o prova la tesi.
Osservazione 2.6.2 Si pu`o dimostrare (esercizio 2.6.4) che
_
2

_
N

_
N
2
+ 1
_
=
1
m
N
(B
0
)
,
ove B
0
`e la palla di R
N
di diametro unitario. Dunque il teorema precedente
aerma che la dierenza fra le misure N-dimensionali di Hausdor e di Lebe-
sgue `e che la prima assegna misura 1 alla palla di diametro unitario, mentre
la seconda assegna misura 1 al cubo di lato unitario.
Esercizi 2.6
1. Sia A R
N
un aperto. Si provi che A =

nN
C
n
, ove i C
n
sono cubi
diadici, ossia della forma
N

i=1
_
r
i
1
2
m
,
r
i
2
m
_
, r
1
, . . . , r
N
Z, m N.
[Traccia: detta c la famiglia di tali cubi, si provi che ogni x A `e
contenuto in un cubo C c, il quale `e massimale, nel senso che non
c`e nessun altro cubo C
t
c tale che C C
t
A; se ne deduca che
tutti i cubi massimali sono disgiunti e che A ne `e lunione.]
46
2. Sia E R
N
. Si provi che:
(i) esiste un boreliano B, intersezione numerabile di aperti, che contie-
ne E ed `e tale che m

N
(E) = m
N
(B);
(ii) esiste un boreliano B, intersezione numerabile di aperti, che con-
tiene E ed `e tale che H

N
(E) = H
N
(B).
3. Si provi che per ogni [0, N] esiste un insieme E R
N
la cui
dimensione di Hausdor `e .
[Traccia: si consideri il prodotto cartesiano
N
s
, ove 0 < s <
1
2
e

s
`e linsieme denito nellesercizio 2.5.5; adattando largomentazione
dellesempio 2.5.3 e suggerita per lesercizio 2.5.5, si provi che
N
s
ha
dimensione di Hausdor uguale a N
log 2
log
2
1s
.]
4. Detta
n
la misura della palla unitaria di R
n
, si verichi che

1
= 2,
2
= ,
n
=
2
n

n2
n 3,
e se ne ricavi la formula dellosservazione 2.6.2.
47
Capitolo 3
Funzioni misurabili
3.1 Denizione e propriet`a
Sia (X, T, ) uno spazio misurato. Prima di introdurre la nozione astratta
di integrale su X rispetto alla misura , occorre descrivere linsieme del-
le funzioni per le quali lintegrale stesso ha senso. Considereremo funzioni
f : D R = [, +], ove D `e un insieme misurabile, ossia un elemento
di T. Dato che si ammette che le funzioni prendano i valori , sar`a utile
la convenzione 0 () = 0, gi`a adoperata nel paragrafo 2.2, con la quale
potremo denire lintegrale senza ambiguit`a.
Cominciamo con la seguente proposizione, che introduce la propriet`a carat-
teristica delle funzioni che ci interessano.
Proposizione 3.1.1 Sia D T, sia f : D R. Sono fatti equivalenti:
(i) x D : f(x) > T R;
(ii) x D : f(x) T R;
(iii) x D : f(x) < T R;
(iv) x D : f(x) T R.
Dimostrazione (i) = (ii) Si ha
x D : f(x) =

nN
+
_
x D : f(x) >
1
n
_
.
48
(ii) = (iii) La tesi si ha per passaggio al complementare.
(iii) = (iv) Si ha
x D : f(x) =

nN
+
_
x D : f(x) < +
1
n
_
.
(iv) = (i) La tesi si ha per passaggio al complementare.
Denizione 3.1.2 Sia D T, sia f : D R. La funzione f `e detta
misurabile su D se vale una delle condizioni della proposizione precedente (e
quindi valgono tutte).
Osservazione 3.1.3 Se (X, T, ) `e uno spazio probabilizzato (esempio 2.1.3
(6)), le funzioni misurabili su X sono chiamate variabili aleatorie.
Vediamo qualche esempio.
Esempi 3.1.4 (1) Se E X, la funzione caratteristica, od indicatrice, di
E, `e

E
(x) =
_
1 se x E
0 se x E
c
.
Essa `e misurabile se e solo se E T: infatti
x X :
E
(x) > =
_
_
_
se 1
E se [0, 1[
X se < 0.
(2) Una funzione semplice `e una funzione del tipo
(x) =
k

h=1

E
h
(x), x X,
ove k N
+
,
1
, . . . ,
k
sono numeri reali, E
1
, . . . , E
k
sono elementi di T e

E
1
, . . . ,
E
k
sono le relative funzioni caratteristiche. Queste funzioni non si
rappresentano in modo unico: ad esempio, se X = R,

[0,1]
2
]1,2]
=
[0,2]
3
]1,2]
;
tuttavia se ne pu`o dare una rappresentazione canonica: dato che esse assu-
mono un numero nito di valori distinti
1
, . . . ,
r
, ponendo
A
i
= x X : (x) =
i
, i = 1, . . . , r,
49
si pu`o scrivere
(x) =
r

i=1

i

A
i
(x);
in questo modo si rappresenta la come combinazione lineare di funzioni
caratteristiche di insiemi disgiunti e massimali, nel senso che ciascun A
i
`e
il pi` u grande insieme dove la assume il corrispondente valore
i
.
Gli A
i
sono misurabili perche ottenuti dagli E
h
con un numero nito di unioni,
intersezioni e dierenze. Dalla rappresentazione canonica di segue subito
che `e misurabile: se i
i
sono ordinati in modo crescente, si ha infatti
x X : (x) > =
r
_
j=i
A
j
se [
i1
,
i
[, i = 2, . . . , r,
mentre se
r
tale insieme `e vuoto e se <
1
tale insieme coincide con
tutto X.
(3) In (R, /, m) le funzioni continue sono misurabili. Infatti per ogni R
linsieme x R : f(x) > = f
1
(], [) `e un aperto di R, quindi `e
misurabile.
(4) In (R, /, m) le funzioni monotone sono misurabili, perche per ogni R
linsieme x R : f(x) > `e una semiretta.
Indicheremo con /
D
linsieme delle funzioni misurabili su D, con o linsieme
delle funzioni semplici su X e con o
0
linsieme delle funzioni semplici su X
che si annullano al di fuori di un insieme di misura nita.
Osservazione 3.1.5 Se f, g /
D
, allora f + g `e misurabile sullinsieme
D
t
dove la somma stessa `e ben denita, ossia
D
t
= D x D : f(x) = g(x) = .
Infatti D
t
`e misurabile ed inoltre
x D
t
: f(x) +g(x) > =
= x D
t
: g(x) = + x D
t
: g(x) < +, f(x) > g(x) =
= x D
t
: g(x) = +

_
rQ
[x D
t
: f(x) > r x D
t
: + > g(x) > r] .
50
Similmente, se f, g /
D
, allora il loro prodotto fg sta in /
D
(esercizio
3.1.3).
La classe /
D
`e chiusa anche rispetto al passaggio allestremo superiore ed
allestremo inferiore, relativi ad insiemi numerabili di indici (non per insiemi
di indici qualunque: si veda lesercizio 3.1.5).
Proposizione 3.1.6 Sia D T, sia f
n

nN
/
D
. Allora le funzioni
sup
n
f
n
, inf
n
f
n
, limsup
n
f
n
e liminf
n
f
n
appartengono a /
D
.
Dimostrazione La misurabilit`a di sup
n
f
n
e inf
n
f
n
segue dalle uguaglianze
x D : sup
n
f
n
> =
_
nN
x D : f
n
(x) > ,
x D : inf
n
f
n
< =
_
nN
x D : f
n
(x) < ;
la misurabilit`a di limsup
n
f
n
e liminf
n
f
n
segue da quanto gi`a provato
e dalle identit`a
limsup
n
f
n
= inf
n
sup
mn
f
m
, liminf
n
f
n
= sup
n
inf
mn
f
m
.
Unimportante caratterizzazione di /
D
`e la seguente:
Proposizione 3.1.7 Sia D T, sia f : D R. Si ha f /
D
se e solo
se esiste
n

nN
o tale che
n
f puntualmente in D per n .
Dimostrazione (=) Poiche le funzioni semplici sono misurabili, la mi-
surabilit`a di f segue dalla proposizione precedente.
(=) Sia f /
D
. Per ogni n N e per ogni x D poniamo:

n
(x) =
_

_
n se f(x) n
k1
2
n
se
k1
2
n
f(x) <
k
2
n
, k = 1, 2, . . . , n2
n
k
2
n
se
k1
2
n
< f(x)
k
2
n
, k = 0, 1, . . . , n2
n
+ 1
n se f(x) n.
`
E facile vericare che
n
o e che
n
(x) f(x) per n .
Osservazioni 3.1.8 (1) Se f 0 in D, le funzioni
n
sopra denite for-
mano una successione crescente:
n
(x)
n+1
(x) f(x) per ogni n N e
x D. Se invece f 0, la successione
n
`e decrescente.
51
(2) Se f `e limitata in D, la convergenza delle
n
`e uniforme in D: infatti
se [f(x)[ L, allora [
n
(x) f(x)[ 2
n
per ogni x D e per ogni n L.
(3) La convergenza delle
n
verso f `e dominata, ossia [
n
(x)[ [f(x)[
per ogni x D e per ogni n N.
(4) Se linsieme x D : f(x) ,= 0 `e -nito, cio`e `e unione numerabile di
insiemi A
n
A
n+1
misurabili di misura nita, allora rimpiazzando
n
con

An
si pu`o supporre che ciascuna
n
appartenga a o
0
. In tal caso valgono
ancora (1) e (3), ma in generale non vale pi` u (2).
Esercizi 3.1
1. Se f `e misurabile su D, si provi che per ogni R linsieme x D :
f(x) = `e misurabile, ma che il viceversa `e falso.
2. Sia f
n

nN
/
D
. Si provi che linsieme x D : lim
n
f
n
(x) `e
misurabile.
3. Si provi che se f, g /
D
allora fg /
D
.
4. Sia f : [a, b] R una funzione derivabile. Si provi che la funzione f
t
`e
misurabile nello spazio misurato (R, /, m).
5. Sia T un insieme, e sia f
t

tT
una famiglia di funzioni misurabili. La
funzione sup
tT
f
t
`e in generale misurabile?
6. Si provi che in un generico spazio misurato (X, T, ) una funzione
f : X R `e misurabile se e solo se f
1
(B) T per ogni boreliano
B R. Si verichi poi che la funzione : B [0, ] denita da
(E) = (f
1
(E)) `e una misura su (R, B). (Se (X) = 1, in linguaggio
probabilistico `e la misura immagine, o legge, della variabile aleatoria
f.)
[Traccia: si provi che c = B B : f
1
(B) T `e una -algebra
contenente gli aperti.]
7. Sia b N, b > 1; per ogni x R si consideri lo sviluppo di x in base b:
x = [x] +

n=1

n
(x)
b
n
,
n
(x) 0, 1, . . . , b 1.
52
Provare che le funzioni
f
n
(x) =
n
(x) , n N
+
,
sono tutte misurabili in (R, /, m).
8. Si provi che la -algebra / contiene propriamente la -algebra dei
boreliani.
[Traccia: per ogni x [0, 1] si consideri il suo sviluppo binario x =

n=1
n
2
n
(
n
0, 1), convenendo di scegliere lo sviluppo innito nei
casi di ambiguit`a: ad esempio, per
3
4
si prender`a 0.101 anziche 0.11.
Posto f(x) =

n=1
2n
3
n
, si mostri che f([0, 1]) C
3
e che f `e iniettiva.
Si usi lesercizio 3.1.7 per vericare che f `e misurabile; quindi, f
1
(B)
/ per ogni B B (esercizio 3.1.6). Sia V [0, 1] non misurabile:
posto E = f(V ), si provi che E / ma f
1
(E) / /. Se ne deduca
che E / B.].
9. Sia f misurabile ed inferiormente limitata. Si costruisca una succes-
sione di funzioni semplici che converga puntualmente a f in modo
crescente.
10. Sia f : R R misurabile in (R, /, m) e sia g : R R continua. Si
provi che g f `e misurabile.
11. Si provi che se f : R R `e continua allora f
1
(B) B per ogni B B.
`
E vero il viceversa?
12. Si provi che f : D R `e misurabile se e solo se f
2
`e misurabile e
linsieme x D : f(x) > 0 appartiene a T.
13. Sia f
n
una successione di funzioni da X in R. Per ogni n N sia T
n
la pi` u piccola -algebra di sottoinsiemi di X rispetto a cui le funzioni
f
k

kn
sono tutte misurabili. Si provi che:
(i) T
n
T
n+1
per ogni n, e T =

T
n
`e una -algebra;
(ii) la funzione f(x) =

nN
f
n
(x), denita per gli x ove ha senso, non
`e in generale T-misurabile;
(iii) linsieme A = x X :

nN
[f
n
(x)[ < appartiene a T;
(iv) se si considerano funzioni da X in R la (iii) `e in generale falsa.
53
14. Si provi che esistono funzioni f : R R continue, tali che limmagine
inversa f
1
(E) di un insieme E / non `e un elemento di /.
[Traccia: si costruisca un omeomorsmo f : [0, 1] [0, 1] che trasfor-
mi C
4
in C
3
, associando ciascun intervallo rimosso nella costruzione di
C
4
al corrispondente intervallo rimosso nella costruzione di C
3
. Si ssi
poi un sottoinsieme non misurabile W C
4
(esercizio 1.8.2) e si mostri
che per E = f(W) si ha f
1
(E) / /.]
15. Si provi che esistono f : R R misurabile secondo Lebesgue e g : R
R continua tali che f g non `e misurabile.
16. Si provi che se f : R R `e una funzione boreliana, ossia B-misurabile,
e g : R R `e una funzione continua, allora f g `e boreliana e quindi
misurabile.
3.2 Funzioni essenzialmente limitate
Introduciamo anzitutto una locuzione che sar`a utilissima nel seguito. Essa
riette il fatto che le funzioni che coincidono al di fuori di un insieme di
misura nulla sono di fatto indistinguibili dal punto di vista della teoria della
misura e dellintegrale.
Denizione 3.2.1 Sia (X, T, ) uno spazio misurato, sia D T e sia p(x)
un predicato denito per x X. Diciamo che la propriet`a espressa da p(x)
`e vera quasi ovunque (e scriveremo q.o.) in D se linsieme x D : p(x)
appartiene a T ed il suo complemento in D, cio`e x D : p(x), ha misura
nulla.
Ad esempio, in (R, /, m) la funzione f =
Q
verica f(x) = 0 q.o. in R.
Osservazione 3.2.2 Siano D T, f /
D
. Se g : D R `e unaltra fun-
zione tale che f(x) = g(x) q.o. in D, possiamo dire che g /
T
? In generale
no (esercizio 3.2.1), ma la risposta `e s` se lo spazio misurato `e completo.
Infatti in tal caso, posto A = x D : f(x) = g(x), per ipotesi A T e
(D A) = 0; daltra parte
x D : g(x) > = x A : f(x) > x D A : g(x) > ,
ed a secondo membro il primo insieme `e misurabile dato che A T e f
/
D
, mentre il secondo `e misurabile grazie alla completezza, essendo incluso
54
in D A che ha misura nulla.
Introduciamo ora lo spazio delle funzioni essenzialmente limitate.
Denizione 3.2.3 Siano D T, f /
D
. Se A D, A T, i numeri
(niti o no)
supess
A
f = inf R : f(x) q.o. in A,
infess
A
f = sup R : f(x) q.o. in A
si chiamano estremo superiore essenziale ed estremo inferiore essenziale di f
in A (si conviene che inf = + e sup = ).
Denizione 3.2.4 Siano D T, f /
D
. Se risulta infess
D
f > e
supess
D
f < +, diremo che f `e essenzialmente limitata in D e scriveremo
f /

(D) (anche se, pi` u correttamente, dovremmo scrivere /

(D, T, )).
`
E facile vericare che f /

(D) se e solo se f /
D
e supess
D
[f[ < +.
Esempi 3.2.5 (1) In (R, /, m) la funzione f(x) = 5
Q
(x) +sin x verica
supess
R
f = 1, infess
R
f = 1.
(2) In (R, /, m), se f : R R `e continua allora supess
A
f = sup
A
f e
infess
A
f = inf
A
f per ogni aperto A R. La stessa cosa non vale se A non
`e aperto (esercizio 3.2.6).
Osservazione 3.2.6 Per ogni f /
D
si ha f(x) infess
D
f e f(x)
supess
D
f q.o. in D (esercizio 3.2.4).
Si verica facilmente che /

(D) `e uno spazio vettoriale e unalgebra (osser-


vazione 3.1.5 ed esercizio 3.2.5).
Esercizi 3.2
1. Sia (X, T, ) uno spazio misurato non completo. Se f /
X
, si provi
che esiste g : X R non misurabile, tale che f(x) = g(x) q.o. in X.
2. Si provi che se f /

(D) allora esiste A T tale che (A


c
) = 0 e
supess
D
[f[ = sup
A
[f[.
3. Sia f /
D
; provare che per ogni A D si ha
f(x) infess
A
f e f(x) supess
A
f q.o. in A.
55
4. Si provi che se f, g /

(D) allora f +g, fg /

(D) e
supess
D
[f +g[ supess
D
[f[ + supess
D
[g[,
supess
D
[fg[ supess
D
[f[ supess
D
[g[.
5. Sia f
n
/

(D) una successione convergente puntualmente in D ad


una funzione f.
`
E vero che f /

(D)?
6. Sia f
n
/
D
una successione tale che
lim
n
f
n
(x) = f(x) q.o. in D.
`
E vero che f /
D
?
7. Sia (X, T, ) -nito, e sia f
n
/
D
. Se le f
n
sono q.o. nite, si
costruisca una successione
n
di numeri positivi tale che
n
f
n
(x) 0
q.o. in D per n .
[Traccia: supposto dapprima che (D) < , si osservi che non `e
restrittivo assumere che 0 f
n
f
n+1
. Per ogni n N si scelga
k
n
N in modo che A
n
= x D : f
n
(x) > k
n
abbia misura minore
di 2
n
; si verichi che (limsup
n
A
n
) = 0. Si deduca la tesi con

n
=
1
nkn
. Si generalizzi poi al caso (D) = .]
8. Si descriva lo spazio /

(D) quando D T e (D) = 0.


9. Si fornisca un esempio di funzione continua f tale che
supess
A
f < sup
A
f
ove A `e un opportuno sottoinsieme chiuso di R.
3.3 Lo spazio L

Sia (X, T, ) uno spazio misurato. Fissato D T, introduciamo nello spazio


/

(D) la seguente relazione di equivalenza:


f g f(x) = g(x) q.o. in D;
le veriche sono pressocche ovvie. A noi interesser`a lo spazio quoziente
rispetto a .
56
Denizione 3.3.1 Linsieme quoziente /

(D)/ si indica con L

(D)
(nuovamente, la notazione pi` u appropriata sarebbe L

(D, T, )).
Osserviamo che gli elementi di L

(D) non sono funzioni, ma classi di equi-


valenza di funzioni q.o. coincidenti; tuttavia, come `e duso, continueremo
a chiamarle funzioni, confondendo in eetti la classe [f] con il suo rappre-
sentante f. Si tenga presente per`o che tali funzioni sono denite soltanto
quasi ovunque e non punto per punto.
Lo spazio L

(D) eredita da /

(D) la struttura di spazio vettoriale e di alge-


bra: la somma `e denita da [f] +[g] = [f +g] e il prodotto da [f] [g] = [fg];
`e immediato vericare che queste denizioni sono ben poste.
Le motivazioni per il passaggio da /

a L

sono fornite dal seguente fonda-


mentale risultato:
Teorema 3.3.2 Sia D T. La quantit`a
|f|
,D
= supess
D
[f[, f /

(D),
`e invariante rispetto alla relazione e denisce una norma su L

(D); inoltre
(L

(D), | |
,D
) `e uno spazio di Banach.
Dimostrazione Sia f /

(D); se g f `e facile vericare che


supess
D
[f[ = supess
D
[g[,
quindi la quantit`a |f|
,D
dipende solo dalla classe [f] e non da f. Veri-
chiamo che | |
,D
`e una norma.
(a) Ovviamente |f|
,D
0; se si ha |f|
,D
= 0 allora per losservazione
3.2.6 si ha f(x) = 0 q.o. in D, cio`e f 0, ossia [f] `e lelemento neutro della
somma in L

(D).
(b) Si ha |f|
,D
= [[|f|
,D
(facile verica usando la denizione di estre-
mo superiore essenziale).
(c) La subadditivit`a di | |
,D
segue dallesercizio 3.2.4.
Proviamo ora la completezza dello spazio normato (L

(D), | |
,D
). Per
maggior chiarezza, utilizziamo la notazione [f] per indicare gli elementi di
L

(D).
Sia dunque [f
n
]
nN
una successione di Cauchy in L

(D): ci`o signica che


per ogni > 0 esiste N tale che
|[f
n
] [f
m
]|
,D
< n, m .
57
Per ogni n N sia g
n
[f
n
]; allora
supess
D
[g
n
[ = |[f
n
]|
,D
, supess
D
[g
n
g
m
[ = |[f
n
] [f
m
]|
,D
n, m N.
Posto per n, m N
A
n
= x D : [g
n
(x)[ > supess
D
[g
n
[,
A
nm
= x D : [g
n
(x) g
m
(x)[ > supess
D
[g
n
g
m
[,
dallosservazione 3.2.6 segue che (A
n
) = (A
nm
) = 0 per ogni n, m N;
dunque anche linsieme
B =
_
_
nN
A
n
_

_
_
n,mN
A
nm
_
ha misura nulla e si ha, per ogni > 0,
[g
n
(x) g
m
(x)[ supess
D
[g
n
g
m
[ < n, m , x D B.
Pertanto g
n
`e una successione di /

(D B) che `e di Cauchy rispetto alla


convergenza uniforme in D B. Dunque esiste una funzione g : D B R
tale che g
n
g uniformemente in D B per n . Tale g `e misurabile su
D B perche tali sono le g
n
; se prolunghiamo g a tutto D ponendola uguale
a 0 in B, otteniamo che g /
D
. Inoltre
supess
D
[g[ sup
D\B
[g[ = sup
D
[g[ < ,
cosicche la classe [g] individuata da g `e un elemento di L

(D). Proviamo
che [f
n
] [g] in L

(D):
|[f
n
] [g]|
,D
= supess
D
[g
n
g[ = sup
D\B
[g
n
g[ 0 per n .
Esercizi 3.3
1. Si provi che se [f], [g] L

(D) allora [fg] L

(D) e
|[fg]|
,D
|[f]|
,D
|[g]|
,D
.
58
2. Sia i : /

(R) L

(R) lapplicazione denita da i(f) = [f]. Si provi


che la restrizione di i allo spazio C
0
(R) /

(R) `e iniettiva.
3. Determinare la chiusura in L

(R) degli spazi C


0
(R) L

(R) e C
0
0
(R),
ove
C
0
0
(R) = f C
0
(R) : f `e nulla fuori da un compatto
(si noti che confondiamo volutamente le f C
0
(R) /

(R) con le loro


classi di equivalenza in L

(R)).
4. Si provi che lo spazio delle funzioni semplici su X `e denso in L

(X).
5. Si descriva lo spazio L

(D) quando D T e (D) = 0.


3.4 Misurabilit`a e continuit`a
Quanta distanza c`e tra la nozione di misurabilit`a di una funzione e quella,
pi` u forte, di continuit`a? E similmente, quanta distanza intercorre fra la
convergenza puntuale q.o. e la ben pi` u restrittiva convergenza uniforme? I
due risultati che seguono sembrano mostrare che le due distanze non sono
poi cos` grandi.
Teorema 3.4.1 (di Lusin) Sia f : R R una funzione misurabile secondo
Lebesgue, q.o. nita, nulla fuori di un insieme A / di misura nita.
Allora per ogni > 0 esiste una funzione g C
0
0
(R) tale che
m(x R : f(x) ,= g(x)) < ,
ed inoltre si ha |g|

|f|

.
Ricordiamo che lo spazio C
0
0
(R) `e stato introdotto nellesercizio 3.3.3. Per
una lieve generalizzazione del teorema di Lusin si veda lesercizio 3.4.1.
Dimostrazione Faremo quattro passi successivi.
(a) A compatto, 0 f 1. Sia
n
la successione crescente di funzioni
semplici convergente uniformemente a f costruita nella dimostrazione della
proposizione 3.1.7, vale a dire

n
(x) =
k
2
n
se
k
2
n
f(x) <
k + 1
2
n
, k = 0, 1, . . . , 2
n
, n N.
59
Poniamo

0
=
0
,
n
=
n

n1
n N
+
;
allora si ha f =

n=0

n
in R. Osserviamo anche che
n
assume soltanto
i valori 0 e 2
n
, cosicche 2
n

n
`e la funzione caratteristica
Tn
di un certo
insieme misurabile T
n
A.
Sia ora V un aperto contenente A, tale che V sia compatto. Per ogni n
scegliamo poi un compatto K
n
ed un aperto V
n
tali che
K
n
T
n
V
n
V, m(V
n
K
n
) <

2
n
(proposizione 1.7.3). Adesso costruiamo una funzione h
n
C
0
0
(R) tale che
0 h
n
1, h
n
= 1 in K
n
, h
n
= 0 in V
c
n
:
ad esempio si pu`o prendere
h
n
(x) =
d(x, V
c
n
)
d(x, V
c
n
) + d(x, K
n
)
, x R,
ove d(x, K) = inf[x y[ : y K per ogni K R; h
n
`e continua su R in
virt` u della maggiorazione
[d(x, K) d(x
t
, K)[ [x x
t
[ x, x
t
R, K R.
Denendo
g(x) =

n=0
2
n
h
n
(x), x R,
si ottiene una funzione che `e continua, in quanto la serie converge unifor-
memente su R, e che `e nulla fuori di V ; dunque g C
0
0
(R). Si noti ora
che
2
n
h
n
(x) =
n
(x) x K
n
V
c
n
= (V
n
K
n
)
c
;
quindi avremo
g(x) = f(x) x

n=0
(V
n
K
n
)
c
.
Se ne deduce
m(x R : g(x) ,= f(x)

n=0
m(V
n
K
n
) 2,
60
cio`e la tesi nel caso (a).
(b) A compatto, f limitata. Posto M = sup
X
[f[, le funzioni
f
+
M
,
f

M
sono
comprese fra 0 e 1, quindi per il passo (a) esistono due funzioni g
+
, g


C
0
0
(R) tali che
m
__
x R : g
+
(x) ,=
f
+
(x)
M
__
<

2
, m
__
x R : g

(x) ,=
f

(x)
M
__
<

2
.
Allora la funzione g = M(g
+
g

) verica la tesi nel caso (b): infatti se


in un punto x si ha g(x) ,= f(x), necessariamente deve essere g
+
(x) ,=
f
+
(x)
M
oppure g

(x) ,=
f

(x)
M
, e dunque
m(x R : g(x) ,= f(x)) <

2
+

2
= .
(c) m(A) < , f limitata. Sia K un compatto contenuto in A tale che
m(A K) < /2 : lesistenza di tale compatto `e facile conseguenza del fatto
che m(A) = lim
n
m(A [n, n]) e della proposizione 1.7.3. La funzione
f
K
verica le ipotesi del passo (b), quindi esiste g C
0
0
(R) tale che
m(x R : g(x) ,= f(x)
K
(x)) <

2
;
ne segue
m(x R : g(x) ,= f(x)) <

2
+m(A K) < ,
il che prova (c).
(d) Caso generale. Per ogni n N sia B
n
= x R : [f(x)[ > n. Gli in-
siemi B
n
sono ovviamente contenuti in A, inoltre B
n
B
n+1
e m(

nN
B
n
) =
0; in particolare, lim
n
m(B
n
) = 0 (proposizione 1.7.2). Scelto n in modo
che m(B
n
) < /2, la funzione f
B
c
n
verica le ipotesi del passo (c), quindi
esiste g C
0
0
(R) tale che
m(x R : g(x) ,= f(x)
B
c
n
(x)) <

2
,
ed allora si ha anche
m(x R : g(x) ,= f(x)) <

2
+m(B
n
) < .
Ci` o prova il passo (d).
61
Inne resta da osservare che la condizione |g|

|f|

`e evidentemente au-
tomatica se f `e illimitata; se invece f `e limitata, per ottenerla basta sostituire
g con
G(x) =
_
g(x) se [g(x)[ |f|

|f|

se [g(x)[ > |f|

.
La G verica ancora la tesi di (d) perche G dierisce da g soltanto in punti
dove sicuramente g(x) ,= f(x), cosicche
x R : g(x) = f(x) x R : G(x) = f(x),
da cui a maggior ragione
(x R : G(x) ,= f(x)) < .
Non bisogna enfatizzare troppo la portata del teorema di Lusin: esso non
aerma che ogni funzione misurabile `e continua salvo che su un insieme di
punti di misura arbitrariamente piccola. Ad esempio, la funzione
Q[0,1]
`e
discontinua in ogni punto di [0, 1], pur coincidendo addirittura q.o. con la
funzione continua g(x) = 0.
Teorema 3.4.2 (di Severini-Egorov) Sia (X, T, ) uno spazio misurato
con (X) < , e sia f
n
una successione di funzioni misurabili che converge
q.o. in X ad una funzione f. Allora per ogni > 0 esiste un insieme E T
con (E) < , tale che f
n
f uniformemente in E
c
per n .
Dimostrazione Per m N e k N
+
poniamo
E
k,m
=

n=m
_
x X : [f
n
(x) f(x)[ <
1
k
_
;
allora si ha
x X : lim
n
f
n
(x) = f(x)

_
m=0
E
k,m
k N
+
,
e quindi

__

_
m=0
E
k,m
_
c
_
=
_

m=0
E
c
k,m
_
= 0 k N
+
.
62
Poiche (X) < , per la proposizione 2.1.5 si ottiene
lim
m
(E
c
k,m
) = 0 k N
+
.
Di conseguenza, per ogni > 0 e per ogni k N
+
possiamo scegliere m
k
N
tale che
(E
c
k,m
k
) <

2
k
.
Dunque, posto E =

k=1
E
c
k,m
k
, si ha
(E)

k=1
(E
c
k,m
k
) < .
Daltra parte per ogni x E
c
si ha che x E
k,m
k
per ogni k N
+
, ossia
[f
n
(x) f(x)[ <
1
k
n m
k
, k N
+
.
Ci` o prova che per ogni k N
+
risulta
sup
xE
c
[f
n
(x) f(x)[
1
k
n m
k
,
cio`e la tesi.
Osservazione 3.4.3 Nel teorema di Severini-Egorov lipotesi (X) < `e
indispensabile: in (R, /, m), posto f
n
=
[n1,n][n.n+1]
, si ha f
n
0
puntualmente, ma non uniformemente al di fuori di alcun sottointervallo di
R; ed infatti m(R) = +.
Anche il teorema di Severini-Egorov non va enfatizzato: la convergenza pun-
tuale q.o. si trasforma in convergenza uniforme al di fuori di un insieme di
misura arbitrariamente piccola, ma linsieme su cui si realizza la convergenza
uniforme pu`o essere estremamente irregolare e frastagliato: di conseguenza,
anche se le f
n
erano continue, le propriet`a di continuit`a ereditate da f sono
ben poco signicative.
63
Esercizi 3.4
1. Si provi che se f : R R `e una funzione misurabile q.o. nita,
allora per ogni > 0 esiste una funzione continua g : R R tale che
|g|

|f|

e
m(x R : g(x) ,= f(x)) < .
[Traccia: Supponendo dapprima f 0, per ogni n N si conside-
ri f
]n,n[
e si determini una g
n
C
0
0
([n, n] non negativa tale che
|g
n
|

|f|

e m(x [n, n] : g
n
(x) ,= f(x)) < . Poi si denisca
g(x) =
_
g
1
(x) se [x[ 1,
maxg
1
(x), . . . g
n
(x) se n 1 < [x[ n, n > 1,
e si mostri che g verica la tesi. Inne si generalizzi al caso di f di
segno qualunque.]
2. Sia f =
C

, ove C

`e linsieme di Cantor (paragrafo 1.6). Fissato


> 0, si determini esplicitamente una funzione continua g, nulla fuori
di [0, 1], tale che m(x R : f(x) ,= g(x)) < .
3. Sia f
n
(x) = max1n d(x, C), 0, ove C = C
1/3
`e linsieme ternario di
Cantor. Si verichi che f
n
0 q.o. in [0, 1] e, ssato > 0, si determini
esplicitamente un insieme misurabile E [0, 1] tale che m(E) < e
f
n
0 uniformemente in [0, 1] E.
3.5 Convergenza in misura
Sia (X, T, ) uno spazio misurato. Introduciamo ora un tipo di convergenza
per funzioni che `e di grande importanza in teoria della probabilit`a.
Denizione 3.5.1 Siano f
n
, f funzioni misurabili q.o. nite su X. Diciamo
che f
n
f in misura per n se per ogni > 0 si ha
lim
n
(x X : [f
n
(x) f(x)[ > ) = 0.
Diciamo che f
n
`e fondamentale in misura se `e una successione di Cauchy
rispetto alla convergenza in misura, ossia se per ogni > 0 e per ogni > 0
esiste N tale che
(x X : [f
n
(x) f
m
(x)[ > ) < n, m .
64
Quando (X) = 1, la convergenza in misura viene chiamata, come `e giusto,
convergenza in probabilit`a.
Le propriet`a della convergenza in misura ed i suoi legami con la convergenza
puntuale sono illustrati nella seguente
Proposizione 3.5.2 Sia (X, T, ) uno spazio misurato, siano f
n
, f, g fun-
zioni misurabili q.o. nite su X.
(i) Se f
n
f in misura e f
n
g in misura, allora f = g q.o. in X.
(ii) Se f
n
f q.o. in X ed inoltre (X) < , allora f
n
f in misura.
(iii) Se f
n
f in misura, allora f
n
`e fondamentale in misura.
(iv) Se f
n
`e fondamentale in misura, allora esiste una sottosuccessione
f
n
k
f
n
che converge q.o. in X ad una funzione f misurabile e
q.o. nita su X.
(v) Se f
n
`e fondamentale in misura, allora esiste f misurabile e q.o. nita
su X tale che f
n
f in misura.
Dimostrazione (i) Basta osservare che, per ogni k N
+
e per ogni n N,
_
x X : [f(x) g(x)[ >
1
k
_

_
x X : [f(x) f
n
(x)[ >
1
2k
_

_
x X : [f
n
(x) g(x)[ >
1
2k
_
,
e che quindi dallipotesi segue che

__
x X : [f(x) g(x)[ >
1
k
__
= 0 k N
+
,
da cui (x X : f(x) ,= g(x)) = 0.
(ii) Per il teorema di Severini-Egorov, per ogni > 0 esiste E T con
(E) < tale che f
n
f uniformemente in E
c
; ne segue che per ogni > 0
si ha
x X : [f
n
(x) f(x)[ > E denitivamente,
da cui
(x X : [f
n
(x) f(x)[ > ) < denitivamente:
65
ci`o prova la tesi.
(iii) Basta notare che
x X : [f
n
(x) f
m
(x)[ >

_
x X : [f
n
(x) f(x)[ >

2
_

_
x X : [f(x) f
m
(x)[ >

2
_
.
(iv) Poiche f
n
`e fondamentale in misura, `e possibile scegliere induttiva-
mente una sequenza n
k
N tale che n
k
< n
k+1
e
(x X : [f
n
(x) f
m
(x)[ > 2
k
) < 2
k
n, m n
k
, k N
+
.
Poniamo X
0
= X N, ove
N =
_
n
x X : [f
n
(x)[ = +.
Allora, posto per k, j N
+
A
k
= x X
0
: [f
n
k+1
(x) f
n
k
(x)[ > 2
k
, B
j
=

_
k=j
A
k
, B =

j=1
B
j
,
otteniamo
(B
j
)

k=j
(A
k
) <

k=j
2
k
,
ed essendo (B
1
) < 1 si conclude che
(B) = lim
j
(B
j
) = 0.
Notiamo ora che la successione f
n
k
converge uniformemente su X
0
B
j
per
ogni j N
+
: infatti dalluguaglianza X
0
B
j
=

k=j
(X
0
A
k
) segue che se
q > p j si ha
[f
nq
(x) f
np
(x)[
q1

k=p
[f
n
k+1
(x) f
n
k
(x)[
q1

k=p
2
k
x X
0
B
j
.
Ponendo allora f(x) = lim
k
f
n
k
(x), la funzione f `e ben denita per ogni
x

j=1
(X
0
B
j
) = X
0
B, ossia q.o. in X, ed `e ovviamente misurabile.
Inoltre, essendo
[f(x)[ [f
n
j
(x)[ + 1 x X
0
B
j
, j N
+
,
66
si ha che f `e nita in X
0
B, e quindi `e nita q.o. in X. Ci`o prova (iv).
(v) Sia > 0; poiche la successione f
n
`e fondamentale in misura, per ogni
> 0 esiste N tale che
(x X : [f
n
(x) f
m
(x)[ > ) < n, m .
Da (iv) segue che esiste una sottosuccessione f
n
k
f
n
che converge
puntualmente q.o. in X ad una funzione f q.o. nita. Inoltre in corri-
spondenza di esiste un insieme B T con (B) < , tale che f
n
k
f
uniformemente in B
c
: basta prendere come B uno dei B
j
della dimostrazio-
ne di (iv), con j sucientemente grande. Allora per ogni > 0 linsieme
x X : [f
n
k
(x)f(x)[ > `e contenuto in B per ogni k abbastanza grande,
cosicche esiste k
0
N tale che
(x X : [f
n
k
(x) f(x)[ > ) (B) < k k
0
.
Ma allora per ogni n si ha, scelto k tale che k k
0
e n
k
,
x X : [f
n
(x) f(x)[ > 2
x X : [f
n
(x) f
n
k
(x)[ > x X : [f
n
k
(x) f(x)[ > ,
da cui
(x X : [f
n
(x) f(x)[ > 2 < 2.
Ne segue la tesi per larbitrariet`a di .
Esercizi 3.5
1. Supponiamo che f
n
f in misura e che g
n
g in misura. Si provi
che:
(i) f
n
+g
n
f +g in misura;
(ii) f
n
f in misura per ogni R;
(iii) [f
n
[ [f[ in misura;
(iv) se (X) < , allora f
n
g
n
fg in misura;
(v) se (X) < e f
n
, f sono q.o. diverse da 0, allora
1
fn

1
f
in
misura.
2. Sia (X) = . Esibire esempi di successioni f
n
, g
n
tali che:
67
(i) f
n
f in misura, g
n
g in misura, ma f
n
g
n
, fg in misura;
(ii) f
n
f in misura, f
n
, f sono q.o. diverse da 0, ma
1
fn
,
1
f
in
misura.
3. Esibire esempi di successioni f
n
tali che:
(i) f
n
f q.o. in X ma f
n
, f in misura;
(ii) f
n
f in misura ma f
n
, f q.o. in X.
4. Sia (X) < , sia f
n
una successione di funzioni misurabili q.o.
nite e sia f unaltra funzione misurabile e q.o. nita. Si provi che
f
n
f in misura se e solo se per ogni sottosuccessione f
n
k

kN
di
f
n
esiste unulteriore sottosuccessione f
n
k
h

hN
che converge a f
q.o. in X.
5. Sia g : R R una funzione uniformemente continua. Si provi che se
f
n
f in misura, allora g f
n
g f in misura.
`
E vero questo
risultato se g `e soltanto continua?
68
Capitolo 4
Lintegrale
4.1 Integrale di funzioni semplici
Sia (X, T, ) uno spazio misurato. Introdurremo la nozione di integrale ri-
spetto alla misura per una sottoclasse di funzioni misurabili (quelle, ap-
punto, integrabili). Se, in particolare, lo spazio misurato `e (R, /, m) op-
pure (R
N
, /
N
, m
N
), otterremo lintegrale di Lebesgue 1-dimensionale o N-
dimensionale.
Cominciamo allora col denire lintegrale per le funzioni semplici. Ricordia-
mo che, in base allesempio 3.1.4 (2), ogni funzione semplice si pu`o scrivere
in modo canonico come
=
n

i=0

A
i
, A
i
= x X : (x) =
i
,
dove gli
i
sono i valori non nulli assunti da ; in particolare gli A
i
sono
elementi disgiunti di T e la loro unione `e tutto X.
Per introdurre lintegrale, bisogner`a distinguere tra funzioni di segno co-
stante (sicuramente integrabili) e di segno variabile (non necessariamente
integrabili).
Denizione 4.1.1 Sia o, e sia

n
i=0

A
i
la sua rappresentazione
canonica (con A
i
= x X : (x) =
i
).
Se 0, l integrale di su X rispetto e alla misura `e il numero non
negativo (eventualmente +)
_
X
d =
n

i=0

i
(A
i
)
69
(si ricordi la convenzione 0 = 0).
Se assume anche valori negativi, posto

+
= max, 0,

= min, 0,
diciamo che `e integrabile su X (rispetto a ) se almeno uno fra i due
integrali
_
X

+
d,
_
X

d `e nito; in tal caso lintegrale di rispetto alla


misura `e
_
X
d =
_
X

+
d
_
X

d.
(In particolare, le funzioni semplici non negative sono sempre integrabili.)
Se entrambi gli integrali
_
X

+
d,
_
X

d sono niti, diciamo che `e


sommabile su X (rispetto a ).
Osservazioni 4.1.2 (1) Una funzione semplice `e sommabile su X se e
solo se si ha o
0
, ossia `e nulla al di fuori di un insieme di misura
nita. Infatti, sia

n
i=0

A
i
la rappresentazione canonica di : se `e
sommabile, allora tutti gli A
i
relativi a valori
i
,= 0 devono avere misura
nita, altrimenti ci sarebbe un addendo innito nella somma

n
i=0

i
(A
i
).
Viceversa, `e chiaro che se tutti gli A
i
relativi ad
i
,= 0 hanno misura nita
allora `e sommabile.
(2) Se o
0
, e se

m
j=0

B
j
`e una qualunque rappresentazione della
funzione tale che
j
R e B
j
T, con (B
j
) < allorche
j
,= 0, allora
si ha
m

j=0

j
(B
j
) =
_
X
d
(esercizio 4.1.1); dunque lintegrale di funzioni di o
0
non dipende dal modo
in cui si rappresenta la funzione come combinazione lineare di funzioni carat-
teristiche di insiemi di misura nita. Si noti che questo non `e vero se si toglie
la condizione che gli insiemi abbiano misura nita: ad esempio in (R, /, m)
possiamo scrivere

[0,1]
=
[0,[

]1,[
e benche risulti
_
R

[0,1]
dm = 1, la somma m([0, [) m(]1, [) non ha
senso.
Lemma 4.1.3 Siano , o non negative. Allora
70
(i) per ogni R si ha
_
X
() d =
_
X
d;
(ii) risulta
_
X
( +) d =
_
X
d +
_
X
d.
Dimostrazione (i) Se 0 `e unovvia conseguenza della denizione 4.1.1;
se < 0, basta osservare che ()
+
= [[

e ()

= [[
+
.
(ii) Siano

n
i=0

A
i
e

m
j=0

B
j
le rappresentazioni canoniche di e
; sia inoltre

p
h=0

E
h
la rappresentazione canonica di + (in par-
ticolare, si ha X =

n
i=0
A
i
=

m
j=0
B
j
=

p
h=0
E
h
). A ciascun valore
h
,
h = 0, 1, . . . , p, corrisponde una coppia, non necessariamente unica, di indici
(i, j) (con i 0, 1, . . . , n e j 0, 1, . . . , m) tale che
h
=
i
+
j
. Detto
F
h
linsieme di tali coppie di indici, si ha (i, j) F
h
se e solo se
h
=
i
+
j
;
quindi si pu`o scrivere
E
h
= x X : (x) +(x) =
h
=
_
(i,j)F
h
A
i
B
j
,
da cui
(E
h
) =

(i,j)F
h
(A
i
B
j
).
Si deduce allora, per ladditivit`a della misura ,
_
X
( +) d =
p

h=0

h
(E
h
) =
p

h=0

(i,j)F
h
(
i
+
j
)(A
i
B
j
) =
=
n

i=0
m

j=0

i
(A
i
B
j
) +
m

j=0
n

i=0

j
(A
i
B
j
) =
=
n

i=0

i
(A
i
) +
m

j=0

j
(B
j
) =
_
X
d +
_
X
d.
Esercizi 4.1
1. Si verichi che se o
0
, e se risulta
(x) =
r

i=0

A
i
(x) =
s

j=0

B
j
(x), x X,
71
con (A
i
) < e (B
j
) < allorche
i
,= 0 e
j
,= 0, allora
r

i=0

i
(A
i
) =
s

j=0

j
(B
j
),
cosicche lintegrale di una funzione semplice `e indipendente dalla rap-
presentazione usata per descriverla.
[Traccia: si osservi che se i B
j
sono disgiunti la verica `e facile.
Altrimenti, risulta
s
_
j=0
B
j
=
s
_
h=1
_
0i
1
<...<i
h
s
C
i
1
,...,i
h
, C
i
1
,...,i
h
=
h

q=1
B
iq

_
j,=i
1
,...,i
h
B
j
;
si provi che i C
i
1
,...,i
h
sono disgiunti e che C
i
1
,...,i
h
B
j
= se j ,=
i
1
, . . . , i
h
, e se ne deduca che
s

j=0

j
(B
j
) =
s

h=1

j,=i
1
,...,i
h
s

j=0

j
(C
i
1
,...,i
h
B
j
) =
=
s

h=1

j,=i
1
,...,i
h
h

p=1

ip
(C
i
1
,...,i
h
).
Da qui si ricavi luguaglianza cercata.]
2. Siano
n
(x), x R, le funzioni introdotte nellesercizio 3.1.7. Si calcoli
per ogni n N
+
lintegrale
_
R

[0,1]
dm,
ove m `e la misura di Lebesgue.
3. Sia W [0, 1] un insieme non misurabile secondo Lebesgue. Posto
= sup
__
1
0
dm, o, 0
W
_
,
si provi che:
(i) = supm(E) : E /, E W;
(ii) m

(W) = infm(F) : F /, F W > ;


(iii) m

(W) +m

([0, 1] W) > 1.
72
4.2 Integrale di funzioni misurabili
Estenderemo ora lintegrale ad una vasta sottoclasse delle funzioni misurabili.
In tutto il discorso che segue (X, T, ) `e un ssato spazio misurato.
Denizione 4.2.1 Sia f /
X
. Se f 0, l integrale di f su X rispetto
alla misura `e il numero (eventualmente +)
_
X
f d = sup
__
X
d : o, 0 f
_
.
Se f assume anche valori negativi, posto
f
+
= maxf, 0, f

= minf, 0,
diciamo che f `e integrabile su X (rispetto a ) se almeno uno fra i due
integrali
_
X
f
+
d,
_
X
f

d `e nito; in tal caso lintegrale di f rispetto alla


misura `e
_
X
f d =
_
X
f
+
d
_
X
f

d.
(In particolare, le funzioni misurabili non negative sono sempre integrabili.)
Se entrambi gli integrali
_
X
f
+
d,
_
X
f

d sono niti, diciamo che f `e


sommabile su X (rispetto a ).
Denizione 4.2.2 Sia D T, sia f /
D
. Diciamo che f `e integrabile
su D rispetto alla misura se, estesa f in modo arbitrario su tutto X, la
funzione f
D
`e integrabile su X; in tal caso si pone
_
D
f d =
_
X
f
D
d.
Se tale integrale `e nito, si dice che f `e sommabile su D (rispetto a ).
Denoteremo con /
1
(D, T, ), o semplicemente con /
1
(D), linsieme delle
funzioni sommabili su D.
Osservazioni 4.2.3 (1) Per le funzioni o, la denizione 4.2.1 `e in
accordo con la denizione 4.1.1.
(2) Se f `e non negativa e sommabile su X, allora
_
X
f d = sup
__
X
d : o
0
, 0 f
_
73
(esercizio 4.2.9).
(3) Se f `e una funzione misurabile su X, e se B T con (B) = 0, allora f
`e integrabile su B e
_
B
f d = 0. Infatti, per denizione, gli integrali su B di
f
+
e f

sono entrambi nulli in quanto ogni funzione semplice non negativa


su B ha integrale nullo su B.
(4) Se f non `e misurabile, la quantit`a introdotta nella denizione 4.2.1 ha
ancora senso, ma non gode di buone propriet`a (si veda lesercizio 4.2.16).
Analizziamo le propriet`a dellintegrale appena denito.
Proposizione 4.2.4 Sia D T, siano f, g integrabili su D. Valgono i
seguenti fatti:
(i) (monotonia) se f g, allora
_
D
f d
_
D
g d;
(ii)

_
D
f d

_
D
[f[ d;
(iii) (omogeneit`a)
_
D
f d =
_
D
f d per ogni R.
Dimostrazione (i) Se si ha 0 f g, la tesi `e facile conseguenza delle
denizioni 4.2.1 e 4.2.2. Nel caso generale, si osservi che da f g segue
f

e f
+
g
+
; dunque, per il caso precedente,
_
D
f
+
d
_
D
g
+
d,
_
D
f

d
_
D
g

d.
Sommando le due disuguaglianze, per ipotesi non si ottiene mai (),
cosicche si deduce la tesi.
(ii) Ovvia conseguenza di (i).
(iii) Se 0 e f 0, la tesi segue facilmente dalle denizioni 4.2.1 e 4.2.2
e dal lemma 4.1.3; se 0 e f `e arbitraria, scrivendo f = f
+
f

e osser-
vando che (f)

= f

, la tesi segue utilizzando la parte gi`a dimostrata. Se


0, basta applicare nuovamente la denizione di integrale, tenendo conto
del fatto che (f)
+
= [[f

e (f)

= [[f
+
.
Prima di dimostrare ladditivit`a - e quindi la linearit`a - dellintegrale, pro-
viamo che lintegrale `e numerabilmente additivo rispetto allinsieme di inte-
grazione:
74
Proposizione 4.2.5 Sia f una funzione integrabile su X. Se A
n

nN
`e una
famiglia di insiemi misurabili fra loro disgiunti, allora posto A =

nN
A
n
si
ha _
A
f d =

nN
_
An
f d.
Osservazione 4.2.6 Si noti che, essendo ovviamente
_

f d = 0 per ogni f
integrabile, nel caso in cui f 0 questa proposizione ci dice che la funzione
di insieme
(E) =
_
E
f d, E T,
`e una misura denita sulla -algebra T.
Dimostrazione della proposizione 4.2.5 Se f =
E
, con E T, la tesi
segue dalla denizione 4.1.1 e dalla numerabile additivit`a di . Se f o e
f 0, il risultato segue allo stesso modo.
Sia ora f misurabile e non negativa e supponiamo dapprima che f sia som-
mabile su A. Fissato > 0, dalla denizione 4.2.2 segue che esiste o
tale che 0 f
A
e
_
A
d =
_
X
d >
_
X
f
A
d .
Poiche, per quanto gi`a dimostrato,
_
A
d =

nN
_
An
d,
si deduce, essendo 0
An
f
An
, che
_
A
f d =
_
X
f
A
d <

nN
_
An
d +

nN
_
An
f d +,
e dallarbitrariet`a di segue
_
A
f d

nN
_
An
f d.
Proviamo ora la disuguaglianza opposta. Per ogni > 0 e n N, esiste

n
o tale che 0
n
f
An
e
_
X

n
d >
_
An
f d

2
n+1
;
75
posto, per ogni N N,
N
=

N
n=0

n
, grazie al lemma 4.1.3 si ha
N
o
e 0
N
f
A
; ne segue
N

n=0
_
X

n
d =
_
X

N
d
_
X
f
A
d =
_
A
f d,
da cui
_
A
f d >
N

n=0
__
An
f d

2
n+1
_
>
N

n=0
_
An
f d .
Per N si ha allora
_
A
f d

n=0
_
An
f d > 0,
cio`e _
A
f d

nN
_
An
f d.
Ci` o conclude la dimostrazione nel caso in cui f `e non negativa e sommabile
su A. Il caso in cui f 0 e
_
A
f d = + `e analogo (ssato M > 0, basta
selezionare o tale che 0 f
A
e
_
X
d > M, e poi procedere
come prima).
Inne se f `e unarbitraria funzione integrabile, basta applicare la parte gi`a
dimostrata a f
+
e f

e poi sottrarre le uguaglianze ottenute (una delle quali


`e sicuramente tra quantit`a nite).
Osservazione 4.2.7 Dalla precedente proposizione segue questa utile pro-
priet`a: se g `e integrabile su D e f `e una funzione misurabile su D tale
che f(x) = g(x) q.o. in D, ove D T, allora f `e integrabile su D e
_
D
f d =
_
D
g d. Infatti, posto B = x D : f(x) ,= g(x), si ha B T e
(B) = 0; quindi, scrivendo D = (D B) B e utilizzando la proposizione
4.2.5 si ottiene
_
D
f
+
d =
_
D\B
f
+
d +
_
B
f
+
d =
_
D\B
g
+
d +
_
B
f
+
d;
poiche, per losservazione 4.2.3,
_
B
f
+
d =
_
B
g
+
d = 0, si deduce
_
D
f
+
d =
_
D\B
g
+
d =
_
D
g
+
d.
76
Analogamente,
_
D
f

d =
_
D\B
g

d =
_
D
g

d,
da cui, essendo g integrabile su D, la tesi.
Proposizione 4.2.8 Sia D T, siano f, g integrabili su D. Vale la seguen-
te propriet`a:
(additivit`a) se non si ha
_
D
f d =
_
D
g d = , allora
_
D
(f +g) d =
_
D
f d +
_
D
g d.
Notiamo che in eetti f +g non `e denita sullinsieme
N = x D : f(x) = g(x) =
il quale, per ipotesi, ha misura nulla (si veda anche lesercizio 4.2.7). Quindi,
ponendo ad esempio f + g = 0 su N, nellintegrale a primo membro si pu`o
sostituire D con DN senza alterarne il valore, in virt` u dellosservazione pre-
cedente. Si osservi anche che, combinando questo risultato con la propriet`a
di omogeneit`a (proposizione 4.2.4), si ottiene che lintegrale `e unapplicazione
lineare: _
D
(f +g) d =
_
D
f d +
_
D
g d,
purche naturalmente siano ben deniti i due membri.
Dimostrazione Proveremo la tesi distinguendo vari casi.
I - f, g 0. Siano , o tali che 0 f
D
, 0 g
D
: allora
0 + (f +g)
D
e dunque, per il lemma 4.1.3,
_
X
d +
_
X
d =
_
X
( +) d
_
D
(f +g) d;
per larbitrariet`a di e si ottiene
_
D
f d +
_
D
g d
_
D
(f +g) d.
Per provare laltra disuguaglianza, introduciamo gli insiemi misurabili
D
m
= x D : m f(x) +g(x) < m + 1, m N
+
,
77
D

= x D : f(x) +g(x) = +,
D
m
=
_
x D :
1
m+ 1
f(x) +g(x) <
1
m
_
, m N
+
,
D

= x D : f(x) +g(x) = 0.
Fissiamo ]0, 1[ e scegliamo o tale che 0 (f +g)
D
. Siano poi

n
e
n
due successioni di funzioni semplici, costruite con la procedu-
ra descritta nella proposizione 3.1.7, convergenti puntualmente alle funzioni
f
D
e g
D
rispettivamente. Per losservazione 3.1.8, la convergenza delle
n
e delle
n
`e uniforme in ciascuno degli insiemi D
m
e D
m
(m ,= ). Dunque,
poiche
(f +g) (1 )(f +g) (1 )m in D
m
,
(f +g) (1 )(f +g)
1
m+ 1
in D
m
,
< f +g = + in D

,
= f +g = 0 in D

,
per ogni m N
+
esiste
m
N tale che per qualunque n
m
risulta
(f +g) (1 )m
n
+
n
f +g in D
m
,
(f +g)
1
m+ 1

n
+
n
f +g in D
m
,

n
+
n
< + = f +g in D

,
=
n
+
n
= 0 = f +g in D

.
Per ladditivit`a dellintegrale sulle funzioni semplici non negative e per la
monotonia, si ricava per ogni m N
+

_
D
m
d
_
D
m
(
n
+
n
) d =
=
_
D
m

n
d +
_
D
m

n
d
_
D
m
f d +
_
D
m
g d,
_
Dm
d
_
Dm
(
n
+
n
) d =
=
_
Dm

n
d +
_
Dm

n
d
_
Dm
f d +
_
Dm
g d,
78
cio`e _
D
m
d
_
D
m
f d +
_
D
m
g d m N
+
,
_
Dm
d
_
Dm
f d +
_
Dm
g d m N
+
.
Sommiamo rispetto a m N
+
: dato che
D =
_
_
mN
+
D
m
_
D

_
_
mN
+
D
m
_
D

,
per la proposizione 4.2.8 si deduce
_
X
d =
_
D
d
_
D
f d +
_
D
g d,
e per larbitrariet`a di ,

_
D
(f +g) d
_
D
f d +
_
D
g d.
Per 1

si ottiene la disuguaglianza cercata.


II - f, g 0. In questo caso basta applicare il risultato del caso I alle
funzioni f, g e poi usare lomogeneit`a.
Prima di passare agli altri casi, osserviamo che f +g `e sicuramente integrabile
su D: infatti si ha (f +g)
+
f
+
+g
+
e (f +g)

+g

, e daltra parte,
per ipotesi e per la parte I gi`a dimostrata, una almeno fra le funzioni f
+
+g
+
e f

+g

`e sommabile su D.
III - f 0, g 0. In questo caso una almeno tra f e g `e sommabile.
Deniamo
S
+
= x D : f(x) +g(x) 0, S

= x D : f(x) +g(x) < 0 :


dato che f
S
= (f +g)
S
+(g)
S
, per le parti I e II gi`a dimostrate si
ha _
S
+
f d =
_
S
+
(f +g) d
_
S
+
g d,
_
S

g d =
_
S

(f +g) d
_
S

f d.
79
Supponiamo ora che, ad esempio, sia sommabile la f. Aggiungiamo ai due
membri delle uguaglianze precedenti rispettivamente le quantit`a
_
S
+
f d e
_
S

f d, e sottraiamo poi nella prima la quantit`a


_
S
+
(f +g) d (che `e nita
essendo 0 f +g f su S
+
), Si ottiene
_
S
+
f d +
_
S
+
g d =
_
S
+
(f +g) d =
_
D
(f +g)
+
d,
_
S

f d +
_
S

g d =
_
S

(f +g) d =
_
D
(f +g)

d.
A queste stesse uguaglianze si arriva supponendo sommabile g in luogo di f.
Sommando le due equazioni (il che `e lecito perche f +g `e integrabile) si ha,
grazie alla proposizione 4.2.8, la tesi.
Notiamo che se `e f 0 e g 0, anziche f 0 e g 0, si ottiene la tesi
scambiando i ruoli di f e di g.
IV - f, g di segno qualunque. Poniamo
F
+
= x D : f(x) 0, F

= x D : f(x) < 0,
G
+
= x D : g(x) 0, G

= x D : g(x) < 0,
e decomponiamo X nellunione disgiunta
X = (F
+
G
+
) (F
+
G

) (F

G
+
) (F

).
Su ciascuno di tali quattro insiemi vale la relazione di additivit`a richiesta, in
virt` u dei passi precedenti; quindi, tenuto conto dellintegrabilit`a di f +g, la
tesi segue grazie alla proposizione 4.2.8.
Osservazione 4.2.9 Se f `e una funzione misurabile su X, allora [f[ `e inte-
grabile su ogni D T e si ha
_
D
[f[ d =
_
D
f
+
d +
_
D
f

d.
Infatti [f[ = f
+
+ f

, quindi la tesi segue dalladditivit`a dellintegrale (pro-


posizione 4.2.8).
80
Esercizi 4.2
1. Sia f : R R cos` denita:
f(x) =
_

_
0 se x Q
n se x / Q e la sua prima cifra decimale
non nulla `e la n-sima.
Si provi che f `e misurabile rispetto alla misura di Lebesgue e si calcoli
lintegrale
_
R
f
[0,1]
dm.
2. Si verichi che se f `e sommabile su X, allora f `e sommabile su D per
ogni D T.
3. Si verichi che se D T e f /
D
, allora f `e sommabile su D se e
solo se lo `e [f[.
4. Si provi che se f `e una funzione denita in [a, b], misurabile secondo
Lebesgue e Riemann-integrabile in [a, b], allora f `e sommabile in [a, b].
5. Siano A, B T con (B) = 0. Si provi che se f `e integrabile su X,
allora _
A
f d =
_
AB
f d.
6. Sia D T e sia f misurabile su D. Se esiste una funzione g, sommabile
su D, tale che [f[ g q.o. in D, si provi che anche f `e sommabile su
D e che _
D
[f[ d
_
D
g d.
7. Sia D T e sia f sommabile su D. Si dimostri che
(x D : [f(x)[ = +) = 0.
8. Sia D T e sia f misurabile su D. Si provi che
_
D
[f[ d = 0 se e solo
se f = 0 q.o. in D.
81
9. Se f `e sommabile su X e f 0, si verichi che
_
X
f d = sup
__
X
d : o
0
, 0 f
_
;
utilizzando la funzione
]0,[
nello spazio misurato (R, T, m), ove m `e
la misura di Lebesgue e T `e la -algebra denita da
T = /
],0]
E / : E = A]0, [, A /
],0]
,
si provi che lenunciato precedente non vale se f `e soltanto integrabile.
10. Se (X, T, ) `e uno spazio misurato -nito, si provi che per ogni fun-
zione f non negativa ed integrabile su X si ha
_
X
f d = sup
__
X
d : o
0
, 0 f
_
.
11. Se f `e sommabile su X (oppure (X, T, ) `e uno spazio misurato -
nito) e f 0, si verichi che
_
X
f d = inf
__
X
d : o
0
, 0 f
_
.
12. Sia f sommabile su X; si provi che linsieme x X : f(x) ,= 0 `e
-nito, cio`e `e unione numerabile di insiemi misurabili A
n
A
n+1
di
misura nita.
13. Sia f misurabile e q.o. nita su X, con (X) < . Posto, per ogni
n N
+
, E
n
= x X : n 1 [f(x)[ < n, si provi che f `e
sommabile se e solo se la serie

n=1
n (E
n
) `e convergente. Che succede
se (X) = +?
14. Sia f sommabile su X. Posto, per ogni n N, F
n
= x X : [f(x)[ >
n, si provi che risulta lim
n
n(F
n
) = 0.
`
E vero il viceversa?
15. Sia (X, T, ) uno spazio misurato con (X) < . Si denisca linsieme
M = f : X R : f `e misurabile e q.o. nita
82
e si consideri linsieme quoziente M
0
= M/ , ove
f g f = g q.o. in X.
Posto
d(f, g) =
_
X
[f g[
1 +[f g[
d, f, g M
0
,
si provi che:
(i) d `e una distanza su M
0
e (M
0
, d) `e uno spazio metrico completo;
(ii) si ha d(f
n
, f) 0 se e solo se f
n
f in misura.
16. Si mostri che la denizione 4.2.1 `e applicabile anche a funzioni non
misurabili, ma che in tal caso lintegrale non `e necessariamente additivo.
[Traccia: si considerino f =
W
e g =
[0,1]\W
, con W [0, 1] non
misurabile secondo Lebesgue, e si applichi lesercizio 4.1.3.]
4.3 Passaggio al limite sotto il segno di inte-
grale
Una delle pi` u importanti caratteristiche della teoria dellintegrazione che stia-
mo esponendo `e il fatto di poter scambiare fra loro le operazioni di limite e
di integrazione sotto ipotesi molto blande. Il primo risultato di questo tipo
riguarda successioni crescenti di funzioni non negative, ed `e di grande impor-
tanza perche si applica in modo naturale alle serie di funzioni assolutamente
convergenti.
Teorema 4.3.1 (di B. Levi, o della convergenza monotona) Sia (X,
T, ) uno spazio misurato, e sia f
n

nN
una successione di funzioni mi-
surabili denite su X, tali che 0 f
n
f
n+1
per ogni n N. Posto
f(x) = lim
n
f
n
(x), si ha
lim
n
_
X
f
n
d =
_
X
f d.
Osserviamo che il risultato `e falso se si sopprime qualcuna delle ipotesi. Ad
esempio, in (R, /, m) le funzioni f
n
=
[n,[
formano una successione
crescente ma non positiva, e risulta
_
X
f
n
d = n N,
_
X
lim
n
f
n
d = 0;
83
invece le funzioni f
n
=
[n,n+1]
sono non negative ma non formano una
successione crescente, e risulta
_
X
f
n
d = 1 n N,
_
X
lim
n
f
n
d = 0.
Dimostrazione () Evidente conseguenza della monotonia dellintegrale
(proposizione 4.2.4).
() Fissiamo o tale che 0 f, e sia ]0, 1[. Gli insiemi
A
n
= x X : f
n
(x) (x) appartengono a T, si ha A
n
A
n+1
e

nN
A
n
= X. Per monotonia ed omogeneit`a (proposizione 4.2.4) si ha per
ogni n N

_
An
d =
_
An
d
_
An
f
n
d
_
X
f
n
d.
Poiche, per losservazione 4.2.6, (E) =
_
E
d `e una misura, utilizzando la
proposizione 2.1.5 si ricava per n

_
X
d = lim
n
_
An
d lim
n
_
X
f
n
d ]0, 1[.
Passando al limite per 1

, si ottiene
_
X
d =
_
X
0
d lim
n
_
X
f
n
d o con 0 f,
da cui la tesi per denizione di integrale.
Se la successione di funzioni non negative non `e crescente, il teorema di B.
Levi non `e applicabile, ma vi `e comunque un criterio di passaggio al limite.
Proposizione 4.3.2 (lemma di Fatou) Sia (X, T, ) uno spazio misurato
e sia f
n

nN
una successione di funzioni misurabili e non negative. Allora
posto f(x) = liminf
n
f
n
(x), si ha
_
X
f d liminf
n
_
X
f
n
d.
Dimostrazione Si ha f = sup
n
inf
mn
f
m
; quindi, posto g
n
= inf
mn
f
m
,
la successione g
n

nN
verica le ipotesi del teorema di B. Levi. Ne segue,
essendo ovviamente g
n
f
n
,
_
X
f d = lim
n
_
X
g
n
d liminf
n
_
X
f
n
d.
84
Il pi` u importante teorema di passaggio al limite sotto il segno di integrale `e
per`o il seguente:
Teorema 4.3.3 (di Lebesgue o della convergenza dominata) Sia (X,
T, ) uno spazio misurato, e sia f
n

nN
una successione di funzioni misu-
rabili tali che:
(i) lim
n
f
n
(x) = f(x) per ogni x X;
(ii) [f
n
(x)[ g(x) per ogni x X, ove g `e una funzione sommabile su X.
Allora
lim
n
_
X
f
n
d =
_
X
f d.
Si osservi che la tesi del teorema si pu`o raorzare: in eetti si pu`o concludere
che lim
n
_
X
[f
n
f[ d = 0 (basta considerare le funzioni [f
n
f[ in luogo
delle f
n
, ed osservare che esse tendono puntualmente a 0 e sono dominate
dalla funzione sommabile 2g).
Dimostrazione Applichiamo il lemma di Fatou alle successioni g + f
n

e g f
n
, entrambe puntualmente convergenti e costituite da funzioni non
negative. Si ottiene
_
X
(g +f) d liminf
n
_
X
(g +f
n
) d =
_
X
g d + liminf
n
_
X
f
n
d,
_
X
(g f) d liminf
n
_
X
(g f
n
) d =
_
X
g d limsup
n
_
X
f
n
.
Sottraendo la quantit`a nita
_
X
g d, si ottiene
limsup
n
_
X
f
n
d
_
X
f d liminf
n
_
X
f
n
d,
cio`e la tesi.
Il teorema di Lebesgue ha anche una versione continua, di grande impor-
tanza nelle applicazioni.
Teorema 4.3.4 Sia (X, T, ) uno spazio misurato, sia t
0
R e sia f :
X R t
0
R una funzione tale che:
(i) f(, t) `e misurabile su X per ogni t R t
0
;
85
(ii) [f(x, t)[ g(x) per ogni x X e t R t
0
, con g sommabile su X;
(iii) lim
tt
0
f(x, t) = F(x) per ogni x X.
Allora
lim
tt
0
_
X
f(, t) d =
_
X
F d.
Dimostrazione Sia t
n

nN
Rt
0
unarbitraria successione che tende a
t
0
per n ; posto f
n
= f(, t
n
), la successione f
n
converge puntualmente
a F in X ed `e dominata dalla funzione sommabile g. Dunque per il teorema
di Lebesgue
lim
n
_
X
f(, t
n
) d =
_
X
F d.
Dallarbitrariet`a della successione t
n
segue la tesi.
Esempio 4.3.5 Sia f : R
2
R tale che:
(i) f(, t) `e sommabile su R per ogni t R;
(ii) f `e derivabile rispetto a t in ogni punto (x, t) R
2
;
(iii)

f
t
(x, t)

(x) per ogni (x, t) R


2
, ove `e una funzione sommabile
su R.
In queste ipotesi si ha, indicando con m
x
la misura di Lebesgue rispetto alla
variabile x,

d
dt
_
R
f(x, t) dm
x
=
_
R
f
t
(x, t) dm
x
.
Infatti, ssato t R, i rapporti incrementali
f
h
(x) =
f(x, t +h) f(x, t)
h
x R, h ,= 0,
vericano le ipotesi del teorema 4.3.4 perche, grazie al teorema del valor
medio,
[f
h
(x)[ =

f
t
(x,
t,x,h
)

(x) h ,= 0, x R,
con
t,x,h
compreso fra t e t +h; ne segue che
lim
h0
_
R
f
h
(x) dm
x
=
_
R
f
t
(x, t) dm
x
,
che `e quanto si voleva.
86
Esercizi 4.3
1. Dimostrare che il teorema di B. Levi `e ancora valido se si suppone che
per ogni n N le relazioni 0 f
n
f
n+1
siano vericate soltanto q.o.
in X.
2. Si provi questa generalizzazione del teorema 4.3.1: se le funzioni f
n
sono
misurabili e vericano f
n+1
f
n
g, ove g `e una funzione sommabile
su X, allora posto f(x) = lim
n
f
n
(x), si ha
lim
n
_
X
f
n
d =
_
X
f d.
3. Sia f
n

nN
una successione di funzioni misurabili e non negative su
X. Si provi che

n=0
_
X
f
n
d =
_
X

n=0
f
n
d.
4. Dimostrare che il lemma di Fatou ed il teorema di Lebesgue sono ancora
validi supponendo che per ogni n N la relazione puntuale richiesta
per f
n
sia vericata soltanto q.o. in X, anziche per ogni x X.
5. Esibire una successione f
n
di funzioni misurabili tale che
_
X
liminf
n
f
n
d < liminf
n
_
X
f
n
d < limsup
n
_
X
f
n
d <
_
X
limsup
n
f
n
d.
[Traccia: per ogni n N si ponga f
2n+1
=
[1/3,1]
, f
2n+2
=
[0,1/3]
.]
6. Sia f
n
una successione di funzioni integrabili su X, tale che:
(i) f
n
(x) f(x) q.o. in X per n ;
(ii) [f
n
(x)[ g
n
(x) q.o. in X per ogni n N;
(iii) g
n
(x) g(x) q.o. in X per n ;
(iv) g
n
e g sono sommabili su X e
_
X
g
n
d
_
X
g d per n .
Si provi che
lim
n
_
X
f
n
d =
_
X
f d.
87
7. Sia f
n
una successione di funzioni misurabili su X. Se

n=0
_
X
[f
n
[ d < ,
si provi che

n=0
f
n
`e sommabile su X e che
_
X

n=0
f
n
d =

n=0
_
X
f
n
d.
8. Sia (X, T, ) uno spazio misurato. Se f `e sommabile su X, si provi che
lim
n
_
X
[f[
1/n
d = (x X : f(x) ,= 0).
9. Si provi che se f
n
`e una successione di funzioni sommabili tale che
_
X
[f
n
f[ d 0, allora f
n
f in misura.
`
E vero il viceversa?
10. (Teorema di Severini-Egorov con convergenza dominata) Sia f
n
una
successione di funzioni misurabili su X, tali che f
n
(x) f(x) q.o. in X,
e supponiamo che esista g sommabile su X per cui risulti [f
n
(x)[ g(x)
q.o. in X per ogni n N. Si provi che per ogni > 0 esiste un insieme
misurabile E con (E) < , tale che f
n
f uniformemente in E
c
per
n .
[Traccia: si ripeta, con le modiche necessarie, la dimostrazione del
teorema 3.4.2.]
11. (Lemma di Fatou per la convergenza in misura) Sia f
n
una succes-
sione di funzioni misurabili e q.o. nite su X, con f
n
0 q.o.; si provi
che se f
n
f in misura, allora
0
_
X
f d liminf
n
_
X
f
n
.
[Traccia: per assurdo, usando la denizione di minimo limite, si tro-
ver`a una sottosuccessione di f
n
, dalla quale si estrarr`a unulteriore
sottosuccessione a cui applicare il lemma di Fatou . . . ]
12. Si provi che se f
n
f in misura, e se esiste una funzione sommabile g
tale che [f
n
[ g q.o., allora
_
X
[f
n
f[ d 0.
[Traccia: si applichi lesercizio precedente a 2g [f
n
f[.]
88
13. Sia T
t

t[0,1]
una famiglia di -algebre di sottoinsiemi di un ssato
insieme X. Per ogni t [0, 1], sia
t
una misura su (X, T
t
); posto
T =

t[0,1]
T
t
, supponiamo che per ogni E T la funzione t
t
(E)
sia misurabile secondo Lebesgue.
(i) Si provi che la funzione
(E) =
_
1
0

t
(E) dt
`e una misura su (X, T);
(ii) si descriva esplicitamente la misura nei casi seguenti:
(a) X = [0, 1], T
t
= /,
t
= misura di Dirac concentrata nel
punto t,
(b) X = [0, 1], T
t
= /,
t
(E) = m(E [0, t]).
4.4 Confronto fra integrale di Riemann ed
integrale di Lebesgue
Consideriamo lo spazio misurato (R, /, m). Come suggerisce lesercizio
4.2.4, sembra esserci una relazione fra lintegrabilit`a secondo Riemann e la
sommabilit`a secondo Lebesgue: come vedremo subito, la prima implica la se-
conda e lintegrale di Riemann di una funzione, se esiste, coincide con quello
di Lebesgue. Ci`o, fra laltro, ci permetter`a di dire che il calcolo esplicito di
un integrale di Lebesgue, quando `e possibile, si fa esattamente come siamo
da sempre abituati a fare. Questo paragrafo `e dedicato al confronto tra le
due nozioni di integrale, compreso il caso degli integrali di Riemann impro-
pri; daremo anche una caratterizzazione delle funzioni Riemann integrabili
in termini della misura di Lebesgue.
Indicheremo con 1(a, b) linsieme delle funzioni Riemann integrabili sullin-
tervallo [a, b] R, e con /
1
(a, b) quello delle funzioni Lebesgue sommabili su
[a, b]; denoteremo rispettivamente con
_
b
a
f(x) dx,
_
b
a
f dm
gli integrali di f su [a, b] secondo Riemann e secondo Lebesgue.
Per quanto riguarda lintegrale di Riemann su un intervallo, vale il seguente
risultato:
89
Proposizione 4.4.1 Se f 1(a, b), allora f /
1
(a, b) e
_
b
a
f dm =
_
b
a
f(x) dx;
viceversa, esistono funzioni sommabili su [a, b] che non sono Riemann inte-
grabili su [a, b].
Dimostrazione La funzione
Q
`e sommabile in ogni [a, b] R, con inte-
grale nullo, ma non `e Riemann integrabile su alcun intervallo di ampiezza
positiva.
Dimostriamo lenunciato principale. Sia f 1(a, b): proviamo per pri-
ma cosa che f `e misurabile (rispetto alla misura di Lebesgue). Anzitutto
osserviamo che per ogni funzione costante a tratti e nulla fuori di [a, b],
=
k

i=1

I
i
, I
i
[a, b] intervalli disgiunti,
lintegrale di Riemann e quello di Lebesgue su [a, b] coincidono:
_
b
a
(x) dx =
_
b
a
dm =
k

i=1

i
m(I
i
).
Per denizione, poi, f `e limitata in [a, b] e si ha
_
b
a
f(x)dx = sup
__
b
a
dm : costante a tratti, f in [a, b]
_
=
= inf
__
b
a
dm : costante a tratti, f in [a, b]
_
.
Quindi esistono due successioni
n
,
n
di funzioni costanti a tratti tali
che
n
f
n
in [a, b] e
_
b
a
(
n

n
) dm <
1
n
per ogni n N
+
. Inoltre si
pu` o supporre che
n

n+1
e
n

n+1
per ogni n (rimpiazzando
n
con
max
kn

k
e
n
con min
kn

k
).
Deniamo ora
= sup
n

n
= lim
n

n
= inf
n

n
= lim
n

n
.
Le funzioni e sono misurabili (proposizione 3.1.6), e si ha f ;
dimostriamo che = q.o. in [a, b].
90
Poiche 0
n

n
per ogni n N
+
, per la monotonia dellintegrale
deduciamo
0
_
b
a
( ) dm
1
n
n N
+
;
quindi , essendo non negativa ed avendo integrale nullo, `e q.o. nulla in
[a, b] per lesercizio 4.2.7.
Pertanto abbiamo = f = q.o. in [a, b]: dunque f coincide q.o. con
una funzione misurabile e quindi, in virt` u della completezza della misura di
Lebesgue, `e essa stessa misurabile (osservazione 3.2.2).
Poich`e f `e limitata in [a, b], f `e sommabile su [a, b]. Inoltre, per la monotonia
dellintegrale, per ogni coppia di funzioni costanti a tratti , , tali che
f in [a, b], risulta
_
b
a
dm
_
b
a
f dm
_
b
a
dm;
ne segue, per denizione di integrale di Riemann,
_
b
a
f(x) dx
_
b
a
f dm
_
b
a
f(x) dx.
il che prova che gli integrali di Riemann e di Lebesgue di f coincidono.
Per quanto riguarda gli integrali di Riemann impropri, la situazione `e meno
facile. Ci limiteremo per semplicit`a a trattare il caso di integrali impropri su
[0, [; indicheremo con 1

(0, ) la classe delle funzioni che sono Riemann


integrabili in senso improprio su tale semiretta: per denizione, si ha f
1

(0, ) se e solo se f 1(a, b) per ogni [a, b] [0, [ ed esiste nito il


limite
lim
b+
_
b
0
f(x) dx,
il quale denisce appunto lintegrale improprio
_

0
f(x) dx.
Proposizione 4.4.2 (i) Se f /
1
(0, ), allora in generale f / 1

(0, ).
(ii) Se f /
1
(0, ), e se f 1(a, b) per ogni [a, b] [0, [, allora f
1

(0, ) e
_

0
f(x) dx =
_

0
f dm .
91
(iii) Se f 1

(0, ) allora in generale f / /


1
(0, ).
(iv) Se f, [f[ 1

(0, ) allora f /
1
(0, ) e
_

0
f dm =
_

0
f(x) dx.
Dimostrazione (i) La funzione
Q
`e sommabile su [0, [ con integrale
nullo, e non appartiene a 1

(0, ).
(ii) La funzione f `e sommabile su [0, [, e poiche per ipotesi essa `e anche
Riemann integrabile su ogni [a, b] [0, [, dalla proposizione 4.4.1 segue che
_
b
0
f(x)dx =
_
b
0
f dm b > 0.
Passiamo al limite per b +: per ogni x > 0 si ha
lim
b+
f(x)
[0,b]
(x) = f(x)
[0,+[
(x),
ed inoltre
[f(x)
[0,b]
(x) [f(x)[ x > 0;
quindi dalla sommabilit`a di f e dal teorema 4.3.4 segue che

_

0
f(x) dx =
_

0
f dm,
da cui la tesi.
(iii) La funzione
f(x) =
_
sin x
x
se x 0
1 se x = 0
`e continua su [0, [; inoltre, come si sa, f 1

(0, ) mentre [f[ / 1

(0, ).
Ne segue che f non `e sommabile su [0, [: infatti se fosse f /
1
(0, ),
avremmo anche [f[ /
1
(0, ), e allora da (ii) seguirebbe [f[ 1

(0, ),
cosa che non `e vera.
(iv) Se f, [f[ 1

(0, ), allora in particolare f, [f[ 1(a, b) per ogni


[a, b] [0, [; dalla proposizione 4.4.1 segue allora che f
[a,b]
`e misurabile
per ogni [a, b] [0, [, e quindi f, essendo il limite puntuale di f
[0,n]
per
92
n , `e misurabile. Inoltre, applicando il teorema di B. Levi (teorema
4.3.1) alla successione [f[
[0,n]
, si ottiene
_

0
[f[ dm = lim
n
_
n
0
[f[ dm = lim
n
_
n
0
[f(x)[ dx =
_
+
0
[f(x)[ dx.
In particolare, tale integrale `e nito e pertanto [f[ `e sommabile su [0, [. Di
conseguenza f `e sommabile su [0, [ ed applicando (ii) si ottiene la tesi.
`
E possibile caratterizzare, tramite la misura di Lebesgue, le funzioni di
/
1
(a, b) che appartengono alla sottoclasse 1(a, b). Si ha infatti:
Proposizione 4.4.3 Sia f : [a, b] R una funzione limitata. Si ha f
1(a, b) se e solo se linsieme dei punti di discontinuit`a di f `e misurabile
secondo Lebesgue ed ha misura nulla.
Dimostrazione (=) Sia f 1(a, b). Come abbiamo visto nella dimo-
strazione della proposizione 4.4.1, per ogni n N
+
esistono
n
,
n
costanti
a tratti in [a, b] tali che

n

n+1
f
n+1

n
in [a, b],
_
b
a
(
n

n
) dm <
1
n
,
ed inoltre, posto = sup
n

n
e = inf
n

n
, si ha f in [a, b] e
= f = q.o. in [a, b].
Deniamo ora
B = x [a, b] : n N
+
: x `e punto di discontinuit`a per
n
o per
n
,
P = x [a, b] : (x) < (x);
come si `e visto P ha misura nulla, ed anche B ha misura nulla essendo al pi` u
numerabile. Quindi
A B P / e m(A) = 0.
Dimostriamo che f `e discontinua al pi` u nei punti di A: ci`o prover`a la tesi.
Se x `e un punto di discontinuit`a per f, devono esistere > 0 e x
k

kN
tali
che
lim
k
x
k
= x, [f(x
k
) f(x)[ k N.
93
Per provare che x A, notiamo che se x B allora evidentemente x A;
se invece x / B, allora x `e punto di continuit`a per tutte le funzioni
n
,
n
.
Dato che tali funzioni sono costanti a tratti, ci`o implica che per ogni n N
+
esiste k
n
N tale che

n
(x
k
) =
n
(x),
n
(x
k
) =
n
(x) k k
n
.
Ne segue, ssando arbitrariamente n e scegliendo k k
n
,

n
(x)
n
(x) =
_

n
(x)
n
(x
k
) f(x) f(x
k
) se f(x
k
) f(x)

n
(x
k
)
n
(x) f(x
k
) f(x) se f(x
k
) f(x) +.
In entrambi i casi si deduce

n
(x)
n
(x) [f(x
k
) f(x)[ n N
+
,
e passando al limite per n otteniamo
(x) (x) + > (x).
Pertanto x P ed inne, come si voleva, x A.
(=) Sia f limitata in [a, b] e continua salvo che in un insieme di punti di
misura di Lebesgue nulla. Per ogni n N consideriamo la partizione
n
di
[a, b[ i cui nodi sono
x
i
= a +
i
2
n
(b a), i = 0, 1, . . . , 2
n
,
e poniamo I
in
= [x
i1
, x
i
[, i = 1, . . . , 2
n
; deniamo poi le seguenti funzioni
costanti a tratti:

n
=
2
n

i=1
inf
I
in
f
I
in
,
n
=
2
n

i=1
sup
I
in
f
I
in
.
Dato che, per ogni n,
n+1
`e pi` u ne di
n
, `e chiaro che
inf
[a,b[
f =
0

n

n+1
f
n+1

n

0
= sup
[a,b[
f .
Quindi, posto = sup
n

n
e = inf
n

n
, si ha per il teorema di Lebesgue
lim
n
_
b
a

n
dm =
_
b
a
dm, lim
n
_
b
a

n
dm =
_
b
a
dm,
94
da cui
lim
n
_
b
a
(
n

n
) dm =
_
b
a
( ) dm.
Osserviamo ora che se x `e un punto di continuit`a di f, allora deve essere
(x) = (x). Infatti, se f `e continua in x, ssato > 0 esiste > 0 tale che
[x
t
x[ < = [f(x
t
) f(x)[ <

2
;
allora, per n abbastanza grande, lunico intervallo I
in
a cui appartiene x `e
contenuto in ]x , x +[. Di conseguenza si ha, per n abbastanza grande,
x
t
I
in
= [f(x
t
) f(x)[ <

2
,
e dunque

n
(x)
n
(x) = sup
I
in
f inf
I
in
f

2
denitivamente.
Quindi, a maggior ragione,
0 (x) (x) < .
Poiche `e arbitrario, deve essere (x) = (x).
Per ipotesi, i punti di discontinuit`a di f formano un insieme di misura nulla:
ne segue, essendo f in [a, b],
= f = q.o. in [a, b],
cosicche f `e misurabile grazie alla completezza della misura di Lebesgue.
Inoltre
_
b
a
dm =
_
b
a
f dm =
_
b
a
dm,
ed in particolare
lim
n
_
b
a
(
n

n
) dm = 0.
Per denizione di integrale di Riemann si conclude che f 1(a, b) e
_
b
a
f(x) dx =
_
b
a
f dm.
95
Esercizi 4.4
1. Determinare una successione di funzioni f
n
denite in [0, 1], tali che:
(i) lim
n
f
n
(x) = 0 x [0, 1], (ii) lim
n
_
1
0
f
n
dm = 1.
2. Determinare una funzione f, sommabile su R, ed illimitata sul comple-
mentare di ogni compatto.
3. Si consideri la funzione di Eulero, gi`a incontrata nel teorema 2.6.1.
Si provi che `e una funzione di classe C

, ed anzi analitica, su ]0, [,


e che

(n)
(p) =
_

0
x
p1
(log x)
n
e
x
dx p > 0.
4. Si consideri la funzione
F(a) =
_
/2
0
dt
_
1 a sin
2
t
, 0 < a < 1.
(i) Si verichi che F `e di classe C

su ]0, 1[.
(ii) Si calcolino, se esistono, i limiti
lim
a0
+
F(a), lim
a1

F(a).
5. Sia
f
n
(x) =
_
n +x
n + 2x
_
n
, x [0, [.
Dimostrare che f
n
f
n+1
e calcolare lim
n
f
n
(x); dire inoltre se si
pu`o passare al limite sotto il segno di integrale nei due casi seguenti:
(i)
_

0
f
n
(x)e
x/2
dm, (ii)
_

0
f
n
(x)e
x/2
dm.
6. Dimostrare le seguenti uguaglianze:
(i)
_
1
0
x
p
1x
[ log x[ dx =

n=1
1
(n+p)
2
p > 1,
(ii)
_

0
sin x
e
x
t
dx =

n=0
t
n
1+(n+1)
2
t [1, 1],
96
(iii)
_
1
0
sin x log x dx =

n=1
(1)
n
2n(2n)!
,
(iv) lim
n
_
n
0
(1
x
n
)
n
x
p1
dx = (p) p > 0,
(v)
_
1
0

n=1
x
n1

n
dx =

n=1
1
n
3/2
,
(vi)
_

0
cos x
e
x
+1
dx =

n=1
(1)
n1 n
n
2
+1
,
(vii)
_

n=1
n
2
sin nx
a
n
dx =
2a(1+a
2
)
(a
2
1)
2
a > 1,
(viii)
_

0
e
x
cos

x dx =

n=0
(1)
n n!
(2n)!
,
(ix) lim
n
_

0
(1 +
x
n
)
n
x
1/n
dx = 1,
(x)
_
1
0
_
log x
1x
_
2
dx =

2
3
,
(xi)
_
1
0
(e
x
1)(log x +
1
x
) dx =

n=1
n
2
+n+1
(n1)!(n
2
+n)
2
,
(xii)
_
1
0
(xlog x)
2
1+x
2
dx = 2

n=0
(1)
n+1
(2n+1)
3
,
(xiii)
_

0
sinhax
sinh bx
dx =

n=0
2a
(2n+1)
2
b
2
a
2
b > a > 0,
(xiv)
_

0
e
x
2
sin x dx =

n=0
(1)
n
n!
2(2n+1)!
.
(xv)
1
k!
_
1
0
[ log x[
k
1+x
dx =

n=1
(1)
n1
n
k+1
k N.
7. Calcolare, se esistono, i limiti
(i) lim
n
_
n
0
1
x
n
+x
2
dx, (ii) lim
n
_

0
nx+x
2
1+nx
3/2
e

x
dx.
(iii) lim
n
_

0
sin n

xcos nxe
x
nx+x
2
dx.
8. Si verichi che se a > 0 si ha
lim
n
_

a
n
2
xe
n
2
x
2
1 +x
2
dx = 0,
e che ci`o `e falso per a = 0.
97
9. Si provi che per p, q > 0 risulta
_
1
0
x
p1
1 +x
q
dx =

n=0
(1)
n
p +nq
;
dedurne che

n=0
(1)
n
n + 1
= log 2,

n=0
(1)
n
2n + 1
=

4
,

n=0
(1)
n
3n + 1
=
1
3
log 2 +

3

3
.
10. Si provi che per [a[ 1 risulta
_
1
0
1 x
1 ax
3
dx =

n=0
a
n
(3n + 1)(3n + 2)
;
dedurne che

n=0
1
(3n + 1)(3n + 2)
=

3

3
,

n=0
1
(6n + 1)(6n + 2)
=

6

3
+
1
3
log 2.
11. Sia f :]0, [R una funzione misurabile, tale che le funzioni x

f(x),
x

f(x) siano sommabili su ]0, [, ove , sono numeri reali con < .
Provare che x

f(x) `e sommabile su ]0, [ per ogni ], [, e che la


funzione F() =
_

0
x

f(x) dm `e continua in [, ].
12. Poniamo
F
n
(t) =
n

_
R
f(x)
1 +n
2
(x t)
2
dm, t R,
ove f L

(R). Provare che se f `e continua in un punto t R, allora


lim
n
F
n
(t) = f(t).
13. Sia C

linsieme di Cantor di parametro ]0,


1
3
[ (paragrafo 1.6). Le
funzioni
C

sono Riemann integrabili su [0, 1]?


14. Sia f : [a, b] R una funzione tale che per ogni x
0
[a, b] esista nito
il limite
g(x
0
) lim
xx
0
f(x).
Dimostrare che f `e limitata, che f `e misurabile, e che f `e Riemann
integrabile.
15. Si costruisca un elemento f L
1
(0, 1) tale che nessuna funzione equi-
valente a f sia Riemann integrabile.
98
4.5 Assoluta continuit`a
Vogliamo analizzare certe relazioni che possono intercorrere fra diverse misure
denite su una stessa -algebra. Consideriamo dunque un insieme X ed una
-algebra T di sottoinsiemi di X; siano poi , due misure denite su T.
Denizione 4.5.1 Diciamo che `e assolutamente continua rispetto a , e
scriviamo , se
E T, (E) = 0 = (E) = 0.
Una misura `e quindi assolutamente continua rispetto ad unaltra misura
se ha (almeno) gli stessi insiemi di misura nulla che ha .
Denizione 4.5.2 Sia A T; diciamo che la misura `e concentrata su A
se si ha
(E) = (E A) E T.
Questa denizione `e stata gi`a incontrata nellesempio 2.1.3 (2). Si pu`o dire,
equivalentemente, che `e concentrata su A se e solo se risulta (E) = 0
per ogni E T disgiunto da A. Si noti che linsieme A non `e univocamente
determinato: se `e concentrata su A, allora `e concentrata anche su tutti
gli insiemi di T che contengono A, ed anche su quelli che dieriscono da A
per un insieme di misura nulla (esercizio 4.5.1).
Denizione 4.5.3 Diciamo che `e singolare rispetto a , e scriviamo
, se esistono due insiemi disgiunti A, B T tali che sia concentrata su
A e sia concentrata su B.
Notiamo che la relazione di assoluta continuit`a `e riessiva e transitiva, mentre
quella di singolarit`a `e simmetrica. Inoltre le due nozioni sono fra loro duali,
nel senso precisato dalla seguente
Proposizione 4.5.4 Siano
1
,
2
, misure sulla -algebra T. Allora:
(i) se
1
e
2
, allora
1
+
2
;
(ii) se
1
e
2
, allora
1
+
2
;
(iii) se
1
e
2
, allora
1

2
;
(iv) se
1
e
1
, allora
1
= 0.
99
Dimostrazione Vedere lesercizio 4.5.3.
Il termine assoluta continuit`a, che sembra avere poca anit`a con il con-
cetto espresso nella denizione 4.5.1, `e giusticato dalla proposizione che
segue:
Proposizione 4.5.5 Siano , misure denite sulla -algebra T, e suppo-
niamo che (X) < +. Si ha se e solo se per ogni > 0 esiste > 0
tale che
E T, (E) < = (E) < .
Dimostrazione (=) Sia . Ragioniamo per assurdo: negando la
tesi, otteniamo che esiste > 0 tale che, per ogni n N, si pu`o trovare
E
n
T per il quale risulta (E
n
) < 2
n
e (E
n
) . Posto allora
F
n
=

_
k=n
E
k
, F =

nN
F
n
= limsup
n
E
n
,
si ha
(F
n
)

k=n
(E
k
)

k=n
2
k
,
da cui (F
n
) 0 per n ; dato che F F
n
per ogni n N, si deduce
(F) (F
n
) per ogni n N e pertanto (F) = 0. Daltra parte, essendo
F
n
E
n
, risulta (F
n
) (E
n
) per ogni n N; e poiche F
n
F
n+1
,
dal fatto che (X) < e dalla proposizione 2.1.5 segue che
(F) = lim
n
(F
n
) .
Quindi non verica la denizione di assoluta continuit`a rispetto a .
(=) Ragionando nuovamente per assurdo, sia E T tale che (E) = 0 e
(E) > 0: allora, scelto ]0, (E)], si ha che
(E) = 0 < > 0, ma (E) ,
contraddicendo cos` lipotesi.
Osserviamo che la caratterizzazione fornita dalla proposizione precedente non
vale in generale per misure non nite (esercizio 4.5.4).
Lesempio tipico di una misura nita ed assolutamente continua rispetto ad
una misura assegnata `e dato dallintegrale di una funzione -sommabile.
Vale infatti la propriet`a seguente (assoluta continuit`a dellintegrale):
100
Proposizione 4.5.6 Sia (X, T, ) uno spazio misurato. Se f `e una funzione
misurabile su X, allora la misura
(E) =
_
E
[f[ d, E T,
`e assolutamente continua rispetto a . Se in particolare f /
1
(X), allora
`e una misura nita su X.
Dimostrazione Sia f /
1
(X). Ovviamente allora risulta
(X) =
_
X
[f[ d < .
Inoltre, se f `e misurabile su X, allora [f[ `e integrabile e per ogni E T con
(E) = 0 si ha (E) = 0 grazie allosservazione 4.2.3.
Uno dei pi` u importanti risultati di teoria della misura `e costituito dal vice-
versa di questa proposizione, noto come teorema di Radon-Nikodym; da esso
segue che se (X, T, ) `e uno spazio misurato -nito, allora ogni misura nita
denita su T, assolutamente continua rispetto a , `e del tipo
(E) =
_
E
[f[ d
per qualche f -sommabile su X. Dimostreremo questo teorema pi` u avanti
nel corso.
Esercizi 4.5
1. Si provi che se `e una misura concentrata su un insieme A T, allora
`e concentrata in ogni insieme B T tale che (A B) = 0, mentre
non `e concentrata su alcun insieme D tale che (A D) > 0.
2. Sia (X, T, ) uno spazio misurato e sia f /
X
.
(i) Si verichi che o = B R : f
1
(B) T `e una -algebra di
sottoinsiemi di R che contiene i boreliani ma non `e necessariamente
contenuta in /.
101
(ii) Posto

f
(B) = (f
1
(B)) B o,
si provi che
f
`e una misura su o, che
f
`e concentrata su f(X),
e che se `e completa, oppure nita, allora
f
`e completa, oppu-
re nita. Se `e -nita, `e vero che
f
`e -nita? (Ricordiamo
che, allorche X `e uno spazio probabilizzato, la misura `e chia-
mata misura immagine, o legge, della variabile aleatoria f; si veda
lesercizio 3.1.6.)
(iii) Si verichi che
_
R

B
(t) d =
_
X

B
(f(x)) d B o,
e si deduca che se (X) < allora
_
R
g(t) d =
_
X
g(f(x)) d g L
1
(R, o, ).
(iv) Si provi che se f, g /
X
, e se risulta (f
1
(g(X))) = 0, oppure
(g
1
(f(X))) = 0, allora
f

g
.
(v) Sia X = [1, 1] e sia la misura di Lebesgue su X. Se f(x) =
max x, 0 e g(x) = min x, 0, `e vero che
f

g
?
3. Si dimostrino gli enunciati della proposizione 4.5.4.
4. Sia la misura di Lebesgue su ]0, 1[, e poniamo
(E) =
_
E
dt
t
, E /, E ]0, 1[.
Si provi che `e assolutamente continua rispetto a , ma non vale la
condizione espressa nella proposizione 4.5.6.
5. Sia (X, T, ) uno spazio misurato con (X) < . Se f
n
, f sono fun-
zioni misurabili tali che f
n
f in misura, si provi che, dette
n
e le
leggi di f
n
e f rispettivamente, risulta
lim
n
_
R
g d
n
=
_
R
g d g C
0
(R) L

(R).
(Se (X) = 1, in linguaggio probabilistico si dice che le variabili alea-
torie f
n
convergono in legge alla variabile aleatoria f.)
Traccia: Si utilizzi la formula illustrata nellesercizio 4.5.2(iii).]
102
4.6 Lo spazio L
1
Poiche due funzioni sommabili che coincidono q.o. hanno lo stesso integrale,
conviene identicare fra loro le funzioni q.o. coincidenti, come si `e fatto per
lo spazio /

.
Sia dunque (X, T, ) uno spazio misurato e introduciamo nello spazio vet-
toriale /
1
(X) delle funzioni sommabili su X la seguente relazione di equiva-
lenza, gi`a introdotta nel paragrafo 3.2:
f g f(x) = g(x) q.o. in X.
Denizione 4.6.1 Lo spazio quoziente /
1
(X)/ si indica con L
1
(X).
Gli elementi di L
1
(X) sono dunque classi di equivalenza di funzioni sommabili
su X; la struttura vettoriale di L
1
`e la stessa di L

ed `e ovvia.
Teorema 4.6.2 Lo spazio L
1
(X) `e uno spazio di Banach con la norma
|f|
1
=
_
X
[f[ d.
Dimostrazione La quantit`a |f|
1
dipende solo dalla classe [f] e non dal
rappresentante f, in virt` u dellosservazione 4.2.7; le propriet`a che fanno di
essa una norma sono pressocche ovvie. Proviamo che L
1
`e completo rispetto
a questa norma.
Sia [f
n
]
nN
una successione di Cauchy in L
1
: ci`o signica che per ogni
> 0 esiste

N tale che
|[f
n
] [f
m
]|
1
= |[f
n
f
m
]|
1
< n, m

.
Dunque, scelto = 2
k
, k N, si costruisce una successione strettamente
crescente
k

kN
tale che
|[f

k+1
f

k
]|
1
< 2
k
k N.
Scegliamo, per ogni n N, un elemento g
n
[f
n
]: allora si ha
_
X
[g

k+1
g

k
[ d < 2
k
k N.
Notiamo ora che
g

k
= g

0
+
k1

h=0
(g

h+1
g

h
) k N
+
,
103
e che la serie

h=0
(g

h+1
g

h
) converge assolutamente q.o. in X; infatti,
per lesercizio 4.3.3,
_
X

h=0
[g

h+1
g

h
[ d =

h=0
_
X
[g

h+1
g

h
[ d <

h=0
2
h
= 2,
e quindi la funzione

h=0
[g

h+1
g

h
[, essendo sommabile, `e q.o. nita su
X (esercizio 4.2.7). Pertanto
f(x) lim
k
g

k
(x) q.o. in X.
Completiamo la denizione di f ponendo f(x) = 0 nei punti x in cui la serie
sopra scritta non converge: la funzione f cos` denita risulta allora misurabile
su X. Essa `e inoltre sommabile, essendo limite puntuale q.o. delle g

k
, le
quali sono dominate dalla funzione sommabile [g

0
[+

h=0
[g

h+1
g

h
[; quindi
la funzione f denisce un elemento [f] L
1
(X). Proviamo che [f
n
] [f] in
L
1
: in virt` u del lemma di Fatou per ogni n

si ha
|[f
n
] [f]|
1
=
_
X
[g
n
f[ d
liminf
k
_
X
[g
n
g

k
[ d = liminf
k
|[f
n
] [f

k
]|
1
,
il che prova la tesi.
Osserviamo che dalla dimostrazione precedente discende, in particolare, la
seguente propriet`a:
Proposizione 4.6.3 Se f
n
f in L
1
(X), allora esiste una sottosuccessione
f
n
k

kN
f
n

nN
che converge q.o. a f in modo dominato, cio`e verica
[f
n
k
(x)[ g(x) q.o. in X, con g L
1
(X).
Dimostrazione Le g

k
della dimostrazione precedente convergono q.o. a f
e sono dominate dalla funzione sommabile [g

0
[ +

h=0
[g

h+1
g

h
[.
Osservazione 4.6.4 Nella proposizione precedente si `e volutamente confuso
il generico elemento di L
1
, cio`e la classe di equivalenza, con uno dei rappre-
sentanti di tale classe, che `e una funzione sommabile. Questo modo di fare
semplica i discorsi e non provoca guai, quindi verr`a sistematicamente adot-
tato nel seguito. Lunica dierenza che ne risulta `e che le relazioni puntuali
tra funzioni di L
1
valgono solamente quasi ovunque, perche tali funzioni
sono denite a meno di insiemi di misura nulla.
104
Esercizi 4.6
1. Si consideri lo spazio misurato (N, T(N), ) ove (E) `e la cardinalit`a
di E. Si caratterizzi lo spazio L
1
(N), e si discutano le connessioni fra
convergenza puntuale, convergenza uniforme, convergenza in misura e
convergenza in L
1
.
2. Sia (X, T, ) uno spazio misurato e sia f L
1
(X, ). Posto (E) =
_
E
[f[ d, si provi che risulta g L
1
(X, ) se e solo se fg L
1
(X, ) e
che in tal caso _
X
[g[ d =
_
X
[fg[ d.
[Traccia: provare il risultato per g o e poi usare la proposizione
3.1.7 ed il teorema di Lebesgue.]
3. Sia (X, T, ) uno spazio misurato e sia f integrabile su X. Provare la
seguente formula di integrazione per fette:
_
X
[f[ d =
_

0
(x X : [f(x)[ > t)dm.
[Traccia: si tratti dapprima il caso f o, scrivendo f nella forma
f =

m
i=1

E
i
, con i numeri [
i
[ ordinati in modo crescente e con
E
i
= f
1
(
i
); poi si usi il teorema di B.Levi.]
4. Siano f
n
, f funzioni di L
1
(X) tali che f
n
(x) f(x) q.o. in X. Si provi
che se, inoltre,
_
X
[f
n
[ d
_
X
[f[ d, allora f
n
f in L
1
(X), e che la
tesi `e in generale falsa senza questa ipotesi.
5. Sia (X, T, ) uno spazio misurato -nito e sia f L
1
(X). Si provi
che per ogni > 0 esiste un insieme A T tale che (A) < e
_
A
c
[f[ d < .
6. Provare che le funzioni f
n
denite da
f
n
(x) =
sin x
n(e
x/n
1)

x
, x > 0,
appartengono a L
1
(0, ) (rispetto alla misura di Lebesgue). Si dica se
esiste nito il limite
lim
n
_

0
f
n
dm.
105
7. Poniamo per ogni n N
+
f
n
(x) =
_
1
nx
_
, x > 0,
ove [y] indica la parte intera di y.
(i) Si verichi che f
n
converge puntualmente a 0 in ]0, [.
(ii) Si dica se f
n
converge a 0 in L
1
(]0, [) (rispetto alla misura di
Lebesgue).
(iii) Si dica se f
n
converge a 0 in misura.
8. Sia L
1
w
(R) linsieme delle funzioni misurabili f : R R per le quali
esiste c > 0 tale che
m(x R : [f(x)[ > t)
c
t
t > 0.
(i) Si verichi che L
1
w
(R) `e uno spazio vettoriale.
(ii) Si dimostri che L
1
(R) L
1
w
(R) con inclusione stretta.
(iii) Si provi che se f
n
L
1
w
(R), se f
n
f in misura, e se esiste
K > 0 tale che
sup
t>0
t m(x R : [f
n
(x)[ > t) K n N,
allora f L
1
w
(R).
4.7 Teoremi di densit`a in L
1
Sia (X, T, ) uno spazio misurato.
`
E utile sapere se e quando sia possibile
approssimare gli elementi di L
1
(X), oppure di L

(X), rispetto alla corrispon-


dente norma, mediante funzioni migliori in qualche senso. Come vedremo,
vi sono svariati risultati di questo tipo.
Il primo di questi riguarda un arbitrario spazio misurato.
Proposizione 4.7.1 Sia (X, T, ) uno spazio misurato. Allora o
0
`e denso
in L
1
(X).
106
Dimostrazione Sia f L
1
. Poiche linsieme dove f `e diversa da 0 `e -
nito (esercizio 4.2.12), applicando losservazione 3.1.8 possiamo trovare una
successione
n

nN
o
0
tale che
lim
n

n
(x) = f(x) q.o. in X, [
n
(x)[ [f(x)[ q.o. in X
(si ricordi losservazione 4.6.4). Dato che
[
n
(x) f(x)[ 2[f(x)[ q.o. in X,
il teorema di Lebesgue, nella variante dellesercizio 4.3.4, fornisce la tesi.
Osservazione 4.7.2 Come gi`a sappiamo (proposizione 3.1.7 ed osservazione
3.1.8), lo spazio o `e denso in L

(X), ma lo spazio o
0
non lo `e, a meno che
non sia (X) < .
Consideriamo adesso lo spazio misurato (R, /, m). In questo ambito pres-
socche tutti gli spazi di funzioni regolari risultano densi in L
1
(R).
Proposizione 4.7.3 C
0
(R) L
1
(R) `e denso in L
1
(R).
Dimostrazione Poiche o
0
`e denso in L
1
, baster`a dimostrare che ogni f o
0
`e arbitrariamente vicina ad una funzione continua e sommabile g, ed a questo
scopo `e chiaro che `e suciente considerare il caso f =
E
, con E / e
m(E) < .
Sia dunque > 0; per la proposizione 1.7.3 esistono un aperto A ed un chiuso
C tali che C E A e m(AC) < ; in particolare, m(A) < m(E)+ < .
Poniamo, come nella dimostrazione del teorema 3.4.1,
g(x) =
d(x, A
c
)
d(x, A
c
) + d(x, C)
, x R;
si ha 0 g 1, g = 1 su C, g = 0 su A
c
ed inoltre g `e continua. Daltra
parte g L
1
(R) perche
_
R
g dm =
_
A
g dm m(A) < .
La tesi segue allora dal fatto che
_
R
[
E
g[ dm =
_
A\C
[
E
g[ dm m(A C) < .
107
Osservazione 4.7.4 Lo stesso risultato vale in ogni spazio misurato (X, T,
) dotato delle seguenti propriet`a:
(i) X `e uno spazio topologico T
4
, cio`e tale che chiusi disgiunti abbiano intorni
disgiunti;
(ii) T `e una -algebra contenente gli aperti;
(iii) `e una misura regolare, cio`e per ogni E T e per ogni > 0 esiste un
aperto A E tale che (A E) < .
Ad esempio, ci`o `e vero per (R
N
, /
N
, m
N
), qualunque sia N N
+
, ed in
(R
N
, H
p
, H
p
), per ogni N N
+
e p ]0, N].
Consideriamo ora lo spazio C
0
0
(R) delle funzioni continue il cui supporto, cio`e
la chiusura dellinsieme x R : g(x) ,= 0, `e compatto.
Proposizione 4.7.5 C
0
0
(R) `e denso in L
1
(R).
Dimostrazione Basta provare che le funzioni di C
0
0
(R) approssimano nel-
la norma di L
1
(R) quelle di C
0
(R) L
1
(R). Sia f C
0
(R) L
1
(R), e
consideriamo le funzioni

n
(x) =
_
_
_
1 se [x[ n
n + 1 [x[ se [x[ [n, n + 1]
0 se [x[ n + 1;
allora si ha f
n
C
0
0
(R), f
n
f puntualmente in R, [f
n
[ [f[ in R; ne
segue, per il teorema di Lebesgue, f
n
f in L
1
(R).
Proposizione 4.7.6 C

0
(R) `e denso in L
1
(R).
Dimostrazione Basta provare che C

0
(R) `e denso in C
0
0
(R) rispetto alla
norma di L
1
(R). Sia f C
0
0
(R), e sia M > 0 tale che il supporto di f sia
contenuto in ] M, M[, cosicche f = 0 per [x[ M. Utilizziamo il fatto che
C

0
(] M, M[) `e denso in C
0
0
(] M, M[) rispetto alla norma uniforme (una
dimostrazione di questo fatto `e tratteggiata negli esercizi 4.7.10 e 4.7.11);
dunque, ssato > 0, esiste C

0
(] M, M[) tale che
sup
[x[M
[(x) f(x)[ <

2M
.
Ne segue
| f|
1
=
_
M
M
[ f[ dm 2M sup
[x[M
[(x) f(x)[ < .
108
Esercizi 4.7
1. Si provi che linsieme delle funzioni che sono costanti a tratti e nulle
fuori di un insieme di misura nita `e denso in L
1
(R).
[Traccia: si osservi che ogni g C
0
0
(R) `e Riemann integrabile in un
opportuno intervallo [a, b].]
2. Esibire un esempio di successione f
n
che converga in L
1
(X) ma tale
che per ogni x X la successione f
n
(x) non abbia limite.
3. (Continuit`a in L
1
delle traslazioni) Sia f L
1
(R). Posto, per h R,
f
h
(x) = f(x +h), si provi che:
(i) f
h
L
1
(R) e |f
h
|
1
= |f|
1
per ogni h R;
(ii) lim
h0
|f
h
f|
1
= 0.
[Traccia: utilizzare la densit`a di o
0
e di C
0
0
(R) in L
1
(R).]
4. Sia f L
1
(R). Posto, per R 0, F

(x) = f(x), si provi che:


(i) F

L
1
(R) e |F

|
1
=
1
[[
|f|
1
per ogni R 0;
(ii) lim
1
|F

f|
1
= 0.
5. Determinare per quali valori di R esiste nito il limite
lim
n
_
2
0
x

n
2
_
1 cos
x
n
_
dx,
e calcolarlo.
6. Sia g C
0
(R) con lim
[x[
g(x) = 0. Provare che per ogni f L
1
(R)
si ha
lim
n
1
n
_
R
g(x)f
_
x
n
_
dm = 0.
7. (Lemma di Riemann-Lebesgue) Se f L
1
(R), si provi che
lim
t
_
R
f(x) cos tx dm = lim
t
_
R
f(x) sin tx dm = 0.
109
8. Sia E / con m(E) < . Provare che
_
E
1
2 sin nx
dm =
m(E)

3
.
[Traccia: se E `e un intervallo, lintegrale si calcola esplicitamente
e, usando la periodicit`a, si ottiene il risultato passando al limite; si
approssimi poi
E
con funzioni costanti a tratti (esercizio 4.7.1).]
9. Sia X un insieme, sia T una -algebra di sottoinsiemi di X, e sia

nN
una successione crescente di misure denite su T. Denita la
misura (E) = lim
n

n
(E) per E T, si provi che:
(i) se f L
1
(X, ) allora f L
1
(X,
n
) per ogni n, e
_
X
f d = lim
n
_
X
f d
n
;
(ii) in generale L
1
(X, ) ,=

n=0
L
1
(X,
n
).
10. Fissata f C
0
[0, 1], per ogni n N
+
ln-simo polinomio di Bernstein
di f `e denito da
P
n
(t) =
n

k=0
_
n
k
_
t
k
(1 t)
nk
f
_
k
n
_
, t R.
(i) Si verichi che P
n
(0) = f(0) e P
n
(1) = f(1) per ogni n N
+
.
(ii) Si mostri che
P
n
(t) f(t) =
n

k=0
_
n
k
_
t
k
(1 t)
nk
_
f
_
k
n
_
f(t)
_
t [0, 1].
(iii) Si provino le seguenti identit`a (x R):
n

k=0
k
_
n
k
_
x
k
(1 x)
nk
= nx ,
n

k=0
k(k 1)
_
n
k
_
x
k
(1 x)
nk
= n(n 1)x
2
,
n

k=0
k
2
_
n
k
_
x
k
(1 x)
nk
= n(n 1)x
2
+nx .
110
(iv) Fissato > 0 e posto, per ogni t [0, 1],
A
t
=
_
k N : 0 k n,

k
n
t


_
,
B
t
=
_
k N : 0 k n,

k
n
t

<
_
,
si dimostri che

kAt
_
n
k
_
t
k
(1 t)
nk
_
f
_
k
n
_
f(t)
_

kAt
(k nt)
2

2
n
2
_
n
k
_
t
k
(1 t)
nk
2|f|

2|f|

2
n
2
[nt(1 t)]
|f|

2
2
n
,

kBt
_
n
k
_
t
k
(1 t)
nk
_
f
_
k
n
_
f(t)
_

se

,
e si concluda che P
n
f uniformemente in [0, 1] per n .
(v) Si deduca che, per ogni [a, b] R, C

[a, b] `e denso in C
0
[a, b] nella
norma uniforme.
11. Sia f C
0
0
(]a, b[) e sia ]0, (ba)/4[ tale che f(x) = 0 per x a+2
e per x b 2. Sia poi Q
n

nN
una successione di polinomi che
converge uniformemente a f in [a, b]. Utilizzando le funzioni
(x) =
_
exp
_

1
x(1x)
_
se 0 < x < 1
0 se x R]0, 1[,
(x) =
_
1
x
dm
_
1
0
dm
x 0,
ed inne
(x) =
_

_
0 se x a +

_
a+2x

_
se a + < x < a + 2
1 se a + 2 x b 2

_
xb+2

_
se b 2 < x < b
0 se x b ,
111
si provi che Q
n

nN
C

0
(]a, b[) e che tale successione converge
uniformemente a f in R; si concluda che C

0
(]a, b[) `e denso in C
0
0
(]a, b[)
nella norma uniforme.
112
Capitolo 5
Misure prodotto
5.1 Rettangoli misurabili
Abbiamo gi`a introdotto (paragrafo 2.2) la misura di Lebesgue in R
N
, ma
non siamo ancora in grado, come vorremmo, di ricondurre il calcolo degli
integrali multipli a N integrazioni semplici successive, ne di stabilire quando
sia lecito scambiare lordine di integrazione. Tutto ci`o `e reso possibile, come
si vedr`a, dalla costruzione delle misure negli spazi prodotto.
Siano dunque (X, T, ) e (Y, (, ) due spazi di misura. Nel prodotto carte-
siano X Y introduciamo la classe 1 dei rettangoli misurabili:
1 = E X Y : E = A B, A T, B (.
La classe 1non `e ne una -algebra ne unalgebra, perche non `e chiusa rispetto
allunione e nemmeno rispetto al passaggio al complementare; essa `e soltanto
chiusa rispetto allintersezione, dato che
(A B) (C D) = (A C) (B D).
Inoltre 1`e una classe troppo ristretta di sottoinsiemi di XY : nel caso X =
Y = R, ad esempio, vorremmo poter annoverare tra gli insiemi misurabili di
R
2
i triangoli, i cerchi, e tanti altri insiemi che non sono elementi di 1.
Daltra parte, su 1 possiamo denire una misura prodotto in modo naturale:
se E = A B 1, poniamo (con la solita convenzione 0 = 0)
(E) = (A B) = (A)(B).
113
Indichiamo con / lalgebra generata da 1, cio`e la pi` u piccola algebra con-
tenente i rettangoli misurabili: `e facile, anche se noioso, vericare che / `e
costituita da tutte le unioni nite di elementi di 1; altrettanto noioso. ma
sempre facile, `e provare che /`e costituita da tutte le unioni nite di elementi
disgiunti di 1 (esercizi 5.1.1, 5.1.2 e 5.1.3).
Ci sar`a utile la seguente nozione:
Denizione 5.1.1 Una famiglia /di sottoinsiemi di un insieme qualunque
Z `e detta classe monotona se:
(i) per ogni P
n

nN
/ tale che P
n
P
n+1
si ha

nN
P
n
/;
(ii) per ogni P
n

nN
/ tale che P
n
P
n+1
si ha

nN
P
n
/.
Osserviamo che ogni -algebra `e una classe monotona ma che il viceversa `e
falso (esercizi 5.1.6 e 5.1.7). Inoltre lintersezione di una famiglia arbitraria
di classi monotone `e ancora una classe monotona.
Introduciamo adesso la -algebra di sottoinsiemi di XY su cui costruiremo
la misura prodotto, ponendo
T ( = la minima -algebra contenente 1.
Ovviamente, T ( `e anche la minima -algebra contenente /.
Vedremo in seguito che la funzione si pu`o estendere alla -algebra T (,
e che tale estensione `e una misura, che verr`a denominata misura prodotto di
e ed indicata col simbolo .
Esercizi 5.1
1. Si provi che se E = A B 1, allora E
c
`e unione nita di elementi
disgiunti di 1.
2. Si provi che se R
1
, . . . , R
m
1, allora

m
i=1
R
i
`e unione nita di
elementi disgiunti di 1.
3. Sia / la pi` u piccola algebra contenente la classe 1. Si provi che
/ =
_
m
_
i=1
R
i
: R
1
, . . . , R
m
1, m N
_
=
=
_
m
_
i=1
R
i
: R
1
, . . . , R
m
1 disgiunti, m N
_
.
114
4. Sia (A B) = (A)(B) per ogni A B 1; si provi che se R 1
`e lunione nita o numerabile di elementi disgiunti R
i
1, allora
(R) =

i
(R
i
).
5. Si estenda allalgebra / la funzione denita nellesercizio precedente,
ponendo
(A) =
m

i=1
(R
i
) se A =
m
_
i=1
R
i
, R
i
disgiunti.
Si verichi che questa `e una buona denizione, ossia non dipende dal
modo in cui si decompone A in rettangoli disgiunti; si provi poi che
se A / `e lunione nita o numerabile di elementi disgiunti A
i
/,
allora
(A) =

i
(A
i
).
6. Provare che la famiglia di tutti gli intervalli di R (compreso linsieme
vuoto ed i singoli punti x) `e una classe monotona che non `e una
-algebra.
7. Trovare una classe monotona di sottoinsiemi di R che sia chiusa rispetto
al passaggio al complementare ma non sia una -algebra.
8. Dimostrare che la -algebra dei boreliani di R
2
`e strettamente conte-
nuta nella -algebra //.
5.2 Insiemi misurabili in X Y
Analizziamo adesso le propriet`a della -algebra T ( e dei suoi elementi.
Cominciamo con unutile caratterizzazione di T (:
Proposizione 5.2.1 Siano (X, T, ) e (Y, (, ) spazi misurati. Allora la -
algebra T( `e la minima classe monotona che contiene lalgebra / generata
dalla famiglia 1 dei rettangoli misurabili di X Y .
115
Dimostrazione Indichiamo con / la minima classe monotona contenente
/; poiche ogni -algebra `e una classe monotona, `e chiaro che / T (.
Per provare luguaglianza, baster`a mostrare che anche / `e una -algebra,
essendo T ( la minima -algebra contenente /.
Cominciamo col dimostrare il seguente
Lemma 5.2.2 Se P, Q /, allora P Q, P Q /.
Dimostrazione Per ogni P X Y sia
(P) = Q X Y : Q P, P Q, P Q /.
Allora si vericano facilmente i seguenti fatti:
(a) Q (P) se e solo se P (Q) (a causa della simmetria nella
denizione di (P));
(b) (P) `e una classe monotona per ogni P X Y (perche tale `e /);
(c) / (P) per ogni P / (infatti, se P / e Q /, allora, essendo
/ unalgebra, si ha P Q, Q P, P Q / /: dunque se P /
risulta Q (P) per ogni Q /, ossia / (P));
(d) / (P) per ogni P / (per (b), (c) e per denizione di /);
(e) / (Q) per ogni Q / (infatti se Q / si ha, per (d), Q
(P) per ogni P /, ossia, per (a), P (Q) per ogni P /,
il che signica / (Q): dunque, per (b) e per denizione di /,
/ (Q)).
Lenunciato (e) fornisce allora la dimostrazione del lemma.
`
E facile adesso provare che / `e una -algebra. Anzitutto, X Y 1
/ /; poi, per il lemma precedente, se Q / si ha Q
c
= (X Y ) Q
/. Inne, sia P
n
una successione di elementi di /: posto, per ogni N,
Q
N
=

N
n=0
P
n
, si ha Q
N
/ (per il lemma precedente) e Q
N
Q
N+1
, da
cui, per la monotonia della classe /,

_
n=0
P
n
=

_
n=0
Q
n
/.
Ci` o conclude la dimostrazione della proposizione 5.2.1.
Passiamo ora ad esaminare gli elementi di T (. Se E T (, deniamo
gli insiemi proiezione di E su X e su Y :
116
Denizione 5.2.3 Sia E T (. Le proiezioni di E su Y sono gli insiemi
E
x
= y Y : (x, y) E, x X;
le proiezioni di E su X sono gli insiemi
E
y
= x X : (x, y) E, y Y.
`
E immediato constatare che gli insiemi E
x
vericano per ogni x X
(E
c
)
x
= (E
x
)
c
,
_
_
A
E

_
x
=
_
A
(E

)
x
,
_

A
E

_
x
=

A
(E

)
x
,
ed analoghe relazioni valgono per gli insiemi E
y
, per ogni y Y .
Proposizione 5.2.4 Se E T(, allora E
x
( per ogni x X, e E
y
T
per ogni y Y .
Dimostrazione Poniamo
| = E X Y : E
x
( x X, 1 = E X Y : E
y
T y Y .
Grazie alle propriet`a degli insiemi E
x
, E
y
sopra scritte, si verica subito che
| e 1 sono -algebre; daltra parte entrambe contengono 1, in quanto se
Q = A B 1, allora
Q
x
=
_
B se x A
se x X A,
Q
y
=
_
A se y B
se y Y B,
cosicche Q
x
( per ogni x X e Q
y
T per ogni y Y , ossia Q | 1.
Ne segue |, 1 T ( per denizione di T (, cio`e la tesi.
La proposizione precedente garantisce la misurabilit`a delle proiezioni su X e
su Y di qualunque insieme E T ( (si noti che il viceversa `e falso, come
mostra lesercizio 5.2.2); dunque possiamo calcolare (E
x
) per ogni x X
e (E
y
) per ogni y Y . Con il fondamentale teorema che segue si mostra
che, sotto ragionevoli ipotesi sugli spazi misurati, le quantit`a (E
x
) e (E
y
)
sono funzioni misurabili della variabile da cui dipendono, e per di pi` u hanno
integrali uguali; ci`o ci consentir`a di denire la misura prodotto sugli
elementi di T (.
117
Teorema 5.2.5 Siano (X, T, ) e (Y, (, ) spazi misurati -niti, e sia E
T (. Allora la funzione

E
: X [0, ],
E
(x) = (E
x
) x X
`e T-misurabile, la funzione

E
: Y [0, ],
E
(y) = (E
y
) y Y
`e (-misurabile, ed inoltre
_
X

E
d =
_
Y

E
d.
Si noti che la tesi di questo teorema ci dice che
_
X
__
Y

E
(x, y)d
_
d =
_
X

E
d =
_
Y

E
d =
_
Y
__
X

E
(x, y)d
_
d,
quindi abbiamo potuto scambiare lordine di integrazione. Questo ci per-
mette anche, come vedremo fra poco, di denire la misura (E) come il
valore comune di tali integrali.
Dimostrazione Anzitutto, se E T ( allora, come si `e gi`a osservato, le
proiezioni E
x
, E
y
appartengono rispettivamente a ( e T, cosicche le funzioni

E
,
E
sono ben denite.
Sia la famiglia degli elementi E T ( che vericano la tesi del teorema:
proveremo che `e una classe monotona che contiene lalgebra / generata
dalla famiglia 1 dei rettangoli misurabili di X Y ; dalla proposizione 5.2.1
seguir`a che T (, e quindi la tesi.
Dividiamo la dimostrazione in quattro passi.
(i) /. Infatti, se anzitutto Q = A B 1, allora risulta

Q
(x) = (B)
A
(x),
Q
(y) = (A)
B
(y),
quindi la prima funzione `e T-misurabile e la seconda `e (-misurabile; inoltre
_
X

Q
d = (A)(B) =
_
Y

Q
d,
e dunque Q . Sia ora A /: per lesercizio 5.1.3, si ha A =

k
i=1
R
i
con
gli R
i
elementi disgiunti di 1. Si verica allora facilmente che
A
=

k
i=1

R
i
118
e
A
=

k
i=1

R
i
; quindi la T-misurabilit`a di
A
e la (-misurabilit`a di
A
,
nonche luguaglianza
_
X

A
d =
_
Y

A
d, si ottengono per additivit`a. Ci`o
prova che A , ossia / .
(ii) Se Q
n
`e una successione di elementi di tale che Q
n
Q
n+1
, al-
lora

nN
Q
n
. Infatti, posto Q =

nN
Q
n
si ha, per la proposizione
2.1.5,
Q
(x) = lim
n

Qn
(x) e
Q
(y) = lim
n

Qn
(y), quindi (proposi-
zione 3.1.6) la prima funzione `e T-misurabile e la seconda `e (-misurabile;
luguaglianza dei due integrali segue dal teorema di B. Levi. Ci`o prova che
Q .
(iii) Se Q
n
`e una successione di elementi disgiunti di , allora

nN
Q
n

. Infatti, posto Q =

nN
Q
n
si ha, per numerabile additivit`a,
Q
=

nN

Qn
e
Q
=

nN

Qn
, da cui, analogamente a (ii), si ottiene Q .
(iv) Se Q
n
`e una successione di elementi di tale che Q
n
Q
n+1
, allora

nN
Q
n
. Per provare ci`o, posto Q =

nN
Q
n
, distinguiamo due casi.
(a) Se (X) < e (Y ) < , allora ((Q
0
)
x
) (Y ) < e ((Q
0
)
y
)
(X) < . Nuovamente per la proposizione 2.1.5, si ha
Q
(x)
Qn
(x)
e
Q
(y)
Qn
(y) per n ; quindi la prima funzione `e T-misurabile e
la seconda `e (-misurabile. Inoltre, luguaglianza degli integrali si ottiene in
virt` u del teorema di Lebesgue, il quale `e applicabile perche

Qn
(x)
Q
0
(x) x X,
Qn
(y)
Q
0
(y) y Y,
_
X

Q
0
d
_
X

XY
d
_
Y

Q
0
d
_
Y

XY
d
_
= (X)(Y ) < .
Dunque in questo caso si ha Q .
(b) Se invece (X) = oppure (Y ) = , utilizziamo il fatto che, essendo
i due spazi misurati -niti, esistono due successioni di insiemi disgiunti
X
k

kN
T, Y
m

mN
(, tali che X =

k=0
X
k
, Y =

m=0
Y
m
, (X
k
) <
per ogni k e (Y
m
) < per ogni m. Pertanto XY =

k,mN
(X
k
Y
m
)
e tale unione `e disgiunta.
Poniamo Q
nkm
= Q
n
(X
k
Y
m
) e dimostriamo anzitutto che Q
nkm

nN

. Consideriamo la famiglia
= P T ( : P (X
k
Y
m
) k, m N :
essa `e una classe monotona contenente /, come segue subito da (i), (ii) e dal
caso (a) gi`a provato. Quindi, per la minimalit`a di T (, si ha = T (
119
e dunque : ci`o mostra che Q
n

nN
e dunque, come si voleva,
Q
nkm

nN
.
Ci` o premesso, si ottiene che anche Q =

nN
Q
n
, ossia Q (X
k

Y
m
) =

nN
Q
nkm
. Da (iii) concludiamo allora che Q, essendo lunione
disgiunta dei Q (X
k
Y
m
) , sta anchesso in .
Da (ii) e (iv) segue che `e una classe monotona; per (i), essa contiene /.
La tesi `e provata.
Denizione 5.2.6 Siano (X, T, ), (Y, (, ) spazi misurati -niti. La mi-
sura prodotto `e denita come segue:
(E) =
_
X

E
d =
_
Y

E
d E T (,
ove le funzioni
E
,
E
sono denite nel teorema 5.2.5.
Si noti che `e davvero una misura: risulta () = 0 (infatti

sono identicamente nulle), e se E


n
`e una successione di elementi disgiunti
di T (, allora posto E =

nN
E
n
si ha
E
=

nN

En
e
E
=

nN

En
,
e dunque luguaglianza (E) =

nN
(E
n
) segue dal teorema di B.
Levi. Si osservi inoltre che (A B) = (A)(B) per ogni A B 1,
come si `e visto nel passo (i) della dimostrazione del teorema 5.2.5.
Osservazione 5.2.7 La misura prodotto non `e in generale completa,
neanche se e lo sono: ad esempio, se X = Y = R, T = ( = / e
= = m, la misura prodotto mm non `e completa. Infatti, sia V [0, 1]
un insieme non misurabile, e sia B ,= un insieme misurabile di misura
nulla: allora V B / //, perche altrimenti, per la proposizione 5.2.4,
scelto y B la proiezione (V B)
y
= V sarebbe un elemento di /. Daltra
parte, V B [0, 1] B, e questultimo insieme `e //-misurabile con
misura nulla. Peraltro, `e immediato vericare che V B /
2
, essendo
m

2
(v B) = 0.
Esercizi 5.2
1. Siano k, h, N N
+
con k +h = N. Indicando con B
N
la -algebra dei
boreliani di R
N
, si provi luguaglianza
B
N
= B
k
B
h
.
120
[Traccia: () si verichi che gli aperti di R
N
appartengono a B
k
B
h
.
() Si provi che per ogni aperto B R
h
la classe |
B
= A R
k
:
A B B
N
`e una -algebra che contiene gli aperti di R
k
. Poi,
analogamente, si provi che per ogni A B
k
la classe 1
A
= B R
h
:
A B B
N
`e una -algebra che contiene gli aperti di R
h
.]
2. Sia F [0, 1] un insieme tale che F / B. Si provi che linsieme
E = (x, x) R
2
: x F appartiene a /
2
, che le sue proiezioni E
x
e E
y
sono elementi di B per ogni x, y [0, 1], ma che E / B
2
.
3. Sia g : [0, 1] [0, 1] R una funzione tale che g
x
sia continua in [0, 1]
per ogni x [0, 1] e g
y
sia continua su [0, 1] per ogni y [0, 1]. Si provi
che g `e una funzione boreliana, cio`e tale che (x, y) : g(x, y) > B
2
per ogni R.
[Traccia: si approssimi la g con le seguenti funzioni g
n
: posto a
i
=
i
n
,
se (x, y) [a
i1
, a
i
] [0, 1] si denisca
g
n
(x, y) =
a
i
x
a
i
a
i1
f(a
i1
, y) +
x a
i1
a
i
a
i1
f(a
i
, y).]
4. Poniamo X = Y = [0, 1], T = E [0, 1] : E / e ( = T([0, 1]);
siano poi = m e denita da
(E) = cardinalit`a di E V E (,
ove V `e un insieme non misurabile di [0, 1]. Si verichi che, scelto
= (x, y) [0, 1] [0, 1] : x = y, le funzioni

non sono
entrambe misurabili. Giusticare il risultato.
5. Siano (X, T, ) e (Y, (, ) spazi misurati -niti, e sia : T (
[0, ] una misura tale che (A B) = (A)(B) per ogni rettangolo
A B con A T e B (. Si provi che = .
5.3 Teoremi di integrazione successiva
Il nostro prossimo obiettivo `e quello di provare che per una vasta famiglia di
funzioni integrabili nello spazio misurato (XY, T (, ) si ha una for-
mula di integrazione una variabile per volta, in ordine arbitrario. Il passo
pi` u faticoso `e gi`a stato fatto: in eetti il teorema 5.2.5 e la denizione 5.2.6
121
ci dicono che la formula in questione `e valida per le funzioni caratteristiche
di insiemi T (-misurabili. Si tratta ora di estendere tale risultato ad una
classe pi` u ampia di funzioni.
Anzitutto, per ogni funzione f : X Y R deniamo le sezioni f
x
, f
y
di
f nel modo seguente: se x `e un ssato elemento di X, la funzione f
x
`e data
da
f
x
: Y R, f
x
(y) = f(x, y) y Y,
e se y `e un ssato elemento di Y , la funzione f
y
`e data da
f
y
: X R, f
y
(x) = f(x, y) x X.
Se f `e continua, `e chiaro che le sezioni f
x
, f
y
sono continue. Anche la
misurabilit`a viene preservata; infatti si ha:
Proposizione 5.3.1 Se f : X Y R `e T (-misurabile, allora per ogni
x X la funzione f
x
`e (-misurabile, e per ogni y Y la funzione f
y
`e
T-misurabile.
Dimostrazione Per ogni R si ha, per ipotesi,
E

= (x, y) X Y : f(x, y) > T (.


In virt` u della proposizione 5.2.4, si deduce
y Y : f
x
(y) > = (E

)
x
(, x X : f
y
(x) > = (E

)
y
T,
che `e la tesi.
Veniamo ai teoremi sullo scambio dellordine di integrazione. Il primo ri-
guarda funzioni misurabili non negative, anche non sommabili, il secondo
riguarda funzioni sommabili, di segno qualunque.
Teorema 5.3.2 (di Tonelli) Siano (X, T, ) e (Y, (, ) spazi misurati -
niti, e sia f una funzione T (-misurabile e non negativa. Allora:
(i) f
x
`e (-misurabile per ogni x X e f
y
`e T-misurabile per ogni y Y ;
(ii) la funzione x
_
Y
f
x
d `e T-misurabile e la funzione y
_
X
f
y
d `e
(-misurabile;
122
(iii) si hanno le uguaglianze
_
X
__
Y
f
x
d
_
d =
_
XY
f d =
_
Y
__
X
f
y
d
_
d.
Dimostrazione (i) Gi`a dimostrato nella proposizione precedente.
(ii)-(iii) Se f =
E
, con E T (, allora la tesi `e stata gi`a provata nel
teorema 5.2.5. Per linearit`a, lo stesso risultato vale quindi per ogni funzione
f semplice rispetto alla -algebra T ( e non negativa. Inne se f `e una
funzione T (-misurabile non negativa, per la proposizione 3.1.7 esiste una
successione crescente
n
di funzioni semplici non negative che converge
puntualmente a f in X Y . Per il teorema di B. Levi si ha allora
lim
n
_
XY

n
d =
_
XY
f d ;
daltra parte, essendo (
n
)
x
e (
n
)
y
due successioni crescenti di funzioni
semplici (la prima rispetto a (, la seconda rispetto a T) non negative, che
convergono puntualmente rispettivamente a f
x
in Y ed a f
y
in X, applicando
nuovamente il teorema di B. Levi si ha
lim
n
_
Y
(
n
)
x
d =
_
Y
f
x
d x X, lim
n
_
X
(
n
)
y
d =
_
X
f
y
d y Y.
Applicando allora ancora una volta il teorema di B. Levi deduciamo
lim
n
_
X
__
Y
(
n
)
x
d
_
d =
_
X
__
Y
f
x
d
_
d,
lim
n
_
Y
__
X
(
n
)
y
d
_
d =
_
Y
__
X
f
y
d
_
d,
e dato che le
n
soddisfano la tesi del teorema, la stessa propriet`a si deduce
per la f.
Teorema 5.3.3 (di Fubini) Siano (X, T, ) e (Y, (, ) spazi misurati -
niti, e sia f una funzione T (-misurabile e sommabile su XY . Allora:
(i) f
x
`e sommabile su Y per -q.o. x X e f
y
`e sommabile su X per -q.o.
y Y ;
123
(ii) la funzione x
_
Y
f
x
d `e sommabile su X e la funzione y
_
X
f
y
d
`e sommabile su Y ;
(iii) si hanno le uguaglianze
_
X
__
Y
f
x
d
_
d =
_
XY
fd =
_
Y
__
X
f
y
d
_
d.
Dimostrazione Le funzioni f
+
, f

soddisfano le ipotesi del teorema di


Tonelli; quindi le funzioni (f

)
x
sono (-misurabili per ogni x X, le funzioni
x
_
Y
(f

)
x
d sono T-misurabili e
_
X
__
Y
(f

)
x
d
_
d =
_
XY
f

d .
In particolare, essendo il secondo membro nito per ipotesi, le funzioni x
_
Y
(f

)
x
d sono sommabili su X; ci`o a sua volta implica che
_
Y
(f

)
x
d < + per -q.o. x X,
ossia che (f
+
)
x
e (f

)
x
sono sommabili su Y per -q.o. x X.
In modo assolutamente uguale si verica che per (f
+
)
y
, (f

)
y
valgono gli
analoghi risultati. Ci`o mostra che f
+
, f

vericano la tesi del teorema. Per


sottrazione, f = f
+
f

verica (i), e dato che gli integrali sono niti, f


verica anche (ii) e (iii).
Le ipotesi dei teoremi di Tonelli e Fubini sono essenzialmente minimali, come
mostrano i seguenti esempi.
Esempi 5.3.4 (1) Nel teorema di Fubini la f deve essere sommabile, o alme-
no integrabile (esercizio 5.3.13): in caso contrario, pu`o capitare che lintegrale
doppio non esista mentre esistono niti e diversi i due integrali iterati. Ad
esempio, se X = Y = [0, 1], T = ( = / e = = m, consideriamo la
funzione
f(x, y) =
x
2
y
2
(x
2
+y
2
)
2
, (x, y) [0, 1] [0, 1],
che `e continua in tutti i punti tranne che nellorigine, quindi `e certamen-
te / /-misurabile. Essa non `e integrabile: infatti, applicando a f
+
il
124
teorema di Tonelli si ha
_
[0,1][0,1]
f
+
dmm =
_
1
0
__
x
0
x
2
y
2
(x
2
+y
2
)
2
dy
_
dx

_
1
0
__
x
0
x
2
y
2
4x
4
dy
_
dx =
_
1
0
1
6x
dx = +,
e similmente
_
[0,1][0,1]
f

dmm =
_
1
0
__
y
0
y
2
x
2
(x
2
+y
2
)
2
dx
_
dy
_
1
0
1
6y
dy = +.
Per questa funzione i due integrali iterati esistono niti e diversi fra loro:
infatti, come si verica facilmente,
_
1
0
__
1
0
x
2
y
2
(x
2
+y
2
)
2
dy
_
dx =
_
1
0
__
1
0

y
y
x
2
+y
2
dy
_
dx =

4
,
_
1
0
__
1
0
x
2
y
2
(x
2
+y
2
)
2
dx
_
dy =
_
1
0
__
1
0

x
x
x
2
+y
2
dx
_
dy =

4
.
(2) Nel teorema di Tonelli la f deve essere non negativa, o almeno integrabile
(esercizio 5.3.13). Ci`o `e provato dalla funzione f dellesempio precedente, che
`e a segno variabile e non `e integrabile.
(3) Abbiamo denito la misura prodotto solo nel caso in cui sia , sia sono
misure -nite. In eetti si pu`o fare a meno di questa ipotesi, introducendo
per altra via (esercizio 5.4.6), ma comunque il teorema di Tonelli non
vale senza la -nitezza: consideriamo ad esempio X = Y = [0, 1], T = /,
( = T([0, 1]), e siano = m e la misura cardinalit`a, che ovviamente non
`e -nita. Allora, posto = (x, y) [0, 1] [0, 1] : x = y, per la funzione

si ha
_
1
0
__
1
0
(

)
y
dm
_
d =
_
1
0
m(y)d = 0,
_
1
0
__
1
0
(

)
x
d
_
dm =
_
1
0
(x)dm = 1.
125
Esercizi 5.3
1. Provare che
lim
b
_
b
0
sin x
x
dx =

2
.
[Traccia: utilizzare luguaglianza
1
x
=
_

0
e
xt
dt ed i teoremi di
Tonelli e Fubini.]
2. Dimostrare che la funzione f(x, y) = ye
(1+x
2
)y
2
`e sommabile nellin-
sieme [0, [[0, [, e dedurre che
_

0
e
t
2
dt =

2
.
3. Provare le uguaglianze
lim
b
_
b
0
sin x

x
dx =
_

2
, lim
b
_
b
0
cos x

x
dx =
_

2
.
[Traccia: Si calcoli dapprima lintegrale
_

0
e
xy
2
dy...]
4. Provare che
_

0
e
x
(sin x)
2
x
dx =
1
4
log 5,
_

0
e
x
sin 2x
x
dx = arctan 2.
5. Si consideri la funzione
f(x, y, t) =
1
(1 +x
2
t
2
)(1 +y
2
t
2
)
, x [0, 1], y [0, 1], t > 0.
Si provi che f L
1
(]0, 1[]0, 1[]0, [) e se ne deduca che
_

0
_
arctan t
t
_
2
dt = log 2.
6. Siano (X, T, ) e (Y, (, ) spazi misurati. Se f L
1
(X) e g L
1
(Y ),
si mostri che (x, y) f(x)g(y) appartiene a L
1
(X Y ) e che
|fg|
1
= |f|
1
|g|
1
.
126
7. Sia (X, T, ) uno spazio misurato -nito, sia f : X R una funzione
T-misurabile. Si provi che se t R risulta (x X : f(x) = t) = 0
ad eccezione al pi` u di un insieme numerabile di valori di t.
8. Sia f : R [0, ]. Si provi che f `e /-misurabile se e solo se linsieme
E = (x, y) R[0, [: y f(x) appartiene a //, e che in tal
caso si ha
_
R
f dm = mm(E) =
_

0
m(x R : f(x) y)dm;
si confronti questo risultato con quello dellesercizio 4.6.3.
9. Sia f : R R una funzione /-misurabile. Si provi che il graco di f
`e //-misurabile ed ha misura mm nulla, ma che il viceversa `e
falso.
10. Sia f L
1
(R). Per > 0 si denisca
g

(x) =
_
x
0
(x t)
1
f(t)dt, x 0;
si provi che

_
y
0
g

(x)dx = g
+1
(y) y 0.
11. Si verichi che la funzione f(x, y) = e
xy
2e
2xy
non `e integrabile
rispetto alla misura mm in [0, 1] [1, [.
12. Posto
f(x) =
1
x
1 x ]0, 2], g(x, y) = f(x)f(y) (x, y) ]0, 2]]0, 2],
si provi che f `e integrabile in ]0, 2], mentre g non `e integrabile in
]0, 2]]0, 2].
13. Dimostrare che sia nel teorema di Tonelli che nel teorema di Fubini il
terzo enunciato vale per ogni funzione integrabile su XY rispetto alla
misura .
[Traccia: si utilizzi la linearit`a dellintegrale.]
127
5.4 Completamento delle misure prodotto
Come abbiamo visto (osservazione 5.2.7), le misure prodotto non sono in ge-
nerale complete. In particolare non `e completa la misura prodotto m m,
ove m `e la misura di Lebesgue su R, ne, pi` u generalmente, lo sono le misure
prodotto m
k
m
h
: ci`o signica che per adesso non possiamo applicare i teo-
remi di Tonelli e Fubini al calcolo di integrali di funzioni Lebesgue sommabili
in R
N
.
Se vogliamo una misura completa nello spazio prodotto, occorre in generale
prendere il completamento della misura prodotto: ricordiamo che il comple-
tamento di una generica misura (o meglio, di uno spazio misurato (Z, c, ))
`e stato descritto nellesercizio 2.1.1, e consiste nellintrodurre nello spazio Z
la -algebra completata
c = E Z : E = A B, A c, B F, F c, (F) = 0,
sulla quale si denisce la misura ponendo (E) = (A). La funzione
risulta ben denita, ed `e una misura completa su c che estende la misura di
partenza .
Per quanto riguarda il prodotto di misure di Lebesgue, il legame fra la misura
prodotto m
k
m
h
e la misura (k + h)-dimensionale m
k+h
`e descritto nella
seguente
Proposizione 5.4.1 Se k, h N
+
e N = k+h, allora la misura di Lebesgue
m
N
`e il completamento della misura prodotto m
k
m
h
.
Dimostrazione Anzitutto osserviamo che (esercizio 5.2.1)
B
N
= B
k
B
h
/
k
/
h
(dove B
p
`e la famiglia dei boreliani di R
p
e /
p
denota la famiglia degli insiemi
Lebesgue misurabili in R
p
).
Notiamo adesso che per ogni aperto A R
N
si ha che m
N
(A) (ben denita
in quanto B
N
/
N
) coincide con m
k
m
h
(A) (ben denita per quanto
appena visto): infatti se A `e un N-parallelepipedo ci`o segue dalla denizione
di m
N
, m
k
e m
h
; il caso generale `e conseguenza del fatto che A `e unione
numerabile di N-parallelepipedi P
n
disgiunti, cosicche
m
N
(A) =

nN
m
N
(P
n
) =

nN
m
k
m
h
(P
n
) = m
k
m
h
(A).
128
Proviamo ora che
/
k
/
h
/
N
.
Sia E F 1 /
k
/
h
, cio`e E /
k
e F /
h
, e supponiamo
per cominciare che si abbia m
k
(E) < e m
h
(F) < . Tenuto conto della
proposizione 1.7.3 (che vale anche per m
N
), per provare che E F /
N
basta far vedere che si possono trovare un aperto A ed un chiuso C tali che
C EF A, e per i quali m
N
(AC) sia arbitrariamente piccola. Fissato
> 0, selezioniamo un aperto U ed un chiuso G in R
k
, nonche un aperto V
ed un chiuso H in R
h
, in modo che risulti
G E U, m
k
(U G) < ; H F V, m
h
(V H) < .
Allora U V `e aperto in R
N
, GH `e chiuso in R
N
, si ha GH EF
U V ed inoltre
m
N
((U V ) (GH)) m
N
((U G) V ) +m
N
(U (V H));
daltra parte
m
N
((UG)V ) = m
k
m
h
((UG)V ) = m
k
(UG)m
h
(V ) < (m
h
(F)+),
ed analogamente
m
N
(U(V H)) = m
k
m
h
(U(V G)) = m
k
(U)m
h
(V H) < (m
k
(E)+).
Ci` o prova che E F /
N
quando m
k
(E) e m
h
(F) sono nite. Si noti che
risulta anche m
N
(E F) = m
k
(E)m
h
(F): infatti per monotonia si ha
m
N
(GH) m
N
(E F) m
N
(U V ),
m
k
m
h
(GH) m
k
m
h
(E F) m
k
m
h
(U V );
ma dato che il primo ed il terzo membro della prima disuguaglianza coincido-
no rispettivamente con il primo ed il terzo membro della seconda, otteniamo
[m
N
(E F) m
k
m
h
(E F)[ m
N
(U V ) m
N
(GH) C
ove `e arbitrario e C = m
k
(E) + m
h
(F) + 2. Dunque m
N
(E F) =
m
k
m
h
(E F) = m
k
(E)m
h
(F).
Nel caso che almeno una fra m
k
(E) e m
h
(F) sia innita, E F `e comunque
unione numerabile di insiemi disgiunti E
n
F
m
con m
k
(E
n
) < e m
h
(F
m
) <
129
, i quali sono tutti in /
N
per quanto visto: dunque anche in questo caso
E F /
N
e, per numerabile additivit`a, si ha ancora m
N
(E F) =
m
k
m
h
(EF) = m
k
(E)m
h
(F). Abbiamo cos` provato che /
k
/
h
/
N
e che m
N
e m
k
m
h
coincidono su /
k
/
h
.
Proviamo inne che m
N
`e il completamento di m
k
m
h
. Se E /
N
, per la
proposizione 1.7.3 esistono D, B B
N
tali che D E B e m
N
(BD) = 0;
quindi possiamo scrivere E = D (E D), e si ha
D B
N
/
k
/
h
, E D B D, B D B
N
/
k
/
h
,
e m
k
m
h
(B D) = m
N
(B D) = 0. Ci`o prova che E /
k
/
h
.
Viceversa, sia E /
k
/
h
: allora si ha E = A B, con
A /
k
/
h
/
N
, B F, F /
k
/
h
/
N
e m
k
m
h
(F) = m
N
(F) = 0. Per la completezza di m
N
, si deduce B /
N
e m
N
(B) = 0, e dunque E = AB /
N
; ci`o mostra che /
N
= /
k
/
h
.
Inoltre
m
N
(E) = m
N
(A) = m
k
m
h
(A) = m
k
m
h
(E),
cosicche m
N
coincide con m
k
m
h
.
I teoremi di Fubini e Tonelli continuano a valere, con lievi modiche, per il
completamento delle misure prodotto, a patto di partire con spazi di misura
completi, oltre che -niti. Si ha infatti:
Teorema 5.4.2 (di Tonelli) Siano (X, T, ) e (Y, (, ) spazi misurati -
niti e completi, e sia f una funzione T (-misurabile e non negativa.
Allora:
(i) f
x
`e (-misurabile per -q.o. x X e f
y
`e T-misurabile per -q.o. y Y ;
(ii) la funzione x
_
Y
f
x
d `e T-misurabile e la funzione y
_
X
f
y
d `e
(-misurabile;
(iii) si hanno le uguaglianze
_
X
__
Y
f
x
d
_
d =
_
XY
f d =
_
Y
__
X
f
y
d
_
d.
Dimostrazione Cominciamo con il seguente
130
Lemma 5.4.3 Siano (X, T, ) e (Y, (, ) spazi misurati -niti e completi,
e sia f una funzione T (-misurabile. Allora esistono due funzioni g, h, ove
g `e T (-misurabile e h `e T (-misurabile e nulla per -q.o. (x, y)
X Y , tali che f(x, y) = g(x, y) +h(x, y) per ogni (x, y) X Y .
Dimostrazione
`
E chiaro che se il risultato vale per f
+
e per f

, esso si
deduce anche per f: quindi si pu`o supporre f 0. Allora per la proposizione
3.1.7 esiste una successione crescente
n
di funzioni semplici (rispetto a
T (), tale che
n
(x, y) f(x, y) per ogni (x, y) XY ; quindi possiamo
scrivere
f =
0
+

n=0
(
n+1

n
) =

k=0
c
k

E
k
per opportuni numeri c
k
0 ed opportuni insiemi E
k
T (. Sar`a E
k
=
A
k
B
k
, ove A
k
T (, B
k
F
k
, F
k
T (, (F
k
) = 0 per ogni
k N. Deniamo
g =

k=0
c
k

A
k
, h = f g;
allora g `e T (-misurabile e h `e T (-misurabile, cosicche linsieme
P = (x, y) X Y : h(x, y) ,= 0
appartiene a T ( e si ha
P

_
k=0
(E
k
A
k
)

_
k=0
B
k

_
k=0
F
k
.
Essendo (

k=0
F
k
)

k=0
(F
k
) = 0, si conclude che h `e -q.o.
nulla in X Y . Ci`o prova il lemma.
Proviamo ora il teorema 5.4.2. La funzione f, per il lemma precedente, pu`o
scriversi come f = g + h, con g funzione T (- misurabile e h funzione
T (-misurabile e nulla per -q.o. (x, y) X Y . Osserviamo che
nella dimostrazione del lemma 5.4.3 abbiamo mostrato, pi` u precisamente,
che si ha
P = (x, y) X Y : h(x, y) ,= 0 Q,
ove Q =

k=0
F
k
T ( e (Q) = 0. Quindi, per il teorema 5.2.5,
_
X

Q
d =
_
Y

Q
d = (Q) = 0.
131
Siano
H = x X :
Q
(x) = (Q
x
) > 0, K = y Y :
Q
(y) = (Q
y
) > 0 :
dalle uguaglianze precedenti segue che (H) = 0 e (K) = 0.
Ora per ogni x / H (ossia per -q.o. x X) si ha (Q
x
) = 0; dato che
P
x
Q
x
, la completezza di implica che per -q.o. x X risulta P
x
( e
(P
x
) = 0. Essendo poi h
x
(y) = 0 per ogni y / P
x
(ovvero per -q.o. y Y ),
otteniamo che per -q.o. x X si ha, grazie alla completezza di , che h
x
`e
(-misurabile e h
x
`e -q.o. nulla in Y . Un analogo risultato si ottiene per h
y
.
Ci` o prova che:
(a) per -q.o. x X si ha f
x
= g
x
-q.o. in Y ;
(b) per -q.o. y Y si ha f
y
= g
y
-q.o. in X.
Dato che g
x
`e (-misurabile e g
y
`e T-misurabile per il teorema 5.3.2, dalla
completezza di e segue (osservazione 3.2.2) la parte (i) del teorema.
Inoltre da (a) e (b) segue che
_
Y
f
x
d =
_
Y
g
x
d per -q.o. x X,
_
X
f
y
d =
_
X
g
y
d per -q.o. y Y,
e ci`o prova, sempre per il teorema 5.3.2 e losservazione 3.2.2, la parte (ii)
del teorema.
Inne la parte (iii) si ricava integrando rispettivamente su X e su Y le ultime
due uguaglianze, ed osservando che, poiche f e g coincidono -q.o. in
X Y , risulta
_
XY
f d =
_
XY
g d =
_
XY
g d .
Il teorema 5.4.2 `e completamente dimostrato.
Teorema 5.4.4 (di Fubini) Siano (X, T, ) e (Y, (, ) spazi misurati -
niti e completi, e sia f una funzione T (-misurabile e sommabile su X
Y . Allora:
(i) f
x
`e sommabile su Y per -q.o. x X e f
y
`e sommabile su X per -q.o.
y Y ;
132
(ii) la funzione x
_
Y
f
x
d `e sommabile su X e la funzione y
_
X
f
y
d
`e sommabile su Y ;
(iii) si hanno le uguaglianze
_
X
__
Y
f
x
d
_
d =
_
XY
fd =
_
Y
__
X
f
y
d
_
d.
Dimostrazione Per le funzioni f
+
e f

sono validi i risultati del teorema


5.4.2. Allora per sottrazione si ottiene che f
x
`e (-misurabile per -q.o. x X,
e che f
y
`e T-misurabile per -q.o. y Y ; inoltre le funzioni x
_
Y
(f
+
)
x
d
e x
_
Y
(f

)
x
d sono T-misurabili e le funzioni y
_
X
(f
+
)
y
d e y
_
X
(f

)
y
d sono (-misurabili, ed inne f
+
e f

vericano le uguaglianze
(iii) nelle quali, essendo f sommabile su XY , tutti gli integrali sono niti.
Dunque f
+
e f

(e, per sottrazione, anche f) vericano (ii): in particolare


(esercizio 4.2.7)
_
Y
f
x
d `e nito per -q.o. x X e
_
X
f
y
d `e nito per
-q.o. y Y . Di conseguenza, per -q.o. x X la funzione f
x
`e sommabile
su Y e per -q.o. y Y la funzione f
y
`e sommabile su X; dunque f verica
(i). Tornando a (iii), sottraendo le relazioni vericate da f
+
e da f

, il che
`e lecito trattandosi di quantit`a nite, si ottiene che f verica (iii).
Dalla proposizione 5.4.1 e dai due teoremi precedenti si deduce, in particolare,
che se f : R
2
R `e /
2
-misurabile e non negativa, oppure sommabile, allora
si ha
_
R
2
f dm
2
=
_
R
__
R
f(x, y)dm(y)
_
dm(x) =
_
R
__
R
f(x, y)dm(x)
_
dm(y).
Qesto fatto si estende in modo ovvio agli integrali in R
N
, i quali sono dun-
que decomponibili in N integrali iterati. Abbiamo dunque un metodo per il
calcolo eettivo degli integrali multipli, che naturalmente per funzioni con-
tinue su insiemi buoni si riduce al sistema consueto usato per gli integrali
multipli di Riemann, sia propri che impropri. Per questa ragione, gli inte-
grali rispetto alla misura di Lebesgue verranno dora in poi scritto nel modo
consueto:
_
D
f(x) dx anziche
_
D
f dm.
Esercizi 5.4
1. Si provi che se k, h N
+
e k +h = N allora le inclusioni
B
N
/
k
/
h
/
N
133
sono strette.
2. Sia c una -algebra di sottoinsiemi di R
N
contenente i boreliani, nonche
tutti gli insiemi E /
N
tali che m
N
(E) = 0. Si provi che c /
N
.
3. Per ogni E R poniamo E
t
= (x, y) R
2
: x y E. Provare che
se E / allora E
t
/
2
.
4. (Convoluzioni) Si provino i fatti seguenti:
(i) se f `e /-misurabile, allora (x, y) f(x y) `e /
2
-misurabile;
(ii) se f, g L
1
(R), allora la convoluzione f g, denita da
f g(x) =
_
R
f(x y)g(y)dy, x R,
`e una funzione di L
1
(R) e si ha |f g|
1
|f|
1
|g|
1
;
(iii) loperazione di convoluzione `e commutativa, associativa e distri-
butiva rispetto alla somma;
(iv) se f C
k
0
(R) e g L
1
(R), allora f g C
k
(R) e (f g)
(k)
= f
(k)
g.
5. Sia C

0
(R
N
) con 0, = 0 fuori della palla unitaria e
_
R
N
dm
N
= 1; per ogni > 0 sia

(x) =
1

N

_
x

_
. Per f L
1
(R
N
)
si ponga f

(x) = f

(x). Si provi che f

(R
N
), e che f

f in
L
1
(R
N
) per 0
+
; si mostri anche che se f `e uniformemente continua
su R
N
allora f

f uniformemente su R
N
.
6. Siano (X, T, ) e (Y, (, ) spazi misurati. Poniamo

(E) = inf
_

n=0
(A
n
)(B
n
) : E

_
n=0
(A
n
B
n
), A
n
T, B
n
(
_
.
(i) Si provi che

`e una misura esterna, ossia `e non negativa, monotona


e numerabilmente subadditiva.
(ii) Posto
c = E XY :

(A) =

(AE) +

(AE
c
) A XY ,
si provi che c `e una -algebra contenente i rettangoli misurabili
di X Y .
134
(iii) Si provi che la restrizione di

a c `e una misura completa.


(iv) Si provi che se e sono -nite, allora
c = T (, = .
7. Sia la misura costruita nellesercizio 5.4.6, essendo = m la misura
di Lebesgue in [0, 1] e la misura cardinalit`a in [0, 1] (esempio 5.3.4
(3)). Posto = (x, y) [0, 1]
2
: x = y, si provi che () = +.
[Traccia: supposto per assurdo () < , si provi che esistono
R
n
1, disgiunti, tali che

n
R
n
,

n
(R
n
) < e R
n
= A
n
A
n
con gli A
n
disgiunti e

n
A
n
= [0, 1]. Posto poi N
1
= n : m(A
n
) > 0,
si provi che 1 (A
n
) < per ogni n N
1
; se ne deduca che
m(

nN
1
A
n
) = 0 e quindi lassurdo.]
8. Sia f una funzione misurabile secondo Lebesgue in [a, b]. Si provi che
f L
1
(a, b) se e solo se la funzione G(x, y) = f(x)f(y) appartiene a
L
1
([a, b] [a, b]), e che in tal caso si ha
|G|
1
= |f|
2
1
.
135
Capitolo 6
Derivazione
6.1 Teorema fondamentale del calcolo inte-
grale
Vogliamo analizzare le connessioni fra lintegrazione secondo Lebesgue in R
e loperazione di derivazione di funzioni reali: in particolare, cercheremo un
analogo, per lintegrale di Lebesgue, di ci`o che `e il teorema fondamentale del
calcolo integrale rispetto allintegrazione secondo Riemann. Ricordiamo che
se f `e una funzione continua in [a, b], allora si ha
d
dx
_
x
a
f(t)dt = f(x) x [a, b],
e che se f `e una funzione di classe C
1
su [a, b] allora risulta
f(x) f(a) =
_
x
a
f
t
(t)dt x [a, b].
In altre parole, le operazioni di derivata e di integrale commutano fra loro
nellambito delle funzioni sucientemente regolari in [a, b] che si annullano
nel primo estremo.
Sia ora f L
1
(a, b). Posto F(x) =
_
x
a
f(t)dt, ci domandiamo:
(i) F `e derivabile, almeno q.o., in [a, b]?
(ii) Sar`a F
t
(x) = f(x), almeno q.o., in [a, b]?
136
Viceversa, se g `e derivabile in [a, b] e la sua derivata `e sommabile in [a, b], ci
chiediamo:
(iii) Risulter`a
_
x
a
g
t
(t)dt = g(x) g(a) in [a, b]?
Per rispondere a queste domande dovremo introdurre alcune nozioni ed alcu-
ne classi di funzioni interessanti di per se, sulle quali comunque insisteremo
soltanto lo stretto necessario. Gli sviluppi matematici che partono da questa
problematica sono innumerevoli, profondi ed assai ranati, ma al di l`a della
portata del nostro corso.
Esercizi 6.1
1. Stabilire in quali punti esiste la derivata della funzione
f(x) =
_
x
0

[
1
2
,
3
4
[
(t) dt, x [0, 1],
e calcolarla.
2. Per ogni n N, sia f
n
la funzione denita da
f
n
(x) = inf
_

x
m
10
n

: m N
_
, x [0, 1].
Si provi che la funzione
f(x) =

n=0
f
n
(x), x [0, 1],
`e continua, ma non `e derivabile in alcun punto di [0, 1].
[Traccia: si verichi che la serie `e uniformemente convergente. Fissato
poi x =

n=1

n
10
n
, ove
n
0, 1, . . . , 9 e lo sviluppo decimale `e
innito, per ogni k N
+
si ponga
x
k
=
_
x 10
k
se
k
= 4, 9
x + 10
k
se
k
= 0, 1, 2, 3, 5, 6, 7, 8.
Si verichi che f
n
(x) = f
n
(x
k
) per n k, mentre f
n
(x) f
n
(x
k
) =
(x x
k
) per n < k. Se ne deduca che f(x) f(x
k
) = p (x x
k
),
ove p, qualunque sia il suo segno, `e un intero con la stessa parit`a di
k 1; si concluda che, per k , x
k
x mentre p =
f(x
k
)f(x)
x
k
x
non
ha limite.]
137
6.2 Punti di Lebesgue
Data una qualunque funzione f sommabile su R
N
, N 1, le sue propriet`a
di misurabilit`a e di sommabilit`a non cambiano se essa viene modicata su
un insieme di misura nulla. In questo paragrafo ci poniamo il problema
di trovare, se possibile, una versione canonica di f, che ne ottimizzi la
regolarit`a buttando via, ad esempio, le discontinuit`a eliminabili.
Cominciamo con la seguente
Denizione 6.2.1 Sia f sommabile su R
N
. Un punto x R
N
si dice punto
di Lebesgue per f se f(x) R e
lim
r0
+
1
m
N
(B
r
)
_
B(x,r)
[f() f(x)[dm
N
= 0,
ove B(x, r) `e la palla di centro x e raggio r in R
N
e m
N
(B
r
) `e la sua misura
(ovviamente indipendente dal centro).
Osserviamo che se f `e continua, allora ogni punto x R
N
`e di Lebesgue
per f, ma per una generica f sommabile non `e detto a priori che i punti di
Lebesgue esistano. In eetti per`o si ha:
Teorema 6.2.2 Se f `e sommabile su R
N
, allora quasi ogni x R
N
`e punto
di Lebesgue per f.
Dimostrazione Per ogni x R
N
introduciamo le seguenti quantit`a:
A
r
f(x) =
1
m
N
(B
r
)
_
B(x,r)
[f() f(x)[dm
N
, r > 0,
Af(x) = limsup
r0
+
A
r
f(x),
Mf(x) = sup
r>0
1
m
N
(B
r
)
_
B(x,r)
[f[dm
N
.
Dobbiamo dimostrare che
m
N
(x R
N
: Af(x) > 0) = 0,
ed a questo scopo baster`a provare che
m

N
(x R
N
: Af(x) > t) = 0 t > 0,
138
in quanto da questo fatto e dalla subadditivit`a di m

N
segue che linsieme
x R
N
: Af(x) > 0 =
_
kN
+
_
x R
N
: Af(x) >
1
k
_
ha misura esterna nulla (e quindi `e misurabile, con misura nulla).
Sia dunque t > 0. Fissato n N
+
, sia g
n
C
0
0
(R
N
) una funzione tale che
|f g
n
|
1
<
1
n
(proposizione 4.7.5). Si noti che si ha Ag
n
0 in R
N
. Utilizzando il fatto
che
Af(x) A(f g
n
)(x) +Ag
n
(x) = A(f g
n
)(x),
possiamo scrivere
Af(x) A(f g
n
)(x)
limsup
r0
+
1
m
N
(B
r
)
_
B(x,r)
[f g
n
[dm
N
+[f(x) g
n
(x)[
M(f g
n
)(x) +[f(x) g
n
(x)[ n N
+
.
Ne segue
m

N
(x R
N
: Af(x) > 2t)
m
N
(x R
N
: M(f g
n
)(x) > t) +
+ m
N
(x R
N
: [f(x) g
n
(x)[ > t) ;
osserviamo che i due insiemi a secondo membro sono misurabili, il secondo
per la misurabilit`a di f e g
n
, il primo perche `e addirittura un aperto (esercizio
6.2.1).
Il secondo addendo si stima facilmente:
m
N
(x R
N
: [f(x) g
n
(x)[ > t)
1
t
|f g
n
|
1
n N
+
;
per maggiorare il primo addendo ci occorre un enunciato apposito.
Proposizione 6.2.3 Se L
1
(R
N
) e t > 0, allora
m
N
(x R
N
: M(x) > t)
3
N
t
||
1
.
139
Dimostrazione Sia K un arbitrario compatto contenuto nellinsieme x
R
N
: M(x) > t. Ogni punto x K `e allora il centro di una palla aperta
B
x
= B(x, r
x
) tale che
_
Bx
[[dm
N
> t m
N
(B
x
).
Dato che le palle B
x

xK
ricoprono K, esister`a una famiglia nita di palle
B
x
1
, . . . , B
xp
B
x

xK
tale che
K
p
_
i=1
B
x
i
.
Proveremo ora che si pu`o trovare una ulteriore sottofamiglia B
x
i
1
, . . . , B
x
i
k

contenuta in B
x
1
, . . . , B
xp
, ove B
x
i
j
= B(x
i
j
, r
i
j
), tale che:
(i) le palle B(x
i
j
, r
i
j
), j = 1, . . . k, sono tutte disgiunte;
(ii) K

k
j=1
B(x
i
j
, 3r
i
j
);
(iii) m
N
(K) 3
N

k
j=1
m
N
(B(x
i
j
, r
i
j
)).
Per provare ci`o, non `e restrittivo supporre che si abbia r
1
r
2
. . . r
p
. Sce-
gliamo i
1
= 1 e buttiamo via tutte le palle B(x
i
, r
i
) che intersecano B(x
i
1
, r
i
1
).
Sia ora B(x
i
2
, r
i
2
) la prima palla, secondo lordinamento degli indici, che `e
disgiunta da B(x
i
1
, r
i
1
) (ammesso che ci sia). Nuovamente, buttiamo via le
palle B(x
i
, r
i
), con i > i
2
, che intersecano B(x
i
2
, r
i
2
), e prendiamo come terza
palla B(x
i
3
, r
i
3
) la prima che `e disgiunta da B
(
x
i
2
, r
i
2
). Procedendo in questa
maniera, dopo un numero nito di passi esauriamo le palle a disposizione ed
il processo si arresta. Il risultato `e la famiglia B(x
i
1
, r
i
1
), . . . , B(x
i
k
, r
i
k
),
che per costruzione `e fatta di palle tra loro disgiunte. Dunque vale (i). Inol-
tre notiamo che se B(x
i
, r
i
) `e una della palle scartate, allora deve essere
B(x
i
, r
i
) B(x
i
j
, r
i
j
) ,= per qualche j = 1, . . . , k con i > i
j
; in particolare si
ha r
i
r
i
j
e di conseguenza B(x
i
, r
i
) B(x
i
j
, 3r
i
j
). La stessa inclusione vale
ovviamente se B(x
i
, r
i
) `e invece una delle palle B(x
i
j
, r
i
j
). Per larbitrariet`a
di B(x
i
, r
i
), si conclude che
K
p
_
i=1
B(x
i
, r
i
)
k
_
j=1
B(x
i
j
, 3r
i
j
),
140
ossia vale (ii). Inne, (iii) `e facile conseguenza di (ii) in quanto
m
N
(B(x
i
j
, 3r
i
j
)) = 3
N
m
N
(B(x
i
j
, r
i
j
)).
Dunque (denotando per semplicit`a con B
j
le palle B(x
i
j
, r
i
j
))
m
N
(K) 3
N
k

j=1
m
N
(B
j
)
3
N
t
k

j=1
_
B
j
[[dm
N
,
ed essendo le palle B
j
disgiunte, si conclude che
m
N
(K)
3
N
t
||
1
.
Questa disuguaglianza vale per ogni compatto K contenuto nellinsieme x
R
N
: M(x) > t; dato che ogni chiuso F R
N
`e unione al pi` u numerabile
dei compatti F B(0, k), k N
+
, la stessa disuguaglianza vale per ogni chiu-
so contenuto in x R
N
: M(x) > t. Poiche tale insieme `e misurabile, ne
segue la tesi.
Torniamo alla dimostrazione del teorema. Per quanto abbiamo visto, possia-
mo dedurre che
m

N
(x R
N
: Af(x) > 2t)
m
N
(x R
N
: M(f g
n
)(x) > t) +
+ m
N
(x R
N
: [f(x) g
n
(x)[ > t)

1 + 3
N
t
|f g
n
|
1
,
e dunque, per come si `e scelta g
n
,
m

N
(x R
N
: Af(x) > 2t)
1 + 3
N
nt
n N
+
.
Passando al limite per n otteniamo
m

N
(x R
N
: Af(x) > 2t) = 0,
da cui la tesi del teorema.
Dal teorema precedente otteniamo subito la risposta alle domande (i) e (ii)
che ci siamo posti alla ne del paragrafo 6.1.
141
Corollario 6.2.4 Se f `e sommabile in R, e F(x) =
_
x

f(t) dt, allora si


ha F
t
(x) = f(x) in ogni punto x di Lebesgue per f, ossia q.o. in R.
Dimostrazione Sia x un punto di Lebesgue per f. Per ogni successione
reale innitesima
n
, tale che
n
,= 0 per ogni n, si ha

F(x +
n
) F(x)

n
f(x)

n
_
x+n
x
f(t) dt f(x)

n
_
x+n
x
[f(t) f(x)[dt
1
[
n
[
_
x+[n[
x[n[
[f(t) f(x)[dt =
=
2
m(B(x, [
n
[))
_
B(x,[n[)
[f(t) f(x)[dt 0 per n
in virt` u della denizione 6.2.1. Per larbitrariet`a della successione
n
, si ha
la tesi.
Corollario 6.2.5 Se f `e sommabile in [a, b], allora
d
dx
_
x
a
f(t) dt = f(x) q.o. in [a, b].
Dimostrazione Basta prolungare f a 0 fuori di [a, b] ed applicare il corol-
lario precedente a f
[a,b]
.
Osservazione 6.2.6
`
E possibile denire la nozione di punto di Lebesgue
di un arbitrario elemento di L
1
(R
N
), e non solo di una arbitraria funzione
sommabile su R
N
; in altre parole, la denizione 6.2.1 pu`o essere modicata in
modo da dipendere solo dalla classe di equivalenza in L
1
, e non dal particolare
rappresentante. Questa variante `e descritta nellesercizio 6.2.2.
Esercizi 6.2
1. Provare che se f L
1
(R
N
) allora per ogni t > 0 linsieme
x R
N
: Mf(x) > t
`e aperto in R
N
.
2. Sia F L
1
(R
N
). Diciamo che un punto x R
N
`e di Lebesgue per F,
e scriviamo x L(F), se esistono y
x
R e g F tali che
lim
r0
+
1
m
N
(B
r
)
_
B(x,r)
[g y
x
[dm
N
= 0.
142
(i) Si provi che se x L(F) allora il limite sopra scritto `e 0 per ogni
h F.
(ii) Si provi che se g F e x `e punto di Lebesgue per g secondo la
denizione 6.2.1, allora x L(F); se ne deduca che R
N
L(F) ha
misura nulla.
(iii) Posto
f(x) =
_
y
x
se x L(F)
0 se x / L(F),
si provi che f F; si provi anche che se g F e x `e punto di
Lebesgue per g secondo la denizione 6.2.1, allora f(x) = g(x); se
ne deduca che L(F) `e lunione di tutti i punti di Lebesgue delle
g F, e che f `e il rappresentante canonico della classe F.
3. Dimostrare che se f L
1
(R
N
) allora f(x) Mf(x) q.o. in R
N
.
4. Se E R
N
`e un insieme misurabile, la densit`a di E nel punto x `e
denita da

E
(x) = lim
r0
+
m
N
(E B(x, r))
m
N
(B(x, r))
nei punti dove il limite esiste (si confronti con lesercizio 1.4.3). Si provi
che

E
(x) = 1 q.o. in E,
E
(x) = 0 q.o. in E
c
.
6.3 Derivabilit`a delle funzioni monotone
La risposta alla domanda (iii) che ci siamo posti nel paragrafo 6.1 `e, come
vedremo, alquanto articolata. Per cominciare, analizziamo a questo riguardo
il comportamento delle funzioni monotone.
Una funzione monotona in un intervallo [a, b] pu`o avere inniti punti di di-
scontinuit`a (ma mai pi` u di uninnit`a numerabile, come mostra lesercizio
6.3.1): un esempio `e la funzione f(x) =
[
1
x
]
1+[
1
x
]
, x [0, 1]. Nondimeno,
le funzioni monotone godono di una propriet`a sorprendente, espressa nel
fondamentale e classico risultato che andiamo ad esporre.
143
Teorema 6.3.1 (di derivazione di Lebesgue) Sia f : [a, b] R una
funzione monotona crescente. Allora f `e derivabile q.o. in [a, b], f
t
`e som-
mabile in [a, b] e
_
b
a
f
t
dm f(b) f(a).
Dimostrazione Tutto si basa sul seguente lemma di ricoprimento:
Lemma 6.3.2 (di Vitali) Sia E un sottoinsieme di R con m

(E) < , e
sia T una famiglia di intervalli chiusi dotati di queste propriet`a:
(a) T `e un ricoprimento di E;
(b) per ogni x E e per ogni > 0 esiste I T tale che x I e m(I) < .
Allora per ogni > 0 esistono I
1
, . . . , I
N
T, disgiunti, tali che
m

_
E
N
_
i=1
I
i
_
< .
Dimostrazione Sia A un aperto contenente E, tale che m(A) < ; si pu`o
supporre allora che sia I A per ogni I T. Costruiamo una sottofamiglia
disgiunta I
n

nN
+ T nel modo seguente. Scegliamo I
1
T in modo
arbitrario; se E I
1
, ci fermiamo perche il singolo intervallo I
1
soddisfa la
tesi del lemma, essendo m

(EI
1
) = m

() = 0. Altrimenti, esiste x EI
1
;
quindi, per le propriet`a (a) e (b), esiste almeno un intervallo I T tale che
I I
1
= . Posto allora
k
1
= supm(I) : I T, I I
1
= ,
si ha 0 < k
1
m(A) < . Si pu`o dunque scegliere I
2
T, disgiunto da I
1
,
tale che
m(I
2
) >
1
2
k
1
.
Induttivamente, costruiti I
1
, . . . I
n
disgiunti, e supposto che non risulti E

n
i=1
I
i
(nel qual caso avremmo ottenuto la tesi del lemma), si osserva che
per le propriet`a (a) e (b) esistono intervalli I T disgiunti da I
1
, . . . , I
n
.
Dunque, posto
k
n
= supm(I) : I T, I I
i
= per i = 1, . . . , n,
144
risulta 0 < k
n
k
n1
k
1
m(A) < . Pertanto si pu`o scegliere
I
n+1
T, disgiunto da I
1
, . . . , I
n
e tale che
m(I
n+1
) >
1
2
k
n
.
Se non accade mai che E

n
i=1
I
i
(nel qual caso abbiamo la tesi del lemma),
otteniamo una successione I
n
T costituita da intervalli disgiunti, ln-
esimo dei quali ha misura maggiore di
1
2
k
n
. Poiche

nN
+
I
n
A, si ha
anche

nN
+
m(I
n
) m(A) < .
Sia ora > 0: esiste N N
+
tale che

n=N+1
m(I
n
) <

5
.
Poniamo F = E

N
i=1
I
i
, e dimostriamo che si ha m

(F) < : ci`o concluder`a


la dimostrazione. Sia x F: poiche x non appartiene al chiuso

N
i=1
I
i
, esiste
I T tale che x I e I A

N
i=1
I
i
. Daltra parte, I deve intersecare
qualcuno degli I
n
con n > N, poiche in caso contrario per denizione di k
n
avremmo
m(I) k
n
< 2m(I
n+1
) n N
+
,
e dunque m(I) = 0, il che `e assurdo. Pertanto esiste n > N tale che I I
n
,=
e I I
k
= per k = 1, . . . , n. Detto x
n
il punto medio di I
n
, si ha allora
[x
n
x[ m(I) +
1
2
m(I
n
) k
n1
+
1
2
m(I
n
) < 2m(I
n
) +
1
2
m(I
n
) =
5
2
m(I
n
).
Indicando con J
n
lintervallo chiuso di centro x
n
e ampiezza quintupla di quel-
la di I
n
, risulta quindi x J
n
: abbiamo cos` mostrato che F

n=N+1
J
n
,
da cui
m

(F)

n=N+1
m(J
n
) = 5

n=N+1
m(I
n
) < .
Torniamo alla dimostrazione del teorema. Per x ]a, b[ consideriamo i quat-
tro numeri derivati (o derivate del Dini) cos` deniti:
D
+
f(x) = limsup
h0
+
f(x +h) f(x)
h
, D
+
f(x) = liminf
h0
+
f(x +h) f(x)
h
,
D

f(x) = limsup
h0

f(x +h) f(x)


h
, D

f(x) = liminf
h0

f(x +h) f(x)


h
.
145
Ovviamente si ha sempre D
+
f(x) D
+
f(x) e D

f(x) D

f(x); provere-
mo che per q.o. x ]a, b[ risulta D
+
f(x) = D
+
f(x) = D

f(x) = D

f(x) e
che per q.o. x ]a, b[ tale valore `e nito e quindi `e la derivata f
t
(x).
Per mostrare luguaglianza dei quattro numeri derivati baster`a far vedere che
D
+
f(x) D

f(x) q.o. in ]a, b[, D

f(x) D
+
f(x) q.o. in ]a, b[;
proveremo in eetti la prima disuguaglianza perche laltra `e del tutto analoga
(cambia solo il segno dellincremento h).
Sia
E = x ]a, b[: D
+
f(x) > D

f(x);
sar`a allora E =

,Q
E

, dove
E

=
_
se
x ]a, b[: D

f(x) < < < D


+
f(x) se < ;
quindi baster`a mostrare che
m

(E

) = 0 , Q con < .
Fissiamo > 0: allora esiste un aperto B, contenente E

, tale che m(B) <


m

(E

) +. Se x E

, si ha
D

f(x) = liminf
h0

f(x +h) f(x)


h
= liminf
h0
+
f(x) f(x h)
h
< ,
quindi per ogni > 0 esiste h

]0, ] tale che


[x h

, x] B, f(x) f(x h

) < h

.
La famiglia di intervalli [x h

, x] : x E

, > 0 `e un ricoprimento di
E

che verica le ipotesi del lemma di Vitali ed `e costituito da sottoinsiemi


di B. Dal lemma 6.3.2 segue che esistono [x
1
h
1
, x
1
], . . . , [x
N
h
N
, x
N
]
disgiunti, tali che
N
_
i=1
[x
i
h
i
, x
i
] B, m

_
E


N
_
i=1
[x
i
h
i
, x
i
]
_
< .
Perci`o laperto A =

N
i=1
]x
i
h
i
, x
i
[ `e contenuto in B e verica m

(EA) < ;
inoltre si ha, applicando ad A la denizione di misurabilit`a:
m

(A E

) = m

(E

) m

(E

A) > m

(E

) .
146
Consideriamo ora linsieme A E

e ripetiamo lo stesso ragionamento: se


y A E

si ha
D
+
f(x) = limsup
k0
+
f(x +k) f(x)
k
> ,
quindi per ogni > 0 esiste k

]0, ] tale che


[y, y +k

] A, f(y +k

) f(y) > k

.
La famiglia di intervalli [y, y +k

] : y AE

, > 0 `e un ricoprimento di
AE

che verica le ipotesi del lemma di Vitali ed `e costituita da sottoin-


siemi di A. Dal lemma 6.3.2 segue che esistono [y
1
, y
1
+k
1
], . . . , [y
M
, y
M
+k
M
]
disgiunti, tali che
M
_
j=1
[y
j
, y
j
+k
j
] A, m

_
(A E

)
M
_
j=1
[y
j
, y
j
+k
j
]
_
< .
Perci`o laperto C =

M
j=1
]y
j
, y
j
+ k
j
[ `e contenuto in A e verica m

((A
E

) C) < . Tenuto conto della precedente stima per m

(A E

), ne
deduciamo, per la misurabilit`a di C,
m(C) m

(C A E

) = m

(A E

) m

((A E

) C) >
> m

(A E

) > m

(E

) 2,
da cui
M

j=1
(f(y
j
+k
j
) f(y
j
)) >
M

j=1
k
j
= m(C) (m

(E

) 2).
Daltra parte, essendo C A, per ogni ssato j 1, . . . , M esiste un unico
i 1, . . . , N tale che ]y
j
, y
j
+ k
j
[]x
i
h
i
, x
i
[; dal fatto che f `e crescente
segue allora
M

j=1
(f(y
j
+k
j
) f(y
j
))
N

i=1
(f(x
i
) f(x
i
h
i
)),
il che implica
(m

(E

) 2) < (m

(E

) +),
147
cio`e
m

(E

) <
+ 2

.
Poiche `e arbitrario, si ottiene che m

(E

) = 0. Ne segue che E =

,Q
E

ha misura esterna nulla, ossia risulta D


+
f(x) D

f(x) q.o.
in ]a, b[, come si voleva dimostrare. In modo analogo, come gi`a osservato, si
trova che D

f(x) D
+
f(x) q.o. in ]a, b[.
Abbiamo mostrato che per q.o. x ]a, b[ esiste la funzione
g(x) = lim
h0
g(x +h) g(x)
h
;
resta da far vedere che [g(x)[ < per q.o. x ]a, b[.
Dopo aver esteso la funzione f oltre b ponendo f(x) = f(b) per ogni x b,
deniamo per ogni n N
+
g
n
(x) =
f(x +
1
n
) f(x)
1
n
, x [a, b].
Chiaramente, g
n
(x) g(x) q.o. in [a, b]; inoltre le g
n
sono misurabili (perche
tale `e f, essendo monotona), e dunque g `e una funzione misurabile, oltre che
non negativa dal momento che f `e crescente. Dal lemma di Fatou segue
perci`o
_
b
a
g dm liminf
n
_
b
a
f(x +
1
n
) f(x)
1
n
dm =
= liminf
n
n
_
_
b+
1
n
a+
1
n
f dm
_
b
a
f dm
_
=
= liminf
n
n
_
_
b+
1
n
b
f dm
_
a+
1
n
a
f dm
_

liminf
n
n
_
_
b+
1
n
b
f(b) dm
_
a+
1
n
a
f(a) dm
_
= f(b) f(a).
Quindi g `e sommabile in [a, b] e in particolare g `e q.o. nita in [a, b]. Ci`o
signica che f `e q.o. derivabile in [a, b] e che f
t
`e sommabile: in particolare
_
b
a
f
t
dm f(b) f(a).
Ci` o conclude la dimostrazione del teorema di Lebesgue.
148
Osservazioni 6.3.3 (1) La disuguaglianza
_
b
a
f
t
dm f(b) f(a) pu`o es-
sere stretta, come si vedr`a; nel paragrafo 6.5 caratterizzeremo la classe delle
funzioni per le quali vale il segno di uguaglianza.
(2) Se f `e monotona decrescente, applicando il teorema di Lebesgue a f si
ottiene che f `e derivabile q.o., che f
t
`e sommabile e che
_
b
a
f
t
dm f(b)f(a).
Esercizi 6.3
1. Si provi che se f : R R `e una funzione monotona, allora f ha al pi` u
uninnit`a numerabile di punti di discontinuit`a.
2. Si costruisca una funzione f : [0, 1] R monotona e discontinua in
ogni punto di Q [0, 1].
3. Si calcolino i quattro numeri derivati nel punto 0 per la funzione
f(x) =
_
0 se x = 0
x sin
1
x
se x ,= 0.
4. Si verichi che, assegnati a < b e c < d, la funzione
f(x) =
_

_
ax sin
2 1
x
+bx cos
2 1
x
se x > 0
0 se x = 0
cx sin
2 1
x
+dx cos
2 1
x
se x < 0
soddisfa D
+
f(0) = a, D
+
f(0) = b, D

f(0) = c, D

f(0) = d.
5. Si calcolino i quattro numeri derivati nel generico punto x R per la
funzione
R\Q
.
6. Provare che se f : R R `e continua, allora le funzioni D
+
f, D
+
f,
D

f e D

f sono misurabili rispetto alla misura di Lebesgue.


7. Siano f, g : R R. Dimostrare che se esiste f
t
(x), allora
D
+
(f +g)(x) = f
t
(x) +D
+
g(x),
e che analoghi risultati valgono per gli altri numeri derivati.
8. Fornire un esempio nel quale risulti D
+
(f +g) ,= D
=
f +D
+
g.
149
6.4 Funzioni a variazione limitata
Questo paragrafo `e dedicato alla descrizione di unimportante classe di fun-
zioni: quelle a variazione limitata.
Denizione 6.4.1 Sia f : [a, b] R. Per ogni partizione : a = x
0
< x
1
<
. . . < x
k
= b di [a, b] poniamo
t
b
a
(f, ) =
k

i=1
[f(x
i
) f(x
i1
)[ ;
la quantit`a
T
b
a
(f) = sup

t
b
a
(f, )
si chiama variazione totale di f in [a, b]. Se T
b
a
(f) < diciamo che f `e a
variazione limitata in [a, b], e scriviamo f BV [a, b].
Osservazioni 6.4.2 (1) Ogni funzione monotona in [a, b] `e a variazione
limitata in [a, b] e si ha
T
b
a
(f) = [f(b) f(a)[.
(2) BV [a, b] `e uno spazio vettoriale: infatti se f, g BV [a, b] e , R si
ha, come `e facile vericare,
T
b
a
(f +g) [[T
b
a
(f) +[[T
b
a
(g).
(3) Ogni funzione di BV [a, b] `e limitata in [a, b]: infatti se f BV [a, b] si
ha
[f(x)[ [f(a)[ +[f(x) f(a)[
[f(a)[ +[f(b) f(x)[ +[f(x) f(a)[ [f(a)[ +T
b
a
(f).
Daltra parte ovviamente esistono funzioni limitate che non sono a variazione
limitata: ad esempio la funzione
A
, ove A =
1
n

nN
+, `e limitata in [0, 1]
ma non sta in BV [0, 1]. Infatti per ogni N N
+
, scelta la partizione
N
:
0 <
1
N
<
1
N1/2
<
1
N1
<
1
N3/2
< . . . <
1
2
<
1
21/2
< 1, lincremento di f
da un nodo al successivo `e sempre 1, e quindi t
1
0
(
A
,
N
) = 2N; ne segue
T
1
0
(
A
) = +.
La variazione totale di una funzione `e additiva rispetto alle decomposizioni
di [a, b] in sottointervalli adiacenti. Si ha infatti:
150
Proposizione 6.4.3 Se f BV [a, b], allora
T
b
a
(f) = T
c
a
(f) +T
b
c
(f) c ]a, b[.
Dimostrazione () Per ogni partizione di [a, b], laggiunta del nodo c
determina due partizioni
1
di [a, c] e
2
di [c, b], la cui unione `e . Si ha
allora
t
b
a
(f, ) t
c
a
(f,
1
) +t
b
c
(f,
2
) T
c
a
(f) +T
b
c
(f),
e quindi, per larbitrariet`a di ,
T
b
a
(f) T
c
a
(f) +T
b
c
(f).
() Per ogni coppia di partizioni
1
di [a, c] e
2
di [c, b], la loro unione `e
una partizione di [a, b] contenente il nodo c: ne segue
t
c
a
(f,
1
) +t
b
c
(f,
2
) = t
b
a
(f, ) T
b
a
(f),
e per larbitrariet`a di
1
e
2
,
T
c
a
(f) +T
b
c
(f) T
b
a
(f).
Ladditivit`a della variazione totale ci permette di arrivare al risultato che
segue, che `e il punto chiave della teoria delle funzioni a variazione limitata.
Corollario 6.4.4 Sia f : [a, b] R. Allora f BV [a, b] se e solo se f `e
dierenza di due funzioni crescenti in [a, b].
Dimostrazione (=) Poiche le funzioni crescenti in [a, b] sono a variazione
limitata, la tesi segue dal fatto che BV [a, b] `e uno spazio vettoriale.
(=) La funzione x T
x
a
(f) `e crescente in [a, b]: infatti, per la proposizione
precedente,
T
y
a
(f) = T
x
a
(f) +T
y
x
(f) T
x
a
(f) se y > x.
Si osservi inoltre che T
a
a
(f) = 0.
Daltra parte, anche la funzione x T
x
a
(f)f(x) `e crescente in [a, b], perche
se y > x si ha, ancora dalla proposizione 6.4.3,
f(y) f(x) [f(y) f(x)[ T
y
x
(f) = T
y
a
(f) T
x
a
(f).
151
Quindi, scrivendo
f(x) = T
x
a
(f) (T
x
a
(f) f(x)),
si ha la tesi.
Da questo corollario e dal teorema di derivazione di Lebesgue (teorema 6.3.1)
segue subito:
Corollario 6.4.5 Ogni funzione f BV [a, b] `e derivabile q.o., e la derivata
f
t
`e sommabile in [a, b].
Esercizi 6.4
1. Si provi che
|f|
BV [a,b]
= sup
x[a,b]
[f(x)[ +T
b
a
(f)
`e una norma nello spazio BV [a, b], e che BV [a, b] con questa norma `e
completo. Si provi inoltre che BV [a, b] non `e chiuso in /

(a, b).
2. Calcolare la variazione totale delle seguenti funzioni:
(i) f(x) = x(x
2
1), x [2, 2];
(ii) f(x) = 3
[0,1/2]
(x) 6
[1/4,3/4]
(x), x [0, 1];
(iii) f(x) = sin x, x [0, 2];
(iv) f(x) = x [x], x [50, 50].
3. Sia g(x) =

x, x [0, 1], e sia f : [0, 1] R denita da:
f(x) =
_
1
n
2
se x
_
1
n
,
1
n
+
1
n
2

, n 2,
0 se x [0, 1]

n=2
_
1
n
,
1
n
+
1
n
2

.
(i) Provare che f, g BV [0, 1] e calcolarne le rispettive variazioni
totali.
(ii) Dimostrare che g f / BV [0, 1].
4. Siano f, g BV [a, b]. Provare che f g, f g BV [a, b].
152
5. Sia f C[a, b]. Si provi che f BV [a, b] se e solo se il graco di f `e
una curva retticabile, e che in tal caso si ha
T
b
a
(f) () T
b
a
(f) +b a.
6. Sia f : [a, b] R una funzione continua e monotona e sia
f
il suo
graco.
(i) Si verichi che
_
(b a)
2
+[f(b) f(a)[
2
(
f
) b a +[f(b) f(a)[.
(ii) Si determinino le funzioni f continue e monotone per le quali
(
f
) =
_
(b a)
2
+[f(b) f(a)[
2
.
(iii) Si trovi una classe di funzioni f continue e monotone per le quali
(
f
) = b a +[f(b) f(a)[.
7. Sia f BV [a, b]; si dimostri che f `e continua in x
0
[a, b] se e solo se
x T
x
a
(f) `e continua in x
0
.
8. Siano f, g BV [a, b]. Si provi che fg BV [a, b] e che (v. esercizio
6.4.1)
|fg|
BV [a,b]
|f|
BV [a,b]
|g|
BV [a,b]
.
9. Siano f, g BV [a, b], con g ,= 0 in [a, b]. Provare che se inf
[a,b]
[g[ > 0
allora
f
g
BV [a, b].
`
E vero il viceversa?
10. Siano f : [a, b] R e g : [c, d] [a, b], con g strettamente crescente.
Provare che se f BV [a, b], allora f g BV [c, d].
6.5 Funzioni assolutamente continue
Introduciamo adesso una classe di funzioni allinterno della quale sar`a possi-
bile dare una risposta positiva alla domanda (iii) del paragrafo 6.1.
153
Denizione 6.5.1 Una funzione f : [a, b] R `e detta assolutamente conti-
nua in [a, b], e scriveremo f AC[a, b], se per ogni > 0 esiste > 0 tale che
per ogni collezione nita di intervalli disgiunti ]
i
,
i
[, i = 1, . . . , k, contenuti
in [a, b] e vericanti

k
i=1
(
i

i
) < , risulta

k
i=1
[f(
i
) f(
i
)[ < .
Osservazioni 6.5.2 (1)
`
E immediato vericare che se f `e assolutamente
continua, allora la condizione richiesta dalla denizione `e soddisfatta anche
nel caso di famiglie innite di intervalli disgiunti.
(2) Se f `e assolutamente continua in [a, b], allora ovviamente f `e anche con-
tinua in [a, b]; il viceversa, come vedremo nellesempio 6.5.6, non `e vero.
(3) Se g L
1
(a, b), allora la funzione f(x) =
_
x
a
g(t) dt appartiene ad
AC[a, b], a causa dellassoluta continuit`a dellintegrale (proposizione 4.5.6).
Tutte le funzioni assolutamente continue in [a, b] hanno necessariamente
variazione limitata in [a, b], come mostra la seguente
Proposizione 6.5.3 Risulta AC[a, b] BV [a, b].
Linclusione `e ovviamente propria, dato che esistono funzioni discontinue a
variazione limitata; ad esempio,
[1,2]
BV [0, 3] con T
3
0
(
[1,2]
) = 2.
Dimostrazione Sia f AC[a, b]. Scelto = 1, sia il corrispondente
numero con il quale la f verica la denizione 6.5.1. Dividiamo [a, b] in N
parti uguali di ampiezza
ba
N
< , e poniamo x
n
= a +
n
N
(b a), 0 n N.
Risulta allora, per costruzione,
T
x
n+1
xn
(f) 1, n = 0, 1, . . . , N 1.
Dunque, per la proposizione 6.4.3 si ha
T
b
a
(f) =
N1

n=0
T
x
n+1
xn
(f) N < .
In particolare, dal corollario 6.4.5 segue che ogni funzione assolutamente con-
tinua in [a, b] `e derivabile q.o. con derivata sommabile in [a, b]. Vericheremo
fra breve che per tali funzioni f lintegrale della derivata vale esattamente
f(b) f(a). Intanto osserviamo che il risultato del corollario 6.4.4 si pu`o
ulteriormente precisare:
154
Corollario 6.5.4 Sia f : [a, b] R. Allora f AC[a, b] se e solo se f `e
dierenza di due funzioni assolutamente continue e crescenti in [a, b].
Dimostrazione (=)
`
E suciente osservare che AC[a, b] `e uno spazio
vettoriale.
(=) Per il corollario 6.4.4 si ha
f(x) = T
x
a
(f) (T
x
a
(f) f(x)),
e le due funzioni a secondo membro sono crescenti in [a, b]. Baster`a allora
provare che x T
x
a
(f) appartiene ad AC[a, b].
Sia > 0 e sia il numero fornito dalla denizione 6.5.1 applicata a f. Sia
]
i
,
i
[
1iN
una famiglia di sottointervalli disgiunti di [a, b] con

N
i=1
(
i

i
) < , e per ogni i sia
i
una partizione di ]
i
,
i
[; allora risulta, grazie
allassoluta continuit`a di f,
N

i=1
t

i
(f,
i
) < ;
di conseguenza, per larbitrariet`a delle partizioni
i
,
N

i=1
_
T

i
a
(f) T

i
a
(f)
_
=
N

i=1
T

i
(f) ,
e ci`o prova la tesi.
Il teorema che segue caratterizza la classe delle funzioni assolutamente con-
tinue proprio in termini della propriet`a (iii) del paragrafo 6.1.
Teorema 6.5.5 Sia f : [a, b] R una funzione continua. Sono fatti equi-
valenti:
(i) f AC[a, b];
(ii) f `e derivabile q.o. in [a, b], f
t
`e sommabile in [a, b] e
f(x) f(a) =
_
x
a
f
t
(t) dt x [a, b].
155
Dimostrazione [(i) = (ii)] Sappiamo gi`a che f `e derivabile q.o. in
[a, b]; dobbiamo solo provare luguaglianza sopra scritta. A questo scopo,
ricordando il corollario 6.5.4, possiamo supporre che f sia crescente in [a, b].
Essendo f crescente, esiste la misura di Lebesgue-Stieltjes
f
associata a f,
introdotta nellesempio 2.1.3(3) e ben denita grazie alla continuit`a di f:
proviamo che
f
`e denita su / e che
f
m (denizione 4.5.1).
Sia E / con m(E) = 0. Fissiamo > 0; scelto > 0 in modo da
soddisfare la denizione di assoluta continuit`a di f, esiste un aperto A E
tale che m(A) < . Per lesercizio 1.3.3, sar`a A =

n
]
n
,
n
[ con gli ]
n
,
n
[
disgiunti; poiche f `e crescente, da

n
(
n

n
) < segue

n
(f(
n
)
f(
n
)) < . Quindi

f
(E)
f
(A)

f
([
n
,
n
[) =

n
(f(
n
) f(
n
)) < .
Dato che `e arbitrario, si ottiene

f
(E) = 0; quindi, per la completezza di

f
, si ha E /
f
e
f
(E) = 0. Poiche ogni insieme G / `e lunione di un
boreliano B e di un insieme E / di misura nulla, ne segue G = B E
/
f
; quindi / /
f
, ossia
f
`e denita su /. Inoltre, come si `e visto, se
m(E) = 0 allora
f
(E) = 0. Ci`o prova che
f
m.
Adesso facciamo uso del teorema di Radon-Nikodym, gi`a citato nel paragrafo
4.5, e che verr`a dimostrato nel capitolo 8 in modo ovviamente indipendente
dalla teoria svolta n qui; in base a questo risultato (che certamente vale per
misure nite) possiamo concludere che esiste una funzione h L
1
(a, b), q.o.
non negativa, tale che

f
(E) =
_
E
h(t) dt E /.
In particolare
f(x) f(a) =
f
([a, x[) =
_
x
a
h(t) dt x [a, b];
applicando allora il corollario 6.2.5 si ottiene che f `e derivabile q.o. in [a, b]
(cosa che gi`a sapevamo), e che f
t
= h q.o. in [a, b] (fatto nuovo). Quindi
possiamo sostituire nellintegrale h con f
t
, e pertanto vale (ii).
[(ii) = (i)] La misura , denita da (E) =
_
E
[f
t
(t)[dt, `e assolutamente
continua rispetto a m in quanto f
t
L
1
(a, b); dato che entrambe le misure
156
sono nite, in virt` u della proposizione 4.5.5 per ogni > 0 esiste > 0 tale
che
m(E) < =
_
E
[f
t
(t)[dt < .
In particolare, quindi, se ]
i
,
i
[
i=1,...,k
`e una collezione nita di sottointer-
valli disgiunti di [a, b] tale che

k
i=1
(
i

i
) < , risulter`a
k

i=1
[f(
i
) f(
i
)[ =

i=1
_

i

i
f
t
(t)dt

i=1
_

i

i
[f
t
(t)[dt < ,
il che mostra che f AC[a, b]. Ci`o prova (i).
Non tutte le funzioni continue in [a, b] sono assolutamente continue in [a, b],
come mostra il sorprendente esempio che segue: esistono funzioni continue,
crescenti, q.o. derivabili, con derivata q.o. nulla, e tuttavia non costanti.
Funzioni di questo tipo non possono essere assolutamente continue a causa
del teorema 6.5.5, ma sono certamente a variazione limitata: per tali funzioni,
in particolare, la disuguaglianza del teorema 6.3.1 `e stretta.
Esempio 6.5.6 Sia C linsieme ternario di Cantor C
1/3
introdotto nel para-
grafo 1.6: si ha
C =

nN
+
E
n
, E
n
E
n+1
, E
n
=
2
n
_
k=1
J
kn
,
dove gli J
kn
sono intervalli chiusi disgiunti con m(J
kn
) = 3
n
. Deniamo per
ogni n N
+
g
n
(x) =
_
3
2
_
n

En
(x), f
n
(x) =
_
x
0
g
n
(t)dt, x [0, 1].
Si noti che
_
J
kn
g
n
(t)dt =
_
3
2
_
n
m(J
kn
) =
1
2
n
,
_
J
kn
g
n+1
(t)dt =
_
3
2
_
n+1
m(J
kn
E
n+1
) =
_
3
2
_
n+1
2
3
n+1
=
1
2
n
,
Risulta allora
f
n
(0) = 0, f
n
(1) =
_
3
2
_
n
m(E
n
) = 1;
157
inoltre se x E
c
n
vale luguaglianza
f
n+1
(x) =
_
x
0
g
n+1
(t)dt =
_
x
0
g
n
(t)dt = f
n
(x)
(perche si integra solo sugli intervalli J
kn
contenuti in [0, x], dove gli integrali
di g
n
e g
n+1
coincidono), mentre invece se x E
n
, ad esempio x J
kn
, vale
la stima
[f
n+1
(x) f
n
(x)[ =

_
x
0
[g
n+1
(t) g
n
(t)]dt

_
J
kn
[g
n+1
(t) g
n
(t)[dt

_
J
kn
[g
n+1
(t) +g
n
(t)]dt =
1
2
n1
(perche gli integrali fra 0 ed il primo estremo di J
kn
si cancellano). In
denitiva
sup
x[0,1]
[f
n+1
(x) f
n
(x)[
1
2
n1
n N
+
,
cosicche la successione f
n
converge uniformemente in [0, 1] ad una funzione
f. Poiche le f
n
sono continue e crescenti, anche f `e continua e crescente, e
verica f(0) = 0, f(1) = 1. Inoltre, dato che f
n
`e costante su ogni intervallo
disgiunto da E
n
, si ha f
t
n
= 0 in E
c
n
ed a maggior ragione f
t
m
= 0 in E
c
n
per ogni m n, visto che in tal caso E
c
m
E
c
n
; quindi se I `e un intervallo
contenuto in

n=1
E
c
n
, ossia disgiunto da C, si ha f
n
f uniformemente in
I e f
t
n
= 0 denitivamente in I: ci`o implica che f `e derivabile con f
t
= 0 in
I. Pertanto f `e derivabile con f
t
= 0 in C
c
, ossia q.o. in [0, 1] (dal momento
che C ha misura nulla).
Come si `e gi`a osservato, f / AC[0, 1] perche
1 = f(1) f(0) >
_
1
0
f
t
(t) dt = 0.
La funzione f `e chiamata funzione di Lebesgue o anche, pi` u informalmente,
scala del diavolo.
Esercizi 6.5
1. Provare che se f, g AC[a, b], allora f g, f g AC[a, b].
158
2. Sia f crescente ed assolutamente continua in [a, b]. Posto f(x) = f(b)
per x > b e f(x) = f(a) per x < a, si verichi che la misura di
Lebesgue-Stieltjes
f
su R `e data da

f
(E) =
_
E
f
t
(t) dt E /.
3. Sia f AC[a, b]; si provi che per ogni E [a, b] misurabile con m(E) =
0 si ha m

(f(E)) = 0; si provi inoltre che per ogni E [a, b] misurabile


linsieme f(E) `e misurabile.
4. Sia f crescente e continua a sinistra in [a, b] e sia
f
la misura di
Lebesgue-Stieltjes associata a f. Si provi che
f
m se e solo se
f AC[a, b].
5. Si provi che
|f|
AC[a,b]
= sup
x[a,b]
[f(x)[ +
_
b
a
[f
t
(t)[dt
`e una norma nello spazio AC[a, b], e che AC[a, b] con questa norma `e
completo. Si provi inoltre che AC[a, b] non `e chiuso in C[a, b].
6. Sia f AC[a, b]; si provi che T
b
a
(f) = |f
t
|
L
1
(a,b)
, e se ne deduca che
AC[a, b] `e un sottospazio chiuso di BV [a, b].
[Traccia: Per provare che T
b
a
(f) |f
t
|
L
1
(a,b)
si utilizzi il fatto che le
funzioni costanti a tratti sono dense in L
1
(a, b).]
7. Sia f : [a, b] R. Si provi che f `e lipschitziana su [a, b] se e solo se
f AC[a, b] e f
t
L

(a, b).
8. Sia
f(x) =
_
x

sin x

se 0 < x 1
0 se x = 0.
Si provi che se 0 < < allora f AC[0, 1], mentre se 0 <
allora f / BV [0, 1].
9. Siano f AC[a, b] e g AC[c, d], con f([a, b]) [c, d]. Si provi che:
(i) se f `e monotona, allora g f AC[a, b];
159
(ii) se g `e lipschitziana, allora g f AC[a, b];
(iii) per f(x) = x
2
[ sin 1/x[ e g(x) = x
1/2
si ha f, g AC[0, 1] ma
g f / AC[0, 1].
10. Sia f : [a, b] R. Si dimostri che:
(i) se f AC[, 1] per ogni ]0, 1[ e f `e continua in 0, allora non `e
detto che f AC[0, 1];
(ii) se f AC[, 1] per ogni ]0, 1[, f BV [0, 1] e f `e continua in 0,
allora f AC[0, 1];
(iii) se f AC[, 1] per ogni ]0, 1[, f
t
L
1
(0, 1) e f `e continua in
0, allora f AC[0, 1].
11. Siano f, g AC[a, b]. Si provi che fg AC[a, b] e che vale la formula
di integrazione per parti
_
b
a
f(t)g
t
(t) dt +
_
b
a
f
t
(t)g(t) dt = f(b)g(b) f(a)g(a).
12. Provare che una funzione f : R R `e della forma f(x) =
_
x

g(t) dt,
con g L
1
(R), se e solo se
f AC[a, a] a > 0, lim
a+
T
a
a
(f) < , lim
x
f(x) = 0.
13. (i) Siano F AC[a, b] e C
1
(R). Si provi che F AC[a, b].
(ii) Si dimostri che per ogni p [1, [ e f L
1
(a, b) esiste g L
1
(a, b)
tale che
__
x
a
[f(t)[dt
_
p
=
_
x
a
g(t)dt x [a, b].
14. Sia f la funzione di Lebesgue dellesempio 6.5.6; si provi che, detto
il suo graco, risulta
() = 2
(si confronti questo risultato con quello degli esercizi 6.4.5 e 6.4.6).
160
15. Sia f la funzione di Lebesgue dellesempio 6.5.6; si provi che f `e holde-
riana di esponente
log 2
log 3
.
[Traccia: posto =
log 2
log 3
, e dati x, y [0, 1], sia n N tale che
3
n1
< [x y[ 3
n
; si provi che allora [f(x) f(y)[ 2
n
. Osser-
vato che 2 3

= 1, si deduca che [f(x) f(y)[ 3

[x y[

per ogni
x, y [0, 1].]
6.6 Cambiamento di variabile
Per lintegrale di Riemann la formula del cambiamento di variabile
_
g(b)
g(a)
f(x) dx =
_
b
a
f(g(t))g
t
(t) dt
vale per ogni f continua in un intervallo [c, d] e per ogni funzione g : [a, b]
[c, d] di classe C
1
. Ci chiediamo ora se questa formula si possa estendere
al caso dellintegrale di Lebesgue, e sotto quali condizioni ci`o sia possibile.
Proveremo il seguente risultato:
Teorema 6.6.1 Sia f L
1
(c, d) e sia g : [a, b] [c, d] una funzione deriva-
bile q.o. in [a, b]. Posto F(x) =
_
x
c
f()d per x [c, d], i seguenti fatti sono
equivalenti:
(i) (f g)g
t
L
1
(a, b) e
_
g(v)
g(u)
f(x) dx =
_
v
u
f(g(t))g
t
(t) dt u, v [a, b];
(ii) F g AC[a, b].
In tal caso risulta (F g)
t
= (f g)g
t
q.o. in [a, b].
Per dimostrare il teorema faremo uso di tre lemmi preliminari.
Lemma 6.6.2 Sia g : [a, b] R una funzione derivabile in ogni punto di
un sottoinsieme E [a, b]. Se risulta [g
t
(x)[ per ogni x E, allora
m

(g(E)) m

(E).
161
Dimostrazione Sia > 0. Per ogni n N
+
poniamo
E
n
=
_
x E : [g(t) g(x)[ ( +)[t x[ t
_
x
1
n
, x +
1
n
_
[a, b]
_
.
Allora risulta
E
n
E
n+1
n N

, E =
_
nN
+
E
n
.
Per ogni n N
+
consideriamo un ricoprimento I
jn

jN
di E
n
, fatto da
intervalli di lunghezza minore di
1
n
, tale che

jN
m(I
jn
) < m

(E
n
) +.
Si ha allora, per denizione di E
n
e per il fatto che m(I
jn
) <
1
n
,
m

(g(E
n
))

jN
m

(g(E
n
I
jn
)) (+)

jN
m(I
jn
) < (+)(m

(E
n
)+);
passando inne al limite per n , e ricordando lesercizio 1.7.2, otteniamo
m

(E) = m

_
_
nN
+
g(E
n
)
_
= lim
n
m

(g(E
n
))
( +)
_
lim
n
m

(E
n
) +
_
= ( +) [m

(E) +] ,
da cui la tesi del lemma per larbitrariet`a di .
Lemma 6.6.3 Sia g : [a, b] R una funzione, e sia E [a, b] un insieme
tale che g sia derivabile in ogni punto x E. Allora si ha m

(g(E)) = 0 se
e solo se g
t
= 0 q.o. in E.
Dimostrazione (=) Sia g
t
= 0 q.o. in E. Poniamo
E
0
= x E : g
t
(x) = 0, E
k
= x E : k1 < [g
t
(x)[ k k N
+
.
Per il lemma 6.6.2 si ha m

(g(E
0
)) = 0 ed anche
m

(g(E E
0
))

kN
+
m

(g(E
k
))

kN
+
km

(E
k
) = 0,
162
da cui m

(g(E)) = 0.
(=) Sia m

(g(E)) = 0: Posto B = x E : g
t
(x) ,= 0, sar`a B =

n=1
B
n
,
ove
B
n
=
_
x E : [g(t) g(x)[
1
n
[t x[ x
_
x
1
n
, x +
1
n
_
[a, b]
_
.
Fissato n N
+
, sia A = B
n
I, ove I `e un qualunque sottointervallo di [a, b]
di lunghezza minore di
1
n
. Se dimostriamo che m(A) = 0, avremo m(B
n
) = 0
a causa dellarbitrariet`a di I; dunque, essendo arbitrario anche n, otterremo
m(B) = 0, cio`e la tesi. Proviamo in denitiva che m(A) = 0.
Sia > 0: dato che m(g(A)) m(g(E)) = 0, esiste un ricoprimento I
j

jN
di g(A), fatto di intervalli, tale che

jN
m(I
j
) < . Poiche A g(g
1
(A))

jN
g
1
(I
j
), denendo U
j
= g
1
(I
j
) A avremo anche A =

jN
U
j
. Perci`o
m

(A)

jN
m

(U
j
)

jN
sup
t,xU
j
[t x[
_
per denizione di B
n
, essendo U
j
I B
n
e m(I)
1
n
_

jN
n sup
t,xU
j
[g(t) g(x)[ (essendo g(U
j
) I
j
)

jN
n m(I
j
) < n,
ove `e arbitrario e n `e ssato. Quindi m

(A) = 0. Ne segue la tesi.


Lemma 6.6.4 Siano F AC[c, d] e g : [a, b] [c, d], e supponiamo che g e
F g siano derivabili q.o. in [a, b]. Allora si ha (F g)
t
= (F
t
g)g
t
q.o. in
[a, b].
Dimostrazione Poniamo
M = y [c, d] : F
t
(y) non esiste, N = g
1
(M), G = [a, b] N.
Notiamo che se y [c, d] M e k [c y, d y] si ha
F(y +k) F(y) = k[F
t
(y) +(y, k)], lim
k0
(y, k) = 0;
163
quindi se x G risulta g(x) [c, d] M e pertanto, scelti h [a x, b x]
e k = g(x +h) g(x), avremo
F(g(x +h)) F(g(x)) = [g(x +h) g(x)][F
t
(g(x)) +(x, h)],
ove
(x, h) = (g(x), g(x +h) g(x)) 0 per g(x +h) g(x) 0.
Supponiamo ora che x G e che esista g
t
(x): ci`o accade q.o. in G. In tal
caso si ha g(x + h) g(x) 0 per h 0, quindi (x, h) 0 per h 0;
allora dividendo per h la relazione precedente e passando al limite per h 0
otteniamo
(F g)
t
(x) = g
t
(x)F
t
(g(x)) q.o. in G.
Daltra parte,
m(g(N)) = m(M) = 0,
ed essendo F AC[c, d], si deduce m(F(g(N))) = 0 in virt` u dellesercizio
6.5.3. Posto
N
0
= x [a, b] : (F g)
t
(x) non esiste,
si ha a maggior ragione m(F(g(N N
0
))) = 0; quindi, per il lemma 6.6.3, si
ha (F g)
t
= 0 q.o. in N N
0
, cio`e q.o. in N. Similmente, posto
N
1
= x [a, b] : g
t
(x) non esiste,
si ha a maggior ragione m(g(N N
1
)) = 0, e ancora dal lemma 6.6.3 segue
g
t
= 0 q.o. in N N
1
, ossia q.o. in N. Inne, ricordando che F
t
`e q.o. nita
in [a, b] (essendo ivi sommabile), otteniamo
(F g)
t
= 0 = (F
t
g)g
t
q.o. in N.
Pertanto si conclude che
(F g)
t
= (F
t
g)g
t
q.o. in N G = [a, b].
Dimostrazione del teorema 6.6.1 (i) = (ii) Per ipotesi, (f g)g
t

L
1
(a, b) e vale la formula di cambiamento di variabile, cio`e per ogni x [a, b]
si ha
F(g(x)) F(g(a)) =
_
g(x)
g(a)
f(y) dy =
_
x
a
f(g(t))g
t
(t) dt;
164
quindi F g AC[a, b] per il teorema 6.5.5.
(ii) = (i) Dato che F g AC[a, b] e F AC[c, d], siamo nelle ipotesi del
lemma 6.6.4: pertanto
(F g)
t
= (F
t
g)g
t
q.o. in [a, b].
Come nella dimostrazione del lemma 6.6.4, siano
M = y [c, d] : F
t
(y) non esiste, N = g
1
(M).
Fuori di N si ha F
t
(g(x)) = f(g(x)) q.o., da cui
(F g)
t
= (f g)g
t
q.o. in [a, b] N;
dentro N, ragionando come nella dimostrazione del lemma 6.6.4, troviamo
(F g)
t
(x) = 0 q.o. e g
t
(x) = 0 q.o., da cui, essendo f sommabile e quindi
q.o. nita,
(F g)
t
= 0 = (f g)g
t
q.o. in N.
In denitiva
(F g)
t
= (f g)g
t
q.o. in [a, b],
e inoltre (f g)g
t
risulta sommabile in [a, b] dato che F g AC[a, b]. Perci`o
_
g(v)
g(u)
f(x) dx = F(g(v)) F(g(u)) =
=
_
v
u
(F g)
t
(t) dt =
_
v
u
f(g(t))g
t
(t) dt u, v [a, b],
e ci`o prova la tesi.
Esercizi 6.6
1. Siano f L
1
(c, d), g AC[a, b] e F(x) =
_
x
c
f(t)dt. Si provi che se,
in pi` u, f L

(c, d), oppure g `e monotona, allora F g AC[a, b] e


quindi la formula di cambiamento di variabile `e applicabile.
2. Posto
g(t) = t
3
sin
1
t
, t [0, 1], f(x) = x

2
3
, x [1, 1],
si provi che la formula di cambiamento di variabile `e falsa per u = 0 e
v > 0. Come mai?
165
3. Posto
g(t) = t sin
1
t
, t [0, 1], f(x) = x, x [1, 1],
si provi che la formula di cambiamento di variabile `e valida, benche
g / AC[0, 1] (e infatti nel teorema 6.6.1 lipotesi g AC[a, b] non c`e).
4. Sia f : [a, b] R misurabile e sia E [a, b] un insieme misurabile tale
che la derivata f
t
(x) esista nita in ogni punto x E. Si provi che
m

(f(E))
_
E
[f
t
[dm.
[Traccia: si supponga dapprima [f
t
[ N, e si denisca E
kn
= x
E : 2
n
(k 1) [f
t
(x)[ < 2
n
k (n N, k = 1, 2, . . . , N2
n
). Si
provi che per ogni n N si ha m

(f(E))

N2
n
k=1
2
n
k m(E
kn
)
_
E
[f
t
[dm+ 2
n
m(E) . . .]
5. Sia F C[a, b] BV [a, b], tale che per ogni E [a, b] con m(E) = 0 si
abbia m(F(E)) = 0. Si provi che F AC[a, b].
[Traccia: se ]x
i
, y
i
[ (1 i N) sono disgiunti, sia E
i
= x ]x
i
, y
i
[:
F
t
(x); si mostri che m(F(]x
i
, y
i
[) = m(F(E
i
)) e che

N
i=1
[F(x
i
)
F(y
i
)[

N
i=1
_
y
i
x
i
[F
t
[dm.]
6. Siano F AC[a, b] e G AC[c, d], con [c, d] = F([a, b]). Si provi che
G F AC[a, b] se e solo se G F BV [a, b].
6.7 Cambiamento di variabili
Scopo di questo paragrafo `e ricavare la formula del cambiamento di variabili
negli integrali di Lebesgue N-dimensionali: vedremo che sotto opportune
ipotesi sulla trasformazione T : R
N
R
N
`e ancora valida la medesima
formula che sussiste per gli integrali multipli di Riemann: in altre parole
risulta, indicando con J
T
il determinante della matrice Jacobiana di T,
_
T(E)
f dm
N
=
_
E
(f T)[J
T
[dm
N
per ogni insieme misurabile E e per ogni funzione misurabile e non negativa
f.
166
Nella dimostrazione faremo uso di diversi enunciati preliminari. Il pi` u impor-
tante di essi `e il teorema del punto sso di Brouwer, risultato fondamentale
in vari contesti e del quale si conoscono numerose dimostrazioni: per comple-
tezza il prossimo paragrafo ne contiene una, dovuta a G. Stampacchia, che
fa uso di strumenti puramente analitici.
Teorema 6.7.1 (di Brouwer) Sia K R
N
un insieme non vuoto, conves-
so e compatto; sia F : K K una funzione continua. Allora F ha almeno
un punto sso.
Iniziamo la trattazione del cambiamento di variabili con un lemma che `e una
conseguenza diretta del teorema di Brouwer.
Lemma 6.7.2 Sia B
r
la palla aperta di R
N
di centro 0 e raggio r, e sia S
r
la sua frontiera. Sia F : B
r
R
N
unapplicazione continua e sia ]0, 1[
tale che
[F(x) x[ < r x S
r
.
Allora F(B
r
) B
(1)r
.
Dimostrazione Ragioniamo per assurdo: sia a B
(1)r
tale che a / F(B
r
).
Allora dallipotesi segue
[F(x)[ [x[ [x F(x)[ > (1 )r x S
r
,
e dunque a non appartiene nemmeno a F(S
r
). Poniamo allora
G(x) =
r(a F(x))
[a F(x)[
, x B
r
:
G `e unapplicazione continua da B
r
in se. Proviamo che G non ha punti ssi:
ci`o, contraddicendo il teorema di Brouwer, ci dar`a lassurdo.
Se x S
r
, allora x x = r
2
e quindi
x (a F(x)) = x a +x (x F(x)) r
2
< r[a[ +r
2
r
2
< 0,
da cui x G(x) < 0 e pertanto x ,= G(x).
Se invece x B
r
, allora x ,= G(x) in quanto G(x) S
r
. Ne segue che G `e
priva di punti ssi.
Il lemma che segue mette in luce il ruolo chiave giocato dal determinante
Jacobiano.
167
Lemma 6.7.3 Sia V un aperto di R
N
, sia T : V R
N
unapplicazione
continua. Se T `e dierenziabile in un punto x V , allora, detta B(x, r) la
palla aperta di centro x e raggio r,
lim
r0
+
m
N
(T(B(x, r)))
m
N
(B(x, r))
= [ det T
t
(x)[.
Dimostrazione Osserviamo che T(B(x, r)) `e misurabile: infatti B(x, r) `e
unione numerabile di compatti e T `e continua, cosicche anche T(B(x, r)) `e
unione numerabile di compatti.
Possiamo supporre, a meno di traslazioni, che x = 0 e T(0) = 0. Poniamo
A = T
t
(0); si hanno due casi: lapplicazione lineare A `e bigettiva oppure no.
1
o
caso: A `e bigettiva. Posto F(x) = A
1
T(x) per ogni x V , si
ha F(0) = 0, F
t
(0) = I e, dalla teoria dellintegrazione secondo Riemann
otteniamo, per ogni palla contenuta in V ,
m
N
(T(B)) = m
N
(A(F(B))) = [ det A[ m
N
(F(B)),
cosicche la tesi sar`a provata se faremo vedere che
lim
r0
+
m
N
(F(B(x, r)))
m
N
(B(x, r))
= 1.
Osserviamo esplicitamente che questo fatto sarebbe stato di dimostrazione
abbastanza semplice se avessimo supposto T di classe C
1
su V , perche avrem-
mo potuto far uso del teorema di inversione locale per applicazioni da R
N
in
R
N
. Nelle nostre ipotesi, invece, occorrer`a utilizzare il teorema di Brouwer.
Sia > 0. Dallipotesi di dierenziabilit`a segue che esiste > 0 tale che
0 < [x[ < = [F(x) x[ < [x[,
e in particolare
[F(x)[ [F(x) x[ +[x[ < (1 +)[x[ per 0 < [x[ < .
Il lemma 6.7.2 applicato a F e la relazione precedente ci dicono che
B(0, (1 )r) F(B(0, r)) B(0, (1 +)r) r ]0, ].
Da qui si ricava
(1 )
N

m
N
(F(B(0, r)))
m
N
(B(0, r))
(1 +)
N
,
168
da cui, come osservato, la tesi quando A `e bigettiva.
2
o
caso: A non `e bigettiva. In particolare A non `e surgettiva: quindi
limmagine di A ha misura N-dimensionale nulla. Sia > 0: esiste > 0
tale che, posto
E

= x R
N
: d(x, A(B(0, 1))) < ,
si ha m
N
(E

) < . Inoltre, essendo A = T


t
(0), esiste > 0 per cui
[x[ < = [T(x) Ax[ [x[.
Se r < si ha
T(B(0, r)) x R
N
: d(x, A(B(0, r))) < r;
denotando questultimo insieme con E, si vede immediatamente che E =
rE

, cosicche m
N
(E) < r
N
. Dunque
m
N
(T(B(0, r))) < r
N
=
m
N
(B(0, r))
m
N
(B(0, 1))
r ]0, [,
da cui
lim
r0
+
m
N
(T(B(0, r)))
m
N
(B(0, r))
= 0 = [ det A[.
La tesi `e provata anche quando A non `e bigettiva.
Il lemma seguente fornisce condizioni anche gli insiemi di misura nulla
vengano trasformati in insiemi di misura nulla.
Lemma 6.7.4 Sia E un insieme misurabile di R
N
con m
N
(E) = 0. Se
T : E R
N
`e unapplicazione tale che
limsup
yx, yE
[T(y) T(x)[
[y x[
< + x E,
allora T(E) `e misurabile con m
N
(T(E)) = 0.
Dimostrazione Per ogni n, p N
+
poniamo
E
np
= x E : [T(y) T(x)[ < n[y x[ y E B(x, 1/p);
169
ovviamente m
N
(E
np
) = 0. Fissato > 0, possiamo ricoprire E
np
con una
famiglia al pi` u numerabile di palle B
i
= B(x
i
, r
i
) con r
i
< 1/p e x
i
E
np
, tali
che

i
m
N
(B
i
) < : questo pu`o essere fatto scegliendo un aperto W E
np
con m
N
(W) < /2, decomponendolo in cubi semiaperti disgiunti di diametro
sucientemente piccolo, e prendendo per ogni cubo C che interseca E
np
una
palla B centrata in un punto di C E
np
e raggio pari al diametro di C.
Se allora x E
np
B
i
, si ha [x x
i
[ < 1/p, da cui
[T(x) T(x
i
)[ < n[x
i
x[ < nr
i
;
quindi T(E
np
B
i
) B(T(x
i
), nr
i
) e pertanto
T(E
np
)
_
i
B(T(x
i
), nr
i
).
Ne segue
m

N
(T(E
np
) n
N

i
m
N
(B
i
), n
N
,
e per larbitrariet`a di si conclude che m

N
(T(E
np
)) = 0 per ogni n, p N

.
Inne, essendo E =

n,pN
+
E
np
, si ricava che m

N
(T(E)) = 0.
Come ovvia conseguenza del lemma precedente si ottiene il
Corollario 6.7.5 Se V `e un aperto di R
N
e T : V R
N
`e unapplicazio-
ne dierenziabile, allora T trasforma sottoinsiemi di V di misura nulla in
insiemi di misura nulla.
Enunciamo nalmente il teorema del cambiamento di variabili.
Teorema 6.7.6 Sia V un aperto non vuoto di R
N
, sia T : V R
N
unap-
plicazione continua, e sia Y V un insieme misurabile tale che:
(i) T sia dierenziabile in ogni punto di Y ;
(ii) T[
Y
sia iniettiva;
(iii) m
N
(T(V Y )) = 0.
Allora per ogni funzione f misurabile e non negativa denita su T(Y ) si ha
_
T(Y )
f dm
N
=
_
Y
(f T)[J
T
[dm
N
,
ove J
T
(x) `e il determinante della matrice Jacobiana di T nel punto x Y .
170
Dimostrazione Procederemo in tre passi.
1
o
passo: se E V `e misurabile, allora T(E) `e misurabile.
Sappiamo dal lemma 6.7.4 che se E
0
V `e misurabile con m
N
(E
0
) = 0, allora
m
N
(T(E
0
Y )) = 0, mentre per lipotesi (iii) si ha m
N
(T(E
0
Y )) = 0: ne
segue m
N
(T(E
0
)) = 0. Inoltre, se E
1
`e un boreliano intersezione numerabile
di aperti, allora E
1
`e unione numerabile di compatti; poiche T `e continua,
anche T(E
1
) `e unione numerabile di compatti e quindi T(E
1
) `e misurabile.
Dato che ogni insieme E misurabile `e unione di un boreliano intersezione
numerabile di aperti e di un insieme di misura nulla, anche T(E) `e misurabile.
Ci` o prova il primo passo.
2
o
passo: se E `e misurabile, allora m
N
(T(E Y )) =
_
Y

E
[J
T
[ dm
N
.
Per ogni n N
+
consideriamo laperto V
n
= x V : [T(x)[ < n e linsieme
Y
n
= Y V
n
, e deniamo

n
(E) = m
N
(T(E Y
n
)), E /
N
.
Dal primo passo segue che
n
`e ben denita, mentra dalliniettivit`a di T su
Y otteniamo che
n
`e una misura. Inoltre
n
`e nita (perche `e la misura di
Lebesgue di insiemi contenuti nella palla di centro lorigine e raggio n) e, per
il corollario 6.7.5,
n
`e assolutamente continua rispetto a m
N
. Quindi, per il
teorema di Radon-Nikod ym, che verr`a dimostrato pi` u avanti nel corso, esiste
una funzione h
n
L
1
(R
N
), non negativa e nulla fuori di Y
n
, tale che

n
(E) =
_
E
h
n
dm
N
E /
N
.
Dimostriamo che h
n
(x) = [J
T
(x)[ q.o. in Y
n
. Sia x Y
n
e sia > 0 tale che
B(x, r) V
n
per r ]0, [; poiche V
n
Y
n
V Y , per lipotesi (iii) si ha

n
(E) = m
N
(T(E V
n
)), da cui per r ]0, [ possiamo scrivere

n
(B(x, r))
m
N
(B(x, r))
=
m
N
(T(B(x, r) V
n
))
m
N
(B(x, r))
=
m
N
(T(B(x, r)))
m
N
(B(x, r))
,
da cui, per il lemma 6.7.3,
lim
r0
+

n
(B(x, r))
m
N
(B(x, r))
= [J
T
(x)[.
Daltronde, se x Y
n
`e punto di Lebesgue per h
n
si ha
lim
r0
+

n
(B(x, r))
m
N
(B(x, r))
= lim
r0
+
1
m
N
(B(x, r))
_
B(x,r)
h
n
dm
N
= h
n
(x),
171
cosicche le funzioni h e [J
T
[ coincidono q.o. in Y
n
. Si conclude allora che
m
N
(T(E Y
n
)) =
n
(E) =
_
Yn
[J
T
[dm
N
E /
N
.
Utilizzando il teorema di B. Levi, per n otteniamo la tesi del secondo
passo.
3
o
passo: se E `e misurabile, allora
_
T(Y )

E
dm
N
=
_
Y
(
E
T)[J
T
[ dm
N
.
Sia A un boreliano di R
N
e sia E = x V : T(x) A, cosicche
E
=
A
T.
Per lesercizio 3.1.16,
E
`e misurabile, quindi anche
E
[J
T
[ lo `e; inoltre si ha
T(E Y ) = A T(Y ), da cui, per il secondo passo,
_
T(Y )

A
dm
N
= m
N
(A T(Y )) = m
N
(T(E Y )) =
_
Y
(
A
T)[J
T
[ dm
N
.
Sia ora G un insieme misurabile di misura nulla. Allora esiste un boreliano
A G di misura nulla, e dunque (
A
T)[J
T
[ = 0 q.o. in R
N
. Ne segue,
essendo 0
G

A
,
_
T(Y )

G
dm
N
= 0 =
_
Y
(
N
T)[J
T
[ dm
N
.
Dato che ogni insieme misurabile E `e unione (disgiunta) di un boreliano A e
di un insieme di misura nulla G, sommando le relazioni relative ad A e a G
si ottiene la tesi del terzo passo.
La dimostrazione del teorema 6.7.6 si conclude ora facilmente: per additivit`a
la tesi del terzo passo vale per ogni funzione semplice, e inne utilizzando il
teorema di B. Levi essa si estende ad ogni funzione misurabile non negativa.
Osservazioni 6.7.7 (1) Ovviamente il teorema di cambiamento di variabili
vale anche per funzioni che cambiano segno, purche siano sommabili o almeno
integrabili.
(2) Dalla dimostrazione segue in particolare che la funzione (f T)[J
T
[ `e
misurabile; in generale tuttavia f T non lo `e (esercizio 6.7.4).
(3) Il teorema 6.7.6 vale anche per N = 1, ma in questo caso il risultato che
si ottiene `e meno generale di quello del teorema 6.6.1.
172
Esercizi 6.7
1. (Coordinate polari in R
N
) Sia x = T(r,
1
, . . . ,
N2
, ) la trasforma-
zione denita da
T : [0, [[0, ]
N2
[0, 2] R
N
,
_

_
x
1
= r cos
1
x
2
= r sin
1
cos
2
x
3
= r sin
1
sin
2
cos
3
. . . . . . . . .
x
N2
= r sin
1
sin
2
sin
3
. . . sin
N3
cos
N2
x
N1
= r sin
1
sin
2
sin
3
. . . sin
N3
sin
N2
cos
x
N
= r sin
1
sin
2
cos
3
. . . sin
N3
sin
N2
sin
Si provi che
[J
T
(r,
1
, . . . ,
N2
, )[ = r
N1
(sin
1
)
N2
. . . sin
N2
e che il teorema 6.7.6 `e applicabile.
2. Posto
N
= m
N
(B(0, 1)) (ove B(0, 1) `e la palla aperta di centro lori-
gine e raggio 1), si provi che

N
=
2
N

N2
N > 2,
e si deduca che, in accordo con losservazione 2.6.2,

N
=

N
2

_
N
2
+ 1
_ =
_

n
n!
se N = 2n
2
n

n1
(2n1)!!
se N = 2n 1,
n N
+
,
ove k!! `e il prodotto di tutti i naturali non superiori a k che hanno la
stessa parit`a di k.
3. Sia f : [0, R] R una funzione integrabile. Si provi che
_
B(0,r)
f([x[)dm
N
= N
N
_
r
0
f()
N1
dm() r [0, R].
173
4. Sia C

linsieme di Cantor di parametro >


1
3
e sia W
n

nN
la colle-
zione di intervalli aperti rimossi durante la costruzione di C

; siano poi
g
n
funzioni continue nulle su W
c
n
e tali che 0 < g
n
< 2
n
in W
n
. Posto
g =

nN
g
n
, deniamo
T(x) =
_
x
0
g(t)dt, t [0, 1].
Si provi che:
(i) T verica le ipotesi del teorema 6.7.6 con N = 1 e Y = V =]0, 1[;
(ii) T `e derivabile in [0, 1], T
t
(x) = 0 per ogni x C

e m(T(C

)) = 0;
se V `e un sottoinsieme non misurabile di C

e A = T(V ), allora
A
`e
una funzione misurabile ma
A
T non lo `e.
6.8 Appendice: dimostrazione del teorema di
Brouwer
Riportiamo per comodit`a lenunciato del teorema.
Teorema (di Brouwer) Sia K R
N
un insieme non vuoto, convesso e
compatto; sia F : K K una funzione continua. Allora F ha almeno un
punto sso.
Dimostrazione Facciamo vari passi.
1
o
passo. Cominciamo col mostrare che, se la tesi vale quando K = B(0, R),
con R > 0, allora vale anche nel caso generale. Infatti, essendo K un convesso
compatto, esister`a R > 0 tale che K B(0, R); detta P
K
la proiezione
sul convesso K, lapplicazione composta F P
K
`e continua da B(0, R) in
K, e quindi da B(0, R) in se. Quindi c`e un punto x B(0, R) tale che
x = F P
K
(x); dato che F `e a valori in K, si ha x K, e di conseguenza
P
K
(x) = x. Ci`o prova che x = F(x), ossia x `e punto sso di F.
2
o
passo. Ora proviamo che se la tesi vale quando K `e la palla unitaria
chiusa, allora vale anche quando K = B(0, R), R > 0. A questo scopo basta
porre
G(x) =
1
R
F(Rx) x B(0, 1),
174
ed osservare che, per ipotesi, G ha un punto sso x B(0, 1); di conseguenza
y = Rx appartiene a B(0, R) ed `e punto sso di F.
3
o
passo. Dora in poi, dunque, supporremo che K = B(0, 1). In questo
terzo passo facciamo vedere che, supposta vera la tesi quando F `e di classe
C

, essa `e vera anche per F continua. Infatti, consideriamo per ogni m N


+
la proiezione P
m
sulla palla B(0, 1
1
m
); la funzione composta P
m
F man-
da K in tale palla. Per la densit`a di C

(K) in C(K), esiste una funzione

m
C

(K) tale che |


m
P
m
F|


1
m
. Da questa stima segue che
m
`e a valori in K: quindi, per ipotesi, per ogni m N
+
esiste un punto sso
x
m
K per lapplicazione
m
. La successione x
m

mN
+ `e limitata, e dun-
que vi `e una sottosuccessione x
mn

nN
+ convergente ad un punto x K.
Proviamo che x `e punto sso per F. Poiche [x
mn
P
mn
(x
mn
)[
N

1
mn
,
si ha P
mn
(x
mn
) x per n ; essendo F continua, si deduce che
F(P
mn
(x
mn
)) F(x) e F(x
mn
) F(x) per n . Dato che P
m
(x)
converge a x per ogni x K, si deduce che P
mn
(F(x
mn
)) F(x) per
n . Utilizzando la relazione |
m
P
m
F|


1
m
, si ricava anche

mn
(x
mn
) F(x) per n . Di conseguenza, passando al limite nelle-
quazione x
mn
=
mn
(x
mn
) si ottiene x = F(x).
4
o
passo. Dimostriamo nalmente la tesi nel caso a cui ci siamo ridotti,
ossia F : K K di classe C

, con K = B(0, 1). Supponiamo per assurdo


che risulti F(x) ,= x per ogni x K. Consideriamo lequazione
[x +a(x F(x))[
2
N
= 1, a R, x K,
ovvero
a
2
[x F(x)[
2
N
+ 2a (x, x F(x))
N
(1 [x[
2
N
) = 0.
Fissato x K, il discriminante di questa equazione di 2
o
grado `e
(x) = (x, x F(x))
2
N
+ (1 [x[
2
N
)[x F(x)[
2
N
.
Ovviamente, (x) 0; proviamo che (x) > 0 per ogni x K. Ci`o `e
evidente quando [x[
N
< 1; se invece [x[
N
= 1, non pu`o essere (x, xF(x))
N
=
1 (x, F(x))
N
= 0, in quanto si ha sempre
(x, F(x))
N
[x[
N
[F(x)[
N
= [F(x)[
N
1,
e vale luguaglianza (x, F(x))
N
= 1 se e solo se F(x) = x, il che `e vietato dal
nostro ragionamento per assurdo.
175
Possiamo considerare allora la maggiore delle due radici dellequazione, che
denotiamo con a(x):
a(x) =
(x, x F(x))
N
+
_
(x)
[x F(x)[
2
N
.
Osserviamo che per [x[
N
= 1 le radici dellequazione sono
0, 2
1 (x, F(x))
N
[x F(x)[
2
N
< 0,
cosicche se [x[
N
= 1 si ha a(x) = 0.
Deniamo
f(t, x) = x +t a(x)(x F(x)), t R, x K.
Questa funzione `e di classe C

(perche (x) > 0 in K) e verica


f(0, x) = x, [f(1, x)[
N
= 1 x K; f
t
(t, x) = 0 per [x[
N
= 1 :
infatti la prima uguaglianza `e banale, la seconda segue dal fatto che a(x) `e
radice dellequazione [x + a(x F(x))[
2
N
= 1, e la terza si ottiene notando
che f
t
(t, x) = a(x)(x F(x)) e ricordando che a(x) = 0 per [x[
N
= 1.
Poniamo adesso, per ogni t R,
D
0
(t, x) = det
_
_
f
i
x
j
(t, x)
_
i,j=1,...,N
_
, I(t) =
_
K
D
0
(t, x) dx.
Dato che D
0
(0, x) = det(I) = 1 per ogni x K, `e chiaro che I(0) = m
N
(K);
verichiamo che si ha inoltre I(1) = 0. Derivando la relazione [f(1, x)[
2
N
= 1,
valida per ogni x K, si ottiene il sistema
2
N

i=1
f
i
(1, x)
f
i
x
j
(1, x) = 0, j = 1, . . . , N, x K;
dunque il sistema lineare omogeneo N N con coecienti
f
i
x
j
(1, x) ha
per soluzione il vettore di componenti f
i
(1, x), il quale `e non nullo, essen-
do [f(1, x)[
N
= 1 per ogni x K. Di conseguenza il determinante dei
coecienti, che `e D
0
(1, x), deve essere nullo per ogni x K, e pertanto
I(1) =
_
K
0 dx = 0.
Vogliamo ora dimostrare che I
t
(t) = 0 per ogni t R: da ci`o seguir`a ov-
viamente lassurdo, essendo I C

e I(1) I(0) ,= 0. A questo scopo `e


essenziale il seguente
176
Lemma 6.8.1 Sia g : R
N+1
R
N
unapplicazione di classe C

nelle
variabili (x
0
, x
1
, . . . , x
N
). Posto

j
(x) = det(D
j
(x)), D
j
(x) =
_
_
g
i
x
j
(x)
_
i=1,...,N, j=0,...,N, j,=i
_
,
risulta
N

j=0
(1)
j

j
x
j
(x) = 0 x R
N+1
.
Dimostrazione Si ha
N

j=0
(1)
j

j
x
j
(x) =
N

j=0
(1)
j
N

i=1
det(A
i
(x)),
ove A
i
(x) `e la matrice N N che si ottiene da D
j
(x) rimpiazzandone la
i-sima riga con
_

2
f
i
x
0
x
j
(x), . . . ,

2
f
i
x
j1
x
j
(x),

2
f
i
x
j+1
x
j
(x), . . . ,

2
f
i
x
N
x
j
(x)
_
.
Gli addendi di questa sommatoria sono N(N + 1), quindi sono in numero
pari. Un generico termine del determinante relativo alladdendo di indici
(j, i), con 0 j N e 1 i N ssati, ha la forma seguente:

2
f
i
x
s
x
j
(x)

1kN, k,=i
f
k
x
r
k
(x),
ove s 0, 1, . . . , N j, e r : 1, . . . , N 0, 1, . . . , N j `e una
permutazione degli indici tale che r
i
= s (e, in particolare, r
k
,= j, s per
k ,= i); il segno di questo termine `e (1)
j
(r), ove (r) `e il segno della
permutazione r. Lo stesso termine compare in un altro determinante: quello
relativo alladdendo di indici (s, i), e che corrisponde alla permutazione :
1, . . . , N 0, 1, . . . , N s tale che
i
= j e
k
= r
k
per ogni k
1, . . . , N i; il suo segno `e, stavolta, (1)
s
().
Adesso osserviamo che (1)
j
(r) `e il segno della permutazione r
t
S
N+1
che
si ottiene ponendo r
t
0
= j e r
t
k
= r
k
per ogni k 1, . . . , N; analogamente,
(1)
s
() `e il segno della permutazione
t
S
N+1
tale che
t
0
= s e
t
k
=
k
177
per ogni k 1, . . . , N. Dato che
t
si ottiene da r
t
scambiando r
t
0
con r
t
i
,
i segni di
t
e r
t
sono opposti: dunque (1)
j
(r) = (1)
s
() e pertanto i
due termini corrispondenti si cancellano fra loro. Ci`o accade per ogni coppia
di termini ed in denitiva lintera somma `e nulla.
Torniamo alla dimostrazione del teorema di Brouwer. Applichiamo il lemma
6.8.1 alla funzione f(t, x
1
, . . . , x
N
): ponendo
D
j
(t, x) = det
_
_
f
i
x
k
(t, x)
_
i=1,...,N, k=0,1,...,N, k,=j
_
, j = 1, . . . , N,
si ha
I
t
(t) =
_
K
D
0
t
(t, x)dx =
N

j=1
(1)
j
_
K
D
j
x
j
(t, x)dx;
applicando le formule di Gauss-Green, si deduce
I
t
(t) =
N

j=1
(1)
j
_
K
D
j
(t, x)
j
(x)d,
ove (x) `e il versore normale esterno a K e `e la misura di Hausdor (N1)-
dimensionale su K. Ma poiche per j = 1, . . . , N i D
j
sono determinanti
di matrici tutte contenenti il vettore colonna f
t
(t, x), il quale `e nullo per
[x[
N
= 1, tutti i D
j
sono nulli su K. Pertanto I
t
(t) = 0 per ogni t R, e
ci`o implica lassurdo. Il teorema di Brouwer `e cos` dimostrato.
Esercizi 6.8
1. Vericare che il teorema di Brouwer `e falso per la palla unitaria chiusa
di
2
.
[Traccia: se B `e la palla unitaria chiusa di
2
, si consideri lapplicazione
f(x) =
_
_
1 |x|
2
2
, x
1
, x
2
, . . .
_
, x B.]
2. Sia f : R
N
R
N
unapplicazione continua tale che esista R > 0 per
cui si abbia
(f(x), x)
N
0 x B(0, R).
Si provi che esiste x B(0, R) tale che f(x) = 0.
[Traccia: ragionare per assurdo, applicando il teorema di Brouwer alla
funzione F : B(0, R) B(0, R) denita da F(x) = R
f(x)
[f(x)[
N
.]
178
Capitolo 7
Spazi di Banach
7.1 Norme
Abbiamo gi`a incontrato vari esempi di spazi vettoriali dotati di norme; alcuni
sono completi rispetto alla distanza indotta dalla norma, altri no. Vogliamo
ora ricapitolare alcuni fatti gi`a noti ed ampiamente usati, e descrivere in
modo pi` u organico questi spazi. Cominciamo con la denizione di norma.
Denizione 7.1.1 Sia X uno spazio vettoriale su R o su C. Una norma su
X `e una funzione | | : X [0, [ dotata delle seguenti propriet`a:
(i) |x| = 0 x = 0;
(ii) |x| = [[|x| per ogni x X e per ogni R (oppure per ogni C);
(iii) |x +y| |x| +|y| per ogni x, y X.
La coppia (X, | |) `e detta spazio normato ed `e uno spazio metrico con la
distanza indotta d(x, y) = |xy|; se tale spazio metrico `e completo, (X, ||)
`e detto spazio di Banach.
Notiamo che da (iii) segue
[ |x| |y| [ |x y| x, y X;
quindi la norma `e una funzione continua da X in [0, +[.
Abbiamo gi`a incontrato i seguenti spazi di Banach:
179
(1) R
N
e C
N
, con |x| =
_

N
i=1
[x
i
[
2
, oppure |x| =

N
i=1
[x
i
[, oppure
|x| = max
1iN
[x
i
[;
(2) L
1
(X, T, ), con |f|
1
=
_
X
[f[d;
(3) L

(X, T, ), con |f|

= supess
X
[f[;
(4) C
k
[a, b] (k N), con |f|
C
k
[a,b]
=

k
h=0
max
[a,b]
[f
(h)
[;
(5) AC[a, b], con |f|
AC[a,b]
= max
[a,b]
[f[ +
_
b
a
[f
t
(t)[dt;
(6) BV [a, b], con |f|
BV [a,b]
= sup
[a,b]
[f[ +T
b
a
(f).
Il seguente lemma caratterizza gli spazi normati che sono anche spazi di Ba-
nach, ossia fornisce un criterio per stabilire se una data norma rende completo
lo spazio X oppure no.
Lemma 7.1.2 Sia X uno spazio normato. Allora X `e uno spazio di Ba-
nach se e solo se per ogni successione x
n

nN
X, per la quale risulti

n=0
|x
n
| < , esiste y X tale che la serie

n=0
x
n
converge a y in X,
ossia
lim
N
_
_
_
_
_
N

n=0
x
n
y
_
_
_
_
_
= 0.
Dimostrazione (=) Sia

n=0
|x
n
| < . Allora la successione delle
somme parziali

N
n=0
x
n

NN
`e di Cauchy in X, dato che
_
_
_
_
_
N

n=M+1
x
n
_
_
_
_
_

n=M+1
|x
n
| N, M N con N > M;
poiche X `e completo, tale successione converger`a ad un opportuno y X.
(=) Sia y
n
una successione di Cauchy in X: allora per ogni k N esiste
n
k
N (e non `e restrittivo supporre n
k+1
> n
k
) tale che
|y
m
y
n
k
| < 2
k
m n
k
.
Poniamo
_
x
0
= y
n
0
x
k+1
= y
n
k+1
y
n
k
, k N;
180
allora x
k

kN
X e

k=0
|x
k
| = |y
n
0
| +

k=0
|y
n
k+1
y
n
k
| |y
n
0
| +

k=0
2
k
< .
Quindi, per ipotesi, esiste y X tale che
y
nm
=
m

k=0
x
k
y in X;
ma dato che y
n
`e di Cauchy, lintera successione y
n
converge a y. Dunque
X `e completo.
Ricordiamo che due norme | |, [ [ su uno spazio vettoriale X si dicono
equivalenti se esistono due costanti positive c
1
, c
2
tali che
c
1
[x[ |x| c
2
[x[ x X;
ci`o accade se e solo se entrambe le norme inducono su X la stessa topologia
(esercizio 7.1.1). In generale, uno spazio pu`o essere di Banach rispetto a due
norme diverse e non confrontabili; se per`o lo spazio vettoriale ha dimensione
nita, questo non pu`o accadere, come mostra la proposizione che segue.
Proposizione 7.1.3 In uno spazio vettoriale nito-dimensionale X tutte le
norme sono fra loro equivalenti.
Dimostrazione Supponiamo che lo spazio vettoriale X sia reale, e sia
dimX = n. Scelta una base e
1
, . . . , e
n
di X, ogni z X si scrive in modo
unico come z =

n
i=1
z
i
e
i
, con z
i
R
n
. Quindi possiamo considerare su
X la norma
|z|
1
=
n

i=1
[z
i
[ z X
e su R
n
la norma
[z
i
[ =
n

i=1
[z
i
[ z
i
R
n
;
vi `e una ovvia isometria bigettiva j : (X, | |
1
) (R
n
, [ [), data da j(z) =
z
i
per ogni z X.
Sia ora | | una norma qualunque su X. Per subadditivit`a si trova subito
|z| =
_
_
_
_
_
n

i=1
z
i
e
i
_
_
_
_
_

i=1
[z
i
[|e
i
| M|z|
1
z X,
181
ove M = max
1in
|e
i
|.
Daltra parte, consideriamo la funzione
f : X R, f(z) = |z| z X;
essa `e continua, quindi f j
1
`e continua da R
n
in R e positiva su R
n
0.
Pertanto f j
1
ha minimo m > 0 sul compatto = z
i
R
n
: [z
i
[ = 1.
Per omogeneit`a si ricava allora, posto z = j
1
(z
i
),
|z| = f j
1
(z
i
) m[z
i
[ = m[j(z)[ z
i
R
n
,
ossia
|z| m|z|
1
z X.
Ne segue che la generica norma | | `e equivalente a | |
1
. Il discorso `e
esattamente lo stesso se lo spazio X `e complesso.
Esercizi 7.1
1. Dimostrare che due norme su uno spazio vettoriale X sono equivalenti
se e solo se esse inducono su X la stessa topologia.
2. Si provi che in BV [a, b] le tre norme
|f|
BV
= sup
[a,b]
[f[ +T
b
a
(f), |f|
1
= |f|

+T
b
a
(f), |f|
2
= [f(a)[ +T
b
a
(f)
sono fra loro equivalenti.
3. Si provi che C
0
[a, b] `e uno spazio normato con |f|
1
=
_
b
a
[f(t)[dt.
`
E
completo?
4. Provare che in C
0
[a, b] le due norme |f|

e |f|
1
non sono equivalenti.
5. Poniamo

= x = x
n

nN
R : x
n
`e limitata,
c
0
= x = x
n

nN
R : x
n
`e innitesima,
c
00
= x = x
n

nN
R : x
n
`e denitivamente nulla.
Provare che |x|

= sup
n
[x
n
[ `e una norma in questi tre spazi; mostrare
poi che i primi due sono spazi di Banach, ed il terzo no.
182
6. Fissato ]0, 1[, si consideri linsieme delle funzioni -holderiane su
[a, b], cio`e
C

[a, b] =
_
f C
0
[a, b] : [f]

= sup
x,=y
[f(x) f(y)[
[x y[

<
_
.
(i) Si verichi che C

[a, b] `e un sottospazio denso in C


0
[a, b].
(ii) Si dimostri che
|f|

= |f|

+ [f]

`e una norma in C

[a, b] che rende tale spazio uno spazio di Banach.


(iii) Posto g
r
(x) = [x r[

, si mostri che g
r
C

[a, b].
(iv) Si provi che
[g
r
g
s
]

2 r, s [a, b],
e se ne deduca che C

[a, b] non `e separabile (uno spazio topologico


X si dice separabile se esiste un sottoinsieme numerabile D denso
in X).
7.2 Prodotti scalari
Una particolare categoria di spazi normati `e costituita da quegli spazi in cui
la norma `e generata da un prodotto scalare. Questa circostanza rende tali
spazi particolarmente ricchi di propriet`a geometriche simili a quelle di R
N
.
Denizione 7.2.1 Sia H uno spazio vettoriale complesso. Un prodotto
scalare `e una applicazione (, ) : H H C con le seguenti propriet`a:
(i) (x, x) `e reale non negativo, e (x, x) = 0 se e solo se x = 0;
(ii) (x, y) = (y, x) per ogni x, y H;
(iii) x (x, y) `e lineare per ogni ssato y H.
Da (ii) e (iii) segue che y (x, y) `e antilineare, ossia
(x, y +w) = (x, y) +(x, w) , C, x, y, w H.
Lo spazio H, munito di un prodotto scalare, si dice spazio con prodotto scalare
o spazio pre-hilbertiano. Nel caso in cui H sia uno spazio vettoriale reale, la
183
denizione `e perfettamente analoga: spariscono i complessi coniugati ed il
prodotto scalare risulta lineare nei suoi due argomenti.
Per mostrare che ogni prodotto scalare genera una norma, `e fondamentale la
seguente propriet`a:
Proposizione 7.2.2 (Disuguaglianza di Cauchy-Schwarz) Sia H uno
spazio con prodotto scalare (, ). Allora
[(x, y)[ (x, x)
1/2
(y, y)
1/2
x, y H.
Dimostrazione Siano x, y H. Se x = 0 la tesi `e banale perche i due
membri della disuguaglianza sono nulli. Sia allora x ,= 0 cosicche (x, x) > 0.
Per ogni C abbiamo
0 (x +y, x +y) = [[
2
(x, x) +(x, y) +(y, x) + (y, y) =
= [[
2
(x, x) + 2Re ((x, y)) + (y, y),
e scegliendo
=
(x, y)
(x, x)
si ricava
0
[(x, y)[
2
(x, x)
+ (y, y),
che `e la tesi.
Corollario 7.2.3 Sia H uno spazio con prodotto scalare (, ). Allora
|x| =
_
(x, x)
`e una norma su H, che `e detta indotta dal prodotto scalare.
Dimostrazione Le prime due propriet`a della denizione 7.1.1 sono evidenti.
Verichiamo la subadditivit`a: per la disuguaglianza di Cauchy-Schwarz si ha
|x +y|
2
= (x +y, x +y) = (x, x) + 2Re(x, y) + (y, y) =
= |x|
2
+ 2Re(x, y) +|y|
2
|x|
2
+ 2|x| |y| +|y|
2
=
= (|x| +|y|)
2
.
Uno spazio con prodotto scalare `e dunque anche uno spazio normato.
184
Denizione 7.2.4 Uno spazio con prodotto scalare si dice spazio di Hilbert
se `e completo rispetto alla norma indotta.
Osservazione 7.2.5 Il prodotto scalare `e continuo rispetto alla norma in-
dotta: infatti per ogni x, x
0
, y, y
0
H si ha la stima
[(x, y) (x
0
, y
0
)[ = [(x x
0
, y y
0
) + (x x
0
, y
0
) + (x
0
, y y
0
)[
|x x
0
| |y y
0
| +|x x
0
| |y
0
| +|x
0
| |y y
0
|,
e quindi (x, y) (x
0
, y
0
) per |x x
0
| 0 e |y y
0
| 0.
Vediamo qualche esempio.
Esempi 7.2.6 (1) C
N
`e uno spazio di Hilbert su C col prodotto scalare
usuale
(x, y) =
N

i=1
x
i
y
i
x, y C
N
,
che induce la norma euclidea
|x| =

_
N

i=1
[x
i
[
2
;
la restrizione a R
N
R
N
di questo prodotto scalare rende R
N
uno spazio di
Hilbert su R col prodotto scalare
(x, y) =
N

i=1
x
i
y
i
x, y R
N
,
il quale induce la stessa norma.
(2) Lo spazio C
0
[a, b], con il prodotto scalare
(f, g) =
_
b
a
f(t)g(t) dt f, g C
0
[a, b],
`e uno spazio pre-hilbertiano, ma non di Hilbert: ad esempio, le funzioni
f
n
(x) =
_

_
0 se a x
a+b
2

1
n
n
2
_
x
a+b
2
+
1
n
_
se

x
a+b
2

<
1
n
1 se
a+b
2
+
1
n
x b
185
convergono nella norma indotta, cio`e
|f| =

_
b
a
[f(t)[
2
dt ,
alla funzione discontinua
[
a+b
2
,b]
, quindi formano una successione di Cauchy
che non converge nello spazio (C
0
[a, b], | |).
(3) In un arbitrario spazio misurato (X, T, ) consideriamo lo spazio /
2
(X)
delle funzioni misurabili tali che [f[
2
`e sommabile su X; indichiamo con L
2
(X)
lo spazio quoziente rispetto alla solita relazione di equivalenza che identica
le funzioni q.o. coincidenti. L
2
(X) `e uno spazio di Hilbert con il prodot-
to scalare dellesempio precedente. La dimostrazione della completezza di
questo spazio rispetto alla norma indotta ricalca quella della completezza di
L
1
(X) (teorema 4.6.2), e per essa si rimanda allesercizio 7.2.1.
(4) Prendendo tutte le funzioni complesse f tali che Ref e Imf sono misu-
rabili, e denendo lintegrale di f come
_
X
f d =
_
X
Re f d +i
_
X
Imf d,
possiamo considerare, sullo spazio L
2
(X, C) delle funzioni di quadrato som-
mabile a valori complessi, il prodotto scalare
(f, g) =
_
X
fg d f, g L
2
(X, C);
esso induce la stessa norma di prima, la quale risulta ancora completa.
Tramite il prodotto scalare si pu`o dare la nozione di ortogonalit`a.
Denizione 7.2.7 Sia H uno spazio con prodotto scalare. Due elementi
x, y H sono fra loro ortogonali, e scriviamo x y, se risulta (x, y) = 0.
Proposizione 7.2.8 (teorema di Pitagora) Sia H uno spazio con pro-
dotto scalare, e siano x, y H con x y. Allora se H `e reale
|x +y|
2
= |x y|
2
= |x|
2
+|y|
2
,
mentre se H `e complesso
|x +y|
2
= |x y|
2
= |x +iy|
2
= |x iy|
2
= |x|
2
+|y|
2
.
186
Dimostrazione Supponiamo H complesso. Allora
|x y|
2
= |x|
2
2Re(x, y) +|y|
2
= |x|
2
+|y|
2
,
|xiy|
2
= |x|
2
2Re(x, iy)+|y|
2
= |x|
2
2Im(x, y)+|y|
2
= |x|
2
+|y|
2
.
Il caso H reale `e compreso nel precedente.
Dato un qualunque spazio normato, come si fa a riconoscere se la norma `e
indotta da un prodotto scalare? La risposta `e nella seguente
Proposizione 7.2.9 Sia X uno spazio normato. La norma di X `e hilber-
tiana, ossia `e indotta da un prodotto scalare, se e solo se vale l identit`a del
parallelogrammo:
|x +y|
2
+|x y|
2
= 2|x|
2
+ 2|y|
2
x, y H.
In tal caso, il prodotto scalare `e dato da
(x, y) =
1
4
_
|x +y|
2
|x y|
2
_
se H `e reale, e da
(x, y) =
1
4
__
|x +y|
2
|x y|
2
_
+i
_
|x +iy|
2
|x iy|
2
_
se H `e complesso.
Dimostrazione (=) Si tratta di unovvia verica.
(=) Si tratta di vericare che le espressioni sopra scritte soddisfano le ri-
chieste della denizione 7.2.1: la cosa `e facile ma noiosa e per essa rimandiamo
allesercizio 7.2.2.
Esercizi 7.2
1. Sia (X, T, ) uno spazio misurato. Si dimostri che L
2
(X, T, ) `e uno
spazio di Hilbert.
[Traccia: si ripeta, con le dovute modiche, la dimostrazione del
teorema 4.6.2.]
187
2. Dimostrare che se nello spazio normato (X, | |) `e vera lidentit`a del
parallelogrammo, allora la norma | | `e indotta da uno dei prodotti
scalari introdotti nella proposizione 7.2.9.
[Traccia: se X `e reale, si provi dapprima che dallipotesi segue
(2x, y) + (2x
t
, y) = 2(x + x
t
, y), da cui, se x
t
= 0, (2x, y) = 2(x, y).
Se ne deduca, per induzione, che (nx, y) = n(x, y) per ogni n N e
poi che (x, y) = (x, y) per ogni Q; si usi, poi, la continuit`a della
norma. Lestensione al caso X complesso `e facile.]
3. Si deniscano

1
=
_
x = x
n

nN
:

n=0
[x
n
[ <
_
, |x|
1
=

n=0
[x
n
[,

2
=
_
x = x
n

nN
:

n=0
[x
n
[
2
<
_
, |x|
2
=

n=0
[x
n
[
2
.
Si provi che
1
e
2
sono spazi di Banach, e che il secondo `e uno spazio
di Hilbert mentre il primo no. Si provi inoltre che questi due spazi sono
separabili (v. esercizio 7.1.6).
4. Si dimostri che (C
0
[a, b], | |

) non `e uno spazio di Hilbert.


5. Si provi che f AC[a, b] : f
t
L
2
(a, b) `e uno spazio di Hilbert con
il prodotto scalare
(f, g)
AC
=
_
b
a
[f(t)g(t) +f
t
(t)g
t
(t)]dm.
6. Sia H uno spazio con prodotto scalare. Se x
n
, y
n
H sono due
successioni tali che |x
n
| 1, |y
n
| 1 e (x
n
, y
n
) 1, si provi che
|x
n
y
n
| 0.
7. Sia H uno spazio con prodotto scalare. Si provi che:
(i) se x, y ,= 0, allora |x +y| = |x| +|y| se e solo se esiste > 0 tale
che x = y;
188
(ii) si ha x y se e solo se |x + y| = |x y| per ogni C, ed
anche se e solo se |x +y| |x| per ogni C.
8. Sia H uno spazio con prodotto scalare. Si provi che per ogni x, y, z, w
H vale la disuguaglianza
|x y| |z w| |x z| |y w| +|x w| |y z|.
[Traccia: Si osservi anzitutto che si pu`o supporre w = 0. Se a primo
membro c`e Re(x y, z), la disuguaglianza `e facile. Fissato u H,
si scelga z = e
i
u con R tale che (x y, z) = |x y| |u| =
|x y| |z|...]
9. Sia f L
1
(a, b). Si provi che f L
2
(a, b) se e solo se esiste una
funzione g AC[a, b] tale che
__
y
x
f(t)dt
_
2
[g(x) g(y)](x y) x, y [a, b].
[Traccia: per limplicazione (=), provare preliminarmente che le
funzioni costanti a tratti sono dense in L
2
(a, b), ed utilizzare poi questo
fatto e la disuguaglianza di Cauchy-Schwarz.]
7.3 Operatori lineari e continui
Siano X, Y spazi normati. Le pi` u importanti fra le applicazioni da X in Y
sono quelle che rispettano la struttura lineare degli insiemi di partenza e di
arrivo, ossia sono le applicazioni lineari. Ad esse `e dedicato questo paragrafo.
Denizione 7.3.1 Unapplicazione F : X Y `e detta operatore lineare se
si ha F(x + x
t
) = F(x) + F(x
t
) per ogni x, x
t
X e per ogni , R
(oppure per ogni , C).
Per gli operatori lineari si usa la scrittura Fx in luogo di F(x).
Denizione 7.3.2 Un operatore lineare F : X Y si dice limitato se esiste
M 0 tale che |Fx|
Y
M|x|
X
per ogni x X.
Dunque, se F : X Y `e un operatore lineare e limitato, risulta
sup
x,=0
|Fx|
Y
|x|
X
< +;
189
si noti che, a causa della linearit`a,
sup
x,=0
|Fx|
Y
|x|
X
= sup
|u|
X
=1
|Fu|
Y
= sup
|v|
X
1
|Fv|
Y
,
ed in particolare un operatore lineare `e limitato se e solo se esso `e una funzione
limitata (in norma) sulla palla unitaria di X (ossia linsieme
B = u X : |u|
X
1).
Linsieme degli operatori lineari limitati da X in Y ha unovvia struttura di
spazio vettoriale e si indica con /(X, Y ); se X = Y si scrive /(X) anziche
/(X, X).
Per gli operatori lineari fra spazi normati, la condizione di limitatezza
equivale alla continuit`a. Si ha infatti:
Proposizione 7.3.3 Siano X, Y spazi normati e sia F : X Y un opera-
tore lineare. Sono fatti equivalenti:
(i) F `e limitato;
(ii) esiste x
0
X tale che F `e continuo nel punto x
0
;
(iii) F `e lipschitziano, cio`e esiste K 0 tale che
|Fx Fx
t
|
Y
K|x x
t
|
X
x, x
t
X.
Dimostrazione (i) = (iii) Per ipotesi esiste M 0 tale che
|Fx|
Y
M|x|
X
x X;
grazie alla linearit`a si deduce
|Fx Fx
t
|
Y
= |F(x x
t
)|
Y
M|x x
t
|
X
x, x
t
X.
(iii) = (ii) Evidente.
(ii) = (i) Per ipotesi, per ogni > 0 esiste > 0 tale che
|x x
0
|
X
= |Fx Fx
0
|
Y
.
190
Sia z X0 (si noti che se X = 0, allora per linearit`a deve essere F = 0
e quindi la tesi `e ovvia). Posto w = z/|z|
X
, si ha

|z|
X
Fz = Fw = F(w +x
0
) Fx
0
,
e poiche |(w +x
0
) x
0
|
X
= |w|
X
= , si ha |Fw|
Y
. Pertanto
|Fz|
Y
=
|z|
X

|Fw|
Y

|z|
X
z X 0.
Dato che per z = 0 la stima precedente `e ovvia, si conclude che F `e limitato.
Lo spazio vettoriale /(X, Y ) diventa uno spazio normato con la norma
|F|
/(X,Y )
= sup
x,=0
|Fx|
Y
|x|
X
(le veriche sono immediate).
Teorema 7.3.4 Siano X, Y spazi normati. Se Y `e uno spazio di Banach,
allora /(X, Y ) `e uno spazio di Banach.
Dimostrazione Sia F
n
una successione di Cauchy in /(X, Y ): ci`o signi-
ca che per ogni > 0 esiste N tale che |F
n
F
m
|
/(X,Y )
< per ogni
n, m ; quindi
|F
n
x F
m
x|
Y
< |x|
X
x X, n, m .
In particolare, per ogni ssato x X la successione F
n
x `e di Cauchy in Y ;
poiche Y `e completo, essa ha limite, per ogni ssato x X, nella norma di
Y . Chiamiamo F(x) tale limite: `e immediato vericare che lapplicazione F
cos` denita `e lineare da X in Y . Inoltre per ogni x X si ha
|Fx|
Y
= lim
n
|F
n
x|
Y
liminf
n
_
|F
n
F

|
/(X,Y )
|x|
X
+|F

x|
Y

_
+|F

|
/(X,Y )

|x|
X
,
cosicche F `e un operatore limitato. Inne, se x X con |x|
X
= 1 si ha
|F
n
xFx|
Y
= lim
m
|F
n
xF
m
x|
Y
liminf
n
|F
n
F
m
|
/(X,Y )
n ,
da cui F
n
F in /(X, Y ).
Vale anche il viceversa di questo teorema, salvo casi patologici: si veda
lesercizio 7.3.9.
191
Denizione 7.3.5 Il duale di uno spazio normato X `e lo spazio /(X, R)
(oppure /(X, C), se X `e complesso); esso si denota con X

. Gli elementi
del duale X

di X si dicono funzionali lineari e limitati su X (ovvero lineari


e continui, per la proposizione 7.3.3).
Osserviamo che, essendo R e C completi, X

`e uno spazio di Banach per ogni


spazio normato X. Vediamo qualche esempio.
Esempi 7.3.6 (1) Se X = R
N
, il duale (R
N
)

`e isomorfo ed isometrico a
R
N
. Infatti ogni funzionale lineare F su R
N
`e completamente caratterizzato
dai valori Fe
1
, . . . , Fe
N
assunti nei vettori della base canonica e
1
, . . . , e
N
;
posto allora a = (Fe
1
, . . . , Fe
N
), lelemento a R
N
cos` denito `e tale che
Fx =

N
i=1
x
i
a
i
= (x, a)
R
N, e si ha anche |F|
(R
N
)
= |a|
R
N (poiche per la
disuguaglianza di Cauchy-Schwarz risulta [Fx[ = [(x, a)
R
N[ |x|
R
N|a|
R
N e
per x = a vale luguaglianza).
(2) Se X = C
N
, il duale (C
N
)

`e isomorfo ed isometrico a C
N
(stesso discor-
so, solo che stavolta i numeri a
i
= Fe
i
sono complessi anziche reali).
(3) Sia (X, T, ) uno spazio misurato. Per ogni ssata f L
1
(X), il
funzionale
Fg =
_
X
fg d, g L

(X),
`e ovviamente lineare; inoltre risulta
[Fg[
_
X
[fg[d |f|
1
|g|

g L

(X),
quindi F `e continuo, cio`e `e un elemento di (L

(X))

, e si ha |F| |f|
1
.
Proviamo che vale luguaglianza: ci`o `e evidente quando f = 0; altrimenti, se
scegliamo
g(x) =
_
0 se f(x) = 0
f(x)
[f(x)[
se f(x) ,= 0,
otteniamo |g|

= 1 e quindi
[Fg[ =

_
X
fg d

=
_
X
[f[d = |f|
1
|g|

.
Si ha dunque limmersione isometrica i : L
1
(X) (L

(X))

, denita da
i(f) = F; come vedremo, questa immersione non `e surgettiva.
192
(4) Sia (X, T, ) uno spazio misurato -nito. Per ogni ssata f L

(X),
consideriamo ancora il funzionale F dellesempio precedente, o pi` u precisa-
mente
Fg =
_
X
fg d, g L
1
(X).
Il calcolo fatto sopra mostra che F (L
1
(X))

e che |F| |f|

. Per
provare luguaglianza, supposto f ,= 0 (altrimenti `e tutto ovvio) e dato > 0,
si sfrutti la -nitezza di X per scegliere un insieme A T con 0 < (A) <
tale che
[f(x)[ > |f|

x A;
allora, scelta g =
f
[f[

A
, risulta
[Fg[ =

_
X
fg d

=
_
A
[f[d > (|f|

)(A) = (|f|

)|g|
1
,
cosicche
|F| |f|

> 0,
e dunque |F| = |f|

. Quindi si ha limmersione isometrica i : L

(X)
(L
1
(X))

, denita da i(f) = F; vedremo nel seguito che tale isometria `e


surgettiva e che dunque, se la misura `e -nita, il duale di L
1
(X) `e isomorfo
a L

(X). Se manca la -nitezza, questo risultato `e in generale falso (esercizi


7.3.7 e 7.3.8).
Esercizi 7.3
1. Provare che se X `e uno spazio normato nito-dimensionale, allora X `e
completo ed ogni funzionale lineare F : X R `e continuo.
2. Siano X, Y, Z spazi normati; provare che se A /(X, Y ) e B /(Y, Z),
allora B A /(X, Z) e
|B A|
/(X,Z)
|A|
/(X,Y )
|B|
/(Y,Z)
.
3. Sia T : C
0
[0, 1] C
0
[0, 1] denito da
Tf(x) =
x
1 +x
2
f(x), x [0, 1], f C
0
[0, 1].
(i) Si calcoli la norma di T.
193
(ii) Si determini limmagine R(T) C
0
[0, 1].
(iii) Si verichi che T `e iniettivo.
(iv) Si provi che T
1
: R(T) C
0
[0, 1] non `e limitato.
4. Posto
T : C
0
[0, 1] C
0
[0, 1], Tf(x) =
_
x
0
(x s)f(s)ds, x [0, 1],
si provi che T `e continuo, se ne calcoli la norma e se ne determini
limmagine R(T).
5. Si consideri loperatore F denito per ogni g L

(R) da
Fg(x) =
1
2x
_
x
x
g(t) dt, x R 0.
(i) Si provi che F /(L

(R)) con norma uguale a 1.


(ii) Si determini il nucleo di F, ossia linsieme ker F = g L

(R) :
Fg = 0.
(iii) Si caratterizzi R(F).
(iv) Per quali g L

(R) si ha Fg C
0
(R)?
6. Si denisca
Af =
_
R
f(t) t e
[t[
dt.
Si provi che il funzionale A `e limitato su L
2
(R), su L
1
(R) e su L

(R),
e se ne calcoli la norma in tutti e tre i casi.
7. Siano X = [0, 1], T = E [0, 1] : E, oppure E
c
, `e numerabile, =
misura cardinalit`a. Si provi che:
(i) per ogni f L
1
(X) la funzione x xf(x) appartiene a L
1
(X);
(ii) il funzionale F, denito da Ff =
_
1
0
xf(x) d per ogni f L
1
(X),
`e un elemento di (L
1
(X))

;
(iii) non esiste alcuna g L

(X) per cui si abbia


Ff =
_
1
0
fg d f L
1
(X).
194
8. Sia (X, T, ) lo spazio misurato dellesempio 2.1.3 (8). Si provi che se
f L

(X) e |f|

> 0, allora il funzionale


Fg =
_
X
fg d, g L
1
(X),
appartiene a (L
1
(X))

ma |F|
(L
1
(X))
< |f|

.
9. Siano X, Y spazi normati, e si supponga che X

,= 0. Si provi che se
/(X, Y ) `e completo, allora Y `e completo.
[Traccia: se y
n
`e una successione di Cauchy in Y , si ssi G
X

0 e si denisca F
n
x = Gxy
n
. Osserviamo che lipotesi X

,= 0
pu`o essere sostituita dalla condizione pi` u naturale X ,= 0; ci`o seguir`a
dal teorema di Hahn-Banach (teorema 10.1.3).]
10. Siano X, Y spazi di Banach. Si verichi che X Y `e uno spazio di
Banach con la norma
[[(x, y)[[
XY
= [[x[[
X
+[[y[[
Y
,
e si provi che (X Y )

`e isomorfo a X

.
11. Si denisca
Fx =

n=0
x
n
n!
x = x
n
c
0
(lo spazio c
0
`e denito nellesercizio 7.1.5). Si provi che F c

0
, se ne
calcoli la norma e si verichi che |F|
c

0
non `e un massimo.
12. Sia a = a
n

. Poniamo
A :
1

1
, (Ax)
n
= a
n
x
n
n N
(lo spazio
1
`e denito nellesercizio 7.2.3). Si provi che:
(i) |A|
/(
1
)
= |a|

;
(ii) A `e iniettivo se e solo se a
n
,= 0 per ogni n N;
(iii) A `e surgettivo e A
1
`e continuo se e solo se inf
n
[a
n
[ > 0.
195
13. Sia T : L
1
(R
2
) L
1
(R) denito da
Tf(x) =
_
R
f(x, y)dy f L
1
(R
2
).
Si provi che T `e ben denito ed appartiene a /(L
1
(R
2
), L
1
(R)), e se ne
calcoli la norma.
14. Sia X uno spazio di Banach, sia F X

0. Posto M = x X :
Fx = 1, si provi che
dist(0, M) =
1
|F|
X

.
15. Sia X uno spazio normato e sia A : X X un operatore lineare
tale che Ax
n
sia una successione limitata in X per ogni successione
x
n
X innitesima in norma. Si provi che A `e continuo.
16. Sia H uno spazio di Hilbert e sia A /(H) tale che (Ax, x) = 0 per
ogni x H. Si provi che se H `e complesso allora A = 0, mentre se H
`e reale ci`o non `e detto in generale.
17. Siano X, Y spazi di Banach, sia A
n
/(X, Y ) una successione di
operatori tali che
lim
n
A
n
x in Y x E,
ove E `e un sottoinsieme denso in X. Provare che se esiste M > 0 tale
che |A
n
|
/(X,Y )
M per ogni n N, allora
lim
n
A
n
x in Y x X,
mentre la cosa `e in generale falsa senza lipotesi |A
n
|
/(X,Y )
M.
18. Sia X uno spazio di Banach, sia A /(X).
(i) Provare che la serie

n=0
t
n
n!
A
n
, t R, ove A
0
= I, A
n
= AA A (n volte),
196
converge in /(X), e che quindi per ogni t R loperatore
T(t)x =

n=0
t
n
n!
A
n
x, x X,
`e lineare e continuo su X con
|T(t)|
/(X)
e
[t[|A|
L(X)
t R.
(ii) Vericare la legge di gruppo
T(0) = I, T(t +s) = T(t) T(s) t, s R.
(iii) Dimostrare che per ogni t R risulta
lim
h0
T(t +h) T(t)
h
= A T(t) in /(X).
(Loperatore T(t) si chiama esponenziale delloperatore A e si
indica con e
tA
.)
19. Sia X uno spazio di Banach, sia F /(X) tale che |F|
/(X)
< 1. Si
provi che I F `e invertibile con inversa continua, e che
(I F)
1
=

n=0
F
n
, |(I F)
1
|
/(X)

1
1 |F|
/(X)
,
ove F
n
= F F F (n volte).
20. Sia X uno spazio di Banach. Si provi che linsieme E = F /(X) :
F
1
/(X) `e aperto in /(X).
[Traccia: se F E, si scriva G = F(I+F
1
(GF)) e si osservi che
esiste > 0 tale che se |GF|
/(X)
< , allora |F
1
(GF)|
/(X)
< 1;
quindi si pu`o applicare lesercizio precedente.]
21. Si provi che c

0
`e isomorfo ed isometrico a
1
(esercizi 7.1.5 e 7.2.3).
22. Si provi che (
1
)

`e isomorfo ed isometrico a

.
23. Per ogni n N si consideri il funzionale T
n
denito da
T
n
f =
_
n
0
f(t) arctan nt dt, f L
1
(0, ).
197
(i) Si provi che T
n
(L
1
(0, ))

e se ne calcoli la norma.
(ii) Si dimostri che esiste T (L
1
(0, ))

tale che
lim
n
T
n
f = Tf f L
1
(0, ).
(iii) Si dica se T
n
converge a T in (L
1
(0, ))

per n .
24. Sia T :

loperatore lineare denito da


(Tx)
n
= x
2n
, n N.
(i) Si provi che per ogni k N
+
loperatore T
k
`e continuo e surgettivo,
e se ne calcoli la norma.
(ii) Si descriva esplicitamente il sottospazio
ker T
k
= x

: T
k
x = 0.
(iii) Si determini la chiusura di

k=1
ker T
k
in

.
(iv) Si consideri la restrizione di T a
1
, si verichi che tale restrizione
manda
1
in
1
e si risponda nuovamente ai tre quesiti precedenti.
198
Capitolo 8
Spazi di Hilbert
8.1 Proiezioni su convessi chiusi
Abbiamo gi`a visto nel paragrafo 7.2 alcuni aspetti della geometria degli spazi
dotati di prodotto scalare. Se lo spazio `e anche completo rispetto alla norma
indotta, le analogie fra le sue propriet`a e quelle caratteristiche di R
N
sono
ancora pi` u strette ed interessanti.
Sia dunque H uno spazio di Hilbert. Per ssare le idee, supporremo H com-
plesso; le modiche da fare agli enunciati nel caso di H reale sono evidenti.
In questo paragrafo consideriamo i sottoinsiemi convessi e chiusi di H, i qua-
li possiedono speciali propriet`a. Notiamo che in questa classe rientrano in
particolare i sottospazi chiusi di H.
Proposizione 8.1.1 Sia K un sottoinsieme convesso, chiuso e non vuoto di
uno spazio di Hilbert H. Allora per ogni y H esiste uno ed un solo x
0
K
tale che
|y x
0
| = min
xK
|y x|.
Tale elemento si chiama proiezione di y sul convesso K e si indica con P
K
(y).
Dimostrazione Sia = inf
xK
|y x|: ovviamente 0. Se = 0,
allora y K = K, quindi si ha la tesi con x
0
= y (e tale x
0
`e unico). Sia
dunque > 0: in tal caso possiamo costruire una successione x
n
K
tale che |y x
n
| < +
1
n
per ogni n N
+
. Applichiamo lidentit`a
del parallelogrammo (proposizione 7.2.9) ai vettori
xny
2
,
xmy
2
: dato che
199
xn+xm
2
K, si trova
_
_
_
_
x
n
x
m
2
_
_
_
_
2
=
_
_
_
_
x
n
+x
m
2
y
_
_
_
_
2
+ 2
_
_
_
_
x
n
y
2
_
_
_
_
2
+ 2
_
_
_
_
x
m
y
2
_
_
_
_
2


2
+
1
2
_
|x
n
y|
2
+|x
m
y|
2

,
e lultimo membro tende a 0 per n, m . Perci`o x
n
`e una successione
di Cauchy in H, la quale dunque converge in H ad un elemento x
0
K (in
quanto H `e completo e K `e chiuso). Se ne deduce
= lim
n
|y x
n
| = |y x
0
|,
cosicche `e un minimo.
Proviamo lunicit`a del punto di minimo. Se x `e un altro punto di minimo
in K, applicando lidentit`a del parallelogrammo ai vettori
x
0
y
2
,
xy
2
si trova,
essendo
x
0
+x
2
K e |x
0
y| = |x y| = ,
_
_
_
_
x
0
x
2
_
_
_
_
2
=
_
_
_
_
x
0
+x
2
y
_
_
_
_
2
+ 2
_
_
_
_
x
0
y
2
_
_
_
_
2
+ 2
_
_
_
_
x y
2
_
_
_
_
2


2
+
1
2
_

2
+
2

,
cio`e x = x
0
.
Osservazioni 8.1.2 (1) Se il convesso K non `e un sottospazio, loperatore
di proiezione P
K
non `e lineare: ad esempio, se 0 / K si ha P
K
(0) ,= 0.
(2) Se x
0
K, allora ovviamente P
K
(x
0
) = x
0
; ci`o mostra che limmagine
di P
K
`e esattamente uguale al convesso K.
La propriet`a di minimalit`a della proiezione su un convesso si traduce nella
seguente caratterizzazione:
Proposizione 8.1.3 Sia H uno spazio di Hilbert, sia K H un convesso
chiuso e non vuoto e siano y, x
0
H. Risulta x
0
= P
K
(y) se e solo se x
0
verica la seguente disequazione variazionale:
_
x
0
K
Re(y x
0
, x x
0
) 0 x K.
200
Dimostrazione Osserviamo preliminarmente che per ogni x H si ha
|yx|
2
= |(yx
0
)(xx
0
)|
2
= |yx
0
|
2
2Re(yx
0
, xx
0
)+|xx
0
|
2
,
da cui
|y x
0
|
2
|y x|
2
= 2Re(y x
0
, x x
0
) |x x
0
|
2
x H.
Ci` o premesso, supponiamo che x
0
verichi la disequazione variazionale; allora
da questa e dalla relazione precedente si ottiene
|y x
0
|
2
|y x|
2
0 x K,
e dato che x
0
K si deduce che x
0
= P
K
(y).
Supponiamo viceversa che x
0
= P
K
(y); allora per denizione x
0
K e
|y x
0
|
2
|y x|
2
0 x K,
cosicche, tenendo conto della relazione dimostrata allinizio, si ricava
2Re(y x
0
, x x
0
) |x x
0
|
2
x K.
Ora, ssato x K, poniamo v = (1 t)x
0
+ tx, con t ]0, 1]. Poiche K `e
convesso, si ha v K, e sostituendo v al posto di x si ottiene
2Re(y x
0
, t(x x
0
)) t
2
|x x
0
|
2
x K, t ]0, 1].
Quindi, dividendo per t,
2Re(y x
0
, x x
0
) t|x x
0
|
2
x K, t ]0, 1],
e nalmente al limite per t 0
+
si ottiene che x
0
verica la disequazione
variazionale.
Corollario 8.1.4 Sia K un convesso chiuso non vuoto di uno spazio di Hil-
bert H. Allora la proiezione P
K
`e un operatore lipschitziano; pi` u precisa-
mente si ha
|P
K
(y) P
K
(z)| |y z| y, z H.
201
Dimostrazione Poniamo u = P
K
(y), v = P
K
(z). Per la proposizione 8.1.3
si ha
_
u K
Re(y u, x u) 0 x K,
_
v K
Re(z v, x v) 0 x K.
Sostituiamo x = v nella prima disequazione e x = u nella seconda: si ottiene
Re(y u, v u) 0, Re(v z, v u) 0.
Sommando le due relazioni abbiamo
Re(y u +v z, v u) = Re(y z, v u) +|v u|
2
0,
da cui
|v u|
2
Re(z y, v u) |z y| |v u|.
Se |v u| = 0, la tesi `e ovvia; altrimenti, semplicando, si trova
|v u| |z y|
che `e la tesi.
Dunque loperatore non lineare P
K
`e lipschitziano su H, con costante di Lip-
schitz non superiore a 1 (in eetti la costante `e esattamente 1 se K contiene
almeno due punti distinti, in quanto P
K
(y) = y per ogni y K). Nel caso
particolare in cui K `e un sottospazio chiuso, vedremo che la proiezione P
K
risulta lineare, ed avr`a lo stesso signicato geometrico di proiezione ortogo-
nale che conosciamo nel caso di R
N
. Per illustrare questi fatti, premettiamo
la seguente
Denizione 8.1.5 Sia S un sottoinsieme non vuoto di uno spazio di Hilbert
H. L ortogonale di S `e linsieme
S

= x H : (x, y) = 0 y S.
Notiamo che, a causa della linearit`a e della continuit`a del prodotto scalare,
S

`e un sottospazio chiuso di H, comunque sia fatto linsieme S. Inoltre si


ha
S S

=
_
se 0 / S
0 se 0 S :
infatti se x S S

allora (x, x) = 0 e quindi x = 0.


La linearit`a della proiezione su un sottospazio chiuso `e conseguenza del
seguente risultato:
202
Teorema 8.1.6 (delle proiezioni) Sia H uno spazio di Hilbert, sia M un
sottospazio chiuso di H. Allora esiste ununica coppia di operatori P, Q :
H H tali che:
(i) R(P) = M e R(Q) = M

;
(ii) x = Px +Qx per ogni x H;
(iii) x = Px per ogni x M, x = Qx per ogni x M

;
(iv) P e Q sono operatori lineari e continui;
(v) se M ,= 0 allora |P|
/(H)
= 1, e se M ,= H allora |Q|
/(H)
= 1.
Gli operatori P, Q si chiamano proiezioni ortogonali su M e su M

rispetti-
vamente.
Ricordiamo che R(P), R(Q) sono le immagini degli operatori P, Q.
Dimostrazione (i) Poniamo
P(x) = P
M
(x), Q(x) = x P
M
(x) x H :
questa denizione `e lecita dato che M `e un convesso chiuso non vuoto. Poiche
P
M
(x) M per ogni x H e P
M
(x) = x per ogni x M, si ha R(P) = M;
inoltre per la proposizione 8.1.3 risulta per ogni x H
Re(x P(x), z P(x)) 0 z M.
Poiche M `e un sottospazio, possiamo scegliere z = P(x) v, con v M,
ottenendo
Re(x P(x), v) 0 v M, x H,
e dunque
Re(x P(x), v) = 0 v M, x H.
Sostituendo poi in questa relazione iv al posto di v, troviamo anche
Im(x P(x), v) = Re(x P(x), iv) = 0 v M, x H :
ne segue
(x P(x), v) = 0 v M, x H,
203
ossia Q(x) = xP(x) M

per ogni x H; in particolare se x M

questa
relazione implica (P(x), v) = 0 per ogni v M, da cui P(x) MM

ossia
P(x) = 0. Ci`o prova che Q(x) = x per ogni x M

e pertanto R(Q) = M

.
Ci` o prova (i).
(ii) Evidente per denizione di P e Q.
(iii) Se x M, allora x = P
M
(x) = P(x), mentre se x M

si ha, come si
`e visto, Q(x) = x.
(iv) Se x, y H e , C, si ha da (ii)
x = P(x) +Q(x), y = P(y) +Q(y),
x +y = P(x +y) +Q(x +y),
da cui, sommando,
P(x) +Q(x) +P(y) +Q(y) = x +y = P(x +y) +Q(x +y),
cio`e
P(x) +P(y) P(x +y) = Q(x) Q(y) +Q(x +y).
Ricordando (i), in questa relazione il primo membro appartiene a M ed
il secondo membro appartiene a M

; essa perci`o denisce un elemento di


M M

= 0. Dunque entrambi i membri sono nulli e questo prova la


linearit`a di P e Q (in particolare, quindi, le proiezioni su sottospazi chiusi
sono lineari). Inoltre, poiche Px Qx per ogni x H, dal teorema di
Pitagora (proposizione 7.2.8) segue
|Px|
2
+|Qx|
2
= |x|
2
x H,
il che mostra che P, Q /(H) con norme non superiori a 1.
(v) Sappiamo che |P|
/(H)
1 e |Q|
/(H)
1. Se M ,= 0, essendo
Px = x per x M, si ottiene |P|
/(H)
= 1. Se M ,= H, per x M

si ha
Px = 0 e quindi Qx = x: pertanto |Q|
/(H)
= 1. Ci`o prova (v) e conclude
la dimostrazione.
Esercizi 8.1
1. Sia H uno spazio di Hilbert, sia u H con |u| = 1. Si verichi che
la palla aperta B(u, 1) = x H : |x u| < 1 `e un convesso non
chiuso, privo di elementi di norma minima.
204
2. Si verichi che, posto K = f L
2
(0, 1) :
_
1/2
0
f(t) dt
_
1
1/2
f(t) dt =
1, si ha min
fK
|f|
2
= 1.
3. Poniamo K = f C
0
[0, 1] :
_
1/2
0
f(t) dt
_
1
1/2
f(t) dt = 1. Si provi
che K `e un convesso chiuso negli spazi (C
0
[0, 1], ||

) e (C
0
[0, 1], ||
2
),
privo in entrambi i casi di elementi di norma minima.
4. Poniamo
Lip[a, b] =
_
f C
0
[a, b] : [f]
1
= sup
x,=x

[f(x) f(x
t
)[
[x x
t
[
<
_
,
e sia K = f Lip[0, 1] : |f|

4, [f]
1
8,
_ 1
2
0
f(t)dt
_
1
1
2
f(t)dt =
1. Si provi che K `e un convesso chiuso e non vuoto di L
2
(0, 1), e che
min
fK
|f|
2
> 1.
5. Poniamo
K
2
= f L
2
(a, b) : |f|
2
1, K

= f L

(a, b) : |f|

1.
Dimostrare che K
2
e K

sono convessi chiusi di L


2
(a, b) e determinare
esplicitamente le proiezioni ortogonali P
K
2
e P
K
.
6. Poniamo
K = f L
2
(a, b) : f 0 q.o. in [a, b], K
0
= K C
0
[a, b].
(i) Si verichi che K e K
0
sono sottoinsiemi convessi di L
2
(a, b).
(ii) Si provi che K `e chiuso in L
2
(a, b) e che K L

(a, b) `e chiuso in
L

(a, b), mentre K


0
`e chiuso in L

(a, b) ma non in L
2
(a, b).
(iii) Si determini esplicitamente la proiezione P
K
.
7. Determinare M

nei casi seguenti:


(i) M = f L
2
(a, b) : f = costante q.o.,
(ii) M = f L
2
(R) : f `e dispari,
(iii) M = [x
n

nN
] L
2
(a, b)
205
(ove [f
i

iI
] indica il sottospazio chiuso generato dalla famiglia f
i

iI
,
cio`e la chiusura dellinsieme delle combinazioni lineari nite di elementi
della famiglia).
8. Sia (X, T, ) uno spazio misurato e sia ( T unaltra -algebra.
(i) Si provi che L
2
(X, (, ) `e un sottospazio chiuso di L
2
(X, T, ).
(ii) Si caratterizzi esplicitamente tale sottospazio nei due casi seguenti:
(a) X = R, ( = B, T = /, = m;
(b) X = [0, 1], ( = , [0, 1], T = /, = m.
9. Si provi che le funzioni 1, cos nx, sin nx (n N
+
) sono a due a due
ortogonali in L
2
(, ).
10. Determinare:
(i) min
_

[x a b sin x c sin
2
x[
2
dx : a, b, c R;
(ii) min
_
1
1
[x
3
a bx cx
2
[
2
dx : a, b, c R;
(iii) la proiezione del vettore 1 + sin x + cos x + sin
3
x sul sottospazio
[1, sin x, sin 3x] di L
2
(, ).
11. Sia H uno spazio di Hilbert, sia S H, S ,= . Provare che S

= [S].
12. Sia H = (c
00
, | |
2
), e sia S = x c
00
:

n=1
xn
n
= 0. Provare che S
`e un sottospazio chiuso di H con S

,= [S].
[Traccia: si verichi per induzione che z S

se e solo se z
n
=
1
n
z
1
per ogni n N
+
, e se ne deduca che S

= 0.]
13. Sia M un sottospazio chiuso di uno spazio di Hilbert H. Si dimostri
che
min
xM
|x y| = max[(z, y)[ : z M

, |z| = 1.
14. Siano P
1
, . . . , P
n
proiezioni ortogonali sui sottospazi chiusi M
1
, . . . , M
n
di uno spazio di Hilbert H. Dimostrare che le seguenti aermazioni
sono equivalenti:
(i) P
i
P
j
= 0 se i ,= j;
(ii) M
1
, . . . , M
n
sono a due a due ortogonali;
206
(iii) loperatore P =

n
i=1
P
i
`e una proiezione ortogonale.
Descrivere in tal caso limmagine R(P).
15. Siano P
1
, P
2
proiezioni ortogonali sui sottospazi chiusi M
1
, M
2
di uno
spazio di Hilbert H. Dimostrare che le seguenti aermazioni sono
equivalenti:
(i) M
1
M
2
;
(ii) P = P
2
P
1
`e una proiezione ortogonale.
Descrivere in tal caso limmagine R(P).
16. Sia B = x = (x
1
, x
2
) R
2
: [x[
2
=
_
(x
1
)
2
+ (x
2
)
2
< 1, e consideria-
mo linsieme delle funzioni di L
2
(B) di tipo radiale:
R = f L
2
(B) : f = f([x[
2
).
(i) Provare che R `e un sottospazio chiuso di L
2
(B).
(ii) Descrivere il sottospazio R

.
(iii) Determinare esplicitamente la proiezione ortogonale P
R
.
17. Sia H uno spazio di Hilbert, e siano M
1
, M
2
due sottospazi chiusi di H
con M
1
M
2
= 0; poniamo M
1
+M
2
= x +y : x M
1
, y M
2
.
(i) Provare che se M
1
e M
2
sono ortogonali, allora M
1
+ M
2
`e un
sottospazio chiuso.
(ii) Dimostrare che se H ha dimensione nita allora M
1
+M
2
`e chiuso.
(iii) Vericare che
M
1
= x
2
: x
2n
= 0 n N,
M
2
=
_
x
2
: x
2n
=
x
2n+1
2n + 1
n N
_
sono sottospazi chiusi di
2
tali che M
1
M
2
= 0, mentre M
1
+M
2
non `e un sottospazio chiuso di
2
.
[Traccia: per (iii) si mostri che c
00
M
1
+M
2

2
.]
207
8.2 Il duale di uno spazio di Hilbert
Unaltra somiglianza fra gli spazi di Hilbert e gli spazi euclidei R
N
e C
N
`e il
fatto che linsieme dei funzionali lineari e continui su uno spazio di Hilbert
H `e uno spazio isomorfo ed isometrico ad H stesso. Vale infatti il seguente
fondamentale risultato:
Teorema 8.2.1 (di Riesz-Frech`et) Sia H uno spazio di Hilbert. Per ogni
F H

esiste un unico z H tale che


Fx = (x, z)
H
x H,
ed inoltre si ha
|F|
H
= |z|
H
.
Dimostrazione Sia F H

: se F = 0, allora scelto z = 0 si ha ovviamente


la tesi. Supponiamo dunque F ,= 0; allora il sottospazio
M = ker F = x H : Fx = 0
`e chiuso e non coincide con H, cosicche il suo sottospazio ortogonale M

contiene propriamente 0. Scegliamo allora un arbitrario elemento w


M

0: per ogni x H si ha
F
_
x
Fx
Fw
w
_
= 0
cio`e
x
Fx
Fw
w M.
Dunque, essendo w M

,
(x
Fx
Fw
w, w)
H
= 0 x H,
da cui
Fx =
Fw
|w|
2
H
(x, w)
H
x H;
in denitiva, scelto
z =
Fw
|w|
2
H
w,
208
risulta
Fx = (x, z)
H
x H.
Da questa relazione segue subito |F|
H
|z|
H
, mentre dalla denizione di
z otteniamo
|z|
H
=
[Fw[
|w|
H
|F|
H
.
Ci` o prova che il vettore z ha i requisiti richiesti. Resta da vericare lunicit`a
di z: se z
t
H `e un altro vettore tale che
Fx = (x, z
t
)
H
x H,
allora avremo
(x, z z
t
)
H
= Fx Fx = 0 x H,
e scelto x = z z
t
otteniamo subito z = z
t
.
Osservazione 8.2.2 Vi `e dunque una isometria bigettiva j : H H

,
denita da z j
z
ove
j
z
(x) = (x, z)
H
x H,
che rende ogni spazio di Hilbert isomorfo al suo duale. Si noti che j `e un
operatore antilineare, in quanto per ogni , C e per ogni x, z, z
t
H si
ha
j
z+z
(x) = (x, z +z
t
)
H
= (x, z)
H
+(x, z
t
)
H
= j
z
(x) +j
z
(x).
Il teorema di Riesz-Frech`et ha unimportante applicazione, che riguarda un
fondamentale risultato di decomposizione e classicazione delle misure in
termini delle nozioni di assoluta continuit`a e mutua singolarit`a introdotte
nel paragrafo 4.5: il teorema di Lebesgue-Radon-Nikod ym. Si tratta in eetti
di due enunciati distinti, che per`o dimostreremo simultaneamente, cosicche
il secondo gurer`a come un facile corollario del primo. Lingrediente basilare
sar`a il teorema 8.2.1.
Teorema 8.2.3 (di decomposizione di Lebesgue) Sia (X, T, ) un s-
sato spazio misurato -nito; sia unaltra misura denita su T, anchessa
-nita. Allora esiste ununica coppia di misure -nite
a
,
s
denite su T,
tali che
=
a
+
s
,
a
,
s
.
La coppia (
a
,
s
) `e chiamata decomposizione di Lebesgue di relativa a .
209
Dimostrazione Proviamo anzitutto lunicit`a della decomposizione. Sup-
poniamo che (
t
a
,
t
s
) sia unaltra decomposizione di con
t
a
e
t
s
;
dobbiamo provare che
a
(E) =
t
a
(E) e
s
(E) =
t
s
(E) per ogni E T,
e a questo scopo, ricordando la proposizione 2.1.5, `e suciente provare che
tali relazioni valgono per ogni E T con (E) < . Poiche, per ipotesi,
=
a
+
s
=
t
a
+
t
s
, si ha

a
(E)
t
a
(E) =
t
s
(E)
s
(E) E T con (E) < .
Consideriamo gli insiemi B, A
s
, A
t
s
dove sono concentrate rispettivamente le
misure ,
s
,
t
s
: a causa della mutua singolarit`a, deve essere B(A
s
A
t
s
) = .
Di conseguenza per ogni E T con (E) < risulta:
(E) = (E B), (E B) = 0;

s
(E B) =
t
s
(E B) = 0,
a
(E B) =
t
a
(E B).

a
(E B) =
t
a
(E B) = 0,
s
(E B) =
t
s
(E B);
Ne segue, usando ladditivit`a delle misure,

a
(E) =
a
(E B) +
a
(E B) =
t
a
(E B) +
t
a
(E B) =
t
a
(E),
e similmente si ottiene
s
(E) =
t
s
(E). Ci`o prova lunicit`a della decomposi-
zione.
Passiamo alla dimostrazione dellesistenza, supponendo dapprima che sia
nita. Osserviamo anzitutto che esiste una funzione w L
1
(X, ) tale che
0 < w(x) < 1 per ogni x X. Infatti, usando la -nitezza di X, se
X =

n=0
X
n
con gli X
n
disgiunti e tali che (X
n
) < , basta porre
w(x) =

n=0
w
n
(x), ove w
n
(x) =
2
n1
1 +(X
n
)

Xn
(x).
Lutilit`a di w sta nel fatto che la misura E
_
E
w d ha esattamente gli
stessi insiemi di misura nulla che ha , ma `e nita anziche -nita come .
Deniamo una misura ausiliaria nel modo seguente:
(E) = (E) +
_
E
w d E T;
`e una misura nita su T.
Il modo in cui `e denita suggerisce che gli integrali rispetto alla misura
210
si rappresentino come somma di due opportuni integrali rispetto a e ; in
eetti si dimostra la seguente relazione, fondamentale per noi, che vale per
ogni funzione T-misurabile e non negativa:
_
X
f d =
_
X
f d +
_
X
fw d.
Infatti, per denizione di la relazione vale per tutte le funzioni semplici T-
misurabili; il passaggio alle arbitrarie funzioni T-misurabili e non negative si
ottiene in virt` u dellosservazione 3.1.8 e del teorema di B. Levi.
Sia ora f L
2
(X, ); poiche si ha, utilizzando la disuguaglianza di
Cauchy-Schwarz (proposizione 7.2.2),

_
X
f d


_
X
[f[d = ([f[, 1)
L
2
(X,)

|f|
L
2
(X,)
|1|
L
2
(X,)
= |f|
L
2
(X,)
_
(X).
Dunque il funzionale lineare Tf =
_
X
f d `e continuo su L
2
(X, ), cio`e `e un
elemento di (L
2
(X, ))

. Per il teorema di Riesz-Frech`et (caso di uno spazio


di Hilbert reale), esiste ununica g L
2
(X, ) tale che
_
X
f d = Tf = (f, g)
L
2
(X,)
=
_
X
fg d f L
2
(X, ).
Proviamo che si ha 0 g(x) 1 -q.o. in X. Scegliendo f =
E
, con E T
tale che (E) > 0 (scelta lecita perche f `e limitata, quindi in L
2
(X, ) essendo
nita), troviamo
(E) = T
E
=
_
E
g d
da cui, dividendo per (E),
0
1
(E)
_
E
g d =
(E)
(E)
1.
Se, per assurdo, fosse (x X : g(x) > 1) > 0, dalla relazione
x X : g(x) > 1 =
_
kN
+
_
x X : g(x) > 1 +
1
k
_
211
segue che esisterebbe k N
+
tale che (x X : g(x) > 1 + 1/k) > 0;
prendendo come E questo insieme, otterremmo
1 +
1
k

1
(E)
_
E
g d 1,
il che `e assurdo. Similmente si prova la disuguaglianza g 0. Modicando
eventualmente g su un insieme di misura nulla, possiamo supporre che sia
0 g(x) 1 x X.
Osserviamo adesso che dalla denizione delloperatore T, nonche dalla for-
mula di rappresentazione degli integrali rispetto a precedentemente dimo-
strata, si ricava
_
X
fd = Tf =
_
X
fg d =
_
X
fg d +
_
X
fgw d f L
2
(X, ), f 0,
da cui
_
X
(1 g)f d =
_
X
fgw d f L
2
(X, ), f 0.
Poniamo A = x X : 0 g(x) < 1 e B = x X : g(x) = 1, e
deniamo nalmente

a
(E) = (E A),
s
(E) = (E B) E T.
Scegliendo f =
B
nella relazione precedente, si ottiene
0 =
_
B
(1 g)d =
_
B
w d,
da cui, per la propriet`a di w gi`a osservata, (B) = 0. Dato che
s
`e concen-
trata su B, ne segue che
s
.
Scegliendo invece nella relazione precedente f = (1 + g + + g
n
)
E
, con
E T, otteniamo
_
E
(1 g
n+1
)d =
_
E
g(1 +g + +g
n
)w d n N;
per n , in virt` u del teorema di B. Levi luguaglianza precedente diventa
(E A) =
_
E
gw
1 g
d.
212
Dunque, posto h =
gw
1g
, la funzione h `e non negativa ed appartiene a L
1
(X, )
(come si vede scegliendo E = X e ricordando che `e una misura nita); di
conseguenza si trova

a
(E) = (E A) =
_
E
h d E T.
In virt` u della proposizione 4.5.6, si conclude che
a
. La tesi `e dimostrata
nel caso in cui la misura sia nita.
Supponiamo adesso che sia -nita. In questo caso esiste una successione
X
n

nN
T con queste propriet`a: gli X
n
sono disgiunti, (X
n
) < per
ogni n N e

n=0
X
n
= X. Per ogni n N poniamo

n
(E) = (E X
n
) E T :
le misure
n
sono nite. Per quanto gi`a dimostrato, per ogni n N si
ha
n
=
an
+
sn
, ove
an
e
sn
; inoltre esiste una funzione
h
n
L
1
(X
n
, ) non negativa, tale che

an
(E) =
_
E
h
n
d E T, E X
n
.
Utilizzando ancora una volta il teorema di B. Levi `e facile allora riconoscere
che, posto

a
=

n=0

an
,
s
=

n=0

sn
,
le funzioni
a
e
s
sono misure -nite tali che
=
a
+
s
,
a
,
s
,
e in particolare. posto h =

n=0
h
n
, la funzione h `e misurabile, non negativa
e si ha

a
(E) =
_
X
h d E T.
La tesi `e completamente dimostrata.
Corollario 8.2.4 (teorema di Radon-Nikod ym) Sia (X, T, ) uno spa-
zio misurato -nito; sia unaltra misura denita su T, anchessa -nita.
Allora si ha se e solo se esiste una funzione T-misurabile e non
negativa h tale che
(E) =
_
E
h d E T.
213
Dimostrazione (=)
`
E la proposizione 4.5.6.
(=) Poiche , per il teorema 8.2.3 la decomposizione di Lebesgue
di rispetto a `e necessariamente data, per unicit`a, da = + 0. Dalla
dimostrazione del teorema 8.2.3 segue che esiste una funzione non negativa
e misurabile h per cui si ha
(E) =
_
E
h d E T,
il che prova la tesi. Osserviamo che nel caso in cui `e nita la funzione h
risulta -sommabile su X.
Esercizi 8.2
1. Sia H uno spazio di Hilbert, sia M un sottospazio di H; sia inoltre
F un funzionale lineare e continuo su M. Provare che esiste un unico
funzionale F lineare e continuo su H, tale che
F[
M
= F, |F|
H
= |F|
M
.
2. Sia H uno spazio di Hilbert, e sia F : H R un funzionale lineare non
continuo. Si provi che ker F `e denso in H.
[Traccia: sia y
n
tale che |y
n
| 0 e Fy
n
= 1; se z (ker F)

, si
provi che
z
Fz
y
n
ker F e se ne deduca che z = 0.]
3. Sia H uno spazio di Hilbert. Fissato T /(H), si verichi che la
relazione
(Sx, y)
H
= (x, Ty)
H
x, y H
denisce univocamente un operatore S : H H lineare e limitato, e
che risulta |S|
/(H)
= |T|
/(H)
. Loperatore S si dice aggiunto di T e si
denota con T

.
4. Sia H uno spazio di Hilbert e sia T /(H) un operatore autoaggiunto,
ossia tale che
(Tx, y) = (x, Ty) x, y H;
supponiamo inoltre che esista c > 0 per cui risulti |Tx| c|x| per
ogni x H. Provare che T `e bigettivo e T
1
`e continuo.
214
5. Sia H uno spazio di Hilbert. Si provi che un operatore P /(H) `e
una proiezione ortogonale se e solo se si ha P
2
= P e P `e autoaggiunto
(secondo la denizione fornita nellesercizio precedente).
6. Sia H uno spazio di Hilbert. Se A /(H), detto A

laggiunto di A
introdotto nellesercizio 8.2.3, si provi che:
(i) |A A

|
/(H)
= |A

A|
/(H)
= |A|
2
/(H)
;
(ii) Se A `e autoaggiunto, allora |A
n
|
/(H)
= |A|
n
/(H)
per ogni n N
+
.
7. Sia H uno spazio di Hilbert e sia A /(H) `e un operatore autoaggiunto
e positivo, ossia tale che (Ax, x) 0 per ogni x H. Si provi che
[(Ax, y)[
_
(Ax, x)
_
(Ay, y) x, y H,
e che se A`e strettamente positivo, ossia (Ax, x) > 0 per ogni x H0,
allora (x, y)
1
= (Ax, y) denisce un prodotto scalare in H.
8.3 Sistemi ortonormali
In R
N
ed in C
N
, come sappiamo, ogni elemento x si pu`o scrivere in modo
unico come combinazione lineare degli elementi di una ssata base. Vediamo
se `e possibile trovare una propriet`a analoga negli spazi di Hilbert.
Denizione 8.3.1 Una famiglia e

A
di elementi di uno spazio di Hilbert
H si chiama sistema ortonormale se si ha
(e

, e

)
H
=

=
_
1 se =
0 se ,=
, A.
Vediamo qualche esempio.
Esempi 8.3.2 (1) Fissato e H con |e| = 1, linsieme e costituisce un
sistema ortonormale in H.
(2) e
1
, . . . , e
N
`e un sistema ortonormale in R
N
ed in C
N
.
(3) In
2
un sistema ortonormale `e dato dalla famiglia e
n

nN
, ove e
n
`e
lelemento con tutte le componenti nulle tranne la n-sima che vale 1.
(4) Se f, g L
2
(R) e se f `e pari e g `e dispari, con |f|
L
2
(R)
= |g|
L
2
(R)
= 1,
215
allora f, g `e un sistema ortonormale in L
2
(R).
(5) Il sistema trigonometrico
_
1

2
,
1

cos nx ,
1

sin nx ; n N
+
_
`e un sistema ortonormale in L
2
(, ) (esercizio 8.1.9).
(6) In L
2
(a, b) esistono altri sistemi ortonormali: vedere ad esempio gli
esercizi 8.3.10 e 8.3.12.
Osservazione 8.3.3 Se H `e separabile, allora ogni sistema ortonormale
e

A
`e composto al pi` u da uninnit`a numerabile di elementi. Infatti
si ha
|e

| =

2 ,= ,
e dunque le palle B(e

,
1

2
) son tutte disgiunte; quindi un insieme denso in
H deve avere almeno la stessa cardinalit`a di A. Essendo H separabile, si
conclude che A `e al pi` u numerabile.
Esempio 8.3.4 Costruiamo uno spazio di Hilbert non separabile. Sia
E = f : R C : x R : f(x) ,= 0 `e numerabile,
e poniamo
H =
_
f E :

xR
[f(x)[
2
<
_
:
la denizione ha senso perche la somma `e fatta al pi` u su uninnit`a numera-
bile di punti, la serie `e a termini positivi e lordine degli addendi `e irrilevante.
Linsieme H `e dotato del prodotto scalare
(f, g) =

xR
f(x)g(x),
ed `e uno spazio di Hilbert, come `e facile vericare; H non `e separabile perche
possiede il sistema ortonormale
x

xR
, il quale `e pi` u che numerabile. Si
noti che H coincide con L
2
(R, T, ), ove `e la misura cardinalit`a e
T = A R : A, oppure A
c
, `e numerabile.
Veniamo alla propriet`a fondamentale dei sistemi ortonormali, ossia la disu-
guaglianza di Bessel. Premettiamo un po di terminologia.
216
Denizione 8.3.5 Sia H uno spazio di Hilbert e sia e

A
un sistema
ortonormale in H. Se x H, i numeri (x, e

)
H
si chiamano coecienti di
Fourier di x relativi al sistema e

. La serie

A
(x, e

)
H
e

(la quale, co-


me si vedr`a nellosservazione 8.3.7(1), contiene al pi` u uninnit`a numerabile
di termini) si chiama serie di Fourier di x relativa al sistema e

.
A priori non sappiamo dire se la serie di Fourier di un elemento x H
converga, ne, tantomeno, se essa converga proprio a x come sarebbe lecito
aspettarsi.
Proposizione 8.3.6 (disuguaglianza di Bessel) Sia e

A
un sistema
ortonormale in uno spazio di Hilbert H. Allora
sup
_
N

i=1
[(x, e

i
)
H
[
2
: N N
+
,
1
, . . .
N
A
_
|x|
2
H
x H.
Dimostrazione Per ogni N N
+
e per ogni N-pla di indici distinti

1
, . . .
N
si ha, grazie allortonormalit`a di e

,
0
_
_
_
_
_
x
N

i=1
(x, e

i
)e

i
_
_
_
_
_
2
H
=
= |x|
2
H
2Re
_
x,
N

i=1
(x, e

i
)
H
e

i
_
H
+
_
_
_
_
_
N

i=1
(x, e

i
)
H
e

i
_
_
_
_
_
2
H
=
= |x|
2
H
2Re
N

i=1
(x, e

i
)
H
(x, e

i
)
H
+
N

i,j=1
(x, e

i
)
H
(x, e

j
)
H

ij
=
= |x|
2
H
2
N

i=1
[(x, e

i
)
H
[
2
+
N

i=1
[(x, e

i
)
H
[
2
=
= |x|
2
H

N

i=1
[(x, e

i
)
H
[
2
.
Ne segue la tesi.
Osservazioni 8.3.7 (1) Se lo spazio H non `e separabile, dato un qualunque
sistema ortonormale e

A
`e facile vericare che per ogni x H linsieme
degli indici A tali che (x, e

)
H
,= 0 `e al pi` u numerabile: infatti per
ogni k N
+
linsieme A : [(x, e

)
H
[ > 1/k `e nito in virt` u della
disuguaglianza di Bessel.
217
(2) Dalla disuguaglianza di Bessel e da (1) segue che la serie di Fourier di un
generico x H, relativa a un qualunque sistema ortonormale, converge in
H; infatti con un conto del tutto analogo a quello svolto nella dimostrazione
precedente si verica che, detti
n
gli indici tali che (x, e
n
)
H
,= 0 e posto
w
N
=

N
n=0
(x, e
n
)
H
e
n
, si ha
|w
N
w
M
|
2
H
=
N

n=M+1
[(x, e
n
)
H
[
2
N, M N con N > M,
e dunque w
N

NN
, essendo una successione di Cauchy, converge in H. Non
`e detto che la somma della serie di Fourier di x sia proprio x: basta pensare
al caso banale di un sistema ortonormale costituito da un solo elemento.
Denizione 8.3.8 Un sistema ortonormale e

A
in uno spazio di Hilbert
H si dice completo se [e

A
] = H, ossia se le combinazioni lineari nite
di elementi di e

A
sono dense in H.
In altre parole, un sistema ortonormale e

A
`e completo se e solo se
e

= 0: ci`o `e facile conseguenza del teorema delle proiezioni (teorema


8.1.6). Vediamo alcuni esempi di sistemi ortonormali completi.
Esempi 8.3.9 (1) Il sistema e
1
, . . . , e
N
`e completo in R
N
ed in C
N
.
(2) Il sistema e
n

nN
`e completo in
2
.
(3) Il sistema trigonometrico `e completo in L
2
(, ) (esercizio 8.3.3).
(4) I polinomi di Legendre, deniti da
P
n
(x) =
1
n! 2
n
_
n +
1
2
d
n
dx
n
(x
2
1)
n
, x [1, 1], n N,
costituiscono un sistema ortonormale in L
2
(1, 1) (esercizio 8.3.10); esso `e
anche completo. Ci`o segue dalla densit`a dei polinomi in C
0
[1, 1] (esercizio
4.7.10) e dalla densit`a di C
0
[1, 1] in L
2
(1, 1) (proposizione 4.7.3 ed osser-
vazione 4.7.4).
(5) I polinomi di Hermite, deniti da
H
n
(x) =
(1)
n
_
n! 2
n

e
x
2 d
n
dx
n
e
x
2
, x R, n N
+
,
formano un sistema ortonormale completo in L
2
(R, /, e
x
2
dx) (esercizio
8.3.11).
218
Proposizione 8.3.10 Ogni spazio di Hilbert H ,= 0 ha un sistema orto-
normale completo.
Dimostrazione Faremo uso del lemma di Zorn. Ricordiamo che un ordina-
mento parziale su un insieme P `e una relazione riessiva, antisimmetrica
e transitiva, e si dice che (P, ) `e un insieme parzialmente ordinato. Un sot-
toinsieme Q di P si dice totalmente ordinato se per ogni a, b Q si ha a b
oppure b a. Un elemento c P `e un maggiorante per Q se si ha q c per
ogni q Q, e un elemento m P `e massimale se non esiste alcun x P,
diverso da m, tale che m x (ossia, se x P e m x implica x = m). Ci`o
posto, vale questo risultato che non dimostriamo:
Lemma 8.3.11 (di Zorn) Sia (P, ) un insieme parzialmente ordinato. Se
ogni sottoinsieme totalmente ordinato Q di P ha un maggiorante in P, allora
in P esiste un elemento massimale.
Prendiamo ora
P = B H : B `e un sistema ortonormale in H :
chiaramente P `e un insieme non vuoto che `e parzialmente ordinato rispetto
alla relazione di inclusione . Verichiamo le ipotesi del lemma di Zorn.
Se Q `e un sottoinsieme totalmente ordinato di P, verichiamo che linsieme
B
0
=

BQ
B `e un elemento di P che `e maggiorante per Q: per cominciare,
ogni e B
0
ha norma unitaria, in quanto `e membro di un certo sistema orto-
normale B Q. Poi, se e, e
t
B
0
ed e ,= e
t
, allora sar`a e B ed e
t
B
t
per
certi B, B
t
Q; dato che Q `e totalmente ordinato, sar`a ad esempio B B
t
.
Ma allora avremo e, e
t
B
t
e quindi, per lortonormalit`a del sistema B
t
, ri-
sulter`a (e, e
t
)
H
= 0. Ci`o prova che B
0
`e un sistema ortonormale in H; dunque
B
0
`e un elemento di P. Daltronde `e chiaro per denizione di B
0
che B B
0
per ogni B Q, cosicche B
0
`e un maggiorante di Q.
Per il lemma di Zorn, deduciamo che in P esiste un elemento massimale B;
proviamo che il sistema ortonormale B `e completo. Se cos` non fosse, esiste-
rebbe x B

0, e quindi B
x
|x|
sarebbe un sistema ortonormale, cio`e
un elemento di P, che contiene strettamente B, contraddicendo la massima-
lit`a di B.
La proposizione che segue caratterizza i sistemi ortonormali completi.
Proposizione 8.3.12 Sia H uno spazio di Hilbert e sia e

A
un sistema
ortonormale in H. I seguenti fatti sono equivalenti:
219
(i) e

`e completo;
(ii) e

= 0;
(iii) vale l uguaglianza di Bessel
|x|
2
H
=

A
[(x, e

)
H
[
2
x H;
(iv) vale l identit`a di Parseval
(x, y)
H
=

A
(x, e

)
H
(y, e

)
H
x, y H;
(v) per ogni x H la serie di Fourier di x, cio`e

A
(x, e

)
H
e

, converge
in H ed ha somma x.
Ricordiamo che in virt` u dellosservazione 8.3.7 le serie che compaiono nelle-
nunciato contengono al pi` u uninnit`a numerabile di termini.
Dimostrazione (i) (ii) Lo sappiamo gi`a, come osservato subito dopo
la denizione 8.3.8.
(ii) (v) Se vale (v) e x e

, allora
x =

A
(x, e

)
H
e

A
0 e

= 0.
Viceversa, supponiamo che valga (ii). Dallosservazione 8.3.7 segue che la
serie di Fourier di x converge in H ad un certo elemento w; si tratta di
vericare che w = x. Ma per ogni ssato A si ha, in virt` u della continuit`a
del prodotto scalare,
(w, e

)
H
=
_

A
(x, e

)
H
e

, e

_
H
=

A
(x, e

)
H
(e

, e

)
H
= (x, e

)
H
,
da cui, per larbitrariet`a di , otteniamo wx e

; per (ii), ci`o signica


w x = 0.
(iii) (v) Questa doppia implicazione `e immediata conseguenza della
220
seguente uguaglianza che gi`a conosciamo: per ogni x H, per ogni N N
+
e per ogni
1
, . . . ,
N
A si ha
_
_
_
_
_
x
N

n=1
(x, e
n
)
H
e
n
_
_
_
_
_
2
H
= |x|
2
H

N

n=1
[(x, e
n
)
H
[
2
.
(iii) (iv) Se vale (iv), allora basta scegliere y = x per ottenere (iii).
Viceversa, se vale (iii), possiamo scrivere
|x +y|
2
H
= |x|
2
H
+|y|
2
H
+ 2Re(x, y)
H
ed anche
|x +y|
2
H
=

A
[(x, e

)
H
+ (y, e

)
H
[
2
=
=

A
[(x, e

)
H
[
2
+

A
[(y, e

)
H
[
2
+ 2Re

A
(x, e

)
H
(y, e

)
H
,
da cui
Re(x, y)
H
= Re

A
(x, e

)(y, e

).
In modo analogo, considerando x +iy in luogo di x +y, si ricava
Im(x, y)
H
= Im

A
(x, e

)
H
(y, e

)
H
.
Ci` o conclude la dimostrazione.
Esercizi 8.3
1. (Propriet`a di miglior approssimazione) Sia e

A
un sistema orto-
normale nello spazio di Hilbert H; ssati
1
, . . . ,
N
A, sia M =
[e

1
, . . . , e

N
]. Si provi che
P
M
x =
N

n=1
(x, e
n
)
H
e
n
.
2. Per ogni n N deniamo
P
n
(t) = k
n
_
1 + cos t
2
_
n
, t [, ],
ove k
n
`e una costante scelta in modo che
_

P
n
(t)dt = 1. Si provi che:
221
(i) P
n
`e un polinomio trigonometrico di grado n, ossia `e combinazione
lineare delle 2n + 1 funzioni 1, cos kx, sin kx, 1 k n, ed `e
strettamente positivo in ] , [;
(ii) risulta
k
n
=
1
_

_
1+cos t
2
_
n
dt

n + 1
4
n N,
e dunque
lim
n
sup
[t[
P
n
(t) = 0 ]0, [;
(iii) se f `e una funzione continua su R e periodica di periodo 2, allora
posto
f
n
(t) =
_

f(t s)P
n
(s)ds, t [, ],
si ha che f
n
`e un polinomio trigonometrico di grado al pi` u n;
(iv) si ha f
n
f uniformemente in [, ] per n .
3. Si provi che il sistema trigonometrico
_
1

2
,
1

cos nx ,
1

sin nx ; n N
+
_
,
o, equivalentemente, il sistema
_
e
ikx

2
; k Z
_
,
`e ortonormale completo in L
2
(, ).
[Traccia: si provi che i polinomi trigonometrici sono densi nello spa-
zio C
0
0
[, ], e quindi anche in L
2
(, ), facendo uso dellesercizio
precedente.]
4. Sia f L
2
(, ). Si verichi che la serie di Fourier di f (relativa al
sistema trigonometrico) si pu`o scrivere nei due modi equivalenti

kZ

k
e
ikt
=
a
0
2
+

n=1
(a
n
cos nt +b
n
sin nt),
ove

k
=
1
2
_

f(s)e
iks
ds k Z,
222
a
n
=
1

f(s) cos ns ds n N,
b
n
=
1

f(s) sin ns ds n N
+
.
Si verichi inoltre che a
0
= 2
0
, a
n
=
n
+
n
, b
n
= i(
n

n
) per
ogni n N
+
.
5. Posto
P = f L
2
(, ) : f `e pari, D = f L
2
(, ) : f `e dispari,
si provi che P e D sono sottospazi chiusi di L
2
(, ) tali che P = D

.
6. Provare che i sistemi
_
_
2

sin nx
_
nN
+
,
_
1

_
_
2

cos nx
_
nN
+
sono entrambi ortonormali e completi in L
2
(0, ).
[Traccia: per la completezza si prolunghi una f L
2
(0, ), ortogonale
a tutti gli elementi di uno dei due sistemi, in modo pari oppure dispari
su ] , [. . . .]
7. Si scriva la serie di Fourier (relativa al sistema trigonometrico) di
f(x) =
_
[x[
2
_
2
, x [, ];
si provi che tale serie converge uniformemente e se ne deduca che

n=1
1
n
2
=

2
6
,

n=1
1
n
4
=

4
90
.
8. Fissata f L
2
(, ), la si prolunghi a tutto R per periodicit`a. Posto,
per ogni g L
2
(, ),
f g(x) =
_

f(x y)g(y)dy, x [, ],
si provi che f g `e continua e che la sua serie di Fourier, relativa al
sistema
e
inx

kZ
, converge uniformemente in [, ].
223
9. Sia f AC[, ] tale che f() = f(), e per ogni k Z poniamo

k
=
1
2
_

f(s)e
iks
ds. Si provi che:
(i) f
t
L
2
(, ) se e solo se

kZ
k
2
[
k
[
2
< ;
(ii) in tal caso la serie

kZ

k
e
ikt
converge assolutamente ed unifor-
memente a f in [, ];
(iii) tale serie `e inoltre derivabile termine a termine, e la serie delle
derivate converge a f
t
in L
2
(, ).
10. Si verichi che il sistema dei polinomi di Legendre
P
n
(x) =
1
n! 2
n
_
n +
1
2
d
n
dx
n
(x
2
1)
n
, x [1, 1], n N,
`e ortonormale in L
2
(1, 1).
11. Si provi che il sistema dei polinomi di Hermite
H
n
(x) =
(1)
n
_
n! 2
n

e
x
2 d
n
dx
n
e
x
2
, x R, n N
+
,
`e ortonormale completo in L
2
(R, /, e
x
2
dx).
[Traccia: si osservi che C
0
0
(R) `e denso in L
2
(R, /, e
x
2
dx), e si utilizzi
la densit`a dei polinomi nello spazio C
0
[a, b] per ogni [a, b] R.]
12. Per ogni n N sia
n
: [0, 1] R denita da
n
(x) = (1)
[2
n
x]
, ove
[a] denota la parte intera di a. Dimostrare che:
(i)
n

nN
`e un sistema ortonormale in L
2
(0, 1);
(ii) il sistema non `e completo perche la funzione g = 1 2
[1/4,3/4]
`e
ortogonale a tutte le
n
;
(iii) risulta
lim
n
_
1
0

n
(t)f(t) dt = 0 f L
1
(0, 1).
13. Siano
n

nN
e
n

nN
due sistemi ortonormali completi in L
2
(a, b)
e L
2
(c, d) rispettivamente. Provare che il sistema f
nm

n,mN
, ove
f
nm
(x, y) =
n
(x)
m
(y), (x, y) ]a, b[]c, d[,
`e ortonormale completo in L
2
(]a, b[]c, d[).
224
14. Sia V il sottospazio di
2
generato dagli elementi x =
1
n

nN
+ e y =

1
2
n

nN
+; determinare un sistema ortonormale in V .
15. Sia H uno spazio di Hilbert separabile e sia e
n

nN
+ un sistema orto-
normale completo in H. Per ogni h N
+
poniamo
M
h
=
_
x H : c > 0 : [(x, e
n
)
H
[
c
n
h
n N
+
_
,
K
h
=
_
x H : [(x, e
n
)
H
[
1
n
h
n N
+
_
.
(a) Vericare che:
(i) K
h
`e un convesso chiuso contenuto in M
h
e K
h
K
h+1
per
ogni h N
+
;
(ii) M
h
`e un sottospazio denso in H e M
h
M
h+1
per ogni
h N
+
.
(b) Caratterizzare il convesso K =

h=1
K
h
e provare che il sottospa-
zio M =

h=1
M
h
`e denso in H.
(c) Scrivere esplicitamente gli operatori P
K
h
, h N
+
, e P
K
.
16. Sia H uno spazio di Hilbert separabile e sia e
n

nN
+ un sistema orto-
normale completo in H; si denisca
M =
_
x H : (x, e
n+2
)
H
=
1
2
(x, e
n
)
H
n N
+
_
.
(i) Si verichi che M `e un sottospazio nito-dimensionale di H.
(ii) Si trovi una base di M.
(iii) Si determini la proiezione ortogonale P
M
.
17. Sia H uno spazio di Hilbert e sia v
n

nN
una successione di elementi
di H fra loro ortogonali, e tali che la serie

n=0
v
n
sia convergente in
H. Si dimostri che per ogni permutazione : N N la serie riordinata

n=0
v
(n)
`e convergente e che si ha

n=0
v
(n)
=

n=0
v
n
.
Cosa succede se si toglie lipotesi (v
n
, v
m
) = 0 per n ,= m?
225
18. Sia H uno spazio di Hilbert separabile e siano e
n
, f
m
sistemi or-
tonormali completi in H. Se T /(H), si provi che

n=0
|Te
n
|
2
converge se e solo se

m=0
|T

f
m
|
2
converge (T

`e denito nelleser-
cizio 8.2.3), e che in tal caso le somme delle due serie coincidono con

n,m=0
[(Te
n
, f
m
)[
2
.
19. Sia H uno spazio di Hilbert separabile, e sia A /(H) un operatore di
Hilbert-Schmidt, ossia tale che esista un sistema ortonormale completo
e
n

nN
in H per cui

n=0
|Ae
n
|
2
< . Dimostrare che:
(i) loperatore A

(denito nellesercizio 8.2.3) `e di Hilbert-Schmidt;


(ii) per ogni sistema ortonormale completo f
m

mN
in H risulta

m=0
|Af
m
|
2
=

n=0
|Ae
n
|
2
< ;
(iii) la famiglia degli operatori di Hilbert-Schmidt su H `e uno spazio
di Hilbert col prodotto scalare
(S, T) =

j=0
(Sh
j
, Th
j
)
H
,
ove h
j

jN
`e un arbitrario sistema ortonormale completo in H;
(iv) il prodotto scalare sopra denito non dipende dalla scelta del si-
stema ortonormale, ossia per ogni coppia di sistemi ortonormali
completi f
m

mN
, g
k

kN
si ha

m=0
(Sf
m
, Tf
m
)
H
=

k=0
(Sg
k
, Tg
k
)
H
.
[Traccia: per (ii) si osservi che (A

= A e si utilizzi lesercizio prece-


dente; per (iv) si faccia uso di (ii) e dellidentit`a del parallelogrammo.]
20. (i) Fissato [a, b] R, si verichi che
lim
n
_
F
sin nx dx = lim
n
_
F
cos nx dx = 0
per ogni sottoinsieme misurabile F di [a, b].
226
(ii) Sia n
k

kN
una successione crescente di numeri naturali; posto
E = x [a, b] : lim
k
sin n
k
x = (x),
si provi che (x) = 0 q.o. in E.
(iii) Si deduca che
lim
k
_
E
sin
2
n
k
x dx = 0.
(iv) Si concluda che risulta m(E) = 0.
8.4 Trasformata di Fourier
Vogliamo descrivere brevemente un operatore che `e di fondamentale impor-
tanza in analisi ed in molti settori della matematica applicata: la trasformata
di Fourier. Si tratta di uno strumento utilissimo, ad esempio, per trovare so-
luzioni esplicite di molte equazioni dierenziali alle derivate parziali; interi
capitoli dellanalisi numerica sono dedicati allo studio di algoritmi e proce-
dure legati alla struttura di questo operatore e delle sue versioni discre-
te. Noi ci limiteremo allo studio delle sue propriet`a basilari, senza troppi
approfondimenti.
Denizione 8.4.1 Sia f L
1
(R
N
). La trasformata di Fourier di f `e la
funzione

f cos` denita:

f() =
_
R
N
f(x)e
i(x,)
dm
N
(x), R
N
,
dove (x, ) `e il prodotto scalare in R
N
. Loperatore f

f si indica con F.
La funzione

f `e dunque a valori complessi, anche se f `e reale; ma in questo
contesto `e naturale prendere anche f a valori complessi. Ricordiamo che
lintegrale per funzioni complesse `e stato introdotto nellesempio 7.2.6 (4) ed
`e soggetto alle usuali regole di calcolo. Calcoliamo la trasformata di Fourier
in qualche caso signicativo.
Esempi 8.4.2 (1) Sia N = 1 e f =
[1,1]
: allora per ogni R si ha

f() =
_
1
1
e
ix
dx =
_

e
ix
i
_
1
1
=
=
i

_
e
i
e
i
_
= 2
sin

.
227
Si osservi che

f / L
1
(R): quindi loperatore F non preserva la sommabilit`a
delle funzioni.
(2) Calcoliamo la trasformata di Fourier di f(x) = e
a[x[
2
, con a > 0 ssato:
si ha

f() =
_
R
N
e
a[x[
2
e
i(x,)
dm
N
(x) =
N

j=1
_

e
ax
2
j
ix
j

j
dx
j
R
N
;
quindi lintegrale multiplo da calcolare si riduce agli N integrali unidimen-
sionali
_

e
ax
2
ix
j
dx. Poniamo
g() =
_

e
ax
2
ix
dx, R;
risulta allora, utilizzando il teorema 4.3.4 ed integrando per parti,
g
t
() = i
_

xe
ax
2
ix
dx =
i
2a
_

d
dx
e
ax
2
e
ix
dx =
=
i
2a
_
e
ax
2
e
ix
_
+


2a
_

e
ax
2
ix
dx =

2a
g().
Lequazione dierenziale g
t
() =

2a
g() ha le soluzioni g() = ke

2
4a
, con
k R; daltra parte per lesercizio 5.3.2 si ha
k = g(0) =
_
+

e
ax
2
dx =
1

2a
_
+

y
2
2
dy =
_

a
,
cosicche
g() =
_

e
ax
2
ix
dx =
_

a
e

2
4a
R
ed in denitiva

f() =
N

j=1
_

e
ax
2
j
ix
j

j
dx
j
=
_

a
_N
2
e

||
2
4a
R
N
.
Proposizione 8.4.3 La trasformata di Fourier `e un operatore lineare e con-
tinuo da L
1
(R
N
) in L

(R
N
), con norma uguale a 1. Inoltre per ogni f
L
1
(R
N
) la funzione

f `e uniformemente continua su R
N
e verica
lim
[[

f() = 0.
228
Dimostrazione Dalla denizione segue subito
[

f()[ |f|
L
1
(R
N
)
R
N
,
e dunque F /(L
1
(R
N
), L

(R
N
)) con |F| 1. Daltra parte scegliendo
f(x) = e

1
2
[x[
2
si ha, ricordando lesempio 8.4.2 (2),
|f|
L
1
(R
N
)
=
__

1
2
x
2
dx
_
N
= (2)
N
2
= |

f|

,
e dunque |F| = 1.
Proviamo luniforme continuit`a. Se , h R
N
si ha
[

f( +h)

f()[ =

_
R
N
f(x)[e
i(x,h)
1]e
i(x,)
dm
N
(x)

=
=

F([e
i(,h)
1]f())()

|[e
i(,h)
1]f()|
L
1
(R
N
)
,
e lultimo membro tende a 0 per [h[ 0, in virt` u del teorema di convergenza
dominata (teorema 4.3.4).
Proviamo inne che

f() tende a 0 per [[ . Osservando che
e
i
(,)
||
2
= 1 R
N
0,
posto v

[[
2
ed eettuando il cambiamento di variabile x v

= y,
possiamo scrivere

f() =
_
R
N
f(x)e
i(x+

||
2
,)
dm
N
(x) =
_
R
N

f(y)e
i(y,)
dm
N
(y),
ove
v

f(y) = f(y +v

); ne segue
[2

f()[ =

_
R
N
[f(y)
v

f(y)]e
i(y,)
dm
N
(y)

|f
v

f|
L
1
(R
N
)
.
Se ora [[ , si ha [v

[ 0 e dunque, ricordando lesercizio 4.7.3 (che `e


relativo a L
1
(R) ma vale anche, con analoga dimostrazione, in L
1
(R
N
)), si
conclude che [

f()[ 0. Ci`o prova la tesi.


Osservazione 8.4.4 La trasformata di Fourier regolarizza le funzioni: se
f `e solo sommabile, come abbiamo visto

f `e continua; analogamente, se
x [x[f(x) `e sommabile, utilizzando come in precedenza il teorema 4.3.4 si
deduce che

f `e di classe C
1
e
229
D
j

f() = [F(ix
j
f(x))]().
La trasformata di Fourier ha anche limportante propriet`a di tramutare il
prodotto di convoluzione (v. esercizio 5.4.4) in un prodotto ordinario:
Proposizione 8.4.5 Per f, g L
1
(R
N
) si ha

f g() =

f() g() R
N
.
Dimostrazione Notiamo che per ogni R
N
la funzione
(x, y) f(x y)g(y)e
i(x,)
`e sommabile su R
N
R
N
; quindi, applicando il teorema di Fubini (teorema
5.4.4) otteniamo

f g() =
_
R
N
f g(x)e
i(x,)
dm
N
(x) =
=
_
R
N
__
R
N
f(x y)g(y)e
i(x,)
dm
N
(y)
_
dm
N
(x) =
=
_
R
N
__
R
N
f(x y)g(y)e
i(x,)
dm
N
(x)
_
dm
N
(y) =
=
_
R
N
__
R
N
f(u)g(y)e
i(u+y,)
dm
N
(u)
_
dm
N
(y) =
=
__
R
N
f(u)e
i(u,)
dm
N
(u)
___
R
N
g(y)e
i(y,)
dm
N
(y)
_
=
=

f() g().
Osservazione 8.4.6 Lo spazio L
1
(R
N
), munito del prodotto di convoluzio-
ne, `e unalgebra, ossia `e chiuso rispetto al prodotto, ed `e priva di unit`a, cio`e
non esiste alcuna funzione h L
1
(R
N
) tale che risulti h f = f per ogni
f L
1
(R
N
). Infatti se tale funzione h esistesse, avremmo per la proposi-
zione precedente

f =

h

f; dunque, scegliendo f in modo che



f() ,= 0 per
ogni R
N
dedurremmo

h 1 in R
N
. Ma ci`o `e in contraddizione con la
proposizione 8.4.3, perch`e

h() non sarebbe innitesima per [[ .


Introduciamo adesso uno spazio di funzioni regolari, lo spazio di Schwartz,
sul quale, come vedremo fra poco, la trasformata di Fourier `e bigettiva ed `e
un isomorsmo.
230
Denizione 8.4.7 Lo spazio di Schwartz o(R
N
) `e denito da
o(R
N
) = C

(R
N
) : x x

(x) L

(R
N
) , N
N
.
Ricordiamo che x

= x

1
1
. . .x

N
N
e che D

= D

1
1
. . . D

N
N
; inoltre si denisce
[[ =
1
+. . . +
N
per N
N
.
`
E immediato vericare che o(R
N
) `e un sottospazio di L
p
(R
N
) per ogni p
[1, ]. Si noti poi che C

0
(R
N
) o(R
N
) e che linclusione `e propria in
quanto la funzione f(x) = e
[x[
2
appartiene a o(R
N
) e non ha supporto
compatto; da questa inclusione segue in particolare che o(R
N
) `e denso in
tutti gli spazi L
p
(R
N
) con p [1, [.
Nello spazio di Schwartz la trasformata di Fourier mostra la sua caratteristica
pi` u importante, che `e quella di scambiare fra loro le operazioni di derivazione
e di moltiplicazione per monomi: di qui scaturisce lutilit`a di questo operatore
per la risoluzione di equazioni dierenziali.
Proposizione 8.4.8 Se o(R
N
) allora

() = i
[[

() R
N
,
D

() = (i)
[[
F(x

(x))() R
N
.
Dimostrazione La prima propriet`a si ottiene integrando per parti [[ volte
nellintegrale che denisce

D

; ci`o `e possibile perche


lim
[x[
[x

(x)[ = 0 , N
N
, o(R
N
).
La seconda propriet`a si ottiene per induzione a partire dal risultato dellos-
servazione 8.4.4.
Proposizione 8.4.9 La trasformata di Fourier manda o(R
N
) in se.
Dimostrazione Basta osservare che se o(R
N
) e , N
N
si ha, per
la proposizione precedente,

() =

(i)
[[
F(x

(x))() = (1)
[[
i
[[[[
F(D

(x

(x)))(),
da cui, per la proposizione 8.4.3,
[

()[ |D

(x

(x))|
L
1
(R
N
)
< R
N
.
La trasformata di Fourier non avrebbe limportanza applicativa che ha se
non ci fosse un modo per ricostruire la funzione originaria a partire dalla sua
trasformata. Ci`o `e possibile nello spazio o(R
N
):
231
Teorema 8.4.10 (formula di inversione) Se o(R
N
), allora si ha
(x) = (2)
N
_
R
N
()e
i(x,)
dm
N
() = (2)
N

(x) x R
N
;
in particolare F : o(R
N
) o(R
N
) `e bigettiva.
Dimostrazione Non possiamo procedere nel modo pi` u naturale, che `e quello
di sostituire la denizione di () nellintegrale candidato a fornire la formula
di inversione, in quanto per qualunque ssato x R
N
la funzione
(y, ) (y)e
i(y,)
e
i(x,)
non `e sommabile in R
N
R
N
, cosicche non possiamo applicare il teorema
di Fubini. Otterremo il risultato con un procedimento di approssimazione.
Premettiamo il
Lemma 8.4.11 Per ogni , o(R
N
) si ha
_
R
N
() ()e
i(x,)
dm
N
() =
_
R
N

(u)(x +u)dm
N
(u) x R
N
.
Dimostrazione La funzione
(y, ) (y)()e
i(y,)
e
i(x,)
appartiene a L
1
(R
N
R
N
); dunque per il teorema 5.4.4 si ha
_
R
N
() ()e
i(x,)
dm
N
() =
=
_
R
N
()
__
R
N
(y)e
i(y,)
dm
N
(y)
_
e
i(x,)
dm
N
() =
=
_
R
N
(y)
__
R
N
()e
i(yx,)
dm
N
()
_
dm
N
(y) =
=
_
R
N

(y x)(y)dm
N
(y),
e la tesi del lemma segue tramite il cambiamento di variabile u = y x.
Dimostriamo la formula di inversione per una ssata o(R
N
). Scegliamo
f() = e

1
2
[[
2
; osserviamo che si ha
f(0) = 1,

f(u) = (2)
N
2
e

1
2
[u[
2
,
_
R
N

f(u)dm
N
(u) = (2)
N
.
232
Adesso, ssato > 0, applichiamo il lemma precedente alla funzione () =
f(): ricordando lesempio 8.4.2 (2), si ha

(u) =
N

f
_
u

_
=
N
(2)
N
2
e

1
2
|u|
2

2
,
cosicche dal lemma 8.4.11 ricaviamo
_
R
N
f() ()e
i(x,)
dm
N
() =
=
N
_
R
N

f
_
u

_
(x +u)dm
N
(u) =
_
y =
u

_
=
_
R
N

f(y)(x +y)dm
N
(y).
Per 0 dal teorema di Lebesgue (teorema 4.3.4) segue la relazione
_
R
N
()e
i(x,)
dm
N
() = (2)
N
(x),
che `e la tesi del teorema.
Osservazione 8.4.12 Dal lemma 8.4.11 segue in particolare, scelto x = 0,
_
R
N
() ()dm
N
() =
_
R
N

(u)(u)dm
N
(u) , o(R
N
).
Enunciamo adesso il pi` u importante risultato della teoria della trasformata
di Fourier: esso esprime il fatto che loperatore F `e un isomorsmo dello
spazio normato (o(R
N
), | |
L
2
(R
N
)
) in se, e che di conseguenza esso si pu`o
estendere in modo unico, per densit`a, ad un isomorsmo di L
2
(R
N
) in se.
Teorema 8.4.13 (di Plancherel) Per ogni f, g o(R
N
) vale la formula
di Parseval
(

f, g)
L
2
(R
N
)
= (2)
N
(f, g)
L
2
(R
N
)
;
in particolare
|

f|
L
2
(R
N
)
= (2)
N
2
|f|
L
2
(R
N
)
f o(R
N
).
233
Dimostrazione Applicando losservazione precedente si ha
(

f, g)
L
2
(R
N
)
=
_
R
N

f() g() dm
N
() =
_
R
N
f(u)

g (u) dm
N
(u).
Daltra parte risulta
g() = g() =
_
R
N
g(x)e
i(x,)
dm
N
(x) =
_
R
N
g(x)e
i(x,)
dm
N
(x) =

g(),
ed anche, posto y = x,
g() =
_
R
N
g(x)e
i(x,)
dm
N
(x) =
_
R
N
g(y)e
i(y,)
dm
N
(y) =

g()();
quindi, per la formula di inversione,

g (u) =

g()(u) = (2)
N
g()(u) = (2)
N
g(u).
Pertanto
(

f, g)
L
2
(R
N
)
= (2)
N
_
R
N
f(u)g(u)dm
N
(u) = (2)
N
(f, g)
L
2
(R
N
)
.
Corollario 8.4.14 La trasformata di Fourier si estende in modo unico ad
un isomorsmo di L
2
(R
N
) in se, che denotiamo con lo stesso simbolismo. In
particolare si ha
(

f, g)
L
2
(R
N
)
= (2)
N
(f, g)
L
2
(R
N
)
f, g L
2
(R
N
),
f(x) = (2)
N

f (x) q.o. in R
N
f L
2
(R
N
);
inoltre, posto per ogni f L
2
(R
N
)

R
() =
_
[x[R
f(x)e
i(x,)
dm
N
(x),

R
(x) = (2)
N
_
[[R

f()e
i(x,)
dm
N
(),
risulta
lim
R
|
R


f|
L
2
(R
N
)
= 0, lim
R
|
R
f|
L
2
(R
N
)
= 0.
234
Dunque la formula esplicita della trasformata di Fourier si estende a tut-
te le funzioni di L
2
(R
N
) non in modo automatico, ma soltanto in un senso
opportuno:

f `e limite in L
2
(R
N
) delle funzioni
R
il cui valore `e una appros-
simazione della formula della trasformata di Fourier.
Dimostrazione Se f L
2
(R
N
), e
n
`e una successione contenuta in
o(R
N
) che converge a f in L
2
(R
N
), poniamo

f = lim
n

n
; questo limite
esiste in L
2
(R
N
) grazie al teorema di Plancherel.
`
E immediato vericare che
la denizione non dipende dalla successione approssimante, ma solo dalla
f.
`
E allora facile vericare che loperatore F, denito da F(f) =

f, `e un
isomorsmo vericante la prima uguaglianza dellenunciato. La seconda pro-
priet`a dellenunciato si ottiene passando ad una sottosuccessione di
n
che
converga q.o. a f.
Proviamo lultima parte della tesi. Posto
R
=
[x[R
per ogni R > 0,
osservato che
R
f L
1
(R
N
) L
2
(R
N
) si vede subito che

R
=

(
R
f), lim
R
|
R
f f|
L
2
(R
N
)
= 0,
da cui
lim
R
|
R


f|
L
2
(R
N
)
= 0.
Similmente, si ha

R
(x) = (2)
N

(
R

f)(x), lim
R
|
R

f

f|
L
2
(R
N
)
= 0,
da cui
lim
R
|(2)
N

R
()

f |
L
2
(R
N
)
= 0,
e inne, invertendo il segno della variabile di integrazione ed applicando poi
la formula di inversione,
lim
R
|
R
f|
L
2
(R
N
)
= 0.
Concludiamo il paragrafo mostrando come applicare la trasformata di Fourier
per risolvere unequazione alle derivate parziali. Consideriamo lequazione del
calore
u
t
(x, t) = u(x, t), (x, t) R
N
]0, [,
235
dove `e loperatore di Laplace, denito da
u =
N

i=1
D
2
i
u, D
i
=

x
i
.
Procederemo formalmente, cercando di ricavare in forma esplicita una fun-
zione candidata al ruolo di soluzione: a posteriori, poi, potremo vericare
rigorosamente che essa risolver`a davvero lequazione.
Applichiamo la trasformata di Fourier ad entrambi i membri dellequazione
del calore: coinvolgendo solo le variabili x
i
ma non la t, essa commuta con la
derivazione rispetto a t e quindi, ricordando la proposizione 8.4.8, troviamo
lequazione
0 =

u

u
t
= [[
2
u
u
t
, (, t) R
N
]0, [.
Risolviamo questa equazione dierenziale ordinaria nella variabile t: le solu-
zioni sono della forma
u(, t) = c()e
[[
2
t
,
con c() funzione arbitraria. Dato che la trasformata di Fourier `e un iso-
morsmo, possiamo porre c() = (), con funzione altrettanto arbitraria,
mentre dallesempio 8.4.2 (2), con a =
1
4t
, segue che
e
[[
2
t
= T
_
e

||
2
4t
(4t)
N/2
_
();
quindi possiamo scrivere
u(, t) = () T
_
e

||
2
4t
(4t)
N/2
_
() = T
_

e

||
2
4t
(4t)
N/2
_
(),
ovvero
u(x, t) =
e

||
2
4t
(4t)
N/2
(x) =
1
(4t)
N/2
_
R
N
e

|xy|
2
4t
(y) dm
N
(y).
Non `e troppo dicile vericare che questa funzione risolve il problema di
Cauchy
_
u
t
= u in R
N
]0, [
u(, 0) = in R
N
,
236
nel senso che essa `e soluzione dellequazione dierenziale in R
N
]0, [ ed
inoltre verica
lim
t0
+
u(x, t) = (x) x R
N
,
purche la funzione sia continua in R
N
e soddis la condizione
x e
[x[
(x) L
1
(R
N
) per qualche > 0
(ad esempio `e ovviamente suciente che sia continua e limitata su R
N
).
Il nucleo dellintegrale di convoluzione che denisce la soluzione u, ossia la
funzione
K(x, t) =
e

|x|
2
4t
(4t)
N/2
, (x, t) R
N
]0, [,
si chiama soluzione fondamentale dellequazione del calore, o anche nucleo
del calore.
Esercizi 8.4
1. Per R 0 e f L
1
(R
N
) si ponga m

f(x) = f(x). Si provi che

f = [[
N
m
1/

f.
2. Per ogni v R
N
e f L
1
(R
N
) si ponga

v
f(x) = f(x +v), e
v
f(x) = e
i(v,x)
f(x).
Si provi che

v
f = e
v

f,
v

f =

(e
v
f).
3. Sia A una matrice reale N N unitaria, ossia tale che [ det A[ = 1.
Provare che per ogni f L
1
(R
N
) si ha

f A =

f A.
4. Sia f L
1
(R
N
) una funzione reale strettamente positiva. Provare che
[

f()[ <

f(0) R
N
0.
237
5. Sia N = 1 e sia f L
1
(R); si provi che se f `e pari allora

f() = 2
_

0
f(x) cos x dx R,
mentre se f `e dispari allora

f() = 2i
_

0
f(x) sin x dx R.
6. Calcolare la trasformata di Fourier delle funzioni
f(x) = e
[x[
, g(x) =
1

2
+x
2
, x R,
ove `e una costante positiva.
7. Calcolare esplicitamente la funzione f
n
=
[n,n]

[1,1]
; trovare poi la
funzione tale che f
n
= .
8. Calcolare la trasformata di Fourier delle seguenti funzioni denite su
R:
f
1
(x) = max1 [x[, 0,
f
2
(x) = sgn(x) f
1
(x),
f
3
(x) = cos
x
2

[,]
(x),
f
4
(x) = sgn(x)
[1,1]
(x) e
[x[
,
f
5
(x) = sgn(x) max1 [x[,
1
2

[1,1]
(x).
9. Sia una misura nita su (R, /). Si denisca la seguente funzione
: R C:
() =
_
R
e
ix
d(x), R.
(i) Si provi che `e una funzione continua e limitata.
(ii) Se inoltre `e concentrata su un insieme limitato, si mostri che
C

(R).
(iii) Si scriva esplicitamente nei casi seguenti:
(a) = f dm, f L
1
(R); (b) =
0
; (c) =

n=1
2
n

n
.
238
Capitolo 9
Spazi L
p
9.1 La norma di L
p
Descriviamo in questo capitolo una nuova famiglia di spazi di Banach, assai
importanti per la ricchezza delle propriet`a di cui godono: gli spazi L
p
. Fra
tutti gli spazi di Banach, la struttura di questi spazi `e quella che pi` u si avvi-
cina a quella hilbertiana. Di questa famiglia conosciamo gi`a alcuni membri,
e cio`e L

(paragrafo 3.3), L
1
(paragrafo 4.6) e L
2
(esempio 7.2.6 (3)).
Sia (X, T, ) uno spazio misurato, e sia 1 p < . Poniamo
/
p
(X) =
_
f : X R : f `e misurabile e
_
X
[f[
p
d <
_
;
si vede facilmente che /
p
(X) `e uno spazio vettoriale. Infatti se f /
p
(X)
allora ovviamente f /
p
(X); poi, se f, g /
p
(X) allora anche f + g
/
p
(X), in quanto tale funzione `e misurabile ed inoltre, per la convessit`a in
[0, [ della funzione t t
p
, si ha
[f(x) +g(x)[
p
[[f(x)[ +[g(x)[]
p
2
p1
[[f(x)[
p
+[g(x)[
p
],
da cui, integrando su X,
_
X
[f +g[
p
d 2
p1
__
X
[f[
p
d +
_
X
[g[
p
d
_
< .
Indicata con labituale relazione dequivalenza che identica le funzioni
q.o. coincidenti, diamo la seguente
239
Denizione 9.1.1 Lo spazio quoziente /
p
(X)/ si indica con L
p
(X).
`
E chiaro che L
p
(X) `e uno spazio vettoriale. Deniamo
|f|
p
=
__
X
[f[
p
d
_1
p
;
dimostreremo che ||
p
`e una norma che rende L
p
(X) uno spazio di Banach. Si
osservi che le prime due propriet`a caratteristiche della norma sono immediate,
e che lunica verica non banale `e quella della subadditivit`a.
A questo scopo proveremo dapprima unaltra fondamentale disuguaglianza.
Per 1 p indichiamo con q lesponente coniugato di p, cio`e il numero
denito dalla relazione
1
p
+
1
q
= 1;
dunque
q =
_

_
1 se p =
p
p1
se 1 < p <
se p = 1.
`
E chiaro che q `e lesponente coniugato di p se e solo se p `e lesponente
coniugato di q. Si noti anche che 2 `e il coniugato di se stesso.
Proposizione 9.1.2 (disuguaglianza di Holder) Sia p [1, ] e sia q
lesponente coniugato di p. Se f L
p
(X) e g L
q
(X), allora fg L
1
(X) e
|fg|
1
|f|
p
|g|
q
.
Dimostrazione La disuguaglianza `e banale se p = 1 (oppure, simmetrica-
mente, se p = ): in tal caso infatti la tesi segue integrando la disuguaglianza
[f(x)g(x)[ [f(x)[|g|

q.o. in X.
Supponiamo dunque p ]1, [ e, di conseguenza, q =
p
p1
]1, [. Si osservi
anche che se p = q = 2 la disuguaglianza di Holder si riduce a quella di
Cauchy-Schwarz (proposizione 7.2.2). Si noti poi che se |f|
p
= 0 oppure
|g|
q
= 0 allora si ha fg = 0 q.o. in X, cosicche la tesi `e evidente; supporremo
pertanto |f|
p
e |g|
q
non nulle.
240
Proviamo la disuguaglianza di Holder. In virt` u della convessit`a di t e
t
,
per ogni a, b > 0 vale la relazione (disuguaglianza di Young)
ab = e
1
p
log a
p
+
1
q
log b
q

1
p
e
log a
p
+
1
q
e
log b
q
=
a
p
p
+
b
q
q
;
daltronde questa disuguaglianza `e ovviamente vera anche per a = 0 oppure
b = 0. Perci`o, essendo f e g q.o. nite su X,
[f(x)g(x)[
[f(x)[
p
p
+
[g(x)[
q
q
q.o. in X,
da cui, integrando su X,
|fg|
1

1
p
|f|
p
p
+
1
q
|g|
q
q
.
Ora, se |f|
p
= |g|
q
= 1 la tesi `e provata perche otteniamo |fg|
1

1
p
+
1
q
= 1;
altrimenti, posto
F(x) =
f(x)
|f|
p
, G(x) =
g(x)
|g|
q
,
risulta |F|
p
= |G|
q
= 1 e dunque, per quanto gi`a dimostrato,
|fg|
1
|f|
p
|g|
q
= |FG|
1
1,
che `e la tesi.
Osservazione 9.1.3 Si noti che la dimostrazione precedente dice qualcosa di
pi` u: la relazione [f(x)g(x)[
[f(x)[
p
p
+
[g(x)[
q
q
q.o. in X vale anche , ovviamente,
nei punti in cui [f(x)[ oppure [g(x)[ valgono +, e pertanto, integrando su
X, si ottiene che la disuguaglianza vale per ogni coppia di funzioni misurabili
f, g (eventualmente nella forma + +). In particolare, se p e q sono
esponenti coniugati e se fg non appartiene a L
1
, si deduce che o f / L
p
, o
g / L
q
.
Corollario 9.1.4 (disuguaglianza di Minkowski) Se p [1, ] e f, g
L
p
(X), allora
|f +g|
p
|f|
p
+|g|
p
.
241
Dimostrazione I casi p = 1 e p = (ed anche quello in cui p = 2) sono
gi`a noti. Se 1 < p < si ha
_
X
[f+g[
p
d =
_
X
[f+g[[f+g[
p1
d
_
X
[f[[f+g[
p1
d+
_
X
[g[[f+g[
p1
d.
Osservando che [f + g[
p1
L
q
(X) ( in quanto (p 1)q = p) ed applicando
la disuguaglianza di Holder si ottiene
|f +g|
p
p
=
_
X
[f +g[
p
d |f|
p
|[f +g[
p1
|
q
+|g|
p
|[f +g[
p1
|
q
=
= (|f|
p
+|g|
p
)
__
X
[f +g[
(p1)q
d
_1
q
=
= (|f|
p
+|g|
p
) |f +g|
p1
p
.
Ne segue la tesi se |f +g|
p
> 0; daltronde quando |f +g|
p
= 0 la tesi stessa
`e banale.
La funzione f |f|
p
`e dunque una norma sullo spazio L
p
(X).
Proposizione 9.1.5 L
p
(X) `e uno spazio di Banach.
Dimostrazione Utilizzando il lemma 7.1.2, sar`a suciente mostrare che
per ogni successione f
n
L
p
, tale che

n=0
|f|
p
< , la serie

n=0
f
n
`e
convergente nella norma | |
p
. Per ogni n N poniamo
g
n
(x) =
n

k=0
[f
k
(x)[, g(x) =

k=0
[f
k
(x)[, x X;
allora g
n
L
p
e
|g
n
|
p

n

k=0
|f
k
|
p
M < n N,
e per il teorema di B. Levi
_
X
g
p
d = lim
n
_
X
g
p
n
d M
p
,
242
cio`e g L
p
. Ne segue che g `e q.o. nita, ossia la serie

k=0
f
k
(x) `e assolu-
tamente convergente per q.o. x X, e dunque la sua somma f(x) `e denita
q.o. in X; per di pi` u, tale funzione f individua un elemento di L
p
in quanto
_
X
[f[
p
d
_
X
g
p
d M
p
.
Inoltre, posto
s
n
(x) =
n

k=0
f
k
(x), x X,
si ha s
n
f q.o. per n e [s
n
[ g q.o. per ogni n; dunque [s
n
f[
p

(2g)
p
q.o. per ogni n. Per il teorema di convergenza dominata, si ottiene
s
n
f in L
p
, ossia la serie

n=0
f
n
`e convergente nella norma | |
p
.
Osservazione 9.1.6 La proposizione precedente si pu`o dimostrare anche
ripetendo le argomentazioni usate per provare la completezza di L
1
(teorema
4.6.2). In tal modo si ottiene qualcosa di pi` u, e cio`e il fatto che se f
n
f in
L
p
, allora esiste una sottosuccessione f
n
k
tale che f
n
k
(x) f(x) per q.o.
x X, e [f
n
k
(x)[ g(x) q.o. in X, con g L
p
.
Osservazione 9.1.7 In analogia con lesempio 7.2.6 (4), si pu`o considerare
anche lo spazio L
p
(X, C) delle funzioni f : X C tali che [f[
p
`e sommabile
su X. Ci`o accade se e solo se Re f e Im f appartengono a L
p
(X). La norma
su tale spazio `e ancora |f|
p
=
__
X
[f[
p
d
1
p
.
Esercizi 9.1
1. Siano p, q > 1 con
1
p
+
1
q
= 1. Dimostrare che la disuguaglianza di Holder
diventa unuguaglianza se e solo se esistono , 0, non entrambi
nulli, tali che
[f(x)[
p
= [g(x)[
q
q.o. in X.
2. Siano f, g L
1
(X): si provi che |f + g|
1
= |f|
1
+ |g|
1
se e solo se
fg 0 q.o. in X.
3. Sia p ]1, [. Dimostrare che la disuguaglianza di Minkowski diventa
unuguaglianza se e solo se esistono , 0, non entrambi nulli, tali
che
f(x) = g(x) q.o. in X.
243
4. Si provi che se (X) < si ha L
p
(X) L
r
(X) per p > r, mentre ci`o
`e falso se (X) = .
5. Posto per 1 p < (v. anche gli esercizi 7.2.3 e 7.1.5)

p
= x = x
n

nN
: |x|
p

p
=

n=0
[x
n
[
p
< ,
si verichi che
p
coincide con L
p
(N, T(N), ), ove `e la misura car-
dinalit`a; si provi poi che
1

p

r

per 1 < p < r < , e che


le corrispondenti inclusioni sono continue con norme uguali a 1.
6. Sia a = a
n

nN

p
, 1 < p < . Si provi che se a ,= 0 allora

n=0
[a
n
[

[a
n+1
[
p
< |a|
p

p
]0, p[.
7. Si verichi che la funzione
f(x) =
1

x(1 +[ log x[)


, x > 0,
appartiene a L
2
(0, ) ma non sta in alcun L
p
(0, ) con p ,= 2. Fis-
sato p [1, ], si trovi poi, analogamente, una funzione g che stia in
L
p
(0, ) ma non in L
r
(0, ) per r ,= p.
8. Sia X =

1p<
L
p
(0, 1); si verichi che L

(0, 1) `e contenuto pro-


priamente in X. Si provi che, similmente, si ha linclusione propria
L
p
(0, 1)

1r<p
L
r
(0, 1).
9. Sia f L
p
(a, b), con p > 1. Si provi che F(x) =
_
x
a
f(t) dt `e una
funzione holderiana in [a, b] di esponente 1
1
p
, ossia esiste K 0 tale
che
[F(x) F(y)[ K[x y[
1
1
p
x, y [a, b],
e che anzi risulta addirittura
lim
r0
+
sup
0<[xy[r
[F(x) F(y)[
[x y[
1
1
p
= 0.
244
10. Sia f L
p
(R), con 1 < p < . Posto F(x) =
_
x
0
f(t) dt, si provi che
se
1
p
+
1
q
= 1 si ha
lim
x0
[x[

1
q
F(x) = 0, lim
x
[x[

1
q
F(x) = 0.
11. Sia (X, T, ) uno spazio misurato con (X) < . Se f `e misurabile
su X, si provi che
lim
p
|f|
p
= |f|

.
12. Sia (X, T, ) uno spazio misurato con (X) < . Se f `e misurabile e
tale che 0 <
_
X
[f[
n
d < denitivamente, si provi che
lim
n
_
X
[f[
n+1
d
_
X
[f[
n
d
= |f|

.
13. Sia f L
p
L
r
, con p < r; si provi che f L
s
per ogni s ]p, r[, e che
si ha
(i) |f|
s
|f|

p
|f|
1
r
, ove
1
s
=

p
+
1
r
;
(ii) |f|
s
|f|
r
+

|f|
p
> 0, ove =
1
p

1
s
1
s

1
r
.
14. Sia una misura -nita e sia f L
p
; si provi che per ogni > 0
esiste un insieme misurabile A

, di misura nita, tale che


_
A
[f[
p
d < .
15. Sia (X) < e sia f
n
una successione limitata in L
r
, ove 1 < r .
Se f
n
(x) f(x) q.o. in X e se 1 p < r, si provi che f
n
f in L
p
.
Si verichi che il risultato `e falso se p = r oppure se (X) = .
[Traccia: usare il teorema di Severini-Egorov.]
16. Sia (X, T, ) uno spazio misurato con (X) < , e sia f
n

nN
una
successione di funzioni sommabili su X, tali che
(a) f
n
0 in misura;
(b) sup
nN
|f
n
|
1
< .
245
Si provi che risulta
lim
n
_
X
_
[f
n
g[ d = 0 g L
1
(X).
17. Sia f
n
una successione limitata in L
p
, con p > 1. Se f
n
(x) f(x)
q.o., si provi che f L
p
e che
lim
n
_
X
f
n
g d =
_
X
fg d g L
q
,
ove
1
p
+
1
q
= 1. Si provi anche che lenunciato `e falso per p = 1.
[Traccia: dopo avere ridotto il problema al caso (X) < , usare il
teorema di Severini-Egorov.]
18. Sia (X) = , e sia f una funzione misurabile, illimitata sul comple-
mentare di ogni insieme di misura nita.
`
E possibile che f appartenga
a L
p
?
19. Trovare una funzione f L
p
(R), 1 p < , illimitata sul comple-
mentare di ogni compatto. Trovarne unaltra che, in pi` u, sia di classe
C

su R.
20. Sia f
n
una successione di funzioni misurabili tali che f
n
(x) f(x)
q.o. e [f
n
(x)[ g(x) q.o., con g L
p
, 1 p < ; si provi che f
n
f
in L
p
.
21. Se f
n
f in L
p
, e ]0, p], si provi che [f
n
[

[f[

in L
p

.
22. Dimostrare che se f L
p
(R), 1 p < , e f `e uniformemente continua
su R, allora lim
[x[
f(x) = 0.
23. Si considerino le convoluzioni denite nellesercizio 5.4.5. Nelle nota-
zioni ivi introdotte, si provi che se f L
p
(R
N
), 1 p < , allora
f

f in L
p
(R
N
) per 0
+
.
24. Si provi che o `e denso in L
p
(X) per 1 p , e che o
0
`e denso in
L
p
(X) per 1 p < .
25. Si provi che C
0
0
(R) e C

0
(R) sono densi in L
p
(R) per 1 p < .
246
26. Si provi che le funzioni costanti a tratti sono dense in L
p
(a, b), 1 p <
.
27. Sia f L
p
(R), 1 p < ; provare che
lim
1
_
R
[f(x) f(x)[
p
dx = 0, lim
h0
_
R
[f(x +h) f(x)[
p
dx = 0.
[Traccia: utilizzare la densit`a di C
0
0
(R).]
28. Si provi che L
p
(R) `e separabile per 1 p < .
29. Siano f L
1
(R) e g L
p
(R). Si provi che la convoluzione f g (v.
esercizio 5.4.4) appartiene a L
p
(R) e che |f g|
p
|f|
1
|g|
p
. Si provi
inoltre che se g L

(R), allora f g `e uniformemente continua su R.


30. Sia la misura su ]0, [ denita da
(E) =
_
E
dt
t
E /, E ]0, [,
e si consideri la convoluzione moltiplicativa
(f g)() =
_

0
f(t)g(t) d(t), f, g L
1
().
(i) Si verichi che f g = g f per ogni f, g L
1
().
(ii) Si provi che se f L
1
() e g L
p
(), 1 p , allora f g
L
p
() e
|f g|
p
|f|
1
|g|
p
.
31. Per ogni h R si consideri loperatore
(T
h
f)(x) = f(x +h) f(x h), x R.
(i) Si provi che T
h
/(L
p
(R)) per ogni p [1, ], con
|T
h
|
/(L
p
(R))
= 2.
(ii) Si dimostri che se p [1, [ allora per ogni f L
p
(R) si ha
T
h
f 0 in L
p
(R) per h 0,
e che ci`o `e falso per p = .
247
32. Fissata una successione a
1
, sia K loperatore denito da:
(Kx)
n
=
n

k=0
a
nk
x
k
, x
p
.
(i) Si provi che K /(
p
) per ogni p [1, ], e che
|K|
/(
p
)
|a|

1 .
(ii) Per p = 1 si calcoli la norma |K|
/(
1
)
.
Traccia: Si provi che, detto
m
:
p

p
loperatore denito da
(
m
x)
k
=
_
x
mk
se k m
0 se 0 k < m,
risulta Kx =

m=0
a
m

m
x per ogni x
p
, ove la serie converge nel
senso di
p
. . . ]
33. Sia : R R una funzione misurabile e sia T loperatore denito
da Tf(x) = (x)f(x). Determinare condizioni necessarie e sucienti
anche:
(a) T sia continuo da L
p
(R) in L
p
(R);
(b) T sia continuo ed iniettivo;
(c) T sia continuo con inverso continuo.
34. Per p ]0, 1[ si denisca L
p
(X) come nella denizione 9.1.1. Si provi
che:
(i) | |
p
non `e subadditiva;
(ii) la funzione
d(f, g) =
_
X
[f g[
p
d, f, g L
p
(X),
`e una distanza su L
p
(X) ed inoltre lo spazio (L
p
(X), d) `e completo.
248
35. (Disuguaglianza di Jensen) Sia (X, T, ) uno spazio misurato con (X)
= 1; sia f : X R una funzione misurabile tale che a < f(x) < b per
ogni x X (ove a < b +), e sia :]a, b[ R una funzione
convessa. Si provi che

__
X
f d
_

_
X
f d
[Traccia: si verichi anzitutto che f `e misurabile. Poi, posto
t =
_
X
f d e = sup
s]a,t[
(t)(s)
ts
, si provi che
(f(x)) (t) (f(x) t) x X . . . ]
36. (Disuguaglianza di Hardy) Sia 1 < p < . Posto F(x) =
1
x
_
x
0
f(t) dt
per ogni f L
p
(0, ), si provi che |F|
p

p
p1
|f|
p
, e che
p
p1
`e la
migliore costante possibile.
[Traccia: supponendo dapprima f 0 e f C
0
0
(]0, [), si integri
per parti
_

0
F(t)
p
dt, e si osservi che xF
t
(x) = f(x) F(x). . . . Poi
si passi al caso generale. Per lultima aermazione si considerino le
funzioni x x

1
p

]0,n[
(x), n N.]
37. Si provi la disuguaglianza

n=0
_
1
n + 1
n

k=0
[x
k
[
_
p

_
2p
p 1
_
p

k=0
[x
k
[
p
x
p
, p [1, [.
Traccia: si applichi la disuguaglianza di Hardy alla funzione f che vale
x
n
sullintervallo [n, n + 1[, n N.]
38. Sia T loperatore cos` denito:
Tf(x) =
_
x+1
x
f(t)dt, x R.
(i) Si provi che per ogni p [1, ] si ha T /(L
1
(R), L
p
(R)) e se ne
calcoli la norma;
(ii) Si dimostri che per ogni f L
1
(R) si ha:
(a) la funzione Tf `e uniformemente continua su R;
(b) la funzione Tf `e assolutamente continua in ogni [a, b] R;
249
(c) la funzione Tf `e innitesima per x .
39. Fissato [0, 1] si consideri linsieme X

costituito dalle funzioni


f : R
N
R misurabili che vericano la seguente propriet`a:
C > 0 :
_
E
[f[dm
N
Cm
N
(E)

E /
N
con m
N
(E) 1.
(i) Vericare che se si ha X

.
(ii) Provare che L
p
(R
N
) X
1
1
p
per ogni p [1, [.
(iii) Dimostrare che L

(R
N
) = X
1
.
9.2 Il duale di L
p
Questo paragrafo `e dedicato alla caratterizzazione del duale dello spazio
L
p
(X), 1 p < , nel caso in cui la misura sia -nita e che le funzioni
siano a valori reali. Vale il seguente, importante risultato:
Teorema 9.2.1 (di Riesz-Fischer) Sia (X, T, ) uno spazio misurato -
nito e sia p [1, [. Per ogni F (L
p
(X))

esiste ununica funzione


f L
q
(X), ove q `e lesponente coniugato di p, tale che
Fg =
_
X
gf d g L
p
(X);
si ha inoltre
|F|
(L
p
)
= |f|
q
.
Dimostrazione Proviamo anzitutto lultima aermazione, ossia che se F
`e il funzionale g
_
X
gf d, con f L
q
, allora la norma di F `e uguale
a |f|
q
. Se p = 1, questo lo sappiamo gi`a (esempio 7.3.6 (4)). Se 1 <
p < , dalla disuguaglianza di Holder segue subito [Fg[ |g|
p
|f|
q
e
quindi |F|
(L
p
)
|f|
q
; daltra parte, scelta g = [f[
q
p
sgnf, si trova Fg =
_
X
[f[
q
d = |g|
p
|f|
q
, da cui |F|
(L
p
)
= |f|
q
.
Proviamo ora lunicit`a della funzione f: se due funzioni f
1
, f
2
L
q
soddisfano
entrambe la tesi, allora risulta
_
X
g(f
1
f
2
)d = 0 g L
p
.
250
Dunque il funzionale F
0
, denito da F
0
g =
_
X
g(f
1
f
2
)d `e identicamente
nullo; ne segue, per quanto appena visto, 0 = |F
0
|
(L
p
)
= |f
1
f
2
|
q
, cosicche
f
1
= f
2
.
Veniamo alla dimostrazione dellesistenza di f. Proveremo dapprima il ri-
sultato per i funzionali positivi, cio`e i funzionali F (lineari e continui) tali
che
g 0 q.o. in X = Fg 0;
nel primo passo supporremo (X) < , e nel secondo passo tratteremo il
caso generale in cui `e -nita. Inne, il terzo passo consister`a in una propo-
sizione in cui si mostrer`a che ogni funzionale lineare e continuo si decompone
nella dierenza di due funzionali positivi, e da qui seguir`a il teorema per
qualunque elemento di (L
p
)

.
1
o
passo Sia dunque (X) < e ssiamo un funzionale positivo F (L
p
)

.
Se F = 0, la tesi `e evidentemente soddisfatta prendendo f = 0; supponiamo
quindi |F|
(L
p
)
> 0. Deniamo
(E) = F
E
E T,
e verichiamo che la funzione di insieme `e una misura su T. Intanto,
essa `e non negativa per la positivit`a di F, ed `e nitamente additiva sugli
insiemi disgiunti grazie alla linearit`a di F. La numerabile additivit`a di
`e conseguenza dalla continuit`a di F: infatti se E =

n=0
E
n
, con gli E
n
elementi disgiunti di T, allora posto A
n
=

n
k=0
E
k
si ha A
n
A
n+1
per ogni
n N e

n=0
A
n
= E. Ne segue, in virt` u della proposizione 2.1.5,
|
E

An
|
p
= ((E A
n
))
1
p
0 per n ,
da cui, essendo F continuo, F
An
F
E
; osservato che
An
=

n
k=0

E
k
,
ricaviamo
n

k=0
(E
k
) =
n

k=0
F
E
k
= F
An
F
E
= (E).
Ci` o prova che (E) =

n=0
(E
n
). Dato che, ovviamente, () = F(0) = 0,
concludiamo che `e una misura; essendo poi (X) = F
X
|F|
(L
p
)
(X)
1
p
,
la misura `e nita. Notiamo inne che poiche
E T, (E) = 0 =
E
= 0 q.o. = |
E
|
p
= 0 =
= F
E
= 0 = (E) = 0.
251
Possiamo allora applicare il teorema di Radon-Nikod ym (corollario 8.2.4),
ottenendo che esiste ununica funzione f L
1
(X, ), q.o. non negativa, tale
che
F
E
= (E) =
_
E
f d E T.
Per la linearit`a di F, ed essendo (X) < , si deduce subito
F =
_
X
f d o;
dalla densit`a di o in L

(X, ) (esercizio 3.3.4, ovvero osservazione 3.1.8),


otteniamo che per ogni g L

esiste
n
o tale che
n
g in L
p
e in
L

. Dunque dalla relazione precedente scritta per le


n
, per la continuit`a
di F su L
p
e per convergenza dominata si deduce
Fg =
_
X
gf d g L

.
Per concludere il 1
o
passo, dobbiamo vericare che f L
q
(e non solo f
L
1
), e che la relazione sopra scritta vale per ogni g L
p
(e non solo g L

).
Se p > 1, deniamo
f
n
(x) =
_
f(x) se [f(x)[ n
0 se [f(x)[ > n,
g
n
(x) = sgnf(x) [f
n
(x)[
q
p
.
Allora f
n
L

, g
n
L

; inoltre |g
n
|
p
= (|f
n
|
q
)
q
p
, e
|f
n
|
q
q
=
_
X
g
n
f d = Fg
n
|F|
(L
p
)
|g
n
|
p
= |F|
(L
p
)
(|f
n
|
q
)
q
p
,
da cui |f
n
|
q
|F|
(L
p
)
. Dal teorema di B. Levi si deduce allora |f|
q

|F|
(L
p
)
.
Se invece p = 1 e q = , consideriamo per ogni k N
+
linsieme E
k
= x
X : [f(x)[ > |F|
(L
1
)
+
1
k
, e poniamo g
k
= sgnf
E
k
; allora g
k
L
1
L

e |g
k
|
1
= (E
k
). Quindi
_
|F|
(L
1
)
+
1
k
_
(E
k
)
_
E
k
[f[d =
_
X
g
k
f d = Fg
k

|F|
(L
1
)
|g
k
|
1
= |F|
(L
1
)
(E
k
),
252
il che implica (E
k
) = 0 per ogni k N
+
: dunque [f(x)[ |F|
(L
1
)
q.o. e
pertanto |f|

|F|
(L
1
)
.
Sia ora g L
p
. Poniamo
g
n
(x) =
_
g(x) se [g(x)[ n
0 se [g(x)[ > n,
ed osserviamo che g
n
L

, g
n
g in L
p
(per convergenza dominata) e
g
n
f gf in L
1
(per la disuguaglianza di Holder). Quindi otteniamo
Fg = lim
n
Fg
n
= lim
n
_
X
g
n
f d =
_
X
gf d g L
p
.
Ci` o conclude la dimostrazione del 1
o
passo.
2
o
passo Supponiamo ora -nita e sia F (L
p
)

un funzionale positivo.
Come si `e osservato nel corso della dimostrazione del teorema 8.2.3, dal fatto
che `e -nita segue che esiste una funzione w L
1
() tale che 0 < w(x) < 1
per ogni x X. Deniamo
(E) =
_
E
w d, E T;
`e una misura nita su T. Lapplicazione g gw
1
p
`e unisometria di L
p
()
in L
p
(): infatti
|gw
1
p
|
p
L
p
()
=
_
X
[g[
p
w d =
_
X
[g[
p
d = |g|
p
L
p
()
.
Di conseguenza, denendo F = F(w
1
p
) per ogni L
p
(), si ha che F
appartiene a (L
p
())

ed `e un funzionale positivo. Dunque, per il 1


o
passo
esiste h L
q
(), q.o. non negativa, tale che
F =
_
X
h d L
p
().
Deniamo f = hw
1
q
(nel caso q = , prenderemo f = h e largomento che
segue funziona ugualmente): per quanto sopra osservato, risulta f L
q
() e
|f|
L
q
()
= |h|
L
q
()
; inoltre, per ogni g L
p
() si ha
Fg = F(gw

1
p
) =
_
X
gw

1
p
h d =
_
X
gw

1
p
fw

1
q
w d =
_
X
gf d.
Ci` o prova il 2
o
passo.
3
o
passo Dimostriamo la seguente
253
Proposizione 9.2.2 Sia Y = C
0
oppure Y = L
p
, 1 p . Allora ogni
elemento F Y

si pu`o scrivere nella forma F = G H ove G, H Y

e
G, H sono funzionali positivi.
Dimostrazione Fissato F Y

, deniamo il funzionale G ponendo per


ogni Y
G =
_
supFg : 0 g se 0
G
+
G

altrimenti,
ove
+
= max, 0,

= min, 0 (e le disuguaglianze sono da inten-


dersi q.o. nel caso che sia Y = L
p
); deniamo poi il funzionale H in modo
che valga la tesi:
H = G F.
Si tratta ora di provare che G e H sono funzionali lineari, continui e positivi.
Procederemo in varie tappe.
(1) Se Y e 0, allora G 0 e H 0; quindi G e H sono funzionali
positivi.
Infatti per denizione si ha G F(0) = 0, e G F.
(2) Se
1
,
2
Y e
1
,
2
0, allora G(
1
+
2
) = G
1
+G
2
.
Infatti, se 0 g
1

1
e 0 g
2

2
, allora 0 g
1
+ g
2

1
+
2
e quindi
G(
1
+
2
) F(g
1
+g
2
) = Fg
1
+Fg
2
; per larbitrariet`a di g
1
e g
2
si deduce
G(
1
+
2
) G
1
+G
2
. Daltra parte, se 0 g
1
+
2
, ponendo
g
1
(x) = ming(x),
1
(x), g
2
(x) = g(x) g
1
(x),
si ha 0 g
1

1
e g
2
= g g
1
= maxg
1
, 0, da cui 0 g
2

2
. Ne
segue
G
1
+G
2
Fg
1
+Fg
2
= F(g
1
+g
2
) = Fg,
da cui, per larbitrariet`a di g, G
1
+G
2
G(
1
+
2
).
(3) Se Y e = , con , 0, allora G = G G; in altre
parole, il valore di G `e indipendente dal modo in cui scriviamo come
dierenza di funzioni non negative.
Ricordiamo che per denizione G = G
+
G

, ove
+
= max, 0,

= min, 0; quindi se = si ha
+
+ = +

, e dunque
dalla propriet`a (2) si deduce G
+
+G = G +G

, da cui la tesi.
(4) G(
1
+
2
) = G
1
+G
2
per ogni
1
,
2
Y .
254
Infatti
1
+
2
= (
+
1
+
+
2
) (

1
+

2
), da cui la tesi per (3) e (2).
(5) Se Y e 0, allora G(c) = c G per ogni c > 0.
Infatti, per denizione di G,
G(c) = supFg : 0 g c = c sup
_
F
_
g
c
_
: 0
g
c

_
= c G.
(6) Se Y , allora G(c) = c G per ogni c > 0.
Infatti, dalla denizione e da (5) si deduce
G(c) = G(c
+
) G(c

) = c G
+
c G

= c G.
(7) Se Y , allora G(c) = c G per ogni c 0.
Infatti, se c = 0 il risultato `e ovvio; se c < 0 si ha da (3) e (5)
G(c) = G([c[

[c[
+
) = G([c[

) G([c[
+
) =
= [c[G

[c[G
+
= c G
+
c G

= c G.
Abbiamo cos` provato la linearit`a di G, e dunque, per dierenza, anche quella
di H. Rimane da vericare che G e H sono elementi di Y

: in eetti si ha
per ogni Y
[G[ G
+
+G

= G([[) = supFg : 0 g [[
|F|
Y
sup|g|
Y
: 0 g [[ = |F|
Y
||
Y
.
Ci` o prova che G (e quindi anche H) `e un operatore limitato. La proposizione
`e dimostrata.
La dimostrazione del teorema di Riesz-Fischer si conclude subito: se F
(L
p
)

, si scrive F = GH con G, H funzionali positivi di (L


p
)

, e per il 2
o
passo esistono due funzioni , L
q
, entrambe q.o. non negative, tali che
Gg =
_
X
g d, Hg =
_
X
g d g L
p
.
Quindi, posto f = , si ha f L
q
e
Fg =
_
X
gf d g L
p
.
Ci` o prova il teorema.
255
Osservazioni 9.2.3 (1) Se la misura non `e -nita, il teorema di Riesz-
Fischer non `e vero per p = 1, come mostrano gli esercizi 7.3.7, 7.3.8 e 9.2.2;
invece per p ]1, [ il teorema vale ancora (esercizio 9.2.5).
(2) Come si vedr`a in seguito, per p = il teorema di Riesz-Fischer `e falso,
ossia linclusione L
1
(L

, che vale in virt` u dellesempio 7.3.6 (3), `e


propria (vedere anche lesercizio 9.2.4).
(3) Il teorema di Riesz-Fischer si estende al caso degli spazi L
p
di funzioni
complesse, nel senso che per ogni F (L
p
)

, 1 p < , esiste ununica


f L
q
tale che
Fg =
_
X
gf d g L
p
(vedere lesercizio 9.2.1).
Esercizi 9.2
1. Si deduca il caso complesso del teorema di Riesz-Fischer dal caso reale.
2. Siano X = [0, 1], T = E [0, 1] : E, oppure E
c
, `e numerabile, =
misura cardinalit`a. Si provi che la funzione xf(x) appartiene a L
1
per ogni f L
1
, e che, posto Fg =
_
1
0
xg(x)d, si ha F (L
1
)

, ma
non esiste alcuna f L

per cui si abbia Fg =


_
1
0
fg d per ogni
g L
1
.
3. Sia una misura -nita, e sia p [1, ]. Se f `e una funzione mi-
surabile tale che fg L
1
per ogni g L
p
, si provi che f L
q
, ove
1
p
+
1
q
= 1.
4. Sia X = a, b, e poniamo () = 0, (a) = 1, (b) = (X) = .
Caratterizzare gli spazi L
p
(X, ) e i loro duali.
5. Si provi che se 1 < p < il teorema di Riesz-Fischer vale anche per
misure non -nite.
[Traccia: sia la famiglia degli insiemi misurabili che sono -niti,
ossia sono unione numerabile di insiemi misurabili di misura nita.
Fissato F (L
p
)

, per ogni E si mostri che esiste ununica funzione


f
E
L
q
, nulla fuori di E, tale che Fg =
_
X
gf
E
d per ogni g L
p
;
si provi anche che se E, E
t
ed E E
t
si ha f
E
= f
E
q.o. in
256
E. Posto poi (E) =
_
X
[f
E
[
q
d per ogni E , si provi che `e
una funzione crescente rispetto allinclusione e limitata superiormente.
Scelta una successione E
n
tale che (E
n
) m = sup

(E), si
provi che H =

n=0
E
n
`e un elemento di per cui (H) = m. Se ne
deduca che, posto f = f
H
, si ha f = f
E
q.o. in E per ogni E ,
e che se g L
q
, posto N = x X : g(x) ,= 0, risulta N e
Fg =
_
X
gf
NH
d =
_
X
gf d. Si verichi inne che |F|
(L
p
)
= |f|
q
.]
6. Sia F (C
0
[a, b])

un funzionale positivo. Si provi che esiste ununica


funzione f : [a, b] R crescente, continua a sinistra, con f(a) = 0 e
tale che
Fg =
_
b
a
g d
f
g C
0
[a, b],
ove
f
`e la misura di Lebesgue-Stieltjes associata a f.
[Traccia: per lunicit`a, si ragioni per assurdo e si approssimi
[a,t[
dal basso con funzioni continue. Per lesistenza, per ogni t ]a, b] si
denisca, per n sucientemente grande,
h
t,n
(x) =
_

_
1 se a x t
1
n
n(t x) se t
1
n
x t
0 se t x b.
Si verichi che esiste f(t) = lim
n
Fh
t,n
per ogni t ]a, b]; posto
f(t) = 0 per ogni t a e f(t) = F
[a,b]
= |F| per ogni t > b, si
verichi che f `e crescente e che f(a) = 0. Posto poi, per t ]a, b] e n
sucientemente grande,
k
t,n
(x) =
_

_
1 se a x t
1
n

1
n
2
tx
1
n
2
1
n

2
n
2
se t
1
n
+
1
n
2
x t
1
n
2
0 se t
1
n
2
x b,
si provi che |h
t,n
k
t,n
|

=
1
n
e che Fh
t,n
Fk
t,n
+
1
n
|F| f(t
1
n
2
) +
1
n
|F|; se ne deduca che f `e continua a sinistra. Consideriamo
ora la misura
f
; ssiamo g C
0
[a, b] e, dato > 0, sia > 0 tale che
[g(x) g(x
t
)[ < per [x x
t
[ < . Se a = t
0
< t
1
< . . . < t
m
= b con
t
k
t
k1
<

2
, si deniscano costante a tratti e
n
C
0
[a, b] (per
257
n >
2

) nel modo seguente:


=
m

k=1
g(t
k
)
[t
k1
,t
k
[
+g(b)
b
,

n
= g(t
1
)h
t
1
,n
+
m

k=2
g(t
k
)[h
t
k
,n
h
t
k1
,n
] +g(b)[
[a,b]
h
b,n
];
si dimostri che |g |

e che |g
n
|

2, e se ne deduca che
[Fg F
n
[ 2|F| e [
_
b
a
g d
f

_
b
a
d
f
[ |F|. Si provi daltra
parte che F
n

_
b
a
d
f
. . .]
7. Si caratterizzi il duale di C
0
[a, b].
[Traccia: fare uso dellesercizio precedente e della proposizione 9.2.2.]
258
Capitolo 10
Operatori lineari
10.1 Estensione di funzionali lineari
Questo capitolo `e dedicato allo studio di alcuni fra i principali teoremi del-
lanalisi funzionale: si tratta di importanti risultati relativi alla struttura ed
alle propriet`a degli operatori lineari fra spazi normati o di Banach, che tro-
vano assai frequente utilizzazione nei pi` u svariati campi dellanalisi e della
matematica applicata.
Il primo enunciato di cui ci occupiamo riguarda la possibilit`a di estendere
a tutto lo spazio funzionali lineari deniti su sottospazi, senza alterarne la
norma. Premettiamo la seguente
Denizione 10.1.1 Sia X uno spazio normato, sia p : X R. Il fun-
zionale p `e detto positivamente omogeneo (o, pi` u semplicemente, benche
impropriamente, omogeneo) se si ha
p(x) = p(x) x X, > 0.
Il funzionale p `e detto subadditivo se
p(x +y) p(x) +p(y) x, y X.
Osservazioni 10.1.2 (1) Se p `e omogeneo, allora p(0) = 0, in quanto
p(0) = p(2 0) = 2p(0); inoltre se < 0 si ha p(x) = p(()(x)) =
p(x) per ogni x X.
259
(2) Se p `e omogeneo e subadditivo, allora p `e convesso: infatti per ogni
x, y X e per ogni [0, 1] si ha
p(x + (1 )y) p(x) +p((1 )y) = p(x) + (1 )p(y).
Viceversa, se p `e omogeneo e convesso, allora p `e subadditivo: infatti per
ogni x, y X risulta
p(x +y) = p
_
2
x +y
2
_
= 2p
_
x +y
2
_
2
_
1
2
p(x) +
1
2
p(y)
_
= p(x) +p(y).
I funzionali omogenei e subadditivi coincidono dunque con quelli omogenei
e convessi. Si pu`o dimostrare facilmente (esercizio 10.1.1 che essi coincidono
anche con quelli subadditivi e convessi tali che p(0) = 0. Invece nessuna di
queste tre propriet`a, da sola, implica le altre (esercizio 10.1.2).
Ad esempio, sono funzionali omogenei e convessi in uno spazio normato: la
norma, ogni funzionale lineare, ed anche il valore assoluto di un funzionale
lineare; un altro esempio importante `e quello dei cosiddetti funzionali di
Minkowski associati ai sottoinsiemi convessi di X (esercizio 10.1.3).
Il problema di estendere un funzionale lineare, denito su un sottospazio M
propriamente contenuto in uno spazio normato X, senza alterarne la norma,
`e di facile soluzione se, ad esempio, X = R
N
e M = R
k
con k < N, ma non
`e altrettanto facile in generale, a meno che X non sia uno spazio di Hilbert
(nel qual caso si rimanda allesercizio 8.2.1). Il teorema che segue fornisce
una risposta molto generale a questa questione.
Teorema 10.1.3 (di Hahn-Banach) Sia X uno spazio normato reale, e
sia p : X R un funzionale omogeneo e subadditivo. Siano inoltre M
un sottospazio proprio di X e f : M R un funzionale lineare tale che
fx p(x) per ogni x M. Allora esiste almeno un funzionale lineare
F : X R tale che F[
M
= f e Fx p(x) per ogni x X.
Osserviamo che se si sceglie p(x) = c|x|, allora si ha f M

e F X

, in
quanto per ipotesi
[fx[ = maxfx, f(x) c|x| x M,
e dal teorema segue
[Fx[ = maxFx, F(x) c|x| x X;
260
in particolare, prendendo c = |f|
M
, otteniamo anche |F|
X
= |f|
M
.
Notiamo inoltre che se X `e uno spazio di Hilbert e p(x) = |f|
M
|x|
X
, allora
in virt` u del teorema di Riesz-Frech`et lestensione `e unica ed `e nulla su M

(esercizio 8.2.1).
Dimostrazione Per ipotesi, esiste z X M. Il primo passo della dimo-
strazione consiste nellestendere f allo spazio M
1
= [M, z] generato da M e
da z, denendo lestensione f
1
nel modo seguente:
f
1
(x +tz) = fx +tc x M, t R,
ove c R `e una costante da ssare (se possibile!) in modo che risulti
fx +tc = f
1
(x +tz) p(x +tz) x M, t R 0.
Dividendo per t ed usando lomogeneit`a si ricavano le condizioni
f
_
x
t
_
+c p
_
x
t
+z
_
x M, t > 0,
f
_
x
t
_
+c p
_

x
t
z
_
x M, t < 0,
ossia, essendo M un sottospazio,
c p(y +z) fy y M, c p(y
t
z) fy
t
y
t
M.
Daltra parte, usando la subadditivit`a di p si ha per ogni y, y
t
M:
fyfy
t
= f(yy
t
) p(yy
t
) = p((y+z)(y
t
+z)) p(y+z)+p(y
t
z),
cio`e
p(y
t
z) fy
t
p(y +z) fy y, y
t
M.
Dunque possiamo scegliere c R in modo che
sup
y

M
p(y
t
z) fy
t
c inf
yM
p(y +z) fy,
ed in generale ci sar`a pi` u di una scelta possibile per c.
Se nello spazio X vi `e una successione z
n
tale che X = [z
n
] (`e il caso, per
esempio, di c
00
), si pu`o ripetere il procedimento sopra descritto, ottenendo
estensioni successive su M
1
= [M, z
1
], su M
2
= [M
1
, z
2
], ed induttivamente
su M
n
= [M
n1
, z
n
] per ogni n N
+
; dato che X =

n=1
M
n
, rester`a inne
261
denita unestensione F su X, la quale vericher`a la tesi del teorema.
Ma in generale questo non accadr`a, e quindi occorre seguire unaltra strada.
Ricorriamo al lemma di Zorn (lemma 8.3.11): consideriamo le coppie (g, N)
ove N `e un sottospazio di X contenente M e g : N R `e un funzionale
lineare tale che g[
M
= f e gx p(x) per ogni x N; linsieme P a cui
applicare il lemma di Zorn sar`a costituito da tutte queste coppie, ordinate
nel modo seguente:
(g, N) (g
t
, N
t
) N N
t
e g
t
[
N
= g.
Si noti che P non `e vuoto perche (f, M) P, ed `e chiaro che `e una
relazione dordine su P. Sia Q P un insieme totalmente ordinato: sar`a
Q = (g
i
, N
i
)
iI
, ove I `e un qualunque insieme di indici. Deniamo
N =
_
iI
N
i
, gx = g
i
x se x N
i
;
una facile verica mostra che (g, N) P e che (g
i
, N
i
) (g, N) per ogni
i I, ossia (g, N) `e un maggiorante per Q. Per il lemma di Zorn, esiste allora
un elemento (F, N
0
) P che `e massimale per P; questo implica N
0
= X,
altrimenti la procedura esposta allinizio della dimostrazione permetterebbe
di ottenere unestensione propria di F, contraddicendo la massimalit`a di
(F, N
0
). Ci`o mostra che F `e lestensione di f richiesta.
Osservazione 10.1.4 Il teorema di Hahn-Banach vale anche negli spazi nor-
mati complessi, modicando opportunamente lenunciato ed anche la deni-
zione di funzionale omogeneo: si veda lesercizio 10.1.6.
Il teorema di Hahn-Banach ha alcune importanti conseguenze.
Corollario 10.1.5 Se X `e uno spazio normato con X ,= 0, e x
0
X0,
allora esiste F X

tale che |F|


X
= 1 e Fx
0
= |x
0
|
X
.
Dimostrazione Scegliamo p(x) = |x|
X
, e sul sottospazio 1-dimensionale
M = [x
0
] poniamo
f(tx
0
) = t|x
0
|
X
t R.
Ovviamente f `e lineare e si ha
f(tx
0
) = t|x
0
|
X
[t[|x
0
|
X
= |tx
0
|
X
= p(tx
0
) t R.
262
Per il teorema di Hahn-Banach esiste un funzionale lineare F : X R tale
che
F(tx
0
) = t|x
0
|
X
t R, Fx |x|
X
x X;
in particolare Fx
0
= |x
0
|
X
e
[Fx[ = maxFx, F(x) |x|
X
x X,
e ci`o prova che |F|
X
= 1.
In particolare il corollario precedente mostra che se X ,= 0 allora X

,= 0.
Corollario 10.1.6 Sia X uno spazio normato e sia M un sottospazio pro-
prio di X. Se x
0
X M e se d(x
0
, M) = > 0, allora esiste F X

tale
che
|F|
X
= 1, F[
M
= 0, Fx
0
.
Dimostrazione Scegliamo p(x) = |x|
X
, e sul sottospazio M
t
= [M, x
0
]
poniamo
f(x +tx
0
) = t x M, t R.
Ovviamente f `e lineare, f `e nullo su M e, per denizione di ,
f(x+tx
0
) = t [t[
_
_
_
x
t
+x
0
_
_
_
X
= |x+tx
0
|
X
= p(x+tx
0
) x M, t ,= 0.
Il teorema di Hahn-Banach fornisce allora unestensione lineare F
0
di f a
tutto X, tale che
F
0
x
0
= , [F
0
x[ = maxF
0
x, F
0
(x) |x|
X
x X;
il funzionale F = F
0
/|F
0
|
X
`e il funzionale cercato.
Corollario 10.1.7 Linclusione L
1
(L

`e in generale stretta.
Dimostrazione Ricordiamo che linclusione `e valida in virt` u dellesempio
7.3.6 (3). Consideriamo lo spazio misurato ([0, 1], /, m). Supponiamo, per
assurdo, che ogni funzionale F (L

(0, 1))

si rappresenti nella forma


Fg =
_
1
0
g(t)h(t) dt g L

(0, 1)
per unopportuna funzione h L
1
(0, 1). Consideriamo il funzionale lineare
f : C[0, 1] R denito da fg = g(0): ovviamente si ha [fg[ |g|

per ogni
263
g C[0, 1]; quindi per il teorema di Hahn-Banach esiste F (L

(0, 1))

tale
che
Fg |g|

g L

(0, 1), F[
C[0,1]
= f.
Detta h la funzione di L
1
(0, 1) che rappresenta F, si ha allora
1 = f(e
nt
) = F(e
nt
) =
_
1
0
e
nt
h(t)dt n N,
ma ci`o `e assurdo in quanto, per convergenza dominata, lultimo membro
tende a 0 per n .
Esercizi 10.1
1. Sia X uno spazio normato e sia p : X R un funzionale subadditivo
e convesso con p(0) = 0; si provi che p `e omogeneo.
2. Si provi che:
(i) se X = R e p(x) =
_
[x[, p `e subadditivo ma non omogeneo ne
convesso;
(ii) se X = R
2
e p(x, y) = x
2
+ y
2
, p `e convesso ma non omogeneo ne
subadditivo;
(iii) se X = R
2
e p(x, y) = (
_
[x[ +
_
[y[)
2
, p `e omogeneo ma non
subadditivo ne convesso.
3. (Funzionale di Minkowski) Sia X uno spazio normato e sia K X un
insieme convesso che abbia 0 come punto interno. Poniamo
p
K
(x) = inf
_
r > 0 :
x
r
K
_
x X.
Si verichi che linsieme di cui p
K
(x) `e lestremo inferiore non `e vuoto,
e si provi che:
(i) p
K
`e un funzionale omogeneo e subadditivo;
(ii) esiste M > 0 tale che p
K
(x) M|x|
X
per ogni x X;
(iii) p
K
(x) 1 per ogni x K.
264
[Traccia: per la subadditivit`a, siano r, s > 0 tali che
x
r
,
y
s
K e
r < p
K
(x) +, s < p
K
(y) +; allora usando la convessit`a di K si mostri
che
x+y
r+s
K e se ne deduca che p
K
(x + y) p
K
(x) + p
K
(y) + 2 per
ogni > 0.]
4. Si determini il funzionale di Minkowski relativo ai seguenti insiemi
convessi K:
(i) X spazio normato, K = X;
(ii) X spazio normato, K = x X : |x| R;
(iii) X =
2
, K = x
2
: [x
j
[ 1, con j N ssato;
(iv) X = R
2
, K = (x, y) R
2
: ax + by c, con a, b R e c > 0
ssati.
5. Sia X = (c
00
, | |
2
), e sia K = x c
00
: [x
n
[ < 2
n
n N. Si
verichi che K ha parte interna vuota ma che malgrado ci`o il funzionale
di Minkowski di K `e ben denito.
6. Sia X uno spazio normato su C, e sia p : X R un funzionale subad-
ditivo e tale che p(x) = [[p(x) per ogni x X ed C. Siano poi
M un sottospazio proprio di X e f : M C un funzionale lineare tale
che [fx[ p(x) per ogni x M. Provare che esiste F : X C lineare,
tale che F[
M
= f e [Fx[ p(x) per ogni x X.
[Traccia: utilizzando il teorema 10.1.3 si costruisca unestensione rea-
le G del funzionale reale Ref; si denisca poi Fx = Gx iG(ix) e si
verichi che deve essere [Fx[ p(x).]
7. Sia X uno spazio normato e sia K X un convesso aperto contenente
0. Si provi che per ogni x
0
X K esiste F X

tale che Fx Fx
0
per ogni x K.
[Traccia: sia f : [x
0
] R denita da f(tx
0
) = t; si verichi che
fx p
K
(x) per ogni x [x
0
], si applichi il teorema di Hahn-Banach
e si provi che lestensione F verica la tesi.]
8. Sia X uno spazio normato e siano K, M sottoinsiemi convessi di X,
non vuoti e disgiunti, con K aperto. Si provi che esiste F : X R
lineare e non nullo che separa K e M, ossia verica
sup
xK
Fx inf
yM
Fy.
265
[Traccia: posto H = K M = x = y z : y K, z M, si
verichi che H `e un convesso aperto che non contiene 0, e si applichi
lesercizio precedente.]
9. Siano K, M convessi dello spazio normato X, non vuoti e disgiunti. Se
K `e chiuso e M `e compatto, si provi che esiste F X

che separa K
e M strettamente, ossia
sup
xK
Fx < inf
yM
Fy.
[Traccia: si provi che K

= K + B(0, ) e M

= M + B(0, ) so-
no convessi aperti non vuoti, e sono disgiunti per sucientemen-
te piccolo; si scelga F X

0 che li separa, e si deduca che


sup
K
F inf
M
F 2|F|
X
.]
10. Sia M un sottospazio di uno spazio normato X. Si provi che M `e denso
in X se e solo se per ogni F X

vale limplicazione
F[
M
= 0 = F = 0.
11. Sia M un sottospazio chiuso e proprio dello spazio normato X. Si provi
che per ogni > 0 esiste x

XM tale che |x

| = 1 e |xx

| > 1
per ogni x M.
12. Siano X, Y spazi normati con X diverso da 0. Si provi che /(X, Y )
`e uno spazio di Banach se e solo se lo `e Y .
13. Siano g, f
1
, . . . , f
n
funzionali lineari e continui sullo spazio normato X.
Si provi che risulta
n

k=1
ker f
k
ker g
se e solo se g `e combinazione lineare degli f
k
.
[Traccia: per la necessit`a si consideri loperatore T : X R
n
denito
da Tx = (f
1
x, . . . , f
n
x), e sia poi h : R(T) R data da h(Tx) = gx;
si verichi che h `e ben denita e continua, e poi si applichi il teorema
di Hahn-Banach.]
266
14. Per ogni x = x
n

nN
+

e per ogni m N
+
poniamo
T
m
x =
1
m
m

k=1
x
k
,
e consideriamo il sottospazio
M = x

: Tx = lim
m
T
m
x.
Si provi che esiste un funzionale lineare e continuo T :

R, detto
limite di Banach, tale che:
(i) Tx = Tx per ogni x M;
(ii) liminf
n
x
n
Tx limsup
n
x
n
per ogni x

;
(iii) Tx = T(x) per ogni x

, ove :

`e loperatore di
shift denito da (x)
n
= x
n+1
.
[Traccia: si ponga p(x) = limsup
n
x
n
e si applichi il teorema di
Hahn-Banach.]
10.2 Uniforme limitatezza di operatori
Un altro fondamentale risultato dellanalisi funzionale permette di trasforma-
re una stima puntuale per unarbitraria famiglia di operatori lineari e limitati
in una stima uniforme. Pi` u precisamente, vale il seguente enunciato:
Teorema 10.2.1 (di Banach-Steinhaus) Sia X uno spazio di Banach e
sia Y uno spazio normato; sia inoltre T

A
una qualsiasi famiglia di
elementi di /(X, Y ). Se risulta
sup
A
|T

x|
Y
< x X,
allora
sup
A
|T

|
/(X,Y )
< ;
se invece esiste z X tale che sup
A
|T

z|
Y
= , allora
sup
A
|T

x|
Y
= + x D,
ove D `e un sottoinsieme denso in X.
267
Dimostrazione
`
E necessario fare uso di un importante risultato di topologia
generale: il teorema di Baire.
Teorema 10.2.2 (di Baire) Sia (Z, d) uno spazio metrico completo. Se
V
n
`e una successione di aperti densi in Z, allora la loro intersezione `e un
insieme denso in Z (in particolare `e non vuota).
Dimostrazione Sia W un aperto non vuoto di Z. Poiche V
1
`e denso in Z,
laperto W V
1
contiene una palla chiusa B(x
1
, r
1
) con r
1
< 1; poiche V
2
`e
denso in Z, laperto B(x
1
, r
1
) V
2
contiene una palla chiusa B(x
2
, r
2
) con
r
2
<
1
2
, e procedendo induttivamente si ottiene che per ogni n N
+
laperto
B(x
n
, r
n
) V
n+1
contiene una palla chiusa B(x
n+1
, r
n+1
) con r
n+1
<
1
n+1
. Si
ha allora
d(x
i
, x
j
) r
n
<
1
n
i, j n,
da cui, per la completezza di Z, esiste x Z tale che x
n
x; si ha anzi
d(x
n
, x) r
n
per ogni n N
+
. Pertanto
x

n=1
B(x
n
, r
n
) B(x
1
, r
1
) W
_

n=1
V
n
_
.
In particolare, linsieme

n=1
V
n
`e non vuoto.
Veniamo alla dimostrazione del teorema di Banach-Steinhaus. Poniamo
(x) = sup
A
|T

x|
Y
, V
n
= x X : (x) > n.
Ciascun V
n
`e aperto in X: infatti se x V
n
, allora per denizione di (x)
esiste A tale che |T

x|
Y
> n; quindi per la continuit`a di T

esiste una
palla B(x, ) tale che |T

z|
Y
> n per ogni z B(x, ), da cui a maggior
ragione (z) > n per ogni z B(x, ): ci`o mostra che B(x, ) V
n
e dunque
V
n
`e aperto.
Adesso i casi sono due: risulta (x) < per ogni x X, oppure al contrario
esiste z X tale che (z) = +. Nel primo caso, non tutti gli aperti V
n
possono essere densi in X, altrimenti per il teorema di Baire dedurremmo
che linsieme

n=1
V
n
= x X : (x) = +
268
sarebbe non vuoto. Dunque almeno uno fra i V
n
non `e denso in X, ossia
esistono n
0
N
+
, x
0
X e r > 0 per i quali
|x x
0
|
X
r = (x) n
0
;
di conseguenza se |x
t
|
X
r si ha
|T

x
t
|
Y
= |T

(x
t
+x
0
) T

x
0
|
Y
2n
0
A,
da cui, se |x|
X
1
|T

x|
Y
=
1
r
|T

(rx)|
Y

2n
0
r
A.
In denitiva, nel caso in cui (x) < per ogni x X abbiamo ricavato che
sup
A
|T

|
/(X,Y )
< +.
Nel caso contrario, in cui esiste z X per cui (z) = +, avremo a maggior
ragione
sup
A
|T

|
/(X,Y )

(z)
|z|
X
= +;
quindi ciascun V
n
deve essere denso in X (altrimenti, per largomentazio-
ne precedente, dedurremmo che sup
A
|T

|
/(X,Y )
< ). Ma allora per il
teorema di Baire linsieme D =

n=1
V
n
`e addirittura denso in X e si ha
(x) = + per ogni x D. Ci`o conclude la dimostrazione del teorema di
Banach-Steinhaus.
Vediamo unapplicazione del teorema precedente alla convergenza puntuale
delle serie di Fourier di funzioni continue. Introduciamo lo spazio di Banach
C
0
#
[.] = f C[, ] : f() = f(),
munito della norma | |

. Se f `e una funzione di tale spazio, in particolare


f L
2
(, ) e quindi la sua serie di Fourier, relativa al sistema trigonome-
trico, converge a f nella norma | |
2
. Possiamo scrivere le somme parziali
della serie di Fourier di f nel modo seguente:
S
n
f(x) =
n

k=n

k
e
ikx
=
1
2
_

f(t)D
n
(x t)dt,
ove il nucleo di Dirichlet D
n
`e denito da
D
n
(t) =
n

k=n
e
ikt
, t R;
269
moltiplicando D
n
(t) per e
it/2
e sottraendo le relazioni ottenute, si vede
subito che
D
n
(t) =
_
sin (n+
1
2
)t
sin
t
2
se t ,= 0
2n + 1 se t = 0;
in particolare, D
n
`e una funzione reale. Quindi, ssato x [, ], per ogni
n N il funzionale
T
n
f = S
n
f(x) f C
0
#
[, ]
`e lineare e continuo con
|T
n
|
(C
0
#
[,])

|D
n
|
1
2
n N,
ed anzi vale luguaglianza, come si vede prendendo una successione g
j

C
0
#
[, ] tale che 0 g
j
1 e lim
j
g
j
(t) = sgnD
n
(t) per ogni t R. Si
osservi che
|T
n
|
(C
0
#
[,])
=
|D
n
|
1
2

2

_

0

sin
_
n +
1
2
_
t

dt
t
=
2

_
(n+
1
2
)
0
[ sin s[
ds
s
,
e poiche la funzione s
[ sin s[
s
non `e sommabile in [0, [, si conclude che
sup
nN
|T
n
|
(C
0
#
[,])
= +.
Per il teorema di Banach-Steinhaus si deduce che esiste un insieme D, interse-
zione di aperti densi in C
0
#
[, ]) e dunque esso stesso denso in C
0
#
[, ]),
tale che
sup
nN
[S
n
f(x)[ = + f D.
In denitiva, c`e un insieme denso di funzioni continue la cui serie di Fourier
non converge puntualmente nel punto x, che era stato ssato arbitrariamente
in [, ]. Un ranamento di questo risultato `e descritto nellesercizio 10.2.9.
Esercizi 10.2
1. Per ogni r > 0 sia B
r
= f L
2
(a, b) : |f|
2
r. Si provi che
B
r
L
1
(a, b), e che B
r
`e un chiuso in L
1
(a, b) privo di punti interni.
Se ne deduca che linclusione L
2
(a, b) L
1
(a, b) `e propria.
270
2. Sia T
n
/(X, Y ), con X spazio di Banach e Y spazio normato.
Supponiamo che per ogni x X la successione T
n
x converga in Y .
Si provi che:
(i) la successione |T
n
|
/(X,Y )
`e limitata;
(ii) x lim
n
T
n
x `e un elemento T di /(X, Y );
(iii) si ha |T|
/(X,Y )
liminf
n
|T
n
|
/(X,Y )
.
3. Sia X uno spazio normato e sia B un sottoinsieme di X

. Se per ogni
x X linsieme Tx : T B `e limitato in R, si provi che B `e limitato
in X

.
4. Sia X uno spazio di Banach e sia B un sottoinsieme di X. Se per ogni
T X

linsieme T(B) `e limitato in R, si provi che B `e limitato in X.


[Traccia: per ogni x B si consideri il funzionale J
x
: X

R
denito da J
x
(T) = Tx.]
5. Si consideri lo spazio (c
00
, | |
1
). Per ogni k N sia T
k
: c
00
R il
funzionale denito da T
k
x = kx
k
. Si provi che T
k
`e lineare e continuo,
che
sup
kN
[T
k
x[ < + x c
00
,
ma che sup
kN
|T
k
| = +. Giusticare il risultato.
6. Sia x
n
una successione reale. Per ogni k N poniamo
T
k
: c
0
R, T
k
a =
k

h=0
x
h
a
h
a = a
n
c
0
.
(i) Provare che |T
k
|
c

0
=

k
h=0
[x
h
[.
(ii) Supponiamo che per ogni a c
0
la successione reale T
k
a abbia
limite nito; si provi allora che il funzionale
T : c
0
R, Ta = lim
k
T
k
a
`e lineare e continuo, con
|T|
c

0
=

h=0
[x
h
[,
e che T
k
T in c

0
.
271
7. Sia a = a
n
una successione reale;
(i) se la serie

n=0
a
n
b
n
`e convergente per ogni successione b = b
n

1
, si provi che a

;
(ii) se la serie

n=0
a
n
b
n
`e convergente per ogni successione b = b
n

c
0
, si provi che a
1
.
8. Sia T

A
/(X, Y ), con X spazio di Banach e Y spazio normato.
Se risulta
sup
A
[(T

x)[ < + x X, Y

,
si provi che sup
A
|T

|
/(X,Y )
< +.
9. Si provi che esiste un insieme D denso in C
0
#
[, ], tale che per ogni
f D linsieme
x [, ] : sup
nN
[S
n
f(x)[ = +
`e denso in [, ].
10.3 Applicazioni aperte
Gli operatori lineari fra spazi di Banach godono di una importante pro-
priet`a topologica, assai utile nelle applicazioni. Essa `e espressa dal seguente
enunciato:
Teorema 10.3.1 (dellapplicazione aperta) Siano X ed Y spazi di Ba-
nach. Se T /(X, Y ) `e un operatore surgettivo, allora T `e un applicazione
aperta, ossia per ogni aperto A X linsieme T(A) `e aperto in Y .
Osserviamo che se T non `e lineare il teorema non vale: ad esempio se X =
Y = R la funzione f(x) = x
3
x `e continua e surgettiva, ma non lineare, e
trasforma laperto ] , 0[ nellinsieme ] ,
2
3

3
] che non `e aperto.
Dimostrazione Siano U, V le palle unitarie in X e Y rispettivamente: la
tesi del teorema equivale a dire che esiste > 0 tale che V T(U) (ove
V = y : y V `e la palla di centro 0 e raggio in Y ). Infatti, se vale
272
questa condizione ed A `e un aperto di X, ssato y
0
T(A) (dunque y
0
= Tx
0
con x
0
A) e scelto r > 0 in modo che x
0
+rU = B(x
0
, r) A, si ha
B(y
0
, r) = y
0
+rV Tx
0
+T(rU) = T(B(x
0
, r)) T(A),
e quindi T(A) `e aperto; viceversa, se T `e unapplicazione aperta allora T(U)
`e aperto in Y e quindi contiene una palla V centrata nel proprio punto
T(0) = 0.
Dimostriamo dunque che esiste > 0 per cui V T(U). Proveremo la tesi
in tre passi.
1
o
passo Y =

k=1
T(kU).
Infatti, essendo T surgettivo, ogni y Y `e immagine di qualche x X; sar`a
|x|
X
< k per qualche k N
+
, da cui y T(kU) T(kU).
2
o
passo Esiste > 0 tale che per ogni y Y ed > 0 c`e un x X che
verica |x|
X
<
1

|y|
Y
e |y Tx|
Y
< .
Anzitutto, per il teorema di Baire almeno uno fra gli insiemi T(kU) ha parte
interna non vuota; quindi esistono k N
+
ed un aperto W Y tali che
W T(kU). Dunque, scelto y
0
W, esiste > 0 tale che B(y
0
, ) W, da
cui
V = B(0, ) T(kU) y
0
T(2kU).
Dora in poi k, W ed sono ssati. Dalla relazione precedente segue che
y B(0, 2|y|
Y
) = 2|y|
Y
V T
_
4k

|y|
Y
U
_
y Y ;
questa `e esattamente la tesi del 2
o
passo con =

4k
.
3
o
passo Proviamo la tesi del teorema.
Applicheremo il 2
o
passo iterativamente. Sia =

4k
. Fissati > 0 e y V ,
per il 2
o
passo esiste x
1
X tale che
|x
1
|
X
<
1

|y|
Y
< 1, |y Tx
1
|
Y
<

2
.
Analogamente, in corrispondenza di y Tx
1
esiste x
2
X tale che
|x
2
|
X
<
1

|y Tx
1
|
Y
< 2
1
, |y Tx
1
Tx
2
|
Y
< 2
2
,
273
e procedendo induttivamente, per ogni n N
+
esiste x
n+1
X tale che
|x
n+1
|
X
<
1

_
_
_
_
_
y
n

k=1
Tx
k
_
_
_
_
_
Y
< 2
n
,
_
_
_
_
_
y
n+1

k=1
Tx
k
_
_
_
_
_
Y
< 2
(n+1)
.
Poniamo ora s
n
=

n
k=1
x
k
; poiche X `e completo, la successione s
n
, che `e
di Cauchy in X, converge ad un elemento x X per il quale risulta
|x|
X
|x
1
|
X
+

k=2
|x
k
|
X
< 1 +;
inoltre, per continuit`a, Ts
n
Tx in y. Daltra parte si ha, per costruzione,
Ts
n
y, e dunque y = Tx T((1 + )U); ne segue, per larbitrariet`a di y,
V T((1 +)U), ossia
T(U)

1 +
V > 0.
In denitiva
T(U)
_
>0

1 +
V = V.
Ci` o prova la tesi.
Corollario 10.3.2 Siano X, Y spazi di Banach e sia T /(X, Y ). Se T `e
bigettivo, allora T `e un isomorsmo, ossia T
1
/(Y, X).
Dimostrazione Ovviamente T
1
`e lineare; inoltre per il teorema dellap-
plicazione aperta T trasforma aperti in aperti e dunque la controimmagine
di un aperto mediante T
1
`e un aperto. Pertanto T
1
`e continua e quindi
T
1
/(Y, X). Notiamo in particolare che si ha
|x|
X
c|Tx|
Y
x X,
ove c = |T
1
|
/(Y,X)
.
Corollario 10.3.3 (teorema del graco chiuso) Siano X ed Y spazi di
Banach e sia T : X Y lineare. Se T `e un operatore chiuso, ossia il
graco G
T
di T `e un sottoinsieme chiuso dello spazio prodotto XY , allora
T /(X, Y ).
274
Osserviamo che se T `e non lineare il risultato `e falso: la funzione f : R R,
data da f(x) =
1
x
per x ,= 0 e f(0) = 0, ha graco chiuso pur essendo
discontinua.
Dimostrazione Dallesercizio 7.3.10 segue che XY `e uno spazio di Banach
con la norma |(x, y)|
XY
= |x|
X
+ |y|
Y
; poiche G
T
`e chiuso in X Y ,
(G
T
, | |
XY
) `e uno spazio di Banach. Lapplicazione : G
T
X denita
da
(x, Tx) = x (x, Tx) G
T
`e ben denita, lineare e, ovviamente, continua con norma non superiore a 1.
Inoltre `e bigettiva; quindi, per il corollario precedente, `e un isomorsmo
ed in particolare esiste c > 0 tale che
|(x, Tx)|
XY
c|x|
X
x X,
da cui c 1 e |Tx|
Y
(c 1)|x|
X
per ogni x X, cio`e la tesi.
Osservazioni 10.3.4 (1) Un operatore lineare T, denito su un sottospazio
M di uno spazio normato X, a valori in uno spazio normato Y , `e chiuso se
e solo se vale limplicazione seguente:
x
n
M, x
n
x in X, Tx
n
y in Y = x M e Tx = y.
Infatti ci`o signica esattamente che G
T
`e chiuso in X Y .
(2) Come vedremo nellesempio successivo, il teorema del graco chiuso `e fal-
so in generale se X non `e completo, oppure se X `e completo ma T `e denito
su un sottospazio proprio e non chiuso di X (le due cose sono equivalenti,
dato che ogni spazio normato non completo `e sottospazio non chiuso dello
spazio di Banach costituito dal suo completamento).
Nelle applicazioni, ad esempio nel campo delle equazioni dierenziali, si
incontrano spesso operatori chiusi non continui; lesempio principale `e il
seguente:
Esempio 10.3.5 Consideriamo loperatore derivata prima:
A : C
1
[a, b] C[a, b], Af = f
t
f C
1
[a, b].
Rispetto alle norme naturali di C
1
[a, b] e di C[a, b], loperatore derivata `e
lineare e continuo con norma uguale a 1: infatti ovviamente
|Af|

|f|

+|f
t
|

= |f|
C
1
[a,b]
,
275
e daltra parte prendendo le funzioni f

(x) = sin
xa

, con 0 < <


2

(b a),
si ottiene subito
|Af

= 1, |f

|
C
1
[a,b]
= + 1
e dunque
|A|
/(C
1
[a,b],C[a,b])

1
1 +
> 0.
Notiamo che A `e surgettivo: ogni g C[a, b] `e la derivata delle funzioni
c +
_
x
a
g(t)dt, che sono tutte in C
1
[a, b]. Quindi A `e unapplicazione aperta.
La restrizione di A al sottospazio
M = f C
1
[a, b] : f(x
0
) = 0 (x
0
punto ssato di [a, b]),
`e anche iniettiva (ogni g C[a, b] ha come unica controimmagine in M
la soluzione del problema di Cauchy f
t
= g, f(x
0
) = 0); quindi A[
M
`e un
isomorsmo. In eetti si ha
(A[
M
)
1
g(x) =
_
x
x
0
g(t)dt,
ed `e immediato vericare che
|(A[
M
)
1
|
/(C[a,b],C
1
[a,b])
= 1 + maxb x
0
, x
0
a.
Cambiamo punto di vista, mettendo su C
1
[a, b] la norma ||

: allora C
1
[a, b]
diventa un sottospazio non chiuso di C[a, b], ovvero uno spazio normato non
completo. Loperatore A agisce allora nello spazio C[a, b]: il suo dominio,
denito da
D(A) = f C[a, b] : Af = f
t
C[a, b],
`e il sottospazio C
1
[a, b] di C[a, b]. In questo modo A non `e pi` u continuo,
perche scegliendo f
n
(x) = (x a)
n
si trova subito
|f
t
n
|

= n(b a)
n1
, |f
n
|

= (b a)
n
,
e dunque
sup
nN
|f
t
n
|

|f
n
|

= +.
Tuttavia A `e un operatore chiuso: infatti se (f
n
, f
t
n
) `e una successione del
graco G
A
che converge nella norma dello spazio prodotto ad un elemento
276
(f, g) (ossia f
n
f uniformemente in [a, b] e f
t
n
g uniformemente in [a, b]),
passando al limite nella relazione
f
n
(x) f
n
(x
t
) =
_
x
x

f
t
n
(t)dt x, x
t
[a, b]
si trova subito che
f(x) f(x
t
) =
_
x
x

g(t)dt x, x
t
[a, b],
da cui `e facile dedurre, dividendo per x x
t
e facendo tendere x
t
ad x, che f
`e derivabile e f
t
(x) = g(x) per ogni x [a, b]: dunque f C
1
[a, b] e Af = g,
ovvero (f, g) G
A
. Quindi G
A
`e chiuso.
Esercizi 10.3
1. Sia X uno spazio normato e sia M un sottospazio di X. Si consideri
loperatore di restrizione r : X

, denito da
r(F) = F[
M
F X

.
(i) Si verichi che r /(X

, M

) e se ne calcoli la norma.
(ii) Loperatore r `e iniettivo? `e surgettivo?
(iii) Si provi che r `e unapplicazione aperta.
2. Siano X, Y spazi di Banach e sia T /(X, Y ) un operatore surgettivo.
Si provi che esiste c > 0 dotata della seguente propriet`a:
y Y x X : Tx = y e |x|
X
c|y|
Y
.
3. Sia H uno spazio di Hilbert e sia T /(H). Si provi che R(T

) =
(ker T)

e R(T) = (ker T

.
4. Sia H uno spazio di Hilbert e sia T /(H). Si provi che i seguenti
fatti sono equivalenti:
(i) R(T) `e chiuso in H;
(ii) R(T

) `e chiuso in H (si ricordi lesercizio 8.2.3);


(iii) R(T) = (ker T

;
277
(iv) R(T

) = (ker T)

;
(v) esiste c > 0 tale che |x| c|Tx| per ogni x (ker T)

;
(vi) esiste c
t
> 0 tale che |y| c
t
|T

y| per ogni y (ker T

.
5. Sia X uno spazio di Banach e sia T /(X) un operatore iniettivo. Si
provi che
|x|
R(T)
= |T
1
x|
X
`e una norma in R(T) e che R(T) `e uno spazio di Banach con tale norma.
Si verichi poi che limmersione i : R(T) X `e continua e se ne calcoli
la norma.
6. Sia X uno spazio di Banach e sia T /(X) tale che T

sia surgettivo.
Si provi che T `e invertibile e T
1
/(X).
7. Sia X uno spazio di Banach e siano M, N sottospazi chiusi di X tali
che M N = 0. Posto Z = x = a +b : a M, b N, si provi che
Z `e chiuso in X se e solo se esiste c > 0 tale che
|a|
X
c|a +b|
X
a M, b N.
[Traccia: supponendo Z chiuso si dimostri che P : Z M, denito
da P(a +b) = a, `e un operatore chiuso.]
8. Sia M = f L
1
(R) : t tf(t) L
1
(R), e sia T : M R denito
da Tf(t) = tf(t), t R. Si provi che M `e denso in L
1
(R) e che T `e
chiuso ma non continuo.
9. Sia X uno spazio normato, sia M un sottospazio di X e sia T : M R
un operatore lineare.
(i) Se M `e chiuso in X e T `e continuo, si provi che T `e chiuso. Cosa
pu`o succedere se M non `e chiuso?
(ii) Se X `e completo, M `e chiuso in X e T `e chiuso, si provi che T `e
continuo. Cosa pu`o succedere se M non `e chiuso?
(iii) Se T `e chiuso, `e vero che T trasforma insiemi chiusi in insiemi
chiusi?
278
10. Si provi che loperatore derivata prima A =
d
dt
: AC[a, b] L
1
(a, b) `e
continuo rispetto alle norme naturali di questi spazi, ed `e chiuso, ma
non continuo, se lo si denisce come operatore nello spazio L
1
(a, b) con
dominio D(A) = AC[a, b].
11. Sia H uno spazio di Hilbert e sia T : H H un operatore lineare
autoaggiunto (vedere lesercizio 8.2.4). Si provi che T /(H).
[Traccia: si mostri che T `e un operatore chiuso.]
12. Sia M un sottospazio di C[a, b] chiuso rispetto alla topologia indotta
dalla norma | |
2
; si provi che M ha dimensione nita.
[Traccia: Si verichi che (M, | |

) e (M, | |
2
) sono spazi di Banach
e si deduca che esiste c > 0 tale che |u|

c|u|
2
per ogni u M;
poi, se e
n
`e un sistema ortonormale completo in M, si ssi y [a, b]
e si denisca v(x) =

N
n=0
e
n
(y)e
n
(x): si verichi che v M e si ricavi
la maggiorazione

N
n=0
[e
n
(y)[
2
c
2
. Inne si integri rispetto a y su
[a, b]. . . .]
13. Per ogni f L
1
(, ) si deniscano i coecienti di Fourier rispetto
al sistema trigonometrico:

k
=
1
2
_

f(t)e
ikt
dt, k Z.
(i) Si provi che
k
0 per [k[ .
(ii) Posto
c
0
(Z) = x = x
k

kZ
: lim
[k[
x
k
= 0,
si verichi che lapplicazione Tf =
k

kZ
`e lineare e continua da
L
1
(, ) in c
0
(Z) con norma uguale a
1
2
.
(iii) Si provi che T `e iniettiva, ma non surgettiva.
10.4 Operatore aggiunto
Questo paragrafo `e dedicato allimportante nozione di aggiunto di un ope-
ratore lineare, nozione gi`a incontrata, in un caso particolare, negli esercizi
8.2.3 e successivi. Dati due spazi normati complessi X, Y , considereremo
279
operatori lineari A : D(A) X Y , ove D(A), il dominio di A, `e un oppor-
tuno sottospazio di X: abbiamo gi`a incontrato questa situazione nellesempio
10.3.5.
Sia dunque A : D(A) X Y un operatore lineare. Poniamo
M = Y

: A : D(A) C `e continuo nella norma di X;


ovviamente M `e un sottospazio di Y

. Fissato M, per il teorema di


Hahn-Banach esiste un funzionale Y

tale che [
D(A)
= A. Tale
funzionale non `e in generale unico; se per`o D(A) `e denso in X, allora lesten-
sione da A a `e unica.
Supporremo allora che D(A) sia denso in X.
Denizione 10.4.1 Siano X e Y spazi normati e sia A : D(A) X Y
un operatore lineare con dominio denso. Loperatore lineare A

: D(A

)
X

denito da
D(A

) = M, A

= M,
ove M e sono deniti come sopra, si chiama operatore aggiunto di A; esso
`e caratterizzato dalla relazione
(A

)x = (Ax) x D(A), D(A

).
Un caso importante `e quello in cui D(A) = X e A `e continuo: in questo caso
si ha
Proposizione 10.4.2 Siano X, Y spazi normati. Se A /(X, Y ), allora
A

/(Y

, X

) e
|A|
/(X,Y )
= |A

|
/(Y

,X

)
.
Dimostrazione Se A = 0 la tesi `e ovvia: supponiamo dunque A ,= 0.
Anzitutto
|A

|
X
= sup
|x|
X
=1
[(Ax)[ ||
Y
|A|
/(X,Y )
,
da cui |A

|
/(Y

,X

)
|A|
/(X,Y )
. Daltra parte, sia x X tale che Ax ,= 0:
posto y =
Ax
|Ax|
Y
, per il teorema di Hahn-Banach (pi` u precisamente per il
corollario 10.1.5) esiste Y

tale che ||
Y
= 1 e y = |y|
Y
= 1.
Dunque (Ax) = |Ax|
Y
e pertanto
|Ax|
Y
= (Ax) |A

|
X
|x|
X
|A

|
/(Y

,X

)
|x|
X
,
da cui |A|
/(X,Y )
|A

|
/(Y

,X

)
.
Le principali propriet`a degli aggiunti sono elencate nellenunciato che segue.
280
Proposizione 10.4.3 Siano X, Y, Z spazi normati. Allora:
(i) Se A, B /(X, Y ), allora (A +B)

= A

+B

.
(ii) Se C e A /(X, Y ), allora (A)

= A

.
(iii) Se A /(Y, Z) e B /(X, Y ), allora (AB)

= B

/(Z

, X

).
(iv) Se A /(X) ed esiste A
1
/(X), allora esiste anche (A

)
1

/(X

) e si ha (A

)
1
= (A
1
)

.
Dimostrazione Le veriche sono tutte facili; in particolare, per (iv) si os-
servi che (AA
1
)

= (A
1
A)

= I

= I : X

, e si applichi (iii).
Osservazione 10.4.4 Se X = Y = H, con H spazio di Hilbert, la nozione di
operatore aggiunto va precisata, in accordo con quanto esposto negli esercizi
8.2.3 e 8.2.4. Indichiamo con j : H H

lisomorsmo canonico fornito dal


teorema di Riesz-Frech`et, tale che
x = (x, j
1
)
H
x H, H

.
Se A /(H), per la proposizione 10.4.2 si ha A

/(H

) e risulta
(x, j
1
(A

))
H
= A

(x) = (Ax) = (Ax, j


1
)
H
x H, H

,
ossia, posto y = j
1
,
(x, (j
1
A

j)y)
H
= (Ax, y)
H
x, y H.
Nel caso di operatori A /(H) `e consuetudine identicare loperatore ag-
giunto A

/(H

) con loperatore j
1
A

j /(H). Nel seguito indicheremo


senzaltro con A

loperatore j
1
A

j; quindi A

sar`a un elemento di /(H) e


sar`a caratterizzato dalla relazione
(x, A

y)
H
= (Ax, y)
H
x, y H.
`
E necessario per`o osservare che, con questa identicazione, lapplicazione di
/(H) in se, denita da A A

, `e antilineare, ossia risulta


(A +B)

= A

+B

, (A)

= A

A, B /(H), C
in contrasto con la proposizione 10.4.3: questo fatto `e conseguenza dellanti-
linearit`a dellisomorsmo canonico j (osservazione 8.2.2).
281
Denizione 10.4.5 Sia H uno spazio di Hilbert. Un operatore A : D(A)
H H, con dominio D(A) denso in H, si dice autoaggiunto se si ha
D(A

) = D(A) e A

= A (nel senso dellosservazione 10.4.4), ossia se


(Ax, y)
H
= (x, Ay)
H
x D(A), y D(A

).
Esempi 10.4.6 (1) Sia A : C
n
C
m
un operatore lineare: allora, scelte su
C
n
e C
m
le basi canoniche, A si rappresenta con una matrice a
ij
m n.
Allora A

si rappresenta con la matrice trasposta coniugata a


ji
. Infatti
z = Ax z
i
=
n

j=1
a
ij
x
j
, i = 1, . . . , m,
da cui
(Ax, y) =
m

i=1
z
i
y
i
=
m

i=1
n

j=1
a
ij
x
j
y
i
=
m

j=1
x
j
m

i=1
a
ij
y
i
= (x, A

y).
In particolare, A `e autoaggiunto se e solo se la matrice a
ij
`e reale e
simmetrica.
(2) Sia H = L
2
(a, b), sia K L
2
(]a, b[]a, b[) e consideriamo loperatore
integrale A : H H denito da
Af(x) =
_
b
a
K(x, y)f(y) dy, x ]a, b[, f H.
Allora si verica facilmente che A /(H) e che
|A|
/(H)
|K|
L
2
(]a,b[]a,b[)
.
Inoltre, utilizzando il teorema di Fubini,
(Af, g)
H
=
_
b
a
__
b
a
K(x, y)f(y) dy
_
g(x) dx =
=
_
b
a
__
b
a
K(x, y)g(x) dx
_
f(y) dy =
=
_
b
a
_
_
b
a
K(x, y)g(x) dx
_
dy = (f, A

g)
H
,
282
da cui si ottiene
A

g(y) =
_
b
a
K(x, y)g(x) dx y ]a, b[, g H.
In particolare, A `e autoaggiunto se e solo se K(x, y) = K(y, x).
Esercizi 10.4
1. Determinare A

, essendo A /(
2
) denito da (Ax)
n
= x
n+1
per ogni
n N.
2. Fissata

, sia A /(
2
) denito da (Ax)
n
=
n
x
n
per ogni
n N. Determinare A

e vericare che:
(i) AA

= A

A;
(ii) A `e autoaggiunto se e solo se
n
R per ogni n N;
(iii) AA

= A

A = I se e solo se [a
n
[ = 1 per ogni n N.
3. Dato loperatore B /(
2
), denito da (Bx)
0
= 0 e (Bx)
n
= x
n1
per ogni n N
+
, si determini B

e si verichi che B

B = I mentre
BB

,= I.
4. Sia I : N N unapplicazione bigettiva e si consideri loperatore A
/(
2
) denito da (Ax)
n
= x
i(n)
per ogni n N. Si provi che A

A =
AA

. Loperatore A `e autoaggiunto?
5. Sia H uno spazio di Hilbert e sia A : D(A) H H lineare e
autoaggiunto. Si provi che A `e un operatore chiuso (corollario 10.3.3),
e che se D(A) = H allora A `e continuo.
6. Siano X, Y spazi di Banach e sia A : D(A) X Y lineare e iniettivo,
con dominio D(A) denso in X e immagine R(A) densa in Y . Si provi
che (A

)
1
esiste e coincide con (A
1
)

. Si provi anche che A


1
`e
continuo se e solo se (A

)
1
`e continuo.
7. Sia K(x, y) = 1+
1
2
e
2i(xy)
, x, y [0, 1], e sia A loperatore dellesempio
10.4.6 (2) in L
2
(0, 1). Si provi che
|A|
/(L
2
(0,1))
< |K|
L
2
(]0,1]]0,1[)
.
[Traccia: Per calcolare la norma di Af si utilizzi luguaglianza di
Bessel per il sistema e
2ikt

kZ
.]
283
10.5 Riessivit`a
Introduciamo ora una nozione, quella di riessivit`a, che pur essendo di natura
algebrica, condiziona fortemente la geometria dello spazio: infatti, fra tutti
gli spazi di Banach, quelli riessivi sono i pi` u vicini, per ricchezza di propriet`a,
agli spazi di Hilbert.
Sia dunque X uno spazio di Banach, sia X

il suo duale, e sia X

= (X

il duale del duale, o biduale di X. Vi `e una immersione naturale di X nel


suo biduale X

, che indichiamo con J e che `e cos` denita: ad ogni x X


associamo il funzionale J
x
X

che agisce su X

nel modo seguente:


J
x
(T) = Tx T X

.
Lapplicazione J : X X

`e chiaramente lineare, perche per ogni x, x


t
X
e per ogni , R (oppure , C) si ha
J
x+x
(T) = T(x +x
t
) = Tx +Tx
t
= J
x
(T) +J
x
(T) T X

.
Inoltre J `e continua, poiche per ogni x X risulta
[J
x
(T)[ = [Tx[ |T|
X
|x|
X
T X

,
da cui |J
x
|
X
|x|
X
; ma scegliendo, grazie al corollario 10.1.5, un elemento
T
0
X

tale che |T
0
|
X
= 1 e T
0
x = |x|
X
, si trova
[J
x
(T
0
)[ = [T
0
x[ = |x|
X
= |T
0
|
X
|x|
X
,
e dunque
|J
x
|
X
= |x|
X
x X.
Pertanto lapplicazione J `e unisometria fra X e la sua immagine J(X)
X

. Essa si chiama immersione canonica di X in X

. Limmagine J(X)
`e un sottospazio chiuso di X

(esercizio 10.5.1), in generale strettamente


contenuto in X

.
Denizione 10.5.1 Diciamo che lo spazio di Banach X `e riessivo se ri-
sulta J(X) = X

, ossia limmersione canonica J `e surgettiva.


Valgono le seguenti propriet`a, per la dimostrazione delle quali si rimanda agli
esercizi 10.5.2, 10.5.3 e 10.5.4.
284
Proposizione 10.5.2 Sia X uno spazio di Banach; allora X `e riessivo se
e solo se X

`e riessivo.
Proposizione 10.5.3 Sia M un sottospazio chiuso dello spazio di Banach
X; se X `e riessivo, allora M `e riessivo.
Proposizione 10.5.4 Se lo spazio di Banach X ha dimensione nita, allora
X `e riessivo.
Vediamo qualche esempio.
Esempi 10.5.5 (1) Ogni spazio di Hilbert H `e riessivo. Infatti, sia
H

e consideriamo lisomorsmo antilineare j : H H

fornito dal teorema


di Riesz-Frech`et, che ad ogni z H associa il funzionale j
z
H

denito da
j
z
(x) = (x, z)
H
per ogni x H; allora il funzionale x j(x) `e lineare,
dunque `e un elemento di H

, e sar`a pertanto della forma j = j


u
per uno
ed un solo u H, che dipender`a da . Quindi si ha
(j
x
) = j(x) = j
u
(x) = (x, u)
H
x H.
Sia adesso T un arbitrario elemento di H

, quindi T = j
z
con z H: si ha,
per denizione di immersione canonica J,
(T) = (j
z
) = (z, u)
H
= (u, z)
H
= Tu = J
u
(T),
e pertanto = J
u
. Ci`o prova che J : H H

`e surgettiva.
(2) Se (X, T, ) `e uno spazio misurato -nito, allora L
p
(X) `e riessivo per
ogni p ]1, [. Infatti, sia (L
p
)

: proveremo che esiste una funzione


a L
p
(necessariamente unica, essendo J unisometria) tale che J
a
= .
Sia q ]1, [ lesponente coniugato di p ; indichiamo con i
q
: L
q
(L
p
)

lisometria bigettiva lineare indotta dal teorema di Riesz-Fischer, denita


dalla relazione
[i
q
f](g) =
_
X
gf d g L
p
.
Dimostreremo che = J
i
1
p
(iq)
. Si noti che i
q
`e un elemento di (L
q
)

in
virt` u della relazione
[(i
q
f)[ ||
(L
p
)
|i
q
f|
(L
p
)
= ||
(L
p
)
|f|
q
f L
q
;
285
dunque, come `e giusto, i
1
p
( i
q
) `e un elemento di L
p
che denotiamo con a.
Sia F (L
p
)

e sia f lunico elemento di L


q
per cui F = i
q
f: si ha allora,
dalle denizioni di i
p
ed i
q
,
J
a
(F) = F(a) =
_
X
fa d = i
p
a(f) = ( i
q
)(f) = (F).
Pertanto = J
a
e ci`o prova che J : L
p
(L
p
)

`e surgettivo, ossia L
p
`e
riessivo. Si noti che, indicando con J
p
e J
q
le immersioni canoniche di L
p
ed L
q
(
1
p
+
1
q
= 1) nei rispettivi biduali, si ha
J
p
f
(i
q
g) =
_
X
fg d =
_
X
gf d = J
q
g
(i
p
f) f L
p
, g L
q
.
(3) Lo spazio L
1
non `e riessivo in generale. Ad esempio, sappiamo dal
teorema di Riesz-Fischer che il duale di L
1
(a, b) `e isomorfo ed isometrico a
L

(a, b) mediante lapplicazione i

che ad ogni f L

associa il funzionale
[i

f](g) =
_
b
a
g(t)f(t) dt per ogni g L
1
; quindi, detta J
1
: L
1
(L
1
)

limmersione canonica, limmagine di J


1
in (L
1
)

`e
J
1
(L
1
) =
_
(L
1
)

: h L
1
: (i

f) =
_
b
a
f(t)h(t) dt f L

_
.
Ma se consideriamo una qualunque estensione a L

del funzionale
f = f(a) f C[a, b],
allora i
1

`e un elemento di (L
1
)

che non pu`o appartenere a J


1
(L
1
):
infatti in tal caso otterremmo, per ogni F = i

f (L
1
)

, ossia per ogni


f L

,
i
1

(F) = f =
_
b
a
f(t)h(t) dt
per unopportuna h L
1
, il che, come sappiamo dal corollario 10.1.7, `e im-
possibile.
Come vedremo nei prossimi paragra, gli spazi riessivi sono importanti per-
che in essi gli insiemi limitati e chiusi sono debolmente compatti in un senso
che preciseremo: questo consente di ottenere, in svariati problemi applicativi,
risultati di esistenza di soluzioni, anche se non sempre vale lunicit`a.
286
Esercizi 10.5
1. Sia X uno spazio di Banach; si provi che J(X) `e un sottospazio chiuso
di X

.
2. Si dimostri la proposizione 10.5.2.
[Traccia: se X

`e riessivo, e se per assurdo esiste X

J(X),
si trovi un elemento X

tale che [
J(X)
= 0 e () ,= 0. Per la
riessivit`a di X

, si avr`a = J

F
con F X

(ove J

`e limmersione
canonica di X

in X

); si provi che necessariamente F = 0, e se ne


deduca lassurdo essendo ,= 0. Se X `e riessivo, si osservi che ogni
X

sar`a della forma = J


x
con x X, da cui J

F
() = (F) =
J
x
(F) = Fx per ogni F X

; quindi se X

si verichi che J
`e un elemento di X

e che risulta = J

J
.]
3. Si dimostri la proposizione 10.5.3.
[Traccia: ovviamente, (M, | |
X
) `e uno spazio di Banach. Se M

,
detta F
r
la restrizione a M di un arbitrario funzionale F X

, si
verichi che F (F
r
) `e un elemento X

. Se x `e lelemento di
X tale che J
x
= , supponendo per assurdo che x / M si trovi un
funzionale G X

con G ,= 0 ma G
r
= 0, e si concluda che ci`o `e
impossibile. Si deduca che = J
M
x
, ove J
M
`e limmersione canonica di
M in M

.]
4. Si dimostri la proposizione 10.5.4.
[Traccia: sia e
1
, . . . , e
n
una base per X, sia f
1
, . . . , f
n
la base duale
di X

(cio`e quella tale che f


i
(e
j
) =
ij
), e sia
1
, . . . ,
n
la base di
X

tale che
k
(f
i
) =
ki
. Si provi che J
e
i
(F) =
i
(F) per ogni F X

e si deduca la tesi.]
5. Si provi che L

(a, b) e L

(R) non sono riessivi.


6. Si provi che
1
e

non sono riessivi.


7. Siano X, Y spazi di Banach, sia T /(X, Y ). Dette J, J
t
le immersioni
canoniche di X in X

e di Y in Y

rispettivamente, si verichi che


T

J = J
t
T, ove T

= (T

: X

`e laggiunto delloperatore
T

: Y

, a sua volta aggiunto di T.


8. Siano X, Y spazi di Banach e sia T /(X, Y ). Se T `e surgettivo, si
provi che T

`e iniettivo e che R(T

) `e chiuso in Y .
287
[Traccia: per la seconda aermazione, sia F
n
R(T

) tale che
F
n
F in X

; si verichi che esiste un unico G


n
Y

tale che F
n
=
T

G
n
, ed usando lesercizio 10.3.2 si provi che G
n
`e una successione
di Cauchy in Y

. Detto G Y

il suo limite, si verichi che F = T

G.]
9. Siano X, Y spazi di Banach con X riessivo. Se T /(X, Y ), si provi
che
R(T

) = F X

: F[
ker T
= 0.
[Traccia: per provare linclusione , si ragioni per assurdo: se F[
ker T
=
0 e F / R(T

), si trovi X

tale che (F) > 0 e [


R(T

)
= 0; se
x X `e tale che J
x
= , si deduca che G(Tx) = 0 per ogni G Y

e
si ricavi lassurdo.]
10. Siano X, Y spazi di Banach. Se T /(X, Y ) e R(T) `e chiuso in Y , si
provi che
R(T

) = F X

: F[
ker T
= 0.
[Traccia: per provare linclusione , si osservi che se F[
ker T
= 0, allora
ha senso denire G(y) = F(x) per ogni y R(T), ove x T
1
(y)
`e scelto ad arbitrio. Dato che R(T) `e chiuso, esso `e uno spazio di
Banach; si usi lesercizio 10.3.2 per provare che esiste c > 0 tale che
[G(y)[ c|y|
Y
per ogni y R(T). Si estenda il funzionale G, col
teorema di Hahn-Banach, ad un elemento G Y

e si concluda che
F = T

G.]
11. Siano X, Y spazi di Banach; se X `e riessivo ed esiste un operatore
T /(X, Y ) surgettivo, si provi che anche Y `e riessivo.
[Traccia: per lesercizio 10.5.8 si ha ker T

= 0 e R(T

) chiuso; se
ne deduca, per lesercizio 10.5.10, che R(T

) = X

: [
ker T
=
0 = X

, e quindi che T

`e surgettivo. Dallesercizio 10.5.7 si ricavi


che Y `e riessivo.]
12. Si provi che uno spazio normato `e separabile se e solo se si ha X =
[x
n
], ove x
n
`e unopportuna successione di elementi di X.
13. Sia X uno spazio di Banach. Si provi che:
(i) se X

`e separabile, allora anche X `e separabile, ma che il viceversa


`e falso;
288
(ii) se X `e separabile e riessivo, allora anche X

`e separabile e ries-
sivo.
[Traccia: (i) se X

= F
n
, si scelga x
n
X tale che |x
n
|
X
= 1
e F
n
(x
n
)
1
2
|F
n
|
X
; posto M = [x
n
], si dimostri che M = X
ragionando per assurdo: se esistesse x
0
XM, utilizzando il corollario
10.1.6 si costruisca un elemento F X

lontano da tutti gli F


n
e si
deduca il risultato. (ii) Si provi che se X = [x
n
] allora X

=
[J
xn
], e quindi X

`e separabile.]
14. Se X e Y sono spazi riessivi, si provi che X Y `e riessivo.
[Traccia: si utilizzi lesercizio 7.3.10.]
10.6 Convergenze deboli
Negli spazi normati vi `e un altro tipo di convergenza, pi` u debole di quella
rispetto alla norma e dunque pi` u facile da ottenere, che `e molto utile nelle
applicazioni.
Denizione 10.6.1 Sia X uno spazio normato e sia x
n
una successione
contenuta in X. Diciamo che x
n
converge debolmente ad un elemento
x X se si ha Fx
n
Fx in R per ogni funzionale F X

; in tal caso
scriviamo x
n
x.
Osserviamo che la convergenza debole, ovviamente, `e pi` u debole della con-
vergenza rispetto alla norma: infatti se x
n
x in X, allora
[Fx
n
Fx[ |F|
X
|x
n
x|
X
0 F X

,
e quindi x
n
x in X.
Altrettanto ovviamente, se x
n
x in X non `e detto che x
n
x. Ad
esempio, ogni sistema ortonormale numerabile e
n
in uno spazio di Hilbert
H converge debolmente allelemento 0 H: ricordando il teorema di Riesz-
Frech`et, questo segue dal fatto che
lim
n
(e
n
, z)
H
= 0 z H
in virt` u della disuguaglianza di Bessel (proposizione 8.3.6). Daltra parte non
pu` o essere e
n
0 dato che |e
n
|
H
= 1 per ogni n N.
289
Si pu`o facilmente vericare (esercizio 10.6.9) che se X ha dimensione nita
allora la convergenza debole `e equivalente a quella forte (cio`e a quella rispetto
alla norma di X). Si noti che questa asserzione non si pu`o invertire, come
mostra lesercizio 10.6.10.
La seguente propriet`a della convergenza debole `e di uso assai frequente.
Proposizione 10.6.2 Sia X uno spazio normato. Se x
n
x in X, allora
x
n
`e limitata in X e
|x|
X
liminf
n
|x
n
|
X
.
Dimostrazione Sia J : X X

limmersione canonica. Per ipotesi si ha


lim
n
J
xn
(F) = lim
n
Fx
n
= Fx F X

;
quindi
sup
nN
[J
xn
(F)[ < F X

.
Per il teorema di Banach-Steinhaus, applicato agli spazi X

e R, si ottiene
sup
nN
|J
xn
|
X
< ,
e ricordando che J `e unisometria, otteniamo la limitatezza in X della suc-
cessione x
n
.
Inoltre, per ogni F X

si ha
[Fx[ = lim
n
[Fx
n
[ liminf
n
|F|
X
|x
n
|
X
,
da cui
|x|
X
= |J
x
|
X
= sup
FX

\0
[Fx[
|F|
X

liminf
n
|x
n
|
X
.
Nello spazio duale X

vi `e un altro tipo di convergenza, ancora pi` u debole.


Denizione 10.6.3 Sia X uno spazio normato e sia F
n
una successione
contenuta in X

. Diciamo che F
n
converge debolmente* in X

(e leggiamo
debolmente star) ad un elemento F X

se si ha F
n
x Fx in R per ogni
x X. In tal caso scriviamo F
n

F.
290
La convergenza debole* `e dunque semplicemente la convergenza puntuale per
funzionali lineari deniti su X. Si noti che in X

si hanno entrambi i tipi di


convergenza debole:
F
n
F in X

(F
n
) (F) X

,
F
n

F in X

F
n
x Fx x X.
In particolare, la convergenza debole in X

implica la convergenza debole*


in X

, mentre il viceversa `e falso in generale, come vedremo nel prossimo


esempio; le due convergenze deboli in X

coincidono nel caso che X sia uno


spazio di Banach riessivo.
Esempio 10.6.4 La successione e
n
(ove e
n
= 0, 0, . . . , 0, 1, 0, 0, . . . con
1 al posto n-simo) converge debolmente* a 0 in

. Infatti

`e isomorfo a
(
1
)

; detto i :

(
1
)

tale isomorsmo, per ogni x


1
si ha
[i(e
n
)]x =

k=0
(e
n
)
k
x
k
= x
n
0 per n .
Inoltre, e
n

0 in
1
: infatti, analogamente,
1
`e isomorfo a (c
0
)

e quindi,
detto j : l
1
(c
0
)

tale isomorsmo, si ha
[j(e
n
)]x =

n=0
(e
n
)
k
x
k
= x
n
0 x c
0
.
Daltra parte e
n
, 0 in
1
, perche scelto lelemento 1 = 1, 1, 1, . . .

,
risulta
[i(1)]e
n
= (e
n
)
n
= 1 , 0.
Le convergenze deboli sono importanti perche forniscono buoni teoremi di
compattezza. Esamineremo alcuni risultati di questo tipo nel prossimo pa-
ragrafo.
Esercizi 10.6
1. Sia X uno spazio normato. Si provi che:
(i) se x
n
x in X e F
n
F in X

, allora F
n
x
n
Fx in R;
(ii) se x
n
x in X e F
n

F in X

, allora F
n
x
n
Fx in R;
291
(iii) se x
n
x in X e F
n

F oppure F
n
F in X

, allora non `e
detto che si abbia F
n
x
n
Fx in R.
2. Sia 1 < p < . Se f
n
L
p
, si provi che f
n
f in L
p
se e solo se:
(i) f
n
`e limitata in L
p
,
(ii)
_
E
f
n
d
_
E
f d per ogni insieme misurabile E con (E) < .
Lenunciato `e ancora vero per p = ?
3. Sia f
n
L
1
. Se f
n
f in L
1
, si provi che valgono (i) e (ii) del
precedente esercizio, ma che il viceversa `e falso se (X) = .
4. Sia X uno spazio normato e sia M un sottospazio di X. Si provi che
M `e chiuso in X se e solo se `e chiuso rispetto alla convergenza debole.
Si provi che lo stesso enunciato vale supponendo soltanto M convesso.
[Traccia: per la seconda parte si utilizzi lesercizio 10.1.9.]
5. Dimostrare che il limite debole, o debole*, `e unico (se esiste).
6. Si provi che se X `e uno spazio di Banach e se F
n

F in X

, allora
F
n
`e limitata in X

e
|F|
X
liminf
n
|F
n
|
X
.
7. Siano X, Y spazi normati e sia T /(X, Y ). Si provi che se x
n
x in
X allora Tx
n
Tx in Y .
8. Sia 1 p . Si provi che linsieme e
m
+me
n

n,mN
non ha alcuna
sottosuccessione che converga debolmente a 0 in
p
.
9. Si provi che se X ha dimensione nita, allora la convergenza debole
equivale a quella forte.
10. Si provi che in
1
la convergenza debole `e equivalente alla convergenza
forte.
[Traccia: per assurdo sia x
(n)

1
tale che x
(n)
0 ma |x
(n)
|
1
;
si osservi che lim
n
x
(n)
k
= 0 per ogni k N. Deniamo induttiva-
mente: n
0
= 0, m
0
= 0 e poi, noti n
h1
e m
h1
, n
h
= minn > n
h1
:

m
h1
k=0
[x
(n)
k
[ <

5
, m
h
= minm > m
h1
:

i=m+1
[x
(n
h
)
i
[ <

5
. Posto
292
z = z
k
, ove z
k
= sgnx
(n
h
)
k
se m
h1
< k m
h
, si ha z

; si mostri
che [

i=0
z
i
x
(n
h
)
i
[

5
per ogni h N, e si deduca lassurdo.]
11. Dimostrare con esempi che:
(i) f
n
f in L
p
,= f
n
f q.o.;
(ii) f
n
f in L
p
,= f
n
f in misura;
(iii) f
n
, f L
p
e f
n
f q.o. ,= f
n
f in L
p
;
(iv) f
n
, f L
p
e f
n
f in misura ,= f
n
f L
p
.
12. Si provi che sin nx 0 in L
p
(R) per ogni p [1, [, e che sin nx

0
in L

(R).
13. Sia (X, T, ) uno spazio misurato -nito. Se f
n
f in L
p
, 1 p <
, oppure f
n

f in L

, si provi che
liminf
n
f
n
(x) f(x) limsup
n
f
n
(x) q.o. in X.
[Traccia: supposto p = 1, e posto M(x) = limsup
n
f
n
(x), si
osservi che per provare che f M q.o. basta mostrare che f M
q.o. in E, ove E `e un arbitrario insieme misurabile di misura nita.
Si utilizzi lesercizio 10.6.2 e si provi che
_
F
f d
_
F
M d per ogni
insieme misurabile F contenuto in Q = x X : [M(x)[ < , od in
Q
+
= x X : M(x) = +, od in Q

= x X : M(x) = .
Per laltra disuguaglianza, si consideri f. Il caso p 1 `e analogo.]
10.7 Compattezza
Come si sa, in uno spazio metrico completo (X, d) un insieme K `e compatto se
e solo se `e chiuso e totalmente limitato; ricordiamo che K `e totalmente limita-
to se per ogni > 0 esiste una -rete, cio`e una famiglia nita x
1
, . . . , x
N
di
punti di K tali che K

N
j=1
B(x
j
, ), ove B(x
j
, ) = x X : d(x, x
j
) < .
Se lo spazio X `e immerso in R
n
od in C
n
per qualche n, allora la nozione di
totale limitatezza equivale a quella di limitatezza; altrimenti, come nel caso
degli spazi di Banach di dimensione innita, gli insiemi limitati e chiusi non
saranno compatti. Ad esempio, gli spazi
p
hanno dimensione innita e lin-
sieme K = e
n

nN
, essendo (e
n
)
k
=
nk
, `e limitato, chiuso ma non compatto
293
(vedere gli esercizi 10.7.5 e 10.7.6).
Esistono svariati criteri di compattezza per sottoinsiemi di spazi di Banach.
Ne esamineremo solamente alcuni fra i principali.
Teorema 10.7.1 (di Ascoli-Arzel`a) Sia X uno spazio metrico separabile
e sia T una famiglia di funzioni X R. Se:
(i) T `e equicontinua, cio`e per ogni > 0 esiste > 0 tale che
d(x, y) < = [f(x) f(y)[ < f T,
(ii) T `e puntualmente equilimitata, ossia per ogni x X esiste M
x
0 tale
che
[f(x)[ M
x
f T,
allora da ogni successione f
n

nN
T si pu`o estrarre una sottosuccessione
che converge uniformemente in ogni sottoinsieme compatto di X.
Dimostrazione Poiche X `e separabile, esiste un insieme numerabile E =
x
n

nN
denso in X. Poniamo S
0
= N; poiche, per (ii), f
n
(x
0
)
nS
0
`e
limitato in R, esiste S
1
S
0
tale che la sottosuccessione f
n
(x
0
)
nS
1
`e
convergente. Per induzione, costruito S
k
S
k1
tale che f
n
(x
j
)
nS
k
`e
convergente per ogni j = 0, 1, . . . , k 1, poiche f
n
(x
k
)
nS
k
`e limitato in
R esiste S
k+1
S
k
tale che la sottosuccessione f
n
(x
k
)
nS
k+1
`e convergente
(al pari delle sottosuccessioni f
n
(x
j
)
nS
k+1
, j = 0, 1, . . . , k 1). Resta
cos` denita uninnita sequenza di sottosuccessioni, ognuna inclusa nella
precedente, delle quali la k + 1-sima `e tale che f
n
(x
j
)
nS
k+1
converge in R
per ogni j = 0, 1, . . . , k.
Adesso indichiamo con r
k
il k-simo elemento dellinsieme S
k
(che `e ordinato
secondo lordinamento naturale di N); ponendo S = r
0
, r
1
, . . . , r
k
, . . ., si ha
S N ed inoltre, per ogni k N, al pi` u i primi k termini di S, da r
0
a r
k1
,
non appartengono a S
k
. Di conseguenza, la sottosuccessione diagonale
f
n

nS
`e tale che f
n
(x
k
)
nS
converge in R per ogni k N, ovvero
lim
nS, n
f
n
(x) x E.
Adesso, ssato un compatto K X, proveremo che f
n
(x)
nS
converge
uniformemente in K. Fissiamo > 0, e scegliamo > 0 in modo che valga
(i). Poiche K `e compatto, esso pu`o essere ricoperto da una famiglia nita
294
di palle B(y
1
,

2
), . . . , B(y
N
,

2
); dato che E `e denso in X, in ciascuna palla
B(y
i
,

2
) cadr`a un punto x
k
i
E. Quindi, per (i), avremo
[f
n
(x
k
i
) f
n
(x)[ < x B
_
y
i
,

2
_
, i = 1, . . . , N,
e dunque se x K, scelto i in modo che x B(y
i
,

2
), e ricordando che
f
n
(x
k
i
)
nS
`e convergente, otteniamo per ogni n, m S sucientemente
grandi:
[f
n
(x)f
m
(x)[ [f
n
(x)f
n
(x
k
i
)[+[f
n
(x
k
i
)f
m
(x
k
i
)[+[f
m
(x
k
i
)f
m
(x)[ < 3.
Ci` o prova che f
n

nS
`e una successione di Cauchy rispetto alla convergenza
uniforme in K, ove K `e un arbitrario compatto contenuto in X. La tesi `e
provata.
Corollario 10.7.2 Sia X uno spazio di Banach separabile e sia F
n
una
successione limitata in X

. Allora esiste una sottosuccessione F


n
k
di F
n

che converge debolmente* in X

ad un elemento F X

.
Dimostrazione Posto M = sup
nN
|F
n
|
X
, si ha
[F
n
x[ M|x|
X
x X, n N,
[F
n
x F
n
y[ M|x y|
X
x, y X, n N;
quindi la famiglia F
n

nN
verica le ipotesi del teorema di Ascoli-Arzel`a.
Dunque, essendo x un compatto di X per ogni x X, per unopportuna
sottosuccessione F
n
k
F
n
si avr`a
lim
k
F
n
k
(x) x X.
`
E chiaro che il limite cos` denito `e un funzionale lineare F tale che [Fx[
M|x|
X
per ogni x X; ne segue la tesi.
Corollario 10.7.3 Sia X uno spazio di Banach riessivo e sia x
n
una
successione limitata in X. Allora esiste una sottosuccessione x
n
k
di x
n

che converge debolmente in X ad un elemento x X.


295
Dimostrazione Il sottospazio M = [x
n
] `e separabile (esercizio 10.5.12) e
riessivo, essendo un sottospazio chiuso dello spazio riessivo X (proposizione
10.5.3). Poiche J
xn
`e una successione limitata in M

, per il corollario
10.7.2 c`e una sottosuccessione J
xn
k
di J
xn
che converge debolmente* ad
un elemento M

. Per la riessivit`a di M sar`a = J


x
per un certo
x M: quindi J
xn
k

J
x
in M

, ovvero Fx
n
k
Fx per ogni F M

.
Dato che ogni funzionale lineare continuo su X `e anche continuo su M, si ha
in particolare che x
n
k
x in X. Ci`o prova la tesi.
Esercizi 10.7
1. Si provi che se X `e uno spazio di Banach riessivo, ogni funzionale
F X

assume massimo sulla palla unitaria chiusa di X.


2. Si provi che M = f C[a, b] : f(a) = 0 non `e riessivo, e se ne
deduca che C[a, b] non `e riessivo.
[Traccia: si consideri il funzionale
Fg =

n=0
1
n!
g
_
a +
b a
n + 1
_
, f M,
e si utilizzi lesercizio precedente.]
3. Si provi che c
0
non `e riessivo.
[Traccia: si utilizzi lesercizio 7.3.11.]
4. Sia X uno spazio di Banach innito-dimensionale e riessivo. Si provi
che esistono una successione x
n
X ed un elemento x X tali che
x
n
x ma x
n
, x in X.
[Traccia: utilizzando lesercizio 10.1.11, si costruisca induttivamente
x
n
X tale che |x
n
|
X
= 1 e |x
n
x
m
|
X

1
2
per ogni n > m . . . ]
5. Si provi che in
1
, in
2
e in

la palla unitaria chiusa non `e compatta.


6. Si provi che se p [1, [ e

n=0
a
n
`e una serie convergente di numeri
positivi, allora linsieme
K = x
p
: [x
n
[ a
n
n N
`e compatto in
p
. Se p = 2 e a
n
=
1
n+1
linsieme K `e detto cubo di
Hilbert.
296
7. Si provi che un sottoinsieme K C[a, b] `e relativamente compatto
se e solo se `e limitato ed equicontinuo (secondo la denizione data
nellenunciato del teorema 10.7.1).
8. Sia K un sottoinsieme di L
p
(a, b), 1 p < . Si provi che K `e
relativamente compatto se e solo se `e limitato ed inoltre, prolungate a
0 fuori di ]a, b[ le funzioni di K, risulta
lim
h0
sup
fK
_
b
a
[f(x +h) f(x)[
p
dx = 0.
[Traccia: per la necessit`a, ssata una -rete per K, si utilizzi lesercizio
9.1.25. Per la sucienza, ssato > 0, per > 0 sia B

= f

: f K,
ove f

`e la convoluzione dellesercizio 9.1.23; si mostri che B

`e limitato
ed equicontinuo in C[a, b], e se ne deduca che per piccolo vi `e una
-rete A per B

in C[a, b], con =



2
(b a)
1
p
; si concluda che A `e una
-rete per K in L
p
(a, b).]
9. (Teorema di Frech`et-Kolmogorov) Sia p [1, [ e sia K L
p
(R). Si
provi che K `e relativamente compatto se e solo se `e limitato ed inoltre
verica:
(i) lim
h0
sup
fK
_
R
[f(x +h) f(x)[
p
dx = 0,
(ii) lim
r
sup
fK
_
[x[r
[f(x)[
p
dx = 0.
[Traccia: per la sucienza, estrarre da K una sottosuccessione con-
vergente in L
p
con un procedimento diagonale, utilizzando lesercizio
precedente.]
10. (Teorema di Peano) Sia G un aperto limitato di R
2
, e sia f : G R
continua. Si provi che per ogni (x
0
, y
0
) G il problema di Cauchy
y
t
(x) = f(x, y(x)), y(x
0
) = y
0
ha almeno una soluzione y C
1
(I), ove I `e un opportuno intervallo di
R centrato in x
0
.
[Traccia: sia M = sup
G
[f[, e per ogni > 0 sia > 0 tale che
[x x
t
[ < , [y y
t
[ < 2M = [f(x, y) f(x
t
, y
t
)[ < .
297
Sia G lunione dei due triangoli chiusi delimitati dalle due rette
per (x
0
, y
0
) di coecienti angolari M e dalle rette verticali x = a e
x = b (con a, b opportuni e tali che a < x
0
< b). Si costruiscano le
spezzate di Eulero nel modo seguente: si tracci da (x
0
, y
0
) la retta di
coeciente angolare f(x
0
, y
0
), si ssi su di essa un altro punto (x
1
, y
1
),
e si tracci da esso la retta di coeciente angolare f(x
1
, y
1
); ssato su
questa un altro punto (x
2
, y
2
), si tracci da esso la retta di coeciente
angolare f(x
2
, y
2
), e cos` via. Sia ora
n
una successione di funzioni
i cui graci siano spezzate di Eulero passanti per (x
0
, y
0
), con nodi
(
(n)
i
,
(n)
i
), tali che
n
= max
i
(
(n)
i

(n)
i1
) tenda a 0 per n . Si
verichi che
n
`e un sottoinsieme limitato ed equicontinuo di C[a, b]
e sia
n
una sottosuccessione di
n
uniformemente convergente in
[a, b] (esercizio 10.7.7). Indichiamo con il limite; sia N N tale che
|
n
|

< 2M e
n
< per ogni n > N. Siano [x x
t
[ < , con
(ad esempio) x < x
t
, e n > N; detti (x
(n)
i
, y
(n)
i
) i nodi della spezzata
graco di
n
, sar`a x
r
x < x
r+1
< . . . < x
s
< x
t
x
s+1
. Si verichi
che

n
(x)
n
(x
t
) = [
n
(x)
n
(x
r+1
)]+
+
s1

i=r+1
[
n
(x
i
)
n
(x
i+1
)] + [
n
(x
s
)
n
(x
t
)] =
= f(x
r
, y
r
)(x x
r+1
) +
+
s1

i=r+1
f(x
i
, y
i
)(x
i
x
i+1
) +f(x
s
, y
s
)(x
s
x
t
),
e dal fatto che [f(x
i
, y
i
) f(x,
n
(x))[ < per i = r, r + 1, . . . , s si
deduca che

n
(x)
n
(x
t
)
x x
t
f(x,
n
(x))

< n > N, x
t
]x , x +[.
Si concluda, passando al limite per n e per x
t
x, che risolve
il problema di Cauchy.]
298
Capitolo 11
Teoria spettrale
11.1 Spettro e risolvente
Questo capitolo `e dedicato alla teoria spettrale degli operatori lineari su uno
spazio normato X: se T : X X `e lineare, studieremo la struttura dellin-
sieme dei valori tali che I T `e invertibile con inverso continuo. Questa
propriet`a `e di grande importanza nelle applicazioni, poiche permette di ot-
tenere teoremi di esistenza di soluzioni per equazioni vettoriali, con le quali
`e possibile modellizzare svariatissimi fenomeni.
Sia A : D(A) X X un operatore lineare in uno spazio di Banach com-
plesso X (se lo spazio X `e reale, si pu`o considerare il complessicato di X: si
veda lesercizio 11.1.1).
Denizione 11.1.1 Sia C. Il punto `e detto regolare per A se lope-
ratore I A : D(A) X `e iniettivo con immagine R(I A) densa in X,
e se il suo inverso (I A)
1
: R(I A) D(A) `e continuo (rispetto alla
norma di X). Linsieme
(A) = C : `e regolare per A
si dice insieme risolvente di A. Loperatore (I A)
1
, che si denota con
R(, A), si chiama operatore risolvente di A. Linsieme
(A) = C (A) = C : non `e regolare per A
si dice spettro di A.
A sua volta lo spettro di A si decompone in questo modo:
spettro puntuale = P

(A) = C : I A non `e iniettivo,


299
spettro continuo = C

(A) = C :
I A `e iniettivo, R(I A) = X, (I A)
1
non `e continuo,
spettro residuo = R

(A) = C : I A `e iniettivo , R(I A) X.


Osservazione 11.1.2 Se A `e un operatore lineare chiuso, e se (A),
allora R(I A) = X, cio`e I A `e bigettivo con inverso (I A)
1
denito
su tutto X. Infatti, se y X = R(I A), esiste x
n
D(A) tale che
x
n
Ax
n
y; la continuit`a di (I A)
1
implica che x
n
`e di Cauchy in X
e quindi converge a un elemento x X. Ne segue che Ax
n
y+x: poiche
A `e chiuso, si conclude che x D(A) e Ax = y x, cio`e y R(I A).
Esempio 11.1.3 Sia A : C
n
C
n
unapplicazione lineare, rappresentata
dalla matrice a
ij
che denotiamo ancora, seppur impropriamente, con A.
Lequazione x Ax = 0 ha lunica soluzione x = 0 se e solo se non `e un
autovalore della matrice A; in tal caso, loperatore (I A)
1
`e denito su
tutto C
n
ed `e continuo. Quindi (A) se e solo se non `e un autovalore.
In denitiva, (A) `e linsieme degli autovalori della matrice A.
In analogia con il caso delle matrici, si ha la seguente
Denizione 11.1.4 Sia A : D(A) X X un operatore lineare in uno
spazio di Banach complesso X. I punti dello spettro puntuale di A si dicono
autovalori di A; i vettori non nulli x X tali che x Ax = 0 si dicono
autovettori di A relativi allautovalore .
Proposizione 11.1.5 Sia X uno spazio di Banach. Se A : D(A) X X
`e un operatore lineare chiuso, allora (A) `e aperto in C e quindi (A) `e
chiuso.
Dimostrazione Se (A) `e vuoto, allora `e aperto. Altrimenti, ssiamo
(A): per losservazione 11.1.2, (I A)
1
/(X); proviamo che se C
e |(I A)
1
|
/(X)
[[ < 1 allora risulta (A).
Per ogni k N sia B
k
=

k
n=0

n
(I A)
n
; per la scelta di , B
k
`e una
successione di Cauchy in /(X) e B =

n=0

n
(I A)
n
appartiene a /(X).
Verichiamo che B(I A)
1
`e linverso di ( )I A. Per ogni k N si
ha
B
k
(I A)
1
[( )I A] = B
k
[I (I A)
1
] =
=
k

n=0

n
(I A)
n
[I (I A)
1
] = I
k+1
(I A)
(k+1)
,
300
ed essendo |
k+1
(I A)
(k+1)
|
/(X)
([[|(I A)
1
|
/(X)
)
k+1
, per k
segue che
B(I A)
1
[( )I A] = I[
D(A)
.
Analogamente si verica che per ogni k N e per ogni x X risulta
[( )I A]B
k
(I A)
1
x = x
k+1
(I A)
(k+1)
x;
posto z
k
= B
k
(I A)
1
x, si ha allora z
k
D(A) e, per k , z
k

B(I A)
1
x e [()I A]z
k
x. Poiche ()I A `e chiuso, si ottiene
che B(I A)
1
x D(A) e
[( )I A]B(I A)
1
)x = x x X.
Proposizione 11.1.6 Sia X uno spazio di Banach. Se A /(X) e se
[[ > |A|
/(X)
, allora (A).
Dimostrazione Se [[ > |A|
/(X)
, si verica che loperatore B =
1

n=0
A
n

n
inverte I A.
Esempi 11.1.7 (1) Poniamo X = C[a, b], D(A) = X, (Af)(t) = tf(t) per
ogni t [a, b]. Allora A /(X) e |A|
/(X)
= max[a[, [b[. Poiche
[(I A)f](t) 0 ( t)f(t) 0 f(t) 0,
si ha che I A `e iniettivo per ogni C, e quindi P

(A) = . Poi, se
/ [a, b], allora per ogni g X la funzione f(t) =
g(t)
t
appartiene a X e
verica la relazione f = (I A)
1
g. Inoltre
|f|

sup
t[a,b]
1
[ t[
|g|

,
cosicche [a, b] (A). Viceversa, se [a, b] si ha
R(I A) = g X : g() = 0 e g `e derivabile nel punto ,
e questo insieme non `e denso in X. Pertanto C

(A) = e R

(A) = (A) =
[a, b].
(2) Sia X = C[a, b], D(A) = C
1
[a, b] e A =
d
dt
. Poiche f(t) f
t
(t) 0
se e solo se f(t) = c e
t
, si ha che ogni C `e autovalore per A. Pertanto
(A) = P

(A) = C.
301
(3) Poniamo stavolta X = C[a, b], D(A) = f C
1
[a, b] : f(a) = 0, A =
d
dt
: lequazione f f
t
= g ha lunica soluzione f(t) = e
t
_
t
a
e

g()d;
di conseguenza (I A)
1
`e denito su tutto X ed `e continuo. Pertanto
(A) = .
(4) Sia ancora X = C[a, b], con D(A) = f C
1
[a, b] : f(a) = f(b) = 0
e A =
d
dt
. Si vede subito che lo spettro puntuale `e vuoto. Daltra parte
lequazione f f
t
= g ha lunica soluzione f(t) = e
t
_
t
a
e

g()d se e
solo se g verica la condizione di compatibilit`a
_
b
a
e

g()d = 0. Dunque
limmagine R(I A) non `e densa in X e pertanto (A) = R

(A) = C.
(5) Consideriamo ancora una volta A =
d
dt
nello spazio X = C[a, b], con
dominio D(A) = f C
1
[a, b] : f(a) = Kf(b), essendo K un ssato
numero reale non nullo. Lequazione f f
t
= 0 ha soluzione non nulla per
=
log [K[+2ki
ab
, k Z, per cui P

(A) `e dato dallinsieme di questi punti. Gli


altri punti di C sono in (A) in quanto risulta per ogni g X
[(I A)
1
g](t) =
Ke
b
_
b
a
e

g()d
e
a
Ke
b
e
t
e
t
_
t
a
e

g()d.
In denitiva, (A) = P

(A) =
_
log [K[+2ki
ab
_
kZ
.
(6) Sia X =
2
e A /(
2
) denito da (Ax)
n
= x
n+1
. Lo spettro puntuale `e
C : [[ < 1, mentre lo spettro continuo `e C : [[ = 1 e lo spettro
residuo `e vuoto (si vedano la proposizione 11.1.6 e lesercizio 11.1.5).
Esercizi 11.1
1. (Complessicazione di uno spazio normato reale) Sia X uno spazio
normato reale. Su X
2
= X X consideriamo le operazioni di somma
e di prodotto per scalari complessi cos` denite:
(x, y) + (u, v) = (x +u, y +v), ( +i)(x, y) = (x y, x +y).
(i) Si denisca x +iy = (x, y) e si verichi che
(x +iy) + (u +iv) = (x +u) +i(y +v) x, y, u, v X,
(+i)(x+iy) = (xy) +i(x+y) , R, x, y X.
302
(ii) Posto X
C
= x + iy : x, y X, si verichi che X
C
`e uno spazio
vettoriale complesso, che
|x +iy|
X
C
= sup
[0,2[
|x cos +y sin |
X
`e una norma su X
C
e che X si immerge isometricamente in X
C
.
(iii) Si mostri che, in generale, la funzione p(x + iy) = |x|
X
+ |y|
X
non `e una norma su X
C
.
2. Sia X uno spazio di Banach di dimensione nita. Se T : X X `e
lineare, si provi che (T) ,= , e che quando X `e reale pu`o capitare che
(T) R = .
3. Sia X uno spazio di Banach e sia A : D(A) X X un operatore
lineare chiuso. Si provi lidentit`a del risolvente
R(, A) R(, A) = ( )R(, A)R(, A) , (A).
4. Sia X uno spazio di Banach e sia T /(X). Si provi che R(, T)
`e unapplicazione da (T) in /(X) olomorfa e si calcoli
d
d
R(, T). Se
ne deduca che se T /(X) allora (T) ,= .
5. Sia X uno spazio di Banach e sia A /(X). Se appartiene alla
frontiera di (A), si provi che P

(A) C

(A).
6. Sia X uno spazio di Banach e sia A /(X). Dimostrare che:
(i) se (A), allora
n
(A
n
) per ogni n N;
(ii) se [[ > liminf
n
|A
n
|
1/n
/(X)
allora (A).
(iii) esiste il limite lim
n
|A
n
|
1/n
/(X)
. Tale limite si chiama raggio
spettrale di A e si indica con r

(A).
[Traccia: per (iii), posto r = liminf
n
|A
n
|
1/n
/(X)
e ssato > 0, si
scelga m N
+
tale che |A
m
|
1/m
/(X)
]r , r + [; si osservi che per
n > m risulta, scelto k N
+
in modo che km < n (k + 1)m:
|A
n
|
1
n
/(X)
|A
km
|
1
n
/(X)
|A
nkm
|
1
n
/(X)

_
|A
m
|
1
m
/(X)
_
km
n
|A|
nkm
n
/(X)
.
303
Si deduca che
|A
n
|
1
n
/(X)
(r +)
km
n
|A|
m
n
/(X)
n > m;
essendo 1
m
n

km
n
< 1, si concluda che limsup
n
|A
n
|
1/n
/(X)
(r +).]
7. Sia A : D(A) X X un operatore lineare chiuso nello spazio di
Banach X, tale che 0 (A). Si provi che se ,= 0 si ha (A) se
e solo se
1
(A
1
).
8. Siano X =
2
, D(A) = x X :

n=1
n
2
[x
n
[
2
< , (Ax)
n
= nx
n
per ogni n N. Loperatore A `e chiuso? Laggiunto A

esiste? Si
determini (A).
9. Sia T :
2

2
loperatore denito da
(Tx)
n
= x
n+2
n N, x
2
.
(i) Si calcoli la norma di T.
(ii) Si scriva loperatore aggiunto T

.
(iii) Si trovino gli autovalori di T.
10. Sia X uno spazio di Banach e sia T /(X) unisometria. Si provi che
P

(T) C : [[ = 1.
11. Sia H uno spazio di Hilbert e sia T /(H) un operatore unitario (cio`e
tale che TT

= T

T = I). Si provi che (T) C : [[ = 1.


12. Sia H uno spazio di Hilbert e sia T /(H) autoaggiunto. Si provi che
R

(T) = .
13. Sia H uno spazio di Hilbert e sia T /(H). Si provi che (T) se
e solo se (T

).
11.2 Operatori compatti
Mentre per gli operatori lineari su spazi di dimensione nita si pu`o formulare
una teoria esauriente, lo studio degli operatori lineari su spazi di dimensione
304
innita costituisce un problema vastissimo e complicato. Tuttavia, alcune no-
tevoli classi di operatori possono essere descritte in maniera sucientemente
completa. Una delle pi` u importanti `e la classe degli operatori compatti: essi
infatti da una parte godono di propriet`a analoghe a quelle degli operatori a
immagine nito-dimensionale, e quindi se ne pu`o fornire una descrizione ac-
curata, e dallaltra giocano un ruolo fondamentale in numerose applicazioni,
e in particolare nella teoria delle equazioni integrali.
Denizione 11.2.1 Siano X e Y spazi normati. Un operatore A : X
Y si dice compatto, o completamente continuo, se `e continuo e trasforma
insiemi limitati di X in insiemi relativamente compatti di Y .
A noi interesseranno esclusivamente gli operatori compatti lineari. Dalla
denizione segue che gli operatori compatti sono continui; si noti che il vice-
versa `e falso se dimY = : lidentit`a I : Y Y non `e compatta. Notia-
mo anche che, evidentemente, per ottenere la compattezza di un operatore
A /(X, Y ) basta mostrare che limmagine della palla unitaria di X `e
relativamente compatta in Y .
Esempi 11.2.2 (1) Se dimY < , ogni operatore A /(X, Y ) `e compat-
to.
(2) Sia A :
2

2
denito da (Ax)
n
=
xn
n+1
per ogni n N. Limmagine
della palla unitaria `e contenuta nel cubo di Hilbert (esercizio 10.7.6), il quale
`e un sottoinsieme compatto di
2
: ne segue che A `e un operatore compatto.
(3) Se M `e un sottospazio chiuso di uno spazio di Hilbert H, la proiezione
ortogonale P
M
`e un operatore compatto se e solo se M ha dimensione nita.
(4) Sia K una funzione di due variabili continua in [a, b] [a, b] e sia A :
C[a, b] C[a, b] loperatore integrale denito da Af(t) =
_
b
a
K(t, s)f(s)ds
per ogni t [a, b]. Utilizzando il teorema di Ascoli-Arzel`a (teorema 10.7.1)
non `e dicile vericare che A `e un operatore compatto.
(5) Un caso particolare dellesempio precedente si ha quando K(t, s) = 0
per t < s: in questo caso si ha Af(t) =
_
t
a
K(t, s)f(s)ds e A viene chiamato
operatore integrale di Volterra. Per tale operatore valgono le stime, vericabili
per induzione,
|A
n
|
/(C[a,b])
|K|
n

(b a)
n
n!
n N;
305
dunque la serie

n=0
[[
n1
|A
n
|
/(C[a,b])
`e convergente per ogni C0,
e di conseguenza la serie

n=0

n1
A
n
denisce un operatore che, come
si verica facilmente, coincide con R(, A). In denitiva, per ogni ssata
g C[a, b] lequazione integrale di Volterra
f(t)
_
t
a
K(t, s)f(s)ds = g(t), t [a, b],
`e univocamente risolubile in C[a, b] qualunque sia C 0. Al contrario,
come si vedr`a in seguito, si ha 0 (A).
Vediamo adesso le principali propriet`a degli operatori compatti fra due spazi
normati X e Y .
`
E evidente dalla denizione che essi formano un sottospazio
di /(X, Y ); il risultato che segue mostra che tale sottospazio `e chiuso allorche
Y `e completo.
Proposizione 11.2.3 Sia X uno spazio normato e sia Y uno spazio di Ba-
nach. Sia A
n

nN
+ una successione di operatori compatti da X a Y tale
che A
n
A in /(X, Y ): allora A `e un operatore compatto.
Dimostrazione Sia x
n
X tale che |x
n
|
X
K per ogni n N: dob-
biamo provare che Ax
n
ha una sottosuccessione convergente in Y . Poiche
A
1
`e compatto, esistono un elemento y
1
Y e una prima sottosuccessione
x
(1)
n
x
n
tale che A
1
x
(1)
n
y
1
in Y per n . Poiche A
2
`e com-
patto, esistono un altro elemento y
2
Y e una seconda sottosuccessione
x
(2)
n
x
(1)
n
tale che A
i
x
(2)
n
y
i
in Y per n , i = 1, 2. Iterando il
ragionamento, per ogni k N
+
, essendo A
k
compatto, esisteranno un k-simo
elemento y
k
Y e una k-sima sottosuccessione x
(k)
n
x
(k1)
n
tale che
A
i
x
(k)
n
y
i
in Y per n , i = 1, 2, . . . , k.
Consideriamo adesso la successione x
(n)
n
, la quale, salvo che per i suoi primi
k termini, `e estratta da x
(k)
n
e in particolare `e una sottosuccessione della
successione originaria x
n
: per essa risulta A
i
x
(n)
n
y
i
in Y per n
qualunque sia i N
+
. Fissiamo dunque > 0: esiste k

N
+
tale che
|A A
k
|
/(X,Y )
< . Allora, dato che A
k
x
(n)
n
y
k
, esiste

N tale che
|A
k
(x
(n)
n
x
(m)
m
)|
Y
< per ogni n, m

. Ne segue, per ogni n, m

,
|Ax
(n)
n
Ax
(m)
m
|
Y
= |Ax
(n)
n
A
k
x
(n)
n
|
Y
+
+|A
k
(x
(n)
n
x
(m)
m
)|
Y
+|A
k
x
(m)
m
Ax
(m)
m
|
Y
<
< 2K +.
306
Dunque la successione Ax
(n)
n
`e di Cauchy in Y . Poiche Y `e completo, essa
`e convergente in Y .
Nella proposizione precedente la completezza di Y `e essenziale, come mostra
il seguente
Esempio 11.2.4 Sia B : c
0

2
denito da (Bx)
n
=
xn
n+1
per ogni n N.
Poniamo X = (c
0
, | |

), Y = (R(B), | |

2), e consideriamo gli operatori


B
n
/(X, Y ) cos` deniti:
(B
n
x)
k
=
_
x
k
k+1
se k n,
0 se k > n;
i B
n
, avendo immagine nito-dimensionale, sono compatti. Si ha B
n
B in
/(X, Y ) per n ; daltra parte, considerando la successione y
(n)
X
data da y
(n)
k
=
_
1 se k n
0 se k > n,
essa `e chiaramente limitata in X mentre,
essendo (By
(n)
)
k
=
_
1/k se k n
0 se k > n,
si ha By
(n)

1
k

k
N
+
/ Y . Ci`o
prova che By
(n)
`e una successione di Cauchy in Y che non converge in
Y (e in particolare Y non `e completo), cosicche By
(n)
`e un insieme non
relativamente compatto in Y . In particolare B : X Y non `e un operatore
compatto. Si osservi tuttavia che B : c
0

2
`e compatto.
Dalla proposizione 11.2.3 segue subito:
Corollario 11.2.5 Sia X uno spazio normato e sia Y uno spazio di Banach.
Allora gli operatori che sono limiti in /(X, Y ) di successioni di operatori ad
immagine nito-dimensionale sono compatti.
Il viceversa del corollario precedente `e falso in generale, ma `e vero, come
vedremo, se X e Y coincidono con uno stesso spazio di Hilbert H.
Proposizione 11.2.6 Siano X, Y, Z spazi normati, siano A /(X, Y ) e
B /(Y, Z). Se uno dei due operatori `e compatto, allora B A `e compatto.
Dimostrazione Immediata conseguenza della denizione 11.2.1.
Proposizione 11.2.7 Sia X uno spazio normato e sia A /(X) un opera-
tore compatto e iniettivo. Allora si ha 0 (A) se e solo se X ha dimensione
nita.
307
Dimostrazione Se X ha dimensione nita, gli operatori lineari da X in
se sono tutti continui e compatti, e se sono iniettivi sono anche surgettivi
con inverso continuo. Quindi 0 appartiene al loro risolvente. Viceversa, sia
A /(X) compatto e iniettivo e sia 0 (A): allora A `e anche surgettivo
e A
1
/(X). Dunque I = A
1
A `e un operatore compatto in virt` u della
proposizione precedente: pertanto X ha dimensione nita.
Corollario 11.2.8 Sia X uno spazio normato di dimensione innita. Se
A /(X) `e un operatore compatto, allora 0 (A).
Proposizione 11.2.9 Siano X e Y spazi normati e sia A /(X, Y ). Se
A `e compatto, allora A

`e compatto; viceversa, se A

`e compatto e Y `e uno
spazio di Banach, allora A `e compatto.
Dimostrazione (=) Per provare che A

`e compatto dimostreremo che se


W `e un sottoinsieme limitato di Y

allora A

(W) `e totalmente limitato in X

:
dato che X

`e completo, ci`o implicher`a che A

(W) `e relativamente compatto


in X

, che `e quanto basta. Sia > 0: posto S = x X : |x|


X
= 1, essendo
A compatto linsieme A(S) `e totalmente limitato in Y . Quindi esistono
x
1
, . . . , x
n
S tali che
min
1in
|Ax Ax
i
|
Y
< x S.
Deniamo loperatore B : Y

C
n
ponendo Bg = (g(Ax
1
), . . . , g(Ax
n
)) per
ogni g Y

. Allora
[Bg[
2
n
=
n

i=1
[g(Ax
i
)[
2
n|g|
2
Y
|A|
2
/(X,Y )
,
cosicche B /(Y

, C
n
). Dato che B ha immagine nito-dimensionale, lin-
sieme B(W) `e totalmente limitato in C
n
: quindi esistono g
1
, . . . , g
m
W tali
che
min
1jm
[Bg
j
Bg[
n
< g W.
Dunque, ssata g W, `e possibile scegliere un indice j
0
fra 1 e m (dipendente
da g) in modo che
[g(Ax
i
) g
j
0
(Ax
i
)[ < , i = 1, . . . , n.
308
Vogliamo adesso valutare la quantit`a
|A

g
j
0
A

g|
X
= sup
xS
[g
j
0
(Ax) g(Ax)[.
Per ogni ssato x S, sia i
0
lindice fra 1 e n (dipendente da x) tale che
|Ax Ax
i
0
|
Y
< ; allora si ha
[g
j
0
(Ax) g(Ax)[
[g
j
0
(Ax) g
j
0
(Ax
i
0
)[ +[g
j
0
(Ax
i
0
) g(Ax
i
0
)[ +[g(Ax
i
0
) g(Ax)[
(|g
j
0
|
Y
+|g|
Y
) +
_
1 + 2 sup
gW
|g|
Y

_
.
Da questa relazione, per larbitrariet`a di x S, segue che
min
1jm
|A

g
j
A

g|
X
|A

g
j
0
A

g|
X

_
1 + 2 sup
gW
|g|
Y

_
g W.
Ci` o prova che A

(W) `e totalmente limitato in X

.
(=) Largomentazione `e del tutto analoga.
Proposizione 11.2.10 Siano X e Y spazi normati e sia A /(X, Y ) un
operatore compatto. Allora limmagine R(A) `e separabile; inoltre R(A) `e uno
spazio normato completo se e solo se ha dimensione nita.
Dimostrazione Proviamo la separabilit`a. Dato che R(A) =

n=1
A(nB),
ove B `e la palla unitaria chiusa di X, basta mostrare che A(B) `e separabile.
Poiche A`e compatto, linsieme A(B) `e relativamente compatto in Y e dunque
totalmente limitato: quindi per ogni m N
+
esistono y
m
1
, . . . , y
m
pm
A(B)
tali che
inf
1ipm
|y y
m
i
|
Y
<
1
m
y A(B).
Ne segue che y
m
i
: 1 i p
m
, m N
+
`e un sottoinsieme numerabile denso
in A(B).
Dimostriamo laltro enunciato. Ovviamente, se la dimensione di R(A) `e
nita, allora R(A) `e completo. Viceversa, supponiamo che Z = R(A) sia
completo. Siccome A : X Z `e compatto, anche A

: Z

`e compatto
(proposizione 11.2.9). Inoltre A

`e iniettivo: infatti se f Z

e A

f = 0
allora f(Ax) = 0 per ogni x X, ovvero, per la surgettivit`a di A : X Z,
fy = 0 per ogni y Z: pertanto f = 0. In denitiva, A

: Z

R(A

) `e
309
bigettivo. Proviamo che (A

)
1
: R(A

) Z

`e continuo: se cos` non fosse,


esisterebbe f
n
Z

tale che
lim
n
|A

f
n
|
X
= 0, lim
n
|f
n
|
Z
= +.
Quindi (A

f
n
)x 0 in C per ogni x X, cio`e f
n
y 0 in C per ogni y Z.
Essendo Z completo, per il teorema di Banach-Steinhaus si conclude che
f
n
`e limitata in Z

, e ci`o `e assurdo. Dunque A

: Z

R(A

) `e compatto,
bigettivo e ha inverso continuo. Dalla proposizione 11.2.7 si ottiene allora
che Z

ha dimensione nita e inne che dimZ = dimZ

< .
Esercizi 11.2
1. Siano X, Y spazi normati e sia A
n
/(X, Y ) una successione di
operatori compatti tale che A
n
x Ax in Y per n . Loperatore
A `e necessariamente compatto?
`
E continuo?
2. Siano X, Y spazi di Banach con X riessivo, e sia A /(X, Y ). Si
provi che A `e compatto se e solo se Ax
n
Ax in Y per ogni x
n
x
in X; si provi poi che quando X non `e riessivo tale condizione non `e
suciente per la compattezza di A (ma `e sempre necessaria).
3. Sia X uno spazio di Banach. Se A /(X) `e bigettivo, si provi che A
`e compatto se e solo se dimX < .
4. Sia Tf(x) = x
2
f(x) per f L
2
(a, b).
(i) Si provi che T /(L
2
(a, b)) e se ne calcoli la norma.
(ii) Si mostri che T non ha autovalori e che (T) = [0, |T|].
5. Fissata g C[a, b], sia A : C[a, b] C[a, b] denito da Af(x) =
f(x)g(x).
(i) Si calcoli |A| e si provi che se g ,= 0 allora A non `e compatto.
(ii) Per quali g loperatore A ha autovalori?
(iii) Se A ha autovalori, si provi che essi sono al pi` u uninnit`a nume-
rabile.
310
6. Sia A loperatore dellesempio 11.2.2 (2). Si provi che (I A)
1
,
quando `e denito, `e un operatore compatto, e se ne determini lo spettro.
Si analizzi poi la situazione per gli operatori degli esempi 11.2.2 (3) e
11.2.2 (4).
7. Siano X, Y spazi di Banach e siano A, B /(X, Y ) con B compatto.
Si provi che se R(A) R(B), allora anche A `e compatto.
8. Sia X = C[0, 1] e poniamo Tf(t) =
_
t
0
f(s)

s
ds.
(i) Si calcoli |T|
/(X)
;
(ii) Si provi che T `e compatto e se ne determini lo spettro;
(iii) per (T) si scriva esplicitamente loperatore R(, T).
[Traccia: per ,= 0 si consideri lequazione f Tf = g supponendo
dapprima g C
1
[0, 1]: si osservi che se f `e soluzione allora f C
1
.
Derivando, si ottiene lequazione f
t
f = g
t
, la cui soluzione (metodo
di variazione delle costanti seguito da una integrazione per parti) `e
f(t) =
1

g(t) +
1

2
_
t
0
e
(ts)/
g(s)ds. Inne si noti che tale espressione ha
senso per ogni g C[0, 1]. . . ]
9. Sia A loperatore integrale dellesempio 10.4.6 (2). Si provi che A :
L
2
(a.b) L
2
(a, b) `e compatto.
11.3 Operatori compatti in spazi di Hilbert
Nel caso di operatori compatti da uno spazio di Hilbert in se, la teoria diventa
pi` u interessante e completa. Per cominciare, analizziamo il comportamento
di un operatore compatto rispetto alla convergenza debole.
Proposizione 11.3.1 Sia H uno spazio di Hilbert e sia A /(H). Allora
A `e compatto se e solo se per ogni x
n
H tale che x
n
x in H risulta
Ax
n
Ax in H.
Dimostrazione (=) Sia K H un insieme limitato e sia x
n
una suc-
cessione contenuta in K. Per il corollario 10.7.3 esiste una sottosuccessione
x
n
k
tale che x
n
k
x H. Per ipotesi, ci`o implica Ax
n
k
Ax, il che mo-
stra che A(K) `e relativamente compatto. Dunque loperatore A `e compatto.
311
(=) Viceversa, sia A compatto e sia x
n
una successione tale che x
n
x
in H. Allora per lesercizio 10.6.7 si ha Ax
n
Ax in H. Se, per as-
surdo, |Ax
n
Ax|
H
non tendesse a 0, esisterebbe una sottosuccessione
x
n
k
x
n
tale che |Ax
n
k
Ax|
H

0
> 0 per ogni k N. Daltra
parte, per la limitatezza di x
n
k
e la compattezza di A, sarebbe possibile
estrarre unulteriore sottosuccessione x
t
n
k
x
n
k
tale che Ax
t
n
k
y H.
A maggior ragione allora Ax
t
n
k
y, e per lunicit`a del limite debole (eserci-
zio 10.6.5) si deduce che y = Ax, e ci`o `e assurdo. Pertanto Ax
n
Ax in H.
Proposizione 11.3.2 Sia H uno spazio di Hilbert e sia A /(H). Allora
A `e compatto se e solo se per ogni x
n
H tale che x
n
x in H risulta
(Ax
n
, x
n
)
H
(Ax, x)
H
.
Dimostrazione (=) Sia A compatto e sia x
n
x in H. Per avere la tesi
basta osservare che
[(Ax
n
, x
n
)
H
(Ax, x)
H
[ [(Ax
n
Ax, x
n
)
H
[ +[(Ax, x
n
x)
H
[
|Ax
n
Ax|
H
|x
n
|
H
+[(Ax, x
n
x)
H
[
e che lultimo membro `e innitesimo per n in virt` u della limitatezza di
|x
n
|.
(=) Viceversa, osserviamo anzitutto che se z
n
0 e y
n
0 in H, allora si
ha anche z
n
+y
n
0 per ogni C: quindi, per ipotesi,
(Az
n
, z
n
)
H
0, (Ay
n
, y
n
)
H
0, (A(z
n
+y
n
), z
n
+y
n
)
H
0.
Scegliendo = 1 e = i, per dierenza si ottiene che (Az
n
, y
n
)
H
0.
Ci` o premesso, sia x
n
x in H e sia z
n
= x
n
x, cosicche z
n
0. Poiche, per
lesercizio 10.6.7, Az
n
0, scegliendo y
n
= Az
n
largomentazione precedente
mostra che |Az
n
|
H
0, ossia Ax
n
Ax. La proposizione 11.3.1 implica
allora che A `e compatto.
Analizziamo ora la struttura dello spettro degli operatori compatti e autoag-
giunti in uno spazio di Hilbert. Il primo enunciato estende un noto risultato
algebrico valido per le matrici hermitiane.
Proposizione 11.3.3 Sia H uno spazio di Hilbert e sia A /(H) un
operatore autoaggiunto. Allora:
(i) gli autovalori di A sono reali;
312
(ii) autovettori relativi ad autovalori distinti sono fra loro ortogonali.
Dimostrazione (i) Se Ax = x con x ,= 0, allora
|x|
2
H
= (Ax, x)
H
= (x, Ax)
H
= |x|
2
H
,
da cui R.
(ii) Se Ax = x e Ax
t
=
t
x
t
con x, x
t
,= 0 e ,=
t
, allora a causa di (i) si
ha
(x, x
t
)
H
= (Ax, x
t
)
H
= (x, Ax
t
)
H
=
t
(x, x
t
)
H
=
t
(x, x
t
)
H
,
da cui x x
t
.
Proposizione 11.3.4 Sia H uno spazio di Hilbert, sia A /(H) un ope-
ratore compatto e autoaggiunto e sia Q(x) = (Ax, x)
H
la forma quadratica
associata ad A; poniamo
m = inf
|x|
H
=1
Q(x), M = sup
|x|
H
=1
Q(x).
Allora:
(i) si ha < m M < + e |A|
/(H)
= max[m[, [M[;
(ii) se m < 0 allora m `e autovalore di A, se M > 0 allora M `e autovalore
di A.
Dimostrazione (i) Anzitutto, evidentemente, Q(x) `e reale per ogni x H,
si ha m M e
max[m[, [M[ sup
|x|
H
=1
[Q(x)[ |A|
/(H)
< .
Se A = 0 allora, banalmente, 0 = |A|
/(H)
= max[m[, [M[; supponiamo
dunque A ,= 0 e poniamo
N = max[m[, [M[ = sup
|x|
H
=1
[Q(x)[ :
allora, come si `e osservato, 0 < N |A|
/(H)
. Daltra parte, essendo A
autoaggiunto,
(A(x +y), x +y)
H
(A(x y), x y)
H
= 4Re(Ax, y)
H
,
313
da cui, grazie allidentit`a del parallelogrammo (proposizione 7.2.9), otteniamo
per ogni x, y H
4Re(Ax, y)
H
[(A(x +y), x +y)
H
[ +[(A(x y), x y)
H
[
N
_
|x +y|
2
H
+|x y|
2
H

= 2N
_
|x|
2
H
+|y|
2
H

.
Per ogni x H tale che |x|
H
= 1 e Ax ,= 0, scegliendo y =
Ax
|Ax|
H
si ricava
|Ax|
H
N: dunque |A|
/(H)
N.
(ii) Sia m < 0 e sia x
n
H tale che |x
n
|
H
= 1 e (Ax
n
, x
n
)
H
m: allora
esiste una sottosuccessione x
n
k
x
n
tale che x
n
k
x, con x H; per
la proposizione 10.6.2 risulta |x|
H
1. Poiche A `e compatto, in virt` u della
proposizione 11.3.2 otteniamo
(Ax, x)
H
= lim
k
(Ax
n
k
, x
n
k
)
H
= m < 0,
e in particolare x ,= 0.
Osserviamo ora che si ha necessariamente |x|
H
= 1: se infatti fosse 0 <
|x|
H
< 1, avremmo (Ax, x)
H
= m < m|x|
2
H
, da cui
_
A
x
|x|
H
,
x
|x|
H
_
H
< m
il che `e assurdo.
Consideriamo allora loperatore AmI: esso `e autoaggiunto e positivo, ossia
verica
((A mI)x, x)
H
= 0, ((A mI)z, z)
H
0 z H.
Per lesercizio 8.2.7, si ha
[((A mI)x, z)
H
[
2
((A mI)x, x)
H
((A mI)z, z)
H
= 0 z H,
da cui Ax = mx. Essendo x ,= 0, il numero m `e autovalore di A con
autovettore x. Discorso analogo se M > 0.
Osservazioni 11.3.5 (1) Se i due numeri m e M hanno lo stesso segno,
non `e detto che entrambi siano autovalori per A: ad esempio, in H =
2
per
loperatore (Ax)
n
= (1 +
1
n
)x
n
, n N
+
, si ha M = |A|
/(H)
= 2 e m = 1, ma
Ax = x se e solo se x = 0.
314
(2) Dalla proposizione 11.3.4 (i) segue facilmente, analizzando tutti i casi
possibili, che almeno uno fra i due numeri |A|
/(H)
`e autovalore di A.
Siamo ora in grado di dimostrare il seguente teorema, che `e unestensione
della propriet`a di diagonalizzazione delle matrici hermitiane in C
N
.
Teorema 11.3.6 (spettrale) Sia A /(H) un operatore compatto e au-
toaggiunto nello spazio di Hilbert H.
(i) Se dimR(A) = n < , allora A possiede n autovalori reali
1
, . . . ,
n
diversi da 0 (non necessariamente distinti), pi` u lautovalore 0 quando
dimH > n, ed esiste un sistema ortonormale x
1
, . . . , x
n
di autovet-
tori relativi ai
k
, tale che
Ax =
n

k=1

k
(x, x
k
)
H
x
k
x H;
inoltre
(A) =
_

k

1kn
se dimH = n,

1kn
0 se dimH > n.
(ii) Se dimR(A) = , allora A possiede uninnit`a numerabile di autovalori
reali
k

kN
+, diversi da 0 (non tutti necessariamente distinti), tali
che [
k
[ [
k+1
[ per ogni k N
+
e
k
0 per k , ed esiste un
sistema ortonormale x
k

kN
+ di autovettori relativi ai
k
, tale che
Ax =

k=1

k
(x, x
k
)
H
x
k
x H;
inoltre
(A) =
k

kN
+ 0.
In particolare, ogni autovalore di A ha molteplicit`a nita. Inne, il si-
stema ortonormale x
k
`e completo in H se e solo se 0 non `e autovalore
di A.
Dimostrazione Se A = 0 tutti gli enunciati sono banalmente veri: si ha
n = 0 e lunico autovalore di A `e 0. Supporremo dunque A ,= 0. Ricordando
losservazione 11.3.5 (2), sia
1
R un autovalore di A con [
1
[ = |A|
/(H)
e
315
sia x
1
un corrispondente autovettore di norma unitaria. Detto M
1
il sotto-
spazio generato da x
1
, notiamo che il sottospazio M

1
`e invariante per A, in
quanto
y M

1
= (Ay, x
1
)
H
= (y, Ax
1
)
H
=
1
(y, x
1
)
H
= 0 = Ay M

1
.
Consideriamo allora la restrizione A[
M

1
: essa `e un operatore compatto e
autoaggiunto nello spazio di Hilbert M

1
. In virt` u dellosservazione 11.3.5
(2), esiste un autovalore
2
R con [
2
[ = |A|
/(M

1
)
[
1
[; scelto un
autovettore corrispondente x
2
di norma unitaria, consideriamo il sottospazio
M
2
generato da M
1
e da x
2
: esso `e ancora invariante per A e dunque la
restrizione A[
M

2
`e un operatore compatto e autoaggiunto nello spazio di
Hilbert M

2
. Iterando questo procedimento si presentano due casi:
(a) dimR(A) < : in questo caso esiste n N
+
tale che A[
M

n
= 0. Se
dimH = n, ci`o signica che M

n
= 0, mentre se dimH > n allora
M

n
= ker A, ossia tale sottospazio `e generato da autovettori relativi
allautovalore 0;
(b) dimR(A) = : in questo caso esiste una successione
k

kN
+ R tale
che
k
`e autovalore non nullo di A e [
k
[ [
k+1
[ per ogni k N
+
.
Si ha inoltre
k
0 per k : infatti i corrispondenti autovettori
x
k
formano un sistema ortonormale e pertanto convergono debolmente
a 0 in H, da cui, essendo A compatto, |Ax
k
|
H
[
k
[ 0 in virt` u della
proposizione 11.3.1.
Da quanto detto segue in particolare che ogni autovalore ha molteplicit`a
nita. Nel caso (a) si ha anche, ovviamente, la formula di rappresentazione
Ax =
n

k=1
(Ax, x
k
)
H
x
k
=
n

k=1
(x, Ax
k
)
H
x
k
=
n

k=1

k
(x, x
k
)
H
x
k
x H.
Proviamo la formula di rappresentazione nel caso (b). Sia x H e poniamo
y
k
= x

k
h=1
(x, x
h
)
H
x
h
. Poiche y
k
M

k
, per denizione dei
k
sar`a
|Ay
k
|
H
[
k+1
[ |y
k
|
H
; ma essendo
|y
k
|
2
H
= |x|
2
H

k

h=1
[(x, x
h
)
H
[
2
|x|
2
H
k N
+
,
316
si ricava |Ay
k
|
H
[
k+1
[ |x|
H
0 per k . Pertanto, osservando che
Ay
k
= Ax
k

h=1
(x, x
h
)
H
Ax
h
= Ax
k

h=1

h
(x, x
h
)
H
x
h
,
si conclude che
Ax =

k=1

k
(x, x
k
)
H
x
k
x H.
Proviamo inne le asserzioni relative allo spettro di A. Mostriamo anzitutto
che A non ha altri autovalori ,= 0 distinti dai
k
: se infatti x
0
fosse un
autovettore di norma unitaria relativo a , allora per la proposizione 11.3.3
avremmo
x
0
= Ax
0
=

k
(x
0
, x
k
)
H
x
k
= 0,
da cui x
0
= 0, il che `e assurdo.
Sia ora C 0 distinto dai
k
e proviamo che (A). Non `e escluso
che 0 sia autovalore di A con molteplicit`a qualunque: ricordando lesercizio
10.3.3, dato che A `e autoaggiunto risulta R(A) = (ker A)

. Sia dunque
y H. Lequazione x Ax = y si scrive nel modo seguente:

k
(
k
)(x, x
k
)
H
x
k
+P
ker A
x =

k
(y, x
k
)
H
x
k
+P
ker A
y.
Ne segue
(
k
)(x, x
k
)
H
= (y, x
k
)
H
k,
P
ker A
x = P
ker A
y.
Pertanto lequazione x Ax = y ha lunica soluzione
x =

k
(y, x
k
)
H

k
x
k
+
1

P
ker A
y;
lespressione a secondo membro denisce anche loperatore R(, A). Inoltre,
posto d = min
k
[
k
[ (si noti che d > 0), vale la maggiorazione
|x|
2
H
= |R(, A)y|
2
H
=
=

k
[(y, x
k
)
H
[
2
[
k
[
2
+
|P
ker A
y|
2
H
[[
2

_
1
d
2
+
1
[[
2
_
|y|
2
H
;
317
perci`o (A). Tenuto conto del corollario 11.2.8, si ottiene la tesi.
La rappresentazione fornita dal teorema spettrale caratterizza gli operatori
compatti e autoaggiunti. Vale infatti la seguente
Proposizione 11.3.7 Sia H uno spazio di Hilbert e sia A /(H) denito
da
Ax =

k
(x, x
k
)
H
x
k
x H,
ove la somma `e nita o innita, x
k
`e un sistema ortonormale in H al pi` u
numerabile e
k
`e una famiglia di numeri reali tali che [
k
[ [
k+1
[ e

k
0. Allora A `e un operatore compatto e autoaggiunto, i
k
sono i suoi
autovalori non nulli e gli x
k
sono i corrispondenti autovettori.
Dimostrazione Si verica immediatamente che (Ax, y)
H
= (x, Ay)
H
per
ogni x, y H, cosicche A `e autoaggiunto.
Proviamo che A `e compatto: sia y
n
H una successione tale che y
n

y H. Allora
A(y
n
y) =

k
(y
n
y, x
k
)
H
x
k
.
Poiche
k
0, per ogni > 0 esiste N
+
tale che [
k
[ < per ogni k > .
Daltra parte si ha lim
n
(y
n
y, x
k
)
H
= 0 per k = 1, 2, . . . , . Perci`o,
grazie allortonormalit`a degli x
k
e alla disuguaglianza di Bessel (proposizione
8.3.6), si ha
limsup
n
|A(y
n
y)|
2
H

limsup
n

k=1
[
k
[
2
[(y
n
y, x
k
)
H
[
2
+ limsup
n

k>

2
[(y
n
y, x
k
)
H
[
2

0 +
2
sup
n
|y
n
y|
2
H
,
e per larbitrariet`a di otteniamo Ay
n
Ay. Dalla proposizione 11.3.1 se-
gue la tesi.
Come mostra la proposizione precedente, la rappresentazione fornita dal teo-
rema spettrale non `e vera per gli operatori che sono compatti ma non au-
toaggiunti, nemmeno in dimensione nita: ad esempio, come si sa, non tutte
le matrici N N possono essere diagonalizzate. Anche la propriet`a di posse-
dere almeno un autovalore non sussiste in generale per gli operatori soltanto
318
compatti, come mostra lesempio che segue; tuttavia essa `e sempre vera in
dimensione nita, dato che ogni matrice N N ha autovalori.
Esempio 11.3.8 Sia A /(
2
) denito da
(Ax)
n
=
_
_
_
0 se n = 0
x
n1
n
se n > 0.
Si vede facilmente che A `e compatto e che non possiede autovalori. Chiara-
mente 0 (A) poiche A `e compatto; in realt`a lo spettro di questo operatore
`e costituito dal solo punto 0. Infatti si verica per induzione che
(A
m
y)
n
=
_
_
_
0 se n < m
y
nm
n(n 1) . . . (n m+ 1)
se n m,
cosicche
|A
m
y|
2
H
=

n=m
[y
nm
[
2
[n(n 1) . . . (n m+ 1)]
2

1
[m!]
2
|y|
2
H
y
2
,
ossia |A
m
|
/(
2
)

1
m!
per ogni m N, il che ci dice che A ha raggio spettrale
nullo:
r

(A) = lim
m
|A
m
|
1/m
/(
2
)
= 0.
Ricordando lesercizio 11.1.6 si conclude che (A) = 0.
Terminiamo il paragrafo con unaltra caratterizzazione degli operatori com-
patti.
Teorema 11.3.9 Sia H uno spazio di Hilbert e sia A /(H). Allora A `e
compatto se e solo se esiste una successione di operatori A
n
/(H), tali
che dimR(A
n
) < per ogni n N e A
n
A in /(H).
Dimostrazione (=) La tesi segue dallesempio 11.2.2 (1) e dalla proposi-
zione 11.2.3.
(=) Per ipotesi, detta B la palla unitaria di H, linsieme A(B) `e relativa-
mente compatto in Y : dunque, ssato n N
+
, esistono y
1
, . . . y
mn
A(B)
tali che
A(B)
mn
_
i=1
B
_
y
i
,
1
n
_
.
319
Sia allora M
n
= [y
1
, . . . , y
mn
]: per ogni n, M
n
`e un sottospazio nito-
dimensionale di H, e se P
n
`e la proiezione ortogonale su M
n
risulta P
n
y
i
= y
i
per i = 1, . . . , m
n
. Quindi per ogni x B si ha, scegliendo y
j
in modo che
Ax B(y
j
, 1/n):
|Ax P
n
Ax|
H
|Ax y
j
|
H
+|y
j
P
n
Ax|
H
<
1
n
+|P
n
(y
j
Ax)|
H
<
2
n
.
Ci` o prova che
|A P
n
A|
calL(H)

2
n
,
da cui la tesi.
Esercizi 11.3
1. Sia T /(
2
) denito per ogni x
2
da (Tx)
n
= n

3
4
x
n
, n N
+
.
Provare che T `e compatto e autoaggiunto e determinarne lo spettro.
2. Sia a
ij
una matrice innita tale che

i,j=1
[a
ij
[
2
< . Posto (Ax)
i
=

j=1
a
ij
x
j
per ogni x
2
, si provi che A /(
2
) e che A `e compatto.
3. Sia

e si denisca (Ax)
n
=
n
x
n
per ogni x
2
. Si verichi che
A /(
2
), si calcoli |A|
/(
2
)
e si provi che A `e compatto se e solo se
c
0
.
4. Sia H uno spazio di Hilbert e sia A /(H) un operatore compatto e
autoaggiunto; posto
m = inf
|x|
H
=1
(Ax, x)
H
, M = sup
|x|
H
=1
(Ax, x)
H
,
si provi che (A) [m, M].
[Traccia: si ricordi che lo spettro `e reale; se ad esempio > M, si
applichi alloperatore strettamente positivo I A lesercizio 10.3.3.]
5. Sia H uno spazio di Hilbert e sia A /(H) un operatore compatto.
Dimostrare che:
(i) se ,= 0 allora R(I A) `e un sottospazio chiuso di H;
(ii) se ,= 0 e (A), allora `e un autovalore di A;
320
(iii) gli autovalori di A non hanno punti daccumulazione diversi da 0;
(iv) (A) `e al pi` u numerabile.
6. Si provi lesercizio precedente nel caso in cui X `e uno spazio di Banach
e A /(X) `e compatto.
Traccia: per sopperire allassenza della nozione di ortogonalit`a, si
utilizzi lesercizio 10.1.11.]
7. Sia H uno spazio di Hilbert non separabile e sia T /(H) compatto e
autoaggiunto. Si provi che 0 `e un autovalore di T.
11.4 Lalternativa di Fredholm
La particolare struttura dello spettro degli operatori compatti in uno spazio
di Hilbert H permette di analizzare in dettaglio la risolubilit`a di equazioni
nellincognita x H della forma
x Ax = y
con y H assegnato e C 0 ssato. Accanto a tale equazione sar`a
utile considerare lequazione omogenea associata
x Ax = 0
nonche le due equazioni aggiunte delle precedenti:
z A

z = w
con w H assegnato, e
z A

z = 0.
Il legame fra queste quattro equazioni `e fornito dal seguente teorema del-
lalternativa:
Teorema 11.4.1 (di Fredholm) Sia H uno spazio di Hilbert, sia A
/(H) un operatore compatto e sia C 0. Allora:
(i) Fissato y H, lequazione x Ax = y ha soluzione se e solo se y
`e ortogonale a ogni soluzione z dellequazione z A

z = 0: in altre
parole, R(I A) = [ker(I A

)]

.
321
(ii) Fissato w H, lequazione z A

z = w ha soluzione se e solo se w
`e ortogonale a ogni soluzione x dellequazione x Ax = 0: in altre
parole, R(I A

) = [ker(I A)]

.
(iii) Lequazione x Ax = y ha soluzione unica per ogni y H se e solo
se lequazione xAx = 0 ha lunica soluzione x = 0, ovvero (A)
se e solo se ker(I A) = 0.
(iv) Lequazione z A

z = w ha soluzione unica per ogni w H se e


solo se lequazione z A

z = 0 ha lunica soluzione z = 0, ovvero


(A

) se e solo se ker(I A

) = 0.
(v) Le equazioni xAx = 0 e zA

z = 0 hanno lo stesso numero (nito)


di soluzioni linearmente indipendenti, ossia
dimker(I A) = dimker(I A

) < .
Dimostrazione Faremo cinque passi successivi (per i primi due si veda anche
lesercizio 10.3.2).
1
o
passo: R(I A) e R(I A

) sono chiusi.
Sia y
n
R(I A) una successione tale che y
n
y H: dobbiamo
provare che y R(I A). Esiste x
n
H tale che x
n
Ax
n
= y
n
; si
pu` o supporre che x
n
[ker(I A)]

, perche altrimenti si prender`a x


t
n
=
x
n
Px
n
, essendo P la proiezione ortogonale su ker(I A). Inoltre si
pu` o supporre x
n
limitata: infatti se esistesse una sottosuccessione (sempre
indicata con x
n
) tale che |x
n
|
H
, avremmo, per la limitatezza di
y
n
,
lim
n
x
n
Ax
n
|x
n
|
H
= 0.
Ma allora, per la limitatezza di
_
xn
|xn|
H
_
e la compattezza di A, passando a
unulteriore sottosuccessione
_
Axn
|xn|
H
_
convergerebbe, per cui anche
_
xn
|xn|
H
_
convergerebbe a un elemento z H. Ovviamente avremmo |z|
H
= 1 e z
Az = 0; ma dato che x
n
[ker(I A)]

, dovrebbe essere z [ker(I A)]

e quindi z = 0: ci`o `e assurdo, e pertanto x


n
`e limitata.
Esiste allora una sottosuccessione x
n
k
tale che Ax
n
k
converge in H, quindi
anche x
n
k
=
1
[y
n
k
Ax
n
k
] converge a un certo elemento x H. Ne segue
y = x Ax, cio`e y R(I A). Pertanto R(I A) `e chiuso. In modo
322
assolutamente analogo si prova che R(I A

) `e chiuso.
2
o
passo: ker(I A) = R(I A

e ker(I A

) = R(I A)

.
Sia z ker(I A): allora
(z, (I A

)x)
H
= ((I A)z, x)
H
= 0 x H,
e quindi z R(I A

. Viceversa, se z R(I A

, allora
((I A)z, x)
H
= (z, (I A

)x)
H
= 0 x H,
da cui (I A)z = 0. In modo del tutto analogo si prova laltra uguaglianza.
3
o
passo: Posto H
k
= R((I A)
k
), esiste j N tale che H
k
= H
j
per ogni
k j.
Ovviamente si ha H = H
0
H
1
H
2
. . ., e gli H
k
sono sottospazi chiusi
di H in virt` u del 1
o
passo. Se fosse H
k
H
k+1
per ogni k N, si troverebbe
un sistema ortonormale x
k
H con x
k
H
k
e x
k
H
k+1
. Allora per
h > k si troverebbe
Ax
h
Ax
k
= x
k
+ [x
h
(I A)x
h
+ (I A)x
k
] = x
k
+y,
dove y = x
h
(I A)x
h
+(I A)x
k
`e un elemento di H

k+1
; ne seguirebbe
|Ax
h
Ax
k
|
2
H
= |x
k
|
2
H
+|y|
2
H
[[
2
,
cosicche da Ax
k
sarebbe impossibile estrarre sottosuccessioni convergenti:
ci`o `e assurdo perche A `e compatto.
4
o
passo: ker(I A) = 0 se e solo se R(I A) = H.
Sia ker(I A) = 0 e sia y H: se y / R(I A), allora y ,= (I A)x
per ogni x H, da cui, per liniettivit`a di I A,
(I A)
k
y (I A)
k+1
x ,= 0 x H, k N,
e ci`o contraddice il 3
o
passo.
5
o
passo: dimker(I A) = dimker(I A

) < .
Se fosse dimker(I A) = +, esisterebbe un sistema ortonormale x
k

kN
contenuto in ker(I A); da Ax
k
= x
k
seguirebbe |Ax
k
Ax
h
|
H
=
[[|x
k
x
h
|
H
= [[

2, per cui Ax
k

kN
sarebbe priva di sottosuccessio-
ni convergenti: assurdo. Analogamente si prova che dimker(I A

) < .
Poniamo ora
= dimker(I A), = dimker(I A

)
323
e proviamo che = . Siano x
1
, . . . , x

e z
1
, . . . , z

sistemi ortonormali
in ker(I A) e in ker(I A

) rispettivamente. Supponiamo per assurdo


che sia < , e poniamo
Sx = (I A)x

k=1
(x, x
k
)
H
z
k
, x H.
Loperatore S `e del tipo I B con B operatore compatto; quindi ad esso `e
applicabile tutto quanto n qui dimostrato. Proviamo che S `e iniettivo: da
Sx = 0 segue
(I A)x =

k=1
(x, x
k
)
H
z
k
:
poiche il primo membro di questa uguaglianza appartiene a R(I A) e il
secondo a ker(I A

), per il 2
o
passo si deduce (I A)x = 0 e (x, x
k
)
H
= 0
per k = 1, 2, . . . , , cio`e x ker(I A)[ker(I A)]

, e in denitiva x = 0.
Applichiamo adesso alloperatore S il 4
o
passo: si ottiene R(S) = H. Per-
tanto esiste y H tale che
z
+1
= Sy = (I A)y

k=1
(y, x
k
)
H
z
k
,
da cui
1 = (z
+1
, z
+1
)
H
= ((I A)y, z
+1
)
H

k=1
(y, x
k
)
H
(z
k
, z
+1
)
H
=
= (y, (I A

)z
+1
)
H
= (y, 0)
H
= 0
il che `e assurdo. Analogamente si mostra che non pu`o essere < . Il
teorema di Fredholm `e dimostrato.
Osservazione 11.4.2 Dal teorema di Fredholm si ricava che se A /(H)
`e compatto e C 0, allora per lequazione
x Ax = y H
vale la seguente alternativa:
o non `e autovalore per A, e allora lequazione ha soluzione unica per
ogni y H,
324
oppure `e autovalore per A, e allora lequazione `e risolubile, non
univocamente, se e solo se y [ker(I A

)]

In altre parole, se ,= 0 allora o `e un punto regolare per A, oppure `e un


autovalore di A (di molteplicit`a nita): questo fatto, nel caso di un operatore
A compatto e autoaggiunto, ci era gi`a noto dal teorema spettrale (teorema
11.3.6).
Torniamo allequazione
x Ax = y H
supponendo stavolta che A sia un operatore compatto e autoaggiunto nello
spazio di Hilbert H. Vogliamo rappresentare le soluzioni x, analogamente a
quanto fatto nel teorema spettrale, esclusivamente in termini degli autovalori
non nulli di A e dei corrispondenti autovettori.
Proposizione 11.4.3 Sia H uno spazio di Hilbert, sia A /(H) compatto
e autoaggiunto, sia
k

kN
+ la successione degli autovalori non nulli di A e
sia x
k

kN
+ il corrispondente sistema ortonormale di autovettori. Allora:
(i) Se ,= 0 non `e autovalore per A, lequazione x Ax = y ha soluzione
unica per ogni y H, data da
x =
1

k=1

k
(y, x
k
)
H

k
x
k
+y
_
.
(ii) Se ,= 0 `e autovalore per A, lequazione x Ax = y ha soluzione se
e solo se y [ker(I A)]

; in tal caso tutte le soluzioni sono della


forma
x =
1

k
,=

k
(y, x
k
)
H

k
x
k
+y
_
+v,
ove v `e un arbitrario elemento di ker(I A), il quale `e un sottospazio
nito-dimensionale di H.
Dimostrazione (i) Dal teorema spettrale segue che lequazione xAx = y
pu` o scriversi nel modo seguente:
x =
1

k=1

k
(x, x
k
)
H
x
k
+y
_
;
325
ne segue

n
(x, x
n
)
H
=

n

[
n
(x, x
n
)
H
+ (y, x
n
)
H
] n N
+
,
da cui

n
(x, x
n
)
H
=

n
(y, x
n
)
H

n
n N
+
e quindi la rappresentazione cercata. Si noti che si tratta della stessa formula
ottenuta nellultima parte della dimostrazione del teorema spettrale (teorema
11.3.6): la dierenza `e che adesso x `e espresso in funzione di y e dei soli
autovettori x
k
, senza far intervenire gli elementi di ker A.
(ii) Sar`a =
s
per un certo s N
+
: per il teorema di Fredholm (teorema
11.4.1) esistono soluzioni se e solo se y ker(
s
I A)]

= ker(
s
I A)]

.
In tal caso per i
n
,=
s
si ha ancora

n
(x, x
n
)
H
=

n
(y, x
n
)
H

n
,
mentre, tenuto conto che y [ker(
s
I A)]

, i coecienti (x, x
n
)
H
relativi
ai
n
=
s
saranno arbitrari. Ne segue la formula cercata.
Il fatto che dimker(
s
I A) < segue dal teorema spettrale.
Esempio 11.4.4 Consideriamo lequazione integrale
f(t)
_
b
a
K(t, s)f(s) ds = h(t), t [a, b],
che `e detta equazione di Fredholm di seconda specie. La funzione K(t, s),
detta nucleo dellequazione, appartiene a L
2
(]a, b[]a, b[), il secondo membro
h `e una funzione assegnata in L
2
(a, b) e `e un parametro complesso non
nullo, mentre f `e lincognita.
Come si sa (esercizio 11.2.9), loperatore A : L
2
(a, b) L
2
(a, b) denito da
Af(t) =
_
b
a
K(t, s)f(s) ds, t [a, b],
`e compatto (nonche autoaggiunto se K(t, s) = K(s, t)). Lequazione integrale
si pu`o scrivere nella forma
f Af = g,
ove =
1

e g =
1

h, e ad essa `e applicabile la teoria precedente. In base alla


proposizione 11.4.3 otteniamo che, se
1

non `e autovalore di A, la soluzione


si rappresenta in questo modo:
326
f(t) =

k=1

k

(h,
k
)
L
2
(a,b)

k
(t) +h(t) q.o. in [a, b],
ove
k

kN
+ `e un sistema ortonormale di autovettori relativi alla famiglia

kN
+ degli autovalori non nulli di A, e la serie converge nel senso di
L
2
(a, b) (si veda anche lesercizio 11.4.2).
Esercizi 11.4
1. Sia
k

kN
+ una successione innitesima tale che

k=1
[
k
[
2
= +.
Posto
Af(t) =

k=1

k
(f, e
k
)
L
2
(a,b)
e
k
(t),
ove e
k
(t) =
_
2

sin kt, si provi che /(L


2
(0, 1)) e che A `e compatto,
ma non `e un operatore integrale con nucleo in L
2
(]0, 1[]0, 1[).
2. Sia K L
2
(]a, b[]a, b[) tale che K(t, s) = K(s, t), e sia A loperato-
re dellesempio 11.4.4. Se
k

kN
+ `e la successione degli autovalori
non nulli di A e u
k

kN
+ `e un corrispondente sistema ortonormale di
autovettori, si provi che:
(i) K(t, s) =

k=1

k
u
k
(t)u
k
(s) q.o. in L
2
(]a, b[]a, b[);
(ii)

k=1
[
k
[
2
< .
3. Sia A loperatore dellesempio 11.4.4, sia
k

kN
+ la successione degli
autovalori non nulli di A e sia u
k

kN
+ un corrispondente sistema
ortonormale di autovettori. Posto
K
1
(t, s) = K(t, s), K
n+1
(t, s) =
_
b
a
K(t, )K
n
(, s) ds n N
+
,
si provi che:
(i) K
n
L
2
(]a, b[]a, b[) e |K
n
|
2
|K|
n
2
per ogni n N
+
;
(ii) A
n
`e un operatore integrale il cui nucleo `e K
n
(t, s);
(iii) A
n
`e compatto, (
k
)
n

kN
+ `e la successione dei suoi autovalo-
ri non nulli e u
k
`e un corrispondente sistema ortonormale di
autovettori;
327
(iv) |K
n
|
2
L
2
(a,b)
=

k=1
[
k
[
2n
per ogni n N
+
;
(v) se K(t, s) = K(s, t) allora K
n
(t, s) = K
n
(s, t) per ogni n N
+
.
11.5 Lequazione di Sturm - Liouville
Consideriamo loperatore dierenziale del secondo ordine
Mu = pu
tt
+ru
t
+qu, u C
2
[a, b],
ove p, q, r sono funzioni reali continue in [a, b] con p(x) ,= 0 in [a, b].
`
E ben
noto dalla teoria delle equazioni dierenziali lineari il seguente risultato:
Teorema 11.5.1 Fissati g C[a, b] e , C, nelle ipotesi sopra scritte il
problema di Cauchy
_

_
Mu = g in [a, b]
u(a) =
u(b) =
ha una e una sola soluzione u C
2
[a, b].
Osserviamo che un operatore del tipo sopra descritto si pu`o sempre trasfor-
mare in un operatore della forma
Lv = (v
t
)
t
+v, v C
2
[a, b],
ove C
1
[a, b] e inoltre (x) > 0 in [a, b]: basta moltiplicare loperatore M
per la funzione

1
p(x)
exp
__
x
a
r(t)
p(t)
dt
_
e scegliere
(x) = exp
__
x
a
r(t)
p(t)
dt
_
, (x) =
q(x)
p(x)
exp
__
x
a
r(t)
p(t)
dt
_
.
Con questo articio, lo studio delle equazioni dierenziali del secondo ordi-
ne, a coecienti reali, si pu`o ridurre, almeno per certi scopi, allo studio di
operatori dierenziali della particolare forma sopra descritta. Considereremo
dunque lequazione di Sturm-Liuville
Lf f = g,
328
con L operatore del tipo sopra illustrato e f soggetta a condizioni agli estremi
di natura pi` u generale di quelle del teorema 11.5.1. Ci`o comporter`a una
restrizione sul dominio delloperatore L, ma ci permetter`a di fare uso della
teoria sviluppata nei due paragra precedenti.
Deniamo
D(L) = u C
1
[a, b] : u
t
AC[a, b], u
tt
L
2
(a, b), B
1
u = B
2
u = 0,
ove
B
1
u =
1
u(a) +
1
u
t
(a), B
2
u =
2
u(b) +
2
u
t
(b),
essendo
1
,
1
,
2
,
2
numeri reali tali che [
1
[ +[
1
[ > 0, [
2
[ +[
2
[ > 0. La
scelta di questo tipo di condizioni agli estremi `e dettata dal fatto che, grazie
ad esse, loperatore L risulta autoaggiunto in L
2
(a, b). La verica di questo
fatto `e una semplice applicazione della formula di integrazione per parti per
funzioni assolutamente continue (esercizio 6.5.11). In particolare, posto
D = u C
2
[a, b] : B
1
u = B
2
u = 0,
si ha
(Lu, v)
L
2
(a,b)
= (u, Lv)
L
2
(a,b)
u, v D.
Nel seguito restringeremo talvolta loperatore L al dominio D, che `e pi` u
piccolo del dominio naturale D(L) ma che garantisce la continuit`a di tutte le
funzioni coinvolte. Notiamo che ogni autovalore di L `e necessariamente un
elemento di D (esercizio 11.5.1).
Proposizione 11.5.2 Sia L loperatore denito nello spazio L
2
(a, b) da
Lu = (u
t
)
t
+u, u D,
ove C
1
[a, b] con > 0 in [a, b], C[a, b] e linsieme D `e quello sopra
introdotto. Allora:
(i) gli autovalori di L sono reali;
(ii) autovettori corrispondenti ad autovalori distinti sono ortogonali in H;
(iii) gli autovalori di L formano un insieme al pi` u numerabile.
329
Dimostrazione GLi enunciati (i) e (ii) si provano come nella proposizione
11.3.3. Per (iii) si osservi che se linsieme degli autovalori fosse pi` u che
numerabile, esisterebbe, per (i), un sistema ortonormale di autovettori pi` u
che numerabile nello spazio di Hilbert separabile L
2
(a, b), il che `e assurdo per
losservazione 8.3.3.
Proposizione 11.5.3 Nelle ipotesi della proposizione 11.5.2, gli autovalori
di L costituiscono una successione limitata inferiormente.
Notiamo che se fosse < 0 in [a, b], la successione degli autovalori sarebbe
limitata superiormente.
Dimostrazione Sia u D un autovettore relativo allautovalore , con
|u|
L
2
(a,b)
= 1. Si ha
= |u|
2
L
2
(a,b)
= (Lu, u)
L
2
(a,b)
=
_
b
a
[(u
t
)
t
+u]udx =
= (b)u
t
(b)u(b) +(a)u
t
(a)u(a) +
_
b
a
([u
t
[
2
+[u[
2
)dx.
Si tratta di minorare gli addendi dellultimo membro. Osserviamo prelimi-
narmente che [u[, essendo una funzione continua in [a, b], ha minimo non
negativo in un punto z [a, b]: poiche |u|
L
2
(a,b)
= 1, deve essere
[u(z)[ = min
x[a,b]
[u(x)[
1

b a
,
altrimenti avremmo
_
b
a
[u(x)[
2
dx >
1
b a
_
b
a
dx = 1.
Di conseguenza si ha, in virt` u della disuguaglianza di Holder (proposizione
9.1.2),
[u(x)[ [u(x) u(z)[ +[u(z)[ =

_
z
x
u
t
(y) dy

+[u(z)[

b a
__
b
a
[u
t
(y)[
2
dy
_
1
2
+
1

b a
x [a, b].
330
Ci`o premesso, se u(a) = 0 oppure u
t
(a) = 0, certamente (a)u
t
(a)u(a) = 0;
altrimenti se u(a)u
t
(a) ,= 0 allora dalla condizione B
1
u = 0 segue che
1
,= 0
e quindi
[(a)u
t
(a)u(a)[ ||

[u(a)[
2

c
_

b a
__
b
a
[u
t
(y)[
2
dy
_
1
2
+
1

b a
_
c
1
__
b
a
[u
t
(y)[
2
dy
_
1
2
+c
2
.
In modo del tutto analogo,
[(b)u
t
(b)u(b)[ c
1
__
b
a
[u
t
(y)[
2
dy
_
1
2
+c
2
.
Pertanto si ottiene
[(a)u
t
(a)u(a)[ [(b)u
t
(b)u(b)[ + min
x[a,b]
(x)
_
b
a
[u
t
[
2
dy
c
3
_
b
a
[u
t
[
2
dy c
4
__
b
a
[u
t
(y)[
2
dy
_
1
2
c
5
=
=
_
_

c
3
_
b
a
[u
t
[
2
dy
c
4
2

c
3
_
_
2
c
6
> .
Proposizione 11.5.4 Nelle ipotesi della proposizione 11.5.2, ogni autovalo-
re di L ha molteplicit`a 1.
Dimostrazione Siano u, v D autovettori non nulli relativi allautovalore
u. Allora
_
Lu = u
B
1
u = B
2
u = 0,
_
Lv = v
B
1
v = B
2
v = 0.
In particolare,

1
u(a) +
1
u
t
(a) =
1
v(a) +
1
v
t
(a) = 0,
il che implica, essendo
1
e
1
non entrambi nulli,
det
_
u(a) v(a)
u
t
(a) v
t
(a)
_
= 0.
331
Perci`o esistono p, q C, non entrambi nulli, tali che
p
_
u(a)
u
t
(a)
_
+q
_
v(a)
v
t
(a)
_
=
_
0
0
_
.
Ne segue che la funzione pu +qv risolve
_
(L I)(pu +qv) = 0 in [a, b]
(pu +qv)(a) = (pu +qv)
t
(a) = 0
e per il teorema 11.5.1 si conclude che pu + qv 0 in [a, b], cio`e u e v sono
linearmente dipendenti.
Osservazione 11.5.5 La proposizione 11.5.2 (iii) ci autorizza a supporre,
senza restrizione alcuna, che 0 non sia autovalore per L. Infatti in caso
contrario, scelto un numero R che non sia autovalore per L, lequazione
Lu u = g si pu`o riscrivere come
(u
t
)
t
+ ( )u ( )u = g;
dunque posto L
0
= L I e
0
= , L
0
`e ancora un operatore di
Sturm-Liouville che non ha 0 come autovalore, e si ha
L
0
u
0
u = Lu u = g.
Esercizi 11.5
1. Nelle ipotesi della proposizione 11.5.2 si provi che ogni autovalore di L
appartiene a C
2
[a, b].
2. Trovare autovalori e autovettori del problema
_
[(1 +x)
2
u
t
]
t
+u = 0 in [0, 1]
u(0) = u(1) = 0;
dedurre che le funzioni
_
1

1 +x log 2
sin
_
k
2 log 2
log(1 +x)
__
kN
+
formano un sistema ortonormale completo in L
2
(0, 1).
[Traccia: Si mostri che u `e soluzione del problema proposto se e solo
se la funzione v(t) = u(e
t
1) risolve v
tt
+ v
t
+ v = 0 in [0, log 2] con
le condizioni ai limiti v(0) = v(log 2) = 0.]
332
3. Si provi che unequazione della forma
(()u
t
)
t
+u = 0, [0, a],
con C[0, a] e > 0, si pu`o trasformare nellequazione
v
tt
+q(x)v +v = 0, x [0, b],
con opportuni b > 0 e q C[0, b], facendo uso delle sostituzioni
x = () =
_

0
dt
_
(t)
. v(x) = u(
1
())
4
_
(
1
()).
4. Determinare landamento asintotico degli autovalori del problema
_
u
tt
+u = 0 in [0, 1]
u(0) = u(1) +u
t
(1) = 0.
11.6 Risolubilit`a dellequazione di Sturm -
Liouville
Consideriamo ancora loperatore di Sturm-Liouville L, sotto le ipotesi della
proposizione 11.5.2. Nellipotesi che 0 non sia autovalore di L, il che, come
si `e osservato, non `e restrittivo, andiamo a dimostrare linvertibilit`a di L in
C[a, b]. Proviamo anzitutto il seguente
Lemma 11.6.1 Nelle ipotesi della proposizione 11.5.2, supponiamo inoltre
che 0 non sia autovalore per L. Allora i due problemi
_
Lu
1
= 0 in [a, b]
B
1
u
1
= 0,
_
Lu
2
= 0 in [a, b]
B
2
u
2
= 0,
hanno rispettivamente soluzioni u
1
, u
2
C
2
[a, b] reali, non identicamente
nulle e tali che per ogni x [a, b] i vettori (u
1
(x), u
t
1
(x)) e (u
2
(x), u
t
2
(x))
sono linearmente indipendenti in R
2
.
333
Dimostrazione Per determinare u
1
e u
2
`e suciente risolvere i problemi di
Cauchy
_

_
Lu
1
= 0 in [a, b]
u
1
(a) =
1
u
t
1
(a) =
1
,
_

_
Lu
2
= 0 in [a, b]
u
2
(b) =
2
u
t
2
(b) =
2
,
i quali per il teorema 11.5.1 hanno ununica soluzione reale di classe C
2
non identicamente nulla. Se (u
1
(x), u
t
1
(x)) e (u
2
(x), u
t
2
(x)) fossero linear-
mente dipendenti per qualche x [a, b], esisterebbe x
0
[a, b] tale che
u
1
(x
0
)u
t
2
(x
0
) u
t
1
(x
0
)u
2
(x
0
) = 0. Daltra parte `e facile vericare che
d
dx
((x)[u
1
(x)u
t
2
(x) u
t
1
(x)u
2
(x)]) = 0 x [a, b],
e poiche tale funzione `e nulla in x
0
si deduce che (u
1
u
t
2
u
t
1
u
2
) = 0 in [a, b],
da cui
u
1
(x)u
t
2
(x) u
t
1
(x)u
2
(x) = 0 x [a, b].
In particolare, calcolando nei punti x = a e x = b, si ha subito B
2
u
1
=
B
1
u
2
= 0. Dunque u
1
e u
2
sono soluzioni del problema
_
Lu = 0 in [a, b]
B
1
u = B
2
u = 0,
e dato che 0 non `e autovalore per L, questo implica u
1
= u
2
= 0: ci`o `e
assurdo poiche, per ipotesi, u
1
e u
2
sono non identicamente nulle.
Osservazione 11.6.2 Dalla dimostrazione del lemma 11.6.1 segue che la
funzione (u
1
u
t
2
u
t
1
u
2
) `e costante in [a, b]; si pu`o quindi supporre (sosti-
tuendo ad esempio
1
e
1
con
1
e
1
, e corrispondentemente u
1
con u
1
,
per un opportuno numero reale ) che tale costante sia 1, cio`e che
(x)(u
1
(x)u
t
2
(x) u
t
1
(x)u
2
(x)) = 1 x [a, b].
Siamo ora in grado di provare il seguente
Teorema 11.6.3 Nelle ipotesi della proposizione 11.5.2, supponiamo inoltre
che 0 non sia autovalore per L e che risulti (u
1
u
t
2
u
t
1
u
2
) = 1 in [a, b],
ove u
1
e u
2
sono le funzioni introdotte nel lemma 11.6.1. Allora esiste una
334
funzione G C([a, b] [a, b]) reale e simmetrica, tale che per ogni g C[a, b]
il problema
_
Lf = g in [a, b]
B
1
f = B
2
f = 0
ha lunica soluzione
f(x) =
_
b
a
G(x, y)g(y) dy, x [a, b].
Dimostrazione Cerchiamo una soluzione dellequazione Lf = g con il meto-
do della variazione delle costanti arbitrarie: cerchiamo dunque una soluzione
del tipo
f(x) = c
1
(x)u
1
(x) +c
2
(x)u
2
(x),
ove c
1
(x) e c
2
(x) sono soluzioni del sistema
_
_
_
c
t
1
u
1
+c
t
2
u
2
= 0
c
t
1
u
t
1
+c
t
2
u
t
2
=
g

.
Il determinante di questo sistema `e u
1
u
t
2
u
t
1
u
2
= 1/ ,= 0, quindi con
facili calcoli si ottiene
c
t
1
= u
2
g, c
t
1
= u
1
g
e pertanto si pu`o scegliere
c
1
(x) =
_
b
x
u
2
(y)g(y) dy, c
2
(x) =
_
x
a
u
1
(y)g(y) dy.
Ne segue
f(x) = u
1
(x)
_
b
x
u
2
(y)g(y) dy +u
2
(x)
_
x
a
u
1
(y)g(y) dy =
_
b
a
G(x, y)g(y) dy,
avendo posto
G(x, y) =
_
u
1
(x)u
2
(y) se x y
u
1
(y)u
2
(x) se x y.
`
E chiaro che G `e continua in [a, b][a, b] e che `e reale e simmetrica. Si verica
allora facilmente che la funzione f appartiene a C
2
[a, b], verica B
1
f = B
2
f =
335
0 e risolve lequazione Lf = g.
Inne, se f
1
`e unaltra soluzione del problema, allora la funzione ff
1
verica
_
L(f f
1
) = 0 in [a, b]
B
1
(f f
1
) = B
2
(f f
1
) = 0,
e quindi f f
1
= 0, dato che 0 non `e autovalore per L.
Osservazioni 11.6.4 (1) Dal teorema precedente segue che loperatore in-
tegrale g Gg, denito da
Gg(x) =
_
b
a
G(x, y)g(y) dy, x [a, b],
ove G(x, y) `e la funzione sopra denita, agisce su R(L) = C[a, b] a valori in
D; inoltre GL = I
D
, LG = I
C[a,b]
, ossia G = L
1
.
(2) La funzione G, oltre che continua in [a, b] [a, b], `e di classe C
2
fuori
della diagonale a x = y b. Si pu`o dimostrare (esercizio 11.6.1) che la
derivata parziale G
x
(x, y) ha un salto pari a 1/
t
(y) per x y.
Esercizi 11.6
1. Sia G(, ) la funzione denita nella dimostrazione del teorema 11.6.3.
Si provi che:
(i) G `e continua in [a, b] [a, b] ed `e di classe C
2
per x ,= y;
(ii) lim
xy
+
G
x
(x, y) lim
xy

G
x
(x, y) =
1

t
(y)
per ogni y [a, b];
(iii) B
1
G(, y) = B
2
G(, y) = 0 per ogni y [a, b];
(iv) [LG(, y)](x) = 0 per x [a, b] y, per ogni y [a, b].
11.7 Rappresentazione delle soluzioni
Analizziamo adesso le propriet`a delloperatore G, introdotto nellosservazione
11.6.4 (1), pensandolo come un operatore integrale su L
2
(a, b). Ricordiamo
che il suo nucleo G(x, y) `e la funzione
G(x, y) =
_
u
1
(x)u
2
(y) se x y
u
1
(y)u
2
(x) se x y,
336
ove u
1
e u
2
sono le soluzioni dei problemi di Cauchy
_

_
Lu
1
= 0 in [a, b]
u
1
(a) =
1
u
t
1
(a) =
1
,
_

_
Lu
2
= 0 in [a, b]
u
2
(b) =
2
u
t
2
(b) =
2
,
e vericano la relazione
(x)(u
1
(x)u
t
2
(x) u
t
1
(x)u
2
(x)) = 1 x [a, b].
Proposizione 11.7.1 Nelle ipotesi della proposizione 11.5.2, supponiamo
inoltre che 0 non sia autovalore per L. Allora loperatore G `e compatto e
autoaggiunto in L
2
(a, b).
Dimostrazione Loperatore G `e compatto per lesempio 10.4.6 (2) e leser-
cizio 11.2.9. Inoltre, in virt` u del teorema 11.6.3, per ogni g
1
, g
2
C[a, b]
esistono uniche f
1
, f
2
D tali che Lf
1
= g
1
e Lf
2
= g
2
. Pertanto, essendo L
autoaggiunto,
(g
1
, Gg
2
)
L
2
(a,b)
= (Lf
1
, f
2
)
L
2
(a,b)
= (f
1
, Lf
2
)
L
2
(a,b)
= (Gg
1
, g
2
)
L
2
(a,b)
.
Dalla densit`a di C[a, b] in L
2
(a, b) segue la tesi.
Proposizione 11.7.2 Nelle ipotesi della proposizione 11.5.2, supponiamo
inoltre che 0 non sia autovalore per L. Se C 0, allora `e autovalore
per G, e g L
2
(a, b) `e un autovettore per G relativo a , se e solo se 1/ `e
autovalore per L e g `e un autovettore per L relativo a 1/. In particolare gli
autovalori di G sono reali, non nulli e di molteplicit`a 1, e gli autovettori di
G appartengono a D.
Dimostrazione Sia C 0 tale che Gg = g con g L
2
(a, b) 0.
Poiche G(x, y) `e continua, si ha g =
1

Gg C[a, b] e di conseguenza Gg
D, da cui g D. Applicando L si trova Lg =
1

g. In particolare, dalla
proposizione 11.5.2 (i) segue R. Viceversa, se f D e Lf =
1

f, allora
in particolare f C[a, b], e applicando G si deduce f = Gf.
Resta da far vedere che 0 non `e autovalore per G. Supponiamo che g
L
2
(a, b) sia tale che Gg = 0: dobbiamo provare che g = 0. Ricordando la
denizione di G(x, y), si vede immediatamente che deve essere
c
1
(x)u
1
(x) +c
2
(x)u
2
(x) = 0 x [a, b]
337
ove
c
1
(x) =
_
b
x
u
2
(y)g(y) dy, c
2
(x) =
_
x
a
u
1
(y)g(y) dy.
Osservato che c
1
, u
1
, c
2
, u
2
AC[a, b], derivando si ottiene
c
1
u
t
1
+c
2
u
t
2
+ (c
t
1
u
1
+c
t
2
u
2
) = 0 q.o. in [a, b];
ricordando che
_
_
_
c
t
1
u
1
+c
t
2
u
2
= 0
c
t
1
u
t
1
+c
t
2
u
t
2
=
g

,
si deduce
c
1
u
t
1
+c
2
u
t
2
= 0 q.o. in [a, b].
Poiche c
1
, c
2
, u
t
1
, u
t
2
AC[a, b], derivando una seconda volta si trova
c
1
u
tt
1
+c
2
u
tt
2
+ (c
t
1
u
t
1
+c
t
2
u
t
2
) = 0 q.o. in [a, b]
e moltiplicando per
u
tt
1
c
1
+u
tt
2
c
2
g = 0 q.o. in [a, b].
Tenendo conto delle relazioni Lu
1
= Lu
2
= 0 si ricava
(u
1

t
u
t
1
)c
1
+ (u
2

t
u
t
2
)c
2
g = 0 q.o. in [a, b],
cio`e, nalmente,
(c
1
u
1
+c
2
u
2
)
t
(c
1
u
t
1
+c
2
u
t
2
) g = 0 q.o. in [a, b]
ovvero g = 0 q.o. in [a, b].
Corollario 11.7.3 Nelle ipotesi della proposizione 11.5.2, supponiamo inol-
tre che 0 non sia autovalore per L. Allora gli autovalori di G formano una
successione reale
k

kN+
tale che [
k
[ [
k+1
[ > 0 per ogni k N
+
e

k
0 per k ; inoltre ogni autovalore ha molteplicit`a 1, ed esiste un
sistema ortonormale di autovettori corrispondenti u
k

kN
+ D, il quale `e
completo in L
2
(a, b).
Dimostrazione La tesi `e conseguenza del teorema spettrale (teorema 11.3.6)
e delle proposizioni 11.7.1 e 11.7.2.
338
Proposizione 11.7.4 Nelle ipotesi della proposizione 11.5.2, gli autovalori
di L formano una successione reale
k

kN
+, tale che [
k
[ + per k
; inoltre ogni autovalore ha molteplicit`a 1 ed esiste un sistema ortonormale
di autovettori corrispondenti u
k

kN
+ D, il quale `e completo in L
2
(a, b).
Si noti che non si fa lipotesi che 0 non sia autovalore per L.
Dimostrazione Se 0 non `e autovalore per L, la tesi segue dal corollario
11.7.3 e dalle proposizioni 11.7.2 e 11.5.2. Se invece 0 `e autovalore per L,
sia
0
R un numero che non sia autovalore per L (esso esiste per la pro-
posizione 11.5.2): posto L
0
= L
0
I, L
0
`e un operatore di Sturm-Liouville
che non ha 0 come autovalore. Sia G
0
loperatore integrale che inverte L
0
:
indicata con
k
la successione degli autovalori di L (reali e di moltepli-
cit`a 1 in virt` u delle proposizioni 11.5.2 e 11.5.4), gli autovalori di G
0
sono i
mumeri
1

kN
+, e i relativi autovettori sono esattamente gli autovettori
u
k

kN
+ di L relativi ai
k

kN
+. La tesi segue applicando a G
0
il corollario
11.7.3.
Le proposizioni precedenti, insieme col teorema spettrale, forniscono una rap-
presentazione delle soluzioni del problema di Sturm-Liouville. La situazione
`e chiarita dal seguente
Teorema 11.7.5 Nelle ipotesi della proposizione 11.5.2, valgono i seguenti
fatti.
(i) Se 0 non `e autovalore per L, allora il problema
_
Lf = g C[a, b]
B
1
f = B
2
f = 0
`e univocamente risolubile in C
2
[a, b] per ogni g C[a, b], e la soluzione
f `e somma in L
2
(a, b) della serie

k=1
1

k
(g, u
k
)
L
2
(a,b)
u
k
,
dove
k

kN
+ `e la successione degli autovalori di L e u
k
`e un corri-
spondente sistema ortonormale completo di autovettori.
339
(ii) Se 0 `e autovalore per L, allora il problema sopra scritto `e risolubile (non
univocamente) se e solo se g (ker L)

; in tal caso le soluzioni sono


tutte e sole le funzioni f della forma
f(x) = cu
0
(x) +

k=1
1

k
(g, u
k
)
L
2
(a,b)
u
k
(x),
ove c C,
k

kN
+ `e la successione degli autovalori non nulli di L,
u
k
`e un corrispondente sistema ortonormale di autovettori, comple-
to in (ker L)

, e u
0
`e un arbitrario versore di ker L, il quale `e un
sottospazio 1-dimensionale di L
2
(a, b); la serie converge nel senso di
L
2
(a, b).
In eetti si pu`o dimostrare (esercizio 11.7.refMerc) che le serie sopra scritte
convergono assolutamente e uniformemente in [a, b].
Dimostrazione (i) Per il teorema spettrale (teorema 11.3.6)
f = Gg =

k=1
1

k
(g, u
k
)
L
2
(a,b)
u
k
in L
2
(a, b),
da cui la tesi.
(ii) Sia
0
R un numero che non sia autovalore per L. Allora L
0
= L
0
I
non ha 0 come autovalore. Sia G
0
= (L
0
)
1
: lequazione Lf = g equivale
a f +
0
G
0
f = G
0
g. Questultima equazione, per il teorema di Fredholm
(teorema 11.4.1) e per losservazione 11.4.2, `e risolubile se e solo se G
0
g
[ker(I +
0
G
0
)]

. Daltra parte, in virt` u della relazione


(g, v)
L
2
(a,b)
= (g,
0
G
0
v)
L
2
(a,b)
=
0
(G
0
g, v)
L
2
(a,b)
v ker(I +
0
G
0
),
risulta
G
0
g [ker(I +
0
G
0
)]

g [ker(I +
0
G
0
)]

.
Inoltre, grazie allinvertibilita di G
0
si ha
ker(I +
0
G
0
) = ker L
in quanto
v +
0
G
0
v = 0 (G
0
)
1
v +
0
v = 0 Lv = 0.
340
Si conclude che lequazione Lf = g ha soluzione se e solo se g (ker L)

.
Sia ora g (ker L)

e sia f D(L) tale che Lf = g: allora, ssato un versore


u
0
ker L, possiamo scrivere f = (f, u
0
)
L
2
(a,b)
u
0
+ f
1
, dove f
1
(ker L)

`e
univocamente determinata dalla f scelta. Inoltre
(g, u
k
)
L
2
(a,b)
= (Lf, u
k
)
L
2
(a,b)
= (Lf
1
, u
k
)
L
2
(a,b)
=
= (f
1
, Lu
k
)
L
2
(a,b)
=
k
(f
1
, u
k
)
L
2
(a,b)
k N
+
,
e quindi
f
1
=

k=1
1

k
(g, u
k
)
L
2
(a,b)
u
k
in L
2
(a, b),
da cui la tesi.
Esempi 11.7.6 (1) Sia
D = u C
2
[0, ] : u(0) = u() = 0, Lu = u
tt
.
Si scelgono quindi 1 e 0, e nelle condizioni agli estremi
1
=
2
= 1,

1
=
2
= 0. Cerchiamo gli autovalori e i corrispondenti autovettori: la
soluzione generale dellequazione u
tt
+u = 0 `e
u(x) = a cos

x +b sin

x, a, b C,
e le condizioni agli estremi implicano a = 0, =
k
= k
2
, k N
+
. In
particolare, 0 non `e autovalore. Il corrispondente sistema ortonormale di
autovettori `e
__
2

sin kx
_
kN
+
.
Andiamo a costruire il nucleo G(x, y) delloperatore G = L
1
. Le funzioni
u
1
(x) = cx e u
2
(x) = c( x) vericano rispettivamente
_
u
tt
1
= 0
u
1
(0) = 0,
_
u
tt
2
= 0
u
2
() = 0,
e si ha
u
1
u
t
2
u
t
1
u
2
= 1 c =
1

.
Quindi il nucleo di G `e
G(x, y) =
_

_
x( y)

se x y
y( x)

se x y.
341
Perci`o se g C[0, ] la soluzione del problema
_
f
tt
= g in [a, b]
f(0) = f() = 0
`e la funzione
f(x) =
_

0
G(x, y)g(y) dy =
2

k=1
1
k
2
__

0
g(t) sin kt dt
_
sin kx.
(2) Sia D = u C
2
[0, ] : u
t
(0) = u
t
() = 0, Lu = u
tt
. In questo caso
1, 0,
1
=
2
= 0,
1
=
2
= 1. Gli autovalori sono
k
= k
2
, k N;
in particolare 0 `e autovalore per L. Il corrispondente sistema ortonormale di
autovettori `e
_
1

__
2

cos kx
_
kN
+
. Si ha
ker L = c
cC
, (ker L)

=
_
u L
2
(a, b) :
_

0
u(x) dx = 0
_
.
Perci`o se g C[a, b] (ker L)

le soluzioni del problema


_
f
tt
= g in [a, b]
f
t
(0) = f
t
() = 0
sono date dalla famiglia f
c

cC
, ove
f
c
(x) =
2

k=1
1
k
2
__

0
g(t) cos kt dt
_
cos kx +c.
Si noti che in questi due esempi le serie convergono assolutamente e unifor-
memente in [0, ]; inoltre esse sono derivabili termine a termine e le serie delle
derivate convergono ancora assolutamente e uniformemente in [0, ]. Invece
le serie delle derivate seconde convergono soltanto in L
2
(a, b).
Esercizi 11.7
1. Si denisca
H = f C
1
[a, b] : f
t
AC[a, b], f
tt
L
2
(a, b),
342
e sia L loperatore denito da
D(L) = f H : B
1
f = B
2
f = 0, Lf = (f
t
)
t
+f,
ove C
1
[a, b] con > 0, C[a, b] e le condizioni agli estremi B
1
f
e B
2
f sono denite nel modo usuale. Si provi che L `e autoaggiunto.
[Traccia: per provare che D(L

) D(L), si supponga dapprima che


0 non sia autovalore per L. Se v D(L

), si verichi che GL

v `e un
ben denito elemento di H e si osservi che per ogni u D(L) si ha
u = GLu e quindi (Lu, v)
L
2
(a,b)
= (u, L

v)
L
2
(a,b)
= (GLu, L

v)
L
2
(a,b)
=
(Lu, GL

v)
L
2
(a,b)
; se ne deduca che v = GL

v H. Integrando per par-


ti si ricavi, per ogni u D(L), che (Lu, v)
L
2
(a,b)
=
_
u
t
v +uv
t

b
a
+
(u, Lv)
L
2
(a,b)
; si concluda che, anche u (Lu, v)
L
2
(a,b)
sia continua
nella norma di L
2
(a, b), deve aversi B
1
v = B
2
v = 0, cio`e v D(L). Si
passi inne al caso generale. . . ]
2. Siano C[a, b] e C
1
[a, b] con 0 e > 0, e sia L denito da
D(L) = f H : f(a) = f(b) = 0, Lf = (f
t
)
t
+f,
essendo H lo spazio introdotto nellesercizio precedente. Indichiamo
con
k
gli autovalori di L, necessariamente positivi (perche?), con
u
k
un sistema ortonormale di autovettori corrispondenti e con G(x, y)
il nucleo delloperatore integrale G = L
1
/(L
2
(a, b)). Si provino i
seguenti fatti:
(i) si ha Lf =

k=1

k
(f, u
k
)
L
2
(a,b)
u
k
in L
2
(a, b) per ogni f D(L);
(ii) si ha

k=1

k
[(f, u
k
)
L
2
(a,b)
[
2
=
_
b
a
[[f
t
[
2
+ [f[
2
]dx per ogni f
D(L);
(iii) si ha

k=1

k
(f, u
k
)
L
2
(a,b)
(g, u
k
)
L
2
(a,b)
=
_
b
a
[f
t
g
t
+fg]dx per ogni
f, g D(L);
(iv) risulta (Gf, f)
L
2
(a,b)
0 per ogni f D(L) e G(x, x) 0 per ogni
x [a, b];
(v) la funzione G
n
(x, y) = G(x, y)

k=n+1
1

k
u
k
(x)u
k
(y) `e ben de-
nita e continua in [a, b] [a, b], il corrispondente operatore inte-
grale G
n
`e compatto e autoaggiunto in L
2
(a, b), e si ha G
n
f =

k=n+1
1

k
(f, u
k
)
L
2
(a,b)
u
k
in L
2
(a, b) e (G
n
f, f)
L
2
(a,b)
0 per ogni
f L
2
(a, b);
343
(vi) la serie

k=1
1

k
[u
k
(x)[
2
converge per ogni x [a, b] e, di con-
seguenza, la serie

k=1
1

k
u
k
(x)u
k
(y) converge assolutamente in
[a, b] [a, b], con somma uguale a G(x, y);
(vii) le serie

k=1
1

k
[u
k
(x)[
2
e

k=1
1

k
u
k
(x)u
k
(y) convergono unifor-
memente in [a, b] e in [a, b] [a, b] rispettivamente;
(viii) si ha

k=1
1

k
=
_
b
a
G(x, x)dx < +;
(ix) per ogni f D(L) la serie

k=1
(f, u
k
)
L
2
(a,b)
u
k
(x) converge a f(x)
assolutamente e uniformemente in [a, b];
(x) (teorema di Mercer) per ogni g C[a, b] lequazione Lf = g ha so-
luzione unica f D(L) data da f(x) =

k=1
1

k
(g, u
k
)
L
2
(a,b)
u
k
(x),
e la serie converge assolutamente e uniformemente in [a, b].
[Traccia: per provare (vii) si dimostri dapprima il lemma del Dini: se
f
n
C[a, b], se f C[a, b] e se f
n
(x) f(x) per n , allora
f
n
f uniformemente in [a, b].]
344
Bibliograa
[1] G. Bachman, L. Narici, Functional analysis, Academic Press, New York 1973.
[2] J. J. Benedetto, Real variable and integration, B. G. Teubner, Stuttgart 1967.
[3] H. Brezis, Analyse fonctionnelle. Theorie et applications, Masson, Paris 1983.
[4] F. Conti, Appunti di istituzioni di analisi superiore (manoscritto), Pisa 1980.
[5] G. de Barra, Teoria della misura e dellintegrazione, LArciere, Cuneo 1987.
[6] N. Dunford, J. T. Schwartz, Linear operators, Interscience Publ., New York
1958.
[7] R. E. Edwards, Fourier series: a modern introduction, vol.1 e vol. 2, Holt,
Rinehart and Winston inc., New York 1967.
[8] R. E. Edwards, Functional analysis. Theory and applications, Holt, Rinehart
and Winston inc., New York 1965.
[9] C. C. Evans, R. F. Gariepy, Measure theory and ne properties of functions,
CRC Press, Boca Rabon 1992.
[10] E. Hewitt, K. Stromberg, Real and abstract analysis, Springer Verlag, Berlin
1965.
[11] A. N. Kolmogorov, S. V. Fomin, Elementi di teoria delle funzioni e di analisi
funzionale, Mir, Mosca 1980.
[12] E. R. Lorch, Spectral theory, Oxford Univ. Press, New York 1962.
[13] C. A. Rogers, Hausdor measures, Cambridge Univ. Press, Cambridge 1970.
[14] H. L. Royden, Real analysis, MacMillan, New York 1968.
345
[15] W. Rudin, Real and complex analysis, McGraw Hill, New York 1987.
[16] M. Schechter, Principles of functional analysis, Academic Press, New York
1971.
[17] A. E. Taylor, Introduction to functional analysis, J. Wiley, New York 1961.
[18] R. L. Wheeden, A. Zygmund, Measure and integral: an introduction to real
analysis, Marcel Dekker, New York 1977.
[19] H. Widom, Lectures on integral equations, notes by D. Drasin and A. Tromba,
Van Nostrand-Reinhold Co., New York 1969.
[20] A. C. Zaanen, Integration, North-Holland Publ. Company, Amsterdam 1967.
[21] A. Zygmund, Trigonometric series, vol. 1 e vol. 2, Cambridge Univ. Press,
Cambridge 1959.
346
Indice analitico
-algebra, 11
degli eventi, 27
degli insiemi Lebesgue - Stieltjes mi-
surabili, 26
degli insiemi Lebesgue misurabili in
R, 11, 14, 26
degli insiemi Lebesgue misurabili in
R
N
, 128
dei boreliani di R, 14, 26
dei boreliani di R
N
, 121, 128
generata, 14, 32, 115
prodotto, 115
-rete, 293
additivit`a
dellintegrale, 77
di funzioni semplici, 71
della variazione totale, 151
nita, 6
numerabile, 3, 74
algebra
di funzioni, 230
di insiemi, 3, 114
applicazione aperta, 272
assioma della scelta, 22
assoluta continuit`a dellintegrale, 100,
154
autovalore, 300
autovettore, 300
base duale, 287
biduale, 284
cambiamento di variabile, 161
cambiamento di variabili, 166, 170
classe di equivalenza
di funzioni q.o. coincidenti, 57, 103,
104, 142, 239
in [0, 1]/Q, 22
classe monotona, 114, 115, 118
coecienti di Fourier, 217, 279
complessicazione di uno spazio norma-
to reale, 299
completamento
del prodotto di misure di Lebesgue,
128
di una misura, 29, 128
convergenza
debole, 289
debole*, 290
dominata, 52, 85
in L
1
, 104, 105
in L
p
, 242
in L

, 58
in legge, 102
in misura, 64
in probabilit`a, 65
monotona, 83
puntuale, 51
puntuale q.o., 56, 59, 62
uniforme, 58, 59, 62
convoluzione, 134, 246, 247
moltiplicativa, 247
coordinate polari in R
N
, 173
cubo di Hilbert, 296, 305
347
curva retticabile, 153
decomposizione di Lebesgue, 209
densit`a
dei polinomi, 218
delle funzioni costanti a tratti,
109, 110, 159, 189, 247
di un insieme, 12, 143
in C
0
, 111
in L
1
, 106109
in L
p
, 246
in L

, 59, 252
derivate del Dini, 145
diametro di un insieme, 32, 36
dierenza simmetrica, 22
dimensione
di Hausdor, 40
nita, 181, 193, 207, 279, 285, 292
innita, 293, 296
disequazione variazionale, 200
disuguaglianza
di Bessel, 217
di Cauchy-Schwarz, 184, 211
di Holder, 240
di Hardy, 249
di Jensen, 249
di Minkowski, 241
dominio
della derivata prima, 276
di un operatore, 280
duale
di C
N
, 192
di
1
, 197
di R
N
, 192
di C
0
, 258
di c
0
, 197
di L
1
, 193195
di L
p
, 250
di L

, 192, 263
di uno spazio di Hilbert, 208
di uno spazio normato, 192
elemento
maggiorante, 219
massimale, 219
equazione
del calore, 235
di Fredholm di 2
a
specie, 326
di Sturm-Liouville, 328
integrale, 326
di Volterra, 306
esponente coniugato, 240
esponenziale di un operatore, 197
estensione di funzionali lineari, 259
estremo inferiore essenziale, 55
estremo superiore essenziale, 55
evento, 27
famiglia
equicontinua, 294
puntualmente equilimitata, 294
forma quadratica, 313
formula
di inversione, 232
di Parseval, 233
funzionale
convesso, 260
di Minkowski, 264
lineare
continuo, 192
limitato, 192
positivo, 251
positivamente omogeneo, 259
subadditivo, 259
funzione
, 44, 96
a variazione limitata, 150
assolutamente continua, 154
boreliana, 54, 121
caratteristica, 17, 49
costante a tratti, 90
348
denita q.o., 57
derivabile q.o., 144, 152, 154
di Lebesgue, 157, 160, 161
di scelta, 22
dispari, 223
essenzialmente limitata, 55
indicatrice, 49
integrabile, 73
Lebesgue misurabile, 50, 53
Lebesgue sommabile, 90
misurabile, 49
pari, 223
q.o. nita, 59, 65
Riemann integrabile, 17, 90, 93
semplice, 49
integrabile, 70
sommabile, 70
sezione, 122
sommabile, 73
identit`a
del parallelogrammo, 187, 199
del risolvente, 303
di Parseval, 220
immagine di un operatore, 194, 203
immersione canonica nel biduale, 284
insieme
-nito, 82
boreliano in R, 14
boreliano in R
N
, 31
di Cantor, 15, 17, 40, 64, 98, 157
di Vitali, 22
Hausdor misurabile, 36
Lebesgue misurabile in R, 8
Lebesgue misurabile in R
N
, 31
Lebesgue-Stieltjes misurabile, 26
misurabile, 25
non Lebesgue misurabile, 22
parzialmente ordinato, 219
proiezione, 117
Riemann misurabile, 1
risolvente, 299
test, 8
totalmente limitato, 293
totalmente ordinato, 219
integrale
di funzioni misurabili, 73
di funzioni semplici, 69
di Lebesgue in R, 69, 90, 91, 136
di Lebesgue in R
N
, 69, 133, 170
di Riemann in R, 90, 136
di Riemann in R
N
, 133
dipendente da parametro, 86
improprio di Riemann in R, 91
improprio di Riemann in R
N
, 133
integrazione
per cambiamento di variabili,
166, 170
per fette, 105
per cambiamento di variabile, 161
per parti, 160
invarianza per traslazioni, 3
legge
di gruppo, 197
di una variabile aleatoria, 52, 102
lemma
del Dini, 344
di Fatou, 84
per la convergenza in misura, 88
di Riemann-Lebesgue, 109
di Vitali, 144
di Zorn, 219, 262
limite
debole, 292
debole*, 292
di Banach, 267
linearit`a dellintegrale, 77
lunghezza
di un intervallo, 2
349
di una curva, 38
massimo limite di insiemi, 21
minimo limite di insiemi, 21
misura, 25
-nita, 25
assolutamente continua, 99, 100, 156,
209
cardinalit`a, 27, 194, 216
completa, 25
concentrata, 26, 99
di Borel, 26
di Dirac, 27
di Hausdor, 36
di Lebesgue - Stieltjes , 26, 156, 159,
257
di Lebesgue in R, 17
di Lebesgue in R
N
, 31
di probabilit`a, 27
discreta, 28
nita, 25
immagine, 52, 102
prodotto, 113, 115, 120, 125
regolare, 20
singolare, 99, 209
misura esterna
di Hausdor, 33
di Lebesgue in R, 4
di Lebesgue in R
N
, 31
di Lebesgue-Stieltjes, 26
prodotto, 134
monotonia
dellintegrale, 74
della misura, 28
della misura di Lebesgue, 4
norma, 179
di un funzionale lineare, 192
di un operatore lineare, 191
equivalente, 181
hilbertiana, 187
in C
N
, 180
in
1
, 188
in
2
, 188
in
p
, 244
in

, 182
in R
N
, 180
in AC, 159
in BV , 152
in C
k
, 180
in C

, 183
in c
0
, 182
in c
00
, 182
in L
1
, 103
in L
p
, 242
in L

, 57
in /(X, Y ), 191
indotta da un prodotto scalare, 184,
187, 199
nucleo
del calore, 237
di Dirichlet, 269
di un operatore lineare, 194, 198,
214
di unequazione integrale, 326
numeri derivati, 145
operatore
aggiunto, 280
in uno spazio di Hilbert, 214, 281
antilineare, 209
autoaggiunto, 214, 282
compatto, 305
completamente continuo, 305
derivata prima, 275, 279
di shift, 267
di Hilbert-Schmidt, 226
di Laplace, 236
di restrizione, 277
integrale, 282, 305, 311
di Volterra, 305
350
lineare, 189
chiuso, 274, 275
continuo, 190
limitato, 189
lipschitziano, 190, 201
positivo, 215, 314
risolvente, 299
strettamente positivo, 215, 320
ordinamento parziale, 219
ortogonalit`a
fra insiemi, 202
fra vettori, 186
passaggio al limite sotto il segno di inte-
grale, 8385
polinomi
di Bernstein, 110
di Hermite, 218, 224
di Legendre, 218, 224
trigonometrici, 222
probabilit`a, 27
discreta, 28
problema di Cauchy, 297
prodotto
di convoluzione, 134, 230
scalare, 183, 215
in C
N
, 185
in R
N
, 185
in AC, 188
in C
0
, 185
in L
2
, 186
proiezione
ortogonale, 203
su un convesso chiuso, 199
su un sottospazio chiuso, 202
propriet`a di miglior approssimazione, 221
punto
di Lebesgue, 138, 142
sso
di una funzione, 167, 174
regolare, 299
quasi certamente, 27
quasi ovunque, 54
raggio spettrale, 303, 319
rappresentazione canonica
di una funzione di L
1
, 143
di una funzione semplice, 49
rettangolo misurabile, 113
riessivit`a, 284, 287
degli spazi di Hilbert, 285
di L
p
, 285
scala del diavolo, 158
scambio dellordine di integrazione,
118, 122, 130
separabilit`a, 288
di L
p
, 247
separazione di insiemi convessi, 265
serie di Fourier, 217
relativa al sistema trigonometrico,
222, 269
sezione di una funzione, 122
sistema
ortonormale, 215, 217, 289
completo, 218, 220
trigonometrico, 216, 279
soluzione fondamentale, 237
sottospazio, 200
chiuso, 202, 287
generato, 206
sottosuccessione
convergente in L
p
, 297
convergente q.o., 65, 104
debolmente convergente, 295
debolmente* convergente, 295
diagonale, 294
uniformemente convergente, 294
spazio
L
1
, 103
351
L
p
, 240
L

, 57
con prodotto scalare, 183, 199
degli operatori lineari limitati, 190
di Banach, 57, 103, 179, 242
di Hilbert, 185, 199
non separabile, 216
di Schwartz, 230
duale, 192
metrico
completo, 268
separabile, 294
misurabile, 25
misurato, 25
normato, 57, 179
pre-hilbertiano, 183
probabilizzato, 27, 49, 102
riessivo, 284, 295
separabile, 183, 216, 295
spettro, 299
puntuale, 299
residuo, 300
spezzate di Eulero, 298
subadditivit`a numerabile, 3
successione
di Cauchy, 64, 103
fondamentale in misura, 64
teorema
del graco chiuso, 274
dellalternativa, 321
dellapplicazione aperta, 272
delle proiezioni, 203
di Ascoli-Arzel`a, 294
di B. Levi, 83
di Baire, 268
di Banach-Steinhaus, 267
di Brouwer, 167, 174
di derivazione di Lebesgue, 143
di Frech`et-Kolmogorov, 297
di Fredholm, 321
di Fubini, 123, 132
di Hahn-Banach, 195, 260
di Lebesgue, 85
di Lusin, 59
di Mercer, 344
di Peano, 297
di Pitagora, 186
di Plancherel, 233
di Radon - Nikod ym, 101, 156, 213,
252
di Riesz-Fischer, 250
di Riesz-Frech`et, 208, 211
di Severini-Egorov, 62
con convergenza dominata, 88
di Tonelli, 122, 130
di decomposizione di Lebesgue,
209
fondamentale del calcolo integrale,
136
spettrale, 315
trasformata di Fourier
di una funzione, 227
di una misura, 238
trib` u, 11
uguaglianza di Bessel, 220
uniforme limitatezza di operatori, 267
unit`a di unalgebra, 230
variabile aleatoria, 49
variazione totale, 150
volume di un parallelepipedo, 31
352
Introduzione alla teoria delle
equazioni alle derivate parziali
Paolo Acquistapace
9 gennaio 2007
Indice
1 Generalit`a 1
1.1 Preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Linee caratteristiche . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Risoluzione delle equazioni del primo ordine . . . . . . . . . . 7
1.4 Derivata normale e derivate tangenziali . . . . . . . . . . . . . 14
1.5 Il teorema di Cauchy-Kovalevskaya . . . . . . . . . . . . . . . 18
1.6 Equazioni risolubili elementarmente . . . . . . . . . . . . . . . 30
1.7 Il metodo di separazione delle variabili . . . . . . . . . . . . . 35
1.8 Classicazione delle equazioni del secondo ordine . . . . . . . 44
2 Lequazione di Laplace 48
2.1 Motivazioni siche . . . . . . . . . . . . . . . . . . . . . . . . 48
2.2 Il problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . 52
2.3 Principio del massimo . . . . . . . . . . . . . . . . . . . . . . 53
2.4 Formule di rappresentazione . . . . . . . . . . . . . . . . . . . 56
2.5 La funzione di Green per la sfera . . . . . . . . . . . . . . . . 62
2.6 Propriet`a delle funzioni armoniche . . . . . . . . . . . . . . . . 72
2.7 Successioni di funzioni armoniche . . . . . . . . . . . . . . . . 77
2.8 Funzioni subarmoniche . . . . . . . . . . . . . . . . . . . . . . 80
2.9 Il problema di Dirichlet . . . . . . . . . . . . . . . . . . . . . . 84
3 Lequazione del calore 88
3.1 Motivazioni siche . . . . . . . . . . . . . . . . . . . . . . . . 88
3.2 Principio del massimo . . . . . . . . . . . . . . . . . . . . . . 91
3.3 La soluzione fondamentale . . . . . . . . . . . . . . . . . . . . 100
3.4 Il problema di Cauchy non omogeneo . . . . . . . . . . . . . . 110
3.5 Equazioni integrali di Volterra . . . . . . . . . . . . . . . . . . 114
3.6 I problemi di Cauchy-Neumann e di Cauchy-Dirichlet . . . . . 121
i
4 Lequazione di DAlembert 136
4.1 Motivazioni siche . . . . . . . . . . . . . . . . . . . . . . . . 136
4.2 Il caso di una variabile spaziale . . . . . . . . . . . . . . . . . 143
4.3 Il metodo dellenergia . . . . . . . . . . . . . . . . . . . . . . . 152
4.4 Il problema di Cauchy in due e tre variabili spaziali . . . . . . 155
4.5 Il problema di Cauchy in R
n
[0, [ . . . . . . . . . . . . . . 164
4.6 Il problema non omogeneo . . . . . . . . . . . . . . . . . . . . 173
4.7 Il metodo di Riemann . . . . . . . . . . . . . . . . . . . . . . 178
Bibliograa 190
ii
Capitolo 1
Generalit`a
1.1 Preliminari
Una equazione alle derivate parziali `e unequazione dierenziale della forma
F(x, u(x), Du(x), . . . , D
m
u(x)) = 0, x , (1.1)
ove `e un aperto di R
n
, m `e un intero positivo (detto ordine dellequazione),
e F `e una funzione assegnata, che supporremo sempre regolare quanto basta
per poter fare tutte le derivate che sono necessarie. Lincognita `e la funzione
u, che sar`a a priori denita su un certo sottoinsieme aperto di ; con Du
si denota linsieme delle n derivate parziali D
i
u, e in generale D
k
u denota
linsieme di tutte le derivate D

u di u di ordine uguale a k; ricordiamo che


se N
n
si ha
D

u =

||
u
x

1
1
x
n
n
, ove [[ =
1
+. . . +
n
,
e che per , N
n
sono di uso comune le notazioni
! =
1
! . . .
n
!, x

= x

1
1
. . . x
n
n
x R
n
,
_

_
=
_

1
_
. . .
_

n
_
.
Lequazione alle derivate parziali (1.1) `e totalmente non lineare. Unequa-
zione `e invece quasi-lineare se dipende linearmente dalle derivate di ordine
massimo e non linearmente dalle altre, mentre `e semilineare se ha parte prin-
cipale lineare: la parte principale di una equazione `e costituita dai termini
1
contenenti le derivate di ordine massimo. Inne, una equazione `e lineare
se dipende in modo lineare da u e dalle sue derivate. Per esempio, delle
equazioni del secondo ordine
n

i,j=1
a
ij
(x, u(x), Du(x))D
i
D
j
u(x) +b(x, u(x), Du(x)) = 0,
n

i,j=1
a
ij
(x)D
i
D
j
u(x) +b(x, u(x), Du(x)) = 0,
n

i,j=1
a
ij
(x)D
i
D
j
u(x) +
n

i=1
b
i
(x)D
i
u(x) +c(x)u(x) = f(x)
la prima `e quasi-lineare, la seconda `e semilineare e la terza `e lineare (omoge-
nea se f 0, non omogenea altrimenti).
La prima questione che ci poniamo `e la seguente: che tipo di condizioni ai
limiti occorrono per determinare una (possibilmente unica) soluzione di una
equazione alle derivate parziali? Come vedremo, la risposta a questa doman-
da non `e univoca: per certe classi di equazioni sar`a ben posto il problema
di Cauchy, generalizzazione di quello relativo alle equazioni dierenziali or-
dinarie, mentre per altre equazioni lesistenza e unicit`a delle soluzioni sar`a
garantita da dierenti tipi di problemi ai limiti.
1.2 Linee caratteristiche
Consideriamo unequazione quasi-lineare del primo ordine in due variabili:
a(x, y, u(x, y))u
x
(x, y) +b(x, y, u(x, y))u
y
(x, y) = c(x, y, u(x, y)), (1.2)
ove a, b, c sono funzioni regolari assegnate, denite su un aperto R
3
.
Denizione 1.2.1 Le linee caratteristiche dellequazione (1.2) sono le curve
(t) = (x(t), y(t), z(t)) che sono soluzioni del sistema di equazioni dieren-
ziali ordinarie
_
_
_
x

(t) = a(x(t), y(t), z(t))


y

(t) = b(x(t), y(t), z(t))


z

(t) = c(x(t), y(t), z(t))


t I,
ove I R `e un opportuno intervallo tale che (x(t), y(t), z(t)) .
2
Ci sono innite linee caratteristiche per la (1.2): anzi, per ogni (x
0
, y
0
, z
0
)
ne passa una e una sola, in virt` u del teorema di esistenza e unicit`a per i sistemi
di equazioni dierenziali ordinarie. Per capire il nesso che intercorre fra linee
caratteristiche e soluzioni della (1.2), `e utile il seguente
Lemma 1.2.2 Sia u una soluzione della (1.2). Allora, ssato un punto
(x
0
, y
0
, z
0
) tale che z
0
= u(x
0
, y
0
), la linea caratteristica passante per
tale punto giace interamente sul graco di u.
Dimostrazione La normale al graco di u `e
(x, y) =
1
_
u
x
(x, y)
2
+u
y
(x, y)
2
+ 1
(u
x
(x, y), u
y
(x, y), 1),
e la (1.2) ci dice che (x, y) `e perpendicolare al vettore
(a(x, y, u(x, y)), b(x, y, u(x, y)), c(x, y, u(x, y))).
Quindi in ogni punto le linee caratteristiche passanti per il graco di u sono
ad esso tangenti. Ci`o suggerisce che se una linea caratteristica tocca il graco
di u in un punto, non potr`a pi` u staccarsene. Per vericare questa illazione,
sia (x(t), y(t), z(t)) la caratteristica che per t = 0 tocca il graco di u in
(x
0
, y
0
, z
0
): essa risolve il problema di Cauchy
_

_
x

(t) = a(x(t), y(t), z(t))


y

(t) = b(x(t), y(t), z(t))


z

(t) = c(x(t), y(t), z(t))


x(0) = x
0
, y(0) = y
0
, z(0) = z
0
,
t I. (1.3)
Sia poi ((t), (t)) la soluzione del problema di Cauchy
_
_
_

(t) = a((t), (t), u((t), (t)))

(t) = b((t), (t), u((t), (t)))


x(0) = x
0
, y(0) = y
0
,
t I, (1.4)
e consideriamo la curva di componenti ((t), (t), u((t), (t))), che `e evi-
dentemente contenuta nel graco di u. Anche questa curva risolve il problema
(1.3): infatti, le condizioni iniziali sono ovviamente vericate; inoltre, dato
che u risolve la (1.2), si ha
d
dt
u(, ) = u
x
(, )a(, , u(, )) +u
y
(, )b(, , u(, )) = c(, , u(, )),
3
e di conseguenza anche le prime due equazioni sono soddisfatte. Per unicit`a,
deve perci`o essere x(t) = (t), y(t) = (t) e z(t) = u((t), (t)) = u(x(t), y(t))
per ogni t I. Questo ci dice che la caratteristica giace interamente sul
graco di u.
Dal lemma precedente segue che il graco di ogni soluzione `e lunione di linee
caratteristiche. Vale anche il viceversa, nel senso che lunione di una famiglia
a un parametro di linee caratteristiche forma il graco di una soluzione della
(1.2). Sia infatti
s
la famiglia di caratteristiche che per t = 0 attraversa
una ssata curva regolare (x
0
(s), y
0
(s), u
0
(s)), s J; supponiamo che valga
la condizione di trasversalit`a
det
_
x

0
(s) y

0
(s)
a(x
0
(s), y
0
(s), u
0
(s)) b(x
0
(s), y
0
(s), u
0
(s))
_
,= 0 s J, (1.5)
che esprime il fatto che la curva dei dati iniziali non `e mai parallela alle ca-
ratteristiche. Siano (x(s, t), y(s, t), z(s, t)) le componenti di
s
(t). A causa di
(1.5), lapplicazione (s, t) (x(s, t), y(s, t)) `e invertibile in un intorno di cia-
scun punto (s, 0). Scriviamo linversa nella forma (x, y) (s(x, y), t(x, y)):
essa `e denita in un intorno U di (x
0
(s), y
0
(s)), e si ha
_
s
x
s
y
t
x
t
y
_
=
_
x
s
x
t
y
s
y
t
_
1
=
1
x
s
y
t
y
s
x
t
_
y
t
x
t
y
s
x
s
_
(x, y) U,
ove le quantit`a negli ultimi due membri sono calcolate in (s(x, y), t(x, y)).
Proviamo che la funzione u(x, y) = z(s(x, y), t(x, y)), il cui graco `e unione
di tratti delle curve
s
, `e soluzione della (1.2). Si ha, utilizzando (1.3),
au
x
+bu
y
= a(z
s
s
x
+z
t
t
x
) +b(z
s
s
y
+z
t
t
y
) =
=
1
x
s
b y
s
a
(az
s
b az
t
y
s
bz
s
a +bz
t
x
s
) = z
t
= c(x, y, u).
Inoltre
u(x
0
(s), y
0
(s)) = u(x(s, 0), y(s, 0)) = z(s, 0) = u
0
(s),
ossia il graco di u contiene la curva iniziale .
Da questa discussione si conclude che per trovare una soluzione dellequazione
(1.2) si deve prescriverne il valore u
0
(s) su una data curva piana (x
0
(s), y
0
(s))
che sia trasversale al vettore (a, b), cio`e sia tale che valga (1.5): questo `e il
problema di Cauchy associato allequazione. Il metodo sopra esposto consen-
te allora di determinare la soluzione riducendo lo studio dellequazione alle
4
derivate parziali a quello di innite equazioni dierenziali ordinarie lungo le
caratteristiche.
Si osservi che se invece prescriviamo il dato iniziale su una linea caratteristi-
ca, in generale non troveremo soluzioni: infatti, imponendo che una soluzione
u verichi u(x(s), y(s)) = (s) lungo una curva che nel punto s `e parallela
ad una caratteristica, poiche i vettori
(x

(s), y

(s)) e (a(x(s), y(s), (s)), b(x(s), y(s), (s)))


sono paralleli, esister`a un numero k(s) tale che
x

(s) = k(s)a(x(s), y(s), (s)), y

(s) = k(s)b(x(s), y(s), (s));


pertanto nel punto s dovr`a aversi
c(x(s), y(s), (s)) =
= a(x(s), y(s), (s))u
x
(x(s), y(s)) +b(x(s), y(s), (s))u
y
(x(s), y(s)) =
=
1
k(s)
(x

(s)u
x
(x(s), y(s)) +y

(s)u
y
(x(s), y(s)) =
1
k(s)

(s),
il che in generale non sar`a vero per una generica funzione .
Esempio 1.2.3 Consideriamo lequazione semilineare del primo ordine
u
x
(x, y) +u
y
(x, y) = u(x, y)
2
, (x, y) R
2
.
Le linee caratteristiche sono le soluzioni del sistema
_
_
_
x

(t) = 1
y

(t) = 1
z

(t) = z(t)
2
t I,
e quindi sono le curve
x = t +h, y = t +k, z =
t
t +m
, t R,
ove h, k, m sono costanti arbitrarie. Fissiamo la curva iniziale denita da
x
0
(s) = s, y
0
(s) = s (che soddisfa ovviamente alla condizione di trasver-
salit`a (1.5)) e prescriviamo su di essa un dato regolare u
0
(s). Si noti che,
essendo lequazione semilineare, la trasversalit`a `e indipendente dalla scelta
5
del dato u
0
. Le linee caratteristiche uscenti da punti di hanno equazioni
parametriche x = t s, y = t + s, z = u
0
(s), da cui, invertendo le prime
due relazioni, si trova s =
1
2
(y x), t =
1
2
(y +x), e di conseguenza un facile
calcolo mostra che
z(s, t) =
u
0
(s)
1 tu
0
(s)
.
Questa funzione, per s ssato, `e denita sulla semiretta ] ,
1
u
0
(s)
[ quando
u
0
(s) > 0, sulla semiretta ]
1
u
0
(s)
, +[ quando u
0
(s) < 0, e (ovviamente) su
tutto R quando u
0
(s) = 0. Se ne deduce che la soluzione del problema
_
u
x
(x, y) +u
y
(x, y) = u(x, y)
2
u[
(s)
= u
0
(s)
`e la funzione
u(x, y) =
u
0
(
yx
2
)
1
y+x
2
u
0
(
yx
2
)
(1.6)
denita sullaperto (x, y) R
2
:
y+x
2
u
0
(
yx
2
) < 1, il quale ovviamente
contiene la curva iniziale.
Si pu`o notare che la soluzione dipende non da una costante arbitraria, come
succede per le equazioni ordinarie del primo ordine, ma da una funzione
arbitraria (di classe C
1
).
Osservazione 1.2.4 In modo analogo, per una equazione quasi-lineare del
primo ordine in n variabili
n

i=1
a
i
(x, u(x))D
i
u(x) = c(x, u(x)), x ,
le linee caratteristiche sono le curve x(t) che risolvono il sistema
_
d
dt
x
i
(t) = a
i
(x(t)), i = 1, . . . , n,
d
dt
z(t) = c(x(t), z(t)),
,
e occorrer`a precisare il dato iniziale u
0
(s) lungo una supercie (n 1)-
dimensionale S, parametrizzata da x = (s), s U R
n1
, in modo che in
ogni punto essa sia trasversale al vettore dei coecienti a((s), u
0
(s)) (ove
a = (a
1
, . . . , a
n
)). Ci`o si esprime scrivendo che
a((s), u
0
(s)) (s) ,= 0 s U,
6
ove (s) `e la normale a S nel punto (s). Questa condizione si esprime
dicendo che i dati (S, u
0
) sono non caratteristici.
Osserviamo, per concludere, che vi `e unampia teoria delle caratteristiche
anche per le equazioni del primo ordine totalmente non lineari, nonche per
sistemi di equazioni del primo ordine: per approfondimenti si rimanda a [3],
[5].
1.3 Risoluzione delle equazioni del primo or-
dine
Per determinare linsieme delle soluzioni dellequazione quasi-lineare in due
variabili
a(x, y, u)u
x
+b(x, y, u)u
y
= c(x, y, u), (1.7)
vi `e un metodo, dovuto a Lagrange, che fa uso delle linee caratteristiche
dellequazione, cio`e delle soluzioni del sistema di equazioni ordinarie (1.3).
Se supponiamo ad esempio a(x, y, z) ,= 0 in una ssata regione R
3
, tale
sistema equivale a questaltro:
_

_
dy
dx
=
b(x, y, z)
a(x, y, z)
dz
dx
=
c(x, y, z)
a(x, y, z)
, (1.8)
ovvero, in forma vettoriale, ponendo Y =
_
y
z
_
e A =
_
b/a
c/a
_
,
dY
dx
= A(x, Y ), x I,
ove I `e un opportuno intervallo tale che (x, Y (x)) per ogni x I. Le
soluzioni di questo sistema saranno della forma
Y = (x, C), x I,
ovvero, in forma scalare,
_
y = (x, h, k)
z = (x, h, k)
, x I, (1.9)
7
ove h e k sono costanti arbitrarie. Supponiamo di poter risolvere questo
sistema rispetto a (h, k), cio`e che risulti
det
(, )
(h, k)
,= 0 (1.10)
in tutti i punti (h, k) tali che si abbia (x, (x, h, k), (x, h, k)) . Possiamo
allora scrivere, almeno localmente,
_
h = p(x, y, z)
k = q(x, y, z)
, (1.11)
e le (1.11) esprimono implicitamente le soluzioni del sistema (1.8). Si osservi
che allo stesso sistema saremmo arrivati supponendo b(x, y, z) ,= 0 in ; si
noti anche che la matrice
_
p
x
p
y
p
z
q
x
q
y
q
z
_
(1.12)
ha rango massimo, poich`e il suo terzo minore `e linverso del determinante
(1.10). Si ha allora:
Teorema 1.3.1 Si consideri lequazione quasi-lineare (1.7), ove a, b, c sono
funzioni regolari sullaperto R
3
tali che a
2
+ b
2
> 0 in . Allora tutte
e sole le soluzioni u(x, y) di tale equazione sono le funzioni di classe C
1
che
sono esprimibili implicitamente nella forma
F(p(x, y, u(x, y)), q(x, y, u(x, y)) = 0 (1.13)
ove F `e unarbitraria funzione di classe C
1
con gradiente mai nullo, e p, q
sono le funzioni che compaiono in (1.11), sulle quali si assume che la matrice
(1.12) abbia rango massimo.
Dimostrazione La chiave di tutto il ragionamento sta nel seguente
Lemma 1.3.2 Siano f, g funzioni di classe C
1
su un aperto R
2
. Si ha
det
_
f
x
(x, y) f
y
(x, y)
g
x
(x, y) g
y
(x, y)
_
= 0 (x, y) (1.14)
se e solo se per ogni (x
0
, y
0
) esistono un intorno U di (x
0
, y
0
),
un intorno V R
2
di (f(x
0
, y
0
), g(x
0
, y
0
)) ed una funzione F C
1
(V ) con
gradiente mai nullo, tali che
F(f(x, y), g(x, y)) = 0 (x, y) U. (1.15)
8
Dimostrazione (=) Supponiamo che valga la (1.15), ove F(s, t) `e di classe
C
1
con gradiente mai nullo. Derivando tale identit`a si trova il sistema
_
F
s
(f, g)f
x
+F
t
(f, g)g
x
= 0
F
s
(f, g)f
y
+F
t
(f, g)g
y
= 0
in U,
e poiche F
2
s
+ F
2
t
> 0, deve valere la (1.14) in U. Ma U `e un intorno del
punto (x
0
, y
0
), arbitrariamente scelto in : ne segue che la (1.14) vale in .
(=) Supponiamo che valga (1.14) in . Sia (x
0
, y
0
) . Se in sono
identicamente nulli tutti gli elementi della matrice, allora le funzioni f e g
sono costanti in un intorno connesso U di (x
0
, y
0
):
f(x, y) h, g(x, y) k in U,
e si ottiene la tesi con la funzione F(, ) = + h k. Se invece la
matrice ha rango 1 in un punto (x
0
, y
0
), allora esistono un aperto rettangolare
AB contenente quel punto, ed una funzione c(x, y), denita su AB,
tale che
grad g(x, y) = c(x, y) grad f(x, y) (x, y) A B. (1.16)
Possiamo inoltre supporre, ad esempio, che sia f
x
(x
0
, y
0
) ,= 0, cosicche,
restringendo opportunamente lintorno, avremo f
x
,= 0 in A B. Posto

0
= f(x
0
, y
0
), la funzione G(x, y, ) = f(x, y) verica
G(x
0
, y
0
,
0
) = 0, G
x
(x, y, ) = f
x
(x, y) ,= 0 (x, y, ) A B R;
quindi, per il teorema del Dini, esistono un parallelepipedo aperto IJK
A B R centrato in (x
0
, y
0
,
0
) ed una funzione : J K I di classe
C
1
, tali che per ogni (y, ) J K vi `e un unico x I per il quale valgono
le tre condizioni, fra loro equivalenti,
G(x, y, ) = 0 = f(x, y) x = (y, ),
e in particolare si ha
f((y, ), y) 0 in J K, x (y, f(x, y)) 0 in U,
ove U `e laperto non vuoto (I J) f
1
(K). Inoltre vale la relazione
f
x
((y, ), y)
y
(y, ) f
y
((y, ), y) 0 in J K.
9
Poniamo adesso
(y, ) = g((y, ), y) (y, ) J K :
allora si ha, utilizzando la (1.16),

y
(y, ) = g
x
((y, ), y)
y
(y, ) +g
y
((y, ), y) =
= c((y, ), y) [f
x
((y, ), y)
y
(y, ) +f
y
((y, ), y)] = 0 in J K.
Dunque la funzione (y, ) dipende in realt`a soltanto da . Consideriamo
allora la funzione
F(, ) = (), (, ) K R :
il suo gradiente non `e mai nullo, e in U si ha, essendo x (y, f(x, y)) 0,
F(f(x, y), g(x, y)) = g(x, y) (f(x, y)) = g(x, y) g((x, f(x, y)), y) = 0.
Ci` o prova la tesi del lemma.
Osservazione 1.3.3 Due funzioni f, g che vericano la (1.15) in un aperto
si dicono funzionalmente dipendenti in . Si noti che questa nozione `e pi` u de-
bole della lineare dipendenza: due funzioni f, g linearmente dipendenti sono
anche funzionalmente dipendenti, perche se risulta c
1
f(x, y) + c
2
g(x, y) 0
`e suciente scegliere F(a, b) = c
1
a + c
2
b, per`o il viceversa non `e vero, come
mostrano le funzioni cos x e sin x.
Torniamo alla dimostrazione del teorema 1.3.1. Proviamo anzitutto che se
u `e denita implicitamente dalla (1.13), allora u `e soluzione della (1.7). Dal
lemma 1.3.2 ricaviamo che si ha
det
_
p
x
+p
z
u
x
q
x
+q
z
u
x
p
y
+p
z
u
y
q
y
+q
z
u
y
_
= 0, (1.17)
ossia, svolgendo i calcoli,
u
x
[p
z
q
y
p
y
q
z
] +u
y
[p
x
q
z
p
z
q
x
] + [p
x
q
y
p
y
q
x
] = 0.
In altre parole, si ottiene la relazione
u
x
det
(p, q)
(y, z)
+u
y
det
(p, q)
(z, x)
= det
(p, q)
(x, y)
. (1.18)
10
Adesso analizziamo le soluzioni implicite del sistema (1.8), ossia le (1.11). Si
tratta di due superci la cui intersezione `e una curva caratteristica: ne segue
che in ogni punto in cui vale (1.11) deve valere anche il sistema
_
ap
x
+bp
y
+cp
z
= 0
aq
x
+bq
y
+cq
z
= 0,
che esprime il fatto che le normali alle due superci sono ortogonali ad (a, b, c).
Da qui si ricava, con noioso ma facile calcolo,
_
a det
(p,q)
(z,x)
b det
(p,q)
(y,z)
= 0
a det
(p,q)
(x,y)
c det
(p,q)
(y,z)
= 0,
. (1.19)
Per ipotesi, uno dei tre minori della matrice
(p,q)
(x,y,z)
`e non nullo: supponiamo
ad esempio che sia
det
(p, q)
(y, z)
,= 0. (1.20)
Allora, sostituendo le relazioni (1.19) nella (1.18), si ottiene
c det
(p, q)
(y, z)
= a det
(p, q)
(x, y)
= au
x
det
(p, q)
(y, z)
+bu
y
det
(p, q)
(y, z)
,
e da (1.20) si conclude, nalmente, che u(x, y) `e soluzione dellequazione
(1.7).
Proviamo ora, viceversa, che se u(x, y) `e soluzione di (1.7), allora esiste una
funzione F tale che u si rappresenta nella forma (1.13). Moltiplichiamo
lequazione (1.7) per la quantit`a (non nulla, in virt` u di (1.20))
det
(p, q)
(y, z)
;
utilizzando le (1.19), e supponendo ad esempio a ,= 0, si ricava la (1.18),
la quale, come si `e visto in precedenza, `e equivalente alla condizione (1.14).
Pertanto otteniamo
det
_

x
p(x, y, u(x, y))
de
y
p(x, y, u(x, y))

x
q(x, y, u(x, y))

y
q(x, y, u(x, y))
_
= 0 in . (1.21)
Dal lemma 1.3.2 segue allora che vale la (1.13).
11
Esempi 1.3.4 (1) Lequazione semilineare dellesempio 1.2.3 ha le due fa-
miglie di caratteristiche y x = h e
1
z
+ x = k: e in eetti, come `e giusto,
la soluzione del problema l` considerato, ossia la funzione (1.6), soddisfa
lequazione implicita
1
u(x, y)
+x =
1
u
0
(
yx
2
)

y x
2
,
e dunque fa parte della famiglia F
_
y x,
1
u
+x
_
= 0, scegliendo
F(s, t) = t
1
u
0
(s/2)

s
2
.
(2) Consideriamo lequazione quasi-lineare
x uu
x
+y uu
y
= (x
2
+y
2
). (1.22)
I tre coecienti a(x, y, z) = xz, b(x, y, z) = yz e c(x, y, z) = (x
2
+ y
2
)
sono funzioni di classe C
1
su tutto R
3
. Il sistema (1.8) diventa, in qualunque
regione in cui xz ,= 0,
dy
dx
=
y
x
,
dz
dx
=
x
2
+y
2
xz
,
e le sue soluzioni sono, come si verica per integrazione diretta,
y = (x, h, k) = hx, z = (x, h, k) =
_
k (1 +h
2
)x
2
(h R, k > 0),
ove il segno di z dipende dalla regione in cui ci si trova. Si noti per`o che tale
segno cambia per x =
_
k
1+h
2
, e la funzione z(x) risultante `e di classe C
1
anche in tali punti, avendo una discontinuit`a solo per x = 0: quindi si pu`o
rimuovere la condizione z ,= 0. Risulta inoltre
det
(, )
(h, k)
= det
_
_
x
hx
2

k(1+h
2
)x
2
0
1
2

k(1+h
2
)x
2
_
_
=
x
2
_
k (1 +h
2
)x
2
;
tale determinante `e non nullo per ogni h, k quando x ,= 0. Risolvendo il
sistema sopra scritto rispetto a h, k si ottiene facilmente
h =
y
x
p(x, y, z), k = z
2
+x
2
+y
2
q(x, y, z).
12
Si conclude che linsieme delle soluzioni della (1.22) nella regione (x, y, z) :
x ,= 0 `e dato da
F
_
y
x
, x
2
+y
2
+z
2
_
= 0
con F funzione arbitraria di classe C
1
tale che F ,= 0.
(3) In certi casi per risolvere il sistema delle caratteristiche `e utile il metodo
dei moltiplicatori. Si osserva anzitutto che se a, b, c, d, e, f sono numeri reali
tali che
a
b
=
c
d
=
e
f
, allora per ogni , , R non tutti nulli risulta, come `e
immediato vericare,
a +c +e
b +d +f
=
a
b
=
c
d
=
e
f
.
Vediamo come luso di questo trucco possa talvolta semplicare di molto il
calcolo: consideriamo ad esempio lequazione dierenziale quasi-lineare
(x
2
y
2
u
2
)u
x
+ 2xyu
y
= 2xu,
le cui caratteristiche sono le soluzioni del sistema
x

x
2
y
2
z
2
=
y

2xy
=
z

2xz
= 1.
Si ha allora
dz
dy
=
z
y
, da cui
y
z
= h;
inoltre, scelti = x, = y, = z, troviamo
z

2xz
=
xx

+yy

+zz

x(x
2
y
2
z
2
) +y(2xy) +z(2xz)
=
xx

+yy

+zz

x(x
2
+y
2
+z
2
)
,
da cui
z

z
=
d
dt
ln(x
2
+y
2
+z
2
)
e, integrando,
x
2
+y
2
+z
2
z
= k.
Dunque linsieme delle soluzioni dellequazione data `e, in forma implicita,
F
_
y
z
,
x
2
+y
2
+z
2
z
_
= 0.
13
1.4 Derivata normale e derivate tangenziali
Sia un aperto di R
n
e sia S = x : (x) = 0 una supercie regolare
(n1)-dimensionale con versore normale (x) =
D(x)
|D(x)|
. Se u `e una funzione
regolare denita su , la sua derivata normale rispetto a S `e
u

(x) = (x) Du(x) =


n

i=1

i
(x)D
i
u(x), x S,
mentre tutte le derivate direzionali di u della forma
u

(x) =
n

i=1

i
(x)D
i
u(x), con (x) (x) = 0
si dicono derivate tangenziali di u rispetto a S.
Deniamo adesso le derivate normali e tangenziali di ordine superiore.
Denizione 1.4.1 Sia S = x : (x) = 0 una supercie regolare con
versore normale (x) =
D(x)
|D(x)|
. Se u `e una funzione regolare denita su
, ogni espressione della forma

||=k
a

(x)D

u(x), ove gli a

vericano la
relazione

||=k
a

(x)

(x) = 0, si chiama derivata tangenziale di ordine


k di u rispetto a S. Lespressione

||=k
(x)

u(x) si chiama derivata


normale di ordine k di u rispetto a S, e si denota con

k
u

k
(x).
In particolare, per k = 2 sono derivate tangenziali di u rispetto a S le quantit`a

n
i,j=1
q
ij
(x)D
i
D
j
u(x) se vale la condizione

n
i,j=1
q
ij
(x)
i
(x)
j
(x) = 0, men-
tre la derivata normale seconda

2
u

2
(x) `e data da

n
i,j=1

i
(x)
j
(x)D
i
D
j
u(x).
Il lemma che segue mostra come decomporre una qualunque derivata di
una assegnata funzione u nella somma di una derivata normale pi` u una
tangenziale.
Lemma 1.4.2 Sia R
n
un aperto, sia S una supercie regolare
(n 1)-dimensionale, e sia u : R una funzione regolare. Allora:
(i) per k = 1, . . . , n si ha
D
k
u(x) =
k
(x)
u

(x) +
u

k
(x),
ove
k
= e
k
(e
k
) `e un vettore tangente a S;
14
(ii) per h, k = 1, . . . , n si ha
D
k
D
h
u(x) =
k
(x)
h
(x)

2
u

2
(x) +
n

i,j=1
q
hkij
(x)D
i
D
j
u(x),
ove lultimo addendo `e unopportuna derivata tangenziale di ordine 2
rispetto a S;
(iii) il valore di ogni derivata tangenziale di u di ordine 2 rispetto a S dipende
soltanto dai valori di u[
S
e di
u

S
(oltre che, naturalmente, da S
stessa).
Dimostrazione (i) Basta osservare che
D
k
u
k
u

=
n

i=1
(
ki

i
)D
i
u
(ove
ij
= 0 per i ,= j e
ij
= 1 per i = j), e che il vettore
k
di componenti
(
k
)
i
=
ki

i
`e tangente a S in quanto

n
i=1
(
ki

i
)
i
=
k
(1[[
2
) = 0.
(ii) Si ha, applicando (i) alla funzione D
h
u,
D
k
D
h
u =
k

D
h
u +

k
D
h
u =
n

i=1

i
D
h
(D
i
u) +

k
D
h
u =
=
n

i,j=1

hj
D
j
D
i
u +

k
D
h
u =
=
n

i,j=1

i
[(
h
)
j
+
h

j
]D
j
D
i
u +

k
D
h
u =
=
n

i=1

h
D
i
u +
k

h
n

i,j=1

j
D
i
D
j
u +

k
D
h
u.
Da qui segue intanto
D
k
D
h
u
k

h
n

i,j=1

j
D
i
D
j
u =
n

i=1

h
D
i
u +

k
D
h
u; (1.23)
15
inoltre, proseguendo il calcolo, e applicando (i) a D
j
u,
D
k
D
h
u
k

2
u

2
=
=
n

i,j=1

i
(
h
)
j
D
j
D
i
u +
n

j=1
(
k
)
j
D
h
D
j
u =
=
n

i,j=1

i
(
h
)
j
D
j
D
i
u +
n

j=1
(
k
)
j
_

D
j
u +

h
D
j
u
_
=
=
n

i,j=1
_

i
(
h
)
j
+
h

i
(
k
)
j
+ (
k
)
j
(
h
)
i
_
D
i
D
j
u.
La tesi segue osservando che
n

i,j=1
_

i
(
h
)
j
+
h

i
(
k
)
j
+ (
k
)
j
(
h
)
i
_

j
=
=
k
[[
2
(
h
) +
h
[
2
[(
k
) + (
k
)(
h
) = 0.
(iii) In virt` u di (i), i valori di D
i
u su S, per i = 1, . . . , n, sono determinati
dai valori di u[
S
=
0
e
u

S
=
1
:
D
i
u[
S
=
i

1
+

0

i
.
Fissiamo adesso una qualunque derivata tangenziale

n
h,k=1
q
hk
D
h
D
k
u: poi-
che

n
h,k=1
q
hk

h
= 0, da (1.23) si avr`a
n

h,k=1
q
hk
D
h
D
k
u =
n

h,k,j=1
q
hk

k
D
j
u +
n

h,k=1
q
hk

h
D
k
u,
e in denitiva tale derivata dipende soltanto, tramite le D
i
u e D
h
u, dai valori

0
= u[
S
e
1
=
u

S
.
Utilizzando le derivate normali e tangenziali a una supercie, siamo in grado
di vedere come sono fatte le caratteristiche nel caso di equazioni alle derivate
parziali del secondo ordine. Consideriamo lequazione quasi-lineare
n

i,j=1
a
ij
(x, u, Du)D
i
D
j
u = b(x, u, Du), x R
n
, (1.24)
16
ed il problema di Cauchy che si ottiene accoppiando tale equazione con le
condizioni ai limiti
u[
S
=
0
,
u

S
=
1
. (1.25)
In analogia con il caso delle equazioni quasi-lineari del primo ordine, diremo
che la terna (S,
0
,
1
) `e caratteristica per lequazione (1.24) se risulta
n

i,j=1
a
ij
(x, u(x), Du(x))
i
(x)
j
(x) = 0 x S. (1.26)
Si noti che in virt` u di (1.25) e del lemma 1.4.2 i valori di u[
S
e delle derivate
D
k
u[
S
sono noti, poiche dipendono dai valori di
0
e
1
. Dunque, lo stesso
accade per il valore su S dei coecienti a
ij
(x, u, Du) e del secondo membro
b(x, u, Du) dellequazione (1.24). Daltronde, la parte principale L(u) =

n
i,j=1
a
ij
(x, u, Du)D
i
D
j
u della (1.24) vale, sempre in virt` u del lemma 1.4.2,
L(u) =
n

i,j=1
a
ij
(x, u, Du)
i

2
u

2
+
n

i,j=1
a
ij
(x, u, Du)
n

r,s=1
q
ijrs
D
r
D
s
u,
ove nel secondo addendo vi `e una derivata tangenziale rispetto a S. Se ora
supponiamo che la terna (S,
0
,
1
) sia caratteristica, troviamo che il primo
addendo `e nullo: pertanto anche il valore di L(u) dipende solo dai valori di
0
e
1
. Quindi, il valore in S della quantit`a L(u) b(x, u, Du) `e determinato,
e in generale esso non sar`a necessariamente nullo. Ci`o signica che, quando
(S,
0
,
1
) `e caratteristica, di regola non esisteranno soluzioni dellequazione
(1.24) soddisfacenti alle condizioni ai limiti (1.25).
Quando al contrario i dati sono non caratteristici, il lemma 1.4.2 mostra
che i valori delle derivate seconde D
i
D
j
u dipendono da
0
,
1
e dalla de-
rivata normale seconda

2
u

2
; ma questultima si pu`o ricavare dallequazione
dierenziale, poiche risulta

2
u

2
=
1

n
i,j=1
a
ij

j
_
L(u)
n

i,j=1
a
ij
n

r,s=1
q
ijrs
D
r
D
s
u
_
=
=
1

n
i,j=1
a
ij

j
_

i,j=1
a
ij
n

r,s=1
q
ijrs
D
r
D
s
u +b(x, u, Du)
_
,
ove il termine

n
i,j=1
a
ij

n
r,s=1
q
ijrs
D
r
D
s
u `e una derivata seconda tangenzia-
le, dunque anchesso dipendente solo da
0
e
1
. Questo rende plausibile
17
lidea che sia ben determinata una soluzione del problema di Cauchy (1.24)-
(1.25): in eetti il teorema di Cauchy-Kovalevskaya, che dimostreremo nel
paragrafo successivo, assicurer`a invece lesistenza e lunicit`a della soluzione
quando i dati (S,
0
,
1
) sono non caratteristici.
Osservazione 1.4.3 Se lequazione `e semilineare, ossia della forma
n

i,j=1
a
ij
(x)D
i
D
j
u = b(x, u, Du), x R
n
, (1.27)
allora la condizione che la terna (S,
0
,
1
) sia caratteristica si riduce a
n

i,j=1
a
ij
(x)
i
(x)
j
(x) = 0,
ed `e dunque indipendente dai dati
0
,
1
. In questo caso si parla perci`o di
supercie caratteristica per il problema (1.27)-(1.25).
1.5 Il teorema di Cauchy-Kovalevskaya
Il principale enunciato di esistenza per equazioni alle derivate parziali di for-
ma generale `e senza dubbio il teorema di Cauchy-Kovalevskaya, che stabilisce
lesistenza di una soluzione (locale) analitica quando i coecienti dellequa-
zione e i dati ai limiti sono analitici e non caratteristici. Si tratta di un
risultato importante, ma non sempre decisivo, nel senso che per molte equa-
zioni alle derivate parziali il problema di Cauchy non `e signicativo; del resto
non sempre i dati e i coecienti di unequazione sono analitici e in tal caso
questo teorema non si applica. Inoltre, esso garantisce una soluzione unica
nella classe delle funzioni analitiche, ma non `e escluso a priori che vi possano
essere altre soluzioni, non analitiche.
Teorema 1.5.1 (di Cauchy-Kovalevskaya) Si consideri lequazione alle
derivate parziali quasi lineare del secondo ordine
n

i,j=1
a
ij
(x, u(x), Du(x))D
i
D
j
u(x) +a(x, u(x), Du(x)) = 0, x , (1.28)
con le condizioni ai limiti
u[
S
=
0
,
u

S
=
1
, (1.29)
18
ove `e un aperto di R
n
, S = x : (x) = 0 `e una supercie regolare
(n 1)-dimensionale con, in particolare, [D[ , = 0 in S. Se ,
0
,
1
, a
ij
, a
sono funzioni analitiche dei loro argomenti, e se i dati (S,
0
,
1
) sono non
caratteristici, ossia
n

i,j=1
a
ij
(x,
0
(x), Du(x))
i
(x)
j
(x) ,= 0 x S,
allora per ogni x
0
S esiste > 0 tale che il problema ha ununica soluzione
u analitica in B(x
0
, ).
Si noti che nei punti di S le derivate D
i
u(x) dipendono soltanto dai dati
0
e
1
in virt` u del lemma 1.4.2.
Dimostrazione Procederemo in varie tappe.
1
a
tappa: riduzione al caso in cui S x R
n
: x
n
= 0.
Fissato x
0
S, poiche [D(x
0
)[ , = 0 possiamo supporre che sia D
n
(x
0
) ,= 0.
Consideriamo la trasformazione : R
n
R
n
denita da
(x) = y, ove
_
y
i
= x
i
, i = 1, . . . , n 1,
y
n
= (x
1
, . . . , x
n
).
Allora la matrice Jacobiana di `e
J

(x) =
_
_
_
_
_
I
n1
0
.
.
.
0
D
1
(x) D
n1
D
n
(x)
_
_
_
_
_
,
cosicche det J

(x
0
) = D
n
(x
0
) ,= 0. Per il teorema di invertibilit`a loca-
le, esiste un intorno U di x
0
tale che [
U
`e invertibile; in particolare si
ha := (S U) = y V : y
n
= 0, ove V `e un intorno del pun-
to y
0
= (x
0
) . Naturalmente, il versore normale alla supercie `e
e
n
= (0, . . . , 0, 1) R
n
.
Vediamo come si trasforma lequazione. Sia v(y) = u(
1
(y)) la nuova
incognita: dalla relazione u(x) = v((x)) = v(x
1
, . . . , x
n1
, (x
1
, . . . , x
n
))
segue
D
i
u(x) = D
i
v((x)) +D
n
v((x))D
i
(x), i = 1, . . . , n 1,
D
n
u(x) = D
n
v((x))D
n
(x),
19
ed anche
D
j
D
i
u(x) = D
j
D
i
v((x)) +D
n
D
i
v((x))D
j
(x)+
+ [D
j
D
n
v((x)) +D
2
n
v((x))D
j
(x)]D
i
(x)+
+ D
n
v((x))D
j
D
i
(x), i, j = 1, . . . , n 1,
D
n
D
i
u(x) = D
n
D
i
v((x))D
n
(x) +D
2
n
v((x))D
n
(x)D
i
(x)+
+ D
n
v((x))D
n
D
i
(x), i = 1, . . . , n 1,
D
2
n
u(x) = D
2
n
v((x))[D
n
(x)]
2
+D
n
v((x))D
2
n
(x).
(1.30)
Osserviamo che la dipendenza di queste derivate dalle derivate seconde di
v `e lineare. Quindi, raggruppando, per ogni derivata D
h
D
k
v, in un singolo
termine b
hk
gli addendi a
ij
relativi a derivate D
j
D
i
u che contengono D
h
D
k
v,
otteniamo che la (1.28) si trasforma in unequazione del tipo
n

h,k=1
b
hk
(y, v(y), Dv(y))D
h
D
k
v(y) +b(y, v(y), Dv(y)) = 0, y V, (1.31)
ove nella funzione b sono inglobati tutti i termini che non contengono derivate
seconde di v. Si vede dunque che la (1.31) ha la stessa forma della (1.28).
Vediamo come si trasformano le condizioni ai limiti. Chiaramente la prima,
u[
S
=
0
, `e equivalente a v[

=
0

1
. La seconda condizione,
u

S
=
1
,
diventa:

1

1
(y) =
n

i=1
D
i
u(
1
(y))
i
(x) =
=
n1

i=1
[D
i
v(y) +D
n
v(y)D
i
(x)]
i
(x) +D
n
v(y)D
n
(x)
n
(x) =
=
n1

i=1
D
i
v(y)
D
i
(x)
[D(x)[
+D
n
v(y)[D(x)[,
ossia
D
n
v(y) =
1
[D(
1
(y))[
_

1
(
1
(y))

n1

i=1
D
i
(
0

1
)(y)
D
i
(
1
(y))
[D(
1
(y))[
_
y .
20
Quindi le nuove condizioni ai limiti sono del tipo
v[

=
0
, D
n
v[

=
1
, (1.32)
con
0
e
1
funzioni analitiche al pari dei coecienti b
hk
e b della (1.31).
Inoltre i nuovi dati sono ancora non caratteristici, ossia risulta in ogni punto
di
n

h,k=1
b
hk
(e
n
)
h
(e
n
)
k
= b
nn
(y
1
, . . . , y
n1
, 0,
0
, D
1

0
, . . . , D
n1

0
,
1
) ,= 0.
Infatti, poich`e b
nn
`e la somma di tutti i coecienti a
ij
tali che lespressione
di D
i
D
j
u contiene la derivata D
2
n
v, dalle (1.30) `e facile riconoscere che
b
nn
(y
1
, . . . , y
n1
, 0,
0
, D
1

0
, . . . , D
n1

0
,
1
) =
= b
nn
(y, v, Dv)[

=
_

n
i,j=1
a
ij
(x, u, Du)D
i
D
j

S
=
=
_

n
i,j=1
a
ij
(x, u, Du)
i

j
[D[
2
_

S
,= 0.
(1.33)
Abbiamo cos` ottenuto il nuovo problema (1.31)-(1.32), che `e equivalente a
quello originario.
2
a
tappa: trasformazione del problema (1.31)-(1.32) in un sistema quasi
lineare del primo ordine.
Aggiungiamo allincognita v altre n variabili p
1
, . . . , p
n
, corrispondenti alle
derivate prime di v. Corrispondentemente, aggiungiamo alla (1.31) nuove
equazioni che legano le nuove incognite in modo coerente:
D
n
v = p
n
,
D
n
p
i
= D
i
p
n
, i = 1, . . . , n 1.
(1.34)
Si tratta di n equazioni, alle quali si aggiunge la (1.31), che riscriviamo cos`:
n

h,k=1
b
hk
(y, v, p
1
, . . . , p
n
))D
h
p
k
+b(y, v, p
1
, . . . , p
n
) = 0, y V,
ovvero, isolando il termine che contiene D
n
p
n
e ricordando (1.33),
D
n
p
n
=
1
b
nn
(y, v, p
1
, . . . , p
n
)
_
n1

h=1
n

k=1
b
hk
(y, v, p
1
, . . . , p
n
)D
h
p
k
+
+
n1

k=1
b
nk
(y, v, p
1
, . . . , p
n
)D
n
p
k
+b(y, v, p
1
, . . . , p
n
)
_
.
(1.35)
21
Al sistema di equazioni (1.34)-(1.35) associamo le condizioni ai limiti che
ricaviamo dalle (1.32):
v[

=
0
, p
i
[

= D
i

0
(i = 1, . . . , n 1), p
n
[

=
1
. (1.36)
Occorre per`o vericare che il problema di Cauchy (1.34)-(1.35)-(1.36) `e equi-
valente al problema di Cauchy (1.31)-(1.32).
`
E chiaro, per costruzione, che
se v `e soluzione del problema (1.31)-(1.32) allora (v, D
1
v, . . . D
n
v) `e soluzione
del sistema (1.34)-(1.35)-(1.36). Per provare il viceversa, poniamo

i
(y) = p
i
(y) D
i
v(y). i = 1, . . . , n,
e proviamo che i
i
sono tutti nulli. Lequazione D
n
v = p
n
dice intanto che

n
0. Allora per i = 1, . . . , n 1 si ha, grazie allequazione D
n
p
i
= D
i
p
n
,
D
n

i
= D
n
p
i
D
n
D
i
v = D
i
(p
n
D
n
v) = D
i

n
= 0;
poiche per y
n
= 0 `e
i
= D
i

0
D
i

0
= 0, si deduce che
i
0.
Dato che p
i
= D
i
v per i = 1, . . . , n, si ottiene che se (v, p
1
, . . . p
n
) risolve il
sistema (1.34)-(1.35)-(1.36), allora v `e soluzione del problema (1.31)-(1.32).
In denitiva, i due problemi di Cauchy sono equivalenti.
3
a
tappa: riduzione a dati iniziali nulli.
Il sistema che dobbiamo risolvere ha acquisito la forma
_
D
n
q
i
=

N
r=1

n1
h=1
B
i
rh
(y, q
1
, . . . , q
N
)D
h
q
r
+B
i
(y, q
1
, . . . , q
N
),
q
i
[

=
i
, i = 1, . . . , N,
(1.37)
ove i coecienti B
i
rh
, B
i
e i dati
i
sono funzioni analitiche nellaperto V .
Scriviamo y = (y

, y
n
) per ogni y R
n
, e introduciamo le nuove incognite
w
i
(y) = q
i
(y)
i
(y

), i = 1, . . . , N,
w
N+1
(y) = y
n
,
ove la w
N+1
serve a rappresentare i coecienti B
i
rh
e B
i
come funzioni delle
sole variabili y

= (y
1
, . . . , y
n1
), oltre che delle incognite w
i
.
Sostituendo le funzioni w
i
in (1.37), otteniamo un nuovo sistema del tipo
_

_
D
n
w
i
=

N+1
r=1

n1
h=1
A
i
rh
(y

, w
1
, . . . , w
N+1
)D
h
w
r
+
+A
i
(y

, w
1
, . . . , w
N+1
), i = 1, . . . , N + 1,
w
i
[

= 0, i = 1, . . . , N + 1,
(1.38)
22
ove la (N + 1)-sima equazione `e semplicemente D
n
w
N+1
= 1. Osserviamo
che dentro gli A
i
sono conglobati i B
i
e anche i termini della forma B
i
rh
D
h

r
.
`
E immediato riconoscere che i sistemi (1.37) e (1.38) sono equivalenti. Mo-
streremo che il sistema (1.38) ha ununica soluzione analitica.
4
a
tappa: costruzione di una candidata soluzione sotto forma di serie di
potenze.
Per ipotesi i coecienti A
i
rh
e A
i
sono analitici: quindi possiamo scrivere
A
i
rh
(y

, z) =

N
n1

N
N+1
a
irh

(y

,
A
i
(y

, z) =

N
n1

N
N+1
a
i

(y

,
e queste serie convergono assolutamente per [y

[ + [z[ < , essendo un


opportuno numero positivo. Scriviamo anche le incognite w
i
come somme di
serie di potenze
w
i
(y) =

N
n
c
i

, i = 1, . . . , N + 1, (1.39)
delle quali occorre determinare i coecienti c
i

. A questo scopo andiamo a


sostituire questa serie nel sistema dierenziale (1.38): poiche
D
k
w
i
=

N
n
:
k
1

k
c
i

y
e
k
=

N
n
(
k
+ 1)c
i
+e
k
y

, k = 1, . . . , n,
scrivendo

N
n
c

:=
_

N
n
c
1

, . . . ,

N
n
c
N+1

_
,
si ottiene

N
n
c
i
+en
(
n
+ 1)y

=
=
N+1

r=1
n1

h=1
_
_

N
n1

N
N+1
a
irh

(y

N
n
c

_
_

N
n
(
h
+ 1)c
r
+e
h
y

+
+

N
n1

N
N+1
a
i

(y

N
n
c

.
23
I due membri sono due serie di potenze nelle variabili y
1
, . . . y
n
, che devono
coincidere per [y[ < , per un opportuno . Quindi i coecienti devono
essere uguali. Osserviamo che il coeciente della generica potenza y

`e,
a sinistra, c
i
+en
, mentre a destra `e una certa espressione polinomiale nei
coecienti a
irh

, a
i

e c
i

; si riconosce agevolmente che questo polinomio ha


coecienti non negativi, e che in esso compaiono solo coecienti c
i

con
n-sima componente
n

n
. Possiamo scrivere allora
c
i
+en
=
1

n
+ 1
p
i

(a
irh

, a
i

, c
i

), (1.40)
con p
i

polinomio a coecienti non negativi, i quali dipendono dalle quantit`a


incognite c
i

, ma solo da quelle relative a multi-indici con


n

n
.
Ricordando che w
i
`e nulla per y
n
= 0, si ha
c
i

= 0 N
n
con
n
= 0, (1.41)
e dunque la (1.40), unita alla (1.41), ci permette di ricavare i coecienti c
i

per induzione su
n
. Abbiamo cos` costruito una candidata soluzione: la
funzione (w
1
, . . . w
n
), con w
i
denita in (1.39).
5
a
tappa: la candidata soluzione `e uneettiva soluzione.
Utilizzeremo il metodo cosiddetto delle serie maggioranti. Ci basiamo
sullevidente fatto che, date due serie di potenze

N
n
f

N
n
g

,
se la seconda `e assolutamente convergente per [y[ < r e se [f

[ [g

[ per
ogni N
n
, allora anche la prima `e assolutamente convergente per [y[ < r.
Consideriamo un nuovo sistema dierenziale della stessa forma di (1.38), vale
a dire
_

_
D
n

i
=

N+1
r=1

n1
h=1
A
i
rh
(y

,
1
, . . . ,
N+1
)D
h

r
+
+A
i
(y

,
1
, . . . ,
N+1
),

i
[

= 0, i = 1, . . . , N + 1,
(1.42)
con coecienti analitici,
A
i
rh
(y

, z) =

N
n1

N
N+1
a
irh

(y

, [y

[ +[z[ < ,
24
A
i
(y

, z) =

N
n1

N
N+1
a
i

(y

, [y

[ +[z[ < ,
e tali inoltre che a
irh

, a
i

0.
Supponiamo inoltre che questo sistema abbia ununica soluzione analitica

i
(y) =

N
n

(1.43)
denita per [y[ < . Vale la seguente
Proposizione 1.5.2 Nelle ipotesi sopra dette, supponiamo inoltre che
[a
irh

[ a
irh

, [a
i

[ a
i

N
n1
, N
N+1
. (1.44)
Allora
[c
i

[ [
i

[ N
n
.
Dimostrazione Sostituendo la serie (1.43) nel sistema (1.42) e procedendo
come in precedenza, si ricava

i
+en
=
1

n
+ 1
p
i

(a
irh

, a
i

,
i

) N
n
,
ove p
i

`e lo stesso polinomio che compare nella (1.40). Poiche tale polinomio


ha coecienti non negativi, e poiche
i

= 0 quando
n
= 0 in virt` u delle
condizioni ai limiti, si deduce intanto, per induzione sullindice
n
, che
i

0
per ogni multi-indice . Inoltre si ha
[c
i
+en
[ =
1

n
+ 1
[p
i

(a
irh

, a
i

, c
i

)[

n
+ 1
p
i

([a
irh

[, [a
i

[, [c
i

[)
1

n
+ 1
p
i

(a
irh

, a
i

, [c
i

[).
Proveremo ora che [c
i

[ [
i

[ =
i

per induzione su
n
. Poiche [c
i

[ = 0 =
i

per ogni N
n
con
n
= 0, `e chiaro che la relazione desiderata `e vera quando

n
= 0. Supponiamo vera la disuguaglianza per tutti i multi-indici con

n
= k 1, e proviamola per quelli con
n
= k. Sia dunque N
n
con

n
= k e poniamo = e
n
: allora
[c
i

[ = [c
i
+en
[
1

n
+ 1
p
i

(a
irh

, a
i

, [c
i

[),
25
ove, come sappiamo, p
i

dipende da coecienti [c
i

[ con
n

n
=
n
1 =
k 1. Quindi, per ipotesi induttiva, si ha [c
i

[
i

; ne segue
[c
i

[
1

n
+ 1
p
i

(a
irh

, a
i

, [c
i

[)
1

n
+ 1
p
i

(a
irh

, a
i

,
i

) =
i
+en
=
i

,
e dunque il passo induttivo `e dimostrato. Ci`o prova la tesi della proposizione
1.5.2.
A questo punto non ci resta che costruire un sistema del tipo (1.42), i cui
coecienti siano analitici e soddisno le relazioni (1.44), ed una sua soluzione
= (
1
, . . . ,
N+1
) che sia analitica per [y[ < , per qualche > 0; dalla
proposizione 1.5.2 dedurremo allora che la serie (1.39) converge per [y[ <
e denisce una soluzione analitica w = (w
1
, . . . , w
N+1
) del sistema (1.38),
cosicche la dimostrazione del teorema di Cauchy-Kovalevskaya sar`a conclusa.
Scegliamo le funzioni A
i
rh
e A
i
come segue:
A
i
rh
(y

, z) = A
i
(y

, z) =
C

n1
p=1
y
p

N+1
j=1
z
j
, (1.45)
ove C `e una costante positiva. Come si vede, si tratta di ununica funzione
indipendente dagli indici i, r, h e analitica per [y

[ + [z[ < . Il suo sviluppo


in serie si calcola facilmente per mezzo del seguente
Lemma 1.5.3 Sia g(x) =
r
r
P
n
p=1
xp
, [x[ <
r

n
. Allora
g(x) =

N
n
[[!
r
||
!
x

per [x[ <


r

n
.
Dimostrazione Essendo

n
p=1
[x
p
[ [x[

n, risulta
g(x) =
1
1
1
r

n
p=1
x
p
=

k=0
_
1
r
n

p=1
x
p
_
k
per [x[ <
r

n
.
Daltronde `e noto, e si verica agevolmente per induzione, che
_
n

p=1
x
p
_
k
=

N
n
, ||=k
[[!
!
x

k N, x R
n
, (1.46)
26
da cui
g(x) =

k=0
1
r
k

N
n
, ||=k
[[!
!
x

N
n
[[!
r
||
!
x

per [x[ <


r

n
.
Da questo lemma segue subito che per [y

[ +[z[ <

n
si ha
A
i
rh
(y

, z) = A
i
(y

, z) =

N
n1
, N
N+1
C
([[ +[[)!

||+||
!!
(y

,
e, come si vede, i coecienti di questa serie di potenze sono non negativi. La
costante C va scelta sucientemente grande da garantire che sia
[a
irh

[ a
irh

, [a
i

[ a
i

N
n1
, N
N+1
.
Ci` o `e sempre possibile: infatti, ssato ]0, [, basta scegliere
C = sup
N
n1
,N
N+1
([a
irh

[
||+||
+[a
i

[
||+||
) <
(il che `e lecito, visto che le serie

,
[a
irh

[
||+||
e

,
[a
i

[
||+||
conver-
gono) per ottenere
[a
irh

[ +[a
i

[
C
r
||+||
C
([[ +[[)!
r
||+||
!!
= a
irh

= a
i

.
Il sistema (1.42) con i coecienti (1.45) diventa
_
_
_
D
n

i
=
C

P
n1
p=1
yp
P
N+1
j=1

j
_

N+1
r=1

n1
h=1
D
h

r
+ 1
_
,

i
[

= 0, i = 1, . . . , N + 1.
(1.47)
Questo sistema, che `e in eetti una sola equazione ripetuta N + 1 volte, ha
una soluzione esplicita
i
= (indipendente da i), data da
(y) =
1
n(N + 1)
_
_

n1

p=1
y
p

_
_

n1

p=1
y
p
_
2
2Cn(N + 1)y
n
_
_
,
denita, nonche analitica, per [y[ < , con < sucientemente piccolo.
Per vericare che essa `e soluzione, conviene porre
x =
n1

p=1
y
p
, y = y
n
, g =
_
( x)
2
2Cn(N + 1)y.
27
Allora possiamo scrivere
(x, y) =
1
n(N + 1)
( x g),
e lequazione che questa funzione deve risolvere `e

y
=
C
x (N + 1)
_
(N + 1)(n 1)

x
+ 1
_
.
Risulta in eetti

y
=
1
n(N + 1)
g
y
=
C
g
,

x
=
1
n(N + 1)

1
n(N + 1)
g
x
=
1
n(N + 1)
_
1 +
x
g
_
,
da cui, come si voleva,
C
x (N + 1)
_
(N + 1)(n 1)

x
+ 1
_
=
=
C
( x)(1
1
n
) +
g
n
_
1
n
+
x
g
_
1
1
n
__
=
C
g
=

y
.
`
E chiaro inoltre che [

= 0 e, in virt` u di tutta la costruzione precedente,


i coecienti della serie di potenze di cui `e somma vericano le relazioni
[c
i

per ogni N
n
. Ci`o completa la dimostrazione del teorema di
Cauchy-Kovalevskaya.
Osservazione 1.5.4 Il teorema di Cauchy-Kovalevskaya vale pi` u in generale
per equazioni totalmente non lineari della forma
_
_
_
F(x, u(x), Du(x), . . . , D
m
u(x)) = 0
u[
S
=
0
,
u

S
=
1
, . . . ,

m1
u

m1

S
=
m1
,
con dati F, s,
0
, . . . ,
m1
analitici, sotto la condizione che essi non siano
caratteristici, ossia

||=m
F
q

(x, u, . . . , D
m
u)

,= 0 su S.
La dimostrazione `e del tutto simile, anche se formalmente pi` u complicata.
28
Esempio 1.5.5 (Kovalevskaya) Consideriamo il problema di Cauchy
_
u
t
= u
xx
in R
2
,
u(x, 0) =
1
1+x
2
, x R.
(1.48)
Osserviamo che la retta iniziale, t = 0, `e caratteristica. Assegnando solo il
dato iniziale per la u, comunque, per t = 0 sono note le derivate rispetto a x,
mentre quelle rispetto a t si ricavano dallequazione; quindi il problema do-
vrebbe avere una soluzione ben determinata (e in eetti `e proprio cos`, come
vedremo nel terzo capitolo). Aermiamo per`o il fatto seguente: nonostante
che tutti i dati siano analitici, questo problema non ha alcuna soluzione ana-
litica.
Ragioniamo per assurdo e sia u(x, t) una soluzione analitica di (1.48). Essa
avr` a uno sviluppo in serie di centro (0, 0) della forma
u(x, t) =

m,h=0
u
m,h
t
m
x
h
;
dobbiamo ora calcolare i coecienti u
m,h
. Poiche per t = 0 si ha

h=0
u
0,h
x
h
= u(x, 0) =
1
1 +x
2
=

k=0
(1)
k
x
2k
,
si deduce intanto
u
0,h
=
_
(1)
k
se h = 2k,
0 se h = 2k + 1.
Poi, dallequazione dierenziale si ricava
u
t
=

m=1

h=0
mu
m,h
t
m1
x
h
= u
xx
=

m=0

h=2
h(h 1)u
m,h
t
m
x
h2
,
ovvero

p=0

k=0
(p + 1)u
p+1,k
t
p
x
k
=

p=0

k=0
(k + 2)(k + 1)u
p,k+2
t
p
x
k
,
29
e dunque otteniamo le relazioni
_

_
u
p+1,h
=
1
p+1
(h + 1)(h + 2)u
p,h+2
p, h N,
u
0,h
=
_
(1)
k
se h = 2k,
0 se h = 2k + 1.
h N.
(1.49)
Da qui segue subito u
p,h
= 0 se h `e dispari. Se invece h `e pari si ha
_
u
p+1,2k
=
1
p+1
(2k + 1)(2k + 2)u
p,2k+2
p, k N,
u
0,k
= (1)
k
k N.
(1.50)
Induttivamente si deduce allora
u
p,2k
=
1
p
(2k + 1)(2k + 2)u
p1,2k+2
=
=
1
p(p 1)
(2k + 1)(2k + 2)(2k + 3)(2k + 4)u
p2,2k+4
=
= =
1
p!
(2k + 1)(2k + 2) . . . (2k + 2p 1)(2k + 2p)u
0,2k+2p
=
=
(1)
k+p
(2k + 2p)!
p!(2k)!
p, k N.
Ma la serie

p,k=0
(1)
k+p
(2k+2p)!
p!(2k)!
t
p
x
2k
non pu`o convergere, salvo che nel punto
(0, 0): infatti per ogni t > 0 e x ] 1, 1[ si ha

p,k=0
(2k + 2p)!
p!(2k)!
t
p
x
2k

p=0
(2p)!
p!
t
p
1
1 x
2
= +,
come agevolmente si verica utilizzando il criterio del rapporto. Si conclude
pertanto che non esiste alcuna soluzione analitica del problema (1.48).
1.6 Equazioni risolubili elementarmente
Certe equazioni alle derivate parziali sono risolubili con metodi elementari: in
questo paragrafo ne forniamo una breve rassegna per mezzo di alcuni esempi.
Andremo alla ricerca sempre e soltanto di soluzioni classiche, ossia tali che
tutte le derivate che compaiono nellequazione siano continue.
30
Esempio 1.6.1 La pi` u semplice equazione alle derivate parziali `e senza
dubbio la seguente:
u
x
(x, y) = 0,
che peraltro rientra fra quelle studiate nel paragrafo 1.3. Le sue soluzioni
sono, evidentemente, tutte e sole le funzioni della forma u(x, y) = g(y), con
g funzione continua arbitraria.
Esempio 1.6.2 Consideriamo lequazione
au
x
(x, y) +bu
y
(x, y) = 0,
ove a, b sono costanti reali non entrambe nulle. Anche questa equazione fa
parte di quelle analizzate nel paragrafo 1.3. Posto = (a, b), lequazione
ci dice che
u

= 0, quindi ogni soluzione u(x, y) deve essere costante lungo


le rette che hanno la direzione di , ossia quelle di equazione bx ay = k,
con k R (che sono le linee caratteristiche associate allequazione). Con il
cambiamento di variabili
_
= bx +ay
= ax +by,

_
x =
b+a
a
2
+b
2
y =
a+b
a
2
+b
2
,
scrivendo v(, ) = u(
b+a
a
2
+b
2
,
a+b
a
2
+b
2
), si trova che v verica
v

=
u
x
a +u
y
b
a
2
+b
2
= 0.
Dallesempio 1.6.1 segue allora v(, ) = g(), con g arbitraria funzione
continua. Pertanto
u(x, y) = v(, ) = g() = g(bx +ay),
con g arbitraria funzione di classe C
1
.
Allo stesso risultato si arriva con la teoria del paragrafo 1.3: si trova infatti
che le soluzioni sono date implicitamente dalla relazione
F(bx +ay, u(x, y)) = 0,
con F di classe C
1
avente gradiente non nullo.
31
Esempio 1.6.3 Lequazione del secondo ordine
u
xy
(x, y) = 0
si risolve facilmente utilizzando lesempio 1.6.1: si ha successivamente
u
x
(x, y) = g(x), g arbitraria funzione continua,
u(x, y) =
_
x
c
g() d +h(y), h arbitraria funzione di classe C
1
,
ove c `e una costante qualunque. Si conclude che
u(x, y) = k(x) +h(y),
con h, k arbitrarie funzioni di classe C
1
.
Esempio 1.6.4 Fissata g C
1
(), ove `e un aperto di R
2
, consideriamo
lequazione
u
x
(x, y)g
y
(x, y) u
y
(x, y)g
x
(x, y) = 0, (x, y) . (1.51)
Sulla base del lemma 1.3.2, possiamo dire che le soluzioni sono tutte le
funzioni denite in forma implicita da
F(u(x, y), g(x, y)) = 0,
con F funzione arbitraria di classe C
1
con gradiente mai nullo.
Esempio 1.6.5 Consideriamo lequazione
u
xx
u
yy
= 0;
quando x `e la variabile tempo, questa `e lequazione uni-dimensionale del-
le onde, o di DAlembert. Le caratteristiche di questa equazione sono, in
accordo con la (1.26), le rette
x +y = c, x y = d, c, d R.
Con il cambiamento di variabili
_
= x +y
= x y

_
x =
+
2
y =

2
, u(x, y) = v(x +y, x y) = v(, ),
32
lequazione diventa, come `e facile vericare
0 = u
xx
u
yy
= 4v

,
ossia v

= 0. Come sappiamo dallesempio 1.6.3, questa equazione ha le


soluzioni v(, ) = a()+b(), con a, b arbitrarie funzioni di classe C
1
; dunque
otteniamo che lequazione originaria ha le soluzioni
u(x, y) = a(x +y) +b(x y),
ove stavolta per`o a e b sono arbitrarie funzioni di classe C
2
.
In modo analogo, lequazione
u
xx

1
c
2
u
yy
= 0, (1.52)
ove c R 0, ha per soluzioni le funzioni
u(x, y) = a(x +cy) +b(x cy),
con a, b arbitrarie funzioni di classe C
2
.
Esempio 1.6.6 Lequazione di Laplace bidimensionale `e la seguente:
u
xx
+u
yy
= 0.
Essa non ha caratteristiche. Formalmente, si ottiene dalla (1.52) scegliendo
c = i: otteniamo come soluzioni tutte le funzioni della forma
u(x, y) = a(x +iy) +b(x iy) (1.53)
con a e b funzioni di classe C
2
.
In eetti quello dellesempio precedente `e molto di pi` u di un calcolo formale:
vale infatti la seguente
Proposizione 1.6.7 Sia u C
2
(), ove R
2
`e un aperto semplicemente
connesso. Sono fatti equivalenti:
(i) u
xx
+u
yy
= 0 in ,
(ii) esiste una funzione f : C olomorfa tale che u(x, y) = Re f(x, y).
33
(iii) esiste una funzione g : C olomorfa tale che u(x, y) = Img(x, y).
Dimostrazione Anzitutto, (ii) e (iii) sono equivalenti: basta porre g = if,
ovvero f = ig. Dunque basta provare che (i) `e equivalente a (ii).
Se vale (ii), ssato (x, y) = x +iy = z esiste il limite
lim
w0
f(z +w) f(z)
w
= f

(z) C.
Poniamo u = Ref, v = Imf: scegliendo w = h R, si ricava
f

(z) = lim
h0
f(x +h +iy) f(x +iy)
h
=
f
x
(z) = u
x
(x, y) +iv
x
(x, y);
scegliendo invece w = ik, k R, si trova analogamente
if

(z) = lim
k0
f(x +iy +ik) f(x +iy)
k
=
f
y
(z) = u
y
(x, y) +iv
y
(x, y).
Uguagliando parte reale e parte immaginaria deduciamo
u
x
= v
y
, u
y
= v
x
in .
Queste sono le equazioni di Cauchy-Riemann. Da esse, derivando, ricaviamo
subito
u
xx
= v
xy
= u
yy
in ,
ossia vale (i). Si noti che anche v verica la stessa equazione.
Se, viceversa, vale (i), allora la forma dierenziale lineare = u
y
dx +u
x
dy
`e chiusa in : poiche `e semplicemente connesso, essa `e esatta in . Sia v
una primitiva di : si ha allora
v
x
= u
y
, v
y
= u
x
in ,
ossia u e v risolvono le equazioni di Cauchy-Riemann in . Posto, per ogni
z = x +iy = (x, y) ,
f(z) = u
_
z +z
2
,
z z
2i
_
+iv
_
z +z
2
,
z z
2i
_
= u(x, y) +iv(x, y),
34
proviamo che f `e olomorfa: se z = x +iy si ha, con w = h +ik,
f(z +w) f(z)
w
=
=
u(x +h, y +k) u(x, y)
h +ik
+i
v(x +h, y +k) v(x, y)
h +ik
=
=
1
h +ik
_
1
0
d
dt
[u(x +th, y +tk) +iv(x +th, y +tk)]dt =
=
1
h +ik
_
1
0
[u
x
h +u
y
k +iv
x
h +iv
y
k]dt =
=
1
h +ik
_
1
0
[u
x
h +u
y
k iu
y
h +iu
x
k]dt =
=
1
h +ik
_
1
0
(u
x
iu
y
)[h +ik]dt =
=
_
1
0
[u
x
(x +th, y +tk) iu
y
(x +th, y +tk)]dt,
e per w 0, con un passaggio al limite sotto il segno di integrale, otteniamo
che f `e olomorfa con f

(z) = u
x
(x, y) iu
y
(x, y): ci`o prova (ii).
Ad esempio, risolvono lequazione di Laplace le funzioni
x
2
y
2
, 2xy (scegliendo in (1.53) a(s) = b(s) = s
2
/2),
x
3
3xy
2
, 3x
2
y y
3
(con a(s) = b(s) = s
3
/2),
e
x
cos y, e
x
sin y (con a(s) = b(s) = e
s
/2),
log(x
2
+y
2
) (con a(s) = b(s) = log s).
1.7 Il metodo di separazione delle variabili
Talvolta `e possibile risolvere unequazione dierenziale alle derivate parzia-
li in due variabili x, y ricercando dapprima soluzioni della forma X(x)Y (y)
(cio`e a variabili separate), e poi cercando soluzioni pi` u generali sotto forma
di combinazioni lineari (nite o innite) delle precedenti. Il metodo `e rivol-
to alla ricerca di soluzioni che soddisno, insieme allequazione, determinate
condizioni ai limiti. Esso `e alquanto generale, ma si presta ad essere meglio
descritto tramite qualche esempio.
35
Consideriamo ancora lequazione di Laplace in due dimensioni, u
xx
+u
yy
= 0,
in un aperto R
2
.
`
E naturale che una soluzione della forma u(x, y) =
X(x)Y (y) sia denita sul prodotto cartesiano di due intervalli di R: suppor-
remo quindi =]a, b[]c, d[. Inoltre, a meno di omotetie (x, y) (
xa
ba
,
yc
ba
)
ci si pu`o ridurre al caso =]0, 1[]0, L[ (con L =
dc
ba
). Studieremo in
denitiva lequazione di Laplace bidimensionale in un rettangolo:
u
xx
+u
yy
= 0, (x, y) ]0, 1[]0, L[. (1.54)
Sostituendo in (1.54) u(x, y) = X(x)Y (y), si ottiene
X

(x)Y (y) +X(x)Y

(y) = 0,
ovvero, dividendo per XY (che ovviamente si suppone non nullo),
X

(x)
X(x)
=
Y

(y)
Y (y)
(x, y) ]0, 1[]0, L[.
Dato che il primo membro dipende solo da x e il secondo soltanto da y, si
deduce che entrambi i membri sono costanti: in altre parole, anche una
funzione a variabili separate u(x, y) = X(x)Y (y) risolva lequazione (1.54), `e
necessario e suciente che esista R tale che
_
X

(x) = X(x) in ]0, 1[,


Y

(y) = Y (y) in ]0, L[.


(1.55)
Le due equazioni che compaiono in (1.55) sono equazioni ordinarie del secon-
do ordine: le soluzioni sono
X(x) =
_

_
c
1
cos

x +c
2
sin

x se > 0
c
1
+c
2
x se = 0
c
1
cosh

x +c
2
sinh

x se < 0,
(1.56)
Y (y) =
_

_
c
3
cosh

y +c
4
sinh

y se > 0
c
3
+c
4
y se = 0
c
3
cos

y +c
4
sin

y se < 0.
(1.57)
Dunque il loro prodotto u(x, y) dipender`a da quattro costanti arbitrarie: per
selezionarne una, occorreranno perci`o quattro condizioni ai limiti. Per le-
quazione di Laplace, tipicamente, si prescrive il valore della soluzione sulla
36
frontiera dellaperto dove lequazione stessa `e soddisfatta: questo `e il proble-
ma di Dirichlet. Nel nostro caso prescriveremo il valore di u sui quattro lati
del rettangolo ]0, 1[]0, L[:
_

_
u(x, 0) = f
1
(x), x [0, 1],
u(1, y) = f
2
(y), y [0, L],
u(x, L) = f
3
(x), x [0, 1],
u(0, y) = f
4
(y), y [0, L],
(1.58)
ove f
1
, f
2
, f
3
e f
4
sono funzioni di classe C
1
assegnate. Naturalmente, se
vogliamo che la soluzione sia continua sul rettangolo chiuso, dovremo imporre
condizioni di compatibilit`a fra i dati negli estremi:
f
1
(1) = f
2
(0), f
2
(L) = f
3
(1), f
3
(0) = f
4
(L), f
4
(0) = f
1
(0). (1.59)
Sfruttando la linearit`a del problema, possiamo costruire la soluzione come
somma delle soluzioni di problemi in cui tre su quattro dei dati alla frontiera
siano nulli: in altre parole, si studiano quattro problemi di Dirichlet in cui i
dati sono
_
_
_
_
f
1
0
0
0
_
_
_
_
,
_
_
_
_
0
f
2
0
0
_
_
_
_
,
_
_
_
_
0
0
f
3
0
_
_
_
_
,
_
_
_
_
0
0
0
f
4
_
_
_
_
,
rimandando ad un secondo momento la questione di come imporre la (1.59).
Consideriamo il primo problema: cerchiamo una funzione u
1
(x, y) tale che
_

_
(u
1
)
xx
+ (u
1
)
yy
= 0 in ]0, 1[]0, L[
u
1
(x, 0) = f
1
(x), u
1
(x, L) = 0, x [0, 1],
u
1
(0, y) = 0, u
1
(1, y) = 0, y [0, L],
(1.60)
Cominciamo a determinare la funzione X(x): vogliamo che sia
X(1)Y (y) = u(1, y) = 0, X(0)Y (y) = u(0, y) = 0,
e avendo supposto Y ,= 0 deduciamo per la X le condizioni ai limiti
X(0) = X(1) = 0.
37
Si vede subito che se la (1.56) deve fornire una soluzione non nulla che verichi
queste condizioni, il numero deve essere positivo. In tal caso, per`o, si ha
X(0) = 0 = c
1
= 0, X(1) = 0 = c
2
sin

= 0,
e poiche non vogliamo che X sia nulla, ci`o implica = k
2

2
, k N
+
. Per
questi valori di si hanno le soluzioni non banali
X
k
(x) = sin kx, k N
+
.
Avendo ormai stabilito che i possibili valori di sono i numeri k
2

2
, andiamo
a determinare la funzione Y = Y
k
corrispondente al valore
k
= k
2

2
: essendo

k
> 0, da (1.57) segue che Y
k
sar`a del tipo
Y
k
(y) = c
3
cosh ky +c
4
sinh ky,
e la condizione u(x, L) = X(x)Y (L) = 0 implica che sia Y (L) = 0. Impo-
nendo questo vincolo, troviamo che deve aversi
0 = c
3
cosh kL +c
4
sinh kL;
si pu`o allora prendere (e la scelta `e unica a meno di una costante moltiplica-
tiva)
c
3
= sinh kL, c
4
= cosh kL,
e dunque
Y
k
(y) = c
k
[cosh ky sinh kL sinh ky cosh kL] = c
k
sinh k(L y)
ove c
k
`e una costante arbitraria. Abbiamo cos` costruito la funzione
u
1k
(x, y) = X
k
(x)Y
k
(y) = c
k
sin kx sinh k(L y),
la quale verica lequazione e tre delle quattro condizioni ai limiti: in gene-
rale, infatti, non sar`a vero che u
1k
(x, 0) = f
1
(x).
Consideriamo per`o la sovrapposizione delle u
1k
, cio`e la serie
u
1
(x, y) =

k=1
c
k
sin kx sinh k(L y), (1.61)
la quale sar`a convergente per ogni punto (x, y) del rettangolo, purche i numeri
c
k
tendano a 0 abbastanza rapidamente.
`
E chiaro che u
1
verica ancora le
38
tre condizioni ai limiti con dato nullo. La quarta condizione `e anchessa
vericata se e solo se risulta

k=1
c
k
sin kx sinh kL = f
1
(x) x [0, 1].
Questo `e possibile solo se il primo membro `e la serie di Fourier di f
1
relativa
al sistema ortonormale
1

2
, cos kx, sin kx relativo allintervallo [1, 1];
trattandosi di una serie di soli seni, ci`o implica che la sua somma `e una
funzione dispari e dunque f
1
, a priori denita su [0, 1], va prolungata per
disparit`a su [1, 1]. Dunque in (1.61) deve aversi
c
k
=
b
k
sinh kL
, ove b
k
= 2
_
1
0
f
1
() sin k d k N
+
.
Poiche b
k
0 per k , `e facile vericare che la serie (1.61), ossia
u
1
(x, y) =

k=1
b
k
sin kx
sinh k(L y)
sinh kL
, b
k
= 2
_
1
0
f
1
() sin k d, (1.62)
converge in ogni punto interno al rettangolo, insieme con tutte le sue derivate.
Inoltre nei punti (x, 0) essa ha per somma il prolungamento dispari di f
1
,
laddove questo `e continuo: ci`o accade quando x ]0, 1[, ma non negli estremi,
a meno che non si abbia f
1
(0) = f
1
(1) = 0.
Cos` la soluzione u
1
denita in (1.62) sar`a di classe C
2
, anzi C

, allinterno
del rettangolo, e prender`a i dati al bordo ovunque tranne che nei vertici (0, 0)
e (0, 1) dove il suo valore sar`a 0.
Procedendo in modo del tutto analogo si trovano le soluzioni degli altri tre
problemi di Dirichlet:
u
2
(x, y) =

k=1
d
k
sinh
k
L
x
sinh
k
L
sin
k
L
y, d
k
=
2
L
_
L
0
f
2
() sin
k
L
d, (1.63)
u
3
(x, y) =

k=1
a
k
sin kx
sinh ky
sinh kL
, a
k
= 2
_
1
0
f
3
() sin k d, (1.64)
u
4
(x, y) =

k=1
f
k
sinh
k
L
(1 x)
sinh
k
L
sin
k
L
y, f
k
=
2
L
_
L
0
f
4
() sin
k
L
d. (1.65)
39
Anche le funzioni u
2
, u
3
e u
4
sono di classe C

nellinterno del rettango-


lo, e si attaccano ai dati al bordo in tutti i punti tranne che nei vertici del
rettangolo, malgrado la presenza delle condizioni di compatibilit`a (1.59). In
denitiva, la somma u = u
1
+ u
2
+ u
3
+ u
4
`e di classe C

nellinterno del
rettangolo, ove risolve lequazione di Laplace, ed `e continua sullintero ret-
tangolo chiuso ad eccezione dei vertici, prendendo i dati al bordo lungo i lati
del rettangolo e valendo 0 nei vertici. Essa dunque coincide con i dati nei
quattro vertici solo se si fa lipotesi che tutte le quantit`a presenti in (1.59)
siano nulle.
Osserviamo per`o che un piccolo ranamento del metodo permette di costrui-
re una soluzione regolare del problema di Dirichlet (1.54)-(1.58) sotto la sola
ipotesi di compatibilit`a (1.59). Consideriamo la funzione
z(x, y) = p +qx +ry +sxy, (1.66)
la quale risolve lequazione di Laplace su tutto R
2
per ogni scelta dei para-
metri p, q, r, s. Scegliamo tali parametri in modo che sia
z(0, 0) = d, z(1, 0) = a, z(0, L) = c, z(1, L) = b, (1.67)
dove a, b, c, d sono i valori presenti in (1.59):
a = f
1
(1) = f
2
(0), b = f
2
(L) = f
3
(1),
c = f
3
(0) = f
4
(L), d = f
4
(0) = f
1
(0).
Si ricava subito
p = d, q = a d, r =
c d
L
, s =
b a c +d
L
.
La funzione z, oltre allequazione dierenziale (1.54) e alle condizioni (1.67),
verica
z(x, 0) = p +qx, z(x, L) = p +qx +rL +sLx x [0, 1],
z(0, y) = p +ry, z(1, y) = p +q +ry +sy y [0, L].
(1.68)
Sia adesso v(x, y) la funzione che risolve il problema di Dirichlet per le-
quazione di Laplace sul rettangolo [0, 1] [0, L] con dati f
1
(x) p qx,
f
2
(y) pq ry sy, f
3
(x) pqxrLsLx, f
4
(y) pry, ottenuta col
metodo di separazione delle variabili visto in precedenza: si noti che questi
40
dati, nei quattro vertici, forniscono il valore 0. La funzione v, come si `e visto,
`e la somma di quattro funzioni v
1
, v
2
, v
3
, v
4
, ciascuna delle quali `e nulla su
tre dei quattro lati e, in particolare, `e nulla sui quattro vertici. Si conclude
che la funzione
u(x, y) = v(x, y) +z(x, y),
ove z `e data da (1.66), risolve lequazione di Laplace sul rettangolo [0, 1]
[0, L], prende sul bordo i dati originari f
1
, f
2
, f
3
, f
4
, e sui vertici assume gli
stessi valori di z forniti dalla (1.67), cio`e i numeri che compaiono nella (1.59).
Quindi u risolve lequazione di Laplace nellinterno del rettangolo ed `e con-
tinua sulla frontiera, ove coincide esattamente con i dati.
La separazione delle variabili si pu`o applicare anche ad altri problemi, come
mostrano gli esempi che seguono.
Esempi 1.7.1 (1) Consideriamo il problema di Cauchy-Dirichlet per lequa-
zione del calore uni-dimensionale:
_

_
u
t
u
xx
= 0 in ]0, L[]0, [
u(0, t) = u(L, t) = 0 in [0, [
u(x, 0) = f(x) in [0, L].
Cercando una soluzione della forma u(x, t) = X(x)T(t) si trova una equazio-
ne lineare del primo ordine per T(t) e del secondo ordine per X(x), con dati
X(0) = X(L) = 0. Procedendo nel modo consueto, si trova la soluzione
u(x, t) =

n=1
b
n
e

n
2

2
L
2
t
sin
n
L
x, b
n
=
2
L
_
L
0
f(t) sin
n
L
t dt.
La serie converge con tutte le sue derivate in R]0, [, grazie alla presenza
dellesponenziale. Per t = 0 la u si attacca al dato f se il prolungamento
dispari di f `e di classe C
1
.
(2) Consideriamo ora il problema di Cauchy-Dirichlet per lequazione della
corda vibrante (equazione delle onde uni-dimensionale):
_

_
u
tt
u
xx
= 0 in ]0, L[]0, [
u(0, t) = u(L, t) = 0 in [0, [
u(x, 0) = u
0
(x), u
t
(x, 0) = u
1
(x) in [0, L].
41
Con i soliti metodi, la soluzione u(x, t) = X(x)T(t) si trova della forma
u(x, t) =

n=1
_
b
n
cos
n
L
t +
L
n

n
sin
n
L
t
_
sin
n
L
x,
ove
b
n
=
2
L
_
L
0
u
0
() sin
n
L
d,
n
=
2
L
_
L
0
u
1
() sin
n
L
d.
Questa serie converge in tutti i punti della semistriscia [0, L] [0, [, purche
risulti ad esempio

n=1
(n[b
n
[ +[
n
[) < ,
il che `e certamente vero se si suppone che i prolungamenti dispari di u
0
e u
1
siano rispettivamente di classe C
2
e C
1
.
(3) Si pu`o usare il metodo di separazione della variabili anche in pi` u di
due dimensioni. Ad esempio, consideriamo lequazione di Laplace in tre
dimensioni,
u
xx
+u
yy
+u
zz
= 0
nel cubo [0, ]
3
, con le condizioni ai limiti
_
u = 0 per x = 0, x = , y = 0, y = , z = ,
u(x, y, 0) = g(x, y).
Cercando una soluzione u(x, y, z) = X(x)Y (y)Z(z), si arriva alla relazione
X

Y Z +XY

Z +XY Z

= 0,
da cui
X

X
+
Y

Y
=
Z

Z
;
ci`o implica
X

X
+
Y

Y
= c
1
=
Z

Z
,
e quindi
X

X
= c
1

Y
= c
2
.
42
In denitiva
X

X
= c
2
,
Y

Y
= c
1
c
2
,
Z

Z
= c
1
.
Le condizioni ai limiti forniscono
X(0) = X(), Y (0) = Y (), Z() = 0.
Risolvendo lequazione per X, si trova c
2
= n
2
, n N
+
, e X
n
(x) = sin nx.
Risolvendo per la Y si ottiene poi c
1
c
2
= m
2
, m N
+
, e y
m
(y) = sin my.
Inne per la Z si ricava c
1
= m
2
n
2
e Z
mn
(z) = c
mn
sinh

m
2
+n
2
(z).
In denitiva, sovrapponendo le soluzioni trovate, la soluzione u ha la forma
u(x, y, z) =

m,n=1
c
mn
sinh

m
2
+n
2
( z) sin nx sin my.
Imponendo inne che u(x, y, 0) coincida con g(x, y) si deduce che
c
mn
=
g
mn
sinh

m
2
+n
2

, g
mn
=
4

2
_

0
_

0
g(, ) sin n sin m dd.
Si pu`o vericare che se i g
mn
sono limitati, il che `e vero se si suppone
_

0
_

0
[g(x, y)[dxdy < , allora la serie che denisce u converge uniforme-
mente con tutte le sue derivate in [0, ] [0, ] [, ] per ogni ]0, [.
Quindi, u `e di classe C

nel cubo aperto e risolve ivi lequazione; inoltre u


`e nulla su tutte le facce del cubo eccetto z = 0. Se, in pi` u, il prolungamento
dispari di g(x, y) rispetto a x e a y `e di classe C
1
, allora la serie della u
converge uniformemente su tutto il cubo e si attacca a tutti i dati al bordo.
Per concludere, osserviamo che molti altri problemi ai limiti sono trattabi-
li col metodo di separazione delle variabili, come ad esempio quelli relativi
alle equazioni di Sturm-Liouville: rimandiamo a [10] per approfondimenti.
Naturalmente, il metodo non `e onnipotente: per applicarlo, occorrono le tre
condizioni che seguono.
1. Loperatore dierenziale L[u] deve essere separabile, ossia tale che esista
una funzione (x, y) che verichi
L[X(x)Y (y)]
(x, y)X(x)Y (y)
= a(x) +b(y);
si noti che L pu`o comunque avere coecienti non costanti.
43
2. Le condizioni ai limiti devono essere assegnate su un rettangolo.
3. Le condizioni su un lato x = c non devono contenere derivate rispetto a
y, ne coecienti che dipendano da y; analoghe condizioni devono valere
per i lati y = c.
1.8 Classicazione delle equazioni del secon-
do ordine
Come sappiamo, unequazione del secondo ordine lineare, omogenea, a coef-
cienti costanti ha la forma seguente:
L[u] =
n

i,j=1
a
ij
D
i
D
j
u +
n

i=1
b
i
D
i
u +cu = 0, (1.69)
ove la matrice A = a
ij
`e reale e simmetrica. In particolare, A ha n autova-
lori reali (non necessariamente tutti distinti), ed `e diagonalizzabile mediante
una matrice ortogonale U:
U
1
AU = U
t
AU = D =
_
_
_

1
0
.
.
.
.
.
.
.
.
.
0
n
_
_
_
.
Con il cambiamento di variabili = Ux, posto U = q
ij
e v() = v(Ux) =
u(x), `e facile vericare che
D
i
u(x) =
n

k=1
D
k
v(Ux)q
ki
, D
j
D
i
u(x) =
n

h,k=1
D
h
D
k
v(Ux)q
hj
q
ki
,
cosicche
0 =
n

i,j=1
a
ij
D
i
D
j
u +
n

i=1
b
i
D
i
u +cu =
=
n

h,k=1
_
n

i,j=1
q
ki
a
ij
q
hj
_
D
h
D
k
v() +
n

k=1
_
n

i=1
q
ki
b
i
_
D
k
v() +cv() =
=
n

k=1

k
D
2
k
v() +
n

k=1
B
k
D
k
v() +cv().
44
Inoltre, se tutti gli autovalori
k
sono non nulli, `e possibile rendere nulli i
coecienti B
k
=

n
i=1
q
ki
b
i
con lulteriore sostituzione
w() = v()e
P
n
k=1
B
k
2
k

k
:
si ottiene infatti per w, come `e facile vericare, lequazione nella sua forma
canonica
n

k=1

k
D
2
k
w() +w() = 0, (1.70)
ove
= c
1
4
n

k=1
B
2
k

k
.
Se vi sono m autovalori non nulli, 0 < m < n, ad esempio
m+1
= =

n
= 0, con la sostituzione
w() = v()e
P
m
k=1
B
k
2
k

k
si trova analogamente la forma canonica
m

k=1

k
D
2
k
w() +
n

k=m+1
B
k
D
k
w() +w() = 0, (1.71)
con
= c
1
4
m

k=1
B
2
k

k
.
La classicazione delle equazioni si fa sulla base del segno degli autovalori, e
naturalmente `e invariante rispetto a trasformazioni ortogonali delle variabili
indipendenti. Cominciamo con il caso n = 2, dove si chiarisce lorigine della
terminologia.
Denizione 1.8.1 Sia L loperatore denito in (1.69). Diciamo che esso `e
ellittico se i due autovalori della matrice A hanno lo stesso segno; `e iperbolico
se i due autovalori hanno segno opposto; `e parabolico se uno (e uno solo)
dei due autovalori `e nullo. Lequazione L[u] = 0 `e detta ellittica, iperbolica,
parabolica se tale `e loperatore L.
45
Lorigine dei tre nomi `e legata alla forma delle curve di livello del polinomio
caratteristico associato alloperatore L, che `e
P(x, y) = a
11
x
2
+ 2a
12
xy +a
22
y
2
+b
1
x +b
2
y +c
e, nel caso di n variabili,
P() =
n

i,j=1
a
ij

j
+
n

i=1
b
i

i
+c.
Quando n = 2, linsieme (x, y) R
2
: P(x, y) = t, se non vuoto, `e una
ellisse se gli autovalori sono non nulli e concordi, `e uniperbole se gli autovalori
sono non nulli e discordi, `e una parabola se uno dei due autovalori `e nullo.
Quando n > 2, la casistica si complica. Per n = 3 si hanno i seguenti casi:
tre autovalori concordi: loperatore `e ellittico e le curve di livello del
polinomio caratteristico sono ellissoidi;
due autovalori concordi, uno discorde: loperatore `e iperbolico e le curve
di livello sono iperboloidi a due falde;
due autovalori concordi e uno nullo: loperatore `e parabolico e le curve
di livello sono paraboloidi;
due autovalori discordi e uno nullo: loperatore `e iperbolico degenere
e le curve di livello sono iperboloidi a una falda;
due autovalori nulli e uno non nullo: loperatore `e parabolico degenere
e le curve di livello sono cilindri obliqui a sezione parabolica.
Nel caso generale, i casi sono ancora di pi` u e non tutti sono studiati:
n autovalori concordi: loperatore `e ellittico;
n 1 autovalori concordi, uno discorde: loperatore `e iperbolico;
k autovalori positivi e n k negativi, con 2 k n 2: loperatore `e
ultra-iperbolico: questo `e un caso non studiato, poiche non vi `e nessun
problema sico che conduca ad operatori di questo tipo;
n 1 autovalori concordi, uno nullo: loperatore `e parabolico;
46
n 2 autovalori concordi, due nulli: loperatore `e ultra-parabolico: se
ne trovano alcuni esempi in problemi di tipo biologico (dinamica delle
popolazioni);
k autovalori nulli, n k non tutti concordi: loperatore `e iperbolico
degenere, ed `e poco studiato per lassenza di esempi applicativi.
Se loperatore (1.69) `e a coecienti variabili (continui), la sua natura (ellitti-
cit` a, iperbolicit`a, parabolicit`a) sar`a un fatto puntuale o locale: ad esempio si
dice che L`e ellittico in se per ogni x la matrice A
ij
(x) ha n autovalori
concordi, ossia la forma quadratica associata alla sua parte principale,
(x, ) =
n

i,j=1
a
ij
(x)
i

j
`e denita positiva per ogni x , ovvero denita negativa per ogni x .
Ci` o equivale alla condizione

i,j=1
a
ij
(x)
i

(x)[[
2
R
n
, x ,
con (x) > 0 in .
Ovviamente, esistono anche operatori che cambiano tipo in un ssato aperto:
ad esempio, loperatore
L[u] = u
xx
+xu
yy
+u
y
`e ellittico per x > 0, parabolico per x = 0, iperbolico per x < 0.
Gli operatori che studieremo in dettaglio nel seguito sono i seguenti:
loperatore di Laplace n-dimensionale u =

n
i=1
D
2
i
u,
loperatore del calore (n + 1)-dimensionale u
t
u,
loperatore di DAlembert (n + 1)-dimensionale u = u
tt
u.
47
Capitolo 2
Lequazione di Laplace
2.1 Motivazioni siche
Loperatore di Laplace `e senza dubbio il pi` u importante e il pi` u studiato fra
tutti gli operatori dierenziali alle derivate parziali, essendo il prototipo di
quelli di tipo ellittico ed entrando nella denizione dei pi` u semplici fra quelli
parabolici e iperbolici. Le soluzioni dellequazione di Laplace hanno anche
un nome speciale:
Denizione 2.1.1 Le funzioni u di classe C
2
in un aperto di R
n
, che
risolvono lequazione u = 0 in , si dicono armoniche in .
Invece lequazione non omogenea u = f prende il nome di equazione di
Poisson.
Loperatore di Laplace interviene in numerosi fenomeni sici: ci limitiamo
ad illustrarne alcuni.
Esempio 2.1.2 Nella teoria della gravitazione, la forza con cui una massa
m, concentrata in un punto x
0
R
3
, agisce su una massa unitaria concentrata
in un altro punto x `e data, secondo la legge di Newton, da
F(x) = m
x
0
x
[x
0
x[
3
, x R
3
x
0
.
Il campo di forze F(x) `e conservativo, ossia esiste un potenziale gravitazionale
U(x) tale che
F(x) = U(x) x R
3
x
0
:
48
precisamente, se vogliamo che allinnito il potenziale sia nullo, si ha U(x) =
m
|xx
0
|
.
`
E facile vericare che il potenziale U `e una funzione armonica nella-
perto R
3
x
0
.
Esempio 2.1.3 Una carica elettrica q, posta in un punto x
0
R
3
, agisce su
una carica unitaria situata in un altro punto x con una forza elettrostatica
F(x) =
q
4
0
x x
0
[x x
0
[
3
,
che `e repulsiva se le cariche sono dello stesso segno, attrattiva altrimenti. La
costante
0
`e detta costante dielettrica (nel vuoto). Questo campo di forze
ha la stessa forma del campo gravitazionale: in particolare `e conservativo
e ammette il potenziale elettrostatico U(x) =
q
4
0
1
|xx
0
|
, il quale `e una
funzione armonica in R
3
x
0
.
Esempio 2.1.4 Sia T un aperto semplicemente connesso in R
3
, delimita-
to da una supercie regolare , in cui transita una corrente di uido in-
compressibile (dunque di densit`a (x, y, z) indipendente dal tempo), con
velocit`a v(x, y, z) costante nel tempo. Supponiamo anche assenza di vor-
tici: ci`o signica che il campo vettoriale v `e tale che lintegrale curvilineo
_

(v
1
dx +v
2
dy +v
3
dz) `e nullo per ogni curva chiusa T. Dal teorema di
Stokes segue che lintegrale
_
S
rot v nd `e nullo per ogni supercie regolare
S T; per larbitrariet`a di S si ricava rot v = 0 in T. Dunque la forma
dierenziale v
1
dx + v
2
dy + v
3
dz `e chiusa e quindi, per lipotesi fatta su T,
esatta. Pertanto esiste un potenziale di velocit`a :
v(x, y, z) = (x, y, z) (x, y, z) T.
A causa dellincompressibilit`a, la quantit`a di uido che entra in una qualun-
que palla B T `e pari a quella che ne esce: dunque il usso di v attraverso
B `e nullo, da cui, per il teorema della divergenza e per larbitrariet`a di B,
segue div v = 0 in T; quindi
= div = 0 in T,
cio`e il potenziale della velocit`a `e una funzione armonica.
Esempio 2.1.5 Sia u(x, y, z, t) la temperatura in un punto P = (x, y, z)
dello spazio al tempo t. Se d `e un elemento di supercie centrato in P e
49
con normale , la quantit`a di calore Q che passa attraverso d nellunit`a di
tempo `e, per la legge di Fourier,
Q = k
u

d,
ove k(x, y, z) `e il coeciente di diusione termica. La legge di conservazione
del calore in un corpo di volume V delimitato da una supercie regolare S `e
espressa dalluguaglianza
_
V
c[u(x, y, z, t)]
t
2
t
1
dxdydz =
_
t
2
t
1
_
S
k
u

ddt +
_
t
2
t
1
_
V
F(x, y, z, t) dxdydzdt.
Il primo membro `e la variazione della quantit`a di calore in V nel generico
intervallo di tempo [t
1
, t
2
] [0, [, la quale `e misurata dalla variazione di
temperatura del corpo, moltiplicata per la sua densit`a (x, y, z) e per la sua
capacit`a termica c; a secondo membro gurano il usso di calore attraverso
S nello stesso intervallo, pi` u il contributo nello stesso tempo di sorgenti o
pozzi di calore interni a V . Applicando il teorema della divergenza possiamo
scrivere
_
V
c[u(, t)]
t
2
t
1
dxdydz =
_
t
2
t
1
_
V
(div(ku) +F) dxdydzdt.
Sostituendo al posto di V una palla di centro (x, y, z) V e raggio r,
dividendo per il volume di B e passando al limite per r 0
+
si ottiene
c(x, y, z)[u(x, y, z, t)]
t
2
t
1
=
_
t
2
t
1
(div(k(x, y, z)u(x, y, z, t)) +F(x, y, z, t)) dt;
dividendo ancora per t
2
t
1
e passando al limite per t
2
t
1
si deduce inne,
scrivendo t in luogo di t
1
, lequazione della conduzione termica:
c(x, y, z)
u
t
(x, y, z, t) = div(k(x, y, z)u(x, y, z, t)) +F(x, y, z, t)
in V [0, [. Se poi supponiamo che il corpo sia omogeneo ( costante)
e isotropo (k costante), e non contenga sorgenti ne pozzi interni (F = 0),
allora lequazione diventa
u
t
= u in V [0, [, (2.1)
50
ove =
k
c
`e il coeciente di conduzione termica. Se, inne, il corpo `e in
equilibrio termico, allora
u
t
= 0 e la temperatura u `e una funzione armonica
in V .
La ragione per cui loperatore di Laplace compare in relazione a fenomeni
sici di natura cos` diversa `e legato al fatto che esso `e, a meno di un fattore
costante, lunico operatore dierenziale lineare omogeneo del secondo ordine
che sia invariante rispetto alle rototraslazioni del sistema di coordinate.
`
E
dunque naturale che il Laplaciano intervenga in fenomeni in cui tale inva-
rianza deve sicamente sussistere.
Come sono fatte le funzioni armoniche? In una dimensione (n = 1) lequa-
zione di Laplace diventa semplicemente u

= 0, e quindi ha per soluzioni


tutte e sole le funzioni ani u(x) = ax + b. Se n = 2, come sappiamo dalla
proposizione 1.6.7, sono armoniche in un aperto R
2
tutte le funzioni che
sono parte reale o immaginaria di funzioni olomorfe in .
In dimensione qualunque, unimportante famiglia di funzioni armoniche `e
quella delle armoniche radiali, ossia delle soluzioni dellequazione di Lapla-
ce che dipendono da [x[ (oppure da [x x[, essendo x un punto ssato di
R
n
). Per determinarle, poniamo r = [x x[; se u(x) = v([x x[) = v(r) `e
armonica, risulta:
D
i
u(x) = v

(r)
x
i
x
i
r
, D
2
i
u(x) = v

(r)
(x
i
x
i
)
2
r
2
+
v

(r)
r
v

(r)
(x
i
x
i
)
2
r
3
,
da cui
0 = u(x) = v

(r) +
v

(r)
r
(n 1).
Risolviamo questa equazione ordinaria: si ha
v

(r)
v

(r)
=
n 1
r
= log v

(r) = (n1) log r+c = v

(r) =
K
r
n1
,
e dunque
v(r) =
_
_
_
c
r
n2
+d se n > 2
c log r +d se n = 2.
Queste sono tutte e sole le funzioni armoniche che hanno simmetria sferi-
ca. In particolare il potenziale newtoniano e il potenziale elettrostatico sono
funzioni armoniche in R
3
x.
51
2.2 Il problema di Cauchy
Poiche lequazione di Laplace non ha caratteristiche, se S `e una supercie
(n1)-dimensionale analitica, e u
0
, u
1
sono dati analitici deniti su S, esiste
unica la soluzione analitica del problema di Cauchy
_

_
u = 0 in un intorno di S
u[
S
= u
0
,
u

S
= u
1
.
Per`o in generale non vi `e dipendenza continua dai dati, come mostra il
seguente
Esempio 2.2.1 Sia n = 2 e poniamo S = (x, y) : y = 0. Il problema di
Cauchy
_
_
_
u = 0 in R R
+
u(x, 0) = cos
x

:= u
0
(x),
u
y
(x, 0) = 0 := u
1
(x)
ha la soluzione
u(x, y) = cos
x

cosh
y

,
che `e lunica analitica. Tuttavia, si ha
lim
0
+
(|u
0
|

+|u
1
|

) = 0
mentre
lim
0
+
|u(, y)|

lim
0
+
[u(0, y)[ = lim
0
+
cosh
y

= + y > 0,
cosicche non c`e dipendenza continua dai dati nella norma uniforme.
In eetti, lequazione di Laplace descrive fenomeni stazionari, in cui non c`e
una variabile privilegiata che funga da tempo, cosa che accade invece, in
maniera naturale, nei problemi di Cauchy. Saranno invece ben posti, sotto
opportune condizioni, altri tipi di problemi ai limiti, quali il problema di
Dirichlet
_
u = 0 in
u = su ,
52
nel quale si prescrivono i valori che la funzione armonica deve assumere sulla
frontiera di un aperto limitato , oppure il problema di Neumann
_
_
_
u = 0 in
u

= su ,
ove invece si prescrivono i valori della derivata di u rispetto alla direzione
normale a . Dimostreremo risultati di unicit`a, esistenza e dipendenza
continua dai dati per il problema di Dirichlet e, parzialmente, anche per il
problema di Neumann.
2.3 Principio del massimo
Sia R
n
un aperto limitato con frontiera di classe C
1
a tratti, in modo
che valgano le formule di Green: in particolare, se u, v C
2
() C
1
(), si
ha allora
_

(uv vu)dx =
_

_
u
v

v
u

_
d, (2.2)
ove, al solito, (x) `e il versore normale esterno a nel punto x .
Un primo, facile risultato riguarda lunicit`a della soluzione del problema di
Dirichlet per lequazione di Poisson:
Proposizione 2.3.1 Sia R
n
un aperto limitato con frontiera di classe
C
1
a tratti; sia u C
2
() C
1
() soluzione del problema
_
u = f in
u = su .
(2.3)
Se v C
2
() C
1
() `e unaltra soluzione, allora v u in .
Dimostrazione Posto w = uv, la funzione w `e armonica in e nulla sulla
frontiera. Integrando per parti ricaviamo
_

[Dw[
2
dx =
_

wd
_

wwdx = 0,
da cui segue che w `e costante in ogni componente connessa di : ma siccome
w `e nulla sulla frontiera, w `e nulla in tutto .
53
Osservazione 2.3.2 Con lo stesso metodo, e altrettanto facilmente, si prova
che la soluzione del problema di Neumann per lequazione di Poisson `e unica
a meno di costanti additive. Si noti per`o che tale soluzione pu`o anche non
esistere aatto: infatti, ssato un aperto limitato con frontiera di classe
C
1
a tratti, anche il problema
_
_
_
u = f in
u

= su
(2.4)
abbia soluzione per due ssate funzioni f C() e C(), `e necessario
che f e verichino la condizione di compatibilit`a
_

f dx =
_

d,
come si verica subito applicando la formula di Green (2.2) alle funzioni u e
v(x) 1.
Proposizione 2.3.3 (principio del massimo debole) Sia un aperto
limitato di R
n
; sia u C
2
() C() tale che u 0 in . Allora
max

u = max

u.
Similmente, se u C
2
() C() `e tale che u 0 in , allora
min

u = min

u.
Dimostrazione Sia x
0
. Fissato > 0, la funzione v(x) = u(x) +
[x x
0
[
2
`e continua in , quindi ha massimo in un punto x . Vediamo
dove sta questo punto. Se risulta x , allora deve essere v(x) = 0 e
D
2
i
v(x) 0 per i = 1, . . . , n; dunque v(x) 0. Daltronde
v(x) = u(x) + 2n > 0,
il che `e assurdo. Quindi x , da cui, per ogni x e per ogni > 0,
u(x) = v(x) [x x
0
[
2
v(x) = max

v max

u + diam()
2
,
54
ossia, per larbitrariet`a di ,
max

u max

u.
Ci` o prova la prima parte. La seconda segue applicando a u la parte gi`a
dimostrata.
Osservazioni 2.3.4 (1) Dal principio del massimo segue lunicit`a per il
problema di Dirichlet in una forma lievemente pi` u forte: se R
n
`e un
aperto limitato, se u, v C
2
()C() e se tali funzioni risolvono il problema
di Dirichlet per lequazione di Poisson con gli stessi dati f, , allora u v in
. Infatti la funzione w = u v `e armonica e nulla sulla frontiera, quindi `e
identicamente nulla per il principio del massimo:
max

w = max

w = 0, min

w = min

w = 0.
(2) La proposizione 2.3.3 si chiama principio del massimo debole perche
non si esclude che la funzione u assuma il suo massimo anche in punti interni
a , senza essere costante; vedremo tuttavia pi` u avanti un enunciato pi` u
forte (corollario 2.6.6) che elimina questa eventualit`a. Si noti che il principio
del massimo `e falso quando `e un aperto illimitato: ad esempio, la funzione
u(x) =
_
log [x[ se n = 2
1 [x[
2n
se n > 2
`e armonica nellaperto = x R
n
: [x[ > 1 ed `e nulla sul bordo di , ma
tuttavia essa `e strettamente positiva in .
Proposizione 2.3.5 (maggiorazione a priori) Sia R
n
un aperto li-
mitato. Se u C
2
() C(), allora
[u(x)[ max

[u[ +
diam()
2
2n
sup

[u[ x .
Dimostrazione Se sup

[u[ = +, non c`e niente da dimostrare. Altri-


menti, ssato x
0
, consideriamo le funzioni
v

(x) = max

[u[ +
diam()
2
[x x
0
[
2
2n
sup

[u[ u(x), x ,
55
e notiamo che si ha
v

(x) = sup

[u[ u(x) 0 in ,
v

(x) max

[u[ u(x) 0 su .
Per il principio del massimo debole, deve essere v

(x) 0 in , cio`e la tesi.


Come immediata conseguenza della maggiorazione a priori si ottiene la di-
pendenza continua dai dati per il problema di Dirichlet su un aperto limitato
: infatti se u risolve il problema (2.3), e se
|f|
C()
+||
C()
,
allora dalla proposizione 2.3.5 segue
|u|
C()

_
1 +
diam()
2
2n
_
.
2.4 Formule di rappresentazione
Il nostro prossimo obiettivo `e quello di trovare una formula di rappresenta-
zione per la soluzione del problema di Dirichlet per lequazione di Poisson
in funzione dei dati, supponendo che la soluzione esista. Una volta ottenuta
tale formula, cercheremo di dimostrare che essa in eetti risolve il problema.
Ci occorre anzitutto una denizione.
Denizione 2.4.1 La soluzione fondamentale dellequazione di Laplace `e la
funzione
K() =
_

_
1
2
log
1
[[
se n = 2
1
(n 2)
n
[[
n2
se n > 2,
ove
n
`e la misura (n 1)-dimensionale della frontiera della palla unitaria
di R
n
:

n
=
2
n/2
(n/2)
= H
n1
(S
n1
).
56
Osserviamo che, ovviamente, K() = K(), e che K() `e armonica
in R
n
0. Fisicamente, la quantit`a K() (nel caso n = 3) rappresenta il
potenziale elettrostatico generato da una carica unitaria posta nellorigine.
Dalla formula di Green (2.2) segue una prima, ancora incompleta, formula
di rappresentazione:
Teorema 2.4.2 Sia un aperto limitato con frontiera di classe C
1
a tratti.
Se u C
2
(), si ha per ogni ssato x
u(x) =
_

_
K(x y)
u

(y) u(y)
K

y
(x y)
_
d(y)
_

K(xy)u(y)dy.
Si noti che la formula ha senso: il primo integrale non presenta singolarit`a,
in quanto x appartiene a mentre la variabile di integrazione y sta sulla
frontiera; daltra parte nel secondo integrale la funzione y K(x y),
avendo una singolarit`a logaritmica (per n = 2) oppure del tipo [x y[
2n
(per n > 2), `e certamente sommabile su .
Dimostrazione Sia x e sia > 0 tale che la palla B(x, ) di centro x e
raggio abbia chiusura contenuta in ; il parametro `e destinato a tendere
a 0. Applichiamo la formula di Green (2.2) alle funzioni u e y K(x y)
nellaperto B(x, ) :
_
\B(x,)
K(x y)u(y)dy =
=
__

+
_
B(x,)
__
K(x y)
u

(y) u(y)

K(x y)
_
d(y).
(2.5)
Analizziamo i due integrali su B(x, ): si ha
_
B(x,)
K(x y)
u

(y)d(y) =
_
_
_
1
2
log
1

_
B(x,)
u

(y)d(y) se n = 2
1
(n2)n
n2
_
B(x,)
u

(y)d(y) se n > 2,
cosicche

_
B(x,)
K(x y)
u

(y)d(y)

_
log
1

sup
B(x,)
[u[ se n = 2

n 2
sup
B(x,)
[u[ se n > 2,
57
e dunque
lim
0
+
_
B(x,)
K(x y)
u

(y)d(y) = 0.
Osserviamo adesso che il gradiente della funzione K(x y) `e dato, sia per
n = 2 che per n > 2, da

x
K(x y) =
y
K(x y) =
x y

n
[x y[
n
y ,= x, (2.6)
e che inoltre per ogni y B(x, ) la normale esterna a ( B(x, )) punta
verso linterno di B(x, ), ed `e quindi data da (y) =
xy

.
`
E allora facile
vericare che per ogni y B(x, ) si ha, per n 2,

y
K(x y) =
y
K(x y)
x y

=
1

n1
=
1
H
n1
(B(x, ))
. (2.7)
Se ne deduce che
lim
0
+
_

_
B(x,)
u(y)

y
K(x y)d(y)
_
=
= lim
0
+
_

1
H
n1
(B(x, ))
_
B(x,)
u(y)d(y)
_
= u(x).
Inne, osservando che, in virt` u della sommabilit`a di y K(x y),
lim
0
+
_
\B(x,)
K(x y)u(y)dy =
_

K(x y)u(y)dy,
da (2.5) si ottiene la tesi per 0
+
.
Sia ora h C
2
() C
1
() una funzione armonica in : allora la formula di
Green (2.2) ci dice che per ogni u C
2
() C
1
() si ha
0 =
_

_
h
u

u
h

_
d
_

hudy;
dunque, sommando questa relazione con quella fornita dal teorema 2.4.2 e
denendo G(x, y) = K(x y) +h(y), si ricava per ogni x
u(x) =
_

_
G(x, y)
u

(y) u(y)

y
G(x, y)
_
d(y)
_

G(x, y)u(y) dy.


58
Se si avesse anche G(x, y) = 0 per ogni y , potremmo scrivere
u(x) =
_

u(y)

y
G(x, y) d(y)
_

G(x, y)u(y) dy, (2.8)


e questa sarebbe una vera e propria formula di rappresentazione per leven-
tuale soluzione del problema di Dirichlet, poiche, noti i valori di u su e
di u in , sarebbe nota la u su tutto .
Siamo cos` ricondotti alla seguente
Denizione 2.4.3 Sia un aperto di R
n
. Una funzione di Green (di prima
specie) per il Laplaciano in `e una funzione G(x, y) continua, denita per
x, y , x ,= y, con le seguenti propriet`a:
(i) per ogni x , la funzione G(x, y)K(xy), che `e armonica in x,
`e prolungabile ad una funzione armonica h
x
(y) denita su tutto ;
(ii) G(x, y) = 0 per ogni y e per ogni x y.
Osservazione 2.4.4 Non `e aatto detto che una funzione di Green esista:
tuttavia, se essa esiste, allora `e unica, almeno quando laperto `e limitato.
In tal caso, infatti, se ve ne fossero due, G(x, y) = K(x y) + h
x
(y) e
G
0
(x, y) = K(x y) + h
0x
(y), allora per ogni x la funzione G(x, y)
G
0
(x, y) = h
x
(y)h
0x
(y) sarebbe prolungabile con continuit`a ad una funzione
armonica in e nulla sulla frontiera: quindi, per il principio del massimo,
h
x
h
0x
sarebbe nulla in , ossia G G
0
.
La funzione di Green, se esiste, gode di varie propriet`a; lenunciato che segue
ne segnala due, utili per il seguito:
Proposizione 2.4.5 Sia un aperto di R
n
tale che esista la funzione di
Green G per il Laplaciano. Allora:
(i) G(x, y) = G(y, x) per ogni x, y , x ,= y;
(ii) G(x, y) 0 per ogni x, y , x ,= y.
Dimostrazione (i) Siano x, y con x ,= y. Posto v(z) = G(x, z) e
w(z) = G(y, z), si ha v(z) = 0 per ogni z x, w(z) = 0 per ogni
59
z y, e v = w = 0 su . Applicando alle funzioni v, w la formula di
Green nellaperto [B(x, ) B(y, )], si trova
_
B(x,)
_
v

w
w

v
_
d =
_
B(y,)
_
w

v
v

w
_
d. (2.9)
Poiche w `e regolare intorno al punto x, mentre v si comporta (per n > 2)
come
2n
su B(x, ), si ha

_
B(x,)
w

v d

c
n1
sup
B(x,)
[v[ = o(1) per 0
+
;
daltronde, essendo v(z) = K(x z) + h
x
(z), con h
x
armonica e quindi
regolare in , si ha anche, utilizzando (2.7),
lim
0
+
_
B(x,)
v

wd =
= lim
0
+
_
B(x,)

z
K(x z) w(z) d(z) + lim
0
+
_
B(x,)
h
x

wd =
= lim
0
+
1
H
n1
(B(x, ))
_
B(x,)
wd + 0 = w(x).
In modo del tutto analogo si prova che
lim
0
+
_
B(y,)
v

wd = 0, lim
0
+
_
B(y,)
w

v d = v(y).
Quindi, al limite per 0
+
, la (2.9) si riduce a w(x) = v(y), ossia G(y, x) =
G(x, y). Per continuit`a, la tesi vale per ogni x, y con x ,= y.
(ii) Sia x e sia > 0 tale che B(x, ) . La funzione y G(x, y) `e
armonica in B(x, ) per ogni < e verica (per n > 2)
G(x, y) = 0 su , G(x, y)
1
(n 2)
n

n2
M su B(x, ),
essendo M il massimo su B(x, ) del modulo della funzione y G(x, y)
K(x y) la quale, per denizione di funzione di Green, `e armonica in e
dunque continua su B(x, ). Dunque G(x, y) 0 per ogni y (B(x, )),
se `e sucientemente piccolo. Dal principio del massimo segue G(x, y) 0
60
per ogni y B(x, ). Ne segue, per larbitrariet`a di , G(x, y) 0 per
ogni y x. Per continuit`a, la tesi vale per ogni x, y con x ,= y.
Nel caso n = 2 le argomentazioni sono esattamente le stesse.
Se esiste la funzione di Green per possiamo concludere con il seguente
Corollario 2.4.6 Sia un aperto limitato di R
n
con frontiera di classe C
1
a tratti. Se esiste la funzione di Green G(x, y) per il Laplaciano in , e se
u C
2
() `e soluzione del problema di Dirichlet (2.3), allora vale la formula
di rappresentazione
u(x) =
_

y
G(x, y) (y) d(y)
_

G(x, y) f(y) dy x . (2.10)


Naturalmente il corollario 2.4.6 non `e un teorema di esistenza. Per`o `e un buon
inizio: se sappiamo costruire la funzione di Green, abbiamo una candidata
soluzione e si pu`o cercare di provare che essa `e soluzione per davvero; questo
`e ci`o che faremo nel caso in cui `e una palla, poiche in tal caso la funzione
di Green si sa scrivere esplicitamente.
Osservazione 2.4.7 In eetti `e possibile costruire la funzione di Green per
ogni aperto di R
n
quando n > 2, e per una vastissima classe di aperti quando
n = 2; si veda [4] per approfondimenti.
Osservazione 2.4.8 In modo analogo si pu`o rappresentare la soluzione del
problema di Neumann per lequazione di Poisson:
_
_
_
u = f in
u

= su .
(2.11)
Si cerca una funzione di Green di seconda specie N(x, y), ossia una funzione
tale che N(x, y) = K(x y) + k
x
(y), con k
x
funzione di classe C
2
armonica
in , e
N
y
(x, y) = c per ogni y , con c costante opportuna. Tale
funzione, come `e facile vericare, `e unica a meno di una costante additiva.
Si trova allora, in analogia con la (2.8),
u(x) =
_

_
N(x, y)
u

(y) +c u(y)
_
d(y)
_

N(x, y) u(y) dy x .
Applicando questa formula alla funzione u 1, che sicuramente risolve il
problema di Neumann (2.11) con dati f e nulli, si trova 1 = cH
n1
(),
61
da cui segue che lunico valore possibile `e c = [H
n1
()]
1
. Con questa
scelta di c si deduce la formula di rappresentazione per le eventuali soluzioni
del problema di Neumann (2.11):
u(x) =
_

N(x, y) (y) d(y)


_

N(x, y) f(y) dy +
+
1
H
n1
()
_

u(y) d(y) x .
Si noti che, come `e giusto, questa formula individua la funzione u a meno di
una costante additiva.
2.5 La funzione di Green per la sfera
La funzione di Green per un aperto si pu`o interpretare sicamente come
il potenziale elettrostatico generato, allinterno di una supercie chiusa con-
duttrice posta a potenziale zero (a terra), da una carica unitaria, situata
in un punto x .
Per costruire la funzione G nel caso in cui `e la palla S = B(0, R) ado-
periamo il metodo di riessione, che trae origine proprio dallinterpretazione
elettrostatica sopra delineata. Se x S e x ,= 0, poniamo x

=
xR
2
|x|
2
, cosicche
[x[ [x

[ = R
2
; cerchiamo una funzione di Green della forma
G(x, y) = K(x y) K(x

y),
ove `e una costante da ssare. Notiamo che la funzione y K(x

y) `e
armonica su S, poiche x

`e al di fuori di S. Il numero rappresenta una carica


incognita da collocare in x

, in modo da ottenere un campo elettrostatico che,


sommato a quello indotto dalla carica posta in x e descritto dalla soluzione
fondamentale K(xy), generi un potenziale che sia nullo sulla supercie S.
Per determinare , osserviamo anzitutto che per ogni y S vale la propriet`a
seguente: nel piano generato dai punti 0, x, y i due triangoli di vertici 0, x, y
e 0, y, x

sono simili. Infatti essi hanno in comune langolo x0y e i lati a due
a due proporzionali, in quanto
0y
0x
=
R
[x[
=
[x

[
R
=
0x

0y
.
62
Per la terza coppia di lati si ha dunque
R
[x

y[
=
0y
x

y
=
0x
xy
=
[x[
[x y[
,
ovvero
[x

y[ = [x y[
R
[x[
y S. (2.12)
Ci` o premesso, nel caso n > 2, anche G(x, ) sia nulla su S basta scegliere
= (R/[x[)
n2
, perche in questo caso si ha, in virt` u di (2.12),
G(x, y) = K(x y)
_
R
[x[
_
n2
K(x

y) =
=
1
(n 2)
n
_
1
[x y[
n2

R
n2
[x[
n2
[x

y[
n2
_
=
=
1
(n 2)
n
_
1
[x y[
n2

1
[x y[
n2
_
= 0 y S.
Se n = 2, si verica direttamente che la funzione di Green per la palla
S = B(0, R) `e data da
G(x, y) =
1
2
log
1
[x y[

1
2
log
R
[x[[x

y[
.
In denitiva, la funzione di Green per la sfera S = B(0, R) in qualunque
dimensione n 2 `e
G(x, y) = K(x y) K
_
[x[
R
(x

y)
_
, ove x

=
xR
2
[x[
2
. (2.13)
Si osservi che dalla proposizione 2.4.5 segue che per x = 0, nel qual caso x

non `e denito, la G `e data da


G(0, y) = G(y, 0) = K(y) K
_
[y[
R
y

_
= K(y) K
_
R
y
[y[
_
.
Vediamo ora come si usa la funzione di Green per risolvere il problema di
Dirichlet per lequazione di Poisson sulla sfera.
63
Teorema 2.5.1 Sia S la palla B(0, R) e siano f C
1
(S) e C(S).
Allora il problema di Dirichlet
_
u = f in S
u = su S
ha come unica soluzione la funzione
u(x) =
R
2
[x[
2
R
n
_
S
(y)
[x y[
n
d(y)
_
S
G(x, y)f(y) dy x S, (2.14)
ove G `e la funzione di Green per la sfera B(0, R), ossia la funzione (2.13).
Dimostrazione Dal corollario 2.4.6 sappiamo che la soluzione, se esiste, `e
data dalla (2.10), ossia
u(x) =
_
S

y
G(x, y)(y)d(y)
_
S
G(x, y)f(y)dy x ,
con G data da (2.13). Calcoliamo la derivata normale di questa funzione nei
punti y S. Nel caso n > 2, per x S ssato si ha, ricordando (2.6),

y
G(x, y) =
y
G(x, y) (y) =
=
_

y
K(x y)
y
K
_
[x[
R
(x

y)
__

y
R
=
=
(x y) y
R
n
[x y[
n

_
R
[x[
_
n2
(x

y) y
R
n
[x

y[
n
=
=
1
R
n
[x y[
n
_
(x y) y
[x[
2
R
2
_
R
2
x
[x[
2
y
_
y
_
=
=
[x[
2
R
2
R
n
[x y[
n
.
Alla stessa formula si perviene nel caso n = 2. Si conclude allora che la
candidata soluzione `e proprio la funzione (2.14), che `e formata da due addendi
che denominiamo u
1
(x) e u
2
(x).
Proviamo che il primo addendo
u
1
(x) :=
R
2
[x[
2
R
n
_
S
(y)
[x y[
n
d(y)
64
verica
_
u
1
= 0 in S
u
1
= su S.
(2.15)
Poiche x S, mentre lintegrale `e fatto su S, si pu`o derivare sotto il segno
di integrale e si ricava che la funzione u
1
`e di classe C

. Inoltre `e facile,
benche laborioso, vericare che per ogni y S si ha

R
2
[x[
2
[x y[
n
= 0 x S.
Pertanto la funzione u
1
`e armonica in S.
Adesso notiamo che il corollario 2.4.6, applicato alla costante v(x) 1 che
certamente risolve il problema
_
v = 0 in S
v = 1 su S,
ci d`a lidentit`a
1 =
R
2
[x[
2
R
n
_
S
1
[x y[
n
d(y) x S.
Ci` o premesso, sia x un punto di S. Possiamo scrivere
u
1
(x) (x) =
R
2
[x[
2
R
n
_
S
(y) (x)
[x y[
n
d(y).
Per la continuit`a di , dato > 0 esiste > 0 tale che
[(y) (x)[ < y I

,
ove I

= y S : [y x[ < . Ne segue, per [x x[ <



2
,
[u
1
(x) (x)[

R
2
[x[
2
R
n
__
I

[x y[
n
d(y) +
_
S\I

[(y) (x)[
[x y[
n
d(y)
_

+
R
2
[x[
2
R
n
_
2

_
n
2||
C(S)

n
R
n1
;
poiche per x x si ha [x[ R, otteniamo
limsup
xx
[u
1
(x) (x)[ ,
65
e per larbitrariet`a di si ottiene u
1
= su S. Ci`o prova (2.15).
Dimostriamo adesso che il secondo addendo di (2.14), vale a dire
u
2
(x) :=
_
S
G(x, y)f(y) dy,
appartiene a C
2
(S) C(S) e verica
_
u
2
= f in S
u
2
= 0 su S.
(2.16)
Mostriamo anzitutto che u
2
appartiene a C(S) e che `e nulla su S. Per
la simmetria della funzione di Green, se x S si ha G(x, y) = 0, da cui
u
2
(x) = 0. Inoltre, per x S, x x, possiamo scrivere
u
2
(x) =
_
S
[G(x, y) G(x, y)]f(y) dy.
Lintegrando `e innitesimo per x x, ma non `e dominato da alcuna funzione
sommabile indipendente dal parametro x: infatti esso `e singolare proprio per
y = x. Ricorriamo allora al seguente corollario del teorema di Lebesgue:
Lemma 2.5.2 Sia f
k
una successione di funzioni integrabili sullo spazio
misurato (X, T, ). Supponiamo che:
(i) f
k
(x) f(x) q.o. in X per k ;
(ii) [f
k
(x)[ g
k
(x) q.o. in X per ogni k N;
(iii) g
k
(x) g(x) q.o. in X per k ;
(iv) g
k
e g siano sommabili su X e
_
X
g
k
d
_
X
g d per k .
Allora
lim
k
_
X
f
k
d =
_
X
f d.
Dimostrazione Basta applicare il lemma di Fatou alle due successioni di
funzioni non negative g
k
+f
k
e g
k
f
k
, e sfruttare la sommabilit`a di g.
66
Applichiamo il lemma 2.5.2 nel modo seguente: per ogni successione x
k

S convergente a x, si ha
[[G(x
k
, y) G(x
0
, y)]f(y)[ C[[x
k
y[
2n
+[x y[
2n
] =: g
k
(y),
e inoltre risulta
lim
k
g
k
(y) = 2C[x y[
2n
per quasi ogni y S,
lim
k
_
S
g
k
(y) dy = 2C
_
S
[x y[
2n
dy;
quindi il lemma 2.5.2 ci dice che
lim
k
_
S
[G(x
k
, y) G(x, y)]f(y) dy = 0,
e dallarbitrariet`a della successione x
k
si ricava
lim
xx
u
2
(x) = lim
xx
_
S
[G(x, y) G(x, y)]f(y) dy = 0 x S,
cosicche u
2
`e continua in S.
Proviamo ora larmonicit`a di u
2
in S. Sia x
0
S e sia r > 0 tale che
B(x
0
, r) S. Decomponiamo la funzione u
2
come segue:
u
2
(x) =
_
B(x
0
,r)
f(y)G(y, x) dy
_
S\B(x
0
,r)
f(y)G(y, x)dy =: v
r
1
(x) +v
r
2
(x),
ove abbiamo usato la simmetria della funzione di Green (proposizione 2.4.5).
Poiche, per y / B(x
0
, r), x G(y, x) `e armonica in S y e quindi in
B(x
0
, r), si pu`o derivare sotto il segno di integrale ottenendo
v
r
2
(x) =
_
S\B(x
0
,r)
f(y)G(y, x) dy = 0 x B(x
0
, r)
ed in particolare
v
r
2
(x
0
) = 0. (2.17)
67
Per quanto riguarda v
r
1
(x), scrivendo esplicitamente la funzione di Green
secondo la (2.13), ma a variabili scambiate, otteniamo
v
r
1
(x) =
_
B(x
0
,r)
f(y) G(y, x) dy =
=
_
B(x
0
,r)
f(y) K(y x) dy
_
B(x
0
,r)
f(y) K
_
[y[
R
(y

x)
_
dy =:
=: v
r
10
(x) +v
r
11
(x).
Dato che la funzione x K(
|y|
R
(y

x)) `e singolare nel punto y

che `e fuori
dalla palla S per ogni y B(x
0
, r), possiamo derivare v
r
11
(x) sotto il segno
di integrale, ottenendo
v
r
11
(x) =
_
B(x
0
,r)
f(y) K
_
[y[
R
(y

x)
_
dy = 0 x B(x
0
, r)
ed in particolare
v
r
11
(x
0
) = 0. (2.18)
Resta da calcolare il Laplaciano di v
r
10
(x). Dobbiamo anzitutto determinare le
derivate parziali D
i
v
r
10
per i = 1, . . . , n. A questo scopo proviamo il seguente
Lemma 2.5.3 Per ogni g C(B(x
0
, r)) risulta
D
i
_
B(x
0
,r)
g(y)K(x y) dy =
_
B(x
0
,r)
g(y)D
x
i
K(x y) dy x B(x
0
, r).
Dimostrazione Fissato x B(x
0
, r), scriviamo il rapporto incrementale
nella i-sima direzione:
1
h
_
B(x
0
,r)
g(y)[K(x +he
i
y) K(x y)] dy =
=
1
(n 2)
n
h
_
B(x
0
,r)
g(y)
_
1
0
d
dt
1
[x +hte
i
y[
n2
dt dy =
=
1

n
_
B(x
0
,r)
g(y)
_
1
0
x
i
+ht y
i
[x +the
i
y[
n
dt dy.
Scambiando lordine di integrazione, il che `e lecito perche lintegrando, per
h ssato, `e certamente sommabile in [0, 1] B(x
0
, r), otteniamo
1
h
_
B(x
0
,r)
g(y)[K(x +he
i
y) K(x y)] dy =
68
=
1

n
_
1
0
_
B(x
0
,r)
g(y)
x
i
+ht y
i
[x +the
i
y[
n
dy dt.
Dobbiamo passare al limite per h 0 sotto il segno di integrale. Fissiamo
> 0 tale che B(x, 2) B(x
0
, r), e scegliamo h tale che [h[ < : allora per
ogni t [0, 1] si ha B(x + the
i
, ) B(x
0
, r). Vogliamo provare che per la
funzione
G
h
(t, y) =
1

n
g(y)
x
i
+ht y
i
[x +the
i
y[
n
(2.19)
valgono i fatti seguenti, dai quali segue subito la tesi del lemma:
lim
h0
G
h
(t, y) =
1

n
g(y)
x
i
y
i
[x y[
n
q.o. in [0, 1] B(x
0
, r), (2.20)
lim
h0
_
1
0
_
B(x
0
,r)
G
h
(t, y) dydt =
_
1
0
_
B(x
0
,r)
1

n
g(y)
x
i
y
i
[x y[
n
dydt. (2.21)
La relazione (2.20) `e ovvia; la (2.21) invece non `e aatto banale. Per dimo-
strarla, ancora una volta non possiamo fare uso del teorema di convergenza
dominata di Lebesgue, poiche lintegrando G
h
(t, y) ha una singolarit`a nel
punto x + the
i
, che si muove durante il passaggio al limite. Applicheremo
allora il lemma 2.5.2 ad unarbitraria successione innitesima h
k

kN
. Per
le corrispondenti funzioni G
h
k
(t, y) denite in (2.19) si ha allora, per quasi
ogni (t, y) [0, 1] B(x
0
, r):
[G
h
k
(t, y)[
1

n
|g|
C(B(x
0
,r))
1
[x
t
h
k
e
i
y[
n1
=:
k
(t, y) (2.22)

k
(t, y)
1

n
|g|
C(B(x
0
,r))
1
[x
t
h
k
e
i
y[
n1
=:
k
(t, y) =: (t, y); (2.23)
inoltre, utilizzando le coordinate polari,
_
1
0
_
B(x
0
,r)

k
(t, y) dydt =
|g|
C(B(x
0
,r))

n
_
1
0
_
B(x
0
,r)
dydt
[x +th
k
e
i
y[
n1
=
=
|g|
C(B(x
0
,r))

n
__
1
0
_
B(x
0
,r)\B(x+th
k
e
i
,)
dydt
[x +th
k
e
i
y[
n1
+
+
_
1
0
_
B(x+th
k
e
i
,)
dydt
[x +th
k
e
i
y[
n1
_
=
69
=
|g|
C(B(x
0
,r))

n
__
1
0
_
B(x
0
,r)
(1
B(x+th
k
e
i
,)
(y))
dydt
[x +th
k
e
i
y[
n1
+
+
n
_
1
0
_

0
1

n1

n1
ddt
_
.
Nel primo integrale si ha [x +th
k
e
i
y[
1n

1n
e quindi, per convergenza
dominata,
lim
k
_
1
0
_
B(x
0
,r)\B(x+th
k
e
i
,)
dydt
[x +th
k
e
i
y[
n1
=
_
1
0
_
B(x
0
,r)\B(x,)
dydt
[x y[
n1
.
Il secondo integrale diventa

n
_
1
0
_

0
1

n1

n1
ddt =
_
1
0
_
B(x,)
dydt
[x y[
n1
.
Dunque, sommando,
lim
k
_
1
0
_
B(x
0
,r)

k
(t, y) dydt =
_
1
0
_
B(x
0
,r)
(t, y) dydt. (2.24)
Da (2.22), (2.23 e (2.24), grazie al lemma 2.5.2 segue che
lim
k
_
1
0
_
B(x
0
,r)
G
h
k
(t, y) dydt =
1

n
_
1
0
_
B(x
0
,r)
g(y)
x
i
y
i
[x y[
n
dydt,
e per larbitrariet`a della successione h
k
si ricava la (2.21). Ci`o. come gi`a
osservato, prova il lemma 2.5.3.
Torniamo alle derivate parziali prime di v
r
10
(x). Si ha anzitutto, usando il
lemma 2.5.3 e integrando per parti,
D
i
v
r
10
(x) =
_
B(x
0
,r)
f(y)D
x
i
K(y x) dy =
_
B(x
0
,r)
f(y)D
y
i
K(y x) dy =
=
_
B(x
0
,r)
f(y)K(y x)
i
(y) d(y)
_
B(x
0
,r)
D
i
f(y)K(y x) dy.
Applicando ancora il lemma 2.5.3, similmente si ottiene, per i = 1, . . . , n,
D
2
i
v
r
10
(x) =
=
_
B(x
0
,r)
f(y)D
x
i
K(y x)
i
(y)d(y)
_
B(x
0
,r)
D
i
f(y)D
x
i
K(y x)dy =
=
_
B(x
0
,r)
f(y)D
y
i
K(y x)
i
(y)d(y) +
_
B(x
0
,r)
D
i
f(y)D
y
i
K(y x)dy,
70
e di conseguenza troviamo, per ogni x B(x
0
, r),
v
r
10
(x) =
_
B(x
0
,r)
f(y)

y
K(yx) d(y)+
_
B(x
0
,r)
f(y)
y
K(yx) dy;
in particolare, da (2.7) segue
v
r
10
(x
0
) =
=
_
B(x
0
,r)
f(y)

K(y x
0
)d(y) +
_
B(x
0
,r)
f(y)
y
K(y x
0
)dy =
=
1

n
r
n1
_
B(x
0
,r)
f(y)d(y) +
1

n
_
B(x
0
,r)
f(y)
y x
0
[y x
0
[
n
dy.
Dunque, da (2.17) e (2.18) segue che
u
2
(x
0
) = (v
r
10
+v
r
11
+v
r
2
)(x
0
) = v
r
10
(x
0
),
e poiche il primo membro non dipende da r, possiamo scrivere
u
2
(x
0
) = lim
r0
+
v
r
10
(x
0
) =
= lim
r0
+
_
1

n
r
n1
_
B(x
0
,r)
f(y)d(y) +
1

n
_
B(x
0
,r)
f(y)
y x
0
[y x
0
[
n
dy
_
=
= f(x
0
) + 0 = f(x
0
).
Poiche x
0
`e un punto arbitrario di S, la (2.16) `e provata. Ci`o conclude la
dimostrazione del teorema 2.5.1
Terminiamo il paragrafo con un corollario assai utile per il seguito.
Corollario 2.5.4 Se u `e una funzione armonica in una palla B(x, r) R
n
e continua sulla chiusura B(x, r), allora
u(z) =
r
2
[z x[
2
r
n
_
B(x,r)
u()
[ z[
n
d() z B(x, r).
Dimostrazione La funzione
v() = u(x +), B(0, r),
71
`e armonica nella palla B(0, r). Per il teorema 2.5.1, si ha la formula di
rappresentazione
v() =
r
2
[[
2
r
n
_
B(0,r)
v(y)
[ y[
n
d(y) B(0, r);
ne segue, posto z = x +,
u(z) = u(x +) =
r
2
[z x[
2
r
n
_
B(0,r)
u(x +y)
[z x y[
n
d(y) =
=
r
2
[z x[
2
r
n
_
B(x,r)
u()
[z [
n
d() z B(x, r).
2.6 Propriet`a delle funzioni armoniche
Una delle pi` u importanti propriet`a di cui godono le funzioni armoniche `e
la cosiddetta propriet`a della media: il valore di una funzione u, armonica
in , in un punto x `e la media dei valori che assume sulla frontiera di una
qualunque palla B(x, r) contenuta in . In questo paragrafo proveremo tale
propriet`a e ne analizzeremo alcune notevoli conseguenze.
Denizione 2.6.1 Sia un aperto di R
n
. Diciamo che una funzione u
C() ha la propriet`a della media in se per ogni palla B(x, r) risulta
u(x) =
1

n
r
n1
_
B(x,r)
u(y) d(y). (2.25)
Stabiliamo anzitutto una formulazione equivalente della propriet`a della me-
dia.
Proposizione 2.6.2 Sia un aperto di R
n
. Una funzione u C() verica
u(x) =
1

n
r
n1
_
B(x,r)
u(y) d(y) B(x, r)
se e solo se
u(x) =
n

n
r
n
_
B(x,r)
u(y) dy B(x, r) . (2.26)
72
Dimostrazione Supponiamo che valga (2.25) e sia B(x, r) . Per ogni
]0, r[ si ha, per ipotesi,
u(x) =
1

n1
_
B(x,)
u(y) d(y).
Moltiplichiamo entrambi i membri per
n1
e integriamo fra 0 e r: si ottiene
u(x)
r
n
n
= u(x)
_
r
0

n1
d =
1

n
_
r
0
_
B(x,)
u(y)d(y)d =
1

n
_
B(x,r)
u(y)dy,
e quindi la (2.26).
Supponiamo viceversa che valga (2.26) e sia B(x, r) . Moltiplichiamo
entrambi i membri per
r
n
n
e deriviamo rispetto a r: il risultato `e
r
n1
u(x) =
d
dr
1

n
_
r
0
_
B(x,)
u(y) d(y) d =
1

n
_
B(x,r)
u(y) d(y),
cio`e la (2.25).
Proposizione 2.6.3 Sia un aperto di R
n
e sia u C(). Se u `e armonica
in , allora u ha la propriet`a della media in .
Dimostrazione Sia B(x
0
, r) . Per il corollario 2.5.4, la funzione u(x) `e
data dalla formula di rappresentazione
u(z) =
r
2
[z x
0
[
2
r
n
_
B(x
0
,r)
u()
[z [
n
d() z B(x
0
, r).
Scelto z = x
0
, si ricava la tesi:
u(x
0
) =
r

n
r
n
_
B(x
0
,r)
u() d().
Vale anche il viceversa della proposizione precedente, ma occorre prima
dimostrare un risultato intermedio che ha interesse di per se.
Proposizione 2.6.4 Sia un aperto connesso di R
n
e sia u C() una
funzione che verica la propriet`a della media in . Se il massimo (oppure il
minimo) di u in esiste, ed `e assunto in un punto interno a , allora u `e
costante in .
73
Dimostrazione Sia M = max

u, e supponiamo che esista x tale che


u(x) = M. Poniamo
A = x : u(x) = M;
allora A`e un sottoinsieme non vuoto e chiuso in , in virt` u della continuit`a di
u. Dimostriamo che A `e anche aperto in : essendo connesso, ci`o prover`a
che A = e quindi la tesi.
Sia x A e sia r
0
> 0 tale che B(x, r
0
) : vogliamo mostrare che u M
su B(x, r) per ogni r < r
0
(e quindi u M su B(x, r
0
)). In eetti se
esistessero r ]0, r
0
[ e B(x, r) tale che u() < M, troveremmo anche una
palla B(, ) B(x, r) per cui u(y) < M per ogni y B(, ). Ma allora,
utilizzando la propriet`a della media (2.26) nellaperto B(x, r
0
), avremmo
M = u(x) =
n

n
r
n
_
B(x,r)
u(y) dy =
=
n

n
r
n
__
B(x,r)\B(,)
u(y) dy +
_
B(,)
u(y) dy
_
< M,
il che `e assurdo. Pertanto B(x, r
0
) A ed A `e aperto in .
In modo analogo si ragiona quando u assume il minimo in un punto interno.
Teorema 2.6.5 Sia un aperto di R
n
e sia u C(). Allora u `e armonica
in se e solo se u ha la propriet`a della media in .
Dimostrazione (=) Questa implicazione `e stata provata nella proposizio-
ne 2.6.3.
(=) Sia S = B(x
0
, r) . Indichiamo con v la soluzione, fornita dal
teorema 2.5.1, del problema di Dirichlet
_
v = 0 in S
v = u su S.
Allora v C(S) ed inoltre v, essendo armonica in S, ha la propriet`a della
media in S. Quindi la dierenza w = u v ha la propriet`a della media in
S e si annulla su S. Siano x
1
e x
2
punti di massimo e di minimo per w su
S: se almeno uno dei due punti `e interno a S, la proposizione 2.6.4 implica
che w `e costante in S, e dunque `e nulla in S; se invece entrambi sono su S,
allora w ha sia minimo che massimo nulli. Ne segue che u v e pertanto u `e
armonica in S. Dato che S `e unarbitraria palla contenuta in , si conclude
che u `e armonica in .
74
Corollario 2.6.6 (principio del massimo forte) Sia un aperto connes-
so di R
n
e sia u C() una funzione armonica in . Se il massimo (oppure
il minimo) di u in esiste, ed `e assunto in un punto interno, allora u `e
costante in .
Dimostrazione Poiche u `e armonica in , u verica la propriet`a della media
in ; la tesi segue allora applicando la proposizione 2.6.4.
Dal fatto che le funzioni armoniche vericano la propriet`a della media discen-
de limportante conseguenza che tali funzioni sono analitiche (reali): questo
non ci sorprende, poiche in dimensione n = 2 ci era gi`a noto. Per prova-
re questo fatto, dobbiamo preliminarmente procurarci opportune stime sulle
derivate di funzioni armoniche.
Proposizione 2.6.7 Sia un aperto limitato di R
n
e sia u C() una
funzione armonica in . Allora
[D

u(x)[
n
||
e
||1
[[!
[d(x, )]
||
max

[u[ N
n
, x . (2.27)
Dimostrazione Sia x e siano = d(x, ) e M = max

[u[. Dal
corollario 2.5.4 otteniamo la formula di rappresentazione
u(z) =

2
[z x[
2

n
_
B(x,)
u()
[ z[
n
d() z B(x, ),
da cui segue che u `e di classe C

. Derivando lequazione u = 0 si deduce


che tutte le derivate D

u sono armoniche in B(x, ); quindi esse vericano


la propriet`a della media in B(x, ).
Ci` o premesso, proviamo la (2.27) per induzione su N = [[. Se [[ = 1,
allora = e
i
, con 1 i n, e dal teorema della divergenza si ha
[D
i
u(x)[ =

n
_
B(x,)
D
i
u(y) dy

n
_
B(x,)
u(y)
i
(y) d(y)

n
M
n

n1
=
n

M,
e ci`o prova la tesi per [[ = 1.
Se la tesi `e vera quando [[ = N, proviamola per i multi-indici di lunghezza
[[ = N +1. Poniamo = +e
i
, con [[ = N e 1 i n: allora scrivendo
75
la propriet`a della media per D

u nella palla B(x,



N+1
) si ottiene, utilizzando
lipotesi induttiva,
[D

u(x)[ =

n
(

N+1
)
n
_
B(x,

N+1
)
D

u(y) dy

=
=

n
(

N+1
)
n
_
B(x,

N+1
)
D

u(y)
i
(y) d(y)

n
(

N+1
)
n
_
B(x,

N+1
)
n
N
e
N1
N!
[d(y, )]
N
M d(y).
Dato che
d(y, ) d(x, ) [x y[ =

N + 1
=
N
N + 1
y B(x,

N+1
),
si deduce
[D

u(x)[
n

n
(

N+1
)
n
n
N
e
N1
N!
(
N
N+1
)
N
M
n
(

N + 1
)
n1
=
=
n
N+1
e
N
(N + 1)!

N+1
M
(N + 1)
N
e N
N
<
n
N+1
e
N
(N + 1)!

N+1
M,
che `e la tesi quando [[ = N + 1. La (2.27) `e provata.
Teorema 2.6.8 Sia un aperto di R
n
. Se u `e una funzione armonica in
, allora u `e analitica in .
Dimostrazione Sia x e sia S = B(x, R) tale che S . Come
sappiamo, u `e di classe C

in . Possiamo scrivere i punti y S nella forma


equivalente
y = x +ha, ove h ]0, R[, a R
n
con [a[ = 1.
Scrivendo la formula di Taylor per u nel punto x, si trova per ogni m N
+
u(y) = u(x +ha) =

||m1
D

u(x)
!
h
||
a

+R
m
(y),
ove il resto R
m
(y) pu`o scriversi nella forma
R
m
(y) =

||=m
D

u(x +
m
ha)
!
h
||
a

76
per un opportuno
m
]0, 1[. Se scegliamo h ]0,
R
2
[, allora d(y, )
R
2
,
cosicche dalla proposizione 2.6.7 otteniamo
[R
m
(y)[

||=m
h
m
!
n
m
e
m1
m!
(
R
2
)
m
max
S
[u[ =
= h
m
_
_

||=m
m!
!
_
_
2
m
n
m
e
m1
R
m
max
S
[u[.
Daltra parte, per la formula (1.46),

||=m
m!
!
= n
m
m N
+
,
da cui nalmente
[R
m
(y)[
_
2n
2
eh
R
_
m
max
S
[u[ 2
m
max
S
[u[ h ]0,
R
4n
2
e
[.
Ci` o prova che la serie di Taylor di u ha per somma u(y) per ogni y
B(x,
R
4n
2
e
). La tesi `e provata.
2.7 Successioni di funzioni armoniche
Il limite di funzioni armoniche, sotto opportune ipotesi, `e a sua volta una
funzione armonica. Dedichiamo il presente paragrafo alla precisazione e al-
lanalisi di questo enunciato.
Un primo risultato `e il seguente:
Teorema 2.7.1 Sia un aperto di R
n
e sia u
k
C() una successione
di funzioni armoniche in . Se u
k
u uniformemente in per k ,
allora u `e armonica in .
Dimostrazione Per il teorema 2.6.5, le u
k
vericano la propriet`a della media
in . La funzione u, limite uniforme delle u
k
, `e continua in e verica
anchessa la propriet`a della media in . Ne segue la tesi applicando ancora
il teorema 2.6.5.
Ci occorre adesso una stima puntuale per funzioni armoniche non negative,
dalla quale trarremo notevoli conseguenze.
77
Proposizione 2.7.2 Sia S = B(x
0
, r) e sia u C(S) una funzione armo-
nica in S e non negativa in S. Allora
1
|xx
0
|
r
_
1 +
|xx
0
|
r
_
n1
u(x
0
) u(x)
1 +
|xx
0
|
r
_
1
|xx
0
|
r
_
n1
u(x
0
) x S. (2.28)
Dimostrazione Per il corollario 2.5.4 si ha la formula
u(x) =
r
2
[x x
0
[
2
r
n
_
S
u(y)
[y x[
n
d(y) x S. (2.29)
Daltra parte si ha
1
(r +[x x
0
[)
n

1
[x y[
n

1
(r [x x
0
[)
n
y S, x S,
da cui
r [x x
0
[
(r +[x x
0
[)
n1

r
2
[x x
0
[
2
[x y[
n

r +[x x
0
[
(r [x x
0
[)
n1
y S, x S
Moltiplichiamo per
u(y)
rn
e integriamo su S: tenendo conto di (2.29), si ottiene
r [x x
0
[
(r +[x x
0
[)
n1
1
r
n
_
S
u(y) d u(x)
r +[x x
0
[
(r [x x
0
[)
n1
1
r
n
_
S
u(y) d
ossia, ricordando che u verica la propriet`a della media in S,
r
n2
r [x x
0
[
(r +[x x
0
[)
n1
u(x
0
) u(x) r
n2
r +[x x
0
[
(r [x x
0
[)
n1
u(x
0
) x S,
da cui la tesi.
Corollario 2.7.3 (teorema di Liouville) Sia u una funzione armonica in
R
n
. Se u `e limitata inferiormente, oppure limitata superiormente, allora u `e
costante.
Dimostrazione Sia u(x) K per ogni x R
n
: applicando la proposizione
2.7.2 a u()K, che `e armonica e non negativa in ogni palla B(0, r), si ottiene
per ogni x B(0, r) e per ogni r > 0,
1
|x|
r
_
1 +
|x|
r
_
n1
(u(0) K) (u(x) K)
1 +
|x|
r
_
1
|x|
r
_
n1
(u(0) K);
78
dunque, per r , si ricava u(x) u(0).
Se u(x) M per ogni x R
n
, si applica lo stesso ragionamento a M u().
La proposizione 2.7.2 si generalizza nel modo seguente:
Teorema 2.7.4 (disuguaglianza di Harnack) Sia un aperto di R
n
e
sia K compatto e connesso. Allora esiste una costante A ]0, 1[ tale che
per ogni funzione u armonica in e non negativa in si ha
Au(x) u(x

)
1
A
u(x) x, x

K.
Dimostrazione Siano x e x

punti distinti di K e sia R = d(K, ). Per com-


pattezza, possiamo ricoprire K con un numero nito N di palle B(x
i
, R/4),
1 i N, centrate in punti di K. Possiamo porre x
0
= x, x
N+1
= x

, e
considerare le N+2 palle B(x
i
, R)
0iN+1
. Un facile argomento di connes-
sione mostra che esiste una sottofamiglia B(x
i
j
, R)
1jk
, con 2 k N,
tale che
x
i
1
= x, x
i
k
= x

, r
j
:= [x
i
j
x
i
j+1
[ <
R
2
per j = 1, . . . , k 1.
Poiche u `e armonica e non negativa in B(x
i
1
, R), dalla proposizione 2.7.2
segue
1
r
1
R
(1 +
r
1
R
)
n1
u(x
i
1
) u(x
i
2
)
1 +
r
1
R
(1
r
1
R
)
n1
u(x
i
1
),
ed essendo r
1
< R/2 deduciamo
2
n2
3
n1
u(x
i
1
) u(x
i
2
) 3 2
n2
u(x
i
1
). (2.30)
Similmente si ha
2
n2
3
n1
u(x
i
2
) u(x
i
3
) 3 2
n2
u(x
i
2
),
il che, insieme a (2.30), implica
_
2
n2
3
n1
_
2
u(x
i
1
) u(x
i
3
)
_
3 2
n2
_
2
u(x
i
1
).
79
Iterando questa procedura, dopo k 1 passi si ricava
_
2
n2
3
n1
_
k1
u(x
i
1
) u(x
i
k
)
_
3 2
n2
_
k1
u(x
i
1
),
e a maggior ragione
_
2
n2
3
n1
_
N1
u(x) u(x

)
_
3 2
n2
_
N1
u(x),
che `e la tesi con A = (3 2
n2
)
(N1)
.
Dalla disuguaglianza di Harnack discende immediatamente il seguente risul-
tato:
Corollario 2.7.5 Sia un aperto connesso di R
n
e sia u
k
una successione
crescente di funzioni armoniche in . Se u
k
converge in un punto x
0
,
allora essa converge uniformemente su ogni compatto contenuto in .
2.8 Funzioni subarmoniche
In vista del teorema di esistenza e unicit`a per il problema di Dirichlet rela-
tivo allequazione di Laplace con dato al bordo continuo, risultato che sar`a
dimostrato nel prossimo paragrafo in ipotesi molto blande sullaperto , in-
troduciamo e analizziamo una classe di funzioni molto importante e utile:
quella delle funzioni subarmoniche.
Denizione 2.8.1 Sia un aperto di R
n
. Una funzione u C() si dice
subarmonica in se per ogni aperto limitato

e per ogni funzione


v C(

), armonica in

, risulta
max

(u v) = max

(u v).
Una funzione u C() si dice superarmonica in se per ogni aperto limitato

e per ogni funzione v C(

), armonica in

, risulta
min

(u v) = min

(u v).
80
In denitiva una funzione u, continua in , `e subarmonica in se e solo se
accade che ogni funzione armonica v, che sia al di sopra di u sulla frontiera
di un arbitrario sotto-aperto

, sta al di sopra di u su tutto

.
Si verica facilmente che una funzione u `e subarmonica se e solo se u `e
superarmonica.
`
E chiaro inoltre che ogni funzione armonica `e sia subarmo-
nica che superarmonica.
`
E immediato riconoscere, poi, che per n = 1 sono
subarmoniche in ]a, b[ tutte e sole le funzioni convesse in ]a, b[. Si osservi
anche che se `e limitato, la condizione di subarmonicit`a vale anche per .
Vediamo alcune propriet`a delle funzioni subarmoniche.
Proposizione 2.8.2 Se u
1
, . . . , u
m
sono funzioni subarmoniche in un aperto
di R
n
, allora la funzione
u(x) = maxu
1
(x), . . . , u
m
(x), x ,
`e subarmonica in .
Dimostrazione Sia

un qualunque aperto limitato contenuto in . Se v


`e una funzione continua in

e armonica in

, la funzione u v `e continua
su

e quindi ha massimo in un punto x


0

. Inoltre, per denizione


di u, esiste un indice i 1, . . . , m tale che u(x
0
) = u
i
(x
0
). Poiche u
i
`e
subarmonica in , si ha
max

(u v) = u(x
0
) v(x
0
) = u
i
(x
0
) v(x
0
)
max

(u
i
v) = max

(u
i
v) max

(u v),
da cui
max

(u v) = max

(u v).
Ci` o prova che u `e subarmonica in .
Introduciamo adesso una particolare trasformazione funzionale denita sullo
spazio C(), ove `e un aperto di R
n
, la quale, come vedremo tra poco,
preserva la subarmonicit`a. Sia u C(): se S `e una palla contenuta in ,
denotiamo con u
S
la soluzione del problema di Dirichlet
_
u
S
= 0 in S
u
S
= u su S,
(2.31)
81
che esiste unica in virt` u del teorema 2.5.1. Sia poi M
S
[u] la funzione denita
da
M
S
[u] =
_
u in S
u
S
in S.
(2.32)
Chiaramente M
S
[u] `e continua su . Inoltre:
Proposizione 2.8.3 Se u `e una funzione subarmonica in un aperto di
R
n
, allora per ogni palla S la funzione M
S
[u] `e subarmonica in .
Dimostrazione Anzitutto, se S `e una palla contenuta in , per la subar-
monicit`a di u e per denizione di M
S
[u], si ha
max
S
(u M
S
[u]) = max
S
(u M
S
[u]) = 0,
ossia u M
S
[u] in S, e quindi
u M
S
[u] in . (2.33)
Sia adesso

un qualunque aperto limitato contenuto in . Se v `e una


funzione continua in

e armonica in

, la funzione M
S
[u]v ha massimo in
un punto x
0

. Se questo punto appartiene a

, allora si ha banalmente
max

(M
S
[u] v) = M
S
[u](x
0
) v(x
0
) = max

(M
S
[u] v),
che `e ci`o che si vuole. Se invece x
0

, allora esso star`a in S, oppure star`a


fuori di S. Se x
0

S, allora, per la subarmonicit`a di u e per (2.33),


max

(M
S
[u] v) = M
S
[u](x
0
) v(x
0
) = u(x
0
) v(x
0
)
max

(u v) = max

(u v) max

(M
S
[u] v),
il che, nuovamente, `e ci`o che si vuole. Se, inne, x
0

S, si ha, essendo
M
S
[u] v armonica in

S,
max

(M
S
[u] v) = M
S
[u](x
0
)v(x
0
) = max

S
(M
S
[u] v) = max
(

S)
(M
S
[u] v);
pertanto esiste x
1
(

S) tale che
max

(M
S
[u] v) = max
(

S)
(M
S
[u] v) = M
S
[u](x
1
) v(x
1
).
82
Se x
1

, gi`a sappiamo che


max

(M
S
[u] v) = max

(M
S
[u] v),
mentre se x
1
S otteniamo, per la subarmonicit`a di u e la (2.33),
max

(M
S
[u] v) = M
S
[u](x
1
) v(x
1
) = u(x
1
) v(x
1
)
max

(u v) = max

(u v) max

(M
S
[u] v).
In denitiva, risulta
max

(M
S
[u] v) = max

(M
S
[u] v)
e ci`o prova che M
S
[u] `e subarmonica in .
La parentela fra funzioni subarmoniche ed armoniche `e completamente chia-
rita dal risultato che segue.
Proposizione 2.8.4 Sia un aperto di R
n
e sia u una funzione continua
in . Valgono i seguenti fatti:
(i) u `e subarmonica in se e solo se u verica
u(x)
1

n
r
n1
_
B(x,r)
u(y) d(y) B(x, r) ; (2.34)
(ii) se u C
2
(), allora u `e subarmonica in se e solo se u 0 in .
Dimostrazione (i) Supponiamo che u verichi la (2.34): allora, per ogni
aperto limitato

e per ogni funzione v C(

) armonica in

, la
funzione uv verica ancora la (2.34) in ogni palla contenuta in

. Quindi,
ripetendo esattamente la dimostrazione della proposizione 2.6.4, si ottiene
che per ogni componente connessa U
i
di

risulta
max
U
i
(u v) = max
U
i
(u v).
Ne segue che se x
0
`e punto di massimo per u v in

i
U
i
, allora esiste
i tale che x
0
U
i
, da cui
max

(u v) = max
U
i
(u v) = max
U
i
(u v).
83
Daltronde, `e facile vericare che

i
U
i
, e quindi dalla relazione
precedente deduciamo
max

(u v) = max
U
i
(u v) max

(u v).
Ne segue che u `e subarmonica in .
Viceversa, se u `e subarmonica in , allora per ogni palla S = B(x, r) con-
tenuta in si ha, per la (2.33) e per denizione di M
S
[u] (si veda (2.32) e
(2.31)),
u(x) M
S
[u](x) =
1

n
r
n1
_
B(x,r)
M
S
[u](y) d(y) =
=
1

n
r
n1
_
B(x,r)
u(y) d(y),
cosicche u verica (2.34).
(ii) Sia u C
2
() subarmonica in . Supponiamo, per assurdo, che esista
x
0
tale che u(x
0
) < 0. Per continuit`a esiste una palla S = B(x
0
, r),
con S , tale che u(x) < 0 per ogni x S. Consideriamo la funzione
M
S
[u]: la dierenza u M
S
[u] `e nulla su S e, per la (2.33), non positiva in
S; dunque il minimo di u M
S
[u] in S `e raggiunto in un punto x interno a
S. Ne segue che in tale punto deve essere u(x) = (u M
S
[u])(x) 0,
contro lipotesi u < 0 in S.
Viceversa, sia u C
2
() C() tale che u 0 in . Fissiamo un aperto
limitato

e una funzione v C(

) armonica in

. Allora (uv) 0
in

; per il principio del massimo debole (proposizione 2.3.3), si ha


max

(u v) = max

(u v),
ossia u `e subarmonica in .
Osservazione 2.8.5 Dalla proposizione 2.8.4 segue in particolare che la
somma, nonche il prodotto per scalari positivi, di funzioni subarmoniche
`e una funzione subarmonica.
2.9 Il problema di Dirichlet
Riprendiamo in esame il problema di Dirichlet per lequazione di Laplace in
un aperto limitato di R
n
. Gi`a sappiamo che per questo problema vi `e
84
unicit`a e dipendenza continua dai dati, ma lesistenza `e per adesso garantita
solo nel caso in cui `e una palla (teorema 2.5.1). Prenderemo in esame ora
aperti (limitati) molto generali.
Teorema 2.9.1 Sia un aperto limitato di R
n
, tale che per ogni y
esista una palla B tale che B = y. Allora per ogni g C() esiste
ununica funzione u C
2
() C() che risolve il problema di Dirichlet
_
u = 0 in
u = g su .
(2.35)
Di questo teorema esistono numerose dimostrazioni molto diverse fra loro.
Noi seguiremo quella, elementare anche se non banale, dovuta a Perron.
Dimostrazione Consideriamo le famiglie di funzioni
A = v C() : v `e subarmonica in , v g su
B = w C() : w `e superarmonica in , w g su .
(2.36)
Le due classi sono non vuote poiche
min

g A, max

g B.
Inoltre risulta
v w v A, w B; (2.37)
infatti, per ogni v A e w B la funzione v w `e subarmonica in virt` u
dellosservazione 2.8.5, ed `e non positiva su , da cui, per denizione di
subarmonicit`a e per il fatto che `e limitato, essa `e non positiva in .
Osserviamo che la soluzione u del problema (2.35), se esiste, appartiene ad
AB, e quindi verica v u w per ogni v A e per ogni w B. Questo
ci suggerisce di denire la candidata soluzione nel modo seguente:
u(x) = sup
vA
v(x) x . (2.38)
Proviamo dunque che questa funzione risolve (2.35). Sia x
0
un arbitrario
punto di . Per denizione di u(x
0
) esiste una successione u
k
A tale che
u
k
(x
0
) u(x
0
). Posto
v
k
(x) = maxu
1
(x), . . . , u
k
(x), x ,
85
`e chiaro che v
k
`e una successione crescente di elementi di A (proposizione
2.8.2), tale che v
k
(x
0
) u(x
0
).
Sia ora S una palla contenuta in contenente x
0
, e poniamo w
k
= M
S
[v
k
]
(si veda (2.32) e (2.31)). Allora w
k
A; infatti le w
k
sono subarmoniche
in (proposizione 2.8.3) e, coincidendo con v
k
in S, non superano g
su . Inoltre la successione w
k
`e crescente, in virt` u della crescenza di
v
k
e del principio del massimo, e si ha w
k
(x
0
) u(x
0
), poiche in S si ha
v
k
w
k
u per (2.33) e (2.38). In virt` u del corollario 2.7.5 e del teorema
2.7.1, concludiamo che le w
k
convergono uniformemente in ogni palla chiusa
S

S a una funzione w armonica in S, tale che w(x


0
) = u(x
0
).
Adesso ssiamo un generico punto S: esiste unaltra successione u
k

A (dipendente da ), tale che u
k
() u(). Deniamo
z
k
(x) = maxv
k
(x), u
1
(x), . . . , u
k
(x), x
e sia y
k
= M
S
[z
k
] (anche queste funzioni dipendono da ). Allora, come
prima, risulta z
k
A e y
k
A, y
k
`e crescente e, per il principio del
massimo, w
k
y
k
in ; inoltre y
k
() u() (perche u
k
z
k
y
k
u
in S). Quindi, analogamente, le y
k
convergono uniformemente in ogni palla
chiusa S

S a una funzione y armonica in S (dipendente da ), tale che


y() = u(). Risulta pertanto
y w in S, y(x
0
) = w(x
0
) = u(x
0
).
Dunque la funzione y w, armonica e non negativa su S, ha minimo uguale
a 0 nel punto x
0
interno a S: per il principio del massimo forte (corollario
2.6.6), y w `e nulla in S e, in particolare, w() = y() = u().
Abbiamo cos` eliminato la dipendenza da e provato che nel generico punto
S si ha u() = w(), ove w `e una ssata funzione armonica: ossia u `e
armonica in S. Poiche S `e una palla contenente un arbitrario punto x
0
,
possiamo dedurre nalmente che u `e armonica in .
Dimostriamo adesso che per ogni y risulta
lim
x, xy
u(x) = g(y); (2.39)
ci`o concluder`a la dimostrazione.
Ci occorre il seguente
Lemma 2.9.2 Sia un aperto limitato di R
n
, tale che per ogni y
esista una palla B tale che B = y. Allora per ogni y esiste una
86
funzione barriera, vale a dire una funzione x
y
(x), denita e continua in
, tale che
(i)
y
`e superarmonica in ,
(ii)
y
`e non negativa in ,
(iii)
y
(x) = 0 se e solo se x = y.
Dimostrazione Fissato y , sia B(, r) una palla tale che B(, r) =
y. Una funzione barriera `e allora, come `e immediato vericare,

y
(x) =
_
r
2n
[x [
2n
se n > 2
log
|x|
r
se n = 2.
Proviamo la (2.39). Sia y e sia > 0: per la continuit`a di g, esiste un
intorno aperto I di y tale che
[g(x) g(y)[ < x I .
Dunque, posto
K =
osc(g, )
min
y
(x) : x I
,
si ha
[g(x) g(y)[ < +K
y
(x) x ,
ove
y
`e la funzione barriera fornita dal lemma 2.9.2. Inoltre, essendo
g(y) K
y
() A, g(y) + +K
y
() B,
si ha
g(y) K
y
(x) u(x) g(y) + +K
y
(x) x ,
ovvero
[u(x) g(y)[ +K
y
(x) x .
Se ne deduce che
limsup
x, xy
[u(x) g(y)[ ,
e poiche `e arbitrario, la (2.39) `e provata.
Osservazione 2.9.3 Si noti che nella dimostrazione precedente abbiamo
usato le condizioni (ii) e (iii) della denizione di funzione barriera solamente
per x .
87
Capitolo 3
Lequazione del calore
3.1 Motivazioni siche
Lequazione del calore
u
t
(x, t) ku(x, t) = f(x, t), (3.1)
ove k `e una costante positiva e f `e una funzione continua assegnata, `e la pi` u
importante e la pi` u semplice fra le equazioni di tipo parabolico. Essendo pre-
sente la variabile t, naturalmente identicata con il tempo, questa equazione
descrive quei fenomeni di tipo evolutivo nei quali interviene una diusione,
ossia quando si ha il trasferimento di una data quantit`a di sostanza, o di
energia, dalle zone di alta concentrazione a quelle di bassa concentrazione.
La funzione f ha il signicato di una sorgente di gas, o di calore, interna alla
regione che si considera. Come vedremo, molte delle propriet`a matematiche
dellequazione del calore sono simili a quelle dellequazione di Laplace.
Abbiamo gi`a visto nellesempio 2.1.5 che lequazione (3.1) descrive la propa-
gazione del calore nello spazio, essendo u(x, t) la temperatura nel punto x
allistante t. Vediamo ora un altro esempio di diusione.
Esempio 3.1.1 Consideriamo un mezzo vuoto, oppure riempito di una
sostanza porosa. Se immettiamo in una certa quantit`a di gas, come si
`e gi`a detto, esso si dionder`a dalle zone di alta concentrazione a quelle di
rarefazione. Indichiamo con u(x, t) la concentrazione di gas nel punto x
allistante t. La legge (sperimentale) di Fick ci dice che la massa dF

di gas
che attraversa nellunit`a di tempo una supercie d centrata in x con versore
88
normale `e proporzionale al gradiente della concentrazione:
dF

= D
u

d, (3.2)
ove D `e il coeciente di diusione e compare il segno poiche la diusio-
ne deve andare nelle direzioni di concentrazione decrescente. Il coeciente D
potrebbe dipendere dal punto x se il mezzo non `e omogeneo, dalla temperatu-
ra del mezzo, dalla concentrazione stessa, ma noi supporremo per semplicit`a
che D sia una costante positiva. Dunque possiamo rappresentare la quantit`a
di gas che si allontana da x mediante il vettore
F = Du. (3.3)
Sia allora B una palla centrata in x di raggio r, contenuta in , e sia [t
0
, ]
un intervallo di tempo. La variazione di concentrazione in B in tale periodo
di tempo `e
_
B
c(x)[u(x, ) u(x, t
0
)]dx,
ove c(x) `e il coeciente di porosit`a, che supponiamo costante; se siamo nel
vuoto possiamo prendere c(x) 1. Risulta
_
B
[u(x, ) u(x, t
0
)]dx =
_

t
0
_
B
(F ) ddt,
poiche la concentrazione decresce se il vettore della diusione F punta verso
lesterno. Se ne deduce, tenuto conto di (3.2) e integrando per parti,
_

t
0
_
B
u
t
(x, t) dxdt =
_
B
[u(x, ) u(x, t)]dx =
=
_

t
0
_
B
D
u

(x, t) ddt =
_

t
0
_
B
Du(x, t) dxdt.
Inne, per larbitrariet`a di B e di [t
0
, ], si deduce
u
t
= Du in [0, [.
Quali condizioni ai limiti sono signicative per lequazione (3.1)? Poiche
in R
n+1
la supercie n-dimensionale t = 0 `e caratteristica, non possiamo
assegnare condizioni iniziali su u e su
u
t
, perche questultima quantit`a `e
89
determinata dallequazione. Fisicamente, tornando allinterpretazione della
(3.1) come modello della propagazione del calore in un corpo , ha senso
assegnare la temperatura del corpo allistante iniziale
u(x, 0) = (x), x ,
e prescrivere poi, per esempio,
u

(x, t) = (x) x , t > 0,


il che corrisponde a supporre che il corpo scambi calore con lesterno in modo
pressato (in particolare, se = 0 vi `e isolamento termico), oppure
u(x, t) = (x) x , t > 0,
il che signica che la temperatura sul bordo di `e mantenuta a un determi-
nato livello. Ma altre condizioni ai limiti sono possibili: se il corpo `e immerso
in un uido, con il quale vi `e scambio di calore per convezione, allora per
la legge di Newton la quantit`a di calore che passa dal corpo al uido `e pro-
porzionale (localmente) alla dierenza delle temperature. In altre parole, se
(x, t) `e la temperatura del uido a contatto con il corpo (dunque x ),
si ha
h(x)u(x, t) (x) = (x)[u(x, t) (x, t)],
ove h(x) `e la conducibilit`a termica nel punto x e (x) `e un fattore
di proporzionalit`a. Supponendo per semplicit`a e h funzioni costanti, si
ottiene
u +h
u

= =: su [0, [.
Abbiamo dunque tre tipi di problemi ai limiti per lequazione del calore: il
problema di Cauchy-Dirichlet
_

_
u
t
u = f in ]0, [,
u(x, 0) = (x) in ,
u(, t)[

= t > 0,
(3.4)
il problema di Cauchy-Neumann
_

_
u
t
u = f in ]0, [,
u(x, 0) = (x) in ,
u

(, t)

= t > 0,
(3.5)
90
e il problema di Cauchy con condizioni di Robin
_

_
u
t
u = f in ]0, [,
u(x, 0) = (x) in ,
_
u(, t) +
u

(, t)
_

= t > 0.
(3.6)
Osserviamo inne che linsieme dei tempi pu`o essere un qualunque intervallo
[t
0
, T], o una semiretta [t
0
, [, o anche tutto R. Noi assumeremo sempre
t
0
= 0 e inoltre, con una diversa scala dei tempi, non `e restrittivo supporre
che in (3.1) il coeciente di diusione k sia uguale a 1.
3.2 Principio del massimo
Consideriamo dunque lequazione del calore omogenea
u
t
u = 0. (3.7)
Sar`a naturale considerare il seguente spazio funzionale:
Denizione 3.2.1 Se A `e un aperto di R
n+1
, lo spazio C
2,1
(A) `e costituito
dalle funzioni u C(A) tali che D
i
u, D
i
D
j
u, u
t
appartengono a C(A) per
ogni i, j 1, . . . , n.
Per le soluzioni dellequazione del calore in un aperto A vale, sotto ipotesi
molto blande, un principio di massimo simile a quello relativo alle funzioni
armoniche (proposizione 2.3.3).
Proposizione 3.2.2 (principio del massimo) Sia A un aperto di R
n+1
.
Poniamo per T R:
A
T
= (x, t) A : t < T,
S
T
= (x, t) A : t < T,

T
= (x, t) A : t = T.
Supponiamo che esista T R tale che laperto A
T
sia non vuoto e limitato,
e sia u C(A) C
2,1
(A). Se risulta u
t
u 0 in A, allora
max
A
T
u = max
S
T
u;
91
se invece risulta u
t
u 0 in A, allora
min
A
T
u = min
S
T
u.
Dimostrazione Supponiamo che u
t
u 0. Sia (x, t) un arbitrario punto
di A
T
e scegliamo ]t, T[. Per > 0, la funzione
v(x, t) = u(x, t) t
`e continua in A

e soddisfa
v
t
v = u
t
u in A.
Sia (x
0
, t
0
) un punto di massimo per v in A

: tale punto pu`o stare in A, e


dunque in A

, oppure in A, dunque in S

. Nel primo caso avremmo


v
t
(x
0
, t
0
) 0, D
2
i
u(x
0
, t
0
) 0, i = 1, . . . , n,
da cui v
t
v 0, assurdo. Dunque si ha (x
0
, t
0
) S

S
T
. Pertanto
u(x, t) = v(x, t) +t max
S
T
v +T max
S
T
u + 2K,
ove K `e unopportuna costante (si ricordi che A
T
`e limitato). Per 0 si
ottiene u(x, t) max
S
T
u. Dato che il punto (x, t) era arbitrario, si ha la tesi
grazie alla continuit`a di u su A
T
.
Se u
t
u 0, si fa un ragionamento del tutto analogo.
Il principio del massimo ora dimostrato `e in forma debole, perche non esclude
che la funzione u assuma massimo anche in punti di A
T
S
T
; tuttavia esso
`e pi` u che suciente per i nostri scopi, e daltronde la versione forte `e di
dimostrazione intricata e alquanto lunga, seppure non dicile.
Osservazioni 3.2.3 (1) Se laperto A
T
non `e limitato, il principio del mas-
simo in generale non vale. Ad esempio, se n = 1 le funzioni
u
k
(x, t) = ce
k
2
t
sin kx
sono tutte soluzioni in A =]0, [R del problema
_
u
t
u
xx
= 0 in A
u(0, t) = u(, t) = 0 t R,
92
ma sono illimitate in A. Si noti che in questo caso A
T
=]0, [] , T[ e
che per questo problema non c`e unicit`a della soluzione.
(2) Dal principio del massimo segue che il problema di Dirichlet per lequa-
zione del calore non `e ben posto: scelti ad esempio n = 1 e A =]0, 1[]0, T[,
il problema
_
u
t
u
xx
= 0 in A
u = su A
non pu`o avere alcuna soluzione se si prende una C(A) che abbia (
1
2
, T)
come unico punto di massimo assoluto.
Una prima conseguenza del principio del massimo, di immediata dimostra-
zione, `e lunicit`a e la dipendenza continua dai dati per il problema di Cauchy-
Dirichlet:
Corollario 3.2.4 Sia A = ]0, T[, ove `e un aperto limitato di R
n
. Se
f C(A), C() e C( [0, T]), allora il problema
_

_
u
t
u = f in A,
u(x, 0) = (x) in ,
u(, t)[

= t [0, T],
(3.8)
ha al pi` u una soluzione u C(A) C
2,1
(A). Se inoltre f 0, risulta
|u|
C(A)
= max||
C()
, ||
C([0,T])
. (3.9)
Il risultato espresso dal corollario precedente pu`o essere migliorato. Si ha:
Teorema 3.2.5 Sia A = ]0, T[, ove `e un aperto limitato di R
n
con
di classe C
1
a tratti. Se f C(A), C() e C([0, T]), allora il
problema
_

_
u
t
u = f in A
u(x, 0) = (x) in ,
_
u(, t) +
u

(, t)
_

= t [0, T],
(3.10)
ove e sono costanti non negative e non entrambe nulle, ha al pi` u una
soluzione nella classe delle funzioni u C(A) C
2,1
(A) per le quali
u


93
C(A). Inoltre, se = 0, oppure se i numeri e sono entrambi positivi,
risulta per ogni t [0, T]
_

[u(x, t)[
2
dx e
t
_

[(x)[
2
dx +
+
_
t
0
e
ts
__

[f(x, s)[
2
dx +K
_

[(x, s)[
2
d
_
ds,
ove K `e unopportuna costante.
Come si vede, qui si ha dipendenza continua dai dati rispetto alla norma
L
2
nello spazio, anziche nella norma uniforme. Vedremo fra poco che per
il problema di Cauchy-Dirichlet vale anche la dipendenza continua rispetto
alla norma uniforme, generalizzando la (3.9) al caso di secondo membro non
nullo.
Dimostrazione Utilizziamo il metodo dellenergia, che avr`a molte applica-
zioni anche nel seguito. Sia u una soluzione del problema. Moltiplichiamo
lequazione per u(x, t) e integriamo su per t [0, T] ssato: utilizzando la
formula di Green (si noti che la derivata normale di u `e continua in A) si ha
1
2
d
dt
_

[u(x, t)[
2
dx =
_

u
t
udx =
_

(f + u)udx =
=
_

f udx +
_

ud
_

[Du[
2
dx.
(3.11)
Se > 0 e > 0, possiamo scrivere ad esempio u =
1

(
u

) su :
quindi
_

ud =
_

2
d +
_

d.
Sostituendo in (3.11) si ricava, utilizzando la relazione ab

2
a
2
+
1
2
b
2
, valida
per ogni a, b R e per ogni > 0,
1
2
d
dt
_

[u(x, t)[
2
dx
_

2
d +
_

d +
_

f udx

+

2
__

2
d +
1
2
_

[[
2
d +
+
1
2
_

[f[
2
dx +
1
2
_

[u[
2
dx.
94
Scelto = 2, otteniamo
d
dt
_

[u(x, t)[
2
dx
_

[u(x, t)[
2
dx
_
C
_

[[
2
d +
_

[f[
2
dx
_
. (3.12)
Questa stessa relazione si ottiene anche quando = 0, osservando che in tal
caso su si ha
u
u

2
0 se > 0, u
u

[u[
2
0 se > 0;
ci`o implica
_

u
u

d 0,
cosicche la (3.12) segue direttamente dalla (3.11).
La (3.12) `e una disequazione dierenziale ordinaria del primo ordine nellin-
cognita v(t) =
_

[u(x, t)[
2
dx; con facile calcolo si vede che essa equivale alla
relazione
v(t) e
t
v(0) +
_
t
0
e
ts
_
C
_

[[
2
d +
_

[f[
2
dx
_
ds,
che `e precisamente la tesi.
Come si `e visto nellosservazione 3.2.3, il principio del massimo non vale in
generale per aperti illimitati di R
n+1
. Tuttavia, se si assume unipotesi sul
comportamento allinnito della funzione u, tale principio si pu`o estendere
in varie versioni: ci limitiamo a fornire lenunciato pi` u semplice relativo al
caso A = R
n
]0, T[.
Teorema 3.2.6 (di Phragmen-Lindelof) Sia T > 0 e sia u C(R
n

[0, T]) C
2,1
(R
n
]0, T[) una funzione vericante le seguenti propriet`a:
(i) u
t
u 0 in R
n
]0, T[,
(ii) u(x, 0) 0 per ogni x R
n
,
(iii) esistono R > 0, K > 0, > 0 tali che
u(x, t) Ke
|x|
2
per [x[ R, t [0, T].
Allora u 0 in R
n
[0, T].
95
Dimostrazione Supponiamo dapprima che valga, in luogo di (iii), lipotesi
pi` u forte
(iii) liminf
|x|
u(x, t) 0 uniformemente rispetto a t [0, T].
Sia > 0. Esiste allora R

> 0 tale che u(x, t) per [x[ R

e t [0, T].
La funzione v = u + verica
_

_
v
t
v 0 in C

= (x, t) R
n
]0, T[: [x[ < R

v(x, 0) 0 per [x[ R

v(x, t) 0 per [x[ = R

, t [0, T].
Per il principio del massimo (proposizione 3.2.2) si ha v 0 in C

. Dunque
u = v per [x[ R

e t [0, T]; pertanto si ha u in R


n
[0, T].
Poiche `e arbitrario, concludiamo che u 0 in R
n
[0, T].
Torniamo allipotesi pi` u generale (iii). Fissato > , consideriamo la
funzione ausiliaria
v(x, t) =
e
|x|
2
14t
(1 4t)
n/2
, x R
n
, t
_
0,
1
8
_
.
Con un calcolo laborioso ma non dicile si verica che
v
t
v = 0 in R
n

_
0,
1
8
_
,
e inoltre, ovviamente,
v(x, t) e
|x|
2
in R
n

_
0,
1
8
_
.
Quindi, per > 0 la funzione w = u +v verica
_

_
w
t
w 0 in R
n

_
0,
1
8
T
_
,
w(x, 0) = u(x, 0) +e
|x|
2
0 in R
n
liminf
|x|
w(x, t) 0 uniformemente rispetto a t
_
0,
1
8
_
,
ove lultima propriet`a segue osservando che, essendo > , si ha per [x[
sucientemente grande
w(x, t) Ke
|x|
2
+e
|x|
2
> 0.
96
In denitiva w soddisfa le condizioni (i), (ii) e (iii); dunque, per quanto gi`a
dimostrato, si ha w 0 in R
n
[0,
1
8
T], ossia
u(x, t) v(x, t) (x, t) R
n

_
0,
1
8
T
_
.
Ne segue, per larbitrariet`a di ,
u 0 in R
n

_
0,
1
8
T
_
.
Se
1
8
T, abbiamo concluso; altrimenti, lintera argomentazione si pu`o
ripetere per le funzioni
u
1
(x, t) = u(x, t +
1
8
), u
2
(x, t) = u(x, t +
2
8
), u
3
(x, t) = u(x, t +
3
8
), ecc.,
e si ottiene la non negativit`a di u nelle strisce R
n
[
1
8
,
2
8
], R
n
[
2
8
,
3
8
],
R
n
[
3
8
,
4
8
], eccetera, no a ricoprire R
n
[0, T] dopo un numero nito di
passi.
Corollario 3.2.7 (maggiorazione a priori) Sia T > 0 e sia u C(R
n

[0, T]) C
2,1
(R
n
]0, T[) una funzione tale che esistano R > 0, > 0, K > 0
per cui
[u(x, t)[ Ke
|x|
2
per [x[ R, t [0, T].
Allora
[u(x, t)[ sup
xR
n
[u(x, 0)[ +T sup
R
n
[0,T]
[u
t
u[ x R
n
, t [0, T].
Dimostrazione Se il secondo membro della disuguaglianza `e innito, non
c`e nulla da dimostrare: supponiamo quindi che i due estremi superiori siano
niti. Consideriamo le funzioni
w

(x, t) = sup
xR
n
[u(x, 0)[ +t sup
R
n
[0,T]
[u
t
u[ u(x, t).
Allora si ha, denotando entrambe le funzioni con w,
_

_
w
t
w = sup
R
n
[0,T]
[u
t
u[ (u
t
u) 0 in R
n
[0, T],
w(x, 0) = sup
xR
n
[u(x, 0)[ u(x, 0) 0 in R
n
,
w(x, t) [u(x, t)[ Ke
|x|
2
per [x[ R, t [0, T].
Dal teorema di Phragmen-Lindelof segue che w 0, ossia w

0, in R
n

[0, T], cio`e la tesi.


97
Osservazioni 3.2.8 (1) La maggiorazione a priori `e ottimale: infatti se
u(x, t) = 1 + t, si ha u
t
u = 1, u(x, 0) = 1 e il corollario precedente
fornisce la stima 1 +t 1 +T in [0, T], che `e la pi` u precisa possibile.
(2) Dal corollario precedente si ricava lunicit`a e dipendenza continua dai
dati in norma uniforme per la soluzione del problema di Cauchy
_

_
u
t
u = f in R
n
]0, T[
u(x, 0) = (x) in R
n
> 0 : [u(x, t)[ = O(e
|x|
2
) uniformemente in [0, T] per [x[ .
(3) In modo del tutto analogo, utilizzando il principio del massimo (propo-
sizione 3.2.2), si dimostra la maggiorazione a priori per un aperto limitato
e per una funzione u C( [0, T]) C
2,1
(]0, T[):
[u(x, t)[ max
_
max
x
[u(x, 0)[, max
[0,T]
[u[
_
+T sup
]0,T[
[u
t
u[
per ogni (x, t) [0, T]; da questa stima si deduce lunicit`a e la dipendenza
continua dai dati per il problema di Cauchy-Dirichlet (3.8), generalizzando
il corollario 3.2.4.
Finora abbiamo visto teoremi di unicit`a e di dipendenza continua dai dati,
supponendo, nel caso = R
n
, che le soluzioni avessero un comportamento al-
linnito non peggiore di e
|x|
2
. Ma in realt`a esistono soluzioni dellequazione
del calore in R
n
]0, [ che tendono allinnito ancora pi` u rapidamente.
Esempio 3.2.9 (Tikhonov) Consideriamo la funzione olomorfa
g(z) = e
1/z
2
, z C 0,
e deniamo la funzione
u(x, t) =
_

k=0
g
(k)
(t)
(2k)!
x
2k
se t > 0, x R
0 se t = 0, x R.
(3.13)
Formalmente si ha, derivando la serie termine a termine,
_
u
t
= u
xx
in R]0, [
u(x, 0) = 0 in R,
(3.14)
98
e tra poco giusticheremo rigorosamente questi fatti. Da ci`o segue che il
problema di Cauchy
_
w
t
w
xx
= f in R]0, [
w(x, 0) = (x) in R,
in cui non si prescrive per la w un andamento al pi` u esponenziale allinnito,
non pu`o avere soluzione unica, poiche se w `e soluzione, anche w + u lo `e, se
u `e la funzione di Tikhonov (3.13). Naturalmente, dato che tutto questo non
deve contraddire il teorema di Phragmen-Lindelof, la funzione (3.13) non pu`o
soddisfare alcuna disuguaglianza della forma
[u(x, t)[ Ke
|x|
2
(x, t) R [0, T]
con , T > 0.
Dimostriamo che vale (3.14). Cominciamo a far vedere che la serie in (3.13) `e
uniformemente convergente in ogni semi-striscia della forma [a, a] [, [.
Fissato t , la formula di Cauchy, applicata alla circonferenza C
t
del piano
complesso di centro t e raggio t/2, fornisce
g
(k)
(t) =
k!
2i
_
Ct
g(z)
(z t)
k+1
dz k N. (3.15)
Poiche vale la relazione, di facile verica,

1
z

4
3t

=
2
3t
z C
t
,
si deduce che per ogni z C
t
esiste [0, 2] tale che
1
z
=
4
3t
_
1 +
e
i
2
_
,
da cui
1
z
2
=
16
9t
2
_
1 +
e
2i
4
+e
i
_
,
e dunque
Re
1
z
2
=
16
9t
2
_
1 +
cos 2
4
+ cos
_

4
9t
2
t ,
99
ove lultima disuguaglianza si ottiene minimizzando rispetto a in [0, 2] (il
minimo si ha per = ). Da qui, ricordando (3.15), ricaviamo
[g
(k)
(t)[
k!
2
_
Ct
[g(z)[
[z t[
k+1
[dz[ =
k!
2
_
2
0
e
Re(1/z
2
)
(t/2)
k+1
t
2
d
k!
_
2
t
_
k
e

4
9t
2
;
ottenendo inne

k=0
[g
(k)
(t)[
(2k)!
x
2k
e

4
9t
2

k=0
2
k
k!
(2k)!
x
2k
t
k
e

4
9t
2

k=0
1
k!
x
2k
t
k
= e

4
9t
2
+
x
2
t
, (3.16)
cosicche la serie in (3.13) `e convergente. Inoltre `e facile constatare che, in
particolare,
lim
N
sup
(x,t)[a,a][,[

k=N
g
(k)
(t)
(2k)!
x
2k

= 0,
il che prova la convergenza uniforme. In modo analogo si dimostra che le
serie

k=0

t
g
(k)
(t)
(2k)!
x
2k
,

k=0

2
x
2
g
(k)
(t)
(2k)!
x
2k
sono uniformemente convergenti in [a, a] [, [. Ne segue u
t
u
xx
= 0 in
R]0, [. Dalla (3.16) segue anche
lim
t0
+
u(x, t) = 0 uniformemente rispetto a x [a, a],
e quindi u C(R [0, [) e u(x, 0) = 0. La validit`a di (3.14) `e provata.
3.3 La soluzione fondamentale
In questo paragrafo ci dedicheremo alla risoluzione esplicita del problema di
Cauchy
_

_
u
t
u = 0 in R
n
]0, [
u(x, 0) = (x) x R
n
,
[u(x, t)[ Ke
|x|
2
(x, t) R
n
[0, [
(3.17)
100
per opportuni , K > 0, ove C(R
n
) L

(R
n
). La soluzione sar`a de-
terminata attraverso la costruzione della cosiddetta soluzione fondamentale
dellequazione del calore, per mezzo della quale, come vedremo in segui-
to, risolveremo anche i problemi di Cauchy-Dirichlet e Cauchy-Neumann in
[0, T], con aperto limitato di tipo assai generale.
Denizione 3.3.1 Si chiama soluzione fondamentale dellequazione del ca-
lore la funzione
(x, t) =
e

|x|
2
4t
(4t)
n/2
, (x, t) R
n
]0, [. (3.18)
Osserviamo che, come promette il suo nome, la funzione (x, t) verica

t
= 0 in R
n
]0, [. (3.19)
Infatti risulta, come `e facile vericare,

t
(x, t) =
e

|x|
2
4t
(4t)
n/2
_

n
2t
+
[x[
2
4t
2
_
, (3.20)
D
i
(x, t) =
e

|x|
2
4t
(4t)
n/2
_

x
i
2t
_
, i = 1, . . . , n, (3.21)
D
j
D
i
(x, t) =
e

|x|
2
4t
(4t)
n/2
_
x
j
x
i
4t
2


ij
2t
_
, i, j = 1, . . . , n, (3.22)
e in particolare
D
2
i
(x, t) =
e

|x|
2
4t
(4t)
n/2
_
x
2
i
4t
2

1
2t
_
, i = 1, . . . , n, (3.23)
da cui la (3.19).
Da dove scaturisce e come si utilizza la soluzione fondamentale? Cominciamo
con un calcolo euristico. Supponiamo che u sia una soluzione (che sappiamo
essere unica) del problema (3.17). Andiamo ad applicare la trasformata di
Fourier allequazione u
t
u = 0.
Ricordiamo che la trasformata di Fourier `e loperatore T denito su L
1
(R
n
)
dalla corrispondenza f

f, ove
Tf() =

f() =
_
R
n
e
i x
f(x) dx, R
n
;
101
esso `e bigettivo da o(R
n
) in o(R
n
), ove
o(R
n
) = f C

(R
n
) : x x

f(x) L

(R
n
) , N
n
,
e si estende univocamente ad un isomorsmo dello spazio di Hilbert L
2
(R
n
)
in se, con
|Tf|
L
2
(R
n
)
= (2)
n
2
|f|
L
2
(R
n
)
f L
2
(R
n
).
Inoltre la trasformata di Fourier gode delle seguenti propriet`a:

D
j
u() = i
j
u() R
n
, u C
1
(R
n
) con u, D
j
u L
1
(R
n
), (3.24)

f g() =

f() g() R
n
, f, g L
1
(R
n
), (3.25)
ove il simbolo denota il prodotto di convoluzione fra due funzioni:
g h(x) = h g(x) =
_
R
n
g(x y)h(y) dy, x R
n
.
Applichiamo dunque la trasformata di Fourier (rispetto alla variabile x, con
t > 0 ssato), senza preoccuparci troppo del fatto che, a priori, la funzione
u(, t) potrebbe non essere in L
1
(R
n
): il conto che segue, in eetti, serve solo a
costruire una candidata soluzione. Si ottiene, tenuto conto della propriet`a
(3.24),
u
t
(, t) +[[
2
u(, t) = 0 (, t) R
n
]0, [, (3.26)
mentre dalla condizione iniziale si ricava
u(, 0) = () R
n
. (3.27)
Le condizioni (3.26)-(3.27) determinano un problema di Cauchy per una
equazione ordinaria del primo ordine, dipendente dal parametro . La sua
unica soluzione `e
u(, t) = () e
||
2
t
, (, t) R
n
]0, [.
Daltra parte `e noto, benche la verica richieda qualche accorgimento tecnico,
che
e
||
2
t
=
1
(4t)
n/2

| |
2
4t
() = T
_
e

| |
2
4t
(4t)
n/2
_
(),
102
cosicche
u(, t) = T()() T
_
e

| |
2
4t
(4t)
n/2
_
(),
e, per la propriet`a (3.25), concludiamo che se u `e soluzione di (3.17), allora
u `e data da
u(x, t) =
e

| |
2
4t
(4t)
n/2
(x) =
1
(4t)
n/2
_
R
n
e

|xy|
2
4t
(y) dy, (3.28)
ossia
u(x, t) =
_
R
n
(x y, t)(y) dy, (x, t) R
n
]0, [. (3.29)
La soluzione fondamentale, pertanto, permette di scrivere la (candidata) so-
luzione del problema di Cauchy (3.17) come un integrale di convoluzione, in
termini del dato iniziale.
Osservazione 3.3.2 Prendiamo, in particolare, una successione di dati ini-
ziali della forma

(y) =
1

_
y

_
,
con C

0
(R
n
) ssata, nulla fuori di B(0, 1) e tale che
_
R
n
(y) dy = 1;
allora le misure

(y)dy convergono debolmente alla misura di Dirac


0
(ossia risulta, come `e facile vericare,
lim
0
+
_
R
n
g(y)

(y) dy =
0
, g) = g(0) g C(R
n
)).
Dunque, detta u

(x, t) la corrispondente funzione (3.29), si ha


lim
0
+
u

(x, t) = (x, t).


Possiamo dunque interpretare la soluzione fondamentale come la risposta,
allistante t, di un impulso partito allistante 0 nel punto x.
Proviamo ora che la candidata soluzione (3.29) `e davvero una soluzione
dimostrando il teorema di esistenza seguente:
103
Teorema 3.3.3 Se C(R
n
) L

(R
n
), allora il problema (3.17) ha unu-
nica soluzione u data dalla (3.29), ove `e la soluzione fondamentale delle-
quazione del calore denita da (3.18). Inoltre u C
2,1
(R
n
]0, [) C(R
n

[0, [) L

(R
n
]0, [) e si ha
|u|
L

(R
n
[0,[)
||
L

(R
n
)
.
Dimostrazione Dobbiamo far vedere che la funzione (3.29) `e soluzione di
(3.17). Questo non `e troppo complicato: infatti nella soluzione fondamentale
`e presente unesponenziale negativa che permette di derivare la funzione u
quante volte si vuole portando la derivata sotto il segno di integrale.
`
E facile
allora vericare che u
t
= u in ogni punto di R
n
]0, [.
Pi` u delicato `e vericare che
u(x
0
, 0) = lim
(x,t)(x
0
,0)
u(x, t) = (x
0
) x
0
R
n
: (3.30)
a questo scopo, notiamo per cominciare che
_
R
n
e

|xy|
2
4t
(4t)
n/2
dy =
n/2
_
R
n
e
||
2
d = 1 t > 0, (3.31)
per cui, ssato x
0
R
n
, possiamo scrivere la dierenza u(x, t) (x
0
) nel
modo seguente:
u(x, t) (x
0
) =
_
R
n
e

|xy|
2
4t
(4t)
n/2
[(y) (x
0
)] dy. (3.32)
Sia > 0: poiche `e continua in x
0
, esiste > 0 tale che [(y) (x
0
)[ <
per [y x
0
[ < . Inoltre esiste > 0 tale che
_
||>r
e
||
2
d < r .
Da (3.32) segue allora, posto = y x
0
e successivamente =
xx
0

t
,
[u(x, t) (x
0
)[ =

_
R
n
e

|xx
0
|
2
4t
(4t)
n/2
[(x
0
+) (x
0
)] d


_
||<
e

|xx
0
|
2
4t
(4t)
n/2
d + 2||

_
||
e

|xx
0
|
2
4t
(4t)
n/2
d <
< + 2
n/2
||

_
|2

t+xx
0
|
e
||
2
d.
104
Dunque, per ogni (x, t) tale che [x x
0
[ <

2
e 0 < t <

2
16
2
, otteniamo
[u(x, t) (x
0
)[ < + 2
n/2
||

_
||
e
||
2
d < C,
ove C `e unopportuna costante. Pertanto la (3.30) `e vericata.
Inne, utilizzando (3.31) si verica immediatamente che
|u|

||

,
e ci`o prova che la funzione (3.28) risolve il problema (3.17).
Osservazioni 3.3.4 (1) La soluzione dellequazione del calore fornita dal
teorema 3.3.3 `e di classe C

(anzi analitica, come vedremo) in R


n
]0, [,
anche se il dato iniziale `e solo una funzione continua: c`e quindi un feno-
meno di regolarizzazione nel tempo che `e tipico delle equazioni paraboliche
e non si riscontra invece nelle iperboliche. Questa propriet`a `e unaltra simi-
litudine fra equazioni paraboliche ed ellittiche.
(2) Se, invece della condizione u C(R
n
[0, [) e u(x, 0) = (x) per ogni
x R
n
, richiedessimo la condizione (pi` u debole di (3.30))
lim
t0
+
u(x, t) = (x) x R
n
,
perderemmo lunicit`a della soluzione. Ad esempio, per n = 1, la funzione
(3.21), ossia
v(x, t) =

x
(x, t) =
2

x e

x
2
4t
(4t)
3/2
risolve lequazione v
t
v
xx
= 0 in R]0, [, `e continua in R[0, [(0, 0)
ed ha limite nullo per t 0 in ogni punto x R, senza essere identica-
mente nulla; daltra parte la funzione identicamente nulla gode delle stesse
propriet`a.
(3) Abbiamo sempre preso t = 0 come istante iniziale nel problema di Cau-
chy: nulla vieta per`o di scegliere invece un qualunque s R. La soluzione
del problema (3.17) con istante iniziale s `e
u(x, t) =
_
R
n
(x y, t s) (y) dy, (x, t) R
n
]s, [. (3.33)
105
(4) Il problema di Cauchy a ritroso nel tempo non `e ben posto, perche manca
la dipendenza continua dai dati: ad esempio, per ogni > 0, la funzione
u

(x, t) = e

2
sin
x

risolve lequazione del calore in R R ed anche, in particolare, il problema


di Cauchy allindietro
_
(u

)
t
u

= 0 in R] , 0[
u

(x, 0) = sin
x

x R.
Benche si abbia sin
x

0 uniformemente per 0
+
, risulta per ogni
T > 0
|u

|
C(R
n
[T,0])
= e
T/
2
+ per 0
+
.
Questo fatto illustra in qualche senso lirreversibilit`a dei fenomeni di diu-
sione.
(5) Sia una funzione continua e non negativa su R
n
, non identicamen-
te nulla e tale che = 0 fuori della palla B(x
0
, r). Allora la soluzione
u(x, t) =
_
R
n
(x , t)() d `e strettamente positiva per ogni t > 0 e
x R
n
. Questo ci dice che nei problemi parabolici le perturbazioni si propa-
gano con velocit`a innita.
(6) C`e una versione pi` u generale del teorema 3.3.3, nella quale il dato iniziale
verica la condizione
C(R
n
), x (x)e
|x|
2
L

(R
n
)
per un ssato > 0. Sotto queste ipotesi si pu`o provare che la funzione (3.29)
`e soluzione del problema in R
n
]0, T] per ogni T <
1
4
. La dimostrazione
`e analoga, con qualche complicazione in pi` u per vericare che le derivazioni
sotto il segno di integrale sono ancora lecite.
La soluzione fondamentale (x, t) utilizzata nella dimostrazione del teorema
3.3.3 gode, come abbiamo visto, di svariate interessanti propriet`a, che qui
rielenchiamo. Anzitutto (si veda (3.19)) essa risolve lequazione del calore in
R
n
]0, [. Poi, per (3.31), per ogni t > 0 tale funzione `e la densit`a di una
misura
t
su R
n
di massa unitaria:

t
(E) =
_
E
(x, t) dx,
t
(R
n
) = 1 t > 0. (3.34)
106
Inoltre, le relazioni (3.30) e (3.29) ci dicono che le misure
t
, pensate come
operatori lineari e continui sullo spazio di Banach C(R
n
) L

(R
n
), conver-
gono debolmente* alla misura di Dirac
0
per t 0
+
, ossia risulta, per ogni
C(R
n
) L

(R
n
):
lim
t0
+

t
, ) = lim
t0
+
_
R
n
(x, t)(x) dx = (0) =
0
, ).
Inne, osserviamo che, denotando con u(x, t; s, ) la funzione (3.33), ossia la
soluzione del problema (con K > 0, > 0 e s R ssati)
_

_
u
t
u = 0 in R
n
]s, [
u(x, s) = (x) x R
n
[u(x, t)[ Ke
|x|
2
(x, t) R
n
[s, [,
(3.35)
si vede immediatamente che essa `e continua rispetto a (x, t, s) in R
n
(t, s) :
0 t s, nonche lineare rispetto a . Inoltre, per unicit`a, si ha
u(x, t; s, ) = u(x, t; , u(, ; s, )) [s, t].
Introducendo loperatore
t
: C(R
n
) L

(R
n
) C(R
n
) L

(R
n
), denito
per ogni t > 0 da
(
t
)(x) = u(x, t; 0, ) x R
n
, C(R
n
) L

(R
n
),
si ottiene allora che ciascun
t
`e lineare e continuo sullo spazio C(R
n
)
L

(R
n
), con norma uguale a 1, e la famiglia
t

t0
`e un semigruppo di
operatori, ossia verica

0
= I,
t+
=
t

t, 0;
scrivendo esplicitamente questa relazione applicata a una generica , e ap-
plicando il teorema di Fubini, si ottiene in particolare, per larbitrariet`a di
, la seguente identit`a soddisfatta dalla soluzione fondamentale:
(x , t +) =
_
R
n
(x y, t)(y , ) dy x, R
n
, t, > 0.
La formula (3.33) ha uninterpretazione sica in termini di calore e tempe-
ratura, alla quale si `e gi`a sommariamente accennato (osservazione 3.3.2). La
107
quantit`a (x , t s) `e la temperatura che si ha nel punto x allistante
t, indotta da unemanazione di calore unitaria, avvenuta istantaneamente
al tempo s e concentrata nel punto . Il contributo alla temperatura in
x al tempo t dovuto al calore presente in al tempo s `e dunque pari a
(x , t s)(). La somma di tutti i contributi emanati allistante s, che
determina la temperatura eettiva u(x, t) nel punto x al tempo t, `e dunque
data dallintegrale
_
R
n
(x , t s)() d.
Useremo la soluzione fondamentale per costruire le soluzioni di svariati pro-
blemi ai limiti. A questo scopo `e necessario procurarci alcune utili maggio-
razioni per essa e per le sue derivate.
Proposizione 3.3.5 Sia la soluzione fondamentale dellequazione del ca-
lore. Allora esistono C, L > 0 tali che per ogni x, x
0
R
n
e per ogni t > 0 si
ha:
(i) [(x, t)[ C t

n
2
e
L
|x|
2
t
;
(ii) [D
i
(x, t)[ C t

n+1
2
e
L
|x|
2
t
, i = 1, . . . , n;
(iii) [

t
(x, t)[ C t

n+2
2
e
L
|x|
2
t
;
(iv) [D
i
D
j
(x, t)[ C t

n+2
2
e
L
|x|
2
t
, i, j = 1, . . . , n;
(v) [(x, t) (x
0
, t)[ C [x x
0
[

n+
2
e
L
(|x||x
0
|)
2
t
per ogni [0, 1];
(vi) [D
i
(x, t) D
i
(x
0
, t)[ C [x x
0
[

n+1+
2
e
L
(|x||x
0
|)
2
t
, i = 1, . . . , n,
per ogni [0, 1].
Dimostrazione Sono tutte veriche facili che si fanno per mezzo di una
stima esplicita, partendo dalle (3.18), (3.20), (3.21) e (3.22). Verichiamo la
(vi) che si ottiene invece per interpolazione (come la (v), ma questultima `e
analoga e ancora pi` u semplice). Usando (ii) si ha
[D
i
(x, t) D
i
(x
0
, t)[ [D
i
(x, t)[ +[D
i
(x
0
, t)[
2C t

n+1
2
e
L
(|x||x
0
|)
2
t
,
mentre usando (iv) e il teorema del valor medio si trova
[D
i
(x, t) D
i
(x
0
, t)[ = [D
i
(, t) (x x
0
)[
nC [x x
0
[ t

n+2
2
e
L
(|x||x
0
|)
2
t
;
108
dunque, ssato [0, 1], possiamo scrivere
[D
i
(x, t) D
i
(x
0
, t)[ = [D
i
(x, t) D
i
(x
0
, t)[
(1)+

_
2C t

n+1
2
e
L
(|x||x
0
|)
2
t
_
1
_
nC [x x
0
[ t

n+2
2
e
L
(|x||x
0
|)
2
t
_

,
da cui segue subito la tesi.
Concludiamo questo paragrafo mostrando che la soluzione del problema di
Cauchy (3.17) `e una funzione analitica per qualunque dato C(R
n
)
L

(R
n
), come annunciato nellosservazione 3.3.4(1).
Teorema 3.3.6 Se u risolve il problema di Cauchy (3.17) in R
n
]0, [,
allora u `e analitica in R
n
]0, [.
Dimostrazione Anzitutto, la soluzione fondamentale `e ben denita in cam-
po complesso: infatti lespressione
(z, ) =
e

z z
4
(4)
n/2
ha senso, ed `e anzi olomorfa, per z C
n
e C con Re > 0, se si prende
come radice quadrata di quella con parte reale positiva. Inoltre, per ogni
R
n
, per ogni z = x + iy C
n
, e per ogni = t + i con t > 0 si ha,
ponendo =

t
(cosicche

1 +
2
=
||
t
):
[(z , )[ =

(4)
n/2

(z) (z)
4

=
= (4t

1 +
2
)
n/2

(x+iy) (x+iy)
4t(1+i)
1i
1i

=
= (4t

1 +
2
)
n/2
e
|x|
2
+|y|
2
2y (x)
4t(1+
2
)
e

2
|y|
2
4t(1+
2
)
e


2
|y|
2
4t(1+
2
)
=
= (1 +
2
)
n/4
(4t(1 +
2
))
n/2
e
|y|
2
4t
e

|x+y|
2
4t(1+
2
)
=
= (1 +
2
)
n/4
e
|y|
2
4t
(x +y, t(1 +
2
)).
Ne segue che per ogni C(R
n
) L

(R
n
) lintegrale
_
R
n
(z , )() d
`e convergente per ogni (z, ) C
n+1
con Re > 0; quindi esso denisce una
funzione u(z, ) continua che estende la soluzione del problema (3.17) alla
109
regione di C
n+1
sopra descritta.
Analogamente si verica che tutte le derivate di u rispetto a x, y, t, si ot-
tengono derivando sotto il segno di integrale e sono continue in A = (z, )
C
n+1
: Re > 0. Ma allora, poiche , essendo olomorfa, verica in quella
regione le equazioni di Cauchy-Riemann
_
D
y
j
= iD
x
j
, j = 1, . . . , n

= i
t
,
lo stesso accadr`a per la u, che dunque `e anchessa olomorfa nella regione A.
In particolare, u(x, t) `e una funzione analitica in R
n
]0, [.
Osservazione 3.3.7 Un risultato analogo vale per la soluzione del problema
di Cauchy (3.17) quando il dato iniziale `e supposto continuo e tale che
x (x)e
|x|
2
L

(R
n
); lunica dierenza `e che la soluzione u si estender`a
olomorcamente nella regione
_
(z, ) C
n+1
: Re > 0, [Im[ <
_
1 4T
4T
Re
_
T
_
0,
1
4
_
.
In particolare, u sar`a analitica in R
n
]0, T[ per ogni T ]0,
1
4
[.
3.4 Il problema di Cauchy non omogeneo
La soluzione fondamentale `e basilare anche per costruire la soluzione del
problema di Cauchy non omogeneo
_

_
u
t
u = f in R
n
]0, [,
u(x, 0) = 0 x R
n
,
[u(x, t)[ Ke
|x|
2
(x, t) R
n
[0, [,
(3.36)
con f C(R
n
[0, [)L

(R
n
]0, [). Vale un metodo di variazione delle
costanti arbitrarie analogo al caso delle equazioni dierenziali ordinarie.
Dal punto di vista sico, infatti, f(, s) rappresenta una sorgente che emana
calore nel punto allistante s: quindi (x, t s)f(, s) `e il contributo di
calore, emesso nel punto al tempo s, che va ad inuenzare la temperatura
110
nel punto x allistante t. La somma di tutti questi contributi, al variare del
punto e dellistante di emanazione, `e lintegrale
_
t
0
_
R
n
(x , t s)f(, s) dds,
il quale dunque deve coincidere con la soluzione calcolata in (x, t). E in eetti
vale il seguente risultato:
Teorema 3.4.1 Se f C(R
n
[0, [) L

(R
n
[0, [) e se inoltre
essa `e holderiana di esponente ]0, 1] rispetto a x oppure rispetto a t,
uniformemente nellaltra variabile, allora la funzione
u(x, t) =
_
t
0
_
R
n
(x , t s)f(, s) dds, (x, t) R
n
[0, [, (3.37)
appartiene a C(R
n
[0, [) C
2,1
(R
n
]0, [) e risolve il problema (3.36).
Inoltre si ha
|u|
L

(R
n
[0,T])
T|f|
L

(R
n
[0,T])
T > 0.
Dimostrazione Lipotesi su f dice che esiste K 0 tale che
[f(x, t) f(x

, t)[ K[x x

x, x

R
n
, t 0, (3.38)
oppure
[f(x, t) f(x, t

)[ K[t t

x R
n
, t, t

0. (3.39)
Abbiamo una candidata soluzione u, data da (3.37), e motivata dalle conside-
razioni siche sopra esposte. Per vericare che essa `e soluzione per davvero,
dobbiamo derivare sotto il segno di integrale: cominciamo dunque col giu-
sticare tale possibilit`a. Il problema non `e banale, perche lintegrando che
compare nella denizione di u contiene una singolarit`a nellestremo t.
Supponiamo che f soddis (3.38) e ssiamo > 0. Per 0 < h < conside-
riamo le funzioni
u
h
(x, t) =
_
th
0
_
R
n
(x , t s)f(, s) dds, (x, t) R
n
[, [.
Esse sono ovviamente derivabili rispetto a t (abbiamo tolto la singolarit`a
dellintegrando in s = t) e si ha
u
h
t
(x, t) =
_
R
n
(x, h)f(, th) d +
_
th
0
_
R
n

t
(x, ts)f(, s) dds;
111
osservando che, in virt` u della (3.34), risulta
_
R
n

t
(x , t s) d =
d
dt
1 = 0 t > s,
possiamo anche scrivere
u
h
t
(x, t) =
_
R
n
(x , h)f(, t h) d +
+
_
th
0
_
R
n

t
(x , t s)[f(, s) f(x, s)] dds.
Daltra parte si ha
[u
h
(x, t) u(x, t)[ =

_
t
th
_
R
n
(x , t s)f(, s) dds

|f|

_
t
th
_
R
n
(x , t s) dds = |f|

h,
cosicche u
h
u per h 0 uniformemente in R
n
[, [. In particolare, u `e
continua in R
n
]0, [. Inoltre la continuit`a di u per t = 0, con u(x, 0) = 0,
`e evidente dallesame della formula (3.37).
Per quanto riguarda (u
h
)
t
, tenuto conto di (3.32) e (3.30) lipotetico limite
per h 0 dovrebbe essere, almeno formalmente,
w(x, t) := f(x, t) +
_
t
0
_
R
n

t
(x , t s)[f(, s) f(x, s)] dds. (3.40)
Verichiamo intanto che questa espressione ha senso: si ha, ricordando la
proposizione 3.3.5(ii) e la (3.38), e utilizzando il cambiamento di variabili
_
L
ts
( x) = y,

_
t
0
_
R
n

t
(x , t s)[f(, s) f(x, s)] dds

C
_
t
0
_
R
n
(t s)

n
2
1
K[ x[

L|x|
2
(ts)
dds =
= L
n/2
CK
_
t
0
_
R
n
(t s)
1+

2
[y[

e
|y|
2
dyds < .
112
Valutiamo allora la dierenza (u
h
)
t
w:

u
h
t
(x, t) w(x, t)

_
R
n
(x , h)f(, t h) d f(x, t)

+
+

_
t
th
_
R
n

t
(x , t s)[f(, s) f(x, s)] dds

.
Per il primo addendo si ha, con un cambiamento di variabili, e ricordando la
proposizione 3.3.5(i) e il fatto che t f(x, t) `e continua,

_
R
n
(x , h)f(, t h)d f(x, t)

_
R
n
(x , h)[f(, t h) f(x, t h)]d

+[f(x, t h) f(x, t)[


L
n/2
CK[h[
/2
_
R
n
[[

e
||
2
d + o(1) = o(1) per h 0,
mentre il secondo termine `e evidentemente anchesso innitesimo per h 0,
trattandosi dellintegrale di una funzione sommabile su un intervallo che va
riducendosi a un punto. Si noti inoltre che le convergenze ottenute sono
uniformi in R
n
[, M] per ogni M > .
Abbiamo cos`
u
h
u,
u
h
t
w uniformemente in R
n
[, M] :
ci`o implica, essendo e M arbitrari, che esiste
u
t
= w in R
n
]0, [.
In maniera assolutamente analoga si prova che esiste u in R
n
]0, [, e che
u(x, t) =
_
t
0
_
R
n
(x , t s)[f(, s) f(x, s)] dds, (3.41)
e poiche verica lequazione del calore, da (3.40) e (3.41) si ottiene subito
u
t
u = f in R
n
]0, [. La tesi del teorema `e provata nel caso in cui f `e
holderiana rispetto alla variabile x.
Se invece vale la condizione (3.39), si procede nello stesso modo, trovando
stavolta:
u
t
(x, t) =
_
t
0
_
R
n

t
(x , t s)[f(, s) f(, t)] dds+
+
_
R
n
(x , t)f(, t) d,
u(x, t) =
_
t
0
_
R
n
(x , t s)[f(, s) f(, t)] dds+
+
_
R
n
(x , t)f(, t) d f(x, t),
113
da cui nuovamente si ottiene u
t
u = f in R
n
]0, [.
La soluzione fondamentale verr`a anche impiegata, nel seguito, per risolvere
i problemi di Cauchy-Dirichlet e di Cauchy-Neumann per lequazione del
calore omogenea, con dato iniziale nullo, in un aperto R
n
:
_

_
u
t
u = 0 in ]0, T],
u(x, 0) = 0 in ,
u(x, t) = (x, t) (x, t) [0, T],
(3.42)
_

_
u
t
u = 0 in ]0, T],
u(x, 0) = 0 in ,
u

(x, t) = (x, t) (x, t) [0, T].


(3.43)
ove, in entrambi i casi, supporremo che C( [0, T]), e che sia un
aperto limitato con frontiera regolare.
Prima di avviarci alla risoluzione di tali problemi, occorre per`o uno studio
preliminare delle equazioni integrali di Volterra, che, come vedremo, gioche-
ranno un ruolo fondamentale. A questo studio `e dedicato il paragrafo che
segue.
3.5 Equazioni integrali di Volterra
Le equazioni integrali di Volterra sono equazioni funzionali del tipo
g(x) +
_
X
K(x, y) g(y) d(y) = f(x), x X,
ove (X, ) `e uno spazio misurato, la funzione K (detta nucleo) `e sommabile
in X X rispetto alla misura prodotto , f `e una funzione nota, ap-
partenente a L
p
(X, ), 1 p , oppure a C(X) (quando X `e anche uno
spazio metrico compatto), e g `e lincognita, che si cerca nello stesso spazio a
cui appartiene f. Piuttosto che fare uno studio generale, noi ci limiteremo
ad equazioni integrali della forma seguente:
q(x, t)+
_
t
0
_

K(x, , t, )q(, ) d

d = p(x, t), (x, t) [0, T], (3.44)


114
ove `e un aperto limitato di R
n
con frontiera di classe C
1
, p C([0, T])
`e assegnata, q C( [0, T]) `e lincognita, e inne il nucleo K(x, , t, ) `e
una funzione continua in [0, T] [0, T] ad eccezione dei punti in
cui x = oppure t = , e verica la stima
[K(x, , t, )[ H[t [
1
[x [
n+1
x ,= , t ,= , (3.45)
ove , sono numeri positivi.
Deniamo loperatore integrale J sullo spazio C( [0, T]) nel modo se-
guente:
(Jq)(x, t) =
_
t
0
_

K(x, , t, )q(, ) d

d, q C( [0, T]). (3.46)


Allora lequazione (3.44) si pu`o scrivere cos`:
(I +J)q = p;
la sua soluzione `e
q = (I +J)
1
p =

m=0
(1)
m
J
m
p, (3.47)
purche la serie sopra scritta converga in qualche senso; naturalmente J
m
signica J J J (m volte). Proveremo:
(a) che J e le sue potenze J
m
sono operatori lineari e continui di C(
[0, T]) in se;
(b) che tali operatori sono operatori integrali con nucleo costruito esplicita-
mente;
(c) che la serie in (3.47) converge nello spazio C( [0, T]).
Questi fatti ci permetteranno di risolvere univocamente lequazione di Vol-
terra (3.44), con soluzione che dipender`a con continuit`a dal secondo membro.
Cominciamo lo studio della (3.44) con alcuni lemmi.
Lemma 3.5.1 Sia R
n
un aperto limitato con frontiera di classe C
1
. Se
0 < n 1, esiste N

0 tale che
_

[x [
n+1
[ y[
n+1
d

[x y[
n+1
x, y .
115
Dimostrazione Per ogni x, , y si ha
[x [
n+1
[ y[
n+1
=
_
[x y[
[x [ [ y[
_
n1
[x y[
n+1

_
[x [ +[ y[
[x [ [ y[
_
n1
[x y[
n+1
=
=
_
1
[ y[
+
1
[x [
_
n1
[x y[
n+1
.
Integrando rispetto a su si trova (per subadditivit`a se 0 n1 < 1,
per convessit`a se n 1 1):
_

[x [
n+1
[ y[
n+1
d

C[x y[
n+1
sup

1
[ [
n1
d

,
ove C = max2, 2
n1
. La tesi segue osservando che lesponente dellin-
tegrando a secondo membro `e strettamente minore della dimensione della
variet`a dove si integra, cosicche lestremo superiore `e certamente nito.
Lemma 3.5.2 Sia la funzione di Eulero, denita da
() =
_

0
q
1
e
q
dq, > 0.
Allora
_
1
0
q
1
(1 q)
1
dq =
()()
( +)
, > 0.
Dimostrazione Calcoliamo lintegrale
I =
_

0
_

0
q
21
p
21
e
p
2
q
2
dpdq
in due modi. Separando le variabili si trova
I =
_

0
q
21
e
q
2
dq
_

0
p
21
e
p
2
dp =
=
1
4
_

0
t
1
e
t
dt
_

0
t
1
e
t
dt =
()()
4
.
116
Utilizzando le coordinate polari si ha invece
I =
_

0
_
/2
0

2+22
cos
21
sin
21
e

2
dd =
=
_

0

2+21
e

2
d
_
/2
0
cos
21
sin
21
d,
da cui, posto r =
2
e p = cos
2
,
I =
( +)
4
_
1
0
p
1
(1 p)
1
dp.
Uguagliando le due espressioni di I, si ha la tesi.
Lemma 3.5.3 Sia la funzione di Eulero. Allora per ogni > 0 la serie
di potenze

m=0
x
m
(m)
ha raggio di convergenza +.
Dimostrazione La tesi segue facilmente applicando il criterio del rapporto,
il lemma 3.5.2 ed il teorema di convergenza dominata.
Nel lemma che segue si introducono i nuclei per mezzo dei quali si rappre-
sentano le potenze delloperatore integrale J denito in (3.46).
Lemma 3.5.4 Sia R
n
un aperto limitato con frontiera di classe C
1
.
Sia J loperatore denito in (3.46) e supponiamo che il suo nucleo K sia una
funzione continua per x ,= e t ,= , vericante la condizione (3.45). Allora
per ogni m N
+
si ha
(J
m
q)(x, t) =
_
t
0
_

K
m
(x, , t, )q(, ) d

d, q C([0, T]), (3.48)


ove K
m
`e denito da
_
K
1
(x, , t, ) = K(x, , t, ),
K
m
(x, , t, ) =
_
t

K(x, , t, s)K
m1
(, , s, ) d

ds m > 1.
Inoltre K
m
`e continuo per x ,= e t ,= , e per ogni m N
+
vale la stima
[K
m
(x, , t, )[ H
m
N
m1

()
m
(m)
[t [
m1
[x [
n+1
. (3.49)
117
Dimostrazione La stima `e banale per m = 1. Se essa `e vera per m 1,
allora dalla (3.45) e dallipotesi induttiva, utilizzando i lemmi 3.5.2 e 3.5.1,
segue
[K
m
(x, , t, )[
H
m
N
m2

()
m1
((m1))

_
t

[t s[
1
[x [
n+1
[s [
(m1)1
[ [
n+1
d

ds
H
m
N
m2

()
m1
((m1))
_
t

(t s)
1
[s [
(m1)1
ds

[x [
n+1
[ [
n+1
d


H
m
N
m1

()
m
(m)
[t [
m1
[x y[
n+1
.
Ci` o prova la (3.49). Questa, a sua volta, permette di denire loperatore
integrale che appare in (3.48); occorre provare che tale operatore coincide
con la potenza J
m
. In eetti ci`o `e banalmente vero per m = 1; se poi la
(3.48) vale per m1, allora
(J
m
q)(x, t) =
_
t
0
_

K(x, , t, s)(J
m1
q)(, s) d

ds =
=
_
t
0
_

K(x, , t, s)
_
s
0
_

K
m1
(, , s, )q(, ) d

dd

ds =
=
_
t
0
_

__
t

K(x, , t, s)K
m1
(, , s, ) d

ds
_
q(, ) d

d =
=
_
t
0
_

K
m
(x, , t, )q(, ) d

d,
e la formula (3.48) `e provata.
Corollario 3.5.5 Sia J loperatore integrale denito da (3.46). Allora per
ogni m N
+
risulta J
m
/(C( [0, T])), con
|J
m
|
L(C([0,T]))
BH
m
N
m1

T
m
()
m
(m)
,
ove B = sup
x
_

[x [
n+1
d

.
118
Dimostrazione Dal lemma precedente e dalla stima (3.49) segue facilmente
che per ogni (x, t) [0, T] si ha
[J
m
q(x, t)[
_
t
0
_

[K
m
(x, , t, )q(, )[ d

_
t
0
_

H
m
N
m1

()
m
(m)
[t [
m1
[x [
n+1
d

d |q|
C([0,T])

H
m
N
m1

T
m
()
m
(m)
_

[x [
n+1
d

|q|
C([0,T])
da cui la tesi.
Come conseguenza del lemma precedente e del lemma 3.5.3, `e ben denito il
nucleo
Q(x, , t, ) =

m=1
(1)
m
K
m
(x, , t, ) (3.50)
per ogni x, e t, [0, T] con x ,= e t ,= : infatti tale serie `e
totalmente convergente in ogni insieme della forma
(x, , t, ) [0, T] [0, T] : [x [ , [t [ ,
in virt` u della maggiorazione
[Q(x, , t, )[

m=1
H
m
N
m1

()
m
(m)
[t [
m1
[x [
n+1

K[t [
1
[x [
n+1
.
Si noti che in eetti, salvo i primi addendi in cui m < 1, i termini della
serie (3.50) sono regolari anche per t = .
Possiamo nalmente enunciare il risultato fondamentale relativo allequazio-
ne (3.44):
Teorema 3.5.6 Sia R
n
un aperto limitato con frontiera di classe C
1
e sia K(x, , t, ) una funzione continua per x ,= e t ,= , vericante la
condizione (3.45). Allora per ogni p C([0, T]) lequazione integrale di
Volterra
q(x, t) +
_
t
0
_

K(x, , t, )q(, ) d

d = p(x, t), (x, t) [0, T],


119
ha lunica soluzione
q(x, t) = p(x, t) +
_
t
0
_

Q(x, , t, )p(, ) d

d,
ove Q `e il nucleo denito in (3.50). Inoltre si ha
|q|
C([0,T])
C|p|
C([0,T])
. (3.51)
Dimostrazione Sia R loperatore integrale di nucleo Q. Allora, per (3.50)
e (3.48), e per convergenza dominata,
(Rp)(x, t) =
_
t
0
_

m=1
(1)
m
K
m
(x, , t, )p(, ) d

d =
=

m=1
(1)
m
_
t
0
_

K
m
(x, , t, )p(, ) d

d =

m=1
(1)
m
(J
m
p)(x, t);
dunque, posto q = p +Rp, si ha
q +Jq = p +Rp +Jp +JRp =
= p +

m=1
(1)
m
J
m
p +Jp +

m=1
(1)
m
J
m+1
p =
= p +

k=1
(1)
k
J
k
p +

k=1
(1)
k1
J
k
p = p.
La stima (3.51) segue subito dalla formula di rappresentazione di q.
Lunicit`a della soluzione dellequazione si dimostra facilmente: se q `e una
soluzione dellequazione (3.44) con p = 0, allora per ogni b ]0, T] si ha
[q(x, t)[

_
t
0
_

K(x, , t, )q(, ) d

|q|
C([0,b])
_
t
0
_

H[t [
1
[x [
n+1
d

d
C|q|
C([0,b])
t

(x, t) [0, b],


da cui q = 0 in [0, b], pur di scegliere b in modo che Cb

< 1. Allora
lequazione (3.44) diventa
q(x, t) +
_
t
b
_

K(x, , t, )q(, ) d

d = 0, (x, t) [b, T].


Ripetendo la precedente argomentazione un numero nito di volte si ottiene
q = 0 in [0, T].
120
3.6 I problemi di Cauchy-Neumann e di Cau-
chy-Dirichlet
Consideriamo i problemi di Cauchy-Dirichlet (3.42) e di Cauchy-Neumann
(3.43) per lequazione del calore omogenea, con dato iniziale nullo, in un
aperto R
n
. Supporremo che C( [0, T]) e che sia un aperto
limitato con frontiera di classe C
1+
, 0 < 1: ci`o signica che per ogni
x
0
esistono un intorno U di x
0
in R
n
ed una funzione F : U B(0, 1)
R
n
, tale che
_

_
F C
1+
(U, R
n
);
F `e biunivoca e [ det F(x)[ , = 0 per ogni x U;
F(U ) = y B(0, 1) : y
n
> 0;
F(U ) = y B(0, 1) : y
n
= 0.
(3.52)
Come si sa (teorema 3.2.5), c`e unicit`a della soluzione per entrambi i pro-
blemi; vogliamo determinare la soluzione nel modo pi` u esplicito possibile.
Useremo ancora, come si `e gi`a preannunciato, la soluzione fondamentale
(x , t ) =
e

|x|
2
4(t)
(4(t ))
n/2
.
Poiche il metodo `e lo stesso per i due problemi, faremo tutti i conti nel caso
del problema di Cauchy-Neumann, mentre ci limiteremo ad alcuni accenni
per il problema di Cauchy-Dirichlet (osservazione 3.6.5(3)).
Teorema 3.6.1 Sia R
n
un aperto limitato con frontiera di classe C
1+
,
ove ]0, 1]. Per ogni C( [0, T]) il problema (3.43) ha ununica
soluzione u C( [0, T]) C
2,1
(]0, T]).
Osserviamo che la soluzione non appartiene, in generale, a C
1
( [0, T]), e
quindi la condizione
u

(x, t) = (x, t), (x, t) ]0, T], vale in un oppor-


tuno senso generalizzato.
Dimostrazione Cercheremo una soluzione del problema (3.43) nella forma
cosiddetta di potenziale di semplice strato (single-layer potential), cio`e del
tipo
u(x, t) =
_
t
0
_

(x , t )(, ) d

d, (3.53)
121
ove C( [0, T]) `e una funzione da determinare. Si noti che questa
funzione `e denita in (R
n
) e non solamente in . Il motivo che
ci spinge a cercare una soluzione di questa forma `e che essa certamente ha
senso e, come vedremo fra poco, verica lequazione dierenziale; inoltre `e
chiaro che u(x, 0) = 0. Per ottenere anche la condizione alla frontiera, poi,
abbiamo a disposizione la funzione , che `e arbitraria; essa sar`a determinata
risolvendo unopportuna equazione integrale di Volterra del tipo analizzato
nel paragrafo precedente.
Mostriamo che la funzione (3.53) risolve lequazione del calore in ]0, T].
Risulta
u
t
(t, x) u(x, t) =
_

(x , 0)(, t) d

+
+
_
t
0
_

[
t
(x , t )
x
(x , t )](, ) d

d = 0
in virt` u del fatto che risolve lequazione del calore e inoltre verica (y, 0) =
0 per ogni y ,= 0.
`
E anche chiaro che risulta u(x, 0) = 0 per ogni x . Meno facile, invece,
`e dimostrare che la condizione alla frontiera sulla derivata normale di u `e
soddisfatta: in eetti, se i 1, . . . , n si ha per (x, t) (R
n
)]0, T]
D
i
u(x, t) =
_
t
0
_

D
i
(x , t )(, ) d

d,
ma quando x tende verso un punto x
0
le stime fornite dalla proposizione
3.3.5(ii)-(vi) non sono sucienti a far convergere lintegrale.
Prima di proseguire, proviamo due ulteriori lemmi utili nel seguito.
Lemma 3.6.2 Se x R
n
0 e s R con n +s > 2, allora
_
t
0
e

|x|
2

n+s
2
d C
s
[x[
2ns
,
e in particolare risulta
lim
t0
+
_
t
0
e

|x|
2

n+s
2
d = 0 x ,= 0.
122
Dimostrazione Si tratta di un facile calcolo:
_
t
0
e

|x|
2

n+s
2
d =
_

|x|
2
t
e
q
[x[
2ns
q
n+s
2
2
dq
[x[
2ns
_

0
e
q
q
n+s
2
2
dq = (
n+s
2
1) [x[
2ns
,
ove `e la funzione di Eulero. Se x ,= 0 la prima uguaglianza mostra anche
che il limite richiesto vale 0.
Lemma 3.6.3 Sia R
n
un aperto limitato con frontiera di classe C
1
.
Per ogni x
0
esiste > 0 tale che, posto S
r
= B(x
0
, r), r ]0, ],
risulta
_
S

\Sr
[x
0
[
n+1
d

r ]0, [, > 0.
Dimostrazione Fissiamo x
0
. Poiche `e di classe C
1
, esiste > 0
per il quale vi `e un dieomorsmo F, di classe C
1
, che verica le condizioni
(3.52), con = 0. Sia > 0 tale che B(x
0
, ) U; mostriamo che esistono
due numeri positivi c
1
e c
2
tali che
B(0, c
1
r) F(B(x
0
, r)) B(0, c
2
r)
per ogni r ]0, ] sucientemente piccolo. Infatti, sia y B(0, c
1
r) e sia
= F
1
(y) B(x
0
, ): allora, dalla formula di Taylor, se r `e piccolo si ha
[ x
0
[ = [F
1
(y) F
1
(0)[ = [F
1
(0)y + o(y)[ K[y[ < Kc
1
r,
da cui la prima inclusione scegliendo c
1
=
1
K
. Similmente, se B(x
0
, r) e
se r `e piccolo si ha
[F()[ = [F() F(x
0
)[ = [F(x
0
)( x
0
)[ + o( x
0
) Mr,
da cui la seconda inclusione prendendo c
2
= M.
Adesso osserviamo che, per denizione di integrale sulla variet`a (n 1)-
dimensionale , si ha
_
S

\Sr
[ x
0
[
n+1
d

=
=
_
{yn=0}F(B(x
0
,)\B(x
0
,r))
[F
1
(y) F
1
(0)[
n+1
M(y) dy

,
123
ove dy

= dy
1
. . . dy
n1
e
M(y) =
_
n

i=1
M
i
(y)
2
_1
2
, M
i
(y) = det
_
(F
1
)
h
y
k
(y)
_
h=i, k=n
.
Dato che le derivate di F
1
sono (in particolare) limitate, deduciamo
_
S

\Sr
[ x
0
[
n+1
d

=
=
_
{yn=0}[B(0,1)\F(B(x
0
,r))]
[F
1
(y) F
1
(0)[
n+1
M(y) dy


C
_
{yn=0}[B(0,1)\B(0,c
1
r)]
[y[
n+1
dy

= C

_
1
c
1
r

n+1

n2
d =
= C

_
1
r

1
_
C

1
r

,
e la tesi `e provata per r > 0 sucientemente piccolo, diciamo 0 < r < r
0
.
Ma se r [r
0
, [, la tesi `e banale:
_
S

\Sr
[ x
0
[
n+1
d

Cr
n+1
0
_

1 d

K
K
r

.
Possiamo adesso enunciare il lemma che costituisce il punto chiave dellintera
argomentazione.
Lemma 3.6.4 Sia R
n
un aperto limitato con frontiera di classe C
1+
,
]0, 1], e sia u la funzione (3.53). Se x
0
e se x x
0
lungo la retta
normale a in x
0
, allora
n

j=1
D
j
u(x, t)
j
(x
0
) W(x
0
, t)
1
2
(x
0
, t) t ]0, T],
ove
W(x
0
, t) =
_
t
0
_

(x
0
)
(x
0
, t )(, ) d

d, (3.54)
e il segno `e positivo oppure negativo a seconda che x x
0
dallinterno di
oppure dallesterno di . Inoltre la funzione (x
0
, t) W(x
0
, t) `e continua
su [0, T].
124
Dimostrazione Accertiamoci anzitutto che W(x
0
, t) abbia senso. Dalla
(3.21) segue

(x
0
)
(x
0
, t ) =
(x
0
, t )
2(t )
(x
0
) (x
0
). (3.55)
Daltra parte risulta
B(x
0
, ) = x B(x
0
, ) : F
n
(x) = 0,
ove F `e il dieomorsmo di classe C
1+
fra B(x
0
, ) e B(0, 1) che verica
le condizioni (3.52). Dunque, per ogni B(x
0
, ) si ha F
n
() = 0 e
() =
Fn()
|Fn()|
. Ne segue
[(x
0
) (x
0
)[ =
1
[F
n
(x
0
)[
[F
n
(x
0
) ( x
0
) +F
n
(x
0
) F
n
()[ =
=
1
[F
n
(x
0
)[

_
1
0
(F
n
(x
0
) F
n
(x
0
+t( x
0
))) ( x
0
) dt

[F
n
(x
0
)[
_
1
0
t

[ x
0
[
1+
dt C

[ x
0
[
1+
,
cosicche da (3.55) e dalla proposizione 3.3.5(i) otteniamo

(x
0
)
(x
0
, t )

C(t )

n+2
2
[ x
0
[
1+
e

L|x
0
|
2
t
, (3.56)
ed anche, di conseguenza,

(x
0
)
(x
0
, t )

C
_
(t )

n
2

4
[ x
0
[
n+

2
e

L|x
0
|
2
t
_
(t )

4
1
[ x
0
[

2
n+1
da cui, per ogni B(x
0
, ) e per ogni t, [0, T] con t ,= ,

(x
0
)
(x
0
, t )

C(t )

4
1
[ x
0
[

2
n+1
. (3.57)
Questa stima prova che lintegrale che denisce W(x
0
, t) nella (3.54) `e conver-
gente. Inoltre un facile argomento basato sulla convergenza dominata mostra
125
che W(x
0
, t) `e continua nei suoi argomenti in [0, T].
Adesso dobbiamo valutare la dierenza
n

j=1
D
j
u(x, t)
j
(x
0
) W(x
0
, t) =
=
_
t
0
_

j=1
[D
j
(x , t ) D
j
(x
0
, t )]

j
(x
0
)(, ) d

d
(3.58)
al tendere di x a x
0
lungo la normale a in x
0
. Se stimiamo direttamente
questa dierenza con lausilio della proposizione 3.3.5(vi) e del lemma 3.6.2,
non otteniamo lo scopo perche troviamo

_
t
0
_

j=1
[D
j
(x , t ) D
j
(x
0
, t )]
j
(x
0
)(, ) d

C||

_
t
0
_

(t )

n+1+
2
e

L(|x||x
0
|)
2
t
[x x
0
[

d
C||

[x x
0
[

([x [ [x
0
[)
n+1
d

,
ma lultimo integrale su non `e convergente.
Dobbiamo dunque aggiungere e togliere termini nella (3.58) in modo oppor-
tuno. Poniamo per brevit`a di scrittura
N
j,x
(, t ) = D
j
(x , t ) D
j
(x
0
, t );
allora possiamo riscrivere la (3.58) come segue:
n

j=1
D
j
u(x, t)
j
(x
0
) W(x
0
, t) =
=
_
t
0
_

j=1
N
j,x
(, t )
j
(x
0
)(, ) d

d = I
1
+I
2
+I
3
+I
4
,
(3.59)
ove
I
1
=
_
t
0
_

j=1
N
j,x
(, t )
j
(x
0
)[(, ) (x
0
, )] d

d,
126
I
2
=
_
t
0
_

j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d

d,
I
3
=
_
t
0
_

j=1
N
j,x
(, t )[
j
(x
0
)
j
()](x
0
, t) d

d,
I
4
= (x
0
, t)
_
t
0
_

j=1
N
j,x
(, t )
j
() d

d.
Proveremo che per x x
0
(lungo la retta normale a in x
0
) i termini I
1
,
I
2
e I
3
sono innitesimi, mentre I
4
il quale, come si vedr`a, ha senso come
integrale improprio di Riemann converge a
1
2
(x
0
, t).
Sia > 0 e sia > 0 tale che
[ x
0
[ < , [0, t] = [(, ) (x
0
, )[ < .
Poniamo = B(x
0
, ) e S = B(x
0
, 2[x x
0
[); se [x x
0
[ < /2,
si ha S . Allora possiamo decomporre I
1
spezzando gli integrali:
I
1
=
_
t
0
_
S
. . . +
_
t
0
_
\S
. . . +
_
t
0
_
\
. . . = I
11
+I
12
+I
13
.
Stimiamo I
11
rimpiazzando con lincremento della e con una somma la
dierenza delle D
j
: dalla proposizione 3.3.5(ii), dalla (3.56) e dal lemma
3.6.2 segue
[I
11
[ =

_
t
0
_
S
n

j=1
N
j,x
(, t )
j
(x
0
)[(, ) (x
0
, )] d

_
t
0
_
S
_
[(x , t )[ +

(x
0
)
(x
0
, t )

_
d

d
C
_
t
0
_
S
_
_
e

L|x|
2
t
(t )
n+1
2
+
e

L|x
0
|
2
t
(t )
n+2
2
[x x
0
[
1+
_
_
d

d
C
__
S
[x [
n+1
d

+
_
S
[x
0
[
n+1+
d

_
.
Osserviamo a questo punto che x appartiene alla retta normale a in x
0
;
poiche S, per [xx
0
[ sucientemente piccolo la dierenza [ P()[ fra
127
e la sua proiezione P() sulliperpiano tangente a in x
0
`e un innitesimo
di ordine superiore a [x x
0
[: pertanto si ha, per [x x
0
[ piccolo,
[ x[ [P() x[ [ P()[ [x
0
x[
1
2
[x x
0
[ =
1
2
[x x
0
[.
Ne segue, per [x x
0
[ piccolo,
[I
11
[ C
_
[x x
0
[
n+1
_
S
d

+
_
S
[x
0
[
n+1+
d

_
C.
Il termine I
12
si stima essenzialmente allo stesso modo. Si osserva che se
S si ha
[ x[ [P() x[ [ P()[ [P() x
0
[ [ P()[
[ x
0
[ 2[P() [
1
2
[ x
0
[
a patto di aver scelto abbastanza piccolo. Quindi, per i lemmi 3.6.2 e 3.6.3,
[I
12
[ =

_
t
0
_
\S
n

j=1
N
j,x
(, t )
j
(x
0
)[(, ) (x
0
, )] d

C
_
t
0
_
\S
e

L|x
0
|
2
2(t)
(t )
n+2
2
[x x
0
[ d

d
C[x x
0
[
_
\S
[x
0
[
n
d

C.
Per I
13
si rimpiazza lincremento di con una costante, e si controlla lin-
cremento delle D
j
con la proposizione 3.3.5(ii). Si trova, con lausilio del
lemma 3.6.2,
[I
13
[ =

_
t
0
_
\
n

j=1
N
j,x
(, t )
j
(x
0
)[(, ) (x
0
, )] d

C
_
t
0
_
\
e

L|x
0
|
2
t
(t )
n+2
2
[x x
0
[ d

d
C[x x
0
[
_
\
[x
0
[
n
d

[x x
0
[.
128
Ci`o prova che I
1
0 per x x
0
, x x
0
.
Analizziamo ora il termine I
2
. In corrispondenza del numero gi`a ssato,
esiste > 0 tale che
, [t [ < = [(, t) (, )[ < .
Allora decomponiamo I
2
spezzando gli integrali:
I
2
=
_
t
0
_

. . . +
_
t
t
_
S
. . . +
_
t
t
_
\S
. . . +
_
t
t
_
\
. . . =
= I
21
+I
22
+I
23
+I
24
,
ove stavolta = B(x
0
, ) e si suppone [x x
0
[ < /2.
Utilizzando la proposizione 3.3.5(vi), la (3.56) ed il lemma 3.6.2 si ottiene,
procedendo come per la stima di I
1
:
[I
21
[ =

_
t
0
_

j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d

C
_
t
0
_

L(|x
0
||x|)
2
t
(t )
n+2
2
[x x
0
[ d

d C

[x x
0
[,
[I
22
[ =

_
t
t
_
S
n

j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d

C
_
t
t
_
S
_
_
e

L|x|
2
t
(t )
n+1
2
+
e

L|x
0
|
2
t
(t )
n+2
2
[x x
0
[
1+
_
_
d

d
C
__
S
[x [
n+1
d

+
_
S
[x
0
[
n+1+
d

C
_
[x x
0
[
n+1
_
S
d

+
_
S
[x
0
[
n+1+
d

_
C,
[I
23
[ =

_
t
t
_
\S
n

j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d

C
_
t
t
_
\S
e

L|x
0
|
2
2(t)
(t )
n+2
2
[x x
0
[ d

d
C[x x
0
[
_
\S
[x
0
[
n
d

C,
129
[I
24
[ =

_
t
t
_
\
n

j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d

C
_
t
t
_
\
e

L
2
2(t)
(t )
n+2
2
[x x
0
[ d

d C

[x x
0
[.
Da tutte queste maggiorazioni segue che I
2
0 per x x
0
, x x
0
.
La stima di I
3
`e pi` u semplice: essendo [(x
0
) ()[ c[x
0
[

, si ha,
utilizzando ancora la proposizione 3.3.5(vi) con 0 < < , nonche il lemma
3.6.2,
[I
3
[ C
_
t
0
_

L(|x
0
||x|)
2
t
(t )
n+1+
2
[x x
0
[

[x
0
[

d
C
_

[x x
0
[

([x
0
[ [x [)
n1+
d

C[x x
0
[

,
e dunque anche I
3
0 per x x
0
, x x
0
.
Vediamo inne il termine I
4
, che verr`a esplicitamente calcolato. Veriche-
remo che si tratta di un integrale improprio di Riemann convergente, ossia
che
I
4
= (x
0
, t)
lim
0
+
_
t
0
_

j=1
[D
j
(x , t ) D
j
(x
0
, t )]
j
() d

d.
Sia infatti, per x e [0, t[,
E(x, ) =
_

j=1
[D
j
(x , t ) D
j
(x
0
, t )]
j
() d

,
allora risulta, per la formula di Green, ed osservando che

(x, t ) +

(x , t ) = 0,
E(x, ) =
_

j=1

j
[(x , t ) (x
0
, t )]
j
() d

=
=
_

[(x , t ) (x
0
, t )] d =
=

[(x , t ) (x
0
, t )] d,
130
cosicche
_
t
0
E(x, ) d =
_

[(x , ) (x
0
, )] d

[(x , t) (x
0
, t)] d = I
41
(x, ) +I
42
(x),
per cui otteniamo
I
4
= (x
0
, t)
_
lim
0
+
I
41
(x, ) +I
42
(x)
_
(3.60)
ammesso che il limite a secondo membro esista, cosa che vericheremo fra
poco. Poiche inoltre
[I
42
(x)[ Ct

n+1
2
[x x
0
[
_

L(|x||x
0
|)
2
t
d c(t)[x x
0
[,
`e chiaro che I
42
(x) tende a 0 quando x tende a x
0
lungo la normale a in
x
0
. In denitiva ci si riduce a dover dimostrare che esistono i due limiti
lim
0
+
I
41
(x, ) = I
4
, lim
xx
0
, xx
0

_
lim
0
+
I
41
(x, )
_
.
Analizziamo il primo limite, ricordando che
I
41
(x, ) =
_

[(x , ) (x
0
, )] d.
Si ha, utilizzando un opportuno cambiamento di variabili,
_

(x , ) d =

n
2
_
A
e
|z|
2
dz,
ove A

= z R
n
: 2

z +x .
Notiamo che se x allora per ogni z R
n
si ha z A

per ogni
sucientemente piccolo; analogamente, se x / , allora z / A

per ogni
sucientemente piccolo. Dunque, per convergenza dominata,
lim
0

n
2
_
A
e
|z|
2
dz =
_
_
_

n
2
_
R
n
e
|z|
2
dz = 1 se x ,
0 se x / .
(3.61)
131
Analogamente
_

(x
0
, ) d =

n
2
_
B
e
|z|
2
dz,
ove stavolta B

= z R
n
: 2

z + x
0
. Dato che x
0
, detto
il semispazio aperto di R
n
che contiene B(x
0
, ), se z si ha z B

per ogni sucientemente piccolo, mentre se z / si ha z / B

per ogni
sucientemente piccolo; se ne deduce, a causa dellinvarianza per rotazioni
dellintegrando,
lim
0

n
2
_
B
e
|z|
2
dz =

n
2
_

e
|z|
2
dz =
1
2
n
2
_
R
n
e
|z|
2
dz =
1
2
. (3.62)
Da (3.61) e (3.62) segue inne
lim
0
I
41
(x, ) = lim
0
+
_

[(x , ) (x
0
, )] d =
_

_
1
2
se x ,

1
2
se x / .
Abbiamo pertanto provato che per x x
0
(lungo la retta perpendicolare a
in x
0
) si ha, in virt` u di (3.60),
I
4

_

_
1
2
(x
0
, t) se x ,

1
2
(x
0
, t) se x / .
Ci` o conclude la dimostrazione del lemma 3.6.4.
Possiamo ora vedere se la nostra candidata soluzione u, data da (3.53), risolve
davvero il problema di Cauchy-Neumann (3.43). La u `e una funzione regolare
in ]0, T], e continua in [0, T], come si verica facilmente usando la
proposizione 3.3.5(v) (con ]0, 1[); essa risolve lequazione del calore in
]0, T] ed `e nulla in per t = 0. Come si `e gi`a osservato, Le stime sulle
derivate di fornite dalla proposizione 3.3.5(vi) non garantiscono che u abbia
derivate prime continue su [0, T]; tuttavia il lemma 3.6.4 ci dice che
si pu`o dare senso alla derivata normale su ]0, T], e che tale derivata
normale vale
u

(x
0
, t) = lim
xx
0
, xx
0

j=1
u
x
j
(x, t)
j
(x
0
) =
= W(x
0
, t) +
1
2
(x
0
, t) (x
0
, t) ]0, T],
(3.63)
132
ove W(x
0
, t) `e dato da (3.54); essa `e dunque una funzione continua su
[0, T]. Perci`o, anche u risolva il problema (3.43), occorre che sia
W(x
0
, t) +
1
2
(x
0
, t) = (x
0
, t) (x
0
, t) [0, T],
ossia che valga, per ogni (x, t) [0, T], lequazione integrale
(x, t) + 2
_
t
0
_

(x , t )(, ) d

d = 2(x, t). (3.64)


Il nucleo di questa equazione, in virt` u della sua continuit`a per x ,= e t ,=
e grazie a (3.57), verica le ipotesi del teorema 3.5.6. Quindi lequazione
integrale ha ununica soluzione , la quale, inserita nellespressione di u,
permette di mostrare che u `e la soluzione del problema di Cauchy-Neumann
(3.43). Ci`o conclude la dimostrazione del teorema 3.6.1
Osservazioni 3.6.5 (1) Anche se abbiamo risolto la (3.64) in [0, T], la
soluzione u verica la condizione
u

(x
0
, t) = (x
0
, t) soltanto in ]0, T]:
infatti si vede facilmente, utilizzando la proposizione 3.3.5, che per t = 0 le
derivate prime di u sono continue, e dunque nulle in , essendo u(, 0) 0
in . Dunque, quando t = 0 si ha
u

(x
0
, 0) = lim
xx
0
, xx
0

j=1
u
x
j
(x, 0)
j
(x
0
) = 0.
Per vericare la condizione alla frontiera anche per t = 0, dovrebbe dunque
essere (x
0
, 0) = 0: questa `e una condizione di compatibilit`a che potrebbe
non essere vericata dal dato . Se questa condizione `e soddisfatta, lequa-
zione integrale ci d`a (x
0
, 0) = 0, la (3.64) vale in [0, T] e la relazione
u

(x
0
, t) = (x
0
, t) `e valida in [0, T], ma soltanto nel senso sopra de-
scritto, perche la u non `e di classe C
1
; infatti le derivate prime di u, nulle su
per t = 0, non sono per`o continue, come funzioni di (x, t), nei punti (x
0
, 0)
con x
0
.
(2) Con lo stesso metodo si vede che la funzione u, denita da (3.53), `e
soluzione del problema di Cauchy-Neumann esterno
_

_
u
t
u = 0 in
c
]0, T],
u(x, 0) = 0 in
c
,
u

(x, t) = (x, t) (x, t) [0, T],


[u(x, t)[ Me
|x|
2
(x, t)
c
[0, T] per qualche M > 0, > 0,
133
purche la funzione che compare nelle denizione di u soddis lequazione
integrale di Volterra
(x, t) 2
_
t
0
_

()
(x , t )(, ) d

d =
= 2(x, t) (x, t) [0, T];
la limitazione sulla crescenza allinnito serve a garantire lunicit`a.
(3) Per il problema di Cauchy-Dirichlet (3.42) in un aperto limitato con
frontiera di classe C
1+
vale un enunciato analogo a quello del teorema 3.6.1:
esiste ununica soluzione u, che `e esprimibile nella forma di potenziale di
doppio strato (double-layer potential), vale a dire
u(x, t) =
_
t
0
_

j=1

j
(x , t )
j
() (, ) d

d, (3.65)
ove C([0, T]) `e lunica soluzione dellequazione integrale di Volterra
in [0, T]
(x, t) + 2
_
t
0
_

()
(x , t ) (, ) d

d = 2(x, t).
La stessa funzione u risolve il problema di Cauchy-Dirichlet esterno
_

_
u
t
u = 0 in
c
]0, T],
u(x, 0) = 0 in
c
,
u(x, t) = (x, t) (x, t) [0, T],
[u(x, t)[ Me
|x|
2
(x, t)
c
[0, T] per qualche M > 0, > 0,
purche la funzione che compare nella (3.65) risolva lequazione integrale
(x, t) 2
_
t
0
_

()
(x , t ) (, ) d

d = 2(x, t).
(4) La versioni pi` u generali dei problemi (3.43) e (3.42), ossia quelle con dati
non omogenei, sono rispettivamente:
_

_
u
t
u = f(x, t) (x, t) ]0, T],
u(x, 0) = (x) x ,
u

(x, t) = (x, t) (x, t) [0, T],


134
_

_
u
t
u = f(x, t) (x, t) ]0, T],
u(x, 0) = (x) x ,
u(x, t) = (x, t) (x, t) [0, T].
Questi problemi sono risolubili con metodi analoghi a quelli visti n qui;
ne tralasciamo lo studio per mancanza di tempo. Osserviamo che vi sono
condizioni non banali di compatibilit`a fra i dati, se si vogliono soluzioni
regolari in [0, T]. Per approfondimenti si pu`o consultare [6]. Le equazioni
paraboliche, come le iperboliche, si possono utilmente arontare, in modo pi` u
astratto e generale, per mezzo della teoria dei semigruppi: si tratta di uno
strumento potente e versatile, applicabile a varie problematiche, per il quale
rimandiamo a [7].
135
Capitolo 4
Lequazione di DAlembert
4.1 Motivazioni siche
Il prototipo delle equazioni iperboliche `e lequazione delle onde, o di DAlem-
bert,
u
tt
c
2
u = f(x, t), (4.1)
cui si perviene nello studio di svariatissimi fenomeni sici di tipo evolutivo,
tutti per`o accomunati dalla caratteristica fondamentale di descrivere moti
ondulatori: di particelle subatomiche, di materiali elastici, di uidi, di cor-
rente elettrica. Il mondo delle equazioni iperboliche `e vastissimo e presenta
caratteristiche matematiche proprie, molto diverse da quelle tipiche del ca-
so parabolico: cercheremo di analizzarle nei paragra successivi. Vediamo
qualche esempio sico in cui compare lequazione delle onde.
Esempio 4.1.1 Analizziamo le vibrazioni trasversali di una corda tesa, ossia
di un lo elastico, essibile, teso orizzontalmente tra due estremi, i punti 0
e L dellasse x. Ci interessa solamente lo spostamento u(x, t) (nel punto x,
allistante t) in direzione verticale. Denotiamo con T(x, t) la tensione della
corda nel punto x allistante t: essa `e diretta tangenzialmente alla corda
in ogni punto (x, u(x, t)) di essa; ci`o traduce matematicamente il fatto che
la corda non esercita resistenza alla essione. Detta (x) la densit`a lineare
della corda, la variazione della componente verticale della quantit`a di moto
relativa ad un tratto di corda [x
1
, x
2
] in un intervallo di tempo [t
1
, t
2
] `e data
da
_
x
2
x
1
()[u
t
(, t
2
) u
t
(, t
1
)] d.
136
Essa coincide con limpulso, nello stesso intervallo di tempo, delle componenti
verticali delle forze che agiscono sul tratto di corda in esame, cio`e la tensione
ai due estremi e le forze esterne quali la gravit`a, che denoteremo globalmente
con F. Si ha dunque
_
x
2
x
1
()[u
t
(, t
2
) u
t
(, t
1
)] d =
=
_
t
2
t
1
[T
y
(x
2
, t) T
y
(x
1
, t)]dt +
_
t
2
t
1
_
x
2
x
1
F(, t) ddt.
Supponendo che u e T siano funzioni regolari, lequazione precedente si pu`o
riscrivere nel modo seguente:
_
t
2
t
1
_
x
2
x
1
_
()u
tt
(, t)

T
y
(, t) +F(, t)
_
ddt = 0.
Per larbitrariet`a del rettangolo [x
1
, x
2
] [t
1
, t
2
], si ricava
(x)u
tt
(x, t)

x
T
y
(x, t) +F(x, t) = 0.
Adesso scriviamo una formula per la tensione: secondo la legge di Hooke,
possiamo assumere
T
y
(x, t) = k(x)u
x
(x, t),
ove k(x) `e il cosiddetto modulo di Young; ci`o `e plausibile, considerando che
la tensione in un tratto di corda deve essere tanto maggiore quanto pi` u gli
spostamenti ai due estremi dieriscono fra loro. Si deduce allora lequazione
(x)u
tt
(x, t)

x
(k(x)u
x
(x, t)) +F(x, t) = 0.
Se ora si ammette che la densit`a e il modulo di Young k siano costanti, si
ottiene lequazione delle onde (4.1) con c =
_
k/.
Le linee caratteristiche per lequazione (4.1) sono le rette x ct = h con h
costante. Dunque la retta t = 0 non `e caratteristica ed `e quindi naturale
ssare, al tempo t = 0, condizioni iniziali della forma
u(x, 0) = (x), u
t
(x, 0) = (x) x [0, L],
con le quali si forniscono la congurazione e la velocit`a iniziale della corda.
Occorre inoltre una condizione agli estremi: se i due capi della corda sono
ssati, imporremo
u(0, t) = u(L, t) = 0 t 0.
137
Esempio 4.1.2 Consideriamo le oscillazioni trasversali di una membrana,
ossia di una pellicola non resistente a essioni e trazioni, ssata lungo il suo
contorno giacente nel piano z = 0. Indicheremo con la proiezione della
membrana sul piano z = 0. Ci interessano gli spostamenti verticali u(x, y, t)
in corrispondenza del punto (x, y) allistante t, e supporremo, per semplicit`a,
che quelli tangenziali siano nulli. Denotiamo con T(x, y, t) la tensione che
viene esercitata sulla membrana in corrispondenza del punto (x, y) ad un
ssato istante t: essa in ogni punto `e tangente alla supercie, proprio perche
non vi `e opposizione alle essioni e alle trazioni.
Consideriamo un pezzetto di membrana, la cui proiezione sul piano orizzon-
tale sia un aperto regolare S. Esso `e sottoposto a tensione in tutti i punti
della sua frontiera, e la tensione agisce in direzione normale a S (eventuali
componenti tangenziali determinerebbero spostamenti non verticali dei punti
della membrana, contro lipotesi fatta). A noi interessa la componente verti-
cale T
z
della tensione: la tensione complessiva, in direzione verticale, a cui `e
sottoposto il pezzo di membrana allistante t si misura attraverso lintegrale
curvilineo _
S
T
z
(x, y) ds.
Facciamo ora lipotesi che nei punti di S risulti
T
z
(x, y, t) = k(x, y)u(x, y, t) n(x, y),
ove n `e il versore normale esterno a S nel piano orizzontale: ci`o, in analogia
con il caso unidimensionale della corda, `e plausibile, perche dove u `e gran-
de in modulo la tensione dovrebbe avere una componente verticale grande;
daltra parte dove u punta in direzione trasversale a n, vuol dire che nella
direzione di n la u `e quasi costante e quindi la tensione dovrebbe essere pic-
cola.
Utilizzando il teorema della divergenza, otteniamo
_
S
T
z
(x, y, t) ds =
_
S
div(ku) dxdy.
Uguagliando la variazione in [t
1
, t
2
] della componente verticale della quantit`a
di moto allimpulso delle forze nello stesso intervallo, indicate con F(x, y, t)
le forze esterne si pu`o scrivere
_
t
2
t
1
_
S
u
tt
dxdydt =
_
t
2
t
1
_
S
[div(ku) +F] dxdydt,
138
da cui per larbitrariet`a di S e di [t
1
, t
2
] ricaviamo, supponendo lintegrando
continuo,
(x, y)u
tt
(x, y, t) div(k(x, y)u(x, y, t)) = F(x, y, t) (x, y) , t > 0.
Se poi si suppone che e k siano costanti, si trova lequazione
u
tt

u =
F

in ]0, [.
Ad essa vanno aggiunte le condizioni iniziali u(x, y, 0) = (x, y) e u
t
(x, y, 0) =
(x, y), nonche una condizione al contorno: dato che la membrana `e tenuta
ssa al bordo, si impone la condizione u(x, y, t) = 0 per (x, y, t) [0, [.
Esempio 4.1.3 Il passaggio di corrente in un lo conduttore `e caratteriz-
zato dalla conoscenza di due grandezze: lintensit`a di corrente i(x, t), cio`e
la quantit`a di carica che attraversa una sezione unitaria del lo nellunit`a di
tempo, e la tensione v(x, t), che dipende dalla dierenza di potenziale alle
estremit`a del lo. La legge di Ohm, applicata ad un trattino dx di lo, lega
queste due quantit`a nel modo seguente:
v(x, t) v(x +dx, t) v
x
dx = Ri dx +Li
t
dx f dx. (4.2)
Il termine v
x
dx rappresenta la caduta di tensione nel tratto di lo consi-
derato, che deve uguagliare la somma delle dispersioni di carica lungo il lo.
Le costanti R e L sono la resistenza e linduttanza del circuito, f `e una forza
elettromotrice esterna, fornita ad esempio da una batteria. Daltra parte la
quantit`a di carica presente nel tratto di lo considerato nellunit`a di tempo
`e pari a i(x, t) i(x+dx, t) i
x
dx; essa `e uguale a Cv
t
dxGv dx, ossia a
ci`o che serve a caricare lelemento dx, meno ci`o che si perde per isolamento
imperfetto: C `e la capacit`a del circuito, G `e un coeciente di perdita, di soli-
to molto piccolo se il lo `e ben isolato. Abbiamo cos` una seconda equazione,
i
x
dx = Cv
t
dx Gv dx. Otteniamo in questo modo il sistema
_
i
x
+Cv
t
Gv = 0,
v
x
+Li
t
+Ri f = 0
(4.3)
Se deriviamo rispetto a x la prima equazione e rispetto a t la seconda,
ricaviamo
_
i
xx
+Cv
tx
Gv
x
= 0,
v
xt
+Li
tt
+Ri
t
f
t
= 0
139
Inserendo al posto di v
x
la sua espressione ottenuta dalla (4.2), e ricavando
v
tx
dalla seconda equazione, la prima equazione si riscrive nella forma
i
xx
+LGi
t
+GRi Gf CLi
tt
CRi
t
+Cf
t
= 0. (4.4)
In modo analogo, derivando la prima equazione del sistema (4.3) rispetto a
t e la seconda rispetto a x, ricaviamo
v
xx
CLv
tt
+GLv
t
RCv
t
+GRv f
x
= 0. (4.5)
Se il lo `e ben isolato, come si `e detto si ha G 0; se inoltre esso `e un buon
conduttore, si ha anche R 0, e le due equazioni diventano rispettivamente
v
tt
=
1
LC
v
xx

f
x
LC
, i
tt
=
1
LC
i
xx
+
f
t
L
,
e dunque sia v, sia i risolvono lequazione di DAlembert.
Esempio 4.1.4 Questo esempio `e un po pi` u elaborato dei precedenti. Con-
sideriamo il moto di un uido o di un gas compressibile, che supporremo
perfettamente non viscoso, ossia con completa assenza di attrito fra le mo-
lecole. Denotiamo con v(x, y, z, t) la sua velocit`a, con (x, y, z, t) la sua
densit`a, con p(x, y, z, t) la sua pressione, e con F(x, y, z, t) le forze esterne
per unit`a di massa. La somma delle forze agenti su un volume di liquido T
(semplicemente connesso) `e data da F e dalla pressione esercitata dal liqui-
do circostante, diretta perpendicolarmente su T. Uguagliando la somma di
tali forze allaccelerazione, si pu`o scrivere lequazione
_
T

d
dt
v dxdydz =
_
T
Fdxdydz
_
T
p nd,
ove n `e il versore normale esterno. Dal teorema della divergenza deduciamo
_
T

d
dt
v dxdydz =
_
T
[ F p] dxdydz.
Daltra parte, se (x(t), y(t), z(t)) `e la legge oraria di una particella di uido,
si ha v = (x

, y

, z

) e
d
dt
v(x, y, z, t) =
v
x
x

+
v
y
y

+
v
z
z

+
v
t
= (v )v +
v
t
,
140
ove (v )v `e il vettore

3
i=1
v
i
D
i
v. Per larbitrariet`a di T, otteniamo
lequazione del moto
v
t
+ (v )v =
1

p +F. (4.6)
Vi `e poi un altro legame fra le variabili: se in T non ci sono ne sorgenti ne
pozzi, la variazione della quantit`a di liquido nellunit`a di tempo `e pari al suo
usso attraverso la frontiera:
d
dt
_
T
dxdydz =
_
T
v nd,
ovvero, ancora per larbitrariet`a di T,

t
+ div(v) = 0. (4.7)
Questa `e lequazione di continuit`a.
Inne, ipotizziamo che la pressione nel uido dipenda soltanto dalla densit`a;
se il fenomeno di moto del uido `e adiabatico, ossia non provoca scambi di
calore con lesterno, allora si ammette che valga una equazione di stato del
tipo
p = p
0
_

0
_
k
,
ove p
0
e
0
sono dati iniziali per la pressione e per la densit`a. Otteniamo cos
il sistema
_

_
v
t
+ (v )v =
1

p +F,

t
+ div(v) = 0
p = p
0
_

0
_
k
.
(4.8)
Osserviamo adesso che se, inizialmente, v = 0, oppure rot v = 0, allora,
purche sia anche F(, t) = 0 o rot F(, t) = 0 per ogni t > 0, risulter`a anche
rot v(, t) 0. Infatti, ssato un punto (x, y, z), e scrivendo v(t) in luogo di
v(x, y, z, t), si ha
rot v(t) = rot v(0) +
_
t
0
rot
d
ds
v(s) ds = 0 +
_
t
0
rot
_
v
s
+ (v )v
_
ds =
=
_
t
0
rot
_

+F
_
ds =
_
t
0
rot
_

p
_
ds.
141
Daltronde, per ogni funzione scalare e per ogni funzione vettoriale A si
verica facilmente che
rot(A) = rot A+ A.
Nel nostro caso si ha =
1
e A = p; essendo p =
p
0

0
k (

0
)
k1
, il
vettore p `e parallelo a , da cui
rot v(t) = rot
_

p
_
=
1

rotp +
1

2
p = 0.
Supponiamo, per semplicit`a, F = 0. Allora da rot v = 0 segue, essendo T
semplicemente connesso, che esiste un potenziale cinetico U(x, y, z, t) tale che
v = U in T. In particolare, si noti che
(v )v = (U )U =
3

i=1
D
i
UD
i
U =
1
2

i=1
(D
i
U)
2
=
1
2
[U[
2
.
Sostituendo la relazione v = U nel sistema (4.8), questultimo diventa
_

_
U
t
+
1
2
[U[
2
=
1

p,

t
div(U) = 0
p = p
0
_

0
_
k
,
(4.9)
ed `e ancora troppo complicato. Facciamo qualche approssimazione: poniamo
s =

0

0
, ossia

0
= s+1, e supponiamo

0
1, da cui s 0. Di conseguenza,
p = p
0
(1 +s)
k
p
0
(1 +ks) e p p
0
ks. Allora, posto a
2
=
p
0
k

0
, il sistema
(4.9) si riduce a
_

_
U
t
+
1
2
[U[
2
= a
2
s,
s
t
U = 0
p = p
0
(1 +ks).
(4.10)
La prima equazione del sistema si pu`o integrare, ottenendo
U
t
+
1
2
[U[
2
+a
2
s = c(t)
con c(t) funzione indipendente da (x, y, z). Ma si pu`o supporre c(t) = 0
modicando il potenziale U, ossia rimpiazzandolo con U(x, y, z, t)
_
t
0
c(s)ds:
142
dunque possiamo supporre senzaltro U
t
+
1
2
[U[
2
+ a
2
s = 0. Derivando
questa equazione rispetto a t, troviamo
0 = U
tt
+
1
2

t
[U[
2
+a
2
s
t
= U
tt
+
1
2

t
[U[
2
+a
2
U,
e dunque U verica
U
tt
a
2
U =
1
2

t
[U[
2
.
Questa `e unequazione non lineare, la cui parte principale `e loperatore di
DAlembert. Se supponiamo che il modulo della velocit`a sia indipendente
dal tempo, si ottiene che U verica lequazione delle onde.
4.2 Il caso di una variabile spaziale
Consideriamo lequazione delle onde in una variabile spaziale: questo `e il caso
pi` u semplice ma permette gi`a di analizzare i fenomeni tipici delle equazioni
iperboliche. La prima cosa da osservare `e che, come peraltro gi`a sappiamo
dallesempio 1.6.5, si ha:
Teorema 4.2.1 Sia D un aperto convesso di R
2
. Tutte e sole le soluzioni
di classe C
2
dellequazione
u
tt
c
2
u
xx
= 0 in D (4.11)
sono le funzioni u della forma
u(x, t) = (x +ct) +(x ct), (4.12)
con e funzioni di classe C
2
di una sola variabile. In particolare, esse
sono estendibili ad un opportuno parallelogramma contenente D.
Dimostrazione
`
E ovvio che tutte le funzioni della forma sopra scritta risol-
vono lequazione (4.11).
Viceversa, loperatore di DAlembert D
2
t
c
2
D
2
x
si pu`o fattorizzare nella for-
ma (D
t
cD
x
)(D
t
+cD
x
), cosicche lequazione (4.11) `e equivalente al sistema
del primo ordine
_
(D
t
+cD
x
)u = v
(D
t
cD
x
)v = 0.
(4.13)
143
Se u `e una soluzione di classe C
2
dellequazione (4.11), allora v = u
t
+cu
x
`e
di classe C
1
e risolve lequazione v
t
cv
x
= 0. Poniamo, per R,
S

= (x, t) D : x +ct = .
La funzione v `e costante su S

(ammesso che questo non sia vuoto): infatti,


nei punti di S

, che sono della forma ( ct, t) con t I

(ove I

, essendo
D convesso, `e un opportuno intervallo di R), si ha
d
dt
v( ct, t) = c v
x
( ct, t) +v
t
( ct, t) = (v
t
cv
x
)( ct, t) = 0.
Sia w() il valore costante che v assume su S

: allora per ogni (x, t) D,


posto = x +ct, si ha v(x, t) = w() = w(x +ct), e in denitiva
v(x, t) = w(x +ct) (x, t) D.
In particolare, la funzione w `e di classe C
1
. Dunque, se `e una funzione di
classe C
2
tale che

() =
1
2c
w(), si avr`a
(D
t
+cD
x
)(x+ct) = 2c

(x+ct) = w(x+ct) = v(x, t) = (D


t
+cD
x
)u(x, t),
ossia la funzione z(x, t) = u(x, t) (x +ct) risolve lequazione z
t
+cz
x
= 0
ed `e di classe C
2
.
Se ora poniamo
T

= (x, t) D : x ct = ,
si trova che nei punti ( + ct, t) di T

, sempre che questo sia non vuoto, si


ha
d
dt
z( +ct, t) = cu
x
( +ct, t) +u
t
( +ct, t) w( + 2ct) =
= (u
t
+cu
x
v)( +ct, t) = 0,
e dunque z `e costante su T

: detto () tale valore, come in precedenza si


ricava che
z(x, t) = (x ct) (x, t) D,
e in particolare `e di classe C
2
. Pertanto
u(x, t) = (x +ct) +(x ct) (x, t) D
144
con e funzioni di classe C
2
. Inoltre, `e denita su un certo intervallo I
e `e denita su un certo intervallo J: si conclude che u `e denita sullintero
parallelogramma
P = (x, t) : x +ct I, x ct J,
il quale contiene D poiche la soluzione `e denita, per ipotesi, su tutto D.
Osservazione 4.2.2 Per un osservatore che si muova con velocit`a c lungo
la direzione positiva dellasse x, il valore di x ct resta costante nel tempo:
quindi (x ct) rimane costante. In altre parole, il graco di z = (x ct)
nel piano xz si sposta con velocit`a c verso destra (asse delle x positive). Ana-
logamente, il graco z = (x+ct) si sposta con velocit`a c verso sinistra (asse
delle x negative). Le funzioni x (x ct) e x (x + ct) si chiamano
onde piane, e come abbiamo visto queste onde si propagano con velocit`a c
lungo lasse x mantenendo la propria forma. In denitiva, il teorema 4.2.1
ci dice che ogni soluzione dellequazione di DAlembert si ottiene sovrappo-
nendo due onde piane, la prima progressiva (che si propaga con velocit`a c),
la seconda regressiva (che si propaga con velocit`a c).
Enunciamo ora il teorema di esistenza per il problema di Cauchy in una
variabile spaziale.
Teorema 4.2.3 Se C
2
(R) e C
1
(R), allora il problema di Cauchy
_

_
u
tt
c
2
u
xx
= 0 in R
2
,
u(x, 0) = (x), x R,
u
t
(x, 0) = (x), x R,
(4.14)
`e ben posto e la sua unica soluzione, che appartiene a C
2
(R[0, [), `e data
dalla formula di DAlembert
u(x, t) =
1
2
[(x +ct) +(x ct)] +
1
2c
_
x+ct
xct
() d. (4.15)
Dimostrazione Se la soluzione esiste, sappiamo dal teorema 4.2.1 che essa
ha la forma (4.12), con , funzioni di classe C
2
. Le condizioni iniziali ci
dicono che
(x) +(x) = (x), c[

(x)

(x)] = (x) x R.
145
Daltra parte vale lidentit`a, di facile verica,
(x +ct) +(x ct) =
=
1
2
[(x +ct) +(x +ct) +(x ct) +(x ct)] +
+
1
2
_
x+ct
xct
[

()

()] d,
quindi la soluzione u, se esiste, `e data dalla formula (4.15).
Daltra parte, sempre per il teorema 4.2.1 la funzione (4.15) `e davvero solu-
zione del problema (4.14), essendo somma di due funzioni calcolate rispetti-
vamente in x + ct e x ct, la cui regolarit`a C
2
`e assicurata dalla regolarit`a
dei dati e .
Inne, verichiamo che il problema `e ben posto: se , L

(R), allora per


ogni (x, t) R [T, T] si ha
[u(x, t)[ ||

+
1
2c
_
x+|ct|
x|ct|
[()[d ||

+T||

,
e ci`o prova la tesi.
Dal punto di vista qualitativo, la formula (4.15) ci rivela immediatamente
che il valore della soluzione u del problema (4.14) in un punto (x
0
, t
0
), con
t
0
positivo, dipende soltanto dai valori assunti dal dato nei due punti
x
0
ct
0
e da nellintervallo [x
0
ct
0
, x
0
+ ct
0
]. Questo intervallo si dice
dominio di dipendenza del punto (x
0
, t
0
). Pi` u in generale, dato un intervallo
I = [a r, a + r] R, linsieme dei punti (x, t), per i quali il valore di u in
(x, t) dipende solo dai valori dei dati , in punti di I, `e il rombo
B(I) = (x, t) R
2
: [x a[ r c[t[.
Le rette di pendenza
1
c
nel piano xt, come sappiamo, sono le caratteristiche
dellequazione. Conducendo per un punto (x
0
, 0) le due caretteristiche, si
determina il cono
c(x
0
) = (x, t) R
2
: [x x
0
[ c[t[,
il quale si chiama dominio di inuenza del punto x
0
R. Esso `e costituito
dai punti (x, t) tali che il valore u(x, t) `e inuenzato dai valori assunti in x
0
dai dati , . Osserviamo che, per giunta, il valore di in x
0
inuenza la so-
luzione solamente nei punti delle rette xx
0
= ct. In altre parole, possiamo
146
dire che le perturbazioni si propagano lungo le linee caratteristiche. C`e da
osservare inoltre un fatto fondamentale: a dierenza che nel caso parabolico,
i fenomeni iperbolici sono reversibili nel tempo: questo segue dallinvarianza
dellequazione delle onde rispetto alla trasformazione t t, e ce lo confer-
ma la forma della soluzione (4.15).
Consideriamo ora un altro problema unidimensionale: quello della corda
semi-nita, ossia lequazione di DAlembert sulla semiretta [0, [. Ci li-
miteremo, per semplicit`a, alla semiretta dei tempi positivi. Il problema `e il
seguente:
_

_
u
tt
c
2
u
xx
= 0 in ]0, [
2
,
u(x, 0) = (x), x 0,
u
t
(x, 0) = (x), x 0
u(0, t) = h(t), t 0,
(4.16)
ove e h sono funzioni di classe C
2
mentre `e di classe C
1
. Poiche cerchiamo
una soluzione di classe C
2
, dobbiamo imporre le condizioni di compatibilit`a
h(0) = (0), h

(0) = (0), h

(0) = c
2

(0). (4.17)
Si ha allora questo risultato:
Teorema 4.2.4 Se C
2
([0, [), h C
2
([0, [), C
1
([0, [), e se val-
gono le condizioni (4.17), allora il problema (4.16) `e ben posto e la soluzione
u C
2
([0, [[0, [) `e data da
u(x, t) =
_

_
(x +ct) +(x ct)
2
+
1
2c
_
x+ct
xct
() d se x ct,
h(t
x
c
) +
(ct +x) (ct x)
2
+
1
2c
_
ct+x
ctx
() d se x ct.
Dimostrazione Sappiamo dal teorema 4.2.1 che la soluzione u, se esiste, ha
la forma u(x, t) = (x +ct) +(x ct), con e di classe C
2
. Imponendo
le condizioni al contorno, otteniamo
_

_
(x) +(x) = (x) x 0,
c

(x) c

(x) = (x) x 0,
(ct) +(ct) = h(t) t 0.
(4.18)
147
Derivando la prima equazione, si ha il sistema
_

(x) +

(x) =

(x) x 0,
c

(x) c

(x) = (x) x 0,
da cui
(x) =
1
2
(x) +
1
2c
_
x
0
() d, (x) =
1
2
(x)
1
2c
_
x
0
() d x 0.
Si noti che dovremmo aggiungere ad e due costanti arbitrarie h e k, ma
la condizione (x) + (x) = (x) implica che h + k = 0; tenuto conto che
u = +, non `e restrittivo scegliere h = k = 0.
Invece per ogni < 0 si ha dalla terza equazione del sistema (4.18)
() = () +h(/c) =
1
2
()
1
2c
_

0
() d +h(/c).
Sostituendo le espressioni delle funzioni e nella denizione della candidata
soluzione, si ottengono senza dicolt`a le formule relative a u. Si noti che,
in virt` u delle condizioni di compatibilit`a (4.17), la funzione u `e di classe C
2
anche nei punti in cui x = ct. Inne, il problema `e ben posto perche si ha,
per ogni T > 0 e per ogni (x, t) [0, [[0, T],
[u(x, t)[
_
||

+T||

se x ct,
|h|

+||

+T||

se x ct.
Osservazione 4.2.5 Quando h(t) 0, la soluzione in un punto (x
0
, t
0
) `e,
per x
0
ct
0
,
u(x
0
, t
0
) =
_
1
2
(ct
0
+x
0
) +
1
2c
_
ct
0
+x
0
0
() d
_

_
1
2
(ct
0
x
0
) +
1
2c
_
ct
0
x
0
0
() d
_
,
ossia `e somma di unonda diretta (regressiva, con velocit`a c, partita dal
punto di ascissa x = x
0
+ ct
0
allistante t = 0) e di unonda riessa, pro-
gressiva (velocit`a c), che `e il risultato della riessione, avvenuta nellestremo
x = 0 allistante t = t
0

x
0
c
, di unonda regressiva, partita allistante t = 0
148
dal punto di ascissa x = ct
0
x
0
. Se prolunghiamo per disparit`a le funzioni
e a tutto R, la soluzione si estende a tutto R[0, [ nel modo seguente:
u(x, t) =
(x +ct) +(x ct)
2
+
1
2c
_
x+ct
xct
() d (x, t) R [0, [,
cio`e ritroviamo la formula (4.15). Si noti che le estensioni dispari di e sono
rispettivamente di classe C
2
e C
1
, in virt` u delle condizioni di compatibilit`a
(4.17).
Concludiamo lesame dei problemi in una dimensione spaziale con il caso
della corda di lunghezza nita L, ssata agli estremi 0 e L:
_

_
u
tt
c
2
u
xx
= 0 in ]0, L[]0, [,
u(x, 0) = (x), x [0, L],
u
t
(x, 0) = (x), x [0, L],
u(0, t) = u(L, t) = 0, t 0,
(4.19)
Le condizioni di compatibilit`a per avere una soluzione in C
2
([0, L] [0, [)
sono:
(0) = (0) =

(0) = 0, (L) = (L) =

(L) = 0. (4.20)
Si ha allora:
Teorema 4.2.6 Se C
2
([0, L]) e C
1
([0, L]), e se valgono le con-
dizioni (4.20), allora il problema (4.19) `e ben posto e la soluzione u
C
2
([0, L] [0, [) `e data da
u(x, t) =
(x +ct) +(x ct)
2
+
1
2c
_
x+ct
xct
() d, (4.21)
ove e sono i prolungamenti dispari e 2L-periodici di e di a tutto R.
In particolare, la soluzione u `e periodica nella variabile t di periodo 2L/c.
Dimostrazione La soluzione u, se esiste, ha la forma u(x, t) = (x + ct) +
(x ct). Le condizioni u(0, t) = u(L, t) = 0 ci dicono che
(ct) +(ct) = 0, (L +ct) +(L ct) = 0,
149
il che implica () = () per ogni 0 ed anche (L+) = (L) =
( L) per ogni L. Pertanto (x) = (x + 2L) per ogni x 0 e
(x) = (x 2L) per ogni x 0. Possiamo dunque prolungare e a
funzioni e denite su R e 2L-periodiche.
Dalle condizioni iniziali del sistema (4.19) ricaviamo poi
(x) = (x) +(x), (x) = c

(x) c

(x) x [0, L] (4.22)


da cui si deduce facilmente, come nel caso della corda semi-nita,
(x) =
1
2
(x) +
1
2c
_
x
0
()d,
(x) =
1
2
(x)
1
2c
_
x
0
()d
x [0, L]. (4.23)
Utilizzando la periodicit`a delle estensioni e , `e facile riconoscere che
(x) = (x),

(x) =

(x) x R,
e in particolare, quindi,
(x) = (x) (x), (x) = c(

(x)

(x)) x [0, L].


Volendo estendere i dati e in modo che la (4.22) valga per ogni x R,
bisogna che le estensioni siano esse stesse, come e , funzioni dispari e 2L-
periodiche. Dette e tali estensioni, si ottiene che la (4.23) vale anchessa
per ogni x R. Da qui segue subito che u, se esiste, ha la forma prescritta
nellenunciato ed `e quindi a sua volta prolungabile ad una funzione denita
su [0, L] R, periodica nella variabile t di periodo
2L
c
. Si noti che
2L
c
`e il
tempo impiegato da unonda per partire da un punto, percorrere la corda
in un senso, riettersi a una estremit`a, percorrerla nellaltro senso, riettersi
alla seconda estremit`a e tornare al punto di partenza.
Dalla forma (4.21) della soluzione segue inne immediatamente la dipendenza
continua dai dati nella norma uniforme in [0, L] [T, T].
Osservazione 4.2.7 Talvolta `e pi` u utile cercare la soluzione del problema
(4.19) sotto forma di serie di Fourier, quantunque questa scelta comporti
ipotesi pi` u restrittive sui dati: occorre infatti prendere C
3
([0, L]) e
C
2
([0, L]), tali che valgano le condizioni (4.20). Possiamo sviluppare le
funzioni e in serie di soli seni:
(x) =

n=1
a
n
sin
nx
L
, (x) =

n=1
b
n
sin
nx
L
.
150
Si noti che in tal modo e possono pensarsi prolungate a R in modo
dispari e 2L-periodico e che le serie sopra scritte convergono uniformemente
in R, al pari delle serie relative a

. Con il metodo della separazione


di variabili non `e dicile mostrare che la soluzione u `e data da
u(x, t) =
1
2

n=1
a
n
_
sin
n(x +ct)
L
+ sin
n(x ct)
L
_

L
2c

n=1
b
n
n
_
cos
n(x +ct)
L
cos
n(x ct)
L
_
Questa `e la rappresentazione di u come somma di onde progressive e regres-
sive. Con evidenti modiche si pu`o anche rappresentare la soluzione come
somma di onde stazionarie,
u(x, t) =

n=1
_
A
n
cos
nct
L
+B
n
sin
nct
L
_
sin
nx
L
=
=

n=1
N
n
sin
_
nct
L
+
n
_
sin
nx
L
,
ove
A
n
=
2
L
_
L
0
() sin
n
L
d, B
n
=
2
nc
_
L
0
() sin
n
L
d,
A
n
= N
n
sin
n
, tan
n
=
A
n
B
n
.
Questo modo di scrivere la soluzione del problema (4.19) si presta a una
analisi musicale del suono prodotto dalla vibrazione della corda: ogni onda
stazionaria N
n
sin
_
nct
L
+
n
_
sin
nx
L
, che viene detta armonica del suono,
determina per ciascun punto x della corda un moto armonico di ampiezza
N
n
sin
nx
L
e fase
n
(che `e la stessa per tutti i punti). La corda, di conse-
guenza, emette un suono di altezza pari alla frequenza di oscillazione
nx
L
, in-
tensit`a [N
n
[ e timbro determinato dalla struttura dellinsieme delle ampiezze
(che decrescono verso 0 per n ).
151
4.3 Il metodo dellenergia
In questo paragrafo inizieremo lo studio dellequazione delle onde in n varia-
bili spaziali. Mostreremo che il problema di Cauchy
_

_
u
tt
c
2
u = 0 in R
n
]0, [,
u(x, 0) = (x), x R
n
,
u
t
(x, 0) = (x), x R
n
,
(4.24)
ha al pi` u una soluzione e proveremo la dipendenza continua della soluzione
dai dati in opportune norme integrali, rimandando la costruzione esplicita
della soluzione ai paragra successivi.
Per stabilire lunicit`a della soluzione faremo uso del metodo dellenergia.
Tutto si basa sul seguente
Lemma 4.3.1 Se u C
2
(R
n
[0, [) `e soluzione dellequazione delle onde
in R
n
]0, [ e se
u(x, 0) = u
t
(x, 0) = 0 per [x x
0
[ a,
allora u 0 sul cono (x, t) : ct +[x x
0
[ a.
Dimostrazione Sia t
0
]0,
a
c
[, e consideriamo il tronco di cono D = (x, t) :
ct +[x x
0
[ a, 0 < t < t
0
. Moltiplichiamo lequazione delle onde per 2u
t
e integriamo su D:
0 =
_
D
2u
t
(u
tt
c
2
u)dxdt =
_
D

t
[u
t
[
2
dxdt 2c
2
_
D
u
t
udxdt;
daltra parte risulta
2u
t
u =
_
2u
t
u + 2
n

i=1
D
i
u
t
D
i
u
_
2
n

i=1
D
i
u
t
D
i
u =
= 2
n

i=1
D
i
(u
t
D
i
u)

t
[u[
2
,
cosicche sostituendo nella relazione precedente ricaviamo
0 =
_
D

t
([u
t
[
2
+c
2
[u[
2
) dxdt 2c
2
_
D
n

i=1
D
i
(u
t
D
i
u) dxdt.
152
Notando che D `e di classe C
1
a tratti possiamo utilizzare il teorema della
divergenza, ottenendo
0 =
_
D
_
([u
t
[
2
+c
2
[u[
2
)
t
2c
2
n

i=1
u
t
D
i
u
i
_
d,
ove `e il versore normale esterno a D in R
n+1
. Decomponendo D nelle sue
tre parti
1
(la base),
2
(la sommit`a) e
3
(la supercie laterale), si ha:
su
1
, = (0, . . . , 0, 1) e t = 0,
su
2
, = (0, . . . , 0, 1) e t = t
0
,
su
3
, = (
1
, . . . ,
n
,
t
) con

t
=
c

1 +c
2
,
n

i=1

2
i
= 1
2
t
=
1
1 +c
2
=

2
t
c
2
.
Notiamo inoltre che su
1
lintegrando `e nullo a causa delle condizioni iniziali.
Pertanto deduciamo
0 =
_

2
_
[u
t
(x, t
0
)[
2
+c
2
[u(x, t
0
)[
2

dx +
+
1

t
_

3
n

i=1
_
c
2
[u
t
[
2

2
i
+c
2
(D
i
u)
2

2
t
2c
2
u
t
D
i
u
i

d =
=
_

2
_
[u
t
(x, t
0
)[
2
+c
2
[u(x, t
0
)[
2

dx +
c
2

2
t
_

3
n

i=1
(u
t

i
D
i
u
t
)
2
d,
da cui
u
2
t
+c
2
[u[
2
= 0 su
2
.
Poiche t
0
`e arbitrario, si ha
u
t
(x, t) = 0, u(x, t) = 0 per t ]0, a/c[ e [x x
0
[ a ct;
per continuit`a deduciamo che u `e costante per ct +[x x
0
[ a. Daltronde,
essendo u(x, 0) = 0 concludiamo che u 0 per ct +[x x
0
[ a.
153
Corollario 4.3.2 Il problema di Cauchy
_

_
u
tt
c
2
u = f in R
n
[0, [,
u(x, 0) = (x), x R
n
,
u
t
(x, 0) = (x), x R
n
,
(4.25)
con f C(R
n
[0, [), C
2
(R
n
) e C
1
(R
n
), ha al pi` u una soluzione.
Dimostrazione Se u e v sono due soluzioni, la loro dierenza risolve il
problema (4.24) con e nulle; dunque si pu`o applicare il lemma 4.3.1 per
ogni scelta di x
0
R
n
e a ]0, [. Ne segue che u v `e identicamente nulla.
Osservazione 4.3.3 Pi` u in generale, per il problema di Cauchy (4.24) vale
un principio di conservazione dellenergia: se u risolve lequazione delle
onde in R
n
[0, [ e se e hanno supporto compatto in R
n
(cosicche
anche u ha supporto compatto rispetto a x per ogni t [0, T], con T > 0
opportuno), allora lintegrale dellenergia
E(t) =
_
R
n
[[u
t
(x, t)[
2
+c
2
[u(x, t)[
2
] dx
`e costante in [0, T]. Infatti, procedendo come nella dimostrazione del lemma
4.3.1, otteniamo per t [0, T]
0 =
_
R
n
2u
t
(x, t)(u
tt
(x, t) c
2
u(x, t)) dx =
=
d
dt
_
R
n
[u
t
(x, t)[
2
dx 2c
2
_
R
n
u
t
(x, t)
n

i=1
D
2
i
u(x, t) dx =
=
d
dt
_
R
n
[u
t
(x, t)[
2
dx + 2c
2
_
R
n
n

i=1
D
i
u
t
(x, t) D
i
u(x, t) dx =
=
d
dt
_
R
n
([u
t
(x, t)[
2
+c
2
[u(x, t)[
2
) dx =
d
dt
E(t),
ove si `e integrato per parti in R
n
usando il fatto che u(x, t) `e identicamente
nulla fuori di un compatto. Pertanto
d
dt
E(t) = 0 t [0, T],
il che prova lenunciato.
154
4.4 Il problema di Cauchy in due e tre varia-
bili spaziali
Veniamo ora al problema dellesistenza per il problema (4.24) nel caso n = 2
oppure n = 3. Ci proponiamo di fornire una formula esplicita per la soluzione.
A questo scopo occorre provare alcuni fatti preliminari che valgono per n
arbitrario.
Sia (x, t) un punto ssato di R
n
]0, [, e consideriamo per ogni r > 0 le
medie sferiche di una soluzione u di classe C
2
del problema (4.24):
U(x, r, t) =
1

n
r
n1
_
B(x,r)
u(y, t) d
y
=:
_
B(x,r)
u(y, t) d
y
, (4.26)
e, analogamente, per un ssato x R
n
, quelle dei dati e :
(x, r) =
_
B(x,r)
(y) d
y
, (x, r) =
_
B(x,r)
(y) d
y
. (4.27)
Useremo, pi` u in generale, il simbolo
_
A
per denotare la media integrale su un
qualunque insieme (misurabile) A.
Vale allora questo lemma:
Lemma 4.4.1 Sia u C
2
(R
n
[0, [) soluzione del problema (4.24). Allo-
ra, per ogni x R
n
, la funzione U(x, , ) appartiene a C
2
([0, [
2
) e risolve
il problema
_

_
U
tt
(x, , ) c
2
_
U
rr
(x, , ) +
n1
r
U
r
(x, , )
_
= 0 in [0, [
2
,
U(x, r, 0) = (x, r), r 0,
U
t
(x, r, 0) = (x, r), r 0,
U(x, 0, t) = u(x, t), t 0.
(4.28)
Se, in pi` u, u C
k
(R
n
[0, [), con k > 2, allora U(x, , ) C
k
([0, [
2
).
Lequazione che compare in questo enunciato si chiama equazione di Eulero-
Poisson-Darboux. Si noti che lespressione U
rr
+
n1
r
U
r
corrisponde al La-
placiano applicato alle funzioni radiali, nel senso che se v `e una funzione
radiale, cio`e tale che v(x) = [u(r)]
r=|x|
= u([x[), allora risulta v(x) =
u
rr
([x[) +
n1
|x|
u
r
([x[).
155
Dimostrazione Nel calcolo delle derivate U
r
e U
rr
non `e restrittivo supporre
u C

(R
n
[0, [), poiche, per ogni ssato compatto di R
n
[0, [, u `e
limite in C
2
(K) di una successione di funzioni di classe C

.
Anzitutto, per omotetia si vede che
U(x, r, t) =
1

n
_
B(0,1)
u(x +rz, t) d
z
=
_
B(0,1)
u(x +rz, t) d
z
,
da cui
lim
r0
+
U(x, r, t) = u(x, t);
inoltre, derivando sotto il segno di integrale,
U
t
(x, r, t) =
_
B(0,1)
u
t
(x +rz, t) d
z
, U
tt
(x, r, t) =
_
B(0,1)
u
tt
(x +rz, t) d
z
.
In particolare, `e chiaro che risulta, grazie alla continuit`a di u e u
t
,
U(x, r, 0) = (x, r), U
t
(x, r, 0) = (x, r) r > 0.
Per quanto riguarda le derivazione rispetto a r, possiamo scrivere
U
r
(x, r, t) =

r
1

n
_
B(0,1)
u(x +rz, t) d
z
=
=
1

n
_
B(0,1)
u(x +rz, t) z d
z
,
il che ci dice che U
r
dipende dalle derivate prime di u. Proseguendo il calcolo,
risulta
U
r
(x, r, t) =
1

n
r
n1
_
B(x,r)
u(y, t)
y x
r
d
y
=
=
1

n
r
n1
_
B(x,r)
u

(y, t) d
y
=
1

n
r
n1
_
B(x,r)
u(y, t) dy =
=
r
n
_
B(x,r)
u(y, t) dy =
r
n
_
B(0,1)
u(x +rz, t) dz,
e, in particolare, otteniamo lim
r0
+ U
r
(x, r, t) = 0. Inoltre
U
rr
(x, r, t) =

r
r
n
_
B(0,1)
u(x +rz, t) dz =
=
1

n
_
B(0,1)
u(x +rz, t) dz +
r

n
_
B(0,1)
u(x +rz, t) z dz;
156
ora, poiche risulta, per il teorema della divergenza,
r

n
_
B(0,1)
u(x +rz, t) z dz =
1

n
_
B(0,1)
n

i=1

z
i
[u(x +rz, t)] z
i
dz =
=
1

n
_
B(0,1)
n

i=1
u(x +rz, t) z
i

i
d
z

n
_
B(0,1)
n

i=1
u(x +rz, t) D
i
z
i
dz =
=
1

n
_
B(0,1)
u(x +rz, t) d
z

n

n
_
B(0,1)
u(x +rz, t) dz =
=
_
B(0,1)
u(x +rz, t) d
z

_
B(0,1)
u(x +rz, t) dz,
deduciamo che
U
rr
(x, r, t) =
_
1
n
1
__
B(0,1)
u(x +rz, t) dz +
_
B(0,1)
u(x +rz, t) d
z
.
In particolare, lim
r0
+ U
rr
(x, r, t) =
1
n
u(x, t).
`
E allora facile vericare che
U(x, , ) e le sue derivate U
r
, U
t
, U
rr
, U
rt
, U
tt
sono funzioni continue in [0, [
2
.
Ci` o prova che U(x, , ) C
2
([0, [
2
).
Se, poi, u C
k
([0, [
2
), allora partendo dalle espressioni di U, U
r
e U
rr
`e
possibile calcolare tutte le derivate di ordine k di U, e mostrarne senza par-
ticolari dicolt`a la continuit`a in [0, [
2
.
Verichiamo inne che U risolve lequazione di Eulero-Poisson-Darboux. Dal-
lespressione di U
r
in termini di media integrale su B(x, r) ricaviamo
r
n1
U
r
(x, r, t) =
r
n
n
_
B(x,r)
u(y, t) dy =
1
c
2

n
_
B(x,r)
u
tt
(y, t) dy,
da cui

r
(r
n1
U
r
(x, r, t)) =
1
c
2

r
_
r
0
_
B(x,)
u
tt
(y, t) d
y
d =
=
r
n1
c
2
_
B(x,r)
u
tt
(y, t) d
y
=
r
n1
c
2
U
tt
(x, r, t).
Ne segue
U
tt
=
c
2
r
n1

r
(r
n1
U
r
) = c
2
_
U
rr
+
n 1
r
U
r
_
,
157
e ci`o prova la tesi.
Passiamo ora a dimostrare i teoremi di esistenza per il problema (4.24) nei
casi n = 2 e n = 3. Considereremo anzitutto il caso n = 3; laltro, co-
me vedremo, si deduce dal primo. Il caso di n qualunque sar`a trattato nel
paragrafo successivo.
Teorema 4.4.2 Sia n = 3, siano C
2
(R
3
) e C
1
(R
3
), e sia u
C
2
(R
3
[0, [) una soluzione del problema
_

_
u
tt
c
2
u = 0 in R
3
[0, [,
u(x, 0) = (x), x R
3
,
u
t
(x, 0) = (x), x R
3
,
(4.29)
Allora u `e data dalla formula di Kirchho
u(x, t) =

t
_
t
_
B(0,1)
(x +ctz) d
z
_
+t
_
B(0,1)
(x +ctz) d
z
=
=
_
B(x,ct)
[t(y) +(y) +(y) (y x)] d
y
(x, t) R
3
]0, [.
(4.30)
Viceversa, se C
3
(R
3
) e C
2
(R
3
), allora il problema (4.29) `e ben
posto e la sua unica soluzione `e la funzione (4.30), la quale appartiene a
C
2
(R
3
[0, [).
Dimostrazione Poniamo per un ssato x R
3
e per ogni (r, t) ]0, [
2
:
V (x, r, t) = r U(x, r, t), G(x, r) = r (x, r), H(x, r) = r (x, r). (4.31)
Proviamo che V (x, , ) risolve il seguente problema di Cauchy, in una dimen-
sione spaziale, per la corda semi-nita:
_

_
V
tt
(x, , ) c
2
V
rr
(x, , ) = 0 in [0, [
2
,
V (x, r, 0) = G(x, r), r 0,
V
t
(x, r, 0) = H(x, r), r 0,
V (x, 0, t) = 0, t 0.
(4.32)
Si noti che in questo problema le condizioni di compatibilit`a necessarie per
avere una soluzione di classe C
2
sono vericate: infatti, procedendo come si
158
`e fatto in precedenza per la funzione U(x, r, t), si verica in modo un po
laborioso ma non dicile che
lim
r0
G(x, r) = 0, lim
r0
H(x, r) = 0, lim
r0
G
rr
(x, r) = 0.
Le condizioni ai limiti per V sono soddisfatte: infatti, essendo u soluzione di
(4.29), utilizzando (4.26) e (4.27) si ha
V (x, r, 0) = r
_
B(x,r)
u(y, 0) d
y
= r
_
B(x,r)
(y) d
y
= r(x, r) = G(x, r),
V
t
(x, r, 0) = r
_
B(x,r)
u
t
(y, 0) d
y
= r
_
B(x,r)
(y) d
y
= r(x, r) = H(x, r).
ed anche, ovviamente,
V (x, 0, t) = lim
r0
rU(x, r, t) = 0.
Inoltre, per il lemma 4.4.1,
V
tt
= r U
tt
= r c
2
_
U
rr
+
2
r
U
r
_
= c
2

r
(U +rU
r
) = c
2

r
V
r
= c
2
V
rr
. (4.33)
Dunque, per V (x, , ) vale il teorema 4.2.4, in base al quale quando r < ct si
ha
V (x, r, t) =
G(x, ct +r) G(x, ct r)
2
+
1
2c
_
ct+r
ctr
H(x, ) d.
Essendo
u(x, t) = lim
r0
U(x, r, t) = lim
r0
V (x, r, t)
r
,
si deduce facilmente, ricordando (4.31) e (4.27),
u(x, t) = G
r
(x, ct) +
1
c
H(x, ct) =
1
c
_

t
G(x, ct) +H(x, ct)
_
=
=
1
c

t
(ct (x, ct)) +t (x, ct) =

t
(t (x, ct)) +t (x, ct) =
=
d
dt
_
t
_
B(0,1)
(x +ctz) d
z
_
+t
_
B(0,1)
(x +ctz) d
z
.
Svolgendo la derivata rispetto a t, si ottiene facilmente la seconda rappresen-
tazione in (4.30). Ci`o prova la prima parte del teorema 4.4.2.
159
Adesso dobbiamo provare che se C
3
(R
3
) e C
2
(R
3
), allora la funzione
u, data da (4.30), risolve il problema (4.29). Per la verica delle condizioni
iniziali si utilizza la prima formulazione della formula di Kirchho:
u(x, 0) = lim
t0
__
B(0,1)
(x +ctz) d
z
+ct
_
B(0,1)
(x +ctz) z d
z
+
+t
_
B(0,1)
(x +ctz) d
z
_
= (x),
e analogamente
u
t
(x, 0) = lim
t0
_
2c
_
B(0,1)
(x +ctz) z d
z
+
+ c
2
t
_
B(0,1)
[
2
(x +ctz) z] z d
z
+
_
B(0,1)
(x +ctz) d
z
+
+ ct
_
B(0,1)
(x +ctz) z d
z
_
=
= 2c
_
B(0,1)
(x) z d
z
+(x) = (x).
Per quanto riguarda lequazione dierenziale, `e suciente provare, pi` u in
generale, che se C
2
(R
3
) allora la funzione
v(x, t) = t
_
B(0,1)
(x +ctz) d
z
`e soluzione dellequazione delle onde: infatti, da ci`o si ha come conseguenza
che se C
3
(R
3
) allora anche v
t
risolve tale equazione, essendo evidente-
mente (v
t
)
tt
= v
ttt
= c
2
(v)
t
= c
2
v
t
.
In eetti, risulta
v
tt
(x, t) =

t
__
B(0,1)
(x +ctz) dz +ct
_
B(0,1)
(x +ctz) z d
z
_
=
=
2c
4
_
B(0,1)
(x +ctz) z d
z
+
ct
4

t
_
B(0,1)
(x +ctz) z d
z
=
=
1
2ct
2
_
B(x,ct)
(y)
y x
ct
d
y
+
160
+
ct
4

t
_
1
c
2
t
2
_
B(x,ct)
(y)
y x
ct
d
y
_
=
=
1
2ct
2
_
B(x,ct)

(y) d
y
+
ct
4

t
_
1
c
2
t
2
_
B(x,ct)

(y) d
y
_
=
=
1
2ct
2
_
B(x,ct)
(y) dy +
+
t
4c
_

2
t
3
_
B(x,ct)
(y) dy +
1
t
2

t
_
ct
0
_
B(x,)
(y) d
y
d
_
=
=
1
4t
_
B(x,ct)
(y) d
y
=
c
2
t
4
_
B(0,1)
(x +ctz) d
z
= c
2
v(x, t).
Per concludere la dimostrazione, osserviamo che dalla formula di Kirchho
segue facilmente che la dipendenza continua dai dati vale nel senso seguente:
per ogni T > 0 e per ogni (x, t) R
3
[0, T] si ha
[u(x, t)[ C[||

+||

+T ||

],
sempre che, naturalmente, il secondo membro sia nito. Il teorema 4.4.2 `e
provato.
Passiamo ora al caso n = 2. Qui non si riesce pi` u a ridurre lequazione di
Eulero-Poisson-Darboux allequazione della corda semi-nita, perche manca
lanalogo della (4.33). Allora si ricorre allarticio di considerare una soluzio-
ne u C
2
(R
2
[0, [) come una funzione di tre variabili, costante rispetto
alla terza, che risolve il problema di Cauchy in R
3
[0, [ con dati a loro vol-
ta costanti rispetto alla terza variabile spaziale. Questa procedura si chiama
metodo di discesa.
Teorema 4.4.3 Sia n = 2, siano C
2
(R
2
) e C
1
(R
2
), e sia u
C
2
(R
2
[0, [) una soluzione del problema
_

_
u
tt
c
2
u = 0 in R
2
[0, [,
u(x, 0) = (x), x R
2
,
u
t
(x, 0) = (x), x R
2
,
(4.34)
161
Allora u `e data dalla formula di Parseval
u(x, t) =

t
_
t
2
_
B(0,1)
(x +ctz)
_
1 [z[
2
dz
_
+
t
2
_
B(0,1)
(x +ctz)
_
1 [z[
2
dz =
=
c
2
_
B(x,ct)
t
2
(y) +t[(y) +(y) (y x)]
_
c
2
t
2
[y x[
2
dy.
(4.35)
Viceversa, se C
3
(R
2
) e C
2
(R
2
), allora il problema (4.34) `e ben
posto e la sua unica soluzione `e la funzione (4.35), la quale appartiene a
C
2
(R
2
[0, [) .
Dimostrazione Sia u C
2
(R
2
[0, [) soluzione del problema (4.34).
Per ogni x = (x
1
, x
2
, z) R
3
scriviamo x

= (x
1
, x
2
), cosicche x = (x

, z).
Deniamo
u(x, t) = u(x

, t) (x, t) R
3
[0, [.
Analogamente, poniamo
(x) = (x

), (x) = (x

) x R
3
.
Se deniamo, per lestensione (x) = (x

) di una generica funzione


C(R
2
),
Z(x, r) =
_
B(x,r)
(y) d
y
, x R
3
, r > 0,
risulta, parametrizzando i due emisferi di B(x, r) mediante le funzioni z =
(y

) con (y

) =
_
r
2
[y

[
2
,
Z(x, r) =
2
4r
2
_
B(x

,r)
(y

)
_
1 +[(y

)[
2
dy

=
=
1
2r
_
B(x

,r)
(y

)
_
r
2
[y

[
2
dy

=
r
2
_
B(x

,r)
(y

)
_
r
2
[y

[
2
dy

,
e in particolare
Z(x, ct) =
ct
2
_
B(x

,ct)
(y

)
_
c
2
t
2
[y

[
2
dy

=
=
1
2
_
B(0

,1)
(x

+ctz

)
_
1 [z

[
2
dz

.
(4.36)
162
Ci`o premesso, la funzione u risolve il problema di Cauchy
_

_
u
tt
c
2
u = 0 in R
3
[0, [,
u(x, 0) = (x), x R
3
,
u
t
(x, 0) = (x), x R
3
,
(4.37)
e quindi `e data dalla formula di Kirchho (4.30):
u(x, t) =

t
_
t
_
B(0,1)
(x +ctz) d
z
_
+t
_
B(0,1)
(x +ctz) d
z
=
=
_
B(x,ct)
[t(y) +(y) +(y) (y x)] d
y
;
ne segue, in virt` u della (4.36),
u(x, t)=

t
_
t
2
_
B(0

,1)
(x

+ctz

)
_
1 [z

[
2
dz

_
+
t
2
_
B(0

,1)
(x

+ctz

)
_
1 [z

[
2
dz

=
=
ct
2
_
B(x

,ct)
t(y

) +(y

) +(y

) (y

)
_
c
2
t
2
[y

[
2
dy

,
(4.38)
formula che, notazioni a parte, coincide con la (4.35).
Se poi C
3
(R
2
) e C
2
(R
2
), poiche la formula (4.30) fornisce leettiva
soluzione (di classe C
2
) del problema (4.37), otteniamo che u, data dalla
(4.38), risolve lo stesso problema: ma essendo tale funzione indipendente da
z al pari dei dati e , essa, o meglio u, `e anche soluzione (di classe C
2
) del
problema (4.34).
Inne, la dipendenza continua dai dati vale nello stesso senso in cui vale nel
caso n = 3: per ogni T > 0 e per ogni (x, t) R
2
[0, T] si ha
[u(x, t)[ C[||

+||

+T ||

],
sempre che il secondo membro sia nito.
Osservazione 4.4.4 Analizziamo le dierenze qualitative fra le soluzioni del
problema di Cauchy in R
n
[0, [ nei casi n = 1, 2, 3.
Quando n = 1, la soluzione u `e data dalla formula di DAlembert (4.15) e,
come sappiamo, il valore di u in (x
0
, t
0
) dipende solo dai valori assunti da
nel dominio di dipendenza [x
0
ct
0
, x
0
+ ct
0
], e dai valori assunti da
163
nel bordo di tale dominio; viceversa, una perturbazione dei dati nel punto
x allistante t = 0 modicher`a i valori assunti da u nellintero dominio di
inuenza (x, t) : [x x[ ct: infatti la perturbazione si propagher`a no a
toccare x
0
allistante [x
0
x[/c e continuer`a ad inuire (tramite la funzione
, ma non tramite la ) negli istanti successivi.
Quando n = 2 la soluzione u `e fornita dalla formula di Parseval (4.35): il
valore u(x
0
, t
0
) dipende dai valori assunti da , e sullintero disco
B(x
0
, ct
0
). Leetto di una perturbazione avvenuta in x allistante iniziale `e
risentito da tutti i punti del cono (x, t) : [x x[ ct, quindi nel punto x
0
linuenza agisce a partire dallistante [x
0
x[/c. Si noti che, a dierenza
del caso n = 1, ci`o accade anche quando = 0. Questo `e precisamente quel-
lo che succede quando si getta un sasso in uno stagno, prescindendo dagli
smorzamenti del moto ondoso dovuti a forze esterne ed attriti.
Nel caso n = 3, inne, la soluzione `e data dalla formula di Kirchho (4.30) e
il valore u(x
0
, t
0
) dipende unicamente dai valori di , e su B(x
0
, ct
0
).
Una perturbazione avvenuta in x per t = 0 determiner`a un eetto in x
0
sol-
tanto allistante [x
0
x[/c, senza lasciare traccia negli istanti successivi: in
altre parole, i segnali si propagano senza deformazione. Questo `e il principio
di Huygens. Ad esempio, un battito di mani emesso a un dato istante viene
percepito dopo un certo tempo e il suo eetto cessa subito dopo. Natural-
mente, questo `e vero quando non vi sono ostacoli sici alla propagazione:
in presenza di ostacoli, invece, le onde sonore si riettono dando luogo ai
fenomeni di eco.
4.5 Il problema di Cauchy in R
n
[0, [
Consideriamo il problema di Cauchy (4.24) in dimensione n qualunque. Pri-
ma di enunciare il teorema di esistenza, stabiliamo alcune utili identit`a.
Lemma 4.5.1 Sia k N
+
e sia C
k+1
(R). Allora per ogni r R si ha
(i)
d
2
dr
2
_
1
r
d
dr
_
k1
(r
2k1
(r)) =
_
1
r
d
dr
_
k
(r
2k

(r));
(ii)
_
1
r
d
dr
_
k1
(r
2k1
(r)) =
k1

j=0

k
j
r
j+1

(j)
(r), ove per j = 0, 1, . . . , k 1 le
quantit`a
k
j
sono costanti indipendenti da , e in particolare

k
0
= (2k 1)!! =: (2k 1) (2k 3) . . . 3 1;
164
(iii)
_
_
1
r
d
dr
_
k
(r)
_
r=ct
=
1
c
2k
_
1
t
d
dt
_
k
[(ct)] per ogni c > 0 e t > 0.
Dimostrazione (i) Utilizziamo linduzione su k. Per k = 1 la relazione da
dimostrare `e vera perche per ogni C
2
(R) i due membri coincidono con
2

(r) +r

(r).
Supponiamo che la tesi valga per un ssato k e per ogni C
k+1
(R), e
dimostriamola per k + 1. Risulta per ogni C
k+2
(R)
d
2
dr
2
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
d
2
dr
2
_
1
r
d
dr
_
k1
__
1
r
d
dr
_
(r
2k+1
(r))
_
=
=
d
2
dr
2
_
1
r
d
dr
_
k1
_
(2k + 1)r
2k1
(r) +r
2k

(r)

=
=
d
2
dr
2
_
1
r
d
dr
_
k1
_
r
2k1
((2k + 1)(r) +r

(r))

.
Dallipotesi induttiva applicata alla funzione r (2k + 1)(r) + r

(r), che
appartiene a C
k+1
(R), segue
d
2
dr
2
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
_
1
r
d
dr
_
k
_
r
2k
d
dr
[(2k + 1)(r) +r

(r)]
_
=
=
_
1
r
d
dr
_
k
[r
2k
(2k + 2)

(r) +r
2k+1

(r)] =
=
_
1
r
d
dr
_
k
_
1
r
d
dr
(r
2k+2

(r))
_
=
_
1
r
d
dr
_
k+1
[r
2k+2

(r)],
e ci`o prova (i).
(ii) Per k = 1 i due membri coincidono con r(r) e risulta
1
0
= 1, cosicche
la tesi `e vera.
Se vale la tesi per un certo k, andiamo a provarla per lintero k + 1. Si ha
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
_
1
r
d
dr
_
k1
_
1
r
d
dr
(r
2k+1
(r))
_
=
=
_
1
r
d
dr
_
k1
[r
2k1
((2k + 1)(r) +r

(r))];
165
per lipotesi induttiva applicata alla funzione (2k +1)(r) +r

(r), si ottiene
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
k1

j=0

k
j
r
j+1
[(2k + 1)
(j)
(r) + (r

(r))
(j)
].
Adesso osserviamo che
(r

(r))
(j)
= r
j+1
(r) +j
(j)
(r) : (4.39)
infatti questa relazione `e vera per j = 0, e se vale per un dato j allora
(r

(r))
(j+1)
=
d
dr
(r

(r))
(j)
=
d
dr
[r
(j+1)
(r) +j
(j)
(r)] =
= r
(j+2)
(r) + (1 +j)
(j+1)
(r).
Quindi, utilizzando la (4.39), si ricava
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
=
k1

j=0

k
j
r
j+1
(2k + 1 +j)
(j)
(r) +
k

h=1

k
h1
r
h+1

(h)
(r) =
=
k

s=0

k+1
s
r
s+1

(s)
(r),
ove
_

k+1
0
= (2k + 1)
k
0
se s = 0,

k+1
s
= (2k + 1 +s)
k
s
+
k
s1
se s = 1, . . . , k.
Ci` o prova la formula enunciata in (ii). In particolare, il coeciente
k
0
si
ottiene dalla formula ricorsiva
_

0
0
= 1

k+1
0
= (2k + 1)
k
0
k N,
che d`a immediatamente
k
0
= (2k 1)!! .
(iii) La formula `e vera per k = 1, dato che si ha
__
1
r
d
dr
_
(r)
_
r=ct
=
1
ct

(ct) =
1
c
2
t
d
dt
[(ct)].
166
Se k > 1 e se la formula vale per tutti gli h k 1, allora nel caso di k,
applicando lipotesi induttiva, dapprima per h = 1 e poi per h = k 1, alla
funzione
_
1
r
d
dr
_
k1
(r), si trova che
_
_
1
r
d
dr
_
k
(r)
_
r=ct
=
_
_
1
r
d
dr
_
_
_
1
r
d
dr
_
k1
(r)
__
r=ct
=
1
c
2
t
d
dt
_
_
1
r
d
dr
_
k1
(r)
_
r=ct
=
1
c
2k
_
1
t
d
dt
_
k
[(ct)],
il che prova la tesi.
Veniamo ora al teorema di esistenza per il problema di Cauchy. Come `e gi`a
accaduto nel caso di due e tre dimensioni spaziali, `e necessario separare il
caso di n dispari dal caso di n pari, perch`e la struttura stessa della soluzione
`e dierente nei due casi. Cominciamo con il caso di n dispari: laltro ne `e
conseguenza quasi immediata tramite il metodo di discesa.
Teorema 4.5.2 Sia n = 2k + 1, e sia u C
k+1
(R
n
[0, [) soluzione del
problema di Cauchy (4.24). Allora u `e data dalla formula
u(x, t) =
1
(n 2)!!
_

t
_
1
t

t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
+
+
_
1
t

t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
_
.
(4.40)
Se, in pi` u, C
n+3
2
(R
n
) e C
n+1
2
(R
n
), allora il problema (4.24) `e ben
posto e la sua unica soluzione `e la funzione (4.40), la quale appartiene a
C
2
(R
n
[0, [).
Dimostrazione Poniamo, per un ssato x R
n
,
V (x, r, t) =
_
1
r

r
_
k1
[r
2k1
U(x, r, t)],
G(x, r) =
_
1
r

r
_
k1
[r
2k1
(x, r)],
H(x, r) =
_
1
r

r
_
k1
[r
2k1
(x, r)],
(4.41)
167
ove le funzioni U(x, r, t), (x, r) e (x, r) sono denite dalle (4.26) e (4.27).
Si noti che risulta
V (x, r, 0) = G(x, r), V
t
(x, r, 0) = H(x, r) x R
n
, r > 0. (4.42)
Come nel caso di tre variabili spaziali, proviamo che V (x, , ) risolve il pro-
blema unidimensionale per la corda semi-nita:
_

_
V
tt
(x, , ) c
2
V
rr
(x, , ) = 0 in [0, [
2
,
V (x, r, 0) = G(x, r), r 0,
V
t
(x, r, 0) = H(x, r), r 0,
V (x, 0, t) = 0, t 0.
(4.43)
In eetti, le condizioni iniziali sono vericate grazie a (4.42), e la condizione
V (x, 0, t) = 0 segue passando al limite per r 0 nella prima delle (4.41),
ricordando il lemma 4.5.1(ii). Quanto allequazione dierenziale, si ha dal
lemma 4.5.1(i)
V
rr
=

2
r
2
_
1
r

r
_
k1
[r
2k1
U] =
_
1
r

r
_
k
[r
2k
U
r
] =
=
_
1
r

r
_
k1
[r
2k1
U
rr
+ 2k r
2k2
U
r
] =
=
_
1
r

r
_
k1
_
r
2k1
_
U
rr
+
n 1
r
U
r
__
;
utilizzando il lemma 4.4.1, si conclude che
V
rr
=
1
c
2
_
1
r

r
_
k1
[r
2k1
U
tt
] =
1
c
2
V
tt
.
Come nel caso n = 3, si pu`o vericare senza troppa fatica che le condizioni
di compatibilit`a per avere la soluzione di classe C
2
, vale a dire
lim
r0
G(x, r) = 0, lim
r0
H(x, r) = 0, lim
r0
G
rr
(x, r) = 0,
sono soddisfatte.
Possiamo allora dire che, in virt` u del teorema 4.2.4, si ha per r < ct
V (x, r, t) =
1
2
[G(x, ct +r) G(x, ct r)] +
1
2c
_
ct+r
ctr
H(x, y) dy.
168
Ora dobbiamo ricavare u(x, t) da V (x, r, t). Il lemma 4.5.1(ii) dice che
V (x, r, t) =
k1

j=0

k
j
r
1+j

j
r
j
U(x, r, t),
e quindi
lim
r0
V (x, r, t)

k
0
r
= lim
r0
U(x, r, t) = u(x, t).
Perci`o
u(x, t) =
1

k
0
lim
r0
_
G(x, ct +r) G(x, ct r)
2r
+
1
2cr
_
ct+r
ctr
H(x, y) dy
_
=
=
1
(2k 1)!!
_

t
G(x, ct) +
1
c
H(x, ct)
_
=
=
1
(n 2)!!
_
1
c
G
r
(x, ct) +
1
c
H(x, ct)
_
.
Dalle ultime due delle (4.41) e dal lemma 4.5.1(iii) ricaviamo inne
u(x, t) =
1
(n 2)!!
_
1
c

t
1
c
2k2
_
1
t

t
_
k1
[(ct)
2k1
(x, ct)] +
+
1
c
2k1
_
1
t

t
_
k1
[(ct)
2k1
(x, ct)]
_
=
=
1
(n 2)!!
_

t
_
1
t

t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
+
+
_
1
t

t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
_
.
Questa `e la formula (4.40). Si noti che per n = 3 essa si riduce alla (4.30).
Resta da provare che la funzione (4.40) `e davvero una soluzione del problema
(4.24). La verica delle condizioni iniziali si fa senza fatica, applicando il
lemma 4.5.1(ii). Per lequazione dierenziale, come gi`a fatto nel caso n = 3,
proveremo pi` u in generale che se C
n+1
2
(R
n
) allora la funzione
v(x, t) =
_
1
t

t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
169
`e soluzione dellequazione delle onde, e che, di conseguenza, se C
n+3
2
(R
n
)
allora anche v
t
risolve tale equazione.
In eetti si ha dal lemma 4.5.1(i)
v
tt
=

2
t
2
_
_
1
t

t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
_
=
=
_
_
1
t

t
_n1
2
_
t
n1

t
_
B(x,ct)
(y) d
y
_
_
.
Daltronde
t
n1

t
_
B(x,ct)
(y) d
y
= t
n1

t
1

n
_
B(0,1)
(x +ctz) d
z
=
=
c t
n1

n
_
B(0,1)
(x +ctz) z d
z
=
=
1
c
n2

n
_
B(x,ct)
(y)
y x
ct
d
y
=
=
1
c
n2

n
_
B(x,ct)

(y) d
y
=
1
c
n2

n
_
B(x,ct)
(y) dy =
=
c
2
t
n
n
_
B(x,ct)
(y) dy.
Se ne deduce
v
tt
=
_
1
t

t
_n1
2
_
c
2
t
n
n
_
B(x,ct)
(y) dy
_
=
=
_
1
t

t
_n1
2
_
1
c
n2

n
_
B(x,ct)
(y) dy
_
=
=
1
c
n2

n
_
1
t

t
_n3
2
_
1
t

t
_
B(x,ct)
(y) dy
_
=
=
1
c
n2

n
_
1
t

t
_n3
2
_
c
t
_
B(x,ct)
(y) dy
_
=
= c
2
_
1
t

t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
=
170
= c
2

_
_
1
t

t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
_
= c
2
v.
Si noti che, avendo supposto C
n+1
2
(R
n
), risulta v
tt
, v C
2
(R
n
). Inoltre
dalla (4.40) si ottiene facilmente che per ogni T > 0 vi `e dipendenza continua
dai dati nel senso seguente:
[u(x, t)[ C
T
_
_
n1
2

h=0
|
h
|

+
n3
2

h=0
|
h
|

_
_
(x, t) R
n
[0, T].
Ci` o conclude la dimostrazione del teorema 4.5.2.
Passiamo ora al teorema di esistenza per il problema di Cauchy in R
n
[0, [
nel caso di n pari.
Teorema 4.5.3 Sia n = 2k e sia u C
k+1
(R
n
[0, [) soluzione del
problema di Cauchy (4.24). Allora u `e data dalla formula
u(x, t) =
c
n!!
_

t
_
1
t

t
_n2
2
_
t
n
_
B(x,ct)
(y)
_
c
2
t
2
[y x[
2
dy
_
+
+
_
1
t

t
_n2
2
_
t
n
_
B(x,ct)
(y)
_
c
2
t
2
[y x[
2
dy
__
.
(4.44)
Se, in pi` u, C
n+4
2
(R
n
) e C
n+2
2
(R
n
), allora il problema (4.24) `e ben
posto e la sua unica soluzione `e la funzione (4.40), la quale appartiene a
C
2
(R
n
[0, [).
Dimostrazione Come nel caso bi-dimensionale, si fa uso del metodo di
discesa. Per x R
n+1
, si scrive x = (x

, z) con x

R
n
, z R, e si
introducono le funzioni
u(x, t) = u(x

, t), (x) = (x

), (x) = (x

).
La funzione u risolve il problema di Cauchy
_

_
u
tt
c
2
u = 0 in R
n+1
[0, [,
u(x, 0) = (x), x R
n+1
,
u
t
(x, 0) = (x), x R
n+1
,
(4.45)
171
e quindi `e data dalla formula (4.40) con n + 1 al posto di n:
u(x, t) =
1
(n 1)!!
_

t
_
1
t

t
_n2
2
_
t
n1
_
B(x,ct)
(y) d
y
_
+
+
_
1
t

t
_n2
2
_
t
n1
_
B(x,ct)
(y) d
y
_
_
.
(4.46)
Daltra parte, posto (y

) =
_
c
2
t
2
[y

[
2
, si ha
_
B(x,ct)
(y) d
y
=
2

n+1
c
n
t
n
_
B(x

,ct)
(y

)
_
1 +[(y

)[
2
dy

=
=
2

n+1
c
n1
t
n1
_
B(x

,ct)
(y

)
_
c
2
t
2
[y

[
2
dy

=
=
2ct
n
n
n+1
_
B(x

,ct)
(y

)
_
c
2
t
2
[y

[
2
dy

,
e analogamente
_
B(x,ct)
(y) d
y
=
2ct
n
n
n+1
_
B(x

,ct)
(y

)
_
c
2
t
2
[y

[
2
dy

.
Se ne deduce
u(x

, t) = u(x, t) =
2c
n
(n 1)!! n
n+1

t
_
1
t

t
_n2
2
_
2ct
n
n
n+1
_
B(x

,ct)
(y

)
_
c
2
t
2
[y

[
2
dy

_
+
+
_
1
t

t
_n2
2
_
2ct
n
n
n+1
_
B(x

,ct)
(y

)
_
c
2
t
2
[y

[
2
dy

__
.
A parte le notazioni e la costante moltiplicativa che compare allinizio, questa
formula coincide con la (4.44). Per precisare la costante, osserviamo che il
numero
n
, cio`e la misura (n1)-dimensionale della sfera B(0, 1), coincide
con n
n
, essendo
n
la misura della palla n-dimensionale B(0, 1); inoltre si
prova facilmente per induzione che

n
=

n/2
(
n+2
2
)
.
172
Si deduce allora, ricordando che n `e pari e utilizzando le note propriet`a della
funzione ( e cio`e (p + 1) = p(p), (1) = 1, (
1
2
) =

):
2c
n
(n 1)!! n
n+1
=
2c (
n+3
2
)

(n + 1)!! (
n+2
2
)
=
2c (n + 1)!! 2

n+2
2

(n + 1)!! n!! 2

n
2
=
c
n!!
.
Questo valore `e esattamente quello che compare nella (4.44). Si noti che per
n = 2 la formula (4.44) si riduce alla (4.35).
Quando C
n+4
2
(R
n
) e C
n+2
2
(R
n
), la funzione (4.44) `e soluzione del
problema perche coincide con u, la quale `e soluzione eettiva del problema
(4.45) in virt` u del teorema 4.5.2. Da questo teorema si deduce anche la
dipendenza continua dai dati nel senso seguente:
[u(x, t)[ C
T
_
_
n
2

h=0
|
h
|

+
n2
2

h=0
|
h
|

_
_
(x, t) R
n
[0, T].
Ci` o conclude la dimostrazione del teorema 4.5.3.
4.6 Il problema non omogeneo
Consideriamo ora il problema di Cauchy non omogeneo
_

_
u
tt
c
2
u = f in R
n
[0, [,
u(x, 0) = 0, x R
n
,
u
t
(x, 0) = 0, x R
n
,
(4.47)
ove f `e una funzione continua su R
n
[0, [ che rappresenta una sorgente,
o del rumore. Naturalmente, se sappiamo risolvere questo problema, poi per
sovrapposizione sapremo risolvere il problema con secondo membro f e dati
iniziali e non nulli.
Costruiremo la soluzione di (4.47), che sappiamo gi`a essere unica, seguendo
un metodo generale che va sotto il nome di principio di Duhamel. Si considera
il problema di Cauchy omogeneo ad istante iniziale s 0
_

_
u
tt
c
2
u = 0 in R
n
[s, [,
u(x, s) = 0, x R
n
,
u
t
(x, s) = f(x, s), x R
n
,
(4.48)
173
del quale esiste la soluzione v(x, t; s) in virt` u dei teoremi 4.5.2 e 4.5.3, a patto
di sostituire t con t s nelle formule esplicite (4.40) e (4.44). Poi si denisce
la funzione
u(x, t) =
_
t
0
v(x, t; s) ds (x, t) R
n
[0, [; (4.49)
il principio di Duhamel stabilisce appunto che questa funzione risolve il
problema (4.47).
Teorema 4.6.1 Sia n N
+
e sia f C
[
n
2
]+1
(R
n
[0, [). Allora il proble-
ma (4.47) `e ben posto e la sua unica soluzione `e la funzione (4.49), la quale
appartiene a C
2
(R
n
[0, [).
Dimostrazione Si ha
_
n
2
_
+ 1 =
_
n+1
2
se n `e dispari,
n+2
2
se n `e pari,
cosicche dai teoremi 4.5.2 e 4.5.3 deduciamo che v(, ; s) C
2
(R
n
[s, [).
Di pi` u, dalle formule (4.40) e (4.44), scritte con t s al posto di t, si vede
facilmente che v `e di classe C
2
sullinsieme R
n
(t, s) : 0 s t. Quindi,
in particolare, la denizione di u(x, t) ha senso. Per vericare che u soddisfa
lequazione delle onde, bisogna anzitutto calcolarne la derivata u
t
: la cosa `e
meno banale di quello che sembra, perche la funzione integranda `e denita
solo per s t. Fissato (x, t) con x R
n
e t > 0, si ha per h 0
+
u(x, t +h) u(x, t)
h
=
=
1
h
_
t+h
t
v(x, t +h; s) ds +
_
t
0
v(x, t +h; s) v(x, t; s)
h
ds,
e dunque otteniamo facilmente, in virt` u della continuit`a di v e della condi-
zione iniziale v(x, t; t) = 0,
lim
h0
+
u(x, t +h) u(x, t)
h
=
_
t
0
v
t
(x, t; s) ds. (4.50)
Per fare il limite da sinistra non si pu`o usare la decomposizione precedente,
perche v(x, t + h; s) non `e denita quando h < 0 e s [t + h, t]. Allora
scriviamo
u(x, t +h) u(x, t)
h
=
_
t+h
0
v(x, t +h; s) v(x, t; s)
h
ds+
1
h
_
t+h
t
v(x, t; s) ds;
174
per h 0

il secondo addendo a secondo membro tende evidentemente


a v(x, t; t), ossia a 0, mentre il primo termine del secondo membro si pu`o
ulteriormente decomporre come segue:
_
t+h
0
v(x, t +h; s) v(x, t; s)
h
ds =
_
t+h
0
1
h
_
t+h
t
v
t
(x, ; s) dds =
=
_
t+h
0
1
h
_
t+h
t
[v
t
(x, ; s) v
t
(x, t; s)] dds +
_
t+h
0
v
t
(x, t; s) ds,
e utilizzando la continuit`a di v
t
, chiaramente il secondo membro tende a
_
t
0
v
t
(x, t; s) ds; si conclude perci`o che
u
t
(x, t) =
_
t
0
v
t
(x, t; s) ds (x, t) R
n
[0, [, (4.51)
dato che per t = 0 si ottiene il risultato in modo ancora pi` u semplice.
Con gli stessi ragionamenti, facendo uso della continuit`a di v
t
e v
tt
, si prova
che per ogni (x, t) R
n
[0, [
u
tt
(x, t) = v
t
(x, t; t) +
_
t
0
v
tt
(x, t; s) ds = f(x, t) +
_
t
0
v
tt
(x, t; s) ds.
Per le derivate rispetto alle variabili spaziali non vi `e alcun problema a deri-
vare sotto il segno di integrale, e quindi possiamo dire che la funzione (4.49)
appartiene a C
2
(R
n
[0, [). Inoltre da (4.51) ricaviamo
u
tt
(x, t) = f(x, t) +
_
t
0
v
tt
(x, t; s) ds =
= f(x, t) +c
2
_
t
0
v(x, t; s) ds = f(x, t) +c
2
u(x, t).
Inne `e chiaro che u(x, 0) = u
t
(x, 0) = 0. La tesi `e provata.
Esempio 4.6.2 Scriviamo esplicitamente la soluzione (4.49) nel caso n = 3.
Si ha dalla formula (4.30) con t s al posto di t e tenendo conto che = 0
e = f(, s),
v(x, t; s) =
t s
4
_
B(0,1)
f(x +c(t s)z, s) d
z
.
175
Quindi
u(x, t) =
_
t
0
t s
4
_
B(0,1)
f(x +c(t s)z, s) d
z
ds =
=
_
t
0

4
_
B(0,1)
f(x +cz, t ) d
z
d =
=
_
t
0

4
_
B(x,c)
1
c
2

2
f(y, t ) d
y
d =
=
_
ct
0
_
B(x,)
1
4c
2

f
_
y, t

c
_
d
y
d =
=
1
4c
2
_
B(x,ct)
f(y, t [x y[/c)
[x y[
dy.
Questa soluzione si chiama potenziale ritardato. Possiamo chiarire il motivo
di tale denominazione come segue. Il valore di u in un punto (x
0
, t
0
) dipende
solo dai valori di f nei punti del cono (x, t) : [x x
0
[ = c(t
0
t): ci`o segue
dallespressione sopra scritta, valutata in x = x
0
e t = t
0
, in cui f `e calcolata
in y = x
0
+ c(t
0
s)z, t = s, e si ha appunto [y x
0
[ = c(t
0
s). Quindi
leetto di una perturbazione di f avvenuta nel punto x allistante t viene
avvertita in x
0
solo nellistante t
0
= t+
|xx
0
|
c
; cio`e leetto della perturbazione
`e ritardato del tempo occorrente a percorrere la distanza [xx
0
[ con velocit`a
c.
Esempio 4.6.3 Consideriamo una sorgente concentrata in una piccola palla
di centro lorigine di R
3
: ci`o signica prendere in (4.47) un secondo membro
della forma
f

(x, t) =
1

3
f
_
x

, t
_
,
ove f `e una funzione continua nulla fuori dal cilindro (x, t) : [x[ < 1 e tale
che
_
B(0,1)
f(x, t) dx = (t), con C
2
([0, [) ssata. Quindi, quanto pi` u
`e piccolo, tanto pi` u la sorgente f

`e concentrata e intensa, dal momento che


_
B(0,)
f

(x, t) dx =
_
B(0,1)
f(x, t) dx = (t) > 0.
La corrispondente soluzione di (4.47) `e
u

(x, t) =
1
4c
2
_
B(x,ct)
f

(y, t [x y[/c)
[x y[
dy.
176
Vediamo cosa succede quando 0
+
: quando [x[ > ct si ha denitivamente
B(0, ) B(x, ct) = , cosicche u

(x, t) 0, mentre quando [x[ < ct risulta


denitivamente B(0, ) B(x, ct), e pertanto, per convergenza dominata,
lim
0
+
u

(x, t) = lim
0
+
1
4c
2
_
B(0,)
f

(y, t [x y[/c)
[x y[
dy =
= lim
0
+
1
4c
2
_
B(0,1)
f(z, t [x z[/c)
[x z[
dz =
1
4c
2
(t [x[/c)
[x[
.
La funzione
u(x, t) =
_
_
_
1
4c
2
(t [x[/c)
[x[
se [x[ < ct,
0 se [x[ > ct,
(4.52)
`e singolare per x = 0 e discontinua quando [x[ = ct; tuttavia essa risolve
lequazione delle onde in (R
3
]0, [) (x, t) : [x[ = ct. Ci`o `e evidente
quando [x[ > ct; se invece [x[ < ct si tratta di una verica un po laboriosa
ma non dicile. La funzione (4.52) rappresenta unonda sferica, generata da
una sorgente puntuale posta nellorigine, che si propaga nello spazio (proble-
ma di radiazione). Se in particolare (t) = 0 fuori da un intorno di t = 0, si
pu` o vericare che ad un dato istante t la funzione u `e diversa da 0 soltanto in
un intorno della supercie sferica B(0, ct): questa `e unaltra formulazione
del principio di Huygens.
Si pu`o comprendere allora per quale ragione il principio di Huygens non fun-
ziona nel caso di due variabili spaziali: la soluzione si ottiene col metodo di
discesa, e dunque il problema di radiazione in R
2
[0, [ corrisponde ad un
problema in R
3
[0, [ in cui `e presente una linea di sorgenti sullasse z.
Quindi un osservatore, posto a distanza dallorigine nel piano xy, ricever`a
allistante /c il segnale irradiato al tempo t = 0 dalla sorgente situata nel-
lorigine; per`o, negli istanti successivi, perverranno allosservatore i segnali
irradiati, sempre al tempo t = 0, da punti situati lungo lasse z alle quote
=
_
c
2

2
. Questo spiega perche il segnale sia percepito in tutti gli
istanti /c.
Concludiamo il nostro studio dellequazione delle onde osservando che natu-
ralmente esso `e tuttaltro che esaurito. La teoria delle equazioni iperboliche
presenta al contrario enormi sviluppi in svariatissime direzioni: equazioni
non lineari, sistemi iperbolici, leggi di conservazione, equazioni di Hamilton-
Jacobi, soluzioni viscosit`a, eccetera. Per una introduzione a questi importanti
177
settori di ricerca si pu`o consultare [2]. Noi ci limiteremo, nel paragrafo che
segue, allanalisi di un metodo classico, dovuto a Riemann, per lo studio di
equazioni iperboliche lineari in R
2
a coecienti variabili.
4.7 Il metodo di Riemann
Consideriamo unequazione iperbolica lineare in due variabili:
a(x, y)u
xx
+ 2b(x, y)u
xy
+c(x, y)u
yy
+
+d(x, y)u
x
+e(x, y)u
y
+g(x, y)u = h(x, y), (x, y) D,
(4.53)
dove a, b, c, d, e, g, h sono funzioni regolari sullaperto connesso D R
2
. La
condizione di iperbolicit`a `e la seguente:
b(x, y)
2
a(x, y)c(x, y) > 0 (x, y) D. (4.54)
Essa assicura lesistenza di due distinte famiglie di caratteristiche in ogni
punto di D: infatti, detta (x, y) = (
x
(x, y),
y
(x, y)) la normale ad una
curva regolare C D, la condizione che C sia una linea caratteristica si
esprime richiedendo che in ogni punto (x, y) si abbia
a
2
x
+ 2b
x

y
+c
2
y
= 0,
ovvero, supposto ad esempio
y
,= 0,
a
_

y
_
2
+ 2b

x

y
+c = 0.
La condizione (4.54) equivale a dire che questa equazione ha per ogni (x, y)
due soluzioni reali distinte, il che fornisce due diverse direzioni per la normale
alla curva in (x, y). Quindi per ogni punto di D passano due curve caratte-
ristiche.
Se una curva C `e descritta dallequazione F(x, y) = 0, allora =
F
|F|
; quindi
C `e caratteristica se e solo se
aF
2
x
+ 2bF
x
F
y
+cF
2
y
= 0 (x, y) C. (4.55)
Se in particolare C `e cartesiana, allora F(x, y) = y k(x), con k di classe
C
1
, e la condizione (4.55) diventa
a(k

)
2
2bk

+c = 0, (4.56)
178
ossia
k

(x) =
b(x, k(x))
_
b(x, k(x))
2
a(x, k(x))c(x, k(x))
a(x, k(x))
.
Queste due equazioni dierenziali avranno due famiglie di soluzioni,
y =
1
(x, ), y =
2
(x, ), (4.57)
ove e sono i valori attribuiti alle singole curve delle famiglie in corri-
spondenza di un ssato x
0
. Se non ci si allontana troppo dai punti (x
0
, ) e
(x
0
, ), le derivate (
1
)

e (
2
)

saranno non nulle, e quindi in (4.57) potremo


ricavare e in funzione di (x, y):
=
1
(x, y), =
2
(x, y). (4.58)
In particolare
(
1
)
x
=
(
1
)
x
(
1
)

, (
1
)
y
=
1
(
1
)

, (
2
)
x
=
(
2
)
x
(
2
)

, (
2
)
y
=
1
(
2
)

,
cosicche

1
(x, y) ,= 0,
2
(x, y) ,= 0. (4.59)
Poiche
1
(, ) e
2
(, ) soddisfano la (4.56), si riconosce subito che
1
e
2
vericano la (4.55).
Il problema di Cauchy per lequazione (4.53) consiste nel ssare i valori di
u e
u

lungo una curva non caratteristica. Lo studio risulta pi` u semplice


se dapprima riduciamo lequazione in forma normale: a questo scopo con-
viene utilizzare proprio il cambiamento di variabili (4.58). In eetti, con
facili ma noiosi calcoli, la sostituzione u(x, y) = v(
1
(x, y),
2
(x, y)) porta
allequazione
2v

[a(
1
)
x
(
2
)
x
+b((
1
)
x
(
2
)
y
+ (
1
)
y
(
2
)
x
) +c(
1
)
y
(
2
)
y
]+
+v

[a(
1
)
xx
+ 2b(
1
)
xy
+c(
1
)
yy
+d(
1
)
x
+e(
1
)
y
]+
+v

[a(
2
)
xx
+ 2b(
2
)
xy
+c(
2
)
yy
+d(
2
)
x
+e(
2
)
y
] +gv = h,
(4.60)
ove i coecienti a, b, c, d, e, g, h sono calcolati in (
1
(x, y),
2
(x, y)). Non `e
dicile per`o vericare che il coeciente che moltiplica v

`e sempre diverso
da 0. Infatti, detta A la matrice
_
a b
b c
_
, dobbiamo far vedere che
(A
1
)
2
,= 0 in D : (4.61)
179
daltronde, poiche
1
verica la (4.55), si ha
(A
1
)
1
= 0 in D, (4.62)
e dunque basta far vedere che per ogni (x, y) D i vettori
1
e
2
sono
linearmente indipendenti. Infatti, ammesso questo fatto, da (4.61) e (4.62)
seguirebbe che il vettore A
1
`e nullo; ma allora, essendo det A ,= 0 in virt` u
di (4.54), dedurremmo
1
= 0, in contraddizione con (4.59). Ma provare
la lineare indipendenza di
1
e
2
`e immediato: se fosse
1
=
2
,
infatti, dedurremmo subito
=
(
2
)

(
1
)

, (
1
)
x
= (
2
)
x
,
mentre invece, per denizione,
1
e
2
soddisfano
(
1
)
x
=
b +

b
2
ac
a
, (
2
)
x
=
b

b
2
ac
a
.
In conclusione, in (4.60) possiamo dividere per il coeciente di v

, ottenendo
unequazione della forma
v

+(, )v

+(, )v

+(, )v = f(, ),
le cui caratteristiche sono le rette = m e = n, con m, n costanti. Per co-
modit`a, riscriviamo questa equazione nelle incognite x, y; il nostro problema
di Cauchy sar`a dunque il seguente:
_
_
_
v
xy
+v
x
+v
y
+v = f in D,
v,
v

assegnate su C,
(4.63)
ove , , , f sono funzioni regolari denite su D, e C D `e il graco di una
funzione strettamente monotona.
Prima di arontare questo problema col metodo di Riemann `e necessaria una
parentesi sugli operatori aggiunti formali.
Denizione 4.7.1 Sia L un operatore dierenziale denito su un aperto
limitato D R
n
, della forma
L[u] =
n

i,j=1
a
ij
(x)D
i
D
j
u +
n

i=1
b
i
(x)D
i
u +c(x)u,
180
con a
ij
C
2
(D), b
i
C
1
(D) e c C(D). L aggiunto formale di L `e
loperatore L

cos` denito:
L

[v] =
n

i,j=1
D
i
D
j
[a
ij
(x)v]
n

i=1
D
i
[b
i
(x)v] +c(x)v.
Osservazione 4.7.2 Fra un operatore dierenziale denito su D e il suo
aggiunto formale intercorre la seguente relazione integrale:
_
D
(L[u]v uL

[v]) dx =
_
D
_
(b )uv +
u

A
v u
v

_
d, (4.64)
ove si `e posto
u

A
(x) =
n

i,j=1
a
ij
(x)D
j
u(x)
i
(x),
v

(x) =
n

i,j=1
D
i
[a
ij
(x)v(x)]
j
(x).
Questa relazione si dimostra facilmente attraverso la formula di Green.
Nel caso specico delloperatore dierenziale
L[u] = u
xy
+(x, y)u
x
+(x, y)u
y
+(x, y)u, (4.65)
risulta ovviamente
L

[v] = v
xy
(v)
x
(v)
y
+v,
e si ha in particolare
L[u]v uL

[v] = u
xy
v v
xy
u +u
x
v + (v)
x
u +u
y
v + (v)
y
u =
=

x
(uv v
y
u) +

y
(uv +u
x
v);
ovvero, sommando e sottraendo la quantit`a
1
2
(uv)
xy
,
L[u]v uL

[v] =

x
_
1
2
[u
y
v v
y
u] +uv
_
+

y
_
1
2
[u
x
v v
x
u] +uv
_
.
Ne segue che per loperatore (4.65) la relazione (4.64) assume la forma
_
D
(L[u]v uL

[v]) dx =
_
D
__
1
2
[u
y
v v
y
u] +uv
_

x
+
+
_
1
2
[u
x
v v
x
u] +uv
_

y
_
ds.
(4.66)
181
Questa formula sar`a il nostro punto di partenza per calcolare la soluzione u
del problema (4.63) in un generico punto P = (, ) D.
Anzitutto osserviamo che la curva C su cui sono assegnati i dati iniziali `e
il graco di una funzione strettamente monotona, ad esempio strettamente
crescente. Se P D e P `e non troppo lontano da C, le due caratteristiche
uscenti da P, cio`e x = e y = , incontrano la curva C in due punti (e due
soli) P
1
= (,

) e P
2
= (

, ). Ammetteremo, per esempio, che P si trovi


al di sopra di C, cosicche risulta <

e >

; quando P invece sta al


di sotto di C, si trova >

e <

. Naturalmente se, al contrario, C


fosse strettamente decrescente, otterremmo, a seconda di come `e situato P,
due altre coppie di disuguaglianze, stavolta concordi.
Consideriamo la regione
P
delimitata dai segmenti
1
= P
1
P,
2
= P
2
P
e dallarco
P
di C di estremi P
1
e P
2
. Applichiamo la relazione (4.66) alla
regione
P
, con una generica v C
1
(D) e con la nostra ipotetica soluzione
u: poiche su
1
la normale `e = (1, 0), mentre su
2
`e = (0, 1), si ha
_

P
(L[u]v uL

[v]) dxdy =
=
_

P
__
1
2
[u
y
v v
y
u] +uv
_

x
+
_
1
2
[u
x
v v
x
u] +uv
_

y
_
ds

1
_
1
2
[u
y
v v
y
u] +uv
_
ds +
_

2
_
1
2
[u
x
v v
x
u] +uv
_
ds.
(4.67)
Calcoliamo gli ultimi due integrali di linea. Per quanto riguarda quello su

1
, si ha
_

1
_
1
2
[u
y
v v
y
u] +uv
_
ds =
=
_

_
1
2
[u
y
(, y)v(, y) v
y
(, y)u(, y)] +(, y)u(, y)v(, y)
_
dy =
=
1
2
[u(P)v(P) u(P
1
)v(P
1
)]
_

u(, y)[v
y
(, y) (, y)v(, y)] dy,
mentre per lintegrale su
2
risulta
_

2
_
1
2
[u
x
v v
x
u] +uv
_
ds =
182
=
_

_
1
2
[u
x
(x, )v(x, ) v
x
(x, )u(x, )] +(x, )u(x, )v(x, )
_
dx =
=
1
2
[u(P
2
)v(P
2
) u(P)v(P)]
_

u(x, )[v
x
(x, ) (x, )v(x, )] dx.
Sostituendo in (4.67), e ricordando che L[u] = f, ricaviamo lespressione
_

P
(fv uL

[v]) dxdy =
=
_

P
__
1
2
[u
y
v v
y
u] +uv
_

x
+
_
1
2
[u
x
v v
x
u] +uv
_

y
_
ds
u(P)v(P) +
1
2
[u(P
2
)v(P
2
) +u(P
1
)v(P
1
)] +
+
_

u(, y)[v
y
(, y) (, y)v(, y)] dy

u(x, )[v
x
(x, ) (x, )v(x, )] dx.
A questo punto notiamo che lintegrale su
P
`e noto, perche coinvolge i valori
di u e delle sue derivate su C, nonche quelli di v. Possiamo ora scegliere la
funzione v, in modo da semplicare il pi` u possibile gli integrali. Ci piacerebbe
che v vericasse
_

_
L

[v] = v
xy
(v)
x
(v)
y
+v = 0 in
P
,
v
y
= v su
1
,
v
x
= v su
2
,
v(P) = 1,
(4.68)
perche in tal caso lespressione precedente si semplicherebbe nel modo se-
guente:
_

P
vf dxdy =
=
_

P
__
1
2
[u
y
v v
y
u] +uv
_

x
+
_
1
2
[u
x
v v
x
u] +uv
_

y
_
ds
u(P) +
1
2
[u(P
2
)v(P
2
) +u(P
1
)v(P
1
)],
183
ossia
u(P) =
1
2
[u(P
2
)v(P
2
) +u(P
1
)v(P
1
)]
_

P
vf dxdy+
+
_

P
__
1
2
[u
y
v v
y
u] +uv
_

x
+
_
1
2
[u
x
v v
x
u] +uv
_

y
_
ds.
(4.69)
Se riusciamo a determinare v attraverso il problema (4.68), che `e detto proble-
ma di Goursat, allora la formula (4.69) `e una rappresentazione della soluzione
del problema di Cauchy (4.63) in termini dei suoi dati sulla curva C, e co-
stituisce pertanto il punto di partenza per provare lesistenza della soluzione
stessa. Se la funzione v esiste, essa si chiama funzione di Riemann relativa
ai dati attribuiti ad u lungo C. Si noti che tale funzione dipende dal punto
P ssato in partenza, che `e il vertice della regione
P
: quindi la funzione di
Riemann in eetti dipende dalle coordinate (x, y)
P
e anche dalle coor-
dinate (, ) di P; essa deve essere dunque denominata v
P
anziche v.
Occupiamoci allora dellesistenza per nulla scontata della funzione di
Riemann v
P
, cio`e della soluzione del problema (4.68).
Teorema 4.7.3 Sia D R
2
un aperto connesso e sia (, ) un punto di D.
Se , C
1
(D) e C(D), allora per ogni rettangolo R
1
= [,
1
][
1
, ]
D il problema di Goursat
_

_
v
xy
(v)
x
(v)
y
+v = 0 in R
1
,
v
y
(, y) = (, y)v(, y) y [
1
, ],
v
x
(x, ) = (x, )v(x, ) x [,
1
],
v(, ) = 1,
(4.70)
ha ununica soluzione v
P
C
1
(R
1
) con (v
P
)
xy
C(R
1
).
Dimostrazione Trasformeremo il problema (4.70) in unopportuna equa-
zione integrale. Sia R D il rettangolo di vertici P = (, ), Q = (,

),
S = (

), T = (

, ), con S = (

) R
1
. Sia v una soluzione in R
1
del
problema di Goursat: allora applicando la relazione (4.66) con il rettangolo
R in luogo di D e con u 1, tenendo conto che L[u] = , L

[v] = 0 e
u
y
= u
x
= 0, si ha:
_
R
v dxdy =
_
R
__

1
2
v
y
+v
_

x
+
_

1
2
v
x
+v
_

y
_
ds.
184
Il bordo R `e costituito dai quattro segmenti PQ, QS, ST, TP. Su PQ si
ha
x
= 1,
y
= 0 e v
y
= v, per cui lintegrando `e
vy
2
; su QS `e
x
= 0
e
y
= 1, e lintegrando vale
vx
2
v; su ST risulta
x
= 1 e
y
= 0, con
integrando pari a
vy
2
+v; inne su TP troviamo
x
= 0,
y
= 1 e v
x
= v,
da cui lintegrando `e uguale a
vx
2
. In conclusione, ricordando che v(P) = 1,
otteniamo
_
R
v dxdy =

v
y
(, y)
2
dy +
_

_
v
x
(x,

)
2
(x,

)v(x,

)
_
dx +
+
_

v
y
(

, y)
2
+(

, y)v(

, y)
_
dy +
_

v
x
(x, )
2
dx =
=
1
2
[v(P) v(Q)] +
1
2
[v(S) v(Q)]
_

(x,

)v(x,

) dx

1
2
[v(T) v(S)] +
_

, y)v(

, y) dy +
1
2
[v(T) v(P)] =
= 1 +v(S)
_

(x,

)v(x,

) dx +
_

, y)v(

, y) dy,
ovvero
v(

) = 1 +
_

(x, y) v(x, y) dydx+


+
_

(x,

)v(x,

) dx
_

, y)v(

, y) dy.
(4.71)
Questa relazione vale per ogni S = (

) R
1
ed `e soddisfatta da ogni
soluzione v del problema (4.70). Viceversa, `e facile vericare che ogni fun-
zione v C(R
1
), vericante la (4.71), ha derivate prime continue e derivata
seconda mista continua, e soddisfa lequazione dierenziale in (4.70); inoltre
facendo tendere S a P, ossia

, si vericano anche le condizioni


ai limiti.
`
E dunque suciente determinare ununica soluzione v
P
C(R
1
)
dellequazione integrale non lineare (4.71).
Possiamo riscrivere la (4.71) nella forma v = T(v), ove T : C(R
1
) C(R
1
)
`e loperatore
T[v](

) = 1 +
_

v dxdy +
185
+
_

(x,

)v(x,

) dx
_

, y)v(

, y) dy, (

) R
1
.
Proveremo che T `e una contrazione da C(R
1
) in se allorche si munisca lo
spazio C(R
1
) della norma
|v|

= sup
(x,y)R
1
e
(x)(y)
[v(x, y)[ v C(R
1
), (4.72)
ove `e un numero positivo da scegliere opportunamente. Questa `e chiara-
mente una norma su C(R
1
), ed `e equivalente alla norma | |

poiche, come
si verica facilmente,
|v|

|v|

e
(
1
)+(
1
)
|v|

v C(R
1
), > 0.
Si ha allora, per ogni (

) R
1
e per ogni v, w C(R
1
),
e
(

)(

)
[T[v](

) T[w](

)[
||

e
(

x)(y

)
_
e
(x)(y)
[v(x, y) w(x, y)[

dxdy +
+||

e
(

x)(

)
_
e
(x)
[v(x,

) w(x,

)[

dx +
+||

e
(

)(y

)
_
e
(y)
[v(

, y) w(

, y)[

dy

|v w|

[||

+||

+||

] ,
da cui
|T[v] T[w]|

|v w|

[||

+||

+||

] .
Se ne deduce che per sucientemente grande loperatore T `e una contra-
zione nello spazio di Banach C(R
1
) e quindi vi `e ununico punto sso, ossia
vi `e ununica soluzione v
P
dellequazione v = T[v], che equivale alla (4.71).
Ci` o prova il teorema 4.7.3.
Osservazione 4.7.4
`
E importante conoscere come la funzione v
P
dipenda
da P. Questo si pu`o vedere per mezzo dellequazione integrale (4.71): siccome
v
P
ne `e soluzione, si ha
v
P
(

) = 1 +
_

(x, y) v
P
(x, y) dydx+
+
_

(x,

)v
P
(x,

) dx
_

, y)v
P
(

, y) dy;
186
Se noi deriviamo formalmente rispetto a e rispetto a questa equazione,
troviamo che le derivate (v
P
)

e (v
P
)

si ottengono come soluzioni di equazioni


integrali analoghe alla precedente:
(v
P
)

) =
_

(, y) v
P
(, y) dy+
+
_

(x, y) (v
P
)

(x, y) dydx (,

) v
P
(,

)+
+
_

(x,

) (v
P
)

(x,

) dx
_

, y) (v
P
)

, y) dy,
(v
P
)

) =
_

(x, ) v
P
(x, ) dx+
+
_

(x, y) (v
P
)

(x, y) dydx +
_

(x,

) (v
P
)

(x,

) dx
(

, ) v
P
(

, )
_

, y) (v
P
)

, y) dy.
Rispetto alla (4.71), `e cambiato solamente il termine noto, che non `e pi` u 1
ma `e, in entrambi i casi, la somma di due quantit`a note che coinvolgono v
P
,
e . Queste due equazioni integrali si risolvono con il solito punto sso, ed
`e facile provare che le loro soluzioni sono davvero le derivate parziali di v
P
rispetto alle coordinate e di P. In denitiva, la funzione di Riemann v
P
dipende in modo C
1
da P; per giunta, in modo simile si verica che anche
(v
P
)

`e continua.
Avendo costruito la funzione di Riemann, `e facile ora provare lesistenza della
soluzione del problema (4.63).
Corollario 4.7.5 Sia D R
2
un aperto connesso e siano , C
1
(D),
, f C(D). Sia inoltre C = (x, y) : x [a, b], y = (x), ove C
1
[a, b] `e
una funzione strettamente monotona tale che R = [a, b][min , max ] D.
Se C
1
[a, b] e C[a, b], allora il problema di Cauchy
_

_
u
xy
+u
x
+u
y
+u = f in R,
u(x, (x)) = (x), x [a, b],
u

(x, (x)) = (x), x [a, b],


(4.73)
187
ha soluzione unica u, tale che u C
1
(R) e u
xy
C(R).
Dimostrazione Fissato un punto P = (, ) R, sia v
P
la soluzione del
problema di Goursat (4.70). Come sappiamo, se u risolve il problema (4.73)
allora u(P) si rappresenta nella forma (4.69). Si tratta di vericare che, nelle
ipotesi fatte sui dati, la funzione (4.69) `e davvero soluzione del problema
(4.73). Ci`o pu`o essere fatto, con enorme fatica, ma in modo concettualmente
facile. Occorre anzitutto parametrizzare gli insiemi
P
e
P
in funzione delle
coordinate (, ):

P
= (x, y) : x
1
(), (x) y ,

P
= (x, (x)) : x
1
();
dopodiche, osservato che lungo
P
si ha =
_

(x)

1+

(x)
2
,
1

1+

(x)
2
_
, bisogna
esplicitare la funzione (4.69):
u(, ) =
1
2
_
u(
1
(), ) v
P
(
1
(), ) +u(, ()) v
P
(, ())

_

1
()

_

(x)
v
P
(x, y)f(x, y) dydx +
+
_

1
()

__
1
2
[u
y
(x, (x)) v
P
(x, (x)) (v
P
)
y
(x, (x)) u(x, (x))]+
+ (x, (x)) u(x, (x)) v(x, (x))
_

(x)

_
1
2
[u
x
(x, (x)) v
P
(x, (x)) (v
P
)
x
(x, (x)) u(x, (x))] +
+ (x, (x)) u(x, (x)) v
P
(x, (x))
__
dx.
Si deve poi osservare che nel secondo membro la u viene calcolata in punti
di C, nei quali `e u(x, (x)) = (x) e
u

(x, (x)) = (x), il che a sua volta


implica
u
x
+u
y

, u
x

u
y
=
_
1 + (

)
2
,
188
da cui, facilmente,
_

_
u
x
(x, (x)) =
(x)

(x)
_
1 +

(x)
2
+

(x)
1 +

(x)
2
,
u
y
(x, (x)) =
(x)
_
1 +

(x)
2
+

(x)

(x)
1 +

(x)
2
.
Questi valori di u, u
x
e u
y
vanno sostituiti nellespressione di u(, ) sopra
scritta. A questo punto, `e abbastanza agevole rendersi conto che le derivate
u

, u

e u

(le quali, si ricordi, sulla base dellosservazione 4.7.4 coinvolgono


anche le derivate (v
P
)

, (v
P
)

e (v
P
)

) esistono e sono continue; assai pi` u


intricato, noioso e lungo `e controllare, utilizzando le propriet`a della funzione
di Riemann v
P
, che u(, ) risolve lequazione: non riporteremo questa ve-
rica. Inne, le condizioni ai limiti per u e per la sua derivata normale si
vericano facendo tendere P a un generico punto P
0
C e osservando che
di conseguenza anche P
1
e P
2
tendono a P
0
mentre
P
e
P
si riducono a
P
0
. Il calcolo `e facile per la condizione su u, perche gli integrali spariscono
mentre v
P
(P
2
) e v
P
(P
1
) tendono a v
P
0
(P
0
) = 1; pi` u laborioso `e il controllo
della condizione sulla derivata normale. Omettiamo i dettagli.
189
Bibliograa
[1] R. Courant, D. Hilbert, Methods of mathematical physics, vol. II: partial
dierential equations, Wiley, New York 1962.
[2] L. C. Evans, Partial dierential equations, American Mathematical Society,
Providence 1998.
[3] P. E. Garabedian, Partial dierential equations, John Wiley & Sons, New
York 1964.
[4] L. L. Helms, Introduction to potential theory, Wiley-Interscience, New York
1964.
[5] F. John, Partial dierential equations, Springer, Berlin 1971.
[6] O. A. Ladyzhenskaja, V. A. Solonnikov, N. N. Uralceva, Linear and quasi-
linear equations of parabolic type, Amer. Math. Soc., Providence 1968.
[7] A. Lunardi, Analytic semigroups and optimal regularity in parabolic equa-
tions, Birkhauser, Basel 1995.
[8] V. P. Michajlov, Equazioni dierenziali alle derivate parziali, Mir, Mosca
1984.
[9] A. N: Tichonov, A.A. Samarskij, Equazioni della sica matematica, Mir,
Mosca 1981.
[10] H. F Weinberger, A rst course in partial dierential equations, Blaisdell
Publishing Company, New York 1965.
190

Potrebbero piacerti anche