Analisi

Appunti di Analisi matematica
Paolo Acquistapace
2 aprile 2009
Indice
1 Numeri 1
1.1 Alfabeto greco . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Insiemi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.3 Funzioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4 Il sistema dei numeri reali . . . . . . . . . . . . . . . . . . . . 9
1.5 Assioma di completezza . . . . . . . . . . . . . . . . . . . . . 13
1.6 Numeri naturali, interi, razionali . . . . . . . . . . . . . . . . . 21
1.7 La formula del binomio . . . . . . . . . . . . . . . . . . . . . . 32
1.8 Radici n-sime . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.9 Valore assoluto . . . . . . . . . . . . . . . . . . . . . . . . . . 43
1.10 La funzione esponenziale . . . . . . . . . . . . . . . . . . . . . 47
1.11 Geometria nel piano . . . . . . . . . . . . . . . . . . . . . . . 60
1.12 Numeri complessi . . . . . . . . . . . . . . . . . . . . . . . . . 80
2 Successioni 112
2.1 Limiti di successioni . . . . . . . . . . . . . . . . . . . . . . . 112
2.2 Serie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
2.3 Successioni monotone . . . . . . . . . . . . . . . . . . . . . . . 129
2.4 Criteri di convergenza per le serie . . . . . . . . . . . . . . . . 137
2.5 Assoluta convergenza . . . . . . . . . . . . . . . . . . . . . . . 146
2.6 Successioni di Cauchy . . . . . . . . . . . . . . . . . . . . . . . 153
2.7 Serie di potenze . . . . . . . . . . . . . . . . . . . . . . . . . . 155
2.8 Riordinamento dei termini di una serie . . . . . . . . . . . . . 171
2.9 Moltiplicazione di serie . . . . . . . . . . . . . . . . . . . . . . 180
3 Funzioni 185
3.1 Spazi euclidei R
m
e C
m
. . . . . . . . . . . . . . . . . . . . . . 185
3.2 Funzioni reali di m variabili . . . . . . . . . . . . . . . . . . . 200
i
3.3 Limiti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
3.4 Proprietà delle funzioni continue . . . . . . . . . . . . . . . . . 224
3.5 Asintoti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 237
4 Calcolo dierenziale 239
4.1 La derivata . . . . . . . . . . . . . . . . . . . . . . . . . . . . 239
4.2 Derivate parziali . . . . . . . . . . . . . . . . . . . . . . . . . . 255
4.3 Proprietà delle funzioni derivabili . . . . . . . . . . . . . . . . 266
4.4 Condizioni sucienti per la dierenziabilità . . . . . . . . . . 275
4.5 Dierenziabilità di funzioni composte . . . . . . . . . . . . . . 278
4.6 Derivate successive . . . . . . . . . . . . . . . . . . . . . . . . 282
4.7 Confronto di innitesimi e inniti . . . . . . . . . . . . . . . . 288
4.8 Formula di Taylor . . . . . . . . . . . . . . . . . . . . . . . . . 297
4.9 Massimi e minimi relativi per funzioni di una variabile . . . . 310
4.10 Forme quadratiche . . . . . . . . . . . . . . . . . . . . . . . . 313
4.11 Massimi e minimi relativi per funzioni di pi` u variabili . . . . . 319
4.12 Convessità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
5 Calcolo integrale 334
5.1 Lintegrale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
5.2 Proprietà dellintegrale . . . . . . . . . . . . . . . . . . . . . . 343
5.3 Alcune classi di funzioni integrabili . . . . . . . . . . . . . . . 349
5.4 Il teorema fondamentale del calcolo integrale . . . . . . . . . . 355
5.5 Metodi di integrazione . . . . . . . . . . . . . . . . . . . . . . 360
5.6 Formula di Stirling . . . . . . . . . . . . . . . . . . . . . . . . 370
5.7 Integrali impropri . . . . . . . . . . . . . . . . . . . . . . . . . 374
6 Equazioni dierenziali 385
6.1 Generalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385
6.2 Alcuni tipi di equazioni del primo ordine . . . . . . . . . . . . 399
6.3 Equazioni lineari del secondo ordine . . . . . . . . . . . . . . . 406
Indice analitico 413
ii
Capitolo 1
Numeri
1.1 Alfabeto greco
Un ingrediente indispensabile per lo studente che aronta un corso di analisi
matematica è la conoscenza dellalfabeto greco, di cui verranno usate a vario
titolo gran parte delle lettere (minuscole e maiuscole). Eccolo:
alfa A iota I ro P
beta B cappa K sigma
gamma lambda tau T
delta mu (mi) M iupsilon Y
epsilon E nu (ni) N
zeta Z csi chi X
eta H omicron o O psi
teta pi omega
Esercizi 1.1
1. Scrivere il proprio nome e cognome in lettere greche.
1.2 Insiemi
Il concetto di insieme è un concetto primitivo, quindi non si può denire se
non ricorrendo a circoli viziosi; comunque in modo vago ma ecace possiamo
dire che un insieme è una collezione di elementi. Indicheremo gli insiemi con
lettere maiuscole A, B, . . . e gli elementi di un insieme con lettere minuscole
1
a, b, x, t, . . . .
Per evitare paradossi logici, è bene parlare di insiemi solo dopo aver ssa-
to un insieme universo X, che è lambiente dentro al quale lavoriamo, e
considerarne i vari sottoinsiemi(cioè gli insiemi A contenuti in X). La scelta
dellambiente X va fatta di volta in volta e sarà comunque chiara dal conte-
sto.
Come si descrive un insieme? Se esso è nito (ossia ha un numero nito di
elementi), e questi elementi sono pochi, ciò può avvenire elencandoli; ma
se linsieme ha molti elementi, o ne ha addirittura una quantità innita (si
dice allora che linsieme è innito), esso si può descrivere individuando una
proprietà p(x) che gli elementi x delluniverso X possono possedere o no, e
che caratterizza linsieme che interessa. Per esempio, linsieme
A = 1, 2, 3, 4, 6, 12
è altrettanto bene descritto dalla proprietà
p(x) = x è divisore di 12,
la quale, allinterno dei numeri naturali (che in questo caso costituiscono il
nostro universo), contraddistingue esattamente gli elementi dellinsieme A.
Introduciamo alcuni simboli che useremo costantemente nel seguito.
x A signica: x appartiene ad A, ovvero x è un elemento di A.
A B, B A signicano: A è contenuto in B, ovvero B contiene
A, ovvero ogni elemento di A è anche elemento di B, o anche A è
sottoinsieme di B.
A = B signica: A coincide con B, ovvero A e B hanno gli stessi
elementi, ovvero A B e B A.
A B, B A signicano: A è strettamente contenuto in B, ovvero A
è sottoinsieme proprio di B, ovvero ogni elemento di A è elemento di
B ma esiste almeno un elemento di B che non è elemento di A, ovvero
A B ma A non coincide con B.
Per negare le proprietà precedenti si mette una sbarretta sul simbolo corri-
spondente: ad esempio, x / A signica che x non appartiene allinsieme A,
A ,= B signica che gli insiemi A e B non hanno gli stessi elementi (e dunque
2
vi è almeno un elemento che sta in A ma non in B, oppure che sta in B ma
non in A), eccetera.
Sia X un insieme e siano A, B sottoinsiemi di X. Deniamo:
AB = unione di A e B, ossia linsieme degli x X che appartengono
ad A oppure a B (oppure ad entrambi).
A B = intersezione di A e B, ossia linsieme degli x X che
appartengono sia ad A che a B.
A B = dierenza fra A e B, ossia linsieme degli x X che apparten-
gono ad A, ma non a B.
A
c
= X A = complementare di A in X, ossia linsieme degli x X
che non appartengono ad A.
= insieme vuoto, ossia lunico insieme privo di elementi.
Si noti che A B = B A, A B =
BA, ma in generale AB ,= BA. Se
A B = , gli insiemi A e B si dicono
disgiunti.
Vi sono altre importanti proprietà degli insiemi e delle operazioni su di es-
si, di cui non ci occupiamo qui: ne parleremo di volta in volta quando ci
occorreranno. Introduciamo ora alcuni insiemi importanti:
N = insieme dei numeri naturali = 0, 1, 2, 3, 4, 5, 6, 7, . . ..
N
+
= insieme dei numeri naturali diversi da 0 = 1, 2, 3, 4, 5, 6, 7, . . ..
3
Z = insieme dei numeri interi = 0, 1, 1, 2, 2, 3, 3, 4, 4, . . ..
Q = insieme dei numeri razionali, cioè di tutte le frazioni
p
q
con p Z,
q N
+
.
R = insieme dei numeri reali: su questo insieme ci soermeremo a
lungo; esso contiene Q, ma anche numeri rrazionali come , e,
2,
3.
C = insieme dei numeri complessi, cioè i numeri della forma a + ib,
con a, b R; la quantità i si chiama unità immaginaria e verica
luguaglianza i
2
= 1: essa non è un numero reale. Anche su questo
insieme avremo molto da dire.
Notiamo che valgono le inclusioni
N
+
N Z Q R C.
Nelle nostre formule useremo alcuni altri simboli che sono delle vere e proprie
abbreviazioni stenograche, e che andiamo ad elencare.
Il simbolo signica per ogni: dunque dire che x B x A
equivale a dichiarare che ogni elemento di A sta anche in B, cioè che
A B.
Il simbolo signica esiste almeno un: dunque aermare che x A
tale che x B vuol dire che cè almeno un elemento di A che sta anche
in B, ossia che A B non è vuoto. i due simboli , exists vengono
detti quanticatori esistenziali.
Il simbolo ! signica esiste un unico: dunque la frase ! x A
tale che x B indica che cè uno ed un solo elemento di A che sta in
B, ossia che A B è costituito da un solo elemento.
Il simbolo : signica tale che: dunque laermazione ! x A : x
B ha lo stesso signicato dellenunciato del punto precedente.
Il simbolo = signica implica: quindi la frase x A = x B
vuol dire che se x A allora x B, ossia A B.
Il simbolo signica se e solo se: si tratta della doppia implica-
zione, la quale ci dice che i due enunciati a confronto sono equivalenti.
Ad esempio la frase x A x B indica che A = B.
4
Nel nostro corso non ci occuperemo di questioni di logica formale e non parle-
remo di predicati, proposizioni, variabili, tabelle di verità, eccetera; cerchere-
mo di ragionare secondo il nostro buon senso, anato (si spera) dalle passate
esperienze scolastiche, rimandando al corso di logica la sistemazione rigorosa
di questi aspetti. Ci limitiamo ad osservare che la pulizia formale è sempre
utile ma non determinante: laermazione di poco sopra x A : x B è
formalmente perfetta ma, se ad esempio
A = n N : n 5, B = n N : n
2
> 25,
essa risulta inesorabilmente falsa.
Come si fa a negare unaermazione della forma x A y B tale che
x = y? Dobbiamo formulare lesatto contrario dellenunciato precedente:
dunque, a lume di naso, ci sarà almeno un x A per il quale, comunque
si scelga y B, sarà sempre x ,= y; ovvero, existsx A tale che y B
risulta x ,= y. Si noti come i quanticatori e si siano scambiati di posto.
Unaltra importante operazione fra due insiemi X, Y è il prodotto cartesiano
X Y : esso è denito come linsieme di tutte le coppie (x, y) con x X e
y Y . Può anche succedere che Y = X, ed in tal caso scriveremo spesso
X
2
in luogo di X X; in questo caso si noti che entrambe le coppie (x, y) e
(y, x) appartengono allinsieme X
2
, e che esse sono diverse luna dallaltra.
Esercizi 1.2
1. Sia A R. Scrivere la negazione delle seguenti aermazioni:
(i) y R : x < y x A,
(ii) x A y A : x < y,
(iii) y, z R : y < x < z x A,
(iv) x A y, z A : y < x < z.
5
2. Elencare gli elementi di ciascuno dei seguenti insiemi:
A =
_
k Z :
1
k
Z
_
;
B = k Z : h Z : k = 6h;
C = n N : m N : m 10, n = 6m;
D =
_
n N :
1
n+2
N
_
;
E = n N : m N : n = 3
m
;
F = n N : n +m > 25 m N.
3. Dimostrare che
_
x R :
x
2
5x + 6
x
2
3x + 2
> 0
_
=] , 1[[3, +[.
4. Sono vere le seguenti aermazioni?
(i) 1 x R : x
2
< 1, (ii) 0 x R : x
2
< 1,
(iii) 1 x R : x
2
= 1, (iv) 2 x R : x
2
4.
5. Disegnare i seguenti sottoinsiemi di R
2
:
A = (x, y) R
2
: y = 2x,
B = (y, x) R
2
: y = 2x,
C = (x, y) R
2
: x = 2y.
6. Siano A, B, C, D sottoinsiemi di un insieme X. Provare le seguenti
relazioni (formule di de Morgan:
(i) (A B) (C D) = (A C) (B D),
(ii) (A B) (C D) = (A C) (B D),
(iii) (A B) (C D) (A C) (B D),
(iv) (A B) C = (A C) (B C),
(v) (A B) C = (A C) (B C).
6
1.3 Funzioni
Uno dei concetti pi` u importanti della matematica, e non solo dellanalisi, è
quello di funzione. Una funzione f è una corrispondenza (di qualunque na-
tura) fra due insiemi X e Y , con lunica regola di associare ad ogni elemento
x di X uno e un solo elemento di Y , che viene indicato con f(x). Si suole
scrivere f : X Y (si legge f da X in Y ) e si dice che f è denita
su X, a valori in Y . Linsieme X è il dominio di f, mentre limmagine, o
codominio, di f è il sottoinsieme f(X) di Y costituito da tutti i punti di Y
che sono immagini mediante f di punti di X, cioè sono della forma f(x)
per qualche x X. Può benissimo capitare che uno stesso y sia immagine
di diversi punti di X, ossia che si abbia y = f(x) = f(x
) per x, x
X e
x ,= x
; quello che non può succedere è che ad un x X vengano associati

due distinti elementi di Y , cioè che risulti f(x) = y e f(x) = y
con y ,= y
.
Esempi di funzioni appaiono dappertutto: a ciascun membro dellinsieme
S degli studenti che sostengono un esame si può associare il relativo voto:
questa è una funzione S N. Ad ogni città dItalia si possono associare le
temperature minima e massima di una data giornata: questa è una funzione
dallinsieme C delle città capoluogo italiane nel prodotto cartesiano Z
2
. Ad
ogni corridore che porta a termine una data corsa ciclistica si può associare
il tempo impiegato, misurato ad esempio in secondi: avremo una funzione a
valori in R (se teniamo conto dei decimi, centesimi, millesimi, eccetera).
Il graco di una funzione f :
X Y è il sottoinsieme del pro-
dotto cartesiano X Y costitui-
to da tutte le coppie della for-
ma (x, f(x)), cioè da tutte e so-
le le coppie (x, y) X Y che
risolvono lequazione y = f(x).
Le funzioni si possono comporre: se f : X Y e g : Y Z sono fun-
zioni, ha senso considerare la funzione composta g f : X Z, denita da
g f(x) = g(f(x)) per ogni x X. Naturalmente, anche la composizione
abbia senso, occorre che il codominio di f sia contenuto nel dominio di g.
Una funzione si dice iniettiva se a punti distinti vengono associate immagini
distinte, ovvero se
f(x) = f(x
) = x = x
.
7
Una funzione si dice surgettiva se si ha f(X) = Y , cioè se ogni y Y è
immagine di almeno un x X.
Una funzione si dice bigettiva, o invertibile, o biunivoca, se è sia iniettiva che
surgettiva: in tal caso, per ogni y Y vi è un unico x X tale che f(x) = y.
In questo caso è denita la funzione inversa f
1
(si legge f alla meno uno);
f
1
è denita su Y , a valori in X, e ad ogni y Y associa quellunico x per
cui f(x) = y. Si dice allora che f denisce una corrispondenza biunivoca fra
gli insiemi X e Y . In particolare, se f è bigettiva si ha f
1
(f(x)) = x per
ogni x X ed anche f(f
1
(y)) = y per ogni y Y : in altre parole, risulta
f
1
f = I
X
, f f
1
= I
Y
, avendo indicato con I
X
e I
Y
le funzioni identità,
denite da I
X
(x) = x per ogni x X e I
Y
(y) = y per ogni y Y .
Osservazione 1.3.1 Se f : X X è una funzione invertibile e f
1
: X
X è la sua funzione inversa, le equazioni y = f(x) e x = f
1
(y) sono equi-
valenti e descrivono entrambe il graco di f. Invece, scambiando fra loro le
variabili x, y (ossia eettuando una simmetria rispetto alla retta y = x nel
piano cartesiano XX), la seconda equazione diventa y = f
1
(x) e descrive
il graco di f
1
, il quale è dunque il simmetrico del graco di f rispetto alla
bisettrice del primo quadrante.
8
Si noti che è sempre possibile supporre che una data funzione f : X Y
sia surgettiva: basta pensarla come funzione da X in f(X). Il problema è
che nei casi concreti è spesso dicile, se non impossibile, caratterizzare il
sottoinsieme f(X) di Y .
Vedremo innumerevoli esempi di funzioni e di graci nel seguito del corso.
Esercizi 1.3
1. Posto f : R R, f(x) = 3x 1, e g : R R, g(t) = t
2
, scrivere
esplicitamente le funzioni composte
g f(x) = g(f(x)), x R, f g(t) = f(g(t)), t R.
2. Quali di queste funzioni a valori in R sono iniettive, quali surgettive e
quali invertibili?
(i) f(x) = 1/x, x R 0; (ii) f(x) = x
3
x, x R;
(iii) f(x) =
1
x
2
+1
, x R; (iv) f(k) = (1)
k
, k Z;
(v) f(s) = s
2
, s R; (vi) f(x) =
_
x
2
se x 0
x
2
se x < 0.
3. Sia f(x) = 2x 1, x R. Tracciare il graco delle seguenti funzioni:
(i) f(x); (ii) f(x);
(iii) maxf(x), f(x); (iv) f(f(x));
(v)
f(x)f(x)
2
; (vi)
f(x)+f(x)
2
;
(vii) minf(x), 0; (viii) maxf(x), 0.
1.4 Il sistema dei numeri reali
Denire in modo rigoroso che cosa siano i numeri reali è un compito tuttaltro
che elementare anche per un matematico di professione: non è il caso quindi
di addentrarsi in questa problematica allinizio di un corso di analisi. Ma
anche senza avere pretese fondazionali, per lavorare coi numeri reali occorre
conoscerne le proprietà, e riettere per un momento sul signicato dei simboli
e delle formule che siamo abituati a manipolare pi` u o meno meccanicamente
n dalle scuole elementari.
Le proprietà dei numeri reali si possono classicare in tre gruppi:
9
(a) proprietà algebriche, riguardanti le operazioni che si possono eseguire tra
numeri reali;
(b) proprietà di ordinamento, relative alla possibilità di confrontare tra loro
i numeri reali per identicarne il maggiore;
(c) proprietà di continuità, pi` u profonde e nascoste, legate allidea che devo-
no esistere abbastanza numeri per rappresentare grandezze che va-
riano con continuità, quali il tempo o la posizione di un punto su una
retta.
Tutte queste proprietà caratterizzano il sistema R dei numeri reali, nel senso
che esse si possono assumere come assiomi che deniscono ed individuano in
modo unico il sistema R. Noi non entreremo in questa questione, limitandoci
pi` u modestamente a mettere in rilievo il fatto che le proprietà (a) e (b) sono
alla base di tutte le regole di calcolo che abbiamo imparato ad usare n
dallinfanzia.
Proprietà algebriche
Nellinsieme R sono denite due operazioni, laddizione e la moltiplicazione,
le quali associano ad ogni coppia a, b di numeri reali la loro somma, che
indichiamo con a+b, e il loro prodotto, che indichiamo con a b od anche con
ab. Valgono le seguenti proprietà:
1. Associatività: a + (b +c) = (a +b) +c, a(bc) = (ab)c per ogni a, b, c R.
2. Commutatività: a +b = b +a, ab = ba per ogni a, b R.
3. Distributività: a(b +c) = ab +ac per ogni a, b, c R.
4. Esistenza degli elementi neutri: esistono (unici) due numeri reali distinti,
che indichiamo con 0 e 1, tali che a + 0 = a, a 1 = a per ogni a R.
5. Esistenza degli opposti: per ogni a R esiste un (unico) b R tale che
a +b = 0; tale numero b si dice opposto di a e si indica con a.
6. Esistenza dei reciproci: per ogni a R 0 esiste un (unico) b R tale
che ab = 1; tale numero b si dice reciproco di a e si indica con
1
a
od
anche con a
1
.
10
Dalle proprietà precedenti seguono facilmente tutte le regole usuali dellalge-
bra elementare, quali:
il fatto che a 0 = 0 per ogni a R;
la semplicazione per laddizione: se a +b = a +c, allora b = c;
la semplicazione per la moltiplicazione: se ab = ac e a ,= 0, allora
b = c;
la denizione di sottrazione: per ogni a, b R esiste un unico c R
tale che a + c = b, e tale numero c, detto dierenza fra b e a, si indica
con b a;
la denizione di divisione: per ogni a, b R con a ,= 0 esiste un unico
c R tale che ac = b, e tale numero c si indica con
b
a
;
la legge di annullamento del prodotto: se ab = 0 allora deve essere a = 0
oppure b = 0 (oppure entrambi).
Provate a dimostrare qualcuno degli enunciati precedenti utilizzando gli as-
siomi 1-6!
Proprietà di ordinamento
Nellinsieme dei numeri reali esiste un sottoinsieme P, i cui elementi sono
detti numeri positivi, dotato delle proprietà seguenti:
7. Se a, b sono numeri positivi, anche a +b e ab sono positivi.
8. Per ogni a R vale una e una sola di queste tre possibilità: a è positivo,
oppure a è positivo, oppure a = 0.
Si noti che, per lassioma 8, il numero reale 0 non può essere positivo. I
numeri diversi da 0 e non positivi si dicono negativi: dunque un numero
reale a è negativo se e solo se a è positivo. Si scrive a > 0 quando a è
positivo, e b > a (o equivalentemente a < b) quando b a è positivo, cioè
b a > 0; in particolare, x < 0 signica x > 0, cioè x negativo. Si scrive
poi a 0 quando a è positivo o uguale a 0, e b a (o equivalentemente
a b) quando b a 0. Si osservi che
a b e a b a = b.
Dagli assiomi 7-8 discendono i seguenti altri fatti (esercizi 1.4.2 e 1.4.3).
11
Il prodotto di due numeri negativi è positivo; in particolare, se x è un
numero reale diverso da 0, il suo quadrato x
2
, che è denito come x x,
è sempre positivo:
x
2
= x x > 0 x R 0.
Il numero 1 è positivo (e quindi N
+
P).
Inoltre si deducono facilmente tutte le usuali regole di calcolo con le disugua-
glianze. Provate a dedurne qualcuna!
Introduciamo adesso alcuni speciali sottoinsiemi di R deniti mediante lor-
dinamento: gli intervalli. Se a, b R ed a b, poniamo:
[a, b] = x R : a x b = intervallo chiuso di estremi a, b;
]a, b[ = x R : a < x < b = intervallo aperto di estremi a, b;
[a, b[ = x R : a x < b = intervallo semiaperto a destra di estremi
a, b;
]a, b] = x R : a < x b = intervallo semiaperto a sinistra di
estremi a, b;
] , b] = x R : x b = semiretta chiusa di secondo estremo b;
] , b[ = x R : x < b = semiretta aperta di secondo estremo b;
[a, +[ = x R : a x = semiretta chiusa di primo estremo a;
]a, +[ = x R : a < x = semiretta aperta di primo estremo a;
] , +[ = R = retta reale.
(I simboli , + si leggono pi` u innito, meno innito e non sono
numeri reali.)
Esercizi 1.4
1. Provare che se u è un elemento di R tale che a u = u, ove a è un ssato
numero reale diverso da 1, allora u = 0.
2. Provare che il prodotto di due numeri negativi è positivo.
12
3. Provare che 1 è un numero positivo.
4. Sia a b. Dimostrare che se c 0 allora ac bc, mentre se c < 0 si
ha ac bc.
5. Dimostrare le uguaglianze
[a, b] =
n=1
_
a
1
n
, b
_
, ]a, b] =
_
n=1
_
a +
1
n
, b
_
.
1.5 Assioma di completezza
Le proprietà 1-8 sin qui viste non sono prerogativa esclusiva di R, dato che
sono ugualmente vere nellinsieme dei numeri razionali Q. Ciò che davvero
caratterizza R è la proprietà di continuità, che si esprime con il corrispon-
dente assioma di continuità, detto anche assioma di completezza. Prima di
enunciarlo in una delle sue numerose formulazioni equivalenti, conviene dare
alcune denizioni.
Denizione 1.5.1 Sia A R. Diciamo che A è limitato superiormente
se esiste m R tale che m a per ogni a A. Tale numero m si dice
maggiorante dellinsieme A.
Denizione 1.5.2 Sia A R. Diciamo che A è limitato inferiormente se
esiste R tale che a per ogni a A. Tale numero si dice minorante
dellinsieme A.
Denizione 1.5.3 Sia A R. Diciamo che A è limitato se è sia limitato
superiormente, sia limitato inferiormente.
`
E chiaro che se A è limitato superiormente e m è un maggiorante di A, allora
ogni numero reale x m è ancora un maggiorante di A; analogamente, se
A è limitato inferiormente e è un minorante di A, allora ogni numero reale
x è ancora un minorante di A.
Ad esempio, se A = [0, 1] linsieme dei minoranti di A è la semiretta ] , 0]
mentre linsieme dei maggioranti di A è la semiretta [1, +[. Se A =]0, 1[,
oppure [0, 1[, oppure ]0, 1], succede esattamente lo stesso. Invece, se A =
[0, +[, allora A non ha maggioranti, mentre sono minoranti di A tutti i
numeri non positivi.
13
Denizione 1.5.4 Sia A R un insieme limitato superiormente. Diciamo
che A ha massimo m se:
(i) m è un maggiorante di A,
(ii) m A.
In tal caso, si scrive m = max A.
Denizione 1.5.5 Sia A R un insieme limitato inferiormente. Diciamo
che A ha minimo se:
(i) è un minorante di A,
(ii) A.
In tal caso, si scrive = min A.
Non è detto che un insieme limitato superiormente abbia massimo: per esem-
pio, [0, 1[ non ha massimo, perche esso è disgiunto dallinsieme dei suoi mag-
gioranti. Analogamente, non è detto che un insieme limitato inferiormente
abbia minimo. Notiamo anche che se A ha massimo, allora max A è il mini-
mo dellinsieme dei maggioranti di A, e che se A ha minimo, allora min A è
il massimo dellinsieme dei minoranti di A.
Denizione 1.5.6 Due sottoinsiemi non vuoti A, B R si dicono separati
se si ha
a b a A, b B.
Esempi 1.5.7 Sono coppie di insiemi separati:
] , 0], [0, [; ] , 0], ]0, [; ] , 0[, ]0, [;
[0, 1[, [2, 3]; [2, 1], N; 0, 3; 0, 0.
Sono coppie di insiemi non separati:
1/2, Z; Q, RQ; [0, 2], [1, 3]; x R : x
2
< 2, x R : x
2
> 2.
Osserviamo inoltre che:
se A, B sono insiemi separati, allora ogni elemento b B è un maggio-
rante di A e ogni elemento a A è un minorante di B;
14
se A è non vuoto e limitato superiormente, e se M è linsieme dei
maggioranti di A, allora A e M sono separati;
similmente, se Aè non vuoto e limitato inferiormente, e se N è linsieme
dei minoranti di A, allora N e A sono separati.
Lassioma di completezza di R asserisce la possibilità di interporre un numero
reale fra gli elementi di qualunque coppia di insiemi separati: in sostanza,
esso ci dice che i numeri reali sono in quantità suciente a riempire tutti i
buchi fra coppie di insiemi separati. Lenunciato preciso è il seguente:
9. Per ogni coppia A, B di sottoinsiemi di R non vuoti e separati, esiste
almeno un elemento separatore, cioè un numero reale tale che
a b a A, b B.
Questo assioma sembra avere un carattere abbastanza intuitivo: in eetti è
facile determinare esplicitamente gli elementi separatori in tutti i casi degli
esempi 1.5.7 in cui essi esistono. Tuttavia, come vedremo, le conseguenze
dellassioma di completezza sono di larghissima portata.
Si osservi che in generale lelemento separatore fra due insiemi separati A e B
non è unico. Però se A è un insieme non vuoto limitato superiormente e sce-
gliamo come B linsieme dei maggioranti di A, allora vi è un unico elemento
separatore fra A e B: infatti ogni elemento separatore deve soddisfare la
relazione
a b a A, b B;
in particolare, la prima disuguaglianza dice che è maggiorante per A, ossia
B; la seconda ci dice allora che = min B. Poiche il minimo di B è
unico, ne segue lunicità dellelemento separatore.
In modo analogo, se B è non vuoto e limitato inferiormente e prendiamo come
A linsieme dei minoranti di B, allora vi è un unico elemento separatore fra
A e B: il massimo dei minoranti di B.
Denizione 1.5.8 Sia A R non vuoto e limitato superiormente, sia M
linsieme dei maggioranti di A. Lunico elemento separatore fra A e M si
dice estremo superiore di A e si denota con sup A.
Il numero reale sup Aè dunque il minimo dei maggioranti di A. In particolare,
esso coincide con max A quando questultimo numero esiste.
15
Denizione 1.5.9 Sia A R non vuoto e limitato inferiormente, sia N
linsieme dei minoranti di A. Lunico elemento separatore fra N e A si dice
estremo inferiore di A e si denota con inf A.
Il numero reale inf A è dunque il massimo dei minoranti di A e coincide con
min A quando questultimo numero esiste.
Lestremo superiore di un insieme A (non vuoto e limitato superiormen-
te), la cui esistenza è conseguenza diretta dellassioma di completezza, si
caratterizza in questo modo:
Proposizione 1.5.10 Sia A R non vuoto e limitato superiormente, e sia
m R. Si ha m = sup A se e solo se m verica le seguenti due proprietà:
(i) m a per ogni a A;
(ii) per ogni > 0 esiste a A tale che m < a m.
Dimostrazione Se m = sup A, allora m è il minimo dei maggioranti di A:
quindi vale (i). Daltra parte, per ogni > 0 il numero reale m non è
un maggiorante per A: quindi cè almeno un elemento a A per il quale
m < a, il che implica la condizione (ii).
Viceversa, se m verica (i) e (ii), allora m è maggiorante di A mentre per
ogni > 0 il numero m non può esere maggiorante di A. Ne segue che
m è il minimo dei maggioranti di A, ossia m = sup A.
Una caratterizzazione analoga, la cui dimostrazione viene omessa essendo
identica alla precedente, vale per lestremo inferiore:
Proposizione 1.5.11 Sia A R non vuoto e limitato inferiormente, e sia
R. Si ha = inf A se e solo se verica le seguenti due proprietà:
(i) a per ogni a A;
(ii) per ogni > 0 esiste a A tale che a < +.
Esempi 1.5.12 (1) Se A = [0, 1], si ha sup A = max A = 1, inf A =
min A = 0.
(2) Se A = [0, 1[, si ha ancora inf A = min A = 0, sup A = 1, mentre max A
non esiste.
(3) Se A = 1, 7, 8, si ha inf A = min A = 1, sup A = max A = 8.
16
(4) Questo esempio mostra limportanza dellassioma di completezza: esso
permette di costruire, nellambito dei reali, il numero
2. Sia
A = x R : x
2
< 2;
ovviamente A non è vuoto, perche 1 A. Mostriamo che A è limitato
superiormente: a questo scopo basta far vedere che sono maggioranti di A
tutti i numeri positivi t tali che t
2
> 2. Infatti se t > 0 e t
2
> 2, e se ci fosse
x A con x > t, allora avremmo anche x > 0 e quindi 2 < t
2
< xt < x
2
< 2,
il che è assurdo. Dunque A è limitato superiormente e per lassioma di
completezza esiste m = sup A. Poiche 1 A, si ha m 1; aermiamo che
m
2
= 2.
Infatti, non può essere m
2
< 2, poiche in tal caso, scrivendo per ogni ]0, 1[
(m +)
2
= m
2
+
2
+ 2m < m
2
+ + 2m,
avremmo (m +)
2
< 2 pur di scegliere
< min
_
1,
2 m
2
2m + 1
_
:
tale scelta è sempre possibile, prendendo ad esempio come la metà del
numero a secondo membro. Ciò signicherebbe che m + appartiene ad
A, contro il fatto che m è uno dei maggioranti di A. Daltra parte non può
nemmeno essere m
2
> 2, poiche in tal caso avremmo per ogni ]0, m[
(m)
2
= m
2
+
2
2m > m
2
2m,
e dunque (m)
2
> 2 pur di scegliere
<
m
2
2
2m
.
Ciò signicherebbe, per quanto osservato allinizio, che m è un maggio-
rante di A; ma allora m non può essere il minimo dei maggioranti di A, e ciò
è assurdo. Pertanto lunica possibilità è che sia m
2
= 2.
Si noti che mè lunica radice reale posi-
tiva dellequazione x
2
= 2; tale numero
si dice radice quadrata di 2 e si scrive
m =
2; lequazione x
2
= 2 ha poi
unaltra radice reale che è negativa, ed
è
2.
17
Osservazione 1.5.13 Si vede facilmente che il numero reale
2 non può
essere un numero razionale: infatti supponiamo che sia
2 =
p
q
con p, q N
+
,
e che la frazione sia stata ridotta ai minimi termini: allora si ha
p
2
q
2
= 2, ossia
p
2
= 2q
2
. Ciò implica che p
2
, e quindi anche p, è un numero pari: sarà
dunque p = 2k, con k N
+
. Ma allora 4k
2
= p
2
= 2q
2
, da cui 2k
2
= q
2
:
ne segue che q
2
è pari e pertanto anche q è pari. Ciò però è assurdo, perche
la frazione sarebbe ulteriormente semplicabile, cosa che era stata esclusa.
Dunque
2 non è un numero razionale.

In modo assolutamente analogo (esercizio 1.5.2) si prova lesistenza della
radice quadrata di un arbitrario numero positivo x, che sarà in generale un
numero irrazionale.
In denitiva, imponendo lassioma 9 siamo necessariamente usciti dallambito
dei numeri razionali, che sono troppo pochi per rappresentare tutte le
grandezze: per misurare la diagonale del quadrato di lato unitario occorre il
numero irrazionale
2. In altre parole, nellinsieme Q non vale lassioma di

completezza.
Osservazione 1.5.14 Nel seguito del corso useremo massicciamente, pi` u
che lassioma di completezza in se, il fatto che ogni insieme non vuoto e
limitato superiormente è dotato di estremo superiore. Notiamo a questo
proposito che se, invece, A R non è limitato superiormente, A non ha
maggioranti e dunque lestremo superiore non esiste; in questo caso si dice
per convenzione che A ha estremo superiore + e si scrive sup A = +.
Analogamente, se A non è limitato inferiormente, si dice per convenzione
che A ha estremo inferiore e si scrive inf A = . In questo modo,
tutti i sottoinsiemi non vuoti di R possiedono estremo superiore ed inferiore,
eventualmente inniti. Per linsieme vuoto, invece, non cè niente da fare!
Esercizi 1.5
1. Provare che
2 = inf x R : x
2
< 2.
2. Provare che per ogni numero reale a > 0, lequazione x
2
= a ha esat-
tamente due soluzioni reali, una lopposta dellaltra; quella positiva si
chiama radice quadrata di a e si indica con

a. Si provi inoltre che
a = sup x R : x
2
< a,
a = inf x R : x
2
< a.
18
Cosa succede quando a = 0? E quando a < 0?
3. Determinare linsieme delle soluzioni reali delle seguenti equazioni:
(i)
x
2
= x , (ii) (
x)
2
= x , (iii)
_
(
x)
2
=
_
x
2
.
4. Dimostrare che
3 è un numero irrazionale.
5. Sia n N. Dimostrare che

n è un numero razionale se e solo se n è
un quadrato perfetto.
[Traccia: Si consideri dapprima il caso in cui n è un numero primo;
si ricordi poi che ogni numero naturale n ha ununica scomposizione in
fattori primi.]
6. Siano m, n N e supponiamo che almeno uno dei due non sia un
quadrato perfetto. Provare che il numero

m +
n è irrazionale.
7. Provare che per ogni n N
+
il numero
4n 1 è irrazionale.
8. Stabilire se i seguenti sottoinsiemi di R sono separati e determinarne
eventualmente gli elementi separatori:
(i) [0, 1], [1, 7];
(ii) [0, 2[, 2, 3;
(iii) x R : x
3
< 2, x R : x
3
> 2;
(iv) n N : n < 6, n N : n 6;
(v) r Q : r
2
< 2, ]
2, +[;
(vi) x R : x
2
< 1, x R : x
4
> 1.
9. Una sezione di R è una coppia (A, B) di sottoinsiemi separati di R, tali
che A B = R, A B = . Si dimostri che lenunciato
per ogni sezione (A, B) di R esiste un unico elemento separatore fra
A e B
è equivalente allassioma di completezza di R.
10. Si provi che esistono sezioni (A, B) di Q prive di elemento separatore
in Q.
[Traccia: si considerino A = x Q : x 0x Q : x > 0, x
2
< 2
e B = Q A.]
19
11. Provare che se A B R e A ,= , allora
inf B inf A sup A sup B;
si forniscano esempi in cui una o pi` u disuguaglianze sono strette.
12. Sia A un sottoinsieme non vuoto e limitato di R, e poniamo
B = x : x A.
Si provi che
sup B = inf A, inf B = sup A.
13. Provare che se A, B sono sottoinsiemi non vuoti e limitati di R si ha
sup A B = maxsup A, sup B, inf A B = mininf A, inf B.
14. Provare che se A, B sono sottoinsiemi di R con a B ,= , allora
sup A B minsup A, sup B, inf A B maxinf A, inf B;
si verichi che le disuguaglianze possono essere strette.
15. Siano A, B sottoinsiemi di ]0, [. Se esiste K > 0 tale che xy K per
ogni x A e per ogni y B, si provi che
sup A sup B K.
16. Calcolare lestremo superiore e lestremo inferiore dei seguenti sottoin-
siemi di R, specicando se si tratta di massimi o di minimi:
(i)
_
2x
x
2
+1
: x R
_
; (ii) x
2
+y
2
: x, y [1, 1], x < y;
(iii)
_
x +
1
x
: x > 0
_
; (iv) x
2
y
2
: 0 < x < y < 4;
(v)
_
n1
n
: n N
+
_
; (vi)
_
1
1+x
2
: x R
_
;
(vii)
_
(1)
k
k
: k N
+
_
; (viii)
_
1
k
3
: k Z 0
_
.
17. Siano a, b, c, d Q. Mostrare che:
(i) a +b
2 = 0 a = b = 0;
(ii) a +b
2 +c
3 = 0 a = b = c = 0;
(iii) a +b
2 +c
3 +d
5 = 0 a = b = c = d = 0.
18. Per quali x R sono vere le seguenti asserzioni?
(i) (x) x
2
> x; (ii)
x
2
= x; (iii) (x
2
)
2
> 16.
20
1.6 Numeri naturali, interi, razionali
A partire dagli assiomi di R, ed in particolare dallassioma di continuità,
possiamo ora rivisitare in maniera pi` u rigorosa alcuni concetti che abbiamo
conosciuto e adoperato su base intuitiva n dalla scuola dellobbligo. Comin-
ciamo ad esaminare linsieme N dei numeri naturali e le sue apparentemente
ovvie proprietà.
Ci occorre anzitutto la seguente
Denizione 1.6.1 Un insieme A R si dice induttivo se verica le seguenti
condizioni:
(i) 0 A,
(ii) per ogni x A si ha x + 1 A.
Ad esempio sono insiemi induttivi R, [a, +[ per ogni a 0, ]b, +[ per
ogni b < 0. Si noti che se A, B R sono induttivi, anche la loro intersezione
AB lo è; anzi, dato un qualunque insieme di indici I e presa una arbitraria
famiglia di insiemi induttivi A
i
iI
, la loro intersezione
iI
A
i
= x R : x A
i
i I
è un insieme induttivo: infatti 0 A
i
per ogni i I in quanto ciascun A
i
è induttivo, e se x A
i
per ogni i I, lo stesso si ha per x + 1, sempre a
causa dellinduttività di ciascun A
i
.
Denizione 1.6.2 Chiamiamo insieme dei numeri naturali, e denotiamo
con N, lintersezione di tutti i sottoinsiemi induttivi di R.
Da questa denizione segue subito che N è il pi` u piccolo insieme induttivo:
infatti se A R è induttivo, esso viene a far parte della famiglia di insiemi
di cui N è lintersezione, cosicche N A. Dunque in N cè il minimo
indispensabile di numeri che occorre per essere induttivo: perciò ci sarà
0, ci sarà 1 = 0 + 1, ci sarà 2 = 1 + 1, ci sarà 3 = 2 + 1, e cos` via.
Questa denizione di N è stata però introdotta proprio per evitare di far uso
della locuzione ...e cos` via: a questo scopo conviene introdurre il seguente
fondamentale
21
Teorema 1.6.3 (principio di induzione) Sia A N un insieme denito
da una certa proprietà p(n), ossia A = n N : p(n). Supponiamo di
sapere che
(i) p(0) è vera, ovvero 0 A;
(ii) p(n) implica p(n +1) per ogni n N, ovvero se n A allora n +1 A.
Allora p(n) è vera per ogni n N, ovvero A = N.
Dimostrazione Si tratta di una immediata conseguenza della denizione
di N. In eetti, per ipotesi A è contenuto in N; le condizioni (i) e (ii) ci dicono
daltronde che linsieme A è induttivo, e quindi A contiene N per denizione
di N: se ne deduce che A = N.
Il principio di induzione è importante non solo come metodo dimostrativo,
come vedremo, ma anche perche consente di introdurre denizioni ricorsive
in modo non ambiguo.
Esempi 1.6.4 (1) (Fattoriale) Consideriamo la sequenza di numeri cos`
deniti:
_
a
0
= 1,
a
n+1
= (n + 1)a
n
n N.
Si vede subito che a
1
= 1, a
2
= 2 1, a
3
= 3 2 1, a
4
= 4 3 2 1, e cos`
via; ssato n N, il numero a
n
cos` introdotto si chiama fattoriale di n e si
scrive a
n
= n! (si legge n fattoriale).
(2) (Somme nite) Data una famiglia innita di numeri reali a
n
nN
,
consideriamo la sequenza di numeri cos` denita:
_
s
0
= a
0
s
n+1
= a
n+1
+s
n
n N.
Si ha chiaramente
s
1
= a
0
+a
1
s
2
= a
0
+a
1
+a
2
s
3
= a
0
+a
1
+a
2
+a
3
s
4
= a
0
+a
1
+a
2
+a
3
+a
4
22
e cos` via; per il numero s
n
, che è la somma di a
0
, a
1
, a
2
, eccetera, no ad
a
n
, si usa il simbolo
s
n
=
n
k=0
a
k
.
Si noti che la variabile k dentro il simbolo di somma è muta: ciò signica
che s
n
è un numero che dipende solo dallestremo n della somma, e non da k, il
quale è solo una lettera per denotare gli addendi della somma. In particolare,
potremmo usare qualunque altro simbolo al posto di k senza alterare il valore
di s
n
:
n
k=0
a
k
=
n
i=0
a
i
=
n
&=0
a
&
=
n
pippo=0
a
pippo
.
Naturalmente, è anche lecito considerare somme nite il cui primo estremo
sia un numero diverso da 0: ad esempio
34
k=30
k = 30 + 31 + 32 + 33 + 34 = 160.
(3) (Prodotti niti) In modo analogo al caso delle somme, data una famiglia
a
n
nN
di numeri reali si denisce la seguente sequenza di numeri:
_
p
0
= a
0
p
n+1
= a
n+1
p
n
n N;
si ha p
1
= a
0
a
1
, p
2
= a
0
a
1
a
2
, p
3
= a
0
a
1
a
2
a
3
, e per il numero p
n
si usa il
simbolo
p
n
=
n
k=0
a
k
,
ove nuovamente k è una variabile muta. Si noti che, in particolare,
n! =
n
k=1
k n N
+
.
(4) Sia q un numero reale. La somma
1 +q +q
2
+q
3
+... +q
n
=
n
k=0
q
k
23
si dice progressione geometrica di ragione q. (Naturalmente, q
k
signica 1 se
k = 0, mentre se k > 0 denota il prodotto di k fattori uguali a q.)
Proviamo che si ha
n
k=0
q
k
=
_
n + 1 se q = 1
1q
n+1
1q
se q ,= 1
n N,
dove il simbolo q
k
nel caso speciale k = 0 e q = 0 deve intendersi come 1.
Se q = 1, la dimostrazione è banale e si lascia per esercizio. Supposto q ,= 1,
indichiamo con p(n) lenunciato seguente:
p(n) = vale luguaglianza
n
k=0
q
k
=
1 q
n+1
1 q
.
Allora p(0) è vera in quanto
0
k=0
q
k
= q
0
= 1 =
1 q
1
1 q
;
Supponiamo adesso che p(n) sia vera per un dato n N, e proviamo a dedurre
p(n +1) (il che, di per se, non signicherà che p(n) e p(n +1) siano vere per
davvero!). Si può scrivere, isolando lultimo addendo,
n+1
k=0
q
k
=
n
k=0
q
k
+q
n+1
,
e poiche stiamo supponendo vera p(n), otteniamo
n+1
k=0
q
k
=
1 q
n+1
1 q
+q
n+1
=
1 q
n+1
+ (1 q)q
n+1
1 q
=
1 q
n+2
1 q
,
che è proprio p(n + 1). Abbiamo cos` provato che p(n) implica p(n + 1) per
ogni n N. Poiche p(0) è vera, dal principio di induzione segue che p(n) è
vera per ogni n N.
(5) Proviamo la disuguaglianza
2
n
(n + 1)! n N.
24
Posto p(n) =2
n
(n + 1)!, si ha che p(0) è vera in quanto 2
0
= 1 è
eettivamente non superiore a 1! = 1. Supposto ora che p(n) sia vera, si può
scrivere
2
n+1
= 2 2
n
2 (n + 1)! ;
da qui ricaviamo, essendo ovviamente 2 n + 2 per ogni n N,
2
n+1
(n + 2)(n + 1)! = (n + 2)! ,
il che mostra che vale p(n+1). Abbiamo cos` provato che p(n) implica p(n+1)
per ogni n N: essendo anche p(0) vera, per il principio di induzione p(n) è
vera per ogni n N.
(6) Proviamo la disuguaglianza
n
2
2
n
n N, n 4.
Posto p(n) =n
2
2
n
, osserviamo che p(0), p(1) e p(2) sono vere mentre
p(3) è falsa; inoltre p(4) è vera. Proviamo adesso che p(n) = p(n + 1) per
ogni n N con n 4: usando lipotesi induttiva, si ha
2
n+1
= 2 2
n
2n
2
> n
2
+ 2n + 1 = (n + 1)
2
;
la seconda disuguaglianza è vera in quanto equivale a n
2
2n + 1 > 2, ossia
a (n1)
2
> 2, e questultima è vericata addirittura per ogni n 3. Poiche
p(4) è vera e p(n) implica p(n+1) per ogni n 4, per il principio di induzione
(applicato, per essere precisi, non a p(n) ma a q(n) = p(n + 4)) segue che
p(n) è vera per ogni n 4.
Proprietà di N, Z, Q
Anzitutto deniamo rigorosamente gli insiemi Z e Q.
Denizione 1.6.5 Linsieme dei numeri interi Z è N n : n N;
linsieme dei numeri razionali Q è
m
n
: m Z, n N
+
(ricordiamo che
N
+
= N 0).
Dalla denizione di N seguono abbastanza facilmente alcune sue proprietà.
Proposizione 1.6.6 N è illimitato superiormente.
25
Dimostrazione Supponiamo per assurdo che N sia limitato superiormente:
in tal caso L = sup N è un numero reale, che per la proposizione 1.5.10
verica
(a) n L per ogni n N,
(b) per ogni ]0, 1[ esiste N tale che L < L.
Avendo scelto < 1, da (b) segue che il numero naturale + 1 verica
L < + < + 1,
il che contraddice (a). Dunque L = +.
Di conseguenza, Z e Q sono illimitati sia superiormente che inferiormente.
Proposizione 1.6.7 (proprietà di Archimede) Per ogni coppia a, b di
numeri reali positivi esiste n N tale che na > b.
Dimostrazione Poiche sup N = +, il numero
b
a
non è un maggiorante
di N; quindi esiste n N per cui risulta n >
b
a
. Moltiplicando per a, che è
positivo, ne segue la tesi.
Una conseguenza della proprietà di Archimede è il fatto che linsieme dei
numeri razionali è denso in R: ciò signica che in ogni intervallo ]a, b[ R
cade almeno un numero razionale (e quindi inniti: vedere lesercizio 1.6.4).
Si ha infatti:
Corollario 1.6.8 Per ogni coppia a, b di numeri reali con a < b, esiste r Q
tale che
a < r < b.
Dimostrazione Supponiamo dapprima a 0. Per la proprietà di Archi-
mede, esiste n N tale che n(b a) > 1, ossia
1
n
< b a.
Consideriamo ora linsieme
A =
_
m N :
m
n
a
_
;
esso è ovviamente limitato superiormente (n a ne è un maggiorante) e non
vuoto (0 A). Posto L = sup A, e ssato ]0, 1[, dalla proposizione 1.5.10
26
segue che esiste A tale che L < L, ossia L < + < +1;
pertanto A mentre + 1 / A (essendo + 1 > sup A). Si ha allora
n
a <
+ 1
n
=

n
+
1
n
< a + (b a) = b.
Il numero razionale r =
+1
n
soddisfa dunque la tesi.
Supponiamo ora a < 0. Se b > 0, si ha la tesi scegliendo r = 0. Se invece
b 0, per quanto già provato esiste un razionale r tale che b < r < a, e
dunque il numero razionale r appartiene ad ]a, b[. La tesi è provata.
Osservazione 1.6.9 Non è dicile dimostrare che il numero L della di-
mostrazione precedente è in realtà un massimo. Si dimostra anzi che ogni
sottoinsieme limitato di N ha massimo (esercizio 1.6.2).
Vi è un risultato di densità pi` u ne, che è il seguente:
Teorema 1.6.10 Sia un numero reale. Linsieme
E = k +h : k, h Z
è denso in R se e solo se è irrazionale.
Dimostrazione Se Q, =
m
n
, allora
E =
_
km +hn
n
: k, h Z
_
=
_
p
n
: p Z
_
e quindi i punti di E distano fra loro almeno
1
n
: pertanto E non può essere
denso in R.
Supponiamo invece R Q: proveremo la densità di E in R mostrando
che per ogni x R e per ogni > 0 esistono k, h Z tali che
x < k +h < x +.
`
E chiaramente suciente provare la tesi per > 0. Sia dunque ]0, [ e
cominciamo con il caso x = 0. Fissiamo N N e poniamo
E
N
= k +h : k, h Z [N, N].
Poiche è irrazionale, gli elementi di E
N
sono tutti distinti e sono esatta-
mente (2N + 1)
2
. Inoltre
E
N
[N(1 +), N(1 +)].
27
Consideriamo adesso, per 1 m
_
4N(1+)
_
+1, gli intervalli chiusi adiacenti
I
m
=
_
N(1 +) + (m1)
2
, N(1 +) +m
2
_
,
la cui unione ricopre lintervallo [N(1 + ), N(1 + )], e quindi E
N
. Sce-
gliamo N abbastanza grande, in modo che
_
4N(1 +)
_
+ 1 < (2N + 1)
2
:
ciò è certamente possibile, risolvendo la disequazione pi` u forte
(2N + 1)
2
>
4N(1 +)
+ 1,
o quella ancora pi` u forte, ma pi` u facile,
(2N + 1)
2
> (2N + 1)
2(1 +)
+ (2N + 1).
Allora, necessariamente, almeno uno fra gli intervalli I
m
dovrà contenere
due diversi elementi di E
N
(questo è il cosiddetto principio dei cassetti: se
mettiamo p oggetti in q cassetti vuoti, e se p > q, allora esiste almeno un
cassetto che contiene pi` u di un oggetto). Quindi esistono quattro interi p
1
,
p
2
, q
1
, q
2
, non superiori a N in valore assoluto, tali che
p
1
+q
1
, p
2
+q
2
I
m
per un opportuno m. In particolare, poiche I
m
ha ampiezza minore di ,
< (p
1
p
2
) + (q
1
q
2
) < ,
e ciò prova la tesi nel caso x = 0.
Sia ora x > 0: per quanto già provato, esistono m, n Z tali che
< m +n < ,
e rimpiazzando eventualmente m, n con m, n possiamo supporre che
0 < m +n < .
28
Adesso scegliamo p N tale che
p(m +n) x < (p + 1)(m +n)
(sarà quindi p =
_
x
m+n
). Si ha allora
x < x (m +n) < p(m +n) x
e quindi abbiamo la tesi con k = pm, h = pn.
Inne, se x < 0, per quanto dimostrato esistono m, n Z tali che
x < m +n < x +,
e dunque si ha la tesi con k = m, h = n.
Esercizi 1.6
1. Dimostrare, sulla base della denizione di N, i seguenti enunciati:
(i) Non esiste alcun numero naturale minore di 0.
(ii) Se p, q N, allora p +q, pq N.
(iii) Se p N
+
, allora p 1 N.
(iv) Se p, q N e p > q, allora p q N.
(v) Se p, q N e p > q, allora p q N
+
.
[Traccia: per (ii), mostrare che S = p N : p + q N e P = p :
pq N sono insiemi induttivi; per (iii), mostrare che T = 0 p
N : p 1 N è induttivo; per (iv), mostrare che A = p N : p q
N q N [0, p[ è induttivo; inne (v) segue da (iv).]
2. Si provi che ogni sottoinsieme limitato di N ha massimo.
3. Dati a, b R con a < b, trovare un numero irrazionale c tale che
a < c < b.
4. Siano a, b R con a < b. Provare che esistono inniti numeri razionali
compresi fra a e b.
5. Un numero intero k si dice pari se esiste m Z tale che k = 2m, si
dice dispari se k + 1 è pari. Dimostrare che:
29
(i) nessun intero è simultaneamente pari e dispari;
(ii) ogni numero intero è o pari, o dispari;
(iii) la somma e il prodotto di numeri pari sono numeri pari;
(iv) la somma di due numeri dispari è pari mentre il prodotto è dispari.
6. Sia b N, b 2. Provare che linsieme delle frazioni in base b, ossia
_
m
b
n
: m Z, n N
+
_
,
è denso in R.
7. Quanti sono i sottoinsiemi distinti di un ssato insieme di n elementi?
8. Per quali n N
+
risulta 2
n
n! n
n
?
9. Si consideri la seguente forma modicata del principio di induzione:
Sia A = n N : p(n). Supponiamo che valgano i seguenti fatti:
(a) p(0) è vera,
(b) se vale p(k) per ogni k N con k n, allora vale p(n + 1).
Allora p(n) è vera per ogni n N, ossia A = N.
(i) Si provi che questo enunciato implica il principio di induzione.
(ii) Si provi che questo enunciato è implicato dal principio di induzione.
[Traccia: Per (ii), si applichi il principio di induzione allaermazione
q(n) denita da q(n) =p(k) per ogni k N con k n.]
10. Si provi che ogni insieme non vuoto E N ha minimo.
[Traccia: se cos` non fosse, posto p(n) =n / E, si applichi a p(n) il
principio di induzione nella forma dellesercizio 1.6.9.]
11. Si dimostri che ogni n N
+
è scomponibile in fattori primi.
[Traccia: Utilizzare il principio di induzione nella forma dellesercizio
1.6.9.]
12. Provare che:
(i)
n
k=1
k =
n(n+1)
2
per ogni n N
+
;
30
(ii)
n
k=1
(2k 1) = n
2
per ogni n N
+
;
(iii)
n
k=1
k
2
=
n(n+1)(2n+1)
6
per ogni n N
+
;
(iv)
n
k=1
k
3
=
n
2
(n+1)
2
4
per ogni n N
+
.
13. Siano a, b, c, d reali positivi. Provare che
min
_
a
c
,
b
d
_
a +b
c +d
max
_
a
c
,
b
d
_
.
14. Stabilire se sono vere o false le seguenti aermazioni:
(i) la somma di due irrazionali è irrazionale;
(ii) il prodotto di due irrazionali è irrazionale;
(iii) la somma di un razionale e di un irrazionale è irrazionale;
(iv) il prodotto di un razionale e di un irrazionale è irrazionale.
15. Siano a, b R. Provare che se 0 < a < b allora 0 < a
n
< b
n
per ogni
n N
+
.
16. Provare che:
(i) n k(n + 1 k)
1
4
(n + 1)
2
per ogni k N con 1 k n;
(ii) (n!)
2
=
n
k=1
k(n + 1 k) per ogni n N
+
;
(iii) n
n
(n!)
2
_
n+1
2
_
2n
per ogni n N
+
.
17. Siano a
1
, . . . , a
n
, b
1
, . . . , b
n
numeri reali. Denotiamo con a
k
il riordi-
namento crescente e con a
k
il riordinamento decrescente della sequen-
za a
k
, e similmente per b
k
. Si provino le disuguaglianze seguenti:
(i)
n
k=1
a
k
b
k

n
k=1
a
k
b
k

n
k=1
a
k
b
k
,
(ii)
n
k=1
a
k
b
k

1
n
(
n
k=1
a
k
) (
n
k=1
b
k
)
n
k=1
a
k
b
k
.
[Traccia: si può supporre che b
k
sia già riordinata in modo crescente.
Consideriamo le due disuguaglianze di destra: per (i), si verichi che
se i < j e a
i
> a
j
, allora risulta a
i
b
i
+ a
j
b
j
< a
j
b
i
+ a
i
b
j
; per (ii), si
decomponga la quantità
n
k,h=1
(a
k
a
h
)(
b
k
b
h
) e si noti che essa è non
negativa. Le disuguaglianze di sinistra si ottengono applicando quelle
di destra a a
k
e a b
k
.]
31
1.7 La formula del binomio
Per ogni n, k N con n k deniamo i coecienti binomiali
_
n
k
_
(si leggen
su k) nel modo seguente:
_
n
k
_
=
n!
k!(n k)!
.
Si noti che
_
n
k
_
= 1 quando k = n e quando k = 0; negli altri casi si ha
_
n
k
_
=
n(n 1) (n k + 1)
k!
,
e questa espressione si presterà ad ulteriori generalizzazioni nel seguito del
corso. Dalla denizione seguono subito queste proprietà:
(simmetria)
_
n
k
_
=
_
n
nk
_
,
(legge del triangolo di Tartaglia)
_
n
k1
_
+
_
n
k
_
=
_
n+1
k
_
.
1
1 1
1 2 1
1 3 3 1
1 4 6 4 1
1 5 10 10 5 1
1 6 15 20 15 6 1
1 7 21 35 35 21 7 1
1 8 28 56 70 56 28 8 1

Il triangolo di Tartaglia ha tutti 1 sui lati obliqui ed ogni suo elemento al-
linterno è la somma dei due elementi ad esso soprastanti. Gli elementi del
triangolo sono appunto i coecienti binomiali:
_
n
k
_
si trova al posto k-simo
nella riga n-sima (cominciando sempre a contare da 0).
La denominazione coeciente binomiale nasce dal fatto che questi numeri
saltano fuori come coecienti nella formula di Newton che dà lo sviluppo del
32
binomio (a +b)
n
, formula che adesso dimostreremo. Ricordiamo preliminar-
mente che se x R0 e n N, la potenza x
n
, il cui signicato è comunque
ovvio, andrebbe denita rigorosamente nel seguente modo:
_
x
0
= 1
x
n+1
= x x
n
n N;
se invece x = 0, si pone 0
n
= 0 per ogni n N
+
, mentre 0
0
non si denisce.
Ciò posto, si ha:
Teorema 1.7.1 Se a, b R 0 e n N
+
, si ha
(a +b)
n
=
n
k=0
_
n
k
_
a
k
b
nk
.
Dimostrazione Utilizziamo il principio di induzione. Se n = 1 la formula
è vera perche
a +b =
_
1
0
_
a
0
b
1
+
_
1
1
_
a
1
b
0
= b +a.
Supponiamo vera la formula per un binomio di grado n e proviamola per un
binomio di grado n + 1. Si ha
(a +b)
n+1
= (a +b)(a +b)
n
= (per ipotesi induttiva)
= (a +b)
n
k=0
_
n
k
_
a
k
b
nk
=
=
n
k=0
_
n
k
_
a
k+1
b
nk
+
n
k=0
_
n
k
_
a
k
b
n+1k
=
(ponendo h = k + 1 nella prima somma e h = k nella seconda)
=
n+1
h=1
_
n
h 1
_
a
h
b
n+1h
+
n
h=0
_
n
h
_
a
h
b
n+1h
=
(isolando lultimo addendo nella prima somma e il primo addendo
nella seconda)
=
_
n
n
_
a
n+1
b
0
+
_
n
0
_
a
0
b
n+1
+
n
h=1
_
n
h 1
_
a
h
b
n+1h
+
+
n
h=1
_
n
h
_
a
h
b
n+1h
=
33
= a
n+1
+b
n+1
+
n
h=1
__
n
h 1
_
+
_
n
h
__
a
h
b
n+1h
=
(per la legge del triangolo di Tartaglia)
= a
n+1
+b
n+1
+
n
h=1
_
n + 1
h
_
a
h
b
n+1h
=
n+1
h=0
_
n + 1
h
_
a
h
b
n+1h
.
Per il principio di induzione la formula è vera per ogni n N
+
.
Osservazioni 1.7.2 (1) La formula del binomio vale pi` u in generale per
a, b R e n N, se in tale formula si conviene di interpretare il simbolo 0
0
come 1.
(2) Scelti a = 1, b = 1, n N
+
si ottiene
0 = (1 + 1)
n
=
n
k=0
_
n
k
_
(1)
k
1
nk
,
cioè
n
k=0
(1)
k
_
n
k
_
= 0 n N
+
.
(3) Scelti a = 1, b = 1, n N si ottiene
n
k=0
_
n
k
_
= 2
n
n N.
Questa uguaglianza ha una interpretazione combinatoria: 2
n
è il nume-
ro di sottoinsiemi distinti di un ssato insieme con n elementi (esercizio
1.6.refsotto), mentre
_
n
k
_
è il numero di sottoinsiemi distinti aventi k ele-
menti di un insieme con n elementi (esercizio 1.7.2). Si tratta dunque di
contare tutti i sottoinsiemi raggruppandoli per numero di elementi.
(4) Un altro modo di enunciare la proprietà dellesercizio 1.7.2 è il seguente:
_
n
k
_
è il numero di modi in cui si possono sistemare k palline indistinguibili
in n scatole distinte, una per scatola: infatti ogni distribuzione di palline
individua un sottoinsieme di k scatole (sulle n complessive). In termini pro-
babilistici si può anche dire: data unurna contenente k palline bianche e
n k palline nere, la probabilità di estrarre le k palline bianche nelle prime
34
k estrazioni (intesa come rapporto tra gli esiti favorevoli e gli esiti possibili)
è pari a
1
_
n
k
_.
Infatti nella prima estrazione ci sono k esiti favorevoli su n possibili, nella
seconda k 1 su n 1, e cos` via, nche nella k-sima si ha un solo esito
favorevole su n k + 1 possibili: dunque la probabilità è
k
n

k 1
n 1

1
n k + 1
=
1
_
n
k
_.
Ad esempio la probabilità di fare 6 al Superenalotto è
1
_
90
6
_ =
1
622.614.630
0.000000016
(qui le palline bianche sono i 6 numeri prescelti e il simbolo signica
circa uguale a).
(5) Dalla formula del binomio segue subito la seguente disuguaglianza di
Bernoulli:
(1 +x)
n
1 +nx x 0, n N
(basta osservare che tutti gli addendi nello sviluppo del binomio (1+x)
n
sono
non negativi); una versione pi` u generale di questa disuguaglianza è enunciata
nellesercizio 1.7.5. Si può anche osservare che risulta
(1 +x)
n
1 +nx +
n(n 1)
2
x
2
x 0, n N.
Esercizi 1.7
1. Provare che:
(i) k
_
n
k
_
= n
_
n1
k1
_
per ogni n, k N con n k 1;
(ii)
n
k=1
k
_
n
k
_
= n 2
n1
per ogni n N
+
;
(iii)
n
k=1
k
2
_
n
k
_
= n(n + 1) 2
n2
per ogni n N
+
;
(iv)
n
m=k
_
m
k
_
=
_
n+1
k+1
_
per ogni n, k N con n k.
2. Provare che un insieme di n elementi ha
_
n
k
_
sottoinsiemi distinti con k
elementi (0 k n).
35
3. Calcolare la probabilità di fare un terno al lotto.
4. Calcolare la probabilità di fare 5 + 1 al Superenalotto.
5. (Disuguaglianza di Bernoulli) Provare che risulta
(1 +x)
n
1 +nx x 1, n N
+
.
6. Provare che
sup
__
1
x
n
2
_
n
: n N
+
_
= 1 x 0.
[Traccia: utilizzare la disuguaglianza di Bernoulli.]
7. Si generalizzi la formula del binomio al caso di tre addendi.
1.8 Radici n-sime
Proviamo adesso unaltra conseguenza dellassioma di continuità, vale a dire
lesistenza della radice n-sima di qualunque numero reale non negativo.
Teorema 1.8.1 Sia n N
+
. Per ogni numero reale a 0 esiste un unico
numero reale r 0 tale che r
n
= a; tale numero si chiama radice n-sima di
a, e si scrive r =
n
a oppure r = a
1
n
.
Dimostrazione Supporremo n 2, dato che per n = 1 la tesi è ovvia. Se
a = 0, allora lunica soluzione dellequazione x
n
= 0 è il numero 0 in virt` u
della legge di annullamento del prodotto. Supponiamo dunque a > 0.
Proviamo dapprima lunicità della radice n-sima: se vi fossero due numeri
r e , entrambi non negativi ed entrambi soluzioni dellequazione x
n
= a,
uno dei due, ad esempio , sarebbe maggiore dellaltro; ma da r < segue
(esercizio 1.6.15) che a = r
n
<
n
= a, il che è assurdo. Dunque r = e
lunicità è provata.
Per dimostrare lesistenza della radice n-sima, consideriamo linsieme
A = x 0 : x
n
< a
(ovviamente non vuoto, dato che 0 A) e mostriamo:
(a) che A è limitato superiormente,
36
(b) che r = sup A è il numero che stiamo cercando, ossia che r
n
= a.
Proviamo (a): se a 1, facciamo vedere che il numero a è un maggiorante
di A, mentre se 0 < a < 1 facciamo vedere che il numero 1 è un maggiorante
di A. Sia a 1: se per un x A risultasse x > a, moltiplicando questa disu-
guaglianza per x e per a avremmo x
2
> ax > a
2
; essendo a 1, dedurremmo
x
2
> a
2
a. Procedendo per induzione, avremmo x
n
> a, contraddicendo il
fatto che x A: dunque si ha x a per ogni x A. Sia ora 0 < a < 1: se
per un x A risultasse x > 1, procedendo analogamente troveremmo x
n
> 1;
essendo 1 > a, otterremmo x
n
> a, nuovamente contraddicendo il fatto che
x A. Se ne conclude che linsieme A ha maggioranti, e quindi è limitato
superiormente.
Proviamo (b). Notiamo anzitutto che r = sup A > 0. Infatti A contiene
elementi non nulli: ad esempio, se a > 1 si ha 1 A in quanto 1
n
= 1 < a,
mentre se 0 < a < 1 si ha a A poiche a
n
< a; inne se a = 1 si ha
1
2
A
dato che
_
1
2
_
n
<
1
2
< 1 = a.
Dobbiamo mostrare che r
n
= a, e lo faremo provando che sono assurde en-
trambe le relazioni r
n
> a e r
n
< a. Supponiamo che sia r
n
> a: vogliamo
mostrare che, di conseguenza, deve essere
(r )
n
> a
per ogni positivo e sucientemente piccolo; ciò implicherebbe che linter-
vallo ]r , r[ è costituito da maggioranti di A, contraddicendo il fatto che
r è il minimo dei maggioranti di A. Invece di ricavare dalla disuguaglian-
za (r )
n
> a, che non sappiamo risolvere, ne dedurremo unaltra pi` u
restrittiva, ma pi` u facile da risolvere. A questo scopo osserviamo che per
]0, r[ si ha, grazie alla disuguaglianza di Bernoulli (esercizio 1.7.5; si noti
che
r
> 1)
(r )
n
= r
n
_
1

r
_
n
r
n
_
1 n
r
_
;
se ne deduce (r )
n
> a purche risulti
r
n
_
1 n
r
_
> a.
Questa disuguaglianza, che segue da quella originale ed è quindi pi` u restrit-
tiva di essa, si risolve subito: essa è vericata se e solo se
<
r
n
_
1
a
r
n
_
,
37
e dunque si deduce, come volevamo, che
(r )
n
> a
_
0,
r
n
_
1
a
r
n
__
]0, r[;
di qui, come si è detto, segue lassurdo.
Supponiamo ora che sia r
n
< a: vogliamo analogamente dedurre che
(r +)
n
< a
per ogni positivo ed abbastanza piccolo; da ciò seguirà che A contiene
numeri maggiori di r, contraddicendo il fatto che r è un maggiorante di A.
Trasformiamo la disuguaglianza che ci interessa: si ha
(r +)
n
= r
n
_
1 +

r
_
n
< a
1
r
n
_
1 +

r
_
n
>
1
a
;
daltronde, applicando nuovamente la disuguaglianza di Bernoulli (si noti che
r
1+
r
> 1), risulta
1
_
1 +

r
_
n
=
_
1
r
1 +

r
_
n
> 1 n
r
1 +

r
> 1 n

r
;
quindi al posto della disuguaglianza (r +)
n
> a si ottiene la disuguaglianza
pi` u restrittiva
1
r
n
_
1 n

r
_
>
1
a
che è vera se e solo se
0 < <
r
n
_
1
r
n
a
_
]0, r[.
Dunque si ottiene, come si voleva,
(r +)
n
< a
_
0,
r
n
_
1
r
n
a
__
,
e quindi, come si è osservato, lassurdo.
In denitiva, non resta che dedurre luguaglianza r = a.
38
Disuguaglianza delle medie
Un risultato molto importante, utilissimo in svariate situazioni, è la disugua-
glianza tra media geometrica e media aritmetica di n numeri non negativi. Se
a
1
, a
2
, . . . , a
n
sono numeri non negativi, la loro media geometrica è il numero
reale
G =
n
_
n
k=1
a
k
,
mentre la loro media aritmetica è il numero reale
A =
1
n
n
k=1
a
k
.
Si ha allora:
Teorema 1.8.2 Se n N
+
e se a
1
, . . . , a
n
sono numeri non negativi, allora
n
_
n
k=1
a
k

1
n
n
k=1
a
k
;
inoltre vale il segno di uguaglianza se e solo se gli a
k
sono tutti uguali fra
loro.
Dimostrazione Anzitutto, è chiaro che se gli a
k
sono tutti uguali fra loro
allora G = A. Per provare il viceversa, mostreremo che se gli a
k
non sono
tutti uguali allora risulta G < A; ciò è ovvio se qualcuno degli a
k
è nullo,
perche in tal caso si ha G = 0 < A. Possiamo dunque supporre gli a
k
strettamente positivi e non tutti uguali. Proveremo la disuguaglianza G < A
per induzione.
Se n = 2, la tesi è vera perche
a
1
a
2
<
1
2
(a
1
+a
2
) (
a
2
a
1
)
2
> 0,
ed essendo a
1
,= a
2
, la relazione a destra è vera.
Supponiamo che la disuguaglianza stretta sia vera per ogni n-pla di numeri
positivi non tutti uguali, con n 2, e dimostriamola nel caso di n + 1
numeri. Prendiamo dunque n + 1 numeri positivi a
1
, . . . , a
n
, a
n+1
non tutti
uguali: allora ce ne sarà almeno uno diverso dalla media aritmetica A; per
39
simmetria, o meglio per denizione stessa di media aritmetica, di numeri
diversi da A ce ne dovranno essere due, a
i
e a
j
, dei quali uno sarà maggiore
ed uno sarà minore di A. Quindi, a meno di riordinare gli a
k
, non è restrittivo
supporre che risulti
a
n
< A < a
n+1
.
Il fatto che A è la media aritmetica degli a
k
si può riscrivere cos`:
n1
k=1
a
k
+ (a
n
+a
n+1
A) = n A
(ricordiamo che n + 1 3 e quindi la prima somma contiene almeno un
addendo). Questa relazione ci dice che A è anche la media aritmetica degli
n numeri non negativi a
1
, . . . , a
n1
, a
n
+ a
n+1
A; per ipotesi induttiva, la
loro media geometrica è non superiore ad A, ossia
n
_
(a
n
+a
n+1
A)
n1
k=1
a
k
A.
Elevando alla n-sima potenza e moltiplicando per A si ricava allora
A (a
n
+a
n+1
A)
n1
k=1
a
k
A
n+1
.
Daltra parte risulta
a
n
a
n+1
< A(a
n
+a
n+1
A)
in quanto
A(a
n
+a
n+1
A) a
n
a
n+1
= (A a
n
)(a
n+1
A) > 0;
quindi a maggior ragione otteniamo
n+1
k=1
a
k
< A (a
n
+a
n+1
A)
n1
k=1
a
k
A
n+1
.
La disuguaglianza per n + 1 numeri è dunque stretta se essi non sono tutti
uguali.
Per il principio di induzione, la tesi è provata.
40
Esempi 1.8.3 (1) Applicando la disuguaglianza delle medie si dimostra
questa basilare proprietà delle radici n-sime:
inf
nN
+
a
1
n
= 1 a 1, sup
nN
+
a
1
n
= 1 a ]0, 1].
(Si osservi la notazione: inf
nN
+ a
1
n
signica inf a
1
n
: n N
+
, e analoga-
mente sup
nN
+ a
1
n
denota sup a
1
n
: n N
+
.)
Infatti la proprietà è evidente quando a = 1, poiche 1
1
n
= 1 per ogni
n N
+
. Supponiamo adesso a > 1: allora, ssato n 2 e prendendo
a
1
= = a
n1
= 1 e a
n
= a, dalla disuguaglianza delle medie si ha
1 < a
1
n
<
1
n
(n 1 +a) = 1 +
a 1
n
n 2,
da cui
1 inf
nN
+
a
1
n
inf
nN
+
_
1 +
a 1
n
_
= 1.
Ciò prova la tesi quando a > 1.
Se a < 1, si ha
1
a
> 1 e, per quanto visto,
1 <
_
1
a
_1
n
< 1 +
1
a
1
n
= 1 +
1 a
na
n 2,
da cui
1
1 +
1a
na
< a
1
n
< 1 n 2;
ne segue
1 = sup
nN
+
1
1 +
1a
na
sup
nN
+
a
1
n
1.
(2) Dimostriamo la seguente importante disuguaglianza:
_
1 +
x
n
_
n
<
_
1 +
x
n + 1
_
n+1
x R 0, n N
+
con n > x.
Essa segue dalla disuguaglianza delle medie, scegliendo a
1
= = a
n
= 1+
x
n
e a
n+1
= 1: infatti
_
1 +
x
n
_
n
=
n+1
k=1
a
k
<
_
1
n + 1
n+1
k=1
a
k
_
n+1
=
41
=
_
1
n + 1
_
n
_
1 +
x
n
_
+ 1
_
_
n+1
=
=
_
n +x + 1
n + 1
_
n+1
=
_
1 +
x
n + 1
_
n+1
.
Esercizi 1.8
1. Provare che per ogni numero reale a > 0 e per ogni intero pari n 2
lequazione x
n
= a ha le due soluzioni reali x = a
1
n
; si provi inoltre
che
a
1
n
= inf x R : x
n
< a.
2. Provare che per ogni a R e per ogni intero dispari n 1, lequazione
x
n
= a ha esattamente una soluzione reale, e cioè:
x =
_
a
1
n
se a 0,
(a)
1
n
se a < 0;
questo permette di estendere la denizione di radice n-sima, quando n
è dispari, a tutti i numeri a R.
3. Si dimostri la formula risolutiva per le equazioni di secondo grado.
[Traccia: data lequazione ax
2
+ bx + c = 0, si osservi che non è re-
strittivo supporre a > 0; si completi il quadrato a primo membro
scrivendola nella forma
_
a x +
b
2
a
_
2
=
b
2
4ac
4a
,
e si analizzi il segno del discriminante b
2
4ac. . . ]
4. Sia n N
+
. Si provi la seguente disuguaglianza tra media armonica e
media geometrica di n numeri positivi:
n
n
k=1
1
a
k
_
n
k=1
a
k
.
42
1.9 Valore assoluto
In geometria la retta è un concetto primitivo, ossia non se ne fornisce la de-
nizione ma la si considera come un ente intrinsecamente noto. Il sistema dei
numeri reali costituisce il modello matematico dellidea intuitiva di retta: si
assume che ad ogni punto della retta corrisponda uno ed un solo numero reale
(che viene detto ascissa del punto). Questo è un vero e proprio assioma, ma
è peraltro un enunciato del tutto ragionevole; per realizzare tale corrispon-
denza, si ssa sulla retta un sistema di riferimento, costituito da unorigine,
a cui associamo il numero reale 0, da ununità di misura, che ci permette
di identicare i punti a cui associare i numeri interi, e da unorientazione,
allo scopo di distinguere i punti corrispondenti a numeri positivi da quelli
corrispondenti a numeri negativi.
Per misurare la grandezza di un numero, a prescindere dal fatto che esso
sia positivo oppure negativo, è fondamentale la seguente
Denizione 1.9.1 Il valore assoluto, o modulo, di un numero reale x è il
numero non negativo [x[ cos` denito:
[x[ =
x
2
=
_
x se x 0,
x se x < 0.
Si noti che risulta
[x[ x [x[ x R,
od equivalentemente
[x[ = maxx, x x R.
Si noti anche che
[x[ a a x a
e. pi` u generalmente,
[x u[ a u a x u +a.
Rappresentando R come retta orientata, [x[ è la distanza del numero reale x
dallorigine 0, e analogamente [a b[ è la distanza fra i due numeri reali a e
b.
43
La proposizione che segue riassume le principali proprietà del valore assoluto.
Proposizione 1.9.2 Valgono i seguenti fatti:
(i) [x[ 0 per ogni x R, e [x[ = 0 se e solo se x = 0;
(ii) [x[ [y[ = [xy[ per ogni x, y R;
(iii) (subadditività) [x +y[ [x[ +[y[ per ogni x, y R;
(iv) [[x[ [y[[ [x y[ per ogni x, y R;
(v)
1
x
=
1
|x|
per ogni x R 0;
(vi)
x
y
=
|x|
|y|
per ogni x R e y R 0.
Dimostrazione La proprietà (i) è evidente. Per (ii) si osservi che dalla
denizione segue subito x
2
= [x[
2
per ogni x R; quindi
([x[ [y[)
2
= [x[
2
[y[
2
= x
2
y
2
= (xy)
2
= [xy[
2
,
da cui la tesi estraendo la radice quadrata: infatti
t R,
t
2
= t t 0.
Proviamo (iii): usando (i) e (ii), si ha
[x +y[
2
= (x +y)
2
= x
2
+y
2
+ 2xy [x[
2
+[y[
2
+ 2[xy[ =
= [x[
2
+[y[
2
+ 2[x[[y[ = ([x[ +[y[)
2
,
da cui la tesi estraendo la radice quadrata.
La (iv) è conseguenza della subadditività: infatti
[x[ = [(x y) +y[ [x y[ +[y[,
44
da cui [x[ [y[ [x y[; scambiando i ruoli di x e y si ottiene anche
[y[ [x[ [y x[ = [x y[, e quindi
[[x[ [y[[ = max[x[ [y[, [y[ [x[ [x y[.
Dimostriamo (v): da (ii) segue
[x[
1
x
x
1
x
= [1[ = 1,
quindi
1
x
è linverso di [x[, ossia vale la tesi.

Inne (vi) è conseguenza evidente di (ii) e (v).
Disuguaglianza di Cauchy-Schwarz
Unaltra importante disuguaglianza, che come si vedrà ha un rilevante signi-
cato geometrico, è la seguente:
Teorema 1.9.3 Fissato n N
+
, siano a
1
, . . . , a
n
, b
1
, . . . , b
n
numeri reali.
Allora si ha
n
i=1
a
i
b
i

_
n
i=1
a
2
i
_
n
i=1
b
2
i
.
Dimostrazione Fissato t R, consideriamo la quantità, certamente non
negativa,
n
i=1
(a
i
+tb
i
)
2
. Si ha
0
n
i=1
(a
i
+tb
i
)
2
=
n
i=1
a
2
i
+ 2t
n
i=1
a
i
b
i
+t
2
n
i=1
b
2
i
t R.
Questa espressione è un trinomio di secondo grado nella variabile reale t. Il
fatto che esso sia sempre non negativo implica che il discriminante
= 4
_
n
i=1
a
i
b
i
_
2
4
n
i=1
b
2
i
n
i=1
a
2
i
deve essere non positivo (esercizio 1.8.3). La condizione 0 implica la
tesi.
45
Esercizi 1.9
1. Determinare sotto quali condizioni sui numeri reali x, y valgono le
uguaglianze:
(i) [x[ [y[ = [x y[; (ii) [x +y[ = [x y[;
(iii) [x[ [y[ = x y; (iv) [x[ [y[ = x +y;
(v) [[x[ [y[[ = [x +y[; (vi) [[x[ [y[[ = [x y[;
(vii) [[x[ [y[[ = x +y; (viii) [[x[ [y[[ = x y.
2. Risolvere le seguenti equazioni e disequazioni:
(i) [x[ + 1 = [x + 1[, (ii) [x[ x
2
= [[x[ +x[,
(iii) [x + 3[ < [2x 3[, (iv) [[x 1[ + 1[ < 1,
(v)
1
|x|

1
|x+3|
>
1
|x+4|
, (vi) [[2x 1[ [x + 3[[ < [4x + 5[.
(i) [x 1[ < 3; (ii) [2 + 3x[ = [4 x[;
(iii) [10 3x[ = 4; (iv) [1 + 2x[ 1;
(v) [x + 2[ 5x; (vi) [5 +x
1
[ < 1;
(vii) [x
2
2[ 1; (viii) x < [x
2
12[ < 4x;
(ix)
15x 3
x
2
5
3 ; (x)
_
x + 1 > 1
3x + 4 > 2
;
(xi)
[x
2
2[ + 3
3x + 1
1; (xii)
[x + 2[ 2x
x
2
2x
1;
(xiii)
2
x + 2
>
2x
x
2
1
; (xiv) x
2
5[x[ + 6 0.
4. Siano a, b R con b 0. Vericare che
[x a[ 1;
(iii)
4x
2
1 < x 3; (iv)
3x
2
1 >
x
2
3;
(v) [x[
1 2x
2
> 2x
2
1; (vi)
[x[ 3
x 2
>
x.
7. Provare che per ogni a R si ha
maxa, 0 =
a +[a[
2
, mina, 0 = maxa, 0 =
a [a[
2
.
8. Si dimostri la disuguaglianza di Cauchy-Schwarz utilizzando il principio
di induzione.
1.10 La funzione esponenziale
Vogliamo denire la funzione esponenziale a
x
per ogni base a > 0 e per
ogni esponente x R, naturalmente preservando le proprietà usuali, noto-
riamente vere quando gli esponenti sono numeri naturali. A questo scopo
procederemo in vari passi.
Prima di cominciare, enunciamo un lemma che useremo a pi` u riprese.
Lemma 1.10.1 (dellarbitrarietà di ) Siano a, b numeri reali e M, nu-
meri reali positivi. Supponiamo che risulti
a b +M ]0, [;
allora si ha necessariamente a b.
Dimostrazione Se fosse a > b, scegliendo

_
0, min
_
,
a b
M
__
si otterrebbe a > b +M, contro lipotesi.
1
o
passo (esponenti naturali) Ricordiamo che per n N e a R la
47
potenza a
n
è stata denita allinizio del paragrafo 1.7; è facile vericare che
se a, b > 0 valgono i seguenti fatti:
(i) a
n
> 0 n N, a
0
= 1;
(ii) a
n+m
= a
n
a
m
n, m N;
(iii) a
nm
= (a
n
)
m
n, m N;
(iv) (ab)
n
= a
n
b
n
n N;
(v) a 1 = a
n
> 1
n N
+
;
(vii)
_
a < 1 = a
m
< a
n
a > 1 = a
m
> a
n
m, n N
+
con m > n.
Le proprietà (i)-(vi) si vericano per induzione su n (esercizio 1.10.1), mentre
la (vii) segue banalmente da (vi) scrivendo a
m
= a
n
a
mn
.
2
o
passo (radici n-sime) Per n N
+
e a > 0 la quantità a
1/n
è stata
denita nel paragrafo 1.8 come lunica soluzione positiva dellequazione x
n
=
a; dunque per denizione si ha
(a
1
n
)
n
= a n N
+
.
Risulta anche
a
1
nm
= (a
1
n
)
1
m
n, m N
+
(perche, per (iii), i due membri risolvono entrambi lequazione x
mn
= a),
(a
1
n
)
m
= (a
m
)
1
n
n, m N
+
(perche, per (iii), i due membri risolvono entrambi lequazione x
n
= a
m
),
(ab)
1
n
= a
1
n
b
1
n
n N
+
(perche, per (iv), i due membri risolvono entrambi lequazione x
n
= ab),
_
a < 1 = a
1
n
< 1
a > 1 = a
1
n
> 1
n N
+
48
(per lesercizio 1.10.2),
_
a < 1 = a
1
n
< a
1
m
a > 1 = a
1
n
> a
1
m
n, m N
+
con m > n
(elevando entrambi i membri alla potenza mn ed usando (iii), (vii)).
3
o
passo (esponenti razionali) Se r Q, sarà r =
p
q
con p Z, q N
+
;
se a > 0 poniamo allora, per denizione,
a
p
q
=
_
_
_
a
1
q
_
p
se p 0
1
a
1
q
p
se p < 0.
Occorre però vericare che questa è una buona denizione, nel senso che essa
non deve dipendere dal modo di rappresentare in frazione il numero razionale
r: in altri termini, bisogna controllare che se r =
p
q
=
m
n
, cioè m = kp, n = kq
con k N
+
, allora risulta a
p
q
= a
m
n
. Ed infatti, supposto ad esempio p 0,
utilizzando le proprietà precedenti si trova
a
m
n
= (a
1
kq
)
kp
= [((a
1
q
)
1
k
)
k
]
p
= (a
1
q
)
p
= a
p
q
;
il discorso è del tutto analogo se p < 0.
Si ottengono allora facilmente le estensioni delle proprietà (i)-(vii) al caso di
esponenti razionali (vedere esercizio 1.10.3):
(i) a
r
> 0 r Q, a
0
= 1;
(ii) a
r+s
= a
r
a
s
r, s Q;
(iii) a
rs
= (a
r
)
s
r, s Q;
(iv) (ab)
r
= a
r
b
r
r Q;
(v) a 0;
(vi)
_
a < 1 = a
r
< 1
a > 1 = a
r
> 1
r Q con r > 0;
(vii)
_
a < 1 = a
r
< a
s
a > 1 = a
r
> a
s
r, s Q con r > s.
49
4
o
passo (esponenti reali) Manco a dirlo, nellestensione da Q a R è
essenziale lassioma di continuità. Prima di denire la quantità a
x
per x R,
dimostriamo il seguente risultato che ci illuminerà sul modo di procedere.
Proposizione 1.10.2 Siano a, x R con a > 0, e poniamo
A = a
r
: r Q, r < x, B = a
s
: s Q, s > x.
Allora gli insiemi A e B sono separati; in particolare, se a 1 si ha sup A =
inf B, mentre se a 1 risulta inf A = sup B.
Dimostrazione Supponiamo a 1 e poniamo = sup A, = inf B; questi
numeri , sono niti (esercizio 1.10.4). Da (vii) segue che
a
r
< a
s
r, s Q con r < x < s,
quindi risulta . Dobbiamo provare che = . Se fosse invece < ,
dal fatto che
inf
nN
+
a
1
n
= 1
(esempio 1.8.3 (1)) segue che possiamo scegliere n N
+
tale che
1 < a
1
n
<

.
Scelto poi r Q tale che x
1
n
< r < x, il che è lecito per la densità dei
razionali in R (corollario 1.6.8), si ha r +
1
n
> x; dunque, usando (ii),
a
r+
1
n
= a
r
a
1
n
a
1
n
<

= .
Ciò è assurdo e pertanto = .
Supponiamo adesso 0 < a 1 e poniamo L = inf A, M = sup B; nuo-
vamente, questi numeri L, M sono niti (esercizio 1.10.4). Da (vii) segue
stavolta
a
r
> a
s
r, s Q con r < x < s,
cosicche L M. Se fosse L > M, preso n N
+
tale che
M
L
< a
1
n
< 1
50
(lecito, essendo sup
nN
+ a
1
n
= 1) e scelto s Q con x < s < x +
1
n
, si ha
s
1
n
< x e dunque, per (ii),
L a
s
1
n
=
a
s
a
1
n
M
a
1
n
< M
L
M
= L.
Ciò è assurdo e pertanto L = M.
La precedente proposizione ci dice che la nostra scelta per denire a
x
è
obbligata: se vogliamo mantenere la proprietà (vii) siamo forzati a dare
questa
Denizione 1.10.3 Siano a, x R con a > 0. Indichiamo con a
x
il numero
reale seguente:
a
x
=
_
supa
r
: r Q, r < x = infa
s
: s Q, s > x se a 1
infa
r
: r Q, r < x = supa
s
: s Q, s > x se 0 < a 1.
Non è dicile vericare che nel caso in cui x è razionale questa denizione
concorda con la precedente (esercizio 1.10.4).
Osservazioni 1.10.4 (1) Dalla denizione segue subito che 1
x
= 1 per
ogni x R.
(2) Per ogni a > 0 e per ogni x R risulta a
x
=
1
a
x
. Infatti, supposto ad
esempio a 1, si ha
a
x
= supa
r
: r Q, r < x = (posto s = r)
= supa
s
: s Q, s > x = (per denizione nel caso
di esponente razionale)
= sup
_
1
a
s
: s Q, s > x
_
= (per lesercizio 1.10.5)
=
1
infa
s
: s Q, s > x
=
1
a
x
;
il discorso è analogo se 0 < a 1.
Estendiamo adesso le proprietà (i)-(vii) al caso di esponenti reali. La (i) è
evidente. Per la (ii) si ha:
Proposizione 1.10.5 Per ogni a > 0 si ha
a
x+y
= a
x
a
y
x, y R.
51
Dimostrazione Supponiamo ad esempio a 1. Poiche
a
x+y
= supa
q
: q Q, q < x +y,
per ogni r, s Q con r < x e s < y si ha r +s < x +y e quindi
a
r
a
s
= a
r+s
a
x+y
.
Passando allestremo superiore separatamente rispetto a r e rispetto a s,
otteniamo (esercizio 1.5.15)
a
x
a
y
a
x+y
.
In modo del tutto analogo, usando il fatto che
a
x+y
= infa
q
: q Q, q > x +y,
si prova che a
x
a
y
a
x+y
. La tesi è cos` provata quando a 1.
Nel caso 0 < a 1 si procede esattamente come sopra: lunica dierenza è
che dalla relazione
a
x+y
= infa
q
: q Q, q < x +y
segue che a
x
a
y
a
x+y
, mentre dalla relazione
a
x+y
= supa
q
: q Q, q < x +y
segue che a
x
a
y
a
x+y
.
Proviamo ora (iv) e (iii); per le proprietà (v), (vi), (vii) si rimanda agli
esercizi 1.10.6, 1.10.7 e 1.10.8.
Proposizione 1.10.6 Per ogni a, b > 0 si ha
(ab)
x
= a
x
b
x
x R.
Dimostrazione Supponiamo a, b 1. Usando la caratterizzazione di a
x
,
b
x
, (ab)
x
mediante gli estremi superiori, si vede che per ogni r Q con r < x
si ha
a
r
b
r
= (ab)
r
(ab)
x
.
Daltra parte ssato > 0 esistono r, r
Q con r < x e r
< x tali che

a
x
< a
r
a
x
, b
x
 0,
a
x
b
x
(b
x
+a
x
) < (ab)
x
ossia
a
x
b
x
< (ab)
x
+(a
x
+b
x
) ]0, mina
x
, b
x
[;
per il lemma dellarbitrarietà di si deduce che a
x
b
x
(ab)
x
.
Utilizzando invece le caratterizzazioni di a
x
, b
x
, (ab)
x
mediante gli estremi
inferiori, si ottiene in modo analogo che a
x
b
x
(ab)
x
. La tesi è cos` provata
quando a, b 1.
Se a, b 1 si procede in modo simmetrico: usando le caratterizzazioni con
gli estremi superiori si trova che a
x
b
x
(ab)
x
, usando quelle con gli estremi
inferiori si trova laltra disuguaglianza.
Inne se a > 1 > b e, ad esempio, ab 1, allora usando le caratterizzazioni
con gli estremi superiori avremo:
a
r
b
r
= (ab)
r
(ab)
x
r Q con r < x,
e per ogni > 0 esistono r
, s
Q, con r
< x, s
> x, tali che

a
x
< a
r
a
x
, b
x
< b
s
b
x
;
dunque se 0 < < mina
x
, b
x
si ricava, ricordando che b
s
1,
0 < (a
x
)(b
x
) < a
r
b
s
a
r
b
r
= (ab)
r
(ab)
x
,
da cui, procedendo come prima, a
x
b
x
(ab)
x
. Similmente, usando le carat-
terizzazioni con gli estremi inferiori, si arriva alla disuguaglianza opposta. Se
a > 1 > b e ab 1, la procedura è la stessa, mutatis mutandis, e lasciamo
i dettagli al lettore.
53
Osservazione 1.10.7 Dalla proposizione precedente segue, in particolare,
che
a
x
_
1
a
_
x
= 1
x
= 1 a > 0, x R,
cioè, ricordando losservazione 1.10.4,
1
a
x
= a
x
=
_
1
a
_
x
a > 0, x R.
Proposizione 1.10.8 Per ogni a > 0 si ha
(a
x
)
y
= a
xy
x, y R.
Dimostrazione
`
E suciente considerare il caso x, y 0: infatti, provata
la tesi in questo caso, se minx, y < 0 ci si riconduce ad esso nel modo
seguente:
(a
x
)
y
=
_
1
a
x
_
y
=
1
a
(x)y
= a
xy
se x < 0 y;
(a
x
)
y
=
1
(a
x
)
y
=
1
a
xy
= a
xy
se y < 0 x;
(a
x
)
y
=
1
(a
x
)
y
=
1
_
1
a
x
_
y
=
1
1
a
(x)(y)
= a
(x)(y)
= a
xy
se x, y < 0.
Siano dunque x, y 0: se x = 0 oppure y = 0 la tesi è evidente, dunque
possiamo assumere x, y > 0. Consideriamo dapprima il caso a 1: in
particolare avremo anche a
x
1. Usando la caratterizzazione con gli estremi
superiori, si ha che
(a
r
)
s
= a
rs
a
xy
r, s Q con r < x e s < y,
e per ogni ]0,
1
2
[ esistono r
, s
Q tali che 0 < r
< x, 0 < s
< y e
a
x
(1 ) < a
r
a
x
, (a
x
)
y
(1 ) < (a
x
)
s
(a
x
)
y
.
Dunque, facendo uso della proposizione 1.10.8 e tenendo conto che s
0 e
0 < r
< xy, si ottiene

(a
x
)
y
<
(a
x
)
s
1
=
(a
x
)
s
(1 )
s
(1 )
s
+1
=
[a
x
(1 )]
s
(1 )
s
+1

a
r
(1 )
s
+1

a
xy
(1 )
s
+1
.
54
Da qui, scegliendo n N tale che s
+1 n, e osservando che da <

1
2
segue
1
1
< 1 + 2, concludiamo che
(a
x
)
y
<
a
xy
(1 )
s
+1
< a
xy
(1 + 2)
n
.
Daltra parte, dalla formula del binomio (teorema 1.7.1) e dallosservazione
1.7.2 (3) segue che
(1 + 2)
n
= 1 +
n
k=1
_
n
k
_
(2)
k
< 1 + 2
n
k=1
_
n
k
_
< 1 + 2
n+1
,
da cui nalmente
(a
x
)
y
< a
xy
+a
xy
2
n+1

_
0,
1
2
_
,
e dunque (a
x
)
y
a
xy
in virt` u dellarbitrarietà di .
In modo analogo, usando la caratterizzazione con gli estremi inferiori, si prova
la disuguaglianza opposta: ciò conclude la dimostrazione nel caso a 1.
Se 0 < a 1 si procede in modo analogo: la caratterizzazione con gli estremi
superiori implicherà che (a
x
)
y
a
xy
, mentre quella con gli estremi inferiori
porterà alla disuguaglianza opposta. La tesi è cos` provata.
Logaritmi
Abbiamo visto che la funzione esponenziale di base a (con a numero positivo
e diverso da 1) è denita per ogni x R ed è a valori in ]0, [. Essa è
strettamente monotòna, ossia verica (esercizio 1.10.8)
x < y = a
x
< a
y
se a > 1, x < y = a
x
> a
y
se a < 1 :
se a > 1 è dunque una funzione strettamente crescente su R, se a < 1 è
strettamente decrescente su R. In particolare, essa è iniettiva: ciò signica
che ad esponenti distinti corrispondono potenze distinte, ossia
a
x
= a
y
= x = y.
Inoltre la funzione esponenziale ha per codominio la semiretta ]0, [, vale
a dire che ogni numero positivo è uguale ad una potenza di base a, per un
opportuno esponente x R; ciò è garantito dal seguente risultato:
55
Teorema 1.10.9 Se a è un numero positivo diverso da 1, allora per ogni
y > 0 esiste un unico x R tale che a
x
= y; tale numero x si chiama
logaritmo in base a di y e si indica con x = log
a
y.
Dimostrazione Lunicità di x è conseguenza delliniettività della funzione
esponenziale. Proviamo lesistenza. Trattiamo dapprima il caso a > 1, y > 1:
consideriamo linsieme
A = t R : a
t
< y,
che è certamente non vuoto, essendo 0 A. Notiamo che A è anche limi-
tato superiormente. Infatti esiste n N tale che a
n
> y, dato che per la
disuguaglianza di Bernoulli (esercizio 1.7.5) si ha a
n
> 1 +n(a 1) > y non
appena n >
y1
a1
; quindi risulta a
n
> y > a
t
per ogni t A, da cui n > t per
ogni t A, ossia ognuno di tali n è un maggiorante di A. Poniamo allora
x = sup A, e mostriamo che a
x
= y.
Se fosse a
x
> y, scelto n N in modo che a
1/n
< a
x
1
y
, il che è possibile
grazie allesempio 1.8.3 (1), avremmo a
x1/n
> y > a
t
per ogni t A, da cui
x
1
n
> t per ogni t A: ne seguirebbe che x
1
n
sarebbe un maggiorante
di A, il che contraddice la denizione di x. Se fosse a
x
< y, scelto n in
modo che a
1/n
< y a
x
, avremmo a
x+1/n
< y, cioè x +
1
n
A, nuovamente
contraddicendo la denizione di x. Perciò a
x
= y, e la tesi è provata nel caso
a > 1, y > 1.
Se a > 1, y = 1 allora chiaramente x = 0. Se a > 1, 0 < y < 1, allora
1
y
> 1,
cosicche per quanto già visto esiste un unico x
R tale che a
x
=
1
y
; quindi,
posto x = x
, si ha a
x
= a
x
= y.
Inne, se 0 < a < 1 e y > 0, per quanto visto esiste un unico x
R tale che
(1/a)
x
= y; posto x = x
, ne segue a
x
= y.
La funzione esponenziale (con base positiva e diversa da 1) è dunque inver-
tibile: la funzione inversa, che ad ogni y > 0 associa lunico esponente x R
per il quale si ha a
x
= y, è il logaritmo di base a:
a
x
= y x = log
a
y.
La funzione logaritmo è denita su ]0, [, a valori in R, ed è ovviamente
anchessa bigettiva: dunque per ogni x R esiste un unico y > 0 tale che
log
a
y = x, e tale y è precisamente a
x
. Si hanno dunque le relazioni
a
log
a
y
= y y > 0, log
a
a
x
= x x R.
56
Dalle proprietà dellesponenziale seguono le corrispondenti proprietà dei lo-
garitmi:
log
a
(bc) = log
a
b + log
a
c b, c > 0, a ]0, [1
(conseguenza di a
x+y
= a
x
a
y
, scegliendo x = log
a
b, y = log
a
c);
log
a
1
c
= log
a
c c > 0, a ]0, [1
(conseguenza di a
x
=
1
a
x
a
c);
log
a
c = log
a
b log
b
c c > 0, a, b ]0, [1
(conseguenza di (a
x
)
y
= a
xy
a
b, y = log
b
c). In particolare:
log
a
b
c
= log
a
b log
a
c b, c > 0, a ]0, [1,
log
a
1 = 0 a ]0, [1,
log
a
b
c
= c log
a
b c R, b > 0, a ]0, [1,
log
a
b =
1
log
b
a
a, b ]0, [1.
I graci approssimativi delle funzioni a
x
, log
a
x sono riportati di seguito.
57
Landamento qualitativo del graco di a
x
è giusticato dalle seguenti consi-
derazioni: se a > 1, lincremento della quantità a
x
nel passaggio da 0 a è
pari a a
1, mentre nel passaggio da t a t + è pari a a

t+
a
t
, ossia a
a
t
(a
1). Dunque è lo stesso di prima, dilatato o contratto di un fattore a

t
(che è maggiore di 1 se t > 0, minore di 1 se t < 0). Se 0 < a < 1, vale lo
stesso discorso, ma rovesciato: si hanno incrementi dilatati se t < 0, contratti
se t > 0.
Il graco qualitativo di log
a
x si ottiene da quello di a
x
per riessione rispetto
alla retta y = x, come sempre accade per le funzioni inverse (osservazione
58
1.3.1).
Esercizi 1.10
1. Dimostrare le regole di calcolo con esponenti naturali, ossia le proprietà
(i)-(vi) enunciate nel 1
o
passo.
2. Si provi che
a 1 a
1/n
1 n N
+
;
0 < a 1 a
1/n
1 n N
+
.
3. Dimostrare le regole di calcolo con esponenti razionali, ossia le proprietà
(i)-(vii) enunciate nel 3
o
passo.
4. Per a > 0 poniamo
A = a
r
: r Q, r < x, B = a
s
: s Q, s > x.
Si provi che A e B sono limitati inferiormente, e che:
(i) se a 1, A è limitato superiormente, mentre se a 1, B è limitato
superiormente;
(ii) supposto x =
p
q
Q, se a 1 si ha a
p/q
= sup A = inf B, mentre
se a 1 si ha a
p/q
= inf A = sup B.
5. Sia A un insieme non vuoto contenuto nella semiretta ]0, [. Si provi
che
sup
_
1
x
: x A
_
=
_
+ se inf A = 0
1
inf A
se inf A > 0,
inf
_
1
x
: x A
_
=
_
0 se sup A = +
1
sup A
se sup A < +.
6. Siano a, b > 0 e x > 0. Si provi che se a 0. Si provi che se a < 1 allora a
x
< 1, mentre se a > 1
allora a
x
> 1.
59
8. Siano a > 0 e x, y R con x < y. Si provi che se a < 1 allora a
x
> a
y
,
mentre se a > 1 allora a
x
< a
y
.
9. Dimostrare che lequazione 37
x
= (0.58)
x
3
non ha soluzioni reali diverse
da 0.
10. Risolvere le seguenti equazioni:
(i)
8
x
=
1
4
; (ii) 9
1/(x1)
= 3
1/(3x1)
;
(iii) 7
x
2
5x+9
= 343; (iv)
(5
2x
)
3+x
25
x1
=
(5
x2
)
2x3
25
2x
125
3
;
(v)
_
x +y = 4
3
xy
= 27
; (vi)
_
x
2
+y
2
= 17
5
x+y
= 125
;
(vii) 8
5x
2
3
x
2
+1
= 2
153x
2
3x
2
+1
; (viii) 81
2x1
+ 2 9
4x
+ 711 = 81
2x+1
+
1
9
.
(i) 7
x+1
+ 7
x1
= 5
x
; (ii)
4
x
15
4
4
x
= 16;
(iii) 3
x+1
5
1x
; (iv)
1
2
< [2
x
1[ < 2;
(v) log
3
x log
1/3
x > 2; (vi) log
1/2
(2x + 3) 3;
(vii) [log
10
[x[[ = 100; (viii) (3 2
x
)(5
x/2
2) > 0;
(ix) log
3
_
log
4
(x
2
5)
_
< 0 ; (x) log
2
[x[ 3 log
4
[x[;
(xi) log
4
x
2
log
8
x =
5
3
; (xii) log
2x
x <
1
2
;
(xiii)
_
y
x
= 10
4
y
1/x
= 10
(xiv)
_
xy = 1/2
x
log
2
y
=
1
4
.
12. Dimostrare che
[a
x
1[ a
|x|
1 a 1, x R.
1.11 Geometria nel piano
In geometria il piano, come la retta, è un concetto primitivo. Lassioma che
permette di identicare una retta orientata con linsieme dei numeri reali ci
60
consente anche di rappresentare univocamente i punti del piano con coppie
di numeri reali. Per fare ciò, si deve ssare il sistema di riferimento, che è
costituito da tre oggetti: (a) un punto origine O, (b) due direzioni, ossia
due rette orientate (non coincidenti e non opposte) passanti per O, e inne
(c) unorientazione: si deve decidere quale sia la prima direzione e quale la
seconda; la prima retta si chiama asse delle ascisse, o asse x e la seconda asse
delle ordinate, o asse y. Si dice che il sistema è orientato positivamente se,
partendo dal lato positivo dellasse x e girando in verso antiorario, si incontra
il lato positivo dellasse y prima di quello negativo. Il sistema è orientato
negativamente nel caso opposto. Noi considereremo soltanto sistemi di rife-
rimento orientati positivamente.
A questo punto si proietta P su ciascuna retta parallelamente allaltra: alle
sue due proiezioni A sullasse x e B sullasse y corrispondono univocamente
(per quanto visto) due numeri reali a, b, che si chiamano coordinate di P (ri-
spettivamente, ascissa e ordinata). La coppia (a, b) determina allora in modo
unico il punto P: si noti che se a ,= b le coppie (a, b) e (b, a) individuano punti
diversi. In denitiva, il piano si può identicare con il prodotto cartesiano
R
2
= R R. Nel seguito questa identicazione sarà sistematica.
`
E comodo, anche se per nulla necessario, utilizzare sistemi di riferimento or-
togonali, nei quali cioè le due direzioni sono perpendicolari fra loro; è anche
utile (ma talvolta controindicato) scegliere la stessa unità di misura per le
ascisse e per le ordinate: si parla allora di coordinate cartesiane ortogonali
monometriche.
61
I punti di R
2
si possono sommare fra loro e moltiplicare per una costante
reale, utilizzandone la rappresentazione in coordinate: se P = (x
P
, y
P
) e
Q = (x
Q
, y
Q
) sono punti di R
2
, la loro somma P +Q è il punto di coordinate
(x
P
+x
Q
, y
P
+y
Q
); se P = (x
P
, y
P
) R
2
e è un numero reale, il prodotto
P è il punto di coordinate (x
P
, y
P
). Scriveremo in particolare P in
luogo di (1)P, e questo permette di denire la sottrazione: P Q signi-
ca P + (1)Q e dunque ha coordinate (x
P
x
Q
, y
P
y
Q
). La somma e la
sottrazione si possono rappresentare gracamente per mezzo della cosiddetta
regola del parallelogrammo.
Per queste operazioni valgono le usuali proprietà della somma e del prodotto
ordinari (associatività, commutatività, distributività, eccetera). La possibi-
lità di eettuare queste operazioni sui punti del piano denisce in R
2
una
struttura di spazio vettoriale, e per questo i punti di R
2
sono anche detti
vettori.
62
Distanza in R
2
Il passo successivo è quello di rappresentare, e quindi denire mediante i
numeri reali, le principali proprietà ed entità geometriche. Cominciamo con
la fondamentale nozione di distanza euclidea nel piano.
Denizione 1.11.1 Siano P = (x
P
, y
P
), Q = (x
Q
, y
Q
) due punti di R
2
. La
distanza euclidea fra P e Q è il numero non negativo
PQ =
_
(x
P
x
Q
)
2
+ (y
P
y
Q
)
2
.
Elenchiamo le proprietà di cui gade la distanza euclidea:
(i) (positività) PQ 0 e PQ = 0 se e solo se P = Q;
(ii) (simmetria) PQ = QP per ogni P, Q R
2
;
(iii) (disuguaglianza triangolare) PQ PR +RQ per ogni P, Q, R R
2
.
Le proprietà (i) e (ii) sono ovvie per denizione;
proviamo la (iii). Poniamo, al solito,
P = (x
P
, y
P
), Q = (x
Q
, y
Q
), R = (x
R
, y
R
)
ed anche, per comodità,
u = x
P
x
R
, v = y
P
y
R
,
w = x
R
x
Q
, z = y
R
y
Q
.
Dobbiamo dimostrare che
_
(u +w)
2
+ (v +z)
2
u
2
+v
2
+
w
2
+z
2
.
In eetti si ha, utilizzando la disuguaglianza di Cauchy-Schwarz (teorema
1.9.3),
(u +w)
2
+ (v +z)
2
= u
2
+w
2
+v
2
+z
2
+ 2(uw +vz)
u
2
+v
2
+w
2
+z
2
+ 2
u
2
+v
2
w
2
+z
2
=
= (
u
2
+v
2
+
w
2
+z
2
)
2
.
La distanza euclidea ha unaltra fondamentale proprietà: linvarianza per
traslazioni. Una traslazione è una trasformazione del piano (cioè una funzione
63
da R
2
in R
2
) che manda ogni punto P nel punto P + U, ove U è un ssato
punto di R
2
. Dalla denizione di distanza è evidente il fatto che
(P +U)(Q+U) = PQ P, Q, U R
2
,
il quale esprime appunto linvarianza per traslazioni della distanza euclidea.
Invece la trasformazione del piano che manda ogni punto P di R
2
nel punto
P, ove è un ssato numero reale, si dice omotetia; il comportamento della
distanza rispetto alle omotetie è il seguente:
(P)(Q) = [[PQ P, Q R
2
, R .
La distanza fra due punti è anche, come suggerisce lintuizione, invariante
rispetto a rotazioni e simmetrie del piano (esercizi 1.11.22 e 1.11.23).
Osservazione 1.11.2 La distanza euclidea PQ fra due punti P e Q coin-
cide, come abbiamo visto, con la distanza di P Q dallorigine O, cioè con
O(P Q). In luogo di questultima notazione si usa spessissimo la seguente:
[P Q[ = PQ =
_
(x
P
x
Q
)
2
+ (y
P
y
Q
)
2
P, Q R
2
;
se Q = O, si scriverà pi` u semplicemente [P[ in luogo di [P O[ (si dice che
[P[ è il modulo del vettore P). Con questa notazione si può scrivere, in modo
pi` u naturale,
[(P +U) (Q+U)[ = [P Q[ P, Q, U R
2
,
[P Q[ = [[ [P Q[ P, Q R
2
, R.
Alla distanza euclidea si associa-
no in modo naturale alcuni spe-
ciali sottoinsiemi del piano: i di-
schi e le circonferenze. Siano P =
(a, b) R
2
e r > 0. Il disco, o
cerchio, di centro P e raggio r è
linsieme
B(P, r) = X R
2
: [X P[ < r = (x, y) R
2
: (x a)
2
+(y b)
2
< r
2
;
il disco chiuso di centro P e raggio r è
B(P, r) = X R
2
: [X P[ r = (x, y) R
2
: (x a)
2
+(y b)
2
r
2
;
la circonferenza di centro P e raggio r è
S(P, r) = X R
2
: [X P[ = r = (x, y) R
2
: (x a)
2
+(y b)
2
= r
2
.
64
Rette
Tutti i sottoinsiemi del piano, in linea di principio, possono essere descritti in
termini delle coordinate dei propri punti, tramite equazioni e disequazioni.
Vediamo come si rappresentano le rette in R
2
.
Se una retta è orizzontale (parallela allasse x), i suoi punti avranno ordinata
y costante e quindi la retta sarà descrittadallequazione
y = k,
ove k è un ssato numero reale. Analogamente, una retta verticale (parallela
allasse y) è costituita da punti di ascissa costante e quindi la sua equazione
sarà
x = h
con h ssato numero reale.
Consideriamo ora una retta r obliqua, ossia non parallela agli assi coordinati.
Fissiamo due punti distinti P e Q in r. Siano poi r
la retta per P parallela

allasse x e r
la retta per Q parallela allasse y: tali rette sono perpendicolari

fra loro e quindi si incontrano in un punto T. Il triangolo PTQ è rettangolo,
di cateti PT e QT.
Se prendiamo due altri punti distinti P
e Q
su r, e ripetiamo la stessa co-

struzione, otteniamo un altro triangolo rettangolo P
, di cateti P
e
Q
, il quale è simile al precedente. Quindi fra le lunghezze dei rispettivi

cateti vale la proporzione
QT : PT = Q
: P
.
65
Dato che, per costruzione, T = (x
Q
, y
P
) e Q
= (x
Q
, y
P
), la proporzione
sopra scritta diventa, dopo un cambiamento di segno,
y
P
y
Q
x
P
x
Q
=
y
P
y
Q
x
P
x
Q
.
Questa relazione è valida per ogni coppia P
, Q
di punti (distinti) di r. Ad
esempio, scegliendo P
= P, pensando P sso e facendo variare Q, si ottiene

che
y
P
y
Q
x
P
x
Q
=
y
P
y
Q
x
P
x
Q
Q, Q
r,
ossia il rapporto m =
y
P
y
Q
x
P
x
Q
è indipendente da Q quando Q varia in r. La
quantità m sopra denita si chiama pendenza o coeciente angolare della
retta r. Se la retta è orizzontale si ha m = 0; se la semiretta (di tale retta)
corrispondente alle y positive forma con la direzione positiva dellasse x un
angolo acuto, si ha m > 0, mentre se tale angolo è ottuso si ha m < 0. Per
le rette verticali il coeciente angolare non è denito, ma si suole dire che
esse hanno pendenza innita.
Come abbiamo visto, se X = (x, y) è un punto di R
2
si ha X r se e solo se
y
P
y
x
P
x
= m;
dunque lequazione cartesiana della retta (obliqua) r è la seguente:
y y
P
= m(x x
P
),
o anche, posto q = y
P
+mx
P
,
y = mx +q.
Il numero reale q è lordinata del punto di incontro di r con lasse y.
Riepilogando ed unicando tutti i casi sopra visti, otteniamo che la pi` u
generale equazione cartesiana di una retta è
ax +by +c = 0
con a, b, c numeri reali tali che a e b non siano entrambi nulli. Se b = 0 la
retta è verticale (di equazione x =
c
a
), se a = 0 la retta è orizzontale (di
equazione y =
c
b
), e se a e b sono entrambi non nulli la retta è obliqua
66
(di equazione y =
a
b
x
c
b
). Notiamo anche che una retta di equazione
ax+by +c = 0 passa per lorigine se e solo se il suo termine noto c è nullo.
Si noti che lequazione cartesiana di una retta è unica a meno di un fattore
di proporzionalità non nullo: se ,= 0, le equazioni
ax +by +c = 0, ax +by +c = 0
individuano la stessa retta.
Inne, la retta passante per due punti distinti assegnati P e Q ha equazione
(x
Q
x
P
)(y y
P
) = (y
Q
y
P
)(x x
P
)
e, se si sa che x
Q
,= x
P
, si può scrivere
equivalentemente
y y
P
=
y
Q
y
P
x
Q
x
P
(x x
P
).
Semirette, segmenti, semipiani
Se invece di una retta occorre descrivere una semiretta, basterà delimitare
linsieme di variabilità della x o della y: per esempio, la semiretta bisettrice
del primo quadrante (x, y) R
2
: x, y 0 è descritta dallequazione
y = x, x 0, oppure y = x, x > 0
a seconda che si consideri la semiretta chiusa, ossia comprendente il suo
estremo, oppure aperta, cioè senza lestremo.
Analogamente, il segmento (chiuso) di estremi P e Qsulla retta r di equazione
ax +by +c = 0 è descritto (supponendo x
P
< x
Q
) dalle condizioni
ax +by +c = 0, x
P
x x
Q
.
(Se risultasse x
P
> x
Q
si scriverà invece x
Q
x x
P
; se poi x
P
= x
Q
, sarà
necessariamente y
P
< y
Q
oppure y
P
> y
Q
e scriveremo allora le limitazioni
y
P
y y
Q
oppure y
Q
y y
P
.)
67
Se il segmento lo si vuole aperto, o semichiuso a destra, o semichiuso a
sinistra, occorrerà rendere strette una o laltra o entrambe le disuguaglianze.
Se una retta r ha equazione ax + by + c = 0 e se P / r, si ha ovviamente
ax
p
+by
P
+c ,= 0. I due insiemi
+
= (x, y) R
2
: ax +by +c 0,
= (x, y) R
2
: ax +by +c 0
sono i due semipiani (chiusi) delimitati da r (se li si vuole aperti basta met-
tere le disuguaglianze strette). Per disegnarli, basta tracciare la retta r, poi
scegliere un punto P fuori di r e vedere il segno dellespressione ax
P
+by
P
+c:
se è positivo, il semipiano contenente P sarà
+
, se è negativo sarà
. Ad
esempio, il semipiano
+
relativo alla retta
10x 6y + 7 = 0 è quello che sta al di
sotto: infatti la retta incontra lasse y nel
punto (0,
7
6
) e quindi lorigine, che appartie-
ne a
+
, sta sotto la retta.
Lintersezione di due rette non parallele è un
punto, le cui coordinate si ottengono metten-
do a sistema le equazioni delle due rette: il
fatto che le pendenze delle rette siano diverse
garantisce la risolubilità del sistema.
Se invece le rette sono parallele, il sistema
avrà innite soluzioni o nessuna soluzione a
seconda che le rette siano coincidenti o no.
Lintersezione di due semipiani è un angolo convesso, cioè minore dellango-
lo piatto; un angolo concavo (maggiore dellangolo piatto) si ottiene invece
facendo lunione di due semipiani. Un triangolo si ottiene intersecando tre
68
(opportuni) semipiani; ogni poligono convesso di n lati si ottiene come inter-
sezione di n semipiani. I poligoni non convessi si realizzano tramite opportune
unioni e intersezioni di semipiani.
Rette e segmenti in forma parametrica
Consideriamo il segmento S di estremi (distinti) A = (x
A
, y
A
) e B = (x
B
, y
B
)
e supponiamo, per ssare le idee, che sia x
A
< x
B
e y
B
,= y
A
. Come sappiamo,
si ha
S =
_
(x, y) R
2
: y y
A
=
y
B
y
A
x
B
x
A
(x x
A
), x [x
A
, x
B
]
_
.
Se P = (x, y) S, si ha, per ragioni di similitudine,
[P A[
[B A[
=
x x
A
x
B
x
A
=
y y
A
y
B
y
A
[0, 1].
Poniamo
t =
[P A[
[B A[
:
poiche P S, si ha t [0, 1]. Le coordinate x, y di P vericano allora
_
x = x
A
+t(x
B
x
A
)
y = y
A
+t(y
B
y
A
).
Quindi ogni P S si rappresenta nella forma sopra descritta, con un oppor-
tuno t [0, 1]. Viceversa, sia P = (x, y) dato dal sistema sopra scritto, per
un certo t [0, 1]: allora si ha
xx
A
x
B
x
A
=
yy
A
y
B
y
A
= t, cosicche P appartiene
alla retta passante per A e B; daltra parte, essendo x x
A
= t(x
B
x
A
),
si ha 0 x x
A
x
B
x
A
, ossia x [x
A
, x
B
]. Pertanto P appartiene al
segmento S.
Il sistema
_
x = x
A
+t(x
B
x
A
)
y = y
A
+t(y
B
y
A
),
t [0, 1]
fornisce le equazioni parametriche del segmento S. Alle stesse equazioni si
perviene, come è facile vericare, quando x
A
> x
B
(basta scambiare i ruoli
di A e B ed eettuare la sostituzione s = (1 t)), ed anche quando y
A
= y
B
69
(segmento orizzontale) oppure x
A
= x
B
e y
A
,= y
B
(segmento verticale). In
forma vettoriale si può scrivere, in modo equivalente,
S = P R
2
: P = A +t(B A), t [0, 1].
In modo analogo, il sistema
_
x = x
A
+t(x
B
x
A
)
y = y
A
+t(y
B
y
A
),
t R,
ovvero, in forma vettoriale,
P = A +t(B A), t R,
dà le equazioni parametriche della retta per A e B. Il vettore B A può
essere interpretato come la velocità di avanzamento lungo la retta, mentre il
parametro t rappresenta il tempo di percorrenza: allistante t = 0 ci troviamo
in A, allistante t = 1 transitiamo in B, per valori t > 1 ci spingiamo oltre
B mentre per t < 0 siamo dallaltra parte, oltre A.
Parallelismo e perpendicolarità
Due rette r, r
sono parallele se e solo se hanno lo stesso coeciente angola-

re, cosicche le rispettive equazioni cartesiane, a parte uneventuale costante
moltiplicativa, dieriscono solamente per il termine noto. Se le rette hanno
equazioni ax + by + c = 0 e a
x + b
y + c
= 0, esse sono parallele se e solo

se il sistema costituito dalle due equazioni non ha soluzioni (in tal caso le
rette sono parallele e distinte) oppure ne ha innite (e allora le due rette
coincidono). Ciò equivale alla condizione
ab
ba
= 0
(esercizio 1.11.1), la quale esprime appunto il fatto che il sistema costituito
dalle equazioni delle due rette non è univocamente risolubile.
Se le due rette sono scritte in forma parametrica:
r = X = P +tQ, t R, r
= X = A +tB, t R,
esse risultano parallele se e solo se esiste R 0 tale che Q = B
(esercizio 1.11.13).
Due segmenti PQ, AB, dunque di equazioni parametriche
PQ = X = P+t(QP), t [0, 1], AB = X = A+t(BA), t [0, 1],
70
sono paralleli se le rette che li contengono sono parallele: quindi se e solo se
QP è proporzionale a B A.
Una retta r è parallela ad un segmento PQ se è parallela alla retta che lo
contiene.
Scriviamo ora lequazione cartesiana di una retta r
perpendicolare ad una
retta r assegnata.
`
E chiaro che se r è orizzontale allora r
è verticale, e se r è
verticale allora r
è orizzontale. Supponiamo r obliqua: se P e Q sono punti

distinti di r, sappiamo che la pendenza di r è m =
y
P
y
Q
x
P
x
Q
; se ora P
e Q
sono punti distinti di r
, costruiamo i punti T e T
di intersezione delle rette

parallele agli assi passanti rispettivamente per P, Q e per P
, Q
, come si è
fatto in precedenza. I triangoli rettangoli PTQ e P
sono ancora simili,

ma le coppie di cateti sono scambiate e si ha
QT : PT = P
: Q
,
da cui
y
Q
y
P
x
Q
x
P
=
x
Q
x
P
y
Q
y
P
=
1
m
,
e in denitiva la pendenza di r
è m
=
1
m
.
Di conseguenza, se r ha equazione del tipo ax + by + c = 0, le rette per-
pendicolari a r hanno equazioni della forma bx + ay + k = 0, con k R
arbitrario.
Vediamo ora come si esprime la perpendicolarità fra segmenti. Consideria-
mo due segmenti OP, OQ con un vertice nellorigine O, ove P = (x
P
, y
P
) e
Q = (x
Q
, y
Q
) sono punti distinti e diversi da O. Il fatto che OP sia perpendi-
colare ad OQ si può descrivere in termini di distanza: signica che O, fra tutti
71
i punti della retta r contenente OQ, è quello situato a minima distanza da P.
Traduciamo questo in termini di coordina-
te: poiche i punti tQ, al variare di t R,
descrivono la retta r, deve aversi
[P[ [P tQ[ t R.
Elevando al quadrato i due membri si ricava,
per denizione di distanza,
x
2
P
+y
2
P
(x
P
tx
Q
)
2
+ (y
P
ty
Q
)
2
=
= x
2
P
+y
2
P
2t(x
P
x
Q
+y
P
y
Q
) +t
2
(x
2
Q
+y
2
Q
) t R,
ovvero
t
2
(x
2
Q
+y
2
Q
) 2t(x
P
x
Q
+y
P
y
Q
) 0 t R.
Ciò è possibile se e solo se il discriminante di questo polinomio di secondo
grado è non positivo: dunque deve essere
(x
p
x
Q
+y
P
y
Q
)
2
0,
ossia
x
P
x
Q
+y
P
y
Q
= 0.
Questa condizione è pertanto equivalente alla perpendicolarità dei segmenti
OP e OQ. Essa dipende solo dalle coordinate di P e di Q: dunque esprime
una proprietà che riguarda intrinsecamente i punti P e Q, e che è naturale
prendere come denizione di ortogonalità fra vettori di R
2
(e non pi` u fra
segmenti di R
2
).
Denizione 1.11.3 Diciamo che due vettori P = (x
P
, y
P
) e Q = (x
Q
, y
Q
)
di R
2
sono fra loro ortogonali, se i segmenti OP e OQ sono perpendicolari,
ossia se risulta
x
P
x
Q
+y
P
y
Q
= 0.
Due segmenti qualunque PQ e AB sono perpendicolari se e solo se i vettori
QP e B A sono ortogonali, ossia se e solo se
(x
Q
x
P
)(x
B
x
A
) + (y
Q
y
P
)(y
B
y
A
) = 0.
Consideriamo ancora due rette r, r
, scritte stavolta in forma parametrica:

r = X = P +tQ, t R, r
= X = A +tB, t R.
72
Allora la direzione di r è quella del vettore Q e la direzione di r
è quella del
vettore B: perciò esse sono perpendicolari se e solo se Q e B sono vettori
ortogonali, vale a dire se e solo se x
Q
x
B
+y
Q
y
B
= 0.
Supponiamo invece, nuovamente, che r, r
siano scritte in forma cartesiana:

r = (x, y) : ax +by +c = 0, r
= (x, y) : a
x +b
y +c
= 0,
e consideriamo le rette ,
parallele a r ed a r
e passanti per lorigine:

= (x, y) : ax +by = 0,
= (x, y) : a
x +b
y = 0.
Dalla denizione 1.11.3 segue subito che è linsieme dei vettori che sono
ortogonali al vettore dei suoi coecienti (a, b), mentre
è, analogamente,
linsieme dei vettori che sono ortogonali a (a
, b
); se ne deduce che e
(e
quindi anche r e r
) sono fra loro perpendicolari se e solo se i vettori (a, b) e

(a
, b
) sono fra loro ortogonali, cioè se e solo se

aa
+bb
= 0.
Ritroviamo cos` il fatto che le equazioni di r e r
sono, a meno di un fattore

di proporzionalità, della forma
r = (x, y) : ax +by +c = 0, r
= (x, y) : bx ay +c
= 0.
Si noti che comunque si ssi U = (u, v) r, la retta r descrive linsieme
dei vettori X = (x, y) tali che X U è ortogonale al vettore dei coecienti
A = (a, b): infatti, essendo U r si ha c = (au +bv), da cui
(x u)a + (y v)b = ax +by +c = 0.
Esempio 1.11.4 La retta r di
equazione x y = 0 è la bi-
settrice degli assi coordinati. La
perpendicolare a r passante per
(2, 5) è la retta r
di equazione
(x + 2) (y 5) = 0, ovvero,
pi` u semplicemente, x + y 3 =
0. La parallela a r passante per
(1, 4) è la retta r
di equazio-
ne (x + 1) (y + 4) = 0, ossia
x y 3 = 0.
73
Prodotto scalare
In R
2
, oltre alla somma ed al prodotto per scalari, è denita unaltra ope-
razione fra vettori: il prodotto scalare, che a due vettori assegnati fa cor-
rispondere una quantità scalare, vale a dire un numero reale, e che come
vedremo ha un rilevante signicato geometrico.
Denizione 1.11.5 Siano P = (x
P
, y
P
), Q = (x
Q
, y
Q
) punti di R
2
. La
quantità
x
P
x
Q
+y
P
y
Q
si chiama prodotto scalare fra P e Q e si indica con P Q.
Le proprietà del prodotto scalare sono le seguenti: per ogni P, Q, R R
2
si
ha
(i) P P = [P[
2
;
(ii) P Q = Q P;
(iii) (P +Q) R = P R +Q R;
(iv) [P Q[ [P[ [Q[.
Le prime tre proprietà sono immediata conseguenza della denizione; la quar-
ta è una riformulazione della disuguaglianza di Cauchy-Schwarz.
Vale anche il seguente sviluppo del binomio:
[P Q[
2
= [P[
2
+[Q[
2
2 P Q P, Q R
2
(esercizio 1.11.8).
Dalla denizione di prodotto scalare e dalla denizione 1.11.3 segue che due
vettori P e Q sono fra loro ortogonali se e solo se P Q = 0.
Ma il signicato geometrico del prodotto scalare non è tutto qui: data una
retta r per lorigine, di equazione ax+by = 0, il vettore Q = (a, b) appartiene
al semipiano
+
= (x, y) R
2
: ax + by 0, come si verica immedia-
tamente. Poiche il segmento OQ è perpendicolare alla retta, si deduce che
+
è linsieme dei vettori P tali che i segmenti OP e OQ formano un angolo
acuto, mentre
= (x, y) R
2
: ax + by 0 è linsieme dei vettori P
tali che langolo fra i segmenti OP e OQ è ottuso. Daltra parte, si ha, per
denizione di prodotto scalare,
+
= P R
2
: P Q 0,
= P R
2
: P Q 0;
74
se ne deducono le equivalenze
QOP acuto P Q > 0,
QOP retto P Q = 0,
QOP ottuso P Q < 0.

Distanza di un punto da una retta
Sia r una retta di equazione ax +by +c = 0, e sia U = (x
U
, y
U
) un punto di
R
2
. Vogliamo calcolare la distanza del punto U dalla retta r, ossia il minimo
delle distanze UP al variare di P r; denoteremo tale distanza con d(U, r).
Supponiamo naturalmente U / r, altrimenti la distanza cercata è 0. Con-
sideriamo la retta r
passante per U e perpendicolare a r: essa intersecherà

r in un punto Q, le cui coordinate (x, y) si determinano, come sappiamo,
risolvendo il sistema
_
ax +by +c = 0
b(x x
U
) +a(y y
U
) = 0,
`
E facile, anche se un po laborioso, dedurre che
x
Q
=
ac +b
2
x
U
aby
U
a
2
+b
2
, y
Q
=
bc abx
U
+a
2
y
U
a
2
+b
2
.
Dato che la minima distanza UP si ottiene per P = Q, ci basterà determinare
UQ. Sviluppando con pazienza i calcoli, si trova
UQ
2
= (x
U
x
Q
)
2
+ (y
U
y
Q
)
2
=
=
1
(a
2
+b
2
)
2
_
_
x
U
(a
2
+b
2
) +ac b
2
x
U
+aby
U
_
2
+
+
_
y
U
(a
2
+b
2
) +bc +abx
U
a
2
y
U
_
2
_
=
=
1
(a
2
+b
2
)
2
_
a
2
(ax
U
+by
U
+c)
2
+b
2
(ax
U
+by
U
+c)
2
=
=
(ax
U
+by
U
+c)
2
a
2
+b
2
,
75
da cui
d(U, r) = UQ =
[ax
U
+by
U
+c[
a
2
+b
2
.
Quindi, ad esempio, la distanza del punto (32, 48) dalla retta di equazione
x 2y 99 = 0 è semplicemente
[32 96 99[
1 + 4
=
163
5
.
Lineare indipendenza
Siano A, B R
2
. Come sappiamo, la somma A+B è il vettore di componenti
(x
A
+y
A
, x
B
+y
B
), e la sua posizione nel piano si determina mediante la regola
del parallelogrammo, il cui nome deriva dal fatto che nel parallelogrammo di
lati OA e OB il quarto vertice è A +B. Consideriamo linsieme
M = P R
2
: , R : P = A +B,
che è il luogo dei quarti vertici di tutti i parallelogrammi costruiti su multipli
dei vettori A e B. Le espressioni A+B, al variare di , R, si chiamano
combinazioni lineari dei vettori A e B: quindi M è linsieme dei vettori P
che sono combinazioni lineari di A e B.
`
E chiaro che O M: per ottenere O
basta scegliere = = 0. A seconda di come si ssano A e B, può capitare
che questo sia lunico modo di ottenere O, o possono invece esistere altri
valori (non nulli) di e tali che A +B = O.
Denizione 1.11.6 Due vettori A, B di R
2
si dicono linearmente indipen-
denti se ogni combinazione lineare nulla di A e B ha necessariamente en-
trambi i coecienti nulli: in altre parole, se vale limplicazione
A +B = O = = = 0.
I due vettori si dicono linearmente dipendenti se non sono linearmente indi-
pendenti, ossia se esistono , R, non entrambi nulli, tali che A+B =
O.
`
E chiaro che A e B sono linearmente dipendenti se e solo se sono allineati con
lorigine; in questo caso linsieme M coincide con la retta per A e B. Quando
invece A e B non sono allineati con O (e in particolare sono entrambi non
nulli), si può agevolmente mostrare che M = R
2
. Sia infatti P = (x, y) R
2
76
e proviamo che esistono e tali che P = A+B. Questa uguaglianza si
può tradurre nel sistema
_
x
A
+x
B
= x
y
A
+y
B
= y
le cui incognite sono e . Risolvendo si
trovano e :
=
yx
B
xy
B
x
B
y
A
y
B
x
A
, =
xy
A
yx
A
x
B
y
A
y
B
x
A
,
il che dimostra che P M, a patto però che risulti x
B
y
A
y
B
x
A
,= 0. Ma
se fosse x
B
y
A
y
B
x
A
= 0, posto C = (y
B
, x
B
) avremmo A C = 0, nonche
B C = 0. Di conseguenza, sia A che B apparterrebbero alla retta di equa-
zione y
B
x +x
B
y = 0, cioè sarebbero allineati con lorigine: ciò è assurdo.
In denitiva, data una qualunque coppia di vettori A, B linearmente indipen-
denti, le combinazioni lineari di tali vettori generano tutto il piano R
2
; in tal
caso ogni P R
2
si può scrivere in uno ed un sol modo come combinazione
lineare di A e B (esercizio 1.11.24).
Esercizi 1.11
1. Dimostrare che il sistema
_
ax +by +c = 0
a
x +b
y +c
= 0
è risolubile univocamente se e solo se risulta ab
ba
,= 0; in tal caso
se ne scriva la soluzione (x, y).
2. Determinare la retta passante per (2, 1) e perpendicolare alla retta di
equazione 4x 3y + 12 = 0.
3. Determinare la retta passante per (0, 0) e per il centro della circonfe-
renza di equazione x
2
+y
2
2x +y = 0.
4. Si calcoli la distanza del punto (3, 2) dalla retta di equazione 4x
3y + 12 = 0.
5. Si suddivida il segmento di estremi (1, 2) e (2, 1) in quattro parti di
egual lunghezza mediante i tre punti P, Q, R. Si calcolino le coordinate
di tali punti.
77
6. Dati P = (2, 5) e Q = (4, 13), trovare le coordinate di un punto R sul
segmento PQ tale che [P R[ = 2 [QR[.
7. Sia R = (2, 3) il punto medio del segmento PQ, ove P = (7, 5).
Determinare le coordinate di Q.
8. Dimostrare che per ogni P, Q R
2
si ha
[P Q[
2
= [P[
2
+[Q[
2
2 P Q.
9. Provare che il triangolo di vertici (2, 1), (4, 2) e (5, 1) è isoscele.
10. Provare che il triangolo di vertici (3, 3), (1, 3) e (11, 1) è rettangolo.
11. Calcolare la lunghezza della mediana uscente dal punto A relativa al
triangolo ABC, ove A = (1, 1), B = (0, 6), C = (10, 2).
12. Scrivere lequazione dellasse del segmento di estremi (0, 2) e (2, 1) (las-
se di un segmento è il luogo dei punti che sono equidistanti dai vertici
del segmento).
13. Si provi che le rette di equazioni parametriche X = P + tQ, t R e
X = A + sB, s R sono fra loro parallele se e solo se esiste R,
non nullo, tale che Q = B.
14. Si provi che le rette di equazioni ax + by + c = 0 e a
x + b
y + c
= 0
sono fra loro parallele se e solo se esiste R 0 tale che a
= a e
b
= b.
15. Si provi che le rette di equazioni ax+by +c = 0 e a
x+b
y +c
= 0 sono
fra loro perpendicolari se e solo se esiste R 0 tale che a = b
,
b = a
.
16. Si provi che le rette di equazioni X = P + tQ, t R, e ax + by + c =
0 sono fra loro perpendicolari se e solo se i vettori Q e (a, b) sono
proporzionali, e sono parallele se e solo se i vettori Q e (b, a) sono
proporzionali.
78
17. Si considerino i luoghi dei punti di R
2
descritti dalle seguenti equazioni:
(i) x
2
+y
2
1 = 0, (v) x
2
+y
2
+xy = 0,
(ii) x
2
+y
2
= 0, (vi) x
2
y
2
= 0,
(iii) x
2
+y
2
+ 1 = 0, (vii) x
2
+y
2
+ 2x + 2y + 2 = 0,
(iv) x
2
+y
2
+ 2xy = 0, (viii) (x
2
1)
2
+y
2
= 0,
e si riconosca quale delle precedenti equazioni rappresenta:
(a) nessun punto, (d) una retta,
(b) un punto, (e) due rette,
(c) due punti, (f) una circonferenza.
18. Si verichi che ogni angolo convesso è lintersezione di due semipiani.
19. Si provi che ogni triangolo in R
2
è lintersezione di tre semipiani.
20. Si provi che ogni quadrilatero in R
2
è lintersezione di quattro semipiani.
21. Vericare che gli insiemi
A = (x, y) R
2
: [x[ 1, [y[ 1, B = (x, y) R
2
: [x[ +[y[ 1
sono quadrati; determinarne i vertici e le lunghezze dei lati.
22. Siano a, b R tali che a
2
+ b
2
= 1. La funzione R : R
2
R
2
, denita
da
R(x, y) = (, ), = ax +by, = bx +ay,
denisce una rotazione del piano (attorno allorigine). Si provi che:
(i) si ha
2
+
2
= x
2
+y
2
per ogni (x, y) R
2
;
(ii) posto U = R(1, 0), V = R(0, 1), le rette per O, U e per O, V for-
mano un sistema di coordinate ortogonali monometriche orientato
positivamente;
(iii) posto (
) = R(x
, y
), si ha (
)
2
+ (
)
2
= (x x
)
2
+
(y y
)
2
per ogni (x, y), (x
, y
) R
2
.
23. Siano a, b R tali che a
2
+ b
2
= 1. La funzione S : R
2
R
2
, denita
da
S(x, y) = (, ), = ax +by, = bx ay,
denisce una simmetria del piano (rispetto a una retta). Si provi che:
79
(i) si ha
2
+
2
= x
2
+y
2
per ogni (x, y) R
2
;
(ii) posto U = S(1, 0), V = S(0, 1), le rette per O, U e per O, V for-
mano un sistema di coordinate ortogonali monometriche orientato
negativamente;
(iii) posto (
) = S(x
, y
), si ha (
)
2
+ (
)
2
= (x x
)
2
+
(y y
)
2
per ogni (x, y), (x
, y
) R
2
;
(iv) i punti (x, y) della bisettrice dellangolo formato dallasse x e dalla
retta bx ay = 0 soddisfano la relazione S(x, y) = (x, y).
24. Si provi che se A, B sono vettori linearmente indipendenti in R
2
, allora
per ogni P R
2
esiste ununica coppia di numeri reali , tali che
P = A +B.
1.12 Numeri complessi
Una delle possibili motivazioni per ampliare il campo dei numeri reali con lin-
troduzione dei numeri complessi è il fatto che nellambito di R non è possibile
risolvere certe equazioni algebriche (cioè equazioni della forma P(x) = 0, con
P(x) polinomio a coecienti reali e x variabile reale). Ad esempio, lequa-
zione x
2
1 = 0 ha le soluzioni reali x = 1, ma lequazione x
2
+1 = 0 non
è risolubile in R. Per risolvere questa ed altre equazioni algebriche occorre
dunque aggiungere nuovi numeri allinsieme dei numeri reali: il primo di essi
è la quantità (certamente non reale) che indichiamo con i, a cui attribuiamo
per denizione la proprietà seguente:
i
2
= 1.
Il numero i è detto unità immaginaria (per pure ragioni storiche: non è me-
no reale di
2, ne pi` u immaginario di
3). Si osservi allora che lequazione

x
2
+ 1 = 0 ha le soluzioni x = i.
Se però vogliamo che anche con laggiunta di questo nuovo numero sia pos-
sibile fare addizioni e moltiplicazioni e restino valide le regole di calcolo vere
in R, dovremo anche aggiungere tutti i numeri che si generano facendo inte-
ragire il numero i con se stesso o con i numeri reali mediante tali operazioni:
dunque nellinsieme allargato di numeri dovremo includere quelli della forma
a +ib (a, b R),
80
ed anche, pi` u generalmente,
a
0
+a
1
i +a
2
i
2
+ +a
n
i
n
(a
0
, a
1
, a
2
, . . . , a
n
R; n N),
cioè tutti i polinomi P(x) a coecienti reali calcolati nel punto x = i.
Fortunatamente, le regole di calcolo e la denizione di i ci dicono che
i
0
= 1 i
1
= i, i
2
= 1 i
3
= i,
i
4
= 1, i
5
= i, i
6
= 1, i
7
= i,
i
4n
= 1, i
4n+1
= i, i
4n+2
= 1, i
4n+3
= i n N,
e quindi è suciente prendere polinomi di grado al pi` u 1. In denitiva,
introduciamo linsieme dei numeri complessi C, denito da
C = a +ib : a, b R;
in altre parole, assegnare un numero complesso a + ib equivale ad assegnare
una coppia (a, b) di numeri reali. La quantità i, meglio scritta come 0 + i1,
appartiene a C perche corrisponde alla scelta (a, b) = (0, 1).
Introduciamo in C le operazioni di somma e prodotto in modo formalmente
identico a R:
(a +ib) + (c +id) = (a +c) +i(b +d),
(a +ib) (c +id) = ac +iad +ibc +i
2
bd = (ac bd) +i(ad +bc).
Si vede subito che gli assiomi di R relativi a somma e prodotto valgono
ancora; in particolare lelemento neutro per la somma è 0 + 0i, lelemento
neutro per il prodotto è 1 + 0i, lopposto di a + ib è (a) + i(b), ovvero
a ib. Vale la legge di annullamento del prodotto:
(a +ib)(0 +i0) = (a 0 b 0) +i(a 0 +b 0) = 0 +i0 a +ib C.
La corrispondenza che ad ogni numero reale a associa la coppia (a, 0) = a+
i0 è chiaramente biunivoca tra R e il sottoinsieme di C costituito dalle coppie
con secondo elemento nullo; inoltre essa preserva la somma e il prodotto, nel
senso che (a) + (a
) = (a + a
) e (a)(a
) = (aa
) per ogni a, a
R.
`
E naturale allora identicare le coppie (a, 0) = a + i0 con i corrispondenti
numeri reali a, ottenendo la rappresentazione semplicata a + i0 = a per
ogni a R; analogamente scriveremo ib anziche 0+ib. Si noti che la legge di
annullamento del prodotto in C ci dice che, nelle notazioni semplicate, deve
essere i0 = 0. In questa maniera si può scrivere R C, o pi` u precisamente
R = a +ib C : b = 0.
81
Se a + ib ,= 0 (cioè è non nullo a, oppure è non nullo b, od anche sono non
nulli entrambi), si può agevolmente vericare che il reciproco di a +ib è
1
a +ib
=
a ib
(a +ib)(a ib)
=
a ib
a
2
i
2
b
2
=
a ib
a
2
+b
2
=
a
a
2
+b
2
i
b
a
2
+b
2
.
In denitiva, in C valgono le stesse proprietà algebriche di R.
Non altrettanto si può dire delle proprietà di ordinamento: in C non è possi-
bile introdurre un ordinamento che sia coerente con le regole di calcolo valide
per R. Infatti, se ciò fosse possibile, per il numero i si avrebbe i > 0, op-
pure i < 0 (non i = 0, in quanto i
2
= 1): in entrambi i casi otterremmo
1 = i
2
> 0, il che è assurdo. Per questa ragione non ha senso scrivere disu-
guaglianze tra numeri complessi, ne parlare di estremo superiore o inferiore
di sottoinsiemi di C.
Dal momento che assegnare un numero complesso equivale ad assegnare una
coppia di numeri reali, vi è una ovvia corrispondenza biunivoca fra C e R
2
,
che associa ad a + ib la coppia (a, b).
`
E naturale allora rappresentare i nu-
meri complessi su un piano cartesiano: il piano complesso, o piano di Gauss.
Lasse delle ascisse è detto asse reale, quello delle ordinate è detto asse im-
maginario. Visualizzeremo i numeri complessi z = a + ib C come vettori
di coordinate (a, b); nel seguito faremo sistematicamente uso di questa iden-
ticazione. Essa, fra laltro, ci permette di rappresentare la somma di due
numeri complessi, ed anche il prodotto z, con R e z C, esattamente
come si è fatto in R
2
(paragrafo 1.11).
Invece la rappresentazione graca del prodotto z w, con z, w C, non ha
un analogo in R
2
; come vedremo, tale rappresentazione sarà possibile con
luso della forma trigonometrica dei numeri complessi, che introdurremo pi` u
avanti.
Se z = a+ib C, il numero reale a è detto parte reale di z, mentre il numero
82
reale b è detto parte immaginaria di z; si scrive
a = Rez, b = Imz,
da cui
z = Rez +i Imz z C.
Se z = a + ib C, il coniugato di z è il numero complesso z denito da
z = a ib. Si ha quindi
Rez = Rez, Imz = Imz,
cioè
z = Rez i Imz z C.
Dunque z è il simmetrico di z rispetto allas-
se reale. Invece, il simmetrico di z rispetto
allasse immaginario è il numero z.
Invertendo le relazioni di z e z in funzione di Rez e Imz, si ricava
Rez =
z +z
2
, Imz =
z z
2i
,
ed in particolare
z R Imz = 0 z = z = Rez,
z = 0 Rez = Imz = 0.
Vediamo le proprietà delloperazione di coniugio, la dimostrazione delle quali
è una semplice verica:
z = z, z +w = z +w, zw = z w,
_
1
z
_
=
1
z
,
_
z
w
_
=
z
w
.
Ad esempio, si ha
i = i, i = i, 1 = 1,
1 = 1, 5 3i = 5 + 3i,
_
1
i
_
=
1
i
= i.
83
Se in C non vi è un buon ordinamento, cè però il modo di valutare quanto
un numero complesso sia grande: si può misurare la sua distanza, intesa nel
senso di R
2
, dallorigine, cioè dal punto 0.
Denizione 1.12.1 Il modulo di un numero complesso z = a + ib è il
numero reale non negativo
[z[ =
a
2
+b
2
=
_
(Rez)
2
+ (Imz)
2
.
Il modulo di z è dunque la distanza del punto (a, b) R
2
dal punto (0, 0)
R
2
; ovvero, è la lunghezza del segmento di estremi 0 e z del piano complesso,
cioè dellipotenusa del triangolo rettangolo di vertici 0, Rez, z. Dalla deni-
zione segue subito, per ogni z C,
[z[ Rez [z[, [z[ Imz [z[.
Si noti che queste sono disuguaglianze
tra numeri reali, non tra numeri com-
plessi!
In particolare, lequazione [z[ = 1 rap-
presenta la circonferenza di centro 0 e
raggio 1 nel piano complesso.
Vediamo le proprietà del modulo di
numeri complessi:
Proposizione 1.12.2 Risulta per ogni z, w C:
(i) z z = [z[
2
;
(ii) [z[ 0, e [z[ = 0 se e solo se z = 0;
(iii) [z[ = [z[ = [ z[;
(iv) [z[ [w[ = [zw[;
(v) (subadditività) [z +w[ [z[ +[w[;
(vi) [[z[ [w[[ [z w[;
(vii) se z ,= 0, allora
1
z
=
1
[z[
e
w
z
=
[w[
[z[
.
84
Dimostrazione Per (i) si ha
z z = (a +ib)(a ib) = a
2
i
2
b
2
= a
2
+b
2
= [z[
2
.
Le proprietà (ii) e (iii) sono evidenti.
Proviamo (iv): usando (i) si ha
[zw[
2
= z w z w = (zz) (ww) = [z[
2
[w[
2
,
Dimostriamo (v): usando (i) e (iv), si ha
[z +w[
2
= (z +w)(z +w) = zz +wz +zw +ww =
= [z[
2
+ 2Re(zw) +[w[
2
[z[
2
+ 2[zw[ +[w[
2
=
= [z[
2
+[w[
2
+ 2[z[[w[ = ([z[ +[w[)
2
,
Per (vi) osserviamo che, grazie a (v), si ha
[z[ = [(z w) +w[ [z w[ +[w[, [w[ = [(w z) +z[ [z w[ +[z[,
cosicche
[z w[ [z[ [w[ [z w[;
ne segue la tesi, per lesercizio 1.9.4.
Proviamo (vii): si ha
1
z
2
=
1
z

_
1
z
_
=
1
zz
=
1
[z[
2
,
da cui la prima uguaglianza; la seconda segue da (iv) e dalla prima.
Il numero
Prima di introdurre la forma trigonometrica dei numeri complessi, conviene
parlare, appunto, di trigonometria. Preliminare a tutta la questione è il pro-
blema di dare una denizione il pi` u possibile rigorosa del numero reale .
Il nostro punto di partenza sarà larea dei triangoli, che supponiamo ele-
mentarmente nota (metà del prodotto base per altezza!), insieme con le sue
basilari proprietà, e cioè:
85
se un triangolo è incluso in un altro triangolo, allora larea del primo è
non superiore allarea del secondo;
se due triangoli sono congruenti, allora essi hanno la stessa area;
larea di una gura costituita da due triangoli disgiunti o adiacenti è
pari alla somma delle aree dei due triangoli.
Fissato un intero n 3, consideriamo un poligono regolare T di n lati,
inscritto nel cerchio B(0, 1) del piano complesso. I vertici di T sono numeri
complessi w
0
, w
1
, . . . , w
n1
di modulo unitario. Denotiamo con O, W
i
,W
i
,
Z
i
i punti del piano corrispondenti ai numeri complessi 0, w
i
, w
i
=
w
i
+w
i1
2
,
z
i
=
w
i
+w
i1
|w
i
+w
i1
|
.
Calcoliamo larea a(T) di T: il triangolo OW
i1
W
i
è isoscele con base W
i
W
i1
e altezza OW
i
; quindi
a(T) =
n
i=1
a(OW
i1
W
i
) =
=
n
i=1
1
2
[w
i
[ [w
i
w
i1
[ =
=
n
i=1
1
4
[w
i
w
i1
[ [w
i
+w
i+1
[.
Invece il perimetro (T) del poligono T è semplicemente la somma delle
lunghezze dei segmenti W
i1
W
i
: quindi
(T) =
n
i=1
[w
i
w
i1
[.
Si noti che, essendo
w
i
+w
i1
2
< 1, si ha
2a(T) < (T).
Daltra parte, detto T
il poligono regolare inscritto di 2n lati, di vertici w

0
,
z
0
, w
1
, z
1
, . . . , w
n1
, z
n1
, w
n
w
0
, si riconosce facilmente che larea di T
è data dalla somma delle aree degli n quadrilateri OW

i1
Z
i
W
i
; poiche
a(OW
i1
Z
i
W
i
) = 2a(OZ
i
W
i
) = 2
_
1
2
[w
i
w
i1
[
2
[z
i
[
_
=
1
2
[w
i
w
i1
[,
86
si ottiene
a(T
) =
1
2
(T).
In particolare, si deduce facilmente:
Proposizione 1.12.3 Risulta
supa(T) : T poligono regolare inscritto in B(0, 1) =
=
1
2
sup(T) : T poligono regolare inscritto in B(0, 1).
Consideriamo ora un poligono regolare Q di n lati circoscritto al cerchio
B(0, 1). Indichiamo con v
0
, v
1
, . . . , v
n1
i vertici di Q e con z
0
, z
1
, . . . , z
n1
i
punti in cui Q tocca la circonferenza S(0, 1). Come prima, denotiamo con O,
V
i
, Z
i
i punti del piano corrispondenti ai numeri complessi 0, v
i
, z
i
. Larea
di Q è data da
a(Q) =
n
i=1
a(OV
i1
V
i
) =
n
i=1
1
2
[z
i
[ [v
i
v
i1
[ =
n
i=1
1
2
[v
i
v
i1
[,
mentre il perimetro di Q è
semplicemente
(Q) =
n
i=1
[v
i
v
i1
[.
Dunque
a(Q) =
1
2
(Q).
Pertanto:
infa(Q) : Q poligono regolare circoscritto a B(0, 1) =
=
1
2
inf(Q) : Q poligono regolare circoscritto a B(0, 1).
Adesso notiamo che per ogni poligono regolare T inscritto in B(0, 1) e per
ogni poligono regolare Q circoscritto a B(0, 1) si ha, evidentemente, T
B(0, 1) Q e quindi a(T) < a(Q). Ciò mostra che i due insiemi numerici
a(T) : T poligono regolare inscritto in B(0, 1),
87
a(Q) : Q poligono regolare circoscritto a B(0, 1)
sono separati: quindi per lassioma di completezza esiste almeno un elemento
separatore fra i due insiemi. Proveremo adesso che i due insiemi sono anche
contigui, e che quindi lelemento separatore è in eetti unico.
Proposizione 1.12.5 Per ogni > 0 esistono due poligoni regolari T e Q,
uno inscritto e laltro circoscritto a B(0, 1), tali che
a(Q) a(T) < .
Dimostrazione Fissato n 2,
siano T
n
e Q
n
poligoni regola-
ri di 2
n
lati, il primo inscritto e
il secondo circoscritto al cerchio
B(0, 1). Denotando con v
i
i ver-
tici di T
n
e con v
i
quelli di Q
n
,
possiamo supporre che la posizio-
ne di Q
n
rispetto a T
n
sia tale
che risulti
v
i
|v
i
|
= v
i
per ciascun
vertice.
Allora utilizzando le formule precedenti in questo caso si trova
a(T
n
) = 2
n
[v
i
v
i1
[ [v
i
+v
i1
[
4
, a(Q
n
) = 2
n
[v
i
v
i1
[
[v
i
+v
i1
[
,
da cui
a(Q
n
) a(T
n
) = 2
n
[v
i
v
i1
[ [v
i
+v
i1
[
_
4
[v
i
+v
i1
[
2
1
_
=
= 4a(T
n
)
_
4
[v
i
+v
i1
[
2
1
_
.
Osserviamo adesso che, indicando con
n
la lunghezza del lato del poligono
regolare inscritto T
n
, si ha
n
= [v
i
v
i1
[ e quindi, essendo [v
1
[ = [v
i1
[ = 1,
[v
i
+v
i1
[
2
= 2+2 Re v
i
v
i1
= 2+(2[v
i
v
i1
[
2
) = 4[v
i
v
i1
[
2
= 4
2
n
;
di conseguenza
a(Q
n
) a(T
n
) = 4a(T
n
)

2
n
4
2
n
< a(Q
2
)
4
2
n
4
2
n
.
88
Al crescere di n, il lato
n
è sempre pi` u piccolo e, in particolare,
inf
n2
n
= 0;
ne segue che, ssato ]0, 4[, esiste 2 sucientemente grande in modo
che
2
< /2 < 2; se ne deduce allora

a(Q
) a(T
) < a(Q
2
)
4
2
4
2
< 4
/2
4 2
= .
Ciò prova la tesi.
Dalle proposizioni precedenti segue che esiste un unico numero reale, che de-
notiamo con , il quale è lunico elemento separatore fra linsieme delle aree
di tutti i poligoni regolari inscritti e linsieme delle aree di tutti i poligoni re-
golari circoscritti al cerchio B(0, 1). Si noti che, a maggior ragione, è anche
lelemento separatore fra linsieme delle aree di tutti i poligoni inscritti (non
necessariamente regolari) e linsieme delle aree di tutti i poligoni circoscritti
al cerchio B(0, 1) (non necessariamente regolari). Ovvie considerazioni geo-
metriche ci inducono a denire larea di B(0, 1) attribuendole il valore . In
altre parole:
Denizione 1.12.6 Il numero reale è larea del cerchio B(0, 1), ed è
quindi dato da
= a(B(0, 1)) = supa(T) : T poligono inscritto in B(0, 1) =
= infa(Q) : Q poligono circoscritto a B(0, 1).
Si noti che è compreso fra 2 e 4 (le aree del quadrato inscritto e di quello
circoscritto).
Dal fatto che larea di un poligono regolare circoscritto al cerchio B(0, 1) è
la metà del suo perimetro, anche linsieme dei perimetri dei poligoni regolari
inscritti in B(0, 1) e quello dei perimetri dei poligoni regolari circoscritti a
B(0, 1) hanno un unico elemento separatore, il quale coincide esattamente
con 2 in virt` u della proposizione 1.12.4. A maggior ragione, 2 è anche
lelemento separatore fra linsieme dei perimetri dei poligoni inscritti (non
necessariamente regolari) e quello dei perimetri dei poligoni circoscritti a
B(0, 1) (non necessariamente regolari). Nuovamente, evidenti considerazio-
ni geometriche ci portano a denire il perimetro della circonferenza S(0, 1)
attribuendole il valore 2. Si ha dunque:
89
Corollario 1.12.7 Il perimetro della circonferenza S(0, 1) è dato da
(S(0, 1)) = sup(T) : T poligono inscritto in B(0, 1) =
= inf(Q) : Q poligono circoscritto a B(0, 1) = 2.
Osservazione 1.12.8 In modo del tutto analogo, per ogni r > 0 si deni-
scono larea del cerchio B(0, r) come
a(B(0, r)) = supa(T) : T poligono inscritto in B(0, r) =
= infa(Q) : Q poligono circoscritto a B(0, r)
e il perimetro della circonferenza S(0, r) come
(S(0, r)) = sup(T) : T poligono inscritto in B(0, r) =
= inf(Q) : Q poligono circoscritto a B(0, r).
Se T è un poligono inscritto o circoscritto con
vertici v
i
, e T
r
è il poligono i cui vertici sono
rv
i
, per ovvie ragioni di similitudine risulta
a(T
r
) = r
2
a(T), (T
r
) = r (T);
pertanto si ha
a(B(0, r)) = r
2
a(B(0, 1)) = r
2
,
(S(0, r)) = r (S(0, 1)) = 2r.
Dunque il cerchio B(0, r) ha area r
2
e perimetro 2r, come era da aspettarsi.
Area dei settori e lunghezza degli archi
Ogni coppia di numeri complessi v, w non nulli individua sulla circonferenza
S(0, 1) due punti, V e W, corrispondenti ai numeri complessi
v
|v|
e
w
|w|
; questi
punti formano con lorigine O due angoli. Prescindendo dallampiezza, attri-
buiamo unorientazione a tali angoli: diciamo che V OW è positivo se larco
è percorso da V a W in verso antiorario; diciamo che V OW è negativo se
larco è percorso da V a W in verso orario.
`
E chiaro che V OW è positivo se
e solo se WOV è negativo.
90
Denotiamo le intersezioni di S(0, 1) con le regioni interne ai due angoli ri-
spettivamente con
+
(v, w) e
(v, w); si tratta evidentemente di due archi:
+
(v, w) va da V a W in verso antiorario, cioè con orientazione positiva,
mentre
(v, w) va da V a W in verso orario, cioè con orientazione negati-

va. Agli archi positivamente orientati attribuiremo una lunghezza positiva,
a quelli negativamente orientati una lunghezza negativa. Analogamente, ai
corrispondenti settori circolari
+
(v, w) = z C : z = t, t [0, 1],
+
(v, w),
(v, w) = z C : z = t, t [0, 1],
(v, w),
attribuiremo unarea rispettivamente positiva e negativa.
Notiamo esplicitamente che, per denizione,
(v, w) =
_
v
[v[
,
w
[w[
_
,
(v, w) =
_
v
[v[
,
w
[w[
_
v, w C 0 :
quindi non sarà restrittivo riferirsi ad archi
(v, w) relativi a numeri v, w C

con [v[ = [w[ = 1.
Fissiamo dunque v, w S(0, 1). Considereremo linee spezzate inscritte o cir-
coscritte a
+
(v, w). Una linea spezzata è formata da una sequenza nita
ordinata di vertici e dai segmenti che li congiungono; ci limiteremo a spez-
zate con primo vertice v e ultimo vertice w. Una tale spezzata è inscritta in
+
(v, w) se tutti i suoi vertici appartengono a
+
(v, w); è invece circoscritta
se tutti i suoi vertici, tranne il primo e lultimo, sono esterni a B(0, 1) e tutti i
suoi segmenti sono tangenti esternamente a
+
(v, w), ossia toccano tale arco
senza attraversarlo. Considereremo anche i settori
P
associati a spezzate
91
P inscritte o circoscritte: detti v
0
v, v
1
, . . . , v
n1
, v
n
w i vertici di P,
il settore
P
è lunione degli n triangoli OV
i1
V
i
(ove al solito O, V
i
sono i
punti del piano corrispondenti ai numeri complessi 0, v
i
).
Ciò premesso, con considerazioni analoghe a quelle svolte per il cerchio
B(0, 1) e per la circonferenza S(0, 1), si ottiene che
supa(
P
) : P spezzata inscritta in
+
(v, w) =
=
1
2
sup(P) : P spezzata inscritta in
+
(v, w) =
=
1
2
inf(Q) : Q spezzata circoscritta a
+
(v, w) =
= infa(
Q
) : Q spezzata circoscritta a
+
(v, w).
Siamo cos` indotti alla seguente
Denizione 1.12.9 Siano v, w C 0. La lunghezza dellarco positiva-
mente orientato
+
(v, w) è il numero reale non negativo
(
+
(v, w)) = sup(P) : P spezzata inscritta in
+
(v, w) =
= inf(Q) : Q spezzata circoscritta a
+
(v, w).
Larea del settore positivamente orientato
+
(v, w) è il numero reale non
negativo
a(
+
(v, w)) = supa(
P
) : P spezzata inscritta in
+
(v, w) =
= infa(
Q
) : Q spezzata circoscritta a
+
(v, w) =
=
1
2
(
+
(v, w)).
La lunghezza dellarco negativamente orientato
(v, w) è il numero reale

non positivo
(
(v, w)) = 2 +(
+
(v, w)).
Larea del settore negativamente orientato
(v, w) è il numero reale non

positivo
a(
(v, w)) = +a(

+
(v, w)).
Una fondamentale proprietà delle lunghezze e delle aree sopra denite è la
loro additività. A questo proposito vale la seguente
92
Proposizione 1.12.10 Siano v, w, z C 0. Se
z
|z|

+
(v, w), allora
(
+
(v, w)) = (
+
(v, z)) +(
+
(z, w)),
a(
+
(v, w)) = a(
+
(v, z)) +a(
+
(z, w)).
Dimostrazione Fissiamo > 0. Per denizione, esistono due spezzate
P, P
, luna inscritta in
+
(v, z) e laltra inscritta in
+
(z, w), tali che
(
+
(v, z)) < (P) (
+
(v, z)), (
+
(z, w)) < (P
) (
+
(z, w)),
Detta P
la spezzata i cui vertici sono tutti quelli di P seguiti da tutti quelli

di P
, è chiaro che P
è inscritta in
+
(v, w); inoltre si ha (P) + (P
) =
(P
) (
+
(v, w)). Quindi
(
+
(v, z)) +(
+
(z, w) 2 < (P
) (
+
(v, w)).
Larbitrarietà di prova che
(
+
(v, z)) +(
+
(z, w) (
+
(v, w)).
Per provare la disuguaglianza inversa, sia > 0 e sia P una spezzata inscritta
a
+
(v, w) tale che
(
+
(v, w)) < (P) (
+
(v, w)).
Se la spezzata P non ha come vertice il punto z, esisteranno due vertici
consecutivi v
i1
, v
i
tali che z
+
(v
i1
, v
i
); allora, sostituendo al segmento
V
i1
V
i
i due segmenti V
i1
Z e ZV
i
, si ottiene una nuova spezzata P
inscritta
a
+
(v, w) tale che (P
) > (P). Inoltre tale spezzata è lunione di due

spezzate P
e P
, luna formata da tutti i vertici fra v e z (inclusi) e inscritta

in
+
(v, z), laltra formata da tutti i vertici fra z e w (inclusi) e inscritta in
+
(z, w). Si ha allora
(
+
(v, w)) < (P) < (P
) = (P
) +(P
) (
+
(v, z)) +(
+
(z, w)).
Nuovamente, larbitrarietà di prova che
(
+
(v, w)) (
+
(v, z)) +(
+
(z, w)).
La prima parte della tesi è provata. La seconda parte segue subito ricordando
che larea di un settore è la metà della lunghezza dellarco corrispondente.
93
Corollario 1.12.11 Se v, w
+
(1, i), allora
[v w[ < [(
+
(1, v)) (
+
(1, w))[
2[v w[.
Dimostrazione Anzitutto notiamo che si ha v
+
(1, w) oppure w
+
(1, v); se siamo ad esempio nel secondo caso, allora per la proposizione
1.12.10
(
+
(1, v)) (
+
(1, w)) = (
+
(w, v)),
cosicche la prima disuguaglian-
za è banale. Per provare la se-
conda, denotiamo, al solito, con
O, V, W, Z i punti corrispondenti
ai numeri complessi 0, v, w, v +w,
e tracciamo la bisettrice dellan-
golo V OW; sia U il punto di in-
tersezione delle perpendicolari ai
segmenti OV e OW condotte da
V e W rispettivamente. La spez-
zata P di vertici V, U, W è allo-
ra circoscritta a
+
(v, w) e la sua
lunghezza è
(P) = [v u[ +[u w[ = 2[u v[ = 2
[v w[
[v +w[
;
ma poiche [v + w[ è la lunghezza della diagonale maggiore OZ del rombo
OV ZW, tale quantità è certamente non inferiore a
2 (la diagonale del

quadrato di lato OV ). Si ottiene allora
(
+
(v, w)) (P)
2[v w[.
Il corollario appena dimostrato ci permette di enunciare il seguente fonda-
mentale risultato, che è conseguenza dellassioma di completezza di R.
Teorema 1.12.12 Per ogni [0, 2[ esiste un unico numero complesso
w, di modulo unitario, tale che
(
+
(1, w)) = 2a(
+
(1, w)) = .
La funzione g(w) = (
+
(1, w)) è bigettiva da S(0, 1) in [0, 2[ ed è surgettiva
da C0 in [0, 2[. Se w C0, il numero = (
+
(1, w)) si dice misura
in radianti dellangolo individuato dai punti 0, 1,
w
|w|
.
94
Dimostreremo il teorema 1.12.12 pi` u
avanti nel corso, utilizzando la teoria
delle funzioni continue.
Un radiante è quindi, per denizione,
la misura dellunico angolo (orientato
in verso antiorario) il cui corrisponden-
te arco della circonferenza unitaria ha
lunghezza 1; un angolo misura ra-
dianti se e solo se larco corrispondente
su S(0, 1) ha lunghezza e il settore
corrispondente ha area

2
.
In particolare, allora, langolo piatto misura (radianti), langolo retto
2
, langolo sotteso da un lato del poligono regolare di N lati misura
2
N
;
il segno davanti alla misura dipende dal verso di rotazione.
Naturalmente, facendo pi` u di un giro in verso antiorario le aree e le lunghezze
darco crescono di 2, 4, eccetera, mentre se il verso è orario esse decrescono
di 2, 4, eccetera. Daltra parte dopo una rotazione di + 2k, con
k intero arbitrario, lestremo dellarco è lo stesso di quello relativo ad una
rotazione di : ad ogni w C 0 corrispondono dunque le innite misure
+ 2k, k Z. Possiamo allora dare la seguente
Denizione 1.12.13 Sia w C0, e sia [0, 2[ la misura in radianti
dellarco
+
(1, w). Ognuno degli inniti numeri + 2k, k Z, si chiama
argomento del numero complesso w e si denota con arg w; il numero , cioè
lunico fra gli argomenti di w che appartiene a [0, 2[, si chiama argomento
principale di w.
Si osservi che arg w denota uno qualsiasi degli inniti argomenti di w, quindi
è una quantità denita a meno di multipli interi di 2.
Funzioni trigonometriche
Sulla base del teorema 1.12.12 e della conseguente denizione 1.12.13, siamo
in grado di introdurre le funzioni trigonometriche. Infatti, ssato [0, 2[,
tale risultato ci permette di scegliere w C 0 tale che arg w = ; in
particolare,
w
|w|
è lunico elemento di S(0, 1) il cui argomento è , cioè che
verica
l
_
+
_
1,
w
[w[
__
= 2a
_
+
_
1,
w
[w[
__
= .
95
Le coordinate di
w
|w|
, vale a dire Re
w
|w|
e Im
w
|w|
, sono quindi funzioni di . Ha
senso perciò la seguente denizione delle funzioni coseno e seno:
Denizione 1.12.14 Per ogni [0, 2[ si pone
cos = Re
w
[w[
, sin = Im
w
[w[
,
ove w C0 è un qualsiasi nu-
mero complesso tale che arg w =
.
In particolare, un generico nume-
ro complesso non nullo w si può
scrivere in forma trigonometrica:
w = (cos +i sin ),
ove = [w[ e = arg w.
Poiche ad un numero complesso z di argomento principale [0, 2[ corri-
spondono anche gli argomenti +2k, occorre che le funzioni coseno e seno
siano periodiche di periodo 2: esse cioè devono vericare le relazioni
cos( + 2) = cos , sin( + 2) = sin R.
Immediata conseguenza della denizione sono poi le seguenti proprietà:
[ cos [ 1, [ sin [ 1, cos
2
+ sin
2
= 1 R.
Poiche i punti z e z sono simmetrici rispet-
to allasse reale, ad essi corrispondono angoli
opposti: dunque il seno ed il coseno di angoli
opposti devono vericare
cos () = Re
z
[z[
= Re
z
[z[
= cos ,
sin () = Im
z
[z[
= Im
z
[z[
= sin .
96
Si verica poi facilmente, utilizzando le simmetrie illustrate nelle gure sot-
tostanti, che
cos
_
2

_
= sin , sin
_
2

_
= cos R,
cos
_
2
+
_
= sin , sin
_
2
+
_
= cos R,
cos ( ) = cos , sin ( ) = sin R,
cos ( +) = cos , sin ( +) = sin R.
Pi` u in generale si ha:
Proposizione 1.12.15 Per ogni , R valgono le formule di addizione
cos ( ) = cos cos + sin sin ,
cos ( +) = cos cos sin sin ,
sin ( ) = sin cos cos sin ,
sin ( +) = sin cos + cos sin .
97
Dimostrazione Siano z, w numeri complessi di modulo 1, con arg z = e
arg w = : ciò signica che nel piano il punto z ha coordinate (cos , sin )
mentre il punto w ha coordinate (cos , sin ). Calcoliamo la quantità [zw[
2
:
si ha
[z w[
2
= (cos cos )
2
+ (sin sin )
2
.
Daltra parte, [z w[ rappresenta la lunghezza del segmento di estremi z e w,
quindi tale quantità non cambia se cambiamo sistema di riferimento. Sceglia-
mo due nuovi assi ortogonali x
, y
tali che la semiretta positiva dellasse x
coincida con la semiretta uscente da 0 che contiene w. Dato che [z[ = [w[ = 1,
le coordinate di w in questo nuovo sistema sono (1, 0) mentre quelle di z sono
(cos ( ), sin ( )). Pertanto
[z w[
2
= (cos ( ) 1)
2
+ (sin ( ))
2
.
Confrontando fra loro le due espressioni e svolgendo i calcoli, si ricava facil-
mente la prima uguaglianza.
La seconda uguaglianza segue dalla prima scambiando con :
cos ( ()) = cos cos () + sin sin () = cos cos sin sin .
Per la terza e quarta uguaglianza si osservi che, per quanto già provato,
sin ( ) = cos
_
+

2
_
=
= cos
_
+

2
_
cos sin
_
+

2
_
sin =
= sin cos cos sin ,
98
sin ( +) = cos
_
+ +

2
_
=
= cos
_
+

2
_
cos + sin
_
+

2
_
sin =
= sin cos + cos sin .
I graci delle funzioni coseno e seno sono illustrati qui sotto.
Si noti che il graco del seno si ottiene da quello del coseno mediante una tra-
slazione di +
2
lungo lasse x, dato che, come sappiamo, cos = sin ( +

2
).
Osservazione 1.12.16 Ovvie considerazioni di similitudine implicano che,
poiche il generico punto di S(0, 1) corrisponde al numero complesso cos +
i sin , al generico punto di S(0, r) corrisponderà il numero r cos +ir sin .
Completiamo queste brevi note
di trigonometria introducendo la
funzione tangente.
Denizione 1.12.17 Se R
e ,=

2
+k, k Z, poniamo
tan =
sin
cos
.
Questa funzione non è denita nei
punti dove si annulla il coseno, ed
è periodica di periodo ; il suo
graco è riportato qui accanto.
99
Vale questa importante disuguaglianza:
cos x <
sin x
x
< 1 x
_
2
,

2
_
0;
di conseguenza si ha
sup
nN
+
sin
a
n
a
n
= 1 a R 0.
Dimostrazione Fissiamo x
0,

2
_
e siano O lorigine ed E, B i punti
corrispondenti ai numeri 1 e cos x +i sin x; sia poi T il punto di incontro tra
la perpendicolare ad OE passante per E ed il prolungamento di OB, e H il
punto dincontro con OE della perpendicolare ad OE passante per B. Dato
che i triangoli OHB e OET sono simili, si ha
[H[ : [E[ = [B H[ : [T E[,
da cui
[T E[ =
[B H[ [E[
[H[
=
sin x
cos x
= tan x.
Daltra parte, il triangolo OEB è contenuto nel settore di vertici O,E,B il
quale a sua volta è contenuto nel triangolo OET: ne segue, calcolando le tre
aree,
1
2
sin x <
1
2
x <
1
2
tan x,
da cui la tesi quando x
0,

2
_
.
Se x
2
, 0
_
, per quanto già visto si ha
cos x = cos (x) <
sin (x)
x
< 1;
dato che
sin (x)
x
=
sin x
x
, si ha la tesi anche in questo caso. Inne, se x =
2
la tesi è banale.
Sia ora a > 0. Essendo
0 1 cos
2
a
n
= sin
2
a
n
<
a
2
n
2
n N
+
,
100
si ottiene (dato che cos
a
n
> 0 per n >
2a
)
1 sup
nN
+
sin
a
n
a
n
sup
nN
+
cos
a
n
sup
n>2a/
_
1
a
2
n
2
_1
2
= 1.
Seno e coseno in coordinate
Fissiamo due punti P, Q R
2
, diversi dallorigine O. Consideriamo langolo
convesso

POQ, orientato da P a Q: la sua ampiezza, misurata in radian-
ti, è un numero
PQ
[, ]. Vogliamo esprimere i numeri reali cos
PQ
,
sin
PQ
, che denoteremo direttamente con cos

POQ e sin

POQ, in termini
delle coordinate di P e Q.
Supponiamo dunque P = (x
P
, y
P
) e Q =
(x
Q
, y
Q
), e poniamo per comodità E = (1, 0).
Siano
P
e
Q
le misure in radianti degli an-
goli convessi orientati

EOP,

EOQ; è facile
vericare che risulta
PQ
=
_
P
se [
Q
P
[ < ,
P
+ 2 se
Q
P
,
P
2 se
Q
P
.
Di conseguenza, utilizzando le formule di addizione (proposizione 1.12.15), si
ottiene
cos

POQ = cos (
Q
P
) =
= cos
Q
cos
P
+ sin
Q
sin
P
=
101
=
x
Q
_
x
2
Q
+y
2
Q
x
P
_
x
2
P
+y
2
P
+
y
Q
_
x
2
Q
+y
2
Q
y
P
_
x
2
P
+y
2
P
,
sin

POQ = sin (
Q
P
) =
= sin
Q
cos
P
cos
Q
sin
P
=
=
y
Q
_
x
2
Q
+y
2
Q
x
P
_
x
2
P
+y
2
P
x
Q
_
x
2
Q
+y
2
Q
y
P
_
x
2
P
+y
2
P
.
Queste sono le espressioni del coseno e del seno che cercavamo. Si noti che,
di conseguenza,
cos

POQ =
P Q
[P[ [Q[
, sin

POQ =
1
[P[ [Q[
det
_
x
P
x
Q
y
P
y
Q
_
,
ove il determinante della matrice
_
a
b
_
è, per denizione, il numero a b.
Vale allora la seguente importante
Proposizione 1.12.19 Siano P, Q R
2
O.
(i) Risulta
P Q = [P[ [Q[ cos

POQ;
(ii) detto T il parallelogrammo di vertici O, P, Q e P +Q, la sua area a(T)
è data da
a(T) = [P[ [Q[ [ sin

POQ[ = [x
P
y
Q
y
P
x
Q
[.
Dimostrazione (i) Segue dai discorsi precedenti.
(ii) La base di T misura [P[ e la sua altezza misura [Q[ sin [
POQ[; poiche
[
POQ[ , si ha sin [
POQ[ = [ sin

POQ[, da cui la tesi.
Se ne deduce immediatamente:
Corollario 1.12.20 Se P, Q R
2
, il triangolo T di vertici O, P, Q ha area
a(T ) =
1
2
[x
P
y
Q
y
P
x
Q
[.
102
Naturalmente, per traslazione si vede
che, se P, Q, R sono punti di R
2
, larea
del triangolo T di vertici P, Q, R è data
da
a(T ) =
1
2
det
_
x
Q
x
P
x
R
x
P
y
Q
y
P
y
R
y
P
_
.
Forma trigonometrica dei numeri complessi
Se z = a + ib è un numero complesso non nullo, esso può essere individua-
to, oltre che dalle sue coordinate cartesiane (a, b), anche per mezzo del suo
modulo e del suo argomento (denizione 1.12.13): infatti, ricordando la de-
nizione 1.12.14, posto = [z[ e = arg z vale la relazione
z = (cos +i sin ).
Questa è la scrittura di z in forma tri-
gonometrica. Si noti che, noti e , si
ha
_
a = cos
b = sin ,
mentre, noti a e b, si ha
=
a
2
+b
2
,
_
cos =
a
sin =
b
,
il che equivale, come è giusto, a determinare a meno di multipli interi di
2.
La forma trigonometrica dei numeri complessi è utile per rappresentare geo-
metricamente il prodotto in C. Siano infatti z, w C: se uno dei due numeri
è 0, allora il prodotto fa 0 e non cè niente da aggiungere. Se invece z, w sono
entrambi non nulli, scrivendoli in forma trigonometrica,
z = (cos +i sin ), w = r(cos +i sin ),
otteniamo che
zw = r(cos +i sin )(cos +i sin ) =
103
= r[(cos cos sin sin ) +i(sin cos + cos sin )] =
= r[cos ( +) +i sin ( +)].
Dunque zw è quel numero complesso che ha per modulo il prodotto dei
moduli e per argomento la somma degli argomenti. In particolare si ha la
formula
arg (zw) = arg z + arg w + 2k, k Z.
Ovviamente si ha anche
zw = r[cos ( ) +i sin ( )];
scelto poi w = z, troviamo
z
2
= r
2
(cos 2 +i sin 2),
e pi` u in generale vale la formula di de Moivre:
z
n
= r
n
(cos +i sin )
n
= r
n
(cos n +i sin n) R, n N.
Da questa formula, utilizzando lo sviluppo di Newton per il binomio (valido
ovviamente anche in campo complesso, trattandosi di una relazione algebrica)
è possibile dedurre delle non banali relazioni trigonometriche che esprimono
sin n e cos n in termini di sin e cos (esercizio 1.12.13).
Altre formule trigonometriche, che seguono facilmente dalle formule di addi-
zione, sono illustrate negli esercizi 1.12.6, 1.12.7 e 1.12.8.
Radici n-sime di un numero complesso
Fissato w C, vogliamo trovare tutte le soluzioni dellequazione z
n
= w
(con n intero maggiore di 1). Ricordiamo che proprio lesigenza di risolvere
le equazioni algebriche ci ha motivato ad introdurre i numeri complessi.
Se w = 0, naturalmente lunica soluzione è z = 0; se w ,= 0, risulta ancora
utile usare la forma trigonometrica. Scriviamo w = r(cos + i sin ), e sia
z = (cos +i sin ) lincognita: anche sia z
n
= w bisognerà avere
n
= r (uguagliando i moduli),
n = + 2k, k Z (uguagliando gli argomenti),
cioè
_
= r
1
n
(radice n-sima reale positiva)
=
+2k
n
, k Z.
104
Sembra dunque che vi siano innite scelte per , cioè innite soluzioni z.
Però, mentre le prime n scelte di k (k = 0, 1, . . . , n 1) forniscono n valori
di compresi fra 0 e 2 (ossia
0
=

n
,
1
=
+2
n
, . . . ,
n1
=
+2(n1)
n
), le
scelte k n e k 1 danno luogo a valori di che si ottengono da quelli
già trovati traslandoli di multipli interi di 2: infatti
n
=
+ 2
n
=
0
+ 2,
n+1
=
+ 2(n + 1)
n
=
1
+ 2,
ed in generale per j = 0, 1, . . . , n 1
mn+j
=
+ 2(mn +j)
n
=
j
+ 2m m Z.
In denitiva, le innite scelte possibili per forniscono solo n scelte distinte
per z, e cioè
z
j
= r
1
n
_
cos
+ 2j
n
+i sin
+ 2j
n
_
, j = 0, 1, . . . , n 1.
Quindi ogni numero complesso
w ,= 0 ha esattamente n radici
n-sime distinte z
0
, z
1
, . . . , z
n1
che sono tutte e sole le soluzioni
dellequazione z
n
= w. I nume-
ri z
0
, . . . ,z
n1
giacciono tutti sul-
la circonferenza di centro 0 e rag-
gio [w[
1
n
; ciascuno forma un an-
golo di
2
n
con il precedente, co-
sicche essi sono i vertici di un po-
ligono regolare di n lati inscritto
nella circonferenza.
Largomento del primo vertice z
0
si trova dividendo per n largomento princi-
pale di w, cioè lunico che sta in [0, 2[. Se, in particolare, w è reale positivo,
si avrà arg z
0
=
1
n
arg w = 0, quindi z
0
è reale positivo ed è la radice n-sima
reale positiva di w. Dunque, se w è reale positivo, la sua radice n-sima reale
positiva w
1
n
è una delle n radici n-sime complesse di w (e tra queste ci sarà
anche w
1
n
se n è pari).
105
Esercizi 1.12
1. Calcolare le quantità
(1 i)
24
,
_
1
i
_
67
,
_
1 +i
1 i
_
45
,
_
i + 2i
1 2i
_
5
,
1 +i
[1 +i[
.
2. Quanti gradi sessagesimali misura un angolo di 1 radiante?
3. Calcolare le aree del poligono regolare di n lati inscritto nella circonfe-
renza di raggio 1 e di quello circoscritto alla medesima circonferenza.
4. Dimostrare che:
(i) (
(v, w)) = (
+
(w, v)) per ogni v, w C 0;
(ii) (
(1, w)) = (
+
(1, w) per ogni w C 0;
(iii) (
+
(i, w)) = (
+
(1, iw)) per ogni w
+
(i, 1);
(iv) (
+
(1, w)) = (
+
(1, w)) per ogni w
+
(1, 1).
5. Completare la seguente tabella:
x 0

6
2
2
3
3
4
5
6
cos x
sin x
tan x
x
7
6
5
4
4
3
3
2
5
3
7
4
11
6
cos x
sin x
tan x
106
6. Dimostrare le formule di bisezione:
cos
2
x
2
=
1 + cos x
2
, sin
2
x
2
=
1 cos x
2
x R.
7. Dimostrare le formule di duplicazione:
cos 2x = cos
2
x sin
2
x, sin 2x = 2 sin x cos x x R.
8. (i) Dimostrare le formule di Werner:
_
_
sin ax sin bx =
1
2
[cos(a b)x cos(a +b)x]
cos ax cos bx =
1
2
[cos(a b)x + cos(a +b)x]
sin ax cos bx =
1
2
[sin(a b)x + sin(a +b)x].
a, b, x R.
(ii) Dedurre le formule di prostaferesi:
_
_
cos + cos = 2 cos
+
2
cos

2
cos cos = 2 sin
+
2
sin

2
sin + sin = 2 sin
+
2
cos

2
sin sin = 2 cos
+
2
sin

2
.
, R.
9. Provare che
[ cos cos [ [ [, [ sin sin [ [ [ , R.
10. Dimostrare le relazioni
tan( +) =
tan +tan
1tan tan
, tan( ) =
tan tan
1+tan tan
,
tan
2
2
=
1cos
1+cos
, tan 2 =
2 tan
1tan
2
per tutti gli , R per i quali le formule hanno senso.

11. Dimostrare che se R (2k + 1)
kZ
si ha
sin =
2 tan

2
1 + tan
2
2
cos =
1 tan
2
2
1 tan
2
2
.
107
12. Provare che
tan + tan =
sin(+)
cos cos
, tan tan =
sin()
cos cos
,
1
tan
+
1
tan
=
sin(+)
sin sin
,
1
tan

1
tan
=
sin()
sin sin
per tutti gli , R per i quali le formule hanno senso.
13. Utilizzando la formula del binomio, dimostrare che per ogni R e
per ogni n N
+
si ha
cos n =
[
n
2
]
h=0
_
n
2h
_
(1)
h
sin
2h
cos
n2h
,
sin n =
[
n1
2
]
h=0
_
n
2h + 1
_
(1)
h
sin
2h+1
cos
n2h1
,
ove [x] denota la parte intera del numero reale x, cioè [x] = maxk
Z : k x.
14. Dimostrare che
1
2
+
N
n=1
cos nx =
sin
_
N +
1
2
_
x
2 sin
x
2
x R 0, N N
+
.
[Traccia: usare le formule di Werner con a =
1
2
e b = n.]
15. Calcolare:
cos

12
, sin
5
12
, tan

8
, cos
5
8
, sin
7
8
, tan
11
12
.
16. (Teorema di Carnot) Sia ABC un triangolo. Detto langolo opposto
al vertice A, si provi che
a
2
= b
2
+c
2
2bc cos .
17. (Teorema dei seni) Sia ABC un triangolo. Detti , e gli angoli
opposti ai vertici A, B e C, si provi che
a
sin
=
b
sin
=
c
sin
.
108
18. Risolvere le equazioni:
(i) 3 sin x
3 cos x = 0, (ii) sin x + (2 +
3) cos x = 1,
(iii) 2 sin
2
x sin x = 1, (iv) sin
4
x 4 sin
2
x cos
2
x + 3 cos
4
x = 0,
(v) sin x + 3[ sin x[ = 2, (vi) cos
4
x 4 sin
2
x cos
2
x + 3 sin
4
x = 0.
19. Risolvere le disequazioni:
(i) sin x <
1
2
, (ii) 4 sin x tan x
3
cos x
> 0,
(iii) cos x >
1
2
, (iv)
_
tan x >
3
sin x >
1
2
,
(v)
2 sin x 1
2 sin x + 1
> 0, (vi) sin x + (
2 1) cos x >
2 1.
20. Determinare larea dei triangoli di vertici:
(i) (0, 0), (2, 5), (4, 2), (ii) (1, 1), (2, 6), (1, 3).
21. Scrivere in forma trigonometrica i numeri complessi:
1 +i, 3 3i,
2,
3 +i, 1 +
3i,
1 i
3 i
,
7
1 +i
.
22. Calcolare:
(i) le radici seste di 1; (ii) le radici quadrate di i;
(iii) le radici quarte di 1 +
3i; (iv) le radici ottave di i.

23. Dimostrare che se z R le radici n-sime di z sono a due a due coniugate.
24. Siano z
1
, . . . , z
n
le radici n-sime di 1 che sono diverse da 1. Provare che
tali numeri sono le soluzioni dellequazione
n1
k=0
z
k
= 0.
109
25. Provare che la somma delle n radici n-sime di un qualunque numero
complesso z è uguale a 0.
26. Risolvere in C le seguenti equazioni:
(i) z
4
2iz
2
+ 3 = 0, (ii) z
4
= z
3
,
(iii) z
3
izz, (iv) z[z[ 2Rez = 0,
(v) [z + 2[ [z 2[ = 2, (vi) z
3
= arg z +

6
,
(vii) z[z[
2
+[z[z
2
zz
2
= 1, (viii) z
2
= i[z[
2,
(ix) [z
2
+ 1[
2
+[z
2
1[
2
= 8z
2
6, (x) z +[z[ = 3i + 2,
(xi) z
5
iz
3
z = 0, (xii) z
6
= arg z + arg z
2
.
27. Risolvere in C i seguenti sistemi:
(i)
_
[z
2
+ 1[ = 1
Rez =
1
2
[z[
2
,
(ii)
_
zw
2
= 1
z
2
+w
4
= 2,
(iii)
_
[z +i 1[ = 2
[z[
2
3[z[ + 2 = 0,
(iv)
_
z
2
w
3
= 1 +i
z
4
[w[
2
= 3i,
(v)
_
z
2
w = i 1
[z[w
2
+ 2z = 0,
(vi)
_
z
3
w
3
1 = 0
z
2
w + 1 = 0.
28. Si provi che se z
1
, z
2
, z
3
C, se [z
1
[ = [z
2
[ = [z
3
[ = 1 e z
1
+z
2
+z
3
= 0,
allora i punti z
1
, z
2
, z
3
sono i vertici di un triangolo equilatero. Cosa
succede nel caso di quattro punti soggetti ad analoghe condizioni?
29. Provare che larea del triangolo di vertici 0, z, w è data da
1
2
Im(zw).
[Traccia: ridursi con una rotazione al caso arg w = 0.]
30. Provare che le equazioni della forma
z +z +c = 0, C, c R,
rappresentano le rette nel piano complesso.
31. Provare che le equazioni della forma
[z[
2
z z +c = 0, C, c R, c < [[
2
,
rappresentano le circonferenze nel piano complesso.
110
32. Siano a, b C: disegnare il luogo dei numeri z C tali che
[z a[ >
1
2
[z b[.
33. Sia z C con [z[ = 1. Si verichi che (z 1)(z + 1) è immaginario
puro e si interpreti geometricamente questo fatto.
111
Capitolo 2
Successioni
2.1 Limiti di successioni
Si usa il termine successione per indicare una sequenza interminabile di
elementi presi ordinatamente da un certo insieme. Pi` u precisamente:
Denizione 2.1.1 Sia X un insieme. Una successione a valori in X è una
funzione a : N X. Gli elementi a(0), a(1), a(2), eccetera, si dicono termini
della successione e si denotano pi` u brevemente con a
0
, a
1
, a
2
, e cos` via. Nel
termine generico a
n
è contenuta la legge di formazione della successione. La
successione a : N X si denota con a
n
nN
o anche semplicemente con
a
n
, confondendola impropriamente con linsieme dei suoi termini.
A noi interesseranno per lo pi` u successioni a valori reali o complessi. Molto
spesso sarà utile considerare successioni denite non su tutto N ma solo per
tutti i numeri naturali maggiori di un intero ssato, cioè funzioni a : n
N : n n
0
X.
Esempi 2.1.2 (1)
1
n
è una successione reale, denita solo per n N
+
: si
ha a
1
= 1, a
2
= 1/2, a
3
= 1/3, . . . , a
n
= 1/n per ogni n N
+
.
(2) Se q C è un numero ssato, q
n
è una successione complessa (reale se
q R) ed i suoi termini sono 1, q, q
2
, q
3
, eccetera. In particolare: se q = 1
la successione vale costantemente 1; se q = 1 la successione prende solo i
valori 1 e 1 alternativamente, innite volte; se q = i, analogamente, a
n
assume ciclicamente i quattro valori 1, i, 1, i.

(3) n! è la successione reale 1, 1, 2, 6, 24, 120, 720, 5040, 40320, . . . , che
112
cresce molto rapidamente al crescere dellindice n.
(4) a
n
=
n
k=0
q
k
, con q C ssato, è una successione i cui termini, come
sappiamo, sono (esempio 1.6.4 (4))
a
n
=
_
1q
n+1
1q
se q ,= 1,
n se q = 1.
(5) La legge di formazione di una successione può essere data induttivamente
anziche in modo esplicito: ad esempio
_
a
0
= 1 se n = 0
a
n
= 1 +
1
a
n1
se n 1,
è una successione denita per ricorrenza, ove ciascun elemento (salvo a
0
) è
denito in termini del precedente; si ha
a
0
= 1, a
1
= 2, a
2
=
3
2
, a
3
=
5
3
, a
4
=
8
5
, a
5
=
13
8
, a
6
=
21
13
,
e possiamo calcolarne quanti vogliamo, ma non è facile determinare una legge
esplicita che esprima il termine generale a
n
in funzione solo di n.
A noi interesserà il comportamento di una data successione per valori molto
grandi di n. A questo scopo è fondamentale la nozione di limite:
Denizione 2.1.3 Sia a
n
C, sia L C. Diciamo che L è il limite
della successione a
n
al tendere di n a +, oppure che la successione a
n
converge a L per n che tende a +, se vale la condizione seguente:

> 0 N : [a
n
L[ < n > .
Ciò signica che comunque si ssi un margine di errore > 0, si può trovare
una soglia al di là della quale per ogni indice n il corrispondente elemento
a
n
dierisce da L (in modulo) per meno di . In tal caso scriveremo
lim
n
a
n
= L, oppure a
n
L per n .
Osservazioni 2.1.4 (1) Se la successione a
n
è reale e L è reale, la deni-
zione di limite non cambia di una virgola: naturalmente il modulo [a
n
L[
diventa un valore assoluto.
113
(2) Nella denizione non cambia nulla se si concede alla soglia di essere
un numero reale anziche un numero naturale: limportante è che per tutti
gli indici n N che sono maggiori di valga la disuguaglianza [a
n
L[ < .
In particolare, non è aatto necessario scegliere il minimo possibile: ciò
oltretutto può complicare terribilmente i conti.
(3) La condizione [a
n
L[ < è tanto pi` u vincolante e signicativa quan-
to pi` u è piccolo; minore è , pi` u saremo costretti a scegliere una soglia
grande. Si noti che la condizione, apparentemente meno forte,
esiste un numero K > 0 tale che per ogni > 0 si può trovare una soglia
per cui risulta [a
n
L[ < K per ogni n >
è equivalente a dire che lim
n
a
n
= L: infatti il numero K è un arbitrario
numero positivo esattamente come lo era , per cui non cè perdita di gene-
ralità.
Nel caso di successioni reali, cè anche la nozione di successione divergente a
+ oppure :
n
R. Diciamo che la successione a
n
ha limite
+ per n +, ovvero che essa diverge positivamente per n +, se
M > 0 N : a
n
> M n > .
Analogamente, diciamo che la successione a
n
ha limite per n +,
ovvero essa diverge negativamente per n +, se
M > 0 N : a
n
< M n > .
In altre parole, la successione è divergente se, ssato un numero M arbitra-
riamente grande, esiste sempre una soglia al di là della quale tutti i termini
della successione sono ancora pi` u grandi di M (se il limite è +), ovvero
ancora pi` u piccoli di M (se il limite è ).
Esempi 2.1.6 (1) lim
n
1
n
= 0. Infatti, ssato > 0, la relazione [
1
n
0[ =
1
n
< è vericata non appena n >
1
. Quindi la denizione è soddisfatta se

si sceglie =
1
; se si vuole N, si potrà prendere =

_
1
+ 1.
(2) lim
n
n
n10
= 1 (questa successione è denita per n 11). Infatti, dato
> 0 si ha
n
n 10
1
<
n
n 10
1 < n > 10
_
1 +
1
_
,
114
per cui basta scegliere = 10
_
1 +
1
_
, o anche =
20
(purche sia 1).

(3) Se q C e [q[ < 1, allora lim
n
q
n
= 0. Infatti dato > 0 si ha
[q
n
[ = [q[
n
< se e solo se n > log
|q|
(si ricordi che la funzione log
|q|
è
decrescente essendo [q[ < 1). Se, invece, [q[ 1 e q / [1, +[, la successione
q
n
non ha limite (esercizio 2.1.7). Osserviamo però che se q R e q 1
lim
n
q
n
=
_
1 se q = 1
+ se q > 1.
Ciò è evidente se q = 1; se q > 1 basta osservare che q
n
> M se e solo se
n > log
q
M, dato che la funzione log
q
stavolta è crescente.
(4) Per ogni q C con [q[ < 1 si ha lim
n
n
k=0
q
k
=
1
1q
. Infatti
k=0
q
k
1
1 q
1 q
n+1
1 q

1
1 q
=
[q[
n+1
[1 q[
,
quindi
k=0
q
k
1
1 q
=
[q[
n+1
[1 q[
< n + 1 > log
|q|
([1 q[).
Ma anche senza questo calcolo esplicito, che oltretutto non è sempre possi-
bile, si poteva osservare che, per lesempio 2.1.6 (3), si ha lim
n
q
n
= 0;
quindi esiste certamente un tale che [q
n+1
[ < [1 q[ per ogni n > . Di
conseguenza risulta, per tutti gli n superiori a quel ,
k=0
q
k
1
1 q
=
[q[
n+1
[1 q[
< .
(5) lim
n
n! = +. Infatti, ovviamente n! > M non appena, ad esempio,
n > M.
(6) Si ha
lim
n
log
b
n =
_
+ se b > 1
se 0 0 risulta
_
log
b
n > M n > b
M
se b > 1,
log
b
n < M n > b
M
se 0 0, si ha lim
n
a
1/n
= 1. La cosa è evidente se a = 1, perche
in tal caso addirittura [a
1/n
1[ = [1 1[ = 0 per ogni n N
+
. Se a > 1,
ricordando lesempio 1.8.3 (1) abbiamo che inf
nN
+ a
1/n
= 1; dunque, dato
> 0 esiste N tale che
1 < a
1/
< 1 +.
Daltra parte, essendo a > 1 si ha a
1/n
< a
1/
per n > : dunque a maggior
ragione
[a
1/n
1[ = a
1/n
1 < n > ,
che è la tesi. Inne se 0 < a < 1 si ha
1
a
> 1 e quindi, per quanto già provato,
per ogni > 0 esiste tale che
_
1
a
_
1/n
1
=
_
1
a
_
1/n
1 < n > ;
dunque, moltiplicando per a
1/n
,
[1 a
1/n
[ = 1 a
1/n
< a
1/n
< n > ,
e la tesi è provata anche in questo caso.
(8) Non è chiaro a priori se la successione n
1/n
abbia limite per n :
lesponente tende a rimpicciolire il numero, la base tende ad accrescerlo.
Osserviamo intanto che n
1/n
1 per ogni n N
+
; daltra parte, se per
ogni n 2 applichiamo la disuguaglianza delle medie (teorema 1.8.2) agli n
numeri positivi a
1
= . . . = a
n2
= 1, a
n1
= a
n
=

n, si ottiene
n
1
n
=
_
n
k=1
a
k
_1
n
<
1
n
n
k=1
a
k
= 1 +
2
n

2
n
< 1 +
2
n
.
Da qui segue che, per ogni ssato > 0, risulta
n
1
n
< 1 + purche
2
n
< ,
ossia purche n > 4/
2
. In conclusione,
lim
n
n
1/n
= 1.
116
Osservazione 2.1.7 Se una certa proprietà p(n) è vericata per ogni nume-
ro naturale maggiore di una data soglia (ossia, in altri termini, se essa vale
per tutti i naturali salvo al pi` u un numero nito), diremo che tale proprietà
è vera denitivamente. Cos`, nellesempio 2.1.6 (8) si ha per ogni > 0
2
n
< denitivamente,
in quanto, come si è visto, tale condizione è vera per tutti gli n > 4/
2
.
Analogamente, la denizione di limite può essere riformulata come segue: si
ha lim
n
a
n
= L se e solo se per ogni > 0 risulta [a
n
L[ < denitiva-
mente, e si ha lim
n
a
n
= + oppure lim
n
a
n
= se per ogni M > 0
risulta a
n
> M denitivamente, oppure a
n
< M denitivamente.
Successioni limitate
Unimportante classe di successioni è quella delle successioni limitate (che
non signica dotate di limite!).
Denizione 2.1.8 (i) Sia a
n
una successione reale o complessa. Diciamo
che a
n
è limitata se esiste M > 0 tale che
[a
n
[ M n N.
(ii) Sia a
n
una successione reale. Diciamo che a
n
è limitata superior-
mente (oppure limitata inferiormente) se esiste M R tale che
a
n
M n N oppure a
n
M n N.
Ovviamente, una successione reale è limitata se e solo se è limitata sia
superiormente che inferiormente. Inoltre, ricordando che
max[Rez[, [Imz[ [z[ [Rez[ +[Imz[ z C,
deduciamo che una successione complessa a
n
è limitata se e solo se le due
successioni reali Rea
n
, Ima
n
sono entrambe limitate.
Proposizione 2.1.9 Ogni successione convergente è limitata; il viceversa è
falso.
117
Dimostrazione Sia lim
n
a
n
= L. Allora, scelto = 1, esiste N tale
che
[a
n
L[ < 1 n > ;
quindi se n > si ha
[a
n
[ = [a
n
L +L[ [a
n
L[ +[L[ < 1 +[L[,
mentre se n = 0, 1, 2, . . . , risulta evidentemente
[a
n
[ max[a
k
[ : k N, k .
In denitiva tutti i numeri [a
n
[ sono non superiori alla quantità
M = max1 +[L[, [a
0
[, [a
1
[, . . . , [a
[.
La successione (1)
n
mostra che il viceversa è falso.
Per le successioni reali divergenti si ha un risultato della stessa natura (eser-
cizio 2.1.8).
Proprietà algebriche dei limiti
Proviamo anzitutto lunicità del limite:
Proposizione 2.1.10 Il limite di una successione reale o complessa, se esi-
ste, è unico.
Dimostrazione Supponiamo per assurdo che a
n
converga a L ed anche
a M, con L ,= M; supponiamo L e M entrambi niti. Fissato tale che
0 < <
1
2
[L M[, si ha per ipotesi
[a
n
L[ < denitivamente, [a
n
M[ < denitivamente;
quindi, scegliendo un n che superi la maggiore delle due soglie, si ha anche
[L M[ = [L a
n
+a
n
M[ [L a
n
[ +[a
n
M[ < 2 < [L M[,
e questo è assurdo. Pertanto deve essere L = M.
Lasciamo al lettore diligente lanalisi dei casi in cui L, o M, è .
Vediamo ora come si comportano i limiti rispetto alle operazioni algebriche.
118
Teorema 2.1.11 Siano a
n
, b
n
successioni reali o complesse. Se a
n
L
e b
n
M per n , con L e M niti, allora:
(i) a
n
+b
n
L +M per n ;
(ii) a
n
b
n
L M per n .
Supposto inoltre M ,= 0, si ha:
(iii)
1
b
n
1
M
per n ;
(iv)
a
n
b
n
L
M
per n .
Dimostrazione (i)-(ii) Fissato > 0, si ha
[a
n
L[ < denitivamente, [b
n
M[ < denitivamente;
quindi risulta denitivamente
[a
n
+b
n
L M[ [a
n
L[ +[b
n
M[ < 2,
e ciò prova (i), tenuto conto dellosservazione 2.1.4 (3). Inoltre
[a
n
b
n
LM[ = [a
n
b
n
Lb
n
+Lb
n
LM[
[a
n
L[ [b
n
[ +[L[ [b
n
M[ < ([b
n
[ +[L[).
Daltra parte, la successione b
n
, essendo convergente, è limitata da una
costante K > 0, in virt` u della proposizione 2.1.9; ne segue
[a
n
b
n
LM[ < (K +[L[) denitivamente,
il che prova (ii), tenuto nuovamente conto dellosservazione 2.1.4 (3).
(iii) Osserviamo anzitutto che b
n
è denitivamente diversa da 0 essendo
M ,= 0, ed anzi si ha [b
n
[ C > 0 denitivamente (esercizio 2.1.9). Quindi
per ogni > 0 si ha
1
b
n
1
M
=
[M b
n
[
[b
n
[ [M[
<

C[M[
denitivamente,
da cui la tesi.
(iv) Segue da (ii) e (iii).
Per un analogo risultato nel caso di successioni (reali) divergenti si rimanda
allesercizio 2.1.18.
119
Limiti e ordinamento
Vediamo adesso come si comportano i limiti rispetto alla struttura dordine
di R.
Teorema 2.1.12 (di confronto) Siano a
n
, b
n
successioni reali. Se
a
n
L e b
n
M per n , e se
a
n
b
n
denitivamente,
allora si ha L M.
Dimostrazione Supponiamo, per ssare le idee, che L, M R e, per as-
surdo, che L > M; scegliamo 0 < <
1
2
(L M). Sia la soglia tale
che
a
n
b
n
, [L a
n
[ < , [M b
n
[ < n > .
Per tali n si ha anche
L < a
n
b
n
< M +,
da cui 0 < L M < 2 per ogni > 0. Ciò è assurdo, per il lemma
dellarbitrarietà di (lemma 1.10.1).
Il caso L = oppure M = è analogo.
Esercizi 2.1
1. Si provi che si ha lim
n
a
n
= L, con L C, se e solo se risulta
lim
n
(a
n
L) = 0.
2. Sia a
n
C. Si provi che a
n
ha limite L C se e solo se le due
successioni reali Rea
n
e Ima
n
convergono entrambe, con limiti ReL
e ImL rispettivamente.
3. Si provi che se a
n
L, allora [a
n
[ [L[.
`
E vero il viceversa?
n
0 e b
n
è limitata, allora a
n
b
n
0.
5. Dimostrare che se a
n
L, allora
lim
n
(a
n+1
a
n
) = 0.
`
120
n
L e L ,= 0, allora
lim
n
a
n+1
a
n
= 1.
`
E vero il viceversa? Che succede se L = 0?
7. Si dimostri che se q C, [q[ 1 e q ,= 1 allora la successione q
n
non
ha limite.
8. Provare che se a
n
è una successione reale divergente, allora a
n
non
è limitata, ma che il viceversa è falso.
9. (Teorema della permanenza del segno) Sia a
n
C. Provare che:
(i) se lim
n
a
n
,= 0, allora esiste > 0 tale che
[a
n
[ denitivamente;
(ii) se a
n
R e se lim
n
a
n
> 0, allora esiste > 0 tale che
a
n
denitivamente.
10. Provare che
lim
n
n
a
n
= 0 a > 1,
e dedurre che
lim
n
n
b
a
n
= 0 a > 1, b R.
11. Provare che
lim
n
log
a
n
n
= 0 a > 0, a ,= 1,
e dedurre che
lim
n
log
a
n
n
b
= 0 a > 0, a ,= 1, b > 0.
12. Provare che
lim
n
a
n
n!
= 0 a > 1.
121
13. Provare che
lim
n
n!
n
n
= 0.
14. Provare che
lim
n
n
n
a
= 1 a R.
15. Provare che
lim
n
n
n! = +.
[Traccia: ricordare lesercizio 1.6.16.]
16. Calcolare, se esistono:
(i) lim
n
n
2
n
+ 3
n
, (ii) lim
n
n
_
(2)
n
+ 3
n
, (iii) lim
n
n
_
2
n
+ (1)
n+1
.
17. Calcolare, se esiste, lim
n
a
n
, ove a
n
= 1 se n è pari e a
n
= 2
n
se n
è dispari.
18. Siano a
n
e b
n
successioni reali. Dimostrare che:
(i) se a
n
+ e b
n
è limitata inferiormente, allora a
n
+b
n
+;
(ii) se a
n
e b
n
è limitata superiormente, allora a
n
+b
n
;
(iii) se a
n
+ e b
n
K > 0 denitivamente, allora a
n
b
n
+;
(iv) se a
n
+ e b
n
K < 0 denitivamente, allora a
n
b
n
;
(v) se a
n
e b
n
K > 0 denitivamente, allora a
n
b
n
;
(vi) se a
n
e b
n
K < 0 denitivamente, allora a
n
b
n
+;
(vii) se a
n
+ oppure a
n
, allora 1/a
n
0;
(viii) se a
n
0 e a
n
,= 0 denitivamente, allora 1/[a
n
[ + (questo
vale anche se a
n
C);
(ix) se a
n
0 e a
n
> 0 denitivamente, allora 1/a
n
+;
(x) se a
n
0 e a
n
< 0 denitivamente, allora 1/a
n
;
(xi) negli altri casi, cioè per le cosiddette forme indeterminate seguenti:
(a) + (per il limite di a
n
+ b
n
quando a
n
+ e b
n

),
(b) 0 () (per il limite di a
n
b
n
quando a
n
0 e b
n
),
122
(c)

(per il limite di
an
bn
quando a
n
e b
n
),
(d)
0
0
(per il limite di
an
bn
quando a
n
0 e b
n
0),
si mostri con esempi che il corrispondente limite può essere un
numero reale qualunque, oppure , oppure può non esistere.
19. (Teorema dei carabinieri) Siano a
n
, b
n
, c
n
successioni reali tali
che a
n
b
n
c
n
denitivamente. Si provi che se a
n
L e c
n
L
(con L R oppure L = ), allora b
n
L.
20. Calcolare, se esistono, i seguenti limiti:
(i) lim
n
_
4n sin 3
n
8
n
_
, (ii) lim
n
ncos
1
n
,
(iii) lim
n
_
n + 1
n
_
, (iv) lim
n
nsin
2
1
n
,
(v) lim
n
_
2n
n
_
, (vi) lim
n
2
n
2
n!,
(vii) lim
n
(4
n
+ 10
n
11
n
), (viii) lim
n
_
3
n+1
3
n
2
+1
_
.
n
R, a
n
L e L > 0, allora
lim
n
k
a
n
=
k
L k N
+
, lim
n
n
a
n
= 1.
n
L, L C, allora
lim
n
1
n
n1
k=0
a
k
= L.
`
E vero il viceversa? Che succede se a
n
R e L = ?
n
]0, [ e a
n
L, con L [0, [, allora
lim
n
n
_
n1
k=0
a
k
= L.
`
E vero il viceversa? Che succede se L = +?
24. Sia b
n
una successione di numeri positivi tale che b
n
b, con b > 0.
Si provi che b
x
n
b
x
per ogni x R.
123
2.2 Serie
Le serie numeriche sono semplicemente successioni reali o complesse di tipo
particolare, che però, per la loro importanza pratica e teorica, meritano una
trattazione a parte.
Data una successione a
n
reale o complessa, andiamo a costruire una nuova
successione s
n
in questo modo:
_
s
0
= a
0
s
n+1
= s
n
+a
n+1
n N.
Si ha dunque
s
n
=
n
k=0
a
k
n N.
Denizione 2.2.1 La successione s
n
sopra denita si chiama serie degli
a
k
e si indica con il simbolo
a
k
(o, pi` u pedantemente, con
k=0
a
k
, quando
si voglia precisare qual è lindice iniziale: si possono infatti considerare anche
serie del tipo
k=1
a
k
,
k=50
a
k
,
k=p
a
k
con p N ssato ad arbitrio).
I numeri a
k
si dicono termini della serie ed i numeri s
n
si dicono somme
parziali della serie.
Si noti che nel denire una serie ed il simbolo che la indica non si è fatto
alcun riferimento alla convergenza della successione s
n
, che può benissimo
non vericarsi.
Denizione 2.2.2 Si dice che la serie
a
k
è convergente ad un numero
(reale o complesso) L se la successione delle sue somme parziali s
n
è con-
vergente ed ha limite L; in tal caso il numero L si dice somma della serie e
si scrive
L = lim
n
n
k=0
a
k
=
k=0
a
k
.
Come si vede, cè una certa ambiguità, perche lo stesso simbolo
k=0
a
k
viene usato sia per indicare la serie (convergente o no), sia per indicarne la
somma (se convergente). Purtroppo si tratta di una notazione di uso ormai
consolidato, e non possiamo evitare di adottarla; sarà comunque chiaro di
volta in volta dal contesto del discorso in quale dei due sensi va inteso il
simbolo
k=0
a
k
.
124
Osservazione 2.2.3 Una serie è dunque una particolare successione, co-
struita a partire da unaltra successione assegnata. Però il punto di vista
si può anche capovolgere: ogni successione a
n
può essere vista come una
serie
b
k
, con b
n
opportuna. Basta infatti denire
_
b
0
= a
0
b
n+1
= a
n+1
a
n
n N,
ed è facile vericare che allora
a
n
=
n
k=0
b
k
n N,
cioè a
n
coincide con la serie
b
k
.
Successioni e serie sono dunque concetti del tutto equivalenti. Tuttavia le
serie si presentano spesso in modo naturale nelle applicazioni (geometriche,
siche, meccaniche, ecc.); inoltre la teoria delle serie è per molti aspetti pi` u
maneggevole ed articolata di quella delle successioni. Ad esempio, vi sono
svariati criteri di uso molto semplice che garantiscono la convergenza delle
serie, i cui analoghi per le successioni non sono altrettanto comodi dal punto
di vista pratico.
Nel caso di serie reali si può dare anche la nozione di serie divergente:
Denizione 2.2.4 Diciamo che la serie reale
b
k
è divergente positiva-
mente, oppure divergente negativamente, se le sue somme parziali s
n
forma-
no una successione che tende a +, oppure a , per n . In tal caso
si scrive
k=0
a
k
= +, oppure
k=0
a
k
= .
Denizione 2.2.5 Diciamo che la serie
a
k
(reale o complessa) è inde-
terminata se la successione delle sue somme parziali s
n
non ha limite per
n .
Esempi 2.2.6 (1) (Serie geometrica) Sia q C. Se [q[ < 1, allora
k=0
q
k
=
1
1 q
(esempio 2.1.6 (4)). Se [q[ 1 e q ,= 1, la serie è indeterminata in virt` u
dellesercizio 2.1.7, mentre se q = 1 la serie diverge positivamente.
125
(2) Risulta
k=1
1
k(k+1)
= 1. Infatti
s
n
=
n
k=1
1
k(k + 1)
=
n
k=1
_
1
k

1
k + 1
_
= 1
1
n + 1
1 per n .
Questo è un esempio di serie telescopica: sono telescopiche le serie che si
presentano nella forma
(b
k
b
k+1
), cosicche s
n
= b
0
b
n+1
. Ciò in eet-
ti accade sempre, tenuto conto dellosservazione 2.2.3, ma si parla di serie
telescopiche soltanto quando questo modo di vederle porta ad una concreta
semplicazione della situazione.
(3) (Serie armonica) La serie
k=1
1
k
si chiama serie armonica perche cia-
scun termine (salvo il primo) è la media armonica del predecessore e del
successore (la media armonica di due numeri positivi a,b è il numero
2
1/a+1/b
;
si veda anche lesercizio 1.8.4). Osservando che i termini
1
k
sono positivi e
decrescenti, si ha
s
2n
s
n
=
2n
k=n+1
1
k

n
2n
=
1
2
n N
+
.
Ne segue che la serie armonica non può essere convergente, perchè in tal caso
esisterebbe L R tale che [s
n
L[ <
1
4
denitivamente; ma allora, scelto n
abbastanza grande, dedurremmo
1
2
s
2n
s
n
[s
2n
L[ +[L s
n
[ <
1
4
+
1
4
=
1
2
,
il che è assurdo. In eetti la stima precedente mostra che per ogni ssato
m N e per ogni n 2
m
si ha
s
n
s
2
m = s
1
+ (s
2
s
1
) + (s
4
s
2
) + (s
8
s
4
) + + (s
2
m s
2
m1) =
= 1 +
m
k=1
(s
2
k s
2
k1) 1 +
m
k=1
1
2
= 1 +
m
2
,
e ciò prova che s
n
(denizione 2.2.4), ossia che la serie armonica è
divergente positivamente.
Osservazione 2.2.7 Sia
k=0
a
k
una serie convergente con somma L. Al-
lora sottraendo s
m
ad entrambi i membri delluguaglianza
k=0
a
k
= L si
126
ottiene che per ogni m N la serie
k=m+1
a
k
è convergente e
k=m+1
a
k
= L s
m
m N.
In particolare, facendo tendere m a +, si deduce che per ogni serie
a
k
convergente si ha
lim
m
k=m
a
k
= 0.
La serie
k=m
a
k
si chiama resto m-simo della serie
k=0
a
k
.
Vediamo ora una condizione necessaria per la convergenza di una serie.
Proposizione 2.2.8 Se
a
k
è una serie convergente, allora i suoi termini
a
n
formano una successione innitesima, ossia risulta a
n
0 per n ;
il viceversa è falso.
Dimostrazione Se L è la somma della serie, ssato > 0 esiste N tale
che [s
n
L[ < per ogni n > . Quindi
[a
n
[ = [s
n
s
n1
[ [s
n
L[ +[L s
n1
[ < 2 n > + 1,
cioè a
n
0 per n .
La serie armonica (esempio 2.2.6 (3)) è una serie che non converge, benche i
suoi termini
1
n
formino una successione innitesima.
Osservazione 2.2.9 Lanalogo della proposizione precedente per le succes-
sioni si può enunciare nel modo seguente (vedere esercizio 2.1.5): se a
n
è
una successione convergente, allora
lim
n
(a
n
a
n+1
) = 0,
ma il viceversa è falso, come mostra la successione
n.
Esercizi 2.2
1. Provare che se
a
n
e
b
n
sono serie convergenti, anche la serie
(a
n
+b
n
) è convergente e
n=0
(a
n
+b
n
) =
n=0
a
n
+
n=0
b
n
;
127
si provi anche che per ogni C la serie
(a
n
) è convergente e
n=0
(a
n
) =
n=0
a
n
.
Si generalizzino questi enunciati, per quanto possibile, al caso di serie
reali divergenti.
2. (criterio del confronto) Siano
a
n
e
b
n
serie reali tali che 0 a
n

b
n
per ogni n N.
(i) Si provi che se
b
n
converge, allora
a
n
converge e
n=0
a
n

n=0
b
n
; in quale caso vale luguaglianza?
(ii) Si provi che se
a
n
diverge, allora
b
n
diverge.
3. Sia
a
n
una serie a termini reali non negativi. Si dimostri che
n=0
a
n
< +
n=0
a
n
1 +a
n
< +.
4. Sia
a
n
una serie a termini reali non negativi. Si dimostri che se
a
n
è convergente, allora
(a
n
)
p
è convergente per ogni p 1.
5. Sia a
n
C. Si provi che se
a
2m
e
a
2m+1
sono convergenti, allora
a
n
è convergente e
n=0
a
n
=
m=0
a
2m
+
m=0
a
2m+1
;
è vero il viceversa?
6. Sia a
n
C. Si provi che se
[a
n
[
2
an
n
è
convergente, ma che il viceversa è falso.
7. (i) Si provi che ogni numero razionale ha uno sviluppo decimale perio-
dico (eventualmente di periodo nullo).
128
(ii) Viceversa, sia x un numero reale con sviluppo decimale periodico, il
cui antiperiodo sia un intero a = a
1
. . . a
p
di p cifre e il cui periodo
sia un intero b = b
1
. . . b
q
con q cifre. Si provi che
x [x] =
a
10
p
+
b
10
p
n=1
1
10
qn
;
dedurre che x è un numero razionale, il quale si può scrivere sotto
forma di frazione (la frazione generatrice di x), il cui denominatore
è fatto da q cifre 9 seguite da p cifre 0, e il cui numeratore è la
dierenza fra lintero a
1
. . . a
p
b
1
. . . b
q
e lintero b
1
. . . b
q
.
2.3 Successioni monotone
Unimportante classe di successioni reali è quella delle successioni monotòne
(e non monòtone!).
n
R. Diciamo che a
n
è monotona crescente
se si ha
a
n+1
a
n
n N.
Diciamo che a
n
è monotona decrescente se si ha
a
n+1
a
n
n N.
Diciamo che a
n
è strettamente crescente o strettamente decrescente se
la corrispondente disuguaglianza è stretta per ogni n N. In entrambi i
casi precedenti, la successione si dirà strettamente monotòna. Inne di-
ciamo che a
n
è denitivamente monotona (crescente o decrescente) se la
corrispondente disuguaglianza è vera soltanto da una certa soglia in poi.
Esempi 2.3.2 (1)
1
n
, n sono successioni strettamente decrescenti.
(2) (n + 1)!,
n1
n
sono successioni strettamente crescenti.
(3)
_
1 +
x
n
_
n
è una successione crescente per ogni x 1 (strettamente,
se x ,= 0), ed è denitivamente crescente per x < 1 (esempio 1.8.3 (2)).
(4) Le somme parziali di una serie a termini di segno costante formano
una successione monotona: crescente se il segno è positivo, decrescente se è
negativo.
129
Il comportamento allinnito delle successioni monotone è particolarmente
semplice. Si ha infatti:
Proposizione 2.3.3 Sia a
n
R una successione monotona. Allora essa
ha limite e si ha
lim
n
a
n
=
_
_
_
sup
nN
a
n
] , +] se a
n
è crescente,
inf
nN
a
n
[, +[ se a
n
è decrescente.
In particolare, una successione monotona è convergente se e solo se è limi-
tata.
Dimostrazione Proveremo la tesi solamente nel caso in cui a
n
è de-
crescente, lasciando laltro caso al lettore. Sia L lestremo inferiore della
successione a
n
, e supponiamo dapprima che L R: allora, come sappiamo
(proposizione 1.5.10), si ha
L a
n
n N,
> 0 N : L a
< L +.
Poiche a
n
è decrescente, deduciamo
L a
n
a
< L + n ,
da cui segue che a
n
L per n +. Se invece L = , allora a
n
non
ha minoranti e quindi
M > 0 N : a
< M;
per la decrescenza di a
n
segue che
a
n
a
< M n ,
cioè a
n
per n +.
Lultima proprietà è banale: se a
n
è monotona e limitata, allora ha estremo
superiore ed estremo inferiore niti, e quindi ha limite nito coincidente
con uno dei due, cioè è convergente; viceversa, ogni successione convergente
è limitata per la proposizione 2.1.9 (si noti che questo è vero anche se la
successione non è monotona).
Tornando alle serie, la proposizione precedente ci dice che per provare la
convergenza delle serie a termini positivi è suciente far vedere che le somme
parziali sono limitate superiormente: e questo è spesso abbastanza facile.
130
Esempi 2.3.4 (1) (Serie armonica generalizzata) Per > 0 consideriamo
la serie
n=1
1
n
.
Se = 1, essa si riduce alla serie armonica e, come si è visto nellesempio
2.2.6 (3), è divergente (positivamente). Dunque per ogni ]0, 1[ si ha a
maggior ragione
s
n
=
n
k=1
1
k
>
n
k=1
1
k
+ per n +,
cioè la serie diverge positivamente. Se = 2, tenuto conto dellesempio 2.2.6
(2), si ha
s
n
=
n
k=1
1
k
2
< 1 +
n
k=2
1
k(k 1)
= 1 +
n1
h=1
1
h(h + 1)
2 per n +,
e per il teorema di confronto (teorema 2.1.12) la serie converge ed ha somma
inferiore a 2. Se > 2, a maggior ragione,
s
n
=
n
k=1
1
k
<
n
k=1
1
k
2
e, per confronto con il caso = 2, la serie converge (con somma minore di
2).
Resta il caso ]1, 2[: analogamente a quanto fatto per la serie armonica,
andiamo a stimare la dierenza s
2n
s
n
: si ha
s
2n
s
n
=
2n
k=n+1
1
k

n
(n + 1)
n N
+
;
quindi, ssato m N
+
e scelto n = 2
m
, la disuguaglianza precedente implica
s
n
= s
2
m = 1 +
m
k=1
(s
2
k s
2
k1) 1 +
m
k=1
2
k1
(2
k1
+ 1)
<
< 1 +
m
k=1
1
2
(k1)(1)
< 1 +
1
1 2
(1)
.
131
Dato che m 2
m
per ogni m N, si conclude che
s
m
s
2
m < 1 +
1
1 2
(1)
m N
+
,
e pertanto la serie è convergente. In denitiva, la serie armonica generalizzata
ha il seguente comportamento:
n=1
1
n
_
converge se > 1
diverge a + se 1.
(2) (Serie esponenziale) Consideriamo la serie
n=0
1
n!
,
che è convergente in quanto
s
n
=
n
k=0
1
k!
2 +
n
k=2
1
k(k 1)
3 per n +.
Questa serie è un caso particolare della serie esponenziale
z
n
n!
, z C, che
verrà analizzata in seguito.
Stabiliamo adesso unimportante relazione che ci darà modo di denire il
fondamentale numero reale e.
k=0
1
k!
= lim
n
_
1 +
1
n
_
n
.
Dimostrazione Notiamo che il limite a destra esiste perche la successione
(1 +
1
n
)
n
è crescente (esempio 1.8.3 (2)). Inoltre si ha, utilizzando la formula
di Newton (teorema 1.7.1),
_
1 +
1
n
_
n
=
n
k=0
_
n
k
_
1
n
k
n N
+
;
132
quindi, per ogni n N
+
,
_
1 +
1
n
_
n
= 1 +
n
k=1
n(n 1) . . . (n k + 1)
k! n
k
=
= 1 +
n
k=1
1
k!

n
n

n 1
n
. . .
n k + 1
n

n
k=0
1
k!
,
da cui, per il teorema di confronto (teorema 2.1.12),
lim
n
_
1 +
1
n
_
n
k=0
1
k!
.
Daltra parte, per ogni ssato m N
+
si ha
m
k=0
1
k!
= 1 +
m
k=1
1
k!
lim
n
_
n
n
n 1
n
. . .
n k + 1
n
_
=
= 1 + lim
n
m
k=1
1
k!
n
n
n 1
n
. . .
n k + 1
n
= lim
n
m
k=0
_
n
k
_
1
n
k
;
aumentando nellultimo termine il numero degli addendi da m (che è sso)
a n (che è pi` u grande, dato che sta tendendo a +) si ottiene
m
k=0
1
k!
lim
n
n
k=0
_
n
k
_
1
n
k
= lim
n
_
1 +
1
n
_
n
m N
+
,
da cui nalmente, facendo tendere anche m a +,
k=0
1
k!
lim
n
_
1 +
1
n
_
n
,
il che prova luguaglianza richiesta.
Denizione 2.3.6 Indichiamo con e il numero reale denito dalla proposi-
zione 2.3.5, ossia poniamo
e =
k=0
1
k!
= lim
n
_
1 +
1
n
_
n
.
133
Il numero e si chiama numero di Nepero e riveste unimportanza fondamentale
in tutta la matematica. Esso è un irrazionale (esercizio 2.3.1) ed è compreso
fra 2 e 3: infatti
2 =
1
k=0
1
k!
<
k=0
1
k!
< 2 +
k=2
1
k(k 1)
= 3.
Il logaritmo in base e si dice logaritmo naturale e si scrive indierentemente
log
e
x = log x = ln x.
Esercizi 2.3
1. Provare che
n=m+1
1
n!
<
1
m m!
m N
+
,
e dedurne che e è irrazionale.
[Traccia: se fosse e = p/q con p, q N
+
primi tra loro, avremmo per
ogni m N la disuguaglianza 0 q, si deduca un assurdo.]
2. Dimostrare che se b > 1 si ha
n=2
1
nlog
b
n
= +,
n=2
1
n(log
b
n)
< + > 1.
[Traccia: stimare s
2n
s
n
per n = 2
k
, analogamente a quanto fatto
per la serie armonica e per la serie armonica generalizzata negli esempi
2.2.6 (3) e 2.3.4 (1).]
3. Sia a
n
una successione decrescente di numeri positivi. Provare che
se
a
n
è convergente, allora lim
n
n a
n
= 0, ma che il viceversa è
falso.
4. Si provi che le successioni
_
1 +
1
n
_
n+1
e
_
1
1
n+1
_
n
sono decrescenti e
se ne calcolino i limiti.
5. Calcolare, se esistono,
lim
n
_
1 +
1
n
2
_
n
, lim
n
_
1 +
1
n
_
n
2
.
134
6. Provare che
lim
n
_
n
2
1
n(1 +n
2
)
_ 1
n
= 1.
7. Dimostrare le disuguaglianze
1
n + 1
< log
_
1 +
1
n
_
<
1
n
,
1
n 1
< log
_
1
1
n
_
<
1
n
n N
+
,
e dedurre che
lim
n
log
_
1 +
1
n
_
1
n
= 1, lim
n
log
_
1
1
n
_
1
n
= 1.
8. (identità di Abel) Siano a
1
, . . . , a
n
, b
1
, . . . , b
n
, b
n+1
numeri complessi.
Posto s
k
=
k
h=1
a
h
, si provi che
n
k=1
a
k
b
k
= s
n
b
n+1
k=1
s
k
(b
k+1
b
k
).
9. Determinare il comportamento delle seguenti serie:
(i)
n=1
_
1 cos
1
n
_
, (ii)
n=1
sin
1
n
, (iii)
n=1
log n
n
3
,
(iv)
n=0
n(n 1)
(n + 1)(n + 2)
2
, (v)
n=2
1
(log n)
log n
, (vi)
n=1
n
n
(n!)
2
,
(vii)
n=1
[7 + 3(1)
n
]
n
2
3n
, (viii)
n=0
1
4
1 +n
3
, (ix)
n=0
n + 2
n
1 +n
3
,
(x)
n=1
_
n + 1
n(1 +n
2
)
_
n
, (xi)
n=1
_
n 1
n
_
n
, (xii)
n=1
(1)
n
40
1
n
.
10. Si verichi lidentità
n!
(n +k)!
=
1
k 1
_
n!
(n +k 1)!

(n + 1)!
(n +k)!
_
n N, k 2,
135
e se ne deduca che
n=0
n!
(n +k)!
=
1
(k 1)(k 1)!
k 2,
ossia
n=0
1
_
n+k
n
_ = 1 +
1
k 1
k 2.
11. Si provi che se a > 1 la serie
(a
1/n
2
1) è convergente mentre la serie
(a
1/n
1) è divergente. Che succede se 0 < a 1?
[Traccia: si utilizzi lidentità (a
1/k
1)
k1
h=0
a
h/k
= a 1.]
12. Sia a
n
denita per ricorrenza dalle relazioni
_
_
_
a
0
= 1
a
n+1
=
a
n
+a
n
n N,
ove è un ssato numero positivo. Si provi che a
n
è decrescente e se
ne calcoli il limite; si deduca che la serie
a
n
è convergente se > 1
e divergente se 0 < 1.
[Traccia: si trovi unespressione esplicita per a
n
.]
13. Sia F
n
la successione dei numeri di Fibonacci, deniti da
_
F
0
= 0, F
1
= 1,
F
n+2
= F
n+1
+F
n
n N;
si determini il comportamento della serie
1
Fn
.
14. Si provi che risulta
1
n + 1
<
k=n+1
1
k
2
<
1
n
n N
+
.
136
2.4 Criteri di convergenza per le serie
Come si è già accennato in precedenza, spesso è facile accertare la convergenza
di una serie senza conoscerne la somma. Ciò è reso possibile da alcuni comodi
criteri che forniscono condizioni sucienti per la convergenza delle serie. I pi` u
semplici di questi criteri riguardano le serie reali a termini di segno costante,
ad esempio positivi; il pi` u semplice in assoluto è il criterio del confronto, una
versione del quale si trova nellesercizio 2.2.2:
Proposizione 2.4.1 (criterio del confronto) Siano
a
n
,
b
n
due se-
rie reali, e supponiamo che risulti
0 a
n
b
n
denitivamente;
in tal caso, se
b
n
converge allora
a
n
converge, mentre se
a
n
diverge
a + allora
b
n
diverge a +.
Dimostrazione Sia N tale che 0 a
n
b
n
per ogni n : allora
0
n=m
a
n

n=m
b
n
m ,
cosicche i due enunciati seguono facilmente tenendo conto dellosservazione
2.2.7.
Si ha poi:
Proposizione 2.4.2 (criterio del rapporto) Sia
a
n
una serie con ter-
mini denitivamente positivi. Se esiste ]0, 1[ tale che
a
n+1
a
n
denitivamente,
allora la serie
a
n
è convergente. Il viceversa è falso.
Dimostrazione Sia N tale che a
n
> 0 per ogni n ed inoltre
a
n+1
a
n
n ;
allora si ha
a
n
= a

n1
k=
a
k+1
a
k
a

n1
k=
= a

n
n ,
137
cioè
a
n

a

n
n .
Dal criterio del confronto, essendo ]0, 1[, segue che
a
n
è convergente.
Viceversa, la serie
1/n
2
è una serie convergente, e malgrado ciò non verica
le ipotesi del criterio del rapporto: infatti
a
n+1
a
n
=
n
2
(n + 1)
2
1 per n +,
e quindi non esiste alcun ]0, 1[ che possa soddisfare lipotesi richiesta.
Osservazione 2.4.3 Si noti che nellipotesi del criterio del rapporto non
basta richiedere che sia
a
n+1
a
n
< 1 denitivamente:
infatti questa condizione è meno restrittiva ed esistono serie divergenti che
la soddisfano: per esempio la serie armonica
1
n
.
Esempi 2.4.4 (1) La serie
n!
n
n
è convergente: infatti
a
n+1
a
n
=
(n+1)!
(n+1)
n+1
n!
n
n
=
_
n
n + 1
_
n
=
1
_
1 +
1
n
_
n

1
e
per n +,
cosicche si ha denitivamente
a
n+1
a
n
<
1
e
+ < 1
pur di scegliere 0 < < 1
1
e
.
(2) La serie
b
n
è convergente per ogni R e per ogni b [0, 1[: infatti
a
n+1
a
n
=
_
n + 1
n
_
b b per n ,
e quindi si ha denitivamente
a
n+1
a
n
b + < 1
138
pur di scegliere 0 < < 1 b.
(3) La serie esponenziale
x
n
n!
è convergente per ogni x > 0: infatti
a
n+1
a
n
=
x
n + 1
0 per n +,
cosicchè per qualunque ]0, 1[ si ha
a
n+1
a
n
denitivamente.
(4) La serie
n=0
_
n +k
k
_
1/2
è a termini positivi, ma luso del criterio del rapporto non dà informazioni
sul suo comportamento: infatti
a
n+1
a
n
=
_
n + 1
n +k + 1
_
1/2
1 per n +,
quindi la serie potrebbe convergere o divergere. Tuttavia se k 3 si ha
a
n
=
k!n!
(n +k)!

k!
(n +k)(n +k 1)(n +k 2)

k!
n
3/2
n N
+
,
quindi la serie converge per il criterio del confronto; se invece k = 2, e a
maggior ragione se k = 0 o k = 1, si vede subito che la serie diverge per
confronto con la serie armonica.
Proposizione 2.4.5 (criterio della radice) Sia
a
n
una serie a termini
non negativi. Se esiste ]0, 1[ tale che
n
a
n
denitivamente,
allora la serie
a
n
è convergente; se invece esistono inniti valori di n per
i quali
n
a
n
1,
allora la serie
a
n
è positivamente divergente.
139
Dimostrazione Dalla prima ipotesi segue che si ha
a
n

n
denitivamente,
quindi
a
n
converge per il criterio del confronto, essendo ]0, 1[.
Se invece vale la seconda ipotesi, allora si ha a
n
1 per inniti valori di n:
quindi la serie
a
n
diverge a +.
Osservazione 2.4.6 Si noti che, come per il criterio del rapporto, nellipo-
tesi del criterio della radice non basta richiedere che sia
n
a
n
< 1 denitivamente,
in quanto questa condizione meno restrittiva è vericata da alcune serie
divergenti: per esempio la serie armonica
1
n
.
3
n
4
n
1
è convergente, perche
_
3
n
4
n
1
_1
n
=
3
4
_
1
1 4
n
_1
n
3
4
per n +,
cosicche, scelto 0 < <
1
4
, si ha
_
3
n
4
n
1
_1
n
<
3
4
+ < 1 denitivamente.
(2) La serie
_
1
1
n
_
n
2
è convergente: infatti, essendo
_
1
1
n
_
n
crescente,
_
_
1
1
n
_
n
2
_1
n
=
_
1
1
n
_
n
1
e
n N
+
.
(3) La serie
_
3
4
+
1
2
cos n
2
_
n
è a termini positivi e diverge a + perche il
termine generale a
n
è
a
n
=
_
_
_
3
4
_
n
se n è dispari,
_
5
4
_
n
se n è multiplo di 4,
_
1
4
_
n
se n è pari ma non è multiplo di 4,
cosicche
n
a
n
1 per inniti indici n.
140
(4) La serie
n=1
_
n
2
1
n(1 +n
2
)
_
n
è a termini positivi ma il criterio della radice non dà informazioni sulla
convergenza, in quanto
n
a
n
=
_
n
2
1
n(1 +n
2
)
_ 1
n
1 per n
(esercizio 2.3.6); quindi per ogni ]0, 1[ si ha denitivamente
<
n
a
n
< 1.
Tuttavia, in virt` u del criterio del confronto la serie è convergente poiche
_
n
2
1
n(1 +n
2
)
_
_
1
n
_
1
n
2
n 4.
Il criterio di convergenza di uso pi` u facile e frequente è il seguente:
Proposizione 2.4.8 (criterio del confronto asintotico) Siano
a
n
e
b
n
due serie a termini denitivamente positivi, e supponiamo che esista
L = lim
n
a
n
b
n
[0, +].
Allora:
(i) se L ]0, +[, le due serie hanno lo stesso comportamento;
(ii) se L = 0, la convergenza di
b
n
implica la convergenza di
a
n
;
(iii) Se L = +, la divergenza di
b
n
implica la divergenza di
a
n
.
Dimostrazione (i) Sia L > 0 e sia ]0, L[. Allora si ha
0 < L <
a
n
b
n
< L + denitivamente,
quindi
b
n
(L ) < a
n
 0 si ha denitivamente a
n
b
n
, da cui la tesi.
(iii) Fissato M > 0, si ha denitivamente Mb
n
< a
n
, da cui la tesi.
141
n=1
n
2
+ 3
n 4
2n
3
n + 1
converge perche confrontandola con
n
3/2
, che è convergente, si ha
lim
n
n
2
+3
n4
2n
3
n+1
1
n
3/2
=
1
2
.
(2) La serie
1
n
(cos n
2
+
n) è divergente a + perche confrontandola con
n
1/2
, che è divergente, si ha
lim
n
cos n
2
+
n
= 1.
(3) La serie
n
3+(1)
n
è convergente perche a confronto con
n
3/2
dà
lim
n
n
3/2
n
3(1)
n
= 0.
(4) Consideriamo la serie
n=2
1
n(log n)
,
ove 1. Notiamo che si ha, per ogni > 0,
1
n
1+
<
1
n(log n)
<
1
n
denitivamente
in quanto lim
n
n
(log n)
= + (esercizio 2.1.11). Quindi siamo in un caso

intermedio fra
1
n
(divergente) e
1
n
1+
(convergente), ed il criterio del
confronto asintotico non dà alcun aiuto. Tuttavia le somme parziali della
serie vericano
s
2n
s
n
=
2n
k=n+1
1
k(log k)

n
(n + 1)(log(n + 1))

1
(log n)
n 2,
s
2n
s
n
=
2n
k=n+1
1
k(log k)

n
2n(log(2n))
=
1
2
1
(log(2n))
n 2;
142
di conseguenza, con lo stesso ragionamento usato per la serie armonica e per
la serie armonica generalizzata (esempi 2.2.6 (3) e 2.3.4 (1)), se 1 si ha
per ogni m 2 e per ogni n 2
m
s
n
s
2
m =
1
2(log 2)
+
m
k=2
(s
2
k s
2
k1)
1
2(log 2)
+
1
2
m
k=2
1
(log 2
k
)
=
1
2(log 2)
k=1
1
k
,
mentre se > 1 si ha per ogni n 2
s
n
s
2
n =
1
2(log 2)
+
n
k=2
(s
2
k s
2
k1)
1
2(log 2)
+
1
2
n
k=2
1
(log 2
k1
)
=
1
(log 2)
_
1
2
+
n1
h=1
1
h
_
.
Dal comportamento della serie armonica generalizzata si deduce che
n=2
1
n(log n)
_
converge se > 1,
diverge a + se 1.
Esercizi 2.4
(i)
n=1
1
n
1+1/n
, (ii)
n=1
1
(n!)
1/n
, (iii)
n=2
1
log n!
,
(iv)
n=0
e
n
, (v)
n=1
log
_
1 +
1
n
2
_
, (vi)
n=2
log
_
1
1
n
2
_
,
(vii)
n=0
2
n
e
n
, (viii)
n=2
2
n
(log n)
n
, (ix)
n=1
tan
2
1
n
,
(x)
n=1
n
n! n
n
, (xi)
n=1
n
n
(
n)
n
, (xii)
n=1
10
n!n
n
.
143
2. (criterio di Raabe) Sia
a
n
una serie a termini positivi. Si provi che
se esiste K > 1 tale che
n
_
a
n
a
n+1
1
_
K n N
+
,
allora la serie converge, mentre se risulta
n
_
a
n
a
n+1
1
_
1 n N
+
,
allora la serie diverge a +.
[Traccia: nel primo caso, posto d = K 1, si mostri che a
n+1

1
d
(na
n
(n + 1)a
n+1
), e che quindi le somme parziali
n
k=1
a
k+1
non
superano
a
1
d
; nel secondo caso si verichi che a
n+1

a
1
n+1
.]
3. Si determini il comportamento delle seguenti serie:
(i)
n=1
1 4 7 . . . (3n 2)
3 6 9 . . . (3n)
, (ii)
n=1
_
1 4 7 . . . (3n 2)
3 6 9 . . . (3n)
_
2
.
[Traccia: utilizzare il criterio di Raabe.]
4. Vericare che il criterio di Raabe implica la divergenza della serie
armonica.
5. Si provi che esiste un numero reale ]0, 1[, detto costante di Eulero,
tale che
lim
n
_
n
k=1
1
k
log n
_
= .
[Traccia: utilizzare il risultato dellesercizio 2.3.7.]
6. Quanti addendi occorre sommare anche risulti
n
k=1
1
k
100?
7. Siano a
0
< a
1
< a
2
< . . . i numeri naturali che, scritti in cifre decimali,
non contengono la cifra 0. Provare che
n
k=1
1
a
k
< 90.
144
[Traccia: si determini quanti sono i numeri di n cifre fra le quali non
cè lo 0, e si osservi che essi sono tutti maggiori di 10
n1
. . .]
8. Si provi che
n
k=1
cos
x
2
k
=
sin x
2
n
sin
x
2
n
n N
+
, x R 0,
e di conseguenza si calcoli la somma della serie
k=1
log cos
x
2
k
, x R.
9. Si consideri la successione denita da
_
a
0
=
a
n+1
= max
1
2
a
n
, a
n
1 n N.
ove R.
(i) Si provi che a
n
è monotona e innitesima per ogni R.
(ii) Si determini il comportamento della serie
a
n
al variare di in
R.
10. Discutere la convergenza della serie
n=1
a
log n
n
al variare del parametro
a > 0.
11. Provare che
n=3
1
n(log n)(log log n)
_
converge se > 1,
diverge a + se 1.
12. Sia a
n
]0, +[. Si provi che
lim
n
a
n+1
a
n
= L = lim
n
n
a
n
= L,
e se ne deduca che il criterio della radice implica il criterio del rapporto.
145
2.5 Assoluta convergenza
Per le serie a termini complessi, o a termini reali di segno non costante,
i criteri di convergenza sin qui visti non sono applicabili. Lunico criterio
generale, rozzo ma ecace, è quello della convergenza assoluta.
Denizione 2.5.1 Sia
a
n
una serie a termini reali o complessi. Diciamo
che la serie è assolutamente convergente se la serie
[a
n
[ è convergente.
Si noti che per vericare la convergenza assoluta di una serie i criteri visti in
precedenza sono tutti validi perche
[a
n
[ è una serie a termini positivi. Na-
turalmente, come suggerisce il loro nome, le serie assolutamente convergenti
sono convergenti: vale infatti la seguente
Proposizione 2.5.2 Ogni serie assolutamente convergente è convergente.
Dimostrazione Sia
[a
n
[ convergente, e supponiamo dapprima che gli a
n
siano tutti reali. Poniamo
b
n
= [a
n
[ a
n
n N :
chiaramente si ha 0 b
n
2[a
n
[ per ogni n, cosicche
b
n
è convergente per
il criterio del confronto. Essendo
a
n
= [a
n
[ b
n
n N,
la serie
a
n
converge perche dierenza di serie convergenti (esercizio 2.2.1).
Supponiamo adesso che gli a
n
siano numeri complessi. Dalle relazioni
[Rez[ [z[, [Imz[ [z[ z C
segue, per il criterio del confronto, che le due serie reali
Rea
n
e
Ima
n
sono assolutamente convergenti; quindi, per quanto già dimostrato, esse con-
vergono. Dunque, applicando alle somme parziali
n
k=0
a
k
il risultato delle-
sercizio 2.1.2, si ottiene che la serie
a
n
=
Rea
n
+i
Ima
n
è convergente.
Come vedremo fra poco, il viceversa della proposizione precedente è falso:
esistono serie convergenti che non sono assolutamente convergenti.
Per le serie a termini reali di segno alterno cè uno speciale criterio di con-
vergenza.
146
Proposizione 2.5.3 (criterio di Leibniz) Sia a
n
una successione reale
decrescente ed innitesima. Allora la serie
(1)
n
a
n
è convergente e si ha
n=m+1
(1)
n
a
n
a
m+1
m N.
Dimostrazione Siano s
n
le somme parziali della serie
n=0
(1)
n
a
n
; se n
è pari, n = 2m, dalla decrescenza di a
n
segue che
s
2m+2
= s
2m
a
2m+1
+a
2m+2
s
2m
s
2
s
0
,
mentre se n è dispari, n = 2m + 1, si ha analogamente
s
2m+1
= s
2m1
+a
2m
a
2m+1
s
2m1
s
3
s
1
.
Inoltre per la positività degli a
n
s
2m+1
= s
2m
a
2m+1
s
2m
m N;
in denitiva
s
1
s
2m1
s
2m+1
s
2m
s
2m2
s
0
m N
+
.
Dunque le successioni s
2m+1
mN
e
s
2m
mN
sono monotone (crescente la
prima e decrescente la seconda) e li-
mitate; quindi convergono entrambe e,
posto
D = lim
m
s
2m+1
, P = lim
m
s
2m
,
dal teorema di confronto (teorema
2.1.12) si ha s
1
D P s
0
.
Daltra parte, essendo s
2m+1
s
2m
= a
2m+1
per ogni m N, dallipotesi
che a
n
è innitesima, passando al limite per m , si ottiene D = P.
Poniamo allora S = D = P, e proviamo che la serie
n=0
(1)
n
a
n
ha somma
S. Per ogni > 0 si ha
[s
2m
S[ < denitivamente, [s
2m+1
S[ < denitivamente;
147
quindi se n è abbastanza grande, pari o dispari che sia, risulterà [s
n
S[ < ,
e pertanto s
n
S per n .
Notiamo poi che si ha
s
2m+1
S s
2m+2
s
2m
m N,
da cui se n è pari, n = 2m,
0 s
n
S = s
2m
S s
2m
s
2m+1
= a
2m+1
= a
n+1
,
mentre se n è dispari, n = 2m + 1,
0 S s
n
= S s
2m+1
s
2m+2
s
2m+1
= a
2m+2
= a
n+1
;
in ogni caso
[s
n
S[ a
n+1
n N,
e ciò prova la tesi.
Osservazione 2.5.4 Il criterio di Leibniz è ancora vero per le serie che ne
vericano le ipotesi soltanto denitivamente: ad esempio, la serie potreb-
be essere a termini di segno alterno solo da un certo indice in poi, ed i
termini stessi, in valore assoluto, potrebbero essere decrescenti solo da un
certo altro indice in poi. In questo caso, però, la stima [s
n
S[ a
n+1
va
opportunamente modicata.
(1)
n
n
è convergente perche
1
n
è una succes-
sione decrescente ed innitesima. Questo è un esempio di serie convergente
ma non assolutamente convergente (dato che la serie dei valori assoluti è la
serie armonica).
(2) La serie
(1)
n
n
100
2
n
è convergente perche n
100
2
n
è innitesima e
denitivamente decrescente (esercizio 2.5.6).
(3) La serie
(1)
n 10
n
n
10
n+1
non converge: il suo termine generale non è in-
nitesimo.
(4) La serie
sin nx
n
2
converge per ogni x R: infatti è assolutamente con-
vergente, per confronto con la serie
1
n
2
.
(5) Quando nessun criterio di convergenza è applicabile, non rimane che ten-
tare uno studio diretto della serie e delle sue somme parziali, con il quale,
148
in certi casi, si riesce a determinarne il comportamento. Consideriamo ad
esempio la serie
n=1
(1)
n(n+1)
2
n
,
che non è assolutamente convergente. Essa non è a segni alterni: infatti si
ha
n(n+1)
2
=
n
k=1
k (esercizio 1.6.12), per cui la parità dellesponente di 1
cambia quando si somma un intero dispari e non cambia quando si somma
un intero pari. Il risultato è che la sequenza dei segni è 1, 1, 1, 1, 1,
1, 1, 1, 1, 1, 1, 1, . . .
Per studiare il comportamento della serie, analizziamone direttamente le som-
me parziali: se N è pari, N = 2m, si ha (dato che gli interi
2m(2m+1)
2
=
2m
2
+m e
(2m1)2m
2
= 2m
2
m hanno la stessa parità di m)
s
2m
=
2m
n=1
(1)
n(n+1)
2
n
=
= 1
1
2
+
1
3
+
1
4

1
5

1
6
+ +
(1)
m
2m1
+
(1)
m
2m
=
=
m
h=1
(1)
h
_
1
2h 1

1
2h
_
.
Questultima espressione è la somma parziale m-sima di una serie che verica
le ipotesi del criterio di Leibniz e quindi è convergente. Perciò la successione
s
2m
converge ad un numero reale S. Se ora N è dispari, N = 2m+1, si ha
s
2m+1
= s
2m
+
(1)
(2m+1)(2m+2)
2
2m + 1
S per m ;
quindi s
2m+1
converge anchessa a S. Se ne deduce, come nella dimostra-
zione del criterio di Leibniz, che lintera successione s
n
converge a S, e che
quindi la serie data è convergente.
(6) Come ultimo esempio consideriamo la serie
n=1
z
n
n
, ove z è un para-
metro complesso: utilizzando il criterio del rapporto si vede subito che essa
converge assolutamente quando [z[ < 1, mentre certamente non converge,
non essendo innitesimo il suo termine generale, quando [z[ > 1. Quando
[z[ = 1 non vi è convergenza assoluta, ma la serie potrebbe convergere in certi
punti: ciò è vero, come sappiamo (esempio 2.5.5 (1)), per z = 1, mentre
149
non è vero per z = 1. Cosa succede per gli altri z di modulo unitario?
Consideriamo le somme parziali
s
n
=
n
k=1
z
k
k
, n N
+
,
ove z C e [z[ = 1. Utilizziamo lidentità di Abel (esercizio 2.3.8), secondo
la quale se n N
+
e se a
1
, . . . , a
n
, b
1
, . . . , b
n
, b
n+1
sono numeri complessi,
allora
n
k=1
a
k
b
k
=
n
b
n+1
k=1
k
(b
k+1
b
k
),
ove
k
=
k
h=1
a
h
. Scegliamo
a
k
= z
k
, b
k
=
1
k
,
ed osserviamo che se z ,= 1 si ha
k
=
k
h=1
z
h
=
z(1 z
k
)
1 z
, [
k
[
2
[1 z[
k N
+
;
quindi la successione
k
kN
+ è limitata. Sostituendo nellidentità di Abel
otteniamo per [z[ = 1, z ,= 1,
s
n
=
n
k=1
z
n
n
=

n
n + 1

n
k=1
k
_
1
k + 1

1
k
_
=

n
n + 1
+
n
k=1
k
k(k + 1)
.
Il primo addendo nellultimo membro tende a 0 per n , in virt` u della
limitatezza delle
k
; il secondo addendo è la somma parziale di una serie as-
solutamente convergente, per confronto con la serie
1
k(k+1)
. Se ne conclude
che le somme parziali s
n
formano una successione convergente, e in denitiva
la serie
z
n
n
converge per ogni z di modulo unitario ad eccezione del punto
z = 1.
150
Esercizi 2.5
(i)
n=0
n(1)
n
n
2
+ 1
, (ii)
n=5
(1)
n
2n 101
, (iii)
n=47
(1)
n
2 + sin n
,
(iv)
n=1
(1)
n
n
3/7
, (v)
n=1
(1)
n
(
n
3 1), (vi)
n=1
2 + (1)
n
n
2
,
(vii)
n=1
(1)
n
n
1/n
, (viii)
n=0
(sin(sin n))
n
, (ix)
n=0
_
sin(n + 1)
n
2
+ 1
_
n
.
2. Determinare per quali x R convergono, e per quali x R convergono
assolutamente, le seguenti serie:
(i)
n=0
x
n
n + 1
, (ii)
n=1
x
n
sin
1
n
, (iii)
n=0
n
n + 1
(x 1)
n
,
(iv)
n=1
sin
n
x
n
, (v)
n=0
(2)
n
e
nx
, (vi)
n=1
(log x)
n
2
n
,
(vii)
n=1
x
1/n
n
1+1/n
, (viii)
n=0
x
n
, (ix)
n=0
log
_
1 +
x
n
2
_
,
(x)
n=1
(n!)
3
x
n
n(3n)!
, (xi)
n=0
n
3
(4x)
n
2
n!
, (xii)
n=0
sin
3x
n
2
+ 1
.
3. Quanti addendi occorre sommare per approssimare la somma della serie
n=0
(1)
n
2n+1
con un errore minore di
1
100
?
4. Provare che la serie
n=1
(1)
n 2n+1
n(n+1)
è convergente e calcolarne la
somma.
5. Per quali R la serie
1
1
2
+
1
3

1
4
+
1
5

1
6
+ +
1
2n 1

1
(2n)
+
è convergente?
151
6. Si provi che la successione n
n
è denitivamente decrescente per
ogni R e > 1.
7. Sia x un numero reale. Si provi che:
lim
n
sin nx x = k, k Z;
lim
n
cos nx x = 2k, k Z.
[Traccia: si supponga che L = lim
n
sin nx esista: usando la formula
di duplicazione per il seno si mostri dapprima che L = 0 oppure L =
3
2
; poi, usando la formula di addizione per sin(n+1)x, si deduca che
se L = 0 allora x è multiplo di , mentre se L ,= 0 allora cos x =
1
2
: da
qui si ricavi un assurdo.]
8. Si consideri la successione denita per ricorrenza da
_
_
_
a
0
= 0
a
n+1
= (a
n
)
2
+
1
4
n N.
(i) Provare che a
n
è crescente e limitata e calcolarne il limite L.
(ii) Provare che la serie
(L a
n
)
2
è convergente e determinarne la
somma.
(iii) Discutere il comportamento per n della successione a
n
quando il valore di a
0
è un numero > 0 qualsiasi, anziche 0.
9. Descrivere il comportamento delle seguenti serie:
(i)
n=0
1
n +i
, (ii)
n=1
sin(n/4)
n
, (iii)
n=0
(1)
n
i
n
2n + 1
, (iv)
n=1
n +in
n
2
in
.
10. Stabilire il comportamento della serie
n=1
z
n
n
sul bordo del cerchio di
convergenza.
[Traccia: utilizzare il procedimento dellesempio 2.5.5 (6).]
152
2.6 Successioni di Cauchy
Unimportante proprietà delle successioni reali o complesse, strettamente
legata alla nozione di limite, è quella espressa dalla denizione che segue.
n
una successione reale o complessa. Diciamo
che a
n
è una successione di Cauchy se vale la condizione seguente:
N : [a
n
a
m
[ < n, m > .
Come si vede, la condizione di Cauchy è molto vicina alla denizione di suc-
cessione convergente: invece che chiedere ai numeri a
n
di essere denitiva-
mente vicini al limite L, si chiede loro di avvicinarsi gli uni agli altri (sempre
denitivamente). Ma il legame con la nozione di limite è strettissimo; infatti:
Proposizione 2.6.2 Sia a
n
una successione reale o complessa. Allora
a
n
è una successione di Cauchy se e solo se essa è convergente.
Dimostrazione Se a
n
converge al numero complesso L allora, per de-
nizione,
> 0 N : [a
n
L[ <

2
n > .
Quindi per ogni n, m > si ha
[a
n
a
m
[ [a
n
L[ +[L a
m
[ <

2
+

2
= ,
e quindi vale la condizione di Cauchy. Viceversa, supponiamo che valga la
condizione di Cauchy: allora, scelto = 2
k
, con k N, si ha che
k N
k
N : [a
n
a
m
[ < 2
k
n, m
k
,
e non è restrittivo supporre che
k
>
k1
per ogni k 1: basta eventualmen-
te sostituire la k-sima soglia
k
con la soglia
k
= 1 + max
j
: 0 j k.
In particolare, avremo
[a
k+1
a
k
[ < 2
k
k N.
Di conseguenza la serie
(a
h+1
a
h
) è assolutamente convergente; pertanto
lim
k
a
k
= lim
k
_
a
0
+
k1
h=0
_
a
h+1
a
h
_
_
= a
0
+
h=0
(a
h+1
a
h
) = L;
153
in altre parole, la sottosuccessione a
k
, ottenuta da a
n
prendendo solo
gli indici n della forma
k
e scartando tutti gli altri, è convergente.
Proviamo adesso che lintera successione a
n
converge a L: ssato > 0, e
scelto k in modo che risulti [a
k
L[ <

2
ed anche 2
k
<

2
, dalla condizione
di Cauchy segue che
[a
n
L[ [a
n
a
k
[ +[a
k
L[ < 2
k
+

2
<

2
+

2
= n >
k
,
da cui la tesi.
Osservazioni 2.6.3 (1) Nel caso di una serie
a
n
di numeri reali o com-
plessi, la condizione di Cauchy si applica alle sue somme parziali ed equivale,
per quanto visto, alla convergenza della serie. Essa ha la forma
> 0 N : [s
n
s
m
[ =
k=m+1
a
k
< n > m ,
ovvero
> 0 N :
m+p
k=m+1
a
k
< m , p N
+
.
(2) Lequivalenza tra la condizione di Cauchy e la convergenza è una pro-
prietà legata allinsieme ambiente: è vera per successioni in R o in C, ma
non è vera in generale. Ad esempio, se ci limitiamo allambiente dei numeri
razionali, ci sono successioni a
n
Q le quali sono di Cauchy, ma non con-
vergono in Q. (Naturalmente ciò non toglie che esse abbiano limite in R!)
Un facile esempio è la successione
_
1 +
1
n
_
n
, che converge al numero reale e,
il quale non è razionale (esercizio 2.3.1).
Esercizi 2.6
1. Si provi che ogni successione di Cauchy è limitata, ma che il viceversa
è falso.
2. Si provi che se una successione di Cauchy ha una sottosuccessione con-
vergente ad un certo valore L C, allora lintera successione ha limite
L.
154
3. Data una successione reale a
n
, per ogni k N poniamo L
k
=
sup
nk
a
n
e
k
= inf
nk
a
n
. Provare che:
(i) L
k
kN
è decrescente,
k
kN
è crescente, e
h
L
k
+
per ogni h, k N.
(ii) Posto L = lim
k
L
k
e = lim
k
k
, si ha L +;
i numeri L e sono chiamati massimo limite e minimo limite della
successione a
n
; si scrive L = maxlim
n
a
n
e = minlim
n
a
n
,
o anche L = limsup
n
a
n
e = liminf
n
a
n
.
(iii) Si ha L = se e solo se esiste = lim
n
a
n
, e in tal caso
= L = ;
(iv) limsup
n
a
n
= r R se e solo se
(a) per ogni > 0 esiste N tale che a
n
< r + per ogni n ,
(b) per ogni > 0 si ha r < a
n
per inniti numeri n N.
(v) liminf
n
a
n
= R se e solo se
(a) per ogni > 0 esiste N tale che a
n
> per ogni n ,
(b) per ogni > 0 si ha + > a
n
per inniti numeri n N.
4. Provare che da ogni successione reale a
n
si possono estrarre due sotto-
successioni che tendono rispettivamente al massimo limite e al minimo
limite di a
n
.
2.7 Serie di potenze
Una serie di potenze è una serie della forma
n=0
a
n
z
n
,
ove a
n
è una arbitraria successione reale o complessa (ssata) e z è un
parametro complesso (variabile). Quindi per ogni scelta di z C si ha una
serie numerica che potrà convergere oppure no; la somma della serie sarà
dunque una funzione di z, denita sullinsieme dei numeri z tali che la serie
è convergente. Le somme parziali
s
n
(z) =
n
k=0
a
k
z
k
155
sono quindi polinomi nella variabile z (cioè combinazioni lineari nite di
monomi, vale a dire di potenze di z). I numeri a
k
si dicono coecienti della
serie di potenze.
Osservazione 2.7.1 Quando z = 0, il primo termine della serie di potenze,
a
0
0
0
, non ha senso; per z ,= 0 esso è a
0
1 = a
0
. Allora conveniamo di porre
a
0
z
0
= a
0
anche quando z = 0; avremo quindi, per denizione,
n=0
a
n
z
n
= a
0
+a
1
z +a
2
z
2
+. . . +a
n
z
n
+. . . z C.
Chiaramente allora ogni serie di potenze converge quando z = 0, con somma
a
0
. Il nostro obiettivo è trovare condizioni che implichino la convergenza
della serie di potenze in altri punti z ,= 0, e caratterizzare linsieme di tali z.
Osservazione 2.7.2 Pi` u in generale si possono considerare serie di potenze
della forma
n=0
a
n
(z z
0
)
n
,
con z
0
C ssato; ma con il cambiamento di variabile y = z z
0
ci si
riconduce immediatamente al caso in cui z
0
= 0, e quindi basta considerare
questo caso.
Lambito naturale delle serie di potenze è il campo complesso; ciò non toglie
che talvolta sia interessante considerare serie di potenze reali, cioè di variabile
reale: per queste ultime verrà usata la variabile x al posto della z, scrivendole
nella forma
n=0
a
n
x
n
.
Esempi 2.7.3 (1) La serie geometrica
n=0
z
n
è una serie di potenze (ove
a
n
= 1 per ogni n N) che converge assolutamente per [z[ < 1 con somma
1
1z
e non converge per [z[ 1.
(2) Ogni polinomio
N
n=0
a
n
z
n
è una serie di potenze in cui a
n
= 0 per ogni
n > N, e ovviamente tale serie converge per ogni z C.
(3) La serie esponenziale
n=0
z
n
n!
converge assolutamente per ogni z C
grazie al criterio del rapporto; calcoleremo la sua somma fra breve.
(4) La serie
n=0
n!z
n
converge per z = 0 e non converge per alcun z
C 0.
156
(5) La serie
n=1
z
n
n
converge per tutti gli z C tali che [z[ 1 e z ,= 1,
mentre non converge per z = 1 e per [z[ > 1 (esempio 2.5.5 (6)).
Vediamo qualche criterio di convergenza.
Proposizione 2.7.4 Se i termini a
n
z
n
di una serie di potenze sono limitati
per [z[ = R, ossia esiste K > 0 per cui risulta
[a
n
[R
n
K n N,
allora
a
n
z
n
è assolutamente convergente in ogni punto z C con [z[ < R.
Dimostrazione Se [z[ < R possiamo scrivere
[a
n
z
n
[ = [a
n
[R
n
_
[z[
R
_
n
K
z
R
n
n N,
da cui la tesi per confronto con la serie geometrica di ragione
|z|
R
< 1.
Corollario 2.7.5 Se una serie di po-
tenze
n=0
a
n
z
n
converge in un pun-
to z
1
C 0, essa converge asso-
lutamente in ogni punto z C con
[z[ < [z
1
[; se la serie non converge in
un punto z
2
C, essa non converge (ed
anzi la serie dei moduli diverge a +)
in ogni z C con [z[ > [z
2
[.
Dimostrazione La prima parte dellenunciato segue dalla proposizione pre-
cedente, perche, per ipotesi, la successione a
n
z
n
1
è innitesima e quindi limi-
tata. Se poi la serie convergesse in un punto z con [z[ > [z
2
[, per la parte già
dimostrata avremmo la convergenza assoluta nel punto z
2
, il che è assurdo.
Esempi 2.7.6 (1) I termini della serie di potenze
n=0
n1
n+1
z
n
sono limitati
per [z[ = 1. Quindi la serie converge assolutamente per [z[ < 1. Daltra
parte essa non può convergere per [z[ 1 perche il termine generale non è
innitesimo.
157
(2) La serie
n=0
nz
n
, pur non avendo i termini limitati per [z[ = 1, è
assolutamente convergente per [z[ < 1, come mostra il criterio del rapporto,
mentre non converge per [z[ 1.
I risultati e gli esempi precedenti fanno pensare che linsieme dei numeri
z C tali che la serie
a
n
z
n
è convergente somigli ad un cerchio di centro
lorigine, e motivano la seguente
Denizione 2.7.7 Il raggio di convergenza di una serie di potenze
a
n
z
n
è il numero (appartenente a [0, +])
R = sup
_
[z[ : z C e
n=0
a
n
z
n
è convergente
_
.
Il cerchio di convergenza della serie è il cerchio di centro 0 e raggio pari al
raggio di convergenza:
B
R
= z C : [z[ < R.
Si noti che B
= C e B
0
= . Se la serie è reale, si parla di intervallo di
convergenza ] R, R[; risulta ovviamente ] R, R[= B
R
R.
Teorema 2.7.8 Sia R il raggio di convergenza della serie di potenze
a
n
z
n
.
Allora:
(i) se R = 0, la serie converge solo per z = 0;
(ii) se R = +, la serie converge assolutamente per ogni z C;
(iii) se 0 < R < +, la serie converge assolutamente per ogni z B
R
e
non converge per ogni z C con [z[ > R;
(iv) nulla si può dire in generale sulla convergenza della serie nei punti
z C con [z[ = R.
Dim (i) Se la serie convergesse in z ,= 0 avremmo R = 0 < [z[, contro la
denizione di raggio di convergenza.
(ii) Sia
A =
_
[z[ : z C e
n=0
a
n
z
n
è convergente
_
,
158
cosicche sup A = R = +. Sia z C; poiche [z[ non è un maggiorante di A,
esiste z
1
C tale che [z
1
[ > [z[ e [z
1
[ A, ossia
a
n
z
n
1
è convergente. Dal
corollario 2.7.5 segue che
[a
n
z
n
[ è convergente, cioè la tesi.
(iii) Sia A denito come prima. Fissiamo z C con [z[ < R; poiche [z[ non
è un maggiorante di A, esiste z
1
C tale che [z[ < [z
1
[ < R e [z
1
[ A, ossia
a
n
z
n
1
è convergente. Dal corollario 2.7.5 segue che
[a
n
z
n
[ è convergente.
Fissiamo ora z C con [z[ > R: se la serie convergesse nel punto z, avremmo
z A e quindi [z[ R, il che è assurdo.
(iv) Lultima aermazione è provata dai seguenti esempi: le tre serie
n=0
z
n
,
n=1
z
n
n
2
,
n=1
z
n
n
hanno tutte raggio di convergenza 1; tuttavia:

z
n
non converge in alcun punto z C con [z[ = 1,

z
n
n
2
converge assolutamente in tutti gli z C con [z[ = 1,

z
n
n
converge (non assolutamente) in ogni z C con [z[ = 1, salvo
che in z = 1 (esempio 2.5.5 (6)).
Come si determina il raggio di convergenza di una serie di potenze? Spesso
è utile il seguente criterio:
Proposizione 2.7.9 Sia
a
n
z
n
una serie di potenze. Se esiste il limite
lim
n
n
_
[a
n
[ = L,
allora il raggio di convergenza della serie è
R =
_
_
+ se L = 0
1/L se 0 < L <
0 se L = +.
Dimostrazione Sia, al solito, A = [z[ : z C e
a
n
z
n
è convergente.
Utilizziamo il criterio della radice: per n si ha
n
_
[a
n
z
n
[ =
n
_
[a
n
[[z[ L[z[.
159
Dunque se L = 0 la serie è assolutamente convergente per ogni z C, cioè
A = [0, +[ e pertanto R = +. Se L = +, la serie non converge per
nessun z C 0, quindi A = 0 e R = 0. Se 0 < L < +, la serie è
assolutamente convergente per gli z C tali che [z[ <
1
L
, mentre non converge
per gli z C tali che [z[ >
1
L
; la prima asserzione dice che [0, 1/L[ A,
la seconda dice che A]1/L, [= . Perciò [0, 1/L[ A [0, 1/L], ossia
R = 1/L.
La pi` u generale versione della proposizione 2.7.9 è esposta nellesercizio 2.7.1.
z
n
ha raggio di convergenza 1 qualunque
sia R: infatti
lim
n
n
= 1 R.
(2) Se b > 0, la serie
(bz)
n
ha raggio di convergenza 1/b: infatti ovviamente
lim
n
n
b
n
= b.
(3) Per calcolare il raggio di convergenza della serie
(nz)
n
n!
il criterio prece-
dente è poco utile, perche richiede di calcolare il non facile limite
lim
n
n
_
n
n
n!
= lim
n
n
n
n!
.
Utilizziamo invece il criterio del rapporto: dato che (denizione 2.3.6)
lim
n
n! (n + 1)
n+1
[z[
n+1
(n + 1)! n
n
[z[
n
= lim
n
_
n + 1
n
_
n
[z[ = e[z[,
avremo che la serie converge assolutamente per tutti gli z C per cui ri-
sulta e[z[ < 1, mentre non potrà convergere, essendo il suo termine generale
denitivamente crescente in modulo, per gli z C tali che e[z[ > 1. Se ne
deduce che R = 1/e.
Si noti che dalla relazione
lim
n
n! (n + 1)
n+1
(n + 1)! n
n
= e
e dallesercizio 2.4.12 segue che
n
n
n!
e, ossia
lim
n
n
n!
n
=
1
e
:
si confronti questo risultato con la stima dellesercizio 1.6.16.
160
La serie esponenziale
Come sappiamo, la serie esponenziale
n=0
z
n
n!
converge assolutamente in
ogni punto z C; ci proponiamo di calcolarne la somma. Ricordiamo che se
z = 1 la somma della serie è, per denizione, il numero e.
Teorema 2.7.11 Per ogni z = x +iy C si ha:
lim
n
_
1 +
z
n
_
n
=
n=0
z
n
n!
= e
x
(cos y +i sin y).
In particolare risulta
cos y =
h=0
(1)
h
y
2h
(2h)!
, sin y =
h=0
(1)
h
y
2h+1
(2h + 1)!
y R.
Dimostrazione Fissiamo z = x +iy C. Possiamo scrivere
_
1 +
z
n
_
n
=
_
1 +
x
n
+i
y
n
_
n
=
=
_
1 +
x
n
_
n
_
1 +i
y
n
1 +
x
n
_
n
=
_
1 +
x
n
_
n
_
1 +i
y
n +x
_
n
.
1
o
passo: calcoliamo il limite della successione reale
_
1 +
x
n
_
n
per un
arbitrario x R.
Come sappiamo, tale successione è sicuramente crescente non appena n >
[x[ (esempio 1.8.3 (2)).
`
E chiaro che se x = 0 la successione ha limite 1.
Supponiamo x > 0 e poniamo
k
n
=
_
n
x
_
, n N;
chiaramente k
n
k
n+1
e k
n
+ per n . Possiamo scrivere
_
1 +
x
n
_
n
=
_
_
1 +
1
n/x
_
n/x
_
x
,
e osservando che k
n
n/x < k
n
+ 1, deduciamo
_
1 +
1
k
n
+ 1
_
kn
<
_
1 +
1
n/x
_
n/x
<
_
1 +
1
k
n
_
kn+1
n N.
161
Per il teorema dei carabinieri, ricaviamo
lim
n
_
1 +
1
n/x
_
n/x
= e;
dallesercizio 2.1.24 segue allora
lim
n
_
_
1 +
1
n/x
_
n/x
_
x
= e
x
x > 0.
Sia ora x < 0. Possiamo scrivere
_
1 +
x
n
_
n
=
_
_
1
1
n/[x[
_
n/|x|
_
|x|
,
e ponendo stavolta k
n
=
_
n
|x|
_
si ha
_
1
1
k
n
_
kn+1
<
_
1
1
n/[x[
_
n/|x|
<
_
1
1
k
n
+ 1
_
kn
n N,
da cui
lim
n
_
1
1
n/[x[
_
n
=
1
e
e, per lesercizio 2.1.24,
lim
n
_
_
1
1
n/[x[
_
n/|x|
_
|x|
=
_
1
e
_
|x|
= e
x
x < 0.
In denitiva
lim
n
_
1 +
x
n
_
n
= e
x
x R.
2
o
passo: calcoliamo il limite della successione complessa
b
n
=
_
1 +i
y
n +x
_
n
.
Poniamo
c
n
= 1 +i
y
n +x
= [c
n
[(cos
n
+i sin
n
)
162
ove
n
] /2, /2[ dato che la parte reale di c
n
è positiva. Allora dalla
formula di de Moivre (paragrafo 1.12) si ottiene
b
n
= [c
n
[
n
(cos n
n
+i sin n
n
).
Valutiamo il modulo di b
n
, cioè [c
n
[
n
: si ha per n sucientemente grande (in
modo che n +x n/2)
1 [b
n
[ =
_
1 +
y
2
(n +x)
2
_n
2
_
1 +
y
2
(n/2)
2
_n
2
=
_
_
1 +
4y
2
n
2
_
n
2
_ 1
2n
_
e
4y
2
_ 1
2n
,
e per il teorema dei carabinieri
lim
n
[c
n
[
n
= 1.
Valutiamo ora largomento di b
n
, cioè n
n
: anzitutto, dato che
[c
n
[ cos
n
= 1, [c
n
[ sin
n
=
y
n +x
,
si ha tan
n
=
y
n+x
0 per n .
Notiamo adesso che dalla proposizione 1.12.18 segue che
cos x
[ sin x[
[x[
1 x ] /2, /2[0;
inoltre ricordiamo che (esercizio 1.12.9)
[ cos x 1[ [x[ x R.
Dal fatto che tan
n
è innitesima si ricava allora
n
0, cos
n
1,

n
tan
n
1 per n ,
e di conseguenza
n
n
= (ntan
n
)

n
tan
n
=
ny
n +x

n
tan
n
y per n ,
163
da cui nalmente
cos n
n
+i sin n
n
cos y +i sin y per n .
Pertanto si conclude che
lim
n
b
n
= lim
n
[c
n
[
n
(cos n
n
+i sin n
n
) = cos y +i sin y.
Dai primi due passi della dimostrazione deduciamo che
lim
n
_
1 +
z
n
_
n
= e
x
(cos y +i sin y).
3
o
passo: mostriamo che la somma della serie
n=0
z
n
n!
coincide col prece-
dente limite.
Ripeteremo, con qualche modica, la dimostrazione della proposizione 2.3.5.
Fissiamo m N: allora si ha
lim
n
1
n
k
_
n
k
_
= lim
n
n(n 1) . . . (n k + 1)
n
k
k!
=
1
k!
per k = 0, 1, 2, . . . , m.
Quindi se z C possiamo scrivere
m
k=0
z
k
k!
= lim
n
m
k=0
_
n
k
_
z
k
n
k
m N.
Daltra parte se n > m si ha, per la formula del binomio (teorema 1.7.1)
m
k=0
_
n
k
_
z
k
n
k
=
n
k=0
_
n
k
_
z
k
n
k

n
k=m+1
_
n
k
_
z
k
n
k
=
_
1 +
z
n
_
n
k=m+1
_
n
k
_
z
k
n
k
,
quindi per n > m si deduce
k=0
_
n
k
_
z
k
n
k

_
1 +
z
n
_
n
k=m+1
_
n
k
_
z
k
n
k
k=m+1
_
n
k
_
[z[
k
n
k
=
n
k=m+1
[z[
k
k!
n
n

n 1
n
. . .
n k + 1
n

k=m+1
[z[
k
k!
;
164
pertanto quando n segue che
k=0
z
k
k!
lim
n
_
1 +
z
n
_
n
lim
n
m
k=0
_
n
k
_
z
k
n
k
lim
n
_
1 +
z
n
_
n
=
= lim
n
k=0
_
n
k
_
z
k
n
k

_
1 +
z
n
_
n
k=m+1
[z[
k
k!
m N
+
.
Adesso facciamo tendere anche m a +: tenuto conto dellosservazione 2.2.7,
si ottiene
k=0
z
k
k!
lim
n
_
1 +
z
n
_
n
lim
m
k=m+1
[z[
k
k!
= 0,
cioè la tesi del 3
o
passo. Il teorema è completamente dimostrato.
La funzione complessa z = x + iy e
x
(cos y + i sin y) è una estensione a C
della funzione esponenziale reale e
x
. Essa si chiama esponenziale complessa
e si indica con e
z
. Dunque, per denizione e per quanto dimostrato,
e
z
= e
Rez
(cos Imz +i sin Imz) =
n=0
z
n
n!
= lim
n
_
1 +
z
n
_
n
z C.
In particolare, scegliendo z = iy immaginario puro, si ha la formula di Eulero
e
iy
= cos y +i sin y y R,
ed anche
e
iy
=
n=0
i
n
y
n
n!
= lim
N
2N
n=0
i
n
y
n
n!
y R;
poiche i
2h
= (1)
h
e i
2h+1
= i(1)
h
, decomponendo la somma in indici pari
ed indici dispari si trova
e
iy
= lim
N
_
N
h=0
(1)
h
y
2h
(2h)!
+i
N1
h=0
(1)
h
y
2h+1
(2h + 1)!
_
,
e dato che le somme parziali a secondo membro si riferiscono a due serie che
sono entrambe assolutamente convergenti per ogni y R, si deduce
cos y +i sin y =
h=0
(1)
h
y
2h
(2h)!
+i
h=0
(1)
h
y
2h+1
(2h + 1)!
y R.
165
Inne, uguagliando fra loro parti reali e parti immaginarie, si ottengono gli
sviluppi in serie per le funzioni seno e coseno:
cos y =
h=0
(1)
h
y
2h
(2h)!
y R,
sin y =
h=0
(1)
h
y
2h+1
(2h + 1)!
y R.
Il teorema è completamente dimostrato.
Esercizi 2.7
1. Sia
a
n
z
n
una serie di potenze. Si provi che, posto
L = limsup
n
n
_
[a
n
[
(si veda lesercizio 2.6.3, il raggio di convergenza R della serie è dato
da
R =
_
_
+ se L = 0
1/L se 0 < L <
0 se L = +.
2. Determinare il raggio di convergenza delle seguenti serie di potenze:
(i)
n=0
z
n!
, (ii)
n=0
z
n
n + 2
n
, (iii)
n=0
_
i
2 +i
_
n
z
n
,
(iv)
n=0
2
n
2
z
n
, (v)
n=1
3
n
7
n
4
n
3
n
z
n
, (vi)
n=0
_
n
2n + 1
_
2n1
z
n
,
(vii)
n=1
z
n
n
n
n
, (viii)
n=0
3
n
z
n
, (ix)
n=0
[(2)
n
+ 1]z
n
,
(x)
n=0
n!
n
n
z
n
, (xi)
n=0
(n!)
2
(2n)!
z
n
2
, (xii)
n=1
(2n 1) . . . 3 1
2n . . . 4 2
z
n
.
166
3. Dimostrare le seguenti uguaglianze, specicando per quali z C sono
vere:
(i)
n=0
(1)
n
z
n
=
1
1 +z
; (ii)
n=0
z
2n
=
1
1 z
2
;
(iii)
n=0
(1)
n
z
2n
=
1
1 +z
2
; (iv)
n=1
i
n
z
2n
=
iz
2
1 iz
2
.
4. Sia
a
n
una serie convergente: si provi che il raggio di convergenza
della serie di potenze
a
n
z
n
è non inferiore a 1.
5. (i) Trovare il raggio di convergenza R della serie
n=0
(n + 1)z
2n
.
(ii) Posto R
n
(z) =
k=n
(k + 1)z
2k
, si verichi che
(1 z
2
)R
n
(z) = nz
2n
+
z
2n
1 z
2
z C con [z[ < R.
(iii) Si calcoli per [z[ < R la somma della serie.
6. (i) Determinare il raggio di convergenza R della serie di potenze
n=1
1
n
3 5 7 . . . (4n 1) (4n + 1)
4
2
8
2
. . . (4n 4)
2
(4n)
2
x
n
;
(ii) vericare che
1
n

3(4n + 1)
4(4n)
< a
n
<
1
n
n N
+
;
(iii) descrivere il comportamento della serie nei punti x = R e x = R.
7. Sia F
n
la successione dei numeri di Fibonacci (esercizio 2.3.13).
(i) Determinare il raggio di convergenza R della serie
n=0
F
n
z
n
.
(ii) Detta S(z) la somma della serie, provare che (1 z z
2
)S(z) = z,
ossia
S(z) =
z
1 z z
2
z C con [z[ < R.
167
8. Trovare due serie di potenze nella variabile z che abbiano come som-
me, nei rispettivi cerchi di convergenza di cui si troveranno i raggi, le
funzioni
F(z) =
1
z
2
+ 4z + 3
, G(z) =
1
z
2
+z + 1
.
9. Sia R il raggio di convergenza di
n=0
a
n
z
n
: provare che anche le serie
n=1
1
n
a
n
z
n
,
n=0
na
n
z
n
,
n=0
a
n+m
z
n
(con m N ssato)
hanno raggio di convergenza R.
10. Trovare il raggio di convergenza della serie
a
n
z
n
, ove a
n
è data da
_
a
0
= 1/2
a
n+1
= a
n
(1 a
n
) n N.
11. Le funzioni coseno iperbolico e
seno iperbolico sono denite da
cosh x =
e
x
+e
x
2
, x R,
sinh x =
e
x
e
x
2
, x R.
Provare che
cosh x =
n=0
x
2n
(2n)!
x R,
sinh x =
n=0
x
2n+1
(2n + 1)!
x R.
168
12. Si provino le seguenti relazioni che legano fra
loro le funzioni iperboliche sinh x e cosh x, e che
sono valide per ogni x, y R:
(i) cosh
2
x sinh
2
x = 1;
(ii) cosh(x +y) = cosh x cosh y + sinh x sinh y,
(iii) sinh(x +y) = sinh x cosh y + cosh x sinh y.
13. Calcolare la somma delle seguenti serie, specicando per quali z C
esse sono convergenti:
(i)
n=0
(1)
n
z
2n
n!
, (ii)
n=0
z
3n+2
n!
, (iii)
n=1
z
n1
(n + 1)!
.
14. Calcolare la somma delle seguenti serie, specicando per quali x R
esse sono convergenti:
(i)
n=0
(1)
n
x
n
(2n)!
, (ii)
n=0
(1)
n
x
4n
(2n + 1)!
, (iii)
n=2
x
3n
(2n 3)!
.
15. Siano , R. Si provi che se x ] 1, 1[ si ha
n=0
x
n
cos( +n) =
cos x cos( )
1 2x cos +x
2
,
n=0
x
n
sin( +n) =
sin x sin( )
1 2x cos +x
2
.
169
16. Calcolare la somma delle seguenti serie, ove , R:
(i)
n=0
cos( +n)
n!
, (ii)
n=0
sin( +n)
n!
,
(iii)
n=0
(1)
n
cos( +n)
(2n)!
, (iv)
n=0
(1)
n
sin( +n)
(2n)!
,
(v)
n=0
cos( +n)
(2n + 1)!
, (vi)
n=0
sin( +n)
(2n + 1)!
,
(vii)
n=0
(5i)
n
cos( 3n)
(2n + 2)!
, (viii)
n=0
(5i)
n
sin( 3n)
(2n + 2)!
.
17. Determinare la parte reale e la parte immaginaria dei seguenti numeri:
e
1i
, e
32i
, e
(1+i)
4
, ie
|1+2i|
, e
i(i1)
.
18. Determinare il luogo dei punti z C in cui ciascuna delle due funzioni
f(z) = e
z
, g(z) = e
z
2
assume valori reali, ed il luogo ove ciascuna assume valori puramente
immaginari.
19. Determinare il luogo dei punti z C in cui ciascuna delle due funzioni
g(z) = e
z
2
, h(z) = e
z
3
ha modulo unitario.
20. Fissato k N
+
, si consideri la serie
n=0
e
2in/k
z
n+1+(1)
n
e se ne determini linsieme di convergenza. Qualè la somma?
170
2.8 Riordinamento dei termini di una serie
Cosa succede se si modica lordine degli addendi di una serie? Le proprietà
di convergenza si mantengono o si alterano?
Intanto bisogna intendersi sul signicato di questa operazione: ad esempio,
sommare i termini in ordine inverso ha senso solo per somme nite. Andia-
mo allora a chiarire con una denizione ciò che intendiamo quando parliamo
di riordinamento dei termini di una serie.
Denizione 2.8.1 a termini reali o complessi, e sia : N N una funzione
bigettiva, cioè sia iniettiva che surgettiva: in altre parole, per ogni k N
esiste uno ed un solo n N tale che (n) = k. Posto b
n
= a
(n)
per ogni
n N, la serie
n=0
b
n
si dice riordinamento della serie
n=0
a
n
.
Osservazioni 2.8.2 (1) Nella serie
n=0
b
n
ciascun termine a
k
compare
esattamente una volta, e cioè quando n =
1
(k), ossia quando n assume
lunico valore n
k
N tale che (n
k
) = k. Quindi
n=0
b
n
ha esattamente
gli stessi addendi di
k=0
a
k
.
(2) Se
n=0
b
n
è un riordinamento di
n=0
a
n
(costruito mediante la cor-
rispondenza biunivoca ), allora, viceversa,
n=0
a
n
è un riordinamento di
n=0
b
n
(mediante la corrispondenza biunivoca
1
, inversa di ).
Il risultato che segue risponde alla domanda iniziale.
Teorema 2.8.3 (di Dirichlet) Sia
a
n
una serie reale o complessa asso-
lutamente convergente. Allora ogni suo riordinamento
b
n
è assolutamente
convergente ed ha la stessa somma:
n=0
a
n
=
n=0
b
n
.
Se
a
n
non è assolutamente convergente, allora nessun riordinamento lo è.
Si osservi che, di conseguenza, per ogni serie
a
n
e per ogni suo riordina-
mento
b
n
si ha
n=0
[a
n
[ =
n=0
[b
n
[
(questo valore potrà essere nito o +).
171
Dimostrazione Con le stesse considerazioni fatte alla ne della dimostra-
zione della proposizione 2.5.2, si verica che possiamo limitarci al caso di
serie a termini reali. Supponiamo dapprima a
n
0 per ogni n N, e siano
S =
n=0
a
n
, s
n
=
n
k=0
a
k
,
n
=
n
k=0
b
k
.
Per ipotesi, si ha s
n
S per ogni n N; inoltre, posto
m
n
= max(0), (1), . . . , (n),
si ha
n
=
n
k=0
a
(k)

mn
h=0
a
h
= s
mn
S n N,
cosicche
b
n
è convergente ed ha somma non superiore a S. Daltra par-
te, essendo
a
n
a sua volta un riordinamento di
b
n
, con ragionamento
simmetrico si ha che
S
n=0
b
n
,
e dunque si ha luguaglianza.
Passiamo ora al caso generale: come si è fatto nella dimostrazione della
proposizione 2.5.2, poniamo
n
= [a
n
[ a
n
,
n
= [b
n
[ b
n
n N,
cosicche
0
n
2[a
n
[, 0
n
2[b
n
[ n N.
La serie
n
è a termini positivi e converge per il criterio del confronto;
dunque, per la parte già dimostrata, il suo riordinamento
n
è convergente
e si ha luguaglianza
n=0
n
=
n=0
n
.
Inoltre, sempre in virt` u della parte già dimostrata, poiche la serie
[a
n
[ è
convergente, il suo riordinamento
[b
n
[ è convergente e
n=0
[a
n
[ =
n=0
[b
n
[,
172
cosicche
b
n
è assolutamente convergente. Ne segue
n=0
b
n
=
n=0
[b
n
[
n=0
n
=
n=0
[a
n
[
n=0
n
=
n=0
a
n
.
Notiamo inne che se
a
n
non è assolutamente convergente, non può esserlo
nemmeno
b
n
, perche se fosse
[b
n
[ < +, per la parte già dimostrata
dedurremmo
[a
n
[ =
[b
n
[ < +, essendo
a
n
un riordinamento di
b
n
.
Osservazione 2.8.4 Per le serie
a
n
assolutamente convergenti si ha una
proprietà di riordinamento ancora pi` u forte di quella espressa dal teorema di
Dirichlet: se A e B sono sottoinsiemi disgiunti di N, la cui unione è tutto N,
allora
n=0
a
n
=
nA
a
n
+
nB
a
n
(esercizio 2.8.1). Si noti che questa proprietà non può valere senza lipotesi
di assoluta convergenza: se A è linsieme dei numeri naturali pari e B quello
dei numeri naturali dispari, la serie
n=0
(1)
n
n+1
si decomporrebbe in due serie
divergenti a + ed a , la cui addizione non avrebbe senso.
Se una serie
a
n
è convergente, ma non assolutamente convergente, lope-
razione di riordinamento può alterare il valore della somma, come è mostrato
dal seguente
Esempio 2.8.5 La serie
n=0
(1)
n
n+1
è convergente ad un numero reale S
(che è uguale a log 2, come vedremo pi` u avanti), ma non è assolutamente
convergente. Si ha quindi
1
1
2
+
1
3

1
4
+
1
5

1
6
+
1
7

1
8
+. . . = S,
e dividendo per 2
1
2

1
4
+
1
6

1
8
+
1
10

1
12
+
1
14

1
16
+. . . =
S
2
.
Consideriamo ora la serie
n=0
c
n
= 0 +
1
2
+ 0
1
4
+ 0 +
1
6
+ 0
1
8
+ 0 +. . . ;
173
il suo termine generale è dunque
c
n
=
_
_
_
0 se n è pari
(1)
(n+1)/2
n + 1
se n è dispari
.
Tale serie è convergente con somma S/2, in quanto le sue somme parziali di
indice 2N + 1 coincidono con quelle di indice N della serie
1
2
(1)
n
n+1
: ossia
0 +
1
2
+ 0
1
4
+ 0 +
1
6
+ 0
1
8
+ 0 +
1
10
+ 0
1
12
+ 0 +. . . =
S
2
.
Sommando ora questa serie con la serie
n=0
(1)
n
n+1
si trova
(0 + 1) +
_
1
2

1
2
_
+
_
0 +
1
3
_
+
_
1
4

1
4
_
+
_
0 +
1
5
_
+
+
_
1
6

1
6
_
+
_
0 +
1
7
_
+
_
1
8

1
8
_
+. . . =
_
S
2
+S
_
,
ovvero
1 + 0 +
1
3

1
2
+
1
5
+ 0 +
1
7

1
4
+
1
9
+ 0 +
1
11

1
6
+
1
13
+ 0 +. . . =
3S
2
.
Adesso notiamo che la serie
b
n
che si ottiene da questa sopprimendo i
termini nulli (che sono quelli di indici 1, 5, 9, . . . , 4n + 1, . . . ) converge alla
stessa somma
3S
2
: infatti, le sue somme parziali di indice 3N + 1 coincidono
con le somme parziali di indice 4N +1 della serie contenente anche i termini
nulli. Tuttavia la serie
b
n
, cioè
1 +
1
3

1
2
+
1
5
+
1
7

1
4
+
1
9
+
1
11

1
6
+
1
13
+. . . ,
è evidentemente un riordinamento della serie
n=0
(1)
n
n+1
, che convergeva a
S. Non è dicile vericare che la corrispondenza biunivoca fra gli indici
delle due serie è data da
_
_
_
(3n) = 4n
(3n + 1) = 4n + 2
(3n + 2) = 2n + 1
n N.
Per le serie non assolutamente convergenti vale questo risultato ancora pi` u
drastico:
174
Teorema 2.8.6 (di Riemann) Sia
a
n
una serie reale convergente, ma
non assolutamente convergente. Allora:
(i) per ogni L R esiste un riordinamento di
a
n
che ha somma L;
(ii) esiste un riordinamento di
a
n
che diverge positivamente;
(iii) esiste un riordinamento di
a
n
che diverge negativamente;
(iv) esiste un riordinamento di
a
n
che è indeterminato.
Dimostrazione (i) Osserviamo anzitutto che la serie
a
n
contiene inniti
termini strettamente positivi e inniti termini strettamente negativi, altri-
menti essa avrebbe termini denitivamente a segno costante e quindi, essendo
convergente, sarebbe anche assolutamente convergente. Poniamo
p
n
= maxa
n
, 0, q
n
= maxa
n
, 0 n N,
cosicche
p
n
0, q
n
0, p
n
q
n
= a
n
, p
n
+q
n
= [a
n
[ n N;
inoltre a
n
coincide o con p
n
(e allora q
n
= 0), o con q
n
(e allora p
n
= 0).
Essendo in particolare
N
n=0
a
n
=
N
n=0
p
n
n=0
q
n
,
N
n=0
[a
n
[ =
N
n=0
p
n
+
N
n=0
q
n
N N,
dallipotesi sulla serie
a
n
si deduce
n=0
p
n
=
n=0
q
n
= +
(altrimenti, se entrambe queste due serie fossero convergenti, otterremmo che
[a
n
[ converge, mentre se convergesse solo una delle due otterremmo che
a
n
diverge).
Daltra parte, essendo 0 p
n
[a
n
[ e 0 q
n
[a
n
[ per ogni n N, si ha
anche
lim
n
p
n
= lim
n
q
n
= 0.
Ciò premesso, ssiamo L R. Costruiremo adesso una serie, che si otterrà
riordinando i termini di
a
n
, e che soddisferà la tesi: essa sarà formata da
175
un certo numero di p
n
, seguiti da un certo numero di q
n
, poi ancora da un
po di p
n
, poi di nuovo da un po di q
n
, e cos` di seguito, in modo da oscil-
lare attorno al valore L prescelto. A questo scopo andiamo a costruire due
opportune successioni crescenti di indici, m
n
nN
+ e k
n
nN
+, e formiamo
la serie
m
1
n=0
p
n
k
1
n=0
q
n
+
m
2
n=m
1
+1
p
n
k
2
n=k
1
+1
q
n
+. . . +
m
h
m
h1
+1
p
n
k
h
n=k
h1
+1
q
n
+. . . ;
denoteremo con s
n
la sua n-sima somma parziale.
Fissiamo due successioni
n
e
n
, entrambe convergenti a L e tali che
n
< L <
n
: ad esempio prenderemo senzaltro
n
= L
1
n
e
n
= L +
1
n
.
Deniamo adesso gli indici m
n
e k
n
: m
1
è il minimo numero naturale m
per cui
m
n=0
p
n
> L + 1, mentre k
1
è il minimo numero naturale k per cui
m
1
n=0
p
n

k
n=0
q
n
< L 1. Questi indici esistono per la divergenza delle
serie
p
n
e
q
n
. In generale, avendo costruito m
h
e k
h
come i minimi indici
maggiori rispettivamente di m
h1
e k
h1
tali che
_
_
m
1
n=0
p
n
k
1
n=0
q
n
+. . . +
m
h
m
h1
+1
p
n
> L +
1
h
,
m
1
n=0
p
n
k
1
n=0
q
n
+. . . +
m
h
m
h1
+1
p
n
k
h
n=k
h1
+1
q
n
< L
1
h
,
deniremo m
h+1
e k
h+1
come i minimi indici maggiori rispettivamente di m
h
e k
h
tali che
_
_
m
1
n=0
p
n
k
1
n=0
q
n
+. . . +
m
h+1
m
h
+1
p
n
> L +
1
h + 1
,
m
1
n=0
p
n
k
1
n=0
q
n
+. . . +
m
h+1
m
h
+1
p
n
k
h+1
n=k
h
+1
q
n
< L
1
h + 1
.
Nuovamente, tali indici esistono in virt` u della divergenza di
p
n
e
q
n
.
Indichiamo con
n
e
n
le somme parziali della serie cos` costruita, cioè s
n
,
i cui ultimi termini sono rispettivamente p
mn
e q
kn
: in altre parole,
n
= s
m
1
+k
1
+...+mn
,
n
= s
m
1
+k
1
+...+mn+kn
.
176
Allora otteniamo, per la minimalità di m
n
e k
n
,
n
p
mn
L +
1
n
<
n
,
n
< L
1
n

n
+q
kn
,
cosicche
n
L e
n
L per n . Daltra parte, consideriamo una
generica somma parziale s
n
: esisterà un unico indice h tale che sia vera una
delle due relazioni
m
1
+k
1
+. . . m
h
n m
1
+k
1
+. . . +m
h
+k
h
,
oppure
m
1
+k
1
+. . . m
h
+k
h
n m
1
+k
1
+. . . +m
h
+k
h
+m
h+1
;
ne segue
h
s
n

h
, oppure
h
s
n

h+1
,
e dunque anche s
n
converge a L per n . Ciò prova (i).
(ii)-(iii)-(iv) Questi enunciati si provano in modo del tutto simile: basta
scegliere le successioni
n
e
n
entrambe divergenti a +, o entrambe
divergenti a , o convergenti a due valori L
1
e L
2
con L
1
< L
2
.
Raggruppamento dei termini di una serie
Vale la proprietà associativa per i termini di una serie? Si possono mettere
le parentesi per racchiudere un numero nito di addendi, senza alterare la
somma? Vediamo.
Denizione 2.8.7 Sia
n=0
a
n
una serie reale o complessa. Sia inoltre
k
n
una successione strettamente crescente di numeri naturali. Posto
b
0
=
k
0
h=0
a
h
, b
n
=
kn
h=k
n1
+1
a
h
n N
+
,
si dice che la serie
b
n
è ottenuta da
a
n
raggruppandone i termini.
Esempio 2.8.8 La serie
n=1
1
2n(2n1)
è ottenuta da
n=1
(1)
n+1
n
raggrup-
pandone i termini a due a due: in questo caso k
n
è denita da k
n
=
2n.
177
Il risultato che segue stabilisce che il raggruppamento dei termini di una serie
è unoperazione del tutto lecita.
Teorema 2.8.9 Sia
a
n
una serie reale o complessa, e sia
b
n
una serie
ottenuta da
a
n
raggruppandone i termini. Se
a
n
anche
b
n
lo è e in tal caso le due serie hanno la stessa somma. Se
a
n
è assolutamente convergente, allora anche
b
n
lo è e in tal caso si ha
n=0
[b
n
[
n=0
[a
n
[.
Dimostrazione Per m, n N poniamo s
m
=
m
k=0
a
k
e
n
=
n
k=0
b
k
; si
ha allora, per denizione di b
h
,
n
= s
k
0
+
n
h=1
_
s
k
h
s
k
h1
_
= s
kn
n N.
Poiche s
n
è per ipotesi convergente ad un numero S, dato > 0 si avrà
[s
n
S[ < per tutti gli n maggiori di un certo . Ma allora, essendo k
n
n,
sarà anche [
n
S[ = [s
kn
S[ < per ogni n > , cioè
n
S per n .
Se poi
n=0
[a
n
[ < , allora a maggior ragione, per la parte già dimostrata,
n=0
[b
n
[
k
0
h=0
[a
h
[ +
n=1
kn
h=k
n1
+1
[a
h
[ =
h=0
[a
h
[ < +.
Osservazioni 2.8.10 (1) Il teorema vale anche nel caso di serie reali diver-
genti (esercizio 2.8.2).
(2) Non mantiene la convergenza, al contrario, loperazione inversa al rag-
gruppamento, che consiste nelleliminare eventuali parentesi presenti: ad
esempio, la serie
(1 1) + (1 1) + (1 1) + (1 1) +. . .
converge ed ha somma 0, mentre la serie
1 1 + 1 1 + 1 1 + 1 1 +. . .
è indeterminata. In generale, si può scrivere luguaglianza
n=0
(a
n
+b
n
) =
n=0
a
n
+
n=0
b
n
178
solo quando ciascuna delle due serie
a
n
e
b
n
è convergente; in tal caso
luguaglianza è conseguenza dellesercizio 2.2.1. Pi` u generalmente, si veda
lesercizio 2.8.3 .
Esercizi 2.8
1. Sia
a
n
una serie assolutamente convergente. Si provi che se A e B
sono sottoinsiemi disgiunti di N tali che A B = N, allora
n=0
a
n
=
nA
a
n
+
nB
a
n
.
2. Provare il teorema 2.8.9 nel caso di due serie reali divergenti a +
oppure divergenti a .
3. Sia
n=0
a
n
una serie reale o complessa, sia k
n
N una successione
strettamente crescente e siano
b
0
=
k
0
h=0
a
h
, b
n
=
kn
h=k
n1
+1
a
h
n N.
Si provi che se
n=0
b
n
è convergente, e se
lim
n
kn
h=k
n1
+1
[a
h
[ = 0,
allora
n=0
a
n
è convergente.
4. (i) Per n, k N
+
siano a
nk
numeri non negativi. Si dimostri che se
n=1
_

k=1
a
nk
_
= S,
allora si ha anche
k=1
_

n=1
a
nk
_
= S.
179
(ii) Vericare che il risultato di (i) è falso se gli a
nk
hanno segno
variabile, utilizzando i seguenti a
nk
:
a
nk
=
_
_
1 se k = n, n N
+
2
n1
1
2
n
1
se k = n + 1, n N
+
0 altrimenti.
2.9 Moltiplicazione di serie
A prima vista il problema di moltiplicare fra loro due serie sembra irrilevante.
Fare il prodotto di due serie signica moltiplicare tra loro le successioni delle
rispettive somme parziali; se queste convergono a S
1
e S
2
, il loro prodotto
convergerà a S
1
S
2
. Dovè il problema?
Il punto è che noi vogliamo ottenere, come risultato del prodotto di due serie,
una nuova serie. Il motivo di questo desiderio è legato alla teoria delle serie
di potenze: due serie di potenze hanno per somma una funzione denita
sul cerchio di convergenza di ciascuna serie; il prodotto di tali funzioni è
una nuova funzione, denita sul pi` u piccolo dei due cerchi di convergenza, e
della quale si vorrebbe conoscere uno sviluppo in serie di potenze che ad essa
converga. Dunque si vuole trovare una serie di potenze che sia il prodotto
delle due serie di potenze date, ed abbia per somma il prodotto delle somme.
Scrivendo il prodotto di due polinomi
N
n=0
a
n
z
n
e
M
n=0
b
n
z
n
(con N M) è
naturale raggruppare i termini con la stessa potenza z
n
: quindi si metteranno
insieme i prodotti a
0
b
n
, a
1
b
n1
, . . . , a
n1
b
1
, a
n
b
0
. Il polinomio prodotto sarà
quindi (ponendo a
n
= 0 per n = N + 1, . . . , M)
N
n=0
_
n
k=0
a
k
b
nk
_
z
n
.
Passando dai polinomi alle serie di potenze o, pi` u in generale, parlando di
serie numeriche, siamo indotti alla seguente
Denizione 2.9.1 Date due serie
n=0
a
n
e
n=0
b
n
reali o complesse, la
serie
n=0
c
n
, ove
c
n
=
n
k=0
a
k
b
nk
n N,
si dice prodotto di Cauchy delle due serie.
180
Si potrebbe sperare di dimostrare che se
n=0
a
n
e
n=0
b
n
sono convergenti,
allora la serie prodotto
n=0
c
n
è convergente, magari con somma uguale al
prodotto delle somme. Ma non è cos`, come mostra il seguente esempio: se
a
n
= b
n
=
(1)
n
n + 1
n N,
allora
c
n
= (1)
n
n
k=0
1
k + 1
n k + 1
n N,
e quindi
[c
n
[
n
k=0
1
n + 1
n + 1
=
n + 1
n + 1
= 1 n N,
per cui c
n
non è innitesima e
c
n
non può convergere. Si ha però questo
risultato:
Teorema 2.9.2 (di Cauchy) Se le serie
n=0
a
n
e
n=0
b
n
sono assoluta-
mente convergenti, allora il loro prodotto di Cauchy
n=0
c
n
è assolutamente
convergente; inoltre
n=0
c
n
=
_

n=0
a
n
_
n=0
b
n
_
.
Dimostrazione Si consideri la serie
n=0
d
n
, la cui legge di formazione è
illustrata dallo schema che segue:
a
0
b
0
a
1
b
0
a
2
b
0
a
n
b
0

a
0
b
1
a
1
b
1
a
2
b
1
a
n
b
1

a
0
b
2
a
1
b
2
a
2
b
2
a
n
b
2

a
0
b
n
a
1
b
n
a
2
b
n
a
n
b
n

181
Si ha dunque
n=0
d
n
= a
0
b
0
+a
0
b
1
+a
1
b
1
+a
1
b
0
+a
0
b
2
+a
1
b
2
+a
2
b
2
+a
2
b
1
+a
2
b
0
+
+ . . . +a
0
b
n
+a
1
b
n
+. . . +a
n
b
n
+a
n
b
n1
+. . . +a
n
b
1
+a
n
b
0
+. . .
Tale serie converge assolutamente, in quanto per ogni n 2 si ha
n
k=0
[d
k
[
n
2
1
k=0
[d
k
[ =
_
n1
k=0
[a
k
[
_
_
n1
k=0
[b
k
[
_
k=0
[a
k
[
_
k=0
[b
k
[
_
< .
Dunque
k=0
d
k
è convergente ad un numero S. Daltra parte, posto A =
k=0
a
k
e B =
k=0
b
k
, considerando la somma parziale della serie
d
k
di
indice n
2
1 si ha per n
n
2
1
k=0
d
k
=
_
n1
k=0
a
k
_
_
n1
k=0
b
k
_
A B.
Ne segue S = AB perche ogni sottosuccessione di una successione conver-
gente deve convergere allo stesso limite.
Dalla serie
k=0
d
k
, riordinando i termini per diagonali, si ottiene la serie
a
0
b
0
+a
0
b
1
+a
1
b
0
+a
0
b
2
+a
1
b
1
+a
2
b
0
+. . . +a
0
b
n
+a
1
b
n1
+. . . +a
n
b
0
+. . . ,
la quale per il teorema di Dirichlet (teorema 2.8.3) è assolutamente conver-
gente ed ha somma AB. Ma raggruppandone opportunamente i termini si
ottiene proprio la serie prodotto di Cauchy di
k=0
a
k
e
k=0
b
k
, che dunque
per il teorema 2.8.9 è una serie assolutamente convergente con somma AB.
Osservazione 2.9.3 Se le serie
a
n
e
b
n
hanno indice iniziale 1, anziche
0, nella denizione di prodotto di Cauchy occorrerà prendere
c
n
=
n
k=1
a
k
b
nk+1
n N
+
, anziche c
n
=
n
k=0
a
k
b
nk
n N.
Esempi 2.9.4 (1) Moltiplicando per se stessa la serie geometrica
1
1 z
=
n=0
z
n
, [z[ < 1,
182
si ottiene, sempre per [z[ < 1,
1
(1 z)
2
=
n=0
_
n
k=0
z
k
z
nk
_
=
n=0
(n + 1)z
n
;
da qui si ricava anche
n=0
nz
n
=
n=0
(n+1)z
n
n=0
z
n
=
1
(1 z)
2

1
1 z
=
z
(1 z)
2
, [z[ < 1.
(2) Come sappiamo si ha, posto z = x +iy,
e
z
= e
x+iy
= e
x
(cos y +i sin y) =
n=0
z
n
n!
z C.
Calcoliamo e
z
e
w
con la regola della moltiplicazione di serie: il termine
generale della serie prodotto ha la forma
n
k=0
1
k!
1
(n k)!
z
k
w
nk
=
1
n!
n
k=0
_
n
k
_
z
k
w
nk
=
(z +w)
n
n!
;
dunque
e
z
e
w
=
n=0
(z +w)
n
n!
= e
z+w
z, w C.
Pertanto lesponenziale complessa mantiene le proprietà algebriche delle-
sponenziale reale. Si noti che e
z
= e
z+2i
per ogni z C, cioè la funzione
esponenziale è periodica di periodo 2i; in particolare, e
z
non è una funzione
iniettiva su C.
Esercizi 2.9
1. Provare che se
n=0
a
n
z
n
= f(z) per [z[ < 1, allora posto A
n
=
n
k=0
a
k
si ha
n=0
A
n
z
n
=
f(z)
1 z
per [z[ < 1.
183
2. Dimostrare che se [z[ < 1 si ha
n=0
_
n +k
k
_
z
n
=
1
(1 z)
k+1
k N.
[Traccia: utilizzare lesercizio 1.7.1 (iv).]
3. Vericare che per [z[ < 1 si ha
k=0
n
2
z
n
=
z
2
+z
(1 z)
3
.
4. Poniamo per ogni n N
n
= a
0
b
n
+. . . a
n
b
n
+a
n
b
n1
+. . . +a
n
b
1
+a
n
b
0
.
Si provi che se
n=0
a
n
= A e
n=0
b
n
= B, allora
n=0
n
= AB.
5. Per y R si verichi la relazione sin 2y = 2 sin y cos y, utilizzando gli
sviluppi in serie di potenze del seno e del coseno.
[Traccia: si verichi preliminarmente che risulta
2
2n
= (1 + 1)
2n
(1 1)
2n
=
n
k=0
_
2n + 1
2k
_
n N.]
6. Dimostrare, usando le serie di potenze, le relazioni
cos
2
x + sin
2
x = 1 x R,
sin(x +y) = sin x cos y + sin y cos x x, y R.
7. Determinare il prodotto di Cauchy della serie
(1)
n
n+1
per se stessa. La
serie che cos` si ottiene è convergente?
8. Sia
n=0
c
n
= (
n=0
2
n
) (
n=0
3
n
): calcolare esplicitamente c
n
e
provare che
3
n
c
n
2
n
n N.
184
Capitolo 3
Funzioni
3.1 Spazi euclidei R
m
e C
m
Inizia qui la seconda parte del corso, in cui si passa dal discreto al conti-
nuo: lo studio delle successioni e delle serie lascerà il posto allanalisi delle
proprietà delle funzioni di variabile reale o complessa. Ci occuperemo comun-
que ancora, qua e là, di successioni e serie, in particolare di serie di potenze.
Fissiamo m N
+
e consideriamo gli insiemi R
m
e C
m
, cioè i prodotti
cartesiani di R e C per se stessi m volte:
R
m
= x = (x
1
, . . . , x
m
) : x
i
R, i = 1, . . . , m,
C
m
= z = (z
1
, . . . , z
m
) : z
i
C, i = 1, . . . , m.
Introduciamo un po di terminologia. Indicheremo in neretto (x, z, a, b,
eccetera) i punti generici, o vettori, di R
m
e di C
m
. Su tali insiemi sono de-
nite le operazioni di somma e di prodotto per scalari che li rendono entrambi
spazi vettoriali:
a +b = (a
1
+b
1
, . . . , a
m
+b
m
) a, b R
m
(oppure a, b C
m
),
a = (a
1
, . . . , a
m
) R, a R
m
(oppure C, a C
m
).
Naturalmente, per m = 2 lo spazio R
m
si riduce al piano cartesiano R
2
mentre per m = 1 lo spazio C
m
si riduce al piano complesso C. Come
sappiamo, R
2
è identicabile con C mediante la corrispondenza biunivoca
z = x +iy; similmente, per ogni m 1 possiamo identicare gli spazi R
2m
e
185
C
m
, associando al generico punto x = (x
1
, x
2
, . . . , x
2m1
, x
2m
) R
2m
il punto
z = (z
1
, . . . z
m
) C
m
, ove
z
j
= x
2j1
+ix
2j
j = 1, . . . , m.
Estenderemo a m dimensioni tutta la struttura geometrica di R
2
.
Prodotto scalare
In R
m
e in C
m
è denito un prodotto scalare fra vettori:
a b =
m
i=1
a
i
b
i
a, b R
m
,
a b =
m
i=1
a
i
b
i
a, b C
m
.
Si noti che, essendo R
m
C
m
e x = x per ogni x reale, il prodotto scalare
dello spazio C
m
, applicato a vettori di R
m
, coincide col prodotto scalare dello
spazio R
m
. Dunque il prodotto scalare associa ad ogni coppia di vettori di
C
m
un numero complesso e ad ogni coppia di vettori di R
m
un numero reale.
Se a b = 0, i due vettori a e b si dicono ortogonali. Il signicato geometrico
del prodotto scalare, nel caso reale, è illustrato nellesercizio 3.1.1.
Notiamo che il prodotto scalare di R
m
è una applicazione lineare nel primo
e nel secondo argomento, ossia risulta
_
(a +b) c = a c + b c
a (b +c) = a b + a c
, R, a, b, c R
m
;
invece il prodotto scalare di C
m
è lineare nel primo argomento ed antilineare
nel secondo argomento, ossia
_
(a +b) c = a c + b c
a (b +c) = a b + a c
, C, a, b, c C
m
(le veriche sono ovvie).
186
Norma euclidea
La norma euclidea di un vettore z C
m
è il numero reale non negativo
[z[
m
=
_
m
i=1
[z
i
[
2
=
z z,
essendo z = (z
1
, . . . , z
m
); la norma di un vettore x R
m
è la stessa cosa,
ossia
[x[
m
=
_
m
i=1
[x
i
[
2
=
x x.
La norma è lanalogo del modulo in C e del valore assoluto in R. Le proprietà
fondamentali della norma sono le seguenti:
(i) (positività) [z[
m
0 per ogni z C
m
, e [z[
m
= 0 se e solo se z = 0;
(ii) (omogeneità) [z[
m
= [[ [z[
m
per ogni C e z C
m
;
(iii) (subadditività) [z +w[
m
[z[
m
+[w[
m
per ogni z, w C
m
.
Le prime due proprietà sono ovvie dalla denizione; la terza è meno evidente,
e per dimostrarla è necessario premettere la seguente
Proposizione 3.1.1 (disuguaglianza di Cauchy-Schwarz) Risulta
[a b[ [a[
m
[b[
m
a, b C
m
.
Dimostrazione Ripetiamo largomentazione svolta nella dimostrazione del
teorema 1.9.3. Per ogni a, b C
m
e per ogni t R si ha
0 [a +tb[
2
m
=
m
j=1
(a
j
+tb
j
)(a
j
+tb
j
) =
=
m
j=1
a
j
a
j
+ 2tRe
m
j=1
a
j
b
j
+t
2
m
j=1
b
j
b
j
=
= a a + 2tRe a b +t
2
b b = [a[
2
m
+ 2tRe a b +t
2
[b[
2
m
;
dal momento che il trinomio di secondo grado allultimo membro è sempre
non negativo, il suo discriminante deve essere non positivo, cioè
(Re a b)
2
[a[
2
m
[b[
2
m
a, b C
m
.
187
Passando alle radici quadrate, ciò prova la tesi nel caso del prodotto scalare
di R
m
, poiche in tal caso Re a b = a b. Nel caso del prodotto scalare di C
m
osserviamo che il numero complesso a b avrà un argomento [0, 2[, e si
potrà dunque scrivere, ricordando la denizione di esponenziale complessa,
a b = [a b[(cos +i sin ) = [a b[e
i
;
ma allora sostituendo a con e
i
a avremo, per la linearità del prodotto scalare
nel primo argomento,
(e
i
a) b = e
i
(a b) = [a b[
m
,
e pertanto, per quanto dimostrato sopra,
[a b[
2
m
= (Re [a b[
m
)
2
=
_
Re
_
(e
i
a) b
_
2
[e
i
a[
2
m
[b[
2
m
= [e
i
[
2
[a[
2
m
[b[
2
m
= [a[
2
m
[b[
2
m
a, b C
m
,
cioè la tesi.
Dimostriamo la subadditività della norma: per la disuguaglianza di Cauchy-
Schwarz si ha
[a +b[
2
m
= [a[
2
m
+ 2Re a b +[b[
2
m
[a[
2
m
+ 2[a b[ +[b[
2
m

[a[
2
m
+ 2[a[
m
[b[
m
+[b[
2
m
= ([a[
m
+[b[
m
)
2
.
Osservazione 3.1.2 Si noti che se a, b R
m
, allora vale luguaglianza
[a +b[
2
m
= [a[
2
m
+[b[
2
m
se e solo se a e b sono vettori fra loro ortogonali.
Distanza euclidea
Tramite la norma si può dare la nozione di distanza fra due vettori di R
m
o
di C
m
.
Denizione 3.1.3 Una distanza, o metrica, su un insieme non vuoto X è
una funzione d : X X [0, [ con queste proprietà:
(i) (positività) d(x, y) 0 per ogni x, y X, d(x, y) = 0 se e solo se x = y;
188
(ii) (simmetria) d(x, y) = d(y, x) per ogni x, y X;
(iii) (disuguaglianza triangolare) d(x, y) d(x, z) +d(z, y) per ogni x, y, z
X.
Se su X è denita una distanza d, la coppia (X, d) è detta spazio metrico.
La nozione di spazio metrico è molto importante e generale, e la sua portata
va molto al di là del nostro corso. Si può vericare assai facilmente che la
funzione
d(x, y) = [x y[
m
x, y C
m
(oppure x, y R
m
)
è una distanza su C
m
(oppure su R
m
), che si chiama distanza euclidea: le
proprietà (i), (ii) e (iii) sono evidenti conseguenze delle condizioni (i), (ii) e
(iii) relative alla norma euclidea. La distanza euclidea gode inoltre di altre
due proprietà legate alla struttura vettoriale di R
m
e C
m
:
(iv) (invarianza per traslazioni) d(x +v, y +v) = d(x, y) per ogni x, y, v
C
m
(oppure R
m
),
(v) (omogeneità) d(x, y) = [[d(x, y) per ogni C e x, y C
m
(oppure
R e x, y R
m
).
Notiamo che d(0, x) = [x[
m
per ogni x C
m
; inoltre se m = 1, come già
sappiamo, posto z = x +iy per ogni z C, si ha [z[ =
_
x
2
+y
2
= [(x, y)[
2
,
ossia C e R
2
, dal punto di vista metrico, sono la stessa cosa.
Per un qualunque spazio metrico si denisce la palla di centro x
0
X e
raggio r > 0 come linsieme B(x
0
, r) = x X : d(x, x
0
) < r; quindi la
palla di centro x
0
R
m
e raggio r è
B(x
0
, r) = x R
m
: [x x
0
[
m
< r,
mentre analogamente la palla di centro z
0
C
m
e raggio r > 0 sarà
B(z
0
, r) = z C
m
: [z z
0
[
m
< r.
Nel caso m = 1 la palla B(x
0
, r) di R è lintervallo ]x
0
r, x
0
+ r[ mentre la
palla B(z
0
, r) di C è il disco z C : [z z
0
[ < r. Un intorno di un punto
x
0
in R
m
o in C
m
è un insieme U tale che esista una palla B(x
0
, r) contenuta
in U. Ogni palla di centro x
0
è essa stessa un intorno di x
0
; talvolta però
è comodo usare intorni di x
0
pi` u generali delle palle (ad esempio intorni di
189
forma cubica, se m = 3).
Una successione x
n
R
m
(oppure C
m
) converge ad un elemento x R
m
(o C
m
) se
lim
n
[x
n
x[
m
= 0,
cioè se per ogni > 0 esiste N tale che x
n
B(x, ) per ogni n . Si
noti che, essendo
[x
i
n
x
i
[ [x
n
x[
m

m
j=1
[x
j
n
x
j
[, i = 1, . . . , m,
la condizione lim
n
x
n
= x equivale alle m relazioni
lim
n
x
i
n
= x
i
, i = 1, 2, . . . , m.
Aperti e chiusi
Deniremo adesso alcune importanti classi di sottoinsiemi di R
m
. Tutto ciò
che verrà detto in questo paragrafo si può ripetere in modo completamente
analogo per C
m
.
Denizione 3.1.4 Sia A R
m
. Diciamo che A è un insieme aperto se è
intorno di ogni suo punto, ossia se per ogni x
0
A esiste r > 0 tale che
B(x
0
, r) A (il raggio r dipenderà ovviamente dalla posizione di x
0
in A).
Gli insiemi aperti formano una famiglia chiusa rispetto a certe operazioni
insiemistiche:
Proposizione 3.1.5 Lunione di una famiglia qualsiasi di aperti è un aper-
to. Lintersezione di una famiglia nita di aperti è un aperto.
Dimostrazione Se A
i
iI
è una famiglia di aperti, e x

iI
A
i
, vi sarà
un indice j I tale che x A
j
; quindi esiste r > 0 tale che B(x, r) A
j

iI
A
i
. Pertanto
iI
A
i
è un aperto.
Se A
1
, . . . , A
k
è una famiglia nita di aperti e x
k
i=1
A
i
, allora per ogni
i fra 1 e k vi sarà r
i
> 0 tale che B(x, r
i
) A
i
; posto r = minr
1
, . . . , r
k
, si
ha r > 0 e B(x, r)
k
i=1
B(x, r
i
)
k
i=1
A
i
.
190
Esempi 3.1.6 (1) Sono aperti in R:
, R, ]a, b[, ] , a[, ]b, +[, R 34, R Z,
]0, 1[]2, 4[, ]0, 1[
1
n
nN
+;
non sono aperti in R:
N, Z, Q, R Q, [a, b[, [a, b], ]a, b], ] , a], [b, +[,
1
n
nN
+, [0, 1]
1
n
nN
+.
(2) Sono aperti in R
2
:
R
2
, , (x, y) R
2
: y > 0, (x, y) R
2
: [x[ +[y[ < 1,
R
2
(0, 0), B((x, y), r);
non sono aperti in R
2
:
R 0, (0, y) : y > 0, (x, y) R
2
: y 0,
(x, y) R
2
: x y, (x, y) R
2
: 1 x
2
+y
2
< 2.
Denizione 3.1.7 Sia F R
m
. Diciamo che F è un insieme chiuso in R
m
se il suo complementare F
c
è un aperto.
Si ha subito la seguente proprietà:
Proposizione 3.1.8 Lintersezione di una famiglia qualsiasi di chiusi è un
chiuso. Lunione di una famiglia nita di chiusi è un chiuso.
Dimostrazione Se F
i
iI
è una famiglia di chiusi, allora tutti i comple-
mentari F
c
i
sono aperti, quindi per la proposizione precedente
_
iI
F
i
_
c
=
iI
F
c
i
è un aperto e dunque
iI
F
i
è chiuso. Se F
1
, . . . , F
k
è una
famiglia nita di chiusi, allora per la proposizione precedente si ha che
_
k
i=1
F
i
_
c
=
k
i=1
F
c
i
è un aperto e quindi
k
i=1
F
i
è chiuso.
Gli insiemi chiusi hanno una importante caratterizzazione che è la seguente:
Proposizione 3.1.9 Sia F R
m
. Allora F è chiuso se e solo se per ogni
successione x
n
F, convergente ad un punto x R
m
, risulta x F.
191
Dimostrazione Supponiamo che F sia chiuso e sia x
n
F tale che
x
n
x per n ; si deve provare che x F. Se fosse x F
c
, dato che
F
c
è aperto esisterebbe una palla B(x, r) contenuta in F
c
; ma siccome x
n
tende a x, denitivamente si avrebbe x
n
B(x, r) F
c
, contro lipotesi che
x
n
F per ogni n. Dunque x F.
Supponiamo viceversa che F contenga tutti i limiti delle successioni che sono
contenute in F, e mostriamo che F
c
è aperto. Se non lo fosse, vi sarebbe
un punto x F
c
per il quale ogni palla B(x, r) interseca (F
c
)
c
, cioè F;
quindi, scegliendo r = 1/n, per ogni n N
+
esisterebbe un punto x
n

B(x, 1/n) F. La successione x
n
, per costruzione, sarebbe contenuta in
F, e convergerebbe a x dato che [x x
n
[
m
< 1/n. Ma allora, per ipotesi,
il suo limite x dovrebbe stare in F: assurdo perche x F
c
. Dunque F
c
è
aperto e F è chiuso.
Esempi 3.1.10 (1) Sono chiusi in R:
R, , [a, b], [a, +[, ] , b],
_
1
n
_
nN
+
0, 65, N, Z;
non sono chiusi in R:
[a, b[, ]a, b[, ]a, b], ] , a[, ]b, +[,
_
1
n
_
nN
+
, Q, R Q.
(2) Sono chiusi in R
2
:
R
2
, , (x, y) R
2
: x
2
+y
2
1, R 0,
(x, y) R
2
: x = 0, y 0, (x, y) R
2
: 1 [x[ +[y[ 3;
non sono chiusi in R
2
:
(x, y) R
2
: 0 < x
2
+y
2
1, (x, y) R
2
: x = 0, y > 0,
(x, y) R
2
: 1 [x[ +[y[ < 3, Q
2
, R
2
Q
2
.
Si noti che esistono insiemi aperti ma non chiusi, insiemi chiusi ma non
aperti, insiemi ne aperti ne chiusi ed insiemi sia aperti che chiusi (vedere
però lesercizio 3.1.18).
192
Punti daccumulazione
Nella teoria dei limiti di funzioni è di basilare importanza la denizione che
segue.
Denizione 3.1.11 Sia E R
m
, sia x
0
R
m
. Diciamo che x
0
è un
punto daccumulazione per E se esiste una successione x
n
E x
0
che
converge a x
0
.
La condizione che x
n
non prenda mai il valore x
0
serve ad evitare il caso in cui
x
n
è denitivamente uguale a x
0
; si vuole cioè che intorno a x
0
si accumulino
inniti punti distinti della successione. E infatti è immediato vericare che
x
0
è un punto daccumulazione per E se e solo se ogni palla B(x
0
, r) contiene
inniti punti di E. Notiamo anche che un punto di accumulazione per E può
appartenere o non appartenere a E: ad esempio, 0 è punto di accumulazione
per
1
n
nN
+, ma 0 ,=
1
n
per ogni n, mentre 1/2 è punto daccumulazione per
linsieme [0, 1] al quale appartiene.
Mediante i punti daccumulazione si può dare unaltra caratterizzazione degli
insiemi chiusi:
Proposizione 3.1.12 Sia E R
m
. Allora E è chiuso se e solo se E
contiene tutti i propri punti daccumulazione.
Dimostrazione Se E è chiuso, e x è un punto daccumulazione per E, allora
esiste x
n
E x E tale che x
n
x per n ; per la proposizione
3.1.9 si ottiene x E.
Viceversa, supponiamo che E contenga tutti i suoi punti daccumulazione e
prendiamo una successione x
n
E convergente a x: dobbiamo mostrare
che x E, e la tesi seguirà nuovamente dalla proposizione 3.1.9. Il fatto che
x E è evidente nel caso in cui x
n
è denitivamente uguale a x; in caso
contrario esisteranno inniti indici n per i quali si ha x
n
,= x: i corrispon-
denti inniti valori x
n
sono dunque una successione contenuta in E x e
convergente a x. Perciò x è punto daccumulazione per E, e di conseguenza
x E.
Il fondamentale teorema che segue garantisce lesistenza di punti daccumu-
lazione per una vastissima classe di insiemi. Diamo anzitutto la seguente
Denizione 3.1.13 Un insieme E R
m
si dice limitato se esiste K 0
tale che
[x[
m
K x E.
193
Dunque un insieme E R
m
è limitato se e solo se esiste una palla B(0, K)
che lo contiene.
Teorema 3.1.14 (di Bolzano-Weierstrass) Ogni sottoinsieme innito e
limitato di R
m
possiede almeno un punto daccumulazione.
Dimostrazione Supponiamo dapprima m = 1. Faremo uso del seguente
risultato:
Proposizione 3.1.15 Da ogni successione reale è possibile estrarre una sot-
tosuccessione monotona.
Dimostrazione Sia a
n
R una successione. Poniamo
G = n N : a
m
< a
n
m > n;
allora G sarà nito (eventualmente vuoto) oppure innito.
Supponiamo G nito: allora esiste n
0
N tale che n / G per ogni n n
0
,
ossia risulta
n n
0
m > n : a
m
a
n
.
Perciò, essendo n
0
/ G, esiste n
1
> n
0
tale che a
n
1
a
n
0
e in particolare
n
1
/ G; esisterà allora n
2
> n
1
tale che a
n
2
a
n
1
, e cos` induttivamente si
costruisce una sequenza crescente di interi n
k
tale che a
n
k+1
a
n
k
per ogni
k N. La corrispondente sottosuccessione a
n
k
a
n
, per costruzione, è
monotona crescente.
Supponiamo invece che G sia innito: poiche ogni sottoinsieme di N ha
minimo (esercizio 1.6.10), possiamo porre successivamente
n
0
= min G, n
1
= min(Gn
0
), . . . , n
k+1
= min(Gn
0
, n
1
, . . . , n
k
), . . .
ottenendo una sequenza crescente di interi n
k
G e dunque tali che a
m
< a
n
k
per ogni m > n
k
; in particolare a
n
k+1
< a
n
k
per ogni k. La corrispondente
sottosuccessione a
n
k
a
n
è perciò monotona decrescente.
Corollario 3.1.16 Ogni successione limitata in R ha una sottosuccessione
convergente.
Dimostrazione La sottosuccessione monotona della proposizione preceden-
te è limitata per ipotesi, dunque convergente (proposizione 2.3.3).
Il corollario appena dimostrato prova anche il teorema nel caso m = 1: se
194
un insieme E è innito e limitato, esso contiene una successione limitata e
costituita tutta di punti distinti, la quale, per il corollario, ha una sottosuc-
cessione convergente; il limite di questa sottosuccessione è evidentemente un
punto daccumulazione per E.
Passiamo ora al caso m > 1. Sia x
n
una successione (costituita tutta di
punti distinti) contenuta in E e proviamo che esiste una sottosuccessione che
converge: il suo limite sarà il punto daccumulazione cercato.
Poiche x
n
è limitata, le successioni reali x
1
n
, x
2
n
,. . . , x
m
n
sono li-
mitate. Allora, per il caso m = 1 già visto, esiste una sottosuccessione
x
n,(1)
x
n
tale che x
1
n,(1)
converge ad un limite x
1
R; da x
n,(1)
possiamo estrarre una ulteriore sottosuccessione x

n,(2)
tale che x
1
n,(2)
x
1
(perchè estratta dalla successione x
1
n,(1)
che già convergeva a x
1
) ed inoltre
x
2
n,(2)
converge ad un limite x
2
R. Continuando ad estrarre ulteriori sotto-
successioni x
n,(3)
x
n,(2)
, x
n,(4)
x
n,(3)
, . . . , dopo m passi otterre-
mo una sottosuccessione x
n,(m)
di tutte le precedenti, tale che x
1
n,(m)
x
1
,
x
2
n,(m)
x
2
, . . . , x
m
n,(m)
x
m
in R. Ne segue che, posto x = (x
1
, . . . , x
m
),
la successione x
n,(m)
, che è una sottosuccessione di x
n
, converge a x in
R
m
.
Osservazioni 3.1.17 (1) Il punto daccumulazione costruito nel teorema di
Bolzano-Weierstrass non è in generale unico!
(2) I punti daccumulazione di un insieme E sono i limiti delle successioni di
E che non sono denitivamente costanti.
Esempi 3.1.18 (1) Linsieme N è innito ma non limitato in R, ed è privo
di punti di accumulazione.
(2) 1 è un insieme limitato in R ma non innito, ed è privo di punti di
accumulazione.
(3) La successione (1)
n
+
1
n
costituisce un insieme innito e limitato in
R che ha i due punti daccumulazione +1 e 1.
Dal teorema di Bolzano-Weierstrass segue la seguente importante caratteriz-
zazione dei sottoinsiemi chiusi e limitati di R
m
.
Teorema 3.1.19 Sia E R
m
. Allora E è chiuso e limitato se e solo se
da ogni successione contenuta in E si può estrarre una sottosuccessione che
converge ad un elemento di E.
195
Dimostrazione Sia E limitato e chiuso. Sia x
n
una successione contenu-
ta in E; se essa già converge ad un punto x R
m
, ogni sua sottosuccessione
convergerà ancora a x, il quale apparterrà al chiuso E in virt` u della propo-
sizione 3.1.9. Se non converge, essa è comunque limitata: per il teorema di
Bolzano-Weierstrass avrà una sottosuccessione x
n
convergente ad un ele-
mento x R
m
; poiche E contiene x
n
ed è chiuso, deve essere x E.
Viceversa, se ogni successione contenuta in E ha una sottosuccessione che
converge ad un punto di E, allora in particolare E contiene il limite di ogni
successione convergente in esso contenuta, e quindi E è chiuso per la proposi-
zione 3.1.9. Inoltre se E non fosse limitato allora per ogni n N
+
esisterebbe
x
n
E tale che [x
n
[
m
> n; ma nessuna sottosuccessione della successione
x
n
cos` costruita potrebbe convergere, essendo illimitata. Ciò contraddice
lipotesi fatta su E, e quindi E è limitato.
Osservazione 3.1.20 Gli insiemi E tali che ogni successione contenuta in E
ha una sottosuccessione che converge ad un elemento di E si dicono compatti;
quindi il teorema precedente caratterizza i sottoinsiemi compatti di R
m
.
Esempi 3.1.21 Sono compatti in R:
3, [a, b], [a, b] [c, d], 0
_
1
n
_
nN
+
, (1)
nN
;
non sono compatti in R:
] , a], ]a, b], ]a, b[, [b, +[,
_
1
n
_
nN
+
, Q [0, 1], N, Z.
Esercizi 3.1
1. Si provi che se a, b R
m
0 allora a b = [a[
m
[b[
m
cos , ove è
langolo convesso fra i due vettori.
[Traccia: Dati a, b in R
m
0
e detto liperpiano (m 1)-
dimensionale ortogonale a b e
passante per a, si osservi che se
0 il piano interseca il seg-
mento di estremi 0 e b in un pun-
to della forma b con 0, e si
avrà (a b) b = 0.
196
Dunque, da una parte si ha a b = [b[
2
m
e dallaltra [b[
m
= [a[
m
cos .
Discorso analogo se 0, lavorando con b al posto di b.]
2. Provare che |x|
1
=
m
i=1
[x
i
[ e |x|
= max[x
i
[ : i = 1, . . . , m
sono norme in R
m
e in C
m
, ossia sono funzioni positive, omogenee e
subadditive a valori in [0, +[.
3. Descrivere le palle B(0, r) per le distanze
d
1
(a, b) = |a b|
1
e d
(a, b) = |a b|
,
ove le norme | |
1
e | |
sono quelle dellesercizio precedente.

4. Si provi che se x
0
R
m
e r 0 linsieme
B(x
0
, r) = x R
m
: [x x
0
[
m
r
è chiuso in R
m
(esso si chiama palla chiusa di centro x
0
e raggio r).
5. Si provi che ogni sottoinsieme di R chiuso e limitato inferiormente ha
minimo, e che ogni sottoinsieme di R chiuso e limitato superiormente
ha massimo. Vi è un risultato analogo in R
m
e C
m
?
6. Provare che se A è aperto in C, allora A R è aperto in R. Vale il
viceversa?
7. Provare che se F è chiuso in C allora F R è chiuso in R. Vale il
viceversa?
8. Sia x
n
R
m
. Dimostrare o confutare i seguenti enunciati:
(i) se esiste x = lim
n
x
n
, allora x è punto daccumulazione per x
n
;
(ii) se x è punto daccumulazione per x
n
, allora esiste lim
n
x
n
= x.
9. Sia E R un insieme limitato superiormente e sia x = sup E. Provare
che se x / E allora x è punto daccumulazione per E. Cosa può
succedere se x E?
10. Se E R
m
(oppure E C
m
) e x E, diciamo che x è interno a E
se E è un intorno di x. Linsieme dei punti interni a E si chiama parte
interna di E e si indica con
E.
197
(i) Si provi che
E è il pi` u grande insieme aperto contenuto in E.

(ii) Determinare
E quando E = z C : 1 [z[ 2, [arg z[ /3.

11. Se E R
m
e x R
m
(oppure E C
m
e x C
m
), diciamo che x
è aderente a E se ogni palla B(x, r) interseca E. Linsieme dei punti
aderenti a E si chiama chiusura di E e si indica con E.
(i) Si provi che E è il pi` u piccolo insieme chiuso contenente E.
(ii) Si provi che E contiene tutti i punti daccumulazione per E.
(iii) Determinare E quando E = i, i z = re
i/4
: 0 < r <
2.
12. Se E R
m
(oppure E C
m
), si chiama frontiera di E, e si indica con
E, linsieme dei punti aderenti a E che non sono interni a E: in altre
parole, si denisce E = E
E.
(i) Si provi che E = EE
c
, che E è chiuso e che risulta E = EE,
E = E E.
(ii) Determinare E quando E = i, i z = re
i/4
: 0 < r <
2.
13. Se E R
m
(oppure E C
m
) e x E, x si dice punto isolato per E
se esiste una palla B(x, r) tale che B(x, r) E = x. Provare che un
punto aderente a E o è punto daccumulazione per E, oppure è punto
isolato per E.
14. Sia E =
kN
_
k
1
k+1
, k +
1
k+1
_
. Determinare:
(i) la chiusura di E,
(ii) la frontiera di E,
(iii) la parte interna di E.
15. Se E R
m
(oppure E C
m
), il diametro di E è denito da
diam E = sup[x y[
m
: x, y E.
Posto Q
m
= x R
m
: 0 x
i
1 per i = 1, . . . , m, provare che
diam Q
m
=

m.
16. Dimostrare che risulta E =
_

(E
c
)
_
c
,
E=
_
E
c
_
c
.
198
17. (i) Esibire una successione x
n
Q che sia limitata e che non abbia
alcuna sottosuccessione convergente in Q.
(ii) Esibire un sottoinsieme di Q innito, limitato e privo di punti
daccumulazione in Q.
18. Dimostrare che gli unici sottoinsiemi di R
m
che sono simultaneamente
aperti e chiusi sono R
m
e .
[Traccia: per assurdo, sia A aperto e chiuso in R
m
tale che A ,= e
A ,= R
m
; allora B = A
c
verica le stesse condizioni. Scelti a A e
b B, siano
C = t R : a +t(b a) A, D = t R : a +t(b a) B;
allora C e D sono non vuoti, C D = R e C D = . Si provi che C
e D sono aperti, e quindi anche chiusi, in R. In questo modo ci siamo
ricondotti al caso m = 1. Adesso poniamo M = t 0 : [0, t] C.
Si provi che M è non vuoto, contenuto in C e limitato superiormente;
posto = sup M, si provi che deve essere C D, il che è assurdo.]
19. Sia E = x R : p(x), ove p(x) è una generica proprietà. Si dimostri
che:
(i) linsieme E è chiuso se e solo se per ogni x
n
che converge a x vale
limplicazione
p(x
n
) denitivamente vera = p(x) vera;
(ii) linsieme E è aperto se e solo se per ogni x
n
che converge a x
vale limplicazione
p(x) vera = p(x
n
) denitivamente vera.
20. Sia A R
m
. La proiezione di A lungo lasse x
i
è linsieme
A
i
= x R : y A : y
i
= x.
Si provi che A è limitato se e solo se le sue proiezioni A
1
, . . . , A
m
sono
insiemi limitati in R.
21. Sia E R
m
. Il derivato di E è linsieme di tutti i punti di accumula-
zione per E; esso si indica con E.
199
(i) Si provi che E è un insieme chiuso.
(ii) Si determinino E e E
E
quando E =
kN
_
k
1
k+1
, k +
1
k+1
_
.
22. (Insieme di Cantor) Dividiamo [0, 1] in tre parti uguali ed asportiamo
lintervallo aperto centrale di ampiezza 1/3. Dividiamo ciascuno dei due
intervalli chiusi residui in tre parti uguali e rimuoviamo i due intervalli
aperti centrali di ampiezza 1/9. Per ciascuno dei quattro intervalli resi-
dui ripetiamo la stessa procedura: al passo n-simo, avremo 2
n
intervalli
chiusi I
k,n
(k = 1, . . . , 2
n
), di ampiezza 3
n
, di cui elimineremo le parti
centrali aperte J
k,n
di ampiezza 3
n1
. Linsieme
C = [0, 1]
_
n=0
2
n
_
k=1
J
k,n
si chiama insieme ternario di Cantor.
(i) Si provi che C è chiuso e privo di punti interni.
(ii) Si dimostri che tutti i punti di C sono punti daccumulazione per
C.
(iii) Si calcoli la lunghezza complessiva degli intervalli J
k,n
rimossi.
3.2 Funzioni reali di m variabili
Sia A un sottoinsieme di R
m
, oppure di C
m
; considereremo funzioni f de-
nite su A a valori reali. Introduciamo anzitutto un po di terminologia, che
daltronde è analoga a quella usata per le successioni.
Denizione 3.2.1 Diciamo che una funzione f : A R è limitata supe-
riormente in A se linsieme immagine di f, cioè
f(A) = t R : x A : f(x) = t
è limitato superiormente; in ogni caso si pone
sup
A
f =
_
sup f(A) se f(A) è limitato superiormente,
+ se f(A) non è limitato superiormente.
200
Similmente, diciamo che f è limitata inferiormente in A se linsieme f(A) è
limitato inferiormente; in ogni caso si pone
inf
A
f =
_
inf f(A) se f(A) è limitato inferiormente,
se f(A) non è limitato inferiormente.
Diciamo inne che f è limitata in A se è sia limitata superiormente che
inferiormente in A.
Potrà accadere che sup
A
f, quando è un numero reale, sia un valore assunto
dalla funzione, cioè sia un elemento di f(A), oppure no; se esiste x A
tale che f(x) = sup
A
f, diremo che x è un punto di massimo per f in A, e
scriveremo f(x) = max
A
f. Analogamente, se inf
A
f è un elemento di f(A),
cioè esiste x A tale che f(x) = inf
A
f, diremo che x è un punto di minimo
per f in A, e scriveremo f(x) = min
A
f.
Esempi 3.2.2 (1) La funzione f : R R denita da f(x) =
|x|
1+|x|
è limitata:
infatti si ha 0 f(x) 1 per ogni x R. Risulta anzi 0 = inf
R
f e
1 = sup
R
f; si noti che 0 è il minimo, raggiunto nel punto di minimo 0, mentre
1 non appartiene a f(R) e la funzione f non ha massimo. Osserviamo anche
che f è pari, ossia f(x) = f(x) per ogni x R: il suo graco è quindi
simmetrico rispetto allasse y.
(2) La funzione f : R R denita da f(x) =
x
1+|x|
coincide con la precedente
per x 0, mentre è la precedente cambiata di segno per x < 0: si tratta di
una funzione dispari, ossia f(x) = f(x) per ogni x R, ed il suo graco
è simmetrico rispetto allorigine.
201
Risulta in particolare 1 = sup
R
f, 1 = inf
R
f e f non ha ne massimo ne
minimo.
(3) La funzione f(x, y) =
_
x
2
+y
2
è denita su R
2
, è illimitata supe-
riormente ed è limitata inferiormente da 0. Si ha sup f = +, mentre
inf f = min f = 0.
(4) La funzione parte intera, denita per ogni x R da
[x] = maxk Z : k x,
non è limitata ne inferiormente, ne superiormente, cosicche sup f = + e
inf f = ; il suo graco presenta dei salti di ampiezza 1 in corrispon-
denza di ciascun punto di ascissa intera.
(5) La funzione f(x) =
x
|x|
è denita per x reale non nullo e assume solo
i valori 1. Quindi 1 = max f = sup f, 1 = min f = inf f. Si noti che
questa funzione ha inniti punti di massimo e inniti punti di minimo.
(6) La funzione f(x) =
_
1 [x[
2
m
è denita sulla palla unitaria di R
m
, cioè
B = x R
m
: [x[
m
1,
a valori in R. Essa ha massimo 1 (raggiunto per x = 0) e minimo 0 (raggiunto
nei punti della frontiera di B).
202
Funzioni continue
La nozione di funzione continua è strettamente legata allidea intuitiva della
consequenzialità fra causa ed eetto. Ci aspettiamo che piccole variazioni di
input provochino piccole variazioni di output: ad esempio, quando si pigia il
pedale dellacceleratore, piccoli incrementi di pressione del piede producono
piccoli aumenti di velocità della macchina. Comunque nella nostra esperien-
za ci sono anche esempi di fenomeni di tipo impulsivo: piccoli aumenti di
pressione del dito su un interruttore causano, oltre una certa soglia, un dra-
stico aumento dellintensità della luce presente in una stanza. Chiameremo
continue quelle funzioni y = f(x) per le quali variando di poco la grandezza
x si ottiene una piccola variazione della quantità y. Pi` u precisamente:
Denizione 3.2.3 Sia A un sottoinsieme di R
m
, oppure di C
m
, sia f : A
R e sia x
0
A. Diciamo che f è continua nel punto x
0
se per ogni > 0
esiste un > 0 tale che
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < .
Diciamo che f è continua in A se è continua in ogni punto di A.
Osservazioni 3.2.4 (1) La continuità di una funzione è un fatto locale: essa
può esserci o no a seconda del punto x
0
che si considera. Per un generico
punto x
0
A i casi sono due: o x
0
è punto daccumulazione per A (denizione
3.1.11), oppure x
0
è punto isolato di A, nel senso che esiste un intorno B(x
0
, )
di x
0
tale che A B(x
0
, ) = x
0
(esercizio 3.1.13). Nel secondo caso, ogni
funzione f : A R è continua in x
0
, poiche qualunque sia > 0 risulta
x A, [x x
0
[
m
< = x = x
0
= [f(x) f(x
0
)[ = 0 < .
203
Nel primo caso, che è lunico interessante, la denizione di continuità di una
funzione si riconduce a quella pi` u generale di limite di funzione, che daremo
fra poco.
(2) Se f : R
2
R è continua in un punto (x
0
, y
0
), allora le funzioni x
f(x, y
0
) e y f(x
0
, y) sono continue rispettivamente nei punti x
0
e y
0
. Si
noti però che il viceversa è falso: esistono funzioni f(x, y) tali che f(, y) è
continua per ogni y, f(x, ) è continua per ogni x, ma f non è continua per
ogni (x, y) (si veda lesercizio 3.2.10).
Non tutte le funzioni pi` u importanti sono continue! Vediamo qualche esempio
di funzione continua e discontinua.
Esempi 3.2.5 (1) Tutte le funzioni ani sono continue. Si tratta delle
funzioni f : R
m
R della forma
f(x) = a x +b =
m
i=1
a
i
x
i
+b,
ove a R
m
e b R sono assegnati. Fissato x
0
R
m
e scelto > 0, si ha
[f(x) f(x
0
)[ = [a x +b a x
0
b[ = [a (x x
0
)[;
utilizzando la disuguaglianza di Cauchy-Schwarz (proposizione 3.1.1) si ot-
tiene
[f(x) f(x
0
)[ [a[
m
[x x
0
[
m
.
204
Quindi se a ,= 0 basta prendere 0 < <

|a|m
per avere
[x x
0
[
m
< = [f(x) f(x
0
)[ [a[
m
[x x
0
[
m
< [a[
m
< ;
daltronde se a = 0 si ha f(x) = b per ogni x R
m
, e la continuità è ovvia.
(2) La somma di una serie di potenze con raggio di convergenza R > 0 è
una funzione continua sul disco B(0, R) = z C : [z[ < R. Sia infatti
f(z) =
n=0
a
n
z
n
per [z[ < R: ssati z
0
con [z
0
[ < R e > 0, scegliamo un
numero positivo < R[z
0
[, cosicche risulta B(z
0
, ) B(0, R). Allora per
ogni z B(z
0
, ) si ha
[f(z) f(z
0
)[ =
n=0
a
n
z
n
n=0
a
n
z
n
0
n=1
a
n
(z
n
z
n
0
)
=
=
n=1
a
n
(z z
0
)(z
n1
+z
n2
z
0
+. . . +zz
n2
0
+z
n1
0
)
n=1
[a
n
[[z z
0
[([z[
n1
+[z[
n2
[z
0
[ +. . . +[z[[z
0
[
n2
+[z
0
[
n1
)
n=1
[a
n
[[z z
0
[
_
n([z
0
[ +)
n1
=
[z z
0
[
[z
0
[ +
n=1
n[a
n
[([z
0
[ +)
n
.
Dato che la serie di potenze
na
n
z
n
ha ancora raggio di convergenza R
(esercizio 2.7.9), otteniamo che la serie allultimo membro è convergente, con
somma uguale a un numero che dipende da z
0
e da , cioè da z
0
e da R; in
particolare, esiste K > 0 tale che
[f(z) f(z
0
)[ K[z z
0
[ z B(z
0
, ).
Adesso basta scegliere positivo e minore sia di che di /K, e si ottiene
[z z
0
[ < = [f(z) f(z
0
)[ < ,
e ciò prova la continuità di f in z
0
.
(3) Come conseguenza dellesempio precedente, le funzioni trigonometriche
cos x e sin x sono continue su R, mentre lesponenziale e
z
è continua su C (e
in particolare su R). Se a > 0, anche la funzione a
x
è continua su R, essendo
a
x
= e
xlog a
=
n=0
(log a)
n
x
n
n!
x R.
205
(4) La funzione parte intera f(x) = [x] è continua in ogni punto x / Z ed
è discontinua in ogni punto x Z. Infatti, scelto x / Z, sia = minx
[x], [x + 1] x: allora qualunque sia > 0 si ha
[t x[ < = [t] = [x] = [[t] [x][ = 0 < .
Daltra parte se x Z allora, scelto ]0, 1] si ha
[[t] [x][ = [[t] x[ = 1 t ]x 1, x[,
quindi è impossibile trovare un > 0 per cui si abbia
[t x[ < = [[t] [x][ < .
(5) Se b > 0 e b ,= 1, la funzione logaritmo di base b è continua in ]0, +[.
Sia infatti x
0
> 0: se ]0, x
0
[ e [x x
0
[ < , si ha, supponendo ad esempio
x < x
0
:
[ log
b
x log
b
x
0
[ =
log
b
x
x
0
= [ log
b
e[ log
x
0
x
= [ log
b
e[ log
_
1 +
_
x
0
x
1
__
.
Notiamo ora che vale limportante disuguaglianza
log(1 +t) t t > 1 :
essa segue dalla crescenza del logaritmo e dal fatto, vericabile direttamente
se t 0 e con il criterio di Leibniz (proposizione 2.5.3) se 1 < t < 0, che
1 +t
n=0
t
n
n!
= e
t
t > 1.
Da tale disuguaglianza ricaviamo
[ log
b
x log
b
x
0
[ [ log
b
e[
_
x
0
x
1
_
= [ log
b
e[
x
0
x
x
[ log
b
e[

x
0
;
quindi, ssato > 0, basterà prendere abbastanza piccolo per ottenere che
lultimo membro sia minore di . Nel caso in cui sia x
0
< x, il calcolo è del
tutto simile.
206
Esercizi 3.2
1. Siano f : A R
m
R e g : B R R, con f(A) B; sia x
0
A e
sia y
0
= f(x
0
). Si provi che se f è continua in x
0
e se g è continua in
y
0
, allora la funzione composta g f(x) = g(f(x)) è continua in x
0
.
2. Descrivere le funzioni f : A R
m
R che in un ssato punto
x
0
A vericano le seguenti proprietà, parenti della denizione di
continuità:
(i) esiste > 0 tale che per ogni > 0 risulta
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < ;
(ii) esiste > 0 tale che per ogni > 0 risulta
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < ;
(iii) per ogni > 0 e per ogni > 0 risulta
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < ;
(iv) esistono > 0 e > 0 tali che risulta
x A, [x x
0
[
m
< = [f(x) f(x
0
)[ < .
3. (Permanenza del segno) Sia f : A R
m
R una funzione continua
in un punto x
0
A. Si provi che se f(x
0
) > 0, allora esiste una palla
B(x
0
, R) tale che f(x) > 0 per ogni x B(x
0
, R) A.
4. Si provi che la funzione
f(x) =
_
_
_
sin
1
x
se x R 0
se x = 0
è discontinua nel punto 0, qualunque sia R.
5. Si provi che sono funzioni continue le combinazioni lineari di funzioni
continue ed i prodotti di funzioni continue.
207
6. Si provi che se f è continua in x
0
e f(x
0
) ,= 0, allora
1
f
è continua in
x
0
.
[Traccia: usare lesercizio 3.2.3.]
7. Sia R. Provare che la funzione f(x) = x
è continua su [0, +[
(se 0) oppure su ]0, +[ (se < 0).
8. (Funzioni a valori vettoriali) Sia A un sottoinsieme di R
m
, sia x
0

A e sia f : A R
m
R
n
una funzione: la funzione (vettoriale) f
associa ad ogni vettore x = (x
1
, . . . , x
m
) A un altro vettore f(x) =
(f
1
(x), . . . , f
n
(x)) R
n
. Diciamo che f è continua in x
0
se per ogni
> 0 esiste > 0 tale che
x A, [x x
0
[
m
< = [f(x) f(x
0
)[
n
< .
Provare che f è continua in x
0
se e solo se le sue n componenti scalari
f
1
, . . . , f
n
sono continue in x
0
.
9. Sia B una palla di R
m
oppure di C
m
, sia f : B R una funzione
continua. Per ogni coppia di elementi ssati a, b B, provare che la
funzione
g(t) = f(ta + (1 t)b), t [0, 1],
è ben denita e continua.
10. Sia f : R
2
R la funzione seguente:
f(x, y) =
_
_
_
4(x
2
y)(2y x
2
)
y
2
0 se y > 0
0 se y 0.
Si provi che:
(i) f è continua in R
2
(0, 0);
(ii) f è discontinua in (0, 0);
(iii) per ogni y R, f(, y) è continua su R;
(iv) per ogni x R, f(x, ) è continua su R.
208
11. Sia A R
m
e siano f, g due funzioni reali limitate denite in A. Si
provi che
sup
A
(f +g) sup
A
f + sup
A
g, inf
A
(f +g) inf
A
f + inf
A
g,
sup
A
(f) =
_
sup
A
f se 0
inf
A
f se 0,
inf
A
(f) =
_
inf
A
f se 0
sup
A
f se 0.
3.3 Limiti
Estendiamo ora al caso delle funzioni reali la nozione di limite, che ci è già
nota nel caso delle successioni. Sia A un sottoinsieme di R
m
oppure di C
m
,
sia f : A R, sia x
0
un punto daccumulazione per A.
Denizione 3.3.1 Sia L R. Diciamo che L è il limite di f(x) per x che
tende a x
0
in A, e scriviamo
lim
xx
0
, xA
f(x) = L,
se per ogni > 0 esiste > 0 tale che
x A x
0
, [x x
0
[
m
< = [f(x) L[ < .
Se, in particolare, L = 0, si dice che f è innitesima per x x
0
.
Se linsieme A coincide con R
m
(o con C
m
), oppure è sottinteso dal contesto,
si scrive pi` u semplicemente
lim
xx
0
f(x) anziche lim
xx
0
, xA
f(x).
Si noti che in generale x
0
non appartiene ad A, e che x
0
non è tra i valori
di x che sono coinvolti nella denizione di limite. Quindi, anche se per caso
si avesse x
0
A, non è lecito far prendere alla variabile x il valore x
0
. Ad
esempio, consideriamo la funzione
pippo(x) =
_
19 se x R 130
237 se x = 130 :
il punto 130 è di accumulazione per R, e benche risulti pippo(130) = 237, si
ha
lim
x130
pippo(x) = 19.
Il limite di una funzione può essere anche :
209
Denizione 3.3.2 Diciamo che f(x) tende a +, oppure a , per x
x
0
in A, se per ogni M > 0 esiste > 0 tale che
x A x
0
, [x x
0
[
m
< = f(x) > M,
oppure
x A x
0
, [x x
0
[
m
< = f(x) < M.
In tal caso scriviamo
lim
xx
0
, xA
f(x) = +, oppure lim
xx
0
, xA
f(x) = .
Nel caso m = 1 e A R, in particolare, si può fare anche il limite destro, op-
pure il limite sinistro, per x x
0
; nella denizione 3.3.1 questo corrisponde
a prendere come A la semiretta ]x
0
, +[ oppure la semiretta ] , x
0
[. Si
scrive in tali casi
lim
xx
+
0
f(x) = L, oppure lim
xx
0
f(x) = ,
e ciò corrisponde a dire che per ogni > 0 esiste > 0 tale che
x
0
< x < x
0
+ = [f(x) L[ < ,
oppure
x
0
< x < x
0
= [f(x) [ < .
Inne, sempre nel caso m = 1 e A R, se A è illimitato superiormente,
oppure inferiormente, si può fare il limite per x +, oppure per x :
si avrà
lim
x+
f(x) = L, oppure lim
x
f(x) = ,
se per ogni > 0 esiste M > 0 tale che
x > M = [f(x) L[ < , oppure x < M = [f(x) [ < .
Esempi 3.3.3 (1) Si ha
lim
x+
a
x
=
_
_
+ se a > 1
1 se a = 1
0 se 0 < a < 1,
lim
x
a
x
=
_
_
0 se a > 1
1 se a = 1
+ se 0 < a < 1;
lim
x+
log
b
x =
_
+ se b > 1
se 0 1
+ se 0 < b < 1.
210
(2) Se x
0
Z, risulta
lim
xx
0
[x] = x
0
1, lim
xx
+
0
[x] = x
0
;
in particolare, se x
0
Z il limite di [x] per x x
0
non esiste (esercizio 3.3.3).
Si ha però
lim
x+
[x] = +, lim
x
[x] = .
(I lettori sono invitati a vericare tutte queste aermazioni!)
Osservazione 3.3.4 I limiti sono legati alla continuità nel modo seguente.
Sia f : A R, sia x
0
un punto di accumulazione per A. Il punto x
0
può
appartenere o non appartenere ad A. Se x
0
A, si ha che
f continua in x
0
lim
xx
0
f(x) = L R e L = f(x
0
).
Se invece, caso pi` u interessante, x
0
/ A, allora il fatto che il limite esista nito
equivale a dire che possiamo estendere la funzione f allinsieme A x
0
in
modo che lestensione sia continua in x
0
: basta assegnarle in tale punto il
valore del limite. In altre parole, denendo
f(x) =
_
f(x) se x A
L se x = x
0
,
si ha che
lim
xx
0
f(x) = L f è continua in x
0
(si confronti con losservazione 3.2.4 (1)).
Esempi 3.3.5 (1) Risulta
lim
x0
sin x
x
= 1;
ciò segue dalle disuguaglianze
cos x
sin x
x
1 x R 0
211
e dal fatto che il primo e il terzo membro tendono a 1 per x 0 (esempio
3.2.5 (3); si veda anche lesercizio 3.3.8). Dunque la funzione
f(x) =
_
_
_
sin x
x
se x R 0
1 se x = 0
è continua nel punto 0. Daltronde questo si poteva vedere anche ricordando
che, per il teorema 2.7.11,
sin x =
n=0
(1)
n
x
2n+1
(2n + 1)!
x R,
da cui
sin x
x
=
n=0
(1)
n
x
2n
(2n + 1)!
x R 0;
la serie di potenze a secondo membro ha raggio di convergenza innito, ed
in particolare ha somma uguale a 1 per x = 0. La sua somma in R è dunque
la funzione f, la quale risulta continua in virt` u dellesempio 3.2.5 (2).
(2) Proviamo che
lim
x0
1 cos x
x
2
=
1
2
.
Si ha (teorema 2.7.11)
cos x =
n=0
(1)
n1
x
2n
(2n)!
x R,
da cui
1 cos x
x
2
=
n=1
(1)
n
x
2n2
(2n)!
x R 0.
La serie a secondo membro ha raggio di convergenza innito e nel punto 0
ha somma uguale a 1/2; ne segue che la somma della serie, cioè la funzione
f(x) =
_
_
1 cos x
x
2
se x R 0
1
2
se x = 0
212
è continua per x = 0, e ciò prova la tesi.
Si noti che la stessa conclusione si poteva ottenere pi` u semplicemente, osser-
vando che
1 cos x
x
2
=
1 cos
2
x
x
2
(1 + cos x)
=
_
sin x
x
_
2
1
1 + cos x
,
da cui, per lesempio precedente e per la continuità del coseno, esempio 3.2.5
(3),
lim
x0
1 cos x
x
2
=
1
2
.
(3) In modo analogo, utilizzando la serie esponenziale, si prova che
lim
x0
a
x
1
x
= log a a > 0.
I limiti per funzioni di m variabili (m > 1) costituiscono un problema al-
quanto dicile, pi` u che nel caso di una sola variabile: è spesso pi` u facile
dimostrare che un dato limite non esiste, piuttosto che provarne lesistenza
quando esso esiste. Il motivo è che in presenza di pi` u variabili il punto x
può avvicinarsi al punto daccumulazione x
0
da varie direzioni, lungo una
qualunque retta o anche lungo traiettorie pi` u complicate. Gli esempi che
seguono illustrano alcune delle possibili situazioni.
Esempi 3.3.6 (1) Vediamo se esiste il limite
lim
(x,y)(0,0)
x
2
y
2
x
2
+y
2
.
Osservato che x
2
x
2
+y
2
per ogni (x, y) R
2
, risulta
x
2
y
2
x
2
+y
2
y
2
[(x, y)[
2
2
e quindi il limite proposto esiste e vale 0.
(2) Esaminiamo ora lesistenza del limite
lim
(x,y)(0,0)
xy
x
2
+y
2
.
213
In questo caso sia il numeratore che il denominatore sono polinomi di secondo
grado: se ci avviciniamo allorigine lungo la retta y = kx, si ottiene
xy
x
2
+y
2
=
k
1 +k
2
.
Quindi la funzione che stiamo esaminando assume valore costante su ogni
retta per lorigine, ma la costante cambia da retta a retta: ciò signica che
in ogni intorno dellorigine la funzione assume tutti i valori
k
1+k
2
con k R,
ossia tutti i valori compresi nellintervallo ] 1, 1[. Dunque essa non ha limite
per (x, y) (0, 0).
(3) Come si comporta la funzione
yx
2
y
2
+x
4
per (x, y) (0, 0)? Se, come
nellesempio precedente, ci restringiamo alle rette y = kx, otteniamo i valori
yx
2
y
2
+x
4
=
kx
3
k
2
x
2
+x
4
=
kx
k
2
+x
2
i quali, per (x, y) (0, 0), tendono a 0 qualunque sia k R. Dunque il limite
della funzione per (x, y) (0, 0), se esiste, deve essere 0. Daltra parte, se
ci si restringe alle parabole y = mx
2
, si ottiene il valore costante
yx
2
y
2
+x
4
=
m
m
2
+ 1
che varia da parabola a parabola. Di conseguenza, anche in questo caso, il
limite della funzione non esiste.
Dagli esempi precedenti si conclude che non esiste una ricetta sicura e uni-
versale per stabilire lesistenza o la non esistenza di un limite in pi` u variabili:
ogni caso va studiato a parte.
Osservazione 3.3.7 Nel caso speciale m = 2 esiste un metodo abbastanza
ecace in molti casi, basato sullutilizzo delle coordinate polari. Poniamo
_
x = r cos
y = r sin ,
r 0, [0, 2].
Geometricamente, nel piano xy la quantità r è la distanza del punto (x, y)
dallorigine, mentre il numero è lampiezza dellangolo che il segmento di
estremi (0, 0) e (x, y) forma con il semiasse positivo delle ascisse (orientato
in verso antiorario).
214
Si noti che la corrispondenza
(r, ) (x, y) non è biunivo-
ca: tutte le coppie (0, ) rap-
presentano lorigine, e le coppie
(r, 0) e (r, 2) rappresentano lo
stesso punto sul semiasse posi-
tivo delle ascisse. Lapplicazio-
ne (r, ) (x, y) trasforma ret-
tangoli del piano r in settori di
corone circolari del piano xy.
Naturalmente, ricordando la corrispondenza (x, y) x + iy, denita fra R
2
e C, la quale è bigettiva e preserva le distanze, si vede immediatamente
che la rappresentazione in coordinate polari è la trasposizione in R
2
della
rappresentazione in forma trigonometrica dei numeri complessi.
Consideriamo allora un limite della forma
lim
(x,y)(0,0)
f(x, y),
ove f è una funzione reale denita in un intorno di (0, 0), salvo al pi` u (0, 0).
Vale il seguente risultato:
lim
(x,y)(0,0)
f(x, y) = L R
se e solo se valgono le seguenti condizioni:
215
(i) per ogni [0, 2] esiste il limite, indipendente da ,
lim
r0
+
f(r cos , r sin ) = L;
(ii) Tale limite è uniforme rispetto a , vale a dire che per ogni > 0 esiste
> 0 tale che
[f(r cos , r sin ) L[ < r ]0, [, [0, 2].
Dimostrazione Supponiamo che f(x, y) L per (x, y) (0, 0): allora,
per denizione, ssato > 0 esiste > 0 tale che
[f(x, y) L[ < (x, y) B((0, 0), ).
Dato che (r cos , r sin ) B((0, 0), ) per ogni r ]0, [ e per ogni
[0, 2], otteniamo
[f(r cos , r sin ) L[ < r ]0, [, [0, 2],
cosiche valgono (i) e (ii).
Viceversa, per ogni punto (x, y) B((0, 0), ), posto r cos = x e r sin = y,
si ha r ]0, [ e dunque, per (i) e (ii),
[f(x, y) L[ = [f(r cos , r sin ) L[ < ;
ne segue f(x, y) L.
Esempi 3.3.9 (1) Consideriamo il limite
lim
(x,y)(0,0)
2(x
2
+y
2
)
log[1 + (x
2
+y
2
)]
.
Utilizzando le coordinate polari si ha
lim
r0
+
2r
2
ln(1 +r
2
)
= 2,
ed il limite è ovviamente uniforme rispetto a , dato che tale variabile è
sparita. Si conclude che il limite cercato è 2.
216
(2) Consideriamo il limite molto simile
lim
(x,y)(0,0)
2(x
2
+ 3y
2
)
ln[1 + (4x
2
+y
2
)]
.
Con la stessa procedura arriviamo a
lim
r0
+
2r
2
(cos
2
+ 3 sin
2
)
ln[1 +r
2
(4 cos
2
+ sin
2
)]
= 2
cos
2
+ 3 sin
2
4 cos
2
+ sin
2
= 2
1 + 2 sin
2
3 cos
2
+ 1
,
e questo limite dipende da . Ne segue che il limite proposto non esiste.
Il teorema-ponte
Il collegamento fra i limiti di successioni ed i limiti di funzioni è fornito dal
teorema che segue, il quale ci darà modo di dedurre senza colpo ferire tutta
la teoria dei limiti di funzioni dai corrispondenti risultati già dimostrati nel
capitolo 2 per le successioni.
Teorema 3.3.10 (teorema-ponte) Sia A un sottoinsieme di R
m
oppure
di C
m
, sia f : A R e sia x
0
un punto di accumulazione per A. Sia inoltre
L R oppure L = . Si ha
lim
xx
0
f(x) = L
se e solo se per ogni successione x
n
A x
0
, convergente a x
0
per
n , risulta
lim
n
f(x
n
) = L.
Dimostrazione (=) Sia ad esempio L R e supponiamo che f(x) L
per x x
0
; sia poi x
n
una successione contenuta in A x
0
che tende a
x
0
per n . Per ipotesi, ssato > 0, esiste > 0 tale che
x B(x
0
, ) (A x
0
) = [f(x) L[ < ;
daltra parte, poiche x
n
x
0
, esiste N tale che
n = [x
n
x
0
[
m
< .
Inoltre, dato che x
n
,= x
0
per ogni n, si ha
x
n
B(x
0
, ) (A x
0
) n ,
217
e pertanto
[f(x
n
) L[ < n .
Ciò prova che f(x
n
) L per n . Se L = la tesi si prova in modo
del tutto simile.
(=) Supponiamo che L R, e che si abbia lim
n
f(x
n
) = L per qualun-
que successione x
n
contenuta in A x
0
tendente a x
0
per n . Se,
per assurdo, non fosse vero che f(x) tende a L per x x
0
, esisterebbe > 0
tale che per ogni > 0 si troverebbe un punto x
A x
0
per il quale
avremmo
[x
x
0
[
m
< ma [f(x
) L[ .
Scegliendo = 1/n, potremmo allora costruire una successione x
n
A
x
0
tale che
[x
n
x
0
[
m
<
1
n
ma [f(x
n
) L[ n N
+
.
Si avrebbe perciò che x
n
A x
0
, x
n
x
0
ma f(x
n
) non tenderebbe
a L, contro lipotesi. Dunque
lim
xx
0
f(x) = L.
Il caso L = è del tutto analogo.
Osservazioni 3.3.11 (1) Il teorema-ponte vale anche nel caso in cui m = 1,
A R e x (esercizio 3.3.11).
(2) Dal teorema-ponte si deduce che una funzione f : A R è continua nel
punto x
0
A se e solo se per ogni successione x
n
A convergente a x
0
risulta
lim
n
f(x
n
) = f(x
0
).
Esempio 3.3.12 Calcoliamo il limite notevole
lim
y0
log
b
(1 +y)
y
,
ove b > 0, b ,= 1. Utilizzeremo il teorema-ponte. Sia y
n
una successione
innitesima tale che y
n
,= 0 per ogni n. Posto, per ogni n, x
n
= log
b
(1 +y
n
),
risulta
y
n
= b
xn
1,
218
e quindi
log
b
(1 +y
n
)
y
n
=
x
n
b
xn
1
;
dalle proprietà di y
n
segue (per la continuità del logaritmo, esempio 3.2.5
(5)) che x
n
è innitesima e che x
n
,= 0 per ogni n. Tenuto conto dellesem-
pio 3.3.5 (3) e del teorema-ponte, otteniamo
lim
n
log
b
(1 +y
n
)
y
n
= lim
n
x
n
b
xn
1
=
1
log b
,
e pertanto, ancora dal teorema-ponte,
lim
y0
log
b
(1 +y)
y
=
1
log b
.
Per un altro modo di calcolare tale limite si veda lesercizio 3.3.10.
Dal teorema-ponte e dai corrispondenti risultati esposti nel teorema 2.1.11
seguono le usuali proprietà algebriche dei limiti:
Proposizione 3.3.13 Sia A un sottoinsieme di R
m
oppure di C
m
, sia x
0
un punto daccumulazione per A e siano f, g : A R funzioni tali che
lim
xx
0
f(x) = L, lim
xx
0
g(x) = M,
con L, M R. Allora:
(i) lim
xx
0
[f(x) +g(x)] = L +M;
(ii) lim
xx
0
[f(x)g(x)] = LM;
(iii) se M ,= 0, lim
xx
0
f(x)
g(x)
=
L
M
.
Si tenga ben presente che nei casi in cui L, oppure M, o entrambi, valgono 0
e , ci si può imbattere in forme indeterminate del tipo +, 0(),
0/0, /; in tutti questi casi può succedere letteralmente di tutto (esercizi
3.3.15, 3.3.16, 3.3.17 e 3.3.18).
219
Esercizi 3.3
1. Si provi che la funzione f(x) =
x
|x|
non ha limite per x 0 (in R); si
provi poi che, analogamente, la funzione f(x) =
x
|x|m
non ha limite per
x 0 (in R
m
).
lim
x2
x
2
, lim
x4
1
x
, lim
x0
1
x
, lim
x0
1
[x[
, lim
x0
1
x
, lim
x3
6
x
6
3
x 3
.
3. Sia f :]a, b[R, sia x
0
]a, b[. Provare che
lim
xx
0
f(x) = L lim
xx
0
f(x) = L e lim
xx
+
0
f(x) = L.
4. Dimostrare che
lim
xx
0
f(x) = L = lim
xx
0
[f(x)[ = [L[;
è vero il viceversa?
5. In quali punti x
0
R la funzione
h(x) =
_
1 se x Q
0 se x R Q
ha limite?
6. Posto
f(x) =
_
x se x Q
_
[x[ se x R Q,
calcolare, se esistono, i limiti
lim
x+
f(x), lim
x
f(x).
7. (Teorema di permanenza del segno) Sia f : A R, sia x
0
un punto
daccumulazione per A. Si provi che se
lim
xx
0
f(x) > 0
allora esiste una palla B(x
0
, R) tale che
f(x) > 0 x B(x
0
, R) (A x
0
).
220
8. (Monotonia dei limiti) Siano f, g : A R, sia x
0
un punto daccumu-
lazione per A. Si provi che se f(x) g(x) in una palla B(x
0
, R) x
0
,
allora si ha
lim
xx
0
f(x) lim
xx
0
g(x),
sempre che tali limiti esistano.
9. Provare che il limite di una funzione in un punto, se esiste, è unico.
10. (Limiti di funzioni composte) Sia f : A R
m
R, sia x
0
un punto
daccumulazione per A e sia
lim
xx
0
f(x) = y
0
R.
Sia poi B R tale che B f(A) e supponiamo che y
0
sia punto
daccumulazione per B. Sia inne g : B R tale che
lim
yy
0
g(y) = L [, +].
Si provi che se vale una delle due condizioni seguenti:
(a) y
0
B e g è continua in y
0
, oppure
(b) f(x) ,= y
0
in un intorno di x
0
,
allora
lim
xx
0
g(f(x)) = L.
Si provi inoltre che ciò è falso in generale se non valgono ne (a) ne (b).
11. Enunciare e dimostrare il teorema-ponte nel caso in cui A R sia
illimitato superiormente o inferiormente e x tenda a + oppure .
lim
x0
tan x
x
, lim
x0
1 cos x
sin
2
x
, lim
x0
sin x x
x
3
, lim
x0
sin x tan x
x
3
cos x
.
221
(i) lim
x1
_
x + 1
x 2
_
2
, (ii) lim
x2
sin x
x 2
, (iii) lim
x1
_
1
x + 1

1
(x + 1)
2
_
,
(iv) lim
x0
3x
1 e
2x
, (v) lim
x+
x
1/x
, (vi) lim
x
_
1
1
x
_
3x
,
(vii) lim
x+
3x
1 e
2x
, (viii) lim
x0
+
x
x
, (ix) lim
x+
log(1 +x
3
)
x
2
,
(x) lim
x0
+
sin
x
x
, (xi) lim
x0
+
x
1/x
, (xii) lim
x+
_
1
1
x
_
3x
.
14. Dimostrare che
lim
x0
+
x
log x = 0 > 0, lim

x+
log x
x
= 0 > 0.
15. Si costruiscano quattro coppie di funzioni f(x), g(x) tali che:
(a) valga lim
xx
0
f(x) = + e lim
xx
0
g(x) = ,
(b) per il limite della dierenza f(x) g(x) valga una delle seguenti
quattro situazioni:
lim
xx
0
[f(x) g(x)] = +, lim
xx
0
[f(x) g(x)] = ,
lim
xx
0
[f(x) g(x)] = R, lim
xx
0
[f(x) g(x)] non esiste.
16. Analogamente allesercizio 3.3.15, si forniscano esempi che illustrino
tutti i casi possibili per il limite di f(x)g(x) quando lim
xx
0
f(x) = 0
e lim
xx
0
g(x) = .
tutti i casi possibili per il limite di
f(x)
g(x)
quando lim
xx
0
f(x) = 0 e
lim
xx
0
g(x) = 0.
tutti i casi possibili per il limite di
f(x)
g(x)
quando lim
xx
0
f(x) = e
lim
xx
0
g(x) = .
222
19. Sia I un intervallo di R e sia f : I R una funzione. Diciamo che f è
crescente in I se
x, x
I, x < x
= f(x) f(x
);
diciamo che f è strettamente crescente in I se
x, x
I, x < x
= f(x) < f(x
).
Diciamo poi che f è decrescente, oppure strettamente decrescente, in I,
se
x, x
I, x < x
= f(x) f(x
) oppure f(x) > f(x
).
Una funzione crescente, o decrescente, in I si dirà monotona; una fun-
zione strettamente crescente, o strettamente decrescente, in I si dirà
strettamente monotona. Si provi che se f è monotona in I allora per
ogni x
0

I
esistono (niti) i limiti destro e sinistro
f(x
+
0
) = lim
xx
+
0
f(x), f(x
0
) = lim
xx
0
f(x),
e che
_
f(x
0
) f(x
0
) f(x
+
0
) se f è crescente
f(x
0
) f(x
0
) f(x
+
0
) se f è decrescente.
20. Sia A un sottoinsieme di R
m
o di C
m
, sia x
0
un punto di A e sia
f : A R una funzione. Il massimo limite ed il minimo limite di f
per x x
0
sono i numeri m, [, +] cos` deniti:
m = lim
r0
+
sup
xB(x
0
,r)
f(x), = lim
r0
+
inf
xB(x
0
,r)
f(x);
essi si denotano con le scritture
m = limsup
xx
0
f(x), = liminf
xx
0
f(x).
Si verichi che
(i) liminf
xx
0
f(x) limsup
xx
0
f(x);
223
(ii) si ha liminf
xx
0
f(x) = limsup
xx
0
f(x) se e solo se esiste, nito
o innito, lim
xx
0
f(x), ed in tal caso
liminf
xx
0
f(x) = limsup
xx
0
f(x) = lim
xx
0
f(x).
lim
(x,y)(0,0)
sin xy
x
2
+y
2
, lim
(x,y)(0,0)
1 cos xy
x
2
+y
2
, lim
(x,y)(0,0)
e
(x+y)
2
1
_
x
2
+y
2
,
lim
(x,y)(0,0)
x
2
y
2
x
2
+y
4
, lim
(x,y)(0,0)
x
2
y
x
2
y
, lim
(x,y)(0,0)
y
2
+x +y
x
2
+x +y
.
22. (i) Posto f(x, y) =
x
2
x
2
+y
2
, si provi che esistono, e sono diversi fra loro,
i due limiti
lim
y0
_
lim
x0
f(x, y)
_
, lim
x0
_
lim
y0
f(x, y)
_
.
(ii) Posto invece f(x, y) =
xy
x
2
+y
2
, si provi che i due limiti esistono e
sono uguali, ma che non esiste il
lim
(x,y)(0,0)
f(x, y).
(iii) Posto inne
f(x, y) =
_
y sin
1
x
+x sin
1
y
se x ,= 0 e y ,= 0
0 se x = 0 oppure y = 0,
si provi che esiste il terzo limite, ma non i primi due.
3.4 Proprietà delle funzioni continue
Le funzioni continue a valori reali hanno svariate proprietà legate allordina-
mento di R. Il primo risultato riguarda funzioni denite su insiemi compatti
(osservazione 3.1.20), i quali, visto che consideriamo funzioni denite in R
m
o C
m
, sono limitati e chiusi (teorema 3.1.19).
224
Teorema 3.4.1 (di Weierstrass) Sia A R
m
(oppure A C
m
) un insie-
me compatto non vuoto, e sia f : A R una funzione continua. Allora f è
limitata in A ed assume massimo e minimo su A.
Dimostrazione Sia L = sup
A
f; può essere L = +, oppure L R. In
ogni caso dalle proprietà dellestremo superiore segue che esiste y
n
f(A)
tale che y
n
L per n : infatti, se L = +nessun n N è maggiorante
per f(A) e quindi esiste y
n
f(A) tale che y
n
> n, mentre se L R nessun
numero della forma L
1
n
è maggiorante per f(A) e quindi esiste y
n
f(A)
tale che L
1
n
< y
n
L.
Poiche y
n
f(A), per ogni n esiste x
n
A tale che f(x
n
) = y
n
. La
successione x
n
è dunque contenuta in A. Dato che A è compatto, esiste
una sottosuccessione x
n
k
estratta da x
n
che converge per k ad un
punto x A: essendo f continua, si deduce che f(x
n
k
) = y
n
k
converge a
f(x) per k .
Daltra parte, poiche y
n
k
è una sottosuccessione della successione y
n
che
convergeva a L, anche y
n
k
deve tendere a L per k . Per lunicità del
limite (esercizio 3.3.9), si ha L = f(x). In particolare, essendo f a valori in
R, si ha L R e dunque f è limitata superiormente; inoltre L f(A), cioè
L è un massimo.
In modo del tutto analogo si prova che f è limitata inferiormente e che ha
minimo in A.
Osservazioni 3.4.2 (1) Il pun-
to di massimo, cos` come quello
di minimo, non è necessariamente
unico!
(2) Il teorema di Weierstrass è
falso se togliamo una qualunque
delle sue ipotesi:
linsieme A = [0, [ è chiuso ma non limitato e la funzione f(x) = x è
continua in A ma non limitata;
linsieme A =]0, 1] è limitato ma non chiuso e la funzione f(x) =
1
x
è
continua ma non limitata;
nellinsieme compatto A = [0, 2] la funzione f(x) = x [x] non è
continua e non ha massimo.
225
Il risultato che segue riguarda funzioni denite su una palla B(x
0
, R) di R
m
o di C
m
.
Teorema 3.4.3 (di esistenza degli zeri) Sia f : B(x
0
, R) R una fun-
zione continua, e supponiamo che esistano a
1
, b
1
B(x
0
, R) tali che f(a
1
) <
0, f(b
1
) > 0. Allora esiste almeno un punto x B(x
0
, R) tale che f(x) = 0.
Dimostrazione Supponiamo dapprima m = 1 e B(x
0
, R) R, cosicche
B(x
0
, R) =]x
0
R, x
0
+ R[ (il fatto che tale intervallo sia aperto non ha
comunque nessuna importanza nellargomento che segue). Si ha f(a
1
) < 0 <
f(b
1
) e possiamo anche supporre che a
1
< b
1
, perche in caso contrario basta
considerare f al posto di f.
Dividiamo in due parti uguali lintervallo [a
1
, b
1
] mediante il punto medio
1
2
(a
1
+ b
1
): se f si annulla proprio in tale punto abbiamo nito e la tesi è
provata, altrimenti per uno (ed uno solo) dei due intervalli [a
1
,
1
2
(a
1
+ b
1
)],
[
1
2
(a
1
+b
1
), b
1
] si avrà la stessa situazione di partenza, ossia la f sarà negativa
nel primo estremo e positiva nel secondo. Indicheremo tale intervallo con
[a
2
, b
2
]: dunque abbiamo costruito un intervallo [a
2
, b
2
] tale che
[a
2
, b
2
] [a
1
, b
1
], b
2
a
2
=
1
2
(b
1
a
1
), f(a
2
) < 0 < f(b
2
).
In modo analogo si divide in due parti uguali lintervallo [a
2
, b
2
]: se f si
annulla nel punto medio
1
2
(a
2
+ b
2
) abbiamo nito, altrimenti si va avanti.
Ci sono due possibilità:
(1) dopo un numero nito di suddivisioni, si trova che la f si annulla proprio
nelln-simo punto medio
1
2
(a
n
+b
n
) e in tal caso la tesi è provata;
(2) per ogni n N
+
si costruisce un intervallo [a
n
, b
n
] tale che
[a
n
, b
n
] [a
n1
, b
n1
], b
n
a
n
=
1
2
(b
n1
a
n1
), f(a
n
) < 0 < f(b
n
).
Consideriamo, nel caso (2), le due successioni a
n
e b
n
: esse sono limita-
te, perche contenute in ]x
0
R, x
0
+ R[, e monotone, crescente la prima e
decrescente la seconda. Siano allora
= lim
n
a
n
, L = lim
n
b
n
:
poiche a
n
< b
n
per ogni n, sarà L; dato che b
n
a
n
= 2
n+1
(b
1
a
1
) 0,
sarà = L.
226
Poniamo x = = L e proviamo che x è il punto cercato. Dalle disuguaglianze
f(a
n
) < 0 < f(b
n
) e dalla continuità di f otteniamo, per n , f(x)
0 f(x), ossia f(x) = 0. La tesi è provata nel caso m = 1.
Se m > 1, o anche se m = 1 e B(x
0
, R) C, ci si riconduce al caso precedente
introducendo la funzione
g(t) = f(ta
1
+ (1 t)b
1
), t [0, 1].
I punti ta
1
+ (1 t)b
1
per t [0, 1] descrivono, come sappiamo (paragrafo
1.11), il segmento di estremi a
1
e b
1
: quindi sono contenuti in B(x
0
, R).
Inoltre g è continua (esercizio 3.2.1), e verica g(0) = f(b
1
) > 0, g(1) =
f(a
1
) < 0. Per la parte già dimostrata, esiste t
[0, 1] tale che g(t
) = 0;
posto allora x
= t
a
1
+(1 t
)b
1
, si ottiene x
B(x
0
, R) e f(x
) = 0. La
tesi è provata.
Osservazione 3.4.4 Il teorema di esistenza degli zeri vale in ipotesi molto
pi` u generali sullinsieme di denizione di f: basta che esso sia connesso, cioè
non fatto di due o pi` u pezzi staccati; pi` u rigorosamente, un sottoinsieme
E di R
m
o di C
m
è connesso se non è possibile trovare due aperti non vuoti e
disgiunti A e B tali che E = (AB)E. Si può far vedere che un sottoinsieme
E di R
m
o di C
m
è connesso se, dati due punti a, b E, ci si può muovere
con continuità da a a b (non necessariamente in modo rettilineo) senza mai
uscire dallinsieme E.
Se f è continua in A ma A non è connesso, il teorema 3.4.3 è ovviamente
falso: per esempio, la funzione f : [0, 1] [2, 3] R denita da
f(x) =
_
1 se 0 x 1
1 se 2 x 3
è continua, prende valori sia positivi che negativi ma non è mai nulla.
Dal teorema di esistenza degli zeri segue senza troppa fatica un risultato assai
pi` u generale:
Corollario 3.4.5 (teorema dei valori intermedi) Se A è un sottoinsie-
me connesso di R
m
o di C
m
e se f : A R è continua, allora f assume tutti
i valori compresi fra il suo estremo superiore e il suo estremo inferiore.
Dimostrazione Sia y ] inf
A
f, sup
A
f[; dobbiamo provare che esiste x
A tale che f(x) = y. Dato che inf
A
f < y < sup
A
f, per le proprietà
dellestremo superiore e dellestremo inferiore esistono a, b A tali che
inf
A
f f(a) < y < f(b) sup
A
f.
227
Poniamo ora g(x) = f(x) y: la funzione g è continua e verica g(a) < 0 <
g(b). Poiche A è connesso, per il teorema di esistenza degli zeri esiste x A
tale che g(x) = 0, ossia f(x) = y. La tesi è provata.
Siamo ora in grado di dimostrare il teorema 1.12.12 relativo alla misura
in radianti degli angoli orientati, enunciato nel paragrafo 1.12, e che qui
richiamiamo:
Teorema 1.12.12 Per ogni [0, 2[ esiste un unico numero complesso w,
di modulo unitario, tale che
(
+
(1, w)) = 2a(
+
(1, w)) = .
+
(1, w)) è bigettiva da S(0, 1) in [0, 2[ ed è surgettiva
da C0 in [0, 2[. Se w C0, il numero = (
+
(1, w)) si dice misura
in radianti dellangolo individuato dai punti 0, 1,
w
|w|
.
Dimostrazione Useremo le notazioni stabilite nel paragrafo 1.12. Poniamo
g(w) = (
+
(1, w)) = 2 a(
+
(1, w)), w
+
(1, i).
Dal corollario 1.12.11 segue che
[v w[ < [(
+
(1, v)) (
+
(1, w))[
2[v w[ v, w
+
(1, i);
ciò mostra che g :
+
(1, i) [0, /2] è continua e iniettiva. Inoltre, larco
+
(1, i) è un insieme connesso. In particolare,
g(1) = (
+
(1, 1)) = 0, g(i) = (
+
(1, i)) =
1
4
(S(0, 1)) =

2
;
quindi, per il teorema dei valori intermedi, g è anche surgettiva. Notiamo che
la disuguaglianza sopra scritta ci dice che linversa g
1
: [0, /2]
+
(1, i) è
pure continua.
+
(1, w)) è poi ben denita per ogni w S(0, 1), a
valori in [0, 2[; verichiamo che essa è ancora continua (salvo che nel punto
1) e surgettiva. A questo scopo osserviamo che, in virt` u della proposizione
1.12.10 e dellesercizio 1.12.4, per w
+
(i, 1) si ha
g(w) = (
+
(1, w)) = (
+
(1, i)) +(
+
(i, w)) =
=

2
+(
+
(1, iw)) =

2
+g(iw).
228
Poiche iw
+
(1, i), per quanto già dimostrato (e per la continuità di
w iw) la funzione w g(iw) è continua, e vale /2 nel punto w = i;
dunque g è continua su
+
(1, 1) e, in particolare, g(1) = .
Se, inne, w
+
(1, 1) 1, allora
g(w) = (
+
(1, w)) = (
+
(1, 1)) +(
+
(1, w)) =
= +(
+
(1, w)) = +g(w);
essendo w
+
(1, 1), la funzione w g(w) è continua; dunque anche
g : S(0, 1) 1 [0, 2[ è continua. Poiche inoltre g assume il valore nel
punto w = 1, si ricava
sup
wS(0,1)
g(w) = sup
z
+
(1,1)
g(z) + = 2.
Ciò prova che g : S(0, 1) [0, 2[ è surgettiva. Osserviamo che
lim
w
(1,i), w1
g(w) = 2, lim
w
+
(1,i), w1
g(w) = 0,
cosicche g è discontinua nel punto 1 S(0, 1).
Il teorema 1.12.12 è completamente dimostrato.
Funzioni continue invertibili
Consideriamo una funzione f : A R R continua e iniettiva; ci chiediamo
se anche la funzione inversa f
1
: f(A) A è continua.
Si vede facilmente che in generale
la risposta è no: ad esempio, sia
A = [0, 1]]2, 3] e sia
f(x) =
_
x se x [0, 1]
x 1 se x ]2, 3].
Chiaramente, f è iniettiva e
f(A) = [1, 2]. Determiniamo la
funzione inversa f
1
risolvendo ri-
spetto a x lequazione y = f(x).
Si ha
y = f(x) =
_
x se x [0, 1]
x 1 se x ]2, 3].
x =
_
y se y [0, 1]
y + 1 se y ]1, 2],
229
e il graco di f
1
si ottiene per
simmetria rispetto alla bisettrice
y = x (osservazione 1.3.1). Si ri-
conosce allora che f è continua
in tutti i punti, compreso x = 1,
mentre f
1
è discontinua nel pun-
to x = f(1) = 1.
Sotto opportune ipotesi sullinsie-
me A, però, lesistenza e la con-
tinuità di f
1
sono garantite dal
seguente risultato.
Teorema 3.4.6 Sia I un intervallo di R (limitato o no). Se f : I R è
continua e iniettiva, allora:
(i) f è strettamente monotona;
(ii) f(I) è un intervallo;
(iii) f
1
: f(I) I è ben denita e continua.
Dimostrazione (i) Sia [a, b] un arbitrario sottointervallo di I. Confron-
tiamo f(a) e f(b): se si ha f(a) < f(b), proveremo che f è strettamente
crescente in [a, b], mentre se f(a) > f(b) proveremo che f è strettamente
decrescente in [a, b]; leventualità f(a) = f(b) è vietata dalliniettività di f.
Supponiamo ad esempio f(a) < f(b) (il caso opposto è del tutto analogo).
Siano c, d punti di [a, b] tali che c < d e ammettiamo, per assurdo, che sia
f(c) f(d). Consideriamo le funzioni (ovviamente continue)
x(t) = a +t(c a), y(t) = b +t(d b), t [0, 1].
Osserviamo che
f(x(0)) = f(a) < f(b) = f(y(0)), f(x(1)) = f(c) f(d) = f(y(1)).
Quindi, introdotta la funzione
F(t) = f(y(t)) f(x(t)), t [0, 1],
F è una funzione continua (esercizio 3.2.1) tale che F(0) > 0 F(1). Per
il teorema di esistenza degli zeri (teorema 3.4.3), esisterà allora un punto
230
t
]0, 1] tale che F(t
) = 0, ossia f(x(t
)) = f(y(t
)): essendo f iniettiva si

deduce x(t
) = y(t
), cioè t
(d c) + (1 t
)(b a) = 0. Dato che b > a e

d > c, ciò è assurdo.
Pertanto f(c) < f(d) e dunque f è strettamente crescente in [a, b].
Se ora [a
1
, b
1
] è un intervallo tale che [a, b] [a
1
, b
1
] I, la f è strettamente
crescente anche in [a
1
, b
1
]: se infatti fra a
1
e a vi fosse un punto x
1
con
f(x
1
) f(a), per il teorema dei valori intermedi f assumerebbe lo stesso
valore in un altro punto x a, violando cos` liniettività. Per larbitrarietà
di [a
1
, b
1
] I, si ottiene allora che f è strettamente crescente in I.
(ii) Per il teorema dei valori intermedi (corollario 3.4.5) si ha
_
inf
I
f, sup
I
f
_
f(I),
mentre, per denizione di estremo superiore ed estremo inferiore,
f(I)
_
inf
I
f, sup
I
f
_
.
Dunque f(I) è un intervallo (che indicheremo con J) di estremi inf
I
f e
sup
I
f: esso può comprendere, o no, uno o entrambi gli estremi.
(iii) Anzitutto, f
1
è ovviamente ben denita su J ed è una funzione stretta-
mente monotona (crescente se f è crescente, decrescente se f è decrescente),
e f
1
(J) = I. Sia y
0
un punto interno a J, e poniamo
= lim
yy
0
f
1
(y), L = lim
yy
+
0
f
1
(y);
questi limiti esistono certamente poiche f
1
è monotona. Inoltre si ha
(esercizio 3.3.19)
f
1
(y
0
) L se f è crescente,
f
1
(y
0
) L se f è decrescente.
Dimostriamo che = L: dato che f è continua nei punti e L, si ha
f() = lim
yy
0
f(f
1
(y)) = lim
yy
0
y = y
0
, f(L) = lim
yy
+
0
f(f
1
(y)) = lim
yy
+
0
y = y
0
,
cosicche f() = f(L) e dunque, per liniettività, = L = f
1
(y
0
), cioè
lim
yy
0
f
1
(y) = f
1
(y
0
)).
231
Quindi f
1
è continua in y
0
.
Se y
0
è un estremo di J, largomento sopra esposto si ripete in modo ancor
pi` u semplice.
Osservazione 3.4.7 Il teorema precedente è di gran lunga il caso pi` u im-
portante, ma la continuità di f
1
si ottiene anche nel caso in cui la funzio-
ne continua ed iniettiva f sia denita su un insieme A compatto: vedere
lesercizio 3.4.1.
Esempi 3.4.8 (1) La funzione f(x) = sin x è continua ma non certo iniet-
tiva; tuttavia la sua restrizione allintervallo [/2, /2] è iniettiva, essendo
strettamente crescente. La funzione inversa di tale restrizione si chiama ar-
coseno e si scrive f
1
(y) = arcsin y. Essa è denita su [1, 1], è a valori in
[/2, /2] ed è continua per il teorema 3.4.6. Si noti che
sin(arcsin x) = x x [1, 1],
arcsin(sin x) = (1)
k
(x k) x
_
2
+k,

2
+k
, k Z.
(2) La restrizione della funzione cos x allintervallo [0, ] è continua e stret-
tamente decrescente, quindi iniettiva. Linversa di tale restrizione si chiama
arcocoseno e si scrive arccos x; essa è denita su [1, 1], è a valori in [0, ] ed
è continua per il teorema 3.4.6. Si noti che
cos(arccos x) = x x [1, 1],
arccos(cos x) = (1)
k
(x (k +
1
2
)) +

2
x [k, (k + 1)], k Z.
232
(3) La restrizione della funzione
tan x allintervallo ] /2, /2[ è
continua e strettamente crescente,
quindi iniettiva (ed anche surgetti-
va su R). Linversa di tale restrizio-
ne si chiama arcotangente e si scrive
arctan x; essa è denita su R, è a va-
lori in ] /2, /2[ ed è continua per
il teorema 3.4.6. Si noti che
tan(arctan x) = x x R,
arctan(tan x) = x k
x
_
2
+k,

2
+k
_
, k Z.
(4) Sia b > 0, b ,= 1. La funzione log
b
x, che è linversa della funzione con-
tinua b
x
, è continua per il teorema 3.4.6, ma lo sapevamo già (esempio 3.2.5
(5)).
(5) Se n N, la funzione x
2n+1
è continua e strettamente crescente su R,
dunque è iniettiva (ed anche surgettiva su R). La funzione inversa è quindi
233
denita e continua su R, a valori in R ed è la funzione radice (2n + 1)-sima:
x = y
1
2n+1
y = x
2n+1
.
La radice (2n + 1)-sima ora denita è il prolungamento a tutto R della fun-
zione y y
1
2n+1
, che fu introdotta per y 0 nel paragrafo 1.8.
Ricordiamo a questo proposito che in campo complesso le radici (2n+1)-sime
di un numero reale y sono 2n + 1: una è reale, ed è y
1
2n+1
, le altre 2n non
sono reali e sono a due a due coniugate (esercizio 1.12.23).
Esercizi 3.4
1. Sia f : R R continua e tale che
lim
x
f(x) < 0, lim
x+
f(x) > 0.
Provare che esiste x R tale che f(x) = 0.
2. Sia f una funzione continua denita in [0, 1] a valori in Q, tale che
f(0) = 23. Si calcoli f(e 2).
3. Sia f : [a, b] [a, b] continua. Si provi che f ha almeno un punto sso,
cioè esiste x
0
[a, b] tale che f(x
0
) = x
0
.
234
4. Supponiamo che la temperatura allequatore sia, ad un dato istante,
una funzione continua della longitudine. Si dimostri che esistono in-
nite coppie di punti (P, P
) situati lungo lequatore, tali che la tempe-

ratura in P e la temperatura in P
siano uguali fra loro; si provi inoltre

che una almeno di tali coppie è formata da due località diametralmente
opposte.
5. Stabilire se le seguenti funzioni sono invertibili oppure no:
(i) f(x) = x +e
x
, x R; (ii) f(x) = e
x
x, x R;
(iii) f(x) = x
2
+x, x R; (iv)f(x) = sin
x
1+|x|
, x R;
(v) f(x) = arctan
3
x, x R; (vi) f(x) = x
3
x, x R;
(vii) f(x) = sin
3
x, x [
2
,

2
], (viii) f(x) = sin x
3
, x [
2
,

2
].
6. Sia f : A R R continua e iniettiva. Se A è compatto, si provi che
f
1
è continua.
[Traccia: si mostri che per ogni y
n
nN
f(A), convergente ad un
ssato y f(A), risulta f
1
(y
n
) f
1
(y).]
7. Sia f(x) = x
3
+ x + 1, x R. Si provi che f : R R è bigettiva e si
calcoli, se esiste, il limite
lim
y+
f
1
_
3y
y + 4
_
.
8. Provare che
arcsin x + arccos x =

2
x [1, 1],
arctan x + arctan
1
x
=
_
/2 se x > 0,
/2 se x < 0.
9. Dimostrare la relazione
arctan u arctan v = arctan
u v
1 +uv
per ogni u, v R con [ arctan u arctan v[ <

2
.
[Traccia: utilizzare la formula di sottrazione per la funzione tangente.]
235
10. Provare che
arctan
1
n
2
+n + 1
= arctan
1
n
arctan
1
n + 1
n N
+
,
e calcolare di conseguenza la somma della serie
n=1
arctan
1
n
2
+n+1
.
11. (i) Trovare una funzione continua f : R R tale che per ogni c R
lequazione f(x) = c abbia esattamente tre soluzioni.
(ii) Provare che non esiste alcuna funzione continua f : R R tale
che per ogni c R lequazione f(x) = c abbia esattamente due
soluzioni.
(iii) Per quali n N è vero che esiste una funzione continua f : R R
tale che per ogni c R lequazione f(x) = c abbia esattamente n
soluzioni?
12. (i) Provare che per ogni k Z lequazione tan x = x ha nellintervallo
]k /2, k +/2[ una e una sola soluzione x
k
.
(ii) Dimostrare che
lim
k
_
x
k
k +

2
_
= 0, lim
k+
_
x
k
k

2
_
= 0.
13. (i) Provare che per ogni n N
+
i graci delle due funzioni e
x
e x
n
si incontrano nel primo quadrante in un unico punto (x
n
, y
n
), con
x
n
, y
n
]0, 1[.
(ii) Provare che la successione x
n
è crescente e che la successione
y
n
è decrescente.
(iii) Calcolare i limiti
lim
n
x
n
, lim
n
y
n
.
14. Provare che la funzione f(x) = arccos
x1
x
è iniettiva sullinsieme A dove
è denita; determinare limmagine f(A) e scrivere la funzione inversa
f
1
.
15. (i) Vericare che le relazioni
tan x =
1
x
, k < x < (k + 1), k Z,
deniscono univocamente una successione reale x
k
kZ
.
236
(ii) Provare che
0 < x
k+1
x
k
< k N, lim
k+
(x
k
k) = 0.
(iii) Per quali > 0 la serie
k=0
(x
k
k)
è convergente?
3.5 Asintoti
Sia [a, b] un intervallo di R e sia x
0
]a, b[. Data una funzione f : [a, b]
x
0
R, si dice che la retta di equazione x = x
0
è un asintoto verticale di
f per x x
+
0
, oppure per x x
0
, se risulta
lim
xx
+
0
f(x) = , oppure lim
xx
0
f(x) = .
Data una funzione reale f denita sulla semiretta ] , a], oppure sulla
semiretta [a, +[, si dice che la retta di equazione y = px + q è un asintoto
obliquo di f (ovvero un asintoto orizzontale di f quando p = 0) per x ,
oppure per x +, se risulta
lim
x
[f(x) px q] = 0, oppure lim
x+
[f(x) px q] = 0.
Per scoprire se una data funzione f ha un asintoto obliquo, ad esempio, per
x +, bisogna controllare lesistenza di tre limiti, e cioè vericare se:
(i) lim
x+
f(x) = ;
(ii) lim
x+
f(x)
x
= p R 0;
(iii) lim
x+
[f(x) px] = q R.
Se i tre limiti esistono, allora lasintoto è la retta di equazione y = px + q.
Viceversa, se f ha, per x +, lasintoto obliquo di equazione y = px +q,
allora ovviamente valgono (i), (ii) e (iii).
Invece, per vedere se la funzione f ha un asintoto orizzontale per x +,
è necessario e suciente che si abbia
lim
x+
f(x) = L R.
237
Esercizi 3.5
1. Determinare, se esistono, gli asintoti delle seguenti funzioni:
(i)
1 +x
2
, (ii) log x, (iii)
x
4
+ 1
x
3
, (iv) arcsin
x
2
x
2
+ 1
,
(v)
_
x + 1
x 1
, (vi) e
1/x
, (vii) [x 2[, (viii) arctan
e
x
e
x
1
,
(ix)
sin x
x
, (x) x log x, (xi)
_
[x
2
1[, (xii) arccos e
2|x|+x
.
2. Sia f : [a, +[ R tale che
f(x)
x
p per x +, con p R 0.
La funzione f ha necessariamente un asintoto obliquo per x +?
238
Capitolo 4
Calcolo dierenziale
4.1 La derivata
Sia f :]a, b[R una funzione e sia G R
2
il suo graco:
G = (x, y) R
2
: x [a, b], y = f(x).
Fissiamo x
0
]a, b[: vogliamo dare un
signicato preciso alla nozione intui-
tiva di retta tangente a G nel punto
P = (x
0
, f(x
0
)) (sempre che tale ret-
ta esista).
Consideriamo un altro punto Q = (x
0
+
h, f(x
0
+ h)) G, ove h è un numero
reale abbastanza piccolo da far s` che
x
0
+h ]a, b[. Tracciamo la retta secan-
te il graco passante per P e Q: come
si verica facilmente, essa ha equazione
y = f(x
0
) +
f(x
0
+h) f(x
0
)
h
(xx
0
).
Al tendere di h a 0, se f è continua in x
0
il punto Q tende, lungo il graco
G, al punto P; dunque lintuizione geometrica ci dice che la retta secante
tende verso una posizione limite che è quella della retta tangente a G in
P; ma lintuizione geometrica ci dice anche che questa posizione limite può
non esistere.
239
Diamo allora la seguente denizione che ci permetterà di attribuire un signi-
cato preciso al termine retta tangente.
Denizione 4.1.1 Sia f :]a, b[ R e sia x
0
]a, b[. Diciamo che f è
derivabile nel punto x
0
se il rapporto incrementale di f in x
0
, ossia la
quantità
f(x
0
+h) f(x
0
)
h
,
ha limite nito per h 0. Tale limite si chiama derivata di f in x
0
e si
indica col simbolo f
(x
0
), oppure Df(x
0
):
f
(x
0
) = Df(x
0
) = lim
h0
f(x
0
+h) f(x
0
)
h
.
Diciamo poi che f è derivabile in ]a, b[ se f è derivabile in ogni punto di
]a, b[.
Osservazioni 4.1.2 (1) Con notazione equivalente, f è derivabile nel punto
x
0
se e solo se esiste nito il limite
lim
xx
0
f(x) f(x
0
)
x x
0
.
(2) Dire che f è derivabile nel punto x
0
]a, b[ è equivalente alla seguente
aermazione: esistono un numero reale L ed una funzione h (h) denita
in un intorno U di 0, tali che
(a) lim
h0
(h) = 0, (b) f(x
0
+h) f(x
0
) = Lh +h (h) per h U.
240
Infatti se f è derivabile in x
0
basta porre L = f
(x
0
) e
(h) =
f(x
0
+h) f(x
0
)
h
f
(x
0
)
per ottenere (a) e (b) con U =]a, b[; viceversa se valgono (a) e (b) allora,
dividendo in (b) per h e passando al limite per h 0, in virt` u di (a) si
ottiene che f è derivabile in x
0
con f
(x
0
) = L.
Dallosservazione 4.1.2 (2) segue che se f è derivabile in x
0
allora lincremento
di f, ossia la quantità f(x
0
+h) f(x
0
), è somma di due addendi: il primo,
f
(x
0
)h, varia linearmente con h, mentre il secondo, h(h), è un innitesimo
di ordine superiore per h tende ancora a 0.
La quantità h (h), che tende a 0
pi` u rapidamente di h per h 0,
è lerrore che si commette volendo
approssimare, in un intorno di x
0
,
lincremento di f con la sua parte
lineare f
(x
0
)h. Questa approssi-
mazione corrisponde a sostituire
al graco di f, in un intorno di
(x
0
, f(x
0
)), quello della funzione
ane
g(x) = f(x
0
) +f
(x
0
)(x x
0
),
il cui graco è la retta per (x
0
, f(x
0
)) di coeciente angolare f
(x
0
). Si noti
che questa retta, fra tutte le rette passanti per (x
0
, f(x
0
)), è quella che rea-
lizza la miglior approssimazione rettilinea del graco di f nellintorno di tale
punto. Infatti, scelta una qualunque retta passante per (x
0
, f(x
0
)), quindi di
equazione
y = g
m
(x) = f(x
0
) +m(x x
0
)
e coeciente angolare m R, si verica facilmente che risulta
lim
xx
0
(f(x) g
m
(x)) = 0 m R,
ma che daltra parte si ha
lim
xx
0
f(x) g
m
(x)
x x
0
= f
(x
0
) m m R,
241
e che quindi
lim
xx
0
f(x) g
m
(x)
x x
0
= 0 m = f
(x
0
) g
m
(x) g(x).
Le considerazioni precedenti giusticano la seguente
Denizione 4.1.3 Sia f :]a, b[ R una funzione derivabile nel punto x
0

]a, b[. La retta di equazione y = f(x
0
) + f
(x
0
)(x x
0
) si chiama retta
tangente nel punto (x
0
, f(x
0
)).
La derivata f
(x
0
) è dunque il coeciente angolare della retta che meglio
approssima il graco di f in (x
0
, f(x
0
)), e quindi ne misura la pendenza,
ossia la rapidità con cui f cresce o decresce intorno a tale punto.
Chiarito il signicato geometrico della derivata, vediamo ora il nesso fra
derivabilità e continuità.
Proposizione 4.1.4 Sia f :]a, b[ R e sia x
0
]a, b[. Se f è derivabile in
x
0
, allora f è continua in x
0
. Il viceversa è falso.
Dimostrazione Dallosservazione 4.1.2 (2) segue subito che
lim
h0
f(x
0
+h) = lim
xx
0
f(x) = f(x
0
),
e ciò prova la continuità. Viceversa, la funzione f(x) = [x[ è continua su R,
ma scelto x
0
= 0 si ha
f(h) f(0)
h
=
[h[ 0
h
=
_
1 se h > 0
1 se h < 0,
quindi il limite del rapporto incrementale di f nel punto 0 non esiste.
Esempi 4.1.5 (1) Sia n N e consideriamo la funzione f(x) = x
n
. Per
ogni x
0
R si ha
f(x) f(x
0
)
x x
0
=
x
n
x
n
0
x x
0
=
_
_
0 se n = 0
1 se n = 1
n1
k=0
x
nk
x
k
0
se n > 1,
242
cosicche quando x x
0
ricaviamo
f
(x
0
) =
_
_
0 se n = 0
1 se n = 1
nx
n1
0
se n > 1
_
_
= nx
n1
0
n N.
In denitiva, scrivendo x al posto di x
0
, troviamo che
Dx
n
= nx
n1
x R, n N
(intendendo, nel caso x = 0 e n = 1, che la derivata vale 1).
(2) La derivata è unapplicazione lineare: ciò signica che se f e g sono due
funzioni derivabili nel punto x, e se e sono due numeri reali, allora la
funzione f +g è derivabile nel punto x e
(f +g)
(x) = f
(x) +g
(x).
In particolare, quindi, da (1) segue che ogni polinomio è derivabile in R: se
P(x) =
N
k=0
a
k
x
k
, x R,
allora
P
(x) =
N
k=1
k a
k
x
k
x R.
(3) Prodotti e quozienti di funzioni derivabili (questi ultimi, naturalmente,
nei punti dove sono deniti) sono funzioni derivabili (esercizi 4.1.2, 4.1.3 e
4.1.4).
(4) Se n N
+
, la funzione f(x) = x
n
è denita per x ,= 0 ed è derivabile
in tutti questi punti. Infatti si ha per ogni x ,= 0 e h ,= 0 tale che x +h ,= 0:
(x +h)
n
x
n
h
=
x
n
(x +h)
n
h x
n
(x +h)
n
,
e per quanto visto nellesempio (1),
lim
h0
(x +h)
n
x
n
h
= lim
h0
(x +h)
n
x
n
h

1
(x +h)
n
x
n
=
nx
n1
x
2n
,
243
ossia
Dx
n
= n x
n1
x ,= 0.
(5) Fissato k N
+
, la funzione f(x) = x
1/k
è denita per x 0 ed è
derivabile per ogni x > 0. Infatti, per tutti gli h ,= 0 tali che x +h > 0 si ha
(x +h)
1/k
x
1/k
h
=
1
k1
j=0
(x +h)
(k1j)/k
x
j/k
,
da cui
Dx
1/k
= lim
h0
(x +h)
1/k
x
1/k
h
=
1
k x
(k1)/k
=
1
k
x
1
k
1
x > 0.
(6) Sia r Q 0. La funzione f(x) = x
r
, denita per x 0 se r > 0 e
per x > 0 se r < 0, è derivabile in ogni punto x > 0. Infatti, supponiamo
dapprima r > 0: posto r = p/q, con p, q N
+
e primi fra loro, si ha per ogni
x > 0 e h ,= 0 tale che x +h > 0:
(x +h)
r
x
r
h
=
(x +h)
p/q
x
p/q
h
=
=
1
h
[(x +h)
1/q
x
1/q
]
p1
j=0
(x +h)
(p1j)/q
x
j/q
,
da cui, grazie a (5),
Dx
r
= lim
h0
(x +h)
r
x
r
h
=
1
q
x
1
q
1
p x
p1
q
=
p
q
x
p
q
1
= r x
r1
x > 0.
Se invece r < 0, possiamo scrivere, come in (4),
(x +h)
r
x
r
h
=
(x +h)
|r|
x
|r|
h
=
x
|r|
(x +h)
|r|
h(x +h)
|r|
x
|r|
da cui
lim
h0
(x +h)
r
x
r
h
=
[r[x
|r|1
x
2|r|
= [r[ x
|r|1
= r x
r1
x > 0.
Abbiamo perciò
Dx
r
= r x
r1
x > 0, r Q.
244
(7) Fissato b > 0, la funzione esponenziale f(x) = b
x
è derivabile in ogni
punto x R. Infatti per ogni h ,= 0 si ha
b
x+h
b
x
h
= b
x
b
h
1
h
,
da cui (esempio 3.3.5 (3))
Db
x
= b
x
log b x R,
e in particolare, se la base dellesponenziale è il numero b = e,
De
x
= e
x
x R.
(8) Le funzioni seno e coseno sono derivabili in ogni punto di R: infatti, per
ogni x R e h ,= 0 si ha dalle formule di prostaferesi (esercizio 1.12.8)
sin(x +h) sin x
h
=
2
h
cos
2x +h
2
sin
h
2
,
cos(x +h) cos x
h
=
2
h
sin
2x +h
2
sin
h
2
,
da cui
Dsin x = cos x x R, Dcos x = sin x x R.
Per avere un quadro completo delle tecniche di derivazione occorre imparare
a derivare le funzioni composte e le funzioni inverse. Ciò è quanto viene
esposto nei risultati che seguono.
Teorema 4.1.6 (di derivazione delle funzioni composte) Siano f :
]a, b[ R e g :]c, d[ R funzioni derivabili, tali che f(]a, b[) ]c, d[. Allora
la funzione composta g f :]a, b[R è derivabile e
(g f)
(x) = g
(f(x)) f
(x) x ]a, b[.

Dimostrazione Fissiamo x ]a, b[ e poniamo y = f(x). Poiche f è
derivabile in x, si ha per [h[ abbastanza piccolo (osservazione 4.1.2 (2))
f(x +h) f(x) = f
(x) h +h (h), ove lim

h0
(h) = 0.
245
Similmente, poiche g è derivabile in y, si ha per [k[ abbastanza piccolo
g(y +k) g(y) = g
(y) k +k (k), ove lim

k0
(k) = 0.
Fissiamo h (sucientemente piccolo), e scegliamo k = f(x +h) f(x): dato
che f è continua in x (proposizione 4.1.4), risulta k 0 quando h 0; anzi,
essendo f derivabile in x, si ha pi` u precisamente che
k
h
f
(x) non appena

h 0. Quindi
g f(x +h) g f(x) = g(f(x +h)) g(f(x)) = g(y +k) g(y) =
= g
(y) k +k (k) = g
(y)(f(x +h) f(x)) +k (k) =

= g
(f(x)) (f
(x) h +h (h)) +k (k) =

= h
_
g
(f(x)) f
(x) +g
(f(x)) (h) +
k
h
(k)
_
.
Ora, ponendo
(h) = g
(f(x)) (h) +
k
h
(k),
si ha che
lim
h0
(h) = g
(f(x)) 0 +f
(x) 0 = 0,
e pertanto abbiamo ottenuto, per [h[ sucientemente piccolo,
g f(x +h) g f(x) = g
(f(x)) f
(x) h +h (h)
con (h) 0 per h 0. La tesi segue allora allosservazione 4.1.2 (2).
Esempi 4.1.7 (1) De
x
2
= e
x
2
(2x) = 2xe
x
2
per ogni x R.
(2) D
1 +x
2
= D(1 +x
2
)
1/2
=
1
2
(1 +x
2
)
1/2
(2x) =
x
1+x
2
per ogni x R.
(3) D
_
sin
_
e
cos x
2
__
= cos
_
e
cos x
2
_
e
cos x
2
(sin x
2
) 2x per ogni x R.
Teorema 4.1.8 (di derivazione delle funzioni inverse) Sia f :]a, b[
R strettamente monotona e derivabile. Se f
(x) ,= 0 in ogni punto x ]a, b[,

allora la funzione inversa f
1
: f(]a, b[) ]a, b[ è derivabile e si ha
(f
1
)
(y) =
1
f
(f
1
(y))
y f(]a, b[).
246
Dimostrazione Ricordiamo anzitutto che f(]a, b[) è un intervallo, che de-
notiamo con J, e che f
1
è continua su J per il teorema 3.4.6, essendo per
ipotesi f derivabile e dunque continua in ]a, b[.
Ciò premesso, siano y J e k ,= 0 tale che y + k J. Allora sarà y = f(x)
e y + k = f(x + h) per opportuni punti x, x + h ]a, b[; avremo quindi
x = f
1
(y), x + h = f
1
(y + k) e dunque h = f
1
(y + k) f
1
(y); in
particolare, h ,= 0 essendo f
1
iniettiva. Potremo perciò scrivere
f
1
(y +k) f
1
(y)
k
=
h
f(x +h) f(x)
,
e notiamo che da k ,= 0 segue f(x + h) ,= f(x), quindi la scrittura ha senso.
Se k 0, la continuità di f
1
implica che h 0, da cui
h
f(x +h) f(x)

1
f
(x)
;
se ne deduce che
lim
k0
f
1
(y +k) f
1
(y)
k
=
h
f(x +h) f(x)
=
1
f
(x)
=
1
f
(f
1
(y))
e la tesi è provata.
Osservazione 4.1.9 Il teorema precedente ci dice che il coeciente ango-
lare della retta tangente al graco di f
1
(pensata come funzione della x,
dunque con x e y scambiati rispetto alle notazioni del teorema: y = f
1
(x)
invece che x = f
1
(y)), nel generico punto (f(a), a), è il reciproco del coe-
ciente angolare della retta tangente al graco di f nel punto corrispondente
(a, f(a)). Ciò è naturale, dato che i due graci sono simmetrici rispetto alla
bisettrice y = x.
247
Esempi 4.1.10 (1) La funzione sin x è bigettiva e derivabile nellintervallo
_
2
,

2
, ma la derivata si annulla agli estremi. Limmagine dellintervallo

aperto
2
,

2
_
è ] 1, 1[; quindi, per il teorema 4.1.8, la funzione arcoseno è
derivabile in ] 1, 1[ e si ha per x ] 1, 1[:
D(arcsin x) =
1
(Dsin)(arcsin x)
=
1
cos arcsin x
=
(poiche arcsin x è un numero compreso fra /2 e /2)
=
1
_
1 sin
2
arcsin x
=
1
1 x
2
.
Similmente, poiche la funzione coseno ha derivata diversa da 0 nellintervallo
]0, [ la cui immagine è ] 1, 1[, la funzione arcocoseno è derivabile in tale
intervallo e si ha per x ] 1, 1[
D(arccos x) =
1
(Dcos)(arccos x)
=
1
sin arccos x
=
(poiche arccos x è un numero compreso fra 0 e )
=
1
1 cos
2
arccos x
=
1
1 x
2
.
Tenuto conto dellesercizio 3.4.8, il secondo risultato era deducibile dal primo.
(2) Sia x R. Essendo
D(tan t) =
1
cos
2
t
= 1 + tan
2
t t
_
2
.
2
_
,
troviamo
D(arctan x) =
1
(Dtan)(arctan x)
=
1
1 + tan
2
arctan x
=
1
1 +x
2
.
(3) Sia b un numero positivo e diverso da 1. Allora per ogni x > 0 si ha,
indicando (per comodità di notazione) con exp
b
(x) la funzione esponenziale
b
x
,
D(log
b
x) =
1
(exp
b
)
(log
b
x)
=
1
b
log
b
x
log b
=
1
x log b
.
248
Ciò si poteva ottenere anche direttamente, utilizzando lesempio 3.3.12:
lim
h0
log
b
(x +h) log
b
x
h
= lim
h0
1
h
log
b
x +h
x
=
1
x
lim
h0
log
b
_
1 +
h
x
_
h
x
=
=
1
x
lim
t0
log
b
(1 +t)
t
=
1
x log b
.
Osserviamo che, in particolare, per b = e si ha
D(log x) =
1
x
x > 0.
Derivazione delle serie di potenze
Unaltra importante classe di funzioni derivabili è quella delle somme di serie
di potenze. Si ha infatti:
Teorema 4.1.11 Sia
n=0
a
n
x
n
una serie di potenze con raggio di conver-
genza R > 0. Detta f(x) la sua somma, la funzione f è derivabile in ]R, R[
e risulta
f
(x) =
n=1
n a
n
x
n1
x ] R, R[.
Dunque le serie di potenze si derivano termine a termine, come se fossero dei
polinomi.
Dimostrazione Anzitutto osserviamo che la serie
n=1
na
n
x
n1
ha ancora
raggio di convergenza R (esercizio 2.7.9). Di conseguenza, anche la serie
n=2
n(n 1)a
n
x
n2
(che interverrà nel seguito) ha raggio di convergenza
R.
Adesso, ssati x ]R, R[ e h R sucientemente piccolo in valore assoluto,
in modo che [x[ +[h[ <
1
2
([x[ +R) , calcoliamo il rapporto incrementale di f
nel punto x:
f(x +h) f(x)
h
=
1
h

n=0
a
n
[(x +h)
n
x
n
] =
(usando la formula di Newton, teorema 1.7.1)
=
1
h

n=1
a
n
_
n
k=0
_
n
k
_
x
k
h
nk
x
n
_
=
1
h

n=1
a
n
_
n1
k=0
_
n
k
_
x
k
h
nk
_
=
249
=
n=1
a
n
_
n1
k=0
_
n
k
_
x
k
h
nk1
_
(isolando nella somma interna lultimo termine, che è anche lunico
quando n = 1)
=
n=1
n a
n
x
n1
+
n=2
a
n
_
n2
k=0
_
n
k
_
x
k
h
nk1
_
.
Poniamo
(
h) =
n=2
a
n
n2
k=0
_
n
k
_
x
k
h
nk1
, [h[ <
1
2
(R [x[) :
se proveremo che (h) 0 per h 0, seguirà la tesi del teorema.
In eetti si ha
[(h)[
n=2
[a
n
[
_
n2
k=0
_
n
k
_
[x[
k
[h[
nk1
_
=
= [h[
n=2
[a
n
[
_
n2
k=0
_
n
k
_
[x[
k
[h[
nk2
_
,
e tenendo conto che per k = 0, 1, . . . , n 2 risulta
_
n
k
_
=
n(n 1)
(n k)(n k 1)
_
n 2
k
_
n(n 1)
2 1
_
n 2
k
_
,
si ottiene
[(h)[ [h[
n=2
[a
n
[
_
n2
k=0
n(n 1)
2
_
n 2
k
_
[x[
k
[h[
nk2
_
=
=
[h[
2
n=2
n(n 1)[a
n
[([x[ +[h[)
n2
[h[
2
n=2
n(n 1)[a
n
[
_
[x[ +R
2
_
n2
.
Dato che la serie allultimo membro è convergente per quanto osservato
allinizio della dimostrazione, si deduce che (h) 0 per h 0.
250
Esempi 4.1.12 (1) Dagli sviluppi in serie di potenze di e
x
, sin x, cos x
(teorema 2.7.11), derivando termine a termine si ritrovano le note formule
(esempio 4.1.5 (8))
De
x
= e
x
, Dsin x = cos x, Dcos x = sin x x R.
(2) Similmente, dagli sviluppi in serie di cosh x e sinh x (esercizio 2.7.12), si
deducono facilmente le relazioni
Dsinh x = cosh x, Dcosh x = sinh x x R,
le quali del resto seguono ancor pi` u semplicemente dalle identità
sinh x =
e
x
e
x
2
, cosh x =
e
x
+e
x
2
x R.
(3) Derivando la serie geometrica
n=0
x
n
, il teorema precedente ci dice che
n=1
nx
n1
=
n=0
Dx
n
= D
n=0
x
n
= D
1
1 x
=
1
(1 x)
2
x ] 1, 1[.
(4) Derivando la serie
n=1
nx
n1
, ancora per il teorema precedente si ha
n=2
n(n 1)x
n2
=
n=1
D(nx
n1
) = D
n=1
nx
n1
=
= D
1
(1 x)
2
=
2
(1 x)
3
x ] 1, 1[.
Iterando questo procedimento di derivazione, troviamo dopo m passi:
n=m
n(n 1) . . . (n m + 1)x
nm
=
m!
(1 x)
m+1
x ] 1, 1[.
Dividendo per m! otteniamo
n=m
_
n
m
_
x
nm
=
1
(1 x)
m+1
x ] 1, 1[,
e posto n m = h, si ha anche, equivalentemente,
h=0
_
m +h
h
_
x
h
=
1
(1 x)
m+1
x ] 1, 1[.
251
Esercizi 4.1
1. Sia f : R R una funzione pari, ossia tale che f(x) = f(x) per ogni
x R. Se f è derivabile in 0, si provi che f
(0) = 0.
2. Si provi che se f e g sono funzioni derivabili in x
0
, allora fg è derivabile
in x
0
e
(fg)
(x
0
) = f
(x
0
)g(x
0
) +f(x
0
)g
(x
0
).
[Traccia: si scriva il rapporto incrementale di fg in x
0
nella forma
f(x)f(x
0
)
xx
0
g(x) +f(x
0
)
g(x)g(x
0
)
xx
0
.]
3. Sia g derivabile in x
0
con g(x
0
) ,= 0. Si provi che
1
g
è derivabile in x
0
e
_
1
g
_
(x
0
) =
g
(x
0
)
g(x
0
)
2
.
4. Siano f e g funzioni derivabili in x
0
con g(x
0
) ,= 0. Si provi che
f
g
è
derivabile in x
0
e
_
f
g
_
(x
0
) =
f
(x
0
)g(x
0
) f(x
0
)g
(x
0
)
g(x
0
)
2
.
5. Data la funzione
f(x) =
_
x
2
se x 4
ax +b se x < 4,
determinare a, b R in modo che f sia derivabile nel punto x
0
= 4.
6. Sia f derivabile in ]a, b[. Si scriva lequazione della retta perpendicolare
al graco di f nel punto (x
0
, f(x
0
)).
7. Sia f derivabile in ]a, b[. Provare che la funzione g(x) = f(x + ) è
derivabile in
,
b
_
e che
g
(x) = f
(x +) x
_
a
,
b
_
.
252
8. Sia f : [0, [ R una funzione continua. Consideriamo il prolunga-
mento pari di f, denito da
F(x) =
_
f(x) se x 0,
f(x) se x < 0,
e il prolungamento dispari di f, denito da
G(x) =
_
f(x) se x 0,
f(x) se x < 0.
Provare che:
(i) F è continua su R;
(ii) F è derivabile in 0 se e solo se
lim
h0
+
f(h) f(0)
h
= 0,
e in tal caso F
(0) = 0;
(iii) G è continua in 0 se e solo se f(0) = 0;
(iv) G è derivabile in 0 se e solo se f(0) = 0 e inoltre
lim
h0
+
f(h) f(0)
h
= L R,
e in tal caso G
(0) = L.
9. Scrivere la derivata delle seguenti funzioni, nei punti dove essa esiste:
(i) f(x) = sin
x, (ii) f(x) = x
2
x[x[,
(iii) f(x) =
x
2
4, (iv) f(x) = log
x
3,
(v) f(x) = x[x
2
1[, (vi) f(x) = arcsin [2x [,
(vii) f(x) = e
|x|
, (viii) f(x) = [ cos x[,
(ix) f(x) = [[x + 2[ [x
3
[[, (x) f(x) =
_
1
_
[x[.
253
10. Le funzioni
f(x) = (x 2[x[)
2
, g(x) =
_
x sin
1
x
se x ,= 0
0 se x = 0
sono derivabili in R?
11. Sia f :]a, b[R monotona crescente e derivabile; si provi che f
(x) 0
per ogni x R. Se f è strettamente crescente, è vero che f
(x) > 0 in
R?
12. Si provi che f(x) = 4x + log x, x > 0, è strettamente crescente ed ha
inversa derivabile, e si calcoli (f
1
)
(4).
13. Si verichi che la funzione sinh x è bigettiva su R e se ne scriva la funzio-
ne inversa (che si chiama settore seno iperbolico per motivi che saranno
chiari quando sapremo fare gli integrali, e si indica con settsinhy). Si
provi poi che
D(settsinh y) =
1
_
1 +y
2
y R.
14. Si verichi che la restrizione della funzione cosh x allintervallo [0, +[
è bigettiva fra [0, +[ e [1, +[, e se ne scriva la funzione inversa (che
si chiama settore coseno iperbolico e si indica con settcosh y). Si provi
poi che
D(settcosh y) =
1
_
y
2
1
y > 1.
15. Calcolare, dove ha senso, la derivata delle seguenti funzioni:
(i) f(x) = x
x
, (ii) f(x) = (x log x)
sin
x
,
(iii) f(x) = log sin
x, (iv) f(x) = 3
3
x
,
(v) f(x) = arccos
_
1x
2
x
2
, (vi) f(x) = log [ log [x[[,
(vii) f(x) = x
1/x
, (viii) f(x) =
sin x x cos x
cos x +x sin x
,
(ix) f(x) = log
x
(2
x
x
2
), (x) f(x) = arctan
_
1cos x
1+cos x
.
254
16. Scrivere lequazione della tangente allellisse denita da
x
2
a
2
+
y
2
b
2
= 1
(ove a e b sono ssati numeri reali non nulli) nel generico punto (x
0
, y
0
).
17. Scrivere lequazione della tangente alliperbole denita da
x
2
a
2

y
2
b
2
= 1
(ove a e b sono ssati numeri reali non nulli) nel generico punto (x
0
, y
0
).
18. Scrivere lequazione della tangente alla parabola denita da
y ax
2
= 0
(ove a è un ssato numero reale) nel generico punto (x
0
, y
0
).
19. Si provi che per ogni a R lequazione x
3
+x
5
= a ha ununica soluzione
reale x = x
a
. Si provi poi che la funzione g(a) = x
a
è continua su R,
e si dica in quali punti è derivabile. Si calcolino inne, se esistono, i
valori g
(2) e g
(2).
4.2 Derivate parziali
Vogliamo estendere loperazione di derivazione alle funzioni di pi` u variabili.
Se A è un aperto di R
m
e f : A R è una funzione, il graco di f è un
sottoinsieme di R
m+1
: vorremmo determinare quali condizioni assicurano che
esso sia dotato di piano tangente (m-dimensionale) in un suo punto.
Denizione 4.2.1 Sia A un aperto di R
m
, sia x
0
A, sia f : A R. La
derivata parziale i-sima di f nel punto x
0
(i = 1, . . . , m) è il numero reale
lim
h0
f(x
0
+he
i
) f(x
0
)
h
(ove e
i
è il vettore con tutte le componenti nulle tranne la i-sima che vale 1),
sempre che tale limite esista nito. Indicheremo le derivate parziali di f in
x
0
con uno qualunque dei simboli
f
x
i
(x
0
), D
i
f(x
0
), f
x
i (x
0
) (i = 1, . . . , m).
255
Le regole di calcolo per le derivate parziali sono semplicissime: basta conside-
rare le altre variabili (quelle rispetto alle quali non si deriva) come costanti.
Esempio 4.2.2 Per ogni (x, y) R
2
con [x[ > [y[ si ha
x
_
x
2
y
2
=
x
_
x
2
y
2
,

y
_
x
2
y
2
=
y
_
x
2
y
2
.
Sfortunatamente, a dierenza di ciò che accade con le funzioni di una sola
variabile, una funzione può avere le derivate parziali in un punto senza essere
continua in quel punto. La ragione è che lesistenza di D
1
f(x
0
),. . . ,D
m
f(x
0
)
fornisce informazioni sul comportamento della restrizione di f alle rette pa-
rallele agli assi x
1
,. . . ,x
m
e passanti per x
0
; daltra parte, come sappiamo
(esercizi 3.3.21 e 3.3.22), il comportamento di f può essere molto dierente
se ci si avvicina a x
0
da unaltra direzione.
Esempio 4.2.3 Consideriamo in R
2
la parabola di equazione y = x
2
: posto
G = (x, y) R
2
: 0 < y < x
2
, H = (x, y) R
2
: y x
2
,
L = (x, y) R
2
: y 0,
ed osservato che G è disgiunto da H L e che G H L = R
2
, deniamo
f(x, y) =
_
1 se (x, y) G
0 se (x, y) H L.
Questa funzione non è continua nello-
rigine, poiche
f(0, 0) = 0, f
_
1
n
,
1
n
3
_
= 1 n N
+
.
Tuttavia le due derivate parziali di f
nellorigine esistono:
f
x
(0, 0) = lim
h0
f(h, 0) f(0, 0)
h
= 0,
f
y
(0, 0) = lim
h0
f(0, h) f(0, 0)
h
= 0.
Qualè, allora, lestensione giusta della nozione di derivata al caso di funzio-
ni di pi` u variabili? Sotto quali ipotesi il graco di una funzione di 2,3,. . . ,m
variabili ha piano tangente in un suo punto?
256
m
0
A.
Diciamo che f è dierenziabile nel punto x
0
se esiste a R
m
tale che
lim
h0
f(x
0
+h) f(x
0
) a h
[h[
m
= 0.
Diciamo che f è dierenziabile in A se è dierenziabile in ogni punto di A.
Osserviamo che in questa denizione lincremento h è un (piccolo) vettore
non nullo di R
m
di direzione arbitraria: dunque linformazione fornita sul
comportamento di f intorno al punto x
0
è ben pi` u completa di quella fornita
dallesistenza delle derivate parziali. E infatti:
Proposizione 4.2.5 Sia A un aperto di R
m
0
A.
Se f è dierenziabile in x
0
, allora:
(i) f è continua in x
0
(e il viceversa è falso);
(ii) esistono le derivate parziali D
i
f(x
0
) e si ha
D
i
f(x
0
) = a
i
, i = 1, . . . , m
(e il viceversa è falso).
Di conseguenza, il vettore a nella denizione 4.2.4 è univocamente determi-
nato (quando esiste).
Dimostrazione (i) Si ha
f(x
0
+h) f(x
0
) = [f(x
0
+h) f(x
0
) a h] +a h;
per h 0 il primo termine è innitesimo a causa della dierenziabilità,
mentre il secondo è innitesimo per la disuguaglianza di Cauchy-Schwarz
(proposizione 1.9.3). Quindi lim
h0
[f(x
0
+h)f(x
0
)] = 0, ossia f è continua
in x
0
.
(ii) Dalla denizione di dierenziabilità, prendendo h = t e
i
, si ricava
lim
t0
f(x
0
+t e
i
) f(x
0
) t a e
i
[t[
= 0;
moltiplicando per la quantità limitata
|t|
t
(cioè per 1), si ottiene
D
i
f(x
0
) = lim
t0
f(x
0
+t e
i
) f(x
0
)
t
= a e
i
, i = 1, . . . , m.
257
La funzione f(x) = [x[
m
è continua su tutto R
m
(in virt` u della disuguaglianza
[[x[
m
[x
0
[
m
[ [xx
0
[
m
, a sua volta conseguenza della proprietà triangolare
della norma), ma non è dierenziabile nellorigine: infatti, se esistesse a R
m
tale che
f(h) f(0) a h
[h[
m
=
[h[
m
a h
[h[
m
= 1 a
h
[h[
m
0 per h 0,
scegliendo h = te
i
con t > 0 otterremmo a
i
= 1, mentre scegliendo h = te
i
con t < 0 dedurremmo a
i
= 1. Ciò è contraddittorio e dunque il viceversa
di (i) è falso.
La funzione dellesempio 4.2.3 mostra che il viceversa di (ii) è anchesso falso:
tale funzione infatti ha le derivate parziali in (0, 0) ma, non essendo continua
in tale punto, a causa di (i) non può essere ivi dierenziabile.
Denizione 4.2.6 Se f : A R ha le derivate parziali nel punto x
0
, il
vettore
_
f
x
1
(x
0
), . . . ,
f
x
m
(x
0
)
_
R
m
si chiama gradiente di f nel punto x
0
e si indica con gradf(x
0
), o con
f(x
0
).
Osservazione 4.2.7 La condizione che f sia dierenziabile in x
0
equivale
alla proprietà seguente: esiste una funzione (h), denita in un intorno U di
0 e innitesima per h 0, tale che
f(x
0
+h) f(x
0
) gradf(x
0
) h = [h[
m
(h) h U.
Si noti che quando m = 1 la dierenziabilità in un punto x
0
equivale alla
derivabilità in x
0
(osservazione 4.1.2 (2)); in tal caso il gradiente è un vettore
a una sola componente, cioè una quantità scalare (vale a dire, è un numero:
precisamente il numero f
(x
0
)).
Piano tangente
La nozione di dierenziabilità è ciò che ci vuole anche il graco di una
funzione abbia piano tangente.
258
m
, sia f : A R, e supponiamo
che f sia dierenziabile in un punto x
0
A. Il piano (m-dimensionale) in
R
m+1
, passante per (x
0
, f(x
0
)), di equazione
x
m+1
= f(x
0
) + gradf(x
0
) (x x
0
)
è detto piano tangente al graco di f nel punto (x
0
, f(x
0
)).
Osservazione 4.2.9 Laggettivo tangente nella denizione è giusticato
dal fatto seguente: il generico piano passante per (x
0
, f(x
0
)) ha equazione
x
m+1
=
a
(x) = f(x
0
) +a (x x
0
)
con a ssato vettore di R
m
. Quindi, per ciascuno di tali piani, ossia per ogni
a R
m
, vale la relazione
lim
xx
0
[f(x)
a
(x)] = 0.
Il piano tangente è lunico fra questi piani per il quale vale la condizione pi` u
forte
lim
xx
0
f(x)
a
(x)
[x x
0
[
m
= 0.
Ciò è conseguenza della proposizione 4.2.5 (ii).
Esempio 4.2.10 Scriviamo lequazione del piano tangente al graco della
funzione
f(x, y) = x
2
+y
2
nel punto (1, 2, f(1, 2)). Si ha
f(1, 2) = 5, e inoltre
f
x
(x, y) = 2x,
f
y
(x, y) = 2y,
da cui
f
x
(1, 2) = 2,
f
y
(1, 2) =
4. Ne deriva che il piano cercato ha
equazione
z = 5 2(x + 1) + 4(y 2),
ovvero z = 2x + 4y 5.
259
Derivate direzionali
Le derivate parziali di una funzione f in un punto x
0
sono i limiti dei rapporti
incrementali delle restrizioni di f alle rette per x
0
parallele agli assi coordi-
nati; ma queste m direzioni non hanno nulla di speciale rispetto alle innite
altre direzioni, ciascuna delle quali è individuata da un vettore v R
m
di
norma unitaria (gli assi cartesiani corrispondono ai vettori v = e
i
). La retta
per x
0
parallela al vettore v è linsieme dei punti di R
m
di coordinate
x = x
0
+tv, t R.
m
, sia f : A R, sia x
0
A. La
derivata direzionale di f in x
0
secondo la direzione v (con v R 0) è il
numero reale
lim
t0
f(x
0
+tv) f(x
0
)
t
,
se tale limite esiste nito. Essa si indica con i simboli
f
v
(x
0
), D
v
f(x
0
).
260
La derivata D
v
f(x
0
) rappresenta la derivata in x
0
della restrizione di f alla
retta per x
0
parallela a v: essa dunque rappresenta la pendenza, nel punto
(x
0
, f(x
0
)), del graco di tale restrizione, cioè dellintersezione del graco di
f con il piano parallelo allasse x
m+1
che contiene la retta per x
0
parallela a
v.
Osservazioni 4.2.12 (1) Se f è dierenziabile in x
0
allora esiste in x
0
la
derivata di f secondo ogni direzione v, e si ha
f
v
(x
0
) = gradf(x
0
) v
(esercizio 4.2.8).
(2) Lesistenza di tutte le derivate direzionali di f in x
0
non implica la
dierenziabilità di f in x
0
. Ciò segue nuovamente dallesempio 4.2.3: si vede
facilmente che quella funzione, discontinua in (0, 0), ha in tale punto tutte
le derivate direzionali nulle. Il motivo è che le sue discontinuità hanno luogo
lungo la parabola y = x
2
, la quale attraversa tutte le rette per (0, 0) prima
che queste raggiungano lorigine.
(3) La nozione di derivata direzionale ha senso per ogni vettore v R
m
0,
ma è particolarmente signicativa quando v è una direzione unitaria, ossia
quando [v[
m
= 1. Si noti che se v è un vettore unitario e R 0, dalla
denizione 4.2.11 segue subito che
f
(v)
=
f
v
.
Esempio 4.2.13 La funzione f(x, y) =
_
x
2
y
2
ha derivate parziali nel-
laperto A = (x, y) R
2
: [x[ > [y[. Fissato v = (
1
5
,
2
5
), calcoliamo
D
v
f in un generico punto (x, y) A: si ha
D
v
f(x, y) = gradf(x, y) v =
1
5
f
x
(x, y)
2
5
f
y
(x, y) =
=
1
5
x
_
x
2
y
2
5
_
y
_
x
2
y
2
_
=
1
5
x + 2y
_
x
2
y
2
.
261
Curve di livello
Sia f : A R una funzione dierenziabile nellaperto Adi R
m
. Consideriamo
le curve di livello di f, cioè gli insiemi (eventualmente, ma non sempre, vuoti)
Z
c
= x A : f(x) = c.
In realtà si tratta di curve vere e proprie solo quando m = 2, ossia f è una
funzione di due sole variabili; altrimenti si dovrebbe parlare di superci di
livello ((m1)-dimensionali).
Vogliamo far vedere che se Z
c
è non vuoto e se il gradiente di f è non nullo nei
punti di Z
c
, allora in tali punti esiste il piano (m1)-dimensionale tangente
a Z
c
e tale piano è ortogonale al gradiente di f (se m = 2 esisterà ovviamente
la retta tangente a Z
c
, che sarà ortogonale a gradf).
Anzitutto, osserviamo che fra tutti i vettori unitari v, la derivata direzio-
nale D
v
f(x
0
) è massima quando v ha direzione e verso coincidenti con
gradf(x
0
), ed è minima quando v ha direzione coincidente con gradf(x
0
)
ma verso opposto: infatti, dallosservazione 4.2.12 (1) e dalla disuguaglianza
di Cauchy-Schwarz segue che
[D
v
f(x)[ = [gradf(x) v[ [gradf(x)[
m
v R
m
con [v[
m
= 1,
e si ha [D
v
f(x)[ = [gradf(x)[
m
scegliendo rispettivamente
v =
gradf(x)
[gradf(x)[
m
e v =
gradf(x)
[gradf(x)[
m
.
Dunque, sempre che gradf(x) ,= 0, la direzione individuata da questo vettore
è quella di massima pendenza del graco di f nel punto (x, f(x)).
Ciò premesso, ssiamo x
0
Z
c
e consideriamo un qualunque piano (m
1)-dimensionale passante per x
0
, quindi di equazione
a (x x
0
) = 0,
con a R
m
0. Se x è un altro punto di Z
c
, la sua distanza dal piano ,
che denotiamo con d(x, ), è data da
d(x, ) = inf[x
x[
m
: x
= [x x
0
[
m
[ cos [,
ove è langolo fra i vettori x x
0
e a, ossia (proposizione 1.12.19)
cos =
(x x
0
) a
[x x
0
[
m
[a[
m
;
262
quindi
d(x, ) =
[(x x
0
) a[
[a[
m
.
Se ne deduce che quando x Z
c
e x x
0
si ha
d(x, ) 0 a R
m
.
Ma se in particolare si sceglie a = gradf(x
0
), cosicche è il piano per x
0
ortogonale al gradiente di f in x
0
, allora
d(x, ) =
[(x x
0
) gradf(x
0
)[
[gradf(x
0
)[
m
.
Daltra parte, poiche f è dierenziabile in x
0
si ha
f(x) f(x
0
) = gradf(x
0
) (x x
0
) +(x x
0
),
ove la funzione è denita in un intorno di 0 e verica
lim
h0
(h)
[h[
m
= 0,
da cui, essendo f(x) = f(x
0
) = c, otteniamo
d(x, )
[x x
0
[
m
=
[(x x
0
) gradf(x
0
)[
[x x
0
[
m
[gradf(x
0
)[
m
=
=
[(x x
0
)[
[x x
0
[
m
[gradf(x
0
)[
m
0 per x Z
c
e x x
0
.
Pertanto se a = gradf(x
0
) non solo la distanza fra x e è innitesima quan-
263
do x x
0
in Z
c
, ma addirittura tale distanza resta innitesima quando viene
divisa per [x x
0
[
m
. Ciò mostra, in accordo con losservazione 4.2.9, che il
piano (m1)-dimensionale per x
0
perpendicolare a gradf(x
0
) è il piano tan-
gente a Z
c
in x
0
.
In particolare, gradf(x
0
) è ortogonale a Z
c
in x
0
; di conseguenza, se v è una
direzione tangente alla curva di livello Z
c
nel punto x Z
c
, si ha
f
v
(x) = gradf(x) v = 0
in quanto, come abbiamo visto, v è ortogonale a gradf(x). Ciò corrisponde
allintuizione: se ci muoviamo lungo una curva di livello, il valore di f resta
costante e quindi la derivata in una direzione tangente a tale curva deve
essere nulla.
Esercizi 4.2
1. Determinare i punti (x, y) R
2
in cui esistono le derivate parziali delle
seguenti funzioni:
(i) f(x, y) = [xy[, (ii) f(x, y) = [x y[(x +y),
(iii) f(x, y) =
_
x
2
+[y[, (iv) f(x, y) = x arcsin xy,
(v) f(x, y) = log
_
1 +
xy
_
, (vi) f(x, y) = sin
1
xy
,
(vii) f(x, y) = y
x
+x
y
, (viii) f(x, y) = arctan
x +y
x y
,
(ix) f(x, y) =
xy
x
2
+y
2
, (x) f(x, y) = tan e
|xy|
.
2. Determinare i punti (x, y) R
2
in cui le seguenti funzioni sono die-
renziabili:
(i) f(x, y) = [ log x
2
y[, (ii) f(x, y) =
_
_
_
xy
x
2
+y
2
se (x, y) ,= (0, 0)
0 se (x, y) = (0, 0),
(iii) f(x, y) = [xy[, (iv) f(x, y) = x
_
1 +[ sin y[.
3. Per quali > 0 la funzione [xy[
è dierenziabile in (0, 0)?

264
4. Per quali , > 0 la funzione
f(x, y) =
_
_
[x[
[y[
x
2
+y
2
se (x, y) ,= (0, 0)
0 se (x, y) = (0, 0)
è dierenziabile in (0, 0)?
5. Scrivere le equazioni dei piani tangenti ai graci delle seguenti funzioni
nei punti a anco indicati:
(i) f(x, y) = arctan(x + 2y) in
_
1, 0,

4
_
,
(ii) f(x, y) = sin x cos y in
_
3
,
6
,
3
4
_
.
6. Determinare i punti del graco di f(x, y) = x
2
y
2
tali che il piano
tangente in tali punti passi per il punto (0, 0, 4).
7. Sia f : R
m
R denita da
f(x) = [x[
4
m
3x v,
ove v =
m
i=1
e
i
= (1, 1, . . . , 1). Si provi che f è dierenziabile in R
m
e
se ne calcolino le derivate parziali D
i
f.
8. (i) Provare che se f è una funzione dierenziabile nel punto x
0
allora
esiste
f
v
(x
0
) per ogni v R
m
0 e che
f
v
(x
0
) = gradf(x
0
) v.
(ii) Si calcolino le derivate direzionali sotto specicate:
(a) D
v
(x +y)
3
, ove v =
_
1
2
,
1
2
_
;
(b) D
v
x b, ove v = b (con b ,= 0).
9. Disegnare approssimativamente le curve di livello delle seguenti funzio-
ni:
(i) f(x, y) = x
2
y
2
, (ii) f(x, y) = e
xy
2
,
(iii) f(x, y) = sin(x
2
+y
2
), (iv) f(x, y) =
xy
x
2
+y
2
,
(v) f(x, y) =
y
2
x
2
y
2
+x
2
, (vi) f(x, y) = log
[x[
[y[
.
265
4.3 Proprietà delle funzioni derivabili
Esponiamo alcuni risultati relativi a funzioni derivabili denite su un inter-
vallo di R, risultati che, come vedremo, hanno svariate applicazioni.
Teorema 4.3.1 (di Rolle) Sia f : [a, b] R una funzione continua in
[a, b] e derivabile in ]a, b[. Se f(a) = f(b), allora esiste ]a, b[ tale che
f
() = 0.
Dunque, se f(a) = f(b) in almeno un punto (, f()) del graco di f la
tangente al graco è orizzontale.
Dimostrazione Se f è costante in [a, b], allora f
(x) = 0 per ogni x [a, b] e

la tesi è provata. Supponiamo dunque che f non sia costante in [a, b]; poiche
f è continua in [a, b], per il teorema di Weierstrass (teorema 3.1.14) f assume
massimo M e minimo m su [a, b], e si ha necessariamente m < M. Dato che
f(a) = f(b), almeno uno tra i valori m e M è assunto in un punto interno
ad ]a, b[; se ad esempio si ha m = f(), allora, scelto h R in modo che
x +h [a, b], risulta
f( +h) f()
h
_
0 se h > 0
0 se h < 0,
dato che il numeratore è sempre non negativo. Passando al limite per h 0,
si ottiene f
() = 0.
Corollario 4.3.2 (teorema di Cauchy) Siano f, g : [a, b] R funzioni
continue in [a, b] e derivabili in ]a, b[, con g
,= 0 in ]a, b[. Allora esiste

266
]a, b[ tale che
f
()
g
()
=
f(b) f(a)
g(b) g(a)
.
Si noti che risulta g(b) g(a) ,= 0 in virt` u dellipotesi g
,= 0 e del teorema
di Rolle.
Dimostrazione Basta applicare il teorema di Rolle alla funzione
h(x) = f(x)[g(b) g(a)] g(x)[f(b) f(a)].
Il risultato pi` u importante è però il seguente:
Corollario 4.3.3 (teorema di Lagrange) Sia f : [a, b] R una funzione
continua in [a, b] e derivabile in ]a, b[. Allora esiste ]a, b[ tale che
f
() =
f(b) f(a)
b a
.
Dunque in almeno un punto
(, f()) del graco di f la tan-
gente al graco è parallela al-
la retta passante per i punti
(a, f(a)) e (b, f(b)), lequazione
della quale è
y = f(a) +
f(b) f(a)
b a
(x a).
Dimostrazione Basta applicare il teorema di Cauchy con g(x) = x.
Vediamo alcune applicazioni del teorema di Lagrange.
Proposizione 4.3.4 Sia f :]a, b[ R una funzione derivabile. Allora f è
costante in ]a, b[ se e solo se risulta f
(x) = 0 per ogni x ]a, b[.

Dimostrazione Se f è costante in ]a, b[ allora ovviamente f
= 0 in ]a, b[.
Viceversa, sia f
= 0 in ]a, b[. Fissiamo un punto x

0
in ]a, b[, ad esempio
x
0
=
a+b
2
, e sia x un altro punto di ]a, b[: per ssare le idee, supponiamo
x ]a, x
0
[. Per il teorema di Lagrange applicato nellintervallo [x, x
0
], esiste
]x, x
0
[ tale che
f
() =
f(x
0
) f(x)
x
0
x
;
267
ma per ipotesi f
() = 0, e quindi f(x) = f(x

0
) per ogni x ]a, x
0
[. In modo
perfettamente analogo si prova che f(x) = f(x
0
) per ogni x ]x
0
, b[. Dunque
f è costante in ]a, b[.
Con laiuto della proposizione precedente possiamo scrivere alcune funzioni
elementari come somme di serie di potenze in opportuni intervalli.
Esempi 4.3.5 (1) (Serie logaritmica) La funzione log(1 +x) è derivabile in
] 1, +[, e si ha
Dlog(1 +x) =
1
1 +x
x ] 1, +[;
daltra parte, come sappiamo (esempio 2.2.6 (1)),
1
1 +x
=
n=0
(1)
n
x
n
x ] 1, 1[.
Ora si riconosce subito che
(1)
n
x
n
= D
(1)
n
n + 1
x
n+1
n N, x R;
quindi dal teorema di derivazione delle serie di potenze (teorema 4.1.11)
otteniamo
n=0
(1)
n
x
n
= D
_

n=0
(1)
n
n + 1
x
n+1
_
x ] 1, 1[.
Pertanto possiamo scrivere
Dlog(1 +x) = D
_

n=0
(1)
n
n + 1
x
n+1
_
x ] 1, 1[.
La funzione derivabile
g(x) = log(1 +x)
n=0
(1)
n
n + 1
x
n+1
ha dunque derivata nulla in ] 1, 1[, e quindi per la proposizione precedente
è costante in tale intervallo. Ma per x = 0 si ha g(0) = (log 1) 0 = 0,
cosicche g è nulla su ] 1, 1[: in altre parole
log(1 +x) =
n=0
(1)
n
n + 1
x
n+1
=
k=1
(1)
k
k
x
k
x ] 1, 1[.
268
Si noti che la serie a secondo membro soddisfa, per x [0, 1[, le ipotesi del
criterio di Leibniz (proposizione 2.5.3); dunque
log(1 +x)
N
n=0
(1)
n
n + 1
x
n+1
x
N+1
N + 1

1
N + 1
x [0, 1[, n N.
Per x 1 si ricava allora
log 2
N
n=0
(1)
n
n + 1
1
N + 1
N N,
cosicche luguaglianza già scritta vale anche per x = 1:
log(1 +x) =
n=0
(1)
n
n + 1
x
n+1
=
k=1
(1)
k1
k
x
k
x ] 1, 1].
(2) (Serie dellarcotangente) La funzione arctan x è derivabile in R, e si ha
Darctan x =
1
1 +x
2
x R.
Si ha inoltre
1
1 +x
2
=
n=0
(1)
n
x
2n
= D
_

n=0
(1)
n
2n + 1
x
2n+1
_
x ] 1, 1[.
Procedendo come nellesempio precedente si deduce
arctan x =
n=0
(1)
n
2n + 1
x
2n+1
x ] 1, 1[,
ed applicando nuovamente il criterio di Leibniz si trova stavolta che la stessa
uguaglianza vale in entrambi gli estremi x = 1:
arctan x =
n=0
(1)
n
2n + 1
x
2n+1
x [1, 1].
(3) (Serie binomiale) Consideriamo la funzione (1+x)
, ove è un parametro
reale ssato, la quale è derivabile in ] 1, +[. Proveremo che
(1 +x)
n=0
_
n
_
x
n
x ] 1, 1[,
269
ove
_
n
_
=
_
1 se n = 0
(1)...(n+1)
n!
se n > 0.
I numeri
_
n
_
si chiamano coecienti binomiali generalizzati; se N essi
coincidono con gli usuali coecienti binomiali quando 0 n , mentre
sono tutti nulli quando n . La serie
_
n
_
x
n
è detta serie binomiale e
quando N essa si riduce alla formula di Newton per il binomio (1 +x)
.
Per provare la formula sopra scritta cominciamo con losservare che il raggio
di convergenza della serie
_
n
_
x
n
è 1, come si verica facilmente mediante
il criterio del rapporto. Sia g(x) la somma, per ora incognita, di tale serie in
] 1, 1[: dobbiamo provare che g(x) = (1 +x)
per ogni x ] 1, 1[.

Mostriamo anzitutto che
(1 +x)g
(x) = g(x) x ] 1, 1[.

In eetti, per il teorema di derivazione delle serie di potenze (teorema 4.1.11)
si ha
(1 +x)g
(x) = (1 +x)D
_

n=0
_
n
_
x
n
_
= (1 +x)
n=1
n
_
n
_
x
n1
=
=
n=1
n
_
n
_
x
n1
+
n=1
n
_
n
_
x
n
=
=
k=0
(k + 1)
_

k + 1
_
x
k
+
k=1
k
_
k
_
x
k
=
= +
k=1
(k + 1)
_

k + 1
_
x
k
+
k=1
k
_
k
_
x
k
=
= +
k=1
_
(k + 1)
_

k + 1
_
+k
_
k
__
x
k
;
daltra parte risulta per ogni k 1
(k + 1)
_

k + 1
_
+k
_
k
_
=
= (k + 1)
( 1) . . . ( k)
(k + 1)!
+k
( 1) . . . ( k + 1)
k!
=
=
( 1) . . . ( k + 1)
k!
( k +k) =
_
k
_
,
270
cosicche
(1+x)g
(x) = +
k=1
k
_
x
k
=
_
1 +
k=1
_
k
_
x
k
_
= g(x) x ]1, 1[.
Consideriamo allora la derivata del prodotto g(x)(1 +x)
: si ha
D
_
g(x)(1 +x)
_
= g
(x)(1 +x)
g(x)(1 +x)
1
=
= (1 +x)
1
[(1 +x)g
(x) g(x)] = 0 x ] 1, 1[;

per la proposizione 4.3.4 si deduce
g(x)(1 +x)
= costante x ] 1, 1[,
e poiche g(0) = 1, si conclude che
(1 +x)
= g(x) =
n=0
_
n
_
x
n
x ] 1, 1[,
che è ciò che volevamo dimostrare.
Concludiamo il paragrafo illustrando uninteressante proprietà di cui godono
tutte le funzioni derivate, ossia tutte le funzioni g : [a, b] R tali che
g = f
per qualche funzione f derivabile in [a, b]: tali funzioni, pur non
essendo necessariamente continue, hanno la proprietà dei valori intermedi.
Vale infatti il seguente
Teorema 4.3.6 (di Darboux) Sia f : [a, b] R una funzione derivabile
e poniamo M = sup
[a,b]
f
, m = inf
[a,b]
f
. Allora per ogni k ]m, M[ esiste

x
0
[a, b] tale che f
(x
0
) = k.
Dimostrazione Fissato k ]m, M[, esistono y ]m, k[ e z ]k, M[ tali che
y = f
(c) e z = f
(d), con c, d [a, b]. Indichiamo con I lintervallo chiuso

di estremi c, d (non sappiamo se è c < d o il contrario): ovviamente I è
contenuto in [a, b]. Posto h(x) = f(x) kx, la funzione h è derivabile e
quindi continua in I; quindi assume massimo e minimo in I, in due punti x
0
e
0
. Poiche
h
(c) = f
(c) k < 0, h
(d) = f
(d) k > 0,
se risulta c < d, utilizzand lesercizio 4.3.3 si deduce che il punto di massimo
x
0
non può coincidere ne con c, ne con d; se invece è c > d, analogamente
271
si ricava che il punto di minimo
0
non può coincidere ne con c, ne con d.
In denitiva vi è sempre un punto x, interno ad I, nel quale la funzione h
assume massimo oppure minimo: si ha dunque h
(x) = 0, ovvero f
(x) = k.
Esercizi 4.3
1. Sia f : R R una funzione derivabile tale che
lim
x+
f(x) lim
x
f(x) = R;
provare che esiste R tale che f
() = 0.
2. Siano f, g : [a, +[ R funzioni derivabili, con g
,= 0 in [a, +[; se
esistono niti i limiti
lim
x+
f(x) = , lim
x+
g(x) = ,
si dimostri che esiste > a tale che
f
()
g
()
=
f(a)
g(a)
.
3. Sia f : [a, b] R una funzione derivabile. Se x
0
[a, b] è un punto di
massimo per f e
0
è un punto di minimo per f, si provi che
f
(x
0
)
_
_
_
0 se x
0
= a
= 0 se a < x
0
< b
0 se x
0
= b,
f
(
0
)
_
_
_
0 se
0
= a
= 0 se a <
0
< b
0 se
0
= b.
4. Sia f :]a, b[R una funzione derivabile. Se esiste nito il limite
lim
xa
+
f
(x) = ,
si provi che f è prolungabile con continuità nel punto a, che f è deri-
vabile in tale punto e che f
(a) = .
[Traccia: si provi che per ogni > 0 esiste > 0 tale che [f(x)
f(y)[ < per ogni x, y [a, a + [, e se ne deduca la continuità delle-
stensione di f; poi si provi che la stessa proprietà vale per f
e se ne
deduca la derivabilità di f ed il fatto che f
(a) = .]
272
5. Sia f : R R una funzione derivabile tale che f(0) = 0 e [f
(x)[
[f(x)[ per ogni x R; provare che f è identicamente nulla in R.
[Traccia: se x
0
è punto di massimo per f in I = [
1
2
,
1
2
], si provi che
esiste I tale che [f
(x)[ [f
()[ [x
0
[ per ogni x I; se ne deduca
che f è costante, quindi nulla, in I. Poi ci si allarghi a [1, 1], [
3
2
,
3
2
],
eccetera. . . ]
6. Si provi che lequazione x
1000
+ax +b = 0 ha al pi` u due soluzioni reali
per ogni scelta di a e b in R.
7. Si provi che lequazione x
999
+ ax + b = 0 ha al pi` u tre soluzioni reali
per ogni scelta di a e b in R, ed al pi` u una per ogni scelta di a 0 e
b R.
8. Si provi che
log
_
1 +x
1 x
=
n=0
x
2n+1
2n + 1
x ] 1, 1[;
scelto x =
1
2m+1
se ne deduca che
log
m + 1
m
=
2
2m + 1
n=0
1
2n + 1
1
(2m + 1)
2n
m N
+
.
9. Si provi che la serie
n=1
_
e
_
1 +
1
n
_
n
_
è divergente, mentre la serie
n=1
_
e
_
1 +
1
n
2
_
n
2
_
è convergente.
10. Si provi che
1 +x = 1 +
n=1
(1)
n1
(2n 3)!!
(2n)!!
x
n
x ] 1, 1[,
ove si è indicato con m!! il prodotto di tutti i naturali fra 1 e m aventi
la stessa parità di m, e si è posto m!! = 1 per m 0.
273
11. Determinare una serie di potenze la cui somma sia
2 x
2
in un
opportuno intervallo di centro 0.
12. Provare che valgono gli sviluppi in serie di potenze
arcsin x =
n=0
_
1/2
n
_
(1)
n
2n + 1
x
2n+1
=
=
n=0
(2n 1)!!
(2n)!!
(1)
n
2n + 1
x
2n+1
x [1, 1],
settsinh x = log
_
x +
1 +x
2
_
=
n=0
_
1/2
n
_
1
2n + 1
x
2n+1
=
=
n=0
(2n 1)!!
(2n)!!
1
2n + 1
x
2n+1
x ] 1, 1[.
[Traccia: ripetere il ragionamento fatto per log(1 +x) e arctan x negli
esempi 4.3.5.]
13. Sia R. Si provi che la serie binomiale
_
n
_
x
n
:
(i) converge assolutamente per x = 1, se 0;
(ii) converge puntualmente per x = 1 e non converge per x = 1, se
1 < < 0;
(iii) non converge per x = 1, se 1.
[Traccia: se 1 si provi che
n
_
_

n+1
_
; se 1 si provi
che
n
_

c
n(n1)
per ogni n sucientemente grande e c costante
opportuna; se [[ < 1 si osservi che
_

n+1
_
<
n
_
, e sfruttando le
relazioni

k1
< log
_
1

k
_
<
k
]0, 1[, k N
+
,
log
n
2
<
n
k=2
1
k
< log n n 2,
si deduca che
n
_
= [[

n
k=2
1
+1
k
e che c n
1
<
n
_
<
c
n
1
per ogni n 2 e per opportune costanti c, c
.]
274
14. Si verichi che
x
2
log(1+x) x per ogni x [0, 1]; se ne deduca, uti-
lizzando le disuguaglianze fra media armonica, geometrica e aritmetica
(teorema 1.8.2 ed esercizio 1.8.4), che
_
n
2 log(n + 1)
_
n
< n! <
_
n + 1
2
_
n
n N
+
.
Si confronti questo risultato con quello ottenuto nellesempio 2.7.10 (3).
4.4 Condizioni sucienti per la dierenziabi-
lità
Torniamo alle funzioni di pi` u variabili: con lausilio del teorema di Lagrange
si può provare la dierenziabilità di unampia classe di tali funzioni.
Teorema 4.4.1 (del dierenziale totale) Sia A un aperto di R
m
, sia
x
0
A e sia f : A R una funzione con le seguenti proprietà:
(i) vi è una palla B(x
0
, r) A tale che esistano le derivate parziali D
i
f(x),
i = 1, . . . , m, in ogni punto x B(x
0
, r);
(ii) le derivate parziali D
i
f sono continue in x
0
.
Allora f è dierenziabile nel punto x
0
.
Dimostrazione Facciamo la dimostrazione nel caso m = 2: il caso generale
è del tutto analogo ma formalmente pi` u complicato (esercizio 4.4.2). Poniamo
dunque (x
0
, y
0
) = x
0
, (h, k) = h, e sia = [h[
2
. Se < r, ossia h
2
+k
2
< r
2
,
allora i punti (x
0
, y
0
+ k) e (x
0
+ h, y
0
+ k) appartengono ancora a B(x
0
, r).
Dobbiamo provare che
lim
0
1
_
f(x
0
+h, y
0
+k) f(x
0
, y
0
)
f
x
(x
0
, y
0
)h
f
y
(x
0
, y
0
)k
_
= 0.
Osserviamo che
f(x
0
+h, y
0
+k) f(x
0
, y
0
) =
= [f(x
0
+h, y
0
+k) f(x
0
, y
0
+k)] + [f(x
0
, y
0
+k) f(x
0
, y
0
)] ,
275
ed applicando il teorema di Lagrange alle due funzioni
t f(t, y
0
+k), t compreso fra x
0
e x
0
+h,
t f(x
0
, t), t compreso fra y
0
e y
0
+k,
otteniamo
f(x
0
+h, y
0
+k) f(x
0
, y
0
) =
f
x
(, y
0
+k)h +
f
y
(x
0
, )k,
ove è un punto opportuno compreso fra x
0
e x
0
+h, e è un punto opportuno
compreso fra y
0
e y
0
+k. Quindi
1
f(x
0
+h, y
0
+k) f(x
0
, y
0
)
f
x
(x
0
, y
0
)h
f
y
(x
0
, y
0
)k
[h[
f
x
(, y
0
+k)
f
x
(x
0
, y
0
)
+
[k[
f
y
(x
0
, )
f
y
(x
0
, y
0
)
f
x
(, y
0
+k)
f
x
(x
0
, y
0
)
f
y
(x
0
, )
f
y
(x
0
, y
0
)
;
quando 0 si ha h 0 e k 0, dunque x
0
e y
0
: perciò lultimo
membro tende a 0 in virt` u della continuità delle derivate parziali di f nel
punto (x
0
, y
0
). Ne segue la tesi.
Osserviamo che il teorema precedente esprime una condizione suciente per
la dierenziabilità di f in x
0
: nellesercizio 4.4.1 si esibisce una funzione che
è dierenziabile benche non soddis le ipotesi del teorema del dierenziale
totale.
Esercizi 4.4
1. Provare che la funzione
f(x, y) =
_
y
2
cos
1
y
se x R, y ,= 0
0 se x R, y = 0
è dierenziabile nel punto (0, 0), ma non soddisfa in tale punto le ipotesi
del teorema del dierenziale totale.
2. Dimostrare il teorema del dierenziale totale nel caso generale (funzioni
di m variabili anziche di due).
276
3. Sia A un cono di R
m
(cioè un insieme tale che se x A allora tx A
per ogni t > 0). Una funzione f : A R si dice omogenea di grado
R se verica lidentità
f(tx) = t
f(x) t > 0, x A.
Provare che:
(i) se f è dierenziabile in A, allora le derivate parziali D
i
f sono
funzioni omogenee di grado 1;
(ii) vale lidentità di Eulero
gradf(x) x = f(x) x A.
4. Sia H una matrice reale e simmetrica mm. Si verichi che la funzione
(v) = Hv v è una funzione omogenea di grado 2 su R
m
(essa si
chiama forma quadratica associata alla matrice H), e se ne calcoli il
gradiente.
5. Si consideri la funzione f : R
2
R cos` denita:
f(x, y) =
_
0 se x R, y = 0
y e
(
xy
y
)
2
se x R, y ,= 0.
(i) Si verichi che f è continua in R
2
.
(ii) Si provi che esistono le derivate parziali di f in ogni punto di R
2
.
(iii) Si scriva il vettore gradf(0, 0).
(iv) Si dimostri che f non è dierenziabile nellorigine, mentre lo è negli
altri punti di R
2
.
6. Si consideri la funzione f : R
2
(x, y) : y = 0 R cos` denita:
f(x, y) =
_
_
x log y
2
y
2
1
se x R, y ,= 1
x se x R, y = 1.
(i) Determinare linsieme dei punti ove f è continua.
277
(ii) Determinare linsieme dei punti ove esistono le derivate parziali e
calcolare tali derivate.
(iii) Determinare linsieme dei punti ove f è dierenziabile e calcolarne
il dierenziale.
7. Sia f una funzione dierenziabile con derivate parziali continue in R
2
,
e tale che
f(x, y) = 0 (x, y) ,
ove = (x, y) R
2
: x = y.
(i) Provare che
f
x
(x, y) =
f
y
(x, y) (x, y) .
(ii) Provare che la funzione
g(x, y) =
f(x, y)
x y
, (x, y) R
2

è estendibile con continuità a R
2
.
4.5 Dierenziabilità di funzioni composte
Estenderemo al caso di funzioni di pi` u variabili il teorema di derivazione delle
funzioni composte (teorema 4.1.6). Cominciamo dal caso pi` u semplice: sia A
un aperto di R
m
, sia f : A R una funzione, e sia u : [a, b] A una funzione
a valori vettoriali: ciò signica che u(t) è un vettore (u
1
(t), . . . , u
m
(t)) di
R
m
, il quale appartiene ad A per ogni scelta di t [a, b]. Ha dunque senso
considerare la funzione composta F(t) = f(u(t)), che è denita su [a, b] a
valori in R.
Teorema 4.5.1 Nelle ipotesi sopra dette, se f è dierenziabile in A e u è
derivabile in [a, b] (ossia le funzioni u
1
,. . . ,u
m
sono derivabili in [a, b]), allora
F = f u è derivabile in [a, b] e si ha
F
(t) = ([gradf] u(t)) u
(t) =
m
i=1
(D
i
f)(u(t)) (u
i
)
(t) t [a, b].

278
Dimostrazione Le u
i
sono funzioni derivabili: quindi, ssato t [a, b], per
ogni k R tale che t +k [a, b] si può scrivere
u
i
(t +k) u
i
(t) = (u
i
)
(t) k +k w
i
(k), i = 1, . . . , n,
ove le funzioni w
i
sono innitesime per k 0; ossia, in forma vettoriale,
u(t +k) u(t) = u
(t) k +k w(k),
ove [w(k)[
m
0 per k 0.
Daltra parte, essendo la funzione f dierenziabile nel punto u(t), dallos-
servazione 4.2.7 segue, prendendo come incremento vettoriale h la quantità
u(t +k) u(t), che
f(u(t +k)) f(u(t)) [gradf(u(t))] [u(t +k) u(t)] =
= [u(t +k) u(t)[
m
(u(t +k) u(t)),
ove (h) è un innitesimo per h 0. Ne segue
F(t +k) F(t) [gradf(u(t))] u
(t) k =
= [gradf(u(t))] w(k) k +[u(t +k) u(t)[
m
(u(t +k) u(t)) =
= [gradf(u(t))] w(k) k +[(u
(t) +w(k)) k[
m
(u(t +k) u(t));
poiche
lim
k0
1
k
[gradf(u(t)) w(k) k +[(u
(t) +w(k)) k[
m
(u(t +k) u(t))]
lim
k0
[[gradf(u(t))[
m
[w(k)[
m
+[u
(t) +w(k)[
m
[(u(t +k) u(t))[] = 0,
si conclude che
lim
k0
F(t +k) F(t)
k
= [gradf(u(t))] u
(t).
Il risultato che segue prova la dierenziabilità delle funzioni composte nel
caso pi` u generale.
Teorema 4.5.2 Sia A un aperto di R
m
, sia B un aperto di R
p
e conside-
riamo due funzioni f : A R e g : B A. Se f è dierenziabile in A
e se g è dierenziabile in B (ossia le componenti scalari g
1
, . . . , g
m
di g
279
sono dierenziabili in B), allora la funzione composta F(x) = f(g(x)) =
f(g
1
(x), . . . , g
m
(x)) è dierenziabile in A e risulta
F
x
j
(x) =
m
k=1
f
y
k
(g(x))
g
k
x
j
(x) x B, j = 1, . . . , p.
Dimostrazione Basta ripetere la dimostrazione precedente considerando le
funzioni x
j
g(x) e x f(x).
Esempi 4.5.3 (1) (coordinate polari in R
2
) Poniamo, come si è fatto nel-
losservazione 3.3.7,
_
x = r cos
y = r sin ,
r 0, [0, 2].
Se f(x, y) è una funzione dierenziabile, posto u(r, ) = f(r cos , r sin ) si
ha
u
r
(r, ) =
f
x
(r cos , r sin ) cos +
f
y
(r cos , r sin ) sin ,
u
(r, ) =
f
x
(r cos , r sin )r sin +
f
y
(r cos , r sin )r cos ,
e in particolare
[[gradf](r cos , r sin )[
2
2
=
=
_
u
r
(r, )
_
2
+
1
r
2
_
u
(r, )
_
2
r > 0, [0, 2].
(2) (coordinate polari in R
3
) Poniamo
_
_
_
x = r sin cos
y = r sin sin
z = r cos ,
r 0, [0, 2], [0, 2].
La quantità r rappresenta la distanza del punto P = (x, y, z) dallorigine
O; il numero è la colatitudine, ossia langolo convesso che il segmento
OP forma con il segmento ON, ove N è il polo nord (0, 0, r); inne, il
numero è la longitudine, cioè langolo (orientato) fra la semiretta delle
x 0 e la proiezione di OP sul piano xy. Come nel caso bi-dimensionale,
280
la corrispondenza (r, , ) = (x, y, z) non è biunivoca poiche tutte le terne
(0, , ) rappresentano lorigine, tutte le terne (r, 0, ) e (r, 0, ) rappresenta-
no i due poli (0, 0, r) e (0, 0, r) rispettivamente, ed inne le terne (r, , 0)
e (r, , 2) rappresentano lo stesso punto sul piano xz. Lapplicazione tra-
sforma parallelepipedi dello spazio r in settori sferici dello spazio xyz.
Se f(x, y, z) è una funzione dierenziabile e v = f , si puo vericare che
(omettendo, per brevità, la dipendenza delle funzione dalle variabili):
v
r
=
_
f
x

_
sin cos +
_
f
y

_
sin sin +
_
f
z

_
cos ,
v
=
_
f
x

_
r cos cos +
_
f
y

_
r cos sin
_
f
z

_
r sin ,
v
=
_
f
x

_
r sin sin +
_
f
y

_
r sin cos .
In particolare si verica facilmente che
[[gradf] [
2
3
=
_
v
r
_
2
+
1
r
2
_
v
_
2
+
1
r
2
sin
2
_
v
_
2
per ogni r > 0, ]0, [, [0, 2].
Esercizi 4.5
1. Scrivere la derivata rispetto a t delle funzioni composte f(u(t)) seguen-
ti:
(a) f(x, y) = x
2
+y
2
, u(t) = (1 +t, 1 t);
(b) f(x, y) = (x
2
+y
2
)
2
, u(t) = (cos t, sin t);
(c) f(x, y) = log(x
2
y
2
), u(t) = (cos t, sin t) con 0 < t <

4
;
(d) f(x, y) =
xy
x
2
+y
4
, u(t) = (3t
2
, 2t) con t ,= 0.
2. Sia A un aperto di R
m
e sia f : A R una funzione dierenziabile. Se
x, y A, e se tutto il segmento I di estremi x e y è contenuto in A, si
provi che
f(x) f(y) = gradf(v) (x y),
281
ove v è un punto opportuno del segmento I.
[Traccia: si applichi il teorema di Lagrange alla funzione F(t) = f(x+
t(y x)), 0 t 1.]
3. Sia f : [0, [R una funzione derivabile; posto
u(x) = f
_
[x[
2
m
_
, x R
m
,
si provi che u è dierenziabile in R
m
e se ne calcoli il gradiente.
4.6 Derivate successive
Sia f :]a, b[ R una funzione derivabile. Allora per ogni x ]a, b[ esiste la
derivata f
(x): dunque resta denita la funzione derivata f
:]a, b[ R. Se
questa funzione è a sua volta derivabile in ]a, b[, la sua derivata (f
si dice
derivata seconda di f e si indica con i simboli
f
(x), D
2
f(x),
d
2
f
dx
2
(x)
(la f
, per analogia, si dirà derivata prima di f). In particolare

f
(x) = lim
h0
f
(x +h) f
(x)
h
x ]a, b[.
Analogamente si deniscono, quando è possibile, la derivata terza, quarta,
. . . , n-sima di f, che si indicano con f
(3)
, f
(4)
, . . . , f
(n)
; si ha
f
(k)
(x) = lim
h0
f
(k1)
(x +h) f
(k1)
(x)
h
x ]a, b[, k = 1, . . . , n.
In tal caso si dice che f è derivabile n volte in ]a, b[.
Esempi 4.6.1 (1) Se f(x) = x
2
+ 3x + 2, si ha f
(x) = 2x + 3, f
(x) = 2,
f
(n)
(x) = 0 per ogni n > 2.
(2) Se f(x) = x[x[, si ha f
(x) = 2[x[ e
f
(x) =
_
2 se x > 0
2 se x < 0,
mentre f
(0) non esiste.

282
(3) Se f(x) = b
x
, si ha f
(n)
(x) = b
x
(log b)
n
per ogni n N
+
.
Per le funzioni di pi` u variabili valgono considerazioni analoghe. Sia f : A
R, ove A è un aperto di R
m
; se f è dierenziabile in A, allora esistono le m
derivate parziali prime D
i
f(x), i = 1, . . . , m. Se ciascuna di queste funzioni,
a sua volta, è dierenziabile in A, esisteranno le m
2
derivate parziali seconde
D
j
(D
i
f)(x), i, j = 1, . . . , m; per tali funzioni useremo i simboli
D
j
D
i
f(x), f
x
j
x
i (x),

2
f
x
j
x
i
(x),
e se i = j
D
2
j
f(x), f
x
j
x
j (x),

2
f
x
j
2
(x).
In generale, f avrà m
k
derivate parziali k-sime (se queste esistono tutte).
Denizione 4.6.2 Diciamo che una funzione f è di classe C
k
in A, e scri-
viamo f C
k
(A), se f possiede tutte le derivate parziali no allordine k
incluso, e inoltre f e le sue derivate sono continue in A; in particolare,
denotiamo con C
0
(A), o semplicemente con C(A), linsieme delle funzioni
continue in A. Poniamo inoltre
C
(A) =
k=0
C
k
(A).
In modo analogo si denisce C
k
(]a, b[) nel caso di funzioni di una sola varia-
bile.
Esempi 4.6.3 (1) Ogni polinomio in m variabili è una funzione di classe
C
(R
m
).
(2) La funzione f(x) = [x[
k+1/2
è di classe C
k
, ma non di classe C
k+1
, su R.
(3) Le somme di serie di potenze reali sono funzioni di classe C
sullinter-
vallo aperto di convergenza. In generale possono esistere le derivate seconde
D
i
D
j
f e D
j
D
i
f di una funzione f di m variabili, ma queste due derivate
possono essere diverse fra loro: un esempio è fornito nellesercizio 4.6.5. Tut-
tavia sotto ipotesi assai ragionevoli vale il seguente risultato sullinvertibilità
dellordine di derivazione:
Teorema 4.6.4 (di Schwarz) Sia A un aperto di R
m
, sia x
0
A e sia
f : A R una funzione tale che le derivate D
i
D
j
f e D
j
D
i
f esistano in un
intorno di x
0
e siano continue in x
0
. Allora risulta D
i
D
j
f(x
0
) = D
j
D
i
f(x
0
).
283
Dimostrazione Si vedano gli esercizi 4.6.6 e 4.6.7.
Di conseguenza, se f : A R è di classe C
2
sullaperto A R
m
, la sua
matrice Hessiana, denita da
H(x) =
_
_
D
2
1
f(x) D
1
D
m
f(x)

D
m
D
1
f(x) D
2
m
f(x)
_
_
, x A,
è una matrice mm reale e simmetrica; ritorneremo a parlare di essa quando
studieremo i massimi e i minimi di funzioni di pi` u variabili (paragrafo 4.11).
Principio di identità delle serie di potenze
Per i polinomi vale il principio di identità, ben noto in algebra, secondo il
quale due polinomi che coincidono per ogni valore della variabile devono avere
gli stessi coecienti. Le serie di potenze condividono questa fondamentale
proprietà: in altre parole, i loro coecienti sono univocamente determinati
dalla somma della serie. Ciò è conseguenza del seguente
Teorema 4.6.5 Sia
n=0
a
k
x
k
una serie di potenze reale con raggio di con-
vergenza R > 0, e sia f(x) la sua somma per [x[ < R. Allora:
(i) f appartiene a C
(] R, R[) (cioè esiste f

(n)
(x) per ogni n N e per
ogni x ] R, R[);
(ii) risulta
f
(n)
(x) =
k=n
k(k 1) . . . (k n + 1)a
k
x
kn
x ] R, R[;
(iii) in particolare,
a
n
=
f
(n)
(0)
n!
n N,
ove f
(0)
signica f.
Dimostrazione Dal teorema 4.1.11 sappiamo che f è derivabile e che
f
(x) =
k=1
ka
k
x
k1
x ] R, R[.
284
Ma allora f
è a sua volta somma di una serie di potenze in ] R, R[:

applicando nuovamente il teorema 4.1.11 segue che f
è derivabile e che
f
(x) =
k=2
k(k 1)a
k
x
k2
x ] R, R[.
Iterando il procedimento si ottengono (i) e (ii). In particolare, scegliendo
x = 0 nella serie di f
(n)
, tutti gli addendi con k > n spariscono e pertanto
f
(n)
(0) = n(n 1) . . . (n n + 1)a
n
= n! a
n
.
Corollario 4.6.6 (principio di identità delle serie di potenze) Siano
n=0
a
n
x
n
e
n=0
b
n
x
n
due serie di potenze reali con raggi di convergenza
R, R
> 0. Posto r = minR, R
, se risulta
n=0
a
n
x
n
=
n=0
b
n
x
n
x ] r, r[,
allora si ha a
n
= b
n
per ogni n N.
Dimostrazione Basta applicare il teorema 4.6.5 alla serie dierenza, cioè
(a
n
b
n
)x
n
, la quale per ipotesi ha somma 0 in ] r, r[.
Esercizi 4.6
1. Sia f :]a, b[ R e supponiamo che f sia derivabile due volte in ]a, b[.
Siano x
1
, x
2
, x
3
punti di ]a, b[, con x
1
< x
2
< x
3
e f(x
1
) = f(x
2
) =
f(x
3
). Si provi che esiste ]x
1
, x
3
[ tale che f
() = 0.
2. Sia f :]a, b[R derivabile due volte in ]a, b[. Si provi che
f
(x) = lim
h0
f(x +h) +f(x h) 2f(x)
h
2
x ]a, b[.
3. Calcolare f
(n)
(x) per ogni n N
+
nei casi seguenti:
(i) f(x) = log
b
x, (ii) f(x) = cos bx, (iii) f(x) = b
x
, (iv) f(x) = x
b
.
285
4. Si dimostri la formula di Leibniz per la derivata n-sima di un prodotto:
D
n
(fg)(x) =
n
k=0
_
n
k
_
D
k
f(x) D
nk
g(x).
[Traccia: si ragioni per induzione.]
5. Sia f : R
2
R la funzione cos` denita:
f(x, y) =
_
_
_
y
2
arctan
x
y
se y ,= 0, x R
0 se y = 0, x R.
Si provi che f
xy
(0, 0) = 0 e f
yx
(0, 0) = 1.
6. Sia A un aperto di R
2
, sia (x
0
, y
0
) A e sia f : A R tale che f
xy
e f
yx
esistano in un intorno di (x
0
, y
0
) e siano continue in tale punto.
Posto
A(h, k) = f(x
0
+h, y
0
+k) f(x
0
+h, y
0
) f(x
0
, y
0
+k) +f(x
0
, y
0
),
si provi che esiste , intermedio fra x
0
e x
0
+h, tale che
A(h, k) = h[f
x
(, y
0
+k) f
x
(, y
0
)];
si provi poi che esiste , intermedio fra y
0
e y
0
+k, tale che
A(h, k) = hk f
yx
(, ).
Inne, in modo analogo si verichi che esistono
, intermedio fra y
0
e
y
0
+k, e
, intermedio fra x
0
e x
0
+h, tali che
A(h, k) = hk f
xy
(
),
e se ne deduca il teorema di Schwarz nel caso m = 2.
[Traccia: si applichi opportunamente il teorema di Lagrange.]
7. Si generalizzi largomentazione dellesercizio precedente al caso di m
variabili, provando che se f : A R è tale che D
i
D
j
f e D
j
D
i
f esistano
in un intorno di x
0
A e siano continue in tale punto, allora esse
coincidono nel punto x
0
.
[Traccia: ci si riconduca al caso di due variabili osservando che il
ragionamento coinvolge solo le due variabili x
i
e x
j
.]
286
8. Sia f C
k
(A), con A aperto di R
m
. Si verichi che le derivate distinte
di f di ordine k sono
_
n+k1
k
_
.
9. Sia
f(x, y) =
_
x y se x > 0, y R
x ye
x
2
se x 0, y R.
(i) Si verichi che f è dierenziabile in R
2
.
(ii) Si calcolino f
xy
(0, 0) e f
yx
(0, 0).
10. Sia f : R R di classe C
. Se esiste n N
+
tale che f
(n)
0, si
provi che f è un polinomio di grado non superiore a n.
11. Si provi che se
f(x) =
n=0
a
n
x
n
, x ] R, R[,
allora per ogni x
0
] R, R[ la funzione f è somma di una serie di
potenze di centro x
0
in ]x
0
r, x
0
+r[, ove r = R [x
0
[.
[Traccia: usando la formula di Newton per il binomio, si scriva x
n
=
[(x x
0
) +x
0
]
n
e
f(x) =
n=0
a
n
[(x x
0
) +x
0
]
n
=
n=0
a
n
k=0
_
n
k
_
x
nk
0
(x x
0
)
k
=
(poiche la somma è estesa agli indici (k, n) N
2
con n k)
=
k=0
_

n=k
a
n
_
n
k
_
x
nk
0
_
(x x
0
)
k
=
=
k=0
_

n=k
n(n 1) . . . (n k + 1)a
n
x
nk
0
_
(x x
0
)
k
=
(per il teorema 4.6.5)
=
k=0
1
k!
f
(k)
(x
0
)(x x
0
)
k
.
Occorre però vericare la validità della terza uguaglianza: cioè, bisogna
vericare che se a
nk
: n, k N, n k è una famiglia di numeri reali
287
o complessi tali che
n=0
_
n
k=0
[a
nk
[
_
= L < +,
allora le serie
n=k
a
nk
per ogni k N,
n=0
_

k=0
a
nk
_
,
k=0
_

n=k
a
nk
_
sono assolutamente convergenti e si ha
n=0
_

k=0
a
nk
_
=
k=0
_

n=k
a
nk
_
.
A questo scopo si utilizzi lesercizio 2.8.4.]
4.7 Confronto di innitesimi e inniti
Nel calcolo di limiti di funzioni di una variabile, il pi` u delle volte ci si trova
a dover determinare leettivo comportamento di una forma indeterminata
del tipo 0/0 oppure /. A questo scopo è utile la seguente terminologia.
Siano f, g funzioni denite in un intorno di x
0
, ove x
0
R oppure x
0
= ,
e innitesime per x x
0
, cioè (denizione 3.3.1) tali che
lim
xx
0
f(x) = lim
xx
0
g(x) = 0.
Supporremo, per semplicità, che f e g siano diverse da 0 in un intorno di x
0
(salvo al pi` u x
0
).
Diremo che f è un innitesimo di ordine superiore a g per x x
0
(oppure,
equivalentemente, che g è un innitesimo di ordine inferiore a f per x x
0
)
se
lim
xx
0
f(x)
g(x)
= 0;
in tal caso useremo la scrittura
f(x) = o(g(x)) per x x
0
,
288
che si legge f è o-piccolo di g per x x
0
.
Diciamo che f e g sono innitesimi dello stesso ordine per x x
0
se esiste
R 0 tale che
lim
xx
0
f(x)
g(x)
= .
Esempi 4.7.1 (1) sin
2
x è un innitesimo per x 0 di ordine superiore a
x, dello stesso ordine di x
2
, e di ordine inferiore a x
3
, in quanto
lim
x0
sin
2
x
x
= 0, lim
x0
sin
2
x
x
2
= 1, lim
x0
x
3
sin
2
x
= 0.
(2) e
x
è un innitesimo per x + di ordine superiore a x
n
qualunque
sia n N
+
, in quanto
lim
x+
e
x
x
n
= 0 n N
+
.
(3) 1/ log x è un innitesimo per x 0
+
di ordine inferiore a x
qualunque
sia > 0, in quanto
lim
x0
+
x
log x = 0 > 0.
(4) Se f è derivabile in x
0
, allora losservazione 4.1.2 (2) ci dice che
f(x) f(x
0
) f
(x
0
)(x x
0
) = o(x x
0
) per x x
0
.
(5) Dire che f(x) = o(1) per x x
0
signica semplicemente che f(x) è un
innitesimo per x x
0
.
(6)
`
E facile costruire due innitesimi non confrontabili fra loro: tali sono ad
esempio, per x 0, le funzioni f(x) = x e g(x) = x(2 + sin
1
x
).
Osservazione 4.7.2 Accanto alla notazione o-piccolo esiste anche l O-
grande: se f e g sono innitesimi per x x
0
, la scrittura
f(x) = O(g(x)) per x x
0
(che si legge f(x) è O-grande di g(x) per x x
0
) signica che esiste K > 0
tale che
[f(x)[ K[g(x)[ in un intorno di x
0
.
Dunque
f(x) = o(g(x)) per x x
0
= f(x) = O(g(x)) per x x
0
,
ma il viceversa è falso: basta pensare a due innitesimi dello stesso ordine.
289
Il risultato che segue aiuta a semplicare il calcolo del limite di una forma
indeterminata 0/0.
Proposizione 4.7.3 (principio di sostituzione degli innitesimi) Sia-
no f, g, , funzioni innitesime per x x
0
, diverse da 0 per x ,= x
0
(con
x
0
R oppure x
0
= ). Se
(x) = o(f(x)) e (x) = o(g(x)) per x x
0
,
e se esiste (nito o innito) il limite
lim
xx
0
f(x)
g(x)
,
allora si ha anche
lim
xx
0
f(x) +(x)
g(x) +(x)
= lim
xx
0
f(x)
g(x)
.
Dimostrazione Basta osservare che
f(x) +(x)
g(x) +(x)
=
f(x)
g(x)

1 +
(x)
f(x)
1 +
(x)
g(x)
,
e che il secondo fattore tende a 1 per x x
0
.
Esempi 4.7.4 (1) Si ha, in base al principio di sostituzione,
lim
x0
sin x x
2
x +x
x
= lim
x0
sin x
x
= 1.
(2) Calcoliamo (se esiste) il limite
lim
x0
sin x x + log(1 +x
2
)
x
2
.
La funzione log(1 + x
2
) è un innitesimo per x 0 di ordine superiore
sia rispetto a sin x, sia rispetto a x; tuttavia essa non è un innitesimo di
ordine superiore a (sin x x), in quanto (sin x x) è dello stesso ordine di
x
3
(esercizio 3.3.12) mentre log(1 + x
2
) è dello stesso ordine di x
2
. Sarebbe
perciò sbagliato concludere che il limite proposto coincide con
lim
x0
sin x x
x
2
= 0;
290
esso invece coincide con
lim
x0
log(1 +x
2
)
x
2
= 1.
Discorsi analoghi, come ora vedremo, valgono per gli inniti per x x
0
, cioè
per le funzioni f denite in un intorno di x
0
(salvo al pi` u x
0
) e tali che
1
f(x)
sia innitesimo per x x
0
.
Siano f, g due inniti per x x
0
: diciamo che f è un innito di ordine
superiore a g per x x
0
, ovvero che g è un innito di ordine inferiore a f
per x x
0
, se
lim
xx
0
g(x)
f(x)
= 0;
in tal caso useremo ancora la scrittura
g(x) = o(f(x)) per x x
0
.
Diciamo che f e g sono inniti dello stesso ordine per x x
0
se esiste un
numero reale ,= 0 tale che
lim
xx
0
g(x)
f(x)
= .
Si noti che, in conseguenza delle denizioni di o-piccolo e O-grande, f è
un innito di ordine superiore a g per x x
0
se e solo se 1/f è un innitesimo
di ordine superiore a 1/g per x x
0
.
Esempi 4.7.5 (1)
1 +x
3
è un innito di ordine superiore a x per x
+, in quanto
lim
x+
x
1 +x
3
= 0.
(2) tan x è un innito dello stesso ordine di
1
+2x
per x
2
+
, in quanto
lim
x/2
+
( + 2x) tan x = lim
x/2
+
2
_
2
+x
_
sin x
cos x
=
= lim
x/2
+
2
_
2
+x
_
sin
_
2
+x
_ sin x = 2.
(3) Le funzioni
1
x
e
1
x
(2 + sin
1
x
) sono inniti non confrontabili per x 0.
291
Proposizione 4.7.6 (principio di sostituzione degli inniti) Siano f,
g, , funzioni innite per x x
0
, ove x
0
R oppure x
0
= . Se
(x) = o(f(x)) e (x) = o(g(x)) per x x
0
,
e se esiste (nito o innito) il limite
lim
xx
0
f(x)
g(x)
,
allora si ha anche
lim
xx
0
f(x) +(x)
g(x) +(x)
= lim
xx
0
f(x)
g(x)
.
Dimostrazione Analoga a quella del principio di sostituzione degli inni-
tesimi.
Un utile strumento per lo studio delle forme indeterminate (non il pi` u im-
portante, però: spesso è pi` u utile la formula di Taylor, come mostreranno
lesempio 4.8.4 (2) e lesercizio 4.8.7) è il seguente
Teorema 4.7.7 (di de lHopital) Sia x
0
[a, b] e siano f, g funzioni de-
rivabili in ]a, b[x
0
. Se:
(i) f e g sono entrambe innitesimi, oppure inniti, per x x
0
;
(ii) g
,= 0 in un intorno di x
0
(salvo al pi` u in x
0
);
(iii) esiste, nito o innito, il limite
lim
xx
0
f
(x)
g
(x)
,
allora
lim
xx
0
f(x)
g(x)
= lim
xx
0
f
(x)
g
(x)
.
Dimostrazione Consideriamo il caso in cui
lim
xx
0
f(x) = lim
xx
0
g(x) = 0.
Anzitutto, prolunghiamo oppure ri-deniamo f e g nel punto x
0
ponendo
f(x
0
) = g(x
0
) = 0. (Ciò è necessario se f e g non sono denite in x
0
, come
292
ad esempio nel caso di
1cos x
x
nel punto 0, oppure se f e g sono denite in
x
0
con valori non nulli, e quindi sono discontinue in tale punto.) In questo
modo, f e g risultano continue in ]a, b[x
0
e derivabili in ]a, b[x
0
.
Dobbiamo calcolare il limite di
f(x)
g(x)
per x x
0
. Detto il limite di
f
(x)
g
(x)
per
x x
0
, e supposto per ssare le idee R, per ogni > 0 esiste > 0 tale
che
0 < [x x
0
[ < =
(x)
g
(x)

< .
Sia x ]a, b[ tale che 0 < [x x
0
[ < , e supponiamo ad esempio x < x
0
:
allora f e g soddisfano le ipotesi del teorema di Cauchy (teorema 4.3.2)
nellintervallo [x, x
0
]; quindi esiste ]x, x
0
[ tale che
f(x)
g(x)
=
f(x) f(x
0
)
g(x) g(x
0
)
=
f
()
g
()
.
Ma [ x
0
[ < [x x
0
[ < e dunque
f(x)
g(x)

()
g
()

< .
Ciò prova che
f(x)
g(x)
converge a per x x
0
. Discorso analogo se = e
se x > x
0
.
Passiamo ora a considerare il caso in cui f e g sono inniti per x x
0
. In
questo caso la dimostrazione è meno semplice.
Proveremo la tesi solamente nel caso in cui R; per il caso = si
rimanda allesercizio 4.7.4.
Fissati due punti distinti x, ]a, b[x
0
, entrambi minori o entrambi mag-
giori di x
0
, per il teorema di Cauchy possiamo scrivere
f(x) f()
g(x) g()
=
f
()
g
()
,
con opportuno punto intermedio fra x e . Questa scrittura ha senso se i
punti x, sono sucientemente vicini a x
0
: in tal caso infatti vale lipotesi
(ii), che assicura liniettività di g. La relazione sopra scritta equivale, con
facili calcoli, a
f(x)
g(x)
=
1
g()
g(x)
1
f()
f(x)
f
()
g
()
,
293
scrittura che a sua volta ha senso per x sucientemente vicino a x
0
, visto
che f e g tendono a per x x
0
.
Sia ora > 0 e sia
]0, 1[ un altro numero, che sseremo in seguito. Per

lipotesi (iii), esiste > 0 tale che
(u)
g
(u)

<
per u ]a, b[, 0 < [u x

0
[ < .
Scegliamo = x
0

2
, a seconda che sia x > x
0
o x < x
0
. Allora quando
0 < [x x
0
[ < si avrà anche 0 < [ x
0
[ < , e dunque
()
g
()

<
.
Adesso osserviamo che, con la nostra scelta di , si ha
lim
xx
0
1
g()
g(x)
1
f()
f(x)
= 1,
e dunque esiste ]0, ] tale che
1
g()
g(x)
1
f()
f(x)
1
<
per 0 < [x x
0
[ < .
Valutiamo allora
f(x)
g(x)

quando 0 < [x x
0
[ < : si ha
f(x)
g(x)

1
g()
g(x)
1
f()
f(x)
f
()
g
()

1
g()
g(x)
1
f()
f(x)
1
()
g
()
()
g
()

([[ +
) +
.
Essendo
< 1, deduciamo
f(x)
g(x)

< ([[ + 2)
per 0 < [x x
0
[ < ,
294
e scegliendo inne

||+2
si conclude che
f(x)
g(x)

< per 0 < [x x

0
[ < ,
che è la tesi.
Osservazioni 4.7.8 (1) Il teorema di de LHopital vale anche nel caso di
rapporti di innitesimi, o di inniti, per x x
+
0
, o per x x
0
, o anche per
x . Le dimostrazioni sono essenzialmente analoghe (esercizio 4.7.4).
(2) La soppressione di una qualunque delle tre ipotesi rende falso il teorema:
si vedano gli esercizi 4.7.2 e 4.7.3.
(3) In pratica la sostituzione di
f
g
con
f
porta sovente ad unulteriore forma

indeterminata. In questi casi, se le tre ipotesi (i)-(ii)-(iii) sono ancora sod-
disfatte, si può applicare il teorema di de LHopital alle funzioni f
e g
, e
considerare i limiti per x x
0
di
f
, poi di
f
(3)
g
(3)
, eccetera, nche non si trova
un n N
+
tale che
lim
xx
0
f
(n)
(x)
g
(n)
(x)
= ;
si avrà allora (e solo allora, cioè solo quando tale limite esiste)
lim
xx
0
f
(n1)
(x)
g
(n1)
(x)
= lim
xx
0
f
(n2)
(x)
g
(n2)
(x)
= . . . = lim
xx
0
f(x)
g(x)
= .
Esempio 4.7.9 Si ha, usando due volte il teorema di de LHopital,
lim
x0
cos 2x cos x
x
2
= lim
x0
2 sin 2x + sin x
2x
= lim
x0
4 cos 2x + cos x
2
=
3
2
.
Esercizi 4.7
1. Nellenunciato del teorema di de LHopital, nel caso del confronto di
due innitesimi non si fa lipotesi che la funzione g sia diversa da 0 in
un intorno di x
0
(salvo al pi` u x
0
): si provi che ciò è conseguenza delle
altre ipotesi del teorema.
2. Posto f(x) = log x e g(x) = x, si verichi che
lim
x0
+
f(x)
g(x)
,= lim
x0
+
f
(x)
g
(x)
.
Come mai?
295
3. Calcolare, se esistono, i limiti
(a) lim
x+
x + sin x
x
, (b) lim
x0
x
2
sin 1/x
sin x
.
4. Dimostrare il teorema di de LHopital nel caso in cui
f
(x)
g
(x)
per
x x
0
, e nel caso di forme indeterminate 0/0 e / per x .
(i) lim
x0
+
(arctan x)
tan x
; (ii) lim
x/4
2 sin x cos x
log sin 2x
;
(iii) lim
x0
+
log
x
(e
x
1); (iv) lim
x+
log(1 + 2e
x
)
1 +x
2
;
(v) lim
x1
x x
x
1 x log x
; (vi) lim
x0
tan x log sin x;
(vii) lim
x0
_
1
x
_
tan x
; (viii) lim
x0
_
1
1 cos x

2
x
2
_
;
(ix) lim
x0
arcsin x x
x arctan x
; (x) lim
x1
+
(log x) log log x;
(xi) lim
x0
+
(tan x)e
1/x
; (xii) lim
x0
_
1
x
2

1
tan
2
x
_
;
(xiii) lim
x0
(1 +x
2
)
1
sin
2
x
; (xiv) lim
x0
(1 +x)
1/x
1 +x e
x
2
;
(xv) lim
x0
+
_
log x
x
_
x
; (xvi) lim
x1
(1 x) tan
x
2
;
(xvii) lim
x0
+
(e
x
1)
x
; (xviii) lim
x1
(log x)
2/3
+ (1 x
2
)
3/4
(sin(x 1))
2/3
;
(xix) lim
x0
_
tan x
x
_
1/x
; (xx) lim
x0
log(1 +x +x
2
) + log(1 x +x
2
)
sin
2
x
.
6. Sia f : [a, b] R una funzione continua, sia x
0
]a, b[ e supponiamo che
f sia derivabile in ]a, b[x
0
. Si provi che se esiste lim
xx
0
f
(x) = R,
allora f è derivabile anche nel punto x
0
, con f
(x
0
) = .
296
7. Sia f : [a, +[R una funzione derivabile. Si provi che se
lim
x+
f
(x) = a R, lim
x
(f(x) ax) = b R.
allora f ha lasintoto obliquo di equazione y = ax +b per x +.
`
E
vero il viceversa?
4.8 Formula di Taylor
Consideriamo una funzione f :]a, b[R e ssiamo un punto x
0
]a, b[. Come
sappiamo, se f è continua allora
f(x) f(x
0
) = o(1) per x x
0
,
mentre se f è derivabile allora
f(x) f(x
0
) f
(x
0
)(x x
0
) = o(x x
0
) per x x
0
.
Il risultato che segue generalizza questa proprietà di approssimabilità.
Teorema 4.8.1 (formula di Taylor) Sia f una funzione derivabile k volte
in ]a, b[, ove k N, e sia x
0
]a, b[. Allora esiste un unico polinomio P
k
(x)
di grado al pi` u k, tale che
f(x) P
k
(x) = o
_
(x x
0
)
k
_
per x x
0
;
tale polinomio è
P
k
(x) =
k
n=0
1
n!
f
(n)
(x
0
)(x x
0
)
n
e si chiama k-simo polinomio di Taylor di f di centro x
0
.
Dimostrazione Se k = 0 si vede immediatamente che P
0
(x) = f(x
0
) è
lunico polinomio che verica la tesi. Possiamo quindi supporre k 1.
Tutto il ragionamento è basato sul seguente lemma:
Lemma 4.8.2 Sia g :]a, b[ R una funzione derivabile k volte, con k 1,
e sia x
0
]a, b[. Si ha
g(x) = o
_
(x x
0
)
k
_
per x x
0
se e solo se
g(x
0
) = g
(x
0
) = g
(x
0
) = . . . = g
(k)
(x
0
) = 0.
297
Dimostrazione del lemma (=) Poiche, per ipotesi, per h = 0, 1, . . . , k1
la funzione g
(h)
(x) è innitesima per x x
0
, usando ripetutamente il teorema
di de LHopital (teorema 4.7.7) si ha la catena di implicazioni
lim
xx
0
g(x)
(x x
0
)
k
= =
= lim
xx
0
g
(x)
k(x x
0
)
k1
= = . . . = lim
xx
0
g
(k1)
(x)
k!(x x
0
)
= ;
ma questultimo limite vale 0, poiche, per denizione di derivata k-sima,
g
(k1)
(x)
k!(x x
0
)
=
1
k!
g
(k1)
(x) g
(k1)
(x
0
)
x x
0
1
k!
g
(k)
(x
0
) = 0 per x x
0
.
(=) Deniamo
Z = h N : 0 h k, g
(h)
(x
0
) ,= 0 :
dobbiamo provare che Z = . Dallipotesi
lim
xx
0
g(x)
(x x
0
)
k
= 0
si deduce in particolare che g(x) deve essere innitesima per x x
0
, quindi
g(x
0
) = 0 e pertanto 0 / Z. Supponiamo per assurdo che Z non sia vuoto:
allora esso avrà un minimo p 1, e si avrà dunque
g(x
0
) = g
(x
0
) = = g
(p1)
(x
0
) = 0, g
(p)
(x
0
) ,= 0.
Consideriamo allora la forma indeterminata g(x)/(x x
0
)
p
: per il teorema
di de lHopital,
lim
xx
0
g(x)
(x x
0
)
p
= lim
xx
0
g
(x)
p(x x
0
)
p1
= = lim
xx
0
g
(p1)
(x)
p!(x x
0
)
=
g
(p)
(x
0
)
p!
,= 0,
mentre invece, per ipotesi,
lim
xx
0
g(x)
(x x
0
)
p
= lim
xx
0
g(x)
(x x
0
)
k
(x x
0
)
kp
= 0.
Ciò è assurdo e pertanto Z = .
298
Dimostriamo ora la formula di Taylor. Sia P(x) un arbitrario polinomio di
grado k, che possiamo sempre scrivere nella forma
P(x) =
k
n=0
a
n
(x x
0
)
n
(esercizio 4.8.1). Applicando il lemma 4.8.2 alla funzione f(x)P(x), avremo
f(x) P(x) = o
_
(x x
0
)
k
_
per x x
0

f
(n)
(x
0
) = P
(n)
(x
0
) per n = 0, 1, . . . , k;
daltra parte si vede subito che
P(x
0
) = a
0
, P
(x
0
) = a
1
, P
(x
0
) = 2a
2
. . . , P
(k)
(x
0
) = k! a
k
,
e dunque
f(x) P(x) = o
_
(x x
0
)
k
_
per x x
0

a
n
=
1
n!
f
(n)
(x
0
) per n = 0, 1, . . . , k,
cioè P(x) P
k
(x).
Osservazioni 4.8.3 (1) Il grado del k-simo polinomio di Taylor P
k
(x) è al
pi` u k; è esattamente k se e solo se f
(k)
(x
0
) ,= 0.
(2) Il (k + 1)-simo polinomio di Taylor (ammesso che esista, cioè che f sia
derivabile k + 1 volte) si ottiene dal k-simo semplicemente aggiungendo un
termine:
P
k+1
(x) = P
k
(x) +
1
(k + 1)!
f
(k+1)
(x
0
)(x x
0
)
k+1
.
(3) Se f è derivabile k + 1 volte in ]a, b[, si può precisare meglio il modo di
tendere a 0 del resto di Taylor, ossia della dierenza f(x)P
k
(x) per x x
0
:
si ha in tal caso
f(x) P
k
(x) =
1
(k + 1)!
f
(k+1)
()(x x
0
)
k+1
,
ove è un opportuno punto compreso fra x e x
0
. Questo risultato potrebbe
chiamarsi teorema di Lagrange di grado k+1. Se in particolare la funzione
f
(k+1)
è limitata, esso ci dice che
f(x) P
k
(x) = O
_
(x x
0
)
k+1
_
per x x
0
.
299
Per provare il teorema di Lagrange di grado k +1, basta applicare ripetu-
tamente il teorema di Cauchy (teorema 4.3.2):
f(x) P
k
(x)
(x x
0
)
k+1
=
f
(
1
) P
k
(
1
)
(k + 1)(
1
x
0
)
k
= . . . =
=
f
(k)
(
k
) P
(k)
k
(
k
)
(k + 1)!(
k
x
0
)
=
f
(k+1)
()
(k + 1)!
,
ove
1
è intermedio fra x e x
0
,
2
è intermedio fra
1
e x
0
, . . . ,
k
è intermedio
fra
k1
e x
0
, e inne è intermedio fra
k
e x
0
; nellultimo passaggio si è
usato il fatto che P
k
ha grado non superiore a k e dunque P
(k+1)
k
0.
(4) Per scrivere il k-simo polinomio di Taylor di una data funzione f non è
sempre obbligatorio calcolare le derivate di f nel punto x
0
; talvolta conviene
invece far uso della sua proprietà di miglior approssimazione: se riusciamo
a trovare un polinomio P, di grado non superiore a k, tale che
f(x) P(x) = o
_
(x x
0
)
k
_
per x x
0
,
necessariamente esso sarà il k-
simo polinomio di Taylor cerca-
to. Ad esempio, data f(x) =
sin x
5
, chi è il suo quattordicesi-
mo polinomio di Taylor di centro
0? Ricordando che
lim
t0
sin t t
t
3
=
1
6
(esercizio 3.3.12), avremo anche
lim
x0
sin x
5
x
5
x
15
=
1
6
(esercizio 3.3.10); in particolare
sin x
5
x
5
= O(x
15
) = o(x
14
)
per x 0, e dunque P
14
(x) = x
5
. Naturalmente si ha anche P
13
(x) =
P
12
(x) = . . . = P
5
(x) = x
5
, mentre, essendo
sin x
5
= O(x
5
) = o(x
4
) per x 0,
300
si ha P
4
(x) = P
3
(x) = P
2
(x) = P
1
(x) = P
0
(x) = 0.
Vediamo adesso quali sono le strettissime relazioni che intercorrono fra la
somma f(x) di una serie di potenze, la serie stessa e i polinomi di Taylor
della funzione f. Supponiamo che risulti
f(x) =
n=0
a
n
x
n
, x ] R, R[,
ove R ]0, +]. Come sappiamo (teorema 4.1.11), si ha
a
n
=
1
n!
f
(n)
(0) n N,
e dunque per ogni k N la somma parziale k-sima della serie coincide con il
k-simo polinomio di Taylor di f di centro 0. Abbiamo perciò per ogni k N,
in virt` u della formula di Taylor,
f(x) P
k
(x) =
n=k+1
a
n
x
n
= o(x
k
) per x 0.
Le somme parziali di una serie di potenze godono quindi di una duplice
proprietà:
(a) in quanto tali, esse vericano, per denizione di serie convergente,
lim
k
_
f(x)
k
n=0
a
n
x
n
_
= 0 x ] R, R[,
cioè forniscono unapprossimazione globale del graco di f in ] R, R[
tanto pi` u accurata quanto pi` u k è grande;
(b) in quanto polinomi di Taylor di centro 0, vericano
lim
xx
0
1
x
k
_
f(x)
k
n=0
a
n
x
n
_
= 0 k N,
cioè forniscono unapprossimazione locale del graco di f nellintorno
di 0 tanto pi` u accurata quanto pi` u x è vicino a 0.
301
Si noti che esistono funzioni di classe C
, per le quali dunque i P

k
(x) sono
deniti per ogni k N, e (per denizione) soddisfano la condizione
lim
xx
0
f(x) P
k
(x)
(x x
0
)
k
= 0 k N,
e che tuttavia vericano per ogni x ,= x
0
lim
k
[f(x) P
k
(x)] ,= 0
(esercizio 4.8.8).
Osserviamo inne che luso della formula di Taylor è utilissimo nel calcolo
dei limiti di forme indeterminate, come mostrano i seguenti esempi.
Esempi 4.8.4 (1) Per calcolare il limite
lim
x0
e
x
2
/2
cos x x
2
x
2
si può osservare che per x 0 risulta
e
x
2
/2
= 1 +
x
2
2
+ o(x
2
), cos x = 1
x
2
2
+ o(x
3
),
e che dunque
e
x
2
/2
cos x x
2
= o(x
2
) per x 0;
pertanto
lim
x0
e
x
2
/2
cos x x
2
x
2
= lim
x0
o(x
2
)
x
2
= 0.
Invece per calcolare il limite
lim
x0
e
x
2
/2
cos x x
2
x
4
occorre scrivere anche i termini del quarto ordine: poiche
e
x
2
/2
cos x x
2
=
=
_
1 +
x
2
2
+
x
4
8
+ o(x
4
)
_
_
1
x
2
2
+
x
4
24
+ o(x
5
)
_
x
2
=
=
x
4
12
+ o(x
4
),
302
si ha
lim
x0
e
x
2
/2
cos x x
2
x
4
= lim
x0
x
4
12
+ o(x
4
)
x
4
=
1
12
.
(2) Per il limite
lim
x0
1 + sin
2
x
1 +x
2
sin x
4
luso del teorema di de LHopital appare poco pratico, perche derivando nu-
meratore e denominatore compaiono espressioni alquanto complicate. Invece,
usando la formula di Taylor, per x 0 risulta (esempio 4.3.5 (3))
sin x
4
= x
4
+ o(x
11
),
1 +x
2
= 1 +
1
2
x
2
1
8
x
4
+ O(x
5
),
_
1 + sin
2
x = 1 +
1
2
sin
2
x
1
8
sin
4
x + o(sin
5
x) =
= 1 +
1
2
_
x
1
6
x
3
+ o(x
4
)
_
2
1
8
_
x + o(x
2
)
_
4
=
= 1 +
1
2
_
x
2
1
3
x
4
_
1
8
x
4
+ o(x
5
) =
= 1 +
1
2
x
2
7
24
x
4
+ o(x
5
),
e pertanto, grazie al principio di sostituzione degli innitesimi,
lim
x0
1 + sin
2
x
1 +x
2
sin x
4
= lim
x0
_
7
24

1
8
_
x
4
+ o(x
5
)
x
4
+ o(x
11
)
=
1
6
.
Formula di Taylor per funzioni di pi` u variabili
La formula di Taylor si può enunciare anche per le funzioni di m variabili.
A questo scopo occorre introdurre alcune comode notazioni. Un vettore p a
componenti intere non negative, ossia un elemento di N
m
, si chiama multi-
indice. Dato un multi-indice p, di componenti (p
1
, ..., p
m
), si deniscono
loperatore di derivazione D
p
D
p
= D
p
1
1
D
p
2
2
. . . D
pm
m
,
303
ed il monomio x
p
x
p
= (x
1
)
p
1
. . . (x
m
)
pm
.
Inoltre si pone
p! = p
1
! . . . p
m
! .
Altre notazioni di uso comune sono quelle che seguono: se p, q N
m
, si
scrive q p se risulta q
i
p
i
per i = 1, . . . , m; in tal caso si denisce
_
p
q
_
=
_
p
1
q
1
_
. . .
_
p
m
q
m
_
.
Ciò premesso, vale un risultato del tutto analogo al caso delle funzioni di una
sola variabile (teorema 4.8.1).
Teorema 4.8.5 (formula di Taylor in pi` u variabili) Sia f una funzio-
ne di classe C
k
denita in un aperto A di R
m
, ove k N, e sia x
0
A.
Allora esiste un unico polinomio P
k
(x) di grado al pi` u k, tale che
f(x) P
k
(x) = o
_
[x x
0
[
k
m
_
per x x
0
;
tale polinomio è
P
k
(x) =
|p|k
1
p!
D
p
f(x
0
)(x x
0
)
p
e si chiama k-simo polinomio di Taylor di f di centro x
0
.
Dimostrazione Se k = 0 non cè niente da dimostrare: il polinomio P
0
è
la costante f(x
0
). Sia dunque k 1. Fissata una generica direzione v, per
> 0 sucientemente piccolo è certamente ben denita la funzione
F(t) = f(x
0
+tv), t [, ].
Essa è di classe C
k
e si ha
F
(t) =
m
i=1
D
i
f(x
0
+tv)v
i
,
F
(t) =
m
i,j=1
D
j
D
i
f(x
0
+tv)v
i
v
j
,
304
e in generale, per 1 h k,
F
(h)
(t) =
m
i
1
,...,i
h
=1
D
i
1
. . . D
i
h
f(x
0
+tv)v
i
1
. . . v
i
h
.
La seconda somma si può scrivere nella forma
F
(t) =
|p|=2
2!
p!
D
p
f(x
0
+tv)v
p
:
infatti, in virt` u del teorema di Schwarz (teorema 4.6.4), le derivate D
i
D
j
,
ossia le D
p
con p = e
i
+e
j
, compaiono due volte, mentre le D
2
i
, ossia le D
p
con p = 2e
i
, compaiono una volta sola. Similmente, per 1 h k risulta
F
(h)
(t) =
|p|=h
h!
p!
D
p
f(x
0
+tv)v
p
:
questo si vede osservando che, se [p[ = h, la quantità h!/p! è il numero dei
modi in cui si può ripartire un insieme di k elementi in m sottoinsiemi aventi
rispettivamente p
1
, . . . , p
m
elementi (infatti, il problema è analogo a quello
di distribuire h palline in m urne, mettendone p
1
nelle prima urna, p
2
nella
seconda, . . . , p
m
nellm-sima: possiamo metterne p
1
nella prima urna in
_
h
p
1
_
modi, p
2
nella seconda urna in
_
hp
1
p
2
_
modi, . . . , p
m1
nella penultima urna
in
_
hp
1
...p
m2
p
m1
_
modi, e inne ci resta un solo modo di mettere le residue p
m
palline nellultima urna. Il numero di modi complessivo è allora il prodotto
dei binomiali, cioè
m1
j=1
(h p
1
. . . p
j1
)!
(p
j
)!(h p
1
. . . p
j1
p
j
)!
=
h!
(p
1
)!(p
2
)! (p
m
)!
=
h!
p!
.
Scriviamo adesso la formula di Taylor per F nel punto t = 0: per il teorema
4.8.1 risulta
F(t) =
k
h=0
F
(h)
(0)
h!
t
h
+R
k
(t), t [, ],
dove R
k
(t) è una funzione tale che
lim
t0
R
k
(t)
t
k
= 0.
305
Sostituendo le espressioni trovate per le derivate di F, e ponendo x = x
0
+tv
con [t[ , otteniamo
f(x) = F(t) =
k
h=0
t
h
h!
|p|=h
h!
p!
D
p
f(x
0
)
_
x x
0
t
_
p
+R
k
(t),
ovvero
f(x) =
|p|h
1
p!
D
p
f(x
0
)(x x
0
)
p
+R
k
([x x
0
[
m
).
Proviamo lunicità del k-simo polinomio di Taylor di f: sia P(x) un altro
polinomio di grado al pi` u k, sviluppato secondo le potenze di x x
0
, che
verica la tesi. Allora, posto Q = P
k
P, possiamo scrivere
Q(x) =
|p|k
c
p
(x x
0
)
p
, lim
xx
0
Q(x)
[x x
0
[
k
m
= 0.
Ne deduciamo che, posto x = x
0
+tv,
lim
t0
Q(x
0
+tv)
t
k
= 0 v R
m
con [v[
m
= 1.
Si ha dunque, per ogni v R
m
con [v[
m
= 1,
0 = lim
t0
Q(x
0
+tv)
t
k
= lim
t0
k
h=0
|p|=h
c
p
t
hk
v
p
,
e questo implica, come è immediato vericare,
|p|=h
c
p
v
p
= 0 v R
m
con [v[ = 1, h 0, 1, . . . , k,
da cui, per omogeneità,
|p|=h
c
p
x
p
= 0 x R
m
, h 0, 1, . . . , k.
Da queste relazioni segue
q! c
q
= D
q
|p|=h
c
p
x
p
= 0 q N
m
con [q[ = h, h 0, 1, . . . , k,
ossia Q(x) 0. Ciò prova che P = P
k
.
306
Esercizi 4.8
1. Sia P(x) =
k
n=0
a
n
x
n
un polinomio. Si provi che per ogni x
0
R
esistono unici b
0
, b
1
,. . . ,b
k
R tali che
P(x) =
k
h=0
b
h
(x x
0
)
h
x R.
[Traccia: scrivere x = (x x
0
) +x
0
e usare la formula di Newton per
il binomio.]
2. Scrivere il decimo polinomio di Taylor di centro 0 per le funzioni:
(a) x sin x
2
; (b) x sin
2
x; (c) log(1 + 3x
3
); (d)
1 2x
4
.
3. Scrivere il k-simo polinomio di Taylor di centro

4
per le funzioni sin x
e cos x.
4. Sia f(x) = x +x
4
; scrivere tutti i polinomi di Taylor di f di centro 1.
5. Si calcoli una approssimazione di sin 1 a meno di 10
4
.
6. Scrivere il secondo polinomio di Taylor di centro 0 per la funzione
f(x) = log(1 +e
x
)
x
2
, e calcolare il limite
lim
x0
f(x) P
2
(x)
x
4
.
307
7. Calcolare, usando la formula di Taylor, i seguenti limiti:
(i) lim
x0
log cos x
x
2
; (ii) lim
x0
+
x sin
2
x sin
2
x
x
2
;
(iii) lim
x0
_
1
x tan x

1
x
2
_
; (iv) lim
x0
1 cos x + log cos x
x
4
;
(v) lim
x0
cosh
2
x 1 x
2
x
4
; (vi) lim
x0
1
x
2
_
sin x
x

x
sin x
_
;
(vii) lim
x0
_
sin 2x
2x
_ 1
x
2
; (viii) lim
x0
sin x(5
x
2
x
)
sin x log(1 x)
;
(ix) lim
x0
e
sin x
1 x
x
2
; (x) lim
x+
_
2x
2
x
3
log
_
1 + sin
2
x
__
;
(xi) lim
n
n
2/n
1
log n
1/n
; (xii) lim
n
n
2
_
1
1 +e
1/n

2n 1
4n
_
;
(xiii) lim
n
n
1/n
1
log n
1/n
; (xiv) lim
n
_
(n
4
+n
3
+ 1)
1/4
n
_
;
(xv) lim
x0
+
(cos x)
log x
; (xvi) lim
x1
x
1
1x
e
x
x 1
.
8. Sia f : R R la funzione denita da
f(x) =
_
e
1
x
2
se x ,= 0
0 se x = 0.
Provare che:
(i) f è innite volte derivabile in R;
(ii) per ogni k N il k-simo polinomio di Taylor di f di centro 0 è
P
k
(x) 0;
308
(iii) per ogni R > 0 non esiste alcuna serie di potenze cha abbia somma
uguale a f(x) in ] R, R[.
[Traccia: si provi per induzione che
f
(n)
(x) =
_
Q
n
(x)e
1
x
2
se x ,= 0
0 se x = 0,
ove Q
n
(x) è unopportuna funzione razionale, cioè è il quoziente di due
polinomi.]
9. Sia f C
k
[a, b] una funzione invertibile; provare che f
1
è di classe
C
k
.
10. Posto f(x) = x + e
x
, si verichi che la funzione inversa f
1
esiste e
se ne scrivano esplicitamente il secondo e terzo polinomio di Taylor di
centro 1.
11. Si determini il terzo polinomio di Taylor di centro (0, 0) per le funzioni
f
1
(x, y) =
cos x
cos y
, f
2
(x, y) = ye
xy
, f
3
(x, y) = log
1 +x
2
1 +y
2
.
12. Provare che se f è una funzione di classe C
k+1
in un aperto A di R
m
, e
se x
0
A, allora il k-simo resto di Taylor di f può essere scritto nella
forma
f(x) P
k
(x) =
|p|=k+1
D
p
f(u)(x x
0
)
p
,
ove u è un punto del segmento di estremi x
0
e x.
[Traccia: applicare il teorema di Lagrange di grado k + 1 alla
funzione F(t) = f(x
0
+t(x x
0
)).]
13. Dimostrare la formula di Leibniz per la derivata di ordine p N
m
del
prodotto di due funzioni:
D
p
(fg) =
qp
_
p
q
_
D
q
fD
pq
g.
[Traccia: Ragionare per induzione su [p[...]
309
4.9 Massimi e minimi relativi per funzioni di
una variabile
La forma del graco di una funzione f nellintorno di un punto è strettamente
legata al comportamento delle derivate di f in tale punto. Andiamo ad
analizzare la questione, cominciando dal caso delle funzioni di una variabile.
Proposizione 4.9.1 Sia f : [a, b] R una funzione derivabile. Allora:
(i) f è crescente in [a, b] se e solo se f
0 in [a, b];
(ii) f è decrescente in [a, b] se e solo se f
0 in [a, b];
(iii) se f
> 0 in [a, b] allora f è strettamente crescente in [a, b], ma il

viceversa è falso;
(iv) se f
< 0 in [a, b] allora f è strettamente decrescente in [a, b], ma il

viceversa è falso.
Dimostrazione (i) Se f è crescente in [a, b], allora ssato x
0
[a, b] si
ha f(x) f(x
0
) se x > x
0
e f(x) f(x
0
) se x < x
0
; quindi il rapporto
incrementale di f in x
0
è sempre non negativo. Facendone il limite per
x x
0
si ottiene f
(x
0
) 0 per ogni x
0
[a, b].
Viceversa, sia f
0 in [a, b] e siano x
, x
[a, b] con x
< x
. Applicando il
teorema di Lagrange (teorema 4.3.3) nellintervallo [x
, x
] si trova che esiste

]x
, x
[ tale che
f(x
) f(x
)
x
= f
() 0,
da cui segue f(x
) f(x
). Quindi f è crescente.
(ii) Segue da (i) applicata a f.
(iii) Si ottiene ragionando come nel viceversa di (i), osservando che stavolta
si ha f
() > 0.
(iv) Segue da (iii) applicata a f.
Inne, il viceversa di (iii) e (iv) è falso perche le funzioni x
3
sono stretta-
mente monotone in R ma hanno derivata prima che si annulla in 0.
m
, ove m N
+
, e sia f : A
R una funzione qualunque; sia x
0
A. Diciamo che x
0
è punto di massimo
310
relativo (oppure punto di minimo relativo) per f, se esiste un intorno U di
x
0
in R
m
tale che
f(x) f(x
0
) x U A (oppure f(x) f(x
0
) x U A).
Naturalmente, i punti di
massimo (minimo) di f so-
no anche punti di massimo
(minimo) relativo, mentre il
viceversa non è vero. La -
gura accanto illustra il caso
m = 1, A = [a, b].
Teorema 4.9.3 (di Fermat) Sia f : [a, b] R una funzione derivabile, e
sia x
0
]a, b[. Se x
0
è punto di massimo o di minimo relativo per f, allora
f
(x
0
) = 0. Il viceversa è falso.
Dimostrazione Si ragiona come nella dimostrazione del teorema di Rolle
(teorema 4.3.1): se x
0
è punto di massimo relativo esiste un intorno I di x
0
tale che
f(x) f(x
0
)
x x
0
_
0 se x I]a, x
0
[
0 se x I]x
0
, b],
quindi passando al limite per x x
0
si trova f
(x
0
) = 0. Lesempio f(x) =
x
3
, con x
0
= 0, mostra che il viceversa è falso.
Discorso analogo per i punti di minimo relativo.
Osserviamo che se il punto di massimo o di minimo relativo è un estremo
dellintervallo, la precedente proposizione non vale (esercizio 4.9.6).
Il seguente risultato caratterizza i punti di massimo e di minimo relativo per
funzioni di una variabile.
Teorema 4.9.4 Sia f : [a, b] R una funzione derivabile due volte, e sia
x
0
]a, b[. Valgono i seguenti fatti:
(i) se x
0
è punto di massimo relativo per f, allora f
(x
0
) = 0 e f
(x
0
) 0,
ma il viceversa è falso;
(ii) se x
0
è punto di minimo relativo per f, allora f
(x
0
) = 0 e f
(x
0
) 0,
ma il viceversa è falso;
311
(iii) se f
(x
0
) = 0 e f
(x
0
) < 0, allora x
0
è punto di massimo relativo per
f, ma il viceversa è falso;
(iv) se f
(x
0
) = 0 e f
(x
0
) > 0, allora x
0
è punto di minimo relativo per f,
ma il viceversa è falso.
Dimostrazione (i) Già sappiamo (proposizione 4.9.3) che f
(x
0
) = 0; pro-
viamo che f
(x
0
) 0. Supponendo, per assurdo, che f
(x
0
) > 0, per il
teorema di permanenza del segno (esercizio 3.2.3) risulta
f
(x) f
(x
0
)
x x
0
=
f
(x)
x x
0
> 0
in un intorno I di x
0
, e dunque
f
(x)
_
< 0 se x I [a, x
0
[
> 0 se x I]x
0
, b].
Ma allora, per la proposizione 4.9.1, f decresce in I [a, x
0
[ e cresce in
I]x
0
, b[, cosicche x
0
non può essere un punto di massimo relativo per f.
(ii) Analogo a (i).
(iii) Lo stesso ragionamento di (i) mostra che se f
(x
0
) < 0 e f
(x
0
) = 0,
allora f cresce in I [a, x
0
[ e decresce in I [x
0
, b[, e quindi x
0
è punto di
massimo relativo.
(iv) Analogo a (iii).
Inne, la funzione f(x) = x
4
nel punto 0 verica f
(0) = 0 e f
(0) = 0,
ma 0 non è punto di massimo relativo (il che rende falso il viceversa di (i)),
ed è, anzi, punto di minimo assoluto, il che rende falso il viceversa di (iv).
La funzione f(x) = x
4
nel punto 0 rende falsi i viceversa degli altri due
enunciati.
Esercizi 4.9
1. Determinare, se esistono, il massimo ed il minimo delle seguenti funzioni
sugli insiemi indicati:
(i) [x
2
1[, x [2, 12]; (ii)
1 + sin e
x
, x 0;
(iii) log(e
x
x), x [1, 1]; (iv) 14x
2/3
x
2
, x [5, 5];
(v) e
x
4
sin x
1/4
, x 0; (vi) arctan x
x
1 +x
2
, x R.
312
2. Fra tutti i rettangoli inscritti in una circonferenza, determinare quello
di area massima.
3. Fra tutti i cilindri a base rotonda inscritti in una sfera, determinare
quello di volume massimo.
4. Dimostrare che per ogni x, y 0 si ha
(x+y)
p
2
p1
(x
p
+y
p
) se p 1, (x+y)
p
x
p
+y
p
se 0 p 1.
5. Provare che:
(i) x e
1/x
> 1 x > 0;
(ii) 2 sin x + tan x > 3x x ]0, /2[;
(iii)
2x
2 x
2
> tan x x ]0,
2[;
(iv) 0
arctan x
x

1
1 +x
2

x
2
1 +x
2
x R.
6. Provare che se f C
1
[a, b] e se f ha un massimo (minimo) relativo nel-
lestremo a, allora f
(a) 0 (f
(a) 0). Enunciare lanalogo risultato

nel caso in cui f ha un massimo (minimo) relativo nellestremo b.
4.10 Forme quadratiche
Nel caso delle funzioni di pi` u variabili, le condizioni perche un punto x
0
sia di massimo o di minimo relativo per una funzione f sono opportune
generalizzazioni di quelle del teorema 4.9.4, e coinvolgono, in luogo di f
e
di f
, il gradiente di f e la matrice Hessiana (cioè la matrice delle derivate

seconde) di f nel punto x
0
; per enunciare tali condizioni, è però necessario
uno studio preliminare delle cosiddette forme quadratiche in R
m
.
Data una matrice A = a
ij
, m m, reale e simmetrica, la funzione :
R
m
R denita da
(v) = Av v =
m
i,j=1
a
ij
v
i
v
j
, v R
m
,
è detta forma quadratica associata ad A.
Una forma quadratica è dunque un polinomio di secondo grado in m variabili,
313
privo di termini di grado inferiore; viceversa, un qualunque polinomio di
questo tipo è una forma quadratica la cui matrice associata A = a
ij
è
univocamente determinata dai coecienti del polinomio (esercizio 4.10.4).
In particolare, risulta
(tv) = t
2
(v) t R, v R
m
,
cosicche è una funzione omogenea di grado 2 (esercizio 4.4.3). Inoltre,
ovviamente, si ha C
(R
m
); verichiamo che risulta
grad(v) = 2Av v R
m
.
In eetti, indicato con
ij
il generico elemento della matrice identità I (co-
sicche
ij
= 0 se i ,= j e
ij
= 1 se i = j), se k = 1, 2, . . . , m si ha per ogni
v R
m
:
D
k
(v) =
m
i,j=1
a
ij
D
k
(v
i
v
j
) =
m
i,j=1
a
ij
_
ik
v
j
+v
i
jk
_
=
=
m
j=1
a
kj
v
j
+
m
i=1
a
ik
v
i
=
m
j=1
a
kj
v
j
+
m
j=1
a
jk
v
j
= 2
m
j=1
a
jk
v
j
= 2(Av)
k
.
Denizione 4.10.1 Una forma quadratica : R
m
R si dice:
denita positiva, se (v) > 0 per ogni v R
m
0;
denita negativa, se (v) < 0 per ogni v R
m
0;
semidenita positiva, se (v) 0 per ogni v R
m
;
semidenita negativa, se (v) 0 per ogni v R
m
;
indenita, se assume sia valori positivi che negativi.
Esempi 4.10.2 Poniamo
A
1
=
_
1 0
0 1
_
, A
2
=
_
1 0
0 1
_
, A
3
=
_
0 0
0 1
_
,
A
4
=
_
1 0
0 0
_
, A
5
=
_
1 0
0 1
_
,
314
e indichiamo con
1
,
2
,
3
,
4
e
5
le forme quadratiche corrispondenti:
1
(x, y) = x
2
+y
2
,
2
(x, y) = x
2
y
2
,
3
(x, y) = y
2
,
4
(x, y) = x
2
,
5
(x, y) = x
2
+y
2
.
Allora
1
è denita positiva,
2
è denita negativa,
3
è semidenita positiva,
4
è semidenita negativa,
5
è indenita.
Qualunque sia la matrice A reale e simmetrica, la forma quadratica associata
ad A, essendo una funzione di classe C
, per il teorema di Weierstrass assume

massimo M
0
e minimo m
0
sulla frontiera della palla unitaria di R
m
, la quale
è un insieme compatto. Esistono dunque v
0
, w
0
tali che
m
0
= (v
0
) (v) (w
0
) = M
0
v .
Dato che è una funzione omogenea di grado 2, possiamo scrivere
(v) = [v[
2
m
_
v
[v[
m
_
v R
m
0,
e di conseguenza si ottiene
m
0
[v[
2
m
(v) M
0
[v[
2
m
v R
m
.
Osserviamo ora che un numero complesso si dice autovalore per la matrice
A se esiste un vettore x C
m
0 (detto autovettore relativo allautovalore
) tale che Ax = x. Dato che tale equazione vettoriale è un sistema lineare
omogeneo nelle incognite x
1
, . . . , x
m
, lesistenza di una sua soluzione x ,= 0,
ossia il fatto che sia autovalore per la matrice A, equivale alla condizione
det(A I) = 0. Quindi gli autovalori di A sono le m soluzioni (in C,
ciascuna contata con la sua molteplicità) dellequazione det(A I) = 0.
Si vede facilmente, però, che se A è reale e simmetrica tutti i suoi autovalori
sono reali: infatti se Ax = x con x C
m
0, allora moltiplicando
scalarmente per x (rispetto al prodotto scalare di C
m
) si ha, essendo A reale
e simmetrica:
[x[
2
m
= Ax x = x A
x = x Ax = Ax x,
ove A
= b
ij
è la matrice i cui elementi sono b
ij
= a
ji
. In particolare Ax x
è un numero reale e quindi =
Ax x
|x|
2
m
è reale. Si noti che, di conseguenza,
lautovettore x appartiene a R
m
dato che il sistema Ax = x è a coecienti
reali.
315
Proposizione 4.10.3 Sia A una matrice m m reale e simmetrica e sia
la forma quadratica associata ad A. I numeri m
0
= (v
0
) = min
e
M
0
= (w
0
) = max
, ove = v R
m
: [v[
m
= 1, sono rispettivamente
il minimo ed il massimo autovalore di A. In particolare si ha
m
0
[v[
2
m
(v) M
0
[v[
2
m
v R
m
.
Dimostrazione Consideriamo la funzione F : R
m
R denita da
F(v) =
(v)
[v[
2
m
.
In virt` u dellomogeneità di , si ha
m
0
= F(v
0
) F(v) F(w
0
) = M
0
v R
m
0.
Dallesercizio 4.11.3 segue che
gradF(v
0
) = gradF(w
0
) = 0;
daltra parte se k = 1, . . . , m si ha per ogni v R
m
0:
D
k
F(v) =
D
k
(v)[v[
2
m
(v)D
k
[v[
2
m
[v[
4
m
=
= 2
(Av)
k
[v[
2
m
(v) 2v
k
[v[
4
m
=
2
[v[
2
m
_
(Av)
k
F(v)v
k
_
,
ossia
gradF(v) =
2
[v[
2
m
(Av F(v)v) v R
m
0.
Dunque, ricordando che v
0
, w
0
,
0 = gradF(v
0
) = Av
0
F(v
0
)v
0
= Av
0
m
0
v
0
,
0 = gradF(w
0
) = Aw
0
F(w
0
)w
0
= Aw
0
M
0
w
0
.
Ciò prova che m
0
, M
0
sono autovalori di A. Resta da far vedere che se è
autovalore di A risulta m
0
M
0
: sia u
0
R
m
0 tale che Au
0
= u
0
;
moltiplicando scalarmente per u
0
otteniamo
(u
0
) = Au
0
u
0
= [u
0
[
2
m
e pertanto
m
0
[u
0
[
2
m
(u
0
) = [u
0
[
2
m
M
0
[u
0
[
2
m
.
Dato che u
0
,= 0, ne segue la tesi.
316
Corollario 4.10.4 La forma quadratica , generata da una matrice reale e
simmetrica A, è:
denita positiva, se e solo se tutti gli autovalori di A sono positivi;
denita negativa, se e solo se tutti gli autovalori di A sono negativi;
semidenita positiva, se e solo se tutti gli autovalori di A sono non
negativi;
semidenita negativa, se e solo se tutti gli autovalori di A sono non
positivi;
indenita, se e solo se A ha sia autovalori positivi, sia autovalori
negativi.
Dimostrazione Se è denita positiva, si ha (v) > 0 per ogni v
R
m
0; in particolare m
0
= min
è positivo, e quindi tutti gli autovalori

di A, che per la proposizione 4.10.3 sono non inferiori a m
0
, sono positivi.
Viceversa, se tutti gli autovalori di A sono positivi, il minimo m
0
della forma
quadratica su è positivo in quanto, sempre per la proposizione 4.10.3,
m
0
è un autovalore di A. Per omogeneità, si ha allora (v) m
0
[v[
2
m
> 0
per ogni v R
m
0, ossia è denita positiva.
Discorso analogo per le altre proprietà.
Osservazione 4.10.5 Una forma quadratica è semidenita positiva e non
denita positiva se e solo se il minimo autovalore di A è esattamente 0. Simil-
mente, una forma quadratica è semidenita negativa e non denita negativa
se e solo se il massimo autovalore di A è esattamente 0.
Due criteri pratici per stabilire la natura di una forma quadratica senza
calcolare gli autovalori della matrice (impresa dicoltosa quando m > 2)
sono descritti negli esercizi 4.10.2 e 4.10.3.
Esercizi 4.10
1. Sia A = a
ij
una matrice m m, sia v C
m
. Provare che [Av[
m

|A| [v[
m
, ove
|A| =
_
m
i,j=1
[a
ij
[
2
.
[Traccia: utilizzare la disuguaglianza di Cauchy-Schwarz.]
317
2. Sia A =
_
a b
b c
_
con a, b, c R, e sia la forma quadratica associata
ad A:
(x, y) = ax
2
+ 2bxy +cy
2
.
Si provi che:
(i) è denita positiva se e solo se ac b
2
> 0, a > 0, c > 0;
(ii) è denita negativa se e solo se ac b
2
> 0, a < 0, c < 0;
(iii) è semidenita positiva se e solo se ac b
2
0, a 0, c 0;
(iv) è semidenita negativa se e solo se ac b
2
0, a 0, c 0;
(v) è indenita se e solo se ac b
2
< 0.
3. Sia A una matrice m m reale e simmetrica, siano
1
, . . . ,
m
i suoi
autovalori (non necessariamente tutti distinti). Si provi che:
(i) risulta
(1)
m
det(A I) =
m
i=1
(
i
) =
m
+
m
i=1
a
i
mi
C,
ove
a
1
=
m
i=1
i
, a
2
=
1i<jm
j
,
a
3
=
1i<j<hm
h
, . . . a
m
= (1)
m
m
i=1
i
;
(ii) la forma quadratica (v) = Av v è:
denita negativa se e solo se a
i
> 0 per i = 1, . . . , m;
denita positiva se e solo se (1)
i
a
i
> 0 per i = 1, . . . , m;
semidenita negativa se e solo se a
i
0 per i = 1, . . . , m;
semidenita positiva se e solo se (1)
i
a
i
0 per i = 1, . . . , m;
indenita in tutti gli altri casi.
4. Sia P(v) un polinomio di secondo grado in R
m
, privo di termini di
grado inferiore. Provare che P(v) è la forma quadratica associata alla
matrice A di coecienti a
ij
=
1
2
D
i
D
j
P.
318
5. Determinare, al variare del parametro a R, la natura delle seguenti
forme quadratiche:
(i) (x, y, z) = x
2
+ 2axy +y
2
+ 2axz +z
2
,
(ii) (x, y, z, t) = 2x
2
+ay
2
z
2
t
2
+ 2xz + 4yt + 2azt.
4.11 Massimi e minimi relativi per funzioni
di pi` u variabili
Per le funzioni di pi` u variabili la ricerca dei massimi e dei minimi relativi si
basa su risultati che sono in stretta analogia con quelli validi per funzioni di
una variabile (teorema 4.9.4). Si ha infatti:
Teorema 4.11.1 Sia f C
2
(A), ove A è un aperto di R
m
, e sia x
0
A.
Valgono i seguenti fatti:
(i) se x
0
è un punto di massimo relativo per f, allora gradf(x
0
) = 0 e la
forma quadratica associata alla matrice Hessiana H(x
0
) è semidenita
negativa, ma il viceversa è falso;
(ii) se x
0
è un punto di minimo relativo per f, allora gradf(x
0
) = 0 e la
forma quadratica associata alla matrice Hessiana H(x
0
) è semidenita
positiva, ma il viceversa è falso;
(iii) se gradf(x
0
) = 0 e se la forma quadratica associata a H(x
0
) è denita
negativa, allora x
0
è punto di massimo relativo per f, ma il viceversa
è falso;
(iv) se gradf(x
0
) = 0 e se la forma quadratica associata a H(x) è denita
positiva, allora x
0
è punto di minimo relativo per f, ma il viceversa è
falso.
Premettiamo alla dimostrazione del teorema due risultati che useremo ripe-
tutamente anche in seguito.
319
Lemma 4.11.2 Sia B(x
0
, r) una palla
di R
m
e sia f C
2
(B(x
0
, r)). Fissato
un punto x B(x
0
, r), la funzione F :
[1, 1] R denita da
F(t) = f (x
0
+t(x x
0
))
è di classe C
2
e risulta
F
(t) = gradf (x
0
+t(x x
0
)) (x x
0
) t [1, 1],
F
(t) = H (x
0
+t(x x
0
)) (x x
0
) (x x
0
) t [1, 1].
Dimostrazione Poiche f è di classe C
2
in A, per il teorema di derivazione
delle funzioni composte (teorema 4.1.6) si ha F C
2
[1, 1] e
F
(t) =
m
i=1
f
x
i
(x
0
+t(x x
0
)) (x
i
x
i
0
) =
= gradf (x
0
+t(x x
0
)) (x x
0
),
F
(t) =
m
i,j=1
2
f
x
i
x
j
(x
0
+t(x x
0
)) (x
i
x
i
0
)(x
j
x
j
0
) =
= H (x
0
+t(x x
0
)) (x x
0
) (x x
0
).
Ciò prova la tesi.
Lemma 4.11.3 Sia B(x
0
, r) una palla di R
m
e sia f C
2
(B(x
0
, r)). Per
ogni x B(x
0
, r) esiste ]0, 1[ tale che
f(x) = f(x
0
) + gradf(x
0
) +
1
2
H(x
0
+(x x
0
))(x x
0
) (x x
0
).
Dimostrazione Consideriamo nuovamente la funzione F : [1, 1] R
denita da
F(t) = f (x
0
+t(x x
0
)) .
Per il teorema di Lagrange di grado 2 (osservazione 4.8.3 (3)) esiste ]0, 1[
tale che
F(1) = F(0) +F
(0) +
1
2
F
().
320
Sostituendo in questa espressione i valori di F, F
e F
forniti dal lemma

4.11.2, si ha la tesi.
Dimostrazione del teorema 4.11.1 (i) Sia x
0
un punto di massimo rela-
tivo per f e sia B(x
0
, r) una palla contenuta in A. Fissato arbitrariamente
x B(x
0
, r), la funzione
F(t) = f (x
0
+t(x x
0
)) , t [1, 1],
è di classe C
2
e ha massimo nel punto t = 0: per il teorema 4.9.1 si ha dunque
F
(0) = 0, F
(0) 0. Dal lemma 4.11.2 otteniamo

F
(0) = gradf(x
0
) (x x
0
) = 0, F
(0) = H(x
0
)(x x
0
) (x x
0
) 0.
Dato che x era stato scelto arbitrariamente in B(x
0
, r), il vettore v = xx
0
è un arbitrario elemento di B(0, r); moltiplicando per [0, [, e scrivendo
nuovamente v al posto di v, le due relazioni precedenti equivalgono a
gradf(x
0
) v = 0, H(x
0
)v v 0 v R
m
.
La prima di queste due condizioni, scelto v = gradf(x
0
), dice che f ha gra-
diente nullo nel punto x
0
; la seconda condizione dice che la forma quadratica
associata a H(x
0
) è semidenita negativa. Ciò prova (i).
(ii) Analoga a (i).
(iii) Sia gradf(x
0
) = 0 e H(x
0
)v v < 0 per ogni v R
m
0. Allora gli
autovalori di H(x
0
) sono tutti negativi ed in particolare, detto il massimo
di essi, si ha (proposizione 4.10.3)
H(x
0
)v v [v[
2
m
v R
m
.
Sia r > 0 tale che B(x
0
, r) A: proviamo che se r è abbastanza piccolo si
ha anche
H(x)v v
2
[v[
2
m
v R
m
, x B(x
0
, r).
Infatti se x B(x
0
, r) abbiamo
H(x)v v = [H(x) H(x
0
)]v v +H(x
0
)v v
[H(x) H(x
0
)]v v
[v[
2
m
;
321
daltra parte, utilizzando lesercizio 4.10.1, si trova
[H(x) H(x
0
)]v v
|H(x) H(x
0
)| [v[
2
m
,
ove
|H(x) H(x
0
)| =
_
m
i,j=1
[D
i
D
j
f(x) D
i
D
j
f(x
0
)[
2
.
Dunque, per la continuità delle derivate seconde di f, lultimo membro è
minore di

2
[v[
2
m
se r è sucientemente piccolo.
Fissato ora arbitrariamente x B(x
0
, r), per il lemma 4.11.3 possiamo
scrivere, ricordando che gradf(x
0
) = 0,
f(x) f(x
0
) =
1
2
H(x
0
+(x x
0
))(x x
0
) (x x
0
),
ove è un punto opportuno fra 0 e 1: dunque x
0
+(xx
0
) B(x
0
, r). Per
come abbiamo scelto r si ha allora
H(x
0
+(x x
0
))(x x
0
) (x x
0
)
2
[x x
0
[
2
m
,
e pertanto si ottiene
f(x) f(x
0
) <
4
[x x
0
[
2
m
< 0 x B(x
0
, r).
Ciò prova che x
0
è punto di massimo relativo.
(iv) Analogo a (iii).
Inne, il viceversa di (ii) è falso: infatti la funzione f(x, y) = x
2
y
4
ha
gradiente nullo nellorigine e Hessiana H(0, 0) =
_
2 0
0 0
_
, cosicche la forma
quadratica associata è semidenita positiva, ma lorigine non è punto di
minimo relativo perche f(0, 0) = 0 e f(0, y) < 0 per ogni y R 0. La
funzione f rende falso il viceversa di (i). Le funzioni (x
4
+ y
4
) rendono
falsi i viceversa di (iv) e (iii), in quanto nellorigine hanno rispettivamente
minimo e massimo assoluto pur avendo le matrici Hessiane nulle.
Osservazione 4.11.4 Un punto x
0
tale che gradf(x
0
) = 0 si dice punto
stazionario per f. Se x
0
è stazionario per f, il piano tangente al graco
322
di f in (x
0
, f(x
0
)) è orizzontale, ossia ortogonale allasse x
n+1
. Un punto
stazionario può non essere ne di massimo ne di minimo relativo: in tal caso
esso si dice punto di sella. Ciò accade se la forma H(x
0
)v v è indenita, ma
non solo, come mostra lesempio della funzione f(x, y) = x
2
y
4
visto sopra,
in cui la forma è semidenita.
Esempio 4.11.5 Sia f(x, y) = 2x
3
+ x
2
+ y
2
, (x, y) R
2
. Cerchiamo gli
eventuali massimi e minimi relativi di f. I punti stazionari si ottengono dal
sistema
_
f
x
(x, y) = 6x
2
+ 2x = 0
f
y
(x, y) = 2y = 0,
le cui soluzioni sono (x, y) = (0, 0) oppure (x, y) = (
1
3
, 0). Poiche f
xx
(x, y) =
12x + 2, f
xy
(x, y) = f
yx
(x, y) = 0, f
yy
(x, y) = 2, si ha
H(0, 0) =
_
2 0
0 2
_
, H
_
1
3
, 0
_
=
_
2 0
0 2
_
;
quindi le rispettive forme quadratiche sono denita positiva la prima e inde-
nita la seconda. Conclusione: (0, 0) è punto di minimo relativo e (
1
3
, 0) è
punto di sella.
Esercizi 4.11
1. Dato un foglio rettangolare di cartone, ritagliare da esso 4 quadrati in
modo da costruire una scatola parallelepipeda di volume massimo.
2. Fra tutti i coni circolari circoscritti ad una sfera, determinare quello di
supercie laterale minima.
3. Provare che se A è un aperto di R
m
, se f : A R è una funzione
dierenziabile e se f ha un massimo o minimo relativo in x
0
A,
allora x
0
è punto stazionario per f, cioè gradf(x
0
) = 0; si mostri anche
che il viceversa è falso.
4. (Teorema di Rolle multidimensionale) Sia K R
m
un insieme compat-
to con parte interna non vuota e sia f continua su K e dierenziabile
nei punti interni di K. Provare che se f è costante su K allora esiste
un punto stazionario per f interno a K.
[Traccia: adattare la dimostrazione del teorema di Rolle (teorema
4.3.1).]
323
5. Determinare, se esistono, i massimi ed i minimi relativi delle seguenti
funzioni:
(i) f(x, y) = [y[ arctan(xe
y
) in A = (x, y) R
2
: max[x[, [y[ 1;
(ii) f(x, y) = x
2
y
2
sul chiuso delimitato dal triangolo di vertici (0, 0),
(3, 1), (1, 3).
6. Determinare il triangolo inscritto in un cerchio che ha area massima.
7. Dati tre punti A, B, C ai vertici di un triangolo equilatero, determinare
un quarto punto P in modo che la somma delle distanze di P da A, B, C
sia minima.
8. Dati k punti (x
i
, y
i
) R
2
con ascisse distinte, trovare una retta y =
ax +b tale che lerrore quadratico totale
E(a, b) =
k
j=1
[ax
j
+b y
j
[
2
sia minimo.
9. Determinare la minima distanza in R
3
del punto (1, 2, 3) dalla retta r
di equazioni
x =
y
3
=
z
2
.
10. Determinare la minima distanza fra le rette r
1
e r
2
di R
3
denite
rispettivamente da
x 1 =
y 2
3
=
z 2
2
,
x
4
= y =
z
2
.
11. Trovare i massimi relativi ed assoluti (se esistono) delle seguenti fun-
324
zioni:
(i) x
2
(x y), (ii) x
4
+y
4
4xy,
(iii) (x
2
+y
2
)e
x
2
y
2
, (iv) cos x sinh y,
(v) sin(x +y) cos(x y), (vi) x
2
(y 1)
3
(z + 2)
2
,
(vii)
1
x
+
1
y
+
1
z
+xyz (con x, y, z > 0), (viii)
1 +x y
_
1 +x
2
+y
2
,
(ix) cos x + cos y + cos(x +y), (x) xy
_
1 x
2
y
2
,
(xi) x +
y
2
4x
+
x
2
y
+
2
z
(con x, y, z > 0), (xii) e
x3y
e
y+2x
,
(xiii) x
2
log(1 +y) +x
2
y
2
, (xiv) (x
2
+ 3xy
2
+ 2y
4
)
2
,
(xv) 2x
4
x
2
e
y
+e
4y
, (xvi)
x
2
+ 2y
x
2
+y
2
+ 1
.
4.12 Convessità
Unimportante proprietà geometrica degli insiemi di R
m
, che si descrive bene
analiticamente, è quella della convessità.
Denizione 4.12.1 Un sottoinsieme K di R
m
oppure di C
m
si dice convesso
se per ogni coppia di punti u, v K si ha (1t)u+tv K per ogni t [0, 1].
In altre parole: K è convesso se e solo se, dati due punti di K, il segmento
che li unisce è interamente contenuto in K.
Ad esempio, sono convesse le palle B(x
0
, r), sia aperte che chiuse. Se K R
è facile vedere che K è convesso se e solo se K è un intervallo (limitato o no,
o eventualmente ridotto a un solo punto).
La nozione di convessità si applica anche alle funzioni f : K R, ove K è
un sottoinsieme convesso di R
m
o di C
m
.
Denizione 4.12.2 Sia K un convesso di R
m
o di C
m
. Una funzione f :
K R si dice convessa se risulta
f ((1 t)u +tv) (1 t)f(u) +tf(v) t [0, 1], u, v K.
La funzione f si dice concava se f è convessa; dunque f è concava in K se
e solo se
f ((1 t)u +tv) (1 t)f(u) +tf(v) t [0, 1], u, v K.
325
Linterpretazione geometrica è la se-
guente: per ogni t [0, 1], il punto
(x, y) R
m+1
di coordinate x = (1
t)u+tv, y = (1t)f(u)+tf(v) appar-
tiene al segmento di estremi (u, f(u),
(v, f(v)); la condizione di convessità
dice che il valore f(x) non supera y.
Quindi il graco della restrizione di f al
segmento di estremi u e v sta al di sot-
to della retta che congiunge gli estremi
(u, f(u)) e (v, f(v)) del graco.
Osservazioni 4.12.3 (1) Si vede facilmente che f è convessa se e solo se il
suo sopragraco
E = (x, y) R
m+1
: x K, y f(x)
è un insieme convesso. Infatti se f è convessa e (u, ), (v, ) E, allora per
ogni t [0, 1]
f ((1 t)u +tv) (1 t)f(u) +tf(v) (1 t) +t,
cioè il punto (1 t)(u, ) + t(v, ) appartiene ad E; dunque E è convesso.
Viceversa, se E è convesso allora, scelti in particolare due punti del tipo
(u, f(u)) e (v, f(v)), per ogni t [0, 1] il punto (1 t)(u, f(u)) +t(v, f(v))
deve stare in E: quindi
(1 t)f(u) +tf(v) f ((1 t)u +tv) ,
cioè f è convessa.
(2) Una funzione convessa su K è necessariamente continua nei punti interni
a K (se esistono). Dimostriamo questo fatto per m = 1, rinviando alleserci-
zio 4.12.9 per il caso generale.
Sia dunque K = [a, b] e sia x
0
]a, b[: se ad esempio x > x
0
, esistono unici
t, s ]0, 1[ tali che
x = (1 t)x
0
+tb, x
0
= (1 s)x +sa;
infatti risulta
t =
x x
0
b x
0
, s =
x
0
x
a x
.
326
Dalla denizione di convessità si ha
f(x) (1 t)f(x
0
) +tf(b), f(x
0
) (1 s)f(x) +sf(a),
o, equivalentemente,
f(x) f(x
0
) t (f(b) f(x
0
)) , f(x
0
) f(x)
s
1 s
(f(a) f(x
0
)) .
Daltronde, quando x x
+
0
si ha anche t 0
+
e s 0
+
, e quindi f(x)
f(x
0
).
Il discorso è del tutto analogo se x < x
0
. Ciò prova la continuità di f.
Se la funzione f : K R ha un po pi` u di regolarità, si possono dare altre
caratterizzazioni della convessità.
Teorema 4.12.4 Sia f una funzione reale dierenziabile, denita su un
insieme convesso K R
m
. Allora f è convessa se e solo se
f(x) f(x
0
) + gradf(x
0
) (x x
0
) x, x
0
K.
In altre parole, f è convessa se e solo se
il suo graco sta sopra tutti i suoi piani
(m-dimensionali) tangenti.
Dimostrazione (=) Supponiamo
che valga la disuguaglianza sopra scrit-
ta. Siano x
1
e x
2
due punti distinti di K
e sia x
0
= tx
1
+(1 t)x
2
con t [0, 1].
Posto h = x
1
x
0
, risulta
x
2
=
x
0
tx
1
1 t
= x
0
t
1 t
h.
Dalle relazioni, vere per ipotesi,
f(x
1
) f(x
0
) + gradf(x
0
) h,
f(x
2
) f(x
0
) + gradf(x
0
)
_
t
1 t
h
_
,
segue, moltiplicando la prima per t e sommandola alla seconda moltiplicata
per 1 t:
tf(x
1
) + (1 t)f(x
2
) f(x
0
),
327
che è la denizione di convessità.
(=) Supponiamo f convessa. Siano x, x
0
K. Posto h = x x
0
, per
lipotesi di convessità si ha
f(x
0
+th) = f((1 t)x
0
+tx) (1 t)f(x
0
) +tf(x) =
= f(x
0
) +t (f(x
0
+h) f(x
0
)) t [0, 1],
da cui, sempre per t [0, 1],
f(x
0
+th) f(x
0
) t gradf(x
0
) h t (f(x
0
+h) f(x
0
) gradf(x
0
) h) .
Dividendo per t ]0, 1] segue
f(x
0
+th) f(x
0
) t gradf(x
0
) h
t
f(x
0
+h) f(x
0
) gradf(x
0
) h,
e inne dalla dierenziabilità, facendo tendere t a 0, si ricava
0 f(x
0
+h) f(x
0
) gradf(x
0
) h,
che è la tesi.
Teorema 4.12.5 Sia f una funzione reale di classe C
2
, denita su un in-
sieme convesso K R
m
. Allora f è convessa se e solo se, detta H(x) la
matrice Hessiana di f, la forma quadratica associata (v) = H(x)v v è
semidenita positiva per ogni x K.
Dimostrazione (=) Supponiamo che sia semidenita positiva per ogni
x K. Poiche f è di classe C
2
, dal lemma 4.11.3 si ricava
f(x) f(x
0
) gradf(x
0
) (xx
0
) =
1
2
H (x
0
+(x x
0
)) (xx
0
) (xx
0
),
ove è un opportuno punto fra 0 e 1. Per ipotesi, il secondo membro è non
negativo per ogni x, x
0
K, e dunque
f(x) f(x
0
) gradf(x
0
) (x x
0
) 0 x, x
0
K.
Dal teorema 4.12.4 segue che f è convessa.
(=) Viceversa, sia f convessa in K e supponiamo dapprima che K sia
un aperto. Se, per assurdo, in un punto x
0
K la forma (v) non fosse
328
semidenita positiva, esisterebbe un vettore v ,= 0 tale che H(x
0
)v v <
0. Poiche le derivate seconde di f sono continue, ragionando come nella
dimostrazione del teorema 4.11.1 (iii) troveremmo una palla B(x
0
, r) K
tale che
H(x)v v < 0 x B(x
0
, r).
Poniamo
h =
r
2[v[
m
v;
allora h B(0, r), quindi posto x = x
0
+h si ha:
x
0
+(x x
0
) B(x
0
, r) ]0, 1[,
x x
0
=
r
2[v[
m
v,
e pertanto
H (x
0
+(x x
0
)) (x x
0
) (x x
0
) =
=
_
r
2[v[
m
_
2
H (x
0
+(x x
0
)) v v < 0 ]0, 1[.
Ne segue, applicando nuovamente il lemma 4.11.3, che
f(x) f(x
0
) gradf(x
0
) (x x
0
) =
=
1
2
H (x
0
+(x x
0
)) (x x
0
) (x x
0
) < 0,
e per il teorema 4.12.4 ciò contraddice la convessità di f.
Se K non è aperto, con largomentazione precedente si prova che la forma
H(x)v v è semidenita positiva per ogni x interno a K. Daltra parte se
x K esiste una successione di punti x
n
interni a K che converge a x; dato
che
H(x
n
)v v 0 v R
m
, n N,
al limite per n si ottiene
H(x)v v 0 v R
m
,
cioè la forma è semidenita positiva, In denitiva si ha che la forma è
semidenita positiva in tutti i punti di K, interni o no.
329
Osservazione 4.12.6 Se m = 1 il teorema precedente vale assumendo so-
lamente lesistenza, e non la continuità, della derivata seconda di f. In altre
parole, se f : [a, b] R è derivabile due volte, allora f è convessa se e solo
se f
0 in [a, b]. Infatti, se f è convessa allora dal teorema 4.12.4 segue,

per ogni x, x
0
[a, b],
f(x) f(x
0
) +f
(x
0
)(x x
0
), f(x
0
) f(x) +f
(x)(x
0
x),
e sommando queste due relazioni si deduce
f
(x
0
)(x x
0
) +f
(x)(x
0
x) 0 x, x
0
[a, b],
ossia
(f
(x) f
(x
0
)) (x x
0
) 0 x, x
0
[a, b].
In particolare, se x < x
0
allora f
(x) f
(x
0
), ossia f
è crescente. Per la
proposizione 4.9.1, ciò equivale a dire che f
0 in [a, b].
Viceversa, sia f
0 in [a, b], cosicche per la proposizione 4.9.1 f
è crescente;
allora per il teorema di Lagrange si ha, per un opportuno punto compreso
fra x e x
0
,
f(x) f(x
0
) = f
()(x x
0
).
Pertanto se x > x
0
si ha > x
0
e dunque f
() f
(x
0
), da cui
f(x) f(x
0
) f
(x
0
)(x x
0
);
se invece x < x
0
, si ha < x
0
e dunque f
() f
(x
0
), da cui segue nuova-
mente la precedente disuguaglianza. Dal teorema 4.12.4 segue allora che f è
convessa in [a, b].
Notiamo che una funzione reale f, di classe
C
2
, denita su [a, b], può cambiare la con-
cavità (cioè passare da concava a convessa o
viceversa) soltanto nei punti in cui f
è nul-
la. I punti in cui f cambia la concavità, nei
quali quindi il graco di f attraversa la retta
tangente, si dicono punti di esso.
Dunque, se f è di classe C
2
e x
0
è punto di esso per f, allora f
(x
0
) = 0. Si
noti che il viceversa è falso: la funzione f(x) = x
4
ha derivata seconda nulla
nel punto 0, eppure è convessa in R e quindi 0 non è punto di esso per f.
330
Esercizi 4.12
1. Si provi che esistono funzioni convesse in [a, b] discontinue nei punti
estremi.
2. Sia f : [a, b] R. Si provi che:
(i) f è convessa se e solo se per ogni u, v, w [a, b] con u < v < w
risulta
f(v)
w v
w u
f(u) +
v u
w u
f(w);
(ii) f è convessa se e solo se per ogni u, v, w [a, b] con u < v < w
risulta
f(v) f(u)
v u

f(w) f(u)
w u

f(w) f(v)
w v
;
(iii) f è convessa se e solo se per ogni x [a, b] il rapporto incrementale
h
f(x +h) f(x)
h
, h [a x, 0[]0, b x],
è una funzione crescente.
3. Se f : [a, b] R è convessa, si provi che per ogni x ]a, b[ esistono la
derivata destra e la derivata sinistra
D
f(x) = lim
h0
f(x +h) f(x)

h
, D
+
f(x) = lim
h0
+
f(x +h) f(x)
h
;
si verichi che D
f(x) D
+
f(x) e si mostri con un esempio che tali
numeri possono essere diversi fra loro.
4. Sia f : [a, b] R continua. Si provi che f è convessa se e solo se
f
_
u +v
2
_
1
2
(f(u) +f(v)) u, v [a, b].
[Traccia: una parte dellenunciato è ovvia. Per laltra, si deduca che
vale la denizione di convessità per ogni t della forma k2
h
con h N e
k = 0, 1, . . . , 2
h
; si passi al caso generale t [0, 1] usando la continuità.]
331
5. Siano p, q > 1 tali che
1
p
+
1
q
= 1. Si provi che
xy
x
p
p
+
x
q
q
x, y 0.
Traccia: per x, y > 0 si scriva xy = e
log xy
e si sfrutti la convessità
della funzione esponenziale.]
6. Sia f : [a, b] R convessa e derivabile. Se ]a, b[ è un punto tale che
f
() = 0, si provi che è un punto di minimo assoluto per f in [a, b].

Il punto è necessariamente unico?
7. Sia f : R R convessa e tale che
lim
x+
f(x) = +, lim
x
f(x) = +.
Si provi che f ha minimo su R. Il punto di minimo è necessariamente
unico? Che succede se f è continua ma non convessa?
8. Sia f : K R convessa, ove K R
m
è un insieme convesso. Provare
che per ogni c R linsieme di sottolivello K
c
= x K : f(x) c,
se non vuoto, è convesso.
9. Sia f una funzione convessa, denita su un insieme K R
m
convesso.
(i) Sia x
0
un punto interno a K e sia C un cubo m-dimensionale di
centro x
0
e lato 2 contenuto in K; sia poi V linsieme dei 2
m
vertici di C. Posto M = max
vV
f(v), si provi che f(x) M per
ogni x C.
(ii) Se x B(x
0
, ), siano x
0
u i punti a distanza da x
0
sulla retta
per x
0
e x: si provi che, posto t =
1
[x x
0
[
m
, risulta
f(x) tM + (1 t)f(x
0
), f(x
0
)
1
1 +t
(f(x) +tM) .
(iii) Se ne deduca che f è continua in x
0
.
10. Sia f : [0, [ R una funzione convessa di classe C
1
, con f
(0) > 0.
Si provi che f(x) + per x +, e che esiste nito il limite
lim
x+
x
f(x)
.
332
11. (Disuguaglianza di Jensen) Sia f : R R una funzione convessa. Si
provi che per ogni n N
+
e per ogni x
1
, x
2
, . . . , x
n
R risulta
f
_
x
1
+x
2
+. . . +x
n
n
_
f(x
1
) +f(x
2
) +. . . +f(x
n
)
n
.
[Traccia: si provi dapprima la disuguaglianza per n = 2
k
; nel caso
generale si ponga m = 2
k
n: per quanto già dimostrato si ha
f
_
x
1
+x
2
+. . . +x
n
+mx
2
k
_
f(x
1
) +f(x
2
) +. . . +f(x
n
) +mf(x)
2
k
per ogni x
1
, . . . , x
n
, x R. Si scelga x =
x
1
+...+xn
n
.]
12. Tracciare un graco qualitativo delle seguenti funzioni, considerando
linsieme di denizione A, i limiti alla frontiera di A, la crescenza, la
convessità, i punti di massimo e di minimo relativo, i punti di esso,
gli asintoti, il valore di f
nei punti limite e nei punti di esso:

(i) [[x
3
[ 1[, (ii)
[x + 3[
3
x
2
, (iii)
2[x[ x
2
+x
x + 1
,
(iv) e
x
x 1, (v)
_
x
2
8
x
, (vi)
_
5 +
1
x
2
_
2
8
x
3
,
(vii)
_
[x
2
10x[, (viii)
log x
1 + log x
, (ix) x
2/3
(x 1)
1/3
,
(x) log
x
2
[x
2
+ 2[
, (xi) x e
1
log x
, (xii) log x log
2
x,
(xiii) e
x(log |x|1)
, (xiv) e
x
x1
, (xv) maxx
2
, 5x 4,
(xvi) arccos
1
1 x
, (xvii) x
1
x
1
, (xviii) x + 4 arctan
_
[x 1[,
(xix)
_
[x[ 1
x
2
+ 1
, (xx) sin

x
2
+ 1
, (xxi) log(x + sin x),
(xxii)
[1 log x[
x
, (xxiii) e
1/x
, (xxiv) x + arcsin
2x
x
2
+ 1
.
333
Capitolo 5
Calcolo integrale
5.1 Lintegrale
Sia f : [a, b] R una funzione limitata. Vogliamo determinare larea con
segno della regione del piano xy delimitata dal graco di f e dallasse x,
considerando cioè positiva larea della parte sopra lasse x e negativa larea
della parte sotto lasse x. Esplicitamente, considereremo positiva larea della
regione
(x, y) R
2
: x [a, b], f(x) 0, y [0, f(x)],
e negativa larea della regione
(x, y) R
2
: x [a, b] : f(x) 0, y [f(x), 0].
Prima di tutto, però, oc-
correrà dare un senso a ciò
che si vuole calcolare: riu-
sciremo a denire larea del-
le regioni sopra descritte per
mezzo di un procedimento
di approssimazione della re-
gione che ci interessa me-
diante unioni nite di ret-
tangoli adiacenti (per i qua-
li larea è quella elemen-
tarmente denita: base per
altezza).
334
Il primo passo da compiere a questo scopo è quello di introdurre la nozione
di suddivisione dellintervallo [a, b].
Denizione 5.1.1 Una suddivisione, o partizione, dellintervallo [a, b] è un
insieme nito di punti = x
0
, x
1
, . . . , x
N
tale che
a = x
0
< x
1
< . . . < x
N1
< x
N
= b.
I punti x
i
si dicono nodi della suddivisione .
Gli intervalli [x
i1
, x
i
], delimitati da due nodi consecutivi di una ssata sud-
divisione di [a, b], saranno le basi dei rettangoli che useremo per le nostre
approssimazioni.
Date due suddivisioni
di [a, b], diciamo che
è pi` u ne di
se si ha
, cioè se
si ottiene da
aggiungendo altri nodi. Naturalmente, in

generale, data una coppia di suddivisioni
, nessuna delle due sarà pi` u -

ne dellaltra: pensiamo per esempio a
= a,
a+b
2
, b e
= a,
2a+b
3
,
a+2b
3
, b.
Però, ssate
, è sempre possibile trovare una terza suddivisione che

è pi` u ne di entrambe: basta prendere =
.
Esempio 5.1.2 Le pi` u semplici suddivisioni di [a, b] sono quelle equispazia-
te: per N N
+
ssato, si ha
N
= x
i
, 0 i N, ove x
i
= a +
i
N
(b a);
in particolare, se N = 1 si ha la suddivisione banale
1
= a, b.
Introduciamo adesso le nostre aree approssimate per eccesso e per difetto.
Denizione 5.1.3 Sia f : [a, b] R limitata. La somma superiore di f
relativa alla suddivisione di [a, b] è il numero
S(f, ) =
N
i=1
M
i
(x
i
x
i1
), ove M
i
= sup
[x
i1
,x
i
]
f.
La somma inferiore di f relativa alla suddivisione di [a, b] è il numero
s(f, ) =
N
i=1
m
i
(x
i
x
i1
), ove m
i
= inf
[x
i1
,x
i
]
f.
335
Osserviamo che S(f, ) e s(f, ) sono numeri reali ben deniti grazie al fatto
che stiamo supponendo f limitata: altrimenti qualcuno fra i numeri M
i
o m
i
potrebbe essere innito.
Ci aspettiamo che inttendo sempre di pi` u i nodi, le somme superiori ed in-
feriori forniscano una approssimazione sempre pi` u accurata dellarea della
regione che ci interessa. E in eetti si ha:
Proposizione 5.1.4 Sia f : [a, b] R una funzione limitata. Se
sono suddivisioni di [a, b], e è una terza suddivisione pi` u ne di entrambe,

allora
s(f,
) s(f, ) S(f, ) S(f,
).
Dimostrazione La disuguaglianza centrale è evidente, per denizione di
somma superiore e inferiore. Proviamo la prima (la terza è analoga). Il pas-
saggio da
a consiste nellaggiungere un numero nito di nuovi nodi, il che

si può vedere come una sequenza nita di aggiunte di un singolo nodo. Dun-
que basterà provare che se si ottiene da
= x
0
, x
1
, . . . , x
N
aggiungendo
il nodo x ]x
k1
, x
k
[, allora s(f,
) s(f, ). La quantità a secondo mem-

bro si ottiene da quella al primo membro rimpiazzandone il k-simo addendo
m
k
(x
k
x
k1
) con i due addendi
inf
[x
k1
,x]
f (x x
k1
) + inf
[x,x
k
]
f (x
k
x);
daltra parte, per denizione di m
k
si ha
m
k
inf
[x
k1
,x]
f, m
k
inf
[x,x
k
]
f,
e quindi
m
k
(x
k
x
k1
) = m
k
(x
k
x +x x
k1
)
inf
[x
k1
,x]
f (x x
k1
) + inf
[x,x
k
]
f (x
k
x),
336
da cui s(f,
) s(f, ).
Il fatto che le approssimazioni migliorino sempre quando si inttiscono i nodi
ci porta a denire le approssimazioni ottimali per eccesso e per difetto
dellarea che ci interessa.
Denizione 5.1.5 Sia f : [a, b] R una funzione limitata. L integrale
superiore di f su [a, b] è il numero
I
+
(f) = inf
S(f, ).
L integrale inferiore di f su [a, b] è il numero
I
(f) = sup
s(f, ).
Osservazione 5.1.6 Gli integrali superiore ed inferiore di f sono numeri
reali ben deniti, e si ha
inf
[a,b]
f (b a) I
(f) I
+
(f) sup
[a,b]
f (b a).
Infatti, indicata con
1
la suddivisione banale a, b, per la proposizione
precedente si ha, per qualunque coppia di suddivisioni
,
inf
[a,b]
f (b a) = s(f,
1
) s(f,
) S(f,
) S(f,
1
) = sup
[a,b]
f (b a),
da cui la tesi passando allestremo superiore rispetto a
e allestremo infe-
riore rispetto a
.
Arrivati a questo punto, sarebbe bello che le approssimazioni ottimali per
eccesso e per difetto coincidessero: questo ci permetterebbe di denire in
modo non ambiguo larea (con segno) della regione
(x, y) R
2
: x [a, b], f(x) 0, y [0, f(x)]
(x, y) R
2
: x [a, b], f(x) 0, y [f(x), 0].
Sfortunatamente, in generale si ha I
(f) < I
+
(f), come mostra il seguente
337
Esempio 5.1.7 Si consideri la funzione di Dirichlet
(x) =
_
1 se x [0, 1] Q,
0 se x [0, 1] Q.
Questa funzione, il cui graco non è disegnabile, è limitata in [0, 1] e per ogni
suddivisione = x
0
, x
1
, . . . , x
N
di [0, 1] si ha, in virt` u della densità in R di
Q e di R Q:
m
k
= inf
[x
k1
,x
k
]
= 0, M
k
= sup
[x
k1
,x
k
]
= 1, k = 1, . . . , N;
quindi per ogni suddivisione si ha s(, ) = 0, S(, ) = 1 e pertanto
I
() = 0, I
+
() = 1.
La nostra procedura di approssimazione non è quindi applicabile a tutte le
funzioni limitate, ma soltanto a quelle che vericano la proprietà descritta
nella seguente fondamentale denizione.
Denizione 5.1.8 Sia f : [a, b] R una funzione limitata. Diciamo che f
è integrabile secondo Riemann in [a, b], e scriveremo f 1(a, b), se risulta
I
(f) = I
+
(f).
In tal caso, l integrale di f su [a, b] è il numero reale I
(f) = I
+
(f), che si
indicherà con il simbolo
_
b
a
f(x)dx:
_
b
a
f(x) dx = I
(f) = I
+
(f).
Il senso di questo simbolo è quello di ricordarci che si fa il limite di somme
nite (da cui il segno
_
, che è una S stilizzata) di aree di rettangolini,
la cui base è un intervallo dellasse x centrato nel punto x di ampiezza pic-
colissima pari a dx, e la cui altezza è un intervallo dellasse y di lunghezza
pari a [f(x)[, presa col segno di f(x).
Come si è visto, esistono funzioni limitate non integrabili: sorge quindi le-
sigenza di determinare esempi, e possibilmente intere classi, di funzioni inte-
grabili; analizzeremo questo problema nel paragrafo 5.3.
Prima di tutto conviene fornire un criterio di integrabilità di grande utilità,
che segue direttamente dalla denizione.
338
Proposizione 5.1.9 Sia f : [a, b] R una funzione limitata: f è integrabile
secondo Riemann in [a, b] se e solo se per ogni > 0 esiste una suddivisione
di [a, b] tale che
S(f, ) s(f, ) < .
Dimostrazione (=) Fissato > 0, per denizione di estremo superiore
ed estremo inferiore esistono due suddivisioni
di [a, b] tali che

_
b
a
f(x) dx

2
< s(f,
)
_
b
a
f(x) dx S(f,
) <
_
b
a
f(x) dx +

2
;
scelta allora una suddivisione pi` u ne di
, si ha per la proposizione
5.1.4
_
b
a
f(x) dx

2
< s(f, )
_
b
a
f(x) dx S(f, ) <
_
b
a
f(x) dx +

2
,
e ciò implica la tesi.
(=) Fissato > 0 e scelta una suddivisione come nellipotesi, si ha
0 I
+
(f) I
(f) S(f, ) s(f, ) < ,

da cui I
+
(f) = I
(f) per larbitrarietà di .

Si noti che il criterio precedente permette di stabilire se una funzione è inte-
grabile, ma non dà informazioni su quanto valga il suo integrale: il problema
del calcolo esplicito degli integrali verrà arontato pi` u avanti (paragrafo 5.5).
Dimostriamo adesso unimportante caratterizzazione dellintegrabilità che ha
interesse sia teorico che pratico. Premettiamo una denizione:
Denizione 5.1.10 Data una suddivisione = x
0
, x
1
, . . . , x
N
di [a, b],
l ampiezza di è il numero
[[ = max
1iN
(x
i
x
i1
).
`
E chiaro che se
è una suddivisione pi` u ne di , allora risulta [
[ [[; il
viceversa naturalmente non è vero (se
3
e
4
sono suddivisioni equispaziate
con 3 e 4 nodi rispettivamente, allora [
4
[ < [
3
[ ma nessuna delle due è pi` u
ne dellaltra).
339
Teorema 5.1.11 Sia f : [a, b] R una funzione limitata. Si ha f 1(a, b)
se e solo se esiste un numero reale A dotato della proprietà seguente: per ogni
> 0 si può trovare un > 0 tale che
[[ < = [S(f, ) A[ < , [s(f, ) A[ < .
In tal caso, si ha A =
_
b
a
f(x) dx.
Dimostrazione (=) Fissato > 0, dallipotesi segue per ogni suddivisione
con [[ <
0 S(f, ) s(f, ) [S(f, ) A[ +[A s(f, )[ < 2,
e quindi f è integrabile in virt` u della proposizione 5.1.9; inoltre, scelta una
suddivisione con [[ < , avremo
[I
+
(f) A[ [I
+
(f) S(f, )[ +[S(f, ) A[ < 2,
da cui A = I
+
(f) =
_
b
a
f(x) dx.
(=) Poiche f è integrabile, ssato > 0 esiste una suddivisione
0
=
x
0
, x
1
, . . . , x
N
di [a, b] tale che
_
b
a
f(x) dx

2
< s(f,
0
) S(f,
0
) <
_
b
a
f(x) dx +

2
.
Poniamo K = sup
[a,b]
[f[ e ssiamo =

4NK
. Sia = t
0
, t
1
, . . . , t
m
una
qualunque suddivisione di [a, b] tale che [[ < . Supponiamo (per semplicità)
che nessun nodo x
j
di
0
coincida con qualcuno dei nodi t
i
di . Consideriamo
gli insiemi
A = i 1, . . . , m : ]t
i1
, t
i
[ non contiene alcun nodo x
j
,
B = i 1, . . . , m : ]t
i1
, t
i
[ contiene almeno un nodo x
j
,
e osserviamo che B ha al pi` u N elementi. Consideriamo poi la suddivisione
=
0
, i cui nodi sono i t
i
e gli x
j
: tali nodi delimitano intervalli del tipo
[t
i1
, t
i
] (quando lindice i appartiene ad A), oppure dei tipi [t
i1
, x
j
], [x
j
, t
i
]
ed eventualmente [x
j
, x
j+1
] (quando lindice i appartiene a B). Denotiamo
con I
ij
gli intervalli corrispondenti ad indici i B, indicando con
ij
la loro
340
ampiezza (per ogni i B ce ne sarà un certo numero nito k
i
); poniamo
inoltre
M
i
= sup
[t
i1
, t
i
]
f, M
ij
= sup
I
ij
f.
Si ha allora
S(f,
) =
iA
M
i
(t
i
t
i1
) +
iB
k
i
j=1
M
ij
ij
.
Daltra parte, gli intervalli I
ij
con i B ssato e j = 1, . . . , k
i
ricoprono
[t
i1
, t
i
]: quindi
iB
k
i
j=1
M
ij
ij
iB
K(t
i
t
i1
) K
iB
KN =

4
,
da cui
iA
M
i
(t
i
t
i1
) = S(f,
iB
k
i
j=1
M
ij
ij
S(f,
) +

4
.
Pertanto possiamo scrivere
S(f, ) =
iA
M
i
(t
i
t
i1
) +
iB
M
i
(t
i
t
i1
)
S(f,
) +

4
+
iB
K(t
i
t
i1
) S(f,
) +

2

S(f,
0
) +

2

_
b
a
f(x) dx +.
In modo analogo si prova che
s(f, )
_
b
a
f(x) dx ,
e quindi il numero A =
_
b
a
f(x) dx verica la condizione richiesta.
Corollario 5.1.12 Sia f : [a, b] R una funzione limitata. Si ha f
1(a, b) se e solo se per ogni > 0 esiste N
+
tale che
S(f,
N
) s(f,
N
) < N ,
ove
N
è la suddivisione equispaziata con nodi x
k
= a +
k
N
(b a), k =
0, 1, . . . , N.
341
Dimostrazione (=) La tesi segue dal teorema 5.1.11 quando [
N
[ =
ba
N
<
.
(=) Fissato > 0, dallipotesi si deduce, scelto N ,
I
+
(f) I
(f) S(f,
N
) s(f,
N
) < ,
e dunque I
+
(f) = I
(f).
Osservazione 5.1.13 Dal corollario precedente segue che in eetti per ca-
ratterizzare lintegrale di Riemann sono sucienti le suddivisioni equispazia-
te, e si ha
_
b
a
f(x) dx = lim
N
S(f,
N
) = lim
N
s(f,
N
) f 1(a, b).
Di conseguenza, se per ogni i = 1, . . . , N si ssa a piacere un numero t
i

[x
i1
, x
i
], la quantità
N
i=1
f(t
i
)(x
i
x
i1
),
che è detta somma di Riemann di f, converge a
_
b
a
f(x) dx per N , gra-
zie al teorema dei carabinieri (esercizio 2.1.19). Su questo fatto si basano le
pi` u semplici formule di quadratura per il calcolo approssimato degli integrali.
Esercizi 5.1
1. Si provi che
_
b
a
x dx =

2
(b
2
a
2
),
_
b
a
x
2
dx =

3
(b
3
a
3
).
2. (Teorema della media) Si provi che se f 1(a, b), allora
inf
[a,b]
f
1
b a
_
b
a
f(x) dx sup
[a,b]
f,
e che se f è anche continua in [a, b] allora esiste [a, b] tale che
f() =
1
b a
_
b
a
f(x) dx.
342
3. Sia f 1(a, b) e sia g una funzione che dierisce da f soltanto in
un numero nito di punti di [a, b]. Si provi che g 1(a, b) e che gli
integrali di f e di g in [a, b] coincidono. Che succede se f e g dieriscono
su un insieme numerabile x
n
, n N [a, b]?
4. Utilizzando solo la denizione di (denizione 1.12.6), dedurre che
_
1
1
1 x
2
dx =

2
.
[Traccia: si verichi che la metà
dellarea del poligono regolare di 2n
lati inscritto nel cerchio di raggio
1 è compresa fra s(
1 x
2
,
n
) e
S(
1 x
2
,
n
), ove
n
è la suddi-
visione di [1, 1] i cui nodi sono le
proiezioni sullasse x dei vertici del
poligono.]
5. Sia f una funzione limitata in [a, b], tale che [f[ 1(a, b); è vero che
f 1(a, b)?
5.2 Proprietà dellintegrale
Lintegrabilità è una proprietà stabile rispetto alle operazioni algebriche fra
funzioni. Per provare questo fatto, è utile introdurre la nozione di oscilla-
zione di una funzione in un intervallo.
Denizione 5.2.1 Sia f : [a, b] R una funzione limitata. Se I è un
intervallo contenuto in [a, b], l oscillazione di f in I è il numero reale
osc(f, I) = sup
I
f inf
I
f.
Osservazioni 5.2.2 (1) Il criterio di integrabilità espresso nella proposizio-
ne 5.1.9 si può riformulare nel modo seguente: f è integrabile in [a, b] se e
solo se per ogni > 0 esiste una suddivisione = x
0
, x
1
, . . . , x
N
di [a, b]
tale che
N
i=1
osc(f, [x
i1
, x
i
]) (x
i
x
i1
) < .
343
(2) Anche la denizione di continuità di una funzione (denizione 3.2.3) può
essere espressa tramite loscillazione. Si ha in eetti che f è continua in un
punto x
0
[a, b] se e solo se, posto I
= [x
0
, x
0
+] [a, b], risulta
lim
0
+
osc(f, I
) = 0.
(3) Si verica facilmente che se f, g sono funzioni limitate in [a, b] e è un
numero reale, allora per ogni intervallo I [a, b] si ha, come conseguenza
dellesercizio 3.2.11,
osc(f +g, I) osc(f, I) + osc(g, I), osc(f, I) = [[osc(f, I).
Dallultima delle osservazioni precedenti si deduce la linearità dellintegrale:
Proposizione 5.2.3 Siano f, g 1(a, b) e sia R. Allora f + g, f
1(a, b) e
_
b
a
(f +g)(x) dx =
_
b
a
f(x) dx+
_
b
a
g(x) dx,
_
b
a
(f)(x) dx =
_
b
a
f(x) dx.
Dimostrazione Poiche f e g sono integrabili, ssato > 0 esistono due
suddivisioni
di [a, b] tali che

S(f,
) s(f,
) < , S(g,
) s(g,
) < .
Scelta unaltra suddivisione pi` u ne di entrambe, si ha a maggior ragione
(proposizione 5.1.4)
S(f, ) s(f, ) < , S(g, ) s(g, ) < ,
da cui, per losservazione 5.2.2(3),
S(f +g, ) s(f +g, ) =
N
i=1
osc(f +g, [x
i1
, x
i
]) (x
i
x
i1
)
i=1
osc(f, [x
i1
, x
i
]) (x
i
x
i1
) +
N
i=1
osc(g, [x
i1
, x
i
]) (x
i
x
i1
) =
= S(f, ) s(f, ) +S(g, ) s(g, ) < 2,
mentre
S(f, ) s(f, ) = [[[S(f, ) s(f, )] < [[.
344
Ne segue che f +g e f sono integrabili. Adesso notiamo che
_
b
a
(f +g)(x) dx
_
b
a
f(x) dx
_
b
a
g(x) dx
S(f +g, ) s(f, ) s(g, )
S(f, ) +S(g, ) s(f, ) s(g, ) < 2,
_
b
a
(f +g)(x) dx
_
b
a
f(x) dx
_
b
a
g(x) dx
s(f +g, ) S(f, ) S(g, )
s(f, ) +s(g, ) S(f, ) S(g, ) > 2,
il che ci fornisce la maggiorazione
_
b
a
(f +g)(x) dx
_
b
a
f(x) dx
_
b
a
g(x) dx
< 2 > 0,
ossia
_
b
a
(f +g)(x) dx =
_
b
a
f(x) dx +
_
b
a
g(x) dx.
Similmente, osservando che
S(f, ) =
_
S(f, ) se 0
s(f, ) se 0,
s(f, ) =
_
s(f, ) se 0
S(f, ) se 0,
è immediato dedurre che, qualunque sia R,
_
b
a
(f)(x) dx
_
b
a
f(x) dx
< [[ > 0,
e che quindi
_
b
a
(f)(x) dx =
_
b
a
f(x) dx R.
Utilizzando le proprietà delloscillazione, si ottiene anche la seguente
Proposizione 5.2.4 Siano f, g 1(a, b). Si ha:
345
(i) f g 1(a, b);
(ii) se inf
[a,b]
[g[ > 0, allora
f
g
1(a, b);
(iii) f g, f g 1(a, b), ove f g(x) = maxf(x), g(x), f g(x) =
minf(x), g(x).
Dimostrazione Si rimanda agli esercizi 5.2.1, 5.2.2 e 5.2.3.
Unaltra importante proprietà dellintegrale è la sua monotonia:
Proposizione 5.2.5 Siano f, g 1(a, b). Se si ha f(x) g(x) per ogni
x [a, b], allora
_
b
a
f(x) dx
_
b
a
g(x) dx.
Dimostrazione Basta notare che, per ipotesi, per ogni suddivisione di
[a, b] si ha
s(f, ) s(g, ),
e poi passare allestremo superiore rispetto a .
Corollario 5.2.6 Se f 1(a, b), allora [f[ 1(a, b) e
_
b
a
f(x) dx
_
b
a
[f(x)[ dx.
Dimostrazione Si verica facilmente che [f(x)[ = f(x) 0 f(x) 0 per
ogni x [a, b]; quindi [f[ 1(a, b) per la proposizione 5.2.4. Essendo poi
[f(x)[ f(x) [f(x)[, per monotonia (proposizione 5.2.5) si ottiene
_
b
a
[f(x)[ dx
_
b
a
f(x) dx
_
b
a
[f(x)[ dx,
da cui la tesi.
Proviamo inne ladditività dellintegrale rispetto allintervallo di integrazio-
ne:
Proposizione 5.2.7 Sia f : [a, b] R una funzione limitata e sia c ]a, b[
un punto ssato. Allora
f 1(a, b) f 1(a, c) 1(c, b),
e in tal caso
_
b
a
f(x) dx =
_
c
a
f(x) dx +
_
b
c
f(x) dx.
346
Dimostrazione La dimo-
strazione è ovvia, se si pen-
sa al signicato geometri-
co dellintegrale come area
con segno. Per una dimo-
strazione formale si rimanda
allesercizio 5.2.5.
Per i discorsi che seguiranno, è utile dare senso allintegrale
_
b
a
f(x) dx anche
nel caso in cui a b.
Denizione 5.2.8 Sia f una funzione reale denita in un intervallo [c, d].
(i) Se a [c, d], poniamo
_
a
a
f(x) dx = 0.
(ii) Se a, b [c, d] con a > b, poniamo (notando che f 1(b, a) grazie alla
proposizione precedente)
_
b
a
f(x) dx =
_
a
b
f(x) dx.
Lutilità di questa convenzione sta nel seguente risultato di additività:
Proposizione 5.2.9 Sia f 1(a, b). Allora
_
v
u
f(x) dx =
_
w
u
f(x) dx +
_
v
w
f(x) dx u, v, w [a, b].
Dimostrazione Si tratta di una noiosa ma facile verica che fa uso del-
la proposizione precedente e consiste nellanalizzare tutti i possibili casi:
u < v < w, v < w < u, w < u < v, u < w < v, v < u < w, w < v < u,
u = v, v = w, u = w.
Anche il risultato di monotonia espresso dal corollario 5.2.6 può essere pre-
cisato alla luce della convenzione sopra descritta:
Corollario 5.2.10 Sia f 1(a, b). Allora
_
v
u
f(x) dx
_
v
u
[f(x)[ dx
u, v [a, b].
347
Dimostrazione Se u < v, il secondo membro è
_
v
u
[f(x)[ dx e la tesi segue
dal corollario 5.2.6. Se u = v la disuguaglianza si riduce a 0 0, quindi è
vera. Se u > v, il primo membro coincide con
_
u
v
f(x) dx
mentre il secondo
diventa
_
u
v
[f(x)[dx, e quindi ci si riduce al primo caso già provato.
Osservazione 5.2.11 Sia A un sottoinsieme di R. La funzione
I
A
(x) =
_
1 se x A
0 se x / A
si chiama funzione caratteristica, o indicatrice, di A. Se Aè limitato, e se [a, b]
è un qualunque intervallo contenente A, la funzione I
A
può essere integrabile
secondo Riemann in [a, b] oppure no, come mostra lesempio 5.1.7. Se A è un
intervallo [c, d], è immediato vericare che I
A
1(a, b) e che
_
b
a
I
A
dx = dc.
Questo suggerisce un modo per attribuire una misura a una vasta classe
di sottoinsiemi limitati di R: quelli la cui corrispondente funzione indicatrice
è integrabile, e che potremo chiamare insiemi misurabili. In altre parole, se
A è limitato, se [a, b] A e se I
A
1(a, b), deniamo la misura di A come
segue:
m(A) =
_
b
a
I
A
dx.
Dato che I
A
è nulla fuori di A, è chiaro che questa denizione non dipende
dalla scelta dellintervallo [a, b]. Dalle proprietà dellintegrale segue imme-
diatamente che m() = 0, che m è additiva sugli insiemi misurabili disgiunti
(ossia m(A B) = m(A) + m(B)), e che in particolare m è monotona (cioè
m(A) m(B) se A B).
Esercizi 5.2
1. Si provi che se f, g 1(a, b) allora fg 1(a, b).
[Traccia: si verichi che
osc(fg, I) osc(f, I) sup
I
[g[ + osc(g, I) sup
I
[f[.]
2. Si provi che se f, g 1(a, b) e inf
[a,b]
[g[ = m > 0, allora
f
g
1(a, b).
[Traccia: grazie allesercizio precedente, basta provare la tesi quando
f 1; si provi che osc(1/g, I)
1
m
2
osc(g, I).]
348
3. Si verichi che per ogni f, g : [a, b] R si ha
f g = g + (f g) 0, f g = f +g f g;
dedurne che se f, g 1(a, b) allora f g, f g 1(a, b).
[Traccia: si osservi che basta vericare che f 0 1(a, b), e si provi
che risulta osc(f 0, I) osc(f, I).]
4. Se A è un sottoinsieme di R
m
o di C
m
, una funzione f : A R
si dice lipschitziana (dal nome del matematico tedesco Lipschitz) se
esiste L > 0 tale che
[f(x) f(y)[ L[x y[
m
x, y A
(il pi` u piccolo numero L che soddisfa la denizione si chiama costante
di Lipschitz di f). Si provi che se f 1(a, b) e : R R è una
funzione lipschitziana, allora f 1(a, b).
[Traccia: si provi che osc( f, I) L osc(f, I).]
5. Dimostrare la proposizione 5.2.7.
6. Si calcoli, se esiste, la misura dellinsieme
A =
_
n=0
[2
2n1
, 2
2n
[.
7. Dimostrare che linsieme ternario di Cantor (esercizio 3.1.22) è misu-
rabile, e calcolarne la misura.
5.3 Alcune classi di funzioni integrabili
Utilizzando il criterio fornito dalla proposizione 5.1.9 si determina facilmente
una prima importante classe di funzioni integrabili: quella delle funzioni
monotone.
Teorema 5.3.1 Sia f : [a, b] R una funzione monotona. Allora f è
integrabile su [a, b].
349
Dimostrazione Osserviamo anzitutto che f è limitata, in quanto dalla
monotonia segue
f(x) [f(a), f(b)] se f è crescente, f(x) [f(b), f(a)] se f è decrescente.
Consideriamo le suddivisioni equispaziate
N
, con nodi x
i
= a +
i
N
(b a)
(esempio 5.1.2). Supponendo ad esempio f crescente, si ha
S(f,
N
) =
N
i=1
f(x
i
)(x
i
x
i1
), s(f,
N
) =
N
i=1
f(x
i1
)(x
i
x
i1
),
cosicche
S(f,
N
) s(f,
N
) =
N
i=1
[f(x
i
) f(x
i1
)](x
i
x
i1
) =
=
N
i=1
[f(x
i
) f(x
i1
)]
b a
N
= [f(b) f(a)]
b a
N
.
Quindi, ssato > 0, il criterio di integrabilità (proposizione 5.1.9) è soddi-
sfatto se si sceglie N abbastanza grande.
Uniforme continuità
Il nostro prossimo obiettivo è quello di dimostrare lintegrabilità delle funzioni
continue su un intervallo compatto. A questo scopo conviene introdurre la
nozione di uniforme continuità, la quale, come suggerisce il nome, è una
proprietà pi` u restrittiva della continuità.
Ricordiamo che se A è un sottoinsieme di R
m
(oppure di C
m
) e f : A R è
una funzione, dire che f è continua in A signica che
x
0
A, > 0 > 0 : [f(x) f(x
0
)[ < x A con [xx
0
[
m
< .
m
(o di C
m
) e sia f : A R
una funzione. Diciamo che f è uniformemente continua in A se
> 0 > 0 : [f(x) f(x
0
)[ < x A, x
0
A con [xx
0
[
m
< .
350
Come si vede, nella denizione di uniforme continuità si è spostata la stringa
x
0
A dallinizio alla ne della frase. Questo fa s` che il numero di
cui si prescrive lesistenza sia sottoposto ad una richiesta pi` u forte: esso deve
garantire che sia [f(x) f(x
0
)[ < non solo per ogni x vicino ad un ssato
punto x
0
, ma per ogni coppia di punti x, x
0
fra loro vicini, in qualunque parte
di A essi si trovino. In denitiva: il numero deve dipendere da , ma non
da x
0
.
La denizione di uniforme continuità si esprime bene facendo intervenire
loscillazione di f (denizione 5.2.1): f è uniformemente continua in A se e
solo se per ogni > 0 esiste > 0 tale che risulti
osc(f, B) = sup
B
f inf
B
f
per ogni palla B A che abbia raggio non superiore a , ovunque si trovi il
suo centro.
Esempi 5.3.3 (1) Siano A = [0, [ e f(x) = x
2
. Per ogni intervallo I
a
=
[a, a +] si ha
osc(f, I
a
) = (a +)
2
a
2
= 2a +
2
;
dunque f, pur essendo continua in [0, [, non è uniformemente continua in
tale semiretta in quanto, ssato > 0 e comunque preso > 0, risulta, per
valori di a sucientemente grandi,
osc(f, I
a
) = 2a +
2
.
(2) Ogni funzione lipschitziana in un insieme A è uniformemente continua
in A: dato > 0, basta scegliere = /L, ove L è la costante di Lipschitz di
f. In particolare, le funzioni f : R R derivabili con derivata limitata sono
uniformemente continue, in quanto per il teorema di Lagrange esse risultano
lipschitziane con costante L sup
R
[f
[. Si noti che in generale le funzioni

appartenenti a C
1
(R) non sono ne lipschitziane ne uniformemente continue,
come mostra lesempio della funzione f(x) = x
2
.
Luniforme continuità di una funzione f si può interpretare geometricamente
nel modo seguente: si consideri un rettangolo R, di base 2 ed altezza 2,
centrato in un punto del graco di f; si ha continuità uniforme se per qua-
lunque > 0 vi è una base > 0 tale che, facendo scorrere il rettangolo R
lungo il graco di f, il graco non intersechi mai i due lati orizzontali del
rettangolo.
351
Come abbiamo visto, non tutte le funzioni continue sono uniformemente
continue; tuttavia vale il seguente importante risultato:
Teorema 5.3.4 (di Heine-Cantor) Sia f una funzione reale, denita su
un sottoinsieme compatto A di R
m
o di C
m
. Se f è continua in A, allora f
è uniformemente continua in A.
Dimostrazione Supponiamo per assurdo che f non sia uniformemente con-
tinua in A: allora, negando la denizione 5.3.2, troviamo che esiste > 0
tale che, qualunque sia > 0, possiamo determinare due punti x, x
0
A che
vericano [x x
0
[
m
< , ma [f(x) f(x
0
)[
m
. Scegliendo allora = 1/k,
con k N
+
, per ogni k troveremo x
k
, x
k
A tali che
[x
k
x
k
[
m
<
1
k
, [f(x
k
) f(x
k
)[ .
Le due successioni x
k
e x
k
cos` costruite sono costituite da punti del
compatto A. Per denizione di insieme compatto (osservazione 3.1.20), esiste
una sottosuccessione x
kn
x
k
che converge ad un punto x A; la
corrispondente sottosuccessione x
kn
x
k
converge anchessa a x, dato
che [x
kn
x
kn
[
m
< 1/k
n
0 per n . Ma allora, essendo f continua nel
punto x, si deve avere f(x
kn
) f(x) e f(x
kn
) f(x) per n , il che è
assurdo perche [f(x
kn
) f(x
kn
)[ per ogni n.
Osservazione 5.3.5 Il teorema di Heine-Cantor vale se A è compatto, ossia
limitato e chiuso (teorema 3.1.19 e osservazione 3.1.20): il risultato è falso
se A non è limitato, come mostra lesempio 5.3.3 (1), ed anche se A non è
chiuso, come mostra lesempio della funzione f(x) = 1/x, x ]0, 1] (si veda
lesercizio 5.3.4).
Integrabilità delle funzioni continue
Proviamo ora lintegrabilità delle funzioni continue su un intervallo [a, b].
Notiamo che ogni funzione continua f : [a, b] R è necessariamente limitata
352
(per il teorema di Weierstrass) e uniformemente continua (per il teorema di
Heine-Cantor).
Teorema 5.3.6 Ogni funzione continua f : [a, b] R è integrabile in [a, b].
Dimostrazione Sia > 0. Poiche f è uniformemente continua, esiste > 0
tale che
x, x
[a, b], [x x
[ < = [f(x) f(x
)[ 
ba
, avremo
x
i
x
i1
=
b a
N
< , i = 1, . . . , N.
Valutiamo la quantità S(f,
N
) s(f,
N
): si ha
S(f,
N
) s(f,
N
) =
N
i=1
_
max
[x
i1
,x
i
]
f min
[x
i1
,x
i
]
f
_
(x
i
x
i1
) =
=
N
i=1
[f(
i
) f(
i
)]
b a
N
,
ove
i
e
i
sono rispettivamente punti di massimo e di minimo per f nel-
lintervallo [x
i1
, x
i
]. Poiche, ovviamente, [
i

i
[ x
i
x
i1
< , avremo
f(
i
) f(
i
) <

ba
, e dunque
S(f,
N
) s(f,
N
) <
N
i=1
b a

b a
N
= N >
b a
.
Per la proposizione 5.1.9 si conclude che f è integrabile in [a, b].
Osservazione 5.3.7 Pi` u in generale, risultano integrabili in [a, b] le funzioni
che sono limitate in [a, b] e continue salvo che in un numero nito di punti
x
1
, . . . , x
k
[a, b]. La dimostrazione di questo fatto, benche formalmente
un po pesante, non è aatto dicile, e per essa si rimanda allesercizio 5.3.5
La classe 1(a, b) è considerevolmente ampliata dal seguente risultato:
353
Teorema 5.3.8 Sia f 1(a, b) e poniamo M = sup
[a,b]
f, m = inf
[a,b]
f. Se
: [m, M] R è una funzione continua, allora f 1(a, b).
Dimostrazione Fissato > 0, sia ]0, [ tale che
t, s [m, M], [t s[ < = [(t) (s)[ < ;
tale esiste poiche è uniformemente continua in [m, M] in virt` u del teorema
di Heine-Cantor.
Poiche f 1(a, b), esiste una suddivisione = x
0
, x
1
, . . . , x
N
di [a, b] tale
che
S(f, ) s(f, ) <
2
.
Posto I
i
= [x
i1
, x
i
], consideriamo gli insiemi
A = i 1, . . . , N : osc(f, I
i
) < ,
B = i 1, . . . , N : osc(f, I
i
) .
Si ha allora, posto K = sup
[m,M]
[[,
osc( f, I
i
) < i A, osc( f, I
i
) 2K i B,
Quindi
iB
(x
i
x
i1
)
iB
osc(f, I
i
)(x
i
x
i1
) S(f, ) s(f, ) <
2
ovvero
iB
(x
i
x
i1
) < .
Da ciò segue
S( f, ) s( f, ) =
=
iA
osc( f, I
i
)(x
i
x
i1
) +
iB
osc( f, I
i
)(x
i
x
i1
)
(b a) + 2K < (b a + 2K),
cioè la tesi.
354
Esercizi 5.3
1. Sia f : R R una funzione continua, e supponiamo che f abbia
asintoti obliqui per x . Provare che f è uniformemente continua
in R.
2. Esibire una funzione f : R R limitata e di classe C
, ma non
uniformemente continua su R.
3. Si provi che [x
[ [x y[
per ogni x, y 0 e per ogni [0, 1];

se ne deduca che se [0, 1[ la funzione f(x) = x
è uniformemente
continua in [0, [, ma non è lipschitziana in tale semiretta.
4. Si provi che per ogni > 0 la funzione f(x) = x
non è uniformemente
continua in ]0, 1].
5. Dimostrare che ogni funzione limitata in [a, b], e continua salvo che in
un numero nito di punti, è integrabile in [a, b].
5.4 Il teorema fondamentale del calcolo inte-
grale
Se f è una funzione integrabile secondo Riemann in un intervallo [a, b], sap-
piamo dalla proposizione 5.2.7 che si ha anche f 1(a, x) per ogni x [a, b].
Quindi possiamo denire la funzione
F(x) =
_
x
a
f(t) dt, x [a, b],
che si chiama funzione integrale della f. Si noti, di passaggio, che non è
lecito scrivere
_
x
a
f(x) dx: la variabile di integrazione non va confusa con gli
estremi dellintervallo di integrazione, esattamente come nelle sommatorie si
scrive
n
k=0
a
k
e non
n
n=0
a
n
.
Analizziamo le proprietà della funzione integrale F.
Proposizione 5.4.1 Se f 1(a, b), allora la sua funzione integrale F è
continua, anzi lipschitziana, in [a, b], e risulta F(a) = 0.
355
Dimostrazione Ovviamente F(a) =
_
a
a
f(x) dx = 0. Proviamo che F è
lipschitziana (esempio 5.3.3 (2)). Siano x, x
[a, b] con, ad esempio, x < x
:
per la proposizione 5.2.9 ed il corollario 5.2.10 si ha
[F(x) F(x
)[ =
_
x
a
f(t) dt
_
x
a
f(t) dt
_
x
x
f(t) dt
_
x
x
[f(t)[ dt
;
scelta la suddivisione banale
1
= x, x
dellintervallo I = [x, x
], si ottiene,
per denizione di integrale,
[F(x) F(x
)[
_
x
x
[f(t)[ dt
S([f[,
1
) = sup
I
[f[ [x x
[.
Ne segue la tesi.
Teorema 5.4.2 (teorema fondamentale del calcolo integrale) Sia f
una funzione continua in [a, b]. Allora la sua funzione integrale F è derivabile
in [a, b] e si ha
F
(x) = f(x) x [a, b].

0
[a, b]. Per ogni x [a, b] x
0
consideriamo
il rapporto incrementale di F in x
0
:
F(x) F(x
0
)
x x
0
=
1
x x
0
_
x
x
0
f(t) dt.
Poiche f è continua in x
0
, ssato > 0 esisterà > 0 tale che
[t x
0
[ < = [f(t) f(x
0
)[ < .
Quindi possiamo scrivere (essendo
_
x
x
0
c dt = c(x x
0
) per ogni costante c)
F(x) F(x
0
)
x x
0
=
1
x x
0
_
x
x
0
[f(t) f(x
0
) +f(x
0
)] dt =
=
1
x x
0
_
x
x
0
[f(t) f(x
0
)] dt +f(x
0
).
Se ora x x
0
, il primo termine allultimo membro è innitesimo: infatti non
appena [x x
0
[ < avremo, per la monotonia dellintegrale,
1
x x
0
_
x
x
0
[f(t) f(x
0
)] dt

1
[x x
0
[
_
x
x
0
[f(t) f(x
0
)[ dt
1
[x x
0
[
_
x
x
0
dt
= .
356
Pertanto
lim
xx
0
F(x) F(x
0
)
x x
0
= f(x
0
) x
0
[a, b],
Osservazioni 5.4.3 (1) La continuità di f è essenziale nel teorema prece-
dente: vedere lesercizio 5.4.1.
(2) Nella dimostrazione precedente in eetti si è provato un risultato pi` u
preciso: se f 1(a, b) e f è continua in un punto x
0
, allora F è derivabile
in quel punto, con F
(x
0
) = f(x
0
).
Perche il teorema fondamentale del calcolo integrale ha questo nome? Perche,
come presto scopriremo, per mezzo di esso è possibile calcolare una gran
quantità di integrali: già questo lo rende un teorema basilare. Ma la sua
importanza è ancora maggiore per il fatto che esso mette in relazione fra
loro lintegrale e la derivata, cioè due operazioni i cui signicati geometrici
sembrano avere ben poca relazione fra di loro: il calcolo di unarea delimitata
da un graco e la nozione di retta tangente a tale graco. In realtà, in un
certo senso, lintegrazione e la derivazione sono due operazioni luna inversa
dellaltra.
Per capire meglio come stanno le cose, è necessario introdurre la nozione di
primitiva di una data funzione.
Denizione 5.4.4 Sia f : [a, b] R una funzione qualunque. Diciamo
che una funzione G : [a, b] R è una primitiva di f se G è derivabile in
[a, b] e se risulta G
(x) = f(x) per ogni x [a.b]. Linsieme delle primitive

di una funzione f si chiama integrale indenito di f e si indica talvolta
con lambiguo simbolo
_
f(x) dx (il quale quindi rappresenta un insieme di
funzioni e non una singola funzione).
Non tutte le funzioni sono dotate di primitive (esercizio 5.4.1); però, se ne
esiste una allora ne esistono innite: infatti se G è una primitiva di f, allora
G + c è ancora una primitiva di f per ogni costante c R. Daltra parte,
sappiamo dal teorema fondamentale del calcolo integrale che ogni funzione f
continua su [a, b] ha una primitiva: la sua funzione integrale F.
Corollario 5.4.5 Se f è continua in [a, b] e G è unarbitraria primitiva di
f, allora si ha
_
y
x
f(t) dt = G(y) G(x) x, y [a, b].
357
Dimostrazione Sia F(x) =
_
x
a
f(t) dt la funzione integrale di f. Allora si
ha F
= G
= f in [a, b], e in particolare (F G)
= 0 in [a, b]. Quindi F G

è una funzione costante in [a, b] (proposizione 4.3.4), ossia esiste c R tale
che G(x) = F(x) +c per ogni x [a, b]. Ne segue
G(y) G(x) = F(y) F(x) =
_
y
x
f(t) dt x, y [a, b].
Osservazioni 5.4.6 (1) Si suole scrivere [G(t)]
y
x
in luogo di G(y) G(x).
(2) La dimostrazione precedente mostra, pi` u in generale, che se f ha una
primitiva F, allora ogni altra primitiva G di f è della forma G(x) = F(x)+c:
in altre parole, se F è una assegnata primitiva di f si ha
_
f(x) dx = F +c, c R.
Dunque per calcolare lintegrale
_
y
x
f(t) dt occorre determinare una primitiva
G di f (per poi calcolarla negli estremi dellintervallo), il che corrisponde
essenzialmente a fare loperazione inversa della derivazione. Per questa ope-
razione non ci sono purtroppo ricette prestabilite, come invece accade per
il calcolo delle derivate: vi sono funzioni continue molto semplici, quali ad
esempio e
x
2
oppure
sin x
x
, le cui primitive (che esistono, per il teorema fon-
damentale del calcolo integrale) non sono esprimibili in termini di funzioni
elementari; il che, peraltro, non impedisce di calcolarne gli integrali con qua-
lunque precisione prestabilita, utilizzando formule di quadratura o scrivendo
le primitive come somme di opportune serie di potenze.
`
E utile a questo punto riportare la seguente tabella di primitive note:
358
integrando primitiva
x
p
(p ,= 1)
x
p+1
p + 1
x
1
log [x[
e
x
( ,= 0)
e
x
cos x sin x
sin x cos x
cosh x sinh x
sinh x cosh x
integrando primitiva
n=0
a
n
x
n
n=0
1
n + 1
a
n
x
n+1
1
1 +x
2
arctan x
1
1 x
2
arcsin x
1
1 +x
2
log
_
x +
1 +x
2
_
1
cos
2
x
tan x
1
sin
2
x

1
tan x
Esercizi 5.4
1. Si consideri la funzione segno di x, denita da
f(x) = sgn(x) =
_
_
_
1 se 0 < x 1
0 se x = 0
1 se 1 x < 0.
(i) Si calcoli
_
x
0
f(t) dt per ogni x [1, 1].
(ii) Si provi che f non ha primitive in [1, 1].
2. Provare che esistono funzioni f discontinue in R, ma dotate di primitive.
[Traccia: posto F(x) = x sin(1/x) per x ,= 0 e F(0) = 0, si verichi
che F è derivabile e si prenda f = F
.]
3. Si dica sotto quali ipotesi si ha:
(i)
d
dx
_
x
a
f(t) dt = f(x), (ii)
_
x
a
f
(t) dt = f(x) f(a).

359
4. Sia f una funzione continua in R.
(i) Si provi che se e sono funzioni derivabili su R, allora
d
dx
_
(x)
(x)
f(t) dt = f((x))
(x) f((x))
(x) x R.
(ii) Calcolare
d
dx
_
2x
x
f(t) dt,
d
dx
_
x
2
x
f(t) dt,
d
dx
sin
__
3
x
2
x
f(t) dt
_
.
[Traccia: si tratta di derivare opportune funzioni composte.]
5. Sia f una funzione continua e non negativa in [a, b]. Si provi che se
_
b
a
f(x) dx = 0, allora f 0 in [a, b], e che la conclusione è falsa se si
toglie una qualunque delle ipotesi.
6. Sia f : R R continua e tale che f(x) R per x . Si provi
che
lim
x
1
x
_
x
0
f(t) dt = .
7. Determinare le primitive delle funzioni arcsin x, arctan x, settsinh x.
8. Sia f : R R una funzione periodica di periodo T > 0, cioè tale che
f(x + T) = f(x) per ogni x R. Provare che se f 1(0, T) allora
f 1(a, a +T) per ogni a R e
_
a+T
a
f(t) dt =
_
T
0
f(t) dt a R.
5.5 Metodi di integrazione
Non esiste una procedura standard per il calcolo delle primitive e quindi degli
integrali. I metodi che esporremo adesso servono a trasformare gli integrali
(e non a calcolarli), naturalmente con la speranza che dopo la trasformazione
lintegrale risulti semplicato e calcolabile.
360
Integrazione per parti
Il metodo di integrazione per parti nasce come conseguenza della formula per
la derivata di un prodotto: poiche
D(f(x)g(x)) = f
(x)g(x) +f(x)g
(x),
avremo
f
(x)g(x) = D(f(x)g(x)) f(x)g
(x),
cosicche, integrando i due membri su [a, b], si ottiene per ogni coppia di
funzioni f, g C
1
[a, b] la seguente formula di integrazione per parti:
_
b
a
f
(x)g(x) dx = [f(x)g(x)]
b
a
_
b
a
f(x)g
(x) dx.
Con questa formula, lintegrale
_
b
a
f
(x)g(x) dx si trasforma nellintegrale

_
b
a
f(x)g
(x) dx: se sappiamo calcolare questo, sapremo calcolare anche lal-

tro.
Esempi 5.5.1 (1) Consideriamo lintegrale
_
b
a
x sin x dx. Si ha, con f
(x) =
sin x e g(x) = x,
_
b
a
x sin xdx = [x(cos x)]
b
a
_
b
a
1 (cos x) dx = [x cos x + sin x]
b
a
,
e in particolare una primitiva di x sin x è x cos x + sin x. In modo analogo
si calcola lintegrale
_
b
a
x cos xdx.
(2) Per il calcolo di
_
b
a
x
2
e
x
dx si ha, con f
(x) = e
x
, g(x) = x
2
,
_
b
a
x
2
e
x
dx =
_
x
2
e
x
b
a
_
b
a
2xe
x
dx =
(con unaltra integrazione per parti)
=
_
x
2
e
x
2xe
x
b
a
+ 2
_
b
a
e
x
dx =
_
x
2
e
x
2xe
x
+ 2e
x
b
a
,
e in particolare una primitiva di x
2
e
x
è (x
2
2x + 2)e
x
.
361
(3) Calcoliamo
_
b
a
e
x
cos xdx. Si ha, con f
(x) = e
x
e g(x) = cos x,
_
b
a
e
x
cos xdx = [e
x
cos x]
b
a
+
_
b
a
e
x
sin xdx =
(integrando nuovamente per parti)
= [e
x
cos x +e
x
sin x]
b
a
_
b
a
e
x
cos xdx;
quindi
2
_
b
a
e
x
cos xdx = [e
x
cos x +e
x
sin x]
b
a
,
e inne
_
b
a
e
x
cos xdx =
1
2
[e
x
cos x +e
x
sin x]
b
a
.
In particolare, una primitiva di e
x
cos x è
1
2
e
x
(cos x+sin x). Si noti che strada
facendo abbiamo indirettamente calcolato anche
_
b
a
e
x
sin xdx =
1
2
[e
x
cos x +e
x
sin x]
b
a
.
Osserviamo inoltre che avremmo potuto anche integrare per parti prendendo
g(x) = e
x
e f
(x) = cos x.
(4) Per lintegrale
_
b
a
1 x
2
dx notiamo prima di tutto che deve essere
[a, b] [1, 1] anche lintegrando sia ben denito. Si ha, con f
(x) = 1 e
g(x) =
1 x
2
,
_
b
a
1 x
2
dx =
_
x
1 x
2
_
b
a
+
_
b
a
x
2
1 x
2
dx =
=
_
x
1 x
2
_
b
a
+
_
b
a
x
2
1 + 1
1 x
2
dx =
=
_
x
1 x
2
_
b
a
_
b
a
1 x
2
dx +
_
b
a
1
1 x
2
dx;
quindi
2
_
b
a
1 x
2
dx =
_
x
1 x
2
_
b
a
+
_
b
a
1
1 x
2
dx =
_
x
1 x
2
+ arcsin x
_
b
a
362
e inne
_
b
a
1 x
2
dx =
1
2
_
x
1 x
2
+ arcsin x
_
b
a
.
In particolare, una primitiva di
1 x
2
è
1
2
_
x
1 x
2
+ arcsin x
.
In modo analogo si può calcolare lintegrale
_
b
a
1 +x
2
dx.
Osservazione 5.5.2 Se [a, b] = [1, 1], dallultimo degli esempi precedenti
segue
_
1
1
1 x
2
dx =
1
2
(arcsin 1 arcsin(1)) =

2
;
questa è larea del semicerchio unitario, in accordo con la denizione del
numero (denizione 1.12.6). Si osservi che abbiamo ritrovato il risultato
dellesercizio 5.1.4.
Integrazione per sostituzione
Il metodo di integrazione per sostituzione è glio della formula che fornisce
la derivata delle funzioni composte: poiche
D(g (x)) = g
((x))
(x),
scegliendo g(y) =
_
y
a
f(t) dt (con f funzione continua in [a, b]) si ha, per il
teorema fondamentale del calcolo integrale,
D
_
(x)
a
f(t) dt = f((x))
(x),
e quindi
_
v
u
f((x))
(x) dx =
_
_
(x)
a
f(t) dt
_
v
u
=
_
(v)
a
f(t) dt
_
(u)
a
f(t) dt.
Pertanto si ottiene per ogni coppia di funzioni f C[a, b], C
1
[c, d], con
a valori in [a, b], la seguente formula di integrazione per sostituzione:
_
v
u
f((x))
(x) dx =
_
(v)
(u)
f(t) dt u, v [c, d].
363
Il signicato è il seguente: la variabile x [c, d] dellintegrale di sinistra
viene sostituita dalla variabile t [a, b] nellintegrale di destra, mediante
il cambiamento di variabile t = (x); le lunghezze innitesime dx e dt
sono legate dalla relazione dt =
(x)dx, la quale è coerente col fatto che da

t = (x) segue
dt
dx
=
(x).
La formula di integrazione per sostituzione si può leggere al contrario: se
: [c, d] [a, b] è invertibile, si ha
_

1
(q)
1
(p)
f((x))
(x) dx =
_
q
p
f(t) dt p, q [a, b].
Si noti che, in realtà, anche sia valida questa formula non è aatto neces-
sario che sia invertibile: se u, v, w, z sono punti di [c, d] tali che (u) =
(w) = p, (v) = (z) = q (dunque non è iniettiva), si ha
_
v
u
f((x))
(x) dx =
_
_
(x)
a
f(t) dt
_
v
u
=
_
(v)
(u)
f(t) dt =
_
q
p
f(t) dt =
=
_
(z)
(w)
f(t) dt =
_
_
(x)
a
f(t) dt
_
z
w
=
_
z
w
f((x))
(x) dx.
Esempi 5.5.3 (1) Nellintegrale
_
b
a
x
3
1 +x
2
dx poniamo x
2
= t, da cui
dt = 2xdx: si ha allora
_
b
a
x
3
1 +x
2
dx =
_
b
2
a
2
1
2
t
1 +t dt =
1
2
_
b
2
a
2
(t + 1 1)
1 +t dt =
=
1
2
_
b
2
a
2
_
(1 +t)
3/2
(1 +t)
1/2
_
dt =
1
2
_
2
5
(1 +t)
5/2
2
3
(1 +t)
3/2
_
b
2
a
2
=
=
1
2
_
2
5
(1 +x
2
)
5/2
2
3
(1 +x
2
)
3/2
_
b
a
.
(2) Nellintegrale
_
b
a
e
x
dx bisogna supporre [a, b] ]0, +[, in modo che
lintegrando sia ben denito e limitato. Posto

x = t, da cui dt =
1
2
x
dx, si
ha
_
b
a
e
x
dx =
_

b
a
2e
t
dt =
_
2e
t
a
=
_
2e
x
_
b
a
.
(3) Sappiamo già calcolare lintegrale
_
1
0
1 x
2
dx (esempio 5.5.1 (4)), ma
ora useremo un altro metodo. Qui leggiamo la formula di integrazione per
364
sostituzione al contrario: poniamo x = sin t, da cui dx = cos t dt; quando x
descrive [0, 1], si ha t [0, /2], oppure t [/2, ], o anche t [, 5/2] (e
innite altre scelte sono possibili): se si è scelto per la variabile t lintervallo
[0, /2], si ottiene
_
1
0
1 x
2
dx =
_
/2
0
_
1 sin
2
t cos t dt =
(essendo cos t > 0 in [0, /2])
=
_
/2
0
cos
2
t dt = (integrando per parti)
=
1
2
[t sin t cos t]
/2
0
=

4
.
Se invece scegliamo per la t lintervallo [/2, ], otteniamo la stessa cosa:
_
1
0
1 x
2
dx =
_
/2
_
1 sin
2
t cos t dt =
(essendo cos t < 0 in [/2, ])
=
_
/2
(cos
2
t) dt =
_

/2
cos
2
t dt =

4
.
Il lettore può vericare per suo conto, prestando attenzione al segno di cos t,
che anche scegliendo per la t lintervallo [, 5/2] il risultato dellintegrazione
è lo stesso.
(4) Nellintegrale
_
b
a
1 +x
2
dx poniamo x = sinh t, da cui dx = cosh t dt, e
ricordiamo che la funzione inversa del seno iperbolico è settsinh x = log(x +
1 +x
2
), x R. Si ha allora
_
b
a
1 +x
2
dx =
_
settsinh b
settsinh a
cosh
2
t dt;
con due integrazioni per parti si ottiene
_
b
a
1 +x
2
dx =
1
2
[t + sinh t cosh t]
settsinh b
settsinh a
=
1
2
_
settsinh x +x
1 +x
2
_
b
a
.
In modo analogo si calcola lintegrale
_
b
a
x
2
1 dx, sempre che si abbia
[a, b]] 1, 1[= .
Nellesercizio 5.5.7 si fornisce una giusticazione dei nomi seno iperbolico,
coseno iperbolico e settore seno iperbolico.
365
Esercizi 5.5
1. Calcolare i seguenti integrali ([x] denota la parte intera di x):
_
11
4
[x] dx,
_
1
1
max
_
x,
x
1
2
_
dx,
_
5
10
x[x[ dx,
_
8
5
[[x] +x[ dx,
_

minsin x, cos x dx,

_
6
0
(x
2
[x
2
]) dx.
2. Calcolare
_
10
10
f(x) dx, ove
f(x) =
_
_
3 se x [10, 7]
1 se x ] 7, 1]
10 se x ]1, 5[
1000 se x = 5
8 se x ]5, 10].
3. Determinare larea della regione piana delimitata da:
(i) la retta y = x e la parabola y = x
2
;
(ii) le parabole y
2
= 9x e x
2
= 9y;
(iii) lellisse
x
2
9
+ 4y
2
= 1;
(iv) le rette y = x, y = x, y = 2x 5.
4. Calcolare le primitive di x
n
e
x
per ogni n N.
5. Calcolare i seguenti integrali
_
/2
/2
cos
2
9xdx,
_
/2
/2
sin
2
10xdx,
_
/4
0
tan x dx,
_
0
3
2
x
dx,
_
100
1
log x
x
dx,
_

0
sin x cos xdx,
_
10
0
x + 2
1 +x
2
dx,
_
2
0
8
x/3
dx.
366
6. Si provi che se m, n N
+
si ha
_

cos mx sin nxdx = 0,

_

cos mx cos nxdx =

_

sin mx sin nx dx =
_
0 se m ,= n
se m = n.
7. (i) Siano O = (0, 0), A = (1, 0) e P = (cos t, sin t). Si provi, calcolando
un opportuno integrale, che larea del settore circolare OAP della
gura a sinistra è uguale a t/2.
(ii) Sia inoltre Q = (cosh t, sinh t). Si provi, analogamente, che larea
del settore iperbolico OAQ della gura a destra è pari a t/2.
8. Provare che se f è una funzione continua in [a, b] si ha
_
x
a
__
t
a
f(s) ds
_
dt =
_
x
a
(x s)f(s) ds.
9. Provare che se f 1(0, a) si ha
_
a
0
f(t) dt =
_
a
0
f(a t) dt,
e utilizzando questo risultato si calcoli lintegrale
_

0
x sin x
1 + cos
2
x
dx.
367
10. Sia
n=0
a
n
x
n
una serie di potenze con raggio di convergenza R > 0.
Provare che la serie è integrabile termine a termine in ogni intervallo
[a, b] contenuto in ] R, R[, cioè che risulta
_
b
a
n=0
a
n
x
n
dx =
n=0
_
b
a
a
n
x
n
dx =
n=0
_
1
n + 1
a
n
x
n+1
_
b
a
.
11. Calcolare i seguenti integrali:
_
3
2
2x + 1
3x 1
dx,
_
1
0
dx
x
2
+x + 1
,
_
1
0
sinh
2
xdx,
_
/2
/4
dx
sin x
,
_
1
0
e
x
1 dx,
_
1
1/2
x log
2
xdx,
_
e
1
x log xdx,
_
1
1
e
e
x
+x
dx,
_
1
0
x arctan x
2
dx,
_
1
0
x arctan
2
xdx,
_
10
0
x
2
(1 +x
2
)
2
dx,
_
4
3
sin log xdx,
_
1
0
e
x
2
e
x
+ 1
dx,
_
2
2
x
7
cosh
3
x
4
dx,
_
2e
e
log log x
x
dx.
12. Dimostrare che se f è una funzione continua e non negativa in [a, b],
allora
lim
n
__
b
a
f(x)
n
dx
_
1/n
= max
[a,b]
f.
13. Sia f : [a, b] R una funzione di classe C
m+1
. Si esprima il resto di
Taylor in forma integrale, ossia si dimostri che per ogni x, x
0
[a, b] si
ha
f(x) =
m
n=0
1
n!
f
(n)
(x
0
)(x x
0
)
n
+
_
x
x
0
(x t)
m
m!
f
(m+1)
(t) dt.
[Traccia: per x [a, b] ssato si consideri la funzione
g(t) = f(x)
m
n=0
1
n!
f
(n)
(t)(x t)
n
, t [a, b],
e si applichi la formula g(x) g(x
0
) =
_
x
x
0
g
(t) dt.]
368
14. Posto I
n
=
_
/2
0
sin
n
xdx, si provi che
I
n
=
n 1
n
I
n2
n 2;
se ne deduca che
I
2n
=
(2n 1)!!
(2n)!!
2
n N
+
, I
2n+1
=
(2n)!!
(2n + 1)!!
n N,
ove k!! denota il prodotto di tutti i numeri naturali non superiori a k
aventi la stessa parità di k.
15. (i) Sia f
n
una successione di funzioni integrabili secondo Riemann
su [a, b]. Provare che se esiste una funzione f : [a, b] R tale che
lim
n
sup
x[a,b]
[f
n
(x) f(x)[ = 0,
allora
lim
n
_
b
a
f
n
(x) dx =
_
b
a
f(x) dx.
(ii) Si verichi che
lim
n
_
1
0
nx
n
dx ,=
_
1
0
lim
n
nx
n
dx.
Come mai?
16. (Irrazionalità di ) Si consideri lintegrale
I
n
=
2
n!
_
2
0
_
2
4
t
2
_
n
cos t dt, n N.
(i) Si verichi che I
n
> 0 per ogni n N.
(ii) Si provi per induzione che I
n+1
= (4n + 2)I
n

2
I
n1
per ogni
n N
+
.
(iii) Se ne deduca che I
n
= P
n
(
2
), ove P
n
è un opportuno polinomio,
di grado al pi` u n, a coecienti interi.
(iv) Supposto per assurdo che
2
sia un razionale della forma p/q, si
provi che q
n
P
n
(
2
) Z
+
e che, daltra parte, lim
n
q
n
I
n
= 0.
369
(v) Si concluda che è irrazionale.
17. (Irrazionalità di , bis) Supposto che risulti =
p
q
, con p, q Q
+
, si
consideri per ogni n N il polinomio
P
n
(x) =
x
n
(p qx)
n
n!
.
(i) Si verichi che P
n
(x) > 0 per ogni x ]0, [.
(ii) Si mostri che D
k
P
n
(0) e D
k
P
n
() sono numeri interi per ogni k N.
(iii) Posto a
n
=
_
0
P
n
(x) sin xdx, si osservi che 0 < a
n
<
C
n
n!
per ogni
n N, ove C è unopportuna costante;
(iv) integrando 2n volte per parti, si provi che a
n
Z per ogni n N,
ottenendo cos` un assurdo.
5.6 Formula di Stirling
La formula di Stirling è una stima che descrive in modo molto preciso il
comportamento asintotico della successione n!
nN
, e che è di grande im-
portanza sia teorica che applicativa. La sua dimostrazione, non banale ma
nemmeno troppo dicile, richiede luso di molti degli strumenti del calcolo
che abbiamo n qui analizzato. Naturalmente, il risultato espresso dalla for-
mula di Stirling implica quello dellesempio 2.7.10(3) e, a maggior ragione,
quello degli esercizi 1.6.16 e 4.3.14.
Teorema 5.6.1 (formula di Stirling) Risulta
2n
_
n
e
_
n
e
1
12(n+1)
< n! <
2n
_
n
e
_
n
e
1
12n
n N
+
.
Dimostrazione Dividiamo largomentazione in quattro passi.
1
o
passo Proviamo che esiste A > 0 tale che
A
n
_
n
e
_
n
e
1
12(n+1)
< n! < A
n
_
n
e
_
n
e
1
12n
n N
+
,
cosicche, in particolare
lim
n
n!
n
_
n
e
_
n
= A.
370
Consideriamo a questo scopo la successione
a
n
=
n!
n
_
e
n
_
n
, n N
+
,
e osserviamo anzitutto che, come è immediato vericare,
a
n
a
n+1
=
1
e
_
1 +
1
n
_
n+
1
2
n N
+
.
Daltra parte, ricordando lesercizio 4.3.8, si ha
log
_
1 +
1
n
_
n+
1
2
=
_
n +
1
2
_
log
_
1 +
1
n
_
=
=
2n + 1
2
log
n + 1
n
=
k=0
1
2k + 1
1
(2n + 1)
2k
.
Ne segue (esempio 2.2.6 (1))
1+
1
3
1
(2n + 1)
2
< log
_
1 +
1
n
_
n+
1
2
< 1+
1
3
k=1
1
(2n + 1)
2k
= 1+
1
3
1
(2n+1)
2
1
1
(2n+1)
2
,
e dunque
e
1+
1
3
1
4n
2
+4n+1
<
_
1 +
1
n
_
n+
1
2
< e
1+
1
3
1
4n
2
+4n
;
in particolare, essendo 4(n + 1)(n + 2) > 4n
2
+ 4n + 1, otteniamo
e
1+
1
12(n+1)(n+2)
<
_
1 +
1
n
_
n+
1
2
< e
1+
1
12n(n+1)
.
Questa doppia diseguaglianza può essere riscritta nella forma
e
1
12(n+1)
e
1
12(n+2)
<
a
n
a
n+1
<
e
1
12n
e
1
12(n+1)
.
Ciò mostra che la successione a
n
e
1
12(n+1)
è strettamente decrescente (oltre
che limitata, essendo positiva) e quindi ha limite A 0, mentre la successione
a
n
e
1
12n
è strettamente crescente e converge necessariamente allo stesso
371
limite A, visto che e
1
12n
1: in particolare risulta A > 0 e si ha, come si
voleva,
Ae
1
12(n+1)
< a
n
< Ae
1
12n
n N
+
.
Per denizione di a
n
, ciò prova il 1
o
passo.
2
o
passo Proviamo la relazione
2
= lim
n
(2n)!!
2
(2n + 1)!!(2n 1)!!
.
Consideriamo la successione
_
_
/2
0
sin
m
xdx
_
mN
: si verica agevolmente
(esercizio 5.5.14) che
_
/2
0
sin
m
xdx =
m1
m
_
/2
0
sin
m2
xdx m 2,
e da questa uguaglianza segue induttivamente, sempre per lesercizio 5.5.14,
_
/2
0
sin
2n
xdx =
(2n 1)!!
(2n)!!
2
n N
+
,
_
/2
0
sin
2n+1
xdx =
(2n)!!
(2n + 1)!!
n N.
Quindi, dividendo la prima equazione per la seconda e rimaneggiando i
termini, si ottiene
2
=
(2n)!!
2
(2n + 1)!!(2n 1)!!
_
/2
0
sin
2n
xdx
_
/2
0
sin
2n+1
xdx
n N
+
.
Daltra parte risulta per ogni n N
+
1 <
_
/2
0
sin
2n
xdx
_
/2
0
sin
2n+1
xdx
=
2n + 1
2n
_
/2
0
sin
2n
xdx
_
/2
0
sin
2n1
xdx
2n + 1
2n
= 1 +
1
2n
,
il che implica
2
= lim
n
(2n)!!
2
(2n + 1)!!(2n 1)!!
_
/2
0
sin
2n
xdx
_
/2
0
sin
2n+1
xdx
= lim
n
(2n)!!
2
(2n + 1)!!(2n 1)!!
.
372
Ciò prova il 2
o
passo.
3
o
passo Dimostriamo che
= lim
n
2
2n
(n!)
2
(2n)!
n
.
Dal 2
o
passo deduciamo
2
= lim
n
2
2
4
2
. . . (2n 2)
2
(2n)
2
3
2
5
2
. . . (2n 1)
2
(2n + 1)
= lim
n
2
2
4
2
. . . (2n 2)
2
2n
3
2
5
2
. . . (2n 1)
2
,
e dunque
= lim
n
2
2 4 . . . (2n 2)
2n
3 5 . . . (2n 1)
=
= lim
n
2
2
2
4
2
. . . (2n 2)
2
(2n)
2
(2n)!
2n
= lim
n
2
2n
(n!)
2
(2n)!
n
.
Il 3
o
passo è provato.
4
o
passo Concludiamo la dimostrazione: Dal 1
o
passo abbiamo
A = lim
n
n!
n
_
e
n
_
n
;
daltronde risulta, come è facile vericare,
2
2n
(n!)
2
(2n)!
n
=
a
2
n
a
2n
2
,
e pertanto dai passi 3 e 1 segue
= lim
n
a
2
n
a
2n
2
=
A
2
,
ovvero A =
2.
Il 1
o
passo implica allora la validità della formula di Stirling.
Esercizi 5.6
1. Si calcoli
lim
n
n! e
n+
1
12n
n
n+
1
2
.
373
2. Di quante cifre è formato (in base 10) il numero 1000! ?
[Traccia: detto N il numero di cifre cercato, si osservi che deve essere
10
N1
1000! < 10
N
e si faccia uso della formula di Stirling nonche di
una buona calcolatrice...]
5.7 Integrali impropri
La teoria dellintegrazione secondo Riemann si riferisce a funzioni limitate
su intervalli limitati di R. Se manca una di queste condizioni, si deve pas-
sare ai cosiddetti integrali impropri. Ci limiteremo a considerare tre casi:
(i) lintegrale su un intervallo limita-
to di funzioni non limitate (ad
esempio:
_
1
0
log xdx);
(ii) lintegrale su intervalli non limitati
di funzioni limitate (ad esempio:
_
0
e
x
dx);
(iii) le due cose insieme, ossia lin-
tegrale su intervalli non limita-
ti di funzioni non limitate (ad
esempio:
_
0
e
x
dx).
Denizione 5.7.1 (i) Sia f :]a, b] R tale che f 1(c, b) per ogni c
374
]a, b[. Se esiste il limite (nito o innito)
lim
ca
+
_
b
c
f(x) dx,
esso viene detto integrale improprio di f su [a, b] e indicato col simbolo
_
b
a
f(x) dx; in tal caso la funzione f viene detta integrabile in senso
improprio su [a, b]. Se lintegrale improprio di f è nito, la funzioen f
si dice sommabile in [a, b].
(ii) Sia f : [a, [R tale che f 1(a, c) per ogni c > a. Se esiste il limite
(nito o innito)
lim
c
_
c
a
f(x) dx,
esso viene detto integrale improprio di f su [a, [ e indicato col simbolo
_
a
f(x) dx; in tal caso la funzione f viene detta integrabile in senso
improprio su [a, [. Se lintegrale improprio di f è nito, la funzione
f si dice sommabile su [a, [.
In entrambi i casi (i) e (ii), lintegrale improprio di f, se esiste, si dice
convergente o divergente a seconda che sia nito o innito.
Modiche opportune di questa denizione permettono di trattare i casi in cui
f ha una singolarità nel punto b, anziche in a, oppure è denita su ] , a],
anziche su [a, [.
Tutto questo riguarda i casi (i) e (ii). Per il caso (iii), ci limitiamo a dire
che lintegrale andrà spezzato in due integrali di tipo (i) e (ii), e che esso
avrà senso se e solo se: (a) hanno senso entrambi i gli integrali, e (b) ha
senso farne la somma. Ad esempio, lintegrale
_
0
e
x
dx va inteso come
_
b
0
e
x
dx+
_
b
e
x
dx, ove b è un arbitrario numero positivo; naturalmente
il valore dellintegrale non dipenderà dal modo in cui è stato spezzato, cioè
non dipenderà dal punto b.
Esempio 5.7.2 Calcoliamo i tre integrali citati allinizio: si ha per ogni
c > 0
_
1
c
log xdx = (integrando per parti)
= [x log x]
1
c

_
1
c
1 dx = [x log x x]
1
c
= 1 c log c +c,
375
da cui
_
1
0
log xdx = lim
c0
+
(1 c log c +c) = 1.
Analogamente, per ogni c > 0 si ha
_
c
0
e
x
dx = [e
x
]
c
0
= e
c
+ 1,
cosicche
_

0
e
x
dx = lim
c+
(e
c
+ 1) = 1.
Inne, scelto b = 1 risulta per ogni c ]0, 1[ e per ogni d > 1:
_
1
c
e
x
dx =
_
2e
x
_
1
c
= 2e
1
+ 2e
c
,
_
d
1
e
x
dx =
_
2e
x
_
d
1
= 2e
d
+ 2e
1
;
dunque
_
1
0
e
x
dx = 2e
1
+ 2,
_

1
e
x
dx = 2e
1
,
da cui
_

0
e
x
dx = 2.
Si noti che se nel calcolo del terzo integrale avessimo scelto b = 37, avremmo
ottenuto ugualmente
_

0
e
x
dx = lim
c0
+
_
37
c
e
x
dx + lim
d+
_
d
37
e
x
dx =
= lim
c0
+
_
2e
x
_
37
c
+ lim
d+
_
2e
x
_
d
37
=
= lim
c0
+
(2e
37
+ 2e
c
) + lim
d+
(2e
d
+ 2e
37
) = 2.
Osservazioni 5.7.3 (1) Consideriamo un integrando f, denito in ]a, b] op-
pure in [a, [, e supponiamo che f sia integrabile secondo Riemann in ogni
sottointervallo chiuso e limitato contenuto nellintervallo di denizione. Sia
376
F una primitiva di f, anchessa denita in ]a, b] oppure in [a, [. Lesistenza
dellintegrale improprio di f in [a, b], o in [a, [, equivale allesistenza del
limite di F(c) per c a
+
o per c . Infatti, ad esempio,
_
b
a
f(x) dx = lim
ca
+
_
b
c
f(x) dx = lim
ca
+
[F(x)]
b
c
= F(b) lim
ca
+
F(c),
e laltro caso è analogo. Nellesempio 5.7.2 quindi si poteva pi` u rapidamente
scrivere, sottintendendo la notazione [G(x)]
b
a
= lim
xb
G(x) lim
xa
G(x),
_
1
0
log xdx = [x log x x]
1
0
= 1,
_

0
e
x
dx =
_
e
x
0
= 1,
_

0
e
x
dx =
_
2e
x
_
0
= 2.
(2) Se f e g sono due funzioni sommabili su un intervallo limitato [a, b]
(oppure su una semiretta), allora anche f + g e f, per ogni R, sono
sommabili e per i relativi integrali impropri vale la relazione
_
b
a
[f(x)+g(x)] dx =
_
b
a
f(x) dx+
_
b
a
g(x) dx,
_
b
a
(f(x)) dx =
_
b
a
f(x) dx.
La verica è immediata sulla base della denizione. Si noti che lanalogo
enunciato per funzioni soltanto integrabili in senso improprio è falso: se ad
esempio
_
b
a
f(x) dx = + e
_
b
a
g(x) dx = , la funzione f + g non è in
generale integrabile in senso improprio e comunque la prima delle relazioni
precedenti non ha senso. Lo stesso vale per la seconda relazione, nel caso
= 0.
Non sempre gli integrali impropri sono calcolabili esplicitamente: è dunque
importante stabilire criteri sucienti a garantire lintegrabilità e la sommabi-
lità di una funzione. Si noti lanalogia con ciò che succede con le serie, di cui
è interessante conoscere la convergenza anche quando non se ne sa calcolare
la somma.
Anzitutto, se f ha segno costante, il suo integrale improprio ha sempre senso:
377
Proposizione 5.7.4 Sia f : [a, [ una funzione di segno costante. Se f
1(a, c) per ogni c > a, allora f è integrabile in senso improprio su [a, [,
(con integrale convergente o divergente).
Dimostrazione Per ipotesi, la funzione integrale F(x) =
_
x
a
f(t) dt è de-
nita per ogni x > a. Tale funzione è monotona, in quanto se x < y si
ha
F(y) F(x) =
_
y
x
f(t) dt =
_
0 se f 0 in [a, [
0 se f 0 in [a, [.
Dunque esiste il limite
lim
c
F(c) = lim
c
_
c
a
f(t) dt,
cioè f ha integrale improprio su [a, [.
Osservazione 5.7.5 Analogamente, una funzione f :]a, b] R, di segno
costante, tale che f 1(c, b) per ogni c ]a, b[, è integrabile in senso im-
proprio su [a, b] (con integrale convergente o divergente). La dimostrazione
è esattamente la stessa.
Lesempio che segue è fondamentale per il successivo teorema di confronto.
Esempio 5.7.6 La funzione f :]0, [ R denita da f(x) = x
, ove
è un ssato numero positivo, è certamente integrabile in senso improprio in
]0, [, essendo sempre positiva. Verichiamo che tale integrale è divergente,
decomponendolo in
_
1
0
x
dx +
_
1
x
dx. Si ha
_
1
0
x
dx =
_
_
[log x]
1
0
= +
_
x
1
1
_
1
0
=
_
1
1
+
se = 1
se 0 < < 1
se > 1.
_

1
x
dx =
_
_
[log x]
1
= +
_
x
1
1
_
1
=
_
+
1
1
se = 1
se 0 < < 1
se > 1.
Sommando i due addendi, lintegrale
_
0
x
dx diverge in tutti i casi. Si noti

tuttavia che
_
1
0
x
dx < < 1;
_

1
x
dx < > 1.
378
Le funzioni x
(e le loro analoghe (x a)
) si prestano assai bene come

termini di confronto per stabilire la sommabilità o la non sommabilità di
funzioni pi` u complicate. Tale possibilità è garantita dal seguente
Teorema 5.7.7 (di confronto) Siano f, g : [a, [R funzioni integrabili
secondo Riemann in ogni intervallo [a, c] [a, [, e supponiamo che g sia
non negativa e sommabile su [a, [. Se risulta [f(x)[ g(x) per ogni x a,
allora anche f è sommabile su [a, [ e si ha
_

a
f(x) dx
_

a
[f(x)[ dx
_

a
g(x) dx.
Dimostrazione Supponiamo dapprima f 0: allora, per ogni c > a, grazie
alla monotonia dellintegrale si ha
0
_
c
a
f(x) dx
_
c
a
g(x) dx.
Poiche f, essendo non negativa, ha certamente integrale improprio al pari di
g, al limite per c troviamo
0
_

a
f(x) dx
_

a
g(x) dx,
e dato che g è sommabile, tale risulta anche f.
Supponiamo ora f di segno variabile. Per ogni c > a possiamo scrivere
_
c
a
f(x) dx
_
c
a
[f(x)[ dx
_
c
a
g(x) dx.
Basta ora provare che f è sommabile: una volta fatto ciò, infatti, la stima
precedente, passando al limite per c , ci dirà che
_

a
f(x) dx
_

a
[f(x)[ dx
_

a
g(x) dx < .
A questo scopo è suciente scrivere
f(x) = [f(x)[ ([f(x)[ f(x)),
e osservare che [f[ è sommabile, come si è visto, e che, per la parte già
dimostrata, lo stesso vale per [f[ f, essendo 0 [f[ f 2[f[. La
sommabilità di f segue dunque dallosservazione 5.7.3 (2).
379
Osservazioni 5.7.8 (1) Un risultato analogo vale ovviamente nel caso di
funzioni denite su ]a, b] e integrabili in ogni [c, b] ]a, b].
(2) Se [f[ è integrabile in senso improprio (su [a, [ o su [a, b]), allora anche
f lo è: basta applicare il teorema precedente scegliendo g = [f[. Vale anche
il viceversa: se f è integrabile in senso improprio, allora f, e quindi [f[,
è integrabile secondo Riemann in ogni sottointervallo chiuso e limitato, e
dunque [f[, avendo segno costante, è integrabile in senso improprio. Non
altrettanto si può dire per la sommabilità: se [f[ è sommabile, anche f lo è,
sempre per il teorema precedente; però, come vedremo fra poco, il viceversa
è falso.
Esempi 5.7.9 (1) Lintegrale
_
e
x
2
dx, che esiste certamente, per la pa-
rità dellintegrando è uguale a 2
_
0
e
x
2
dx (esercizio 5.7.1). Inoltre
e
x
2
_
1 se 0 x 1
e
x
se x 1,
cosicche lintegrale proposto è convergente:
_

0
e
x
2
dx
_
1
0
1 dx +
_

1
e
x
dx = 2.
(2) Nellintegrale
_
0
sin
xe
x
dx la funzione integranda non ha segno co-
stante, però si ha
[ sin
xe
x
[ e
x
x 0,
e la funzione e
x
è sommabile in [0, [. Ne segue che lintegrale proposto
esiste nito.
(3) Proviamo che la funzione f(x) =
sin x
x
è sommabile su [0, [, mentre
lintegrale improprio di [f[ in [0, [ è divergente. Si noti che in questo caso
losservazione 5.7.8 (2) e il teorema di confronto non sono applicabili, e la
sommabilità di f va dimostrata in maniera diretta.
Anzitutto, come sappiamo (esempio 3.3.5 (1)), la funzione f è prolungabile
con continuità in 0, col valore 1. Si ha, scegliendo 1 cos x come primitiva
di sin x, e integrando per parti:
_
c
0
sin x
x
dx =
_
1 cos x
x
_
c
0
+
_
c
0
1 cos x
x
2
dx =
1 cos c
c
+
_
c
0
1 cos x
x
2
dx
380
ove si è usato il fatto che anche
1cos x
x
è prolungabile con continuità in 0, col
valore 0 (esempio 3.3.5 (2)). Dunque per c si ha, essendo non negativo
lintegrando allultimo membro:
lim
c
_
c
0
sin x
x
dx =
_

0
1 cos x
x
2
dx.
Questo limite è nito per il teorema di confronto, essendo
1 cos x
x
2

_
1/2 se 0 < x 1 (per il criterio di Leibniz)
2/x
2
se x > 1.
Daltra parte per lintegrale improprio di
sin x
x
, che esiste certamente, si ha

_

0
sin x
x
dx = lim
k
_
k
0
sin x
x
dx = lim
k
k
h=0
_
(h+1)
h
[ sin x[
x
dx =
=
h=0
_
(h+1)
h
[ sin x[
x
dx =
h=0
_

0
sin t
t +h
dt
h=0
1
(h + 1)
_

0
sin t dt =
2
h=0
1
h + 1
= .
Esercizi 5.7
1. Sia f integrabile secondo Riemann oppure sommabile su [a, a]. Si pro-
vi che se f è una funzione pari, ossia f(x) = f(x), allora
_
a
a
f(x) dx =
2
_
a
0
f(x) dx, mentre se f è una funzione dispari, ossia f(x) = f(x),
allora
_
a
a
f(x) dx = 0.
2. Discutere lesistenza e la convergenza dei seguenti integrali impropri:
_
1
0
e
sin(1/x)
x
dx,
_

0
arctan x
x
_
[1 x[
dx,
_

e
x
e
x
2
dx,
_

1 +x
2
1 +x
4
x
2
+x
4
dx,
_
1
0
sin 2x
x(x 1/2)(x 1)
dx,
_

1
cos e
x
+ sin x
x
x 1
dx.
381
3. Discutere lesistenza ed eventualmente calcolare i seguenti integrali
impropri:
_

2
dx
x log x log log x
,
_
3/2
0
(tan x)
2/3
(sin x)
1/3
dx,
_

1
_
1
x

1
tan x
_
dx,
_
3/2
0
(tan x)
4/3
(sin x)
1/3
dx,
_
1
0
arccos x
_
(1 x
2
) arcsin x
dx,
_
1
1
3x
2
+ 2
x
5/3
dx,
_

1
log x
x(1 +
x)
2
dx,
_
3
0
dx
_
x
3
(3 x)
,
_
2
0
dx
_
x(2 x)
,
_

1
dx
x
2
x
2
1
,
_
3
0
x
x
3
+ 1
dx,
_
10
0
_
1 +
1
x
dx,
_

2
dx
x
x
2
4
,
_

1
dx
e
2x
e
x
,
_

dx
(1 +x
2
)
2
,
_

[x[
5
e
x
2
dx.
4. (Criterio integrale di convergenza per le serie) Sia f : [1, [ R una
funzione non negativa e decrescente. Si provi che lintegrale improprio
_
1
f(x) dx e la serie
n=1
f(n) sono entrambi convergenti o entrambi
divergenti.
5. Dimostrare che
_
1
0
arctan x
x
dx =
n=0
(1)
n
(2n + 1)
2
.
6. Dimostrare che
_
1
0
log x log(1 x) dx =
n=1
1
n(n + 1)
2
.
382
[Traccia: utilizzando lo sviluppo di Taylor di log(1 x), si verichi
che per ogni ]0, 1[ si ha
_
1
0
log x log(1 x) dx =
n=1
_
(1 )
n+1
n(n + 1)
2

(1 )
n+1
log(1 )
n(n + 1)
_
e poi si passi al limite per 0.]
7. Dimostrare che
n=N+1
1
n
2
<
1
N
N N
+
.
8. (Integrali di Fresnel) Provare che i due integrali impropri
_

0
sin(x
2
) dx,
_

0
cos(x
2
) dx
sono convergenti.
9. Provare che lintegrale improprio
_

0
x cos(x
4
) dx
è convergente, benche lintegrando non sia nemmeno limitato in [0, [.
10. (Integrale di Frullani) Sia f una funzione continua in [0, [, tale che
lintegrale improprio
_

a
f(x)
x
dx
sia convergente per ogni a > 0. Provare che se , sono numeri positivi
si ha
lim
a0
+
_

a
f(x) f(x)
x
dx = f(0) log

;
dedurne che
_

0
e
x
e
x
x
dx = log

,
_

0
cos x cos x
x
dx = log

.
383
11. Calcolare
_
/2
0
log sin xdx,
_
/2
0
log cos xdx.
[Traccia: utilizzare le formule di duplicazione.]
12. (Funzione di Eulero) Si consideri la funzione :]0, [ R denita
dallintegrale improprio
(p) =
_

0
x
p1
e
x
dx.
(i) Vericare che (p) è un numero reale e che (p + 1) = p(p) per
ogni p > 0.
(ii) Provare che è derivabile in ]0, [, con
(p) =
_

0
x
p1
log xe
x
dx.
(iii) Provare che è una funzione convessa di classe C
.
[Traccia: per (ii), si stimi la dierenza
(p +h) (p)
h

_

0
x
p1
log xe
x
dx
utilizzando il teorema di Lagrange; per (iii), si verichi che
(p) > 0.]

384
Capitolo 6
Equazioni dierenziali
6.1 Generalità
Una equazione dierenziale è unidentità che lega fra di loro, per ogni valore
della variabile x in un dato insieme, i valori della funzione incognita y(x) e
quelli delle sue derivate y
(x), y
(x), eccetera. Unequazione dierenziale è

detta ordinaria quando la variabile x appartiene a un intervallo di R, mentre
è detta alle derivate parziali allorche la variabile x è un elemento di R
m
(e in tal caso nellequazione compariranno le derivate parziali D
i
u, D
i
D
j
u,
eccetera). Non ci addentreremo comunque in questo vastissimo campo.
Unequazione dierenziale ordinaria è dunque unequazione funzionale del
tipo
f(x, y(x), y
(x), y
(x), . . . , y
(m)
(x)) = 0, x I,
ove f è una funzione continua nei suoi m + 2 argomenti, I è un intervallo
(eventualmente illimitato) di R e y è la funzione incognita. Lordine del-
lequazione dierenziale è il massimo ordine di derivazione che vi compare:
nellesempio sopra scritto lordine è m.
Unequazione dierenziale è detta in forma normale se si presenta nella forma
y
(m)
(x) = g(x, y(x), y
(x), . . . , y
(m1)
(x)), x I,
cioè se è risolta rispetto alla derivata di grado massimo dellincognita y.
In particolare, unequazione del primo ordine in forma normale è del tipo
y
(x) = g(x, y(x)), x I.

385
Perche si va ad esplorare lenorme universo delle equazioni dierenziali? Per-
che esse saltano fuori in modo naturale non appena si formula un qualunque
tipo, anche molto semplice, di modello matematico per descrivere fenomeni
sici, chimici, biologici, economici, eccetera.
Accanto alle equazioni è utile considerare anche sistemi dierenziali
f(x, u(x), u
(x)) = 0, x I,
eventualmente in forma normale
u
(x) = g(x, u(x)), x I,

ove stavolta lincognita è una funzione u : I R
m
. Il motivo di questo
allargamento del tiro è il fatto che ogni equazione dierenziale di ordine m
può essere trasformata, in modo equivalente, in un sistema di m equazioni
dierenziali del primo ordine, il quale è, in linea generale, pi` u semplice da
trattare. Infatti, se y C
m
(I) risolve lequazione
f(x, y, y
, . . . , y
(m)
) = 0, x I
(è consuetudine omettere dallincognita y la variabile indipendente x), intro-
ducendo le m funzioni
u
0
(x) = y(x), u
1
(x) = y
(x), . . . , u
m1
(x) = y
(m1)
(x),
si ottiene una funzione u = (u
0
, u
1
, . . . u
m1
) C
1
(I, R
m
) che risolve il
sistema dierenziale
_
_
(u
0
)
= u
1
(u
1
)
= u
2
. . . . . . . . .
(u
m2
)
= u
m1
f(x, u
0
, u
1
, . . . , u
m1
, (u
m1
)
) = 0.
Viceversa, se u = (u
0
, u
1
, . . . , u
m1
) C
1
(I, R
m
) è soluzione del sistema, è
facile vericare che, posto y = u
0
, si ha y C
m
(I) e tale funzione risolve
lequazione dierenziale originaria.
Si noti che se lequazione dierenziale era in forma normale,
y
(m)
= g(x, y, y
, . . . , y
(m1)
),
386
allora lultima equazione del sistema diventa
(u
m1
)
= g(x, u
0
, u
1
, . . . , u
m1
),
e quindi anche il sistema è in forma normale.
Tutte le equazioni dierenziali sono risolubili? Naturalmente no! Un esempio
banale è il seguente:
1 +y
2
+ (y
)
2
= 0.
Limportanza delle equazioni in forma normale sta nel fatto che, al contrario,
esse sono sempre risolubili ed anzi hanno uninnità di soluzioni: questo si
vede già esaminando la pi` u semplice, e cioè
y
= f(x), x [a, b],

le cui soluzioni sono
y(x) =
_
x
a
f(t) dt +c, x [a, b],
ove c è una costante arbitraria.
Nel seguito, considereremo solamente equazioni e sistemi in forma normale.
Problema di Cauchy
Un modo per selezionare una delle innite soluzioni di una equazione dieren-
ziale in forma normale del primo ordine è quello di prescrivere alla soluzione
di assumere, in un determinato punto x
0
I, un pressato valore y
0
R. Si
formula cos` il problema di Cauchy:
_
y
= g(x, y), x I,
y(x
0
) = y
0
.
Poiche assegnare g(x, y(x)) signica prescrivere il coeciente angolare della
retta tangente al graco della soluzione y(x) nel suo punto (x, y(x)), risolvere
il problema di Cauchy signica determinare una funzione il cui graco passi
per un ssato punto (x
0
, y
0
) e del quale sia prescritta punto per punto la
pendenza.
Per i sistemi del primo ordine in forma normale il problema di Cauchy ha la
forma seguente:
_
y
= g(x, y), x I,
y(x
0
) = y
0
.
387
Per unequazione dierenziale di ordine m, linsieme delle soluzioni dipenderà
in generale da m costanti arbitrarie: il problema di Cauchy è in tal caso
_
y
(m)
= g(x, y, . . . , y
(m1)
), x I,
y(x
0
) = y
0
, y
(x
0
) = y
1
, . . . y
(m1)
(x
0
) = y
m1
,
ove y
0
, y
1
, . . . , y
m1
sono m numeri assegnati.
Il teorema di esistenza e unicità
Per equazioni e sistemi del primo ordine in forma normale vi è un fonda-
mentale risultato che garantisce, perlomeno localmente, la risolubilità del
problema di Cauchy: in altre parole, si dimostra che vi è ununica soluzione
locale, ovvero che la soluzione del problema è denita almeno in un intorno
del punto iniziale x
0
.
Per formulare questo enunciato occorrono alcune premesse. Consideriamo il
sistema
u
= g(x, u), x I,
sotto le seguenti ipotesi:
(i) g : A R
m
è una assegnata funzione continua, denita su un aperto
A R
m+1
;
(ii) la funzione g è localmente lipschitziana in A rispetto alla variabile vet-
toriale u, uniformemente rispetto a x: pi` u precisamente, per ogni
compatto K A esiste una costante H
K
0 tale che
[g(x, y) g(x, u)[
m
H
K
[y u[
m
(x, y), (x, u) K.
Fissiamo un punto (x
0
, u
0
) A e consideriamo il problema di Cauchy
_
u
= g(x, u)
u(x
0
) = u
0
.
Dato che A è aperto, esisterà un cilindro (m+ 1)-dimensionale compatto R,
di centro (x
0
, u
0
), tutto contenuto in A. Esso sarà della forma
R = (x, u) R
m+1
: [x x
0
[ a, [u u
0
[
m
b.
388
Poiche g è continua nel compatto R, in virt` u del teorema di Weierstrass
(teorema 3.4.1) esisterà M 0 tale che
[g(x, u)[
m
M (x, u) R;
inoltre, per (ii), esiste H 0 tale che
[g(x, y) g(x, u)[
m
H[y u[
m
(x, y), (x, u) R.
Si ha allora il seguente teorema di esistenza e unicità locale:
Teorema 6.1.1 Sotto le ipotesi (i) e (ii), sia (x
0
, u
0
) A, e siano R il
cilindro e M, H le costanti sopra denite. Allora esistono un intervallo
J = [x
0
h, x
0
+ h], con 0 < h a, e ununica funzione u : J R
m
di
classe C
1
, tali che
u
(x) = g(x, u(x)) x J, u(x

0
) = u
0
;
inoltre il graco di u è tutto contenuto in R, cioè si ha
[u(x) u
0
[
m
b x J.
Prima di dimostrare il teorema facciamo qualche considerazione. Anzitut-
to, le ipotesi di regolarità formulate sulla funzione g sono ottimali: infatti,
389
benche sia possibile provare lesistenza di soluzioni del problema di Cauchy
supponendo solamente g continua in A, è facile vedere con esempi che in
mancanza dellipotesi di locale lipschitzianità viene a cadere lunicità della
soluzione.
Esempio 6.1.2 Sia m = 1. Il problema di Cauchy
_
u
= u
2/3
u(0) = 0
ha la soluzione u = 0, le innite
altre u
(x) = (x )
3
/27, come
è facile vericare, ed altre anco-
ra. Il secondo membro g(x, u) =
u
2/3
, che è denito su R
2
, è ov-
viamente continuo ma non veri-
ca la proprietà di locale lipschi-
tzianità. Sia infatti K un intorno
di (x
0
, 0) R
2
: se esistesse H 0
tale che
[y
2/3
u
2/3
[ H[y u[ (x, y), (x, u) K,
scelti (x, u) = (x
0
, 0) e (x, y) = (x
0
,
1
n
), con n N
+
, avremmo (x
0
,
1
n
) K
denitivamente, da cui
1
n
2/3

H
n
denitivamente,
cioè n H
3
denitivamente, il che è assurdo.
Dimostrazione del teorema 6.1.1 Ci limiteremo, per semplicità, a pro-
vare la tesi nel caso di una singola equazione (m = 1).
1
o
passo Trasformiamo il problema di Cauchy in una equazione integrale
equivalente.
Se u C
1
(J) risolve il problema di Cauchy
_
u
= g(x, u), x J,
u(x
0
) = u
0
,
390
allora ssato x J possiamo integrare i due membri fra x
0
e x, ottenendo
lequazione integrale
u(x) = u
0
+
_
x
x
0
g(t, u(t)) dt, x J.
Viceversa se u C
0
(J) risolve questa equazione, allora anzitutto u(x
0
) = u
0
;
inoltre, essendo g e u funzioni continue, il secondo membro è di classe C
1
e
quindi u C
1
(J). Possiamo allora derivare entrambi i membri dellequazione
integrale, ottenendo
u
(x) = g(x, u(x)) x J.

Quindi u risolve il problema di Cauchy. Ciò prova lequivalenza richiesta.
2
o
passo Risolviamo lequazione integrale con il metodo delle approssima-
zioni successive.
Sia h = mina, b/M. Deniamo la seguente successione di funzioni u
n
:
_
_
u
0
(x) u
0
,
u
n+1
(x) = u
0
+
_
x
x
0
g(t, u
n
(t)) dt n N,
x J.
Si vericano per induzione i seguenti fatti:
sup
xJ
[u
n
(x) u
0
[ b n N,
[u
n+1
(x) u
n
(x)[ M
H
n
(n + 1)!
[x x
0
[
n+1
x J, n N.
La prima relazione è ovvia per n = 0; supponendo che essa valga per un certo
n, si ha (essendo (t, u
n
(t)) R per ogni t J)
sup
xJ
[u
n+1
(x) u
0
[ = sup
xJ
_
x
x
0
g(t, u
n
(t)) dt
sup
xJ
M[x x
0
[ Mh b.
Dunque la relazione vale per n+1 e pertanto, per induzione, è vera per ogni
n N.
La seconda disuguaglianza vale per n = 0, dato che
[u
1
(x) u
0
[ =
_
x
x
0
g(t, u
0
) dt
M[x x
0
[ x J;
391
se poi essa vale per un certo n, allora risulta (essendo (t, u
n
(t)), (t, u
n1
(t))
R per ogni t J)
[u
n+1
(x) u
n
(x)[ =
_
x
x
0
[g(t, u
n
(t)) g(t, u
n1
(t))] dt
_
x
x
0
H[u
n
(t) u
n1
(t)[ dt
_
x
x
0
MH
n
[t x
0
[
n
n!
dt
=
= M
H
n
(n + 1)!
[x x
0
[
n+1
x J.
Dunque la disuguaglianza vale anche per n + 1, cosicche, per induzione, è
vera per ogni n N.
In particolare, la relazione appena provata implica che
sup
xJ
[u
n+1
(x) u
n
(x)[ MH
n
h
n+1
(n + 1)!
n N,
e quindi, per ogni m > n,
sup
xJ
[u
m
(x) u
n
(x)[
m1
k=n
sup
xJ
[u
k+1
(x) u
k
(x)[ M
m1
k=n
H
k
h
k+1
(k + 1)!
.
Dato che la serie M
k=0
H
k
h
k+1
(k+1)!
è convergente, la stima appena ottenuta
mostra che per ogni x J la successione numerica u
n
(x) è di Cauchy in R
(denizione 2.6.1). Pertanto esiste
u(x) = lim
n
u
n
(x) x J,
e anzi la convergenza è uniforme in J, nel senso che (esercizio 6.1.4)
lim
n
sup
xJ
[u
n
(x) u(x)[ = 0;
per di pi` u, nellesercizio 6.1.5 si dimostra che la funzione limite u è continua
in J.
Adesso vogliamo passare al limite per n nella relazione che denisce la
successione u
n
. Il primo membro tende ovviamente a u(x); per il secondo
membro si ha, in virt` u delle ipotesi fatte su g,
_
x
x
0
g(t, u
n
(t)) dt
_
x
x
0
g(t, u(t)) dt
392
_
x
x
0
[g(t, u
n
(t)) g(t, u(t))[ dt
_
x
x
0
H[u
n
(t) u(t)[ dt
Hhsup
tJ
[u
n
(t) u(t)[,
e lultimo membro tende a 0 per n . In denitiva con il passaggio al
limite per n otteniamo che la funzione u risolve lequazione integrale
u(x) = u
0
+
_
x
x
0
g(t, u(t)) dt, x J.
Notiamo anche che dalla prima delle due disuguaglianze provate per induzio-
ne segue, al limite per n ,
sup
xJ
[u(x) u
0
[ b.
ciò conclude la dimostrazione del 2
o
passo e del teorema 6.1.1.
Osservazioni 6.1.3 (1) La dimostrazione del teorema 6.1.1 nel caso dei
sistemi (m > 1) funziona in modo assolutamente analogo, facendo uso della
norma euclidea [ [
m
al posto del valore assoluto. Lunica novità sta nel
fatto che occorre scrivere lequazione integrale in forma vettoriale, e a questo
scopo è necessario introdurre lintegrale di funzioni v a valori in R
m
. Esso si
denisce come segue:
_
x
x
0
v(t) dt =
__
x
x
0
v
1
(t) dt, . . . ,
_
x
x
0
v
m
(t) dt
_
R
m
.
Per questi integrali vettoriali vale la disuguaglianza
_
x
x
0
v(t) dt
_
x
x
0
[v(t)[
m
dt x
0
, x con x
0
< x.
Essa si dimostra cos`: per ogni y R
m
si ha, per denizione di prodotto
scalare (paragrafo 3.1):
_
x
x
0
v(t) dt y =
m
i=1
_
x
x
0
v
i
(t) dt y
i
=
_
x
x
0
m
i=1
v
i
(t)y
i
dt =
_
x
x
0
v(t) y dt;
quindi per la disuguaglianza di Cauchy-Schwarz (proposizione 3.1.1)
_
x
x
0
v(t) dt y
_
x
x
0
[v(t)[
m
[y[
m
dt y R
m
.
393
Scegliendo y =
_
x
x
0
v(t) dt, si conclude che
_
x
x
0
v(t) dt
2
m
_
x
x
0
[v(t)[
m
dt
_
x
x
0
v(t) dt
m
,
e quindi si ottiene la disuguaglianza cercata. Con questo strumento si può
ripetere tutta la dimostrazione fatta nel caso m = 1 estendendola al caso dei
sistemi.
(2) Ai ni della risoluzione delle equazioni dierenziali, come vedremo, è
utile estendere lintegrazione al caso di funzioni complesse, anziche reali. Sia
f : [a, b] C una funzione limitata. Allora le due funzioni reali Re f(x) e
Im f(x) sono limitate. Se queste funzioni sono integrabili su [a, b], diremo
che f è integrabile su [a, b] e porremo per denizione
_
b
a
f(x) dx =
_
b
a
Re f(x) dx +i
_
b
a
Imf(x) dx.
Per lintegrale di funzioni complesse valgono tutte le usuali regole algebri-
che e di calcolo, ma non le proprietà legate allordinamento. Vale però la
fondamentale relazione (fra numeri reali)
_
b
a
f(x) dx
_
b
a
[f(x)[ dx;
ricordando che C è isomorfo ed isometrico a R
2
, questa relazione si dimostra
come nel caso di funzioni a valori vettoriali.
A titolo di esempio, calcoliamo lintegrale di e
ix
su [0, a]:
_
a
0
e
ix
dx =
_
a
0
cos xdx +i
_
a
0
sin xdx = sin a i(cos a 1) =
= i(e
ia
1) =
1
i
(e
ia
1) =
_
e
ix
i
_
a
0
.
Dipendenza continua dal dato iniziale
A complemento del teorema di esistenza e unicità conviene fare qualche ulte-
riore considerazione. Nelle applicazioni e in particolare nellapprossimazione
numerica delle soluzioni di equazioni e sistemi dierenziali è di capitale im-
portanza che a piccole variazioni del dato iniziale u
0
(ad esempio causate
394
da errori di misura) corrispondano piccole variazioni della soluzione corri-
spondente, perche senza questa proprietà verrebbe a mancare il presupposto
stesso del procedimento di approssimazione. Si vuole, in altre parole, che
la soluzione del problema di Cauchy dipenda con continuità dal valore ini-
ziale u
0
. In eetti, se (x
0
, u
0
) e (x
0
, y
0
) sono punti di A (di uguale ascissa)
sucientemente vicini, allora le soluzioni dei due problemi di Cauchy
_
u
= g(x, u), x J,
u(x
0
) = u
0
_
y
= g(x, y), x J
,
y(x
0
) = y
0
vericano la diseguaglianza
[u(x) y(x)[
m
C[u
0
y
0
[
m
x J
,
ove J
è un opportuno intervallo di centro x

0
contenuto in J J
e C è
unopportuna costante. Infatti, utilizzando le equazioni integrali equivalenti,
posto J
= [x
0
h, x
0
+h] si ha
[u(x) y(x)[
m
=
u
0
y
0
+
_
x
x
0
[g(t, u(t)) g(t, y(t))] dt
[u
0
y
0
[
m
+H
_
x
x
0
[u(t) y(t)[
m
dt
[u
0
y
0
[
m
+Hh sup
tJ
[u(t) y(t)[
m
,
da cui
(1 hH) sup
tJ
[u(t) y(t)[
m
[u
0
y
0
[
m
e quindi la tesi quando h è sucientemente piccolo in modo che hH < 1.
Prolungamento delle soluzioni
Il teorema 6.1.1 ha carattere locale, e non dà informazioni su quanto grande
sia linsieme J di denizione della soluzione. Daltra parte, se il graco della
soluzione passa per un punto (x
1
, u
1
) A, tale punto può essere preso come
nuovo punto iniziale e ancora il teorema 6.1.1 garantisce che la soluzione può
essere prolungata ulteriormente in un intorno di x
1
. Si può cos` pensare di
prolungare la soluzione procedendo per passi successivi. Si ha in eetti:
395
Teorema 6.1.4 Nelle ipotesi del teorema 6.1.1, sia R un arbitrario cilindro
chiuso e limitato incluso in A e contenente (x
0
, u
0
) come punto interno.
Allora la soluzione locale u del problema di Cauchy
_
u
= g(x, u),
u(x
0
) = u
0
può essere univocamente estesa a un intervallo chiuso [x
1
, x
2
], con x
1
< x
0
<
x
2
, in modo che i punti (x
1
, u(x
1
)) e (x
2
, u(x
2
)) appartengano alla frontiera
di R.
Dimostrazione Sia Q un cilindro chiuso e limitato di R
m+1
tale che R
Q A, e siano M, H 0 tali che
[g(x, u)[
m
M (x, u) Q,
[g(x, y) g(x, u)[
m
H[y u[
m
(x, y), (x, u) Q.
Prendiamo poi a, b > 0 sucientemente piccoli in modo che
(x, u) R
m+1
: [x x
0
[ a, [u u
0
[
m
b Q (x
0
, u
0
) R,
e scegliamo inne un numero h > 0 tale che
h < min
_
a,
b
M
_
.
Allora si può ripetere la dimostrazione del teorema 6.1.1 ottenendo, per ogni
punto iniziale (x
0
, u
0
) R una soluzione locale denita almeno nellintervallo
[x
0
h, x
0
+h]. Adesso osserviamo che il numero h non dipende dalla scelta
del punto (x
0
, u
0
) R: è chiaro allora che procedendo per passi successivi
linsieme di denizione della soluzione del problema di Cauchy si allunga, ad
ogni passo, di h e che quindi dopo un numero nito di tappe intermedie il
graco della soluzione raggiungerà la frontiera di R.
Lunicità del prolungamento è poi ovvia.
Notiamo che nel teorema 6.1.4 è essenziale che R sia un rettangolo chiuso e
limitato e non, ad esempio, una striscia innita o un semispazio. Per esempio,
se m = 1 il problema di Cauchy
_
u
= 1 +u
2
u(0) = 0,
396
che ha secondo membro regolare in tutto R
2
, ha come unica soluzione la
funzione u(x) = tan x, la quale non è prolungabile al di fuori dellintervallo
2
,

2
_
. Quindi non avremmo potuto, nel teorema 6.1.4, prendere come R
la striscia
_
2
,

2
R.
Fino a che punto la soluzione locale del problema di Cauchy è prolungabile?
In termini un po grossolani si può dire che il prolungamento è possibile no
a che il graco della soluzione giace nellaperto A ove è denito il secondo
membro g. Per formalizzare questa idea, ssato (x
0
, u
0
) A, introduciamo
la famiglia (x
0
, u
0
) costituita da tutti gli intervalli J contenenti x
0
come
punto interno, tali che il problema di Cauchy di punto iniziale (x
0
, u
0
) abbia
soluzione u
J
() denita su tutto J: il teorema 6.1.1 ci dice che questa famiglia
non è vuota. Sia ora J
0
lintervallo unione di tutti gli intervalli J (x
0
, u
0
),
e deniamo per x J
0
:
u(x) = u
J
(x) se x J e J (x
0
, u
0
).
Questa denizione ha senso perche due soluzioni u
J
, u
I
coincidono su J I
per unicità. Resta cos` denita in tutto J
0
ununica soluzione del problema
di Cauchy che, per costruzione, non è ulteriormente estendibile: essa viene
chiamata soluzione massimale.
Soluzione globale
Supponiamo che la funzione g(x, u) sia denita su una striscia [c, d] R
m
,
sia ivi continua e lipschitziana nella variabile u uniformemente rispetto a x,
ossia
[g(x, y) g(x, u)[
m
H[y u[
m
(x, y), (x, u) [c, d] R
m
.
Allora si ha:
Teorema 6.1.5 Nelle ipotesi sopra dette, per ogni (x
0
, u
0
) [c, d] R
m
la
soluzione del problema di Cauchy
_
u
= g(x, u)
u(x
0
) = u
0
è globale, cioè è denita nellintero intervallo [c, d].
397
Dimostrazione Si ripete la dimostrazione del teorema 6.1.1, provando che
per ogni (x
0
, u
0
) [c, d] R
m
e per h sucientemente piccolo le approssima-
zioni successive u
n
(x) vericano
sup
xJ
[u
m
(x) u
n
(x)[
m
M
m1
kn
H
k
h
k
(k + 1)!
m > n,
ove M = max
x[c,d]
[g(x, u
0
)[
m
. Se ne deduce che le u
n
convergono ad una
funzione continua u denita su J, che risolve il problema di Cauchy. Essendo
h indipendente dalla scelta di (x
0
, u
0
), la soluzione si può prolungare a tutto
[c, d] con un numero nito di iterazioni.
Questo risultato è importante perche copre il caso dei sistemi lineari, in cui
g(x, u) = A(x)u +b(x),
con A(x) matrice mm a coecienti continui in [c, d] e b funzione continua
su [c, d]. Dunque le soluzioni di equazioni e sistemi dierenziali lineari di
qualsiasi ordine (a coecienti continui) esistono in tutto lintervallo su cui
sono deniti i coecienti.
Esercizi 6.1
1. Trasformare lequazione dierenziale
y
+ sin x y
cos x y
+y = x
in un sistema di tre equazioni del primo ordine.
2. Trasformare il sistema
_
u
= 2u v +x
v
= 3u +v x
in una equazione dierenziale del secondo ordine.
3. Determinare tutte le soluzioni (di classe C
1
in qualche intervallo) del-
lequazione dierenziale (y
)
2
= 1.
398
4. Sia f
n
una successione di funzioni denite su un intervallo [a, b].
Supponiamo che
sup
x[a,b]
[f
n+1
(x) f
n
(x)[ a
n
n N,
e che la serie
n=0
a
n
sia convergente. Si provi che esiste una funzione
f : [a, b] R tale che f
n
f uniformemente in [a, b], ossia tale che
lim
n
sup
x[a,b]
[f
n
(x) f(x)[ = 0.
5. Sia f
n
una successione di funzioni continue denite su un intervallo
[a, b]. Supponiamo che esista una funzione f : [a, b] R tale che
f
n
f uniformemente in [a, b] (vedere lesercizio precedente). Si provi
che f è continua in [a, b].
6.2 Alcuni tipi di equazioni del primo ordine
Come risolvere le equazioni dierenziali? Come scriverne esplicitamente le
soluzioni? Una risposta esaustiva è impossibile, ma per certe classi di equa-
zioni si può fornire qualche metodo pratico. Esamineremo in dettaglio due
tipi di equazioni che sono i pi` u importanti nella pratica, rimandando lo studio
degli altri tipi agli esercizi 6.2.5, 6.2.6 e 6.2.7.
Equazioni a variabili separabili
Le equazioni a variabili separabili sono equazioni (non lineari, in generale)
della forma
y
= f(x)g(y), x I,
dove f è una funzione continua sullintervallo I e g è una funzione continua su
un altro intervallo J. Necessariamente, una soluzione y di questa equazione
dovrà essere denita in I (o in un sottointervallo di I) a valori in J. La
tecnica risolutiva è la seguente:
1
o
passo Si cercano gli eventuali punti y
0
J nei quali si ha g(y
0
) = 0: per
ciascuno di questi punti la funzione costante
y(x) = y
0
, x I,
399
è soluzione dellequazione.
2
o
passo Si cercano le soluzioni non costanti y, denite in qualche sottoin-
tervallo I
I e a valori in qualche sottointervallo J
J nel quale si abbia

g ,= 0; se y(x) è una di queste soluzioni, sarà g(y(x)) ,= 0 per ogni x I
;
quindi dividendo lequazione per g(y(x)) si ottiene
1
g(y(x))
y
(x) = f(x), x I
.
3
o
passo Si calcolano le primitive dei due membri di tale identità: indicando
con F una primitiva di f in I
e con una primitiva di

1
g
in J
, si ricava
(y(x)) = F(x) +c, x I
,
dove c è una costante arbitrariamente scelta.
4
o
passo Si osserva che
=
1
g
,= 0 in J
per ipotesi, per cui è strettamente

monotona in J
(proposizione 4.9.1). Se ne deduce, per il teorema 3.4.6, che

esiste la funzione inversa
1
, e la relazione precedente diventa
y(x) =
1
(F(x) +c), x I
.
Si noti che y(x) J
per ogni x I
, come richiesto, e che y verica

eettivamente lequazione dierenziale perche per ogni x I
si ha
y
(x) = (
1
)
(F(x) +c)F
(x) =
1
(
1
(F(x) +c))
f(x) =
= g(
1
(F(x) +c))f(x) = g(y(x))f(x).
Osserviamo che il 3
o
passo si può meglio memorizzare se si utilizza la nota-
zione y
=
dy
dx
e si passa formalmente da
1
g(y)
dy
dx
= f(x) a
dy
g(y)
= f(x)dx, per
poi integrare i due membri il primo rispetto a y e il secondo rispetto a x.
Questo è però un articio formale: a rigor di termini, si integrano entrambi
i membri rispetto a x, con la dierenza che a sinistra si fa il cambiamento di
variabile y = y(x).
Si badi bene che questo procedimento non esaurisce in generale linsieme del-
le soluzioni: vi possono essere altri tipi di soluzioni, come illustra il secondo
degli esempi che seguono.
Esempi 6.2.1 (1) Consideriamo lequazione y
= x(1 +y
2
). Qui le funzioni
f(x) = x e g(y) = 1 + y
2
sono denite su tutto R e la g non è mai nulla.
400
Dividendo per 1 +y
2
si trova
y
1 +y
2
= x,
dy
1 +y
2
= x dx,
e integrando
arctan y(x) =
x
2
2
+c.
Dunque
y(x) = tan
_
x
2
2
+c
_
, c R.
Si osservi che ciascuna soluzione è denita non su tutto R ma solo nel sot-
toinsieme descritto dalla disuguaglianza [
x
2
2
+ c[ <

2
, perche solo per tali x
la quantità
x
2
2
+ c appartiene allimmagine della funzione arcotangente. Ad
esempio, se c = 0 si ha x ]
[, mentre se c = si hanno i due in-

tervalli ]
3,
[ e ]
3[ (si tratta dunque di due distinte soluzioni,

denite su intervalli disgiunti).
(2) Nellequazione y
=

y si ha f(x) 1 in I = R e g(y) =

y in
J = [0, [. Lunica soluzione costante è y(x) = 0, x R; le soluzioni a valori
in J
=]0, [ si ottengono dividendo per

y con i passaggi che seguono:
y
y
= 1,
dy
y
= dx,
2
_
y(x) = x +c
(il che implica x +c > 0); si trova dunque
y(x) =
_
x +c
2
_
2
, x ] c, +[.
Ma lequazione ha altre soluzioni: ad esempio, per ogni ssato R, la
funzione
y
(x) =
_
_
0 se x <
_
x +
2
_
2
se x
401
è di classe C
1
in R e verica lequazione dierenziale su tutto R. Essa non fa
parte di quelle già trovate, perche non è identicamente nulla e non è a valori
in ]0, [.
(3) Per lequazione y
= x/y, la funzione f(x) = x è denita su R mentre

la g(y) = 1/y è denita su R 0: quindi cerchiamo soluzioni y(x) ,= 0. Col
solito metodo si trova
yy
= x,
y dy = x dx,
y
2
2
=
x
2
2
+c,
y(x)
2
= x
2
+ 2c = x
2
+c
;
ciò implica c
= y
2
+x
2
> 0. In conclusione,
y(x) =
x
2
, x ]
[.
Le soluzioni hanno per graci delle semicirconferenze di raggi
, con c
arbitrario numero positivo. Si osservi che, dopo aver scritto lequazione nella
forma simmetrica y dy = x dx, abbiamo ricavato x
2
+y
2
= c
, che è lequa-
zione dellintera circonferenza di centro (0, 0) e raggio
. In eetti lequa-
zione in forma simmetrica è risolta anche dalle funzioni x(y) =
_
c
y
2
,
y ]
[, ottenute esplicitando la variabile x in funzione della y. Le-

quazione x
2
+ y
2
= c
(in termini generali, lequazione (y) + F(x) = c

ottenuta nel 3
o
passo rappresenta una curva del piano la quale, localmen-
te (ossia nellintorno di ogni suo ssato punto), è graco di una funzione
y(x), oppure x(y), ciascuna delle quali è soluzione della forma simmetrica
dellequazione dierenziale.
Equazioni lineari del primo ordine
Le equazioni lineari del primo ordine, come sappiamo, hanno la forma se-
guente:
y
= a(x)y +b(x), x I,
ove a e b, detti coecienti dellequazione, sono funzioni continue in I. Sia
y una soluzione dellequazione: se A è una primitiva della funzione a in I,
moltiplicando i due membri dellequazione per e
A(x)
si ottiene
e
A(x)
b(x) = e
A(x)
(y
(x) a(x)y(x)) =
d
dx
_
e
A(x)
y(x)
_
, x I;
402
dunque e
A(x)
y(x) è una primitiva di e
A(x)
b(x) in I. Quindi, scelto arbitra-
riamente x
0
I, esisterà c R per cui
e
A(x)
y(x) =
_
x
x
0
e
A(t)
b(t) dt +c, x I,
ossia la funzione y(x) è data da
y(x) = e
A(x)
__
x
x
0
e
A(t)
b(t) dt +c
_
, x I.
Viceversa, se y è una funzione di questo tipo (con x
0
I e c R ssati),
allora per ogni x I si ha
y
(x) = a(x)e
A(x)
__
x
x
0
e
A(t)
b(t) dt +c
_
+e
A(x)
_
e
A(x)
b(x)
_
=
= a(x)y(x) +b(x),
cioè y risolve lequazione dierenziale.
Si noti che se b(x) 0 (nel qual caso lequazione si dice omogenea) linsieme
delle soluzioni è ce
A(x)
, c R ed è quindi uno spazio vettoriale di dimen-
sione 1, generato dallelemento e
A(x)
. Se b(x) , 0, linsieme delle soluzioni
è uno spazio ane, cioè un traslato dello spazio vettoriale precedente: la
traslazione è ottenuta sommando la funzione e
A(x)
_
x
x
0
e
A(t)
b(t) dt, che è essa
stessa una soluzione dellequazione non omogenea.
Si osservi anche che la scelta di una diversa primitiva, A(x) + , di a, non
altera linsieme delle soluzioni. Analogamente, la scelta di un diverso punto
x
1
I come primo estremo nellintegrale ha leetto di modicare la costante
c, che diventa c +
_
x
1
x
0
e
A(t)
b(t) dt: ma dato che c varia in R, nuovamente
linsieme delle soluzioni non cambia.
Esempio 6.2.2 Consideriamo lequazione y
= 2xy + x
3
. Una primitiva
della funzione 2x è x
2
. Moltiplichiamo lequazione per e
x
2
: si ottiene
d
dx
_
e
x
2
y(x)
_
= x
3
e
x
2
.
Calcoliamo una primitiva di x
3
e
x
2
: con facili calcoli
_
x
0
t
3
e
t
2
dt =
x
2
+ 1
2
e
x
2
+
1
2
.
403
Dunque
e
x
2
y(x) =
x
2
+ 1
2
e
x
2
+
1
2
+c =
x
2
+ 1
2
e
x
2
+c
,
e le soluzioni dellequazione proposta sono le funzioni
y(x) =
x
2
+ 1
2
+ce
x
2
, c R.
Se imponiamo ad esempio la condizione di Cauchy y(33) = 700, troviamo
facilmente la corrispondente costante c:
c = 155e
1089
,
e dunque ununica soluzione, in accordo con il teorema 6.1.1.
Si osservi che non sempre i calcoli per risolvere unequazione dierenziale
possono essere esplicitamente svolti, perche talvolta le primitive non sono
esprimibili in forma chiusa: ad esempio la semplicissima equazione y
= e
x
2
ha le soluzioni y(x) = c +
_
x
0
e
t
2
dt.
Esercizi 6.2
1. Provare che il problema di Cauchy
_
y
=
_
1 y
2
y(0) = 1
ha innite soluzioni; disegnare il graco di alcune di esse.
2. Risolvere le seguenti equazioni dierenziali:
(i) y
= xy
2
, (ii) y
= y
2/3
, (iii) y
=
x
1 + log y
,
(iv) y
= log x sin y, (v) y
= x
_
1 +
1
y
_
, (vi) xyy
= y 1,
(vii) y
=
log x cos y
x sin 2y
, (viii) y
=
x xy
2
y +x
2
y
, (ix) y
= e
y+e
y
.
404
3. Determinare linsieme delle soluzioni delle seguenti equazioni dieren-
ziali:
(i) y
=
xy
1 +x
2
+x 2, (ii) y
= 2xy +xe
x
,
(iii) y
= tan x y + sin x, (iv) y
=
2
x
y +x,
(v) y
=
y
1 x
2
+ 1 x, (vi) y
=
y
x

e
x
x
.
4. Sia y(x) una soluzione dellequazione dierenziale
y
= a(x)y +b(x), x > 0,

e si supponga che sia a(x) c < 0 e lim
x+
b(x) = 0. Si dimostri
che
lim
x+
y(x) = 0.
5. (Equazioni di Bernoulli) Si consideri lequazione dierenziale
y
= p(x)y +q(x)y
,
ove è un numero reale diverso da 0 e da 1. Mediante la sostituzione
v(x) = y(x)
1
, si verichi che lequazione dierenziale diventa lineare
nellincognita v(x). Utilizzando questo metodo si risolvano le equazioni
(i) y
= 2y 3y
2
, (ii) y
= 2xy +x
3
y
3
, (iii) y
=
xy
3
+x
2
y
2
.
6. (Equazioni non lineari omogenee) Utilizzando la sostituzione v(x) =
y(x)
x
, si verichi che unequazione dierenziale della forma y
= g(
y
x
),
con g assegnata funzione continua, diventa a variabili separabili nel-
lincognita v(x). Si utilizzi questo metodo per risolvere le equazioni
(i) y
= 2
x
y
, (ii) y
=
y
x
+
_
1 +
y
2
x
2
, (iii) x
2
y
= y
2
+xy + 4x
2
.
7. (Equazioni di Riccati) Data lequazione dierenziale
y
= a(x)y
2
+b(x)y +c(x), x I,
405
si supponga di conoscerne una soluzione (x). Si verichi che con la so-
stituzione y(x) = (x) +
1
v(x)
, lequazione diventa lineare nellincognita
v(x). Utilizzando questo metodo, si risolva lequazione
y
= y
2
xy + 1.
8. Risolvere i seguenti problemi di Cauchy:
(i)
_
y
= 3x
2
y
4
y(1) = 0,
(ii)
_
4x
3/2
yy
= 1 y
2
y(1) = 2,
(iii)
_
_
_
y
=
y
2
1
x
2
1
y(0) = 0,
(iv)
_
_
_
y
=
y
2
+ 1
x
2
+ 1
y(0) =
3,
(v)
_

xy
y sin
x = 0
y(
2
) = 9,
(vi)
_
y
= x(y
3
y)
y(0) = 1,
(vii)
_
2xyy
= y
2
x
2
+ 1
y(1) = 1,
(viii)
_
y
=
_
(1 +y)(1 +x
2
)
y(0) = 1.
6.3 Equazioni lineari del secondo ordine
Consideriamo unequazione dierenziale lineare del secondo ordine: essa ha
la forma
y
+a
1
(x)y
+a
0
(x)y = f(x), x I,
dove a
0
, a
1
e f sono funzioni continue nellintervallo I R. Accanto a questa
equazione consideriamo anche lequazione omogenea
y
+a
1
(x)y
+a
0
(x)y = 0, x I,
Come nel caso delle equazioni lineari del primo ordine, è immediato vericare
che linsieme delle soluzioni dellequazione omogenea è uno spazio vettoriale.
Esso, come vedremo, ha dimensione 2 (pari allordine dellequazione). Lin-
sieme delle soluzioni dellequazione non omogenea sarà ancora uno spazio
ane, ottenibile dallo spazio vettoriale precedente per mezzo di una trasla-
zione. In eetti, detto V
f
linsieme delle soluzioni dellequazione con secondo
406
membro f, e detto V
0
linsieme delle soluzioni nel caso f = 0, si ha, avendo
ssato un elemento v V
f
,
V
f
= u
0
+v : u
0
V
0
.
Infatti, se u V
f
allora u v V
0
, poiche
(u v)
+a
1
(x)(u v)
+a
0
(x)(u v) = f f = 0, x I;
dunque, posto u
0
= u v, si ha u = u
0
+ v con u
0
V
0
. Viceversa, se
u = u
0
+v con u
0
V
0
, allora
u
+a
1
(x)u
+a
0
(x)u =
= (u
0
+v)
+a
1
(x)(u
0
+v)
+a
0
(x)(u
0
+v) = 0 +f = f, x I,
cioè u V
f
.
Pertanto, per determinare completamente V
f
basterà caratterizzare comple-
tamente V
0
e trovare un singolo, arbitrario elemento di V
f
.
(a) Caratterizzazione di V
0
. Proviamo anzitutto che lo spazio vettoriale
V
0
ha dimensione 2. Fissato un punto x
0
I, consideriamo i due problemi
di Cauchy
_
y
+a
1
(x)y
+a
0
(x)y = 0
y(x
0
) = 1, y
(x
0
) = 0,
_
y
+a
1
(x)y
+a
0
(x)y = 0
y(x
0
) = 0, y
(x
0
) = 1.
Essi sono univocamente risolubili (per il teorema 6.1.1 e losservazione 6.1.3,
dopo averli trasformati in problemi di Cauchy per sistemi lineari del primo
ordine); inoltre le soluzioni sono denite su tutto lintervallo I in virt` u del
teorema 6.1.5. Denotiamo tali soluzioni con y
1
(x) e y
2
(x).
Dimostriamo che y
1
e y
2
sono linearmente indipendenti, ossia che se
1
e
2
sono costanti tali che
1
y
1
(x) +
2
y
2
(x) 0 in I, allora necessariamente
1
=
2
= 0. La funzione
1
y
1
(x) +
2
y
2
(x) è lunica soluzione del problema
di Cauchy
_
y
+a
1
(x)y
1
+a
0
(x)y = 0
y(x
0
) =
1
, y
(x
0
) =
2
;
quindi se tale soluzione è identicamente nulla, deve essere
1
= 0 e
2
= 0.
Proviamo ora che le funzioni y
1
e y
2
generano V
0
, ossia che ogni elemento
u V
0
è combinazione lineare di y
1
e y
2
. Fissata una funzione u V
0
,
407
poniamo v(x) = u(x
0
)y
1
(x) + u
(x
0
)y
2
(x): allora v è soluzione del problema
di Cauchy
_
y
+a
1
(x)y
1
+a
0
(x)y = 0
y(x
0
) = u(x
0
), y
(x
0
) = u
(x
0
),
problema che è risolto anche da u: per unicità, deve essere u v, e pertanto
u
1
y
1
+
2
y
2
con
1
= u(x
0
) e
2
= u
(x
0
), ossia u è combinazione lineare
di y
1
e y
2
. Le due funzioni y
1
e y
2
formano in denitiva una base dello spazio
vettoriale V
0
.
Abbiamo cos` individuato la struttura di V
0
: osserviamo però che in generale
non si riesce a determinare esplicitamente una base y
1
, y
2
di V
0
.
Se lequazione dierenziale lineare ha coecienti costanti, ossia a
0
(x) a
0
e
a
1
(x) a
1
, è invece possibile, e anzi facile, trovare esplicitamente le funzioni
y
1
e y
2
, cercandole di forma esponenziale (perche le esponenziali x e
x
sono le uniche funzioni che hanno le proprie derivate multiple di loro stesse).
Sia dunque y(x) = e
x
, con numero da determinare: imponendo che y V
0
,
si ha
0 = y
+a
1
y
+a
0
y = e
x
(
2
+a
1
+a
0
),
e poiche e
x
,= 0 si deduce che deve essere radice del polinomio caratteristico
P() =
2
+a
1
+a
0
, ossia deve essere
2
+a
1
+a
0
= 0. Si hanno allora tre
casi possibili:
1
o
caso: 2 radici reali distinte
1
e
2
.
Ci sono dunque due soluzioni e
1
x
e e
2
x
. Esse sono linearmente indipendenti
perche, supposto ad esempio
1
,= 0, si ha
c
1
e
1
x
+c
2
e
2
x
0 = e
1
x
(c
1
+c
2
e
1
)x
) 0 =
= c
1
+c
2
e
(
2
1
)x
0 = (derivando)
= c
1
(
2
1
)e
(
2
1
)x
0 = (essendo
2
,=
1
)
= c
1
= 0 = c
1
= c
2
= 0.
Dunque
V
0
= c
1
e
1
x
+c
2
e
2
x
: c
1
, c
2
R.
2
o
caso: una radice reale doppia (che è uguale a a
1
/2).
Una soluzione è e
x
; unaltra soluzione è xe
x
: infatti
D(xe
x
) = e
x
(1 +x), D
2
(xe
x
) = e
x
(
2
x + 2),
408
da cui
D
2
(xe
x
) +a
1
D(xe
x
) +a
0
xe
x
=
= e
x
_
2
x + 2 +a
1
(1 +x) +a
0
x
_
=
= e
x
_
(
2
+a
1
+a
0
)x + (2 +a
1
)
_
=
(essendo 2 +a
1
= 0)
= e
x
0 = 0.
Le due soluzioni sono linearmente indipendenti perche
c
1
xe
x
+c
2
e
x
0 = e
x
(c
1
x+c
2
) 0 = c
1
x+c
2
0 = c
1
= c
2
= 0.
Dunque
V
0
= c
1
xe
x
+c
2
e
x
: c
1
, c
2
R.
3
o
caso: due radici complesse coniugate
1
= a +ib e
2
= a ib.
Abbiamo due soluzioni e
1
x
e e
2
x
, che sono linearmente indipendenti (stesso
calcolo fatto nel 1
o
caso) ma sono a valori complessi, mentre a noi interessano
le soluzioni reali. Si osservi però che, essendo e
(aib)x
= e
ax
(cos bx i sin bx),
possiamo scrivere
c
1
e
1
x
+c
2
e
2
x
= e
ax
(c
1
(cos bx +i sin bx) +c
2
(cos bx i sin bx)) =
= (c
1
+c
2
)e
ax
cos bx +i(c
1
c
2
)e
ax
sin bx =
= c
1
e
ax
cos bx +c
2
e
ax
sin bx,
ove c
1
= c
1
+c
2
e c
2
= i(c
1
c
2
). Scegliendo le costanti c
1
e c
2
reali, si trovano
tutte le soluzioni reali. In denitiva
V
0
= c
1
e
ax
cos bx +c
2
e
ax
sin bx : c
1
, c
2
R.
(b) Determinazione di un elemento di V
f
. Sia y
1
, y
2
una base per
V
0
(comunque determinata). Cercheremo una soluzione dellequazione non
omogenea nella forma seguente:
v(x) = v
1
(x)y
1
(x) +v
2
(x)y
2
(x),
con v
1
e v
2
funzioni da scegliere opportunamente. Questo metodo, non a
caso, si chiama metodo di variazione della costanti arbitrarie: se v
1
e v
2
409
sono costanti, allora v V
0
; se sono funzioni, ossia costanti che variano, si
cerca di fare in modo che v V
f
.
Sostituendo v, v
e v
nellequazione dierenziale, bisogna imporre che

v
+a
1
(x)v
+a
0
(x)v = (v
1
y
1
+ 2v
1
y
1
+v
1
y
1
+v
2
y
2
+ 2v
2
y
2
+v
2
y
2
)+
+a
1
(x)(v
1
y
1
+v
1
y
1
+v
2
y
2
+v
2
y
2
) +a
0
(x)(v
1
y
1
+v
2
y
2
) = f(x).
Da qui, utilizzando il fatto che y
1
, y
2
V
0
, si deduce
(v
1
y
1
+ 2v
1
y
1
+v
2
y
2
+ 2v
2
y
2
) +a
1
(x)(v
1
y
1
+v
2
y
2
) = f(x),
ossia
_
d
dx
(v
1
y
1
+v
2
y
2
) + (v
1
y
1
+v
2
y
2
)
_
+a
1
(x)(v
1
y
1
+v
2
y
2
) = f(x).
Questa equazione è certamente soddisfatta se si impongono le seguenti due
condizioni:
_
v
1
y
1
+v
2
y
2
= 0 in I,
v
1
y
1
+v
2
y
2
= f in I.
Si tratta di un sistema algebrico lineare nelle incognite v
1
e v
2
, con coecienti
y
1
, y
2
, y
1
, y
2
. Il determinante di questo sistema è
det
_
y
1
(x) y
2
(x)
y
1
(x) y
2
(x)
_
= y
1
(x)y
2
(x) y
1
(x)y
2
(x) = D(x).
Proviamo che D(x) ,= 0 per ogni x I: si ha D(x
0
) = y
1
(x
0
)y
2
(x
0
)
y
1
(x
0
)y
2
(x
0
) = 1, e
D
(x) = y
1
y
2
+y
1
y
2
y
1
y
2
y
1
y
2
= y
1
y
2
y
1
y
2
=
= y
1
(a
1
(x)y
2
a
0
(x)y
2
) (a
1
(x)y
1
a
0
(x)y
1
)y
2
=
= a
1
(x)(y
1
y
2
y
1
y
2
) = a
1
(x)D(x);
quindi D(x) è soluzione del problema di Cauchy
_
D
= a
1
(x)D
D(x
0
) = 1,
per cui D(x) = e
R
x
x
0
a
1
(t)dt
; in particolare, D(x) ,= 0 per ogni x I.
Dunque, per ogni x I il sistema sopra scritto ha determinante dei coef-
cienti non nullo e pertanto è univocamente risolubile: ciò ci permette di
410
determinare le funzioni v
1
e v
2
. Inne si scelgono due primitive arbitrarie
v
1
e v
2
, e la funzione v corrispondente, per costruzione, apparterrà a V
f
. In
conclusione, otteniamo
V
f
= v +v
0
: v
0
V
0
= (c
1
+v
1
)y
1
+ (c
2
+v
2
)y
2
: c
1
, c
2
R.
Da questa descrizione di V
f
si vede anche che una diversa scelta delle primitive
di v
1
e v
2
non modica linsieme V
f
.
Esempio 6.3.1 Consideriamo lequazione dierenziale
y
+y =
cos x
sin x
, x ]0, [.
Risolviamo dapprima lequazione dierenziale omogenea: il polinomio carat-
teristico è
2
+ 1, e le sue radici sono i. Quindi
V
0
= c
1
cos x +c
2
sin x : c
1
, c
2
R.
Per trovare una soluzione dellequazione non omogenea che abbia la forma
v(x) = v
1
(x) cos x +v
2
(x) sin x
dobbiamo imporre le condizioni
_
_
_
v
1
(x) cos x +v
2
(x) sin x = 0
v
1
(x) sin x +v
2
(x) cos x =
cos x
sin x
.
Risolvendo il sistema si trova
v
1
(x) = cos x, v
2
(x) =
1
sin x
sin x.
Dunque, ad esempio,
v
1
(x) = sin x, v
2
(x) = log
_
tan
x
2
_
+ cos x
e inne
v(x) = sin x cos x +
_
log
_
tan
x
2
_
+ cos x
_
sin x = sin x log
_
tan
x
2
_
.
In denitiva, tutte le soluzioni dellequazione proposta sono date da
V
f
=
_
c
1
cos x +
_
c
2
+ log
_
tan
x
2
__
sin x : c
1
, c
2
R
_
.
411
Osservazione 6.3.2 Il metodo di variazione della costanti arbitrarie è molto
importante dal punto di vista della teoria, ma sul piano pratico comporta
spesso calcoli lunghi e complessi. Un metodo pi` u ecace, anche se meno
generale, è il metodo dei coecienti indeterminati, applicabile solo per
equazioni a coecienti costanti con secondi membri f di tipo speciale. Questo
metodo è illustrato nellesercizio 6.3.1.
Esercizi 6.3
1. (Metodo dei coecienti indeterminati) Si consideri lequazione dieren-
ziale lineare a coecienti costanti
y
+a
1
y
+a
0
y = f(x) P(x)e
x
,
ove P è un polinomio e C. Si cerchi un elemento v V
f
della
forma v(x) = x
m
Q(x)e
x
, dove Q è un polinomio dello stesso grado
di P, mentre m vale 0, o 1, o 2 a seconda che non sia radice del
polinomio caratteristico, oppure sia radice semplice, oppure sia radice
doppia. Si osservi che il metodo copre anche i casi in cui f contiene
le funzioni seno e coseno. Si applichi il metodo per determinare le
soluzioni dellequazione
y
+ 2ky
+y = x
2
e
x
,
con k ssato numero reale.
2. (Principio di sovrapposizione) Si verichi che se v V
f
e w V
g
, allora
v+w V
f+g
. Si utilizzi questo fatto per trovare linsieme delle soluzioni
dellequazione
y
2y
+y = cos x + sin
x
2
.
[Traccia: si utilizzino le identità cos t =
e
it
+e
it
2
, sin t =
e
it
e
it
2i
e il
metodo dei coecienti indeterminati (esercizio 6.3.1).]
3. Risolvere le equazioni dierenziali seguenti:
(i) y
2y
+ 2y = 0, (ii) y
+ 4y = tan 2x,
(iii) y
y = xe
x
, (iv) y
+ 6y
+ 9y = e
x
/x,
(v) y
+y = x cos x, (vi)y
+ 4y
+ 4y = e
x
+e
x
,
(vii) y
2y
+ 2y = x cos x, (viii) y
3y
+ 2y = 2x
3
,
(ix) y
+ 4y
= x
2
+ 1, (x) y
+y
+y = e
x
.
412
4. (Equazioni di Eulero) Si provi che le equazioni della forma
x
2
y
+xa
1
y
+a
0
y = 0
hanno soluzioni del tipo y(x) = x
, con C. Si risolva con questo

metodo lequazione x
2
y
+xy
y = 3.
413
Indice analitico
O-grande, 289
o-piccolo, 288, 290
o(1), 289
additività
dellarea, 92
dellintegrale, 345
addizione, 10
alfabeto greco, 1
angolo
acuto, 74
concavo, 68
convesso, 68, 196, 280
orientato, 90, 280
ottuso, 74
aperto, 190
applicazione
antilineare, 186
lineare, 186, 243
arco
di circonferenza, 91
orientato, 91
area
con segno, 333
del cerchio, 89, 90
del semicerchio, 362
del triangolo, 102
di un poligono regolare, 86, 342
di un settore
circolare, 366
iperbolico, 366
orientato, 91, 92, 228
argomento, 95
principale, 95
ascissa, 43, 61
asintoto
obliquo, 237, 354
orizzontale, 237
verticale, 237
asse
delle ascisse, 61
delle ordinate, 61
di un segmento, 78
immaginario, 82
reale, 82
assioma
di completezza, 15, 17, 18
di continuità, 15
assiomi dei numeri reali, 10
assoluta convergenza, 146
autovalore, 315, 316
autovettore, 315
base
del logaritmo, 56
dellesponenziale, 47
di uno spazio vettoriale, 407
cerchio, 64
di convergenza, 158
chiuso, 191, 193
chiusura, 198
circonferenza, 64
codominio, 55
di una funzione, 7
coeciente
414
angolare, 66, 241
binomiale, 32
generalizzato, 270
coecienti
di una equazione dierenziale, 397,
401
di una serie di potenze, 156
colatitudine, 280
combinazione lineare, 76, 207
complementare, 3, 191
componenti scalari, 208
coniugato di un numero complesso, 83
coniugio, 83
cono, 276
convergenza
assoluta, 146
uniforme, 391
coordinate, 61
cartesiane, 61
polari
in R
2
, 214, 280
in R
3
, 280
coppia di numeri reali, 61, 81, 82
corrispondenza biunivoca, 8, 171
coseno, 96
in coordinate, 102
iperbolico, 168
costante
di Eulero, 144
di Lipschitz, 348
criterio
del confronto, 128, 137
del confronto asintotico, 141
del rapporto, 137, 145, 160
della radice, 139, 145, 159
di integrabilità, 338
di Leibniz, 147, 206, 269
di Raabe, 144
integrale, 381
curva di livello, 262
denitivamente, 117
densità
dei razionali, 26, 50
derivata, 240
n-sima, 282
destra, 330
direzionale, 260
prima, 282
seconda, 282
sinistra, 330
derivate
parziali, 255
k-sime, 283
seconde, 282
derivato, 199
determinante, 102, 409
diametro di un insieme, 198
dierenza, 11
fra insiemi, 3
direzione, 61
di massima pendenza, 262
unitaria, 261
disco, 64
discriminante, 42, 45, 72
distanza, 188, 197
di un punto da una retta, 75
euclidea, 189
euclidea in R
2
, 63
in R, 43
disuguaglianza
delle medie, 39, 116
di Cauchy-Schwarz, 45, 63, 187,
204, 317
di Bernoulli, 35, 36, 56
di Jensen, 332
triangolare, 63, 189
divisione, 11
dominio di una funzione, 7
elemento
415
di un insieme, 1
neutro, 10, 81
separatore, 15
ellisse, 255
equazione
algebrica, 80
di una retta, 66
dierenziale, 384
a coecienti costanti, 407, 411
a variabili separabili, 398
alle derivate parziali, 384
di Bernoulli, 404
di Eulero, 412
di Riccati, 404
in forma normale, 384
lineare del 1
o
ordine, 401
lineare del 2
o
ordine, 405
lineare non omogenea, 402, 408
lineare omogenea, 402, 405
non lineare omogenea, 404
ordinaria, 384
integrale, 389
equazioni parametriche
di un segmento, 69
di una retta, 70
errore quadratico, 323
esponente, 47
estensione di una funzione, 211
estremo
inferiore, 16
di una funzione, 201
superiore, 15, 16
fattoriale, 22
forma
indeterminata, 122, 219, 288, 301
quadratica, 277, 313
denita negativa, 314, 316
denita positiva, 314, 316
indenita, 314, 316
semidenita negativa, 316
semidenita positiva, 314, 316,
327
semidenita negativa, 314
trigonometrica, 96, 103
di un numero complesso, 104
formula
del binomio, 33, 55, 104, 132, 249,
306
di de Moivre, 104, 163
di Eulero, 165
di Leibniz, 285, 309
di Stirling, 369
di Taylor, 297, 304
formule
di addizione, 97
di bisezione, 107
di de Morgan, 6
di duplicazione, 107
di prostaferesi, 107, 245
di quadratura, 341, 357
di Werner, 107
frazione
generatrice, 129
in base b, 30
frontiera, 198
funzione, 7, 200
di Eulero, 383
a valori vettoriali, 208, 278
ane, 204, 241
arcocoseno, 232
arcoseno, 232
arcotangente, 233
bigettiva, 8, 171
biunivoca, 8
caratteristica, 347
composta, 7, 207
concava, 325
continua, 203, 208
416
in un punto, 203, 343
convessa, 325
coseno, 96
coseno iperbolico, 168
crescente, 223, 309
decrescente, 223, 309
derivabile, 240
in un punto, 240
derivata, 282
di classe C
k
, 283
di classe C
, 283
di Dirichlet, 337
dierenziabile, 257
in un punto, 257
discontinua, 204
dispari, 201, 380
esponenziale, 47, 51, 183, 331
complessa, 165, 183, 188
identità, 8
indicatrice, 347
innita, 290
innitesima, 209, 288
iniettiva, 7, 55
integrabile
in senso improprio, 374
secondo Riemann, 337, 339
integrale, 354, 355
inversa, 8, 56, 229
invertibile, 8
limitata, 201, 333
inferiormente, 201
superiormente, 200
lipschitziana, 348, 354
localmente lipschitziana, 387
logaritmo, 56
monotona, 223, 348
omogenea, 276, 313
pari, 201, 380
parte intera, 202, 365
periodica, 96, 183, 359
primitiva, 356
radice (2n + 1)-sima, 234
razionale, 308
segno, 358
seno, 96
seno iperbolico, 168
settore coseno iperbolico, 254
settore seno iperbolico, 254
strettamente
crescente, 55, 223, 309
decrescente, 55, 223, 309
monotona, 55, 223
surgettiva, 8
tangente, 99
uniformemente continua, 349
vettoriale, 208
funzioni iperboliche, 169, 366
gradiente, 258
graco
graco di una funzione, 7
identità
di Abel, 135, 150
di Eulero, 277
immagine, 7
di una funzione, 7
incremento, 241, 257
innitesimi
dello stesso ordine, 288
non confrontabili, 289
innitesimo, 288
di ordine
inferiore, 288
superiore, 241, 288
inniti dello stesso ordine, 291
innito, 290
di ordine
inferiore, 290
superiore, 290
417
insieme, 1
aperto, 190
chiuso, 191, 193, 197
chiuso e limitato, 195
compatto, 196, 232, 314, 351
complementare, 3, 191
connesso, 227
convesso, 324
degli interi, 4, 25
dei complessi, 4, 81
dei naturali, 3, 21
dei naturali non nulli, 3
dei razionali, 4, 25
dei reali, 4, 9
denso, 26
di Cantor, 200
di sottolivello, 331
nito, 2
immagine, 200
induttivo, 21
innito, 2, 194
limitato, 13, 193, 194
inferiormente, 13, 197
superiormente, 13, 197
misurabile, 347
ternario di Cantor, 200
universo, 2
vuoto, 3
insiemi
disgiunti, 3
separati, 14, 50
integrale, 337
di Fresnel, 382
di Frullani, 382
di funzioni vettoriali, 392
improprio, 374
convergente, 374
divergente, 374
indenito, 356
inferiore, 336
superiore, 336
integrazione
per parti, 360
per sostituzione, 362
intersezione, 3
intervallo, 12
di convergenza, 158
intorno, 189
invarianza per traslazioni, 63, 189
iperbole, 255
iperpiano, 196
ortogonale, 196
irrazionalità
di , 368, 369
di
2, 18
di e, 134
legge di annullamento del prodotto, 11
lemma dellarbitrarietà di , 47
limite
allinnito, 210
destro, 210, 223
di una funzione, 209, 217
composta, 221
di una successione, 113, 190
sinistro, 210, 223
linea spezzata, 91
logaritmo, 56
naturale, 134
longitudine, 280
lunghezza
di un arco orientato, 92, 228
maggiorante, 13
massimo
di un insieme, 14, 197
massimo limite
di una successione, 155, 166
matrice, 102, 277
418
Hessiana, 283
media
aritmetica, 39
armonica, 42, 126
geometrica, 39, 42
metodo
dei coecienti indeterminati, 411
delle approssimazioni successive,
390
di variazione delle costanti arbitra-
rie, 408
metrica, 188
minimo
di un insieme, 14, 194, 197
minimo limite
di una successione, 155
minorante, 13
misura
di un insieme, 347
in radianti, 94, 228
modulo
di un numero reale, 43
di un vettore, 64
moltiplicazione, 10
monomio, 156
monotonia
dellintegrale, 345
della misura, 347
multi-indice, 303
negazione, 5
nodi di una suddivisione, 334
norma, 197
di un vettore, 187
euclidea, 187
numero
0, 10
1, 10
, 89, 342, 362
e, 133, 161
complesso, 4, 81
di Fibonacci, 136, 167
di Nepero, 133, 161
dispari, 29
intero, 4, 25
irrazionale, 4, 31
naturale, 3, 21
negativo, 11
pari, 29
positivo, 11
razionale, 4, 25
reale, 4, 10
omogeneità
della distanza euclidea, 189
della norma, 187
omotetia, 64
opposto, 10, 81
ordinamento, 82
dei reali, 11
ordinata, 61
ordine di unequazione dierenziale, 384
orientazione, 43, 61
negativa, 61, 80
positiva, 61, 79
origine, 43, 61
ortogonalità, 72
oscillazione, 342, 350
palla, 189, 197
chiusa, 197
parabola, 255
parte
immaginaria, 83
intera, 202
interna, 197
reale, 82
partizione, 334
419
pendenza, 66, 242
perimetro
della circonferenza, 89, 90
di un poligono, 86
piano, 60
cartesiano, 8, 82, 185
complesso, 82, 185
di Gauss, 82
tangente, 259, 264
polinomio, 156, 243
caratteristico, 407
di Taylor, 297, 304
positività
della distanza, 188
della norma, 187
potenza di un numero reale, 24, 33
primitiva, 356
principio
dei cassetti, 28
di identità
dei polinomi, 284
delle serie di potenze, 285
di induzione, 22, 30
di sostituzione
degli innitesimi, 289
degli inniti, 291
di sovrapposizione, 411
problema di Cauchy, 386, 406
prodotto
cartesiano, 5, 7, 61, 185
di Cauchy, 180
di numeri complessi, 81
di numeri reali, 10
per scalari, 62, 185
scalare, 74, 186, 392
progressione geometrica, 24
proiezione
di un insieme, 199
di un punto su una retta, 61
prolungamento
dispari, 253
pari, 253
proprietà
associativa, 10
commutativa, 10
dei numeri reali, 9
della distanza, 188
della norma, 187
di Archimede, 26
di miglior approssimazione, 300
distributiva, 10
punto
aderente, 198
daccumulazione, 193, 194, 203, 209,
217
di esso, 329
di frontiera, 198
di massimo, 201, 310
relativo, 310, 311, 318
di minimo, 201, 310
relativo, 310, 311, 319
di sella, 322
sso, 234
interno, 197
isolato, 198, 203
stazionario, 322
quadrato di un numero reale, 12
quanticatori esistenziali, 4
radiante, 95
radice
(2n + 1)-sima, 234
n-sima, 36, 48
di un polinomio, 407
quadrata, 17, 18
raggio di convergenza, 158, 159, 166
raggruppamento dei termini di una se-
rie, 177, 182
420
rapporto incrementale, 240, 330
reciproco, 10, 82
regola del parallelogrammo, 62
resto
di Taylor, 299, 367
di una serie, 127, 165
restrizione di una funzione, 214, 232,
233, 256
retta, 43, 65
per due punti, 67
tangente, 242
rette
parallele, 70
perpendicolari, 71, 72
riordinamento di una serie, 171
rotazione, 64, 79
salto di una funzione, 202
segmenti
paralleli, 70
perpendicolari, 71, 72
segmento, 67, 281
semipiano, 68
semiretta, 67
seno, 96
in coordinate, 102
iperbolico, 168
serie, 124
armonica, 126, 143
generalizzata, 131, 143
binomiale, 269
convergente, 124
assolutamente, 146
del settore seno iperbolico, 274
dellarcoseno, 273
dellarcotangente, 269
di potenze, 155
divergente negativamente, 125
divergente positivamente, 125
esponenziale, 132, 139, 156, 161, 183
geometrica, 125, 156, 182
indeterminata, 125
logaritmica, 268
telescopica, 126
settore
associato a una spezzata, 92
circolare, 91, 366
orientato, 91
iperbolico, 366
sferico, 280
sezione di R, 19
simbolo
+, 12, 18
, 12, 18
di appartenenza, 2
di doppia implicazione, 4
di implicazione, 4
di inclusione, 2
di inclusione propria, 2
di non appartenenza, 2
di non uguaglianza, 2
di prodotto, 23
di somma, 22
di uguaglianza, 2
di uguaglianza approssimata, 35
simmetria, 64, 79
della distanza, 189
sistema
di riferimento, 43, 61
dierenziale, 385
del primo ordine, 385
in forma normale, 386
lineare, 397
lineare, 409
soluzione
globale, 396
locale, 387
massimale, 396
somma
di numeri complessi, 81
421
di numeri reali, 10
di Riemann, 341
di una serie, 124
di potenze, 205
di una serie di potenze, 249, 284,
357
di vettori, 62, 185
inferiore, 334
parziale, 124
di una serie di potenze, 301
superiore, 334
sopragraco, 325
sottoinsieme, 2
sottosuccessione, 154, 182, 194
sottrazione
fra numeri, 11
fra vettori, 62
spazio
C
m
, 185
R
m
, 185
ane, 402
metrico, 189
vettoriale, 62, 185
spezzata, 91
circoscritta, 91
inscritta, 91
subadditività
del modulo, 84
del valore assoluto, 44
della norma, 187
successione, 112
convergente, 113, 190
crescente, 129
decrescente, 129
denita per ricorrenza, 113
denitivamente monotona, 129
di Cauchy, 153, 391
di Fibonacci, 136, 167
divergente negativamente, 114
divergente positivamente, 114
innitesima, 127
limitata, 117, 194
limitata inferiormente, 117
limitata superiomente, 117
monotona, 129, 194
strettamente crescente, 129
strettamente decrescente, 129
strettamente monotona, 129
suddivisione, 334
equispaziata, 334, 340, 349
pi` u ne, 334
tangente, 99
teorema
dei carabinieri, 123, 162, 341
dei seni, 108
dei valori intermedi, 227
del dierenziale totale, 275
della media, 341
di permanenza del segno, 121, 207,
220, 311
di Bolzano-Weierstrass, 194
di Carnot, 108
di Cauchy, 181, 266, 292, 299
di confronto
per integrali, 378
per serie, 131
di confronto per serie, 120, 133
di Darboux, 271
di de lHopital, 292, 295
di derivazione
delle funzioni composte, 245, 278
delle funzioni inverse, 246
delle serie di potenze, 249, 268,
270
di dierenziabilità
delle funzioni composte, 279
di Dirichlet, 171, 182
di esistenza degli zeri, 226
di esistenza e unicità locale, 388
422
di Fermat, 310
di Heine-Cantor, 351
di Lagrange, 267, 275, 309
di grado k + 1, 299, 320
di Pitagora, 188
di Riemann, 175
di Rolle, 266, 323
multidimensionale, 323
di Schwarz, 283, 286
di Weierstrass, 225, 314
di Weirestrass, 266
fondamentale del calcolo integrale,
355
ponte, 217, 221
termini
di una serie, 124
di una successione, 112
traslazione, 63, 402
triangolo di Tartaglia, 32
unicità del limite, 118, 221
unione, 3
unit` a
di misura, 43
immaginaria, 4, 80
valore assoluto, 43
vettore, 62, 82, 185
vettori
linearmente dipendenti, 76
linearmente indipendenti, 76
ortogonali, 72, 186
423
Appunti di Analisi convessa
Paolo Acquistapace
6 luglio 2009
Indice
1 Spazi vettoriali topologici 1
1.1 Insiemi convessi . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Funzionale di Minkowski . . . . . . . . . . . . . . . . . . . . . 3
1.3 Topologie su uno spazio vettoriale . . . . . . . . . . . . . . . . 8
1.4 Completezza . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.5 Operatori lineari e continui . . . . . . . . . . . . . . . . . . . . 23
1.6 Topologie deboli . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.7 Separazione di insiemi convessi . . . . . . . . . . . . . . . . . . 41
1.8 Punti estremi di insiemi convessi . . . . . . . . . . . . . . . . . 51
2 Funzioni convesse 56
2.1 Generalità . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.2 Semicontinuità . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.3 Funzioni convesse semicontinue inferiormente . . . . . . . . . . 62
2.4 Funzioni convesse continue . . . . . . . . . . . . . . . . . . . . 72
2.5 Funzioni coniugate . . . . . . . . . . . . . . . . . . . . . . . . 76
2.6 Problemi di ottimizzazione . . . . . . . . . . . . . . . . . . . . 81
3 Calcolo in spazi di Banach 96
3.1 Integrale di Bochner . . . . . . . . . . . . . . . . . . . . . . . 96
3.2 Dierenziale di Frechèt . . . . . . . . . . . . . . . . . . . . . . 103
3.3 Dierenziale di Gateaux . . . . . . . . . . . . . . . . . . . . . 106
3.4 Loperatore di superposizione . . . . . . . . . . . . . . . . . . 108
3.5 Derivate successive . . . . . . . . . . . . . . . . . . . . . . . . 117
3.6 Massimi e minimi relativi . . . . . . . . . . . . . . . . . . . . . 121
3.7 Funzioni implicite . . . . . . . . . . . . . . . . . . . . . . . . . 124
3.8 Varietà tangente ad una curva di livello . . . . . . . . . . . . . 130
3.9 Massimi e minimi vincolati . . . . . . . . . . . . . . . . . . . . 135
i
4 Calcolo delle variazioni 140
4.1 Funzionali del calcolo delle variazioni . . . . . . . . . . . . . . 140
4.2 Lemmi fondamentali del calcolo delle variazioni . . . . . . . . 143
4.3 Equazione di Eulero . . . . . . . . . . . . . . . . . . . . . . . 147
4.4 Integrali primi . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
4.5 Condizione di Legendre . . . . . . . . . . . . . . . . . . . . . . 158
4.6 Il problema isoperimetrico . . . . . . . . . . . . . . . . . . . . 160
4.7 Geodetiche su una supercie . . . . . . . . . . . . . . . . . . . 163
5 Sottodierenziale 173
5.1 Denizione e proprietà . . . . . . . . . . . . . . . . . . . . . . 173
5.2 Funzioni convesse sottodierenziabili . . . . . . . . . . . . . . 178
5.3 Regolarizzata di una funzione convessa . . . . . . . . . . . . . 187
6 Disequazioni variazionali 195
6.1 Problemi variazionali con vincoli convessi . . . . . . . . . . . . 195
6.2 Forme bilineari . . . . . . . . . . . . . . . . . . . . . . . . . . 197
6.3 Operatori monotoni . . . . . . . . . . . . . . . . . . . . . . . . 203
6.4 Filo elastico teso sopra un ostacolo . . . . . . . . . . . . . . . 211
7 Multifunzioni 219
7.1 Nomenclatura . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
7.2 Punti ssi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
7.3 Punti di sella . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
7.4 Teoria dei giochi . . . . . . . . . . . . . . . . . . . . . . . . . 236
7.5 Selezioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
7.6 Inclusioni dierenziali . . . . . . . . . . . . . . . . . . . . . . . 255
7.7 Multifunzioni monotone . . . . . . . . . . . . . . . . . . . . . 256
7.8 Alcune multifunzioni massimali monotone . . . . . . . . . . . 263
7.9 Inclusioni funzionali . . . . . . . . . . . . . . . . . . . . . . . . 273
Bibliograa 285
ii
Capitolo 1
Spazi vettoriali topologici
1.1 Insiemi convessi
Questo corso è dedicato alla descrizione, necessariamente sommaria, di alcuni
aspetti e metodi dellanalisi non lineare, con particolare riguardo a qualcuna
delle sue innumerevoli applicazioni.
Lanalisi convessa è il principale argomento di cui ci occuperemo. Esso per
certi versi è il pi` u vicino alle tematiche di analisi funzionale lineare svolte nel
primo modulo: frequentemente, infatti, i risultati dellanalisi convessa sono
le prime, naturali estensioni a casi non lineari di proprietà già dimostrate ed
analizzate nel caso lineare.
Ricordiamo, per cominciare, la nozione di insieme convesso.
Denizione 1.1.1 Sia X uno spazio vettoriale su R o su C. Un sottoinsie-
me E X si dice convesso se si ha
x + (1 )x
E [0, 1], x, x
E.
Osservazione 1.1.2 Le intersezioni, nite od innite, di insiemi convessi
sono insiemi convessi. Inoltre se E, F X sono convessi, allora gli insiemi
E = x X : x = y, y E ( R oppure C),
E +F = x X : x = u +v, u E, v F
sono convessi.
1
Inoltre, se X, Y sono spazi vettoriali e se F : X Y è unapplicazione
lineare, allora valgono le implicazioni seguenti:
A X convesso = F(A) Y convesso,
B Y convesso = F
1
(B) X convesso.
Denizione 1.1.3 Sia E un sottoinsieme dello spazio vettoriale X. L
inviluppo convesso di E è linsieme
co(E) =
_
n
k=1
k
x
k
: n N
+
, x
k
E,
k
0,
n
k=1
k
= 1
_
.
Dunque co(E) è il pi` u piccolo insieme convesso contenente E.
Esercizi 1.1
1. Sia X uno spazio vettoriale e sia U
t
t]a,b[
una famiglia di sottoinsiemi
convessi di X tale che U
t
U
s
per t s. Si mostri che
t]a,b[
U
t
è un
insieme convesso.
2. Sia X uno spazio vettoriale. Si provi che:
(i) se U X e , > 0 si ha U + U ( + )U con inclusione
stretta in generale;
(ii) un sottoinsieme U X è convesso se e solo se U+U = (+)U
per ogni , > 0.
3. Sia X uno spazio vettoriale. Un sottoinsieme U di X si dice radiale, od
assorbente, se 0 U e se per ogni x X esiste > 0 tale che x U
per ogni ]0, [. Si provi che le proprietà U è convesso e contiene
0 e U è radiale sono fra loro indipendenti.
4. Un sottoinsieme E di uno spazio vettoriale X si dice bilanciato, o
cerchiato, se risulta E E per [[ 1. Si provi che:
(i) un convesso che contiene lorigine non è necessariamente bilanciato;
(ii) un insieme bilanciato contiene lorigine ma non è necessariamente
convesso;
2
(iii) un insieme radiale non è necessariamente bilanciato;
(iv) un insieme bilanciato non è necessariamente radiale.
5. Si determini linviluppo convesso dei seguenti insiemi:
(i) E = (x, y) R
2
: [x[ 1, [y[ 1, xy = 0;
(ii) E = (x, y) R
2
: y e
x
;
(iii) E = z C : z = e
i
, Z.
6. Sia X uno spazio vettoriale. Si mostri che
t(U V ) = tU tV, t(U V ) = tU tV t R, U, V X.
7. Determinare linviluppo convesso del sottoinsieme di R
2
costituito dai
punti (k, 1/[k[), k Z 0.
1.2 Funzionale di Minkowski
Ad ogni sottoinsieme E di uno spazio vettoriale X possiamo associare una
funzione reale p
E
denita su X, dotata di interessanti proprietà che sono par-
ticolarmente signicative, come vedremo, allorche E è un convesso contenente
lorigine.
Denizione 1.2.1 Sia E un sottoinsieme dello spazio vettoriale X. Il fun-
zionale di Minkowski di E è la funzione p
E
: X [0, ] denita da
p
E
(x) = inf > 0 : x tE t
(con la convenzione che p
E
(x) = + quando linsieme a secondo membro è
vuoto).
Si osservi che il numero p
E
(x) è lestremo inferiore di una semiretta, even-
tualmente vuota: può benissimo succedere, in eetti, che sia p
E
(x) = +
per qualche x. Ad esempio, se E = y con y ,= 0, si ha p
E
(x) = +
per ogni x X; se invece E è il semidisco di R
2
di centro (0, 0) e raggio 1
contenuto nel semipiano y 0, allora p
E
(x, y) = + se e solo se y < 0. Ha
interesse, perciò, sapere per quali insiemi E il funzionale p
E
è nito su X.
3
Proposizione 1.2.2 Sia X uno spazio vettoriale, sia E X. Risulta
p
E
(x) < per ogni x X se e solo se E è radiale, ossia se e solo se
0 E e per ogni x X esiste > 0 tale che x E per qualunque ]0, [
(esercizio 1.1.3).
Dimostrazione (=) Sia p
E
(x) < per ogni x X. Dalle proprietà
dellestremo inferiore segue che x tE per ogni t > p
E
(x); pertanto x E
per ogni <
1
p
E
(x)
(intendendo < +se p
E
(x) = 0). In particolare 0 tE
per ogni t > p
E
(0) e pertanto 0 = 0/t E. Ciò prova che E è radiale.
(=) Sia x X. Per ipotesi si ha x
1
E per ogni ]0, [, ossia x tE

per ogni t >
1
. Ciò prova che p

E
(x)
1
< .
Vediamo ora le principali proprietà del funzionale di Minkowski.
Proposizione 1.2.3 Sia E un sottoinsieme dello spazio vettoriale X. Val-
gono i fatti seguenti:
(i) 0 E se e solo se p
E
(0) = 0;
(ii) se x ,= 0, allora p
E
(x) = 0 se e solo se x : > 0 E;
(iii) si ha p
E
(x) = p
E
(x) per ogni > 0 e per ogni x X;
(iv) se e
i
E = E per ogni R, allora p
E
(x) = [[p
E
(x) per ogni
C 0 e per ogni x X;
(v) se E è convesso, allora p
E
(x +x
) p
E
(x) +p
E
(x
) per ogni x, x
X.
Dimostrazione (i) Basta osservare che se t > 0 si ha 0 tE se e solo se
0 E.
(ii) Sia x ,= 0; per denizione si ha p
E
(x) = 0 se e solo se x tE per ogni
t > 0, ossia se e solo se x E per ogni > 0.
(iii) Se p
E
(x) = +, allora chiaramente p
E
(x) = +. Se invece p
E
(x) <
+, si ha
p
E
(x) = inf > 0 : x tE t =
= inf
_
> 0 : x sE s

_
=
= inf > 0 : x sE s = p
E
(x).
4
(iv) Proviamo anzitutto che p
E
(e
i
x) = p
E
(x) per ogni x X e R.
Dallipotesi segue facilmente che p
E
(x) = + se e solo se p
E
(e
i
x) = +.
Se invece queste quantità sono nite, se t > p
E
(x) si ha x tE e quindi
e
i
x e
i
(tE) = t(e
i
E) = tE t > p
E
(x),
da cui p
E
(e
i
x) p
E
(x). Scambiando i ruoli di x e e
i
x si ottiene laltra
disuguaglianza.
Se ora = [[e
i
C 0, si ha, usando (iii),
p
E
(x) = p
E
([[e
i
x) = [[p
E
(e
i
x) = [[p
E
(x),
da cui la tesi.
(v) Possiamo supporre che p
E
(x) e p
E
(x
) siano entrambi niti. Poiche E

è convesso, si ha E + E = ( + )E per ogni , 0 (esercizio 1.1.2).
Poiche risulta x tE per ogni t > p
E
(x) e x
sE per ogni s > p

E
(x
), si
deduce x +x
(t +s)E per ognuno di tali t, s; quindi x +x
E per ogni
> p
E
(x) +p
E
(x
). Ciò implica p
E
(x +x
) p
E
(x) +p
E
(x
).
Osservazione 1.2.4 Se lo spazio X è reale, la proprietà (iv) della proposi-
zione precedente vale per ogni R0 supponendo solamente che linsieme
E sia simmetrico, ossia E = E.
Una nozione che useremo spesso nel seguito è quella di seminorma: le se-
minorme sono importanti perche, come vedremo, consentono di costruire
topologie dotate di buone proprietà.
Denizione 1.2.5 Una seminorma nello spazio vettoriale X è una funzione
p : X [0, [ tale che
(i) p(x) = [[p(x) per ogni R (oppure per ogni C) e per ogni
x X;
(ii) p(x +x
) p(x) +p(x
) per ogni x, x
X.
Osservazione 1.2.6 Dalla denizione segue immediatamente che ogni semi-
norma p su X verica p(0) = 0 e [p(x)p(x
)[ p(xx
) per ogni x, x
X.
In particolare, ogni seminorma verica p(0) = 0, ma non è detto che valga
limplicazione p(x) = 0 = x = 0; ciò vale se e solo se p è una norma su
X. Inoltre si verica subito che se p è una seminorma su X allora gli insiemi
U
c
= x X : p(x) < c, c > 0,
5
sono convessi e radiali, nonche bilanciati, ossia tali che U
c
U
c
per [[ 1
(esercizio 1.1.4).
Esempio 1.2.7 Se E è un sottoinsieme dello spazio vettoriale X che è ra-
diale, bilanciato e convesso, allora il funzionale di Minkowski p
E
è una semi-
norma su X in virt` u della proposizione 1.2.3.
`
E vero anche il viceversa: se p
è una seminorma sullo spazio vettoriale X, allora (esercizio 1.2.6) p coincide
col funzionale di Minkowski p
U
, ove
U = x X : p(x) < 1.
Esercizi 1.2
1. Si forniscano esempi di insiemi contenenti lorigine che siano:
(a) convessi ma non radiali;
(b) radiali ma non convessi;
(c) convessi ma non bilanciati;
(d) bilanciati ma non convessi;
(e) bilanciati ma non radiali;
(f) radiali ma non bilanciati.
2. Si consideri il funzionale di Minkowski del sottoinsieme E = B(0, 1)
1 di C. Si provi che valgono le relazioni
p
E
(z) = [[p
E
(z) C, z C
benche si abbia e
i
E ,= E per ,= 2k, k Z.
3. Si consideri il funzionale di Minkowski del sottoinsieme E = B(0, 1)
z C : [z[ = 2 di C. Si provi che
p
E
(z +z
) p
E
(z) +p
E
(z
) z, z
C
benche linsieme E non sia convesso.
4. Si provi che se E è un sottoinsieme convesso dello spazio vettoriale X
che contiene 0, allora
p
E
(x) = infr > 0 : x rE x X;
6
si dia anche un esempio di sottoinsieme E X tale che 0 E ma per
il quale risulti, per almeno un x X,
infr > 0 : x rE < p
E
(x).
5. Si provi che se X è uno spazio vettoriale, e se U V X, allora p
U

p
V
. Se ne deduca che se U
i
iI
è unarbitraria famiglia di sottoinsiemi
di X, allora
p
T
iI
U
i
= sup
iI
p
U
i
, p
S
iI
U
i
= inf
iI
p
U
i
.
6. Sia p una seminorma denita sullo spazio vettoriale X. Posto per c > 0
U
c
= x X : p(x) < c,
si provi che p
Uc
(x) =
p(x)
c
per ogni x X.
7. Sia X uno spazio vettoriale, sia E X. Si provi che
x X : p
E
(x) < 1 E,
e che inoltre se E è convesso e 0 E, allora
E x X : p
E
(x) 1.
8. Sia X uno spazio normato. Se U è un intorno di 0, si provi che esiste
M 0 tale che p
U
(x) M|x|
X
per ogni x X.
9. Si determini il funzionale di Minkowski p
E
nei casi seguenti:
(i) X spazio normato, E = X;
(ii) X spazio normato, E = B(0, r);
(iii) X = R
2
, E = (x, y) R
2
: ax + by c, con a, b R e c > 0
ssati;
(iv) X = R
2
, E = (x, y) R
2
: x
2
+y
2
1, y 0;
(v) X =
2
, E = x = x
n
nN
: [x
j
[ 1, con j N ssato.
7
1.3 Topologie su uno spazio vettoriale
In molte applicazioni dellanalisi non lineare gli spazi di Banach non sono
sucientemente generali. Ad esempio, per ottenere lesistenza di soluzioni
per certi problemi, occorrono risultati di compattezza che valgono in molti
di questi spazi soltanto se si fa uso di topologie pi` u deboli di quella indotta
dalla norma; rispetto a tali topologie lo spazio perde la sua struttura metri-
ca, mantenendo solo quella di spazio vettoriale topologico, in cui lunico
requisito richiesto è la continuità delle operazioni di somma e prodotto per
scalari rispetto alla topologia.
`
E quindi utile fare un esame sommario delle
caratteristiche di questi spazi.
Denizione 1.3.1 Uno spazio vettoriale topologico è uno spazio vettoria-
le X dotato di una topologia , rispetto alla quale sono continue le due
applicazioni
(x, y) x +y da X X in X,
(, x) x da R X in X, oppure da C X in X.
Da questa denizione segue subito che le traslazioni x x+x
0
e le omotetie
x x, con x
0
X e C 0 ssati, sono omeomorsmi di X in
se.
`
E anche chiaro che la topologia di uno spazio vettoriale topologico è
univocamente individuata se si ssano gli intorni U di 0: gli intorni di ogni
altro punto x ,= 0 sono semplicemente gli insiemi traslati x +U.
Osservazione 1.3.2 In un qualunque spazio vettoriale topologico, ogni in-
torno U di 0 contiene un intorno W di 0 che è bilanciato. Infatti, per la
continuità del prodotto, esistono > 0 ed un intorno V di 0 tali che V U
per [[ < ; quindi, posto
W =
_
||<
V,
risulta W U, e W è ovviamente bilanciato. Si noti che W è anche radiale
(esercizio 1.3.1). Se lintorno U è anche convesso, non è detto che anche W
lo sia; tuttavia in tal caso è facile vericare che linsieme co(W) è ancora
un intorno di 0 che è contenuto in U, convesso, radiale, nonche bilanciato in
virt` u dellesercizio 1.3.10.
La proposizione che segue caratterizza gli spazi vettoriali topologici che sono
di Hausdor.
8
Proposizione 1.3.3 Sia X uno spazio vettoriale topologico, sia U
i
iI
un
sistema fondamentale di intorni dellorigine. Lo spazio X è di Hausdor se
e solo se
iI
U
i
= 0.
Dimostrazione (=) Sia X di Hausdor: allora se x
0
,= 0 esiste un intorno
U
i
tale che x
0
/ U
i
, e quindi x
0
/
iI
U
i
.
(=) Sia x
0
,= 0: per ipotesi esiste i I tale che x
0
/ U
i
. Poiche lap-
plicazione (x, y) x y è continua, esiste j I tale che x y U
i
per
ogni x, y U
j
; ciò signica che U
j
U
j
U
i
. Se ne deduce che U
j
è di-
sgiunto da x
0
+U
j
: infatti in caso contrario troveremmo x
1
, x
2
U
j
tali che
x
0
+x
1
= x
2
, da cui x
0
= x
2
x
1
U
j
U
j
U
i
, cosa che non è. Quindi x
0
e 0 hanno intorni disgiunti. Per traslazione, due arbitrari punti distinti x, x
hanno intorni disgiunti.

Denizione 1.3.4 Uno spazio vettoriale topologico X si dice localmente
convesso se esiste un sistema fondamentale di intorni di 0 costituito da
insiemi convessi.
Gli spazi vettoriali topologici localmente convessi sono importanti perche la
loro topologia può essere caratterizzata mediante una famiglia di seminorme,
il che ne rende pi` u comodo lo studio.
Sia p
i
iI
una famiglia arbitraria di seminorme denite su uno spazio vet-
toriale X: vediamo ora come esse generino una topologia che rende
X uno spazio vettoriale topologico localmente convesso. Fissati k N
+
e
i
1
, . . . , i
k
I, deniamo per x X ed > 0
V
i
1
,...,i
k
,
(x) = X : p
i
h
( x) < per h = 1, . . . , k.
Gli insiemi V
i
1
,...,i
k
,
(x) sono convessi (osservazione 1.2.6), ed è facile consta-
tare che per ogni x X la famiglia
1(x) = V
i
1
,...,i
k
,
(x) : k N
+
, i
1
, . . . , i
k
I, > 0,
verica gli assiomi relativi ad un sistema fondamentale di intorni di x; quindi
esiste una ed una sola topologia su X rispetto alla quale, per ogni x X,
1(x) è un sistema fondamentale di intorni di x. Rispetto a questa topologia
le applicazioni (, x) x e (x, y) x + y sono continue, come facile
conseguenza delle relazioni
p
i
(x) = [[p
i
(x), p
i
(x +y) p
i
(x) +p
i
(y);
9
dunque la topologia rende X uno spazio vettoriale topologico localmente
convesso.
Si noti che tutte le seminorme p
i
sono automaticamente continue rispetto
a , a causa della disuguaglianza [p
i
(x) p
i
(y)[ p
i
(x y). Vale anche il
viceversa: se (X, ) è uno spazio vettoriale topologico localmente convesso,
esiste una famiglia di seminorme su X che genera la topologia . Infatti,
sia U
i
iI
un sistema fondamentale di intorni convessi di 0 nella topologia
, che possiamo sempre supporre bilanciati e radiali (osservazione 1.3.2): i
funzionali di Minkowski p
U
i
ad essi associati sono seminorme (esempio 1.2.7),
che vericano, in virt` u dellesercizio 1.3.2,
x X : p
U
i
(x) < 1 U
i
x X : p
U
i
(x) 1,
e quindi generano .
Vi è un facile criterio, basato sulle seminorme, per stabilire se un dato spazio
vettoriale topologico è di Hausdor o no. Esso è espresso dallenunciato che
segue.
Proposizione 1.3.5 Sia X uno spazio vettoriale, sia p
i
iI
una famiglia
di seminorme denite su X. La topologia generata dalle p
i
è di Hausdor se
e solo se le p
i
separano i punti, ossia per ogni x X 0 esiste i I tale
che p
i
(x) > 0.
Dimostrazione Per la proposizione 1.3.3, X è di Hausdor se e solo se
lintersezione di tutti gli intorni
V
i
1
,...,i
k
,
= x X : p
i
h
(x) < per h = 1, . . . , k,
al variare di k N
+
, i
1
, . . . , i
k
I, ed > 0, è uguale a 0. Poiche tale
intersezione coincide con
iI
p
1
i
(0), X è di Hausdor se e solo se non vi è
alcun x ,= 0 tale che p
i
(x) = 0 per ogni i I. Ciò prova la tesi.
Alcuni spazi vettoriali topologici di Hausdor sono particolarmente impor-
tanti perche su di essi è possibile denire una metrica:
Proposizione 1.3.6 Sia X uno spazio vettoriale topologico localmente con-
vesso e di Hausdor. Allora X è metrizzabile se e solo se esiste un sistema
fondamentale di intorni di 0 che è numerabile.
Lipotesi di locale convessità sarebbe superua, ma semplica la dimostra-
zione, e daltronde è il caso che pi` u ci interessa.
10
Dimostrazione
`
E chiaro che se X è metrizzabile allora le palle di centro 0 e
raggio
1
n
formano un sistema fondamentale di intorni di 0 che è numerabile.
Viceversa, sia U
n
nN
un sistema fondamentale di intorni di 0 numerabile
e fatto di intorni convessi, bilanciati e radiali (osservazione 1.3.2). Allora, in
virt` u dellesercizio 1.2.7, gli insiemi x X : p
Un
(x) < 1 costituiscono un
sistema fondamentale di intorni di 0 equivalente a quello degli U
n
. Perciò,
denendo
d(x, y) =
n=0
2
n
p
Un
(x y)
1 +p
Un
(x y)
x, y X,
si ottiene una distanza su X che induce la topologia data.
Osservazione 1.3.7 Si noti che la distanza sopra denita è invariante per
traslazioni, cioè d(x + z, y + z) = d(x, y) per ogni x, y, z X. Questa
proprietà non è automatica: ad esempio, nellinsieme R, che è uno spazio
vettoriale topologico metrizzabile con lovvia distanza d(x, y) = [x y[, vi
è la distanza equivalente (x, y) = [ arctan x arctan y[ che induce la stessa
topologia ma non è invariante per traslazioni.
Esercizi 1.3
1. Sia X uno spazio vettoriale topologico. Si provi che ogni intorno di 0
è radiale.
2. Sia X uno spazio vettoriale topologico e sia U un convesso contenente
lorigine. Si provi che:
(i) se U è aperto, allora U = x X : p
U
(x) < 1;
(ii) se U è chiuso, allora U = x X : p
U
(x) 1.
3. Sia X uno spazio vettoriale topologico. Si provi che se U è un intorno
di 0, allora U è un intorno di 0 per ogni ,= 0.
4. Sia X uno spazio vettoriale topologico e sia U un intorno di 0. Si provi
che X =
s>0
sV .
5. Sia X uno spazio vettoriale topologico. Si provi che per ogni intorno
U di 0 esiste un altro intorno V di 0 tale che V +V U.
6. Si provi che in ogni spazio vettoriale topologico lorigine ha un sistema
fondamentale di intorni chiusi.
11
7. Sia X uno spazio vettoriale topologico. Si provi che se A X è un
aperto, allora il suo inviluppo convesso co(A) è aperto.
8. Sia E un sottoinsieme di uno spazio vettoriale X e sia una qualun-
que topologia su X (che lo renda uno spazio vettoriale topologico).
Linviluppo convesso chiuso di E è il pi` u piccolo insieme convesso e
chiuso che contiene E. Si verichi che esso coincide con co(E).
9. Sia X uno spazio vettoriale topologico, sia K un convesso non vuoto di
X. Si provi che
K,= se e solo se le chiusure di
K e di K coincidono.
10. Sia W un insieme bilanciato in uno spazio vettoriale topologico X. Si
provi che co(W) è bilanciato.
1.4 Completezza
Sia X uno spazio vettoriale topologico. Andiamo a denire la nozione di
completezza dello spazio X. Le nozioni di successione di Cauchy e di succes-
sione convergente (a valori in X) sono ben note: x
n
x in X se per ogni
intorno U di 0 esiste N tale che x
n
x U per ogni n > ; x
n
è di
Cauchy in X se per ogni intorno U di 0 esiste N tale che x
n
x
m
U per
ogni n, m > . Utilizzando la continuità della somma in X si ottiene anche
che ogni successione convergente è di Cauchy. Se la topologia di X è generata
da una famiglia di seminorme p
j
jJ
, si vede facilmente che x
n
x in X
se e solo se si ha p
j
(x
n
x) 0 in R per ogni seminorma p
j
.
Cominciamo con il caso in cui 0 ha un sistema fondamentale di intorni
numerabile.
Denizione 1.4.1 Sia X uno spazio vettoriale topologico tale che 0 abbia
un sistema fondamentale di intorni numerabile. Diciamo che X è completo
se ogni successione di Cauchy in X converge ad un elemento di X.
Nel caso generale, eliminando lipotesi che 0 abbia un sistema fondamentale
di intorni numerabile, la completezza di X si fonda sul concetto di successione
generalizzata, o net.
Denizione 1.4.2 Un insieme diretto, o ltrante, è un insieme (I, ) par-
zialmente ordinato, con la proprietà che per ogni i, j I esiste h I con
h i e h j. Una successione generalizzata, o net, a valori in un insieme
X è una famiglia x
i
iI
di punti di X, ove I è un insieme ltrante.
12
Esempi 1.4.3 (1) Poiche N è un insieme ltrante, ogni successione x
n
contenuta in un ssato insieme X è un net a valori in X.

(2) La famiglia | degli intorni di 0 in un arbitrario spazio topologico è un in-
sieme ltrante rispetto allordinamento parziale dellinclusione rovesciata:
se U, V |, si denisce U V se U V . Quindi ogni famiglia di punti
della forma x
U
UU
è un net a valori in X.
(3) Un ordinamento parziale in R
2
è dato da
(x, y) (x
, y
) x < x
oppure x = x
e y y
.
Con questo ordinamento, R
2
è un insieme ltrante e ogni funzione f : R
2
X denisce il net f(x, y)

(x,y)R
2 a valori in X.
Denizione 1.4.4 Sia X uno spazio vettoriale topologico. Diciamo che un
net x
i
iI
contenuto in X converge ad un punto x X se per ogni intorno
U di 0 esiste i
0
I tale che x
i
x U per ogni i I, i i
0
. Il net è di
Cauchy in X se per ogni intorno U di 0 esiste i
0
I tale che x
i
x
j
U
per ogni i, j I, i, j i
0
.
Nuovamente, ogni net convergente è di Cauchy. Se la topologia di X è
generata da una famiglia di seminorme p
j
jJ
, un net x
i
iI
X converge
allelemento x in X se e solo se per ogni j J il net p
j
(x
i
x)
iI
R è
innitesimo (tende a 0).
Denizione 1.4.5 Uno spazio vettoriale topologico X si dice completo se
ogni net di Cauchy in X converge ad un elemento x di X.
Denizione 1.4.6 Uno spazio vettoriale topologico localmente convesso, di
Hausdor, completo è detto spazio di Frechèt.
Vediamo ora alcuni esempi importanti di spazi vettoriali topologici, completi
e non.
Esempio 1.4.7 Ogni spazio normato è uno spazio vettoriale topologico lo-
calmente convesso e di Hausdor; le palle B(0,
1
n
) costituiscono un sistema
fondamentale numerabile di intorni di 0 convessi. Se lo spazio normato è
completo, esso è uno spazio di Frechèt.
Esempio 1.4.8 Consideriamo per p ]0, 1[ lo spazio
13
p
=
_
x = x
n
nN
C : (x) =
n=0
[x
n
[
p
<
_
;
la disuguaglianza (a + b)
p
a
p
+ b
p
, valida per ogni a, b 0, mostra che
p
è uno spazio vettoriale, e che la quantità
d(x, y) = (x y) =
n=0
[x
n
y
n
[
p
, x, y
p
,
è una distanza su
p
; si noti che (x) non è una norma perche (x) =
[[
p
(x).
`
E chiaro che somma ed il prodotto per scalari sono applicazioni
continue rispetto a questa distanza; quindi
p
è uno spazio vettoriale topolo-
gico di Hausdor, ed è anche uno spazio metrico completo (esercizio 1.4.6).
Tuttavia
p
non è localmente convesso (e quindi non è uno spazio di Frechèt).
Infatti in caso contrario, posto B(r) = x
p
: (x) r, esisterebbe un
intorno convesso W di 0 tale che W B(1); scelto m N
+
in modo che
B(m
p
) W, utilizzando lomotetia x mx si deduce
B(1) = mB(m
p
) mW mB(1) = B(m
p
) B(m).
Consideriamo daltronde la famiglia e
(n)
nN
, ove e
(n)
è la successione che
ha tutte la componenti nulle tranne la n-sima che vale 1. Si ha e
(n)
B(1),
quindi e
(n)
appartiene al convesso mW per ogni n N. Pertanto anche
g
(n)
=
1
n
n1
k=0
e
(k)
appartiene a mW per ogni n N
+
. Daltra parte
(g
(n)
) = n
1p
per n ,
mentre, essendo mW B(m), dovrebbe aversi (g
(n)
) m per ogni n N
+
.
Ci` o è assurdo.
Esempio 1.4.9 Sia un aperto non vuoto di R
N
; ssato m N, consideria-
mo lo spazio C
m
() delle funzioni che sono continue su insieme con le loro
derivate no allordine m incluso. Se K
n
nN
è una successione strettamente
crescente di compatti (ossia K
n

Kn+1
), la cui unione è , ponendo
14
p
n
(f) = sup
Kn
||m
[D
f[
si ottiene una famiglia numerabile di seminorme che separano le funzioni di
C
m
(): infatti se f ,= 0 esiste certamente un n N per il quale p
n
(f) >
0. Dunque, per ogni m N, C
m
() è uno spazio vettoriale topologico
localmente convesso, di Hausdor, metrizzabile; in particolare, la topologia
è indipendente dalla scelta della successione di compatti K
n
, e si ha f
n

f in C
m
() se e solo se per ogni compatto K si ha D
f
n
D
f
uniformemente in K per ogni multi-indice N
N
con [[ m. Da noti
teoremi sulla convergenza uniforme segue che C
m
() è uno spazio di Frechèt.
Esempio 1.4.10 Consideriamo lo spazio C
() delle funzioni innitamente

derivabili denite sullaperto non vuoto R
N
. Ovviamente C
()
C
m
() per ogni m N; se vogliamo, come è naturale, che questa immersione
sia continua, occorre mettere su C
() una topologia tale che per ogni

m N e per ogni compatto K gli insiemi
_
_
_
f C
() : sup
K
||m
[D
f[ <
_
_
_
, > 0,
siano -intorni di 0. La meno ne topologia per cui questo accade si può
costruire nel modo seguente: si sceglie una successione strettamente crescente
di compatti K
n
nN
che invada , e si introduce la famiglia numerabile di
seminorme p
mn
m,nN
cos` denite:
p
mn
(f) = sup
Kn
||m
[D
f[.
Poiche, ovviamente, queste seminorme separano gli elementi di C
(), la
topologia da esse generata è localmente convessa e di Hausdor; in particolare
C
() è metrizzabile. Si ha f
n
f in C
() se e solo se per ogni compatto

K e per ogni N
N
si ha D
f
n
D
f uniformemente in K. Si
conclude che C
() è uno spazio di Frechèt immerso con continuità in tutti

gli spazi C
m
().
Esempio 1.4.11 Questo esempio è meno facile ma pi` u importante. Per
m N sia C
m
0
() lo spazio delle funzioni f C
m
() il cui supporto è
compatto nellaperto R
N
. Osserviamo che se K è un ssato compatto
contenuto in , allora il sottospazio C
m
K
(), costituito dalle funzioni di C
m
0
()
che hanno supporto contenuto in K, è uno spazio di Banach con la norma
15
p
m
K
(f) = sup
K
||m
[D
f[;
inoltre, se K e K
sono compatti tali che K K
, limmersione natu-
rale C
m
K
() C
m
K
() è unisometria di C
m
K
() su un sottospazio chiuso di
C
m
K
(). Notiamo poi che, ovviamente,
C
m
0
() =
_
K compatto
C
m
K
().
Introduciamo su C
m
0
() la topologia indotta dalla famiglia di seminorme
costruite nel modo seguente: considerato linsieme c
+
0
delle successioni in-
nitesime di numeri positivi, e ssata una successione crescente di compatti
K
n
nN
tale che K
0
= e
nN
K
n
= , per ogni successione a = a
n
nN

c
+
0
si denisce la seminorma
p
a
(f) = sup
N
sup
x\K
1
a
||m
[D
f(x)[.
Si noti che in eetti, essendo K
0
= , p
a
è una norma. In particolare, la
famiglia p
a
ac
+
0
denisce su C
m
0
() una topologia localmente convessa e
di Hausdor. Il motivo per il quale si considera lintera famiglia p
a
ac
+
0
anziche una singola norma è chiarito dal risultato seguente:
Proposizione 1.4.12 La topologia sopra descritta è la pi` u ne topologia
localmente convessa nello spazio C
m
0
() rispetto alla quale, per ogni compatto
K , limmersione C
m
K
() C
m
0
() è continua.
Dimostrazione Per provare la tesi dobbiamo mostrare che gli intorni del-
lorigine nella topologia sopra denita sono tutti e soli gli insiemi convessi
dotati della proprietà che per ogni compatto K la loro intersezione con
lo spazio C
m
K
() è un intorno convesso dellorigine in C
m
K
().
A questo scopo basta considerare il sistema fondamentale di intorni dellori-
gine della forma V
a
= f C
m
0
() : p
a
(f) < 1. Sia quindi a = a
c
+
0
:
si ha
V
a
=
_
_
_
f C
m
0
() :
||m
[D
f(x)[ < a
x K
, N
_
_
_
,
16
e quindi
V
a
C
m
K
() =
_
f C
m
K
() :
||m
[D
f(x)[ < a
j
x K
j
, j = 0, 1, . . . , 1
_
.
In particolare
f C
m
K
() : p
m
K
(f) < mina
0
, a
1
, . . . , a
1
V
a
C
m
K
(),
cioè V
a
C
m
K
() è un intorno convesso dellorigine in C
m
K
() per ogni N.
Viceversa, sia W C
m
0
() un convesso tale che, per ogni N, WC
m
K
()
sia un intorno dellorigine in C
m
K
(): proviamo che esiste una successione
a c
+
0
tale che W V
a
.
Poiche W C
m
K
+2
() è intorno di 0 in C
m
K
+2
(), risulta
W C
m
K
+2
() f C
m
K
+2
() : p
m
K
+2
(f) <
,
ove =
è un opportuno elemento di c
+
0
. Sia
N
una partizione
dellunità di classe C
m
associata al ricoprimento di costituito dalle corone
aperte
K+2
K
. Scrivendo una generica f C

m
0
() in forma di somma
(necessariamente nita, in realtà)
f =
=0
2
1
(2
+1
f),
dalla convessità di W seguirà f W purche si abbia 2
+1
f W per ogni
N. Osserviamo che per ogni N esiste C
> 0 tale che, per qualsiasi

f C
m
0
(),
sup
\K
||m
[D
f[ a
= sup
2
+1
||m
[D
f)[ C
in virt` u del fatto che
è nulla su K
. Scegliamo la successione a = a
in modo che sia C
<
per ogni N: allora se f V

a
, per ogni N
si ha 2
+1
f C
m
K
+2
() e p
m
K
+2
(2
+1
f) <
, ossia 2
+1
f W. In
denitiva W contiene lintorno V
a
e pertanto è un intorno convesso dellorigine
in C
m
0
(). Ciò prova la tesi.
17
Teorema 1.4.13 Sia un aperto di R
N
, e sia m N. Valgono i seguenti
fatti:
(i) C
m
0
() non è metrizzabile;
(ii) C
m
0
() è uno spazio di Frechèt.
Dimostrazione (i) Basta far vedere che per ogni sottofamiglia numerabi-
le V
a
(n)
nN
del sistema V
a
esiste un intorno V
a
che non contiene alcun
elemento della sottofamiglia. Possiamo supporre che per ogni n N la suc-
cessione a
(n)
= a
(n)

N
sia decrescente e contenuta in ]0, 1[. Per ogni j N
sia
a
j
=
j
n,=0
a
(n)
e poniamo a = a
j
jN
: la successione a è un elemento di c
+
0
e inoltre a
j
<
a
(n)
j
per ogni j N e n j. Sia, per assurdo, V
a
(n) V
a
: se f C
m
0
() ha
supporto contenuto in
Kn+1
K
n
, e se la quantità
C = sup
||m
[D
f[
è sucientemente grande, allora la funzione g =
1
C+1
a
(n)
n
f appartiene a V
a
(n)
ma non a V
a
.
(ii) Sia f
i
iI
un net di Cauchy in C
m
0
(). Allora per ogni successione
innitesima a di numeri positivi esiste i
a
I tale che
||m
[D
f
i
(x) D
f
j
(x)[ < a
x K
, N, i, j i
a
.
Proviamo ora il seguente
Lemma 1.4.14 Se f
i
iI
è un net di Cauchy in C
m
0
(), allora esistono un
compatto K e un indice i
0
I tali che il supporto di tutte le f
i
, per
i i
0
, è contenuto in K.
Dimostrazione Supponiamo, per assurdo, che la tesi del lemma non sia
vera: allora per ogni N
+
e per ogni i I esisteranno una funzione
18
f
j
,i
f
j
ji
e un punto x
,i
K
tali che f
j
,i
(x
,i
) ,= 0. Per ogni i I
W
i
=
_
g C
m
0
() : [g(x
,i
)[ <
1
[f
j
,i
(x
,i
)[ N
+
_
e scegliamo una successione a
(i)
= a
(i)

N
c
+
0
con a
(i)
<
1
[f
j
,i
(x
,i
)[ per
ogni N
+
; allora si ha per ogni i I
V
a
(i) =
_
_
_
g C
m
0
() :
||m
[D
g(x)[ < a
(i)
x K
, N
_
_
_
W
i
.
Dunque, per ogni i I linsieme W
i
è un intorno di 0 e inoltre f
j
,i
/ W
i
per ogni N
+
. Pertanto
f
j
ji
/ W
i
> 0, i I.
Daltra parte, in virt` u dellesercizio 1.4.2, per ogni i I esistono h
i
I e
i
> 0 tali che f
j
W
i
per ogni >
i
e per ogni j h
i
: in altre parole,
f
j
jh
i
W
i
>
i
, i I.
Le ultime due proprietà si contraddicono luna con laltra e ciò prova il lemma.
Dal lemma 1.4.14 segue subito che esistono un compatto K e un indice
i
o
I tali che il net f
i
ii
0
è di Cauchy rispetto alla norma di C
m
K
(),
e quindi converge in tale norma a una funzione f C
m
K
(). Ma allora
f C
m
0
(); inoltre, per ogni successione a
n
c
+
0
si ha denitivamente
rispetto a i
||m
[D
f
i
(x) D
f(x)[ < a
n
x K
n
, n N;
infatti se N è tale che K K
avremo
||m
[D
f
i
(x) D
f(x)[ = 0 < a
n
x K
n
, n , i i
0
,
mentre per n = 0, 1, . . . 1 le condizioni corrispondenti, in numero nito,
saranno soddisfatte denitivamente rispetto a i. Quindi f
i
f in C
m
0
().
19
Esempio 1.4.15 In modo sostanzialmente analogo si prova che lo spazio
C
0
() delle funzioni di classe C
aventi supporto compatto nellaperto

R
N
è uno spazio di Frechèt rispetto alla topologia denita dalla seguente
famiglia di seminorme: ssata una successione di compatti K
n
con K
0
=
e
nN
K
n
= , per ogni successione a c
+
0
e per ogni successione divergente
m = m
N
di interi positivi si pone
p
m,a
(f) = sup
N
sup
x\K
1
a
||m
[D
f(x)[.
Questa topologia è la pi` u ne tra quelle che rendono continue tutte le im-
mersioni C
K
() C
(), ove C
K
() è il sottospazio di C
() formato
dalle funzioni il cui supporto è contenuto nel compatto K . La verica
di queste proprietà è analoga alla dimostrazione della proposizione 1.4.12 e
del teorema 1.4.13.
Gli spazi C
0
() e C
K
() sono anche comunemente denotati con T() e
T
K
().
Esempio 1.4.16 Sia o(R
N
) lo spazio di Schwartz delle funzioni di classe
C
a decrescenza rapida: f o(R

N
) se e solo se
x [x[
k
D
f(x) L
(R
N
) N
N
, k N.
Deniamo in o(R
N
) la famiglia di seminorme
p
m,k
(f) = sup
||m
sup
xR
N
(1 +[x[)
k
[D
f(x)[, m, k N.
`
E chiaro che queste seminorme separano i punti di o(R
N
), e che tale spazio
è localmente convesso e metrizzabile. Si noti che esso è un sottospazio di
C
(R
N
), ma che la sua topologia è strettamente pi` u ne di quella indotta
da C
(R
N
): infatti una successione f
n
o(R
N
) converge a 0 in o(R
N
)
se e solo se le successioni x [x[
k
D
f
n
(x) convergono a 0 uniformemente
in R
N
, qualunque sia k N e N
N
. In particolare tutte le derivate di
f
n
convergono uniformemente a 0 in R
N
e ciò implica immediatamente che
f
n
0 in C
(R
N
).
Proviamo che lo spazio o(R
N
) è completo. Sia f
n
una successione di Cau-
chy in o(R
N
): allora f
n
è anche una successione di Cauchy in C
(R
N
) e
quindi converge in C
(R
N
) a una funzione f C
(R
N
). Dobbiamo provare
20
che f o(R
N
) e che f
n
f in o(R
N
).
Fissiamo m, k N e > 0: esiste un indice =
m,k
N tale che
p
m,k
(f
n
f
h
) n, h ;
scelto h = , ne segue p
m,k
(f
n
) + p
m,k
(f
) = C
m,k
per ogni n , e in
particolare
sup
||m
[D
f
n
(x)[ C
m,k
(1 +[x[)
k
x R
N
, n .
Poiche, in virt` u della convergenza delle f
n
in C
(R
N
), le derivate di f
n
convergono uniformemente sui compatti alle corrispondenti derivate di f, si
deduce che
sup
||m
[D
f(x)[ C
m,k
(1 +[x[)
k
x R
N
e pertanto f o(R
N
). Ma dalla condizione di Cauchy sopra scritta dedu-
ciamo anche
sup
||m
[D
(f
n
f
h
)(x)[ (1 +[x[)
k
x R
N
, n, h ,
e per h ricaviamo facilmente
p
m,k
(f
n
f) < n .
Per larbitrarietà di m e k si ha dunque f
n
f in o(R
N
). Ciò prova che
o(R
N
) è uno spazio di Frechèt.
Esercizi 1.4
1. Un sottoinsieme B di uno spazio vettoriale topologico X si dice limitato
se per ogni intorno U di 0 esiste > 0 tale che B U per ogni > .
Si provi che:
(i) se A e B sono limitati, allora A +B è limitato;
(ii) se A è limitato e t R, allora tA è limitato;
(iii) se A è limitato allora A è limitato.
21
2. Sia X uno spazio vettoriale topologico e sia x
i
iI
un net di Cauchy
contenuto in X.
(i) Si provi che per ogni intorno W di 0 esistono > 0 e i
0
I tali che
x
i
ii
0
W per ogni > .
(ii) Si mostri con un esempio che x
i
iI
non è necessariamente limitato
in X.
[Traccia: per (i) si supponga, come è sempre possibile, che W sia
bilanciato e si determini un altro intorno V di 0 tale che V + V W;
si mostri poi che esiste i
0
I tale che x
i
x
i
0
+ V per ogni i i
0
. Si
scelga adesso s > 1 in modo che x
i
0
sV (esercizio 1.3.4), e si deduca
che x
i
tW per ogni t > s e i i
0
.]
3. Sia X linsieme delle funzioni misurabili f : [0, 1] R, con la topologia
generata dalla famiglia di seminorme p
x
(f) = [f(x)[ al variare di x
[0, 1]. Si provi che f
n
f in X se e solo se f
n
f puntualmente in
[0, 1].
4. Sia (X, ) lo spazio vettoriale topologico denito nellesercizio pre-
cedente, e sia la topologia su X indotta dalla pseudo-metrica
seguente:
d(f, g) =
_
1
0
[f(x) g(x)[
1 +[f(x) g(x)[
dx
(si noti che d non è una distanza, ma denisce una topologia compatibile
con le operazioni dello spazio vettoriale X). Si provi che:
(i) lapplicazione identica i : (X, ) (X, ) trasforma insiemi -
limitati in insiemi -limitati;
(ii) se f
n
nN
X e f
n
0 rispetto a , allora f
n
0 rispetto a ;
(iii) lapplicazione i, tuttavia, non è continua.
Se ne deduca che 0 non ha un sistema fondamentale di intorni nume-
rabile nella topologia e che quindi (X, ) non è metrizzabile.
5. Nello spazio C(R) si considerino le seminorme
p
n
(f) = sup
[n,n]
[f[, n N
+
,
22
e la distanza indotta
d(f, g) =
n=1
2
n
p
n
(f g)
1 +p
n
(f g)
.
Posto f(x) = max0, 1 [x[, g(x) = 100f(x 2) e h(x) =
1
2
(f(x) +
g(x)), si calcolino d(f, 0), d(g, 0) e d(h, 0) e si concluda che la palla di
centro 0 e raggio
1
2
non è convessa, benche lo spazio metrico (C(R), d)
sia localmente convesso.
6. Dimostrare che per p ]0, 1[ lo spazio metrico
p
è completo.
7. Sia x
i
iI
un net in uno spazio topologico X; sia poi
i
iI
un net di
numeri reali tali che [
i
[ K per ogni i I. Si provi che se x
i
0 in
X, allora
i
x
i
0 in X.
8. Sia X uno spazio vettoriale topologico. Si provi che:
(i) se A, B sono sottoinsiemi compatti di X, allora A+B è compatto;
(ii) se A è compatto e B è chiuso, allora A +B è chiuso;
(ii) se A e B sono chiusi, non è detto che A +B sia chiuso.
9. Si provi che i sottoinsiemi compatti di uno spazio vettoriale topologico
sono limitati.
1.5 Operatori lineari e continui
Siano X, Y spazi vettoriali topologici. Descriveremo brevemente alcune pro-
prietà che sono equivalenti alla continuità di un operatore lineare f : X Y .
Anzitutto, è chiaro che f è continuo se e solo se è continuo nel punto 0 X.
Unaltra facile caratterizzazione è fornita dalla seguente
Proposizione 1.5.1 Siano X, Y spazi vettoriali topologici, sia f : X Y
lineare. Allora f è continua se e solo se per ogni net x
i
iI
convergente a 0
in X il net fx
i
iI
converge a 0 in Y .
Dimostrazione (=) Sia U un arbitrario intorno di 0 in Y . Per continuità,
esiste un intorno V di 0 in X tale che f(V ) U. Sia x
i
iI
X un net
convergente a 0 in X: per denizione, esiste i
0
I tale che x
i
V per ogni
23
i I, i i
0
. Dunque, fx
i
U per ogni i I, i i
0
e pertanto il net
fx
i
iI
converge a 0 in Y .
(=) Sia 1 la famiglia degli intorni di 0 X. Se f non fosse continua,
esisterebbe un intorno U di 0 in Y tale che per qualunque V 1 potremmo
trovare x
V
V per cui fx
V
/ U. Ma allora il net x
V
V V
convergerebbe a
0 in X, senza che il net fx
V
V V
converga a 0 in Y , il che contraddirebbe
lipotesi.
Nel caso speciale che f sia lineare da X a R (oppure C), vale la seguente
caratterizzazione:
Teorema 1.5.2 Sia X uno spazio vettoriale topologico e sia f : X C un
funzionale lineare. Sono fatti equivalenti:
(i) f è continuo;
(ii) ker f (il nucleo di f) è chiuso in X;
(iii) esiste un intorno U di 0 in X tale che f[
U
è limitato, ossia esiste
M > 0 tale che [fx[ < M per ogni x U.
Dimostrazione (i)= (ii) ker f è limmagine inversa del chiuso 0 C,
e quindi è chiuso in X perche f è continua.
(ii)= (iii) Se f 0, la tesi è evidente. Altrimenti, deve essere ker f ,= X,
quindi A = (ker f)
c
è un aperto non vuoto. Scelto x A, sia U un intorno
di 0 in X tale che x + U A; possiamo supporre che U sia bilanciato
(osservazione 1.3.2). Allora si ha
f(U) =
_
||1
f(U) =
_
||1
f(U),
quindi f(U), essendo bilanciato in C, è un disco di centro 0. Dunque f(U) è
un disco limitato, oppure f(U) è tutto C. Se, per assurdo, fosse f(U) = C,
esisterebbe y U tale che fy = fx, ossia x+y ker f; ma ciò è impossibile
perche x +y x +U A.
(iii)= (i) Sia [fx[ < M per ogni x U, con U intorno di 0 in X. Allora,
ssato > 0, linsieme W =

M
U è intorno di 0 (in quanto lapplicazione
x x è un omeomorsmo), e si ha [fx[ < per ogni x W. Ciò prova
che f è continua in 0.
Nel caso in cui le topologie negli spazi X, Y siano generate da seminorme, la
24
continuità di un operatore lineare si può descrivere in un modo particolar-
mente comodo, che generalizza la nozione di limitatezza per operatori lineari
fra spazi normati.
Teorema 1.5.3 Siano X, Y spazi vettoriali topologici, con topologie generate
dalle famiglie di seminorme p
i
iI
e q
j
jJ
rispettivamente. Sia f : X Y
un operatore lineare; allora f è continuo se e solo se per ogni j J esistono
K
j
> 0, n
j
N
+
e i
1
, . . . , i
n
j
I tali che
q
j
(fx) K
j
max
1hn
j
p
i
h
(x) x X.
Dimostrazione (=) Per ipotesi, per ogni ssato j J esistono K
j
> 0,
n
j
N
+
e i
1
, . . . , i
n
j
I per i quali
q
j
(fx) K
j
max
1hn
j
p
i
h
(x) x X.
Sia > 0. Sia U un intorno di 0 Y , che sarà della forma
U = U
j
1
,...,jm,
=
m
s=1
q
1
js
([0, [),
e consideriamo linsieme
V = x X : p
i
h
(x) <

K
js
, h = 1, . . . , n
js
, s = 1, . . . , m,
il quale è un intorno di 0 X. Allora la disuguaglianza precedente mostra
che fx U per ogni x V . Quindi f è continuo nel punto 0 X.
(=) Siano > 0, j J ed U = q
1
j
([0, [). Poiche f è continua, esiste un
intorno W di 0 tale che f(W) U, ossia esistono > 0 e i
1
, . . . , i
n
I tali
che
x X, max
1hn
p
i
h
(x) < = q
j
(fx) < .
Sia ora z X e poniamo
w =

max
1hn
p
i
h
(z) +
z,
dove è un arbitrario numero positivo (questo numero serve a dar senso
alla frazione nel caso che si abbia p
i
h
(z) = 0 per h = 1, . . . , n). Allora
p
i
h
(w) =

max
1hn
p
i
h
(z) +
p
i
h
(z);
25
quindi
max
1hn
p
i
h
(w) < ,
da cui
q
j
(fw) < ,
ossia
q
j
(fz) =
max
1hn
p
i
h
(z) +
q
j
(fw) <

_
max
1hn
p
i
h
(z) +
_
.
Questa relazione vale per ogni > 0; ne segue la tesi prendendo n
j
= n e
K
j
=

.
Quando X e Y sono spazi normati, la continuità di un operatore f : X Y
equivale alla sua limitatezza; una condizione analoga (ma non identica!) vale
anche nel caso di due spazi vettoriali topologici: ricordiamo che la nozione di
sottoinsieme limitato in uno spazio vettoriale topologico è stata introdotta
nellesercizio 1.4.1.
Proposizione 1.5.4 Siano X, Y spazi vettoriali topologici, sia f : X Y
un operatore lineare. Se f è continuo, allora f è limitato, ossia trasforma
insiemi limitati di X in insiemi limitati di Y .
Si noti che il viceversa di questa implicazione è falso (esercizio 1.4.4), ma è
vero sotto opportune ipotesi di metrizzabilità (esercizio 1.5.1).
Dimostrazione Sia U un intorno di 0 Y : per continuità, esiste un intorno
V di 0 X tale che f(V ) U. Sia E limitato in X: per denizione esiste
> 0 tale che E V per ogni > ; ne segue
f(E) f(V ) = f(V ) U > .
Per larbitrarietà di U, f(E) è limitato.
Consideriamo ora lo spazio vettoriale dei funzionali lineari e continui su uno
spazio vettoriale topologico.
Denizione 1.5.5 Il duale di uno spazio vettoriale topologico (X, ) è lo
spazio vettoriale X
dei funzionali lineari e continui su X, ossia degli opera-

tori lineari e continui da X in R (oppure da X in C).
26
Si noti che la continuità di un operatore lineare su X dipende dalla topologia
, quindi X
dipende a sua volta da e dovremmo denotarlo con X
; tuttavia
se si pensa ssata, la notazione X
non si presta ad equivoci.

Di per se, X
è uno spazio vettoriale privo di una propria topologia naturale

(salvo che nel caso in cui X sia uno spazio normato). I sottoinsiemi di X
determinano altre topologie su X, diverse da : infatti si osserva anzitutto

che ogni applicazione lineare : X C individua su X la seminorma
p
(x) = [x[, x X; di conseguenza, ssato un arbitrario sottoinsieme B di

X
, la topologia indotta da B su X è la topologia generata dalla famiglia di

seminorme p
B
e si indica con (X, B). In particolare, quando B = X
si ha la topologia debole su X, cioè (X, X
), che viene spesso denotata con

w (benche dipenda anche, attraverso X e X
, da ); essa verrà ampiamente

descritta nel paragrafo che segue.
Si possono denire in modo analogo svariate topologie su X
che lo rendono
uno spazio vettoriale topologico localmente convesso: infatti per ogni x X
la funzione q
x
() = [x[, X
, è una seminorma su X
; quindi, ssato un
sottoinsieme D di X, la famiglia di seminorme q
x
xD
genera una topologia
su X
. che si denota con (X
, D). In particolare è importante la topologia

debole* (X
, X) (si legge debole-star), che si ottiene scegliendo D = X,

e che verrà analizzata nel prossimo paragrafo.
Unaltra importante topologia su X
è la topologia forte, che è generata dalla

pi` u ricca famiglia di seminorme p
A
AA
denite da
p
A
(f) = sup
xA
[fx[ f X
,
ove / è la famiglia dei sottoinsiemi limitati di X. Queste seminorme sono
ben denite in virt` u della proposizione 1.5.4.
Ovviamente, la topologia forte è pi` u ne di quella debole*; in particolare,
allorche X è uno spazio di Banach la topologia forte è quella indotta dalla
norma di X
.
Esempio 1.5.6 Consideriamo lo spazio C
0
(), altrimenti detto T(), in-
trodotto nellesempio 1.4.15. Il suo duale si denota con T
() e gli elementi
del duale si chiamano distribuzioni su . Dalla denizione delle seminorme
p
m,a
è facile dimostrare (esercizio 1.5.3) che un funzionale lineare T denito
su T() è una distribuzione se e solo se per ogni compatto K esistono
due costanti C > 0 e m N tali che
[Tf[ C
||m
sup
xK
[D
f(x)[ f T
K
().
27
Nel caso = R
N
, lo spazio T(R
N
) è immerso con continuità nello spazio di
Schwartz o(R
N
) introdotto nellesempio 1.4.16; dunque il duale dello spazio
di Schwartz, che si denota con o
(R
N
), è immerso con continuità in T
(R
N
).
Gli elementi di o
(R
N
) si dicono distribuzioni temperate.
Esercizi 1.5
1. Siano X, Y spazi vettoriali topologici e supponiamo che X sia metriz-
zabile, con distanza d tale che d(kx, 0) k d(x, 0) per ogni k N e
per ogni x X. Sia inoltre f : X Y unapplicazione lineare che
trasforma insiemi limitati di X in insiemi limitati di Y . Si provino i
seguenti fatti:
(i) se x
n
nN
X e x
n
0 in X, allora fx
n
nN
è limitata in Y ;
(ii) se x
n
nN
X e x
n
0 in X, allora esiste
n
nN
]0, [ tale
che
n
e
n
x
n
0 in X;
(iii) se x
n
nN
X e x
n
0 in X, allora fx
n
0 in Y ;
(iv) f è continua.
2. Sullo spazio vettoriale X = C[0, 1] deniamo il seguente sistema fon-
damentale di intorni di 0:
V
n,k
=
_
f X : m
_
x [0, 1] : [f(x)[ <
1
n
_
1
1
k
_
, n, k N
+
,
ove m è la misura di Lebesgue.
(i) Si verichi che X è uno spazio vettoriale topologico metrizzabile.
(ii) Si mostri che X
= 0, ossia lunico funzionale lineare e continuo

su X è quello identicamente nullo.
[Traccia: per (ii), ssato F X
, si determini un V
n,k
tale che [F(f)[ <
1 per ogni f V
n,k
. Quindi si utilizzi una partizione dellunità con
funzioni
j
aventi supporto in intervalli di ampiezza minore di
1
k
, e si
osservi che per ogni f X e R si ha
j
f V
n,k
. Si mostri inne
che F(f) = 0 sfruttando larbitrarietà di .]
28
3. Si provi che un funzionale lineare T : T() C è una distribuzione se
e solo se per ogni compatto K esistono C > 0 e m N tali che
[Tf[ C
||m
sup
xK
[D
f(x)[ f T
K
().
1.6 Topologie deboli
In uno spazio vettoriale topologico (X, ), come abbiamo visto, è possibile
denire, accanto alla sua topologia naturale, unaltra topologia meno ne: la
topologia debole. Questo paragrafo è dedicato alla descrizione delle sue nu-
merose proprietà, che hanno particolare rilevanza, sia teorica che applicativa,
nel caso speciale in cui X è uno spazio di Banach.
Denizione 1.6.1 Sia X uno spazio vettoriale topologico. Si chiama topo-
logia debole su X la topologia generata dalla famiglia di seminorme p
cos` denite:
p
(x) = [x[ x X.
La topologia debole si denota con i simboli w (weak) oppure (X, X
).
Dunque un sistema fondamentale di w-intorni di 0 è dato dagli insiemi della
forma
V
1
,...,n,
= x X : [
i
x[ , i = 1, . . . , n,
al variare di n N
+
, > 0 e
1
, . . . ,
n
X
. Ripetiamo ancora che la

topologia debole dipende dalla topologia originaria di cui è dotato X at-
traverso la scelta dei funzionali di X
: cambiando cambia lo spazio X
dei
funzionali lineari -continui.
Dalla denizione segue che la topologia debole w è la meno ne topologia su
X che rende continui tutti i funzionali X
; poiche tutti gli elementi di

X
sono continui per la topologia naturale di X, la topologia debole è meno

ne di questultima. Tuttavia, se X ha dimensione nita le due topologie
coincidono (esercizio 1.6.7). In particolare, ogni insieme debolmente chiuso
(cioè chiuso rispetto a w) è chiuso, mentre il viceversa non è vero in generale.
Ad esempio, nello spazio di Banach
2
linsieme = x
2
: |x|
2
= 1
è chiuso ma non debolmente chiuso: infatti, ricordando che la successione
e
(n)
nN
è contenuta in e converge debolmente a 0 in
2
, si deduce che 0
appartiene alla chiusura debole di perche ogni suo w-intorno della forma
V
1
,...,p,
contiene necessariamente qualcuno degli e
(n)
.
29
Se X è uno spazio normato, da un noto corollario del teorema di Hahn-
Banach segue che per ogni x X 0 esiste X
tale che (x) ,= 0;

quindi la topologia debole rende X uno spazio vettoriale topologico local-
mente convesso e di Hausdor. Se in particolare X è uno spazio di Banach
riessivo, allora (X, w) è completo (esercizio 1.6.4). In generale, 0 non ha un
sistema fondamentale di intorni numerabile e lo spazio (X, w) non è metriz-
zabile: si veda a questo proposito lesercizio 1.6.15.
Il duale X
di uno spazio vettoriale topologico X è esso stesso uno spazio

vettoriale topologico (localmente convesso) con una delle due topologie (de-
bole* e forte) introdotte alla ne del paragrafo precedente. La denizione di
topologia debole si applica ovviamente anche al caso di X
: è quella generata
dalle seminorme p
X
cos` denite:
p
() = [[ X
.
Naturalmente, lo spazio X
cambia a seconda che si scelga di mettere su X
la topologia forte, oppure la topologia debole* (o altre ancora di cui non ci

occuperemo). Richiamiamo la denizione di topologia debole*:
Denizione 1.6.2 Sia X uno spazio vettoriale topologico, sia X
il suo dua-
le. Si chiama topologia debole* su X
la topologia generata dalla famiglia di

seminorme p
x
xX
cos` denite:
p
x
() = [x[ X
.
La topologia debole* si denota con i simboli w
oppure (X
, X).
Un sistema fondamentale di w
-intorni di 0 è fatto dagli insiemi della forma

V
x
1
,...,xn,
= X
: [x
i
[ , i = 1, . . . , n.
Dato che, ovviamente, per ogni X
0 esiste x X tale che x ,= 0,

le seminorme p
x
separano i punti di X
e dunque (X
, w
) è uno spazio
vettoriale topologico localmente convesso e di Hausdor. Se in particolare X
è uno spazio di Banach, lo spazio (X
, w
) è anche completo (esercizio 1.6.4).

Quando X è uno spazio di Banach, ricordando come è denita limmersione
canonica J : X X
, possiamo scrivere le seminorme che generano la

topologia (X
, X) nel modo seguente:

p
x
() = [x[ = [J
x
[ X
.
30
Quindi, la topologia debole* (X
, X) è la meno ne topologia su X
che
rende continui tutti i funzionali J
x
J(X), mentre, per denizione, tutti gli
elementi di X
sono continui su X
per la topologia (X
, X
) (la topo-
logia debole relativa alla topologia indotta dalla norma di X
). Ne segue
che su X
la topologia debole* (X
, X) è meno ne della topologia debole

(X
, X
), che a sua volta è meno ne di quella indotta dalla norma di X
.
Le due topologie deboli su X
coincidono se e solo se J(X) = X
, ossia se
e solo se X è riessivo.
Come si è già osservato, le topologie deboli in spazi normati sono impor-
tanti perche permettono di ottenere buoni teoremi di compattezza. Ne de-
scriveremo adesso i principali, insieme ad alcuni risultati di metrizzabilità
strettamente collegati.
Teorema 1.6.3 (di Banach-Alaoglu) Sia X uno spazio normato e sia B
la palla unitaria chiusa di X
. Allora B
è compatta nella topologia debole*

(X
, X).
Dimostrazione Per ogni x X denotiamo con I
x
lintervallo chiuso reale
[|x|
X
, |x|
X
]. Consideriamo il prodotto cartesiano
P =
xX
I
x
,
munito della topologia prodotto . Allora P, essendo prodotto di compatti,
è -compatto; denotando i suoi elementi con f(x)
xX
, possiamo descrivere
tale insieme nel modo seguente:
P = f : X C : [f(x)[ |x|
X
x X.
Poiche B
P X
, B
eredita due topologie indotte, una da (X
, w
) e
una da (P, ). Proveremo che:
(a) B
è chiuso in (P, ),
(b) w
coincide con su B
.
Da (a) seguirà che B
è -compatto, e da (b) dedurremo che B
è w
-
compatto, ossia la tesi.
Proviamo dapprima (b). Siano n N
+
, x
1
, . . . , x
n
X,
1
, . . . ,
n
> 0 e
g
0
B
: consideriamo i due insiemi

W
1
= g X
: [gx
i
g
0
x
i
[ <
i
, i = 1, . . . , n,
31
W
2
= f P : [f(x
i
) g
0
x
i
[ <
i
, i = 1, . . . , n;
W
1
e W
2
sono generici intorni di g
0
nelle topologie w
e rispettivamente.
Dato che, banalmente, W
1
B
= W
2
B
, la proprietà (b) è provata.

Proviamo adesso (a). Sia f
0
un elemento della chiusura di B
in (P, ):
proveremo che f
0
: X C è lineare. Dati x, y X, , C ed > 0,
linsieme
U = f P : [f(x) f
0
(x)[ < , [f(y) f
0
(y)[ < ,
[f(x +y) f
0
(x +y)[ <
è intorno di f
0
in (P, ). Poiche f
0
è -aderente a B
, esiste f B
U.
Usando la linearità di f, ne segue
[f
0
(x +y) f
0
(x) f
0
(y)[ =
= [(f
0
f)(x +y) (f
0
f)(x) (f
0
f)(y)[ <
< (1 +[[ +[[),
e per larbitrarietà di otteniamo che f
0
è lineare.
Resta da far vedere che f
0
B
: ssati > 0 e x X con |x|

X
1, sia
V = g P : [g(x) f
0
x[ < .
Dato che V è un -intorno di f
0
, esiste g B
V ; dunque si ha
[f
0
x[ [f
0
x gx[ +[gx[ < +|x|
X
+ 1,
e per larbitrarietà di , ricaviamo
[f
0
x[ 1 x X con |x|
X
1.
Si conclude che f
0
B
, e ciò prova (a).

Teorema 1.6.4 (di Eberlein-Smulyan) Sia X uno spazio di Banach ri-
essivo, e sia B la palla unitaria chiusa di X. Allora B è compatta nella
topologia debole (X, X
).
Dimostrazione Sia U
i
iI
un ricoprimento w-aperto di B: per ogni i I
e per ogni x U
i
esiste un w-intorno V di x, della forma
V = y X : [
i
(x y)[ < , i = 1, . . . , k,
32
che è contenuto in U
i
. Applichiamo limmersione canonica J : X X
, che
per ipotesi è unisometria bigettiva: otteniamo che per ogni i I e per ogni
J
x
J(U
i
) linsieme
J(V ) = J
y
X
: [J
x
i
J
y
i
[ < , i = 1, . . . , k
è contenuto in J(U
i
). Ma J(V ) è un intorno di J
x
nella topologia debole*
su X
, e dunque J(U
i
)
iI
è un ricoprimento w
-aperto di J(B), cioè della

palla unitaria chiusa di X
. Per il teorema di Banach-Alaoglu (teorema

1.6.3), J(B) è w
-compatta in X
, quindi esiste un sottoricoprimento nito

J(U
i
h
)
1hm
di J(B). Di conseguenza, U
i
h
1hm
è un sottoricoprimento
nito di B, estratto dal ricoprimento w-aperto originale U
i
iI
. Pertanto B
è w-compatta.
Corollario 1.6.5 Sia X uno spazio normato. Allora:
(i) i limitati di X
sono debolmente* relativamente compatti;

(ii) se X è uno spazio di Banach riessivo, allora i limitati di X sono
debolmente relativamente compatti.
Dimostrazione Basta osservare che ogni limitato è incluso in una palla
chiusa, ed applicare i due teoremi precedenti.
La topologia debole su uno spazio normato non è metrizzabile in generale,
come abbiamo visto (esercizio 1.6.15); però vale il seguente risultato:
Teorema 1.6.6 Sia X uno spazio normato e sia B
la palla unitaria chiusa

di X
. Allora X è separabile se e solo se la topologia indotta su B
dalla
topologia debole* di X
è metrizzabile.
Dimostrazione (=) Sia X separabile: ssata una successione x
n
nN
densa nella palla unitaria B di X, poniamo
d(f, g) =
n=0
2
n
[fx
n
gx
n
[, f, g B
.
`
E chiaro che d è una distanza su B
e che è invariante per traslazioni. Quindi

per provare la tesi sarà suciente mostrare che:
(a) ogni palla Q
= f B
: d(f, 0) < contiene B
U, ove U è un
opportuno intorno di 0 in (X
, X);
33
(b) ogni intorno U di 0 in (X
, X) contiene una palla Q
, con opportuno.
Proviamo (a): ssato un arbitrario > 0, sia N N tale che 2
N
<

4
.
Scegliamo
U =
_
f X
: [fx
k
[ <

4
, k = 0, . . . , N 1
_
;
allora se f B
U si ha
d(f, 0) =
N1
n=0
2
n
[fx
n
[ +
n=N
2
n
[fx
n
[ <

4
N1
n=0
2
n
+
n=N
2
n
|f|
X
< ,
cioè f Q
. Quindi B
U Q
.
Proviamo (b): ssati > 0 e y
1
, . . . , y
m
X 0, poniamo
U = f X
: [fy
i
[ < , i = 1, . . . , m
e cerchiamo Q
tale che Q
U. Poiche x
n
nN
è densa in B, esistono
n
1
, . . . , n
m
N tali che
_
_
_
_
y
i
|y
i
|
X
x
n
i
_
_
_
_
X
<

2K
per i = 1, . . . , m, ove K = max
1im
|y
i
|
X
.
Siano N = max
1im
n
i
ed =
2
N
2K
; si ha per ogni f Q
e per ogni
i = 1, . . . , m
2
n
i
[fx
n
i
[ d(f, 0) < ,
da cui
[fx
n
i
[ < 2
n
i
2
N
<

2K
.
Pertanto per ogni i = 1, . . . , m si ha, ricordando che |f|
X
= 1,
[fy
i
[
|y
i
|
X
f
_
y
i
|y
i
|
X
x
n
i
_
+[fx
n
i
[ <

2K
+

2K
=

K
ed inne
[fy
i
[ <

K
|y
i
|
X
, i = 1, . . . , m.
Ci` o prova che f U, ossia Q
U.
(=) Supponiamo che (B
, w
) sia metrizzabile; allora 0 ha un sistema

34
fondamentale di intorni numerabile U
n
nN
, e si può supporre che tali U
n
siano della forma
U
n
= B
: [x[ <
n
x A
n
,
ove A
n
è un sottoinsieme nito di X. Poniamo A =
nN
A
n
: dato che
A è numerabile, il sottospazio chiuso X
0
X generato da A è separabile.
Supponiamo ora che esista x X X
0
: per un corollario del teorema di
Hahn-Banach, vi è un funzionale X
, di norma unitaria, tale che x ,= 0

e z = 0 per ogni z X
0
. Ciò signica che U
n
per ogni n N, e questo
implica che 0, contraddicendo il fatto che x ,= 0. Pertanto deve essere
X
0
= X e dunque X è separabile.
Unanaloga proprietà di metrizzabilità vale negli spazi di Banach che hanno
duale separabile.
Teorema 1.6.7 Sia X uno spazio di Banach e sia B la palla unitaria chiusa
di X. Allora X
è separabile se e solo se la topologia indotta su B dalla

topologia debole di X è metrizzabile.
Dimostrazione (=) Sia X
separabile: allora è noto che anche X è sepa-

rabile; dunque, per il teorema precedente, la palla unitaria B
di X
, munita
della topologia debole*, è metrizzabile. Inoltre B
è w
-compatta in virt` u
del teorema di Banach-Alaoglu. Perciò, dato che gli spazi metrici compatti
sono separabili, (B
, w
) è separabile. Sia f
n
nN
+ una successione densa in
(B
, w
), e deniamo la distanza
d(x, y) =
n=1
2
n
[f
n
(x y)[, x, y B.
Proviamo che lo spazio metrico (B, d) coincide con lo spazio (B, w).
Sia i : (B, w) (B, d) lidentità: essa è continua, poiche ssata arbitraria-
mente una palla B(x
0
, ), esiste N
N tale che per il w-intorno

V = x B : [f
n
(x x
0
)[ < /2 , n N
risulta per ogni x V

d(x, x
0
)
nN
2
n
[f
n
(x y)[ +
n>N
2
n
<
nN
2
n
/2 +/2 < .
35
Dunque lapplicazione i è biunivoca e continua dallo spazio compatto (B, w)
nello spazio di Hausdor (B, d): dunque è un omeomorsmo, e in particolare
(B, d) = (B, w).
(=) Proviamo anzitutto due lemmi.
Lemma 1.6.8 Sia X uno spazio vettoriale e siano g, f
1
, . . . , f
m
: X C
funzionali lineari. Risulta
m
i=1
ker f
i
ker g se e solo se esistono
1
, . . . ,
m

C tali che g =
m
i=1
i
f
i
.
Dimostrazione (=) Evidente.
(=) Sia F loperatore lineare da X in C
m
dato da Fx = (f
1
x, . . . , f
m
x), e
deniamo h : R(F) C nel modo seguente:
h(z) = gx z = Fx R(F).
Questa denizione è ben posta perche se z = Fx = Fy si ha xy ker F =
m
i=1
ker f
i
e quindi, per ipotesi, gx = gy. Per il teorema di Riesz, applicato
allo spazio di Hilbert R(F), esiste un unico elemento v R(F) tale che
hz = z v per ogni z R(F). Ne segue che il funzionale H : C
m
C,
Hz = z v per ogni z C
m
, estende h. In particolare, allora,
gx = h(Fx) = H(Fx) = Fx v =
m
i=1
f
i
x v
i
x X,
ovvero si ha la tesi con
i
= v
i
.
Lemma 1.6.9 Sia X uno spazio di Banach e sia B la palla unitaria chiusa di
X. Detta J : X X
limmersione canonica, linsieme J(B) è (X
, X
)-
denso nella palla unitaria chiusa B
di X
.
Dimostrazione Sia, per assurdo, B
J(B)
w
, ove J(B)
w
è la chiusura
di J(B) rispetto a (X
, X
). Esiste allora, per il teorema di Hahn-Banach,

un funzionale f : X
C lineare e (X
, X
)-continuo tale che

f ,= 0, f = 0 J(B)
w
.
Dimostriamo che esiste X
tale che
f = X
,
36
ovvero, in altri termini, proviamo che esiste X
tale che f = J
, es-
sendo J
limmersione canonica di X
nel proprio biduale. Ciò implicherà

0 = fJ
x
= J
x
= x per ogni x B, e quindi per linearità dedurremo = 0;
ma questo è assurdo essendo = f ,= 0.
Per provare lasserzione osserviamo che, essendo f (X
, X
)-continua, esi-
ste un intorno di 0 X
della forma U = X
: [
i
[ < , i =
1, . . . , m tale che [f[ < 1 per ogni U. Adesso, se
m
i=1
ker J
i
, os-
sia
i
= 0 per i = 1, . . . m, allora per ogni k N si ha k[f[ = [f(k)[ < 1,
da cui f = 0: ciò mostra che
m
i=1
ker J
i
ker f. Ne segue, per il lemma
1.6.8, che esistono
1
, . . . ,
m
C tali che f =
m
i=1
i
J
i
. Dunque, posto
=
m
i=1
i
, abbiamo provato che f = J
, ossia lasserzione sopra scritta.

Ci` o conclude la dimostrazione del lemma.
Dimostriamo la seconda implicazione del teorema. Sia (B, w) metrizzabi-
le: allora la topologia w ha come base dintorni di 0 la famiglia numerabile
U
n
nN
, con
U
n
= x X : [x[ <
n
A
n
,
ove
n
> 0 e A
n
è un sottoinsieme nito di X
. Il sottospazio chiuso X
generato dallunione degli A

n
è separabile: vogliamo provare che X
= X
, e
che pertanto X
è separabile.
Supponiamo per assurdo che esista X
: allora
d = inf
X
| |
X
> 0.
Per uno dei corollari del teorema di Hahn-Banach, esiste X
tale che
||
X
=
1
d
, = 1, [
X
= 0.
Consideriamo linsieme U = x B : [x[ < d/2, che è un w-intorno di 0
in B: esiste allora n N tale che V U
n
. Gli insiemi
V
n
= X
: [[ <
n
A
n
, V = X
: [[ < d/2
sono (X
, X
)-intorni di 0 X
. Poiche d B
, per il lemma 1.6.9

esiste x
1
B tale che J
x
1
d V
n
V , ossia
[x
1
[ = [d J
x
1
[ <
n
A
n
, [d x
1
[ = [d J
x
1
[ < d/2 .
Ma allora [x
1
[ > d/2: dunque si ha x
1
U
n
V , il che è assurdo essendo
U
n
V . Ne segue X
= X
e dunque la tesi.
37
Proviamo inne il seguente risultato, che va confrontato con quello delleser-
cizio 1.6.14:
Teorema 1.6.10 Sia X uno spazio normato con X
separabile, e sia M
X un insieme limitato. Allora la chiusura debole di M coincide con la
chiusura debole sequenziale di M, cioè con linsieme
M
s
= x X : x
n
M : x
n
x.
Dimostrazione
`
E facile vericare che M
s
è contenuto nella chiusura debole
di M. Per provare linclusione opposta faremo uso del seguente
Lemma 1.6.11 Sia X uno spazio normato, sia M X limitato e sia u X
un elemento della chiusura debole di M. Allora esiste un sottoinsieme al pi` u
numerabile M
0
M tale che u appartiene alla chiusura debole di M
0
.
Dimostrazione Sia B
la palla unitaria chiusa di X
e sia
B
n
= B
(n volte).
Per m, n N
+
e f = (f
1
, . . . , f
n
) B
n
consideriamo il w-intorno
U
m,n,f
(u) =
_
v X : [f
j
(v u)[ <
1
m
, j = 1, . . . , n
_
.
Per ipotesi, per ogni m, n N
+
e f B
n
esiste v M tale che v U
m,n,f
(u).
Riscriviamo questa aermazione in modo diverso: per ogni m, n N
+
e
v M sia
W
m,n,v
= f B
n
: v U
m,n,f
(u);
allora possiamo dire che per ogni m, n N
+
linsieme B
n
è ricoperto dalla
famiglia W
m,n,v
vM
.
Ora osserviamo che i W
m,n,v
sono aperti in B
n
per la topologia indotta dalla
topologia debole* di (X
)
n
; infatti se f W
m,n,v
linsieme
_
g B
n
: [f
i
(u v) g
i
(u v)[ <
1
m
max
1jn
[f
j
(u v)[, i = 1, . . . , n
_
è un intorno di f in tale topologia che è contenuto in W
m,n,v
. Poiche, per il
teorema di Banach-Alaoglu (teorema 1.6.3), B
è debolmente* compatto in
38
X
, anche B
n
è debolmente* compatto in (X
)
n
. Quindi esiste una sotto-
famiglia nita di W
m,n,v
vM
che è ancora un ricoprimento di B
n
: in altre
parole, esiste un sottoinsieme nito S
m,n
M tale che
f = (f
1
, . . . , f
n
) B
n
v S
m,n
: [f
j
(v u)[ <
1
m
per j = 1, . . . , n.
Posto M
0
=
m,nN
+
S
m,n
, M
0
è numerabile; essendo contenuto in M, è
anche limitato in X. Per denizione di M
0
, per ogni f B
n
esiste v M
0
tale che v U
m,n,f
(u): dunque u appartiene alla chiusura debole di M
0
.
Riprendiamo la dimostrazione del teorema 1.6.10. Sia u X un elemento
della chiusura debole di M in X. Sia M
0
il sottoinsieme numerabile di M
determinato dal lemma 1.6.11: dunque u appartiene alla chiusura debole
di M
0
in X. Poiche M
0
è limitato, esiste una palla chiusa B
R
di X, di
raggio R opportuno, tale che M
0
B
R
. Essendo X
separabile per ipotesi,

per il teorema 1.6.7 la topologia debole su B
R
è indotta da una distanza.
Poiche negli spazi metrici la chiusura di un insieme coincide con la chiusura
sequenziale, deduciamo che u appartiene alla chiusura debole sequenziale di
M
0
, da cui in particolare la tesi.
Esercizi 1.6
1. Sia X uno spazio vettoriale topologico, sia : X C lineare. Si provi
che X
se e solo se è w-continua.
2. Sia X uno spazio normato, sia : X
C lineare. Si provi che

X
se e solo se è w-continua (ove w è la topologia debole su

X
), e che J(X) se e solo se è w
-continua.
3. Per ogni t [a, b] sia F
t
: C[a, b] R denito da F
t
(f) = f(t) per ogni
f C[a, b]. Si provi che lapplicazione t F
t
è continua da [a, b] in
((C[a, b])
, w
).
4. Sia X uno spazio di Banach. Si provi che:
(i) (X
, w
) è uno spazio vettoriale topologico completo;

(ii) se lo spazio X è riessivo, allora anche (X, w) è uno spazio vetto-
riale topologico completo.
39
5. Si provi che se X è lo spazio normato (c
00
, | |
2), allora (X
, w
) è uno
spazio vettoriale topologico non completo.
[Traccia: si considerino i funzionali T
k
: c
00
R deniti da T
k
x =
k
j=0
jx
j
. . . ]
6. Si provi che se X è lo spazio normato (c
0
, | |
), allora (X, w) è uno

spazio vettoriale topologico non completo.
[Traccia: ssato x
c
0
, si consideri la successione x
(n)
ove
x
(n)
= x
0
, x
1
, . . . , x
n1
, x
n
, 0, 0, . . .. . . ]
7. Sia X uno spazio normato. Si provi che la topologia debole di X
coincide con quella indotta dalla norma se e solo se X ha dimensione
nita.
8. Sia X uno spazio normato, sia E un sottoinsieme di X. Si provi che E
è limitato in X se e solo se E è w-limitato.
9. Sia X uno spazio normato, sia F un sottoinsieme di X
. Si provi che
F è limitato in X
se e solo se F è w
-limitato.
10. Sia X uno spazio normato e sia B la palla unitaria chiusa di X. Si
provi che J(B) è w
-denso nella palla unitaria chiusa B
di X
(qui
w
è la topologia debole* di X
).
Traccia: Sia B
e sia V = X
: [[ < : si osservi
che [||
X
, ||
X
] e che (B) ] ||
X
, ||
X
[, e si deduca
che esiste x B tale che J
x
V .]
11. Si provi che C[a, b] è w
-denso in L
(a, b).
12. Si provi che la palla unitaria chiusa di c
0
non è w-compatta.
13. Sia (X, ) uno spazio vettoriale topologico. Se lorigine ha un sistema
fondamentale di intorni numerabile, si provi che per ogni sottoinsieme
E X la chiusura debole di E e la chiusura debole sequenziale di E
coincidono.
14. Siano X =
2
e E = e
(m)
+ me
(n)
: m, n N, m n. Si dimostri
che:
(i) la chiusura debole sequenziale di E è E e
(m)
mN
;
(ii) la chiusura debole di E contiene anche 0.
40
15. Si provi che nello spazio vettoriale topologico (
2
, w) lorigine non ha un
sistema fondamantale di intorni numerabile; se ne deduca che (
2
, w)
non è metrizzabile.
16. Sia (X, ) uno spazio vettoriale topologico. Denotando con X
w
lo spazio
vettoriale X dotato della topologia debole relativa a , si provi che
(X
w
)
w
= X
w
, cioè che la topologia debole relativa alla topologia debole
coincide con questa.
1.7 Separazione di insiemi convessi
Iniziamo il paragrafo con lestensione agli spazi vettoriali topologici del teo-
rema di Hahn-Banach. Di questo risultato fondamentale conosciamo una
versione inutilmente restrittiva, in cui lambiente è uno spazio normato. In
eetti, senza cambiare una virgola della dimostrazione relativa a quel caso,
si prova il seguente enunciato pi` u generale:
Teorema 1.7.1 (di Hahn-Banach, caso reale) Sia X uno spazio vetto-
riale reale, sia p : X R una funzione subadditiva e positivamente omogenea
(ossia, tale che p(x) = p(x) e p(x + y) p(x) + p(y) per ogni > 0 e
x, y X); siano poi M un sottospazio di X e f : M R un funzionale li-
neare tale che fx p(x) per ogni x M. Allora esiste un funzionale lineare
F : X R tale che F[
M
= f e Fx p(x) per ogni x X.
Se X è uno spazio vettoriale complesso, il teorema di Hahn-Banach vale nella
forma seguente:
Teorema 1.7.2 (di Hahn-Banach, caso complesso) Sia X uno spazio
vettoriale complesso, sia p : X R una funzione subadditiva e positivamente
omogenea; siano poi M un sottospazio di X e f : M C un funzionale
lineare tale che Re fx p(x) per ogni x M. Allora esiste un funzionale
lineare F : X C tale che F[
M
= f e Re Fx p(x) per ogni x X.
Dimostrazione Ci ricondurremo alla dimostrazione del caso reale mediante
le seguenti osservazioni di immediata verica. Se F : X C è un funzionale
lineare, allora U = Re F : X R è un funzionale R-lineare (ossia è additivo
e U(x) = Ux per ogni R). Viceversa, se U : X R è R-lineare, allora
il funzionale F : X C denito da
Fx = Ux iU(ix), x X,
41
è lineare su X e, naturalmente, Re F = U.
Nelle ipotesi del teorema, allora, il funzionale u = Re f verica le ipote-
si del teorema nel caso reale (teorema 1.7.1). Quindi esiste un funzionale
U : X R, R-lineare, tale che U[
M
= u e Ux p(x) per ogni x X. Ne
segue che il funzionale Fx = Ux iU(ix) è lineare su X e soddisfa la tesi.
Del teorema di Hahn-Banach esiste una versione geometrica altrettanto im-
portante e utile, che si esprime in termini di separazione di insiemi convessi
mediante gli insiemi di livello di opportuni funzionali lineari. Si hanno due
enunciati abbastanza simili: entrambi si dimostrano sfruttando lenunciato
algebrico, cioè il teorema 1.7.2 (si noti che il teorema 1.7.2, che riguarda il
caso complesso, si riduce automaticamente al teorema 1.7.1, relativo al caso
reale, quando lo spazio X è reale).
Teorema 1.7.3 (di Hahn-Banach, 1
a
forma geometrica) Sia X uno
spazio vettoriale topologico, e siano K, H sottoinsiemi non vuoti, convessi e
disgiunti di X, con K aperto. Allora esiste un funzionale lineare F : X C,
continuo e non nullo, tale che
sup
K
Re F inf
H
Re F .
Dimostrazione Cominciamo con un caso particolare.
Lemma 1.7.4 Sia X uno spazio vettoriale topologico reale, sia K un con-
vesso aperto e non vuoto di X e sia x
0
X K. Allora esiste un funzionale
lineare F : X R, continuo e non nullo, tale che
Fx < Fx
0
x K.
Dimostrazione Supponiamo dapprima che 0 K. Allora si ha x
0
,= 0,
quindi possiamo denire un funzionale lineare f sul sottospazio M = [x
0
]
ponendo
f(tx
0
) = t t R.
Essendo il convesso K aperto e contenente lorigine, si vede facilmente che,
detto p
K
il funzionale di Minkowski di K, si ha p
K
(x) < +per ogni x X.
Inoltre risulta
f(tx
0
) = t p
K
(tx
0
) t R :
infatti ciò è ovvio quando t 0, e daltra parte, essendo x
0
/ K, se t > 0 si
ha tx
0
/ tK e dunque, per denizione, p
K
(tx
0
) t.
42
Per il teorema 1.7.1 esiste un funzionale lineare F : X R tale che F[
M
= f
e F p
K
in X. Ricordando che p
K
(x) < 1 per ogni x K (esercizio 1.3.2),
si deduce
Fx p
K
(x) < 1 = fx
0
= Fx
0
x K
e in particolare il funzionale F non è identicamente nullo. Resta da provare
che F è continuo: si ha F < 1 su K, da cui anche F > 1 sul convesso K.
Di conseguenza,
[Fx[ < 1 x K (K).
Cos` F risulta limitato sullintorno K (K) di 0. Dal teorema 1.5.2 segue
che F è continuo.
Supponiamo ora che 0 / K. Sia y
0
K e consideriamo il traslato K y
0
,
che è un convesso aperto contenente 0. Per quanto già provato, esiste un
funzionale lineare, continuo e non nullo F : X R tale che
Fy < F(x
0
y
0
) y K y
0
,
ossia
Fx = F(x y
0
) +Fy
0
< F(x
0
y
0
) +Fy
0
= Fx
0
x K.
Ci` o prova la tesi del lemma.
Torniamo alla dimostrazione del teorema 1.7.3. Poniamo
C = K H = x y : x K, y H;
C è un convesso aperto non vuoto, e 0 / C perche H e K sono disgiunti.
Applicando il lemma 1.7.4 con x
0
= 0 e K = C, si ottiene lesistenza di un
funzionale R-lineare, continuo e non nullo U : X R tale che Uz < 0 per
ogni z C, ossia
Ux < Uy x K, y H.
Posto Fx = Ux iU(ix), il funzionale F : X C è lineare, continuo e non
nullo, e verica la tesi.
Vi è una versione stretta del teorema di separazione 1.7.3, che è la seguente:
Teorema 1.7.5 (di Hahn-Banach, 2
a
forma geometrica) Sia X uno
spazio vettoriale topologico localmente convesso di Hausdor, e siano K, H
convessi non vuoti e disgiunti di X, con K chiuso e H compatto. Allora
esiste un funzionale F : X C lineare, continuo e non nullo tale che
sup
K
Re F < inf
H
Re F.
43
Dimostrazione Premettiamo il seguente lemma.
Lemma 1.7.6 Se B è un compatto in uno spazio topologico di Hausdor Z,
allora ogni net z
i
iI
B ha almeno un punto di accumulazione z B.
Dimostrazione Poniamo I
i
= j I : i < j e A
i
= z
j
: j I
i
:
dunque A
i
B per ogni i I. Stiamo cercando un punto z B tale che
per ogni intorno U di z e per ogni i I esista z
j
A
i
U; cioè stiamo
cercando un punto z B che appartenga a tutte le chiusure A
i
, i I. Dato
che, per denizione di net, si ha
n
h=1
A
i
h
,= per ogni sottoinsieme nito
i
1
, . . . i
n
I, a maggior ragione risulta
n
h=1
A
i
h
,= i
1
, . . . i
n
I,
e per la compattezza di B si ottiene
iI
A
i
,= .
Dunque esiste un punto z

iI
A
i
B. Tale z appartiene anche a B
poiche B, essendo compatto nello spazio di Hausdor Z, è chiuso. Ciò prova
il lemma.
Proviamo il teorema 1.7.5. Sia U
i
iI
un sistema fondamentale di intorni di
0, con gli U
i
aperti e convessi. Per ogni i I poniamo H
i
= H+U
i
; allora H
i
è un convesso aperto. Dimostriamo che esiste i
0
I tale che KH
i
= per
ogni i I, i i
0
. In caso contrario, per ogni k I esisterebbe i
k
k per cui
K H
i
k
,= , ossia esisterebbero x
i
k
K e y
i
k
H tali che x
i
k
y
i
k
U
i
k
.
Quindi il net x
i
k
y
i
k
kI
convergerebbe a 0 in X. Daltronde, essendo
H compatto, il lemma 1.7.6 ci dice che il net y
i
k
kI
H avrebbe un
punto di accumulazione y H. Poiche x
i
k
y
i
k
0, il punto y sarebbe di
accumulazione anche per il net x
i
k
kI
K; ma essendo K chiuso, dovrebbe
essere y K, il che è assurdo perche H e K sono disgiunti. Lasserzione
precedente è provata.
Pertanto i convessi H
i
0
e K vericano le ipotesi del teorema 1.7.3: quindi
esiste un funzionale G : X C lineare, continuo e non nullo tale che
sup
H
Re G+ sup
U
i
0
Re G = sup
H
i
0
Re G inf
K
Re G.
44
Osserviamo che sup
U
i
0
Re G > 0: infatti, essendo G non identicamente nullo,
esiste z X 0 tale che Re Gz ,= 0; per la continuità delle omotetie,
esisterà R0 per cui z U
i
0
e Re G(z) > 0. Quindi sup
U
i
0
Re G > 0
e pertanto
sup
H
Re G < inf
K
Re G.
Posto F = G, si ha allora la tesi.
Vogliamo ora riformulare i teoremi 1.7.3 e 1.7.5 in termini pi` u geometrici. A
questo scopo ci occorre anzitutto una caratterizzazione dei sottospazi di uno
spazio vettoriale topologico X che sono luogo di zeri di funzionali lineari su
X.
Denizione 1.7.7 Sia X uno spazio vettoriale e sia M un sottospazio di
X. Diciamo che M è massimale se non vi è alcun sottospazio Y di X che
verichi le inclusioni proprie M Y X.
Proposizione 1.7.8 Sia X uno spazio vettoriale e sia M un sottospazio di
X. Allora M è massimale se e solo se esiste un funzionale lineare f su X
tale che M = ker f. In tal caso il funzionale f è unico a meno di costanti
moltiplicative.
Dimostrazione (=) Se M = ker f con f : X C lineare, allora ovvia-
mente M è un sottospazio di X. Se Y è un sottospazio di X che contiene
propriamente M, ssiamo y
0
Y M: allora per ogni x X possiamo
scrivere, essendo fy
0
,= 0,
x =
_
x
fx
fy
0
y
0
_
+
fx
fy
0
y
0
;
ma a secondo membro il primo addendo è un elemento di M, quindi di Y ,
ed il secondo addendo sta in Y . Ciò mostra che X Y , ossia X = Y .
(=) Sia M un sottospazio massimale. Se M = X, allora il funzionale
identicamente nullo ha M come luogo di zeri. Se M X, ssiamo z
0

X M: allora il sottospazio [z
0
, M] contiene propriamente M, e quindi
deve coincidere con X. Quindi ogni elemento x X si può decomporre (in
modo unico) nella forma
x = u +z
0
, u M, C.
45
Deniamo il funzionale f nel modo seguente:
f(u +z
0
) = .
Chiaramente f è ben denito e lineare; inoltre ker f = M.
Resta da vericare che se M = ker f = ker g, con f e g funzionali lineari su
X, allora g è multiplo di f; e in eetti se z
0
X M, allora
x
fx
fz
0
z
0
ker f = ker g x X,
da cui
g
_
x
fx
fz
0
z
0
_
= 0 x X,
ossia
gx =
gz
0
fz
0
fx x X.
Ci` o prova la tesi.
Osservazione 1.7.9 Se M è un sottospazio massimale dello spazio vetto-
riale topologico X, allora M è chiuso in X oppure denso in X. Infatti, M
è un sottospazio che contiene M: se M = M, allora M è chiuso; se invece
M M, allora per la massimalità di M si ha M = X, ossia M è denso in
X.
Corollario 1.7.10 Sia X uno spazio vettoriale topologico e sia f un funzio-
nale lineare su X. Allora ker f è chiuso in X oppure denso in X a seconda
che f sia continuo oppure no.
Dimostrazione Se f è continuo, allora ker f = f
1
(0) è limmagine inversa
di un chiuso di C e quindi è chiuso.
Se f non è continuo, proviamo che ker f è denso in X. Sia x X: se fx = 0,
abbiamo già nito, per cui possiamo supporre che fx ,= 0. Sia U = x+V un
intorno di x tale che V sia un intorno bilanciato di 0. Per il teorema 1.5.2, U
contiene un punto y tale che [fy[ > [fx[. Scegliamo t =
fx
fy
; allora, essendo
[t[ < 1 si ha ty V e quindi x + ty U. Daltra parte, x + ty ker f e ciò
prova la tesi.
Adesso introduciamo la nozione di iperpiano.
46
Denizione 1.7.11 Sia X uno spazio vettoriale topologico. Un iperpiano
ane di X è un insieme della forma
= x X : Re fx = k, k R,
ove f è un funzionale lineare su X.
Si noti che se X è reale, ogni iperpiano ane è il traslato di un sottospazio
massimale: infatti se f : X R è lineare e non identicamente nullo, e
= x X : fx = k, k R, allora si ha = x X : fx = 0 + x
0
, ove
x
0
è scelto in modo che fx
0
= k. Osserviamo che ciò è falso se X è complesso
(esercizio 1.7.7).
Osservazione 1.7.12 Dal corollario 1.7.10 segue che un iperpiano ane è
chiuso o denso in X a seconda che il corrispondente funzionale sia continuo
o no. Un iperpiano ane chiuso è anche detto varietà ane. Si noti che ogni
iperpiano ane chiuso della forma = x X : Re fx = k, con k reale,
divide X in due semispazi chiusi
+
= x X : Re fx k,
= x X : Re fx k.
I teoremi di Hahn-Banach 1.7.3 e 1.7.5 si possono allora riformulare nel modo
seguente.
Corollario 1.7.13 Sia X uno spazio vettoriale topologico.
(i) Se K, H sono convessi non vuoti e disgiunti in uno spazio vettoriale
topologico X, con K aperto, allora esiste un iperpiano ane chiuso
che separa H e K (nel senso che H e K sono contenuti uno in
+
ed
uno in
).
(ii) Se lo spazio vettoriale topologico X è localmente convesso di Hausdor,
e se K, H sono convessi non vuoti disgiunti con K chiuso e H compatto,
allora esiste un iperpiano ane chiuso che separa strettamente H
e K (ossia H e K sono contenuti nei due semispazi aperti individuati
da ).
Vediamo altre proprietà geometriche degli insiemi convessi.
Denizione 1.7.14 Sia X uno spazio vettoriale topologico, sia K X. Un
iperpiano di appoggio per K è un iperpiano ane chiuso tale che:
47
(i) K ,= ,
(ii) K è contenuto in uno dei due semispazi chiusi individuati da .
Un punto x K si dice punto di appoggio di su K.
Corollario 1.7.15 Sia X uno spazio vettoriale topologico, sia K un convesso
di X con parte interna non vuota. Allora ogni x
0
K è punto di appoggio
su K di qualche iperpiano ane chiuso.
Dimostrazione Gli insiemi x
0
e
K sono convessi disgiunti di X, con
K
aperto. Per il teorema 1.7.3, esiste un funzionale lineare e continuo F : X
C tale che
Re Fx
0
Re Fx x
K;
quindi, per continuità,
Re Fx
0
Re Fx x
K,
il che implica, per lesercizio 1.3.9,
Re Fx
0
Re Fx x K.
Pertanto, posto = Re Fx
0
, liperpiano ane chiuso = u X : Re Fu =
è di appoggio per K e x
0
è punto di appoggio di su K.
Corollario 1.7.16 Sia X uno spazio vettoriale topologico localmente con-
vesso di Hausdor. Se K X è un convesso chiuso non vuoto, allora K è
lintersezione di tutti i semispazi chiusi che lo contengono.
Dimostrazione Sia H lintersezione di tutti i semispazi chiusi contenenti
K: ovviamente K H. Sia x
0
H: se fosse x
0
/ K, i convessi x
0
e K sarebbero disgiunti, con x

0
compatto e K chiuso. Per il teorema
1.7.5, esisterebbe un iperpiano ane chiuso che separa strettamente i due
convessi; quindi fra i due semispazi chiusi individuati da ce ne sarebbe uno
contenente K ma non il punto x
0
, contro lipotesi x
0
H.
Dai risultati precedenti deduciamo facilmente questa importante proprietà:
Corollario 1.7.17 Sia X uno spazio vettoriale topologico localmente con-
vesso di Hausdor. Se K è un convesso di X, allora K è chiuso se e solo se
K è w-chiuso.
48
Dimostrazione Poiche la topologia debole è meno ne di quella naturale di
X, ogni insieme w-chiuso è necessariamente chiuso.
Viceversa, supponiamo che K sia chiuso. Per il corollario 1.7.16, K è lin-
tersezione di tutti i semispazi chiusi che lo contengono. Ma un semispazio
chiuso ha la forma x X : Re Fx k, con F X
e k R; dato che w
è la meno ne topologia che rende continui gli elementi di X
, ogni insieme
della forma sopra scritta è w-chiuso, essendo la controimmagine del chiuso
] , k] R mediante lapplicazione w-continua Re F. Dunque ogni semi-
spazio chiuso è w-chiuso, e dunque H, essendo intersezione di w-chiusi, è un
insieme w-chiuso.
Corollario 1.7.18 Sia X uno spazio normato, sia x
n
nN
una successione
contenuta in X, e sia x X tale che x
n
x in X. Allora esiste una
successione v
n
nN
, costituita da combinazioni convesse degli x
n
, tale che
|v
n
x|
X
0.
Dimostrazione Poiche x
n
x, per ogni n N il punto x appartiene alla
chiusura debole dellinsieme
k=n
x
k
, ed a maggior ragione alla chiusura
debole del suo inviluppo convesso. Ma, ovviamente, questultimo insieme
è un convesso w-chiuso, quindi anche chiuso nella topologia indotta dalla
norma. In denitiva,
x co
_

_
k=n
x
k
_
n N.
Perciò si può costruire una successione v
n
nN
tale che v
n
x in X e
v
n
co (
k=n
x
k
) per ogni n N. Ciascun v
n
, per denizione, è della
forma
v
n
=
qn
k=pn
(n)
k
x
k
,
(n)
k
[0, 1],
qn
k=pn
(n)
k
= 1, n p
n
q
n
.
Concludiamo il paragrafo con un altro risultato di compattezza negli spazi
di Banach: questa proprietà è stabile nel passaggio da un insieme qualunque
al suo inviluppo convesso.
Proposizione 1.7.19 (teorema di Mazur) Sia K un sottoinsieme relati-
vamente compatto di uno spazio di Banach X. Allora co(K) è compatto.
49
Dimostrazione Basta dimostrare che co(K) è totalmente limitato. Sia >
0: poiche K, essendo relativamente compatto, è totalmente limitato, esistono
z
1
, . . . , z
n
K tali che
K
n
_
i=1
B
_
z
i
,

2
_
.
Poniamo H = coz
1
, . . . , z
n
; allora H è compatto in X, perche è limmagine
del compatto a [0, 1]
n
:
n
1=1
a
i
= 1 mediante lapplicazione continua
(a) =
n
i=1
a
i
z
i
. Dunque H è totalmente limitato e pertanto esistono
v
1
, . . . v
m
H tali che
H
m
_
j=1
B
_
v
j
,

2
_
.
Sia ora y co(K), ossia y =
p
r=1
r
y
r
, con y
r
K,
p
r=1
r
= 1 e
r
0; sia i
r
1, . . . m un indice tale che y
r
B(z
ir
,

2
). Allora, posto
u =
p
r=1
r
z
ir
, si ha u H e
|y u|
X
=
_
_
_
_
_
p
r=1
r
(y
r
z
ir
)
_
_
_
_
_
X
r=1
r
|y
r
z
ir
|
X
<

2
,
e dunque
co(K)
_
uH
B
_
u,

2
_
m
_
j=1
B(v
j
, ) ,
da cui la tesi, essendo v
1
, . . . v
m
H co(K).
Esercizi 1.7
1. Sia X uno spazio vettoriale topologico localmente convesso di Hau-
sdor. Se x X 0, si provi che esiste un funzionale lineare e
continuo F : X C tale che Fx ,= 0.
2. Sia X uno spazio vettoriale topologico localmente convesso di Hausdor
e sia M un sottospazio proprio di X. Se x / M, si provi che esiste un
funzionale lineare e continuo F : X C tale che Re Fx = 1 e F[
M
= 0.
3. Sia X uno spazio vettoriale topologico localmente convesso di Hau-
sdor, e sia B un sottoinsieme chiuso, convesso e bilanciato di X. Se
x
0
/ B, si provi che esiste un funzionale lineare e continuo F : X C
tale che [Re F[ 1 su B e Re Fx
0
> 1.
50
4. Nello spazio L
2
(1, 1) si consideri il sottoinsieme K
= f C[1, 1] :
f(0) = , R. Si verichi che ciascun K
è convesso e denso in
L
2
(1, 1), e si provi che per ,= gli insiemi K
e K
sono disgiunti
ma non sono separati da alcun iperpiano ane.
5. Vericare che i due insiemi
K = (x, y) R
2
: y 0, H = (x, y) R
2
: y e
x
sono convessi chiusi disgiunti di R

2
, che non possono essere separati
strettamente da alcun funzionale F (R
2
)
.
6. Sia X uno spazio vettoriale topologico reale. Si provi che ogni iperpiano
ane chiuso in X R è della forma
M = (x, t) X R : fx +t = ,
ove f è un funzionale lineare e continuo su X e , sono numeri reali.
Si mostri poi che se ,= 0, allora M è un opportuno traslato del graco
di un funzionale X
, ossia esiste y X R tale che M si può

scrivere nella forma
M = y +(x, x) : x X.
7. Sia X uno spazio vettoriale topologico complesso e sia f X
0.
Si mostri che se k R linsieme P = x X : Re fx = k non è il
traslato di alcun sottospazio di X.
8. Si estenda il teorema di Mazur al caso in cui X è uno spazio vettoriale
topologico completo e metrizzabile.
9. Sia X uno spazio topologico di Hausdor. Si provi che un sottoinsieme
A di X è compatto se e solo se ogni net x
i
iI
A ha almeno un
punto di accumulazione x A.
1.8 Punti estremi di insiemi convessi
Ogni insieme convesso K in uno spazio vettoriale X è, ovviamente, linviluppo
convesso di se stesso; ci chiediamo se sia possibile individuare un sottoinsieme
H K minimale del quale K sia linviluppo convesso. Per rispondere a
questa domanda è importante la nozione di punto estremo.
51
Denizione 1.8.1 Sia X uno spazio vettoriale e sia K un sottoinsieme con-
vesso e non vuoto di X. Un punto x
0
K si dice punto estremo di K se
linsieme K x
0
è convesso.
In altre parole, un punto x
0
K è estremo per K se non vi è alcuna coppia
di punti distinti x, y K tali che si abbia x + (1 )y = x
0
per qualche
]0, 1[, cosicche togliere x
0
non distrugge la convessità di K.
Uno dei pi` u profondi risultati relativi agli insiemi convessi e compatti è il
seguente
Teorema 1.8.2 (di Krein-Milman) Sia X uno spazio vettoriale topolo-
gico localmente convesso di Hausdor e sia K X un insieme compatto,
convesso e non vuoto. Allora, detto K
e
linsieme dei punti estremi di K, si
ha:
(i) K
e
è non vuoto;
(ii) K = co(K
e
).
Dimostrazione (i) Indichiamo con / la classe di tutti i sottoinsiemi chiusi
e non vuoti A K tali che
x, y K, ]0, 1[, x + (1 )y A = x, y A.
Poiche K /, la classe / è non vuota (ed è costituita da insiemi compatti,
essendo K compatto). Consideriamo su di essa lordinamento parziale dato
dallinclusione rovesciata:
A
1
A
2
A
1
A
2
A
1
, A
2
/.
Osserviamo che se / / è un insieme totalmente ordinato, allora linsieme
AA
A è non vuoto, essendo intersezione di una famiglia decrescente di
compatti; inoltre applicando la denizione di / si vede subito che
AA
A è
un elemento di /, ed è evidentemente un maggiorante per /. Per il lemma
di Zorn, deduciamo che esiste almeno un elemento massimale A
1
/.
Aermiamo che ogni elemento massimale A
1
/ contiene esattamente un
punto. Infatti, supposto per assurdo x, y A
1
e x ,= y, per il teorema 1.7.5
possiamo trovare un funzionale lineare e continuo F X
tale che, posto

G = Re F, sia Gx < Gy. Poniamo
A
0
= u A
1
: Gu = inf
A
1
G;
52
allora A
0
,= perche il funzionale continuo G ha minimo sul compatto A
1
.
Daltra parte, A
0
/: infatti, se u, v K e u + (1 )v A
0
per qualche
]0, 1[, si ha intanto u, v A
1
(in quanto A
1
/); di conseguenza, essendo
inf
A
1
G = inf
A
1
G+(1) inf
A
1
G Gu+(1)Gv = G(u+(1)v) = inf
A
1
G,
si deduce che Gu = Gv = inf
A
1
G, ossia u, v A
0
. Ciò mostra appunto che
A
0
/. Ma, dato che y A
1
A
0
, otteniamo che A
0
è contenuto propria-
mente in A
1
, ossia A
1
A
0
e A
1
,= A
0
, il che contraddice la massimalità di
A
1
. Si conclude che A
1
ha al pi` u un elemento; ma siccome A
1
/, deve
essere A
1
,= e pertanto A
1
ha esattamente un elemento. Tale elemento, per
denizione di /, è un punto estremo di K. Ciò prova (i).
(ii) Essendo K un convesso chiuso contenente K
e
, è chiaro che K
co(K
e
); proviamo laltra inclusione. Supponiamo per assurdo che esista
z K co(K
e
). Per il teorema 1.7.5, esiste un funzionale lineare e continuo
F X
tale che, posto G = Re F, risulta

Gz < infGu : u co(K
e
).
Posto
K
0
= x K : Gx = inf
K
G,
chiaramente K
0
è un chiuso non vuoto disgiunto da K
e
ed inoltre si ha,
ragionando come in precedenza,
x, y K, ]0, 1[, x + (1 )y K
0
= x, y K
0
,
ossia K
0
appartiene alla classe / introdotta allinizio della dimostrazione.
Inoltre K
0
, essendo compatto e convesso, ha punti estremi in virt` u della
parte (i) già provata.
Mostriamo adesso che ogni punto estremo di K
0
è punto estremo di K. Sia
x
0
(K
0
)
e
: in particolare, x
0
K
0
e quindi Gx
0
= inf
K
G. Se fosse x
0
/ K
e
esisterebbero u, v K e ]0, 1[ tali che u + (1 )v = x
0
. Ma allora,
con lormai consueto ragionamento, deduciamo inf
K
G = Gx
0
= Gu = Gv,
cioè u, v K
0
; questo contraddice il fatto che x
0
è punto estremo di K
0
. Si
conclude quindi che x
0
K
e
.
Abbiamo cos` ottenuto (K
0
)
e
K
0
K
e
= , e ciò è impossibile. Pertanto
K co(K
e
) e la tesi è dimostrata.
53
Esercizi 1.8
1. Sia K un convesso non vuoto in uno spazio vettoriale topologico lo-
calmente convesso di Hausdor. Si provi che K
e
K; si fornisca
un esempio in cui vale linclusione stretta ed un esempio in cui vale
luguaglianza.
2. Se K è un poliedro convesso in R
N
, si provi che K
e
coincide con
linsieme dei vertici di K.
3. Si consideri linsieme K R
3
cos` denito:
K = co(1, 0, 1), (1, 0, 1), (cos , sin , 0) : [0, 2].
Si determini K
e
e si mostri che K è compatto mentre K
e
non lo è.
4. Per ogni p [1, [ sia
B
p
= f L
p
(0, 1) : |f|
p
1.
Si provi che (B
1
)
e
= , mentre
(B
p
)
e
= f L
p
(0, 1) : |f|
p
= 1 p ]1, [.
5. Posto
B = f C([0, 1], C) : |f|
1, B
= B C([0, 1], R),

si provi che
B
e
= f C([0, 1], C) : [f(t)[ = 1 t [0, 1], B
e
= 1.
6. Si determini B
e
, ove B = f L
(0, 1) : |f|
1.
7. Sia S un sottoinsieme non vuoto di R
N
. Si provi che ogni x co(S) è
combinazione convessa di al pi` u N + 1 punti di S.
[Traccia: Se x co(S), sarà x =
m
i=1
i
x
i
, con
i
[0, 1],
m
i=1
i
=
1, x
i
S e m N
+
. Se m N + 1 non cè niente da dimostrare;
altrimenti sarà m > N + 1 e potremo assumere
i
> 0 per ogni i =
1, . . . , m. Si verichi che esistono
1
, . . . ,
m1
non tutti nulli, tali che
m1
i=1

i
(x
i
x
m
) = 0, ossia
m
i=1
i
x
i
= 0, ove
m
=
m1
i=1

i
.
54
Si determini ora R tale che: (a)
i

i
0 per i = 1, . . . , m;
(b) esiste j 1, . . . , m per cui
j

j
= 0. Se ne deduca che x
è combinazione convessa di x
1
, . . . , x
m
con coecienti
i

i
, i =
1, . . . m, uno dei quali è nullo: dunque x è combinazione convessa di
m 1 elementi di S. Iterando questo argomento un numero nito di
volte si ricavi la tesi.]
8. Provare che se K è un convesso compatto e non vuoto di R
N
, allora
ogni x K è combinazione convessa di al pi` u N + 1 punti estremi di
K.
55
Capitolo 2
Funzioni convesse
2.1 Generalità
Le funzioni convesse hanno un ruolo fondamentale nei problemi di minimo e
nel calcolo delle variazioni. Questo capitolo è dedicato alla descrizione delle
loro principali proprietà.
Denizione 2.1.1 Sia X uno spazio vettoriale. Una funzione f : X R =
[, +] si dice convessa se risulta
f((1 t)x +ty) (1 t)f(x) +tf(y) t [0, 1]
per ogni coppia di punti x, y X per i quali il secondo membro sia ben
denito (ossia non risulti f(x) = f(y) = ). Se, limitatamente agli x, y
per i quali ha senso, la disuguaglianza è stretta per ogni t ]0, 1[ e x ,= y,
la funzione si dice strettamente convessa. La funzione si dice concava, o
strettamente concava, se f è convessa o strettamente convessa.
Abbiamo ammesso tra i valori di una funzione convessa anche . Ci sono
almeno due buone ragioni per ammettere il valore +. La prima è che se
U X è un insieme convesso e se f : U R è una funzione convessa (cioè
vale la disuguaglianza di convessità per ogni t [0, 1] e x, y U), allora
lestensione
f(x) =
_
f(x) se x U
+ se x / U
risulta convessa: quindi possiamo limitarci a considerare funzioni convesse
denite su tutto X. La seconda ragione è la seguente: introducendo la
56
funzione indicatrice di un insieme E X,
I
E
(x) =
_
0 se x E
+ se x / E,
si ha che E è convesso in X se e solo se I
E
è una funzione convessa su X:
dunque lo studio degli insiemi convessi può attuarsi tramite lo studio delle
funzioni convesse.
Invece le funzioni convesse che assumono il valore sono alquanto patologi-
che: se f è convessa e se f(x
0
) = , allora su ogni semiretta x
0
+tv, t > 0
il comportamento di f è il seguente: o essa vale costantemente +, o vale
costantemente , oppure per un opportuno t
0
> 0 si avrà f(x
0
+tv) =
per 0 t < t
0
e f(x
0
+ tv) = + per t > t
0
, mentre f(x
0
+ t
0
v) sarà un
qualunque valore in R. Questa aermazione segue facilmente utilizzando la
disuguaglianza di convessità.
Per sgombrare il campo da certe patologie, sono utili le denizioni che seguo-
no.
Denizione 2.1.2 Sia X uno spazio vettoriale. Una funzione f : X R
si dice propria se f(x) > per ogni x X ed esiste x X per cui
f(x) < +.
Denizione 2.1.3 Sia X uno spazio vettoriale e sia f : X R una fun-
zione. Il dominio di f è linsieme
D(f) = x X : f(x) < +.
Dunque se f è convessa e propria si ha D(f) = x X : f(x) R. Inoltre,
se f è convessa, D(f) è un sottoinsieme convesso di X.
Esempio 2.1.4 In uno spazio vettoriale X sono funzioni convesse e proprie:
i funzionali lineari, i funzionali di Minkowski di insiemi convessi e radiali, le
seminorme.
Osservazione 2.1.5 Se f : X R è convessa, allora gli insiemi di sottoli-
vello
E
= x X : f(x) , R,
sono convessi. Il viceversa è falso, come mostra lesempio della funzione x
3
in R. Se f : X R è una funzione i cui insiemi di sottolivello sono convessi,
essa si dice quasi convessa; f si dirà quasi concava se f è quasi convessa.
57
Denizione 2.1.6 Sia X uno spazio vettoriale, sia f : X R. L epigra-
co di f è il sottoinsieme di X R cos` denito:
epi(f) = (x, t) X R : f(x) t =
_
R
(E
[, +[).
La stretta parentela fra insiemi convessi e funzioni convesse è evidenziata
dalla seguente
Proposizione 2.1.7 Sia X uno spazio vettoriale. Una funzione f : X R
è convessa se e solo se il suo epigraco è convesso in X R.
Dimostrazione (=) Siano (x, t), (y, s) epi(f): allora in particolare ne
f(x), ne f(y) valgono + e quindi si può sicuramente scrivere la disugua-
glianza di convessità. Pertanto, per ogni [0, 1] si ha
f((1 )x +y) (1 )f(x) +f(y) (1 )t +s,
ossia
(1 )(x, t) +(y, s) epi(f) [0, 1],
il che mostra che epi(f) è convesso.
(=) Se almeno uno fra f(x) e f(y) vale +, la disuguaglianza di convessità,
se ha senso, è ovvia. Se f(x) e f(y) sono entrambi reali, allora i punti (x, f(x))
e (y, f(y)) appartengono a epi(f), e quindi si ha, per ipotesi,
((1 )x +y, (1 )f(x) +f(y)) epi(f) [0, 1],
cioè
f((1 )x +y) (1 )f(x) +f(y) [0, 1].
Inne se almeno uno fra f(x) e f(y) vale , ad esempio f(x) = (ma
nessuno dei due vale +), per ogni u R e per ogni v [f(y), +[ si ha
(x, u), (y, v) epi(f) e dunque come prima otteniamo
f((1 )x +y) (1 )u +v u R, v [f(y), +[,
da cui per u ricaviamo f((1 )x + y) = , ossia f verica la
relazione di convessità anche in questo caso.
58
Esercizi 2.1
1. Sia X uno spazio vettoriale e sia f : X R convessa. Si provi che se
: R R è crescente e convessa, allora f è convessa su X.
2. Si provi che lestremo superiore di una famiglia arbitraria di funzioni
convesse è una funzione convessa.
3. Sia X uno spazio vettoriale e sia f : X R una funzione qualunque.
Si provi che f è convessa su X se e solo se per ogni x, v X il rapporto
incrementale
t
f(x +tv) f(x)
t
, t R 0,
è una funzione crescente.
4. Sia X uno spazio vettoriale. Si provi che se f : X R è convessa,
allora linsieme x X : f(x) = è convesso mentre in generale
linsieme x X : f(x) = + non lo è.
5. Sia X uno spazio di Hilbert. Si provi che x |x|
2
X
è una fun-
zione strettamente convessa, mentre x |x|
X
è convessa ma non
strettamente convessa.
6. Sia X uno spazio vettoriale topologico. Se f : X R è continua, si
provi che f è convessa se e solo se
f
_
x +y
2
_
1
2
f(x) +
1
2
f(y) x, y X.
7. Sia X uno spazio vettoriale. Si provi che linsieme delle funzioni con-
vesse è un convesso dello spazio vettoriale Y = f : X R, ed è
chiuso rispetto alla convergenza puntuale.
2.2 Semicontinuità
Una fondamentale proprietà funzionale, di grande importanza nei problemi
di minimo, è la semicontinuità.
59
Denizione 2.2.1 Sia X uno spazio topologico e sia f : X R. Diciamo
che f è semicontinua inferiormente nel punto x
0
X se si ha
f(x
0
) liminf
xx
0
f(x).
Diciamo che f è semicontinua superiormente nel punto x
0
X se si ha
f(x
0
) limsup
xx
0
f(x).
La funzione f si dice semicontinua inferiormente, o superiormente, in X se
lo è in ogni punto di X.
Ricordiamo che, detta |(x
0
) la famiglia degli intorni di x
0
, si ha per deni-
zione
liminf
xx
0
f(x) = sup
V U(x
0
)
inf
yV \{x
0
}
f(y), limsup
xx
0
f(x) = inf
V U(x
0
)
sup
yV \{x
0
}
f(y).
`
E facile vericare che f è semicontinua inferiormente in x
0
se e solo se f è
semicontinua superiormente in x
0
; inoltre f è continua in x
0
se e solo se f è
semicontinua sia inferiormente che superiormente in x
0
. Vale poi la seguente
caratterizzazione:
Proposizione 2.2.2 Sia X uno spazio topologico e sia f : X R. I
seguenti fatti sono equivalenti:
(i) f è semicontinua inferiormente in X;
(ii) gli insiemi di sottolivello E
= x X : f(x) sono chiusi per ogni

R;
(iii) epi(f) è chiuso in X R.
Dimostrazione (i) = (ii) Proviamo che E
c
è aperto. Sia x
0
/ E
, ossia
f(x
0
) > ; scelto ]0, f(x
0
) [, per ipotesi esiste V |(x
0
) tale che
f(x) f(x
0
) > per ogni x V x
0
. Ciò è ovviamente vero anche
per x = x
0
, il che mostra che V E
c
; pertanto E
c
è aperto.
(ii) = (iii) Proviamo che epi(f)
c
è aperto. Sia (x
0
, ) / epi(f), ossia
f(x
0
) > ; scelto ]0, f(x
0
) [, poiche x
0
appartiene allaperto E
c
+
esiste V |(x
0
) tale che f(x) > + per ogni x V . Dunque, per
60
ogni (x, ) V ] , + [ si ha a maggior ragione f(x) > , ossia
V ] , +[ epi(f)
c
. Ciò mostra che epi(f)
c
è aperto.
(iii) = (i) Proviamo che f è semicontinua inferiormente in un generico
punto x
0
X. Sia < f(x
0
): allora (x
0
, ) appartiene allaperto epi(f)
c
,
cosicche esistono V |(x
0
) ed > 0 tali che V ] , +[ epi(f)
c
; ciò
signica f(x) > per ogni x V e per ogni ] , + [. Ne segue
inf
V
f + > , ed a maggior ragione
sup
V U(x
0
)
inf
V \{x
0
}
f > .
Per larbitrarietà di , otteniamo liminf
xx
0
f(x) f(x
0
).
Corollario 2.2.3 Lestremo superiore di unarbitraria famiglia di funzioni
semicontinue inferiormente è una funzione semicontinua inferiormente.
Dimostrazione Sia f
i
iI
una famiglia di funzioni semicontinue inferior-
mente nello spazio topologico X. Per ogni x
0
X e per ogni i I si
ha
f
i
(x
0
) sup
V U(x
0
)
inf
xV \{x
0
}
f
i
(x);
quindi
f
i
(x
0
) sup
V U(x
0
)
inf
xV \{x
0
}
sup
iI
f
i
(x),
ed inne
sup
iI
f
i
(x
0
) sup
V U(x
0
)
inf
xV \{x
0
}
sup
iI
f
i
(x),
che è la tesi.
Per le funzioni semicontinue vale metà del classico teorema di Weierstrass.
Proposizione 2.2.4 Sia X uno spazio topologico di Hausdor e sia f : X
R una funzione semicontinua inferiormente in X. Se K X è un insieme
compatto, oppure sequenzialmente compatto, allora f ha minimo su K.
Naturalmente, se vogliamo che il minimo di f su K sia nito, dovremo ri-
chiedere che in K si abbia f ,= + e f > .
Dimostrazione Se f + su K, allora inf
K
f = min
K
f = +. Al-
trimenti, sarà = inf
K
f < +; esiste allora una successione x
n
K
tale che f(x
n
) per n . Supponendo K sequenzialmente compatto,
61
esiste una sottosuccessione x
n
k
x
n
che converge ad un punto x K;
per semicontinuità, si conclude che f(x) liminf
k
f(x
n
k
) = , ossia
f(x) = = min
K
f.
Se invece K è compatto, sia > 0: esiste N tale che f(x
n
) < + per
ogni n . Utilizzando il lemma 1.7.6 otteniamo che la successione x
n
n
ha un punto daccumulazione x K: ciò signica che per ogni U |(x)
esiste un indice n
U
tale che x
n
U
U. Ne segue che il net x
n
U
UU(x)
converge a x. Scelto U |(x) in modo che inf
yU
f(y) > liminf
yx
f(y) , per
semicontinuità si conclude che
f(x) inf
yU
f(y) + f(x
n
U
) + + 2,
da cui f(x) = .
Esercizi 2.2
1. Sia X uno spazio topologico. Si provi che un sottoinsieme E di X
è chiuso se e solo se la sua funzione indicatrice I
E
è semicontinua
inferiormente su X.
2. Esibire un esempio di funzione f : R R che non è semicontinua
inferiormente ne superiormente in alcun punto.
3. Sia X uno spazio topologico e sia f : X R una funzione semicontinua
inferiormente. Si verichi che se x
n
è una successione contenuta in
X che converge a un punto x X, allora
f(x) liminf
n
f(x
n
).
2.3 Funzioni convesse semicontinue inferior-
mente
Sia X uno spazio vettoriale topologico: le funzioni convesse da X in R che
sono semicontinue inferiormente hanno un quadro pi` u ricco di proprietà e
rivestono grande importanza nelle applicazioni.
Tutti gli enunciati che daremo hanno una versione simmetrica relativa alle
funzioni concave e semicontinue superiormente, di cui per brevità non parle-
remo; osserviamo tuttavia che sono proprio le funzioni concave e semicontinue
62
superiormente quelle maggiormente usate nelle applicazioni alleconomia.
Prima di tutto, osserviamo che, fra le funzioni convesse, quelle semicontinue
inferiormente presentano meno patologie. Infatti:
Proposizione 2.3.1 Sia X uno spazio vettoriale topologico e sia f : X R
una funzione convessa e semicontinua inferiormente. Se esiste x
0
X tale
che f(x
0
) = , allora [f(x)[ = + per ogni x X.
Dimostrazione Se esistesse y
0
X tale che f(y
0
) R, allora per convessità
avremmo
f(x
0
+ (1 )y
0
) f(x
0
) + (1 )f(y
0
) = ,
e quando 0 otterremmo, per semicontinuità,
f(y
0
) liminf
0
f(x
0
+ (1 )y
0
) = liminf
0
() = .
In particolare, dunque, se una funzione convessa e semicontinua inferiormente
assume un valore reale, allora non assume il valore .
Le funzioni convesse e semicontinue inferiormente possiedono la seguente
proprietà, di fondamentale importanza per le applicazioni.
vesso di Hausdor. Se f : X R è convessa e semicontinua inferiormente,
allora f è semicontinua inferiormente per la topologia debole di X.
Dimostrazione Per ipotesi, il convesso epi(f) è chiuso in X R; quindi,
per il corollario 1.7.17, esso è anche w-chiuso in X R. I funzionali lineari e
continui su X R sono tutti e soli quelli della forma
(x, t) x +t, (x, t) X R,
con X
e R
= R (esercizio 2.3.8); quindi lo spazio topologico

(X R, w) coincide con lo spazio prodotto (X, w) R. Dunque epi(f) è
chiuso in (X, w) R e pertanto f è semicontinua inferiormente in X relati-
vamente a w.
Dalla proposizione precedente discendono alcuni criteri per lesistenza del
minimo, su opportuni insiemi, di una funzione convessa e semicontinua infe-
riormente.
63
Teorema 2.3.3 Sia X uno spazio di Banach riessivo e sia f : X R una
funzione convessa e semicontinua inferiormente. Se K è un sottoinsieme
limitato, debolmente chiuso e non vuoto di X, allora f ha minimo su K.
Se f è propria su K, tale minimo è nito. Se inne K è convesso e f è
strettamente convessa, il punto di minimo è unico.
Dimostrazione Se f + su K, allora min
K
f = inf
K
f = +. Al-
trimenti, sarà = inf
K
f < +; scegliamo una successione x
n
K
tale che f(x
n
) per n . Poiche K è debolmente chiuso, esso è
chiuso nonche limitato: essendo X riessivo, per il teorema di Eberlein-
Smulyan (pi` u precisamente per il corollario 1.6.5) K è debolmente com-
patto; quindi esiste x
n
k
x
n
tale che x
n
k
x K per k .
Poiche f è w-semicontinua inferiormente (proposizione 2.3.2), otteniamo
f(x) liminf
k
f(x
n
k
) = .
Se f è anche propria in K, la relazione f(x) = mostra che > e
quindi il minimo di f è nito.
Inne se K è convesso e f è strettamente convessa, siano x
1
e x
2
due distinti
punti di minimo per f in K: allora essendo f(x
1
) = f(x
2
) = , la stretta
convessità implica
f
_
x
1
+x
2
2
_
<
1
2
f(x
1
) +
1
2
f(x
2
) = ,
il che è assurdo.
Corollario 2.3.4 Sia X uno spazio di Banach riessivo e sia f : X R
una funzione convessa e semicontinua inferiormente. Se risulta
lim
x
f(x) = +,
allora f ha minimo su ogni sottoinsieme debolmente chiuso non vuoto H
X. Se f è anche propria in H, tale minimo è nito. Se inoltre H è convesso
e f è strettamente convessa, il punto di minimo è unico.
Dimostrazione Se f + su H, allora min
H
f = inf
H
f = +. Altri-
menti, ssato un numero reale M > inf
H
f, per ipotesi si avrà f(x) > M per
|x| > r, con r opportuno; dunque inf
H
f = inf
HB(0,r)
f, e quindi ci siamo
ridotti al caso del teorema precedente. Ne segue la tesi.
64
Osservazione 2.3.5 Il risultato del teorema 2.3.3 e quindi del corollario
2.3.4 si estendono al caso delle funzioni quasi convesse, denite nellosserva-
zione 2.1.5: si veda in proposito lesercizio 2.3.5.
Stabiliamo adesso un lemma di separazione fra lepigraco di una funzione
convessa ed un convesso disgiunto; le due forme di questo enunciato, che
seguono dalle due forme geometriche del teorema di Hahn-Banach, verranno
usate ripetutamente nel seguito.
Lemma 2.3.6 (i) Sia X uno spazio vettoriale topologico, sia f : X R
una funzione convessa e sia B X R un insieme convesso non vuoto. Se
epi(f),= , B
epi(f)= ed esistono
D(f) e s R tali che (, s) B,

allora si possono trovare G X
e > 0 tali che, posto = Re G, risulti

y +s x +t (y, s) B, (x, t) epi(f).
(ii) Sia X uno spazio vettoriale topologico localmente convesso di Hausdor
e sia f : X R una funzione convessa, semicontinua inferiormente e tale
che f(x) > per ogni x X. Se (y, s) / epi(f), allora si possono trovare
G X
e > 0 tali che, posto = Re G, risulti

y +s < infx +t : (x, t) epi(f).
Dimostrazione (i) Poiche
epi(f) e B sono convessi non vuoti disgiunti ed

il primo è aperto, per il teorema 1.7.3 esiste un funzionale lineare e continuo
su X R, non nullo, che li separa: in altre parole, in virt` u del corollario
1.7.13 e dellesercizio 1.7.6, esistono R e G : X C lineare e continuo,
non entrambi nulli e tali che, posto = Re G,
supy +s : (y, s) B infx +t : (x, t)
epi(f).
Questa disuguaglianza, per continuità, diventa
supy +s : (y, s) B infx +t : (x, t)
epi(f),
e poiche, per lesercizio 1.3.9, risulta
epi(f) = epi(f),
65
deduciamo in particolare
y +s x +t (y, s) B, (x, t) epi(f).
Dimostriamo che si ha necessariamente > 0.
`
E chiaro che non può essere
< 0 perche in tal caso per t +dedurremmo che il primo membro della
disuguaglianza vale . Daltronde, se fosse = 0, la sarebbe non nulla;
prendendo (, s) B con
D(f) e scegliendo y = , la disuguaglianza si

ridurrebbe a
x x D(f).
Dato che è un punto interno a D(f), si potrebbe prendere un intorno
bilanciato V di 0 tale che +V D(f): quindi scegliendo x = v, v V ,
ricaveremmo
0 v v V,
il che, per linearità, implicherebbe 0: ma ciò è assurdo, e pertanto deve
essere > 0.
(ii) Se f +, allora epi(f) è vuoto e la tesi è ovvia: supponiamo perciò
che esista z X tale che f(z) R. Gli insiemi epi(f) e (y, s) sono
convessi non vuoti e disgiunti in X R; inoltre il secondo è compatto ed
il primo è chiuso in quanto f è semicontinua inferiormente. Per il teorema
1.7.5, esiste un funzionale lineare e continuo su XR, non nullo, che li separa
strettamente: dunque esistono R e G : X C lineare e continuo, non
entrambi nulli e tali che, posto = Re G,
y +s < x +t (x, t) epi(f).
Se fosse < 0, lultimo membro della disuguaglianza sarebbe e ciò è
assurdo; dunque si ha, intanto, 0. Supponiamo dapprima che sia f(y)
R: allora (y, f(y)) epi(f) e quindi, scegliendo x = y e t = f(y) ricaviamo
s < f(y), da cui necessariamente > 0. Se invece f(y) = +, può essere
ancora > 0, e in tal caso abbiamo concluso, oppure = 0: mostreremo che
in questo caso si possono comunque modicare e G prendendo positivo.
Supponiamo dunque = 0, cosicche
y < x x D(f).
Siccome f(z) R, esiste u R tale che (z, u) / epi(f), e come abbiamo
appena visto, in questa situazione esistono

G X
e > 0 tali che, posto

66
= Re

G,
z +u < = infx +t : (x, t) epi(f).
Scegliamo c > 0 abbastanza grande da far s` che
s < c( y) + y.
Allora risulta
(c +)y +s < +c (c +)x +t (x, t) epi(f),
da cui, posto G = cG+

G e = Re G = c +, si ha
y +s < infx +t : (x, t) epi(f).
La tesi è provata anche in questo caso.
Le funzioni convesse e semicontinue inferiormente hanno la proprietà di essere
approssimabili dal basso con funzioni ani.
vesso di Hausdor e sia f : X R una funzione convessa, semicontinua
inferiormente e tale che f(x) > per ogni x X. Allora:
(i) f ha una funzione ane minorante g, ossia esistono b R e G : X C
lineare e continuo, tali che f(x) g(x) = Re Gx +b per ogni x X;
(ii) f è linviluppo delle sue funzioni ani minoranti, ossia
f(x) = supg(x) : g è una funzione ane, g f in X x X.
Dimostrazione Anzitutto, se f + si ha f(x) = + = sup
nN
n e (i),
(ii) sono ovvie.
Se invece esiste z X tale che f(z) R, in particolare epi(f) è un convesso
chiuso non vuoto; sia allora y X e sia a ] , f(y)[: proveremo che esiste
una funzione ane g, minorante f, tale che a < g(y). Ciò proverà la tesi.
Dato che (y, a) / epi(f), applicando il lemma 2.3.6 (ii) troviamo G : X C
lineare e continuo e > 0 tali che, posto = Re G,
y +a < = infx +t : (x, t) epi(f).
67
Perciò, posto g(x) =
1
x +

, si ha
a < g(y), g(x) f(x) x D(f),
e a maggior ragione
g(x) f(x) x X,
che è quanto si voleva.
Se f è una funzione qualunque su uno spazio vettoriale topologico X, è pos-
sibile considerare la pi` u grande funzione convessa semicontinua inferiormente
e minore di f. Pi` u precisamente:
Denizione 2.3.8 Sia X uno spazio vettoriale topologico e sia f : X R
una funzione. La regolarizzata semicontinua di f è linviluppo delle funzioni
convesse e semicontinue inferiormente minoranti di f, ossia è la funzione
f(x) = supg(x) : g : X R, g è convessa
e semicontinua inferiormente, g f in X, x X.
Notiamo che esistono sempre funzioni convesse e semicontinue minoranti di
f: ad esempio, g(x) . Dunque f è sempre ben denita.
`
E immediato
vericare che f(x) f(x) per ogni x X; si noti poi che per lesercizio 2.1.2
f è convessa, e per il corollario 2.2.3 f è semicontinua inferiormente.
Il caso pi` u signicativo in cui si applica la denizione 2.3.8 è quello in cui la
funzione f di partenza è già convessa. In tal caso si ha:
Proposizione 2.3.9 Sia X uno spazio vettoriale topologico, sia f : X R
convessa, e sia f la sua regolarizzata semicontinua. Allora:
(i) epi(f) = epi(f);
(ii) se x
0
X e liminf
xx
0
f(x) < +, allora f(x
0
) = liminf
xx
0
f(x);
(iii) f è semicontinua inferiormente in un punto x
0
X se e solo se risulta
f(x
0
) = f(x
0
).
Si noti che se la condizione liminf
xx
0
f(x) < è violata, la proprietà (ii)
non vale in generale: ad esempio per la funzione I
{0}
in R si ha I
{0}
(0) =
I
{0}
(0) = 0 < + = liminf
x0
I
{0}
(x).
Dimostrazione (i) Poiche f è semicontinua inferiormente e f f, epi(f)
è chiuso e contiene epi(f): quindi epi(f) epi(f).
68
Proviamo che, viceversa, epi(f) epi(f). Mostreremo che epi(f) = epi(g),
con g funzione convessa, semicontinua inferiormente e tale che g f in
X; da ciò, per denizione di f, seguirà che g f e dunque che epi(f) =
epi(g) epi(f). Osserviamo a questo scopo che per ogni x X linsieme
epi(f)(xR) è sempre una semiretta (eventualmente vuota, o coincidente
con tutto R): infatti se (x, t) epi(f) esiste un net (x
i
, t
i
)
iI
epi(f) tale
che x
i
x in X e t
i
t in R; quindi, ssato > t si troverà i
0
I
per cui risulta t
i
per i i
0
. Di conseguenza avremo f(x
i
) t
i
,
cioè (x
i
, ) epi(f), per ogni i i
0
, e quindi passando al limite otteniamo
(x, ) epi(f). In altre parole, abbiamo mostrato che
(x, t) epi(f) = (x, ) epi(f) > t.
Possiamo allora denire la funzione g nel modo seguente:
g(x) =
_
+ se epi(f) (x R) = ,
inft R : (x, t) epi(f) altrimenti.
`
E facile vericare che epi(g) = epi(f), e dunque epi(g) è chiuso; essendo la
chiusura del convesso epi(f), epi(g) è anche convesso e, ovviamente, contiene
epi(f). Ne segue che g è semicontinua inferiormente e convessa, e che g f
in X. Ciò prova (i).
(ii) Poiche f è semicontinua inferiormente e f f in X, si ha
f(x
0
) liminf
xx
0
f(x) liminf
xx
0
f(x) x
0
X.
Proviamo la disuguaglianza opposta. Per la parte già provata, f(x
0
) < +.
Sia t ]f(x
0
), +[: allora (x
0
, t) epi(f) = epi(f). Quindi, se U
i
I
i
iI
è
un sistema fondamentale di intorni di (x
0
, t) in X R, per ogni i I esiste
un punto (x
i
, t
i
) (U
i
I
i
) epi(f). Se risulta x
i
,= x
0
per inniti indici
i I, essendo f(x
i
) t
i
deduciamo che liminf
xx
0
f(x) t.
Se invece risulta x
i
= x
0
denitivamente, allora otteniamo f(x
0
) t
i
deni-
tivamente, da cui f(x
0
) t; in questo caso, daltronde, è facile provare che
liminf
xx
0
f(x) f(x
0
). Infatti, posto per comodità = liminf
xx
0
f(x),
ssato > 0 esiste un intorno V di 0, che possiamo supporre bilanciato, tale
che
< inf
yV \{0}
f(x
0
+y) .
69
Per denizione di estremo inferiore, si può anche trovare un punto V 0
in modo che
inf
yV \{0}
f(x
0
+y) f(x
0
+) +.
Sia ora ]0, 1]; poiche V è bilanciato, si ha V . Dunque, per convessità,
f(x
0
+) = f((1 )x
0
+(x
0
+))
(1 )f(x
0
) +f(x
0
+)
(1 )f(x
0
) +( +) < +.
Per 0
+
, si deduce f(x
0
), e per larbitrarietà di si ricava
f(x
0
).
Abbiamo cos` ottenuto, in tutti i casi, che liminf
xx
0
f(x) t per ogni
t > f(x
0
): dunque liminf
xx
0
f(x) f(x
0
) e (ii) è provata.
(iii) La relazione f(x
0
) = f(x
0
) implica
f(x
0
) liminf
xx
0
f(x) liminf
xx
0
f(x).
Supponiamo viceversa che f sia semicontinua inferiormente in x
0
. Se f(x
0
) =
+, allora essendo f f si ha a maggior ragione f(x
0
) = + = f(x
0
).
Se invece f(x
0
) < +, allora per ogni t > f(x
0
) risulta (x
0
, t) epi(f) =
epi(f): quindi esiste un net (x
i
, t
i
)
iI
epi(f) tale che x
i
x in X e
t
i
t in R. Se x
i
,= x
0
per inniti indici avremo di conseguenza
f(x
0
) liminf
i
f(x
i
) liminf
i
t
i
= t t > f(x
0
),
mentre, nel caso in cui sia x
i
= x
0
denitivamente, la stessa relazione segue
in modo ancora pi` u semplice. In denitiva, per larbitrarietà di t, otteniamo
f(x
0
) f(x
0
). Ciò implica luguaglianza.
Esercizi 2.3
1. Esibire una funzione convessa, semicontinua inferiormente, non propria
e non identicamente uguale ne a +, ne a .
2. Esibire una funzione convessa, propria e non semicontinua inferiormen-
te in almeno un punto.
70
3. Esibire una funzione convessa, propria, semicontinua inferiormente ma
non continua in almeno un punto.
4. Sia X uno spazio di Banach. Si verichi che una funzione convessa,
semicontinua inferiormente e propria può non avere minimo su X.
5. Sia X uno spazio di Banach riessivo, sia K X un convesso non
vuoto, chiuso e limitato e sia f : K R una funzione quasi convessa e
semicontinua inferiormente. Si provi che f ha minimo su K.
6. Sia X uno spazio di Hilbert e poniamo
J(x) =
1
2
|x|
2
(z, x), x X,
ove z è un ssato elemento di X. Si provi che:
(i) J è una funzione strettamente convessa, continua e nita;
(ii) J(x) per |x| ;
(iii) J ha minimo su X ed il punto di minimo è z;
(iv) se K X è un convesso chiuso, allora J ha minimo su K ed
il punto di minimo u è lunica soluzione in K della disequazione
variazionale
Re (u, v u) Re (z, v u) v K.
[Traccia: per (iv) si usi la condizione
_
d
dt
J(tv + (1 t)u)
t=0
0.]
7. Sia H uno spazio di Hilbert, sia e
k
kN
+ un sistema ortonormale
completo e sia F = B(0, 1) B(0,
1
2
). Posto
f(x) = I
F
(x) +
k=1
[(x, e
k
)
H
[
k
x X,
si provi che f è una funzione semicontinua inferiormente che non ha
minimo nel chiuso limitato F.
8. Sia X uno spazio vettoriale topologico reale. Si provi che i funzionali
lineari su X R sono tutti e soli quelli della forma (x, t) Gx + t,
con R e G : X C lineare. Si verichi poi che i funzionali lineari
e continui su X R sono tutti e soli quelli della forma precedente con
R e G : X C lineare e continuo.
71
9. Sia f una funzione convessa su uno spazio vettoriale topologico X, e
sia f la sua regolarizzata semicontinua. Se liminf
xx
0
f(x) < + per
ogni x
0
X, si provi che
x X : f(x) =
>
x X : f(x) R.
2.4 Funzioni convesse continue
Vediamo qualche condizione che assicuri la continuità di una funzione conves-
sa. Cominciamo con un lemma che verrà usato sistematicamente nel seguito
del paragrafo.
Lemma 2.4.1 Sia X uno spazio vettoriale topologico, sia f : X R con-
vessa. Se z
0
X e f è limitata superiormente in un intorno di z
0
, allora f
è continua in z
0
.
Dimostrazione Per ipotesi, esiste K > 0 ed esiste un intorno bilanciato V
di 0 tale che f(y) K per ogni y z
0
+V . Sia ]0, 1[: se x V , si ha
f(z
0
+x) = f
_
(1 )z
0
+
_
z
0
+
x
__
(1 )f(z
0
) +f
_
z
0
+
x
_
(1 )f(z
0
) +K.
Da qui segue intanto che se f(z
0
) = , allora f in z
0
+V , e dunque
f è continua in z
0
. Quindi possiamo supporre che f(z
0
) > ; in questo
caso, per sottrazione otteniamo
f(z
0
+x) f(z
0
) ([f(z
0
)[ +K) x V.
Daltra parte, se x V si ha
f(z
0
) = f
_
1
2
(z
0
+x) +
1
2
(z
0
x)
_
1
2
f(z
0
+x) +
1
2
f(z
0
x),
da cui, osservando che se x V anche x V ,
f(z
0
) f(z
0
+x) f(z
0
x) f(z
0
) ([f(z
0
)[ +K) x V ;
quindi si conclude che
[f(z
0
+x) f(z
0
)[ ([f(z
0
)[ +K) x V,
cosicche f è continua in z
0
.
72
Teorema 2.4.2 Sia X uno spazio vettoriale topologico e sia f : X R
convessa e propria. Sono fatti equivalenti:
(i)
D(f) è non vuoto e f è continua in ogni punto di
D(f);
(ii) esiste z
0

D(f) tale che f è continua in z

0
;
(iii) esiste z
0
D(f) tale che f è limitata superiormente in un intorno di
z
0
.
Dimostrazione (i) = (ii) Ovvio.
(ii) = (iii) Poiche f è continua nel punto z
0

D(f), si ha f(z
0
) R
ed esiste un intorno bilanciato V di 0 tale che f(y) < f(z
0
) + 1 per ogni
y z
0
+V . Quindi f è limitata superiormente in un intorno di z
0
.
(iii) = (i) Per ipotesi esiste un intorno bilanciato V di 0 tale che f(y)
K < + per ogni y z
0
+ V ; in particolare, z
0

D(f). Sia z un arbitrario

punto di
D(f): allora esiste t > 0 tale che z
= z + t(z z
0
) D(f).
Consideriamo lintorno W = z+
t
t+1
V di z: per ogni u W si ha u = z+
t
t+1
y
con y V , da cui, essendo z =
1
t+1
(z
+tz
0
), otteniamo per ogni y V , ossia
per ogni u W,
f(u) = f
_
1
t + 1
(z
+tz
0
) +
t
t + 1
y
_
= f
_
1
t + 1
z
+
t
t + 1
(z
0
+y)
_
1
1 +t
f(z
) +
t
t + 1
f(z
0
+y)
1
t + 1
[f(z
)[ +
t
t + 1
K.
Dunque f è limitata superiormente nellintorno W di z. Per il lemma 2.4.1,
f è continua nel punto z.
Corollario 2.4.3 Sia X uno spazio vettoriale topologico e sia f : X R
convessa e propria. Se f è semicontinua superiormente in un punto x
0

D(f), allora f è continua in
D(f).
Dimostrazione Dallipotesi segue che + > f(x
0
) limsup
xx
0
f(x),
quindi esiste un intorno V di x
0
tale che
sup
V
f f(x
0
) + 1 < +.
73
Dal teorema 2.4.2 segue la tesi.
Dai risultati precedenti segue che in relazione alla continuità le funzioni con-
vesse hanno un comportamento analogo a quello delle funzioni lineari: la
continuità equivale alla continuità in un singolo punto ed alla locale limi-
tatezza nellintorno di un singolo punto. La dierenza sta nel fatto che la
continuità non è globale in X, ma solo in
D(f). Se però si considerano solo

funzioni convesse nite, allora
D(f)= D(f) = X e lanalogia è perfetta.

Vediamo ora qualche situazione particolare in cui sulla continuità delle fun-
zioni convesse si può dire qualcosa di pi` u.
Teorema 2.4.4 Sia X uno spazio di Banach e sia f : X R una funzione
convessa e semicontinua inferiormente. Allora f è continua su X.
Dimostrazione Fissato x
0
X, basterà provare che f è limitata superior-
mente in un intorno di x
0
. Sia
A = x X : f(x
0
x) [f(x
0
)[ + 1;
poiche f è convessa e semicontinua inferiormente, A è convesso e chiuso;
inoltre 0 A ed A è simmetrico. Se x X si ha, scelto un intero n >
maxf(x
0
+ x) f(x
0
), f(x
0
x) f(x
0
) (il che è possibile essendo f a
valori in R),
f
_
x
0
1
n
x
_
= f
__
1
1
n
_
x
0
+
1
n
(x
0
x)
_
_
1
1
n
_
f(x
0
) +
1
n
f(x
0
x) =
= f(x
0
) +
1
n
[f(x
0
x) f(x
0
)] [f(x
0
)[ + 1.
Dunque, con questa scelta di n si ha x nA. Ciò prova che X =
nN
+
nA.
Dato che X è uno spazio di Banach, il teorema di Baire ci dice che esiste
N
+
tale che A ha parte interna non vuota: dunque esiste una palla
B(y
0
, r) contenuta in A. Quindi, se w B(0, r) si ha y
0
w A, ed
essendo A simmetrico abbiamo anche y
0
w A. Poiche A è convesso,
deduciamo poi che w =
1
2
(w + y
0
) +
1
2
(w y
0
) A; si conclude pertanto
che B(0, r) A, ossia B(0,
r
) A. Per denizione di A, ciò signica che f

è limitata superiormente in B(x
0
,
r
). Ne segue la tesi.
74
Proposizione 2.4.5 Sia X uno spazio normato e sia f : X R convessa.
Se f è limitata in una palla B(x
0
, r), allora f è localmente lipschitziana in
B(x
0
, r).
Dimostrazione Sia x B(x
0
, r) e sia > 0 tale che B(x, 2) B(x
0
, r);
proveremo che f è lipschitziana in B(x, ). Per ipotesi, N
x
= sup
B(x,2)
[f[ <
. Se x
1
, x
2
B(x, ), poniamo d = |x
1
x
2
| e x
3
= x
2
+

d
(x
2
x
1
). Allora
x
3
B(x, 2) e x
2
=

d+
x
1
+
d
d+
x
3
; quindi per convessità deduciamo
f(x
2
)

d +
f(x
1
) +
d
d +
f(x
3
),
da cui
f(x
2
) f(x
1
)
d
d +
[f(x
3
) f(x
1
)]
d
[f(x
3
) f(x
1
)[
2N
x
|x
1
x
2
|.
Scambiando i ruoli di x
1
e x
2
, si conclude che
[f(x
2
) f(x
1
)[
2N
x
|x
1
x
2
|.
Inne enunciamo un risultato di dierenziabilità, dovuto a Mazur, valido in
spazi di Banach separabili, la dimostrazione del quale sarà fornita nel capitolo
5.
Teorema 2.4.6 (di Mazur) Sia X uno spazio di Banach separabile, sia
D X un aperto convesso non vuoto e sia f : D R una funzione convessa
e continua. Allora f è G-dierenziabile in un insieme D
0
D, denso in D,
che è unione numerabile di aperti densi.
Esercizi 2.4
1. Sia X uno spazio vettoriale topologico di dimensione nita. Se f : X
R è convessa e propria, si provi che f è continua su
D(f).
[Traccia: Se x
0

D(f), si ssi un cubo C di centro x

0
contenuto in
D(f), e si osservi che ogni x C è combinazione convessa dei vertici
x
i
del cubo; se ne deduca che f(x) maxf(x
i
) per ogni x C e di
qui si ricavi la tesi.]
75
2. Sia X uno spazio vettoriale topologico e sia K X un convesso con-
tenente 0. Si provi che il funzionale di Minkowski p
K
è una funzione
continua se e solo se 0
K.
3. Sia X uno spazio normato. Esibire una funzione f : X R continua,
ma non w-continua.
2.5 Funzioni coniugate
La nozione di funzione coniugata (relativa ad una funzione assegnata) è assai
utile nelle applicazioni ai problemi di ottimizzazione, specialmente nel caso in
cui la funzione assegnata sia convessa. Si può comunque denire la coniugata
di una funzione qualunque.
Denizione 2.5.1 Sia X uno spazio normato reale e sia f : X R. La
coniugata, o polare, di f è la funzione f
: X
R cos` denita:
f
() = sup
xX
x f(x) X
.
Osservazioni 2.5.2 (1) La denizione ha sempre senso, in quanto x è un
numero reale per ogni x X; risulta f
() b se e solo se la funzione ane

x x b è minorante di f.
(2) La funzione f
è sempre convessa e w
-semicontinua inferiormente, per-

che è lestremo superiore di funzioni che, rispetto alla variabile , sono con-
vesse e w
-semicontinue inferiormente.
(3) Può capitare che sia f
+: ad esempio, se X = R e f(x) = e
x
,
si ha f
(y) = sup
xR
yx + e
x
= + per ogni y R
= R. Però quan-
do f è convessa ciò non può accadere (sotto certe ipotesi), come mostra la
proposizione che segue.
Proposizione 2.5.3 Sia X uno spazio normato reale e sia f : X R una
funzione convessa, semicontinua inferiormente e propria. Allora la coniugata
f
è propria.
Dimostrazione Per ipotesi, D(f) è non vuoto, quindi scelto x D(f) si ha
f
() xf(x) > . Inoltre, per la proposizione 2.3.7, esistono X
e b R tali che f(x) x + b per ogni x X: dunque, per losservazione

precedente, f
() b, cosicche f
è propria.
76
Osservazione 2.5.4
`
E utile precisare la seguente proprietà: si ha f
() >
per ogni X
se e solo se f non è identicamente uguale a +. La

dimostrazione si lascia al lettore (esercizio 2.5.1).
Il termine coniugata di f si giustica sulla base della seguente proprietà:
Proposizione 2.5.5 (disuguaglianza di Young) Sia X uno spazio nor-
mato reale e sia f : X R. Se f
è la coniugata di f, si ha
f
() x f(x) X
, x X.
In particolare, se f è propria la disuguaglianza acquista la forma simmetrica
x f(x) +f
() X
, x X.
Dimostrazione La prima forma della disuguaglianza è banale conseguenza
della denizione di f
. Per la seconda basta osservare che se f è propria,

allora f
> per losservazione 2.5.4, e quindi la somma f(x) + f
() è
sempre ben denita.
Esempi 2.5.6 (1) Sia X = R. Fissato p ]1, [, poniamo
f(x) =
[x[
p
p
, x R.
Allora
f
(y) = sup
xR
_
yx
[x[
p
p
_
=
[y[
q
q
y R,
ove
1
p
+
1
q
= 1. Infatti, f
(y) [y[
q
/q per la disuguaglianza di Young classica,
e vale luguaglianza, come si verica facilmente, quando x = sgn(y) [y[
q/p
.
(2) Sia X = R e sia f(x) = [x[. Allora
f
(y) = sup
xR
yx [x[ =
_
0 se [y[ 1,
+ se [y[ > 1.
(3) Sia X = R e sia f(x) = e
x
. Allora si trova facilmente che
f
(y) = sup
xR
yx e
x
=
_
_
_
+ se y < 0,
0 se y = 0,
y(log y 1) se y > 0.
77
(4) Sia X uno spazio normato reale e sia U un sottoinsieme non vuoto di
X. Per la funzione I
U
si ha
I
U
() = sup
xX
x I
U
(x) = sup
xU
x;
la funzione I
U
si chiama funzione di supporto di U. Essa è positivamente
omogenea e subadditiva; inoltre vale lequivalenza
U x X : x I
U
() .
Le proprietà della funzione coniugata sono raccolte nella seguente
Proposizione 2.5.7 Sia X uno spazio normato reale e siano f, g, f
i
: X
R. Allora:
(i) f
(0) = inf
xX
f(x);
(ii) se f g, allora f
;
(iii) (inf
iI
f
i
)
= sup
iI
f
i
;
(iv) (sup
iI
f
i
)
inf
iI
f
i
;
(v) (f)
() = f
) per ogni X
e per ogni > 0;

(vi) posto f
u
(x) = f(x u), si ha f
u
() = f
() + u per ogni X
e
per ogni u X.
Dimostrazione Sono tutte facili conseguenze della denizione 2.5.1.
Possiamo anche considerare la bipolare di f, ossia la coniugata di f
: sarà
la funzione f
: X
R denita da
f
() = sup
X
() X
.
La funzione f
è convessa e semicontinua inferiormente rispetto alla topo-

logia debole* di X
. Se calcoliamo f
nel punto = J
x
, ove x X e J è
limmersione canonica di X in X
, si ha per la disuguaglianza di Young

f
(J
x
) = sup
X
x f
() f(x) x X.
Tuttavia, sotto opportune ipotesi, f
(J
x
) coincide con f(x).
78
Teorema 2.5.8 (di Fenchel-Moreau) Sia X uno spazio normato reale e
sia f : X R propria. Allora si ha f
(J
x
) = f(x) per ogni x X se e solo
se f è convessa e semicontinua inferiormente.
Dimostrazione (=) Sappiamo che f
è convessa e semicontinua inferior-

mente per la topologia debole* di X
; quindi f
J è convessa e semiconti-
nua inferiormente per la topologia debole di X. Essendo f(x) = f
(J
x
) per
ogni x X, tale è anche f e a maggior ragione si ha la tesi.
(=) Poiche f
(J
x
) f(x), la tesi è banale se f
(J
x
) = +. Inoltre, sic-
come f è propria, f
non è identicamente + e di conseguenza f
>
(osservazione 2.5.4). Perciò dobbiamo provare che se f
(J
x
) R, allora
f
(J
x
) = f(x).
Supponiamo, per assurdo, che esista x
0
X tale che f
(J
x
0
) < f(x
0
). Al-
lora (x
0
, f
(J
x
0
)) non appartiene al convesso chiuso epi(f); dunque, per il
lemma 2.3.6 (ii), esistono X
, > 0 e R tali che

x
0
+f
(J
x
0
) < = inf
(x,t)epi(f)
x +t.
Osservato che
= inf
(x,t)epi(f)
x +t = inf
xD(f)
x +f(x) =
= sup
xD(f)
x f(x) = (f)
() = f
_
,
dividendo la disuguaglianza precedente per si ricava
1
x
0
+f
(J
x
0
) < f
_
.
Questa relazione contraddice la disuguaglianza di Young: essendo f
> ,
deve infatti essere
x
0
= J
x
0
_
_
f
(J
x
0
) +f
_
.
Osservazione 2.5.9 Se X è uno spazio normato reale e f : X R è
una funzione convessa che non è semicontinua inferiormente, allora f
(J
x
)
coincide con f(x), ove f è la regolarizzata semicontinua di f introdotta nella
denizione 2.3.8. Infatti, f
J è convessa, semicontinua inferiormente e

minorante di f: quindi, per denizione di regolarizzata semicontinua, si ha
79
f
J f. Daltra parte, se g è una funzione convessa, semicontinua

inferiormente e minorante di f, dalla proposizione 2.5.7 segue g
e
g
. Ma dal teorema di Fenchel-Moreau otteniamo

g(x) = g
(J
x
) f
(J
x
) x X,
e quindi, per larbitrarietà di g, deduciamo f f
J.
Esempio 2.5.10 Sia X uno spazio normato reale. Se U è un sottoinsieme
non vuoto di X, consideriamo la funzione indicatrice I
U
(si veda lesem-
pio 2.5.6 (4)). Losservazione precedente ci dice che I
U
J = I
U
; daltra
parte, poiche il minimo convesso chiuso contenente U è co(U), si riconosce
facilmente che I
U
= I
co(U)
. Abbiamo cos` provato che
I
U
(J
x
0
) = I
co(U)
(x
0
) x
0
X,
e naturalmente risulta in generale I
co(U)
(x) < I
U
(x), salvo che U non sia
un convesso chiuso di X; in questo caso, come è giusto, I
U
è convessa e
semicontinua inferiormente.
Esercizi 2.5
1. Sia X uno spazio normato e sia f : X R. Si provi che la coniugata
f
non assume il valore se e solo se f non è identicamente uguale

a +.
2. Sia X uno spazio normato. Si calcoli f
quando f X
.
3. Sia X = R. Determinare le coniugate delle funzioni:
f
1
(x) = cosh x, f
2
(x) = maxe
x
, e
x
,
f
3
(x) =
_
log x se x > 0
+ se x 0,
f
4
(x) =
_
cos x se [x[ < 1
+ se [x[ 1.
4. Vericare con un esempio che in generale si ha
minf
1
, f
2
, = (maxf
1
, f
2
)
.
5. Sia X = R. Per ogni n N
+
si calcoli la coniugata della funzione
f
n
(x) =
n
_
1 +[x[
n
.
80
6. Sia X = R
N
. Si calcoli la coniugata della funzione f(x) =
1
2
(Qx, x)
R
N,
ove Q è una matrice N N denita positiva.
7. Sia X uno spazio normato e sia H : R R una funzione convessa e
semicontinua inferiormente. Posto F(x) = H(|x|
X
) per ogni x X e
G() = H
(||
X
) per ogni X
, si provi che F
= G.
8. Sia X uno spazio normato e sia A X un convesso contenente 0. Se
p
A
è il funzionale di Minkowski di A, si provi che
p
A
= I
{X
:I
A
()1}
.
9. Sia X uno spazio di Banach riessivo e sia U un sottoinsieme non
vuoto, convesso e limitato di X. Si provi che si ha I
U
() = se e
solo se il semipiano x X : x contiene U e liperpiano ane
x X : x = è di appoggio per U.
10. Sia U = (x, y) R
2
: x > 0, xy < 1. Si verichi che I
U
(0, 1) = 0,
che U è contenuto nel semipiano y 0 ma che la retta y = 0 non è di
appoggio per U.
11. Si consideri in L
1
(R) il convesso limitato U = co(
[n,n+1]
nZ
). Posto
F =
_
R
e
x
2
(x)dx per ogni L
1
(R), si provi che risulta I
U
(F) =
0, che U L
1
(R) : F 0 ma che il semispazio L
1
(R) :
F 0 non è di appoggio per U.
12. Sia X uno spazio normato e siano U, V convessi non vuoti contenuti
in X. Si provi che U V se e solo se I
U
I
V
, dove I
U
e I
V
sono le
rispettive funzioni di supporto (esempio 2.5.6 (4)).
2.6 Problemi di ottimizzazione
Le funzioni coniugate mostrano tutta la loro utilità nei problemi di ottimiz-
zazione che coinvolgono funzioni convesse. In questo paragrafo illustriamo
alcuni esempi relativi a questa vasta tematica.
Ci occuperemo del problema
min
uX
F(u)
81
ove F : X Rè una funzione convessa, semicontinua inferiormente e propria
e X è uno spazio normato reale; cercheremo di caratterizzare i punti di
minimo attraverso delle opportune relazioni di estremalità. A questo scopo
sarà conveniente immergere il problema sopra descritto in una famiglia di
problemi del tipo
min
uX
(u, p)
ove p è un parametro che varia in un altro spazio normato reale Y , e è
unaltra funzione convessa, semicontinua inferiormente e propria in X Y ,
tale che (u, 0) = F(u) per ogni u X.
Cominciamo con alcuni fatti preliminari.
Lemma 2.6.1 Siano X, Y spazi normati reali e sia : X Y R una
funzione convessa. Allora la funzione
h(y) = inf
uX
(u, y), y Y,
è convessa.
Dimostrazione Siano p, q Y tali che non risulti h(p) = h(q) = . Se
h(p) oppure h(q) vale +, la disuguaglianza di convessità è ovvia; supponia-
mo dunque h(p) < + e h(q) < +. Fissiamo a > h(p) e b > h(q): allora
esistono u, v X tali che
h(p) (u, p) < a, h(q) (v, q) < b.
Dunque per ogni ]0, 1[ si ha
h(p + (1 )q) = inf
wX
(w, p + (1 )q)
(u + (1 )v, p + (1 )q)
(u, p) + (1 )(v, q) a + (1 )b,
e per larbitrarietà di a > h(p) e b > h(q) si ottiene la disuguaglianza di
convessità.
Lemma 2.6.2 Nelle ipotesi del lemma 2.6.1, la coniugata della funzione
h(y) = inf
uX
(u, y) è data da
h
() =
(0, ) Y
,
ove
è la coniugata di , ossia
(, ) = sup
uX, yY
u +y (u, y) X
, Y
.
82
Dimostrazione Si ha
h
() = sup
yY
y h(y) = sup
yY
y inf
uX
(u, y) =
= sup
yY
_
y + sup
uX
(u, y)
_
=
= sup
yY
sup
uX
y (u, y) =
(0, ).
Ciò premesso, ssiamo le nostre ipotesi, che varranno per tutto il resto del
paragrafo. Sono dati due spazi normati reali X e Y , e una funzione :
XY R convessa, semicontinua inferiormente e propria, tale che (u, 0) =
F(u) per ogni u X. Chiameremo problema primale quello che consiste
nel trovare il minimo di F su X; diremo invece problema duale il problema
di massimizzazione seguente:
max
Y
(0, ).
Osservazione 2.6.3 Per il lemma 2.6.2 e per denizione di bipolare, risulta
sup
Y
(0, ) = sup
Y
() = h
(J
0
) h(0) = inf
uX
(u, 0),
e tale quantità non vale +, essendo F = (, 0) propria; potrebbe però
valere , come mostra lesempio di (u, y) = u y +e
uy
in X Y = R
2
:
in questo caso si ha infatti h(y) e h
() +.
Andiamo ad analizzare le relazioni fra il problema primale e il problema duale,
cercando condizioni che assicurino la risolubilità di entrambi: scopriremo che
questo comporterà anche luguaglianza inf
uX
(u, 0) = sup
Y
(0, ).
Denizione 2.6.4 Nelle ipotesi precedenti, diciamo che il problema primale
è normale se h(0) = inf
uX
(u, 0) R e se la funzione h è semicontinua
inferiormente nel punto 0 Y .
Denizione 2.6.5 Nelle ipotesi precedenti, diciamo che il problema primale
è stabile se h(0) R e se esiste Y
tale che h(y) h(0) + y per ogni

y Y .
Come vedremo pi` u avanti nel corso, la condizione di stabilità equivale alla
sottodierenziabilità di h nel punto 0.
83
Proposizione 2.6.6 Nelle ipotesi precedenti, il problema primale è normale
se e solo se
sup
Y
(0, ) = inf
uX
(u, 0) R.
Dimostrazione Supponiamo che il problema primale sia normale. Sia h la
regolarizzata semicontinua di h: si ha, per il lemma 2.6.2, per losservazione
2.5.9, per la proposizione 2.3.9 (iii) e per ipotesi,
sup
Y
(0, ) = h
(J
0
) = h(0) = h(0) = inf
uX
(u, 0) R.
Viceversa, se queste quantità coincidono e sono nite, allora h
(J
0
) = h(0) =
h(0) R e quindi il problema primale è normale in virt` u della proposizione
2.3.9 (iii).
Proposizione 2.6.7 Nelle ipotesi precedenti, il problema primale è stabile
se e solo se esso è normale e il problema duale ha soluzione.
Dimostrazione Se il problema primale è stabile, allora esiste
0
Y
tale
che h(y) h(0) +
0
y per ogni y Y ; ne segue
liminf
y
Y
0
h(y) h(0),
quindi h è semicontinua inferiormente in 0. Inoltre per ogni Y
si ha,
grazie al lemma 2.6.2,
(0, ) = h
() = J
0
h
() h
(J
0
) = h(0) h(y)
0
y y Y,
da cui
(0, ) inf
yY
h(y)
0
y = h
(
0
) =
(0,
0
) Y
.
Ci` o prova che
max
Y
(0, ) =
(0,
0
).
Viceversa, se il problema primale è normale e il problema duale ha soluzione
0
, allora
h
(
0
) h
() Y
,
da cui
h
(
0
) = sup
Y
() = h
(J
0
) = h(0),
84
e dunque
h(0) = h
(
0
)
0
y +h(y) y Y :
ciò mostra che il problema primale è stabile.
Osservazione 2.6.8 Di fatto, lipotesi che il problema primale sia normale è
irrinunciabile se vogliamo che esso abbia minimo nito; con lipotesi ulteriore
che il problema primale sia stabile, otteniamo la risolubilità del problema
duale, e lunica cosa che resta da fare è provare lesistenza del minimo per il
problema primale. Lipotesi di stabilità è dunque naturale.
Un semplice criterio di stabilità per il problema primale è il seguente:
Lemma 2.6.9 Oltre alle ipotesi precedenti, supponiamo che h(0) > e
che esista u
0
X tale che la funzione y (u
0
, y) sia continua in 0, con
(u
0
, 0) R. Allora il problema primale è stabile.
Dimostrazione Poiche (u
0
, ) è continua e nita in 0, essa è limitata in un
opportuno intorno aperto V di 0 da una costante K. Dunque
h(y) = inf
uX
(u, y) (u
0
, y) K y V,
per cui h, essendo convessa e limitata superiormente in un intorno di 0, è
continua e nita in tale punto (lemma 2.4.1).
Adesso notiamo che (0, h(0)) appartiene alla frontiera di epi(h) in Y R, e
che epi(h) ha parte interna non vuota poiche contiene laperto V ]K, +[.
Per il lemma 2.3.6 (i), esistono Y
e > 0 tali che

0 +h(0) y +t (y, t) epi(h),
e in particolare, scelti y D(h) e t > h(y), e posto
0
=
,
h(0)
0
y +t y D(h), t > h(y).
Per larbitrarietà di t > h(y) e per il fatto che h(0) R, deduciamo che h è
propria e che
h(0) +
0
y h(y) y Y.
Ci` o mostra che il problema primale è stabile.
Veniamo ora alla questione dellesistenza del minimo per il problema primale,
e soprattutto alla sua caratterizzazione mediante opportune condizioni di
estremalità.
85
Teorema 2.6.10 Nelle ipotesi del lemma 2.6.9, se u X è punto di minimo
per il problema primale e Y
è punto di massimo per il problema duale,

allora u e vericano la relazione di estremalità
( u, 0) +
(0, ) = 0.
Viceversa, se u X e Y
soddisfano tale relazione, allora

( u, 0) = min
uX
(u, 0) = max
Y
(0, ) =
(0, ) R.
Dimostrazione Per il lemma 2.6.9 il problema primale è stabile: quindi, se
u minimizza il problema primale e massimizza il problema duale, allora
( u, 0) = min
uX
(u, 0) = max
Y
(0, ) =
(0, ) R,
cosicche ( u, 0) +
(0, ) = 0.
Viceversa, dalla stabilità del problema primale segue
inf
uX
(u, 0) = max
Y
(0, ) R.
Dunque, essendo
( u, 0) inf
uX
(u, 0) = max
Y
(0, )
(0, ) = ( u, 0),
si ha immediatamente la tesi.
Corollario 2.6.11 Oltre alle ipotesi del lemma 2.6.9, supponiamo che:
(i) X sia uno spazio di Banach riessivo;
(ii) lim
u
X
(u, 0) = +.
Allora il problema primale ha minimo, il problema duale ha massimo e vale
la relazione di estremalità.
Dimostrazione Basta osservare che, per il corollario 2.3.4 ed il lemma 2.6.9
il problema primale ha soluzione ed è stabile; per la proposizione 2.6.7 anche
il problema duale ha soluzione. La tesi segue allora dal teorema precedente.
Vi è un altro modo di caratterizzare i punti di minimo del problema primale
e i punti di massimo del problema duale: essi si ottengono come punti di
sella di unopportuna funzione: la lagrangiana.
86
Denizione 2.6.12 La funzione lagrangiana del problema primale è la fun-
zione L : X Y
R cos` denita:
L(u, ) = inf
yY
(u, y) y u X, Y
.
In altre parole, per ogni ssato u X, L(u, ) è data da
L(u, ) = inf
yY
(u, y) y = sup
yY
y (u, y) = [(u, )]
(),
cioè è lopposta della coniugata di (u, ).
Lemma 2.6.13 Nelle ipotesi del lemma 2.6.1, si ha:
(i) L(u, ) è concava e semicontinua superiormente in Y
per ogni
u X;
(ii) u L(u, ) è convessa in X per ogni Y
.
Dimostrazione (i) Per u X ssato, [(u, )]
è convessa e semicontinua
inferiormente, quindi L(u, ) = [(u, )]
è concava e semicontinua superior-

mente.
(ii) Fissato Y
, L(, ) è lestremo inferiore delle funzioni convesse

(u, y) (u, y) y; quindi la convessità di L(, ) segue con lo stesso ar-
gomento usato nella dimostrazione del lemma 2.6.1.
Tramite la funzione lagrangiana, i problemi primale e duale si possono ri-
formulare come problemi di minimax: si tratta di un punto di vista che
ritroveremo pi` u avanti nel corso, parlando della teoria dei giochi.
Scrivendo
(, ) = sup
uX, yY
u +y (u, y) =
= sup
uX
_
u + sup
yY
y (u, y)
_
= sup
uX
u L(u, ),
ricaviamo
(0, ) = sup
uX
L(u, ) = inf
uX
L(u, ),
e quindi il problema duale si scrive nella forma maximin
sup
Y
inf
uX
L(u, ).
87
Similmente, poiche è convessa e semicontinua inferiormente,
(u, y) = ([(u, )]
J) (y) =
= sup
Y
y [(u, )]
() = sup
Y
y +L(u, ),
da cui
(u, 0) = sup
Y
L(u, ).
Pertanto il problema primale si scrive nella forma minimax
inf
uX
sup
Y
L(u, ).
Osservazione 2.6.14
`
E immediato vericare che
sup
Y
inf
uX
L(u, ) inf
uX
sup
Y
L(u, ) :
infatti
L(u, ) sup
Y
L(u, ) u X, Y
,
da cui
inf
uX
L(u, ) inf
uX
sup
Y
L(u, ) Y
e quindi la tesi. Ritroviamo cos` il risultato dellosservazione 2.6.3.

Denizione 2.6.15 Diciamo che ( u, ) X Y
è punto di sella per la

funzione lagrangiana L se risulta
L( u, ) L( u, ) L(u, ) u X, Y
.
Teorema 2.6.16 Nelle ipotesi del lemma 2.6.9, sia ( u, ) X Y
. Sono
fatti equivalenti:
(i) ( u, ) è punto di sella per la lagrangiana L,
(ii) u minimizza il problema primale, massimizza il problema duale e
min
uX
(u, 0) = max
Y
(0, ) R.
88
Dimostrazione Ricordiamo anzitutto che, per i calcoli fatti in precedenza,
inf
uX
L(u, ) =
(0, ), sup
Y
L( u, ) = ( u, 0).
Supponiamo che valga (i): allora si ha
(0, ) = min
uX
L(u, ) = L( u, ) = max
Y
L( u, ) = ( u, 0) R,
da cui segue subito la relazione di estremalità ( u, 0) +
(0, ) = 0; dal
teorema 2.6.10 segue (ii).
Supponiamo viceversa che valga (ii): essendo
(0, ) = inf
uX
L(u, ) L( u, ), ( u, 0) = sup
Y
L( u, ) L( u, ),
la relazione di estremalità, che vale in virt` u del teorema 2.6.10, implica
L( u, ) = inf
uX
L(u, ) = sup
Y
L( u, ),
cosicche ( u, ) è punto di sella per L.
Corollario 2.6.17 Nelle ipotesi del lemma 2.6.9, sia u X. Allora u mini-
mizza il problema primale se e solo se esiste Y
tale che ( u, ) sia punto

di sella per la lagrangiana L.
Dimostrazione Se tale esiste, la tesi segue dal teorema 2.6.16. Viceversa,
se u minimizza il problema primale, poiche esso è stabile il problema duale
ha una soluzione Y
e si ha
inf
uX
(u, 0) = sup
Y
(0, ) R.
Dunque ( u, ) è punto di sella per L in virt` u del teorema 2.6.16.
Esempio 2.6.18 Consideriamo un caso particolare della situazione conside-
rata n qui: prendiamo la funzione F della forma
F(u) = f(u) +g(u), u X,
ove è un ssato operatore lineare e continuo da X in Y , mentre f : X R
e g : Y R sono funzioni convesse, semicontinue inferiormente e proprie.
Faremo le ipotesi seguenti:
89
(a) X è uno spazio di Banach riessivo e Y è uno spazio normato (entrambi
reali);
(b) lim
u
X
[f(u) +g(u)] = +,
(c) esiste un punto u
0
X tale che i numeri f(u
0
) e g(u
0
) siano entrambi
niti e che g sia continua nel punto u
0
.
Allora, scegliendo
(u, y) = f(u) +g(u y) (u, y) X Y,
per ogni Y
si ha, denotando con
L(Y
, X
) loperatore aggiunto
di ,
(0, ) = sup
uX
sup
yY
y f(u) g(u y) = [posto u y = p]
= sup
uX
sup
pY
(u p) f(u) g(p) =
= sup
uX
sup
pY
(
)u p f(u) g(p) =
= sup
uX
(
)u f(u) + sup
pY
p g(p) =
= f
) +g
().
Le ipotesi fatte su f e g garantiscono che sono soddisfatte le ipotesi del
corollario 2.6.11. La condizione di estremalità diventa
f( u) +g( u) +f
) +g
( ) = 0;
ma poiche, per la disuguaglianza di Young,
f( u) +f
) (
) u, g( u) +g
( ) ( u) = (
) u,
la relazione di estremalità si scinde nel sistema seguente:
f( u) +f
) = (
) u = g( u) g
( ).
Le soluzioni u, di questo sistema risolvono i problemi primale e duale:
f( u) +g( u) = min
uX
f(u) +g(u) =
= max
Y
) g
() = f
) g
( ).
90
La funzione lagrangiana è data da
L(u, ) = inf
yY
f(u) +g(u y) y =
= inf
pY
f(u) +g(p) (u) +p =
= f(u) (
)u + inf
pY
p +g(p) =
= f(u) (
)u sup
pY
p g(p) = f(u) (
)u g
(),
e il punto ( u, ) è di sella per L. Questo ce lo dice il teorema 2.6.16, ma si
pu` o vedere direttamente: dal sistema che esprime le relazioni di estremalità,
utilizzando la disuguaglianza di Young, segue infatti
L( u, ) = f( u) (
) u g
( ) = f
) g
( )
f(u) (
)u g
( ) = L(u, ) u X,
e similmente
L( u, ) = f( u) (
) u g
( ) = f( u) +g( u)
f( u) ( u) g
() = L( u, ) Y
.
Esempio 2.6.19 Siano X, Y spazi di Banach reali con X riessivo. Sia C
un cono di Y (ciò signica che C + C C e tC C per ogni t 0) che
supponiamo non vuoto, convesso, chiuso e tale che C (C) = 0. Esso
induce una relazione dordine parziale su Y , denita per y, z Y da
y z z y C
(le veriche sono ovvie). Per costruzione risulta C = y Y : 0 y, mentre
C = y Y : y 0. Il cono duale è il cono di Y
denito da
C
= Y
: y 0 y C,
e scriveremo 0 se e solo se C
. Si verica facilmente (esercizio 2.6.2)

che
C = y Y : y 0 C
.
Sia K un convesso chiuso non vuoto di X e sia J : X R una funzione
convessa, semicontinua inferiormente e propria, tale che D(J) = K. Sia inne
91
B : X Y un operatore non necessariamente lineare, convesso rispetto alla
relazione su Y :
B(y + (1 )z) B(y) + (1 )B(z) y, z X, [0, 1].
Supponiamo che valgano le seguenti condizioni:
(a) per ogni C
lapplicazione u (B(u)) è semicontinua inferior-

mente in K;
(b) linsieme x K : B(x)
C
è non vuoto;
(c) risulta infJ(u) : u K, B(u) 0 R;
(d) si ha lim
u
X
, B(u)0
J(u) = +.
Il nostro problema primale sarà
min
uK, B(u)0
J(u),
e sceglieremo la funzione cos` denita:
(u, y) = J(u) +I
C
(y B(u)) =
_
J(u) se u K e B(u) y
+ altrimenti.
Occorre vericare che le ipotesi del corollario 2.6.11 sono soddisfatte.
`
E
immediato vericare, grazie a (c), che e (, 0) sono proprie. Proviamo che
è convessa e semicontinua inferiormente: posto
E = (u, y) X Y : u K, B(u) y,
si può scrivere
(u, y) = J(u) +I
E
(u, y),
e quindi, ricordando che J è convessa e semicontinua inferiormente, basta far
vedere che E è un convesso chiuso in X Y . Dato che
E =
(u, y) X Y : u K, (B(u) y) 0,
in virt` u di (a) linsieme E è intersezione di convessi chiusi e quindi è un
convesso chiuso.
92
Inne, la condizione di stabilità del problema primale segue da (b): infatti,
scelto u
0
K tale che B(u
0
)
C
, esiste un intorno V di 0 Y tale che
B(u
0
) y 0 per ogni y V : ne segue (u
0
, y) = J(u
0
) per ogni y V ,
cosicche y (u
0
, y) è nita e continua nel punto 0. Notiamo anche che (d)
implica lesistenza del minimo per il problema primale.
Si ha allora, procedendo come nellesempio 2.6.18,
(0, ) = sup
uX
sup
yY
y J(u) I
C
(y B(u)) = [y B(u) = p]
= sup
uK
sup
pY
(B(u)) +p J(u) I
C
(p) =
= sup
uK
(B(u)) J(u) +I
C
();
notando poi che, come si verica facilmente,
I
C
() = sup
0y
y = I
C
() Y
,
si conclude che
(0, ) = sup
uK
(B(u)) J(u) +I
C
().
Quindi il problema duale è
max
Y
_
inf
uK
J(u) (B(u)) I
C
()
_
= max
C
inf
uK
J(u) (B(u)).
La condizione di estremalità è
J( u) +I
C
(B( u)) + sup
uK
(B(u)) J(u) +I
C
( ) = 0;
essa implica u K, B( u) 0, C
(da cui (B( u)) 0) e

J( u) + sup
uK
(B(u)) J(u) = 0.
Poiche, per denizione,
J( u) + sup
uK
(B(u)) J(u) (B( u)) 0,
93
la relazione di estremalità implica le semplici condizioni
u K, B( u) 0, 0; (B( u)) = 0,
le quali tuttavia non sono equivalenti alla relazione di estremalità: ad esempio
esse sono soddisfatte per = 0, ma non è detto che il funzionale 0 Y
massimizzi
(0, ).
La lagrangiana è data da
L(u, ) = inf
yY
J(u) +I
C
(y B(u)) y =
= inf
pY
J(u) +I
C
(p) (B(u)) p =
= J(u) (B(u)) + inf
pY
I
C
(p) p =
= J(u) (B(u)) sup
pY
p I
C
(p) =
= J(u) (B(u)) I
C
().
La relazione di estremalità, come sappiamo, equivale al fatto che ( u, ) è
punto di sella per L, cosa che, volendo, si può anche vericare direttamente
senza troppa fatica.
Esercizi 2.6
1. Sia X uno spazio normato, e sia K X un convesso chiuso non vuoto.
Si provi che
d(x
0
, K) = max
X
=1
x
0
I
K
() x
0
K.
2. Sia Y uno spazio di Banach, sia C un cono di Y che supponiamo non
vuoto, convesso, chiuso e tale che C (C) = 0. Detto C
il cono
duale di Y
rispetto alla relazione dordine indotta da C, si verichi

che C coincide con y Y : y 0 C
.
[Traccia: per la seconda inclusione si ragioni per assurdo utilizzando
il teorema di Hahn-Banach.]
3. (Teorema di Karush-Kuhn-Tucker) Per ogni k N
+
si introduca in R
k
lordinamento indotto dal cono
k
= x R
k
: x
i
0, i = 1, . . . , k.
94
Sia poi A = a
ij
una matrice reale mn. Fissati c R
n
, b R
m
, si
consideri il problema primale
min
uV
c, u)
n
, V = u R
n
: u 0, Au b.
(i) Posto (u, y) = c, u)
n
+ I
n
(u) + I
m
(b + y Au), si provi che il
problema duale è
max
yW
b, y)
m
, W = y R
m
: y 0,
t
Ay c.
(ii) Si scriva la lagrangiana e si determini la relazione di estremalità.
(iii) Supponendo inoltre che b 0, che c
i
> 0 per i = 1, . . . , n e che
linsieme u
n
: (Au)
i
< b
i
, i = 1, . . . , m sia non vuoto, si
verichi che esiste un punto di minimo u per il problema primale
e che esiste un punto di massimo y per il problema duale; se ne
deduca che per ogni i = 1, . . . , m vale la seguente alternativa:
(A u)
i
< b
i
e y
i
= 0 oppure (A u)
i
= b
i
e y
i
0.
95
Capitolo 3
Calcolo in spazi di Banach
3.1 Integrale di Bochner
Nel capitolo precedente abbiamo visto, sotto opportune ipotesi, alcuni risul-
tati di esistenza del minimo di funzioni convesse in spazi di Banach. Ma per
trovare eettivamente i punti di minimo, occorre saper fare le derivate di
questo tipo di funzioni. Questo capitolo è dedicato allestensione delle usuali
proprietà del calcolo dierenziale al caso di funzioni tra spazi normati.
Preliminare a questo studio, però, è una breve descrizione della teoria del-
lintegrazione per funzioni a valori in uno spazio di Banach, limitandoci per
semplicità al caso di funzioni denite in un intervallo [a, b] R.
Sia dunque X uno spazio di Banach (reale o complesso): denoteremo con
| | la norma in X e considereremo funzioni f : [a, b] X.
Denizione 3.1.1 Indichiamo con o(X) lo spazio vettoriale delle funzioni
semplici, ossia delle funzioni : [a, b] X della forma
(t) =
k
i=1
x
i
A
i
(t), t [a, b],
ove k N
+
, x
i
X, e gli A
i
sono sottoinsiemi di [a, b] misurabili (secondo
Lebesgue) e fra loro disgiunti.
Denizione 3.1.2 Se o(X), =
k
i=1
x
i
A
i
, l integrale di su [a, b]
è lelemento di X
_
b
a
(t) dt =
k
i=1
x
i
m(A
i
) .
96
Osservazione 3.1.3 Lintegrale su o(X) gode delle usuali proprietà: in par-
ticolare è lineare, e in luogo della monotonia (che non ha senso nel generico
spazio di Banach X) si ha la disuguaglianza
_
_
_
_
_
b
a
(t) dt
_
_
_
_
_
b
a
|(t)|dt o(X).
Si noti che |()| è una funzione semplice su [a, b], a valori reali.
Passiamo ad introdurre le funzioni misurabili a valori in X.
Denizione 3.1.4 Una funzione f : [a, b] X è detta fortemente misura-
bile se esiste una successione
n
nN
o(X) tale che
n
(t) f(t) in X t [a, b].
La funzione f è detta debolmente misurabile se per ogni F X
la funzione
reale o complessa t Ff(t) è misurabile (secondo Lebesgue).
`
E facile vericare che ogni funzione fortemente misurabile è debolmente mi-
surabile; il viceversa è falso, come mostra lesercizio 3.1.1. Inoltre si vede
immediatamente che se f è fortemente misurabile allora la funzione reale
t |f(t)| è misurabile secondo Lebesgue.
Denizione 3.1.5 Sia f : [a, b] X una funzione fortemente misurabile.
Diciamo che f è sommabile su [a, b] se si ha
_
b
a
|f(t)|dt < +.
Osserviamo che ogni funzione semplice è sommabile.
Vediamo ora come denire lintegrale di una funzione sommabile, il quale sarà
un elemento di X; naturalmente per le funzioni semplici la nuova denizione
di integrale dovrà corrispondere alla vecchia. Prima di tutto stabiliamo la
seguente
Proposizione 3.1.6 Sia f : [a, b] X fortemente misurabile. I seguenti
fatti sono equivalenti:
(i) f è sommabile;
(ii) esiste
n
nN
o(X) tale che
_
b
a
|f(t)
n
(t)|dt 0 per n .
97
Dimostrazione (ii)= (i) Per ipotesi esiste N tale che
_
b
a
|f(t)
n
(t)|dt < 1 n ;
quindi
_
b
a
|f(t)|dt
_
b
a
|f(t)
(t)|dt +
_
b
a
|
(t)|dt 1 +K < ,
ove K è unopportuna costante. Pertanto f è sommabile.
(i) = (ii) Poiche f è fortemente misurabile, esiste
n
nN
+ o(X) tale
che
n
(t) f(t) in X per ogni t [a, b]. Deniamo
n
(t) =
_
0 se
n
(t) = 0,
n(t)
n(t)
h
n
(t) se
n
(t) ,= 0,
ove la funzione h
n
: [a, b] R è data da
h
n
(t) =
_
n se |f(t)| n
k1
2
n
se
k1
2
n
|f(t)| <
k
2
n
(k = 1, 2, . . . , n2
n
).
Si verica facilmente che
n
nN
+ o(X) e che |
n
(t)| |f(t)| per ogni
t [a, b]; proviamo che si ha
n
(t) f(t) in X t [a, b].
In eetti, se f(t) = 0 si ha
n
(t) = 0 per denizione. Se invece f(t) ,= 0,
esisterà N
+
tale che |f(t)| 2
: quindi per n risulta

n
(t) ,= 0 e
dalla denizione di
n
(t) segue
lim
n
n
(t) = lim
n
n
(t)
|
n
(t)|
h
n
(t) =
f(t)
|f(t)|
|f(t)| = f(t).
Poiche inoltre |
n
(t) f(t)| 2|f(t)|, dato che f è sommabile la conver-
genza è dominata. Ne segue la tesi.
Siamo ora in grado di denire lintegrale di una funzione f : [a, b] X
sommabile. Infatti, per la proposizione 3.1.6 esiste
n
nN
o(X) tale che
98
lim
n
_
b
a
|f(t)
n
(t)|dt = 0. Ne segue che la successione
_
_
b
a

n
(t)dt
_
nN
è di Cauchy in X, in quanto
_
_
_
_
_
b
a
n
(t) dt
_
b
a
m
(t) dt
_
_
_
_
_
b
a
|
n
(t)
m
(t)|dt
_
b
a
|
n
(t) f(t)|dt +
_
b
a
|f(t)
m
(t)|dt 0 per n, m .
Essendo X completo, tale successione converge in X ed è naturale richiedere
che il suo limite, per denizione, sia lintegrale su [a, b] della funzione f.
In altre parole, deniamo lintegrale di una funzione sommabile nel modo
seguente:
Denizione 3.1.7 Sia X uno spazio di Banach, sia f : [a, b] X somma-
bile. L integrale (di Bochner) di f in [a, b] è lelemento di X
_
b
a
f(t) dt = lim
n
_
b
a
n
(t) dt,
ove il limite è fatto nella norma di X e
n
nN
è una qualunque successione
di funzioni semplici tale che lim
n
_
b
a
|f(t)
n
(t)|dt = 0.
La denizione non dipende dalla scelta delle funzioni approssimanti
n
:
infatti, se
n
nN
è unaltra successione in o(X) tale che
lim
n
_
b
a
|f(t)
n
(t)|dt = 0,
allora evidentemente
lim
n
_
_
_
_
_
b
a
n
(t) dt
_
b
a
n
(t) dt
_
_
_
_
lim
n
_
b
a
|
n
(t)
n
(t)|dt = 0.
Lintegrale di Bochner gode di tutte le proprietà usuali: ad esempio, se si
denisce
_
a
b
f(t) dt =
_
b
a
f(t) dt,
è facile dedurre (esercizio 3.1.2) che risulta
_
q
p
f(t) dt =
_
r
p
f(t) dt +
_
q
r
f(t) dt p, q, r [a, b].
99
Si ha anche, come facile conseguenza della denizione,
_
_
_
_
_
b
a
f(t) dt
_
_
_
_
_
b
a
|f(t)|dt.
Introduciamo adesso gli spazi L
p
per funzioni a valori in X.
Denizione 3.1.8 Se 1 p < denotiamo con L
p
(a, b; X) lo spazio delle
funzioni f : [a, b] X fortemente misurabili tali che
_
b
a
|f(t)|
p
dt < . Se
p = denotiamo con L
(a, b; X) lo spazio delle funzioni f : [a, b] X

fortemente misurabili e tali che supess
t[a,b]
|f(t)| < .
Si verica facilmente, riconducendosi al caso di funzioni da [a, b] in R, che
gli spazi L
p
(a, b; X), 1 p , sono spazi normati con le usuali rispettive
norme:
|f|
L
p
(a,b;X)
=
__
b
a
|f(t)|
p
dt
_
1
p
, |f|
L
(a,b;X)
= supess
t[a,b]
|f(t)|
(si veda lesercizio 3.1.6).
Inoltre, con la stessa dimostrazione che si fa nel caso X = R, si ottiene che
tali spazi sono di Banach. Quando X è riessivo, si sa anche caratterizzare,
in analogia col caso scalare, il duale di L
p
(a, b; X):
Teorema 3.1.9 (di Riesz-Fischer) Sia X uno spazio di Banach riessivo
e sia p [1, [. Allora (L
p
(a, b; X))
è isomorfo ed isometrico a L
q
(a, b; X
),
ove
1
p
+
1
q
= 1; in altre parole, per ogni F (L
p
(a, b; X))
esiste ununica
funzione g L
q
(a, b; X
) tale che
(i) Ff =
_
b
a
g(t), f(t))dt f L
p
(a, b; X);
(ii) |F|
(L
p
(a,b;X))
= |g|
L
q
(a,b;X
)
.
(In (i), la notazione g(t), f(t)) indica lazione del funzionale g(t) X
sullelemento f(t) X.)

Si osservi che lo spazio C([a, b], X) delle funzioni continue da [a, b] in X è
contenuto (propriamente) in tutti gli spazi L
p
(a, b; X) (esercizio 3.1.3). In
particolare, vale il seguente enunciato:
Proposizione 3.1.10 Sia X uno spazio di Banach. Se f C([a, b], X),
allora la funzione F(t) =
_
t
a
f(s)ds appartiene a C
1
([a, b], X) e F
(t) = f(t)
per ogni t [a, b].
100
Dimostrazione Se t, t +h [a, b], si ha
_
_
_
_
F(t +h) F(t)
h
f(t)
_
_
_
_
=
_
_
_
_
1
h
_
t+h
t
[f(s) f(t)]dt
_
_
_
_
1
[h[
_
t+h
t
|f(s) f(t)|ds
,
ed in virt` u della continuità di f, lultimo membro è innitesimo per h 0.
Corollario 3.1.11 Sia X uno spazio di Banach. Se f C
1
([a, b], X) risulta
f(t) = f(s) +
_
t
s
f
(r) dr t, s [a, b].

Dimostrazione Fissato s [a, b], la funzione
(t) = f(t)
_
t
s
f
(r) dr, t [a, b],

appartiene a C
1
([a, b], X) ed ha derivata nulla per la proposizione precedente.
Perciò, ssato X
, la funzione reale o complessa g(t) = (t) ha ancora

derivata nulla, perche, in virt` u della linearità e continuità di ,
lim
h0
g(t +h) g(t)
h
=
_
lim
h0
(t +h) (t)
h
_
= 0.
Dunque, g è costante su [a, b]; ne segue ((t) (s)) = 0 per ogni t [a, b]
e per ogni X
. Per il teorema di Hahn-Banach, ssato t [a, b] si può

scegliere tale che ((t)(s)) = |(t)(s)|; si conclude che (t) = (s)
per ogni t [a, b]. Essendo (s) = f(s), si ha la tesi.
Esercizi 3.1
1. Sia X = L
(a, b) e sia f : [a, b] X denita da

f(t) =
[a,t]
t [a, b].
Si provino i seguenti fatti:
101
(i) Per ogni funzionale positivo F X
la funzione reale t Ff(t) è

crescente.
(ii) La funzione f è debolmente misurabile.
(iii) Se
n
nN
o(X), allora
n
(t) : t [a, b], n N è un
sottoinsieme al pi` u numerabile di X.
(iv) Se g : [a, b] X è fortemente misurabile, allora g(t) : t [a, b]
è un sottoinsieme quasi separabile di X, ovvero esiste un insieme
B
0
[a, b] di misura nulla, tale che g(t) : t [a, b] B
0
è
separabile.
(v) La funzione f non è fortemente misurabile.
2. Sia X uno spazio di Banach. Si provi che se f : [a, b] X è sommabile,
allora
_
q
p
f(t) dt =
_
r
p
f(t) dt +
_
q
r
f(t) dt p, q, r [a, b].
3. Sia X uno spazio di Banach. Si provi che ogni funzione continua f :
[a, b] X è fortemente misurabile.
4. Sia X uno spazio di Banach. Si provi che una funzione f : [a, b] X è
fortemente misurabile se e solo se esiste una successione f
n
di funzioni
fortemente misurabili che converge a f puntualmente q.o. in [a, b].
5. Sia X uno spazio di Banach, sia p [1, ] e sia q lesponente coniugato
di p. Se f L
p
(a, b; X) e g L
q
(a, b; X
), si provi la disuguaglianza di
Holder:
_
b
a
[g(t), f(t))[ dt |f|
L
p
(a,b,X)
|g|
L
q
(a,b;X
)
.
6. Sia X uno spazio di Banach e sia p [1, [. Se f, g L
p
(a, b; X), si
dimostri la disuguaglianza di Minkowski:
__
b
a
|f(t) +g(t)|
p
dt
_
1
p
__
b
a
|f(t)|
p
dt
_
1
p
+
__
b
a
|g(t)|
p
dt
_
1
p
.
102
3.2 Dierenziale di Frechèt
Veniamo ora alla generalizzazione delle usuali proprietà del calcolo dieren-
ziale.
Denizione 3.2.1 Siano X, Y spazi normati e sia un aperto di X. Una
funzione f : Y si dice dierenziabile secondo Frechèt nel punto x
0

(pi` u brevemente, F-dierenziabile in x
0
) se esiste un operatore A L(X, Y )
tale che risulti
lim
h
X
0
|f(x
0
+h) f(x
0
) Ah|
Y
|h|
X
= 0.
Loperatore A si dice dierenziale di Frechèt di f in x
0
e si scrive A = f
(x
0
).
Osservazione 3.2.2 Il dierenziale di Frechèt di f, se esiste, è unico. Infatti
se B L(X, Y ) verica la stessa denizione, risulterà
lim
h
X
0
|f(x
0
+h) f(x
0
) Bh|
Y
|h|
X
= 0;
per dierenza, deduciamo
lim
h
X
0
|Ah Bh|
Y
|h|
X
= 0.
Dunque, ssato > 0, si avrà per |h| < , con opportuno,
|Ah Bh|
Y
|h|
X
< ,
e per linearità
|(A B)u|
Y
u X con |u|
X
1.
Ci` o prova che |A B|
L(X,Y )
, e dunque A = B per larbitrarietà di .
Si noti che la denizione di dierenziabilità secondo Frechèt dipende solo
dalla topologia di X e di Y , ed è invariante rispetto al passaggio a norme
equivalenti.
`
E anche evidente che ogni funzione F-dierenziabile è continua
(esercizio 3.2.1).
La regola di calcolo per il dierenziale di funzioni composte è valida anche
nel contesto degli spazi normati. Si ha infatti:
103
Proposizione 3.2.3 Siano X, Y, Z spazi normati; siano un aperto di X,
un aperto di Y , e siano f : , g : Z. Se f è F-dierenziabile in
un punto x
0
e g è F-dierenziabile nel punto y
0
= f(x
0
), allora g f è
F-dierenziabile in x
0
e si ha
(g f)
(x
0
) = g
(y
0
) f
(x
0
).
Dimostrazione Per ipotesi si ha
lim
h
X
0
|(h)|
Y
|h|
X
= 0, ove (h) = f(x
0
+h) f(x
0
) f
(x
0
)h,
lim
k
Y
0
|(k)|
Z
|k|
Y
= 0, ove (k) = g(y
0
+k) g(y
0
) g
(y
0
)k.
Scegliamo k = f(x
0
+ h) f(x
0
) ed osserviamo che se |h|
X
0 allora
|k|
Y
0. Si ha
g(f(x
0
+h)) g(f(x
0
)) = g(y
0
+k) g(y
0
) = g
(y
0
)k +(k) =
= g
(y
0
)[f
(x
0
)h +(h)] +(f
(x
0
)h +(h));
posto (h) = g
(y
0
)[(h)] +(f
(x
0
)h +(h)), si ricava
lim
h
X
0
|(h)|
Z
|h|
X
lim
h
X
0
|g
(y
0
)|
L(Y,Z)
|(h)|
Y
|h|
X
+
+ lim
h
X
0
|(k)|
Z
|h|
X
.
Daltra parte se |h|
X
0 si ha
|(k)|
Z
|h|
X
= o(1)
|k|
Y
|h|
X
o(1)
_
|f
(x
0
)|
L(X,Y )
+
|(h)|
Y
|h|
X
_
0.
Pertanto, |(h)|
Z
= o(|h|
X
) e la relazione
g f(x
0
+h) g f(x
0
) g
(y
0
) f
(x
0
)h = (h)
ci dà la tesi.
Esempi 3.2.4 (1) Se f(x) è costante in , allora f
(x
0
) = 0 per ogni
x
0
.
(2) Se f L(X, Y ), allora f
(x
0
) = f per ogni x
0
X.
(3) Se f : X Y Z è unapplicazione bilineare e continua, allora f è
F-dierenziabile in ogni (x
0
, y
0
) XY , e f
(x
0
, y
0
) è lapplicazione lineare
(h, k) f(h, y
0
) +f(x
0
, k).
104
Concludiamo il paragrafo con la seguente
Denizione 3.2.5 Siano X, Y spazi normati e sia un aperto di X. Se f :
Y è una funzione F-dierenziabile in ogni punto x
0
, lapplicazione
f
: L(X, Y ) è detta derivata prima di f. Se f
è continua su , diremo
che f è di classe C
1
su .
Esercizi 3.2
1. Si verichi che ogni funzione F-dierenziabile in un punto x
0
è continua
in x
0
, e che il viceversa non è vero.
2. Sia : R R una funzione derivabile. Se X è uno spazio normato
e f : X R è una funzione F-dierenziabile, si provi che f è
F-dierenziabile e
( f)
(x) =
(f(x))f
(x) x X.
3. Sia X uno spazio con prodotto scalare. Si provi che la funzione f(x) =
|x|
2
è F-dierenziabile in X, mentre la funzione g(x) = |x| è F-
dierenziabile soltanto in X 0.
4. Siano X = R
N
e Y = R; si verichi che la denizione 3.2.5 relativa a
funzioni f : X Y si riduce a quella usuale.
5. Vericare che i seguenti funzionali a valori in R sono F-dierenziabili
negli spazi a anco indicati, e scriverne la derivata di Frechèt:
(i) J(y) =
_
b
a
[y(x)
2
+y
(x)
2
2y(x) sin x] dx, X = C
1
[a, b];
(ii) J(y) =
_
b
a
y
(x)
2
x
3
dx, X = C
1
[a, b] (a > 0);
(iii) J(y) =
_
b
a
[16y(x)
2
y
(x)
2
+x
3
] dx, X = C
2
[a, b];
(iv) J(y) =
_
b
a
[2xy(x) y
(x)
2
] dx, X = C
3
[a, b].
6. In uno spazio di Hilbert, le proiezioni su convessi chiusi sono applica-
zioni F-dierenziabili?
105
3.3 Dierenziale di Gateaux
La nozione di dierenziabilità secondo Gateaux è lestensione del concetto
di derivata direzionale. Si tratta quindi di una proprietà meno forte della
F-dierenziabilità.
Denizione 3.3.1 Siano X, Y spazi normati, sia un aperto di X. Una
funzione f : Y si dice dierenziabile secondo Gateaux nel punto x
0

(pi` u brevemente, G-dierenziabile in x
0
) se esiste un operatore A L(X, Y )
tale che
lim
t0
_
_
_
_
1
t
[f(x
0
+tv) f(x
0
)] Av
_
_
_
_
Y
= 0 v X.
Loperatore A si dice dierenziale di Gateaux di f in x
0
e si scrive A =
f
G
(x
0
).
Si noti che in questa denizione si richiede non solo che esista la derivata di
f in x
0
secondo qualunque direzione v X, ma anche che la dipendenza di
tale derivata da v sia lineare: ciò non è sempre vero (esercizio 3.3.3).
Per lunicità del limite, il G-dierenziale di f in x
0
è unico (se esiste); lap-
plicazione x
0
f
G
(x
0
) si chiama derivata di Gateaux di f.
`
E noto da esempi elementari che già nel caso X = R
2
, Y = R unapplica-
zione G-dierenziabile può non essere continua e quindi, a maggior ragione,
non essere F-dierenziabile (esercizio 3.2.1). Però dalle denizioni si vede
subito che se f è una funzione F-dierenziabile in x
0
, allora f è anche G-
dierenziabile in x
0
ed in tal caso si ha f
G
(x
0
) = f
(x
0
).
La seguente proposizione generalizza il classico teorema di Lagrange.
Proposizione 3.3.2 Siano X, Y spazi normati, sia un aperto di X, sia
f : Y una funzione G-dierenziabile in . Se x
1
e x
2
sono punti di
tali che lintero segmento di estremi x
1
, x
2
sia contenuto in , allora
|f(x
2
) f(x
1
)|
Y
sup
t[0,1]
|f
G
((1 t)x
1
+tx
2
)|
L(X,Y )
|x
2
x
1
|
X
.
Si noti che il secondo membro della disuguaglianza potrebbe valere +(eser-
cizio 3.3.2).
Dimostrazione Consideriamo la funzione F : [0, 1] R denita da
F(t) = [f((1 t)x
1
+tx
2
)], t [0, 1],
106
ove è un ssato elemento di Y
. Essa è derivabile, perche, posto x(t) =

(1 t)x
1
+tx
2
, risulta
lim
h0
F(t +h) F(t)
h
= lim
h0
[f(x(t) +h(x
2
x
1
)) f(x(t))]
h
=
=
_
lim
h0
f(x(t) +h(x
2
x
1
)) f(x(t))
h
_
= [f
G
(x(t))(x
2
x
1
)].
Per il teorema di Lagrange si ha
[f(x
2
)] [f(x
1
)] = F(1) F(0) = F
() = [f
G
(x())(x
2
x
1
)]
con ]0, 1[ opportuno. Di conseguenza
[[f(x
2
)] [f(x
1
)][ ||
Y
|f
G
(x())|
L(X,Y )
|x
2
x
1
|
X
,
e scegliendo tale che ||
Y
= 1 e [f(x
2
) f(x
1
)] = |f(x
2
) f(x
1
)|
Y
, si
ottiene la tesi.
Il risultato che segue fornisce una condizione suciente per la F-dierenzia-
bilità ed è la generalizzazione del classico teorema del dierenziale totale.
Corollario 3.3.3 Siano X, Y spazi normati, sia un aperto di X. Se f :
Y è una funzione G-dierenziabile, e se inoltre f
G
: L(X, Y )
è continua nel punto x
0
, allora f è F-dierenziabile in x
0
e f
(x
0
) =
f
G
(x
0
).
Dimostrazione Esiste un intorno U di 0 X nel quale è denita la funzione
(h) = f(x
0
+h) f(x
0
) f
G
(x
0
)h, h U.
Questa funzione è G-dierenziabile, perche tali sono gli addendi che la com-
pongono (esercizio 3.3.1), e si ha
G
(h) = f
G
(x
0
+h) f
G
(x
0
) h U.
Poiche (0) = 0, dalla proposizione 3.3.2 otteniamo
|(h)|
Y
sup
t[0,1]
|f
G
(x
0
+th) f
G
(x
0
)|
L(X,Y )
|h|
X
,
e dunque, per la continuità di f
G
in x
0
, si ha
lim
h
X
0
|(h)|
Y
|h|
X
= 0.
107
Esercizi 3.3
1. Siano X, Y spazi normati. Si verichi che se f : X Y è una funzione
G-dierenziabile, allora per ogni x X la funzione g(h) = f(x + h) è
a sua volta G-dierenziabile con g
G
(h) = f
G
(x +h).
2. Sia f : R R denita da
f(x) =
_
0 se x = 0,
[x[
3/2
sin
1
|x|
se x ,= 0.
Si provi che f è derivabile in ogni punto di R, ma che
sup
x[1,1]
[f
(x)[ = +.
3. Si provi che la funzione f : R
2
R, denita da
f(x, y) =
_
0 se [y[ [x[,
sgn(y)
_
y
2
x
2
se [y[ > [x[,
(x, y) R
2
,
non è G-dierenziabile in (0, 0), benche abbia tutte le derivate direzio-
nali in tale punto.
4. Posto X = L
1
(a, b), si provi che lapplicazione f |f|
1
non è in
generale G-dierenziabile.
[Traccia: si consideri la derivata nel punto
I
secondo la direzione
J
,
ove I e J sono intervalli disgiunti di ]a, b[.]
5. Sia X uno spazio normato e sia f : X R una funzione convessa e
G-dierenziabile. Si provi che
f(x
0
+v) f(x
0
) +f
G
(x
0
)v x
0
, v X.
[Traccia: si utilizzi la crescenza del rapporto incrementale nella dire-
zione v (esercizio 2.1.3).]
3.4 Loperatore di superposizione
Esaminiamo in dettaglio un esempio interessante e non banale di funzione
F-dierenziabile.
Sia R
N
un aperto di misura di Lebesgue nita (limitato o no) e sia
f : R R una funzione tale che:
108
(i) x f(x, t) è misurabile in per ogni t R;
(ii) esiste un insieme misurabile
0
tale che m(
0
) = 0 e t f(x, t)
è continua su R per ogni x
0
.
Poniamo
[(u)](x) = f(x, u(x)), x ;
per comprensibili ragioni, lapplicazione u (u) si chiama operatore di
superposizione.
Si tratta ora di scegliere lo spazio in cui far variare le funzioni u. Osserviamo
anzitutto che se u : R è misurabile, allora (u) è a sua volta misurabile.
Infatti, questo è vero quando u è una funzione semplice (se u =
k
i=1
E
i
,
con gli E
i
disgiunti e
k
i=1
E
i
= , si ha (u) =
k
i=1
f(,
i
)
E
i
e dunque
(u) è misurabile); poi, se u è misurabile e u
n
è una successione di fun-
zioni semplici che converge ad u puntualmente in , allora (u) è il limite
puntuale in
0
, dunque q.o. in , delle funzioni misurabili (u
n
), e dunque
è misurabile in virt` u della completezza della misura di Lebesgue.
Vale inoltre la seguente proprietà:
Lemma 3.4.1 Nelle ipotesi precedenti, se u
n
è una successione di funzioni
misurabili su tale che u
n
u in misura, allora (u
n
) (u) in misura.
Dimostrazione Sia > 0; dobbiamo provare che
lim
n
m(x
0
: [(u
n
)(x) (u)(x)[ > ) = 0.
Per ogni k N
+
k
=
_
x
0
: [f(x, u(x)) f(x, t)[ t
_
u(x)
1
k
, u(x) +
1
k
__
.
Non è evidente che linsieme
k
sia misurabile: la dimostrazione di questo
fatto è tratteggiata nellesercizio 3.4.1. Risulta inoltre
k

k+1
e, per
la continuità di f rispetto alla variabile t, si ha
k=1

k
=
0
; essendo
m(
0
) = m() < , se ne deduce, in virt` u della misurabilità di
k
, che
m(
0

k
) 0 per k . Dunque, ssato > 0, esiste k N
+
(che
pensiamo dora in poi ssato) tale che m(
0

k
) < /2.
Deniamo ora per ogni n N linsieme
A
n
=
_
x
0
: [u
n
(x) u(x)[
1
k
_
;
109
poiche u
n
u in misura, si ha lim
n
m(
0
A
n
) = 0 e dunque esiste n N
tale che
m(
0
A
n
) <

2
n n.
Daltra parte, se x A
n
k
si ha u
n
(x) [u(x) 1/k, u(x) +1/k] e quindi
[(u
n
)(x) (u)(x)[ ; ne segue, per ogni n n,
m(x
0
: [(u
n
)(x) (u)(x)[ > )
m(
0
(A
n

k
)) m(
0
A
n
) +m(
0

k
)

2
+

2
= ,
cioè la tesi.
Una conseguenza del lemma precedente è la continuità delloperatore su
opportuni spazi L
p
.
Proposizione 3.4.2 Supponiamo che, in aggiunta alle ipotesi precedenti,
esistano p, q 1 tali che
[f(x, t)[ a(x) +b[t[
p/q
per q.o. x , t R,
ove a L
q
(), con a 0, e b 0. Allora loperatore di superposizione
manda con continuità L
p
() in L
q
().
Dimostrazione Anzitutto, se u L
p
() si ha (u) L
q
() perche
_
[f(x, u(x))[
q
dx 2
q1
__
a(x)
q
dx +b
q
_
[u(x)[
p
dx
_
;
dobbiamo provare la continuità di . Sia u
n
L
p
() una successione tale
che u
n
u in L
p
(): occorre mostrare che (u
n
) (u) in L
q
(). Dato
che, in particolare, u
n
u in misura, il lemma 3.4.1 ci dice che (u
n
) (u)
in misura. Inoltre vale la seguente stima:
[(u
n
)(x) (u)(x)[
q
2
q1
_
[(u
n
)(x)[
q
+[(u)(x)[
q
_
4
q1
_
a(x)
q
+b
q
[u
n
(x)[
p
+a(x)
q
+b
q
[u(x)[
p
_
4
q1
_
2a(x)
q
+ 2
p1
b
q
[u
n
(x) u(x)[
p
+ (2
p1
+ 1)b
q
[u(x)[
p
_
c
p,q
_
a(x)
q
+[u
n
(x) u(x)[
p
+[u(x)[
p
_
.
110
Sia allora > 0: esiste n N tale che |u
n
u|
p
L
p
()
< per ogni n n;
quindi, per lassoluta continuità dellintegrale e per la stima precedente, esiste
> 0 per cui si ha
m(E) < , n n =
_
E
[(u
n
) (u)[
q
dx 3c
p,q
.
Scegliamo ora > 0 tale che
q
< ; posto
E
n
= x : [(u
n
)(x) (u)(x)[ ,
sarà m(E
n
) < per ogni n n n. Ne segue, nalmente,
_
[(u
n
) (u)[
q
dx =
=
_
En
[(u
n
) (u)[
q
dx +
_
\En
[(u
n
) (u)[
q
dx
3c
p,q
+
q
m() < C n n,
Vediamo ora quali ulteriori condizioni garantiscono la F-dierenziabilità del-
lapplicazione .
Teorema 3.4.3 Supponiamo che f soddis tutte le ipotesi della proposizione
3.4.2 con p > 2 e q =
p
p1
. Supponiamo inoltre che la funzione
f
t
esista e
verichi le seguenti condizioni:
(i) x
f
t
(x, t) è misurabile in per ogni t R;
(ii) t
f
t
(x, t) è continua su R per q.o. x ;
(iii) vale la disuguaglianza
f
t
(x, t)
(x) +[t[
p2
per q.o. x , t R,
ove L
p
p2
() e 0.
Allora loperatore di superposizione : L
p
() L
q
() è F-dierenziabile
in ogni punto u L
p
() e
[
(u)v](x) =
f
t
(x, u(x))v(x), x , v L
p
().
111
Dimostrazione Anzitutto, osserviamo che lapplicazione denita da
(u)(x) =
f
t
(x, u(x)), x , u L
p
()
manda con continuità L
p
() in L
p
p2
() in virt` u della proposizione 3.4.2;
quindi, per la disuguaglianza di Holder con esponenti p1 e
p1
p2
, se v L
p
()
si ha (u)v L
q
() e
|(u)v|
L
q
()
|(u)|
L
p
p2
()
|v|
L
p
()
.
Poniamo adesso per u, v L
p
()
(v) = (u +v) (u) (u)v;
allora
|(v)|
q
L
q
()
=
=
_
f(x, u(x) +v(x)) f(x, u(x))

f
t
(x, u(x))v(x)
q
dx =
=
_
_
1
0
_
f
t
(x, u(x) +v(x))
f
t
(x, u(x))
_
v(x) d
q
dx ;
dunque, posto
z(x) =
_
1
0
_
f
t
(x, u(x) +v(x))
f
t
(x, u(x))
_
d,
si ha
|(v)|
q
L
q
()
=
_
[z(x)v(x)[
q
dx |z|
q
L
p
p2
()
|v|
q
L
p
()
.
Valutiamo adesso la norma |z|
L
p
p2
()
. Usando ancora una volta la disugua-
glianza di Holder ed il teorema di Tonelli, si trova
_
[z[
p
p2
dx
_
_
1
0
f
t
(x, u(x) +v(x))
f
t
(x, u(x))
p
p2
ddx =
=
_
1
0
|(u +v) (u)|
p
p2
L
p
p2
()
d.
112
Per la continuità dellapplicazione , lintegrando allultimo membro tende
a 0 per |v|
L
p
()
0. Daltronde, in virt` u dellipotesi (iii), per |v|
L
p
()
1
esso è dominato dalla costante
c
p
_
||
p
p2
L
p
p2
()
+
p
p2
(|u|
p
L
p
()
+ 1)
_
(che ovviamente è una funzione sommabile in [0, 1] rispetto a ); ne segue,
per il teorema di Lebesgue, che |z|
L
p
p2
()
0 per |v|
L
p
()
0. Ciò prova
che
lim
v
L
p
()
0
|(v)|
L
q
()
|v|
L
p
()
= 0.
Abbiamo cos` provato la F-dierenziabilità di sugli spazi L
p
con p > 2. Se
p = 2 vale un risultato pi` u debole:
Teorema 3.4.4 Supponiamo che f verichi tutte le ipotesi della proposizio-
ne 3.4.2 con p = 2 e q = 2. Supponiamo inoltre che la funzione
f
t
esista e
verichi le seguenti condizioni:
(i) x
f
t
(x, t) è misurabile in per ogni t R;
(ii) t
f
t
(x, t) è continua su R per q.o. x ;
(iii) vale la disuguaglianza
f
t
(x, t)
M per q.o. x , t R,
ove M 0.
Allora loperatore di superposizione : L
2
() L
2
() è G-dierenziabile
in ogni u L
2
() e
[
G
(u)v](x) = [(u)v](x) =
f
t
(x, u(x))v(x), x , v L
2
().
Dimostrazione Sia v L
2
(). Per ,= 0 e per q.o. x si ha
1
_
[(u +v)](x) [(u)](x)
_
[(u)](x)v(x) =
= v(x)
_
1
0
_
f
t
(x, u(x) +tv(x))
f
t
(x, u(x))
_
dt.
113
Se 0, si ha tv(x) 0 per ogni t [0, 1] e per q.o. x ; quindi,
utilizzando la continuità di
f
t
(x, ), per q.o. x lintegrando a secondo
membro converge puntualmente a 0 per 0. Esso è anche dominato dalla
costante 2M, e quindi il teorema di Lebesgue implica che
lim
0
_
1
_
[(u +v)](x) [(u)](x)
_
[(u)](x)v(x)
_
= 0 per q.o. x .
Dato che si ha anche
_
[(u +v)](x) [(u)](x)
_
[(u)](x)v(x)
2
(2M)
2
[v(x)[
2
q.o. in ,
unaltra applicazione del teorema di Lebesgue porta a concludere che
lim
0
_
_
_
_
1
_
[(u +v)](x) [(u)](x)
_
[(u)](x)v(x)
_
_
_
_
2
L
2
()
= 0,
che è la tesi.
Il risultato del teorema precedente si può ulteriormente precisare: se p = q =
2, lapplicazione è F-dierenziabile in un punto ssato di L
p
() soltanto nel
caso in cui la funzione f(x, t) è ane rispetto alla variabile t (e naturalmente
in questo caso la sarà F-dierenziabile in ogni punto).
Teorema 3.4.5 Siano p = q = 2. Nelle stesse ipotesi del teorema 3.4.4, se
loperatore di superposizione è F-dierenziabile in un punto u
0
L
2
(),
allora la funzione f è necessariamente della forma
f(x, t) = h(x) +tk(x) per q.o. x , t R,
ove h L
2
() e k L
() sono funzioni opportune.

Dimostrazione Anzitutto notiamo che
(u
0
), che esiste per ipotesi, deve
coincidere con
G
(u
0
), che esiste per il teorema 3.4.4 e coincide con (u
0
).
Per ogni x sia B(x,
x
) una palla contenuta in . Poniamo per x e

x
v
,x
() =
B(x,)
(), ,
con R ssato: chiaramente, qualunque sia x , v
,x
0 in L
2
() per
0; quindi dallipotesi segue che, posto
(v
,x
) = (u
0
+v
,x
) (u
0
) (u
0
)v
,x
,
114
risulta per ogni x
lim
0
|(v
,x
)|
L
2
()
|v
,x
|
L
2
()
= 0.
Daltra parte, osservato che
|(v
,x
)|
2
L
2
()
|v
,x
|
2
L
2
()
=
1
[[
2

1
m(B(x, ))

_
B(x,)
_
f(, u
0
() +) f(, u
0
())
f
t
(, u
0
())
_
2
d,
si ha anche
lim
0
|(v
,x
)|
2
L
2
()
|v
,x
|
2
L
2
()
=
1
[[
2
f(x, u
0
(x) +) f(x, u
0
(x))
f
t
(x, u
0
(x))
2
in ogni punto x che sia punto di Lebesgue per la funzione integranda;
quindi tale uguaglianza vale per q.o. x . Pi` u precisamente, metten-
do insieme i due risultati otteniamo che per ogni R esiste un insieme
misurabile A
con m( A
) = 0, tale che
f(x, u
0
(x) +) f(x, u
0
(x))
f
t
(x, u
0
(x))
= 0 x A
.
Facendo variare in Q otteniamo, per intersezione numerabile, un insieme
misurabile A , con m( A) = 0, tale che
f(x, u
0
(x) +) f(x, u
0
(x))
f
t
(x, u
0
(x))
= 0 x A, Q;
dato che f è continua (anzi di classe C
1
) nella variabile t, la relazione
precedente implica che
f(x, u
0
(x) +) f(x, u
0
(x))
f
t
(x, u
0
(x))
= 0 x A, R.
Posto t = u
0
(x) + , con x A, t è un arbitrario numero reale: otteniamo
cos`
f(x, t) = f(x, u
0
(x)) +
f
t
(x, u
0
(x))(t u
0
(x)) x A, t R.
Ne segue la tesi, prendendo le funzioni
h(x) = f(x, u
0
(x))
f
t
(x, u
0
(x))u
0
(x), k(x) =
f
t
(x, u
0
(x)).
Si noti che h L
2
() e k L
(), come richiesto.

115
Esercizi 3.4
1. Sia f una funzione vericante le ipotesi elencate allinizio del paragrafo
3.4 e sia u : R una funzione misurabile. Per , r > 0 poniamo
,r
= x
0
: [f(x, u(x)) f(x, t)[ per [t u(x)[ r.
Si provi che:
(i) linsieme
,r
coincide con
x
0
: [f(x, u(x)) f(x, q)[ q Q con [q u(x)[ r;
(ii) se u è una funzione semplice, allora
,r
è misurabile;
(iii) se u è arbitraria, se u
n
è una successione di funzioni semplici che
converge puntualmente a u in , e se poniamo
n
,r
= x
0
: [f(x, u
n
(x)) f(x, t)[ per [t u
n
(x)[ r,
allora risulta
,r
=
hN
+
limsup
n
n
+
1
h
,r
=
hN
+
mN
_
n=m
n
+
1
h
,r
,
cosicche
,r
è misurabile per ogni , r > 0.
2. Sia f una funzione vericante le ipotesi della proposizione 3.4.2 con
1
p
+
1
q
= 1. Si provi che il funzionale
J(u) =
_
_
u(x)
0
f(x, t) dtdx, u L
p
(),
è F-dierenziabile in tutti i punti di L
p
(), con
J
(u)v =
_
f(x, u(x))v(x) dx v L
p
().
116
3.5 Derivate successive
Vediamo brevemente come si possono introdurre le derivate successive di una
applicazione f fra spazi normati.
Denizione 3.5.1 Siano X, Y spazi normati, sia un aperto di X e sia
f : Y una funzione F-dierenziabile. Se la derivata di Frechèt f
:
L(X, Y ) è F-dierenziabile in un punto x
0
, lapplicazione [f
(x
0
)
L(X, L(X, Y )) è detta dierenziale secondo di f in x
0
, e si denota con f
(x
0
).
Se f
è F-dierenziabile in , lapplicazione f
: L(X, L(X, Y )) è detta

derivata seconda di f; se essa è continua, la funzione f si dirà di classe C
2
in .
Esempi 3.5.2 (1) Se f L(X, Y ), allora f
(x
0
) = f per ogni x
0
X, e
f
(x
0
) = 0 per ogni x
0
X.
(2) Sia X = C[a, b], e poniamo f(g) = g
2
per ogni g X, ossia [f(g)](t) =
g(t)
2
per ogni t [a, b]. La funzione f applica C[a, b] in se, e si verica
facilmente che essa è F-dierenziabile in ogni punto g
0
C[a, b], con
[f
(g
0
)h](t) = 2g
0
(t)h(t), t [a, b], h C[a, b].
Si ha poi, per ogni k C[a, b],
f
(g
0
+h)k f
(g
0
)k = 2(g
0
+h)k 2g
0
k = 2hk,
e dunque
[f
(g
0
)h]k = 2hk h, k C[a, b].
Lapplicazione f
è dunque bilineare su C[a, b]C[a, b]. Questo non è casuale,

come mostra la proposizione che segue.
Proposizione 3.5.3 Siano X, Y spazi normati. Lo spazio L(X, L(X, Y )) è
isomorfo ed isometrico allo spazio L
2
(X, Y ) delle applicazioni : XX Y
bilineari e continue, munito della norma
||
L
2
(X,Y )
= sup
h
X
, k
X
1
|(h, k)|
Y
.
Dimostrazione Sia L(X, L(X, Y )) e siano h, k X. Allora h
L(X, Y ) e [h]k Y . La dipendenza di [h]k da h e k è ovviamente bilineare,
nonche continua: quindi esiste L
2
(X, Y ) tale che
(h, k) = [h]k h, k X,
117
e risulta
||
L
2
(X,Y )
= sup
h
X
, k
X
1
|(h, k)|
Y
= sup
h
X
, k
X
1
|[h]k)|
Y
=
= sup
h
X
1
|h|
L(X,Y )
= ||
L(X,L(X,Y ))
.
Dunque, esiste una corrispondenza i : L(X, L(X, Y )) L
2
(X, Y ), denita
da i() = , che è unisometria lineare. Resta da far vedere che i è anche
surgettiva. Sia dunque L
2
(X, Y ) e consideriamo per ogni ssato h X
lapplicazione
h
: X Y denita da
h
k = (h, k) per ogni k X;
ovviamente,
h
L(X, Y ) per ogni h X. La corrispondenza h
h
è
unapplicazione lineare : X L(X, Y ), che è anche continua perche per
ogni h X si ha
|h|
L(X,Y )
= |
h
|
L(X,Y )
= sup
kX\{0}
|
h
k|
Y
|k|
X
=
= sup
kX\{0}
|(h, k)|
Y
|k|
X
||
L
2
(X,Y )
|h|
X
.
Dunque L(X, L(X, Y )), e naturalmente
i()(h, k) = [h]k =
h
k = (h, k) h, k X.
In denitiva, si può sempre vedere la derivata seconda (calcolata in un punto)
come una forma bilineare continua su X X.
In modo analogo, denendo induttivamente la derivata n-sima come la de-
rivata prima di f
(n1)
: L
n1
(X, Y ), si trova che tale derivata n-sima,
calcolata in un punto x
0
, è unapplicazione n-lineare f
(n)
(x
0
) L
n
(X, Y ),
dove per ogni n N
+
lo spazio L
n
(X, Y ) è la classe delle applicazioni di X
n
in Y n-lineari e continue, con la norma
||
Ln(X,Y )
= sup|(h
1
, . . . , h
n
)|
Y
: |h
i
|
X
1 per i = 1, . . . n.
Vediamo inne come si scrive la formula di Taylor (arrestata al secondo
ordine, per semplicità) nel caso di applicazioni fra spazi normati.
Proposizione 3.5.4 Siano X, Y spazi normati, sia un aperto di X e sia
f : Y di classe C
2
. Se x
0
e se B(x
0
, R) , allora per ogni
h B(0, R) si ha
f(x
0
+h) = f(x
0
) +f
(x
0
)h +
1
2
[f
(x
0
)h]h +(h),
118
ove : B(0, R) Y è una funzione tale che
lim
h
X
0
|(h)|
Y
|h|
2
X
= 0.
Dimostrazione Sia h B(0, R). Fissato Y
, la funzione reale
g
h
(t) = (f(x
0
+th)), t [1, 1],
è di classe C
2
: infatti per la proposizione 3.2.3 si ha
g
h
(t) = (f
(x
0
+th)h) t [1, 1],
g
h
(t) = ([f
(x
0
+th)h]h) t [1, 1],
ed inoltre g
h
e g
h
sono funzioni continue, essendo f di classe C
2
.
Dalla formula di Taylor per la funzione g
h
segue
(f(x
0
+h) f(x
0
)) = g
h
(1) g
h
(0) = g
h
(0) +
1
2
g
h
(
h
)
ove
h
è un punto opportuno in ]0, 1[. Ne segue
(f(x
0
+h) f(x
0
)) = (f
(x
0
)h) +
1
2
([f
(x
0
+
h
h)h]h) =
= (f
(x
0
)h) +
1
2
([f
(x
0
)h]h) +((h)),
ove
(h) =
1
2
[(f
(x
0
+
h
h) f
(x
0
))h]h.
Dunque
_
f(x
0
+h) f(x
0
) f
(x
0
)h
1
2
[f
(x
0
)h]h
_
[((h))[ ||
Y
|(h)|
Y
.
Per larbitrarietà di Y
, si ricava
_
_
_
_
f(x
0
+h) f(x
0
) f
(x
0
)h
1
2
[f
(x
0
)h]h
_
_
_
_
Y
|(h)|
Y
.
Poiche, per la continuità di f
,
lim
h
X
0
|(h)|
Y
|h|
2
X
= 0,
si ha la tesi.
119
Esempio 3.5.5 Sia H uno spazio di Hilbert (reale, per semplicità), e si
consideri la funzione
F(x) = |x|
4
|x|
2
, x H.
Poiche
F(x +h) F(x) = (|x +h|
2
|x|
2
)(|x +h|
2
+|x|
2
1) =
= (2(x, h) +|h|
2
)(|x +h|
2
+|x|
2
1),
si vede subito che la funzione F è dierenziabile secondo Frechèt e F
(x) =
(4|x|
2
2)x, ossia
(F
(x), h) = (4|x|
2
2)(x, h) h H.
Analogamente,
F
(x +k) F
(x) = 4(|x +k|

2
|x|
2
)x + (4|x +k|
2
2)k,
da cui è facile dedurre che anche F
è dierenziabile secondo Frechèt in H e

(F
(x)k, h) = (4|x|
2
2)(k, h) + 8(x, k)(x, h) k, h H.
Esercizi 3.5
1. Siano X, Y spazi normati, sia un aperto di X e sia f : Y una
funzione di classe C
2
.
(i) Fissato x
0
, si provi che, posto
(h, k) = f(x
0
+h+k)f(x
0
+k)f(x
0
+h)+f(x
0
), h, k X,
se |h|
X
e |k|
X
sono sucientemente piccole si ha
|(h, k) [f
(x
0
)h]k|
Y
(|h|
X
+ 2|k|
X
)|k|
X
,
|(h, k) [f
(x
0
)k]h|
Y
(2|h|
X
+|k|
X
)|h|
X
.
(ii) Si provi che per |h|
X
e |k|
X
abbastanza piccole si ha anche
|[f
(x
0
)h]k [f
(x
0
)k]h|
Y
2(|h|
2
X
+|h|
X
|k|
X
+|k|
2
X
).
120
(iii) Si concluda che lapplicazione f
(x
0
) : L
2
(X, Y ) è simme-
trica, ossia
[f
(x
0
)h]k = [f
(x
0
)k]h h, k X.
2. Siano X, Y, Z spazi normati. sia un aperto di X Y e sia f :
Z una funzione. Le derivate parziali f
x
(x
0
, y
0
) e f
y
(x
0
, y
0
) sono cos`
denite:
f
x
(x
0
, y
0
) = [f(, y
0
)]
(x
0
), f
y
(x
0
, y
0
) = [f(x
0
, )]
(y
0
).
(i) Si verichi che se f è F-dierenziabile in (x
0
, y
0
) allora esistono
f
x
(x
0
, y
0
) e f
y
(x
0
, y
0
), e si ha
f
x
(x
0
, y
0
)h = [f
(x
0
, y
0
)](h, 0) h X,
f
y
(x
0
, y
0
)k = [f
(x
0
, y
0
)](0, k) k Y.
(ii) Si provi che se f è di classe C
2
, allora
[f
xy
(x
0
, y
0
)h]k = [f
(x
0
, y
0
)(h, 0)](0, k) (h, k) X Y,
[f
yx
(x
0
, y
0
)k]h = [f
(x
0
, y
0
)(0, k)](h, 0) (h, k) X Y.
(iii) Si deduca che se f è di classe C
2
le applicazioni bilineari f
xy
(x
0
, y
0
)
e f
yx
(x
0
, y
0
) coincidono, cioè che
[f
xy
(x
0
, y
0
)](h, k) = [f
yx
(x
0
, y
0
)](k, h) (h, k) X Y.
3. Sia J : X R un funzionale di classe C
2
denito sullo spazio normato
X. Si scriva la derivata seconda del funzionale E(x) = e
J(x)
.
3.6 Massimi e minimi relativi
Analizziamo brevemente alcune condizioni necessarie o sucienti per lesi-
stenza di punti di massimo o di minimo relativo nel caso di funzionali deniti
su spazi normati. Come vedremo, si tratta di facili generalizzazioni delle
analoghe condizioni che valgono in R
N
.
Proposizione 3.6.1 Sia X uno spazio normato, sia un aperto di X e sia
f : R una funzione G-dierenziabile. Se x
0
è un punto di massimo
o di minimo locale per f, allora f
G
(x
0
) = 0.
121
Dimostrazione Supponiamo ad esempio che x
0
sia punto di massimo locale;
allora esiste un intorno U di x
0
tale che
f(x) f(x
0
) x U.
Se v X allora si ha x
0
+tv U per [t[ < , con sucientemente piccolo;
quindi
f(x
0
+tv) f(x
0
)
t
_
0 se < t < 0,
0 se 0 < t < .
Per t 0 ne segue f
G
(x
0
)v = 0 per ogni v X, cioè la tesi.
Questa condizione, benche soltanto necessaria per lesistenza del minimo, è
la pi` u utile nelle applicazioni al calcolo delle variazioni che vedremo nel pros-
simo paragrafo.
Vediamo ora unaltra condizione legata al comportamento della derivata
seconda.
f : R una funzione di classe C
2
. Se x
0
è punto di massimo relativo,
allora
[f
(x
0
)v]v 0 v X.
Se x
0
è punto di minimo relativo, si ha invece
[f
(x
0
)v]v 0 v X.
Dimostrazione Supponiamo ad esempio che x
0
sia punto di massimo locale.
Sia > 0 tale che B(x
0
, ) . Fissato v X 0, dalla formula di
Taylor (proposizione 3.5.4), osservato che si ha f
(x
0
) = 0 per la proposizione
precedente, otteniamo
f(x
0
+tv) f(x
0
)
t
2
2
[f
(x
0
)v]v = (tv) t
_

|v|
X
,

|v|
X
_
,
dove la funzione (x)/|x|
2
X
è innitesima per |x|
X
0. Dunque, se [t[ è
sucientemente piccolo si deduce
0 f(x
0
+tv) f(x
0
) = t
2
_
1
2
[f
(x
0
)v]v +|v|
2
X
(tv)
|tv|
2
X
_
.
Dividendo per t
2
e facendo tendere t a 0 si ottiene la tesi.
Questa condizione necessaria, lievemente raorzata, diventa suciente.
122
f : R una funzione di classe C
2
. Se in un punto x
0
si ha f
(x
0
) = 0
e [f
(x
0
)v]v c|v|
2
X
per ogni v X, con c > 0, allora x
0
è punto di
massimo relativo per f. Se invece si ha f
(x
0
) = 0 e [f
(x
0
)v]v c|v|
2
X
per
ogni v X, allora x
0
è punto di minimo relativo per f.
Dimostrazione Supponiamo che f
(x
0
) = 0 e [f
(x
0
)v]v c|v|
2
X
per ogni
v X, con c > 0. Dalla formula di Taylor (proposizione 3.5.4) segue che
f(x
0
+v) f(x
0
) =
1
2
[f
(x
0
)v]v +(v)

c
2
|v|
2
X
_
1
2
c
(v)
|v|
2
X
_
v X 0.
Poiche (v)/|v|
2
X
è innitesima per |v|
X
0, se è sucientemente piccolo
si deduce che f(x
0
+v) f(x
0
) per |v|
X
< . Quindi x
0
è punto di massimo
relativo.
Esempio 3.6.4 Riconsideriamo la funzione F dellesempio 3.5.5: risulta
F
(0) = 0, F
(0) = 2I,
dove I : H H è lapplicazione identità. Per la proposizione 3.6.3, lorigine è
punto di massimo relativo per F (come era facile prevedere, ponendo t = |x|
e studiando la funzione g(t) = t
4
t
2
).
Incontreremo esempi pi` u signicativi pi` u avanti nel corso, nellambito del
calcolo della variazioni. Va comunque osservato che la condizione suciente
fornita dalla proposizione 3.6.3 è troppo restrittiva per le applicazioni.
Esercizi 3.6
1. Sia F :
2
R denito da
F(x) =
n=1
_
[x
n
[
2
n
[x
n
[
4
_
, x
2
.
Si provi che si ha F
(0) = 0 e (F
(0)u, u)
2 > 0 per ogni u

2
0, e
che tuttavia 0 non è un punto di minimo relativo per F.
123
3.7 Funzioni implicite
Siano X, Y, Z spazi di Banach e sia F : X Y Z unapplicazione. Ci
poniamo il problema di sapere sotto quali ipotesi lequazione
F(x, y) = 0
denisce implicitamente il graco di una funzione y : X Y tale che
F(x, y(x)) = 0. La soluzione di questo problema si otterrà, come vedre-
mo, sotto ipotesi del tutto analoghe a quelle classiche del teorema del Dini
in R
2
od in R
n+m
.
Teorema 3.7.1 (delle funzioni implicite) Siano X, Y, Z spazi di Bana-
ch, sia (x
0
, y
0
) X Y e sia V W un intorno di tale punto. Sia poi
F : V W Z una funzione dotata delle seguenti proprietà:
(i) F è continua in (x
0
, y
0
) e F(x
0
, y
0
) = 0;
(ii) per ogni x V esiste la derivata di Frechèt F
y
(x, y) della funzione
y F(x, y) in ogni punto y W, ed inoltre (x, y) F
y
(x, y) è
continua in (x
0
, y
0
);
(iii) esiste linversa F
y
(x
0
, y
0
)
1
L(Z, Y ).
Allora esistono , > 0 tali che per ogni x B(x
0
, ) lequazione F(x, y) = 0
ha ununica soluzione y B(y
0
, ): in particolare, esiste : B(x
0
, )
B(y
0
, ) per cui risulta
x B(x
0
, ), y B(y
0
, ), F(x, y) = 0 y = (x).
Inoltre è continua in x
0
; se poi F è anche continua in V W, allora è
continua in B(x
0
, ). Inne, se F C
1
(V W, Z) allora C
1
(B(x
0
, ), Y )
e si ha
(x) = F
y
(x, (x))
1
F
x
(x, (x)) x B(x
0
, ).
Osserviamo che, quando F è dierenziabile secondo Frechèt, gli operatori
F
y
(x, y) e F
x
(x, y) sono le derivate parziali della funzione F, denite nelleser-
cizio 3.5.2, ed appartengono rispettivamente a L(Y, Z) e L(X, Z). Notiamo
anche che se F è di classe C
1
lipotesi (iii) implica che gli operatori F
y
(x, y)
hanno inversa continua per ogni (x, y) in un opportuno intorno di (x
0
, y
0
)
124
(esercizi 3.7.1 e 3.7.2).
Dimostrazione Anzitutto, non è restrittivo supporre che sia V = B(x
0
,
0
)
e W = B(y
0
,
0
). Per ogni x B(x
0
,
0
) consideriamo lapplicazione T
(x)
:
B(y
0
,
0
) Y denita da
T
(x)
(y) = y F
y
(x
0
, y
0
)
1
F(x, y).
Lequazione F(x, y) = 0 equivale a T
(x)
(y) = y; dunque occorre cercare un
punto sso di T
(x)
per ogni x sucientemente vicino a x
0
. Osserviamo che
T
(x)
è F-dierenziabile in ogni punto y B(y
0
,
0
) e
T
(x)
(y) = I F
y
(x
0
, y
0
)
1
F
y
(x, y) = F
y
(x
0
, y
0
)
1
[F
y
(x
0
, y
0
) F
y
(x, y)];
quindi, per la continuità di F
y
in (x
0
, y
0
), ssato q ]0, 1[ esistono ]0,
0
]
ed ]0,
0
[ tali che
|x x
0
|
X
< , |y y
0
|
Y
= |T
(x)
(y)|
L(Y )
q.
Di conseguenza, per la proposizione 3.3.2 si ha per ogni y, y
B(y
0
, )
|T
(x)
(y)T
(x)
(y
)|
Y
sup
s[0,1]
|T
(x)
((1s)y+sy
)|
L(Y )
|yy
|
Y
q|yy
|
Y
.
Dunque T
(x)
è una contrazione in B(y
0
, ). Inoltre, per la continuità di F in
(x
0
, y
0
), in corrispondenza di e q esiste ]0,
0
] tale che
|xx
0
|
X
< = |T
(x)
(y
0
)y
0
|
Y
= |F
y
(x
0
, y
0
)
1
F(x, y
0
)|
Y
<
1
2
(1q).
Sia allora = min, : per ogni x B(x
0
, ), lapplicazione T
(x)
manda
B(y
0
, ) in se, anzi in B(y
0
, ), poiche
|T
(x)
(y) y
0
|
Y
|T
(x)
(y) T
(x)
(y
0
)|
Y
+|T
(x)
(y
0
) y
0
|
Y

q|y y
0
|
Y
+
1
2
(1 q) <
< q +(1 q) = y B(y
0
, ).
Pertanto, per il teorema delle contrazioni, per ogni x B(x
0
, ) lapplicazione
T
(x)
ha un unico punto sso (x) B(y
0
, ). In particolare, T
(x
0
)
(y
0
) = y
0
e
125
quindi (x
0
) = y
0
. Inoltre, la funzione : B(x
0
, ) B(y
0
, ) è continua in
x
0
perche
|(x) (x
0
)|
Y
= |T
(x)
((x)) y
0
|
Y

|T
(x)
((x)) T
(x)
(y
0
)|
Y
+|T
(x)
(y
0
) y
0
|
Y

q|(x) y
0
|
Y
+|F
y
(x
0
, y
0
)
1
F(x, y
0
)|
Y
,
da cui
(1q)|(x) (x
0
)|
Y
|F
y
(x
0
, y
0
)
1
F(x, y
0
)|
Y
0 per |xx
0
|
X
0.
Supponiamo ora che F sia continua in B(x
0
, ) B(y
0
,
0
). Allora, con un
calcolo analogo al precedente, per ogni x, x
B(x
0
, ) si ha
|(x) (x
)|
Y
= |T
(x)
((x)) T
(x
)
((x
))|
Y

|T
(x)
((x)) T
(x)
((x
))|
Y
+|T
(x)
((x
)) T
(x
)
((x
))|
Y

q|(x) (x
)|
Y
+|F
y
(x
0
, y
0
)
1
|
L(Z,Y )
|F(x, (x
)) F(x
, (x
))|
Z
(si noti che, peraltro, F(x
, (x
)) = 0); da qui, per |x x
|
X
0 si ottiene
(1 q)|(x) (x
)|
Y

|F
y
(x
0
, y
0
)
1
|
L(Z,Y )
|F(x, (x
)) F(x
, (x
))|
Z
0.
Supponiamo inne che F sia di classe C
1
. Allora F
x
(x, y) L(X, Z) e
F
y
(x, y) L(Y, Z) per ogni (x, y) B(x
0
, )B(y
0
,
0
), e possiamo supporre,
come osservato in precedenza, che in ogni punto (x, y) di tale intorno risulti
F
y
(x, y)
1
L(Z, Y ). Fissiamo x B(x
0
, ) e poniamo per comodità y =
(x). Osserviamo che F
x
(, y) è limitata in unopportuna palla B(x, )
B(x
0
, ), in virt` u della relazione di continuità
|F
x
(x, y) F
x
(x, y|
L(X,Z)
1 per |x x|
X
< ;
dalla stima precedente e dalla proposizione 3.3.2 segue allora
|(x) (x)|
Y

C
1 q
sup
s[0,1]
|F
x
((1 s)x +sx, (x))|
L(X,Z)
|x x|
X

K|x x|
X
x B(x, ).
126
Per ipotesi, esiste F
y
(x, y)
1
L(Z, Y ); quindi, usando la F-dierenziabilità
di F in (x, y), si ha
_
_
_(x) (x) +
_
F
y
(x, y)
1
F
x
(x, y)
_
(x x)
_
_
_
Y
=
=
_
_
_F
y
(x, y)
1
_
F
y
(x, y)((x) (x)) +F
x
(x, y)(x x)
__
_
_
Y
|F
y
(x, y)
1
|
L(Z,Y )
_
|F(x, (x)) F(x, (x))|
Z
+
+|(x x, (x) (x))|
Z
_
.
Essendo
|(x x, (x) (x))|
Z
= o(|x x|
X
+|(x) (x)|
X
)
o((1 +K)|x x|
X
),
tale relazione ci dice che è F-dierenziabile nel punto x, e che la sua
derivata è F
y
(x, y)
1
F
x
(x, y); ma, per ipotesi e per lesercizio 3.7.2, questa
derivata è continua rispetto alla variabile x, e ciò prova la tesi.
Osservazione 3.7.2 La formula che fornisce la derivata della funzione im-
plicita dipende solo da F
x
, F
y
e stessa. Quindi, se si suppone che F sia
di classe C
m
in V W, m 1, si può derivare tale formula, ottenendo cos`
che anche è di classe C
m
, e ricavando una formula per la derivata
(m)
in
termini delle derivate di F no allordine m e di no allordine m1.
Esempio 3.7.3 Tra le numerose applicazioni del teorema delle funzioni im-
plicite, ne illustriamo una di fondamentale importanza nello studio delle
equazioni dierenziali in spazi di Banach: la regolarità delle soluzioni rispetto
ai dati iniziali. Consideriamo il problema di Cauchy
_
u
(t) = f(t, u(t)), t [t

0
, T],
u(t
0
) = u
0
ove u
0
X e f : [t
0
, T] X X, essendo X uno spazio di Banach. Suppo-
niamo che f sia continua, insieme con la sua derivata di Frechèt rispetto alla
seconda variabile, in [t
0
, T]X; assumiamo anche che tale derivata sia unifor-
memente continua nella seconda variabile. Per questo problema di cauchy si
ha esistenza ed unicità locale della soluzione, ossia esiste t
1
= t
1
(u
0
) ]t
0
, T],
dipendente dalla scelta di u
0
, ed esiste ununica funzione u C
1
([t
0
, t
1
], X)
127
per cui u(t
0
) = u
0
e lequazione è vericata in ogni punto di [t
0
, t
1
]: questo
fatto si dimostra nello stesso modo con cui si prova il caso scalare, vale a dire
trasformando il problema nellequazione integrale equivalente
u(t) = u
0
+
_
t
t
0
f(s, u(s)) ds, t [t
0
, T],
e risolvendo questultima in [t
0
, t
1
] con il metodo delle approssimazioni suc-
cessive.
Deniamo la seguente funzione F:
[F(u
0
, u)](t) = u(t) u
0
_
t
t
0
f(s, u(s)) ds, t [t
0
, ],
ove è un ssato punto di ]t
0
, T]. Questa funzione è denita su X
C
1
([t
0
, ], X), a valori in C
1
([t
0
, ], X), ed è continua, come è facile veri-
care; essa è anche di classe C
1
, in voirt` u delluniforme continuità di f
u
, ed in
particolare si ha
F
u
0
(u
0
, u)x = x x X,
[F
u
(u
0
, u)g](t) = g(t)
_
t
t
0
[f
u
(s, u(s))]g(s) ds, t [t
0
, ], g C
1
([t
0
, ], X).
Verichiamo che F
u
(u
0
, u) : C
1
([t
0
, ], X) C
1
([t
0
, ], X) è invertibile. Fis-
sata g C
1
([t
0
, ], X), lequazione F
u
(u
0
, u)h = g (nellincognita h) equivale
allequazione integrale
h(t)
_
t
t
0
[f
u
(s, u(s))]h(s) ds = g(t), t [t
0
, ],
che a sua volta equivale al problema di Cauchy
_
h
(t) = f
u
(t, u(t))h(t) +g
(t), t [t
0
, ],
h(t
0
) = g(t
0
).
Questo problema è lineare, a coecienti continui: con lo stesso metodo che
si usa nel caso scalare, si dimostra che esso ha soluzione unica globale, ossia
denita nello stesso intervallo in cui sono deniti i coecienti (nel nostro
caso, [t
0
, ]), e dipendente con continuità dai dati. Esiste dunque ununica
h C
1
([t
0
, ], X) tale che F
u
(u
0
, u)h = g, e la sua norma in C
1
([t
0
, ], X) è
controllata dalla norma del secondo membro g nello stesso spazio. Questo
128
fatto ci dice che loperatore F
u
(u
0
, u) ha inverso continuo in C
1
([t
0
, ], X).
Sono dunque vericate per la funzione F tutte le ipotesi del teorema delle
funzioni implicite nellintorno di un arbitrario punto (u
0
, u) dello spazio X
C
1
([t
0
, ], X), nel quale risulti F(u
0
, u) = 0, ossia tale che u verichi, nell
intervallo [t
0
, ],
_
u
(t) = f(t, u(t)), t [t

0
, ],
u(t
0
) = u
0
Pertanto, scelto = t
1
(u
0
), per il teorema 3.7.1 esistono un intorno V di u
0
in X ed un intorno W di u in C
1
([t
0
, t
1
], X) tali che lequazione F(u
0
, u) = 0
ha soluzione unica in W per ogni x V , che dipende in modo C
1
da u
0
. In
altre parole, per ogni u
0
in V la soluzione u del problema di Cauchy
_
u
(t) = f(t, u(t)), t [t

0
, t
1
],
u(t
0
) = u
0
,
che è appunto la funzione u = (u
0
) denita implicitamente dallequazione
F(u
0
, u) = 0, dipende in modo C
1
del dato iniziale u
0
.
Osservazione 3.7.4 In modo analogo si può dimostrare che la soluzione del
problema di Cauchy dipendente da un parametro
_
u
(t) = f(t, u(t), ), t [t

0
, T], R ssato,
u(t
0
) = u
0
,
sotto le ipotesi precedenti e supponendo inoltre che la derivata f
sia conti-
nua, è dierenziabile con continuità rispetto al parametro .
Esercizi 3.7
1. Siano X, Y spazi di Banach. Provare che linsieme
1 = A L(X, Y ) : A
1
L(Y, X)
è aperto in L(X, Y ).
[Traccia: ssati A, B 1, si provi che A
1
= B
1
(I(AB)A
1
) e si
deduca che se la norma |AB|
L(X,Y )
è sucientemente piccola, allora
A
1
(I (A B)A
1
)
1
=
n=0
A
1
[(A B)A
1
]
n
è eettivamente
linverso di B.]
129
2. Siano X, Y, Z spazi di Banach e sia A(z) L(X, Y ) una famiglia di
operatori dipendenti da una variabile z Z. Se z A(z) è di classe
C
1
in una palla B(z
0
, R) e se esiste A(z
0
)
1
L(Y, X), si provi che:
(i) esiste A(z)
1
in tutti i punti z di unopportuna palla B(z
0
, r)
B(z
0
, R);
(ii) che lapplicazione z A(z)
1
è a sua volta di classe C
1
in B(z
0
, r),
e che la derivata di tale applicazione in un ssato punto z
B(z
0
, r) è lelemento di L(Z, L(Y, X)) cos` denito:
(A()
1
)
(z)h = A(z
0
)
1
[A
(z)h]A(z
0
)
1
h Z.
3. Con riferimento allenunciato del teorema 3.7.1, sia : B(x
0
, )
B(y
0
, ) la funzione denita implicitamente dallequazione F(x, y) = 0.
Supponendo F di classe C
2
, si calcoli
(x) in termini delle derivate

prime e seconde di F, nonche di e
.
4. Con riferimento alla dimostrazione del teorema 3.7.1, si denisca per
ogni n N
_
y
0
(x) = y
0
y
n+1
(x) = T
(x)
(y
n
(x)), n N,
x B(x
0
, );
si provi che per ogni x B(x
0
, ) la successione y
n
(x)
nN
converge
in Y al punto sso dellapplicazione T
(x)
.
5. Si dimostri il risultato di esistenza ed unicità locale per il problema di
Cauchy
_
u
(t) = f(t, u(t)), t [t

0
, T],
u(t
0
) = u
0
in uno spazio di Banach X. Si provi anche che se il secondo membro è
lineare o ane rispetto a u, la soluzione è globale.
3.8 Varietà tangente ad una curva di livello
DallAnalisi II sappiamo che se F è una funzione reale di classe C
1
denita
su R
2
, e Z è linsieme dei suoi zeri oppure una sua qualunque altra curva di
130
livello, allora in ogni punto P
0
= (x
0
, y
0
) Z nel quale il gradiente di F sia
non nullo esiste la retta r tangente a Z in P
0
. Lequazione di r è
F
x
(x
0
, y
0
)(x x
0
) +F
y
(x
0
, y
0
)(y y
0
) = 0,
ovvero F(P
0
) (P P
0
) = 0; in altre parole, si ha P r se e solo se il
vettore P P
0
appartiene al nucleo dellapplicazione lineare v F(P
0
) v.
La retta r è l unica fra quelle passanti per P
0
per la quale risulti
lim
PP
0
, PZ
d(P, r)
[P P
0
[
2
= 0.
Una situazione analoga si ha, sotto opportune ipotesi, nel caso di una funzione
F : X Y di classe C
1
, allorche X e Y sono spazi di Banach.
Teorema 3.8.1 (di Lyusternik) Siano X, Y spazi di Banach e sia F :
X Y una applicazione di classe C
1
. Sia Z
0
= x X : F(x) = 0,
e ssato x
0
Z
0
, supponiamo che il sottospazio T
0
= ker F
(x
0
) sia non
banale e deniamo la varietà ane T
x
0
= x
0
+ T
0
. Se loperatore lineare
F
(x
0
) : X Y è surgettivo, allora valgono le seguenti proprietà:
(i) lim
xx
0
, xZ
0
d(x, T
x
0
)
|x x
0
|
X
= 0,
(ii) lim
vx
0
, vTx
0
d(v, Z
0
)
|v x
0
|
X
= 0.
Se, in particolare, il sottospazio chiuso T
0
è complementabile in X, ossia
esiste un sottospazio chiuso S
0
X tale che X = T
0
S
0
, allora esiste un
intorno U di x
0
ed un omeomorsmo : T
x
0
U Z
0
U, di classe C
1
, tali
che
lim
vx
0
, vTx
0
|v (v)|
X
|v x
0
|
X
= 0, lim
xx
0
, xZ
0
|x
1
(x)|
X
|x x
0
|
X
= 0.
La varietà ane T
x
0
è dunque tangente alla curva di livello Z
0
nel punto
x
0
. Si osservi che se X è uno spazio di Hilbert allora T
0
è sempre comple-
mentabile: basta prendere S
0
= T
0
.
Osserviamo che il teorema di Lyusternik è falso quando ker F
(x
0
) = 0.
Ad esempio, se Y = X, x
0
= 0 e F(x) = x per ogni x X, si ha
T
0
= ker F
(x
0
) = ker I = 0 e Z
0
= 0: in questo caso ne (i), ne (ii)
131
hanno senso.
Dimostrazione Ci limitiamo per semplicità a provare la tesi nel caso com-
plementabile (per il caso generale si vedano gli esercizi 3.8.1 e 3.8.2).
Sia dunque T
0
,= 0 e X = T
0
S
0
. Osserviamo che se x = h+g con h T
0
e g S
0
, la norma |x|
X
è equivalente alla norma |h|
X
+|g|
X
: infatti lap-
plicazione (h, g) h + g è lineare, continua e bigettiva da T
0
S
0
su X, e
dunque per il teorema dellapplicazione aperta essa è un isomorsmo.
Per ogni x X scriviamo x x
0
= h + g, con h T
0
e g S
0
. Allora
lequazione F(x) = 0 equivale a
(h, g)
def
= F(x
0
+h +g) = 0,
ed è soddisfatta per (h, g) = (0, 0). Vogliamo applicare a questa equazione
il teorema delle funzioni implicite (teorema 3.7.1). Osserviamo che è di
classe C
1
, che
g
(0, 0) = F
(x
0
)[
S
0
e che tale applicazione è bigettiva: infatti
se g S
0
e F
(x
0
)g = 0, allora g S
0
T
0
= 0. Daltra parte, ssato
y Y , possiamo scegliere, in virt` u dellipotesi di surgettività, un elemento
v X tale che F
(x
0
)v = y: scrivendo v = h + g, con h T
0
e g S
0
,
otteniamo perciò y = F
(x
0
)(h + g) = F
(x
0
)g = F
(x
0
)[
S
0
g. In denitiva,
F
(x
0
)[
S
0
è un isomorsmo fra S
0
e Y .
Per il teorema delle funzioni implicite, esistono un intorno V di 0 in T
0
, un
intorno W di 0 in S
0
ed unapplicazione : V W di classe C
1
, tali che
(0) = 0 e
(h, g) = 0, (h, g) V W g = (h).
Inoltre si ha
(h) =
g
(h, (h))
1
h
(h, (h)) per ogni h V ; in partico-
lare
(0) =
g
(0, 0)
1
F
(x
0
)[
T
0
= 0.
Siano U = x
0
+ V + W e = x
0
+ V : U è un intorno di x
0
in X, mentre
è intorno di x
0
in T
x
0
. Consideriamo lapplicazione : X denita da
(v) = v +(v x
0
), v .
Posto x = (v), risulta x UZ
0
: infatti, detto h = vx
0
si ha h V , da cui
(h) W, x = v+(vx
0
) = x
0
+h+(h) U e F(x) = (h, (h)) = 0. In
denitiva manda in U Z
0
ed è continua, come composizione di funzioni
continue. Si ha anche, in particolare, (x
0
) = x
0
+(0) = x
0
.
132
Verichiamo che è bigettiva. Se (v) = (v
), allora posto h = v x
0
e h
= v
x
0
abbiamo x
0
+ h + (h) = x
0
+ h
+ (h
), da cui h h
=
(h
) (h) T
0
S
0
= 0; ne segue h = h
e dunque v = v
. Se poi
x U Z
0
, si ha x = x
0
+h +g, con h V e g W, e F(x) = (h, g) = 0:
quindi g = (h), e detto v = x
0
+h otteniamo x = v +(v x
0
) = (v).
Quindi, esiste
1
; proviamo che
1
è continua. Se x = x
0
+ h + g e
x
= x
0
+h
+g
sono punti di UZ
0
, allora
1
(x) = hx
0
e
1
(x
) = h
x
0
,
da cui
|
1
(x)
1
(x
)|
X
= |h h
|
X
|h h
|
X
+|g g
|
X
c|x x
|
X
.
Inne, per v e v x
0
si ha
|(v) v|
X
= |(v x
0
)|
X
=
= |(v x
0
) (0)
(0)(v x
0
)|
X
= o(|v x
0
|
X
),
mentre per x U Z
0
e x x
0
, posto v =
1
(x), si ha anche v x
0
ed
inoltre
|
1
(x) x|
X
|x x
0
|
X
=
|v (v)|
X
|x x
0
|
X
=
=
|v (v)|
X
|v x
0
|
X
|
1
(x)
1
(x
0
)|
X
|x x
0
|
X
c
o(|v x
0
|
X
)
|v x
0
|
X
.
Ci` o prova lultima parte dellenunciato.
Esempio 3.8.2 Siano X = L
2
(a, b), Y = R e F(g) = |g|
2
2
per ogni g X.
Fissata g X con |g|
2
2
= > 0, determiniamo la varietà tangente alla curva
di livello Z = f X : F(f) = . La derivata di Frechèt F
(g) è
F
(g)h = 2(g, h)
2
h X,
e tale applicazione è ovviamente surgettiva da X su R. Si ha
ker F
(g) = [g]
e dunque, per il teorema di Lyusternik,

T
g
= g + ker F
(g) = g + [g]
,
il che era prevedibile data la simmetria circolare della curva di livello Z.
133
Esercizi 3.8
1. Si dimostri lenunciato (i) del teorema 3.8.1 nel caso generale.
[Traccia: si introduca in X la relazione di equivalenza h
1
h
2

h
1
h
2
T
0
, e si osservi che F
(x
0
) induce un operatore A : X/T
0
Y ,
denito da A[h] = F
(x
0
)k per ogni k [h], il quale è bigettivo e
continuo: dunque A
1
L(Y, X/T
0
). Ciò premesso, sia > 0 e sia
> 0 tale che per |x x
0
|
X
< risulti
|F(x) F(x
0
) F
(x
0
)(x x
0
)|
X

2|A
1
|
L(Y,X/T
0
)
|x x
0
|
X
;
se ne deduca, per x = x
0
+d Z
0
,
|d|
X
= |[d]|
X/T
0

2
|d|
X
,
da cui
|d|
X
, g [d] B(0, 2|[d]|
X/T
0
) = |g|
X
|d|
X
.
Da qui si ricavi la tesi.]
2. Si dimostri lenunciato (ii) del teorema 3.8.1 nel caso generale.
[Traccia: posto c = |A
1
|
L(Y,X/T
0
)
, si ssi
0,
1
4c
, e si determini
> 0 tale che si abbia |F
(x) F
(x
0
)|
L(X,Y )
per |x x
0
|
X
,
e che inoltre per |k|
X
, |h|
X
risulti
|F(x
0
+k) F(x
0
+h) F
(x
0
)(k h)|
X
|k h|
X
.
Ciò premesso, ssato v = x
0
+ h T
x
0
, si ponga g
0
= 0, [h
1
] =
A
1
F(x
0
+h), e si scelga g
1
[h
1
] con |g
1
|
X
2|[h
1
]|
X/T
0
; poi, noti
[h
i
] e g
i
per i = 1, . . . , n, si ponga [h
n+1
] = [h
n
] A
1
F(x
0
+h+g
n
) e si
scelga g
n+1
[h
n+1
] con |g
n+1
g
n
|
X
2|[h
n+1
] [h
n
]|
X/T
0
. Si mostri
che esiste
0,

2
tale che |g
1
|
X
min,
1
2
|h|
X
; poi si dimostrino
per induzione le seguenti disuguaglianze:
|g
n
|
X

n1
k=0
2
k
|g
1
|
X
,
|[h
n+1
] [h
n
]|
X/T
0
2
n1
|g
1
|
X
, |g
n+1
g
n
|
X
2
n
|g
1
|
X
.
Si concluda che esistono g X e [d] X/T
0
tali che |g
n
g|
X
0 e
|[h
n
] [d]|
X/T
0
0. Si deduca inne che x = x
0
+ h + g Z
0
e che
|v x|
X
= |g|
X
2|h|
X
= 2|v x
0
|
X
.]
134
3.9 Massimi e minimi vincolati
Siano X, Y spazi di Banach e siano F : X R, : X Y funzioni
assegnate. Ci poniamo il problema di trovare il minimo o il massimo di F sul
vincolo costituito dallinsieme Z = x X : (x) = 0. Otterremo risultati
analoghi al caso dei vincoli in R
N
. Il risultato che segue è una versione
generalizzata del metodo dei moltiplicatori di Lagrange.
Teorema 3.9.1 Siano X, Y spazi di Banach reali e siano F : X R,
: X Y funzioni di classe C
1
. Sia Z = x X : (x) = 0, ssiamo
x
0
Z e supponiamo che lapplicazione lineare
(x
0
) abbia immagine chiusa
in Y . Se x
0
è punto di massimo relativo, o di minimo relativo, per F[
Z
, allora
esistono
0
R e Y
, non entrambi nulli, tali che
0
F
(x
0
) +
(x
0
)
= 0.
Si osservi che luguaglianza sopra scritta è fra elementi di X
; in particolare,
(x
0
)
è loperatore aggiunto di
(x
0
), denito da
(x
0
)
(x
0
) Y
.
Nelle applicazioni ha interesse soprattutto il caso in cui
0
,= 0, che si rea-
lizza, come vedremo dalla dimostrazione, quando
(x
0
) è unapplicazione
surgettiva.
Nel caso particolare in cui X = R
N
e Y = R
k
(N > k), il funzionale (R
k
)
è della forma x x, con R

k
; la derivata F
(x
0
) (R
N
)
si esprime
come x gradF(x
0
) x, e la derivata
(x
0
) L(R
N
, R
k
) è la matrice Ja-
cobiana (k N) di nel punto x
0
. Quindi la tesi del teorema si riduce al
fatto che esistono
0
,
1
, . . . ,
k
R tali che
0
F
x
j
(x
0
) +
k
i=1
i
x
j
(x
0
) = 0, j = 1, . . . , N.
Se la matrice Jacobiana di in x
0
ha rango massimo, allora Z è una varietà,
e in particolare
(x
0
) è surgettiva. In questo caso, come si è detto, possiamo
scegliere
0
,= 0: si ritrova cos` lusuale regola dei moltiplicatori di Lagrange.
Dimostrazione Sia K limmagine di
(x
0
): per ipotesi, K è un sottospazio
chiuso di Y . Distinguiamo i due casi K ,= Y e K = Y .
135
Se K ,= Y , per il teorema di Hahn-Banach esiste Y
0 tale che
[
K
= 0. Ne segue
[
(x
0
)
](x) = (
(x
0
)x) = 0 x X,
e quindi si ha la tesi del teorema scegliendo
0
= 0.
Supponiamo invece K = Y : osserviamo che se ker
(x
0
) = 0 allora
(x
0
)
è un isomorsmo fra X e Y , quindi
(x
0
)
è un isomorsmo fra Y
e X
:
pertanto scelto = [
(x
0
)
]
1
F
(x
0
) si ha subito F
(x
0
) +
(x
0
)
= 0
e la tesi è provata con
0
= 1. Altrimenti sarà ker
(x
0
) ,= 0: in
tal caso applichiamo a il teorema di Lyusternik (teorema 3.8.1). Posto
T
x
0
= x
0
+ ker
(x
0
), per la condizione (ii) si ha
lim
vx
0
, vTx
0
d(v, Z)
|v x
0
|
X
= 0.
Scegliamo v = x
0
+th, ove t R 0 e h è un ssato elemento di ker
(x
0
)
con norma unitaria; allora
lim
t0
d(x
0
+th, Z)
[t[
= 0.
Per ogni ssato t ,= 0 esiste x
t
Z tale che, posto r(t) = x
0
+thx
t
, risulta
|x
0
+th x
t
|
X
d(x
0
+th, Z) +t
2
; quindi si ha anche
lim
t0
|r(t)|
X
[t[
= 0.
Di conseguenza r(0) = 0 e r
(0) = 0. Sia ora

f(t) = F(x
t
) = F(x
0
+th r(t)), t R :
per lipotesi fatta su F la funzione f : R R ha un punto di massimo o di
minimo relativo in t = 0, e pertanto 0 = f
(0) = F
(x
0
)(hr
(0)) = F
(x
0
)h.
Se ne deduce, per linearità,
F
(x
0
)h = 0 h ker
(x
0
).
A questo punto ci serve un lemma di analisi funzionale.
Lemma 3.9.2 Siano X, Y spazi di Banach e sia A L(X, Y ) surgettivo.
Allora
R(A
) = X
: x = 0 x ker A.
136
Prima di dimostrare il lemma, concludiamo la dimostrazione del teorema
3.9.1: poiche F
(x
0
) ha valore nullo in ogni punto di ker
(x
0
), il lemma ci
garantisce che F
(x
0
) R(
(x
0
)
), e quindi esiste Y
tale che F
(x
0
) =
(x
0
)
. Ne segue la tesi del teorema scegliendo

0
= 1.
Dimostrazione del lemma 3.9.2 Sia R(A
): allora = A
, con
Y
, da cui x = (Ax) = (0) = 0 per ogni x ker A.

Viceversa, sia X
tale che x = 0 per ogni x ker A; cerchiamo Y
tale che = A
. Per ipotesi, ker ker A; ssato y Y , e scelti x, x
X
tali che Ax = Ax
= y (tali punti esistono perche A è surgettivo), avremo

x x
ker A e dunque x = x
. In altri termini, è costante sullinsieme

A
1
(y).
`
E lecito allora denire : Y R nel modo seguente:
(y) = x x A
1
(y),
ed ovviamente è un funzionale lineare. Proviamo che è continuo: se G è
un aperto di R, si ha
1
(G) = y Y : y G = Ax : x X, x G =
= Ax X : x G = A
1
(G).
Poiche è continua,
1
(G) è un aperto di X, mentre A
1
(G) è aperto in Y
in quanto A è unapplicazione aperta (essendo lineare, continua e surgettiva).
Ne segue che
1
(G) è aperto in Y e pertanto è continuo, ossia Y
.
Per denizione, si ha x = (Ax) = A
(x) per ogni x X, cioè = A
.
Osservazione 3.9.3 La condizione necessaria per lesistenza di un massimo
o di un minimo vincolato espressa dal teorema 3.9.1 (nel caso
0
= 1) dice
che è nullo il dierenziale di Frechèt in X Y
della funzione
H(x, ) = F(x) +((x)).
Infatti si verica senza dicoltà che
H
(x, )(h, ) = F
(x)h +(
(x)h) +((x)) =
= [F
(x) +
(x)
]h +((x)),
quindi tale dierenziale è nullo se e solo se
_
[F
(x) +
(x)
]h = 0 h X
((x)) = 0 Y
,
137
ossia se e solo se
_
F
(x) +
(x)
= 0
(x) = 0.
Esempio 3.9.4 Sia H uno spazio di Hilbert. Vogliamo determinare i punti
di massimo e di minimo della funzione F(x) = (x, y) sullinsieme
K = x H : |x| = 1, (x, z) = 0,
ove y, z sono ssati elementi di H.
Posto X = H, Y = R
2
e
: H R
2
, (x) =
_
|x|
2
1, (x, z)
_
x H,
il nostro problema è quello di trovare il massimo ed il minimo di F sul
vincolo K = x H : (x) = 0. Naturalmente si può supporre che z ed y
siano linearmente indipendenti (cosicche in particolare z ,= 0), poiche in caso
contrario avremmo F[
K
= 0 e quindi ci sarebbe ben poco da dire.
Questo problema si risolve facilmente con considerazioni geometriche, ma
vogliamo mostrare come la sua risoluzione sia possibile tramite il teorema
3.9.1. Per applicare tale teorema occorre vericare che limmagine di
(x) è
chiusa in R
2
; in eetti non è dicile vericare che ciò è vero, ed anzi, poiche
z ,= 0, lapplicazione
(x) è surgettiva per ogni x K in virt` u dellesercizio

3.9.3.
Sia allora x un punto di massimo relativo o di minimo relativo per F[
K
: per il
teorema 3.9.1 esistono R e (R
2
)
= R
2
tali che F
(x)+
(x)
= 0,
e dalla dimostrazione del teorema 3.9.1 segue che si può scegliere = 1; in
altre parole, posto = (, ), si ha
(y, v) + 2(x, v) +(z, v) = 0 v H,
il che implica (scrivendo in luogo di 2)
y = x +z.
Dai due vincoli |x|
2
= 1 e (x, z) = 0 segue subito, essendo z ,= 0, che
= (y, x), =
(y, z)
|z|
2
,
138
e di conseguenza, con facili calcoli,
x =
y
(y,z)
z
2
z
_
_
_y
(y,z)
z
2
z
_
_
_
.
`
E anche facile vericare che, come era prevedibile, i punti trovati sono addi-
rittura punti di minimo e di massimo assoluti per F sullinsieme K.
Esercizi 3.9
1. Sia H uno spazio di Hilbert reale e sia A L(H). Posto f(x) =
(Ax, x)
H
, si provi che se x
0
è punto di massimo o di minimo relativo
per la restrizione di f allinsieme B = x H : |x|
H
= 1, allora
esiste R tale che Ax
0
+A
x
0
= 2x
0
.
2. Nelle stesse ipotesi dellesercizio precedente, supponiamo anche che A
sia autoaggiunto. Si provi che se x
0
è punto di massimo assoluto per f
su B, allora Ax
0
= |A|
L(H)
x
0
, cosicche max
B
f = |A|
L(H)
.
3. Sia H uno spazio di Hilbert e siano y, z H. Si provi che lapplicazione
: H R
2
, denita da (v) = ((v, y), (v, z)), ha immagine chiusa; si
provi che essa coincide con R
2
se e solo se i vettori y, z sono linearmente
indipendenti.
139
Capitolo 4
Calcolo delle variazioni
4.1 Funzionali del calcolo delle variazioni
In questo capitolo ci limiteremo ad alcuni cenni su una problematica che è
vastissima ed alla quale sono dedicati interi scaali di biblioteche ed innu-
merevoli articoli di ricerca. Il problema principale del calcolo delle variazioni
è la minimizzazione di funzionali dipendenti da variabili che si muovono in
spazi di funzioni; la scelta degli spazi in cui cercare la soluzione di un pro-
blema di minimo è in genere parte integrante del problema stesso.
Limitandoci al caso di funzioni di una sola variabile, considereremo soprat-
tutto il seguente problema tipico: si vuole minimizzare un funzionale della
forma
J(y) =
_
b
a
F(x, y(x), y
(x))dx
nella classe delle y C
1
[a, b] soggette (eventualmente) a certe condizioni
negli estremi a, b. Dunque la classe X delle funzioni ammissibili è un sot-
tospazio (lineare od ane) di C
1
[a, b]. Supporremo, come ipotesi minima,
che lintegrando F sia di classe C
1
nei suoi argomenti (x, y, p) [a, b] R
2
.
Senza grosse complicazioni, incontreremo anche funzionali che dipendono da
funzioni a valori in R
m
: in tal caso la F sarà di classe C
1
in [a, b] R
2m
.
Verichiamo anzitutto che nelle ipotesi fatte, il funzionale J è dierenziabile.
Proposizione 4.1.1 Sia J(y) =
_
b
a
F(x, y(x), y
(x))dx per y C
1
[a, b]. Se
F C
1
([a, b] R
2
), allora il funzionale J è F-dierenziabile in C
1
[a, b], e
140
per ogni v C
1
[a, b] si ha
J
(y)v =
_
b
a
_
F
y
(x, y(x), y
(x)) v(x) +F
p
(x, y(x), y
(x)) v
(x)
_
dx.
Dimostrazione Sia y C
1
[a, b]. Per ogni v C
1
[a, b] possiamo scrivere
J(y +v) J(y) =
=
_
b
a
_
F(x, y(x) +v(x), y
(x) +v
(x)) F(x, y(x), y
(x))
_
dx =
=
_
b
a
_
1
0
d
dt
F(x, y(x) +tv(x), y
(x) +tv
(x)) dtdx =
=
_
b
a
_
1
0
_
F
y
(x, y(x) +tv(x), y
(x) +tv
(x)) v(x) +
+F
p
(x, y(x) +tv(x), y
(x) +tv
(x)) v
(x)
_
dtdx;
applicando il teorema della media, per ogni x [a, b] esiste un opportuno
x
]0, 1[ tale che lultimo membro si può riscrivere come
_
b
a
_
F
y
(x, y(x) +
x
v(x), y
(x) +
x
v
(x)) v(x)+
+F
p
(x, y(x) +
x
v(x), y
(x) +
x
v
(x)) v
(x)
_
dx.
Pertanto possiamo decomporre lincremento J(y +v) J(y) nella forma
J(y +v) J(y) =
=
_
b
a
_
F
y
(x, y(x), y
(x)) v(x) +F
p
(x, y(x), y
(x)) v
(x)
_
dx +
+
_
b
a
_
[F
y
(x, y(x) +
x
v(x), y
(x) +
x
v
(x)) F
y
(x, y(x), y
(x))] v(x) +
+[F
p
(x, y(x) +
x
v(x), y
(x) +
x
v
(x)) F
p
(x, y(x), y
(x))] v
(x)
_
dx.
Verichiamo che il secondo integrale è innitesimo per |v|
C
1
[a,b]
0. Le de-
rivate di F sono per ipotesi continue; ssato M > 0 tale che M > 2|y|
C
1
[a,b]
,
esse sono uniformemente continue nel compatto [a, b] [M, M] [M, M].
141
Pertanto, dato > 0, esiste ]0, M/2[ per cui, se |v|
C
1
[a,b]
< , allora
_
b
a
_
[F
y
(x, y(x) +
x
v(x), y
(x) +
x
v
(x)) F
y
(x, y(x), y
(x))] v(x)+
+[F
p
(x, y(x) +
x
v(x), y
(x) +
x
v
(x)) F
p
(x, y(x), y
(x))] v
(x)
_
dx

_
b
a
[[v(x)[ +[v
(x)[]dx (b a)|v|
C
1
[a,b]
.
Osservazioni 4.1.2 (1) Nel caso in cui F C
1
([a, b] R
2m
), la derivata di
Frechèt di J assume esattamente la stessa forma, con lunica dierenza che
nellintegrale i prodotti F
y
v +F
p
v
sono prodotti scalari in R

m
.
(2) Se F C
2
([a, b] R
2
), con procedimento analogo si può dimostrare che
il funzionale J è dierenziabile due volte e che
[J
(y)v]w =
_
b
a
_
F
yy
(x, y(x), y
(x))v(x)w(x) +
+ F
yp
(x, y(x), y
(x))[v(x)w
(x) +w(x)v
(x)] +
+ F
pp
(x, y(x), y
(x))v
(x)w
(x)
_
dx.
Un analogo risultato vale nel caso in cui F C
2
([a, b]R
2m
) (esercizio 4.1.1).
Esercizi 4.1
1. Dimostrare che se F C
2
([a, b] R
2m
) allora il funzionale
J(y) =
_
b
a
F(x, y(x), y
(x))dx, y C
1
([a, b], R
m
)
è dierenziabile due volte e che
[J
(y)v]w =
_
b
a
_
F
yy
(x, y(x), y
(x))v(x) w(x) +
+ F
yp
(x, y(x), y
(x))v(x) w
(x) +
+ F
yp
(x, y(x), y
(x))w(x) v
(x) +
+ F
pp
(x, y(x), y
(x))v
(x) w
(x)
_
dx.
142
2. Fissata una curva regolare
0
C
1
[a, b], R
N
), si provi che il funzionale
lunghezza darco J() =
_
b
a
[
(t)[
N
dt è F-dierenziabile due volte
nello spazio C
1
([a, b], R
N
) per =
0
, mentre è semicontinuo inferior-
mente, ma non continuo, in C
1
[a, b], R
N
) rispetto alla topologia indotta
dalla norma uniforme.
4.2 Lemmi fondamentali del calcolo delle va-
riazioni
Per trovare i punti di minimo del funzionale J introdotto nel paragrafo pre-
cedente, cercheremo anzitutto di utilizzare la condizione necessaria espressa
dalla proposizione 3.6.1. A questo scopo, è chiaro che le migliori informazioni
per la determinazione dei punti di minimo si hanno quando si è in grado di
dedurre condizioni necessarie legate allintegrando F. Per procurarci que-
ste informazioni sono utilissimi i seguenti lemmi, globalmente denominati
lemmi fondamentali del calcolo delle variazioni.
Lemma 4.2.1 Sia C([a, b], R
N
) tale che
_
b
a
(x) (x) dx = 0 C
1
0
([a, b], R
N
);
allora = 0 in [a, b].
Ricordiamo che C
1
0
([a, b], R
N
) = C
1
([a, b], R
N
) : (a) = (b) = 0.
Dimostrazione Basta provare, in virt` u della continuità di , che (x) = 0
per ogni x ]a, b[. Se in un punto x
0
]a, b[ fosse (x
0
) ,= 0, allora esiste una
componente i 1, . . . , N tale che
i
(x
0
) ,= 0 (e possiamo supporre che sia
i
(x
0
) > 0). Quindi, sempre per continuità, esiste [x
1
, x
2
] [a, b] tale che
i
(x) > 0 per ogni x [x
1
, x
2
].
Scegliamo una funzione C
1
0
([a, b], R
N
) nel modo seguente: la componente
i-esima di è
i
(x) =
_
(x x
1
)
2
(x
2
x)
2
se x [x
1
, x
2
],
0 se x [a, b] [x
1
, x
2
],
143
mentre se j ,= i, poniamo
j
(x) = 0 per ogni x [a, b].
`
E chiaro che
C
1
0
[a, b]. Allora dallipotesi segue
0 =
_
b
a
(x) (x) dx =
_
x
2
x
1
i
(x)(x x
1
)
2
(x
2
x)
2
dx > 0,
il che è assurdo. Dunque è nulla su [a, b].
N
) tale che
_
b
a
(x)
(x) dx = 0 C
1
0
([a, b], R
N
);
allora è costante in [a, b].
Dimostrazione Deniamo
c =
1
b a
_
b
a
() d, (x) =
_
x
a
[() c] d, x [a, b];
allora C
1
0
([a, b], R
N
) per la scelta di c. Poiche
(x) = (x) c, si ha
dallipotesi
_
b
a
[(x) c[
2
N
dx =
_
b
a
((x) c)
(x) dx = 0 c [(b) (a)] = 0,

da cui la tesi.
Lemma 4.2.3 Siano , C([a, b], R
N
) tali che
_
b
a
[(x) (x) +(x)
(x)] dx = 0 C
1
0
([a, b], R
N
);
allora C
1
([a, b], R
N
) e
= in [a, b].
Dimostrazione Poniamo A(x) =
_
x
a
() d, x [a, b]; allora per ogni
C
1
0
([a, b], R
N
) si ha, usando lipotesi ed integrando per parti,
0 =
_
b
a
[(x) (x) +(x)
(x)] dx =
_
b
a
[A(x) +(x)]
(x) dx,
e dal lemma 4.2.2 segue che A+ è costante in [a, b]. Dunque, = A+c
C
1
([a, b], R
N
) e
= A
= in [a, b].
Deniamo lo spazio
C
2
0
([a, b], R
N
) = C
2
([a, b], R
N
) : (a) = (b) =
(a) =
(b) = 0.
I due lemmi che seguono costituiscono la generalizzazione dei due precedenti.
144
N
) tale che
_
b
a
(x)
(x) dx = 0 C
2
0
([a, b], R
N
);
allora è un polinomio di grado non superiore a 1 in [a, b].
Dimostrazione Poniamo
(x) =
_
x
a
(x )[() c d( a)]d, x [a, b],
e cerchiamo c, d R
N
tali che C
2
0
([a, b], R
N
). Con facili calcoli si trova
che occorre scegliere
c =
2
(b a)
2
__
b
a
() d
3
b a
_
b
a
(b )() d
_
,
d =
6
(b a)
2
__
b
a
() d
2
b a
_
b
a
(b )() d
_
.
Con questa scelta si ottiene
_
b
a
[(x) c d(x a)[
2
N
dx =
=
_
b
a
((x) c d(x a))
(x) dx =
= 0 c [
(b)
(a)] d(b a)
(b) +d [(b) (a)] = 0,

cioè la tesi.
Lemma 4.2.5 Siano , , C([a, b], R
N
) tali che risulti, per ogni
C
2
0
([a, b], R
N
),
_
b
a
[(x) (x) +(x)
(x) +(x)
(x)] dx = 0;
allora C
1
([a, b], R
N
),
C
1
([a, b], R
N
) e (
= in [a, b].
145
Dimostrazione Deniamo
A(x) =
_
x
a
(x )() d, B(x) =
_
x
a
() d, x [a, b].
Dallipotesi, integrando per parti, segue
0 =
_
b
a
[(x) (x) +(x)
(x) +(x)
(x)] dx =
=
_
b
a
(A(x) B(x) +(x))
(x) dx C
2
0
([a, b], R
N
).
Per il lemma 4.2.4, si ha (x)+A(x)B(x) = c+d(xa) per ogni x [a, b];
quindi, per dierenza, C
1
([a, b], R
N
) e
= d A
+ in [a, b]. Da qui

ricaviamo
= dA
C
1
([a, b], R
N
) e (
= in [a, b]. Ne segue

la tesi.
Esercizi 4.2
1. Si enunci e si dimostri la generalizzazione del lemma 4.2.4 al caso
dellequazione
_
b
a
(x)
(n)
(x) dx = 0 C
n
0
([a, b], R
N
),
ove
C
n
0
([a, b], R
N
) = C
n
([a, b], R
N
) :
(k)
(a) =
(k)
(b) = 0 per k = 0, 1, . . . , n 1.
2. Si enunci e si dimostri la generalizzazione del lemma 4.2.5 al caso
dellequazione
_
b
a
n
k=0
k
(x)
(k)
(x) dx = 0 C
n
0
([a, b], R
N
).
3. Si dimostri il lemma 4.2.1 supponendo L
1
(a, b), anziche
C([a, b], R
N
).
[Traccia: ssato > 0, si ssi g C
0
[a, b] tale che |g|
1
< e se ne
146
deduca che
_
b
a
gdt
< ||
per ogni C
0
[a, b]). Per stimare |g|
1
,
si denisca K
1
= t [a, b] : g(t) , K
2
= t [a, b] : g(t) e
K = K
1
K
2
. Si scelga una funzione C
0
[a, b] tale che [[ 1, = 1
su K
1
e = 1 su K
2
: osservato che in [a, b] K si ha [g[ [g[ < ,
si provi che |g|
1
+ (b a), e si concluda che ||
1
< (2 +b a)
per ogni > 0.]
4. Si dimostri il lemma 4.2.1 supponendo L
1
(a, b; R
N
), anziche
C([a, b], R
N
).
[Traccia: si utilizzi lesercizio precedente.]
5. Si dimostrino i lemmi 4.2.2, 4.2.3, 4.2.4 e 4.2.5 supponendo le funzioni
, , in L
1
(a, b; R
N
) anziche in C([a, b], R
N
).
6. Sia X uno spazio di Banach e siano u, v L
p
(a, b; X), 1 < p < . Se
risulta
_
b
a
[u(t)(t) +v(t)
(t)] dt = 0 C
0
(]a, b[, R),
si provi che v è derivabile q.o. e che v
(t) = u(t) q.o. in [a, b].

[Traccia: si ssi X
e si osservi che
_
b
a
[u(t)(t)+v(t)
(t)] dt =
0 per ogni C
0
(]a, b[, R); se ne deduca che (
_
b
s
u(t)dt + v(s)
v(b)) = 0 per ogni s [a, b]. Fissato s e scelto opportunamente , si
mostri che v(s) +
_
b
s
u(t)dt = v(b) e si ricavi la tesi.]
4.3 Equazione di Eulero
Veniamo al risultato principale del calcolo delle variazioni: i punti di mini-
mo o di massimo relativo del funzionale J sono soluzioni di una equazione
dierenziale che è legata soltanto allintegrando F.
Teorema 4.3.1 Sia F C
1
([a, b] R
2
) e sia J il funzionale denito da
J(y) =
_
b
a
F(x, y(x), y
(x))dx
nella classe X = y C
1
[a, b] : y(a) = A, y(b) = B. Se y
0
è un punto
di minimo relativo, o di massimo relativo, per J in X, allora y
0
è soluzione
147
dellequazione dierenziale
d
dx
F
p
(x, y(x), y
(x)) = F
y
(x, y(x), y
(x)) in [a, b],

che è detta equazione di Eulero del funzionale J.
Dimostrazione Supponiamo che y
0
sia punto di minimo locale. Possiamo
scrivere, in virt` u della proposizione 4.1.1,
J
(y
0
)v =
_
b
a
_
F
y
(x, y
0
(x), y
0
(x)) v(x) +F
p
(x, y
0
(x), y
0
(x)) v
(x)
_
per ogni v C
1
[a, b]. Poiche in particolare si ha y
0
+ v X per ogni
v C
1
0
[a, b], ripetendo largomentazione usata per provare la proposizione
3.6.1 si ricava
J
(y
0
)v =
_
b
a
_
F
y
(x, y
0
(x), y
0
(x)) v(x) +F
p
(x, y
0
(x), y
0
(x)) v
(x)
_
dx = 0
per ogni v C
1
0
[a, b]. Dal lemma 4.2.3 segue allora la tesi.
Osservazioni 4.3.2 (1) Le soluzioni dellequazione di Eulero di un funzio-
nale J si dicono estremali del funzionale J nella classe X. Un punto y
0
X è
unestremale per J se e solo se J
(y
0
)v = 0 per ogni v C
1
0
[a, b]. Non è detto,
in generale, che unestremale sia punto di massimo o di minimo relativo per
J.
(2) Se però il funzionale J, oltre che F-dierenziabile, è anche convesso, al-
lora ogni estremale di J è punto di minimo assoluto per J: infatti in virt` u
dellesercizio 3.3.5 si ha
J(y
0
+v) J(y
0
) +J
(y
0
)v = J(y
0
) v C
1
0
[a, b].
Se inoltre J è strettamente convesso, il punto di minimo è unico.
Una condizione che assicura la convessità di J è la convessità dellintegrando
F nelle variabili (y, p) R
2
(esercizio 4.3.5).
(3) Quando F C
1
([a, b], R
2m
), lequazione di Eulero è un sistema di m
equazioni della forma
d
dx
F
p
i
(x, y(x), y
(x)) = F
y
i
(x, y(x), y
(x)) in [a, b], i = 1, . . . , m.

148
Esempio 4.3.3 Dati due punti A, B R
N
, e ssati a, b R con a < b,
vogliamo determinare le curve regolari : [a, b] R
N
il cui sostegno ha per
estremi i punti A e B ed ha lunghezza minima; chiaramente, ci aspettiamo
di trovare il segmento di estremi A e B. Dobbiamo determinare il punto di
minimo assoluto del funzionale
J() =
_
b
a
[
[
N
dt
nella classe X = C
1
([a, b], R
N
) : [
[
N
,= 0, (a) = A, (b) = B. Poiche
si suppone [
[
N
,= 0, la funzione integranda F(t, y, p) = [p[
N
è di classe C
1
,
anzi C
, ed in particolare F
p
i
(t, y, p) = p
i
/[p[
N
e F
y
i
= 0. Dunque, se una
curva realizza il minimo di J, per il teorema 4.3.1 essa deve soddisfare
lequazione di Eulero, cioè il sistema seguente:
d
dt
i
(t)
[
(t)[
N
= 0 t [a, b], i = 1, . . . , N,
da cui
i
(t)
[
(t)[
N
= c
i
t [a, b], i = 1, . . . , N.
Questa relazione esprime il fatto che il versore tangente alla curva è lo stesso
in ogni punto e vale c = (c
1
, . . . , c
N
); ovviamente, [c[
N
= 1. Del resto,
integrando fra a e b troviamo
B A =
_
b
a
(t) dt = c
_
b
a
[
(t)[
N
dt = c J(),
da cui, come era da aspettarsi, J() = [B A[
N
, e di conseguenza
c =
B A
[B A[
N
.
Dunque il versore tangente alla curva ha in ogni punto la direzione di BA;
quindi il sostegno di è il segmento AB. Le equazioni parametriche di
sono
(t) = A +
B A
[B A[
N
_
t
a
[
()[
N
d t [a, b].
Si noti che la nostra impostazione del problema fornisce innite curve solu-
zioni, tutte parametrizzate su [a, b] ed aventi come sostegno il segmento di
149
estremi A e B; il passaggio dalluna allaltra avviene tramite cambiamenti di
parametro : [a, b] [a, b] di classe C
1
, i quali non alterano il funzionale
lunghezza ma solo la velocità istantanea di percorrenza del segmento AB.
In questo caso, la condizione necessaria ci ha permesso di trovare i punti di
minimo. Si noti che non abbiamo dimostrato che le curve del tipo sopra
scritto siano punti di minimo del funzionale J; tuttavia questo fatto (molto
verosimile, del resto!) segue osservando che J è convesso e ricordando los-
servazione 4.3.2 (2). Pi` u semplicemente ancora, esso può essere vericato nel
modo seguente: per ogni curva : [a, b] R
N
di estremi A, B, si ha
J() =
_
b
a
[
(t)[
N
dt
_
b
a
(t) dt
N
= [(b) (a)[
N
= [B A[
N
,
mentre per valeva luguaglianza.
Esercizi 4.3
1. Trovare le estremali dei seguenti funzionali in C
1
[a, b]:
(i) J(y) =
_
b
a
[y(x)
2
+y
(x)
2
+ 2y(x)e
x
]dx,
(ii) J(y) =
_
b
a
[y(x)
2
y
(x)
2
2y(x) cosh x]dx,
(iii) J(y) =
_
b
a
y
(x)[1 +x
2
y
(x)]dx,
(iv) J(y) =
_
b
a
[x
2
y
(x)
2
+ 2y(x)
2
+ 2xy(x)]dx.
2. Risolvere lequazione di Eulero del funzionale
J(y) =
_
b
a
f(x)
_
1 +y
(x)
2
dx, y C
1
[a, b],
ove f(x) > 0 è una funzione assegnata, considerando in particolare i
casi f(x) =

x e f(x) = x.
3. Determinare, se esiste, il minimo del funzionale
_
1
0
_
1
2
y
(x)
2
+y(x)y
(x) +y
(x) +y(x)
_
dx
in C
1
[0, 1] ed in y C
1
[0, 1] : y(0) = y(1) = 0.
150
4. (Problemi ad estremi variabili) Si provi che se y
0
è unestremale per il
funzionale
J(y) =
_
b
a
F(x, y(x), y
(x))dx
nella classe X = y C
1
[a, b] : y(a) [A
1
, A
2
], y(b) [B
1
, B
2
], allora
y
0
verica, oltre allequazione di Eulero, le condizioni agli estremi
F
p
(a, y
0
(a), y
0
(a)) = 0, F
p
(b, y
0
(b), y
0
(b)) = 0.
5. Si provi che se F(x, y, p) è di classe C
1
ed è convessa rispetto a (y, p),
allora il funzionale J(y) =
_
b
a
F(x, y(x), y
(x))dx è convesso. Si provi

anche che la stretta convessità di F in (y, p) implica la stretta convessità
di J.
4.4 Integrali primi
Molto spesso lo studio e la risoluzione dellequazione di Eulero di un funziona-
le sono tuttaltro che agevoli. In certi casi particolari, tuttavia, la struttura
dellequazione è tale da semplicare la situazione: ciò accade ad esempio
allorche lequazione possiede un integrale primo, cioè si riesce a ricavare
unequazione dierenziale pi` u semplice della quale ogni estremale deve essere
soluzione. Vale a questo proposito la seguente
_
b
a
F(x, y(x), y
(x))dx, con F C
1
([a, b]
R
2
). Se lintegrando F è di classe C
2
e non dipende dalla variabile x, ossia
F = F(y, p) C
2
(R
2
), allora ogni estremale y di J verica anche lequazione
F(y(x), y
(x)) y
(x)F
p
(y(x), y
(x)) = c x [a, b],

ove c è una costante. Si dice che lequazione qui scritta è un integrale primo
dellequazione di Eulero.
Si noti che la presenza di un integrale primo permette di abbassare il grado
dellequazione dierenziale da risolvere.
Dimostrazione Sia y unestremale dellequazione di Eulero
d
dx
F
p
(y(x), y
(x)) = F
y
(y(x), y
(x)).
151
Osserviamo anzitutto che se in un punto x [a, b] si ha F
pp
(y(x), y
(x)) ,= 0,
allora in quel punto esiste la derivata seconda y
(x). Infatti, utilizzando il

teorema di Lagrange,
F
y
(y(x), y
(x)) = lim
h0
1
h
[F
p
(y(x +h), y
(x +h)) F
p
(y(x), y
(x))] =
= lim
h0
1
h
[F
py
(
h
,
h
)(y(x +h) y(x)) +F
pp
(
h
,
h
)(y
(x +h) y
(x))]
ove (
h
,
h
), (
h
,
h
) sono punti opportuni nel segmento di estremi (y(x), y
(x))
e (y(x + h), y
(x + h)). Nelluguaglianza precedente, quando h 0 il

primo termine allultimo membro converge a F
py
(y(x), y
(x))y
(x); quindi
anche il secondo converge: indichiamo il suo limite con G(x). Siccome
F
pp
(y(x), y
(x)) ,= 0, si ha che
y
(x) = lim
h0
y
(x +h) y
(x)
h
=
F
y
(y(x), y
(x)) F
py
(y(x), y
(x))y
(x)
F
pp
(y(x), y
(x))
,
cosicche G(x) = y
(x)F
pp
(y(x), y
(x)) nei punti in cui F

pp
(y(x), y
(x)) ,= 0.
Ci` o prova lasserzione precedente. In denitiva, vale lequazione
0 = F
y
(y(x), y
(x))
d
dx
F
p
(y(x), y
(x)) =
= F
y
(y(x), y
(x)) F
py
(y(x), y
(x))y
(x) G(x)
in ogni punto x [a, b].
Daltra parte, calcolando il rapporto incrementale della quantità
F(y(x), y
(x)) y
(x)F
p
(y(x), y
(x)),
152
si ottiene, decomponendo opportunamente,
1
h
_
F(y(x +h), y
(x +h)) y
(x +h)F
p
(y(x +h), y
(x +h))
F(y(x), y
(x)) +y
(x)F
p
(y(x), y
(x))
_
=
=
1
h
[F(y(x +h), y
(x +h)) F(y(x), y
(x +h))] +
+
1
h
[F(y(x), y
(x +h)) F(y(x), y
(x))]
1
h
[y
(x +h) y
(x)]F
p
(y(x +h), y
(x +h))
1
h
y
(x)[F
p
(y(x +h), y
(x +h)) F
p
(y(x), y
(x +h))]
1
h
y
(x)[F
p
(y(x), y
(x +h)) F
p
(y(x), y
(x))] =
= I + II + III + IV + V.
Quando h 0 si ha:
I = o(1) +F
y
(y(x), y
(x))y
(x),
IV = o(1) F
py
(y(x), y
(x))y
(x)
2
;
inoltre, in virt` u del teorema di Lagrange,
II = o(1) +F
p
(y(x), y
(x))
y
(x +h) y
(x)
h
,
III = o(1) F
p
(y(x), y
(x))
y
(x +h) y
(x)
h
,
e inne
V = o(1) G(x)y
(x),
quantità che ha sempre senso per quanto osservato in precedenza. Si conclude
allora, sommando i cinque termini e ricordando lequazione precedentemente
ottenuta, che
d
dx
[F(y(x), y
(x)) y
(x)F
p
(y(x), y
(x))] =
= F
y
(y(x), y
(x))y
(x) F
py
(y(x), y
(x))y
(x)
2
G(x)y
(x) =
= 0 x [a, b],
153
Esempio 4.4.2 Vogliamo trovare una curva cartesiana y C
1
[a, b], stret-
tamente positiva, con valori ssati negli estremi, la cui rotazione attorno
allasse x generi una supercie di area minima. Fissati dunque A, B > 0,
cerchiamo una funzione y(x) che renda minimo il funzionale
J(y) = 2
_
b
a
y(x)
_
1 +y
(x)
2
dx
nella classe
X = y C
1
[a, b] : y(a) = A, y(b) = B, y(x) > 0 x [a, b].
Se y X, allora se v C
1
0
[a, b] si ha y + v X, purche la norma |v|
C
1
[a,b]
sia sucientemente piccola. Quindi, se y
0
è punto di minimo per J, varrà
lequazione di Eulero: essendo
F(x, y, p) = y
_
1 +p
2
, F
p
(x, y, p) =
yp
_
1 +p
2
, F
y
=
_
1 +p
2
,
avremo
d
dx
y(x)y
(x)
_
1 +y
(x)
2
=
_
1 +y
(x)
2
x [a, b].
Questa equazione è piuttosto complicata: fortunatamente però lintegrando
F non dipende dalla variabile x e quindi, per la proposizione 4.4.1, si ha
lintegrale primo
y(x)
_
1 +y
(x)
2
y(x)y
(x)
2
_
1 +y
(x)
2
= c x [a, b],
ossia, semplicando,
y(x)
_
1 +y
(x)
2
= c x [a, b].
Se c = 0 otteniamo y(x) = 0, non ammissibile. Se invece c ,= 0, per risol-
vere lequazione dierenziale introduciamo una variabile ausiliaria t = t(x),
ponendo
y
(x) = sinh t(x), ossia t(x) = log(y
(x) +
_
1 +y
(x)
2
).
154
Si ha allora
y(x) = c
_
1 +y
(x)
2
= c
_
1 + sinh
2
t(x) = c cosh t(x) x [a, b];
inoltre
sinh t(x) = y
(x) =
d
dx
c cosh t(x) = c sinh t(x) t
(x),
da cui t(x) = 0 oppure t
(x) =
1
c
. Il primo caso corrisponde a y(x) = c, non
ammissibile se A ,= B; nel secondo caso segue che t(x) è invertibile e linversa
x(t) verica x
(t) = c, per cui x(t) = ct+d. Quindi t =

x(t)d
c
, ed in denitiva
y(x) = c cosh t(x) = c cosh
x d
c
, x [a, b].
`
E facile vericare che queste funzioni risolvono eettivamente lequazione dif-
ferenziale.
Abbiamo cos` ottenuto come estremali delle catenarie; le corrispondenti su-
perci di rotazione si chiamano catenoidi. Occorre ora imporre le condizioni
agli estremi:
y(a) = c cosh
a d
c
= A, y(b) = c cosh
b d
c
= B;
da queste si dovrebbero ricavare le costanti c, d. Si trovano due, una o nessuna
soluzione a seconda di come sono scelti i valori A, B (vedere lesercizio 4.4.2).
Anche in questo caso non abbiamo dimostrato che le estremali sono in eetti
punti di minimo del funzionale: questo comunque è vero poiche il funzionale
è convesso nella regione y > 0, p R.
Esempio 4.4.3 Uno dei problemi che storicamente hanno motivato la na-
scita del calcolo delle variazioni è il problema della brachistocrona: dati due
punti (a, A), (b, B) in R
2
con A > B, si cerca una curva cartesiana tale che
un punto materiale vincolato a muoversi lungo vada dal primo al secondo
estremo impiegando un tempo minimo.
Possiamo ssare lorigine delle coordinate in modo che a = 0 e B = 0, e
supporre che il punto abbia massa unitaria. Per il principio di conservazio-
ne dellenergia, ssato x [0, b] e detti y(x) lordinata del punto e v(x) il
modulo della sua velocità, si avrà
1
2
v(x)
2
+gy(x) = gA,
155
ove g è la costante di gravitazione; quindi
v(x) =
_
2g(A y(x)).
Poiche il vettore velocità è tangente al graco di in ogni punto, lo spazio
s percorso lungo è pari a vt, dove t è il tempo impiegato. Dunque, il
funzionale da minimizzare, cioè il tempo totale per andare dal primo estremo
al secondo lungo è dato dallintegrale curvilineo
J(y) = T =
_
1
v
ds =
_
b
0
_
1 +y
(x)
2
_
2g(A y(x))
dx.
La classe delle funzioni ammissibili è
X = y C[0, b] C
1
]0, b] : y(0) = A, y(b) = 0, 0 < y(x) < A x ]0, b[.
Si noti che a priori non possiamo prendere y C
1
[0, b], perche la soluzione
potrebbe avere pendenza nel punto iniziale. Lintegrando è
F(y, p) =
_
1 +p
2
_
2g(A y)
,
quindi non dipende da x; si ha poi
F
y
(y, p) =
_
1 +p
2
2
2g(A y)
3/2
, F
p
(y, p) =
p
_
2g(A y)(1 +p
2
)
.
Si noti che se y X allora y + v X per ogni v C
1
0
[0, b[ sucientemente
piccola (in particolare, v deve annullarsi in un intorno sinistro di b). Dunque,
possiamo dire che vale lequazione di Eulero (dapprima soltanto in ]0, b ],
con arbitrario, e poi di conseguenza in ]0, b]); anzi, per la proposizione 4.4.1,
esiste lintegrale primo
_
1 +y
(x)
2
_
2g(A y(x))
(x)
2
_
2g(A y(x))(1 +y
(x)
2
)
= c x ]0, b],
che, dopo semplicazioni, diventa
_
2g(A y(x))(1 +y
(x)
2
) =
1
c
x ]0, b].
156
Quadrando e ponendo u(x) = A y(x), si ottiene
u(x)(1 +u
(x)
2
) = K x ]0, b].
Come nellesempio 4.4.2, introduciamo la variabile ausiliaria t(x) mediante
la relazione
u
(x) =
1
tan
t(x)
2
, x ]0, b]
(si noti che t(x) ,= 0 per ogni x ]0, b]). Con procedura analoga, troviamo
per ogni x ]0, b]
u(x) =
K
1 +u
(x)
2
=
K
1 +
1
tan
2
t(x)
2
=
K
2
(1 cos t(x)),
da cui
1
tan
t(x)
2
= u
(x) =
K
2
sin t(x) t
(x)
e dunque
t
(x) =
2
K
1
sin t(x) tan
t(x)
2
=
1
K sin
2 t(x)
2
=
2
K(1 cos t(x))
x ]0, b].
Perciò t(x) è invertibile e linversa x(t) verica
x
(t) =
K
2
(1 cos t),
da cui x(t) =
K
2
(t sin t); ne segue che la curva (x, u(x)) è data, in forma
parametrica, da
x(t) =
K
2
(t sin t), u(x(t)) =
K
2
(1 cos t).
Si tratta quindi di un arco di cicloide. Tornando alla funzione originaria y,
essa è data da
x(t) =
K
2
(t sin t), y(x(t)) = A
K
2
(1 cos t).
Questa curva, che è ancora una cicloide, passa per il punto (0, A) in corrispon-
denza del valore t = 0; passerà per laltro estremo (b, 0) in corrispondenza di
un certo valore t
0
> 0 tale che
x(t
0
) = b =
K
2
(t
0
sin t
0
), y(x(t
0
)) = 0 = A
K
2
(1 cos t
0
).
157
Il valore t
0
e la costante K si determinano risolvendo questo sistema. Si
noti che la curva trovata è ammissibile, ossia è cartesiana ed appartiene a X,
anche se non è possibile ricavare unespressione esplicita per y(x).
Si può vericare che il funzionale J è convesso nella regione y X, p R,
cosicche le estremali trovate sono in eetti punti di minimo del funzionale.
Esercizi 4.4
1. Si determini una curva C[0, b] C
1
]0, b], con (0) = A, tale che
un punto materiale vincolato a muoversi lungo , soggetto soltanto alla
forza di gravità, raggiunga la retta x = b in tempo minimo. Si provi
che nel punto di contatto con tale retta la curva ottimale ha tangente
orizzontale.
[Traccia: con riferimento alle notazioni dellesempio 4.4.3, si verichi
che imponendo la condizione F
p
(y(b), y
(b)) = 0 si trova t
0
= e K =
2b/.]
2. Si consideri il problema dellesempio 4.4.2 con [a, b] = [1, 1] e A =
B > 0.
(i) Si provi che se vi è unestremale della forma
y(x) = c cosh
_
x
c
+
_
, ( R, c > 0),
allora deve essere = 0 e B = c cosh
1
c
.
(ii) Se ne deduca che, posto = min
t>0
t cosh
1
t
, si hanno due estremali
di tale forma se B > , unestremale di tale forma se B = e
nessuna estremale di tale forma se 0 < B < .
4.5 Condizione di Legendre
Descriviamo brevemente una ulteriore condizione necessaria per lesistenza
di unestremale, legata stavolta alla derivata seconda del funzionale J.
_
b
a
F(x, y(x), y
(x))dx, con F C
2
([a, b]
R
2
). Se y è punto di minimo locale per J nella classe X = y C
1
[a, b] :
y(a) = A, y(b) = B, allora
F
pp
(x, y(x), y
(x)) 0 x [a, b].

158
Se y è punto di massimo locale, allora
F
pp
(x, y(x), y
(x)) 0 x [a, b].

Questa condizione è detta condizione necessaria di Legendre.
Dimostrazione Supponiamo che y sia punto di minimo locale. Se in un
punto x
0
]a, b[ fosse F
pp
(x
0
, y(x
0
), y
(x
0
)) < 0, allora avremmo
F
pp
(x, y(x), y
(x)) < 0 x [x
0
, x
0
+],
con e numeri positivi opportuni. Consideriamo la funzione
u(x) =
_
sin
2 (xx
0
)
se [x x
0
[ ,
0 altrimenti.
Se è sucientemente piccolo, si ha u C
1
0
[a, b] e con calcoli elementari si
vede che
|u|
2
L
2
(a,b)
=
_
x
0
+
x
0
sin
4
(x x
0
)
dx =

sin
4
t dt =
3
4
.
|u
|
2
L
2
(a,b)
=
_
x
0
+
x
0
2
sin
2
2(x x
0
)
dx =

2
_
2
2
sin
2
t dt =

2
.
Adesso calcoliamo la derivata seconda del funzionale J: per losservazione
4.1.2 (2) si ha
[J
(y)v]w =
_
b
a
_
F
yy
(x, y(x), y
(x))v(x)w(x) +
+ F
yp
(x, y(x), y
(x))[v(x)w
(x) +w(x)v
(x)] +
+ F
pp
(x, y(x), y
(x))v
(x)w
(x)
_
dx.
Quindi, sostituendo u al posto di v e w ed utilizzando le stime precedenti, si
ottiene
[J
(y)u]u =
_
x
0
+
x
0
_
F
yy
(x, y(x), y
(x))u(x)
2
+
+ 2F
yp
(x, y(x), y
(x))u(x)u
(x) +F
pp
(x, y(x), y
(x))u
(x)
2
_
dx
3
4
|F
yy
(, y(), y
())|
L
(a,b)
+
+
3|F
py
(, y(), y
())|
L
(a,b)
=
= c
1
+c
2
c
3
,
159
ove c
1
, c
2
e c
3
sono costanti positive. Se è sucientemente piccolo, si ottiene
allora
[J
(y)u]u < 0,
il che è assurdo, in quanto per la proposizione 3.6.2 dovrebbe essere
[J
(y)v]v 0 v C
1
[a, b].
Osservazione 4.5.2 Nel caso di un funzionale denito su C
1
([a, b], R
m
), se
F C
2
([a, b] R
2m
) la condizione necessaria di Legendre assume la for-
ma seguente: per ogni x [a, b], la matrice F
p
i
p
j
(x, y(x), y
(x))
i,j=1,...,m
è
semi-denita positiva quando y è punto di minimo locale, ed è semidenita
negativa quando y è punto di massimo locale.
Esercizi 4.5
1. Fissata c R, si consideri il funzionale
J(u) =
_
1
0
[u
(x)
2
+cu(x)
2
]dx, u C
1
0
[0, 1].
(i) Si trovino le estremali di J.
(ii) Si verichi che J
è costante e verica la condizione di Legendre

in ogni punto di C
1
0
[0, 1].
(iii) Si provi che 0 è punto di minimo assoluto per J se e solo se
c
2
.
(iv) Si mostri che se c <
2
si ha inf J = .
4.6 Il problema isoperimetrico
Dedichiamo questo paragrafo allanalisi di un problema classico, vale a dire
il problema isoperimetrico, che è il seguente: fra tutte le curve chiuse di
classe C
1
in R
2
aventi lunghezza assegnata L, si vuole determinare quella che
delimita la regione di area massima.
Ricordando che per ogni dominio D R
2
con frontiera di classe C
1
vale la
formula
m
2
(D) =
1
2
_
+D
(x dy y dx),
160
ove lorientazione positiva su D è quella antioraria, occorrerà massimizzare
la funzione
F() =
1
2
_
+
(x dy y dx)
fra tutte le curve chiuse in R
2
, di classe C
1
. Fissiamo un intervallo [a, b] e
scegliamo X = C
1
([a, b], R
2
); cercheremo il massimo del funzionale F() =
1
2
_
b
a
(xy
yx
)dt sullinsieme
Z =
_
X : (a) = (b),
_
b
a
[
[
2
dt = L
_
.
Si tratta di un problema di massimo con vincolo: quindi andiamo ad applicare
il teorema 3.9.1. Poniamo Y = R e () =
_
b
a
[
[
2
dt L. Denotiamo con
() = (x(), y()) una generica curva appartenente a X; se h() = (u(), v())
è un altro elemento di X si ha
F
() h = F
(x(), y()) (u(), v()) =

=
1
2
_
b
a
[(y
u yu
) + (xv
v)]dt =
=
1
2
_
b
a
__
y
_
h +
_
y
x
_
h
_
dt h X,
e anche
() h =
_
b
a
[
2
dt h X.
Si noti che
() non esiste in generale se la curva non è una curva regolare:

quindi dovremo escludere eventuali soluzioni non regolari. Osserviamo che,
al contrario, se è una curva regolare allora
() : X R è un funzionale
surgettivo: se si sceglie h = r, con X, al variare di r R la quantità
() r = r
_
b
a
[
[dt = r() descrive tutto R. Dunque, per il teorema

3.9.1, se è punto di massimo di F su Z, esiste R
= R tale che
F
() h + [
()
] h = 0 h X,
ossia
1
2
_
b
a
_
(y
u yu
) + (x
v +xv
) +
x
+y
_
x
2
+y
2
_
dt = 0 (u(), v()) X.
161
Dato che u e v variano indipendentemente nella classe delle funzioni w
C
1
[a, b] con w(a) = w(b), scegliendo prima luna e poi laltra uguale a 0
lequazione si scinde nel sistema
_
_
_
b
a
_
y
u yu
+
x
x
2
+y
2
_
dt = 0
_
b
a
_
x
v +xv
+
y
x
2
+y
2
_
dt = 0
(u(), v()) X.
Dal lemma 4.2.3 segue
_
_
d
dt
_
y +
x
x
2
+y
2
_
y
= 0
d
dt
_
x +
y
x
2
+y
2
_
+x
= 0
in [a, b],
da cui, integrando,
_
x
2
+y
2
= 2(c
1
+y),
y
_
x
2
+y
2
= 2(c
2
x) in [a, b].
Se ne deduce, quadrando e sommando,
2
4
= (c
1
+y(t))
2
+ (c
2
x(t))
2
t [a, b].
Ci` o prova che i punti di massimo di F in Z sono circonferenze di raggio
||
2
e, naturalmente, centro (c
2
, c
1
) arbitrario. Dato che la circonferenza deve
avere lunghezza L, si ricava L = [[; dunque le curve di lunghezza L che
delimitano una regione di area massima, se esistono, sono le circonferenze
di raggio
L
2
. I metodi qui illustrati non ci permettono di dedurre che le
circonferenze eettivamente risolvono il nostro problema; di questo fatto pe-
raltro esiste una dimostrazione di tipo geometrico, non banale ma del tutto
elementare.
Esercizi 4.6
1. Dati due punti distinti A, B R
2
, sia
0
una ssata curva regolare di
estremi A e B, il cui sostegno giaccia in uno dei due semipiani indivi-
duati dalla retta passante per A e per B. Fra tutte le curve di ssata
lunghezza , aventi per estremi A e B ed il cui sostegno non interseca
quello di
0
, si determini quella che insieme a
0
delimita una regione
di area massima.
162
4.7 Geodetiche su una supercie
In questo paragrafo ci occupiamo della determinazione delle curve geodetiche,
ossia di minima lunghezza, giacenti su una supercie regolare assegnata. Si
tratta di un problema classico e piuttosto intricato, di fondamentale impor-
tanza in geometria dierenziale; cercheremo di arontarlo con i metodi dei
paragra precedenti.
Sia dunque R
3
una supercie regolare connessa, di equazione g(x, y, z) =
0, e supponiamo che g sia di classe C
3
(questo fatto ci servirà in seguito);
dati due punti distinti A, B , si cerca la curva (regolare)
0
giacente su
, di estremi A e B, che abbia lunghezza minima. Non è detto a priori che
tale curva esista, ne che sia unica.
Fissiamo [a, b] R e consideriamo curve : [a, b] di classe C
1
.
Dobbiamo minimizzare il funzionale
J() =
_
b
a
[
[
3
dt
sullinsieme K = C
1
([a, b], R
3
) : (a) = A, (b) = B, sotto il vinco-
lo che sia contenuta in , ossia sotto la condizione g((t)) = 0 per ogni
t [a, b]. Abbiamo a disposizione il teorema 3.9.1, che fornisce una condizio-
ne necessaria anche una ssata curva
0
sia una geodetica di ; ma occorre
che linsieme dove è denita la funzione da minimizzare sia uno spazio di Ba-
nach, mentre nel nostro caso K è soltanto una varietà ane di C
1
([a, b], R
3
).
Conviene allora porre =
0
+ , in modo che la curva appartenga allo
spazio di Banach X = C
1
0
([a, b], R
3
). Poniamo poi Y = C
1
[a, b], e deniamo
le funzioni F : X R e : X Y nel modo seguente:
F() =
_
b
a
[
0
+
[
3
dt, () = g (
0
+),
cosicche il fatto che
0
sia una geodetica di di estremi A, B signica che 0 è
punto di minimo per la restrizione di F al vincolo Z = X : () = 0.
Verichiamo le ipotesi del teorema 3.9.1. Anzitutto, avendo supposto
0
regolare, sia F che sono F-dierenziabili in un intorno di = 0, con
F
() =
_
b
a
0
+
0
+
[
3

dt,
() = g(
0
+) X.
Verichiamo che
(0) : X Y è un operatore surgettivo: poiche la su-

percie è regolare, si ha g(
0
(t)) ,= 0 per ogni t [a, b]. Essendo [a, b]
163
compatto, esiste > 0 tale che
[g(
0
)(t)[
3
t [a, b].
Quindi, posto
A
i
=
_
t [a, b] : [D
i
g(
0
(t))[ >

2
3
_
, i = 1, 2, 3,
la terna A
1
, A
2
, A
3
è un ricoprimento aperto di [a, b]. Sia
1
,
2
,
3
una partizione dellunità di classe C
associata a tale ricoprimento (ossia
i
C
0
(A
i
),
i
0, e
3
i=1
i
1). Allora, se v è un arbitrario elemento
di Y , scelta h = (h
1
, h
2
, h
3
) ove h
i
=
v
i
D
i
g(
0
)
, si ha h X e
(0)h = g(
0
) h =
3
i=1
D
i
g(
0
)h
i
=
3
i=1
i
v = v,
il che mostra la surgettività di
(0).
Per il teorema 3.9.1, esiste Y
= (C
1
[a, b])
tale che
F
(0)h +(
(0)h) = 0 h X.
Per interpretare questa uguaglianza occorre caratterizzare lo spazio duale
(C
1
[a, b])
.
Lemma 4.7.1 Lo spazio (C
1
[a, b])
è costituito dai funzionali della forma

f = f(a) +f
f C
1
[a, b],
dove R e (C[a, b])
, ossia =
+

, con
+
e
misure di
Lebesgue-Stieltjes associate a funzioni p
+
, p
: [a, b] R crescenti e continue

a sinistra.
Dimostrazione
`
E chiaro che ogni funzionale della forma sopra scritta
appartiene a (C
1
[a, b])
.
Viceversa, sia (C
1
[a, b])
. Consideriamo il funzionale [
M
, ove M =
f C
1
[a, b] : f(a) = 0. Osserviamo che loperatore A =
d
dt
: M C[a, b]
è bigettivo e continuo, perche se C[a, b] vi è una ed una sola funzione
f M tale che f
= , e precisamente f(t) =
_
t
0
(s)ds. Per il lemma
3.9.2, loperatore aggiunto A
: (C[a, b])
è a sua volta surgettivo:

164
quindi esiste (C[a, b])
tale che A
= [
M
. Il funzionale è della forma
=
+

con
+
e
misure di Lebesgue-Stieltjes su [a, b] associate a

funzioni p
+
, p
crescenti e continue a sinistra in [a, b].

Se ora f C
1
[a, b], possiamo scrivere f = f(a) + g, con g M; ne segue,
indicando con I(t) la funzione costantemente uguale a 1,
f = f(a) + (A
)g = f(a)I +g
.
Scelto = I, si ha la tesi del lemma.
Possiamo ora interpretare lidentità fornita dal teorema 3.9.1. Supporremo
però che la curva geodetica
0
sia di classe C
2
, come del resto è pratica
comune in geometria dierenziale, dove non è mai utile fare economia nella
regolarità. Lequazione F
(0)h + (
(0)h) = 0, valida per ogni h X,

diventa, tenuto conto dellespressione di dedotta dal lemma 4.7.1,
_
b
a
0
h
0
[
3
dt +g(
0
(a)) h(a) +
_
b
a
d
dt
[g(
0
(t)) h(t)]d = 0 h X,
ove il simbolo d è una forma compatta per indicare d
+
d
. E poiche
h(a) = 0, si ha pi` u semplicemente
_
b
a
0
h
0
[
3
dt +
_
b
a
d
dt
[g(
0
(t)) h(t)]d = 0 h X.
Adesso vorremmo integrare per parti il secondo termine del primo membro,
sfruttando il fatto che g è di classe C
3
e
0
di classe C
2
. A questo scopo è
fondamentale la seguente generalizzazione della formula di integrazione per
parti:
Lemma 4.7.2 Sia p : [a, b] R una funzione crescente e continua a sini-
stra, e sia la corrispondente misura di Lebesgue-Stieltjes. Allora per ogni
f AC[a, b] si ha
_
b
a
f d = f(b)p(b) f(a)p(a)
_
b
a
f
p dt.
Dimostrazione La formula è vera quando p AC[a, b]: basta infatti osser-
vare che in tal caso fp AC[a, b], scrivere la formula che lega fp allintegrale
della sua derivata ed osservare che d = p
(t)dt.
Nel caso generale, esiste una successione p
n
AC[a, b] tale che ogni p
n
165
è crescente in [a, b] e p
n
(t) p(t) puntualmente in [a, b] (basta ad esempio
prendere le convoluzioni p
n
, ove
n
(t) = n(nt), con C
(R), 0,
(t) = 0 per [t[ 1 e
_
1
1
(t)dt = 1). Allora si ha
([x, y[) = p(y) p(x) = lim
n
[p
n
(y) p
n
(x)] = lim
n
_
y
x
p
n
dt.
Di conseguenza, per ogni funzione costante a tratti, =
N
k=1
[c
k
,d
k
[
, si
ha
_
b
a
d =
N
k=1
k
([c
k
, d
k
[) = lim
n
N
k=1
k
_
d
k
c
k
p
n
dt = lim
n
_
b
a
p
n
dt.
Vogliamo ottenere la stessa relazione quando è una funzione crescente ed
assolutamente continua. Scegliamo una successione
k
di funzioni costanti
a tratti tale che
k
e
k
(t) (t) uniformemente in [a, b]; si ha allora
_
b
a
k
d = lim
n
_
b
a
k
p
n
dt lim
n
_
b
a
p
n
dt k N,
da cui
_
b
a
d = lim
k
_
b
a
k
d lim
n
_
b
a
p
n
dt.
Daltra parte, ssato > 0 e scelto k sucientemente grande,
lim
n
_
b
a
p
n
dt limsup
n
_
b
a
(
k
)p
n
dt + lim
n
_
b
a
k
p
n
dt
lim
n
[p
n
(b) p
n
(a)] +
_
b
a
k
d
[p(b) p(a)] +
_
b
a
d.
Per larbitrarietà di , si deduce che
_
b
a
d = lim
n
_
b
a
p
n
dt
per ogni funzione assolutamente continua e crescente; per dierenza, questa
relazione vale per ogni AC[a, b].
166
Sia nalmente f AC[a, b]: possiamo scrivere, utilizzando il teorema di
Lebesgue,
_
b
a
f d = lim
n
_
b
a
fp
n
dt =
= lim
n
_
f(b)p
n
(b) f(a)p
n
(a)
_
b
a
f
p
n
dt
_
=
= f(b)p(b) f(a)p(a)
_
b
a
f
p dt,
Consideriamo ora le funzioni h C
2
0
(]a, b[, R
3
), che costituiscono un sotto-
spazio denso in X: allora per tali h, tenendo conto del lemma 4.7.2 (applicato
separatamente alle misure
+
e
), la condizione necessaria per il minimo

vincolato si può scrivere nella forma seguente:
_
b
a
0
h
0
[
3
dt
_
b
a
d
2
dt
2
[g(
0
(t)) h(t)] p(t) dt,
da cui, sviluppando le derivate,
_
b
a
_
p[g(
0
)]
h +
_

0
[
0
[
3
2p[g(
0
)]
_
h
pg(
0
) h
_
dt = 0.
Utilizzando il lemma 4.2.5, otteniamo le seguenti informazioni: anzitutto,
pg(
0
) C
1
([a, b], R
3
), il che implica p C
1
[a, b] essendo g(
0
) di
classe C
2
e diverso da 0; in secondo luogo, la funzione
0
[
0
[
3
2p[g(
0
)]
+ (p[g(
0
)])
0
[
0
[
3
p[g(
0
)]
+p
[g(
0
)]
deve essere in C
1
([a, b], R
3
): ciò implica, per dierenza, che p
[g(
0
)] è di
classe C
1
e dunque p C
2
[a, b]. La terza informazione è la relazione
d
dt
_

0
[
0
[
3
p[g(
0
)]
+p
[g(
0
)]
_
= p[g(
0
)]
in [a, b],
dalla quale, svolgendo le derivate (lecito, visto che sappiamo che p C
2
[a, b]),
ricaviamo, dopo alcune semplicazioni,
d
dt
0
[
0
[
3
+p
g(
0
) = 0 in [a, b].
167
Questo è il sistema dierenziale che caratterizza le geodetiche: esso ci dice
che, lungo la geodetica
0
, la normale principale alla curva (ossia la derivata
del versore tangente

0
|
0
|
3
) è parallela alla normale alla supercie , che è
il vettore g. Se, in particolare, rappresentiamo la curva
0
mediante il
parametro lunghezza darco s, e poniamo = p
, il sistema acquista la
forma pi` u semplice
0
(s) (s)g(
0
(s)) = 0.
Questo sistema, che pure costituisce soltanto una condizione necessaria per
lesistenza di geodetiche, permette in molti casi concreti di calcolarle esplici-
tamente (esempi 4.7.3 e 4.7.4, nonche esercizio 4.7.1).
Naturalmente, resta il problema di provare lesistenza di almeno una geode-
tica. Dimostreremo che esiste almeno una geodetica nella classe delle curve
lipschitziane su [a, b] (ossia assolutamente continue in [a, b] con derivata es-
senzialmente limitata).
Osserviamo prima di tutto che, essendo una supercie regolare e connes-
sa, vi è almeno una curva regolare : [a, b] di estremi A e B; posto
M = |
, linsieme
N = AC([a, b], ) : (a) = A, (b) = B,
(a, b; R
3
), |
M
è dunque un sottoinsieme non vuoto dello spazio
Z = AC([a, b], R
3
) :
(a, b; R
3
)
che è di Banach con la norma
||
Z
= ||
+|
.
Proviamo che N è compatto in Z: per ogni N si ha
[(t)[
3
[(a)[
3
+
_
t
a
[
()[
3
d [A[
3
+M(b a) < t [a, b],
[(t) (s)[
3
=
_
t
s
(r) dr
M[t s[ s, t [a, b],

e dunque le funzioni di N costituiscono una famiglia equicontinua ed equi-
limitata. Per il teorema di Ascoli-Arzelà, N è relativamente compatto ri-
spetto alla convergenza uniforme; la compattezza in Z si ottiene osservan-
do che se
n
nN
N e
n
uniformemente, allora otteniamo anche
168
[(t) (s)[
3
M[t s[ e quindi è assolutamente continua: inoltre la sua
derivata, che esiste quasi ovunque, è limitata da M, il che mostra che N.
Osserviamo adesso che il funzionale lunghezza F() =
_
b
a
[
(t)[
3
dt è ovvia-
mente continuo su Z (e addirittura semicontinuo inferiormente rispetto alla
convergenza uniforme in virt` u dellesercizio 4.1.2); quindi F, che evidente-
mente è limitato inferiormente, ha minimo sul compatto N, ossia esiste una
geodetica in N.
Resta aperto il delicato problema della regolarità: sappiamo che esiste una
geodetica lipschitziana, ma la condizione necessaria da noi dimostrata in pre-
cedenza vale solo per geodetiche di classe C
2
. Questa questione è però al di
là della portata degli strumenti che abbiamo.
Esempio 4.7.3 Consideriamo il caso della supercie sferica di raggio r, cen-
trata per semplicità nellorigine. Si ha g(x, y, z) = x
2
+y
2
+z
2
r
2
, e dunque
il sistema che caratterizza le geodetiche assume la forma
(s) = 2(s)(s),
dove abbiamo scritto per comodità in luogo di
0
. Moltiplicando scalar-
mente per (s) otteniamo
d
ds
((s),
(s))
3
[
(s)[
2
3
= ((s),
(s))
3
= 2(s)[(s)[
2
3
,
daltra parte si ha [(s)[
3
= r, [
(s)[
3
= 1 ed inoltre ((s),
(s))
3
=
1
2
d
ds
[(s)[
2
3
= 0. Quindi lequazione si riduce a 1 = 2(s)r
2
, il che si-
gnica (s)
1
2r
2
; in particolare, è indipendente da s. Arriviamo cos` al
sistema
(s) = 2(s) =
1
r
2
(s).
Scegliamo i punti A, B: non è restrittivo scegliere uno dei due il pi` u comoda-
mente possibile dal punto di vista dei calcoli, mentre il secondo deve essere
generico. Poniamo quindi
A = (r, 0, 0), B = (x
0
, y
0
, z
0
).
Risolvendo il sistema si trova
_
_
x(s) = P cos
s
r
+Qsin
s
r
y(s) = Rcos
s
r
+S sin
s
r
z(s) = T cos
s
r
+U sin
s
r
,
169
con P, Q, R, S, T, U costanti da determinare. Imponendo che (0) = A si
trova subito P = r, R = 0 e T = 0; dallidentità [
(s)[
3
= 1, ponendo
dapprima s = 0, si trova con facili calcoli Q
2
+S
2
+U
2
= r
2
, e di conseguenza,
con s ,= 0, si deduce Q = 0 e S
2
+U
2
= r
2
. In denitiva
_
_
x(s) = r cos
s
r
y(s) = S sin
s
r
z(s) = U sin
s
r
,
da cui ricaviamo
y(s)
S
=
z(s)
U
,
ossia la curva giace sul piano di equazione UySz = 0. Questo piano passa
per lorigine (contiene anzi lasse x), e dunque taglia la supercie sferica in
un cerchio massimo. Ne segue che la geodetica è necessariamente un arco
di cerchio massimo.
Esempio 4.7.4 Consideriamo il caso di un cilindro, con asse che possiamo
supporre coincidente con lasse z. Avremo perciò g(x, y, z) = x
2
+y
2
r
2
. Il
sistema delle geodetiche diventa
_
_
_
x
(s) = 2(s)x(s)
y
(s) = 2(s)y(s)
z
(s) = 0.
Scegliamo i punti A = (r, 0, 0) e B = (x
0
, y
0
, z
0
). Moltiplicando la prima
equazione per x(s), la seconda per y(s), e sommando, otteniamo
x(s)x
(s) +y(s)y
(s) = 2(s)(x(s)
2
+y(s)
2
),
ed osservato che xx
+ yy
= (xx
+ yy
(x
2
+ y
2
) = (x
2
+ y
2
) (per-
che dallequazione x
2
+ y
2
= r
2
segue xx
+ yy
= 0), deduciamo 2(s) =

r
2
(x
(s)
2
+y
(s)
2
). Daltronde, risolvendo la terza equazione si ha z
(s) = c
e z(s) = cs +d, con d = 0 (per come è stato scelto A); quindi
(s) =
x
(s)
2
+y
(s)
2
2r
2
=
1 z
(s)
2
2r
2
=
1 c
2
2r
2
,
quindi nuovamente non dipende da s. Si noti che, necessariamente, [c[ 1.
Le prime due equazioni del sistema diventano allora
x
(s) =
1 c
2
r
2
x(s), y
(s) =
1 c
2
r
2
y(s),
170
da cui
x(s) = P cos
1 c
2
r
s +Qsin
1 c
2
r
s,
y(s) = Rcos
1 c
2
r
s +S sin
1 c
2
r
s.
Dalla condizione iniziale ricaviamo P = r e R = 0, mentre dallidentità
x(s)x
(s) + y(s)y
(s) = 0, scelto s = 0, segue che Q = 0; di conseguenza

S
2
r
2
= 0, ossia S = r. In denitiva
_
_
x(s) = r cos
1c
2
r
s,
y(s) = r sin
1c
2
r
s,
z(s) = cs,
ove la costante c [1, 1] dipende dalla scelta del punto B. Queste sono
le equazioni di unelica cilindrica; nel caso particolare in cui c = 0 si ha un
arco di cerchio orizzontale, mentre quando c = 1 si ottiene un segmento
verticale.
Esercizi 4.7
1. (Geodetiche su un cono) Dato il cono di equazione z = a
_
x
2
+y
2
,
ove a > 0, sia (s) = (x(s), y(s), z(s)) una geodetica di estremi A =
(x
0
, y
0
, a
_
x
2
0
+y
2
0
) e B = (x
1
, y
1
, a
_
x
2
1
+y
2
1
), espressa in funzione del
parametro lunghezza darco.
(i) Si scrivano le equazioni dierenziali soddisfatte da x(s), y(s), z(s).
(ii) Si provi che
d
2
ds
2
[(s)[
2
3
= 2,
d
2
ds
2
z(s)
2
=
2a
2
1 +a
2
.
(iii) Si deduca che
z(s)
2
=
a
2
1 +a
2
s
2
+bs +c,
con b, c costanti univocamente individuate dalle condizioni
z(0) = a
_
x
2
0
+y
2
0
, z() = a
_
x
2
1
+y
2
1
.
171
(iv) Scritte x(s) e y(s) nella forma
x(s) =
1
a
z(s) cos (s), y(s) =
1
a
z(s) sin (s),
si verichi che
_
a[cos (s) x
(s) + sin (s) y
(s)] = z
(s)
a[sin (s) x
(s) cos (s) y
(s)] = z(s)
(s),
e se ne deduca che
(s) = 2
z
(s)
(s)
z(s)
.
(v) Si concluda che
(s) =
0
+ (
1
0
)
_
s
0
dr
z(r)
2
_
0
dr
z(r)
2
,
dove
0
e
1
sono individuati dalle relazioni
cos
0
=
x
0
_
x
2
0
+y
2
0
, sin
0
=
y
0
_
x
2
0
+y
2
0
,
cos
1
=
x
1
_
x
2
1
+y
2
1
, sin
1
=
y
1
_
x
2
1
+y
2
1
.
172
Capitolo 5
Sottodierenziale
5.1 Denizione e proprietà
Se occorre minimizzare un funzionale che non è dierenziabile, i metodi ed i
risultati visti nei capitoli precedenti non sono utilizzabili. Vi sono però altre
tecniche, legate a generalizzazioni del concetto di derivata, che funzionano
in questi contesti pi` u generali. La pi` u importante di tali generalizzazioni,
nellottica dei problemi di minimo ed in stretta relazione con la convessità, è
la nozione di sottodierenziabilità.
Denizione 5.1.1 Sia X uno spazio normato reale e sia f : X R. Di-
ciamo che f è sottodierenziabile nel punto x
0
X se esiste unapplicazione
ane : X R tale che
(x) f(x) x X, (x
0
) = f(x
0
).
Se f è denita in un aperto U X, diremo che f è sottodierenziabile nel
punto x
0
U se lo è lestensione di f che vale + in X U.
Osservazione 5.1.2 Dalla sottodierenziabilità di una funzione f in un
punto x
0
seguono subito due fatti. Il primo, banale ma importante, è che
f(x
0
) R; il secondo è che esiste X
tale che
f(x) f(x
0
) +(x x
0
) x X.
Infatti, se (x) = x + b è lapplicazione ane che verica la denizione di
sottodierenziabilità, si ha per ogni x X
f(x) (x) = (xx
0
) +x
0
+b = (xx
0
) +(x
0
) = (xx
0
) +f(x
0
);
173
si noti che, di conseguenza, f è semicontinua inferiormente nel punto x
0
.
Denizione 5.1.3 Sia X uno spazio normato reale e sia f : X R. Se f
è sottodierenziabile in x
0
, ogni X
tale che
f(x) f(x
0
) +(x x
0
) x X
si chiama sottogradiente di f in x
0
; linsieme dei sottogradienti di f in x
0
si
chiama sottodierenziale di f in x
0
e si indica col simbolo f(x
0
).
Osservazione 5.1.4 Se non esistono sottogradienti di f in x
0
, evidente-
mente f(x
0
) = ; questo accade certamente se f(x
0
) = , ma può anche
capitare in un punto x
0
in cui f(x
0
) R, ad esempio se f è una funzio-
ne concava su R. Se X
, si ha f(x
0
) se e solo se f(x
0
) R
e f(x) f(x
0
) + (x x
0
) per ogni x X. In particolare, f(x
0
) è un
sottoinsieme convesso (eventualmente vuoto) di X
.
Esempi 5.1.5 (1) Sia X uno spazio normato reale e sia f : X R convessa
e G-dierenziabile; allora si ha f(x
0
) = f
G
(x
0
) per ogni x
0
X. Infatti,
se f(x
0
) si ha, per losservazione precedente,
f(x
0
+tv) f(x
0
) t v t R 0, v X;
dividendo per t si ottiene per t 0
_
f
G
(x
0
)v v se t 0
+
,
f
G
(x
0
)v v se t 0
,
da cui f
G
(x
0
) = . Viceversa, poiche f è convessa, il suo rapporto incremen-
tale in una qualunque direzione v X è crescente (esercizio 2.1.3): quindi,
scegliendo v = x x
0
, si ottiene
f(x) f(x
0
) = f(x
0
+v) f(x
0
) f
G
(x
0
)v = f
G
(x
0
)(x x
0
) x X,
da cui f
G
(x
0
) f(x
0
).
(2) Sia X uno spazio normato reale. Calcoliamo il sottodierenziale f(0),
dove f(x) = |x|
X
. Per denizione si ha f(0) se e solo se |x|
X
x
per ogni x X; scrivendo x al posto di x otteniamo anche |x|
X
x,
quindi f(0) se e solo se ||
X
1.
Vediamo adesso alcune proprietà del sottodierenziale.
174
Proposizione 5.1.6 Sia X uno spazio normato reale e sia f : X R.
Per ogni x
0
X il sottodierenziale f(x
0
) è un sottoinsieme convesso e
debolmente* chiuso di X
; in particolare, f(x
0
) è chiuso in X
. Se, inoltre,
f è continua in x
0
, allora f(x
0
) è debolmente* compatto.
Dimostrazione Se f(x
0
) = , allora f(x
0
) = e quindi la tesi è provata.
Sia dunque f(x
0
) R: allora la convessità di f(x
0
) segue dallosservazione
5.1.4. Proviamo che f(x
0
) è debolmente* chiuso: se / f(x
0
), esiste
x X tale che f(x
0
) +(x x
0
) f(x) =
0
> 0; ssato lintorno
U =
_
X
: [( )(x x
0
)[ <

0
2
_
,
si ha / f(x
0
) per ogni U, in quanto
f(x
0
) +(x x
0
) f(x) f(x
0
) +(x x
0
) f(x)

0
2
=

0
2
> 0.
Dunque il complementare di f(x
0
) è aperto nella topologia debole*.
Supponiamo adesso che f sia continua in x
0
: scelto = 1, esiste > 0 tale
che [f(x) f(x
0
)[ 1 per |x x
0
|
X
. Sia allora f(x
0
): dalla
relazione
(x x
0
) f(x) f(x
0
) x X
segue subito
[(x x
0
)[ [f(x) f(x
0
)[ 1 per |x x
0
|
X
,
e quindi, scelto x = x
0
+u, con |u|
X
1,
[u[ 1 per |u|
X
1.
ciò signica che
||
X

1
f(x
0
).
Dunque f(x
0
) è un sottoinsieme w
-chiuso e limitato in X
; pertanto, in
virt` u del teorema di Banach-Alaoglu (teorema 1.6.3), f(x
0
) è w
-compatto.
Osservazione 5.1.7 Dalla dimostrazione precedente segue facilmente che
se f è lipschitziana in una palla B(x
0
, ) di uno spazio normato reale X, con
costante di Lipschitz M, allora per x B(x
0
, /2) i sottodierenziali f(x)
sono insiemi equilimitati dalla costante M.
175
Limportanza della nozione di sottodierenziale in relazione ai problemi di
minimo è ben evidenziata dalla seguente
Proposizione 5.1.8 Sia X uno spazio normato reale e sia f : X R. Se
x
0
X, risulta
f(x
0
) = min
xX
f(x) R
se e solo se 0 f(x
0
).
Dimostrazione
`
E una diretta conseguenza della denizione di sottodie-
renziale.
Il sottodierenziale di una funzione ha una chiara parentela con la bipolare
(della stessa funzione), introdotta nel paragrafo 2.5. Il legame fra questi due
oggetti viene messo in luce dalla proposizione che segue (si veda anche il
teorema 2.5.8).
Proposizione 5.1.9 Sia X uno spazio normato reale e sia f : X R. Si
ha:
(i) se f(x
0
) ,= , allora f(x
0
) = f
(J
x
0
);
(ii) se f(x
0
) = f
(J
x
0
), allora f(x
0
) = (f
J)(x
0
).
Dimostrazione (i) Sia una funzione ane tale che (x) f(x) per
ogni x X e (x
0
) = f(x
0
); allora, essendo in particolare convessa e
semicontinua inferiormente, per losservazione 2.5.9 si ha (x) f
(J
x
)
f(x) per ogni x X; in particolare, per x = x
0
si ottiene f
(J
x
0
) = (x
0
) =
f(x
0
).
(ii) Supponiamo che f
(J
x
0
) = f(x
0
). Se f(x
0
) = , allora f
(J
x
0
) =
e quindi f(x
0
) = (f
J)(x
0
) = . Se invece f(x
0
) R (il che
non esclude che f(x
0
) sia ugualmente vuoto!), sia f(x
0
): allora per
denizione
f(x) f(x
0
) +(x x
0
) = f
(J
x
0
) +(x x
0
) x X;
poiche x f
(J
x
0
) + (x x
0
) è una funzione ane, dunque convessa e
semicontinua inferiormente, si deduce
f
(J
x
) f
(J
x
0
) +(x x
0
) x X,
176
da cui (f
J)(x
0
).
Se, viceversa, (f
J)(x
0
), allora
f(x) f
(J
x
) f
(J
x
0
) +(x x
0
) = f(x
0
) +(x x
0
) x X,
cioè f(x
0
).
Unaltra caratterizzazione del sottodierenziale è fornita dal seguente risul-
tato:
Proposizione 5.1.10 Sia X uno spazio normato reale e sia f : X R.
Fissati X
e x
0
X, risulta f(x
0
) se e solo se f(x
0
) R e
f(x
0
) +f
() = x
0
; in particolare, in tal caso si ha f
() R.
Dimostrazione Per losservazione 5.1.4, si ha f(x
0
) se e solo se f(x
0
)
R e
f(x) f(x
0
) +(x x
0
) x X,
ovvero, moltiplicando per 1, se e solo se f(x
0
) R e
f
() = sup
xX
x f(x) = x
0
f(x
0
).
In particolare, se f(x
0
) questa relazione implica f
() R.
Corollario 5.1.11 Sia X uno spazio normato reale, sia f : X R e siano
x
0
X e X
. Si ha: f(x
0
) se e solo se J
x
0
f
() e f(x
0
) =
f
(J
x
0
).
Dimostrazione (=) Sia f(x
0
); allora f(x
0
) R e, per la propo-
sizione 5.1.9, si ha f(x
0
) = f
(J
x
0
). Dalla proposizione 5.1.10 otteniamo
allora f
() R e
x
0
= f(x
0
) +f
() = f
(J
x
0
) +f
(),
da cui, sempre per la proposizione 5.1.10 (applicata stavolta a f
nel punto
) segue J
x
0
f
().
(=) Sia J
x
0
f
(): per la proposizione 5.1.10 si ha f
() R e
f
(J
x
0
) +f
() = J
x
0
, da cui, tenuto conto dellipotesi f(x
0
) = f
(J
x
0
),
f(x
0
) +f
() = f
(J
x
0
) +f
() = J
x
0
= x
0
.
Quindi f(x
0
) R ed inne, invocando ancora una volta la proposizione
5.1.10, si conclude che f(x
0
).
177
Esercizi 5.1
1. Sia X uno spazio normato reale e sia f : X R. Provare che
(f)(x
0
) = f(x
0
) 0, x
0
X.
2. Sia X uno spazio normato reale e siano f, g : X R. Provare che
(f +g)(x
0
) f(x
0
) +g(x
0
);
si mostri che linclusione è in generale stretta.
3. Fissato > 0, si determini f(0), ove f(x) = [x[
, x R.
4. Sia X uno spazio di Banach reale e sia K un sottoinsieme convesso e
chiuso di X. Si provi che, posto
N
K
(x
0
) = X
: (x x
0
) 0 x K,
risulta
I
K
(x
0
) =
_
N
K
(x
0
) se x
0
K
se x
0
/ K.
Nel caso X = R
N
, si interpreti geometricamente questo risultato.
(Linsieme N
K
(x
0
) si chiama cono normale a K in x
0
.)
5. Sia g L
(a, b) e poniamo f(x) =

_
x
a
g(t)dt. Si provi che f(x)
coincide con lintervallo (eventualmente vuoto) [g
(x), g
+
(x)], ove
g
(x) = sup
a<x
1
x
_

x
g(t) dt, g
+
(x) = inf
x<b
1
x
_

x
g(t) dt.
5.2 Funzioni convesse sottodierenziabili
La nozione di sottodierenziale, come si è già osservato, è particolarmente
importante ed utile quando si considerano funzioni convesse. Per semplicità,
considereremo solamente funzioni a valori in ] , +]. Innanzi tutto, il
sottodierenziale di una funzione convessa è quasi sempre non vuoto, come
mostra la proposizione che segue.
178
Proposizione 5.2.1 Sia f : X ] , +] una funzione convessa su uno
spazio normato reale X. Se esiste x
0
D(f) tale che f è continua in x
0
,
allora si ha f(x) ,= per ogni x
D(f) e, in particolare, f(x

0
) ,= .
Dimostrazione Poiche f non assume il valore , si ha f(x
0
) R; la
continuità di f implica allora che f è limitata in un intorno U di x
0
, da
cui U D(f) e pertanto x
0

D(f). Per il teorema 2.4.2, si deduce che f

è continua in ogni punto di
D(f) ed è limitata in un opportuno intorno di

ciascun punto di
D(f).
Ciò premesso, sia x
D(f). Adoperiamo un ragionamento già impiegato

nella dimostrazione del lemma 2.6.9: linsieme epi(f) è convesso in X R;
proviamo che esso ha parte interna non vuota. Sia V un intorno aperto di x
tale che [f()[ K per ogni V : allora V ]K, +[ è un aperto contenuto
in epi(f), cosicche per ogni t > K il punto (x, t) è interno ad epi(f). Si osservi
inoltre che (x, f(x)) epi(f), in quanto (x, f(x) ) / epi(f) per ogni
> 0: in particolare, (x, f(x)) /
epi(f).
Dunque, per il lemma 2.3.6 (i), esistono X
e t > 0 tali che

x +tf(x) = +ta (, a) epi(f).
Dividendo per t e scegliendo a = f(), troviamo
t

t
f() X,

t

t
x = f(x).
Per sottrazione si ottiene
t
( x) +f(x) f() X,
e dunque
t
f(x). Abbiamo cos` provato che f(x) ,= per ogni
x
D(f). Poiche x
0

D(f), in particolare f(x

0
) ,= .
Osserviamo che se f assume anche il valore , il risultato della proposi-
zione precedente non è vero (esercizio 5.2.1).
Vediamo ora come è strutturato il sottodierenziale di una funzione convessa.
Teorema 5.2.2 Sia f : X ] , +] una funzione convessa su uno
spazio normato reale X. Allora, posto per ogni x D(f) e v X
D
+
f(x, v) = lim
h0
+
f(x +hv) f(x)
h
, D
f(x, v) = lim
h0
f(x +hv) f(x)

h
,
179
si ha per x D(f) e v X
f(x) = X
: v D
+
f(x, v) v X =
= X
: v D
f(x, v) v X.
Inoltre, se esiste x
0
D(f) tale che f è continua in x
0
, allora per ogni
x
D(f) e per ogni v X risulta

D
+
f(x, v) = supv : f(x), D
f(x, v) = infv : f(x).

Dimostrazione Per lesercizio 2.1.3, per ogni x D(f) i rapporti incremen-
tali di f lungo unarbitraria direzione v X sono crescenti e quindi i limiti
D
f(x, v) esistono, niti od inniti, con D
f(x, v) D
+
f(x, v).
Dimostriamo le inclusioni (). Sia x D(f) e sia f(x): si ha
f() f(x) ( x) X,
quindi
f(x +tv) f(x) t v t R 0, v X.
Dividendo per t otteniamo per t 0
+
e t 0
D
+
f(x, v) v D
f(x, v) v X.
Viceversa, se X
verica la prima di queste due disuguaglianze, allora

per la crescenza dei rapporti incrementali di f si ha a maggior ragione
f(x +v) f(x) v v X,
da cui, posto v = x, si deduce
f() f(x) +( x) X,
ossia f(x). Se invece verica la seconda delle due disuguaglianze
precedenti, allora analogamente
v f(x) f(x v) v X,
e posto v = x si arriva nuovamente alla conclusione che f(x). Ciò
prova le inclusioni ().
180
Proviamo la seconda parte della tesi. Per la proposizione 5.2.1, f(x) è non
vuoto per ogni x
D(f).
`
E chiaro che per ogni v X si ha
D
+
f(x, v) supv : f(x), D
f(x, v) infv : f(x);

dimostriamo le disuguaglianze opposte. Fissiamo x
D(f). Essendo f con-

tinua in x
0
, per il teorema 2.4.2 f è continua in ogni punto di
D(f), quindi
f è limitata in unopportuna palla B(x, 2); per la proposizione 2.4.5, f è
localmente lipschitziana in B(x, 2) e pertanto esiste K 0 tale che
K|v|
X
f(x v) f(x) D
f(x, v)
D
+
f(x, v) f(x +v) f(x) K|v|
X
v B(0, ).
Dato che le funzioni v D
f(x, v) sono positivamente omogenee (oltre che

convesse), deduciamo che la stessa relazione vale per ogni v X, ossia
K|v|
X
D
f(x, v) D
+
f(x, v) K|v|
X
v X.
Fissato v X 0, andiamo ora a costruire un sottogradiente f(x)
che verichi luguaglianza v = D
+
f(x, v): ciò mostrerà che
D
+
f(x, v) supv : f(x).
Consideriamo il funzionale y D
+
f(x, y), che è positivamente omogeneo e
convesso, e deniamo un funzionale lineare : [v] R ponendo
(tv) = t D
+
f(x, v) t R.
Si ha (tv) D
+
f(x, tv) per ogni t R: infatti ciò è banale se t 0,
mentre se t < 0 possiamo scrivere, in virt` u della relazione D
+
f(x, v) =
D
f(x, v),
(tv) = ([t[v) =
= D
+
f(x, [t[v) = D
+
f(x, tv) = D
f(x, tv) D
+
f(x, tv).
Per il teorema di Hahn-Banach esiste : X R tale che
(tv) = (tv) t R, y D
+
f(x, y) y X.
181
Si ha X
, perche
[y[ = maxy, (y) maxD
+
f(x, y), D
+
f(x, y) K|y|
X
y X.
Di conseguenza, f(x) per la caratterizzazione già dimostrata. Inoltre,
per costruzione, v = D
+
f(x, v).
Lanaloga disuguaglianza relativa a D
f(x, v) segue utilizzando nuovamente

la relazione D
f(x, v) = D
+
f(x, v).
Vediamo ora la relazione fra sottodierenziabilità e G-dierenziabilità di
funzioni convesse: andiamo a completare il risultato dellesempio 5.1.5 (1).
Proposizione 5.2.3 Sia X uno spazio normato reale, sia f : X] ,+]
una funzione convessa e propria; sia inoltre x
0
D(f).
(i) Se f è G-dierenziabile in x
0
, allora f è sottodierenziabile in x
0
e
f(x
0
) = f
G
(x
0
).
(ii) Se f è continua in x
0
e f(x
0
) =
0
, allora f è G-dierenziabile in
x
0
e f
G
(x
0
) =
0
.
Dimostrazione (i) Basta ripetere il ragionamento utilizzato nellesempio
5.1.5 (1).
(ii) Dal teorema 5.2.2 segue, per ogni v X,
D
+
f(x
0
, v) = supv : f(x
0
) =
0
v,
D
f(x
0
, v) = infv : f(x
0
) =
0
v,
e dunque esiste la derivata di Gateaux f
G
(x
0
)v =
0
v per ogni v X.
Dimostriamo adesso il teorema di Mazur (teorema 2.4.6), che qui richiamia-
mo:
Teorema 2.4.6 (di Mazur) Sia X uno spazio di Banach separabile, sia
D X un aperto convesso non vuoto e sia f : D R una funzione conves-
sa e continua. Allora f è G-dierenziabile in un insieme D
0
D, denso in
D, che è unione numerabile di aperti densi.
Dimostrazione Sia
D
0
= x D : f
G
(x),
182
e dimostriamo che D D
0
è unione numerabile di insiemi chiusi in D.
Sia x
n
nN
+ una successione densa nella palla unitaria B di X. Per ogni
n, m N
+
poniamo
A
nm
=
_
x D : , f(x) : ( )(x
n
)
1
m
_
.
Osserviamo che, per la proposizione 5.2.3, f
G
(x) non esiste se e solo se f(x)
contiene almeno due elementi distinti: dato che due elementi distinti di C
devono assumere valori distinti in almeno un punto della palla unitaria B,

dalla densità di x
n
nN
+ si ricava facilmente che
D D
0
=
_
n,mN
+
A
nm
.
Basta allora provare che ciascun A
nm
è chiuso in D. Sia dunque z
k
kN

A
nm
una successione convergente ad un elemento z D, e proviamo che
z A
nm
. Per ogni k esistono
k
,
k
f(z
k
) tali che (
k

k
)(x
n
)
1
m
. Notiamo adesso che, per la proposizione 2.4.5, f è lipschitziana in una
palla B(z, ); losservazione 5.1.7 ci dice allora che i sottodierenziali f(z
k
)
sono equilimitati per ogni k k
0
, ove k
0
è la soglia a partire dalla quale
si ha z
k
B(z, /2). Quindi esiste M 0 tale che |
k
|
X
, |
k
|
X
M
per ogni k N
+
. Per debole* compattezza, possiamo supporre, a meno di
sottosuccessioni, che
k
e
k
in X
. Pertanto
(y z) = lim
k
k
(y z
k
) lim
k
[f(y) f(z
k
)] = f(y) f(z) y X,
cioè f(z); analogamente si vede che f(z). Inoltre
( )(x
n
) = lim
k
(
k

k
)(x
n
)
1
m
,
il che prova che z A
nm
e dunque A
nm
è chiuso in D.
Dimostriamo adesso che D A
nm
è denso in D: da ciò seguirà che anche
DD
0
=
n,mN
+
[DA
nm
] è denso in D, concludendo cos` la dimostrazione.
Sia x
0
D. Per ogni n sia I
n
= s R : x
0
+ sx
n
D: I
n
è un intervallo
aperto non vuoto. La funzione f
1
(r) = f(x
0
+rx
n
), r I
n
, è derivabile salvo
al pi` u un insieme numerabile di punti (esercizio 5.2.5): dunque esiste una
successione di punti della forma x
h
= x
0
+ r
h
x
n
, convergente a x
0
, tale che
f
1
(r
h
) esiste per ogni h N. Ne segue che se , f(x
h
) le restrizioni
183
di e allo spazio [x
n
] appartengono a f
1
(r
h
) per ogni h, ed essendo
f
1
(r
h
) = f
1
(r
h
) si deduce x
n
= x
n
. Ciò mostra che x
h
/ A
nm
per ogni
m N
+
, e che quindi il punto x
0
è approssimabile da punti x
h
D A
nm
.
La tesi è cos provata.
Proviamo inne due risultati che estendono al caso di spazi normati due ben
note caratterizzazioni della convessità per funzioni derivabili su R.
Proposizione 5.2.4 Sia X uno spazio normato reale, sia K X un con-
vesso non vuoto e sia f : K R una funzione G-dierenziabile. Allora f è
convessa se e solo se
f() f(x) +f
G
(x)( x) , x K.
Dimostrazione Sia f convessa: dopo averla prolungata a tutto X ponendola
uguale a + nei punti di X K, siamo nelle ipotesi della proposizione
5.2.3; ne segue f(x) = f
G
(x) per ogni x K, e da qui segue subito la
disuguaglianza cercata.
Viceversa, applichiamo la disuguaglianza alle coppie di punti (u, (1)u+v)
e (v, (1 )u +v), con u, v K e [0, 1]: si ottiene
f(u) f((1 )u +v) +f
G
((1 )u +v)(u v),
f(v) f((1 )u +v) + (1 )f
G
((1 )u +v)(v u).
Moltiplichiamo la prima disuguaglianza per (1 ) e la seconda per , e poi
sommiamo: il risultato è
(1 )f(u) +f(v) f((1 )u +v),
cosicche f è convessa.
Proposizione 5.2.5 Sia X uno spazio normato reale, sia K X un con-
vesso non vuoto e sia f : K R una funzione G-dierenziabile. Allora f
è convessa se e solo se il suo dierenziale di Gateaux f
G
: K X
è un
operatore monotono, ossia
[f
G
(u) f
G
(v)](u v) 0 u, v K.
Dimostrazione Sia f convessa: ssati u, v K, per la proposizione 5.2.4 si
ha
f(v) f(u) +f
G
(u)(v u), f(u) f(v) +f
G
(v)(u v);
184
sommando queste due disuguaglianze si ha
0 f
G
(u)(v u) +f
G
(v)(u v),
da cui la monotonia di f
G
.
Viceversa, sia f
G
monotono. Fissati u, v K, poniamo
() = f((1 )u +v), [0, 1].
Chiaramente è derivabile e
() = f
G
((1 )u +v)(v u) [0, 1];
dalla monotonia di f
G
segue che se < si ha
()
() =
_
f
G
((1 )u +v) f
G
((1 )u +v)
_
(v u) =
=
1

_
f
G
((1 )u +v) f
G
((1 )u +v)
_
_
[(1 )u +v] [(1 )u +v]
_
0.
In altre parole,
: R R è crescente: ne segue che è convessa in [0, 1].

Pertanto
f((1 )u +v) = () (1 )(0) +(1) = (1 )f(u) +f(v),
cioè f è convessa su K.
Osservazione 5.2.6 Con lo stesso ragionamento usato nella prima parte
della dimostrazione precedente, è facile dedurre la seguente proprietà: se X
è uno spazio normato reale e se f : X R è una funzione convessa, allora si
ha
( )(u v) 0 f(u), f(v)
(talvolta naturalmente potrà succedere che i sottodierenziali in questione
siano vuoti). Si esprime questo fatto dicendo che il sottodierenziale è mo-
notono, quantunque esso non sia un operatore da X in X
; ciò troverà piena

giusticazione pi` u avanti, nel pi` u ampio contesto delle multifunzioni.
185
Esercizi 5.2
1. Si costruisca una funzione f : R R convessa, tale che 0
D(f) e f
sia continua in 0, ma risulti f(x) = per ogni x
D(f).
2. Sia K un convesso non vuoto dello spazio normato reale X, e sia f :
K R una funzione G-dierenziabile. Si provi che f è strettamente
convessa se e solo se
f(v) > f(u) +f
G
(u)(v u) u, v K con u ,= v.
3. Sia X uno spazio normato reale e siano f, g : X ] , +] convesse
e proprie. Se esiste x
0
D(f) D(g) tale che f è continua in x
0
, si
provi che risulta
(f +g)(x) = f(x) +g(x) x D(f) D(g).
[Traccia: si osservi che, per lesercizio 5.1.2, basta provare linclusione
(). Fissato x D(f) D(g), sia X
tale che f() + g()

( x) +f(x) +g(x) per ogni X. Si deniscano
C = (, a) X R : f() f(x) ( x) a,
D = (, b) X R : b g(x) g();
si mostri che C e D sono convessi e che
D = , con
C ,= . Si
applichi il lemma 2.3.6 ai convessi D e
C, e si deduca che esistono

X
, t > 0 e R tali che

+tb +ta (, b) D, (, a) C.
Scegliendo = e a = f() f(x) ( x) e b = g(x) g(), si
ricavi la relazione
g(x) g()

t

t
f() f(x) ( x) X.
Si concluda che = x e che

t
g(x),

t
f(x).]
186
4. Siano X, Y spazi normati reali, sia L(X, Y ) e sia f : Y ]
, +] una funzione convessa; supponiamo che esista y
0
D(f) tale
che f è continua in y
0
. Si provi che
f (x) =
(f(x)) x
1
(D(f)).
[Traccia: Linclusione () è facile. Per dimostrare laltra, si ssi
f (x), e si denisca
L = (, ( x) +f(x)) Y R : X.
Si provi che L è convesso ed è disgiunto dal convesso (non vuoto)
epi(f);
si determini un funzionale non nullo (, t) (Y R)
che separi i due

convessi, si mostri che t > 0 e si deduca che
t
f(x) e che
=
t
).]
5. Sia f : [a, b] R una funzione convessa. Si provi che f è derivabile in
[a, b] N, ove N è un insieme al pi` u numerabile.
[Traccia: Si utilizzi la ben nota relazione
f(v) f(u)
v u

f(w) f(u)
w u

f(w) f(v)
w v
per a u < v < w b
per dimostrare che
D
+
f(u) D
f(v) D
+
f(v) D
f(w) per a u < v < w b;

se ne deduca che se f non è derivabile in x
0
allora x
0
è un punto di
discontinuità della funzione crescente x D
+
f(x)...]
5.3 Regolarizzata di una funzione convessa
Vi è un modo canonico di approssimare le funzioni convesse, valido in ogni
spazio di Hilbert reale ed assai utile in molte applicazioni, che andiamo ad
illustrare.
Sia H uno spazio di Hilbert reale e sia f : H ] , +] una funzione
convessa, semicontinua inferiormente e propria. Per ogni > 0 ed ogni
x H, consideriamo la funzione
g
,x
(y) =
1
2
|x y|
2
H
+f(y), y H.
187
Si vede immediatamente che g
,x
è strettamente convessa, semicontinua infe-
riormente e propria.
Lemma 5.3.1 Nelle ipotesi sopra scritte, comunque si ssino > 0 e x H,
la funzione g
,x
ha un unico punto di minimo in H. Inoltre, un punto x
0
H
è il punto di minimo di g
,x
se e solo se risulta
1
(x x
0
) f(x
0
).
Dimostrazione In virt` u della proposizione 2.3.7, esiste una funzione ane
tale che f in H, ossia esistono z H e b R tali che
g
,x
(y) =
1
2
|x y|
2
H
+f(y)
1
2
|x y|
2
H
+ (z, y)
H
+b y H.
Ne segue che g
,x
(y) + per |y|
H
. Dunque, per il corollario 2.3.4,
la funzione g
,x
ha almeno un punto di minimo in H. Poiche inoltre g
,x
è
strettamente convessa, il punto di minimo è unico.
Supponiamo che x
0
H sia tale che
1
(x x
0
) f(x
0
). Allora, per
denizione di sottodierenziale, f(x
0
) R e
f(y) f(x
0
)
1
(x x
0
, y x
0
)
H

(x x
0
, y x
0
)
H

1
2
|y x
0
|
2
H
=
=
1
2
(2x 2x
0
y +x
0
, y x
0
)
H
=
=
1
2
(x x
0
+x y, y x +x x
0
)
H
=
=
1
2
_
|x x
0
|
2
H
|x y|
2
H
_
;
ne segue che g
,x
ha minimo nel punto x
0
.
Viceversa, sia x
0
H lunico punto di minimo di g
,x
: allora, ssato y H
e scelto z = (1 t)x
0
+ ty, con t ]0, 1[, utilizzando la convessità di f ed
osservando che x z = x x
0
t(y x
0
), si può scrivere
t[f(y) f(x
0
)] f(z) f(x
0
)
1
2
_
|x x
0
|
2
H
|x z|
2
H
_
=
=
t
(x x
0
, y x
0
)
H

t
2
2
|x
0
y|
2
H
t ]0, 1[,
188
da cui, dividendo per t e passando al limite per t 0
+
,
f(y) f(x
0
)
1
(x x
0
, y x
0
)
H
y H.
Ci` o mostra che
1
(xx
0
), o meglio il funzionale z
1
(xx
0
, z)
H
, appartiene
a f(x
0
). Il lemma è provato. Si noti che lintero enunciato poteva anche
dedursi dallesercizio 5.2.3).
Indicheremo con y
,x
lunico punto di minimo della funzione g
,x
.
Ci` o premesso, andiamo a denire la regolarizzata di una funzione convessa.
Denizione 5.3.2 Sia f : H ] , +] una funzione convessa, semi-
continua inferiormente e propria su uno spazio di Hilbert reale H. Fissato
> 0, la regolarizzata di f è la funzione cos` denita:
f
(x) = min
yH
g
,x
(y) = g
,x
(y
,x
), x H.
Naturalmente, la regolarizzata f
di una funzione f convessa, semicontinua

inferiormente e propria è cosa diversa dalla regolarizzata semicontinua f di
una funzione convessa f, introdotta con la denizione 2.3.8.
Vediamo ora le principali proprietà della regolarizzata f
.
Proposizione 5.3.3 Sia f : H ] , +] una funzione convessa, semi-
continua inferiormente e propria su uno spazio di Hilbert reale H. Per ogni
> 0 sia f
la regolarizzata di f. Allora:
(i) f
è convessa, assume valori reali e verica

f(y
,x
) f
(x) f(x) x H;
(ii) f
è F-dierenziabile in H e
f
(x) =
1
(x y
,x
) x H;
(iii) posto D = x H : f(x) ,= , si ha
_
_
_
_
1
(x y
,x
)
_
_
_
_
H
min|y|
H
: y f(x) x D;
189
(iv) linsieme D è convesso e
lim
0
+
|y
,x
P
D
(x)|
H
= 0 x H;
(v) risulta
lim
0
+
f
(x) = f(x) x H.
Dimostrazione (i) Anzitutto, f
(x), essendo un minimo, è un numero reale.

Per ogni x H si ha poi, per denizione,
f(y
,x
)
1
2
|x y
,x
|
2
H
+f(y
,x
) = f
(x) = min
yH
g
,x
(y) g
,x
(x) = f(x).
Proviamo la convessità di f
: per ogni x, x
H e [0, 1] si ha
f
(x + (1 )x
) = g
,x+(1)x
(y
,x+(1)x
)
g
,x+(1)x
(y
,x
+ (1 )y
,x
) =
=
1
2
|(x y
,x
) + (1 )(x
y
,x
)|
2
H
+f(y
,x
+ (1 )y
,x
)
1
2
_
|x y
,x
|
2
H
+ (1 )|x
y
,x
|
2
H
+
+f(y
,x
) + (1 )f(y
,x
) =
= g
,x
(y
,x
) + (1 )g
,x
(y
,x
) = f
(x) + (1 )f
(x
).
(ii) Proviamo anzitutto la disuguaglianza
_
_
_
_
1
(x y
,x
)
1
(x
y
,x
)
_
_
_
_
H
|x x
|
H
x, x
H.
In virt` u del lemma 5.3.1, si ha =
1
(xy
,x
) f(y
,x
) e
=
1
(x
y
,x
)
f(y
,x
); ne segue, essendo x = y
,x
+ e x
= y
,x
+
, e tenendo conto
dellosservazione 5.2.6,
(
, x x
)
H
= (
, (
))
H
+ (
, y
,x
y
,x
)
H
|
|
2
H
,
da cui la tesi.
Ci` o premesso, osservato che risulta, per denizione di sottodierenziale,
f(y
,x
) f(y
,x
) (, y
,x
y
,x
)
H
,
190
possiamo scrivere
f
(x
) f
(x) = f(y
,x
) +
1
2
|x
y
,x
|
2
H
f(y
,x
)
1
2
|x y
,x
|
2
H

2
(|
|
2
H
||
2
H
) + (, y
,x
y
,x
)
H
=
=

2
(|
|
2
H
||
2
H
) + (, x
x)
H
(,
)
H
,
da cui
f
(x
) f
(x) (, x
x)
H

2
_
|
|
2
H
||
2
H
2(,
)
H
_
=
=

2
_
|
|
2
H
+||
2
H
2(,
)
H
_
=
=

2
|
|
2
H
0.
Daltra parte, scambiando i ruoli di x e x
abbiamo anche
f
(x) f
(x
) (
, x x
)
H
0,
e quindi, in virt` u della disuguaglianza dimostrata preliminarmente,
f
(x
) f
(x) (, x
x)
H
=
= f
(x
) f
(x) (
, x
x)
H
+ (
, x
x)
H

(
, x
x)
H

1
|x
x|
2
H
.
Ne segue
0 f
(x
) f
(x) (, x
x)
H

1
|x
x|
2
H
,
cosicche f
è F-dierenziabile in ogni x H, con f
(x) = =
1
(x y
,x
).
Ci` o prova (ii).
(iii) Dal lemma 5.3.1 segue che
1
(x y
,x
) f(y
,x
). Quindi
f(z) f(y
,x
)
1
(x y
,x
, z y
,x
)
H
z H,
da cui, scelto z = x, ricaviamo
1
|x y
,x
|
2
H
f(x) f(y
,x
) (y, x y
,x
)
H
y f(x).
191
Ne segue
_
_
_
_
1
(x y
,x
)
_
_
_
_
2
H
_
y,
1
(x y
,x
)
_
H
y f(x),
e ciò implica la tesi, essendo linsieme |y|
H
: y f(x) non vuoto, chiuso
e limitato inferiormente in R.
(iv) Sia x H. Mostriamo anzitutto che linsieme y
,x
]0,1]
è limitato in
H. Fissiamo u D e v f(u): ad esempio potremmo prendere u = y
1,x
e
v = x y
1,x
. Allora per il lemma 5.3.1 e losservazione 5.2.6 si ha
(x y
,x
v, y
,x
u)
H
0 u D, v f(u).
Ne segue la seguente fondamentale disuguaglianza:
|y
,x
|
2
H
(x, y
,x
u)
H
+ (y
,x
, u)
H
(v, y
,x
u)
H
.
Da questa relazione è facile dedurre una disequazione di secondo grado del
tipo
|y
,x
|
2
H
A|y
,x
|
H
+B,
la quale implica la limitatezza di |y
,x
|
H
.
Pertanto linsieme y
,x
]0,1]
è debolmente relativamente compatto nello
spazio di Hilbert H ed è contenuto nel convesso chiuso K = co(D). Sia
n
una successione contenuta in ]0, 1] e tendente a 0, tale che y

n,x
x
0
in H;
allora x
0
K. Passando al minimo limite nella disuguaglianza fondamentale,
e ricordando che liminf
n0
|y
n,x
|
H
|x
0
|
H
, si ricava
(x x
0
, u x
0
)
H
0 u D;
per chiusura, per convessità e per densità, si deduce
(x x
0
, u x
0
)
H
0 u K.
Ma questa disequazione è precisamente quella che caratterizza la proiezione
sul convesso chiuso K: quindi x
0
coincide con P
K
(x). Dato che lo stesso
ragionamento si può fare per qualunque successione
n
contenuta in ]0, 1]
ed innitesima, concludiamo che y
,x
P
K
(x) per 0.
Adesso osserviamo che dalla disuguaglianza fondamentale segue, al limite per
0,
limsup
0
|y
,x
|
2
H
(x, P
K
(x) u)
H
+ (P
K
(x), u)
H
u D,
192
e ancora una volta questa relazione si estende ad ogni u K. Scegliendo
u = P
K
(x), si deduce
limsup
0
|y
,x
|
2
H
|P
K
(x)|
2
H
liminf
0
|y
,x
|
2
H
,
e quindi |y
,x
|
H
|P
K
(x)|
H
per 0. Essendo anche y
,x
P
K
(x), per
una nota proprietà della convergenza debole si conclude che y
,x
P
K
(x) in
H per 0.
Inne, essendo y
,x
D, si ha P
K
(x) D per ogni x H, e quindi
K = R(P
K
) D. Ma per denizione di K si ha ovviamente D K; dunque
K = D e pertanto D, coincidendo col suo inviluppo convesso, è esso stesso
convesso.
(v) Osserviamo prima di tutto che se 0 <
< risulta
f
(x) = inf
yH
_
1
2
|x y|
2
H
+f(y)
_
inf
yH
_
1
2
|x y|
2
H
+f(y)
_
= f
(x);
dunque esiste il limite di f
(x) per 0 e tenuto conto di (i) e (iii) si ha,

essendo f semicontinua inferiormente,
f(P
D
(x)) liminf
0
f(y
,x
) lim
0
f
(x) f(x) x H.
Se x D, questa relazione fornisce subito la tesi. Se invece x / D, allora
d = dist(x, D) > 0: quindi
1
2
|x y
,x
|
2
H

d
2
2
,
e pertanto
f(x) lim
0
f
(x) liminf
0
d
2
2
+f(P
D
(x)) = +,
da cui, ugualmente, la tesi.
Osservazione 5.3.4 Nelle ipotesi della proposizione 5.3.3, si vede facilmente
che D(f) coincide con D, ove D = x H : f(x) ,= . Infatti se x / D
si è visto nella dimostrazione di (v) che f(x) = + e quindi x / D(f);
pertanto D(f) D e dunque D(f) D. Daltra parte, losservazione 5.1.2
ci dice che D D(f), il che implica D D(f).
193
Esercizi 5.3
1. Sia H uno spazio di Hilbert reale e sia f : H ] , +] una funzio-
ne convessa, semicontinua inferiormente e propria. Si provi che esiste
sempre almeno un punto x
0
tale che f(x
0
) ,= .
2. Sia H uno spazio di Hilbert reale e sia f : H ], +] una funzione
convessa, semicontinua inferiormente e propria. Detto y
,x
il punto di
minimo della funzione y
1
2
|xy|
2
H
+f(y), si provi la disuguaglianza
|y
,x
y
,x
|
H
2|x x
|
H
x, x
H.
3. Si calcoli esplicitamente la regolarizzata f
nei casi seguenti:

(a) H = R
N
, f(x) = [x[
2
N
;
(b) H = R, f(x) = dist(x, [a, b]);
(c) H spazio di Hilbert, f funzione ane;
(d) H spazio di Hilbert, f = I
K
, K convesso chiuso di H;
(e) H spazio di Hilbert, f(x) = dist(x, K), K convesso chiuso di H.
194
Capitolo 6
Disequazioni variazionali
6.1 Problemi variazionali con vincoli convessi
Negli spazi di Banach riessivi le funzioni convesse e semicontinue inferior-
mente hanno minimo sui chiusi limitati ed anche, sotto ipotesi convenienti, su
quelli non limitati (teorema 2.3.3 e corollario 2.3.4). Una caratteristica tipica
di questo genere di problemi (ossia dei problemi di minimizzazione di funzio-
nali convessi su vincoli a loro volta convessi) è la possibilità di caratterizzare
i punti di minimo come soluzioni di opportune disequazioni variazionali. Il
prototipo di tali disequazioni è quello che contraddistingue la proiezione su
un convesso chiuso in uno spazio di Hilbert reale: u = P
K
(x) se e solo se u è
il punto di minimo in K della funzione v |x v|
2
X
, e ciò accade se e solo
se
u K, (u x, v u)
X
0 v K
(esercizio 2.3.6). Pi` u in generale si ha il seguente risultato:
Teorema 6.1.1 Sia X uno spazio normato reale, sia K X un convesso
non vuoto, e sia f : K R convessa e G-dierenziabile, con f
G
: K X
continua. Allora sono fatti equivalenti:

(i) u K e f(u) = min
vK
f(v);
(ii) u K e f
(u)(v u) 0 per ogni v K;

(iii) u K e f
(v)(v u) 0 per ogni v K.

195
Si noti che f è di classe C
1
per il corollario 3.3.3, quindi la notazione f
anziche f
G
è giusticata.
Dimostrazione (i) = (ii) Per ogni v K e ]0, 1[ si ha f(u)
f(u +(v u)); quindi
1
[f(u +(v u)) f(u)] 0 ]0, 1[.

Per 0
+
si ottiene f
(u)(v u) 0 per ogni v K. Si osservi che in

questa implicazione non si è usata lipotesi di convessità.
(ii) = (i) Poiche f è convessa, i rapporti incrementali di f sono crescenti
(esercizio 2.1.3); quindi, se u K verica (ii) si ha
f(v) f(u)
1
[f(u +(v u)) f(u)] f
(u)(v u) 0 v K.
(ii) = (iii) Per la proposizione 5.2.5 f
è un operatore monotono, cioè

[f
(v) f
(u)](v u) 0 u, v K;
quindi se u K verica (ii) si ottiene immediatamente che vale anche (iii).
(iii) = (ii) Se w K e ]0, 1[, scegliamo in (iii) v = (1 )u +w: si
trova
f
((1 )u +w)((w u)) 0,

e dopo aver diviso per , per 0 si ottiene (ii) in virt` u della continuità
di f
(si noti che tale ipotesi viene sfruttata esclusivamente qui).

Nei prossimi paragra vedremo risultati pi` u generali ed incontreremo altri
esempi di disequazioni variazionali.
Esercizi 6.1
1. Sia K R
N
un convesso chiuso non vuoto e sia A un aperto di R
N
contenente K. Si provi che se f : A R è una funzione di classe C
1
che ha minimo in K nel punto x
0
, allora
gradf(x
0
) (x x
0
) 0 x K;
si deduca che se x
0

K
allora (ovviamente) gradf(x
0
) = 0.
196
2. Siano f
1
, . . . f
k
funzioni convesse di classe C
1
denite su R
N
; posto
K = x R
N
: f
i
(x) 0, i = 1, . . . , k,
si supponga che
K
,= e che gradf
i
(x) ,= 0 per ogni x K e per ogni
i = 1, . . . , k. Sia poi F : K R
N
una funzione continua. Se in un
punto x
0
K risulta
F(x
0
) (x x
0
) 0 x K,
si provi che esistono
1
, . . . ,
k
0 tali che
F(x
0
) +
k
i=1
i
gradf
i
(x
0
) = 0;
i
f
i
(x
0
) = 0, i = 1, . . . , k
(i numeri
i
si dicono moltiplicatori di Lagrange).
[Traccia: lunico caso non banale è quando x
0
K e F(x
0
) ,= 0.
In questo caso si provi preliminarmente che il cono normale N
K
(x
0
)
(denito nellesercizio 5.1.4) è dato da
N
K
(x
0
) =
_
iI
i
gradf
i
(x
0
),
i
0
_
,
ove I = i 1, . . . , k : f
i
(x
0
) = 0 (a tale scopo si ragioni per assurdo
utilizzando il teorema di Hahn-Banach). Ciò premesso, si osservi che
liperpiano F(x
0
) (xx
0
) = 0 è di appoggio per K in x
0
e se ne deduca
il risultato.]
6.2 Forme bilineari
Consideriamo un caso speciale, ma importante, del teorema 6.1.1. Sia X uno
spazio di Banach reale riessivo e sia a : XX R una forma bilineare, ossia
unapplicazione lineare separatamente nei suoi due argomenti. Supponiamo
che la forma a sia simmetrica (ovvero verichi a(u, v) = a(v, u) per ogni
u, v X), continua (cioè esista M 0 tale che
[a(u, v)[ M|u|
X
|v|
X
u, v X)
197
e coerciva (ossia esista > 0 tale che
a(u, u) |u|
2
X
u X).
Fissato X
, il funzionale
f(u) = a(u, u) 2u, u X,
verica le condizioni del teorema 6.1.1. Infatti f è F-dierenziabile perche
per ogni u, v K si ha
f(v) f(u) = a(v u, u) +a(u, v u) +a(v u, v u) 2(v u) =
= 2a(u, v u) 2(v u) +a(v u, v u),
cosicche
f
(u)w = 2a(u, w) 2w, w X, u X.

Si noti che f
: X X
è continua, anzi lipschitziana:

[[f
(v) f
(u)]w[ = [2a(v u, w)[ 2M|v u|

X
|w|
X
w X,
da cui |f
(v) f
(u)|
X
2M|u v|
X
. Poi, f è strettamente convessa:
infatti si ha
a(v u, v u) 0, a(v u, v u) = 0 v = u,
da cui 2a(u, v) a(u, u) + a(v, v) con luguaglianza se e solo se u = v; ne
segue, per ogni ]0, 1[,
a((1 )u +v, (1 )u +v) =
= (1 )
2
a(u, u) + 2(1 )a(u, v) +
2
a(v, v)
(1 )
2
a(u, u) +(1 )[a(u, u) +a(v, v)] +
2
a(v, v) =
= (1 )a(u, u) +a(v, v),
con luguaglianza se e solo se u = v. Pertanto u a(u, u) è strettamente
convessa e dunque tale è anche f. Inne, f(u) tende a + per |u|
X
,
in quanto
f(u) |u|
2
X
2||
X
|u|
X
= |u|
X
[|u|
X
2||
X
].
198
Possiamo allora concludere che f ha minimo unico in ogni chiuso convesso
non vuoto contenuto in X. Per il teorema 6.1.1, per ogni convesso chiuso non
vuoto K X esiste un unico u K che risolve la disequazione variazionale
a(u, v u) (v u) v K,
od equivalentemente
a(v, v u) (v u) v K.
Si noti che se K è limitato, per avere la sola esistenza di punti di minimo
basta che la forma a(u, v) sia continua, simmetrica e non negativa.
Osservazione 6.2.1 Lequivalenza fra il problema di minimo e la risolubi-
lità della disequazione variazionale nella situazione precedente è dovuta alla
simmetria della forma bilineare: quando a non è simmetrica, un punto u è
di minimo per u a(u, u) 2u in K se e solo se verica
a(u, v u) +a(v u, u) (v u) v K,
e questa disequazione variazionale non è equivalente alla precedente.
`
E interessante osservare che, anche quando la forma bilineare non è simme-
trica, la disequazione variazionale
è risolubile, come mostra il risultato che segue: naturalmente la soluzione di
essa non sarà, in generale, punto di minimo per u a(u, u) 2u.
Proposizione 6.2.2 Sia X uno spazio di Banach reale riessivo e sia a :
X X R una forma bilineare, continua e coerciva. Se K X è un
convesso chiuso non vuoto, e se X
, allora esiste un unico u K tale

che
o equivalentemente
199
Dimostrazione Per lequivalenza fra le due formulazioni della disequazione
variazionale, rimandiamo allesercizio 6.2.1.
Poniamo
(u, v) =
a(u, v) +a(v, u)
2
, (u, v) =
a(u, v) a(v, u)
2
;
le forme bilineari e sono la parte simmetrica e la parte antisimmetrica di
a.
`
E chiaro che è simmetrica, continua e coerciva con le stesse costanti
di a, mentre è continua (e (u, v) = (v, u) per ogni u, v X). Sia la
costante di coercività di a ed ; sia poi
N = sup
u,vX\{0}
[(u, v)[
|u|
X
|v|
X
.
e deniamo per ogni t [0, 1]
a
t
(u, v) = (u, v) +t(u, v);
anche la forma a
t
è coerciva con la stessa costante . Dimostreremo fra poco
il seguente
Lemma 6.2.3 Nelle ipotesi precedenti, sia [0, 1[ tale che per ogni
X
esista un unico u K per cui

a
(u, v u) (v u) v K.
Allora la stessa proprietà vale per ogni t
_
, +

N
_
.
Da questo lemma segue subito la tesi della proposizione 6.2.2: infatti la
disequazione variazionale
a
(u, v u) (v u) v K
è risolubile per = 0 (perche la forma a
0
= è simmetrica); quindi ripetute
applicazioni del lemma ci danno la risolubilità per ogni
_
0,

N
_
, per ogni

_
0,
2
N
_
, per ogni
_
0,
3
N
_
, eccetera, nche dopo un numero nito di
passi avremo la risolubilità per ogni [0, 1]. Dato che a
1
= a, avremo la
tesi.
Dimostrazione del lemma 6.2.3 Fissato t
0

_
0,

N
_
, sia t [, + t
0
].
Riscriviamo la disequazione variazionale associata a t nel modo seguente:
a
(u, v u) (t )(u, v u) +(v u) v K.

200
Per ogni w X sia
w
il funzionale denito da
w
(v) = (t )(w, v) +v, v X;
allora
w
X
e
|
w
|
X
(t )N|w|
X
+||
X
.
Quindi, per ipotesi, esiste un unico u K tale che
a
(u, v u)
w
(v u) v K;
poiche u è funzione di w, scriviamo u = (w). Proviamo che : X K è
una contrazione: se w
1
, w
2
X e u
1
= (w
1
), u
2
= (w
2
), si ha
|u
2
u
1
|
2
X
a
(u
2
u
1
, u
2
u
1
) =
= a
(u
2
, u
2
u
1
) a
(u
1
, u
2
u
1
)

w
2
(u
2
u
1
)
w
1
(u
2
u
1
) = (
w
2

w
1
)(u
2
u
1
)
|
w
2

w
1
|
X
|u
2
u
1
|
X
.
Poiche
w
2

w
1
= (t )(w
2
w
1
, ), dalla relazione precedente segue
|u
2
u
1
|
X

t
|(w
2
w
1
, )|
X

(t )N
|w
2
w
1
|
X

t
0
N
|w
2
w
1
|
X
;
dato che t
0
<

N
, è una contrazione.
Essendo X uno spazio di Banach, lapplicazione : X K ha un unico
punto sso w K: lequazione w = (w) signica
a
(w, v w) (t )(w, v w) +(v w) v K,

cioè w risolve la disequazione variazionale relativa alla forma a
t
.
Osservazione 6.2.4 Se X è uno spazio di Hilbert reale, ogni forma bilineare
a : X X R continua individua univocamente, in virt` u del teorema di
Riesz-Frechèt, un operatore A L(X) tale che
a(u, v) = (Au, v)
X
u, v X.
201
Le proprietà della forma a si traducono in corrispondenti proprietà dellope-
ratore A: in eetti, a è simmetrica se e solo se A è autoaggiunto, a è non
negativa se e solo se A è monotono, ed inne a è coerciva se e solo se A
è anchesso coercivo, nel senso che (Au, u)
X
|u|
2
X
per ogni u X. Si
noti che ciò implica |Au|
X
|u|
X
per ogni u X, ma che questultima
proprietà non implica la coercività delloperatore A e della forma a (esercizio
6.2.2).
Corollario 6.2.5 (teorema di Lax-Milgram) Sia X uno spazio di Hil-
bert reale e sia A L(X) un operatore coercivo, ossia tale che
(Au, u)
X
|u|
2
X
u X,
con > 0. Allora per ogni X esiste un unico u X tale che Au = .
Dimostrazione La forma bilineare a(u, v) = (Au, v)
X
verica tutte le ipotesi
della proposizione 6.2.2 sul convesso K = X. Quindi esiste un unico u X
tale che
(Au, v u)
X
(, v u)
X
v X,
e scegliendo v = u w, con w X, si trova
(Au, w)
X
(, w)
X
w X,
ossia
(Au, w)
X
= (, w)
X
w X.
Ci` o prova che Au = .
Esercizi 6.2
1. Sia X uno spazio di Banach reale riessivo e sia a : X X R una
forma bilineare, continua e coerciva. Se K X è un convesso chiuso
non vuoto, e se X
, si provi che un elemento u K risolve la

disequazione variazionale
se e solo se risolve questaltra:
202
2. Sia H uno spazio di Hilbert reale e sia a : H H R una forma
bilineare continua e simmetrica. Si dia un esempio in cui loperatore A
ad essa associato verica |Au|
X
|u|
X
per ogni u X senza che a
sia coerciva.
3. Stabilire per quali p, q, r, s R la forma quadratica
a(u, v) =
_
1
0
[pu
+qu
v +ruv
+suv] dx
è coerciva sullo spazio di Hilbert H = u AC[0, 1] : u
L
2
(0, 1),
rispetto alla norma naturale |u|
H
=
_
|u|
2
L
2
(0,1)
+|u
|
2
L
2
(0,1)
.
6.3 Operatori monotoni
Losservazione 6.2.4 lascia intuire che per una forma bilineare la proprietà
di monotonia delloperatore associato è un buon surrogato della coercività
della forma, con lulteriore vantaggio, come già sappiamo, che la nozione di
operatore monotono ha senso anche nel caso di operatori non lineari. In
eetti vi è una ricca teoria che riguarda le disequazioni variazionali in cui
compaiono operatori monotoni, e che trova applicazione in problemi non
lineari con vincoli convessi. Uno dei pi` u semplici risultati in questo ambito è
la seguente facile generalizzazione dellenunciato del teorema 6.1.1:
Teorema 6.3.1 Sia X uno spazio di Banach reale riessivo, sia K X un
convesso chiuso non vuoto e sia f : K ], +] una funzione della forma
f = f
1
+ f
2
, con f
1
e f
2
funzioni convesse e semicontinue inferiormente;
supponiamo inoltre che f
1
sia G-dierenziabile, con f
1
: K X
continua,
e che f
2
sia propria. Allora sono fatti equivalenti:
(i) u K e f(u) = min
vK
f(v);
(ii) u K e f
1
(u)(v u) f
2
(u) f
2
(v) per ogni v K;
(iii) u K e f
1
(v)(v u) f
2
(u) f
2
(v) per ogni v K.
Dimostrazione Si tratta di una sostanziale ripetizione della dimostrazione
del teorema 6.1.1.
(i) = (ii) Poiche f
1
è a valori in R (essendo G-dierenziabile) e f
2
è
203
propria, si ha f(u) R. Poiche f(u) f((1 )u +v) per ogni ]0, 1] e
per ogni v K, dalla convessità di f
2
segue
f(u) = f
1
(u) +f
2
(u) f
1
((1 )u +v) +f
2
((1 )u +v)
f
1
((1 )u +v) + (1 )f
2
(u) +f
2
(v).
Mettendo a sinistra i termini contenenti f
1
e a destra quelli contenenti f
2
, e
dividendo per , si trova
1
[f
1
((1 )u +v) f
1
(u)] f
2
(u) f
2
(v);
per 0
+
si ottiene (ii).
(ii) = (i) Per la crescenza dei rapporti incrementali di f
1
e per ipotesi,
f
1
(v) f
1
(u) f
1
(u)(v u) f
2
(u) f
2
(v) v K,
cioè f(v) f(u) per ogni v K.
(ii) = (iii) Facile conseguenza della monotonia di f
1
.
(iii) = (ii) Se v = (1 )u +w, con ]0, 1] e w K, si ha da (iii)
f
1
((1 )u +w)(w u) f
2
(u) f
2
((1 )u +w),
e per la convessità di f
2
f
1
((1)u+w)(wu) f
2
(u)(1)f
2
(u)f
2
(w) = [f
2
(u)f
2
(w)];
dividendo per ed utilizzando la continuità di f
1
, per 0
+
si ottiene (ii).
Esempio 6.3.2 Sia X uno spazio di Hilbert reale. Poniamo, per un ssato
x X,
f
1
(u) =
1
2
|u x|
2
X
, f
2
(u) = (u) u X,
ove : X ] , +] è una funzione convessa, semicontinua inferiormente
e propria. Osserviamo che f = f
1
+ f
2
tende a + per |u|
X
: infatti,
ha una minorante ane (proposizione 2.3.7), cioè esistono y X e R
per cui (u) (y, u)
X
+ per ogni u X; ne segue
204
f(u)
1
2
|u x|
2
X
|y|
X
|u|
X
[[ + per |u|
X
.
Per il corollario 2.3.4, f ha un unico punto di minimo su X, essendo stretta-
mente convessa. In particolare, per il teorema 6.3.1, esiste un unico u K
tale che
(u x, v u)
X
(u) (v) v X.
Tale u, evidentemente, dipende dal pressato x; scriviamo dunque u = p
(x).
Lapplicazione p
: X D() si chiama applicazione di prossimità (relativa

alla prescelta).
Se, ad esempio, K è un convesso chiuso non vuoto di X, e scegliamo
(u) = I
K
(u) =
_
0 se u K
+ se u / K,
allora non è dicile vedere che p
= P
K
(la proiezione sul convesso K).
Osserviamo che p
è continua, anzi lipschitziana: infatti se x

1
, x
2
X e
u
1
= p
(x
1
), u
2
= p
(x
2
), sostituendo u
1
e u
2
nella disequazione variazionale
risolta rispettivamente da u
2
e u
1
, si ottiene
(u
1
x
1
, u
2
u
1
)
X
(u
1
) (u
2
),
(u
2
x
2
, u
1
u
2
)
X
(u
2
) (u
1
);
sommando le due relazioni deduciamo
(x
1
x
2
, u
1
u
2
)
X
|u
1
u
2
|
2
X
0,
da cui
|u
1
u
2
|
2
X
(x
1
x
2
, u
1
u
2
)
X
|x
1
x
2
|
X
|u
1
u
2
|
X
,
e quindi
|u
1
u
2
|
X
= |p
(x
1
) p
(x
2
)|
X
|x
1
x
2
|
X
.
Il pi` u importante risultato nella teoria delle disequazioni variazionali è il
teorema che segue.
Teorema 6.3.3 (di Lions-Stampacchia) Sia X uno spazio di Banach
reale riessivo, sia g : X ] , +] una funzione convessa, semicontinua
inferiormente e propria, e sia A : X X
un operatore (non necessaria-

mente lineare) tale che:
205
(i) A è demicontinuo (cioè continuo rispetto alla topologia debole* di X
sui sottospazi di X nito-dimensionali);

(ii) A è monotono;
(iii) esiste v
0
D(g) per cui
lim
v
X
A(v)(v v
0
) +g(v)
|v|
X
= +.
Allora per ogni X
esiste u D(g) tale che

A(u)(v u) +g(v) g(u) (v u) v X.
Inoltre se A è strettamente monotono, ossia [A(v) A(u)](v u) > 0 per
ogni u, v X con u ,= v, allora la soluzione della disequazione variazionale
è unica.
Lipotesi (ii) signica che se Y X è un sottospazio nito-dimensionale,
allora per ogni ssato u X la funzione reale y A(y)u è continua.
Dimostrazione Proveremo la tesi in tre passi.
1
o
passo: dim(X) < e D(g) limitato in X.
Poiche X ha dimensione nita, X X
R
N
e la dualità fra X e X
è
espressa dal prodotto scalare di R
N
. Si noti che A : R
N
R
N
è continua.
Risulta
u D(g), A(u)(v u) +g(v) g(u) (v u) v X
se e solo se
u D(g), (u (u + A(u)), v u)
X
+g(v) g(u) 0 v X,
ossia se e solo se
u = p
g
(u + A(u)),
ove p
g
è lapplicazione di prossimità relativa a g, denita nellesempio 6.3.2.
Poiche D(g) è convesso e limitato, D(g) è convesso e compatto. La restrizione
a D(g) della funzione
r(u) = p
g
(u + A(u)), u X,
206
manda D(g) in se, anzi addirittura in D(g), ed è continua; per il teorema
di Brouwer, esiste almeno un punto sso u = r(u) D(g). Tale punto sso
risolve, per costruzione, la disequazione variazionale.
2
o
passo: dim(X) < .
Per r > 0 deniamo g
r
: X ] , +] nel modo seguente:
g
r
(u) = g(u) +I
{uX:u
X
r}
(u) =
_
g(u) se |u|
X
r
+ se |u|
X
> r.
La funzione g
r
è convessa e semicontinua inferiormente; se r > |v
0
|
X
, essa
è anche propria con dominio D(g
r
) u X : |u|
X
r, dunque limitato.
Quindi, per il 1
o
passo, esiste u
r
D(g
r
) tale che
(A(u
r
), v u
r
)
X
+g
r
(v) g
r
(u
r
) (v u
r
) v X.
Se r > |v
0
|
X
, scegliendo v = v
0
otteniamo g
r
(v
0
) = g(v
0
) < e
(A(u
r
), v
0
u
r
)
X
+g(v
0
) g(u
r
) (, v
0
u
r
)
X
,
da cui
(A(u
r
), u
r
v
0
)
X
+g(u
r
)
|u
r
|
X
1
|u
r
|
X
[(, u
r
v
0
)
X
+g(v
0
)].
Quindi se per una successione r
k
si avesse |u
r
k
|
X
, dallipotesi
(iii) dedurremmo che il primo membro della disuguaglianza tenderebbe a +
per k , mentre il secondo sarebbe limitato. Ciò è assurdo e pertanto
esiste K > 0 tale che
sup
r>0
|u
r
|
X
= K < .
Poiche X ha dimensione nita, deduciamo che esiste una successione u
rn
estratta dalla famiglia u

r
r>0
tale che u
rn
u per n . Dallipotesi (i)
segue che A(u
rn
) A(u) in X
X. Passando al limite per n nella

relazione
(A(u
rn
), v u
rn
)
X
+g
rn
(v) g
rn
(u
rn
) (, v u
rn
)
X
v X
e tenendo conto che denitivamente risulta g
rn
(u
rn
) = g(u
rn
) e g
rn
(v) = g(v)
per ogni v X, si ottiene
(A(u), v u)
X
+g(v) + limsup
n
(g(u
rn
) (, v u)
X
v X,
207
da cui, per la semicontinuità inferiore di g,
(A(u), v u)
X
+g(v) +g(u) (, v u)
X
v X,
che è la tesi del 2
o
passo.
3
o
passo: caso generale. Sia 1 la famiglia dei sottospazi M X nito-
dimensionali e contenenti v
0
. Per il 2
o
passo, per ogni M 1 esiste u
M

D(g) M tale che
A(u
M
)(v u
M
) +g(v) g(u
M
) (v u
M
) v M.
Scelto v = v
0
M, ripetendo largomentazione svolta nel 2
o
passo si deduce
sup
MV
|u
M
|
X
= K < .
A questo punto ci serve un lemma per mettere la disequazione variazionale
in forma pi` u comoda.
Lemma 6.3.4 Nelle ipotesi precedenti, se M è un sottospazio di X, per un
elemento u M D(g) i seguenti fatti sono equivalenti:
(i) A(u)(v u) +g(v) g(u) (v u) per ogni v M;
(ii) A(v)(v u) +g(v) g(u) (v u) per ogni v M.
Dimostrazione Si fa esattamente come nella dimostrazione (ii) (iii)
dei teoremi 6.1.1 e 6.3.1; nella parte (=) si usa lipotesi di monotonia di A,
mentre nella parte (=) si utilizza la demicontinuità di A.
Continuiamo la dimostrazione del teorema di Lions-Stampacchia. Sia v X
e poniamo
S(v) = u D(g) : |u|
X
K, A(v)(v u) +g(v) g(u) (v u).
Linsieme S(v) è un convesso chiuso (eventualmente vuoto) di X, in quanto
g è convessa e semicontinua inferiormente. Quindi S(v) è debolmente chiuso.
Essendo anche limitato, dalla riessività di X segue che S(v) è debolmente
compatto. Se dimostriamo che
vX
S(v) ,= ,
208
allora esiste u X tale che |u|
X
K e
A(v)(v u) +g(v) g(u) (v u) v X;
dal lemma 6.3.4 seguirà che u risolve la disequazione variazionale e ciò proverà
lenunciato principale del teorema.
Per mostrare che gli S(v) hanno intersezione non vuota, trattandosi di insiemi
w-chiusi contenuti nella palla w-compatta B(0, K), è suciente far vedere
che vale la proprietà dellintersezione nita, ossia che per ogni N N
+
e
per ogni v
1
, . . . , v
N
X si ha
N
i=1
S(v
i
) ,= . Ma, ssati v
1
, . . . , v
N
X e
posto M
N
= [v
0
, v
1
, . . . , v
N
], si ha M
N
1 e quindi, per il 2
o
passo, esiste
u
N
M
N
D(g) tale che
A(u
N
)(v u
N
) +g(v) g(u
N
) (v u
N
) v M
N
,
ossia, per il lemma 6.3.4,
A(v)(v u
N
) +g(v) g(u
N
) (v u
N
) v M
N
.
Se in questa relazione sostituiamo v = v
i
, i = 1, . . . N, otteniamo che
u
N

N
i=1
S(v
i
). Ciò, come si è osservato, prova la tesi del 3
o
passo.
Resta da provare lunicità della soluzione quando A è strettamente mono-
tono. Se u
1
, u
2
sono due soluzioni della disequazione variazionale, possiamo
sostituire ciascuno dei due nella disequazione vericata dallaltro: sommando
le due relazioni si ottiene
[A(u
1
) A(u
2
)](u
2
u
1
) 0.
Daltra parte, se u
1
,= u
2
deve aversi [A(u
1
) A(u
2
)](u
2
u
1
) < 0: ne segue
u
1
= u
2
.
Vediamo ora alcuni casi particolari del teorema di Lions-Stampacchia.
Corollario 6.3.5 Sia X uno spazio di Banach reale riessivo e sia K X
un convesso chiuso contenente lorigine; sia inoltre A : X X
un operatore
demicontinuo, monotono e tale che
lim
v
X
A(v)v
|v|
X
= +.
Allora per ogni X
esiste u K tale che

A(u)(v u) (v u) v K.
209
Dimostrazione Basta porre g = I
K
(la funzione indicatrice di K) e v
0
= 0,
ed applicare il teorema 6.3.3.
Corollario 6.3.6 Sia X uno spazio di Banach reale riessivo e sia A : X
X
un operatore demicontinuo, monotono e tale che

lim
v
X
A(v)v
|v|
X
= +.
Allora A è surgettivo.
Dimostrazione Fissato X
, si applichi il corollario precedente con

K = X: si ottiene lesistenza di un u X tale che
A(u)(v u) (v u) v X.
Scelto v = u w con w X, si deduce
(A(u) )w = 0 w X,
cioè A(u) = .
Osservazione 6.3.7 Se g è convessa, semicontinua inferiormente e propria,
un elemento u X risolve la disequazione variazionale
A(u)(v u) +g(v) g(u) (v u) v X
se e solo se, per denizione di sottodierenziale, A(u) g(u). In
particolare, u risolve
u K, A(u)(v u) (v u) v K
se e solo se A(u) I
K
(u).
Esercizi 6.3
1. Si verichi che ogni applicazione di prossimità è un operatore monoto-
no.
210
2. Sia X uno spazio di Banach reale riessivo, sia g : X ] , +]
una funzione convessa, semicontinua inferiormente e propria, e sia K
un convesso chiuso di X tale che KD(g) ,= . Sia inoltre A : X X
un operatore demicontinuo, monotono e tale che esista v

0
D(g) K
per cui
lim
v
X
A(v)(v v
0
) +g(v)
|v|
X
= +.
Si provi che per ogni X
esiste almeno un u K tale che

A(u)(v u) +g(v) g(u) (v u) v K.
6.4 Filo elastico teso sopra un ostacolo
Come applicazione della teoria delle disequazioni variazionali, consideriamo
un lo elastico teso fra due estremi di ascisse a e a, con a > 0 ssato, e
vincolato a stare al di sopra di un ostacolo (x). La congurazione u(x)
assunta dal lo sarà tale da minimizzare lenergia in gioco, che, in assenza di
forze esterne, è descritta dal funzionale
J(u) =
1
2
_
a
a
[p(x)u
(x)
2
+q(x)u(x)
2
]dx,
dove p(x) è la densità del lo nel punto di ascissa x e q(x) è il coeciente di
elasticità del lo nello stesso punto; il primo termine nellintegrale è lenergia
potenziale dovuta alla sua massa, mentre il secondo è lenergia di deforma-
zione elastica immagazzinata dal lo.
Supporremo p, q, C[a, a] con p > 0 e q 0 in [a, a]; anche lostacolo
non interferisca col lo nei punti di ssaggio, supporremo anche (a) < 0
e (a) < 0. Il problema è quello di trovare una funzione u che minimizzi il
funzionale J nellinsieme delle funzioni per le quali esso ha senso, e che sono
in ogni punto non inferiori a (x).
Come spazio ambiente è naturale scegliere
X = u AC[a, a] : u
L
2
(a, a), u(a) = u(a) = 0,
che è uno spazio di Hilbert con il prodotto scalare
(u, v)
X
=
_
a
a
[u(x)v(x) +u
(x)v
(x)]dx u, v X.
211
La classe delle funzioni ammissibili è descritta dallinsieme
K = u X : u(x) (x) x [a, a].
Per riuscire a minimizzare J bisognerà vericare che K è un convesso chiuso
e che J verica le ipotesi del teorema 2.3.3 o del corollario 2.3.4.
Proviamo anzitutto il seguente
Lemma 6.4.1 Nelle ipotesi precedenti, risulta
|u|
L
2
(a,a)

2a|u|
C[a,a]
2a|u
|
L
2
(a,a)
2a|u|
X
u X.
Dimostrazione Se u X si ha
_
a
a
[u[
2
dx
2a|u|
C[a,a]
=
2a sup
x[a,a]
[u(x) u(a)[ =
=
2a sup
x[a,a]
_
x
a
u
(t) dt
2a|u
|
L
2
(a,a)
2a|u|
X
2a .
`
E facile vedere che K è un convesso. Esso è ovviamente chiuso in C[a, a]
(con la norma uniforme) e quindi è anche chiuso in X in virt` u della stima
fornita dal lemma precedente. Grazie alla limitatezza delle funzioni p e q, è
chiaro che J è continuo rispetto alla norma di X; inoltre risulta
lim
u
X
J(u) = + :
per provare ciò, notiamo che
J(u) min
[a,b]
p |u
|
2
L
2
(a,a)
;
daltronde se |u|
X
allora si ha anche |u
|
L
2
(a,a)
, poiche al-
trimenti otterremmo, dal lemma 6.4.1, che nemmeno |u|
L
2
(a,a)
potrebbe
tendere allinnito, contro lipotesi |u|
X
. Si verica anche, facilmente,
che il funzionale J è strettamente convesso.
Dal corollario 2.3.4 segue che J ha un unico punto di minimo u sul convesso
K. Poiche J è dierenziabile secondo Frechèt, con
J
(u)h =
_
a
a
[p(x)u
(x)h
(x) +q(x)u(x)h(x)]dx h X,
212
per il teorema 6.1.1 il punto di minimo u è lunica soluzione della disequazione
variazionale
u K, J
(u)(v u) 0 v K.
Vogliamo ora trovare le eventuali ulteriori proprietà di regolarità del punto
di minimo vincolato u. A questo scopo conviene anzitutto analizzare il com-
portamento delloperatore J
: X X
, che in questo caso è ovviamente

lineare e che denoteremo con A.
Lemma 6.4.2 Sia u il punto di minimo di J su K e sia Au = J
(u), cosicche
Au(v) =
_
a
a
(pu
+quv) dx v X.
Allora il funzionale Au X
verica le seguenti proprietà:

(i) Au è positivo, ossia
Au(g) 0 g X con g 0 in [a, a];
(ii) Au è nullo sul complementare E = [a, a] D dellinsieme di contatto
D = x ] a, a[ : u(x) = (x), nel senso che
Au(g) = 0 g X con g = 0 in D.
Dimostrazione (i) Sia g X una funzione non negativa. Allora, posto
v = u + g, si ha v K; quindi, utilizzando la disequazione variazionale
soddisfatta da u, si ricava
Au(g) = J
(u)g = J
(u)(v u) 0.
(ii) Sia g X nulla in D: se g 0, ovviamente Au(g) = 0. Altrimenti, il
supporto di g sarà un compatto contenuto in E, sul quale la funzione continua
u deve avere un minimo necessariamente positivo. Di conseguenza, si
ha v = u + tg K per [t[ <

g
e dunque, ancora dalla disequazione
variazionale,
t(Au)(g) = Au(tg) = J
(u)(v u) 0 per [t[ <

|g|
:
dato che il segno di t è arbitrario, ciò signica Au(g) = 0.
La prossima tappa, che è il punto chiave di tutto il discorso, consiste nelle-
stendere il funzionale Au ad un elemento di (C[a, a])
. Preliminare a ciò è
il seguente risultato:
213
Lemma 6.4.3 Sia u il punto di minimo di J su K e sia Au il funzionale
denito nel lemma precedente. Allora esiste M 0 tale che
[Au(g)[ M|g|
L
(D)
g X,
ove D = x [a, a] : u(x) = (x).
Dimostrazione Supponiamo per assurdo che la tesi non sia vera: allora per
ogni j N
+
esiste g
j
X tale che |g
j
|
L
(D)

1
j
e [Au(g
j
)[ = 1. Notando
che D è un compatto contenuto in ] a, a[, possiamo ssare una funzione
C
1
0
(] a, a[) tale che 0 1 e = 1 su D. Per ogni j N
+
sia poi
j
> 0 tale che
[g
j
(x)[
2
j
per d(x, D) = inf
yD
[x y[ <
j
,
e ssiamo per ogni j N
+
una funzione
j
C
1
0
(] a, a[) tale che
0
j
,
j
= 1 su D,
j
= 0 per d(x, D)
j
.
Allora [g
j
j
[
2
j
in [a, a], cosicche, utilizzando le proprietà (i) e (ii) del
lemma 6.4.2, risulta
1 = [Au(g
j
)[ = [Au(g
j
j
) +Au(g
j
(1
j
))[ =
= [Au(g
j
j
)[ Au([g
j
[
j
)
2
j
Au().
Per j si ottiene lassurdo.
Corollario 6.4.4 Sia u il punto di minimo di J su K e sia Au il funzionale
denito nel lemma 6.4.2. Allora esiste ununica misura nita , denita su
una -algebra contenente i boreliani di [a, a], tale che
Au(g) =
_
a
a
g d g X;
inoltre è concentrata sullinsieme di contatto D.
Dimostrazione Dal lemma 6.4.3 segue, in particolare,
[Au(g)[ M|g|
L
(D)
M|g|
C[a,a]
g X;
214
da qui è facile dedurre, per densità, che il funzionale A si può estendere a tutto
C[a, a] mantenendo valida la stessa disuguaglianza: infatti, se u C[a, a]
e se u
n
X converge uniformemente a u in [a, a], allora la disuguaglianza
precedente, applicata a u
n
u
m
, ci dice che Au
n
è una successione di
Cauchy in C[a, a] e quindi converge ad una funzione v C[a, a]. Posto
Au = v, si vede subito che la denizione è ben posta, e pertanto otteniamo
unestensione di A allo spazio C[a, a] che continua a vericare la relazione
precedente. Per la caratterizzazione del duale (C[a, a])
, esiste una misura

di Lebesgue-Stieltjes , denita su una -algebra contenente i boreliani di
[a, a] e associata a una funzione m(x) crescente e continua a sinistra in
[a, a], tale che
Au(g) =
_
a
a
g d g X.
Per quanto visto in precedenza, tale misura verica anche
_
a
a
g d
M|g|
L
(D)
g C[a, a].
Ci` o implica che è concentrata sullinsieme D.
Inoltre la misura è univocamente determinata: se
1
è unaltra misura con
le stesse proprietà, si ha infatti
_
D
gd =
_
a
a
gd = Au(g) =
_
a
a
gd
1
=
_
D
gd
1
g X
da cui, per densità,
_
D
gd =
_
D
gd
1
g C(D),
ossia =
1
.
Analizziamo nalmente le proprietà di regolarità del punto di minimo u, sotto
opportune ipotesi sullostacolo .
Proposizione 6.4.5 Sia u il punto di minimo di J su K e sia E = x
[a, a] : u(x) > (x). Allora pu
C
1
(E) e (pu
+qu = 0 in E; se inoltre
lostacolo ha le derivate destra e sinistra
(x
+
) e
(x
), e se risulta
(x
+
)
(x
) in ogni punto x [a, a], allora la funzione u è derivabile

in ogni punto di [a, a].
215
Questo enunciato ci dice che lipotesi chiave per avere la derivabilità di u in
[a, a] è che i punti angolosi dellostacolo siano rivolti verso il basso, ossia
non siano punti di massimo locale: se ad esempio uno di quei punti fosse di
massimo assoluto per , esso, fatalmente, sarebbe un punto angoloso di u.
Dimostrazione Partiamo dalla relazione dimostrata nel lemma 6.4.4:
Au(g) =
_
a
a
g d g X,
e ricordiamo che la misura è associata ad una funzione m : [a, a] R
crescente, continua a sinistra e nulla per x = a. Dal lemma 4.7.2 segue,
integrando per parti,
Au(g) =
_
a
a
g d =
_
a
a
g
mdx g X.
Dunque, ricordando la denizione del funzionale Au,
_
a
a
[(pu
+m)g
+qug] dx = 0 g X.
Applichiamo ora il lemma 4.2.3 alla funzione pu
+ m, nella versione pi` u

generale dellesercizio 6.4.2: si noti infatti che a priori pu
+ m è soltanto
sommabile in [a, a], e non continua. Si ottiene che
[p(x)u
(x) +m(x)]
= q(x)u(x) q.o. in [a, a],

e in particolare pu
+ m C
1
[a, a]. Ma poiche è concentrata su D =
[a, a] E, in ogni componente connessa di E la funzione m è costante,
cosicche la derivata m
esiste ed è nulla. Ne segue pu
C
1
(E) e (pu
= qu
in E.
Osserviamo poi che si ha, per unopportuna costante c,
u
(x) =
m(x)
p(x)
+
c
p(x)

1
p(x)
_
x
a
q(t)u(t)dt x [a, a].
e quindi u
ha limiti destro e sinistro in ogni punto, con

u
(x
+
) u
(x
) =
m(x
+
) m(x
)
p(x)
0 x ] a, a[;
216
in particolare u
è continua nei punti di E.

Daltra parte, nei punti di D la funzione u ha minimo uguale a 0, da cui
(u )
(x
+
) 0 (u )
(x
) x D.
Dunque, per lipotesi fatta su ,
u
(x
+
)
(x
+
)
(x
) u
(x
) x D,
e pertanto
u
(x
+
) = u
(x
) x D.
Ci` o prova che u è derivabile anche nei punti di D.
Esercizi 6.4
1. Si provi che nello spazio X = u AC[a, b] : u(a) = u(b) = 0 la
quantità |u
|
L
2
(a,b)
è una norma equivalente alla norma naturale
|u|
X
=
_
|u|
2
L
2
(a,b)
+|u
|
2
L
2
(a,b)
.
2. Si provino queste generalizzazioni dei lemmi 4.2.1, 4.2.2 e 4.2.3:
(i) Sia L
1
(a, b) tale che
_
b
a
(x) (x) dx = 0 C
1
0
[a, b];
allora = 0 q.o. in [a, b].
(ii) Sia L
1
(a, b) tale che
_
b
a
(x)
(x) dx = 0 C
1
0
[a, b];
allora esiste c R tale che = c q.o. in [a, b].
(iii) Siano , L
1
(a, b) tali che
_
b
a
[(x) (x) +(x)
(x)] dx = 0 C
1
0
[a, b];
allora AC[a, b] con
= q.o. in [a, b].

217
3. Si supponga che lostacolo sia una funzione assolutamente continua
in [a, a]; si provi che se il funzionale
A(v) =
_
a
a
(p
+qv) dx, v X,
è positivo, allora linsieme di contatto D è un intervallo.
[Traccia: Si ragioni per assurdo, supponendo che esistano s, t D
e x [s, t] tali che u(x) > (x): posto v(x) = (x) per x [s, t] e
v(x) = u(x) per x [a, a] [s, t], si verichi che v K e che v u;
si deduca che [A Au](v u) 0 e che di conseguenza ( u)
= 0
in [s, t]. Di qui si arrivi allassurdo.]
218
Capitolo 7
Multifunzioni
7.1 Nomenclatura
Le multifunzioni, o funzioni multivoche, sono applicazioni che ad ogni punto
associano un insieme. Esse rivestono grande importanza in svariati problemi
della matematica applicata, e comprendono entro il proprio ambito, genera-
lizzandone la portata, la teoria delle disequazioni variazionali e dei problemi
al contorno per equazioni dierenziali.
Denizione 7.1.1 Siano X, Y insiemi. Una multifunzione è unapplicazio-
ne F : X T(Y ). Linsieme F(x), per un ssato x X, è il valore o
l immagine di x. Gli insiemi
D(F) = x X : F(x) ,= , R(F) = F(X) =
_
xX
F(x)
sono rispettivamente il dominio e l immagine di F. Il graco di F è linsieme
G(F) = (x, y) X Y : y F(x).
Se A è un sottoinsieme di X, l immagine di A mediante F è linsieme
F(A) =
_
xA
F(x);
se B è un sottoinsieme di Y , la controimmagine di B mediante F è linsieme
F
1
(B) = x X : F(x) B ,= .
219
Osservazione 7.1.2 Se K è un sottoinsieme di X e F : K T(Y ) è una
multifunzione con dominio D(F) K, possiamo sempre estendere F ad una
multifunzione F : X T(Y ), ponendo
F(x) =
_
se x / K,
F(x) se x K.
Si ottiene in questo modo una multifunzione denita su tutto X, tale che
D(F) = D(F) K.
Quindi nel seguito, quando ci farà comodo, potremo supporre di aver a che
fare con multifunzioni denite su tutto X.
Osservazione 7.1.3 Ogni multifunzione F : X T(Y ) è univocamente
determinata dal suo graco G(F), nel senso che lapplicazione F G(F) è
iniettiva ed anche surgettiva su T(X Y ). Infatti liniettività è pressocche
ovvia, mentre per la surgettività basta osservare che ogni X Y è il
graco della multifunzione J : X T(Y ) cos` denita:
J(x) = y Y : (x, y) x X.
Denizione 7.1.4 Sia F : X T(Y ) unarbitraria multifunzione. La sua
inversa è la multifunzione F
1
: Y T(X) denita da:
F
1
(y) = x X : y F(x) y Y.
`
E facile vericare che D(F
1
) = R(F) e R(F
1
) = D(F); inoltre per ogni
x X e per ogni y Y si ha
(x, y) G(F) (y, x) G(F
1
).
Si noti che, coerentemente con la denizione di controimmagine mediante F,
risulta
F
1
(B) = x X : F(x) B ,= =
_
yB
F
1
(y) B Y.
Osservazione 7.1.5 Ad ogni funzione F : X Y corrisponde la multifun-
zione F : X T(Y ) denita da F(x) = F(x). In tal caso la multifunzione
F
1
è semplicemente limmagine inversa (in senso insiemistico) della funzione
F, ossia
F
1
(y) = F
1
(y) = x X : F(x) = y y Y.
220
Esempi 7.1.6 (1) Se X è uno spazio normato e f : X R è una funzione
ssata, il sottodierenziale di f è una multifunzione f : X T(X
), il cui
dominio è linsieme dei punti in cui f è sottodierenziabile.
Si osservi che se X è riessivo e f è convessa, semicontinua inferiormente e
propria, allora dal corollario 5.1.11 segue che
f(x) x J
1
f
() x X, X
,
ove J : X X
è limmersione canonica; ne segue che le due multifunzioni

f : X T(X
) e J
1
f
: X
T(X) hanno dominio non vuoto e sono

una linversa dellaltra.
(2) Sia X uno spazio di Banach; per ogni x X poniamo
F(x) = X
: x = |x|
2
X
= ||
2
X
.
Il teorema di Hahn-Banach ci garantisce che F(x) ,= per ogni x X; quindi
la multifunzione F ha per dominio tutto X. Essa si chiama applicazione di
dualità.
Riprenderemo in esame questi esempi pi` u avanti.
Andiamo ora a denire le nozioni di semicontinuità e di continuità per multi-
funzioni, che sono sostanzialmente dierenti da quelle analoghe relative alle
funzioni. La continuità per una multifunzione non ha una naturale de-
nizione: se si prova ad estendere alle multifunzioni qualcuna delle svariate
caratterizzazioni di questa proprietà valide per le funzioni, si ottengono con-
dizioni non pi` u equivalenti fra loro. Bisogna dunque fare una scelta fra le
varie possibilità, e la bontà di tale scelta sarà giusticata dalla sua utilità
nelle applicazioni.
Denizione 7.1.7 Siano X, Y spazi topologici e sia F : X T(Y ) una
multifunzione. Diciamo che F è semicontinua superiormente nel punto x
0

X se per ogni aperto A F(x
0
) esiste un intorno U di x
0
in X tale che
F(U) A.
Diciamo che F è semicontinua superiormente in X se F è semicontinua
superiormente in ogni punto di X.
Si noti che se F è una funzione questa denizione si riduce alla usuale nozione
di continuità.
221
multifunzione. Diciamo che F è semicontinua inferiormente nel punto x
0

X se per ogni y
0
F(x
0
) e per ogni intorno N di y
0
in Y esiste un intorno
U di x
0
in X tale che
F(x) N ,= x U.
Diciamo che F è semicontinua inferiormente in X se F è semicontinua
inferiormente in ogni punto di X.
Anche questa denizione, allorche F è una funzione, si riduce a quella di
continuità, in quanto la condizione F(x) N ,= diventa F(x) N.
multifunzione. Diciamo che F è continua nel punto x
0
X se F è sia
semicontinua superiormente che semicontinua inferiormente nel punto x
0
.
Diciamo che F è continua in X se F è continua in ogni punto di X.
Esempio 7.1.10 Siano F, G : R T(R) denite da:
F(x) =
_
[1, 1] se x = 0
0 se x ,= 0,
G(x) =
_
0 se x = 0
[1, 1] se x ,= 0.
Allora si verica facilmente che F è semicontinua superiormente in R, ma
non è semicontinua inferiormente nel punto 0, mentre G è semicontinua
inferiormente in R ma non è semicontinua superiormente nel punto 0.
Come vedremo, la semicontinuità superiore è una proprietà importante nello
studio dei punti ssi delle multifunzioni, mentre la semicontinuità inferiore
è utile per costruire selezioni di multifunzioni. Negli esercizi 7.1.1 e 7.1.2
sono esposte caratterizzazioni di questi due tipi di semicontinuità che, in
qualche modo, motivano la scelta degli attributi superiore ed inferiore
loro assegnati.
Esercizi 7.1
1. Siano X, Y spazi topologici. Si provi che una multifunzione F : X
T(Y ) è semicontinua superiormente se e solo se F
1
(B) è chiuso in X
per ogni chiuso B Y .
222
2. Siano X, Y spazi topologici. Si provi che una multifunzione F : X
T(Y ) è semicontinua inferiormente se e solo se F
1
(A) è aperto in X
per ogni aperto A Y .
3. Siano X, Y, Z spazi topologici e siano F : X T(Y ) e G : Y T(Z)
due multifunzioni. Deniamo la multifunzione composta G F cos`:
G F(x) =
_
yF(x)
G(y) x X.
Si provi che se F e G sono semicontinue superiormente allora G
F è semicontinua superiormente, e che se F e G sono semicontinue
inferiormente allora G F è semicontinua inferiormente.
4. Siano X, Y spazi metrici e sia F : X T(Y ) una multifunzione. Si
provi che:
(i) se F è semicontinua superiormente e F(x) è chiuso in Y per ogni
x X, allora il graco G(F) è chiuso in X Y ;
(ii) se il graco G(F) è chiuso in X Y ed Y è compatto, allora F è
semicontinua superiormente;
(iii) la multifunzione F : R T(R
2
), denita da
F() = (x, y) R
2
: y = x R,
ha graco chiuso in R
3
, F() è chiuso in R
2
per ogni R, ma F
non è semicontinua superiormente nel punto 0.
5. Si provi che la multifunzione F : R T(R
2
) denita da
F() = (x, y) R
2
: y = R
è semicontinua inferiormente ma non semicontinua superiormente.
7.2 Punti ssi
Lesistenza di punti ssi per le multifunzioni è una proprietà di grande
importanza nelle applicazioni, come cercheremo di mostrare nel seguito.
223
Denizione 7.2.1 Sia X un insieme e sia F : X T(X) una multifun-
zione. Diciamo che un elemento x X è un punto sso per F se si ha
x F(x).
Il primo risultato sui punti ssi di multifunzioni è una generalizzazione del
classico teorema delle contrazioni di Banach. Introduciamo anzitutto una
nozione di distanza fra insiemi.
Denizione 7.2.2 Sia (X, d) uno spazio metrico. La quantità
D(A, B) = max
_
sup
aA
d(a, B), sup
bB
d(b, A)
_
, A, B X,
si chiama metrica di Hausdor.
Ricordiamo che d(a, B) = inf
bB
d(a, b).
`
E abbastanza facile vericare che la
funzione D è una distanza sullinsieme ( dei sottoinsiemi chiusi e limitati di
X (esercizio 7.2.1).
Si ha il seguente risultato:
Teorema 7.2.3 Sia (X, d) uno spazio metrico completo, sia M un sottoin-
sieme non vuoto e chiuso di X, e sia F : X T(M) una multifunzione con
D(F) M, tale che F(x) sia chiuso per ogni x M. Se esiste k ]0, 1[ tale
che
D(F(x), F(y)) k d(x, y) x, y M,
allora F ha almeno un punto sso.
Si osservi che non possiamo aspettarci lunicità del punto sso: se ad esempio
F(x) = M per ogni x X, e M ha pi` u di un elemento, le ipotesi del teorema
sono banalmente vericate e tutti i punti di M sono punti ssi per F.
Dimostrazione Fissiamo h ]k, 1[ e sia x
0
D(F). Scegliamo x
1
F(x
0
)
tale che d(x
0
, x
1
) > 0 (se tale x
1
non esiste, vuol dire che F(x
0
) = x
0
,
cosicche in particolare x
0
è un punto sso di F ed abbiamo nito). Essendo
x
1
F(x
0
) M D(F), si ha F(x
1
) ,= . Allora
d(x
1
, F(x
1
)) sup
aF(x
0
)
d(a, F(x
1
))
D(F(x
0
), F(x
1
)) k d(x
0
, x
1
) < h d(x
0
, x
1
);
quindi, per denizione di d(x
1
, F(x
1
)), esiste x
2
F(x
1
) tale che
d(x
1
, x
2
) < h d(x
0
, x
1
).
224
Se d(x
2
, x
1
) = 0, allora x
2
= x
1
F(x
1
), e x
1
è un punto sso di F; altrimenti,
sarà d(x
2
, x
1
) > 0 e possiamo iterare questo procedimento. Se non si trova
un punto sso dopo un numero nito di passi, si costruirà una successione
x
n
tale che
x
n+1
F(x
n
) M, d(x
n
, x
n+1
) < h
n
d(x
0
, x
1
) n N.
`
E facile riconoscere che x
n
è una successione di Cauchy contenuta nel chiuso
M; per la completezza di X essa converge ad un elemento x M. Ne segue
d(x
n+1
, F(x)) D(F(x
n
), F(x)) k d(x
n
, x) 0 per n ,
da cui x F(x) = F(x), che è la tesi.
Osservazione 7.2.4 Non è dicile vericare che nelle ipotesi del teorema
precedente la multifunzione F è semicontinua inferiormente, ma non è in
generale semicontinua superiormente: lo è, ad esempio, nei punti x tali che
F(x) è compatto (si vedano gli esercizi 7.2.2 e 7.2.3).
Uno dei pi` u importanti teoremi di punto sso per le multifunzioni è quello
che segue; da esso discendono come corollari molti dei classici risultati di
punto sso per funzioni.
Teorema 7.2.5 (di Kakutani) Sia X uno spazio vettoriale topologico lo-
calmente convesso di Hausdor, sia K un sottoinsieme non vuoto, convesso
e compatto di X, e sia F : K T(K) una multifunzione semicontinua supe-
riormente e tale che F(x) sia non vuoto, convesso e chiuso per ogni x K.
Allora F ha almeno un punto sso.
Prima di dimostrare questo teorema vediamo alcune delle sue conseguenze.
Corollario 7.2.6 (teorema di Tikhonov) Sia X uno spazio vettoriale to-
pologico localmente convesso di Hausdor, sia K un sottoinsieme non vuoto,
convesso e compatto di X, e sia F : K K unapplicazione continua. Allora
F ha almeno un punto sso.
Dimostrazione Poiche F : K K è continua, la multifunzione F(x) =
F(x) è semicontinua superiornmente e verica le ipotesi del teorema 7.2.5.
Quindi esiste x K tale che x F(x), ossia x = F(x).
225
Corollario 7.2.7 (teorema di Schauder) Sia X uno spazio di Banach e
sia M un sottoinsieme non vuoto, convesso, chiuso e limitato di X. Se
F : M M è unapplicazione continua e compatta (ossia trasforma insiemi
limitati in insiemi relativamente compatti), allora F ha almeno un punto
sso.
Dimostrazione Per ipotesi, linsieme F(M) è relativamente compatto: dun-
que, per il teorema di Mazur (teorema 1.7.19), linsieme K = co(F(M)) è
convesso e compatto; inoltre K M perche M è un convesso chiuso che con-
tiene F(M). Consideriamo la restrizione F[
K
: questa applicazione verica le
ipotesi del teorema di Tikhonov (corollario 7.2.6). Quindi esiste x K M
tale che F(x) = x.
Il teorema di Schauder può essere generalizzato alle multifunzioni come segue:
Corollario 7.2.8 Sia X uno spazio di Banach e sia M un sottoinsieme
non vuoto, convesso e chiuso di X. Sia F : M T(M) una multifunzione
semicontinua superiormente, tale che F(M) sia relativamente compatto e che
F(x) sia convesso, chiuso e non vuoto per ogni x M; allora F ha almeno
un punto sso.
Dimostrazione Sia K = co(F(M)); K è un convesso compatto non vuoto
contenuto in M. La restrizione F[
K
è a valori in T(K): infatti se x K
allora F(x) è un convesso chiuso contenuto in F(M), e quindi in K. Dun-
que, per il teorema 7.2.5, F[
K
ha un punto sso; ne segue che anche F ha un
punto sso.
Dimostrazione del teorema 7.2.5 Proviamo anzitutto la seguente pro-
posizione, che fornisce la tesi del teorema sotto dierenti ipotesi e che ha
interesse di per se.
Proposizione 7.2.9 Sia X uno spazio vettoriale topologico di Hausdor,
sia K X non vuoto, convesso e compatto, e sia F : K T(K) una
multifunzione (non necessariamente semicontinua superiormente) tale che:
(i) F(x) è non vuoto e convesso per ogni x K;
(ii) F
1
(y) è aperto in K per ogni y K.
226
Si verica facilmente che la condizione (ii) implica la semicontinuità inferiore
di F: dunque siamo in ipotesi diverse da quelle del teorema di Kakutani.
Dimostrazione La famiglia di aperti F
1
(y)
yK
è un ricoprimento di K:
infatti, se x K, scelto y F(x), si ha y K e, per denizione, x F
1
(y).
Dato che K è compatto, K è ricoperto da una unione nita
n
i=1
F
1
(y
i
),
con y
1
, . . . , y
n
K. Sia f
i
una partizione dellunità associata a F
1
(y
i
),
i = 1, . . . , n (essa esiste perchè il compatto K, essendo di Hausdor, è pa-
racompatto e in particolare è normale, ossia tale che due chiusi disgiunti
possiedono intorni disgiunti). Poniamo
p(x) =
n
i=1
f
i
(x)y
i
x K
0
= co(y
1
, . . . y
n
) K.
Il convesso K
0
è contenuto in uno spazio al pi` u n-dimensionale, vale a dire
quello generato dai vettori y
1
, . . . , y
n
, ed è compatto. Lapplicazione p è
continua e p(K
0
) K
0
in quanto
n
i=1
f
i
(x) = 1. Per il teorema di Brouwer
p ha un punto sso x K
0
. Basta allora dimostrare che p(x) F(x) per
ogni x K
0
, per dedurre che x è un punto sso di F in K
0
K.
Sia x K
0
: poiche
n
i=1
f
i
(x) = 1 su K, esiste almeno un j 1, . . . , n per
il quale f
j
(x) ,= 0. Per ciascun indice j tale che f
j
(x) ,= 0 si ha x F
1
(y
j
)
e quindi y
j
F(x). Ne segue, essendo F(x) convesso,
p(x) =
n
i=1
f
i
(x)y
i
=
j: f
j
(x)=0
f
j
(x)y
j
F(x),
da cui la tesi.
La dimostrazione del teorema 7.2.5 prosegue introducendo una disequazione
variazionale.
Proposizione 7.2.10 Sia X uno spazio vettoriale topologico di Hausdor,
sia K X non vuoto, convesso e compatto, e sia T : K X
continua
rispetto alla topologia forte di X
. Allora la disequazione variazionale

[T(x
0
)](x
0
x) 0 x K
ha soluzione x
0
K.
Dimostrazione Ragioniamo per assurdo: se cos` non fosse, per ogni x
0
K
troveremmo un elemento x K tale che [T(x
0
)](x
0
x) < 0. Consideriamo
227
la multifunzione F : K T(K) denita nel modo seguente:
F(x
0
) = x K : [T(x
0
)](x
0
x) < 0 x
0
K.
Chiaramente F(x
0
) è non vuoto e convesso. Proviamo che F
1
(x) è aperto
in K per ogni x K: per denizione di controimmagine di F si ha
F
1
(x) = x
0
X : [T(x
0
)](x
0
x) < 0.
Sia x
i
iI
un net contenuto in K F
1
(x) che converge ad un elemento
x K in X; allora vale la relazione
[T(x
i
)](x
i
x) 0 i I.
Quindi possiamo scrivere
[T(x)](x x) =
= [T(x)](x x
i
) + [T(x) T(x
i
)](x
i
x) + [T(x
i
)](x
i
x)
[T(x)](x x
i
) + [T(x) T(x
i
)](x
i
x) i I.
Passando al limite rispetto ad i, il primo termine allultimo membro tende
a 0 perche T(x) X
. Notiamo poi che K, essendo compatto, è limitato

in X (esercizio 1.4.9). Poiche (v. paragrafo 1.5) la topologia forte di X
è
generata dalle seminorme p
A
() = sup
yA
[y[, con A sottoinsieme limitato
di X, dalla continuità di T rispetto a tale topologia e dalla limitatezza di
K K si deduce, passando al limite rispetto ad i,
[[T(x
i
) T(x)](x
i
x)[ p
KK
(T(x
i
) T(x)) 0;
quindi si conclude che
[T(x)](x x) 0,
ossia x K F
1
(x). Ciò prova che F
1
(x) è aperto.
Sono allora vericate le ipotesi della proposizione 7.2.9, e pertanto esiste un
punto sso x
0
K per F; quindi, per denizione di F(x
0
), otteniamo
0 = [T(x
0
)](x
0
x
0
) < 0,
il che è assurdo.
Il teorema di Kakutani si deduce immediatamente dal risultato che segue:
228
Proposizione 7.2.11 (teorema di Browder) Sia X uno spazio vettoriale
topologico localmente convesso di Hausdor, sia K X non vuoto, convesso
e compatto; sia inoltre F : K T(X) una multifunzione semicontinua
superiormente, tale che F(x) sia chiuso, convesso e non vuoto per ogni x
K. Supponiamo inoltre che si abbia
(a) per ogni x K esistono y F(x), u K, > 0 tali che y =
x +(u x),
oppure
(b) per ogni x K esistono y F(x), u K, < 0 tali che y =
x +(u x).
Il teorema 7.2.5 corrisponde allipotesi (a): infatti nel caso del teorema di
Kakutani si ha F(x) K e quindi, ssato y F(x), si può scegliere u = y e
= 1. Pertanto avremo provato il teorema 7.2.5 se proveremo il teorema di
Browder.
Dimostrazione Supponiamo che valga la condizione (a) e ragioniamo per
assurdo. Assumiamo che F sia priva di punti ssi: ciò signica che x / F(x)
per ogni x K.
Linsieme x è convesso e compatto, mentre F(x) è convesso e chiuso. Per
il teorema di Hahn-Banach (teorema 1.7.5) esiste un funzionale w(x) X
tale che
w(x)x < inf
yF(x)
w(x)y ;
quindi, per continuità, esiste un intorno W
x
di x tale che
sup
zWx
w(x)z < inf
yF(x)
w(x)y .
Posto
U
x
= y X : sup
zWx
w(x)z < w(x)y,
U
x
è un aperto contenente F(x). Adesso per ogni x K deniamo
N
x
= v K : w(x)(v y) < 0 y F(v),
e proviamo che N
x
è un intorno di x. Dato che F è semicontinua supe-
riormente, in corrispondenza dellaperto U
x
F(x) esiste un intorno V
x
di
229
x, aperto in K e che non è restrittivo supporre contenuto in W
x
, tale che
F(v) U
x
per ogni v V
x
; ciò signica che
sup
zWx
w(x)z < w(x)y y F(v), v V
x
.
A maggior ragione, quindi,
w(x)(v y) < 0 y F(v), v V
x
,
e dunque V
x
N
x
.
Poiche K è compatto, esistono x
1
, . . . , x
n
K tali che K =
n
i=1
V
x
i
; sce-
gliamo una partizione dellunità f
i
associata a V
x
i
(nuovamente, ciò è
possibile perche K è compatto e di Hausdor, dunque paracompatto), e
poniamo
r(x) =
n
i=1
f
i
(x)w(x
i
), x K.
`
E facile vericare che la funzione r : K X
è continua rispetto alla

topologia forte di X
; proviamo che
r(x)(x y) < 0 y F(x).
Per ogni indice i tale che f
i
(x) > 0 (e di tali indici ce nè almeno uno) si ha
x V
x
i
N
x
i
; quindi, per denizione di N
x
i
,
w(x
i
)(x y) < 0 y F(x),
ed a maggior ragione, sommando su i, si ottiene r(x)(x y) < 0.
Adesso osserviamo che r e K vericano le ipotesi della proposizione 7.2.10:
quindi esiste x K tale che
r(x)(x v) 0 v K.
Da qui dedurremo lassurdo. Infatti, il punto x sarà interno a K oppure sulla
frontiera di K. Se x è interno a K, allora per ogni ssato z X esiste > 0
tale che xz K; se nella disequazione variazionale prendiamo v = xz,
otteniamo r(x)z = 0, e per larbitrarietà di z si ricava r(x) 0, contro il
fatto che r(x)(x y) < 0 per y F(x). Se invece x K, entra in gioco la
condizione (a): esistono y F(x), u K e > 0 tali che y = x +(u x).
Scelto v = u, la disequazione variazionale ci dice che r(x)(x u) 0, da cui
230
r(x)(x y) 0; ma dato che y F(x), deve essere invece r(x)(x y) < 0.
Ci` o prova lassurdo.
Se si assume la condizione (b) in luogo della (a), si sceglie con il teorema
1.7.5 un funzionale w(x) X
tale che
w(x)x > sup
yF(x)
w(x)y ,
e si ripete tutta largomentazione con la disuguaglianza > in luogo di <.
Esercizi 7.2
1. Dimostrare che la metrica di Hausdor denisce una distanza sulla
classe dei sottoinsiemi chiusi e limitati di uno spazio metrico (X, d).
2. Sia (X, d) uno spazio metrico e sia F : X T(X) una multifunzione
con le seguenti proprietà:
(i) F(x) è chiuso e non vuoto per ogni x X;
(ii) esiste k ]0, 1[ per cui
D(F(x), F(x
)) k d(x, x
) x, x
X,
ove D è la metrica di Hausdor. Si provi che F è semicontinua infe-
riormente in ogni punto, e che è semicontinua superiormente nei punti
x X tali che F(x) è compatto.
3. Sia F : R
2
T(R
2
) denita da
F(x, y) =
_
,
x
2
_
_
,
y
2
_
(x, y) R
2
.
Si provi che F non è semicontinua superiormente in alcun punto, benche
risulti
D(F(x, y), F(x
, y
))
1
2
_
(x x
)
2
+ (y y
)
2
(x, y), (x
, y
) R
2
.
231
7.3 Punti di sella
Vogliamo applicare la teoria dei punti ssi di multifunzioni allesistenza di
punti di sella per funzioni denite sul prodotto di spazi di Banach; il teorema
che dimostreremo troverà a sua volta applicazione nella teoria dei giochi. In
accordo con la denizione 2.6.15, poniamo:
Denizione 7.3.1 Siano A, B insiemi non vuoti, e sia f : AB R una
funzione. Diciamo che (x
0
, y
0
) AB è punto di sella per la funzione f se
f(x
0
, y) f(x
0
, y
0
) f(x, y
0
) (x, y) A B,
oppure se
f(x
0
, y) f(x
0
, y
0
) f(x, y
0
) (x, y) A B.
Dunque un punto (x
0
, y
0
) A B è di sella per f se e solo se
max
yB
f(x
0
, y) = f(x
0
, y
0
) = min
xA
f(x, y
0
)
oppure
min
yB
f(x
0
, y) = f(x
0
, y
0
) = max
xA
f(x, y
0
).
Dato che i punti di sella per f sono di sella anche per f, a meno di cambiare
segno alla f si può sempre supporre, e cos` faremo nel seguito, che in un punto
di sella (x
0
, y
0
) si abbia
f(x
0
, y) f(x
0
, y
0
) f(x, y
0
) (x, y) A B.
Ad esempio, se A = B = R il punto (0, 0) sarà di sella per la funzione
f(x, y) = x
2
y
2
(e non, in base alla nostra convenzione, per la sua opposta).
Si noti che la nozione di punto di sella che ci interessa qui è molto pi` u
restrittiva di quella utilizzata nel calcolo dierenziale: ad esempio, la funzione
g : R
2
R denita da
g(x, y) = (1 x
2
/2)(1 2x
2
)
ha nellorigine un punto stazionario che non è ne di massimo, ne di minimo
relativo (essendo g(x, x
2
) < 0 < g(0, y) per ogni x, y ,= 0), ma che non è di
sella secondo la denizione 7.3.1 poiche
g(0, y) > g(0, 0) y ,= 0, g(x, 0) > g(0, 0) x ,= 0.
Inoltre consideremo solamente punti di sella globali: per quelli locali basterà
restringere la funzione ad un opportuno intorno del punto (x
0
, y
0
).
232
Proposizione 7.3.2 Siano A, B insiemi non vuoti, sia f : A B R
una funzione. La f possiede un punto di sella in A B se e solo se la
funzione x sup
yB
f(x, y) ha minimo in A, la funzione y inf
xA
f(x, y)
ha massimo in B, e
min
xA
sup
yB
f(x, y) = max
yB
inf
xA
f(x, y) = R.
In tal caso, se (x
0
, y
0
) è punto di sella per f si ha f(x
0
, y
0
) = .
Dimostrazione Anzitutto deniamo per comodità
(x) = sup
yB
f(x, y), (y) = inf
xA
f(x, y),
ed osserviamo che, come nellosservazione 2.6.14, è facile vericare che
sup
yB
inf
xA
f(x, y) = sup
yB
(y) inf
xA
(x) = inf
xA
sup
yB
f(x, y).
Notiamo che un punto (x
0
, y
0
) A B è punto di sella per f se e solo se
(x
0
) = max
yB
f(x
0
, y) = f(x
0
, y
0
) = min
xA
f(x, y
0
) = (y
0
);
quindi se f ha un punto di sella (x
0
, y
0
) dalla relazione precedente segue
inf
xA
(x) (x
0
) = (y
0
) sup
yB
(y)
e pertanto vale luguaglianza
inf
xA
(x) = sup
yB
(y).
Detto tale valore, si ha necessariamente f(x
0
, y
0
) = .
Viceversa, supponiamo che abbia minimo nel punto x
0
A e che abbia
massimo nel punto y
0
B, con
(x
0
) = min
xA
(x) = max
yB
(y) = (y
0
) = .
Allora il punto (x
0
, y
0
) è di sella per f poiche
f(x
0
, y) (x
0
) = = f(x
0
, y
0
) = (y
0
) f(x, y
0
) x A, y B.
La tesi è provata.
Dimostriamo ora il seguente teorema, la cui importanza applicativa sarà
evidenziata nel prossimo paragrafo:
233
Teorema 7.3.3 (del minimax, o di von Neumann) Siano X, Y spazi
di Banach riessivi, e siano A X, B Y non vuoti, convessi, chiusi e
limitati. Sia inoltre f : A B R una funzione tale che:
(i) x f(x, y) è quasi convessa e semicontinua inferiormente per ogni
y B;
(ii) y f(x, y) è quasi concava e semicontinua superiormente per ogni
x A.
Allora f ha un punto di sella in A B.
Ricordiamo (osservazione 2.1.5) che f è quasi convessa se i suoi insiemi di
sottolivello sono convessi, e che f è quasi concava se f è quasi convessa,
ossia gli insiemi di sopralivello di f, vale a dire F
= x A : f(x) ,
sono convessi.
a = min
xA
max
yB
f(x, y), b = max
yB
min
xA
f(x, y);
grazie alla proposizione 7.3.2, basterà provare che i numeri a e b esistono e
coincidono.
Fissato y B, la funzione x f(x, y) è quasi convessa e semicontinua
inferiormente in A, e per losservazione 2.3.5 ha minimo in A in un punto
z(y) A:
f(z(y), y) = min
xA
f(x, y) y B.
Poniamo ora
h(y) = f(z(y), y), y B,
e mostriamo che h è quasi convessa e semicontinua inferiormente in B.
Fissato t R, consideriamo gli insiemi
H = y B : h(y) t, G(w) = y B : f(z(w), y) t, w B.
Osserviamo che H G(w) per ogni w B, essendo f(z(y), y) f(z(w), y)
per ogni w, y B; inoltre G(w) è convesso e chiuso, in quanto la funzione
y f(z(w), y) è quasi convessa e semicontinua inferiormente. Proviamo
che H è chiuso: se y
n
H e y
n
y in B, allora si ha y G(w) per ogni
w B; in particolare y G(y), ossia y H. Proviamo che H è convesso:
234
se y, v H e ]0, 1[, allora posto u = (1 )y + v si ha u G(w) per
ogni w B; in particolare u G(u), ossia u H. Essendo H convesso e
chiuso, si deduce che h è quasi convessa e semicontinua inferiormente per la
proposizione 2.2.2. Pertanto, dallosservazione 2.3.5 segue che h ha minimo
m sul convesso chiuso e limitato B; posto b = m, si ha
b = min
yB
_
min
xA
f(x, y)
_
= max
yB
min
xA
f(x, y).
In modo analogo si prova che esiste il numero a. Inoltre risulta
min
xA
f(x, y) min
xA
max
yB
f(x, y) = a y B,
da cui la disuguaglianza b a.
Proviamo ora che a b. Consideriamo le topologie deboli su X e su Y ,
ssiamo > 0 e introduciamo la multifunzione T : A B T(A B)
denita da
T(x, y) = (u, v) A B : f(u, y) a .
Si ha T(x, y) ,= perche min
uA
f(u, y) b e max
vB
f(x, v) a; inoltre
T(x, y) è convesso in virt` u delle ipotesi fatte su f. Proviamo che per ogni
(u, v) AB linsieme T
1
(u, v) è aperto nello spazio X Y , munito della
topologia prodotto delle due topologie deboli su X e su Y (si noti che XY
è uno spazio vettoriale topologico localmente convesso di Hausdor, e che
A B è compatto e convesso in tale spazio). Si ha infatti
T
1
(u, v) = (x, y) A B : (u, v) T(x, y) =
= (x, y) A B : f(u, y) a =
= x A : f(x, v) > a y B : f(u, y) < b +;
dal momento che x A : f(x, v) a e y B : f(u, y) b + sono
convessi chiusi, dunque debolmente chiusi, in A ed in B rispettivamente, essi
sono anche debolmente chiusi in X ed in Y , cosicche i loro complementari
sono debolmente aperti in X ed in Y . Pertanto il loro prodotto cartesiano è
aperto nel prodotto X Y .
In denitiva, la multifunzione T verica le ipotesi della proposizione 7.2.9
nello spazio XY munito del prodotto delle topologie deboli: pertanto esiste
235
un punto sso per T, ossia esiste (x
0
, y
0
) AB tale che (x
0
, y
0
) T(x
0
, y
0
),
ossia
a < f(x
0
, y
0
) < b +.
Quindi a < b + 2, ed essendo arbitrario si conclude che a b.
Per la proposizione 7.3.2, esiste un punto di sella per f in A B.
Esercizi 7.3
1. Siano A = B = 1, 2, 3 e siano F
1
, F
2
: A B R le funzioni i cui
valori sono deniti dalle matrici
F
1
=
_
_
1 2 0
0 2 0
2 3 1
_
_
, F
2
=
_
_
1 3 0
1 1 0
0 0 1
_
_
.
Vericare che F
1
ha punti di sella (quanti?) mentre F
2
non ne ha.
2. Siano A, B insiemi non vuoti, e sia f : A B R una funzione.
`
E
vero che che se (x
0
, y
0
) A B verica
f(x
0
, y
0
) = min
xA
max
yB
f(x, y) = max
yB
min
xA
f(x, y),
allora (x
0
, y
0
) è necessariamente un punto di sella per f oppure per
f?.
7.4 Teoria dei giochi
Consideriamo un gioco fra due giocatori P e Q: per vincere a questo gioco,
P e Q hanno a disposizione due insiemi di strategie A e B. Ogni x A
ed ogni y B costituiscono una possibile mossa, o sequenza di mosse,
del gioco per P e per Q; se P sceglie la strategia x e Q sceglie la strategia
y vi sono due funzioni di utilità f
P
(x, y) e f
Q
(x, y) che rappresentano la
vincita (o la perdita, se negative) per P e per Q conseguenti alla strategia
scelta. Nel caso pi` u semplice, che è quello dei cosiddetti giochi a somma
zero, si ha f
P
(x, y) = f
Q
(x, y), il che signica che la funzione di utilità
g(x, y) = f
Q
(x, y) rappresenta simultaneamente il guadagno di Q e la per-
dita di P (se positiva), o viceversa la perdita di Q e il guadagno di P (se
negativa).
236
Nei giochi a somma zero esiste un criterio soddisfacente per scegliere la
strategia migliore relativa a ciascun giocatore.
Denizione 7.4.1 La coppia (x
0
, y
0
) A B si dice coppia strategica
ottimale se (x
0
, y
0
) è punto di sella per la funzione di utilità g in A B.
Dalla proposizione 7.3.2 segue:
Proposizione 7.4.2 Siano A, B insiemi non vuoti e sia g : A B R la
funzione di utilità di un gioco a somma zero con insiemi di strategie A e B.
Esiste una coppia strategica ottimale relativa alla funzione g se e solo se
min
xA
sup
yB
g(x, y) = max
yB
inf
xA
g(x, y) = ;
in tal caso, se (x
0
, y
0
) è una coppia strategica ottimale, allora g(x
0
, y
0
) = .
Il numero si dice valore del gioco.
Interpretiamo il risultato della proposizione precedente: ciascun giocatore
gioca con una strategia volta ad ottimizzare il proprio interesse (cos` si sup-
pone). Poiche g(x, y) rappresenta ciò che guadagna Q ed insieme ciò che
perde P, chiaramente P punta a minimizzare g mentre Q punta a massimiz-
zare g. Supponiamo, per ssare le idee, che il valore del gioco sia positivo. Se
P sceglie la mossa x
0
, il guadagno di Q sarà, nella migliore delle ipotesi, pari
al pi` u a max
yB
g(x
0
, y); la scelta della strategia y
0
garantisce a Q esattamen-
te tale guadagno, poiche g(x
0
, y
0
) = max
yB
g(x
0
, y). Simmetricamente, se
Q opta per la mossa y
0
, la perdita di P sarà, nella migliore delle ipotesi, pari
a min
xA
g(x, y
0
); scegliendo la mossa x
0
, P avrà la certezza di non perdere
di pi` u, in quanto g(x
0
, y
0
) = min
xA
g(x, y
0
).
Pi` u in generale, se P gioca una mossa qualunque x, Q sa che, giocando
bene, può arrivare a una vincita al pi` u uguale a max
yB
g(x, y); daltron-
de Q non può impedire a P di rendere minima tale vincita riducendola
a min
xA
max
yB
g(x, y) (ossia a g(x
0
, y
0
)). Tuttavia, se Q sceglie y
0
, ot-
terrà una vincita g(x, y
0
) che supererà comunque tale stima pessimistica.
Similmente, ad una mossa qualsiasi y da parte di Q, P potrà risponde-
re in modo ottimale perdendo soltanto min
xA
g(x, y), ma non potrà farci
niente se la mossa di Q era tale da massimizzare tale perdita elevandola a
max
yB
min
xA
g(x, y); però se P sceglie x
0
la sua perdita sarà g(x
0
, y), cioè
comunque inferiore al valore precedente.
Tutto questo mostra che la coppia strategica ottimale (x
0
, y
0
) garantisce un
237
bilanciamento ottimale degli interessi contrapposti dei due giocatori.
Il valore assunto da g nel punto (x
0
, y
0
), ossia il valore del gioco (che è uni-
vocamente determinato anche se la coppia strategica ottimale non è unica,
in virt` u della proposizione 7.4.2), ci dice se il gioco è equo oppure no: se
g(x
0
, y
0
) = 0, e se i giocatori giocano entrambi in modo ottimale, nessuno
dei due vincerà ne perderà; se g(x
0
, y
0
) > 0, il gioco è squilibrato a favore
di Q, che scegliendo una strategia ottimale guadagnerà comunque, mentre se
g(x
0
, y
0
) < 0 il favorito dal gioco sarà P.
Esempio 7.4.3 (pari o dispari) I giocatori P e Q dichiarano ciascuno un
numero: se la somma dei numeri è pari, P vince 1 euro, se è dispari P perde
1 euro; per Q avviene lopposto. Le strategie di P e Q sono A = B = p, d,
e la funzione di utilità g = f
Q
= f
P
è
g(p, d) = g(d, p) = 1, g(p, p) = g(d, d) = 1.
Si verica subito che
min
xA
max
yB
g(x, y) = 1, max
yB
min
xA
g(x, y) = 1,
cosicche non esistono strategie ottimali. La cosa non sorprende, perche A e
B non sono convessi!
Per applicare la teoria precedente al caso di insiemi di strategie niti, bisogna
introdurre una versione probabilistica del gioco. Si assume che il gioco (a
somma zero) sia stato giocato molte volte, e che i giocatori P e Q scelgano
le loro strategie sulla base di ssate probabilità, o meglio di frequenze di
successi: se le strategie di P e Q sono E = E
1
, . . . , E
N
e F = F
1
, . . . , F
M
,
e se g(E
i
, F
j
) è la funzione di utilità risultante dalle scelte E
i
e F
j
, supporremo
che P scelga la mossa E
i
con probabilità p
i
, e che Q scelga la mossa F
j
con
probabilità q
j
. Poniamo allora
A =
_
p R
N
: 0 p
i
1,
N
i=1
p
i
= 1
_
,
B =
_
q R
M
: 0 q
j
1,
M
j=1
q
j
= 1
_
;
un elemento p A rappresenta dunque la strategia di P consistente nello
scegliere la mossa E
1
con probabilità p
1
, la mossa E
2
con probabilità p
2
,
eccetera.
238
Denizione 7.4.4 Ogni coppia (p, q) A B si dice coppia strategica
mista. La quantità
L(p, q) =
N
i=1
M
j=1
g(E
i
, F
j
)p
i
q
j
è la speranza di vincita per il giocatore Q.
La funzione L(p, q) esprime il valore statisticamente probabile di vincita per
Q, misurato dopo molte mani del gioco.
Denizione 7.4.5 Una coppia (p
0
, q
0
) A B è una coppia strategica
mista ottimale se (p
0
, q
0
) è punto di sella per la funzione L(p, q).
Dunque una coppia (p
0
, q
0
) è ottimale se
L(p
0
, q) L(p
0
, q
0
) L(p, q
0
) (p, q) A B.
Si ha allora questo risultato:
Teorema 7.4.6 Nelle ipotesi precedenti esiste almeno una coppia strategica
mista ottimale (p
0
, q
0
), e si ha
L(p
0
, q
0
) = min
pA
max
qB
L(p, q) = max
qB
min
pA
L(p, q).
Dimostrazione Scelti X = R
N
e Y = R
M
, basta applicare il teorema del
minimax (teorema 7.3.3) alla funzione L(p, q) che, essendo lineare in p e q, è
continua, nonche simultaneamente concava e convessa in ciascuna variabile
sui convessi A e B, i quali sono limitati e chiusi.
Esempio 7.4.7 Nel caso del gioco pari o dispari (esempio 7.4.3), le mosse
sono E
1
= F
1
= p, E
2
= F
2
= d, le strategie miste sono
A = B = p = (p
1
, p
2
) : p
1
, p
2
[0, 1], p
1
+p
2
= 1
e la funzione di utilità è
g(E
i
, F
j
) =
_
1 se E
i
= F
j
1 se E
i
,= F
j
;
la funzione speranza di vincita è
239
L(p, q) =
2
i,j=1
g(E
i
, F
j
)p
i
q
j
= p
1
q
1
p
2
q
2
+p
1
q
2
+p
2
q
1
= (p
1
p
2
)(q
1
q
2
).
Si vede subito che un punto di sella è (p, q) con p = q = (
1
2
,
1
2
), e il valore del
gioco è, come potevamo aspettarci,
L(p, q) =
_
1
2

1
2
__
1
2

1
2
_
= 0.
Si noti che (p, q) è lunico punto di sella per L: infatti se (p
, q
) è un altro
punto di sella, deve essere L(p
, q
) = 0, e quindi si ha p
1
= p
2
oppure q
1
= q
2
,
da cui p
= p oppure q
= p. Ma se p
= p = (
1
2
,
1
2
), dalle relazioni
0 = L(p, q
) = L(p
, q
) L(p, q
) p A,
scegliendo p = (
1
4
,
3
4
) oppure p = (
3
4
,
1
4
) si deduce 0
1
2
(q
1
q
2
), e quindi
q
= p = (
1
2
,
1
2
). In modo analogo, se q
= (
1
2
,
1
2
) si deduce p
= q = (
1
2
,
1
2
).
In denitiva, il gioco è equo e la strategia ottimale per entrambi i giocatori
è quella di dichiarare un numero pari con probabilità
1
2
e un numero dispari
con probabilità
1
2
. (In eetti, trattandosi di un gioco essenzialmente di for-
tuna, i due giocatori, mediamente, vinceranno ciascuno con probabilità
1
2
, e
il guadagno di ciascuno sarà mediamente nullo.)
Per i giochi non a somma zero la teoria è meno semplice. Per mostrare quello
che può accadere, è utile considerare il seguente
Esempio 7.4.8 (dilemma dei prigionieri) Sono stati arrestati dalla po-
lizia due malfattori che devono scontare un anno di prigione ciascuno per un
reato minore. Il procuratore sospetta che i due siano stati complici in un
reato maggiore, punibile con ulteriori cinque anni di reclusione, ma non è in
grado di provarlo. Nel tentativo di incriminarli per il delitto maggiore, egli
fa a ciascuno di loro, separatamente, la seguente promessa: se accuserà il
socio del reato maggiore, gli verrà abbuonato lanno di galera per il crimine
minore, e se poi il socio non lo accuserà del delitto maggiore (nel qual caso
dovrà invece scontare i relativi 5 anni), sarà liberato.
La situazione può essere descritta come un gioco fra i due malfattori P e
Q. Entrambi possono scegliere fra le due strategie di accusare laltro (a) o
di non accusarlo (n); le corrispondenti funzioni di utilità si deniscono co-
me lopposto degli anni da scontare (in modo da dover essere massimizzate).
Quindi risulterà:
f
P
(a, a) = 5, f
P
(a, n) = 0, f
P
(n, a) = 6, f
P
(n, n) = 1;
240
f
Q
(a, a) = 5, f
Q
(a, n) = 6, f
Q
(n, a) = 0, f
Q
(n.n) = 1.
Si riconosce immediatamente che la coppia strategica consistente nellaccu-
sarsi a vicenda fornisce un esito peggiore per tutti e due rispetto alla scelta di
omertà per entrambi. Eppure, ciascun malfattore, che non si da dellaltro,
nota che la scelta di accusare laltro gli arrecherà il benecio di scontare,
in qualunque caso, un anno in meno: infatti, se laltro non lo accusa uscirà
subito invece di star dentro un anno, mentre se laltro lo accusa a sua volta,
sconterà 5 anni anziche 6. Il risultato nale è che entrambi i rei si accuse-
ranno, e dunque staranno in galera per 5 anni: con la strategia omertosa,
invece, se la sarebbero cavata con un anno per ciascuno.
Come si vede, la strategia omertosa, che da un punto di vista cooperativo è
la soluzione migliore, non lo è dal punto di vista individuale: anche in pre-
senza di un accordo clandestino fra i malfattori per tacere entrambi, nessuno
dei due può avere la garanzia che, non accusando laltro, costui mantenga la
parola di non accusarlo a sua volta; è troppo grande il rischio di beccarsi 6
anni vedendo laltro uscire di galera.
Lidea che la razionalità individuale preceda quella collettiva, fenomeno tipico
dei giochi non cooperativi (in cui non cè possibilità di accordi o alleanze fra
i giocatori), è alla base della nozione di equilibrio di Nash.
Denizione 7.4.9 La coppia (x
0
, y
0
) AB si dice punto di equilibrio di
Nash se per ogni altra strategia (x, y) A B valgono le disuguaglianze
f
P
(x
0
, y
0
) f
P
(x, y
0
), f
Q
(x
0
, y
0
) f
Q
(x
0
, y).
In altre parole, un punto di equilibrio di Nash è una coppia di strategie che
massimizza lutilità di un singolo giocatore quando lavversario si attiene
alla strategia data. Il senso è questo: a P conviene scegliere la strategia
x
0
, perche ciò invoglierà Q a scegliere y
0
onde massimizzare f
Q
, e in questo
modo P massimizzerà f
P
. Il discorso è simmetrico dal punto di vista di
Q. Il guaio è che lesistenza di un punto di equilibrio di Nash non esclude
aatto che possa esistere una coppia strategica (x, y) per la quale risulti
f
P
(x, y) > f
P
(x
0
, y
0
) e f
Q
(x, y) > f
Q
(x
0
, y
0
): è precisamente ciò che accade
nel dilemma dei prigionieri con la strategia della non accusa reciproca.
Osservazioni 7.4.10 (1) Se il gioco è a somma zero (ossia f
Q
= f
P
= g),
allora un punto (x
0
, y
0
) fornisce un equilibrio di Nash se e solo se esso è punto
241
di sella per la funzione g. Infatti dalla denizione 7.4.9 segue subito, per ogni
(x, y) A B,
g(x
0
, y) = f
Q
(x
0
, y) f
Q
(x
0
, y
0
) = f
P
(x
0
, y
0
) f
P
(x, y
0
) = g(x, y
0
)
cosicche (x
0
, y
0
) è punto di sella per g; il viceversa è del tutto analogo.
(2) Nellesempio del dilemma dei prigionieri è facile vericare che lunico
punto di equilibrio di Nash è la strategia dellaccusa reciproca.
Teorema 7.4.11 Siano X, Y spazi di Banach e siano A X, B Y non
vuoti, convessi e compatti. Siano f, g : AB R funzioni continue tali che
x f(x, y) sia concava per ogni y B e y g(x, y) sia concava per ogni
x X. Allora esiste un punto di equilibrio di Nash (x
0
, y
0
) A B per le
funzioni f e g.
Dimostrazione Introduciamo la funzione F : (A B) (A B) R,
denita da
F(p, q) = f(p
1
, q
2
) +g(q
1
, p
2
) p, q A B,
e osserviamo che F è continua, nonche concava in p per ogni ssato q. Per
questa funzione vale il seguente
Lemma 7.4.12 Nelle ipotesi precedenti, esiste q
0
A B tale che
max
pAB
F(p, q
0
) = F(q
0
, q
0
).
Dimostrazione La disuguaglianza è banale per ogni q
0
AB. Ragio-
niamo per assurdo, ammettendo che per ogni q A B esista p A B
per cui risulti F(p, q) > F(q, q). Poniamo
G
p
= q A B : F(p, q) > F(q, q), p A B :
linsieme G
p
è aperto in AB, e per lipotesi fatta si ha AB
pAB
G
p
.
Linsieme AB è compatto nello spazio XY , quindi esistono p
1
, . . . , p
k

A B tali che A B
k
i=1
G
p
i
. Deniamo adesso le funzioni
i
(q) = maxF(p
i
, q) F(q, q), 0, q A B, i = 1, . . . , k,
242
le quali sono continue e non negative; osserviamo che per ogni q A B
esiste i 1, . . . k tale che q G
p
i
e dunque
i
(q) > 0. Normalizziamo le
i
ponendo
i
(q) =

i
(q)
k
j=1
j
(q)
,
cosicche
k
i=1
i
(q) = 1 per ogni q A B. Posto (q) =
k
i=1
i
(q)p
i
,
lapplicazione manda il convesso AB in se ed è continua. Poiche AB
è compatto, per il teorema di Tikhonov (teorema 7.2.6) esiste un punto sso
q
A B per . Si ha dunque q
k
i=1
i
(q
)p
i
, da cui per concavità
F(q
, q
) = F
_
k
i=1
i
(q
)p
i
, q
i=1
i
(q
)F(p
i
, q
).
Daltra parte, se
i
(q
) > 0 si ha F(p
i
, q
) > F(q
, q
), e ciò implica
F(q
, q
)
k
i=1
i
(q
)F(p
i
, q
) >
k
i=1
i
(q
)F(q
, q
) = F(q
, q
),
il che è assurdo. Il lemma è provato.
Torniamo alla dimostrazione del teorema 7.4.11. Per il lemma, esiste q
0

A B tale che
max
pAB
F(p, q
0
) = F(q
0
, q
0
).
Posto (x
0
, y
0
) = q
0
, si ha allora
f(x, y
0
) +g(x
0
, y) f(x
0
, y
0
) +g(x
0
, y
0
) (x, y) A B;
scegliendo x = x
0
si deduce g(x
0
, y) g(x
0
, y
0
) per ogni y B, mentre
scegliendo y = y
0
si trova f(x, y
0
) f(x
0
, y
0
) per ogni x A. Pertanto
(x
0
, y
0
) è punto di equilibrio di Nash.
Esercizi 7.4
1. Si analizzi, come si è fatto negli esempi 7.4.3 e 7.4.7, il gioco sasso-
carta-forbici: due giocatori P e Q scelgono simultaneamente S, C o
F. Tenuto conto che il sasso spunta le forbici, le forbici tagliano la
243
carta e la carta nasconde il sasso, e che il gioco vuole essere a somma
zero, si consideri la seguente funzione di utilità per il giocatore Q:
S C F
S 0 1 1
C 1 0 1
F 1 1 0
Si provi che il gioco, nella sua versione probabilistica, è equo e che ad
entrambi i giocatori conviene alternare le tre mosse con probabilità
1
3
ciascuna.
2. Siano A = E
1
, . . . , E
N
e B = F
1
, . . . , F
M
le strategie di un gioco
a somma zero per due giocatori P e Q, e si supponga che la funzione
di utilità g del giocatore Q non abbia punti di sella. Si provi che Q,
giocando intelligentemente, può garantirsi un guadagno non inferiore a
v = max
j
min
i
g(E
i
, F
j
), e che similmente P, giocando con astuzia, non
permetterà a tale guadagno di superare v = min
i
max
j
g(E
i
, F
j
).
3. (Battaglia fra i sessi) Due innamorati U e D devono decidere come
passare la serata: seguendo i rispettivi stereotipi culturali, U vorrebbe
andare alla partita di calcio mentre D preferirebbe andare a ballare, ma
soprattutto entrambi desiderano trascorrere la serata assieme. Indicate
con c e b le corrispondenti scelte, deniamo quindi le funzioni di utilità
f
U
e f
D
nel modo seguente (in verticale le scelte di U, in orizzontale
quelle di D):
(f
U
, f
D
) :
b (2, 2) (1, 2)
c (2, 1) (1, 1)
c b
Si determinino i punti di equilibrio di Nash per questo gioco.
7.5 Selezioni
Luso di una multifunzione si presta a rappresentare unincertezza nella de-
terminazione del valore di una data funzione f: dato x, può capitare che il
valore f(x) sia noto solo approssimativamente, e quindi si conosca solo un
insieme F(x) al quale f(x) certamente appartiene. Una selezione f di una
244
multifunzione F è un modo di scegliere per ogni x, in assenza di pi` u precise
informazioni, un possibile valore f(x) tra tutti quelli ammissibili, cioè fra gli
elementi di F(x).
Denizione 7.5.1 Siano W, M insiemi non vuoti e sia F : W T(M)
una multifunzione. Una selezione di F è unapplicazione m : W M tale
che m(w) F(w) per ogni w W.
Unovvia condizione necessaria anche almeno una selezione esista è che si
abbia F(w) ,= per ogni w W; in questo caso, lesistenza di una selezione
è sempre e comunque garantita dallassioma della scelta. Il problema che ci
poniamo, e che è importante nelle applicazioni, è quello di costruire selezioni
dotate di particolari proprietà: quando W e M sono insiemi niti, ci inte-
resseranno selezioni iniettive; quando W è uno spazio misurato e M è, ad
esempio, R, vorremo trovare selezioni misurabili; quando W e M sono spazi
topologici, andremo in cerca di selezioni continue.
Cominciamo dal caso di insiemi niti.
Teorema 7.5.2 (del matrimonio) Siano W, M insiemi non vuoti, con W
nito; sia F : W T(M) una multifunzione. Allora esiste una selezione
iniettiva m : W M se e solo se risulta
#S #F(S) S W,
ove #S è la cardinalità di S.
Prima di dimostrare il teorema, vediamo come esso si applica al problema
del matrimonio. Vi è un certo insieme W ,= di donne ed un certo insieme
M ,= di uomini; lobiettivo è far sposare pi` u donne possibile. Però il matri-
monio deve aver luogo fra individui compatibili, o amici (mutuamente
attraenti). La multifunzione F è l amicizia: ad ogni donna w W viene
associato linsieme F(w) M dei suoi amici di sesso maschile, tra i quali ella
dovrà scegliersi lo sposo. La condizione #S #F(S) dice che un arbitrario
insieme di donne non è pi` u grosso dellinsieme di tutti gli amici di esse; in
particolare è escluso il caso in cui due donne debbono per forza litigarsi lo
stesso uomo. La selezione m : W M è il matrimonio: m(w) è il marito
scelto da w nella cerchia dei suoi amici; m deve essere iniettiva per garantire
la monogamia dei maschi. Il teorema 7.5.2 dice allora che tutte le donne
possono sposarsi.
Dimostrazione
`
E chiaro che la condizione #S #F(S) per ogni S W è
245
necessaria per lesistenza di una selezione iniettiva: infatti se questa esiste si
ha
#S = #m(S) #F(S) S W.
Proviamo che la condizione è anche suciente. Ragioneremo per induzione
sulla cardinalità di W.
Se #W = 1, cè un unico elemento w W, al quale possiamo associare un
qualsiasi elemento F(w) (per ipotesi, #F(w) 1); posto m(w) = ,
abbiamo nito.
Fissato n > 1, supponiamo di sapere che se #W < n ogni multifunzione
G : W T(M) abbia una selezione iniettiva m : W M; consideriamo il
caso #W = n e la multifunzione F. Vi sono due sottocasi:
(I) #S < #F(S) per ogni S W non vuoto;
(II) esiste S
W, non vuoto, tale che #S
= #F(S
).
Nel caso (I), scegliamo w W e F(w), e deniamo m(w) = . Resta
da denire m sullinsieme W w, che è non vuoto e per il quale quindi si
ha, per ipotesi,
n 1 = #W w < #F(W w).
Consideriamo la multifunzione F
1
: W w T(M ), denita da
F
1
(w) = F(w) w W w.
Dalla denizione di F
1
segue che
F
1
(S) = F(S) S W w,
ed in particolare
#F
1
(S) #F(S) 1 #S S W w.
Dunque, per ipotesi induttiva, la multifunzione F
1
ha una selezione iniettiva
m
1
: W w M , e si ha m
1
(w) F
1
(w) F(w) per ogni w
W w. La funzione
m(w) =
_
se w = w
m
1
(w) se w ,= w
246
è la selezione di F cercata.
Nel caso (II), essendo #S
< #W, per ipotesi induttiva esiste una selezione

iniettiva m
: S
F(S
). Resta da denire la selezione su W S
. A questo
scopo consideriamo la multifunzione F
1
: W S
T(M F(S
)) denita da
F
1
(w) = F(w) F(S
) w W S
.
A priori F
1
(w) potrebbe essere vuoto per qualche w; dimostreremo che si ha,
al contrario,
#S #F
1
(S) S W S
(cosicche, in particolare, 1 #F
1
(w) per ogni w W S
). Infatti, se per
assurdo esistesse T W S
tale che #T > #F

1
(T), allora dallinclusione
F(S
T) F(S
) (F(T) F(S
))
dedurremmo
#F(S
T) #F(S
) + #(F(T) F(S
)) =
= #S
+ #F
1
(T) < #S
+ #T = #(S
T),
il che contraddirebbe lipotesi #S #F(S) per ogni S W.
Pertanto possiamo applicare lipotesi induttiva alla multifunzione F
1
: si ot-
tiene che F
1
ha una selezione iniettiva m
1
: W S
M F(S
), e si ha
m
1
(w) F
1
(w) F(w) per ogni w W S
. Posto
m(w) =
_
m
(w) se w S
m
1
(w) se w W S
,
m è la selezione di F cercata. Dunque vale la tesi del teorema quando
#W = n, e ciò conclude la dimostrazione.
Passiamo ora al caso degli spazi misurati (in una situazione particolarmente
semplice).
Teorema 7.5.3 (di Kuratowski e Ryll-Nardzewski) Sia [a, b] R, sia
X uno spazio di Banach separabile e sia F : [a, b] T(X) una multifunzione
tale che:
(i) F(t) è non vuoto e chiuso in X per ogni t [a, b];
(ii) F
1
(A) è misurabile secondo Lebesgue per ogni aperto A X.
247
Allora F ha una selezione f : [a, b] X fortemente misurabile.
Dimostrazione Sia D = c
j
jN
X un sottoinsieme numerabile e denso:
allora a maggior ragione, D è denso in X anche rispetto alla distanza
d
X
(x, y) =
|x y|
1 +|x y|
x, y X.
In questa dimostrazione lavoreremo con la distanza d
X
in luogo della norma
di X: notiamo che d
X
(x, y) < 1 per ogni x, y X. Inoltre, deniamo
B(x, r) = y X : d
X
(x, y) < r x X, r > 0,
d
X
(x, A) = inf
yA
d
X
(x, y) x X, A X.
Utilizzando la successione c
j
, dimostriamo il seguente
Lemma 7.5.4 Nelle ipotesi del teorema, esiste una successione
n
nN
di
funzioni da [a, b] in X con le seguenti proprietà:
(a)
n
è fortemente misurabile;
(b) d
X
(
n
(t), F(t)) < 2
n
per ogni t [a, b];
(c) d
X
(
n
(t),
n1
(t)) < 2
1n
per ogni t [a, b].
Dimostrazione Fissiamo c
j
0
D: ovviamente si ha d
X
(c
j
0
, F(t)) < 1 per
ogni t [a, b], cosicche, posto
0
(t) = c
j
0
, è evidente che
0
verica (a) e
(b).
Fissato p N
+
, supponiamo che siano già state costruite
0
,
1
, . . . ,
p1
vericanti (a) e (b); andiamo a denire una funzione
p
con le stesse pro-
prietà.
Poniamo
A
j,p
= F
1
(B(c
j
, 2
p
))
1
p1
(B(c
j
, 2
1p
)) j N,
E
0,p
= A
0,p
, E
j,p
= A
j,p
j1
_
k=0
E
k,p
j N
+
,
ed osserviamo che, ovviamente, gli E
j,p
sono tutti disgiunti; proviamo, preli-
minarmente, che risulta
j=0
E
j,p
= [a, b].
248
Sia t [a, b]; poiche d
X
(
p1
(t), F(t)) < 2
1p
, esisterà un punto
p,t
F(t)
tale che d
X
(
p1
(t),
p,t
) < 2
1p
. Adesso scegliamo un numero tale che
0 < <
1
2 +|
p1
(t)
p,t
|
X
,
il che equivale, come è facile vericare, alla condizione
|
p1
(t)
p,t
|
X
1 +|
p1
(t)
p,t
|
X
<
1
2
|
p1
(t)
p,t
|
X
1 +|
p1
(t)
p,t
|
X
.
Posto
p,t
=
p1
(t) + (1 )
p,t
, si ha allora
d
X
(
p,t
,
p,t
) <
1
2
d
X
(
p1
(t),
p,t
) < 2
p
.
Per densità, esisterà c
jp
D tale che
d
X
(c
jp
,
p,t
) < 2
p
d
X
(
p,t
,
p,t
).
Da questa relazione segue
d
X
(c
jp
, F(t)) d
X
(c
jp
,
p,t
) d
X
(c
jp
,
p,t
) +d
X
(
p,t
,
p,t
) < 2
p
,
e anche
d
X
(
p1
(t), c
jp
) d
X
(
p1
(t),
p,t
) +d
X
(
p,t
, c
jp
) <
< d
X
(
p1
(t),
p,t
) + 2
p
d
X
(
p,t
,
p,t
)
2
p
+d
X
(
p1
(t),
p,t
) < 2
p
+ 2
p
= 2
1p
.
Pertanto, dalla denizione degli A
j,p
segue che t A
jp,p
. Di conseguenza, o
t E
jp,p
oppure t E
i,p
per qualche i < j
p
; in ogni caso sarà t
j=0
E
j,p
,
come si voleva.
Deniamo allora la funzione
p
: [a, b] X nel modo seguente:
p
(t) = c
j
t E
j,p
, j N.
Ora osserviamo che ciascun E
j,p
è misurabile secondo Lebesgue: infatti sono
misurabili gli A
j,p
, a causa dellipotesi (ii) e della forte misurabilità di
p1
.
Dunque, essendo
p
(t) = lim
n
n
j=0
c
j
E
j,p
(t) t [a, b],
249
la funzione
p
è limite puntuale di funzioni semplici e pertanto è fortemente
misurabile, ossia verica (a). Proviamo che
p
verica anche (b). Sia t
[a, b]; esiste j tale che t E
j,p
A
j,p
. Ciò signica tre cose:
p
(t) = c
j
, d
X
(
p1
(t), c
j
) < 2
1p
, x F(t) : d
X
(x, c
j
) < 2
p
.
Da questi fatti segue
d
X
(
p
(t), F(t)) d
X
(c
j
, x) < 2
p
, d
X
(
p
(t),
p1
(t)) < 2
1p
,
e dunque, qualsiasi sia t [a, b], è soddisfatta non solo la proprietà (b) (il
che conclude il passo induttivo) ma anche la (c). Dunque la successione
n
verica (a) e (b), per induzione, e anche (c), per costruzione. Il lemma 7.5.4
è dimostrato.
Il teorema di Kuratowski e Ryll-Nardzewski si dimostra ora facilmente. La
proprietà (c) del lemma 7.5.4 mostra che
n
converge puntualmente in
X a una funzione f che, dunque, è fortemente misurabile (esercizio 3.1.4).
Inoltre, dalla (b) del lemma segue d
X
(f(t), F(t)) = 0, ed essendo F(t) chiuso
si conclude che f(t) F(t). Ciò prova il teorema 7.5.3.
Inne esaminiamo il caso degli spazi topologici.
Teorema 7.5.5 (di Michael) Sia X uno spazio topologico paracompatto,
sia Y uno spazio di Banach e sia F : X T(Y ) una multifunzione semi-
continua inferiormente e tale che F(x) sia non vuoto, chiuso e convesso per
ogni x X. Allora F ha una selezione continua f : X Y .
Si noti che se F è semicontinua superiormente anziche inferiormente il teo-
rema non è vero: ad esempio la multifunzione F : R T(R) denita
da
F(x) =
_
_
_
0 se x > 0
[0, 1] se x = 0
1 se x < 0
è semicontinua superiormente, non è semicontinua inferiormente in x = 0
e, pur vericando gli insiemi F(x) le ipotesi richieste, F è priva di selezioni
continue.
Dimostrazione Tutto si basa sul seguente lemma di approssimazione:
250
Lemma 7.5.6 Sia W uno spazio topologico paracompatto, sia M uno spazio
di Banach e sia G : W T(M) una multifunzione semicontinua inferior-
mente, tale che G(w) sia non vuoto e convesso per ogni w W. Allora per
ogni > 0 esiste una funzione continua g : W M che verica
d(g(w), G(w)) < w W.
Dimostrazione Fissiamo unarbitraria selezione m : W M della multi-
funzione G (costruibile, ad esempio, con lassioma della scelta). Poiche G è
semicontinua inferiormente, ssati w W ed > 0 esiste un intorno aperto
U(w) di w in W tale che
G(x) B(m(w), ) ,= x U(w).
Poiche W è paracompatto, il ricoprimento U(w)
wW
ha un ranamento
V
i
iI
localmente nito: ciò signica che per ogni i I esiste w
i
W
tale che V
i
U(w
i
), ed inoltre ogni w W ha un intorno che interseca un
numero nito di intorni V
i
. Sia f
i
iI
una partizione dellunità associata al
ricoprimento V
i
: poniamo allora
g(x) =
i
f
i
(x)m(w
i
) x W;
la somma è nita per ogni ssato x W, quindi g è ben denita ed è continua
perche tali sono le f
i
. Inoltre se f
i
(x) > 0 si ha x V
i
U(w
i
) e dunque,
per denizione di U(w
i
),
d(m(w
i
), G(x)) < .
Ne segue che g(x) è una combinazione convessa di elementi di G(x)+B(0, 1);
poiche per ipotesi G(x) è convesso, anche tale insieme è convesso e pertanto
g(x) G(x) +B(0, 1). Ciò prova il lemma.
Proviamo il teorema di Michael. Utilizzando il lemma 7.5.6, per ogni n N
andiamo a costruire una funzione continua g
n
: X Y con le seguenti
proprietà:
d(g
n
(x), F(x)) < 2
n
x X,
|g
n
(x) g
n1
(x)|
X
< 2
2n
x X.
La costruzione ricalca quella usata nella dimostrazione del lemma 7.5.4. Se
n = 0, basta applicare il lemma 7.5.6 con M = X, W = Y , = 1 e G = F,
251
e poi prendere g
0
= g. Se sono state costruite g
0
, g
1
, . . . , g
n1
, consideriamo
la multifunzione G
n
: X T(Y ) denita da
G
n
(x) = F(x) B(g
n1
(x), 2
1n
);
per ipotesi induttiva, G
n
(x) è non vuoto e convesso per ogni x X.
Proviamo che G
n
è semicontinua inferiormente: ssato x X, sia y G
n
(x)
e sia N un intorno di y in Y . Osservato che y B(g
n1
(x), 2
1n
), sia > 0
tale che B(y, ) N B(g
n1
(x), 2
1n
), cosicche |y g
n1
(x)|
Y
< 2
1n
;
allora, essendo F semicontinua inferiormente, esiste un intorno U
1
di x in
X tale che F(v) B(y,

2
) ,= per ogni v U
1
. Daltra parte, essendo
g
n1
continua, esiste un altro intorno U
2
di x in X tale che g
n1
(U
2
)
B(g
n1
(x),

2
). Di conseguenza, posto U = U
1
U
2
, se v U linsieme
F(v) B(y,

2
) contiene almeno un elemento z, e si ha
|z g
n1
(v)|
Y

|z y|
Y
+|y g
n1
(x)|
Y
+|g
n1
(x) g
n1
(v)|
Y
<
<

2
+ 2
1n
+

2
= 2
1n
,
cosicche z G
n
(v) B(y,

2
) G
n
(v) N. Ciò prova che G
n
(v) N ,= per
ogni v U, e dunque G
n
è semicontinua inferiormente.
Possiamo perciò applicare il lemma 7.5.6 con W = X, M = Y , G = G
n
e
= 2
n
, trovando una funzione continua g
n
: X Y tale che
d(g
n
(x), G
n
(x)) < 2
n
x X;
ne segue che, per costruzione, g
n
soddisfa alle due condizioni richieste, le
quali per induzione sono vere per ogni n.
La successione g
n
cos` costruita è di Cauchy rispetto alla convergenza uni-
forme: poiche Y è uno spazio di Banach, essa converge ad una funzione
continua f : X Y ; questa funzione è una selezione di F in quanto per ogni
x X si ha d(f(x), F(x)) = 0 e F(x) è chiuso.
Nel caso speciale in cui Y è uno spazio di Hilbert e la multifunzione F è
continua, il teorema 7.5.5 si può migliorare e precisare.
Teorema 7.5.7 Sia X uno spazio topologico, sia Y uno spazio di Hilbert e
sia F : X T(Y ) una multifunzione continua e tale che F(x) sia non vuoto,
252
convesso e chiuso per ogni x X. Allora la proiezione di 0 sul convesso F(x),
ossia la funzione
f : X Y, f(x) = P
F(x)
(0) x X,
è una selezione continua di F. Essa viene chiamata selezione minimale di
F.
Dimostrazione Poiche F è continua, F è sia semicontinua superiormente
che inferiormente; in particolare, ssati > 0 e x
0
X, esiste un intorno U
di x
0
in X con le seguenti proprietà:
F(x) F(x
0
) +B(0, 1) x U,
F(x) B(f(x
0
), ) ,= x U,
ove f(x) = P
F(x)
(0).
Sia dunque x U: per ogni y F(x), scelto y
0
F(x
0
) tale che |y y
0
|
Y
<
, dalla minimalità di |f(x
0
)|
Y
si deduce
|y|
Y
|y
0
|
Y
|f(x
0
)|
Y
,
e dunque, ancora per minimalità,
|f(x)|
Y
|f(x
0
)|
Y
x U;
dalla seconda relazione si ricava invece, scelto y F(x) B(f(x
0
), ),
|f(x)|
Y
|y|
Y
|f(x
0
)|
Y
+ x U.
Ci` o prova che per ogni x U il vettore f(x) appartiene alla corona S
di
centro 0 e raggi |f(x
0
)|
Y
; ne segue
f(x) S
[F(x
0
) +B(0, 1)] x U.
Daltra parte, per ogni y S
[F(x
0
) +B(0, 1)] F(x), con x U, risulta,
posto y = y
0
+z ove y
0
F(x
0
) e z B(0, 1):
|f(x
0
) y|
2
Y
= |f(x
0
)|
2
Y
+|y|
2
Y
2(f(x
0
), y)
Y

|f(x
0
)|
2
Y
+ (|f(x
0
)|
Y
+)
2
2(f(x
0
), y
0
+z)
Y
=
= 2|f(x
0
)|
2
Y
+[2|f(x
0
)|
Y
2(f(x
0
), z)
Y
+] 2(f(x
0
), y
0
)
Y

2(f(x
0
), f(x
0
) y
0
)
Y
+ 4|f(x
0
)|
Y
+
2
.
253
Dalla disequazione variazionale di cui, per denizione, f(x
0
) è soluzione,
concludiamo che si ha
|f(x
0
) y|
2
Y
4|f(x
0
)|
Y
+
2
,
ed in particolare, scelto y = f(x) con x U, si ottiene
|f(x
0
) f(x)|
Y
< c x U.
Ci` o prova che x f(x) è continua; ovviamente, poi, f(x) = P
F(x)
(0) F(x),
e quindi f è una selezione di F.
Esercizi 7.5
1. Sia X uno spazio topologico paracompatto, sia Y uno spazio di Banach
e sia F : X T(Y ) una multifunzione semicontinua inferiormente, tale
che F(x) sia non vuoto, chiuso e convesso per ogni x X. Si provi che
per ogni x
0
X e per ogni y
0
F(x
0
) esiste una selezione continua
f
0
: X Y di F, tale che f
0
(x
0
) = y
0
.
2. Nelle ipotesi dellesercizio precedente, sia : X T(Y ) unaltra mul-
tifunzione tale che F(x)(x) ,= per ogni x X; supponiamo inoltre
che il suo graco G() sia aperto in XY . Si provi che per ogni x
0
X
e per ogni y
0
F(x
0
) (x
0
) esistono un intorno U di x
0
in X ed una
funzione continua f : U Y , tali che f(x
0
) = y
0
e f(x) F(x) (x)
per ogni x U.
3. Nelle ipotesi dellesercizio precedente, si supponga inoltre che F(x)
(x) sia convesso per ogni x X. Si costruisca una selezione continua
di F .
[Traccia: utilizzando lesercizio 7.5.2, per ogni x X e z F(x) si
trovino un intorno U
x
di x in X ed una funzione continua f
x
: U
x
Y
tali che f
x
(x) = z e f
x
(v) F(v) (v) per ogni v U
x
; si costruisca
un ranamento localmente nito V
i
U
x
i
di U
x
xX
, si ssi
una partizione dellunità g
i
ad esso associata e si provi che f(v) =
i
g
i
(v)f
x
i
(v) è la selezione cercata.]
4. Sia B la palla unitaria chiusa di R
2
. Per ogni x B 0 siano
x
,
x
deniti dalla relazione x = (
x
cos
x
,
x
sin
x
) e si denisca la
254
multifunzione F : B T(B) nel modo seguente:
F(x) =
_
B se x = 0,
(cos , sin ) : [
x
[ (1
x
)] se x ,= 0.
Provare che:
(i) F : B T(B) è continua;
(ii) F(x) è compatto per ogni x B;
(iii) F non ha alcuna selezione continua.
[Traccia: per (iii), ragionare per assurdo, utilizzando il teorema di
Brouwer ed il fatto che F(x) = x per ogni x B.]
7.6 Inclusioni dierenziali
Consideriamo una multifunzione F denita su un aperto U R
N+1
, a valori
in T(R
N
). Vogliamo determinare una funzione x : R R
N
, con derivata
continua, che sia soluzione dellinclusione dierenziale
_
x
(t) F(t, x(t)), t R,

x(t
0
) = x
0
,
ove (t
0
, x
0
) è un ssato punto di U. Il senso della questione è il seguente:
la multifunzione F associa agli stati x(t) di un sistema linsieme delle sue
possibili velocità. Si modellano in questo modo, attraverso le inclusioni dif-
ferenziali, quei sistemi dinamici nei quali la complessità o la grandezza è tale
da non consentire una completa descrizione dei fenomeni e delle interazio-
ni presenti, generando dunque un certo grado di indeterminazione. Svariati
esempi di sistemi di questo tipo compaiono in biologia, in economia e nelle
scienze sociali.
Una semplice applicazione del teorema di Michael (teorema 7.5.5) porta al
seguente risultato:
Teorema 7.6.1 Sia U R
N+1
un aperto, sia F : U T(R
N
) una multi-
funzione semicontinua inferiormente, tale che F(t, x) sia non vuoto, chiuso
e convesso per ogni (t, x) U. Fissato (t
0
, x
0
) U, valgono i seguenti fatti:
255
(i) esiste una funzione x di classe C
1
, denita in un intorno J di t
0
, a valori
in R
N
, tale che
_
x
(t) F(t, x(t)), t J,

x(t
0
) = x
0
;
(ii) esistono un intervallo aperto I =]a, b[ contenente t
0
ed una funzione x
C
1
(I) che risolve linclusione dierenziale sopra scritta nellintervallo
I e che è massimale: ciò signica che si ha a = oppure a R e
(t, x(t)) U quando t a
+
; un enunciato analogo vale per lestremo
b.
Dimostrazione Per il teorema 7.5.5, esiste una selezione continua f di F.
Allora si può considerare il problema di Cauchy
_
x
(t) = f(t, x(t)), t J,

x(t
0
) = x
0
;
questo problema di Cauchy ha soluzione in virt` u del teorema di esistenza
di Peano, valido quando f è continua nella coppia (t, x). Ogni soluzione di
questo problema è una soluzione dellinclusione dierenziale, e verica la (ii)
se opportunamente prolungata.
Esercizi 7.6
1. Sia F : R
2
T(R) denita da F(t, x) = 1, 1. Determinare le
soluzioni dellinclusione dierenziale
x
(t) F(t, x(t)), x(0) = 0.

2. Sia F : R
2
T(R) denita da F(t, x) = [[t[, [t[]. Determinare le
soluzioni dellinclusione dierenziale
x
(t) F(t, x(t)), x(0) = 0.

7.7 Multifunzioni monotone
La nozione di monotonia, per le multifunzioni cos` come per gli operatori, è
molto utile nelle applicazioni: è una proprietà che in un certo senso sostituisce
256
la continuità o la semicontinuità.
Cominciamo col denire la monotonia per insiemi. In questo paragrafo e nei
successivi faremo uso della notazione , u)
X
, già usata nel paragrafo 3.1,
in luogo di quella usuale (u) per indicare lazione del funzionale X
sullelemento u X.
Denizione 7.7.1 Sia X uno spazio di Banach. Se X è reale, un insieme
S X X
si dice monotono se si ha
, u v)
X
0 (u, ), (v, ) S.
Se X è complesso, linsieme S è monotono se
Re , u v)
X
0 (u, ), (v, ) S.
Un insieme S X X
si dice massimale monotono se è monotono e se

non esiste alcun insieme monotono S
X X
tale che S S
.
Ad esempio, se X = R (cosicche X
= R) un insieme S R
2
è monotono se
(y y
) (xx
) 0 per ogni (x, y), (x
, y
) S, ovvero se vale limplicazione

(x, y), (x
, y
) S, x x
= y y
.
In particolare, in R
2
il segmento di estremi (0, 0) e (1, 1) è un insieme mono-
tono ma non massimale monotono; lo stesso segmento, unito alle semirette
verticali 0] , 0] e 1 [1, [, è un insieme massimale monotono,
mentre il segmento di estremi (0, 1) e (1, 0) non è un insieme monotono.
Passiamo ora a denire la monotonia per multifunzioni.
Denizione 7.7.2 Sia X uno spazio di Banach e sia A : X T(X
)
una multifunzione. Diciamo che A è monotona se il suo graco G(A) è un
sottoinsieme monotono di X X
. Diciamo che A è massimale monotona

se G(A) è massimale monotono in X X
.
Osservazione 7.7.3
`
E facile vericare che se X è uno spazio di Banach una
multifunzione A : X T(X
) è massimale monotona se e solo se è monotona

e
(u, ) X X
, Re , u v)
X
0 (v, ) G(A) =
= (u, ) G(A).
257
`
E chiaro che la denizione di monotonia per multifunzioni si riduce a quella
usuale (vedere la proposizione 5.2.5) nel caso in cui la multifunzione sia ad
un sol valore, cioè sia una funzione. In particolare, un operatore monotono
A : D(A) X X
è massimale monotono se e solo se

(u, ) X X
, Re A(v), u v)
X
0 v D(A) =
= u D(A) e A(u) = .
Ad esempio, se X = X
= R ogni funzione crescente f : R R è monotona,

e se è anche continua allora è massimale monotona (esercizio 7.7.2). Se invece
la funzione crescente f ha un salto nel (solo) punto x
0
R, risulta massimale
monotona la multifunzione F : R T(R
2
) denita da
F(x) =
_
f(x) se x ,= x
0
,
[f(x
0
), f(x
+
0
)] se x = x
0
.
Vediamo alcune proprietà delle multifunzioni massimali monotone, la cui
fondamentale importanza applicativa sarà chiara nel seguito.
Proposizione 7.7.4 Sia X uno spazio di Banach e sia A : X T(X
)
una multifunzione. Detta J : X X
limmersione canonica, si ha che A è

monotona, oppure massimale monotona, se e solo se J A
1
: X
T(X
)
è monotona, oppure massimale monotona.
Dimostrazione Per denizione di graco e di multifunzione inversa si ha
G(J A
1
) = (, ) : (J A
1
)() = (, J
x
) : x A
1
() =
= (, J
x
) : (, x) G(A
1
) = (, J
x
) : (x, ) G(A);
è facile allora riconoscere che G(A) è monotono in X X
se e solo se lo è
G(J A
1
) in X
.
Sia poi G(J A
1
) massimale monotono e sia, per assurdo, S un insieme
monotono tale che G(A) S X X
; allora è immediato vericare che

linsieme
S
= (, J
x
) : (x, ) S
è un insieme monotono tale che G(J A
1
) S
. Il viceversa è
analogo.
Proposizione 7.7.5 Sia X uno spazio di Banach e sia A : X T(X
) una
multifunzione massimale monotona. Allora per ogni u X linsieme A(u) è
convesso e chiuso per la topologia debole* di X
.
258
Dimostrazione Supporremo X reale, ma quando X è complesso il calcolo
è del tutto analogo. Sia u X e siano , A(u). Se t ]0, 1[, poniamo
t
= (1 t) +t e mostriamo che
t
A(u). Per ogni (v, ) G(A) si ha
t
, u v)
X
= (1 t) , u v)
X
+t , u v)
X
0,
dunque (u,
t
) G(A) per losservazione 7.7.3; pertanto
t
A(u) e A(u) è
convesso.
Proviamo che A(u) è debolmente* chiuso in X
. Sia / A(u): per denizio-

ne si ha (u, ) / G(A), e per losservazione 7.7.3 deve esistere (v, ) G(A)
tale che
= , u v)
X
< 0.
Poniamo
U = X
: [ , u v)
X
[ < .
Linsieme U è aperto nella topologia debole* di X
, e se U si ha
, u v)
X
= , u v) + , u v)
X
< = 0.
Dunque (u, ) / G(A) per ogni U, ossia risulta U A(u) = . Ciò prova
che A(u)
c
è w
-aperto, il che signica che A(u) è debolmente* chiuso.

Consideriamo ora multifunzioni ad un sol valore: questo corrisponde ad ope-
ratori A : D(A) X X
, ove il dominio di A è linsieme degli u X per

i quali la multifunzione corrispondente ad A assume valore A(u) ,= .
Proposizione 7.7.6 Sia X uno spazio di Banach riessivo e sia A : D(A)
X X
un operatore monotono ed emicontinuo, ossia continuo sui sotto-

spazi mono-dimensionali rispetto alla topologia debole* di X
. Se D(A) = X,
allora A è massimale monotono.
Lipotesi di emicontinuità signica che per ogni u, v, w X la funzione reale
t A(u +tv)w è continua.
Dimostrazione Sia (u, ) X X
tale che
Re A(v), u v)
X
0 v X.
In virt` u dellosservazione 7.7.3, basterà provare che A(u) = . Scegliamo
v = u tw, con t > 0 e w X: si ha
Re A(u tw), tw)
X
0 w X, t > 0,
259
e dividendo per t
Re A(u tw), w)
X
0 w X;
per t 0
+
si deduce, grazie allemicontinuità di A, che
Re A(u), w)
X
0 w X,
e scrivendo w in luogo di w si conclude che
Re A(u), w)
X
= 0 w X.
In modo analogo, scegliendo v = u itw, si dimostra che
Im A(u), w)
X
= 0 w X.
Ne segue che = A(u).
Teorema 7.7.7 (di Minty) Sia X uno spazio di Hilbert e sia A : D(A)
X X un operatore monotono. Allora A è massimale monotono se e solo
se loperatore I +A è surgettivo, ove I : X X è lidentità.
Questo risultato spiega limportanza della proprietà di massimale monotonia:
essa garantisce la surgettività delloperatore I +A e quindi la risolubilità di
equazioni della forma u+A(u) = g, con A massimale monotono e g assegna-
ta. Vedremo nel seguito che molti operatori che compaiono nelle applicazioni
sono in eetti massimali monotoni.
Dimostrazione (=) Proveremo questa implicazione pi` u avanti, come co-
rollario di un pi` u generale teorema di Browder (corollario 7.9.7).
(=) Sia R(I +A) = X. Vale il seguente
Lemma 7.7.8 Nelle ipotesi del teorema 7.7.7, sia I + A surgettivo; allora
per ogni > 0 loperatore I + A è bigettivo e linverso (I + A)
1
è un
operatore non espansivo, ossia lipschitziano con costante uguale a 1.
Dimostrazione Se u, v D(A) si ha, grazie alla monotonia di A,
|(I +A)(u) (I +A)(v)|
2
X
=
= |u v|
2
X
+
2
|A(u) A(v)|
2
X
+ 2Re (A(u) A(v), u v)
X

|u v|
2
X
;
260
quindi I + A è iniettivo per ogni > 0. In particolare, I + A è bigettivo e
(I +A)
1
è non espansivo. Sia ora >
1
2
: ssato w X, risolvere rispetto a
u lequazione u + A(u) = w equivale a trovare u D(A) tale che A(u) =
w u, ossia u +A(u) = u +
1
(w u), ed inne (I +A)(u) = u +

1
(w u).
Quindi si cerca u D(A) tale che
u = (I +A)
1
_
u +
1
(w u)
_
= L
w
(u).
Dobbiamo dunque trovare un punto sso u D(A) per loperatore L
w
, ove
w X è ssato. Dato che (I +A)
1
è non espansivo, risulta per u, v X
|L
w
(u) L
w
(v)|
X
=
=
_
_
_
_
(I +A)
1
_
u +
1
(w u)
_
(I +A)
1
_
v +
1
(w v)
__
_
_
_
X
_
_
_
_
_
u +
1
(w u)
_
_
v +
1
(w v)
__
_
_
_
X
=
=
1
1
|u v|
X
;
poiche [1
1
[ < 1, loperatore L
w
è una contrazione nello spazio di Hilbert
X, con valori in D(A). Per il teorema delle contrazioni esiste un unico punto
sso u D(A). Pertanto, per ogni w X vi è un unico u D(A) tale che
u +A(u) = w, ossia loperatore I +A è bigettivo per ogni >
1
2
.
Se ripetiamo questa argomentazione con I +A al posto di I +A, ove >
1
2
,
otteniamo la bigettività di I + A per ogni >

2
, e quindi per ogni >
1
4
.
Iterando questo procedimento, si ha la tesi del lemma per ogni > 2
n
, con
n arbitrario, e dunque il lemma è provato.
Torniamo alla dimostrazione del teorema di Minty. Sia (u, w) X X tale
che
Re (w A(v), u v)
X
0 v D(A);
poniamo v
t
= (I +A)
1
(u +w +tz), ove t > 0 e z X. Poiche
Re (w A(v
t
), u v
t
)
X
0, Re (u v
t
, u v
t
)
X
= |u v
t
|
2
X
0,
sommando si ha
Re (tz, u v
t
)
X
= Re (w +u A(v
t
) v
t
, u v
t
)
X
0,
261
da cui, dividendo per t,
Re (z, u (I +A)
1
(u +w +tz))
X
= (z, u v
t
)
X
0,
e per t 0
+
Re (z, u (I +A)
1
(u +w))
X
0 z X.
Similmente, ponendo stavolta v
t
= (I +A)
1
(u +w +itz), si ottiene
Im(z, u (I +A)
1
(u +w))
X
0 z X.
Per larbitrarietà di z, ciò implica u = (I +A)
1
(u +w), ovvero u +A(u) =
u+w, e dunque A(u) = w. Per losservazione 7.7.3 si conclude che loperatore
A è massimale monotono.
Esercizi 7.7
1. Sia X uno spazio di Banach e sia A : X T(X
) una multifunzione
monotona. Provare che A
1
e A (con > 0) sono monotone; provare
anche che sono monotone la chiusura di A, denita da
A(x) = chiusura debole di A(x) in X
e linviluppo convesso chiuso di A, cioè

co(A)(x) = co(A(x)).
2. Provare che ogni funzione f : R R continua e crescente è unappli-
cazione massimale monotona.
3. Sia F : R R crescente. Si provi che la multifunzione f, denita da
f(x) = [f(x
), f(x
+
)] per ogni x R, è massimale monotona. Si provi
anche che ogni multifunzione massimale monotona g : R T(R) è di
questo tipo.
4. Sia X uno spazio di Hilbert. Se J : X X è una contrazione, si
verichi che I +J è monotona, ove I è lidentità su X.
262
5. Sia X uno spazio di Hilbert e sia A : X X un operatore monotono.
Se / : L
2
(a, b; X) L
2
(a, b; X) è denito da
[/(u)]() = A(u()) u L
2
(a, b; X),
si provi che / è monotono.
6. Sia X uno spazio di Banach riessivo, e sia A : X T(X
) una multi-
funzione monotona ed emicontinua, ossia tale che per ogni u, v X la
multifunzione t A(tu+(1 t)v), da [0, 1] in T(X
) sia semicontinua
superiormente rispetto alla topologia debole di X. Supponiamo anche
che A(u) sia convesso e debolmente chiuso in X
per ogni u X. Si
provi che se (u, ) D(A) X
e se
Re , u v)
X
0 (v, ) D(A),
allora (u, ) G(A).
[Traccia: supponendo / A(u), si faccia uso del teorema di Hahn-
Banach (teorema 1.7.1).]
7. Sia X uno spazio di Banach riessivo, e sia A : X T(X
) una
multifunzione monotona, emicontinua e tale che A(u) sia non vuoto,
convesso e chiuso in X
per ogni u X. Si provi che A è massimale

monotono.
[Traccia: utilizzare lesercizio precedente.]
7.8 Alcune multifunzioni massimali monoto-
ne
Raggruppiamo in questo paragrafo alcuni esempi signicativi di multifunzioni
o di operatori massimali monotoni.
Esempio 7.8.1 (applicazioni di dualità) Sia X uno spazio di Banach:
consideriamo lapplicazione di dualità introdotta nellesempio 7.1.6 (2), che
è denita per ogni x X da
F(x) = X
: , x)
X
= |x|
2
X
= ||
2
X
.
Le proprietà elementari di questa multifunzione sono raggruppate nel seguen-
te
263
Lemma 7.8.2 Sia X uno spazio di Banach (reale o complesso). Lapplica-
zione di dualità F sopra denita verica:
(i) F(x) è un convesso chiuso non vuoto di X
per ogni x X;
(ii) si ha F(x) = F(x) per ogni C e per ogni x X;
(iii) F è monotona;
(iv) se X è riessivo, allora
xX
F(x) = X
;
(v) se X è uno spazio di Hilbert, allora F(x) = x per ogni x X.
Dimostrazione (i) F(x) è ovviamente chiuso, ed è non vuoto in virt` u del
teorema di Hahn-Banach. Proviamo la convessità: se , F(x) e ]0, 1[,
allora
(1)+, x)
X
= (1), x)
X
+, x)
X
= (1)|x|
2
X
+|x|
2
X
= |x|
2
X
da cui
|(1 ) +|
X
|x|
X
;
daltronde
|(1 ) +|
X
(1 )||
X
+||
X
= |x|
X
,
e dunque (1 ) + F(x).
(ii) La tesi è conseguenza del fatto, di immediata verica, che F(x)
se e solo se (1/) F(x).
(iii) Dobbiamo provare che
Re , x y)
X
0 x, y X, F(x), F(y).
In eetti, poiche , x)
X
= |x|
2
X
= ||
2
X
e , y)
X
= |y|
2
X
= ||
2
X
si ha
Re , x y)
X
= Re (, x)
X
, y)
X
, x)
X
+, y)
X
)
|x|
2
X
2|x|
X
|y|
X
+|y|
2
X
= (|x|
X
|y|
X
)
2
0.
(iv) Sia X riessivo: ssato X
, per il teorema di Hahn-Banach esiste

un elemento X
, che sarà della forma = J

x
con x X, tale che
, x)
X
= J
x
, )
X
= ||
X
, |x|
X
= |J
x
|
X
= 1.
264
Ne segue che lelemento y = tx, ove t = ||
X
, verica
, y)
X
= ||
2
X
= |y|
2
X
,
cioè F(y).
(v) Sia X uno spazio di Hilbert. Se x = 0, allora per denizione F(0) = 0.
Se invece x ,= 0 e z, w F(x) X
= X, si ha
(z, x)
X
= |z|
2
X
= |x|
2
X
= |w|
2
X
= (w, x)
X
,= 0.
Quindi, essendo 2|x|
2
X
= (z+w, x)
X
|z+w|
X
|x|
X
, si deduce |z+w|
X

2|x|
X
= |z|
X
+|w|
X
, ovvero |z + w|
X
= |z|
X
+|w|
X
. Ciò implica che
esiste > 0 tale che w = z; dalla relazione (w, x)
X
= (z, x)
H
= (w, x)
H
,=
0 segue = 1 e quindi w = z. Pertanto F(x) ha un solo elemento. Dato che,
ovviamente, x F(x), si conclude che F(x) = x.
Proposizione 7.8.3 Sia X uno spazio di Banach reale o complesso. Lap-
plicazione di dualità F sopra denita è massimale monotona.
Dimostrazione Sia (x, ) X X
tale che
Re , x y)
X
0 y X, F(y),
e proviamo che F(x); dallosservazione 7.7.3 seguirà che F è massimale
monotona.
Cominciamo col provare che ||
X
|x|
X
. Sia v
n
nN
una successione
di elementi di X tale che |v
n
|
X
= 1 e , v
n
)
X
||
X
per n (ed
in particolare Im, v
n
)
X
0). Scegliamo nella disuguaglianza precedente
y = x +tv
n
, con t > 0: poiche ||
X
= |x +tv
n
|
X
e |v
n
|
X
= 1 otteniamo
tRe , v
n
)
X
= Re , x y)
X
Re , x y)
X
=
= Re , tv
n
)
X
t|x +tv
n
|
X
,
da cui, dividendo per t,
Re , v
n
)
X
|x +tv
n
|
X
t > 0.
Se t 0
+
ricaviamo Re , v
n
)
X
|x|
X
per ogni n N; inne per n
si conclude che ||
X
|x|
X
.
265
Adesso mostriamo che Re, x)
X
= |x|
2
X
e che quindi |x|
X
||
X
. Ciò
implicherà F(x) e dunque la tesi. Sappiamo che risulta
Re , x)
X
Re , x)
X
+ Re , y)
X
|y|
2
X
y X, F(y).
Scegliamo y = x, con R: allora essendo F(x) = F(x), sarà
= con F(x). Quindi , x)
X
= , x)
X
= |x|
2
X
e pertanto
Re , x)
X
|x|
2
X
+Re , x)
X

2
|x|
2
X
R.
Se ,= 1, dividendo per 1 otteniamo
Re , x)
X
|x|
2
X
< 1, Re , x)
X
|x|
2
X
> 1.
Al limite rispettivamente per 1
e per 1
+
deduciamo Re , x)
X
=
|x|
2
X
, il che è quanto si voleva.
Esempio 7.8.4 (derivata seconda) Sia A loperatore u u
, denito
sullo spazio di Hilbert X = L
2
(a, b), con dominio
D(A) = u C
1
[a, b] : u
AC[a, b], u
L
2
(a, b), u(a) = u(b) = 0
(ma funzionano altrettanto bene le condizioni u
(a) = u
(b) = 0, oppure
u(a) = u
(b) = 0, oppure u
(a) = u(b) = 0).

Verichiamo che A è monotono: se u D(A), integrando per parti (il che è
lecito, dato che u e u
sono assolutamente continue) si ha

(Au, u)
X
=
_
b
a
(u
)u dx = [u
u]
b
a
+
_
b
a
[u
[
2
dx =
_
b
a
[u
[
2
dx 0,
ed essendo A lineare, la monotonia è provata.
Verichiamo che A è massimale monotono: per il teorema di Minty, basta
provare che R(I +A) = L
2
(a, b). Ed infatti, se f L
2
(a, b) il problema
_
u
+u = f in [a, b]
u(a) = u(b) = 0
ha lunica soluzione
u(x) =
_
b
a
sinh(b s) f(s) ds
sinh(b a)
sinh(x a)
_
x
a
sinh(x s) f(s) ds.
266
Esempio 7.8.5 (derivata prima) Sia H uno spazio di Hilbert, che iden-
ticheremo, al solito, con il suo duale H
, e poniamo, per un ssato T >

0,
X = L
2
(0, T; H)
(si veda il paragrafo 3.1). Esso è uno spazio di Hilbert con il prodotto scalare
(f, g)
X
=
_
b
a
(f(t), g(t))
H
dt f, g X.
Nel lemma che segue vengono dimostrate alcune proprietà importanti per il
seguito.
Lemma 7.8.6 Sia H uno spazio di Hilbert. Fissato T > 0, sia X =
L
2
(0, T; H) e sia Y lo spazio costituito da tutte le funzioni u : [0, T] H
appartenenti a X e tali che u è derivabile q.o. in [0, T], u
X, e vale la
formula
u(t) u(s) =
_
t
s
u
() d s, t [0, T].
Allora:
(i) Y è uno spazio di Hilbert con il prodotto scalare
(u, v)
Y
= (u, v)
X
+ (u
, v
)
X
;
(ii) C
1
([0, T], H) è denso in Y ;
(iii) Y è incluso con continuità in C([0, T], H);
(iv) vale la formula di integrazione per parti
(u(t), v(t))
H
(u(s), v(s))
H
=
=
_
t
s
[(u
(r), v(r))
H
+ (v
(r), u(r))
H
] dr u, v Y.
Dimostrazione (i) Anzitutto, lo spazio Y non si riduce a 0, dato che
contiene le funzioni costanti f(t) v, con v H. Sia u
n
una successione
di Cauchy in Y : poiche X è completo, esistono u, v X tali che
u
n
u in L
2
(0, T; H), u
n
v in L
2
(0, T : H).
267
Per la continuità del prodotto scalare, per ogni C
0
(]0, T[, H) si ha
d
dt
(u
n
(t), (t))
H
= (u
n
(t), (t))
H
+ (u
n
(t),
(t))
H
q.o. in [0, T],
da cui, integrando,
_
T
0
(u
n
(t), (t))
H
dt =
_
T
0
(u
n
(t),
(t))
H
dt
e per n
_
T
0
(v(t), (t))
H
dt +
_
T
0
(u(t),
(t))
H
dt = 0 C(]0, T[, H).
Utilizzando unopportuna generalizzazione del lemma 4.2.3 (esercizio 7.8.1),
si deduce che
u
(t) = v(t) q.o. in [0, T],

e ciò prova che u Y e che u
n
u in Y ; quindi Y è completo.
(ii) Sia u Y ; estendiamo la u fuori di [0, T] in modo qualunque, ad
esempio ponendola uguale a 0 fuori di [0, T]. Sia C
0
(R) una funzione
non negativa, nulla fuori di [1, 1] e tale che
_
1
1
(t)dt = 1; poniamo per
> 0:
u
(t) =
_
R
u(t )()d =
1
_
R
u(s)
_
t s
_
ds, t [0, T].
Le funzioni u
sono in C
1
([0, T], H) con
u
(t) =
1
2
_
R
u(s)
_
t s
_
ds =
=
1
_
R
u
(s)
_
t s
_
ds =
_
R
u
(t )()d t [0, T].

268
Si ha allora
|u
u|
2
X
=
_
T
0
_
_
_
_
1
_
R
[u(s) u(t)]
_
t s
_
ds
_
_
_
_
2
H
dt
_
T
0
_
_
R
|u(s) u(t)|
H
_
1

_
t s
__1
2
+
1
2
ds
_
2
dt
_
T
0
__
R
|u(s) u(t)|
2
H
1

_
t s
_
ds
_ __
R
1

_
t s
_
ds
_
dt =
=
_
T
0
_
R
|u(t ) u(t)|
2
H
()ddt =
=
_
1
1
_
T
0
|u(t ) u(t)|
2
H
dt ()d,
e quando 0
+
risulta u
u in virt` u della continuità in L

2
delle trasla-
zioni e del teorema di Lebesgue.
In modo del tutto analogo,
|u
|
2
H

_
1
1
_
T
0
|u
(t ) u
(t)|
2
H
dt ()d 0 per 0
+
.
Ci` o prova che C
1
([0, T], H) è denso in Y .
(iii) Sia u C
1
([0, T], H) e sia t
0
[0, T] un punto di minimo per |u()|
H
,
cosicche
|u(t
0
)|
H

1
T
_
T
0
|u(s)|
H
ds.
Allora si ha per ogni t [0, T]
|u(t)|
2
H
= |u(t
0
)|
2
H
+
_
t
t
0
d
ds
|u(s)|
2
H
ds =
= |u(t
0
)|
2
H
+ 2
_
t
t
0
(u
(s), u(s))
H
ds
_
1
T
_
T
0
|u(s)|
H
ds
_
2
+ 2|u
|
X
|u|
X

1
T
|u|
2
X
+ 2|u
|
X
|u|
X
2|u|
2
Y
,
269
da cui
|u|
C([0,T],H)
2|u|
Y
u C
1
([0, T], H).
Questa stima, in virt` u della densità (già provata) di C
1
([0, T], H) in Y ,
si estende a tutte le funzioni u Y , mostrando cos` che Y è incluso in
C([0, T], H) e che tale inclusione è continua.
(iv) La formula di integrazione per parti vale quando u, v C
1
([0, T], H):
infatti
(u(t), v(t))
H
(u(s), v(s))
H
=
=
_
t
s
d
dr
(u(r), v(r))
H
dr =
_
t
s
[(u
(r), v(r))
H
+ (u(r), v
(r))
H
] dr;
dato che C
1
([0, T], H) è denso in Y , e che Y è immerso con continuità in
C([0, T], H), si ottiene che C
1
([0, T], H) è anche denso nello spazio Y munito
della norma di C([0, T], H). Quindi la formula precedente si estende per den-
sità a tutte le funzioni u, v Y . Il lemma 7.8.6 è completamente dimostrato.
Dopo tutte queste premesse, deniamo nalmente il dominio delloperatore
derivata prima
d
dx
. Abbiamo due opzioni:
D(L
1
) = u Y : u(0) = 0, L
1
u = u
u D(L
1
);
D(L
2
) = u Y : u(0) = u(T), L
2
u = u
u D(L
2
).
Proposizione 7.8.7 Sotto le ipotesi del lemma 7.8.6, per i = 1, 2 gli opera-
tori L
i
: D(L
i
) X X
sopra deniti sono massimali monotoni.

Dimostrazione Ovviamente, L
i
è lineare; inoltre se u D(L
i
) si ha
L
i
u, u)
X
=
_
T
0
(u
(t), u(t))
H
dt =
1
2
_
T
0
d
dt
|u(t)|
2
H
dt =
=
1
2
_
|u(T)|
2
H
|u(0)|
2
H
0,
e ciò prova la monotonia di L
i
, i = 1, 2.
Proviamo che L
i
è massimale monotono: in virt` u del teorema di Minty (teo-
rema 7.7.7) basterà provare che lequazione u+L
i
u = f ha soluzione per ogni
f L
2
(0, T; H). Tale equazione equivale a uno dei due problemi di Cauchy
_
u +u
= f in [0, T]
u(0) = 0
oppure
_
u +u
= f in [0, T]
u(0) = u(T)
270
Tali problemi hanno rispettivamente le soluzioni
u
1
(t) =
_
t
0
e
(ts)
f(s) ds,
u
2
(t) =
e
t
1 e
T
_
T
0
e
(Ts)
f(s) ds +
_
t
0
e
(ts)
f(s) ds,
il che prova la massimale monotonia di L
1
e L
2
.
Esempio 7.8.8 (sottodierenziale) Il sottodierenziale di una funzione
f : X R, ove X è uno spazio di Banach, è una multifunzione f : X
T(X
). Se f è convessa, a valori in ] , +], semicontinua inferiormente

e propria, tale multifunzione è massimale monotona, come vedremo. Questo
fatto è vero per qualunque spazio di Banach, ma per semplicità ci limiteremo
a considerare il caso pi` u facile in cui X è uno spazio di Hilbert.
Teorema 7.8.9 (di Rockafellar) Sia X uno spazio di Hilbert e sia f :
X ] , +] una funzione convessa, semicontinua inferiormente e pro-
pria. Allora f : X T(X
) è massimale monotono ed inoltre il suo

dominio verica D(f) = D(f).
Dimostrazione Come anticipato nellosservazione 5.2.6, f è monotono.
Proviamo adesso che R(I + f) = X per ogni > 0. Questo non implica
ancora la tesi: infatti il teorema di Minty (teorema 7.7.7) è applicabile solo
alle funzioni; tuttavia questa proprietà ci servirà nel corso della dimostrazio-
ne.
Sia y un arbitrario punto di X: ssato > 0, consideriamo la funzione
g
,y
(x) = f(x) +
1
2
|x y|
2
X
, x X,
già introdotta nel paragrafo 5.3. Per il lemma 5.3.1, essa ha un unico punto
di minimo x
0
X, e si ha
1
(y x
0
) f(x
0
); ciò signica
y (I +f)(x
0
),
Proviamo che f è massimale monotono. Siano u, w X tali che
(w x, u v)
X
0 v D(f), x f(v);
271
se proveremo che u D(f) e che w f(u), avremo dimostrato la tesi in
virt` u dellosservazione 7.7.3.
Consideriamo, per t > 0 e z X ssati, lelemento u + w + tz X: poiche
R(I +f) = X, esiste v
t
D(f) tale che
u +w +tz (I +f)(v
t
);
in altri termini possiamo scrivere
u +w +tz = v
t
+
t
,
t
f(v
t
).
Ora osserviamo che, per come sono stati scelti u, w,
(tz, u v
t
)
X
= (u v
t
+w
t
, u v
t
)
X
=
= |u v
t
|
2
X
+ (w
t
, u v
t
)
X
|u v
t
|
2
X
0,
il che implica, intanto, |u v
t
|
X
t|z|
X
e quindi v
t
u per t 0
+
.
Inoltre, applicando nuovamente la proprietà R(I+f) = X, esiste v D(f)
tale che u +w (I +f)(v), cioè
u +w v f(v).
Dimostriamo adesso il seguente facile
Lemma 7.8.10 Nelle ipotesi del teorema 7.8.9, siano w, v D(f): allora
|w v|
2
X
|w v +(x y)|
2
X
> 0, x f(w), y f(v).
Dimostrazione Basta osservare che
|wv+(xy)|
2
X
= |wv|
2
X
+
2
|xy|
2
X
+2(wv, xy)
X
|wv|
2
X
.
Scegliamo nel lemma
= 1, w = v
t
, x = u +w +tz v
t
, y = u +w v;
si ottiene
|v
t
v|
2
X
|v
t
v + (u +w +tz v
t
) (u +w v)|
2
X
= t
2
|z|
2
X
da cui v
t
v per t 0
+
. Ma allora u = v, cioè
w f(u).
Ci` o dimostra che f è massimale monotono.
Inne, la relazione D(f) = D(f) è stata dimostrata nellosservazione 5.3.4.
272
Esercizi 7.8
1. Sia H uno spazio di Hilbert e siano u L
p
(0, T; H) e v L
q
(0, T; H)
(
1
p
+
1
q
= 1). Se risulta
_
T
0
[(
(t), u(t))
H
+ (v(t), (t))
H
] dt = 0 C
0
(]0, T[, H),
si provi che u è derivabile q.o. a valori in H e che u
= v q.o. in [0, T].

2. Sia H uno spazio di Hilbert e sia K un convesso chiuso non vuoto
contenuto in H. Detta I
K
la funzione indicatrice di K, introdotta nel
capitolo 2, si provi che
(I +I
K
)
1
(v) = P
K
(v) v H,
ove P
K
è la proiezione sul convesso K.
7.9 Inclusioni funzionali
Sia X uno spazio di Banach, sia K X un convesso chiuso non vuoto e
siano A, B : K T(X
) due multifunzioni, con A massimale monotona. La

multifunzione B rappresenta una perturbazione di A. Fissato un elemento
b X
, vogliamo studiare l inclusione funzionale

_
u K
b A(u) +B(u).
ove u è lincognita. Il senso di questa scrittura è il seguente: si cerca un
elemento u K tale che il funzionale b si possa scrivere come b = v + w,
con v A(u) e w B(u). Gli esempi che seguono forniscono alcune delle
numerose motivazioni che inducono a questo studio.
Esempio 7.9.1 (equazioni integrali) Unequazione integrale della forma
u(x) +
_
k(x, y)f(y, u(y))dy = g(x), x ,

ove è un aperto di R
n
e g L
p
() è una funzione assegnata, si può mettere
nella forma astratta seguente:
u +KF(u) = g,
273
dove F(u) = f(, u()), Kv =
_
k(, y)v(y)dy. Utilizzando la multifunzione

K
1
, si può scrivere anche
F(u) K
1
(g u),
ovvero
0 K
1
(g u) F(u).
Questa è uninclusione funzionale che rientra nel nostro schema.
Esempio 7.9.2 (equazioni di evoluzione del 1
o
ordine) Si considerino
i problemi
_
u
+B(u) = f
u(0) = 0,
_
u
+B(u) = f
u(0) = u(T),
dove B è un operatore, lineare o no, di L
p
(0, T; X) in se, ed f è un ssato
elemento di L
p
(0, T; X) (X è uno spazio di Banach). Utilizzando i risultati
dellesempio 7.8.5, i due problemi si riscrivono cos`:
f = L
i
u +B(u), i = 1, 2,
e questo è un caso particolare della nostra inclusione funzionale.
Esempio 7.9.3 (problemi di minimo) Il problema di minimizzare una
funzione f : X R, ove X è uno spazio di Banach, equivale per la
proposizione 5.1.8 alla condizione
0 f(u),
che è ancora uninclusione funzionale.
Esempio 7.9.4 (disequazioni variazionali) Se X è uno spazio di Bana-
ch, B : X X
è un operatore (lineare o no) e X
, la disequazione
variazionale sul convesso chiuso K X
_
u K,
B(u) , v u)
X
0 v K
si traduce, in virt` u dellosservazione 6.3.7, nellinclusione funzionale
I
K
(u) +B(u) se K X,
= B(u) se K = X.
274
Pi` u in generale, se : X ], +] è una funzione convessa, semicontinua
inferiormente e propria, la disequazione variazionale
B(u) , v u)
X
+(v) (u) 0 v X
equivale allinclusione funzionale
(u) +B(u).
Nella teoria delle inclusioni funzionali è di fondamentale importanza il se-
guente risultato:
Teorema 7.9.5 (di Browder) Sia X uno spazio di Banach riessivo, e sia
b X
. Supponiamo che:
(i) K X sia un convesso chiuso non vuoto;
(ii) A : K T(X
) sia una multifunzione massimale monotona;

(iii) B : K X
sia unapplicazione limitata (ossia trasforma limitati

in limitati), demicontinua (ossia debolmente continua sui sottospazi
nito-dimensionali) e monotona;
(iv) nel caso che K sia illimitato, esistano u
0
D(A),
0
A(u
0
) e r > 0
tali che
B(u) +
0
, u u
0
)
X
> b, u u
0
)
X
u K con |u|
X
> r.
Allora esiste u D(A) che verica linclusione funzionale b A(u) +B(u).
Prima di dimostrare il teorema, segnaliamo i seguenti corollari di dimostra-
zione immediata.
Corollario 7.9.6 Sia X uno spazio di Banach riessivo. Supponiamo vere
le ipotesi (i), (ii) e (iii) del teorema 7.9.5; supponiamo poi che, nel caso che
K sia illimitato, esista u
0
D(A) tale che
B(u), u u
0
)
X
|u|
X
+ per u K, |u|
X
+.
Allora R(A +B) = X
.
275
Corollario 7.9.7 Sia X uno spazio di Hilbert e sia A : X T(X) una
multifunzione massimale monotona. Allora R(I +A) = X.
Si noti che in particolare il corollario 7.9.7 dimostra la seconda implicazione
del teorema 7.7.7.
Dimostrazione del teorema 7.9.5 Cominciamo con alcune osservazio-
ni preliminari. Anzitutto, come è naturale aspettarsi, si ha D(A) ,= :
altrimenti avremmo G(A) = , cosicche denendo ad esempio
A(x) =
_
0 se x = 0
se x ,= 0,
la multifunzione A sarebbe unestensione propria e monotona di A, contrad-
dicendo la massimale monotonia di A.
Osserviamo anche che possiamo supporre u
0
= 0 e
0
= 0, ossia:
(a) che 0 D(A) e 0 A(0);
(b) che se K è illimitato la proprietà (iv) sia vera per u
0
= 0 e = 0.
Infatti nessuna di queste due richieste è restrittiva: linclusione funzionale
u K, b A(u) +B(u)
equivale, posto v = u u
0
, allinclusione funzionale
v K u
0
, b A(v +u
0
)
0
+B(v +u
0
) +
0
.
Ne segue che, denendo A(v) = A(v +u
0
)
0
e B(v) = B(v +u
0
) +
0
, le
multifunzioni A e B vericano le ipotesi del teorema con K, u
0
e
0
rimpiaz-
zati rispettivamente da K u
0
, 0 X e 0 X
; inoltre 0 A(0). Quindi

valgono (a) e (b). Supporremo pertanto nel seguito che u
0
= 0 D(A) con
0
= 0 A(0) K.
La dimostrazione vera e propria è alquanto articolata e si divide in vari passi.
1
o
passo: conversione dellinclusione funzionale in una disequazione varia-
zionale equivalente.
Proviamo che per un elemento u K si ha
_
u D(A)
b A(u) +B(u)

_
u K
b B(u) , u v)
X
0 (v, ) G(A).
276
Infatti, se vale linclusione funzionale allora (u, bB(u)) G(A) e quindi, per
monotonia, si ottiene la disequazione variazionale; viceversa, dalla validità
di questultima segue che (v, b B(u)) è un elemento di X X
che verica
la condizione dellosservazione 7.7.3: dato che A è massimale monotona, si
deduce (u, b B(u)) G(A), cosicche concludiamo che u verica linclusione
funzionale.
2
o
passo: stima a priori per le soluzioni della disequazione variazionale.
Se K è limitato non cè niente da dimostrare: K sarà incluso in una palla di
centro 0 e raggio r e quindi se u risolve la disequazione variazionale risulterà
|u|
X
r.
Se K è illimitato e u K è soluzione, allora poiche (0, 0) G(A) si ha
b B(u), u)
X
0.
Daltra parte lipotesi (iv) dice che esiste r > 0 per cui
b B(u), u)
X
< 0 per u K, |u|
X
> r;
dunque deve essere |u|
X
r.
3
o
passo: risoluzione della disequazione variazionale in dimensione nita.
Sia 1 linsieme di tutti i sottospazi nito-dimensionali di X. Sia Y 1, e
consideriamo la disequazione variazionale
u
Y
K Y, b B(u
Y
) , u
Y
v)
X
0 (v, ) G(A) con v Y.
Per R > 0 e Y 1, poniamo
K
R
= v K Y : |v|
X
R, G
R
= (v, ) G(A) : v K
R
,
e studiamo la disequazione variazionale in K
R
:
u
R
K
R
, b B(u
R
) , u
R
v)
X
0 (v, ) G
R
.
Poiche K
R
è un convesso chiuso di Y e Y ha dimensione nita, questa
disequazione variazionale ha soluzione u
R
K
R
in virt` u del lemma che segue.
Lemma 7.9.8 Sia X uno spazio di Banach, sia K un convesso compatto non
vuoto di X; siano poi M K X
un insieme monotono e T : K X
unapplicazione w-continua. Allora esiste u K che risolve la disequazione

variazionale
T(u) f, u v)
X
0 (v, f) M.
277
Dimostrazione Supponiamo per assurdo che non vi sia alcuna soluzione in
K: allora per (v, f) M poniamo
U(v, f) = u K : T(u) f, u v)
X
< 0.
Linsieme U(v, f) è aperto in K: infatti K U(v, f) è chiuso, come segue
facilmente dalla w-continuità di T. Inoltre, poiche nessun u K risolve la
disequazione variazionale, si ha
K =
_
(v,f)M
U(v, f);
per compattezza, esistono (v
i
, f
i
) M, i = 1, . . . , m, tali che
K =
m
_
i=1
U(v
i
, f
i
).
Sia
i
1im
una partizione dellunità associata al ricoprimento U(v
i
, f
i
).
Poniamo K
1
= cov
1
, . . . , v
m
e deniamo
p : K
1
K
1
, p(u) =
m
j=1
j
(u)v
j
u K
1
,
q : K
1
X
, q(u) =
m
i=1
i
(u)f
i
u K
1
.
Dato che p è continua, per il teorema di Brouwer esiste u K
1
K tale che
p(u) = u. Deniamo le quantità
ij
= T(u) f
i
, u v
j
)
X
;
dalla monotonia di M si ha
ij
+
ji
= T(u) f
i
, u v
j
)
X
+T(u) f
j
, u v
i
)
X
=
=
jj
+f
j
f
i
, u v
j
)
X
+
ii
+f
i
f
j
, u v
i
)
X
=
=
jj
+
ii
+f
j
f
i
, v
i
v
j
)
X

jj
+
ii
.
278
Ne segue
0 = T(u) q(u), u p(u))
X
=
=
m
i,j=1
i
(u)(T(u) f
i
),
j
(u)(u v
j
))
X
=
=
m
i,j=1
i
(u)
j
(u)
ij
=
m
i,j=1
i
(u)
j
(u)
ij
+
ji
2

i,j=1
i
(u)
j
(u)
jj
+
ii
2
.
Daltra parte, se
i
(u)
j
(u) > 0 allora u U(v
i
, f
i
) U(v
j
, f
j
) e quindi
jj
< 0,
ii
< 0: ne segue che gli addendi non nulli di questa somma sono
negativi e, visto che u K, essi non sono tutti nulli. Ciò è assurdo.
Applicando il lemma precedente, come già osservato si ha che per ogni R > 0
la disequazione variazionale
u
R
K
R
, b B(u
R
) , u
R
v)
X
0 (v, ) G
R
ha soluzione. Sia S
R
linsieme delle soluzioni:
S
R
= u K
R
: b B(u) , u v)
X
0 (v, ) G
R
.
Oltre che non vuoto, S
R
è limitato: infatti per ogni u S
R
si ha necessa-
riamente |u|
X
r (altrimenti, per lipotesi (iv), scegliendo (v, ) = (0, 0)
avremmo b B(u), u)
X
< 0, in contraddizione con la disequazione varia-
zionale). Poiche B è demicontinuo, S
R
è chiuso; dato che dimY < , S
R
è
compatto. Inoltre
r R < R
= G
R
G
R
= S
R
S
R
,
cosicche S
R
Rr
è una famiglia di compatti che ha la proprietà dellinterse-
zione nita. Pertanto
u
Y

Rr
S
R
;
di conseguenza u
Y
K e
b B(u
Y
) , u
Y
v)
X
0 (v, ) G
R
, R r.
279
Quindi u
Y
è soluzione della disequazione variazionale in Y . Si noti che
|u
Y
|
X
r per ogni Y 1.
4
o
passo: passaggio al limite quando Y invade X.
Per Z 1 deniamo
M
Z
= (u, B(u)) K X
: Y 1, Y Z tale che
b B(u) , u v)
X
0 (v, ) G(A) con v Y .
Osserviamo che se Z, W 1 e Z W, allora per denizione M
Z
M
W
.
Proveremo che
(u, )
ZV
M
Z
w
(ove M
Z
w
è la chiusura debole di M
Z
), e che il corrispondente u risolve la
disequazione variazionale originaria.
Poiche loperatore B è limitato, se (u, B(u)) M
Z
si ha |u|
X
r e dunque
|B(u)|
X
K
r
, con K
r
costante opportuna; quindi esiste una palla chiusa
S X X
tale che
_
ZV
M
Z
S.
Poiche X è riessivo, tali sono X
e XX
; quindi S è debolmente compat-

ta. Essendo M
Z
w
debolmente chiuso e contenuto in S, M
Z
w
è debolmente
compatto e
_
ZV
M
Z
w
S.
Siano ora Z
1
, . . . , Z
m
1: posto W = [Z
1
, . . . , Z
m
] (il minimo sottospazio
contenente gli Z
i
), avremo M
W

m
i=1
M
Z
i
, da cui
M
W
w
i=1
M
Z
i
w
i=1
M
Z
i
w
.
Quindi, per la proprietà dellintersezione nita, esiste (u, )
ZV
M
Z
w
.
5
o
passo: alcuni lemmi ausiliari.
Lemma 7.9.9 Nelle ipotesi del teorema 7.9.5, se (u, )
ZV
M
Z
w
allora
per ogni Z 1 esiste una successione (u
n
, B(u
n
)) M
Z
tale che u
n
u
in X e B(u
n
) in X
. In particolare, u K.
280
Dimostrazione Poiche M
Z
è limitato in K X
, la sua chiusura debole

coincide con la sua chiusura debole sequenziale in virt` u del lemma 1.6.10.
Lemma 7.9.10 Nelle ipotesi del teorema 7.9.5, sia (u, )

ZV
M
Z
w
;
allora esiste (v, ) G(A) tale che
b , u v)
X
0.
Dimostrazione Altrimenti avremmo b , u v)
X
> 0 per ogni
(v, ) G(A); quindi otterremmo u D(A) e b A(u) per la mas-
simale monotonia di A. Ma allora, scelti v = u e = b , dedurremmo
0 > 0.
Lemma 7.9.11 Sia X uno spazio di Banach, sia K X un convesso chiuso
non vuoto e sia B : K X
un operatore monotono ed emicontinuo (ossia

debolmente continuo sulle rette). Allora B è pseudomonotono, cioè verica
la proprietà seguente:
u
n
K, u
n
u, limsup
n
B(u
n
), u
n
u)
X
0 =
= B(u), u v)
X
liminf
n
B(u
n
), u
n
v)
X
v K.
Dimostrazione Sia u
n
K tale che
u
n
u in X, limsup
n
B(u
n
), u
n
u)
X
0.
Per monotonia
B(u), u
n
u)
X
B(u
n
), u
n
u)
X
n N,
e poiche u
n
u si deduce
lim
n
B(u
n
), u
n
u)
X
= 0.
Ancora per monotonia,
B(v), u
n
v)
X
B(u
n
), u
n
v)
X
n N, v K,
e per n
B(v), u v)
X
liminf
n
B(u
n
), u
n
v)
X
v K.
281
Adesso, ssato w K, scegliamo v = u +(w u), con ]0, 1]: si trova
B(u +(w u)), (u w))
X

liminf
n
[B(u
n
), u
n
u)
X
+B(u
n
), u w)
X
] =
= liminf
n
B(u
n
), u w)
X
=
= lim
n
B(u
n
), u u
n
)
X
+liminf
n
B(u
n
), u
n
w)
X
=
= liminf
n
B(u
n
), u
n
w)
X
.
Dividendo per e usando lemicontinuità di B, si deduce per 0
+
B(u), u w)
X
liminf
n
B(u
n
), u
n
w)
X
w K,
6
o
passo: calcolo nale.
Sia (u, )
ZV
M
Z
w
. Per il lemma 7.9.10, esiste (v, ) G(A) tale che
b , u v)
X
0.
Sia Y 1 tale che v Y . Dimostreremo che
b B(u) , u v)
X
0 (v, ) G(A) con v Y ;
per larbitrarietà di Y , ciò proverà che u è soluzione della disequazione va-
riazionale originaria.
Per il lemma 7.9.9, esiste (u
n
, B(u
n
)) M
Y
tale che u
n
u in X e
B(u
n
) in X
; si ha, per denizione di M

Y
,
b B(u
n
) , u
n
v)
X
0 (v, ) G(A) con v Y.
Scriviamo questa relazione nella forma
B(u
n
), u
n
u)
X
b, v u
n
)
X
+B(u
n
), v u)
X
(v, ) G(A) con v Y.
Scelto (v, ) = (v, ), si trova per n
limsup
n
B(u
n
), u
n
u)
X

b, v u)
X
+, v u)
X
= b , u v)
X
0.
282
Dal lemma 7.9.10 deduciamo che B è pseudomonotono; quindi
B(u), u v)
X
liminf
n
B(u
n
), u
n
v)
X
v K Y,
e usando la disequazione variazionale vericata da u
n
, otteniamo per ogni
(v, ) G(A) con v Y
B(u), u v)
X
liminf
n
b , u
n
v)
X
= b , u v)
X
.
Pertanto
b B(u) , u v)
X
0 (v, ) G(A) con v Y, Y 1,
cioè la tesi. Il teorema 7.9.5 è cos` provato.
Esercizi 7.9
1. Sia X uno spazio di Banach. Se B : X X
è monotono ed emicon-
tinuo, si provi che B è pseudomonotono.
2. Sia X uno spazio di Banach. Se B : X X
è tale che
x
n
x in X = B(x
n
) B(x) in X
,
si provi che B è pseudomonotono.
3. Sia X uno spazio nito-dimensionale. Se B L(X, X
), si provi che
B è pseudomonotono.
4. Sia X uno spazio di Banach riessivo. Se A : X X
e B : X X
sono pseudomonotoni, si provi che A +B è pseudomonotono.

è monotono ed
emicontinuo, e B : X X
è tale che
x
n
x in X = B(x
n
) B(x) in X
,
si provi che A +B è pseudomonotono.
6. Sia X uno spazio di Banach. Si provi che ogni operatore A : X X
lineare e monotono è continuo.

283
è monotono ed
emicontinuo, si provi che A è demicontinuo.
8. Sia X uno spazio di Banach. Si provi che se A : X X
è tale che
x
n
x in X = A(x
n
) A(x) in X
,
allora A è un operatore compatto, ossia trasforma insiemi limitati in
insiemi relativamente compatti; si mostri che se A è lineare, allora vale
anche il viceversa.
9. Sia X uno spazio di Banach. Se A : X X
è pseudomonotono
e B : X X
è monotono ed emicontinuo, si provi che A + B è

pseudomonotono.
10. Sia X uno spazio di Banach. Se A : X X
è pseudomonotono e
B : X X
è tale che
x
n
x in X = B(x
n
) B(x) in X
,
si provi che A +B è pseudomonotono.
284
Bibliograa
[1] A. Andreotti, Lezioni sugli spazi vettoriali topologici, Ist. Mat. L.Tonelli,
Pisa 1965.
[2] J. P. Aubin, A. Cellina, Dierential inclusions. Set-valued maps and viability
theory, Springer Verlag, Berlin 1984.
[3] J. P. Aubin, H. Frankowska, Set-valued analysis, Birkhauser, Boston 1990.
[4] C. Baiocchi, A. Capelo, Disequazioni variazionali e quasi-variazionali. Appli-
cazioni a problemi di frontiera libera, Pitagora ed., Bologna 1976.
[5] V. Barbu, Th. Precupanu, Convexity and optimization in Banach spaces, D.
Reidel Publ. Comp., Dordrecht 1986.
[6] H. Brezis, Analyse fonctionnelle. Theorie et applications, Masson, Paris 1983.
[7] H. Brezis, Operateurs maximaux monotones et semi-groupes de contractions
dans les espaces de Hilbert, North-Holland Publ. Comp., Amsterdam 1973.
[8] E. Burger, Introduction to the theory of games, Prentice Hall, Englewood
Clis 1963.
[9] K. Deimling, Nonlinear functional analysis, Springer Verlag, Berlin 1985.
[10] N. Dunford, J. T. Schwartz, Linear operators, Interscience Publ., New York
1958.
[11] H. G. Eggleston, Convexity, Cambridge Univ. Press, Cambridge 1977.
[12] I. Ekeland, R.Temam, Analyse convexe et problèmes variationnels, Dunod,
Paris 1974.
[13] I. M. Gelfand, S. V. Fomin, Calculus of variations, Prentice-Hall, Englewood
Clis 1963.
285
[14] E. Hille, R. S. Phillips, Functional analysis and semigroups, Amer. Math.
Soc., New York 1957.
[15] J.-B. Hiriart-Urruty, C. Lemarechal, Fundamentals of convex analysis,
Springer Verlag, Berlin 2001.
[16] D. Kinderlehrer, G. Stampacchia, An introduction to variational inequalities
and their applications, Academic Press, London 1980.
[17] A. N. Kolmogorov, S. V. Fomin, Elementi di teoria delle funzioni e di analisi
funzionale, Mir, Mosca 1980.
[18] G. Prodi, A. Ambrosetti, Analisi non lineare, Scuola Norm. Sup., Pisa 1973.
[19] T. Parthasarathy, T. E. S. Raghavan, Some topics in two-person games,
Elsevier, New York 1971.
[20] R. T. Rockafellar, R. J.-B. Wets, Variational analysis, Springer Verlag, Berlin
1988.
[21] W. Rudin, Functional analysis, McGraw-Hill, New York 1973.
[22] H. Sagan, Introduction to the calculus of variations, McGraw-Hill, New York
1969.
[23] F. Treves, Topological vector spaces, distributions and kernels, Academic
Press, New York 1967.
[24] J. L. Troutman, Variational calculus with elementary convexity, Springer
Verlag, Berlin 1983.
[25] E. Zeidler, Nonlinear functional analysis and its applications, Vol. I - IIA -
IIB, Springer Verlag, Berlin 1984.
286
Indice analitico
applicazione
n-lineare, 118
bilineare, 104, 117
continua, 117
simmetrica, 121
compatta, 226
di dualità, 221, 263
di prossimità, 205
assioma della scelta, 251
battaglia fra i sessi, 244
bipolare, 78, 176
brachistocrona, 155
catenoide, 155
chiusura
debole, 38
sequenziale, 38
di una multifunzione, 262
cicloide, 157
combinazione convessa, 54, 75
condizione
di estremalità, 86
di Legendre, 159, 160
coniugata di una funzione, 76
cono, 91
duale, 91
normale, 178, 197
controimmagine, 219
coppia strategica
mista, 239
ottimale, 239
ottimale, 237
curva di livello, 131
derivata
n-sima, 118
di Gateaux, 106
parziale, 121
prima, 105
seconda, 117
dierenziale
di Frechèt, 103
di funzioni composte, 104
di Gateaux, 106
secondo, 117
dilemma dei prigionieri, 240
disequazione
variazionale, 71, 195, 199, 206, 227,
274, 277
distribuzione, 27, 29
temperata, 28
disuguaglianza
di Holder, 102
di Minkowski, 102
di Young, 77
dominio
duale
di C
1
[a, b], 164
di L
p
(a, b; X), 100
di uno spazio vettoriale topologico,
26, 30
elica cilindrica, 171
287
epigraco, 58, 60
equazione
di Eulero, 148
di evoluzione
del 1
o
ordine, 274
integrale, 273
equilibrio di Nash, 241
estremale, 148, 151
famiglia di seminorme, 9
che separano i punti, 10
lo elastico, 211
forma
bilineare, 197
coerciva, 198
continua, 118, 197
simmetrica, 197
formula
di integrazione per parti, 165
di Taylor, 118
funzionale, 140, 142
di Minkowski, 3, 57
lineare, 24, 57, 71
continuo, 24, 71
limitato, 24
lunghezza darco, 143, 149
funzione
a decrescenza rapida, 20
ane, 67
bipolare, 78, 176
concava, 56
coniugata, 76, 78
convessa, 56, 184
debolmente misurabile, 97
di classe C
1
, 105
di classe C
2
, 117
di supporto, 78, 81
di utilità, 236
dierenziabile
secondo Frechèt, 103
secondo Gateaux, 106
fortemente misurabile, 97
indicatrice, 57, 62, 80, 210, 273
lagrangiana, 87
lipschitziana, 75
localmente lipschitziana, 75
multivoca, 219
polare, 76
propria, 57
quasi concava, 57, 234
quasi convessa, 57, 65, 234
semicontinua inferiormente, 60
semicontinua superiormente, 60
semplice, 96
sommabile, 97
sottodierenziabile, 173
strettamente concava, 56
strettamente convessa, 56
geodetiche, 163
sul cilindro, 170
sul cono, 171
sulla sfera, 169
gioco, 236
a somma zero, 236, 238
battaglia fra i sessi, 244
del pari o dispari, 238, 239
dilemma dei prigionieri, 240
equo, 238
non cooperativo, 241
sasso-carta-forbici, 243
graco
di un funzionale lineare, 51
immagine
in un punto, 219
inclusione
dierenziale, 255
funzionale, 273, 275
288
rovesciata, 13, 52
insieme
assorbente, 2
bilanciato, 2
cerchiato, 2
convesso, 1, 57
debolmente chiuso, 29
di sopralivello, 234
di sottolivello, 57, 60, 234
diretto, 12
ltrante, 12
limitato, 21
massimale monotono, 257
monotono, 257
radiale, 2
simmetrico, 5
totalmente limitato, 50
integrale
di Bochner, 99
di funzioni semplici, 96
di una funzione sommabile, 99
primo, 151
inversa di una multifunzione, 220
inviluppo
convesso, 2
convesso chiuso
di un insieme, 12
di una famiglia di funzioni, 67, 68
iperpiano
ane, 47
chiuso, 47
denso, 47
di appoggio, 47, 81, 197
lemmi fondamentali del calcolo delle va-
riazioni, 143146, 148, 162, 167,
216, 217, 268
massimi e minimi
relativi, 121
vincolati, 135
metodo
dei moltiplicatori, 135, 161, 164
metrica
di Hausdor, 224, 231
moltiplicatori di Lagrange, 197
multifunzione, 219
composta, 223
continua, 222
emicontinua, 263
inversa, 220, 221, 258
massimale monotona, 257, 263, 273,
276
monotona, 257
semicontinua inferiormente, 222
semicontinua superiormente, 221
net, 12
convergente, 13
di Cauchy, 13
norma
in L
p
(a, b; X), 100
in L
(a, b; X), 100

in L
2
(X, Y ), 117
in L
n
(X, Y ), 118
nucleo di un funzionale lineare, 24, 45,
46
operatore
aggiunto, 135
coercivo, 202
compatto, 284
demicontinuo, 206, 275
derivata
prima, 267, 270
seconda, 266
di superposizione, 109
emicontinuo, 259, 281
lineare, 23, 25
continuo, 23, 25
limitato, 26
289
lipschitziano, 260
massimale monotono, 258, 260, 263
monotono, 184, 203, 206, 259
non espansivo, 260
pseudomonotono, 281, 283
strettamente monotono, 206
ostacolo, 211
pari o dispari, 238, 239
parte
antisimmetrica, 200
simmetrica, 200
polare di una funzione, 76
poliedro convesso, 54
problema
ad estremi variabili, 151
del matrimonio, 245
di Cauchy, 127, 129, 130
di massimo
con vincolo, 135
di minimax, 87
di minimo, 61, 64, 140, 176, 274
con vincolo, 135, 163, 195, 211
duale, 83
isoperimetrico, 160
primale, 83
normale, 83
stabile, 83
punto
di appoggio, 48
di equilibrio di Nash, 241
di massimo, 86
relativo, 121123, 147, 159, 160
vincolato, 135, 137, 138
di minimo, 53, 64, 86, 149, 154, 158,
176, 188, 205, 234
relativo, 121123, 147, 158, 160
vincolato, 135, 137, 138, 167, 195,
196, 199, 212
di sella, 88, 232
estremo, 52
sso
di una funzione, 207, 225, 226
di una multifunzione, 222, 224
226
rapporto incrementale, 59, 180
regolarizzata
di una funzione convessa, 189
semicontinua, 68, 79, 84
relazione
dordine associata a un cono, 91
di estremalità, 86
selezione, 222, 245
continua, 245, 250, 254
fortemente misurabile, 248
iniettiva, 245
minimale, 253
misurabile, 245
seminorma, 5, 57
semispazio
aperto, 47
chiuso, 47
separazione
di insiemi convessi, 42, 65
separazione stretta
di insiemi convessi, 47, 65
sottodierenziale, 174, 221, 271
di una funzione convessa, 179
sottogradiente, 174
sottospazio
complementabile, 131
massimale, 45
chiuso, 46
denso, 46
spazio
C([a, b], X), 100
C
m
(), 14
C
m
0
(), 15
C
m
K
(), 15
290
C
(), 15
L
2
(0, T; H), 267
L
p
(a, b; X), 100
L
(a, b; X), 100
p
, 13
L
2
(X, Y ), 117
L
n
(X, Y ), 118
di Frechèt, 13
di Schwartz, 20
vettoriale topologico, 8
localmente convesso, 9
completo, 12, 13
di Hausdor, 8, 10
metrizzabile, 10
speranza di vincita, 239
strategia, 236
successione
convergente, 12
di Cauchy, 12
generalizzata, 12
supercie di rotazione di area minima,
154
teorema
del dierenziale totale, 107
del matrimonio, 245
del minimax, 234, 239
delle contrazioni, 224
delle funzioni implicite, 124, 132
di Banach-Alaoglu, 31, 175
di Browder
sui punti ssi, 229
sulle inclusioni funzionali, 260, 275
di Eberlein-Smulyan, 32
di Fenchel-Moreau, 79
di Hahn-Banach, 41
1
a
forma geometrica, 42, 47
2
a
forma geometrica, 43, 47
di Kakutani, 225
di Karush-Kuhn-Tucker, 94
di Krein-Milman, 52
di Kuratowski e Ryll-Nardzewski, 247
di Lagrange, 106
di Lax-Milgram, 202
di Lions-Stampacchia, 205
di Lyusternik, 131, 134, 136
di Mazur
sugli inviluppi convessi, 49, 226
sulle funzioni convesse, 75, 182
di Michael, 250, 255
di Minty, 260, 266, 276
di Peano, 256
di Riesz-Fischer, 100
di Rockafellar, 271
di Schauder, 226
di Tikhonov, 225
di von Neumann, 234
di Weierstrass, 61
topologia
(X, B), 27
(X, X
), 27, 29
(X
, X), 27, 30
debole, 27, 29, 235
debole*, 27, 30, 258
forte, 27, 227
indotta
da un sottoinsieme di X, 27
da un sottoinsieme di X
, 27
da una famiglia di seminorme, 9,
27, 29
valore
di un gioco, 237
di una multifunzione in un punto,
219
varietà
ane, 47, 131
tangente, 131
vertice di un poliedro, 54, 75
291
Appunti del corso di
Analisi funzionale
Paolo Acquistapace
17 ottobre 2007
Indice
1 Misura di Lebesgue in R 1
1.1 Motivazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Lunghezza degli intervalli . . . . . . . . . . . . . . . . . . . . 2
1.3 Misura esterna di Lebesgue . . . . . . . . . . . . . . . . . . . 3
1.4 Insiemi misurabili secondo Lebesgue . . . . . . . . . . . . . . . 7
1.5 Misurabilità degli intervalli . . . . . . . . . . . . . . . . . . . . 13
1.6 Insieme di Cantor . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.7 Proprietà della misura di Lebesgue . . . . . . . . . . . . . . . 17
1.8 Un insieme non misurabile . . . . . . . . . . . . . . . . . . . . 22
2 Misure 25
2.1 Spazi misurati . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.2 Misura di Lebesgue in R
N
. . . . . . . . . . . . . . . . . . . . 31
2.3 Misure esterne di Hausdor . . . . . . . . . . . . . . . . . . . 32
2.4 Misure di Hausdor . . . . . . . . . . . . . . . . . . . . . . . . 36
2.5 Dimensione di Hausdor . . . . . . . . . . . . . . . . . . . . . 39
2.6 La misura H
N
in R
N
. . . . . . . . . . . . . . . . . . . . . . . 43
3 Funzioni misurabili 48
3.1 Denizione e proprietà . . . . . . . . . . . . . . . . . . . . . . 48
3.2 Funzioni essenzialmente limitate . . . . . . . . . . . . . . . . . 54
3.3 Lo spazio L
. . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.4 Misurabilità e continuità . . . . . . . . . . . . . . . . . . . . . 59
3.5 Convergenza in misura . . . . . . . . . . . . . . . . . . . . . . 64
4 Lintegrale 69
4.1 Integrale di funzioni semplici . . . . . . . . . . . . . . . . . . . 69
4.2 Integrale di funzioni misurabili . . . . . . . . . . . . . . . . . . 73
i
4.3 Passaggio al limite sotto il segno di integrale . . . . . . . . . . 83
4.4 Confronto fra integrale di Riemann ed integrale di Lebesgue . 89
4.5 Assoluta continuità . . . . . . . . . . . . . . . . . . . . . . . . 99
4.6 Lo spazio L
1
. . . . . . . . . . . . . . . . . . . . . . . . . . . . 103
4.7 Teoremi di densità in L
1
. . . . . . . . . . . . . . . . . . . . . 106
5 Misure prodotto 113
5.1 Rettangoli misurabili . . . . . . . . . . . . . . . . . . . . . . . 113
5.2 Insiemi misurabili in X Y . . . . . . . . . . . . . . . . . . . 115
5.3 Teoremi di integrazione successiva . . . . . . . . . . . . . . . . 121
5.4 Completamento delle misure prodotto . . . . . . . . . . . . . . 128
6 Derivazione 136
6.1 Teorema fondamentale del calcolo integrale . . . . . . . . . . . 136
6.2 Punti di Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . 138
6.3 Derivabilità delle funzioni monotone . . . . . . . . . . . . . . . 143
6.4 Funzioni a variazione limitata . . . . . . . . . . . . . . . . . . 150
6.5 Funzioni assolutamente continue . . . . . . . . . . . . . . . . . 153
6.6 Cambiamento di variabile . . . . . . . . . . . . . . . . . . . . 161
6.7 Cambiamento di variabili . . . . . . . . . . . . . . . . . . . . . 166
6.8 Appendice: dimostrazione del teorema di Brouwer . . . . . . . 174
7 Spazi di Banach 179
7.1 Norme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
7.2 Prodotti scalari . . . . . . . . . . . . . . . . . . . . . . . . . . 183
7.3 Operatori lineari e continui . . . . . . . . . . . . . . . . . . . . 189
8 Spazi di Hilbert 199
8.1 Proiezioni su convessi chiusi . . . . . . . . . . . . . . . . . . . 199
8.2 Il duale di uno spazio di Hilbert . . . . . . . . . . . . . . . . . 208
8.3 Sistemi ortonormali . . . . . . . . . . . . . . . . . . . . . . . . 215
8.4 Trasformata di Fourier . . . . . . . . . . . . . . . . . . . . . . 227
9 Spazi L
p
239
9.1 La norma di L
p
. . . . . . . . . . . . . . . . . . . . . . . . . . 239
9.2 Il duale di L
p
. . . . . . . . . . . . . . . . . . . . . . . . . . . 250
ii
10 Operatori lineari 259
10.1 Estensione di funzionali lineari . . . . . . . . . . . . . . . . . . 259
10.2 Uniforme limitatezza di operatori . . . . . . . . . . . . . . . . 267
10.3 Applicazioni aperte . . . . . . . . . . . . . . . . . . . . . . . . 272
10.4 Operatore aggiunto . . . . . . . . . . . . . . . . . . . . . . . . 279
10.5 Riessività . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 284
10.6 Convergenze deboli . . . . . . . . . . . . . . . . . . . . . . . . 289
10.7 Compattezza . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
11 Teoria spettrale 299
11.1 Spettro e risolvente . . . . . . . . . . . . . . . . . . . . . . . . 299
11.2 Operatori compatti . . . . . . . . . . . . . . . . . . . . . . . . 304
11.3 Operatori compatti in spazi di Hilbert . . . . . . . . . . . . . 311
11.4 Lalternativa di Fredholm . . . . . . . . . . . . . . . . . . . . 321
11.5 Lequazione di Sturm - Liouville . . . . . . . . . . . . . . . . . 328
11.6 Risolubilità dellequazione di Sturm - Liouville . . . . . . . . 333
11.7 Rappresentazione delle soluzioni . . . . . . . . . . . . . . . . . 336
Bibliograa 345
iii
Capitolo 1
Misura di Lebesgue in R
1.1 Motivazioni
La teoria della misura e dellintegrazione secondo Riemann, concettualmente
semplice e soddisfacente per molti aspetti, non è tuttavia cos` essibile da
consentire certe operazioni che pure appaiono naturali: ad esempio, si ha
lim
n
_
A
f
n
(x) dx =
_
A
lim
n
f
n
(x) dx
solo se Aè limitato e se vi è convergenza uniforme delle f
n
; se A
n
è una suc-
cessione di insiemi misurabili disgiunti, la loro unione non è necessariamente
misurabile, ne, tanto meno, vale in generale la relazione
m
_
_
nN
A
n
_
=
nN
m(A
n
);
inne, le quantità
_
A
[f(x)[dx ,
__
A
[f(x)[
2
dx
_1
2
non sono norme sullo spazio delle funzioni Riemann integrabili 1(A), perche
manca loro la proprietà di annullarsi se e solo se f è identicamente nulla (la
f potrebbe essere non nulla in un numero nito di punti).
Vi sono poi altre, e pi` u importanti, motivazioni a posteriori: la teoria del-
lintegrazione secondo Lebesgue ha dato lavvio ad enormi sviluppi nellanalisi
1
funzionale, nella teoria della probabilità, ed in svariatissime applicazioni (ri-
soluzione di equazioni dierenziali, calcolo delle variazioni, ricerca operativa,
sica matematica, matematica nanziaria, biomatematica, ed altre ancora).
Esporremo la teoria della misura di Lebesgue seguendo la presentazione in-
trodotta da Caratheodory, che è quella che pi` u facilmente si estende, come
vedremo, al caso di misure astratte denite su insiemi arbitrari.
Esercizi 1.1
1. Esibire una successione di funzioni f
n
denite su [a, b], Riemann
integrabili in [a, b], puntualmente convergenti in [a, b], e tali che
lim
n
_
b
a
f
n
(x) dx ,=
_
b
a
lim
n
f
n
(x) dx.
2. Esibire una successione di sottoinsiemi A
n
di R, misurabili secondo
Riemann e disgiunti, tali che la loro unione non sia misurabile secondo
Riemann.
1.2 Lunghezza degli intervalli
Il punto di partenza, come è naturale, è lattribuzione di una lunghezza agli
intervalli della retta reale.
Denizione 1.2.1 Sia I un intervallo di R. La sua lunghezza l(I) è data
da
l(I) =
_
b a se ]a, b[ I [a, b],
+ se I è illimitato.
La funzione l(I) associa ad ogni intervallo di R un numero in [0, +] (si
noti che, in particolare, l() e l(a) valgono 0). Vogliamo estendere tale
funzione a sottoinsiemi di R pi` u generali, in modo da poterli misurare.
Sarebbe auspicabile poter denire una funzione di insieme m che verichi le
seguenti proprietà:
1. m(E) è denita per ogni E R;
2. m(I) = l(I) per ogni intervallo I;
2
3. (numerabile additività) se E
n
nN
è una famiglia numerabile di insiemi
disgiunti, allora
m
_
_
nN
E
n
_
=
nN
m(E
n
);
4. (invarianza per traslazioni) per ogni x R e per ogni E R si ha
m(x +E) = m(E), ove x +E = y R : y x E.
Sfortunatamente si può dimostrare (si veda lesercizio 2.1.8) che non è pos-
sibile soddisfare simultaneamente queste richieste: se si vogliono mantenere
le proprietà 2, 3 e 4 non si potranno misurare tutti i sottoinsiemi di R; se,
al contrario, si vuole mantenere la proprietà 1, occorrerà indebolire qualcuna
delle altre, ad esempio sostituire la 3 con la seguente:
3
t
. (numerabile subadditività) se E
n
nN
è una famiglia numerabile di
sottoinsiemi di R, allora
m
_
_
nN
E
n
_
nN
m(E
n
).
Considerazioni geometriche ci inducono a considerare irrinunciabili le pro-
prietà 2, 3 e 4: di conseguenza, come si vedrà, la classe degli insiemi misu-
rabili sarà un sottoinsieme proprio di T(R).
Esercizi 1.2
1. Si provi che la famiglia delle unioni nite di intervalli di R aperti a
destra è unalgebra, ossia è una classe contenente linsieme vuoto e
chiusa rispetto allunione ed al passaggio al complementare.
2. Si verichi che la famiglia delle unioni nite di intervalli aperti di R
non è unalgebra.
1.3 Misura esterna di Lebesgue
Cominciamo ad attribuire ad ogni sottoinsieme di R una misura esterna
che goda delle proprietà 1, 2, 3
t
e 4 del paragrafo 1.2.
3
Denizione 1.3.1 Se E R, la misura esterna m
(E) è data da
m
(E) = inf
_
nN
l(I
n
) : E
_
nN
I
n
, I
n
intervalli aperti
_
.
Dalla denizione seguono subito le seguenti proprietà:
Proposizione 1.3.2 Si ha:
(i) m
(E) 0 E R;
(ii) m
() = m
(x) = 0 x R;
(iii) (monotonia) se E F allora m
(E) m
(F).
Dimostrazione (i) Evidente.
(ii) Per ogni > 0 si ha x ]x , x + [; questo intervallo ha
lunghezza 2 e ricopre x e . Quindi, per denizione,
m
() 2, m
(x) 2 > 0,
da cui la tesi.
(iii) Se E F, ogni ricoprimento I
n
di F costituito da intervalli aperti è
anche un ricoprimento di E, da cui
m
(E)
nN
l(I
n
);
per larbitrarietà del ricoprimento di F, si ottiene la tesi.
Verichiamo ora la proprietà 2:
Proposizione 1.3.3 Se I R è un intervallo, allora m
(I) = l(I).
Dimostrazione Supponiamo dapprima I = [a, b]. Per ogni > 0 lintervallo
]a , b +[ ricopre I, e quindi per denizione si ha
m
(I) l(]a , b +[) = b a + 2 > 0,

da cui m
(I) b a.
Per provare la disuguaglianza opposta, sia I
n
nN
un ricoprimento di I co-
stituito da intervalli aperti; poiche I è compatto, esisterà un sottoricopri-
mento nito I
n
1
, . . . , I
nm
. Eliminando eventualmente qualcuno degli I
n
k
,
4
possiamo supporre che gli I
n
k
siano tutti distinti fra loro, ed inoltre che il
ricoprimento sia minimale, nel senso che togliendo un I
n
k
gli intervalli residui
non ricoprano pi` u [a, b].
Ordiniamo gli intervalli I
n
k
=]a
k
, b
k
[ in modo che
a
1
< a
2
< a
3
< < a
m
;
si noti che non può aversi a
k
= a
k+1
, poiche in tal caso si avrebbe I
n
k
I
n
k+1
se b
k
 b
k+1
: quindi potremmo eliminare
uno dei due intervalli. Avremo poi a
1
< a < b
1
, perche se fosse b
1
a
potremmo eliminare I
n
1
, e possiamo supporre b
1
b, perche da b < b
1
segue
[a, b] I
n
1
e in tal caso si ha direttamente l(I) = ba < b
1
a
1

nN
l(I
n
),
che è ciò a cui vogliamo arrivare). Risulta anche
a
1
< a a
2
< b
1
< b
2
:
infatti se fosse b
2
b
1
potremmo eliminare I
n
2
, se fosse b
1
a
2
risulterebbe
b
1
[a, b]
m
k=1
I
n
k
, e se fosse a
2
< a potremmo eliminare I
n
1
.
Ragionando in modo analogo troviamo che
a
k1
< a
k

> (b b
m1
) +
m1
k=2
(b
k
b
k1
) + (b
1
a) = b a.
Dallarbitrarietà del ricoprimento segue m
(I) b a = l(I).
Sia ora I tale che I = [a, b]. Poiche per ogni ]0,
ba
2
[ si ha [a + , b ]
I [a, b], dalla monotonia di m
e da quanto già dimostrato segue

b a 2 m
(I) b a
_
0,
b a
2
_
,
5
e quindi m
(I) = b a = l(I).
Inne, se I è illimitato, per ogni n N esiste un intervallo J
n
di lunghezza
n contenuto in I: quindi, per monotonia,
m
(I) m
(J
n
) = l(J
n
) = n n N,
cioè m
(I) = + = l(I).
Verichiamo ora che m
gode della proprietà 3

t
del paragrafo 1.2.
Proposizione 1.3.4 La misura esterna m
è numerabilmente subadditiva.
Dimostrazione Sia E
n
una successione di sottoinsiemi di R: dobbiamo
provare che
m
_
_
nN
E
n
_
nN
m
(E
n
).
Ci` o è ovvio se la serie a secondo membro è divergente; supponiamo quindi che
essa sia convergente, cosicche in particolare m
(E
n
) < per ogni n N. Per
denizione di misura esterna, ssato > 0 esiste un ricoprimento I
kn
kN
di E
n
costituito di intervalli aperti, tale che
kN
l(I
kn
) < m
(E
n
) +

2
n+1
.
La famiglia I
kn
k,nN
è allora un ricoprimento di
nN
E
n
costituito di
intervalli aperti, e si ha
m
_
_
nN
E
n
_
k,nN
l(I
kn
)
nN
_
m
(E
n
) +

2
n+1
_
=
nN
m
(E
n
) + ;
dallarbitrarietà di segue la tesi.
Inne osserviamo che m
verica anche la proprietà 4 del paragrafo 1.2:

infatti la lunghezza degli intervalli è ovviamente invariante per traslazioni;
ne segue facilmente, usando la denizione, che anche m
è invariante per
traslazioni.
Come vedremo in seguito, la misura esterna non verica invece la proprietà
3 del paragrafo 1.2, ed anzi non è nemmeno nitamente additiva su T(R)
(esercizio 1.8.4). Sarà però numerabilmente additiva su una sottoclasse molto
vasta di T(R).
6
Esercizi 1.3
1. Sia t R 0. Posto tE = x R :
x
t
E, si provi che
m
(tE) = [t[m
(E).
2. Dimostrare che la funzione di insieme m
non cambia se nella deni-

zione 1.3.1 si fa uso, anziche di intervalli I
n
aperti, di intervalli I
n
di
uno dei seguenti tipi:
(a) intervalli I
n
chiusi;
(b) intervalli I
n
aperti a destra;
(c) intervalli I
n
qualunque;
(d) intervalli I
n
ad estremi razionali.
3. Si dimostri che ogni aperto di R è unione al pi` u numerabile di intervalli
aperti disgiunti.
4. Si provi che ogni aperto non vuoto di R ha misura esterna strettamente
positiva.
5. Si provi che ogni sottoinsieme numerabile di R ha misura esterna nulla.
6. Per ogni > 0 si costruisca un aperto A R, denso in R, tale che
m
(A) < .
7. Sia E R un insieme di misura esterna strettamente positiva. Si provi
che per ogni > 0 esiste un intervallo I tale che m
(EI) > (1)l(I).

[Traccia: ssato > 0, si prenda un aperto A contenente E, tale che
m
(A) < m
(E) + ; si utilizzi lesercizio 1.3.3 e si verichi che per

sucientemente piccolo, uno almeno degli intervalli che compongono A
verica necessariamente la tesi.]
1.4 Insiemi misurabili secondo Lebesgue
Introduciamo adesso una classe di sottoinsiemi di R sulla quale la funzione
m
è numerabilmente additiva (proprietà 3 del paragrafo 1.2).

7
Denizione 1.4.1 Un insieme E R è detto misurabile (secondo Lebesgue)
se per ogni insieme A R si ha
m
(A) = m
(A E) +m
(A E
c
).
Indicheremo con / la classe dei sottoinsiemi misurabili di R.
Un sottoinsieme E di R è dunque misurabile se, ssato un arbitrario insieme
test A R, esso viene decomposto bene da E, nel senso che la misura
esterna di A è additiva sulle due parti A E e A E
c
. Si noti che per la
subadditività di m
si ha sempre
m
(A) m
(A E) +m
(A E
c
),
quindi la disuguaglianza signicativa è quella opposta.
Osservazione 1.4.2 Dalla denizione segue subito che E è misurabile se e
solo se lo è E
c
; quindi / è chiusa rispetto al passaggio al complementare.
Inoltre è facile vedere che R, sono insiemi misurabili.
Pi` u in generale:
Proposizione 1.4.3 Se E R e m
(E) = 0, allora E è misurabile.

Dimostrazione Per ogni insieme test A R si ha
m
(A) m
(A E) +m
(A E
c
)
in quanto m
(A E) m
(E) = 0. Ne segue la tesi.

La classe / è chiusa anche rispetto allunione; si ha infatti:
Proposizione 1.4.4 Se E, F R sono misurabili, allora EF è misurabile.
Dimostrazione Sia A un insieme test. Poichè E è misurabile,
m
(A) = m
(A E) +m
(A E
c
);
poichè F è misurabile, scelto come insieme test A E
c
si ha
m
(A E
c
) = m
(A E
c
F) +m
(A E
c
F
c
) =
= m
(A E
c
F) +m
(A (E F)
c
),
8
e dunque
m
(A) = m
(A E) +m
(A E
c
F) +m
(A (E F)
c
);
daltra parte, essendo
(A E) (A E
c
F) = A (E F),
la subadditività di m
implica che
m
(A E) +m
(A E
c
F) m
(A (E F)),
da cui nalmente
m
(A) m
(A (E F)) +m
(A (E F)
c
).
Ci` o prova la misurabilità di E F.
Corollario 1.4.5 Se E, F R sono misurabili, allora E F ed E F sono
misurabili.
Dimostrazione Se E, F /, allora E
c
, F
c
/; per la proposizione
precedente, E
c
F
c
/ e quindi E F = (E
c
F
c
)
c
/. Di qui segue
E F = E F
c
/.
La classe / contiene linsieme vuoto ed è chiusa rispetto alle operazioni di
unione, intersezione e dierenza; in particolare, /è unalgebra (v. esercizio
1.2.1).
Osservazione 1.4.6 Se E, F sono insiemi misurabili e disgiunti, si ha
m
(E F) = m
(E) +m
(F),
come si verica applicando la denizione 1.4.1 ad E e scegliendo come insieme
test E F. Di conseguenza, se E, F / ed E F, vale luguaglianza
m
(F E) +m
(E) = m
(F),
e, se m
(E) < ,
m
(F E) = m
(F) m
(E).
Nel caso di N insiemi misurabili disgiunti si ha, pi` u generalmente:
9
Lemma 1.4.7 Siano E
1
, . . . , E
N
misurabili e disgiunti. Allora per ogni in-
sieme A R si ha
m
_
A
N
_
n=1
E
n
_
=
N
n=1
m
(A E
n
).
Dimostrazione Ragioniamo per induzione. Se N = 1 non cè niente da di-
mostrare. Supponiamo che la tesi sia vera per N insiemi misurabili disgiunti,
e consideriamo N + 1 insiemi E
1
, . . . , E
N+1
/ fra loro disgiunti. Poiche
E
N+1
è misurabile, scegliendo come insieme test A
N+1
n=1
E
n
, si ha
m
_
A
N+1
_
n=1
E
n
_
=
= m
_
A
_
N+1
_
n=1
E
n
_
E
N+1
_
+m
_
A
_
N+1
_
n=1
E
n
_
E
c
N+1
_
=
= m
(A E
N+1
) +m
_
A
N
_
n=1
E
n
_
;
ma, per ipotesi induttiva,
m
_
A
N
_
n=1
E
n
_
=
N
n=1
m
(A E
n
),
da cui
m
_
A
N+1
_
n=1
E
n
_
= m
(A E
N+1
) +
N
n=1
m
(A E
n
) =
=
N+1
n=1
m
(A E
n
).
Grazie al lemma precedente, siamo in grado di provare che la classe /
è chiusa rispetto allunione numerabile (e quindi rispetto allintersezione
numerabile).
Proposizione 1.4.8 Se E
n
nN
/, allora
nN
E
n
/.
10
Dimostrazione Anzitutto, scriviamo
nN
E
n
come unione numerabile di
insiemi misurabili e disgiunti: basta porre
F
0
= E
0
, F
n+1
= E
n+1
n
_
k=0
F
k
n N
per avere che gli F
n
sono disgiunti, stanno in / e vericano
_
nN
F
n
=
_
nN
E
n
.
Sia A R un insieme test: per ogni N N possiamo scrivere, grazie al
lemma precedente,
m
(A) = m
_
A
N
_
n=0
F
n
_
+m
_
A
_
N
_
n=0
F
n
_
c
_
=
=
N
n=0
m
(A F
n
) +m
_
A
N
n=0
F
c
n
_
n=0
m
(A F
n
) +m
_
A
n=0
F
c
n
_
=
=
N
n=0
m
(A F
n
) +m
_
A
_
_
n=0
F
n
_
c
_
.
Se N , in virt` u della numerabile subadditività di m
otteniamo
m
(A)
n=0
m
(A F
n
) +m
_
A
_
_
n=0
F
n
_
c
_
_
A
_
n=0
F
n
_
+m
_
A
_
_
n=0
F
n
_
c
_
.
Ci` o prova che
nN
F
n
=
nN
E
n
è misurabile.
Dunque la classe / contiene linsieme vuoto ed è chiusa rispetto allunione
numerabile ed al passaggio al complementare. Una famiglia di insiemi dotata
di queste proprietà si chiama -algebra, o trib` u; /è pertanto una -algebra
di sottoinsiemi di R.
Proviamo nalmente che m
è numerabilmente additiva su /.
11
Proposizione 1.4.9 Se E
n
nN
/ e gli E
n
sono fra loro disgiunti,
allora si ha
m
_
_
nN
E
n
_
=
nN
m
(E
n
).
Dimostrazione Poiche m
è numerabilmente subadditiva, la disuguaglianza

() è evidente; proviamo laltra. Per ogni N N si ha, utilizzando la
monotonia di m
ed il lemma 1.4.7 con A = R,

m
_
_
nN
E
n
_
m
_
N
_
n=0
E
n
_
=
N
n=0
m
(E
n
),
da cui per N
m
_
_
nN
E
n
_
n=0
m
(E
n
).
Esercizi 1.4
1. Per ogni [0, ] si determini una successione di aperti A
n
di R
tali che
A
n
A
n+1
, m
(A
n
) = n N, m
nN
A
n
_
= .
2. Sia E R con m
(E) = 0 e sia f : R R una funzione derivabile

con derivata limitata. Si provi che f(E) ha misura esterna nulla. Si
provi poi lo stesso risultato supponendo f C
1
(R).
3. Sia E un sottoinsieme di R. La densità di E nel punto x R è il limite
lim
h0
+
1
2h
m
(E]x h, x +h[).
(i) Tale limite esiste sempre?
(ii) Si provi che linsieme
_
x R 0 : cos
1
x
>
1
2
_
ha densità
1
3
nel punto x = 0.
12
[Traccia: per (i) si consideri E =
n=0
[2
2n1
, 2
2n
]; per (ii), detto E
linsieme in questione, si verichi che
1
h
m
(E [0, h[) è uguale a

1
6h
n=k+1
1
n
2
1
36
se
3
(6k+5)
< h <
3
(6k+1)
, ed è uguale a
1
6h
n=k+1
1
n
2
1
36
+ 1
3
h(6k + 1)
se
3
(6k+1)
h
3
(6k1)
. Se h 0
+
(e quindi k ), si provi che
il termine con la serie tende a
1
3
.]
4. Sia T una -algebra di sottoinsiemi di R. Si provi che T è nita, op-
pure T contiene una innità pi` u che numerabile di elementi.
[Traccia: se, per assurdo, fosse T = E
n
nN
con gli E
n
tutti distinti,
si costruisca una successione F
n
nN
T di insiemi disgiunti; dopodi-
che, posto T
t
= F
n
nN
, si metta T(T
t
) in corrispondenza biunivoca
con T(N).]
1.5 Misurabilità degli intervalli
La classe degli insiemi misurabili non avrebbe limportanza che ha, se non
contenesse gli intervalli di R: questo è ciò che andiamo a dimostrare.
Proposizione 1.5.1 Gli intervalli di R sono misurabili secondo Lebesgue.
Dimostrazione Sappiamo già che R =
c
è misurabile. Osserviamo poi che
ogni intervallo non aperto è lunione di un intervallo aperto e di uno o due
punti, e dunque è misurabile se lo sono tutti gli intervalli aperti; inoltre, dato
che ogni intervallo aperto limitato ]a, b[ è lintersezione delle due semirette
aperte ] , b[ e ]a, +[, basterà provare che sono misurabili le semirette
aperte. Inne, essendo ]a, +[
c
=] , a[a, sarà in denitiva suciente
mostrare che ] , b[ / per ogni b R.
Sia dunque A R un insieme test. Se m
(A) = , la disuguaglianza da
provare, ossia
m
(A) m
(A] , b[) +m
(A [b, +[)
13
è evidente. Se invece m
(A) < , per denizione ssato > 0 esiste un

ricoprimento I
n
di A, fatto di intervalli aperti, tale che
nN
l(I
n
) < m
(A) +.
Poniamo
I
t
n
= I
n
] , b[, I
tt
n
= I
n
[b, +[;
chiaramente
l(I
t
n
) +l(I
tt
n
) = l(I
n
) n N,
quindi
nN
l(I
t
n
) +
nN
l(I
tt
n
) < m
(A) +.
Dato che I
t
n
e I
tt
n
ricoprono rispettivamente A] , b[ e A [b, +[,
per la numerabile subadditività di m
si ottiene a maggior ragione

m
(A] , b[) +m
(A [b, +[) < m
(A) +,
e la tesi segue per larbitrarietà di .
Corollario 1.5.2 Gli aperti ed i chiusi di R sono misurabili secondo Lebe-
sgue.
Dimostrazione Basta ricordare lesercizio 1.3.3.
Naturalmente la -algebra / contiene molti altri insiemi: indicando con /
la famiglia degli aperti di R, dovrà stare in / tutto ciò che si ottiene da /
con unioni ed intersezioni numerabili. La pi` u piccola -algebra che contiene
/ (ossia lintersezione di tutte le -algebre contenenti /: si vede subito che
essa stessa è una -algebra) si indica con B ed i suoi elementi si chiamano
boreliani. Si dice che B è la -algebra generata da /. Vedremo in seguito
(esercizio 3.1.8) che / contiene propriamente B.
Esercizi 1.5
1. Si verichi che linsieme
_
x
_
0,
1
_
: sin
1
x
> 0
_
è misurabile e se ne calcoli la misura esterna.
14
2. Sia E linsieme dei numeri di [0, 1] che possiedono uno sviluppo decimale
ove non compare mai la cifra 9. Si dimostri che E è misurabile e se ne
calcoli la misura esterna.
3. Per ogni x [0, 1] sia
n
nN
+ la successione delle cifre decimali di
x (scegliendo lo sviluppo innito nei casi di ambiguità). Si calcoli la
misura di Lebesgue dei seguenti insiemi:
(a) E = x [0, 1] :
n
è dispari per ogni n N
+
,
(b) F = x [0, 1] :
n
è denitivamente dispari,
(c) G = x [0, 1] :
n
è dispari per inniti indici n N
+
.
1.6 Insieme di Cantor
Per rendersi conto di quanto la nozione di misurabilità secondo Lebesgue
sia generale, e di quanto la misura esterna si discosti dallidea intuitiva di
estensione di un insieme, è utile considerare lesempio che segue.
Sia ]0,
1
3
]. Dallintervallo [0, 1] togliamo i punti dellintervallo aperto I
1
1
di
centro
1
2
e ampiezza ; dai due intervalli chiusi rimasti togliamo i due interval-
li aperti I
2
1
, I
2
2
che hanno come centri i punti medi e ampiezza
2
; dai quattro
intervalli chiusi residui togliamo i quattro intervalli aperti I
3
1
, I
3
2
, I
3
3
, I
3
4
con
centri nei punti medi ed ampiezza
3
; al passo k-simo toglieremo dai 2
k1
in-
tervalli chiusi residui le 2
k1
parti centrali aperte di ampiezza
k
. Procedendo
in questa maniera per ogni k N
+
, ciò che resta alla ne è linsieme
C
= [0, 1]
_
k=1
2
k1
_
j=1
I
k
j
,
il quale è chiuso, quindi misurabile; la sua misura è (proposizione 1.4.9)
m(C
) = 1
k=1
2
k1
j=1
k
= 1
1
2
k=1
(2)
k
=
1 3
1 2
.
Si noti che C
è privo di punti interni: infatti per ogni k N

+
esso non può
contenere intervalli di ampiezza superiore a 2
k
(perche con il solo passo k-
simo si lasciano 2
k
intervalli disgiunti di uguale ampiezza che non ricoprono
[0, 1]: tale ampiezza quindi è minore di 2
k
). In particolare, C
è totalmente
15
sconnesso, cioè la componente connessa di ogni punto x C
è x. Inoltre
C
è perfetto, ossia tutti i suoi punti sono punti daccumulazione per C
:
infatti se x C
allora per ogni k N

+
il punto x sta in uno dei 2
k
intervalli
residui del passo k-simo, per cui gli estremi di tale intervallo sono punti di
C
che distano da x meno di 2

k
.
Per = 1/3, linsieme C
1/3
(che è quello eettivamente introdotto da Cantor)
ha misura nulla. Esso si può costruire anche nel modo seguente: per ogni
x [0, 1] consideriamo lo sviluppo ternario
x =
k=1
k
3
k
,
k
0, 1, 2.
Tale sviluppo non è sempre unico: ad esempio,
1
3
si scrive come 0.02 oppure
come 0.1.
`
E facile vericare che C
1/3
è costituito dai numeri x [0, 1] che
ammettono uno sviluppo ternario in cui non compare mai la cifra 1. Cos`,
1
3
C
1/3
mentre
1
2
= 0.1 / C
1/3
(perche lo sviluppo di
1
2
è unico).
Linsieme C
1/3
, pur avendo misura esterna nulla, è pi` u che numerabile: se
infatti si avesse C
1/3
= x
(n)
nN
, con
x
(n)
=
k=1
(n)
k
3
k
,
(n)
k
0, 2,
allora scegliendo
y =
k=1
k
3
k
,
n
=
_
0 se
(n)
n
= 2
2 se
(n)
n
= 0,
avremmo y C
1/3
ma y ,= x
(n)
per ogni n, dato che la n-sima cifra ternaria
di y è diversa da quella di x
(n)
(per una stima della distanza [y x
(n)
[ si veda
lesercizio 1.6.1). Ciò è assurdo.
Esercizi 1.6
1. Con riferimento allargomentazione che mostra la non numerabilità di
C
1/3
, si provi che [y x
(n)
[ 3
n
.
2. Si costruisca un insieme misurabile E R, tale che
0 < m
(E) < , m
(E I) < l(I)
per ogni intervallo aperto non vuoto I.
16
3. Si mostri che / ha la stessa cardinalità di T(R).
4. La funzione caratteristica
C
degli insiemi di Cantor C
, denita da
(x) =
_
1 se x C
0 se x / C
,
è Riemann integrabile su [0, 1]?
1.7 Proprietà della misura di Lebesgue
Anzitutto, deniamo la misura di Lebesgue in R:
Denizione 1.7.1 La funzione di insieme
m = m
[
/
: / [0, +]
si chiama misura di Lebesgue.
Dalle proposizioni 1.3.2 e 1.4.9 segue che m è monotona, numerabilmente
additiva ed invariante per traslazioni, con m() = 0. Queste proprietà (tran-
ne linvarianza per traslazioni, legata alla geometria di R) saranno i requisiti
richiesti per denire le misure in spazi astratti.
Vediamo adesso come si comporta la misura di Lebesgue rispetto alle succes-
sioni monotone di insiemi misurabili.
Proposizione 1.7.2 Sia E
n
nN
una successione di insiemi misurabili.
(i) Se E
n
E
n+1
, allora
m
_
_
nN
E
n
_
= lim
n
m(E
n
).
(ii) Se E
n
E
n+1
e se esiste n
0
N tale che m(E
n
0
) < , allora
m
_
nN
E
n
_
= lim
n
m(E
n
).
17
Dimostrazione (i) Poniamo
F
0
= E
0
, F
n+1
= E
n+1
E
n
n N.
Allora si ha
E
N
=
N
_
n=0
F
n
,
_
nN
E
n
=
_
nN
F
n
,
e gli F
n
sono misurabili e disgiunti. Quindi, usando la numerabile additività
di m,
m
_
_
nN
E
n
_
= m
_
_
nN
F
n
_
=
nN
m(F
n
) = lim
N
N
n=0
m(F
n
) =
= lim
N
m
_
N
_
n=0
F
n
_
= lim
N
m(E
N
).
(ii) Poniamo F
n
= E
n
0
E
n
per ogni n > n
0
. Allora gli F
n
sono misurabili
e F
n
F
n+1
; inoltre
_
n=n
0
F
n
= E
n
0

n=n
0
E
n
.
Per (i) e per losservazione 1.4.6 abbiamo
m(E
n
0
) m
_

n=n
0
E
n
_
= m
_

_
n=n
0
F
n
_
=
= lim
n
m(F
n
) = lim
n
[m(E
n
0
) m(E
n
)] = m(E
n
0
) lim
n
m(E
n
).
Ne segue la tesi poiche, ovviamente,
n=n
0
E
n
=
nN
E
n
.
Osserviamo che lipotesi che esista n
0
N tale che m(E
n
0
) < è essenziale
nellenunciato (ii): se E
n
= [n, [, si ha E
n
E
n+1
, m(E
n
) = per ogni
n, ma lintersezione degli E
n
, essendo vuota, ha misura nulla.
Diamo ora unimportante caratterizzazione degli insiemi misurabili: sono
quegli insiemi E che dieriscono poco, in termini di m
, sia dagli aperti

(contenenti E), sia dai chiusi (contenuti in E).
18
Proposizione 1.7.3 Sia E un sottoinsieme di R. Sono fatti equivalenti:
(i) E /;
(ii) per ogni > 0 esiste un aperto A E tale che m
(A E) < ;
(iii) esiste un boreliano B E tale che m
(B E) = 0;
(iv) per ogni > 0 esiste un chiuso C E tale che m
(E C) < ;
(v) esiste un boreliano D E tale che m
(E D) = 0.
Dimostrazione Proveremo le due catene di implicazioni
(i) = (ii) = (iii) = (i), (i) = (iv) = (v) = (i).
(i) = (ii) Supponiamo dapprima m(E) < . Per denizione di m
,
ssato > 0 esiste un ricoprimento I
n
di E fatto di intervalli aperti, tale
che
nN
l(I
n
) < m(E) +,
cosicche, posto A =
nN
I
n
, laperto A verica, per subadditività numera-
bile,
m(A) < m(E) +;
dal fatto che m(E) < segue allora (osservazione 1.4.6)
m(A E) = m(A) m(E) < .
Sia ora m(E) = . Prendiamo un ricoprimento di R fatto di intervalli
limitati e disgiunti: ad esempio
I
2n
= [2n, 2n + 2[, I
2n+1
= [2n 2, 2n[, n = 0, 1, 2, . . . .
Posto E
n
= E I
n
, si ha m(E
n
) < ; quindi, per quanto già dimostrato,
esistono degli aperti A
n
E
n
tali che
m(A
n
E
n
) <

2
n+1
n N.
Linsieme A =
nN
A
n
è un aperto contenente E, e poiche
A E =
_
nN
A
n
_
kN
E
k

_
nN
(A
n
E
n
),
19
si conclude che
m(A E) <
nN
m(A
n
E
n
) < .
(ii) = (iii) Per ogni n sia A
n
un aperto contenente E, tale che
m
(A
n
E) <
1
n + 1
;
linsieme B =
nN
A
n
è un boreliano contenente E e si ha, per monotonia,
m
(B E) m
(A
n
E) <
1
n + 1
n N,
cioè m
(B E) = 0.
(iii) = (i) Scrivendo E = B(BE), la tesi segue dal fatto che linsieme B
è misurabile perche boreliano, mentre linsieme BE è misurabile avendo, per
ipotesi, misura esterna nulla (proposizione 1.4.3). Dunque E è misurabile.
(i) = (iv) = (v) = (i) Queste implicazioni si dimostrano facilmente
applicando ad E
c
gli enunciati già dimostrati.
Le proprietà (ii) (v) della proposizione precedente si sintetizzano dicendo
che la misura di Lebesgue è una misura regolare.
Esercizi 1.7
1. Dimostrare che se E, F sono sottoinsiemi misurabili di R, si ha
m(A B) +m(A B) = m(A) +m(B).
2. Si provi che per ogni successione E
n
nN
T(R) tale che E
n
E
n+1
risulta
m
_
_
nN
E
n
_
= lim
n
m
(E
n
).
[Traccia: una disuguaglianza è banale. Per laltra, si può supporre
lim
n
m
(E
n
) < ; scelto un aperto A
n
E
n
in modo che m(A
n
) <
m
(E
n
) + 2
n1
, sia F
n
=
n
k=0
A
k
; si mostri per induzione che
m(F
n
) < m
(E
n
) +
n
k=0
2
k1
. Poiche m(F
n
) m
_
kN
A
k
_
, se
ne deduca che m
_
nN
E
n
_
lim
n
m
(E
n
) +.]
20
3. Sia E
n
una successione di insiemi misurabili di R. Linsieme E
t
degli
x R tali che x E
n
per inniti valori di n si chiama massimo limite
della successione E
n
e si scrive E
t
= limsup
n
E
n
, mentre linsieme
E
tt
degli x R tali che x E
n
denitivamente si chiama minimo limite
di E
n
e si scrive E
tt
= liminf
n
E
n
.
(i) Si verichi che
limsup
n
E
n
=
n=0
_
m=n
E
m
, liminf
n
E
n
=
_
n=0
m=n
E
m
.
(ii) Si provi che
m
_
liminf
n
E
n
_
liminf
n
m(E
n
),
e che se m(
n=0
E
n
) < allora
m
_
limsup
n
E
n
_
limsup
n
m(E
n
).
(iii) Si mostri che la seconda disuguaglianza è in generale falsa se
m(
n=0
E
n
) = .
(iv) Si verichi che liminf
n
E
n
limsup
n
E
n
e si provi che
se la successione E
n
è monotona rispetto allinclusione, allora
liminf
n
E
n
= limsup
n
E
n
.
4. Provare che se E / è un insieme di misura positiva, allora per ogni
t [0, m(E)] esiste un insieme boreliano B
t
E tale che m(B
t
) = t.
5. Sia E un sottoinsieme di R. Si provi che esiste un boreliano B, in-
tersezione numerabile di aperti, che contiene E ed è tale che m(B) =
m
(E).
6. Sia E un sottoinsieme di R con m
(E) < . Si provi che E è misurabile

secondo Lebesgue se e solo se
m
(E) = supm(B) : B B, B E.
Si mostri anche che se m
(E) = lenunciato precedente è falso.

21
7. Sia E R un insieme tale che m
(E) < . Si provi che E è misurabile

secondo Lebesgue se e solo se per ogni > 0 esiste una famiglia nita
di intervalli disgiunti I
1
, . . . , I
N
tali che
m
_
E
N
_
i=1
I
i
_
< ,
ove AB = (AB) (BA) è la dierenza simmetrica fra gli insiemi
A, B R.
[Traccia: per la necessità, approssimare E con aperti dallesterno e
ricordare che ogni aperto è unione al pi` u numerabile di intervalli di-
sgiunti. Per la sucienza: (a) selezionare un aperto A E tale
che m(A) < m
(E) + ; (b) posto F = A

_
N
i=1
I
i
_
, vericare che
m
(F E) < ; (c) utilizzando le inclusioni A E (A F) (F E)

e E F (E F), provare che m
(A E) < 3.]
1.8 Un insieme non misurabile
La -algebra / degli insiemi Lebesgue misurabili è molto vasta, ma non
esaurisce la classe di tutti i sottoinsiemi di R. Tuttavia, per esibire un insieme
non misurabile non si può fare a meno del seguente
Assioma della scelta Per ogni insieme non vuoto X esiste una funzione
di scelta f : T(X) X tale che f(E) E per ogni E T(X) .
In altre parole, lassioma della scelta dice che è possibile selezionare, per
mezzo della funzione f, esattamente un elemento da ciascun sottoinsieme di
X. La cosa sarebbe banale se X avesse cardinalità nita, e facile se X fosse
numerabile (esercizio 1.8.5), ma per insiemi di cardinalità pi` u alta questa
proprietà non è altrimenti dimostrabile.
Linsieme che andiamo a costruire fu introdotto da Vitali. Consideriamo in
[0, 1] la relazione di equivalenza
x y x y Q.
Vi è uninnità pi` u che numerabile di classi di equivalenza, ognuna delle
quali contiene uninnità numerabile di elementi. Costruiamo un insieme
V prendendo, grazie allassioma della scelta, esattamente un elemento da
ciascuna classe di equivalenza: V è un sottoinsieme pi` u che numerabile di
22
[0, 1].
Sia ora q
n
nN
una numerazione di Q[1, 1], e sia V
n
= V +q
n
. Notiamo
che V
n
V
m
= se n ,= m: infatti se x V
n
V
m
allora x = a +q
n
= b +q
m
con a, b V ; di qui segue a b = q
m
q
n
Q, da cui (per come è stato
costruito V ) a = b. Ne deduciamo q
n
= q
m
, ed inne n = m. Notiamo anche
che valgono le inclusioni
[0, 1]
_
n=0
V
n
[1, 2],
e quindi, per la monotonia di m
,
1 m
_
n=0
V
n
_
3.
Se V fosse misurabile secondo Lebesgue, anche i suoi traslati V
n
sarebbero
misurabili ed avrebbero la stessa misura; per ladditività numerabile di m si
ricaverebbe
m
_
_
n=0
V
n
_
=
n=0
m(V
n
) =
n=0
m(V ) =
_
0 se m(V ) = 0
+ se m(V ) > 0,
e ciò contraddice il fatto che la misura di
n=0
V
n
è compresa fra 1 e 3.
Pertanto V non può essere misurabile.
Esercizi 1.8
1. Dimostrare che per ogni ]0, +] esiste un sottoinsieme U [0, [,
non misurabile secondo Lebesgue, tale che m
(U) = .
2. Dato un insieme misurabile E R di misura positiva, si provi che
esiste un sottoinsieme W E che non è Lebesgue misurabile.
3. Sia V
n
= V +q
n
, come nella costruzione dellinsieme non misurabile di
Vitali. Posto E
n
=
m=n
V
m
, si provi che
m
(E
n
) < , E
n
E
n+1
n N, lim
n
m
(E
n
) > m
n=0
E
n
_
.
23
4. Siano V, W sottoinsiemi di R non misurabili, disgiunti e tali che V W
sia misurabile. Si provi che se m(V W) < allora
m(V W) < m
(V ) +m
(W).
5. Dato un insieme numerabile X, si costruisca una funzione di scelta per
X.
24
Capitolo 2
Misure
2.1 Spazi misurati
La misura di Lebesgue è il modello concreto a cui si ispira la nozione astratta
di misura che stiamo per introdurre. Lo studio delle misure astratte ha svaria-
te applicazioni in analisi funzionale, in probabilità, in calcolo delle variazioni
ed in altri campi ancora.
Denizione 2.1.1 Uno spazio misurabile è una coppia (x, T), ove X è un
insieme e T è una -algebra di sottoinsiemi di X. I sottoinsiemi di X che
appartengono a T si dicono misurabili.
Uno spazio misurato è una terna (X, T, ), ove X è un insieme, T è una
-algebra di sottoinsiemi di X, e : T [0, ] è una misura, ossia una
funzione di insieme tale che
(i) () = 0,
(ii) se E
n
nN
T è una successione di insiemi disgiunti, allora
_
_
nN
E
n
_
=
nN
(E
n
).
Lo spazio misurato si dice completo, e la misura si dice completa, se ogni
sottoinsieme di un insieme di T di misura nulla è a sua volta in T (ed ha
misura nulla, come seguirà dalla proposizione 2.1.4).
Lo spazio misurato si dice nito, e la misura si dice nita, se si ha (X) <
+; si dice -nito, e si dice -nita, se X è unione numerabile di insiemi
misurabili di misura nita.
25
Osservazione 2.1.2 Se nella denizione 2.1.1 si sceglie in (ii) E
n
= per
ogni n N, si deduce che () = 0 oppure () = +. Dunque la condizione
(i) non è in generale conseguenza di (ii).
Vediamo qualche esempio.
Esempi 2.1.3 (1) (R, /, m) è uno spazio misurato completo e -nito.
Pure (R, B, m[
B
) è uno spazio misurato; esso è ancora -nito ma non è
completo, perche non tutti i sottoinsiemi di un boreliano di misura nulla
sono boreliani, come vedremo pi` u in là. La misura m[
B
è detta misura di
Borel.
(2) Se A R è un insieme misurabile secondo Lebesgue, la funzione (E) =
m(AE) è una misura su /; (R, /, ) è uno spazio misurato -nito, ed è
nito se e solo se m(A) < . Tutti gli insiemi disgiunti da A hanno misura
nulla, quindi in generale questo spazio misurato non è completo. Si dice che
la misura è concentrata sullinsieme A.
(3) (Misura di Lebesgue-Stieltjes) Sia g : R R una funzione crescente e
continua a sinistra, cioè tale che lim
xx
0
g(x) = g(x
0
) per ogni x
0
R. Ripe-
tiamo la procedura seguita per costruire la misura di Lebesgue su R, con luni-
ca dierenza di attribuire agli intervalli una diversa lunghezza: precisamente,
deniamo la lunghezza l
g
sugli intervalli aperti a destra, ponendo
l
g
([a, b[) = g(b) g(a),
e convenendo di porre g() = lim
x
g(x).
Poi introduciamo la misura esterna
g
su T(R) in analogia con il caso di m
,
cioè denendo
g
(E) = inf
_
nN
l
g
(I
n
) : E
_
nN
I
n
, I
n
intervalli aperti a destra
_
.
Dopo aver provato, in perfetta analogia con il caso di m
, che
g
è monotona
e numerabilmente subadditiva, si introduce la classe /
g
degli insiemi
g
-
misurabili:
/
g
= E R :
g
(A) =
g
(A E) +
g
(A E
c
) A R.
Si verica, come per il caso della misura di Lebesgue, che /
g
è una -algebra
contenente i boreliani, ed inne si denisce la misura di Lebesgue-Stieltjes
g
26
come la restrizione di
g
alla classe /
g
. Si dimostra allora, senza modiche
rispetto al caso di m, che (R, /
g
,
g
) è uno spazio misurato completo e -
nito (è nito se e solo se la funzione g è limitata su R).
Questa stessa costruzione si può fare in un ssato intervallo [a, b] R per
ogni funzione g : [a, b[R crescente e continua a sinistra (e non è restrittivo
supporre che g(a) = 0): la corrispondente misura di Lebesgue-Stieltjes sarà
nita quando lim
tb
g(t) < +, mentre sarà -nita allorche tale limite
vale +. Nel primo caso, ponendo
g
(b) = 0, la misura
g
viene estesa a
tutto [a, b], o pi` u precisamente alla -algebra /
g
T([a, b]) denita da
/
g
= /
g
E b : E /
g
.
Ritroveremo questa famiglia di misure pi` u avanti nel corso.
(4) Sia X un insieme innito, e poniamo per ogni E T(X)
n(E) =
_
#(E) se E è un insieme nito
+ se E è un insieme innito,
ove #(E) denota la cardinalità di E. (X, T(X), n) è uno spazio misurato;
esso è completo, ed è -nito se e solo se X è numerabile.
(5) (Misura di Dirac) Sia X un insieme non vuoto, sia x X. Per ogni
E T(X) poniamo
x
(E) =
_
0 se x / E
1 se x E.
(X, T(X),
x
) è uno spazio misurato completo e nito.
(6) Uno spazio misurato (X, T, ) tale che (X) = 1 si chiama spazio proba-
bilizzato, la misura si chiama probabilità e gli elementi di T sono gli eventi.
Il numero (E) [0, 1] è la probabilità che levento E si realizzi; se in parti-
colare (E) = 1 si dice che levento E è vericato quasi certamente.
(7) Sia a
n
nN
una successione di numeri non negativi tali che la serie
nN
a
n
sia convergente. Per ogni E T(N) sia
(E) =
nE
a
n
.
(N, T(N), ) è uno spazio misurato completo e nito. Se si normalizza la
successione a
n
ponendo
p
n
=
a
n
kN
a
k
,
27
la misura (E) =
nE
p
n
è una probabilità discreta.
(8) Sia X un insieme pi` u che numerabile, e sia
T = E X : E, oppure E
c
, è numerabile;
si verica subito che T è una -algebra. Per E T poniamo
(E) =
_
0 se E è numerabile
+ se E
c
è numerabile.
`
E facile vericare che è una misura; lo spazio misurato (X, T, ) è completo
ma non -nito.
Si estendono al caso astratto le tipiche proprietà dimostrate nel caso della
misura di Lebesgue. In particolare:
Proposizione 2.1.4 Sia (X, T, ) uno spazio misurato. Allora è mono-
tona su T, cioè (E) (F) per E, F T ed E F.
Dimostrazione Essendo F = E (F E), la tesi segue dalladditività e
positività di .
Proposizione 2.1.5 Sia (X, T, ) uno spazio misurato e sia E
n
nN
T.
(i) Se E
n
E
n+1
per ogni n, allora
_
_
nN
E
n
_
= lim
n
(E
n
).
(ii) Se E
n
E
n+1
per ogni n, ed esiste n
0
N tale che (E
n
0
) < , allora
nN
E
n
_
= lim
n
(E
n
).
Dimostrazione Come nel caso della misura di Lebesgue (proposizione
1.7.2).
28
Esercizi 2.1
1. Sia (X, T, ) uno spazio misurato non completo. Si consideri la famiglia
T
0
= E = A B : A T, B B
0
, ove B
0
T e (B
0
) = 0,
e si provi che T
0
è una -algebra. Si denisca poi
0
(A B) = (A) E = A B T
0
;
si verichi che
0
è ben denita, che
0
[
T
= , che
0
è una misura su
T
0
e che (X, T
0
,
0
) è uno spazio misurato completo. Si mostri inoltre
che se (X, T, ) è -nito, anche (X, T
0
,
0
) è -nito.
2. Sia X un insieme pi` u che numerabile, sia T la -algebra dellesempio
2.1.3 (8), e deniamo per E T
(E) =
_
0 se E è numerabile
1 se E
c
è numerabile.
Si provi che (X, T, ) è uno spazio misurato completo e nito.
3. Sia
n
una successione di misure denite su una -algebra T, tale
che
n
(E)
n+1
(E) per ogni n N e per ogni E T. Si provi che
la funzione
(E) = lim
n
n
(E) E T
è una misura su T.
4. Sia X un insieme e sia X
n
una famiglia di sottoinsiemi disgiunti di X
la cui unione è X. Per ogni n N sia T
n
una -algebra di sottoinsiemi
di X
n
. Posto
T =
_
_
nN
E
n
: E
n
T
n
_
,
si provi che T è una -algebra di sottoinsiemi di X.
5. Sia (X, T, ) uno spazio misurato. Se A, B, C sono elementi di T con
A C e B C, e se (A) = (C) < , si mostri che
(A B) = (B).
29
6. Sia (X, T, ) uno spazio misurato nito. Deniamo su T la relazione
E F (E F) = 0,
ove E F = (E F) (F E) è la dierenza simmetrica fra E ed F
denita nellesercizio 1.7.7.
(i) Si verichi che è una relazione di equivalenza.
(ii) Posto = T/ , si provi che
d(E, F) = (E F)
è una distanza su .
(iii) Si dimostri che (, d) è uno spazio metrico completo.
[Traccia: per (iii), data una successione di Cauchy E
n
, si provi
che per unopportuna sottosuccessione E
n
k
si ha (E
m
E
n
k
) < 2
k
per ogni m > n
k
, e se ne deduca che (E
n
k
E) 0 per k ,
ove E = limsup
k
E
n
k
(v. esercizio 1.7.3); a questo scopo, può essere
utile notare che
k=m
(E
n
k
E
n
h
) (E
nm
E
n
h
)
k=m+1
(E
n
k
E
n
k1
).]
7. Per ogni n N sia
E
n
=
_
z = re
i
C : 0 r 1, /
_
kZ
](s
n
+ 2k), (s
n+1
+ 2k)[
_
,
ove s
0
= 0, s
n
=
n
k=1
1
k
. Determinare gli insiemi limsup
n
E
n
e
liminf
n
E
n
.
8. Si provi che non si può costruire alcuna misura su R in modo che
valgano le proprietà 1, 2, 3 e 4 del paragrafo 1.2.
9. Sia : / [0, ] una misura tale che:
(i) ([0, 1]) = [0, +[, (ii) è invariante per traslazioni.
Si provi che = m, ove m è la misura di Lebesgue.
30
2.2 Misura di Lebesgue in R
N
Per denire la misura di Lebesgue in R
N
occorre ripetere la procedura svolta
nel Capitolo 1 e riassunta nellesempio 2.1.3 (3). Si denisce anzitutto il vo-
lume N-dimensionale dei parallelepipedi R =
N
i=1
I
i
, ove gli I
i
sono intervalli
di R:
v
N
(R) =
N
i=1
l(I
i
),
con la convenzione che 0 = 0, necessaria ad attribuire volume nullo, ad
esempio, ai sottospazi k-dimensionali di R
N
.
Poi si introduce la misura esterna N-dimensionale m
N
di un arbitrario insie-
me E R
N
:
m
N
(E) = inf
_
nN
v
N
(R
n
) : E
_
nN
R
n
, R
n
parallelepipedi aperti
_
.
Si osserva che la denizione di m
N
non cambia se i ricoprimenti sono fatti
con parallelepipedi qualsiasi anziche aperti, e si verica che m
N
estende v
N
,
ed è monotona, nulla sullinsieme vuoto, numerabilmente subadditiva ed in-
variante per traslazioni.
A questo punto si introduce la classe /
N
degli insiemi misurabili:
/
N
= E R
N
: m
N
(A) = m
N
(A E) +m
N
(A E
c
) A R
N
,
la quale è una -algebra contenente i parallelepipedi, e quindi anche gli aperti
ed i chiusi. Dunque /
N
contiene la -algebra B
N
dei boreliani di R
N
.
Si denisce inne la misura di Lebesgue in R
N
come la restrizione di m
N
a
/
N
:
m
N
(E) = m
N
(E) E /
N
,
e si dimostra che m
N
è numerabilmente additiva. Quindi (R
N
, /
N
, m
N
)
è uno spazio misurato che risulta completo e -nito. Tutte queste cose si
provano esattamente come nel caso della misura di Lebesgue unidimensionale.
Ritroveremo poi la misura m
N
come misura prodotto di N copie della
misura di Lebesgue m, e ciò ci permetterà di dare una formula per il calcolo
degli integrali multipli come integrali semplici iterati.
31
Esercizi 2.2
1. Si denisca
1 = E F : E, F /.
(i) Si verichi che 1 non è unalgebra, ma che la famiglia / costituita
dalle unioni nite di elementi di 1 lo è.
(ii) Detta / / la -algebra generata da / (ossia la minima -
algebra che contiene /), si provi che se A // allora
x R : (x, y) A / y R,
y R : (x, y) A / x R.
(iii) Si provi che la -algebra //è contenuta propriamente in /
2
.
2. Dimostrare che
m
N
(tE) = t
N
m
N
(E) E R
N
, t 0.
2.3 Misure esterne di Hausdor
La misura di Lebesgue in R
N
non fa distinzioni fra i suoi sottoinsiemi mi-
surabili di misura nulla: un iperpiano (N 1)-dimensionale, il sostegno di
una curva, una k-varietà sono tutti insiemi trascurabili rispetto a m
N
. Le
misure di Hausdor H
p
(ove p > 0) permettono invece di catalogare gli
insiemi di misura nulla attribuendo loro una dimensione che può essere
intera (1 per il sostegno di una curva, k per le k-varietà) od anche non intera
nel caso di certi insiemi frattali (esempio 2.5.3).
Come la misura di Lebesgue, le misure di Hausdor si costruiscono tramite
i ricoprimenti: tuttavia la nozione base non è quella di volume, ma quella di
diametro di un insieme.
Denizione 2.3.1 Se E R
N
, il diametro di E è il numero (eventualmente
+)
diam E =
_
0 se E =
sup[x y[
N
: x, y E se E ,= .
32
Per denire le misure di Hausdor bisogna ancora una volta cominciare dalle
misure esterne. Siano p, > 0 e consideriamo per ogni E R
N
le quantità
H
p,
(E) = inf
_
nN
(diam U
n
)
p
: E
_
nN
U
n
, U
n
aperti, diam U
n
<
_
.
Per misurare bene gli insiemi frastagliati quelli che contano sono i ricopri-
menti con diametri piccoli: infatti pi` u è piccolo, pi` u la quantità H
p,
(E) è
grande, essendo lestremo inferiore di un insieme pi` u piccolo. La valutazione
ottimale della misura di E si otterrà al limite per 0
+
(vedere anche
lesercizio 2.3.5).
Denizione 2.3.2 Sia p > 0. La misura esterna di Hausdor H
p
(E) è la
quantità
H
p
(E) = lim
0
+
H
p,
(E) = sup
>0
H
p,
(E) E R
N
.
Si noti che, in eetti, la denizione di H
p
dipende anche da N, cioè dalla
dimensione dello spazio ambiente, perche coinvolge luso di aperti di R
N
;
daltronde questo fatto è irrilevante, nel senso che le misure esterne di Hau-
sdor di indice p costruite su R
N
e su R
M
coincidono per p minN, M
(esercizio 2.3.2). Nel seguito, comunque, prenderemo in considerazione solo
i sottoinsiemi di R
N
, con N ssato.
Come conseguenza immediata della denizione si ha:
Proposizione 2.3.3 Sia p > 0. Allora:
(i) H
p
(E) 0 E R
N
;
(ii) H
p
() = H
p
(x) = 0 x R
N
;
(iii) H
p
è monotona.
Dimostrazione (i) Evidente.
(ii) Un ricoprimento di e di x è la famiglia costituita dalla sola palla
B(x,

3
) il cui diametro è minore di ; dunque
lim
0
+
H
p,
() = lim
0
+
H
p,
(x) = 0.
(iii) Se E F, ogni ricoprimento che concorre a denire H
p,
(F) concorre
anche a denire H
p,
(E); quindi H
p,
(E) H
p,
(F) per ogni > 0, da cui
H
p
(E) H
p
(F).
33
Proposizione 2.3.4 Sia p > 0. Allora:
(i) H
p
(E +x) = H
p
(E) x R
N
, E R
N
;
(ii) H
p
(tE) = t
p
H
p
(E) t > 0, E R
N
.
Dimostrazione Si verica facilmente che
H
p,
(E +x) = H
p,
(E), H
p,
(tE) = t
p
H
p,
t
(E) > 0,
da cui la tesi per 0
+
.
Si verica inoltre (esercizio 2.3.4) che la denizione di H
p
(E) non cambia se
i ricoprimenti di E si prendono qualsiasi, anziche costituiti da aperti. Inne:
Proposizione 2.3.5 Sia p > 0. Allora H
p
è numerabilmente subadditiva.
Dimostrazione Si prova, esattamente come per la misura esterna di Lebe-
sgue, che
H
p,
_
_
nN
E
n
_
nN
H
p,
(E
n
) E
n
nN
T(R
N
);
osservando poi che
H
p,
(E) H
p
(E) > 0, E R
N
,
al limite per 0
+
si ha la tesi.
Esercizi 2.3
1. Siano A, B sottoinsiemi di R
N
. Si provi che se A B ,= , allora
diam A B diam A + diam B.
2. Siano N, M N
+
con N < M, e sia p N. Si provi che per ogni
sottoinsieme E R
N
le misure esterne di Hausdor di indice p costruite
su R
N
e su R
M
coincidono.
3. Si provi che per ogni p > 0 i sottoinsiemi numerabili di R
N
hanno
misura esterna H
p
nulla.
34
4. Si provi che la quantità H
p
(E) non cambia se si considerano ricopri-
menti di E costituiti da insiemi arbitrari anziche aperti.
[Traccia: indicando con H
p,
(E) la quantità ottenuta con luso di ri-
coprimenti fatti di insiemi arbitrari, si osservi che H
p,
(E) H
p,
(E);
daltra parte, se V
n
è un arbitrario ricoprimento di E con 0 <
diam V
n
< e tale che
nN
(diam V
n
)
p
< H
p,
(E) + , si conside-
ri laperto U
n,k
= x R
N
: dist(x, V
n
) <
1
k
e si provi che per k = k
n
opportuno si ha diam U
n,kn
((diam V
n
)
p
+2
n1
)
1/p
. Pertanto il rico-
primento aperto U
n,kn
è tale che
nN
(diam U
n,kn
)
p
H
p,
(E)+2);
se ne deduca la tesi.]
5. Si consideri la denizione di H
p,
nel caso p = 0, con lavvertenza di
porre H
0,
() = 0 e di prendere ricoprimenti niti o numerabili, ma con
aperti non vuoti. Si descriva la misura esterna H
0
.
6. Sia
H
p
(E) = inf
_
nN
(diam U
n
)
p
: E
_
nN
U
n
_
;
si provi che H
p
(E) H
p
(E) per ogni E R
N
, ma che in generale non
vale luguaglianza.
7. Dimostrare che H
1
(E) = m
(E) per ogni E R.

[Traccia: si verichi che m
(E) H
1
(E) . Per provare laltra disugua-
glianza si consideri dapprima il caso in cui E è un intervallo limitato, e
poi si passi al caso generale usando la numerabile subadditività di H
1
.]
8. Siano E, F R
N
tali che
dist(E, F) = inf[x y[
N
: x E, y F > 0.
Si provi che
H
p
(E F) = H
p
(E) +H
p
(F).
[Traccia: si provi che vale luguaglianza per la funzione H
p,
, non
appena è sucientemente piccolo.]
9. Sia S il segmento di estremi x, y, con x, y R
N
ssati. Si provi che
H
p
(S) =
_
_
_
0 se p > 1
[x y[
N
se p = 1
+ se 0 0.
12. Sia (X, d) uno spazio metrico. Se E X è un insieme non vuoto, il
diametro di E è denito, analogamente al caso di R
N
, da
diam(E) = sup
x,yE
d(x, y).
(i) Se A
n
nN
è una successione di sottoinsiemi di X tale che A
n

A
n+1
per ogni n N, si provi che
diam
_
_
nN
A
n
_
= lim
n
diam(A
n
).
(ii) Se A
n
nN
è una successione di sottoinsiemi di X tale che A
n

A
n+1
per ogni n N, si provi che
diam
_
nN
A
n
_
lim
n
diam(A
n
).
(iii) Si trovi un esempio in cui A
n
A
n+1
per ogni n N e
diam
_
nN
A
n
_
< lim
n
diam(A
n
).
2.4 Misure di Hausdor
Introduciamo adesso gli insiemi misurabili rispetto alla misura di Hausdor
di indice p.
Denizione 2.4.1 La classe degli insiemi H
p
-misurabili è
H
p
= E R
N
: H
p
(A) = H
p
(A E) +H
p
(A E
c
) A R
N
.
Naturalmente, in questa denizione quella che conta è la disuguaglianza ().
Come si è fatto per la classe /, si verica che H
p
è una -algebra e che la
misura di Hausdor di indice p, denita da H
p
= H
p
[
1p
, è numerabilmente
additiva sugli elementi di H
p
. Inoltre, H
p
contiene i boreliani di R
N
: ciò è
conseguenza della seguente
36
Proposizione 2.4.2 I parallelepipedi di R
N
sono elementi di H
p
per ogni
p > 0.
Dimostrazione Ogni parallelepipedo P R
N
può scriversi come unio-
ne numerabile di parallelepipedi chiusi e limitati; quindi basta provare che
ogni parallelepipedo chiuso e limitato, dunque del tipo P =
N
i=1
[a
i
, b
i
],
appartiene a H
p
. Poniamo
P
n
=
N
i=1
_
a
i
1
n + 1
, b
i
+
1
n + 1
_
, n N,
e sia A un insieme test. Occorre provare la disuguaglianza
H
p
(A) H
p
(A P) +H
p
(A P
c
),
che è ovvia se H
p
(A) = ; supporremo quindi H
p
(A) < .
Notiamo che, detto A
n
= A P
c
n
, si ha
A
n
A
n+1
, dist(A
n
, P) > 0 n N,
_
nN
A
n
= A P
c
.
Dunque, per la monotonia di H
p
e per lesercizio 2.3.8,
H
p
(A) H
p
((A P) A
n
) = H
p
(A P) +H
p
(A
n
) n N,
da cui, essendo A
n
A
n+1
per ogni n,
H
p
(A) H
p
(A P) + lim
n
H
p
(A
n
).
Mostriamo che
lim
n
H
p
(A
n
) H
p
(A P
c
);
ciò proverà la relazione
H
p
(A) H
p
(A P) +H
p
(A P
c
),
e quindi la tesi.
Poniamo D
n
= A
n+1
A
n
: allora per ogni n N si ha luguaglianza
A P
c
= A
n
_
k=n
D
k
,
37
e dunque, per la numerabile subadditività di H
p
,
H
p
(A P
c
) H
p
(A
n
) +
k=n
H
p
(D
k
) n N.
Vericheremo fra poco che la serie
k=0
H
p
(D
k
) è convergente; quindi pas-
sando al limite per n si ricava
H
p
(A P
c
) lim
n
H
p
(A
n
),
come si voleva.
Proviamo la convergenza della serie
k=0
H
p
(D
k
): scriviamo
m
k=0
H
p
(D
k
) =
[
m
2
]
k=0
H
p
(D
2k
) +
[
m1
2
]
k=0
H
p
(D
2k+1
), m N,
ed osserviamo che dist(D
k
, D
k+2
) > 0 per ogni k N. Quindi utilizzando
nuovamente lesercizio 2.3.8 otteniamo
[
m
2
]
k=0
H
p
(D
2k
) = H
p
_
_
_
[
m
2
]
_
k=0
D
2k
_
_
_
,
[
m1
2
]
k=0
H
p
(D
2k+1
) = H
p
_
_
_
[
m1
2
]
_
k=0
D
2k+1
_
_
_
.
Essendo inoltre
_
_
_
[
m
2
]
_
k=0
D
2k
_
_
_
_
_
_
[
m1
2
]
_
k=0
D
2k+1
_
_
_
=
m
_
k=0
D
k
A
m+1
A,
si deduce nalmente che
m
k=0
H
p
(D
k
) H
p
(A) < .
La misurabilità del parallelepipedo P è completamente dimostrata.
Esercizi 2.4
1. Sia : [a, b] R
N
una curva semplice di classe C
1
con sostegno .
Si provi che H
1
e che H
1
() = ().
[Traccia: si osservi anzitutto che è chiuso, quindi sta in H
1
. Per
provare (), ssato > 0 si mostri che se : a = t
0
< t
1
< . . . <
38
t
m
= b è una suddivisione di [a, b] sucientemente ne, allora si ha
[(t
i
) (t
i1
)[
N
< e, per ogni i, la palla B
i
di centro
(t
i
)+(t
i1
)
2
e diametro [(t
i
) (t
i1
)[
N
contiene
i
= ([t
i1
, t
i
]). Se ne deduca
che se è piccolo si ha H
1,
() (). Per provare , ssato > 0 si
determini > 0 ed un ricoprimento U
n
di con diam U
n
< , tale che
n
diam U
n
< H
1
() +. Si estragga un opportuno sottoricoprimento
nito U
n
1
, . . . , U
nm
e si costruisca una suddivisione : a = t
0
<
t
1
< . . . < t
m
= b tale che
m
i=1
[(t
i
) (t
i1
)[
N

m
i=1
diam U
n
i
;
si concluda, utilizzando la continuità di
t
, che se è sucientemente
piccolo si ha () H
1
() + 2.]
2.5 Dimensione di Hausdor
Analizziamo adesso il comportamento di H
p
al variare di p > 0. Notiamo
anzitutto che, per lesercizio 2.3.11, H
N+
(E) = 0 per ogni E R
N
e per
ogni > 0; quindi ci interessano i valori di p compresi fra 0 e N.
Proposizione 2.5.1 Sia E R
N
e sia p ]0, N]. Risulta:
(i) se H
p
(E) < , allora H
q
(E) = 0 per ogni q ]p, N];
(ii) se H
p
(E) > 0, allora H
q
(E) = per ogni q ]0, p[.
Dimostrazione Sia U
n
un ricoprimento aperto di E. Se s > r > 0 e se
diam U
n
< si ha
nN
(diam U
n
)
s
<
sr
nN
(diam U
n
)
r
,
cosicche
H
s,
(E)
sr
H
r,
(E) s > r > 0.
I due enunciati seguono allora facilmente, scegliendo r = p e s = q nel primo
caso, r = q e s = p nel secondo.
Dunque, per ogni E R
N
la funzione p H
p
(E) decresce con p, nel
senso che, se non è identicamente H
p
(E) = 0, esiste p
0
]0, N] tale che
H
p
(E)
_
_
_
= se p ]0, p
0
[
[0, ] se p = p
0
= 0 se p > p
0
.
Questo comportamento di H
p
ci induce alla seguente
39
Denizione 2.5.2 Si chiama dimensione di Hausdor di un sottoinsieme E
di R
N
, e si indica con dim
H
(E), il numero
dim
H
(E) = infp > 0 : H
p
(E) = 0.
Ovviamente, la dimensione di Hausdor di un sottoinsieme di R
N
è compresa
fra 0 e N (estremi inclusi).
Esempio 2.5.3 Calcoliamo la dimensione di Hausdor dellinsieme di Can-
tor C = C
1/3
introdotto nel paragrafo 1.6. Anzitutto osserviamo che si ha
C = C
1
C
2
, con C
1
e C
2
copie di C rimpicciolite di un fattore
1
3
: pre-
cisamente si ha C
1
=
1
3
C e C
2
= C
1
+
2
3
. Per la proposizione 2.3.4(ii) si
deduce H
p
(C) = H
p
(C
1
) + H
p
(C
2
) =
2
3
p
H
p
(C), e quindi se H
p
(C) ]0, [
deve essere
2
3
p
= 1, cioè p =
log 2
log 3
.
Poniamo allora D =
log 2
log 3
. Proveremo che D è davvero la dimensione di Hau-
sdor di C facendo vedere che H
D
(C) = 1.
Sia > 0: poiche dist(C
1
, C
2
) > 0, risulta per omotetia e traslazione
H
D,/3
(C) = H
D,/3
(C
1
) +H
D,/3
(C
2
) =
= H
D,/3
(
1
3
C) +H
D,/3
(C
1
+
2
3
) =
=
1
3
D
H
D,
(C) +
1
3
D
H
D,
(C) = H
D,
(C).
Ci` o implica che la quantità H
D,
(C) non dipende da , e pertanto H
D
(C) =
lim
0
+ H
D,
(C) = H
D,1
(C). Scegliendo il ricoprimento costituito dal singolo
aperto ] , 1 + [ si vede immediatamente che H
D,1
(C) 1 + 2 per ogni
> 0: si conclude che H
D
(C) 1.
Dimostriamo che H
D
(C) 1. A questo scopo, sia > 0. Fissato > 0,
esiste un ricoprimento aperto U
n
nN
di C tale che
diam(U
n
) < n N,
n=0
(diam(U
n
))
D
< H
D,
(C) +.
Andiamo a costruire un ricoprimento aperto nito W
1
, . . . , W
N
di C (con
diam(W
i
) non necessariamente minore di ), tale che
1
N
i=1
(diam(W
i
))
D
n=0
(diam(U
n
))
D
.
40
Fatto ciò, la tesi si otterrà osservando che
1
n=0
(diam(U
n
))
D
< H
D,
(C) H
D
(C) > 0.
Per costruire i W
i
, anzitutto estraiamo da U
n
nN
, per compattezza, un
sottoricoprimento nito U
t
1
, . . . , U
t
h
; si può anche supporre che esso sia
minimale, nel senso che, togliendo uno degli U
t
j
, gli altri non ricoprono pi` u
C. Consideriamo laperto U
t
1
U
t
2
: se esso è non vuoto, sostituiamo la coppia
U
t
1
, U
t
2
con il singolo aperto V
1
= U
t
1
U
t
2
. Si ha allora, essendo 0 < D < 1,
(diam(V
1
))
D
(diam(U
t
1
) + diam(U
t
2
))
D
(diam(U
t
1
))
D
+ (diam(U
t
2
))
D
;
iterando questo argomento con la coppia V
1
, U
t
3
, e cos` via, si genera un
nuovo ricoprimento nito V
1
, . . . , V
N
di C, fatto di aperti disgiunti, tale
che
N
k=1
(diam(V
k
))
D
n=0
(diam(U
n
))
D
.
Adesso osserviamo che laperto
N
k=1
V
k
contiene C, e che C =
k=0
C
k
,
ove C
k
è ciò che resta dopo il k-simo passo nella costruzione dellinsieme
di Cantor: ricordiamo che C
k
=
2
k
j=1
J
k
j
, ove gli J
k
J
sono intervalli chiusi
disgiunti, di ampiezza 3
k
, tali che dist(J
k
j
, J
k
j+1
) 3
k
; in particolare si ha
C
k
C
k+1
per ogni k N.
Un facile ragionamento mostra che deve esistere N tale che
N
k=1
V
k
C
.
Poiche C
ha 2
componenti connesse, e gli aperti V

k
sono disgiunti, ciascuna
componente connessa di C
deve essere coperta da un singolo V

k
, cosicche si
ha necessariamente N 2
.
Daltra parte, se un ssato V
k
ricopre J
j
J
j+1
, si avrà in particolare
diam(V
k
) diam(J
j
) + diam(J
j+1
) + dist(J
j
, J
j+1
) 3
1
.
Sostituiamo allora V
k
con una coppia di aperti disgiunti W
1
e W
2
, tali che
W
1
J
j
, W
2
J
j+1
, diam(W
1
) < 3
+, diam(W
2
) < 3
+,
ove > 0 è scelto in modo che si abbia
(diam(W
1
))
D
+ (diam(W
2
))
D
< (diam(V
k
))
D
.
41
Ciò è possibile poiche, scelto ]0, diam(V
k
) 3
1
[, si verica facilmente
che vale la relazione
(diam(W
1
))
D
+ (diam(W
2
))
D
< 2(3
+)
D
< (3
1
+)
D
< (diam(V
k
))
D
pur di prendere ]0, 2
1/D
[.
In questo modo si rimpiazzano tutti gli aperti V
k
che contengono pi` u di un
intervallo J
j
. Si ottiene cos` una famiglia W
1
, . . . , W
M
di aperti disgiunti,
tali che
M
h=1
(diam(W
h
))
D
k=1
(diam(V
k
))
D
n=0
(diam(U
n
))
D
.
Inoltre, dato che ognuno dei W
h
contiene esattamente uno dei J
j
, deve essere
M = 2
; pertanto
2
h=1
(diam(W
h
))
D
h=1
(diam(J
j
))
D
=
2
h=1
3
D
= 2
3
D
= 1.
Ci` o prova che
n=0
(diam(U
n
))
D
h=1
(diam(W
h
))
D
1
e quindi, come si è osservato, si ha H
D
(C) 1.
Esercizi 2.5
1. Si provi che per ogni E R
N
si ha
dim
H
(E) =
_
0 se H
p
(E) = 0 p > 0
supp > 0 : H
p
(E) = +. altrimenti.
2. Si dimostri che se E
n
nN
T(R)
N
), allora
dim
H
_
_
nN
E
n
_
= sup
nN
dim
H
(E
n
).
42
3. Sia f : R
N
R
m
una funzione -holderiana, ossia tale che
[f(x) f(x
t
)[
m
K[x x
t
[
N
x, x
t
R
N
.
Si provi che se E R
N
allora
dim
H
(f(E))
1
dim
H
(E).
Se ne deduca che se f : R
N
R
N
è bi-lipschitziana, ossia
K
1
[x x
t
[
N
[f(x) f(x
t
)[
N
K
2
[x x
t
[
N
x, x
t
R
N
,
allora per ogni E R
N
si ha dim
H
(f(E)) = dim
H
(E).
4. Si provi che se E R
N
è tale che dim
H
(E) < 1, allora E è totalmente
sconnesso.
[Traccia: ssati x, x
t
E, si consideri la funzione f(z) = [z x[
N
e si
osservi che, per lesercizio precedente, dim
H
(f(E)) < 1; si utilizzi inne
il fatto che f(E)
c
è denso in R per costruire due diverse componenti
connesse che contenenti rispettivamente x e x
t
.]
5. Fissato s ]0, 1[, si consideri linsieme
s
costruito, analogamente al ca-
so dellinsieme di Cantor descritto nel paragrafo 1.6, nel modo seguente:
al primo passo si toglie da [0, 1] un intervallo centrale di ampiezza s;
nei passi successivi si toglie da ciascun intervallino residuo di lunghezza
d la parte centrale di ampiezza pari a sd. Si provi che m(
s
) = 0 e che
dim
H
(
s
) =
log 2
log
2
1s
.
[Traccia: adattare largomentazione relativa allesempio 2.5.3.]
2.6 La misura H
N
in R
N
Dato un insieme misurabile E R
N
, che relazione cè fra la sua misura di
Hausdor H
N
e la sua misura di Lebesgue m
N
? Vedremo ora che le due
quantità coincidono a meno di una costante moltiplicativa.
43
Teorema 2.6.1 Esiste una costante
N
tale che per ogni insieme E R
N
si ha
H
N
(E) =
N
m
N
(E).
Tale costante vale
N
=
_
2
_
N
_
N
2
+ 1
_
,
ove è la funzione di Eulero:
(p) =
_

0
x
p1
e
x
dx, p > 0.
Dimostrazione Proveremo solo lesistenza della costante
N
, senza cal-
colarla esattamente, perche ciò richiede strumenti troppo sosticati per noi
(salvo che quando N = 1, nel qual caso si rimanda allesercizio 2.3.7).
Sia C
0
= [0, 1[
N
. Fissato > 0 e scelto n >
, possiamo ricoprire C
0
con
n
N
cubi della forma
N
i=1
_
r
i
1
n
,
r
i
n
_
(r
1
, . . . , r
N
1, 2, . . . n).
Dato che tali cubi hanno diametro
N
n
< , ricordando lesercizio 2.3.4
otteniamo H
N,
(C
0
) (
N)
N
per ogni > 0, e dunque
H
N
(C
0
) (
N)
N
.
Sia ora U
n
nN
un arbitrario ricoprimento di C
0
con diam U
n
< : ciascun
U
n
può essere ricoperto da una palla di diametro pari a 2 diam U
n
, e quindi
da un cubo C
n
di lato 2 diam U
n
e con gli spigoli paralleli agli assi coordinati.
Dato che
C
0

_
nN
U
n

_
nN
C
n
,
avremo
1 = m
N
(C
0
)
nN
m
N
(C
n
) =
nN
2
N
(diam U
n
)
N
,
ossia
nN
(diam U
n
)
N
2
N
.
44
Per larbitrarietà del ricoprimento, concludiamo che H
N,
(C
0
) 2
N
, e
quindi
H
N
(C
0
) 2
N
.
In particolare
N
=
N
m
N
(C
0
) = H
N
(C
0
)
_
2
N
, (
N)
N
_
]0, [.
Grazie al fatto che H
N
e m
N
sono invarianti per traslazioni ed omogenee di
grado N rispetto alle omotetie, otteniamo anche
H
N
(C) =
N
m
N
(C)
per ogni cubo C con gli spigoli paralleli agli assi coordinati di R
N
.
Adesso sia A un aperto di R
N
: esiste un ricoprimento di A fatto di cubi
disgiunti C
j
, ognuno dei quali è del tipo
N
i=1
_
r
i
1
2
m
,
r
i
2
m
_
(r
1
, . . . , r
N
Z, m N).
Un modo di costruire tale ricoprimento è descritto nellesercizio 2.6.1. Si ha
allora, grazie alla numerabile additività di H
N
e m
N
,
H
N
(A) =
jN
H
N
(C
j
) =
N
jN
m
N
(C
j
) =
N
m
N
(A)
per ogni aperto A di R
N
.
Sia ora B un boreliano di R
N
della forma
B =
nN
A
n
, A
n
aperti,
e non è restrittivo supporre che A
n
A
n+1
. Se m
N
(B) < +, utilizzando
la denizione di misura esterna, è chiaro che possiamo scrivere B come in-
tersezione numerabile di aperti A
t
n
di misura m
N
nita; di conseguenza, per
monotonia si ha H
N
(B) H
N
(A
t
n
) =
N
m
N
(A
t
n
) < . La proposizione
2.1.5 ci autorizza allora a concludere che
H
N
(B) = lim
n
H
N
(A
t
n
) =
N
lim
n
m
N
(A
t
n
) =
N
m
N
(B).
45
Se invece m
N
(B) = , posto B
m
= B]m, m[
N
, i B
m
vericano la relazione
precedente e quindi, al limite per m , si ottiene luguaglianza
H
N
(B) =
N
m
N
(B)
per ogni boreliano B che sia intersezione numerabile di aperti.
Inne, sia E R
N
: per lesercizio 2.6.2, si possono trovare due boreliani B
1
e B
2
contenenti E, entrambi intersezione numerabile di aperti, tali che
H
N
(B
1
) = H
N
(E), m
N
(B
2
) = m
N
(E),
da cui, posto B = B
1
B
2
, si ha che B è un boreliano contenente E che è
ancora intersezione numerabile di aperti, e per il quale risulta
H
N
(E) = H
N
(B) =
N
m
N
(B) =
N
m
N
(E).
Osservazione 2.6.2 Si può dimostrare (esercizio 2.6.4) che
_
2
_
N
_
N
2
+ 1
_
=
1
m
N
(B
0
)
,
ove B
0
è la palla di R
N
di diametro unitario. Dunque il teorema precedente
aerma che la dierenza fra le misure N-dimensionali di Hausdor e di Lebe-
sgue è che la prima assegna misura 1 alla palla di diametro unitario, mentre
la seconda assegna misura 1 al cubo di lato unitario.
Esercizi 2.6
1. Sia A R
N
un aperto. Si provi che A =
nN
C
n
, ove i C
n
sono cubi
diadici, ossia della forma
N
i=1
_
r
i
1
2
m
,
r
i
2
m
_
, r
1
, . . . , r
N
Z, m N.
[Traccia: detta c la famiglia di tali cubi, si provi che ogni x A è
contenuto in un cubo C c, il quale è massimale, nel senso che non
cè nessun altro cubo C
t
c tale che C C
t
A; se ne deduca che
tutti i cubi massimali sono disgiunti e che A ne è lunione.]
46
2. Sia E R
N
. Si provi che:
(i) esiste un boreliano B, intersezione numerabile di aperti, che contie-
ne E ed è tale che m
N
(E) = m
N
(B);
(ii) esiste un boreliano B, intersezione numerabile di aperti, che con-
tiene E ed è tale che H
N
(E) = H
N
(B).
3. Si provi che per ogni [0, N] esiste un insieme E R
N
la cui
dimensione di Hausdor è .
[Traccia: si consideri il prodotto cartesiano
N
s
, ove 0 < s <
1
2
e
s
è linsieme denito nellesercizio 2.5.5; adattando largomentazione
dellesempio 2.5.3 e suggerita per lesercizio 2.5.5, si provi che
N
s
ha
dimensione di Hausdor uguale a N
log 2
log
2
1s
.]
4. Detta
n
la misura della palla unitaria di R
n
, si verichi che
1
= 2,
2
= ,
n
=
2
n

n2
n 3,
e se ne ricavi la formula dellosservazione 2.6.2.
47
Capitolo 3
Funzioni misurabili
3.1 Denizione e proprietà
Sia (X, T, ) uno spazio misurato. Prima di introdurre la nozione astratta
di integrale su X rispetto alla misura , occorre descrivere linsieme del-
le funzioni per le quali lintegrale stesso ha senso. Considereremo funzioni
f : D R = [, +], ove D è un insieme misurabile, ossia un elemento
di T. Dato che si ammette che le funzioni prendano i valori , sarà utile
la convenzione 0 () = 0, già adoperata nel paragrafo 2.2, con la quale
potremo denire lintegrale senza ambiguità.
Cominciamo con la seguente proposizione, che introduce la proprietà carat-
teristica delle funzioni che ci interessano.
Proposizione 3.1.1 Sia D T, sia f : D R. Sono fatti equivalenti:
(i) x D : f(x) > T R;
(ii) x D : f(x) T R;
(iii) x D : f(x) < T R;
(iv) x D : f(x) T R.
Dimostrazione (i) = (ii) Si ha
x D : f(x) =
nN
+
_
x D : f(x) >
1
n
_
.
48
(ii) = (iii) La tesi si ha per passaggio al complementare.
(iii) = (iv) Si ha
x D : f(x) =
nN
+
_
x D : f(x) < +
1
n
_
.
(iv) = (i) La tesi si ha per passaggio al complementare.
Denizione 3.1.2 Sia D T, sia f : D R. La funzione f è detta
misurabile su D se vale una delle condizioni della proposizione precedente (e
quindi valgono tutte).
Osservazione 3.1.3 Se (X, T, ) è uno spazio probabilizzato (esempio 2.1.3
(6)), le funzioni misurabili su X sono chiamate variabili aleatorie.
Esempi 3.1.4 (1) Se E X, la funzione caratteristica, od indicatrice, di
E, è
E
(x) =
_
1 se x E
0 se x E
c
.
Essa è misurabile se e solo se E T: infatti
x X :
E
(x) > =
_
_
_
se 1
E se [0, 1[
X se < 0.
(2) Una funzione semplice è una funzione del tipo
(x) =
k
h=1
E
h
(x), x X,
ove k N
+
,
1
, . . . ,
k
sono numeri reali, E
1
, . . . , E
k
sono elementi di T e
E
1
, . . . ,
E
k
sono le relative funzioni caratteristiche. Queste funzioni non si
rappresentano in modo unico: ad esempio, se X = R,
[0,1]
2
]1,2]
=
[0,2]
3
]1,2]
;
tuttavia se ne può dare una rappresentazione canonica: dato che esse assu-
mono un numero nito di valori distinti
1
, . . . ,
r
, ponendo
A
i
= x X : (x) =
i
, i = 1, . . . , r,
49
si può scrivere
(x) =
r
i=1
i

A
i
(x);
in questo modo si rappresenta la come combinazione lineare di funzioni
caratteristiche di insiemi disgiunti e massimali, nel senso che ciascun A
i
è
il pi` u grande insieme dove la assume il corrispondente valore
i
.
Gli A
i
sono misurabili perche ottenuti dagli E
h
con un numero nito di unioni,
intersezioni e dierenze. Dalla rappresentazione canonica di segue subito
che è misurabile: se i
i
sono ordinati in modo crescente, si ha infatti
x X : (x) > =
r
_
j=i
A
j
se [
i1
,
i
[, i = 2, . . . , r,
mentre se
r
tale insieme è vuoto e se <
1
tale insieme coincide con
tutto X.
(3) In (R, /, m) le funzioni continue sono misurabili. Infatti per ogni R
linsieme x R : f(x) > = f
1
(], [) è un aperto di R, quindi è
misurabile.
(4) In (R, /, m) le funzioni monotone sono misurabili, perche per ogni R
linsieme x R : f(x) > è una semiretta.
Indicheremo con /
D
linsieme delle funzioni misurabili su D, con o linsieme
delle funzioni semplici su X e con o
0
linsieme delle funzioni semplici su X
che si annullano al di fuori di un insieme di misura nita.
Osservazione 3.1.5 Se f, g /
D
, allora f + g è misurabile sullinsieme
D
t
dove la somma stessa è ben denita, ossia
D
t
= D x D : f(x) = g(x) = .
Infatti D
t
è misurabile ed inoltre
x D
t
: f(x) +g(x) > =
= x D
t
: g(x) = + x D
t
: g(x) < +, f(x) > g(x) =
= x D
t
: g(x) = +
_
rQ
[x D
t
: f(x) > r x D
t
: + > g(x) > r] .
50
Similmente, se f, g /
D
, allora il loro prodotto fg sta in /
D
(esercizio
3.1.3).
La classe /
D
è chiusa anche rispetto al passaggio allestremo superiore ed
allestremo inferiore, relativi ad insiemi numerabili di indici (non per insiemi
di indici qualunque: si veda lesercizio 3.1.5).
Proposizione 3.1.6 Sia D T, sia f
n
nN
/
D
. Allora le funzioni
sup
n
f
n
, inf
n
f
n
, limsup
n
f
n
e liminf
n
f
n
appartengono a /
D
.
Dimostrazione La misurabilità di sup
n
f
n
e inf
n
f
n
segue dalle uguaglianze
x D : sup
n
f
n
> =
_
nN
x D : f
n
(x) > ,
x D : inf
n
f
n
< =
_
nN
x D : f
n
(x) < ;
la misurabilità di limsup
n
f
n
e liminf
n
f
n
segue da quanto già provato
e dalle identità
limsup
n
f
n
= inf
n
sup
mn
f
m
, liminf
n
f
n
= sup
n
inf
mn
f
m
.
Unimportante caratterizzazione di /
D
è la seguente:
Proposizione 3.1.7 Sia D T, sia f : D R. Si ha f /
D
se e solo
se esiste
n
nN
o tale che
n
f puntualmente in D per n .
Dimostrazione (=) Poiche le funzioni semplici sono misurabili, la mi-
surabilità di f segue dalla proposizione precedente.
(=) Sia f /
D
. Per ogni n N e per ogni x D poniamo:
n
(x) =
_
_
n se f(x) n
k1
2
n
se
k1
2
n
f(x) <
k
2
n
, k = 1, 2, . . . , n2
n
k
2
n
se
k1
2
n
< f(x)
k
2
n
, k = 0, 1, . . . , n2
n
+ 1
n se f(x) n.
`
E facile vericare che
n
o e che
n
(x) f(x) per n .
Osservazioni 3.1.8 (1) Se f 0 in D, le funzioni
n
sopra denite for-
mano una successione crescente:
n
(x)
n+1
(x) f(x) per ogni n N e
x D. Se invece f 0, la successione
n
è decrescente.
51
(2) Se f è limitata in D, la convergenza delle
n
è uniforme in D: infatti
se [f(x)[ L, allora [
n
(x) f(x)[ 2
n
per ogni x D e per ogni n L.
(3) La convergenza delle
n
verso f è dominata, ossia [
n
(x)[ [f(x)[
per ogni x D e per ogni n N.
(4) Se linsieme x D : f(x) ,= 0 è -nito, cioè è unione numerabile di
insiemi A
n
A
n+1
misurabili di misura nita, allora rimpiazzando
n
con
An
si può supporre che ciascuna
n
appartenga a o
0
. In tal caso valgono
ancora (1) e (3), ma in generale non vale pi` u (2).
Esercizi 3.1
1. Se f è misurabile su D, si provi che per ogni R linsieme x D :
f(x) = è misurabile, ma che il viceversa è falso.
2. Sia f
n
nN
/
D
. Si provi che linsieme x D : lim
n
f
n
(x) è
misurabile.
3. Si provi che se f, g /
D
allora fg /
D
.
4. Sia f : [a, b] R una funzione derivabile. Si provi che la funzione f
t
è
misurabile nello spazio misurato (R, /, m).
5. Sia T un insieme, e sia f
t
tT
una famiglia di funzioni misurabili. La
funzione sup
tT
f
t
è in generale misurabile?
6. Si provi che in un generico spazio misurato (X, T, ) una funzione
f : X R è misurabile se e solo se f
1
(B) T per ogni boreliano
B R. Si verichi poi che la funzione : B [0, ] denita da
(E) = (f
1
(E)) è una misura su (R, B). (Se (X) = 1, in linguaggio
probabilistico è la misura immagine, o legge, della variabile aleatoria
f.)
[Traccia: si provi che c = B B : f
1
(B) T è una -algebra
contenente gli aperti.]
7. Sia b N, b > 1; per ogni x R si consideri lo sviluppo di x in base b:
x = [x] +
n=1
n
(x)
b
n
,
n
(x) 0, 1, . . . , b 1.
52
Provare che le funzioni
f
n
(x) =
n
(x) , n N
+
,
sono tutte misurabili in (R, /, m).
8. Si provi che la -algebra / contiene propriamente la -algebra dei
boreliani.
[Traccia: per ogni x [0, 1] si consideri il suo sviluppo binario x =
n=1
n
2
n
(
n
0, 1), convenendo di scegliere lo sviluppo innito nei
casi di ambiguità: ad esempio, per
3
4
si prenderà 0.101 anziche 0.11.
Posto f(x) =
n=1
2n
3
n
, si mostri che f([0, 1]) C
3
e che f è iniettiva.
Si usi lesercizio 3.1.7 per vericare che f è misurabile; quindi, f
1
(B)
/ per ogni B B (esercizio 3.1.6). Sia V [0, 1] non misurabile:
posto E = f(V ), si provi che E / ma f
1
(E) / /. Se ne deduca
che E / B.].
9. Sia f misurabile ed inferiormente limitata. Si costruisca una succes-
sione di funzioni semplici che converga puntualmente a f in modo
crescente.
10. Sia f : R R misurabile in (R, /, m) e sia g : R R continua. Si
provi che g f è misurabile.
11. Si provi che se f : R R è continua allora f
1
(B) B per ogni B B.
`
12. Si provi che f : D R è misurabile se e solo se f
2
è misurabile e
linsieme x D : f(x) > 0 appartiene a T.
13. Sia f
n
una successione di funzioni da X in R. Per ogni n N sia T
n
la pi` u piccola -algebra di sottoinsiemi di X rispetto a cui le funzioni
f
k
kn
sono tutte misurabili. Si provi che:
(i) T
n
T
n+1
per ogni n, e T =
T
n
è una -algebra;
(ii) la funzione f(x) =
nN
f
n
(x), denita per gli x ove ha senso, non
è in generale T-misurabile;
(iii) linsieme A = x X :
nN
[f
n
(x)[ < appartiene a T;
(iv) se si considerano funzioni da X in R la (iii) è in generale falsa.
53
14. Si provi che esistono funzioni f : R R continue, tali che limmagine
inversa f
1
(E) di un insieme E / non è un elemento di /.
[Traccia: si costruisca un omeomorsmo f : [0, 1] [0, 1] che trasfor-
mi C
4
in C
3
, associando ciascun intervallo rimosso nella costruzione di
C
4
al corrispondente intervallo rimosso nella costruzione di C
3
. Si ssi
poi un sottoinsieme non misurabile W C
4
(esercizio 1.8.2) e si mostri
che per E = f(W) si ha f
1
(E) / /.]
15. Si provi che esistono f : R R misurabile secondo Lebesgue e g : R
R continua tali che f g non è misurabile.
16. Si provi che se f : R R è una funzione boreliana, ossia B-misurabile,
e g : R R è una funzione continua, allora f g è boreliana e quindi
misurabile.
3.2 Funzioni essenzialmente limitate
Introduciamo anzitutto una locuzione che sarà utilissima nel seguito. Essa
riette il fatto che le funzioni che coincidono al di fuori di un insieme di
misura nulla sono di fatto indistinguibili dal punto di vista della teoria della
misura e dellintegrale.
Denizione 3.2.1 Sia (X, T, ) uno spazio misurato, sia D T e sia p(x)
un predicato denito per x X. Diciamo che la proprietà espressa da p(x)
è vera quasi ovunque (e scriveremo q.o.) in D se linsieme x D : p(x)
appartiene a T ed il suo complemento in D, cioè x D : p(x), ha misura
nulla.
Ad esempio, in (R, /, m) la funzione f =
Q
verica f(x) = 0 q.o. in R.
Osservazione 3.2.2 Siano D T, f /
D
. Se g : D R è unaltra fun-
zione tale che f(x) = g(x) q.o. in D, possiamo dire che g /
T
? In generale
no (esercizio 3.2.1), ma la risposta è s` se lo spazio misurato è completo.
Infatti in tal caso, posto A = x D : f(x) = g(x), per ipotesi A T e
(D A) = 0; daltra parte
x D : g(x) > = x A : f(x) > x D A : g(x) > ,
ed a secondo membro il primo insieme è misurabile dato che A T e f
/
D
, mentre il secondo è misurabile grazie alla completezza, essendo incluso
54
in D A che ha misura nulla.
Introduciamo ora lo spazio delle funzioni essenzialmente limitate.
Denizione 3.2.3 Siano D T, f /
D
. Se A D, A T, i numeri
(niti o no)
supess
A
f = inf R : f(x) q.o. in A,
infess
A
f = sup R : f(x) q.o. in A
si chiamano estremo superiore essenziale ed estremo inferiore essenziale di f
in A (si conviene che inf = + e sup = ).
Denizione 3.2.4 Siano D T, f /
D
. Se risulta infess
D
f > e
supess
D
f < +, diremo che f è essenzialmente limitata in D e scriveremo
f /
(D) (anche se, pi` u correttamente, dovremmo scrivere /
(D, T, )).
`
E facile vericare che f /
(D) se e solo se f /
D
e supess
D
[f[ < +.
Esempi 3.2.5 (1) In (R, /, m) la funzione f(x) = 5
Q
(x) +sin x verica
supess
R
f = 1, infess
R
f = 1.
(2) In (R, /, m), se f : R R è continua allora supess
A
f = sup
A
f e
infess
A
f = inf
A
f per ogni aperto A R. La stessa cosa non vale se A non
è aperto (esercizio 3.2.6).
Osservazione 3.2.6 Per ogni f /
D
si ha f(x) infess
D
f e f(x)
supess
D
f q.o. in D (esercizio 3.2.4).
Si verica facilmente che /
(D) è uno spazio vettoriale e unalgebra (osser-

vazione 3.1.5 ed esercizio 3.2.5).
Esercizi 3.2
1. Sia (X, T, ) uno spazio misurato non completo. Se f /
X
, si provi
che esiste g : X R non misurabile, tale che f(x) = g(x) q.o. in X.
2. Si provi che se f /
(D) allora esiste A T tale che (A

c
) = 0 e
supess
D
[f[ = sup
A
[f[.
3. Sia f /
D
; provare che per ogni A D si ha
f(x) infess
A
f e f(x) supess
A
f q.o. in A.
55
4. Si provi che se f, g /
(D) allora f +g, fg /
(D) e
supess
D
[f +g[ supess
D
[f[ + supess
D
[g[,
supess
D
[fg[ supess
D
[f[ supess
D
[g[.
5. Sia f
n
/
(D) una successione convergente puntualmente in D ad

una funzione f.
`
E vero che f /
(D)?
6. Sia f
n
/
D
una successione tale che
lim
n
f
n
(x) = f(x) q.o. in D.
`
E vero che f /
D
?
7. Sia (X, T, ) -nito, e sia f
n
/
D
. Se le f
n
sono q.o. nite, si
costruisca una successione
n
di numeri positivi tale che
n
f
n
(x) 0
q.o. in D per n .
[Traccia: supposto dapprima che (D) < , si osservi che non è
restrittivo assumere che 0 f
n
f
n+1
. Per ogni n N si scelga
k
n
N in modo che A
n
= x D : f
n
(x) > k
n
abbia misura minore
di 2
n
; si verichi che (limsup
n
A
n
) = 0. Si deduca la tesi con
n
=
1
nkn
. Si generalizzi poi al caso (D) = .]
8. Si descriva lo spazio /
(D) quando D T e (D) = 0.

9. Si fornisca un esempio di funzione continua f tale che
supess
A
f < sup
A
f
ove A è un opportuno sottoinsieme chiuso di R.
3.3 Lo spazio L
Sia (X, T, ) uno spazio misurato. Fissato D T, introduciamo nello spazio

/
(D) la seguente relazione di equivalenza:

f g f(x) = g(x) q.o. in D;
le veriche sono pressocche ovvie. A noi interesserà lo spazio quoziente
rispetto a .
56
Denizione 3.3.1 Linsieme quoziente /
(D)/ si indica con L
(D)
(nuovamente, la notazione pi` u appropriata sarebbe L
(D, T, )).
Osserviamo che gli elementi di L
(D) non sono funzioni, ma classi di equi-

valenza di funzioni q.o. coincidenti; tuttavia, come è duso, continueremo
a chiamarle funzioni, confondendo in eetti la classe [f] con il suo rappre-
sentante f. Si tenga presente però che tali funzioni sono denite soltanto
quasi ovunque e non punto per punto.
Lo spazio L
(D) eredita da /
(D) la struttura di spazio vettoriale e di alge-

bra: la somma è denita da [f] +[g] = [f +g] e il prodotto da [f] [g] = [fg];
è immediato vericare che queste denizioni sono ben poste.
Le motivazioni per il passaggio da /
a L
sono fornite dal seguente fonda-

mentale risultato:
Teorema 3.3.2 Sia D T. La quantità
|f|
,D
= supess
D
[f[, f /
(D),
è invariante rispetto alla relazione e denisce una norma su L
(D); inoltre
(L
(D), | |
,D
) è uno spazio di Banach.
Dimostrazione Sia f /
(D); se g f è facile vericare che

supess
D
[f[ = supess
D
[g[,
quindi la quantità |f|
,D
dipende solo dalla classe [f] e non da f. Veri-
chiamo che | |
,D
è una norma.
(a) Ovviamente |f|
,D
0; se si ha |f|
,D
= 0 allora per losservazione
3.2.6 si ha f(x) = 0 q.o. in D, cioè f 0, ossia [f] è lelemento neutro della
somma in L
(D).
(b) Si ha |f|
,D
= [[|f|
,D
(facile verica usando la denizione di estre-
mo superiore essenziale).
(c) La subadditività di | |
,D
segue dallesercizio 3.2.4.
Proviamo ora la completezza dello spazio normato (L
(D), | |
,D
). Per
maggior chiarezza, utilizziamo la notazione [f] per indicare gli elementi di
L
(D).
Sia dunque [f
n
]
nN
una successione di Cauchy in L
(D): ciò signica che

per ogni > 0 esiste N tale che
|[f
n
] [f
m
]|
,D
< n, m .
57
Per ogni n N sia g
n
[f
n
]; allora
supess
D
[g
n
[ = |[f
n
]|
,D
, supess
D
[g
n
g
m
[ = |[f
n
] [f
m
]|
,D
n, m N.
Posto per n, m N
A
n
= x D : [g
n
(x)[ > supess
D
[g
n
[,
A
nm
= x D : [g
n
(x) g
m
(x)[ > supess
D
[g
n
g
m
[,
dallosservazione 3.2.6 segue che (A
n
) = (A
nm
) = 0 per ogni n, m N;
dunque anche linsieme
B =
_
_
nN
A
n
_
_
_
n,mN
A
nm
_
ha misura nulla e si ha, per ogni > 0,
[g
n
(x) g
m
(x)[ supess
D
[g
n
g
m
[ < n, m , x D B.
Pertanto g
n
è una successione di /
(D B) che è di Cauchy rispetto alla

convergenza uniforme in D B. Dunque esiste una funzione g : D B R
tale che g
n
g uniformemente in D B per n . Tale g è misurabile su
D B perche tali sono le g
n
; se prolunghiamo g a tutto D ponendola uguale
a 0 in B, otteniamo che g /
D
. Inoltre
supess
D
[g[ sup
D\B
[g[ = sup
D
[g[ < ,
cosicche la classe [g] individuata da g è un elemento di L
(D). Proviamo
che [f
n
] [g] in L
(D):
|[f
n
] [g]|
,D
= supess
D
[g
n
g[ = sup
D\B
[g
n
g[ 0 per n .
Esercizi 3.3
1. Si provi che se [f], [g] L
(D) allora [fg] L
(D) e
|[fg]|
,D
|[f]|
,D
|[g]|
,D
.
58
2. Sia i : /
(R) L
(R) lapplicazione denita da i(f) = [f]. Si provi

che la restrizione di i allo spazio C
0
(R) /
(R) è iniettiva.
3. Determinare la chiusura in L
(R) degli spazi C

0
(R) L
(R) e C
0
0
(R),
ove
C
0
0
(R) = f C
0
(R) : f è nulla fuori da un compatto
(si noti che confondiamo volutamente le f C
0
(R) /
(R) con le loro

classi di equivalenza in L
(R)).
4. Si provi che lo spazio delle funzioni semplici su X è denso in L
(X).
5. Si descriva lo spazio L
(D) quando D T e (D) = 0.

3.4 Misurabilità e continuità
Quanta distanza cè tra la nozione di misurabilità di una funzione e quella,
pi` u forte, di continuità? E similmente, quanta distanza intercorre fra la
convergenza puntuale q.o. e la ben pi` u restrittiva convergenza uniforme? I
due risultati che seguono sembrano mostrare che le due distanze non sono
poi cos` grandi.
Teorema 3.4.1 (di Lusin) Sia f : R R una funzione misurabile secondo
Lebesgue, q.o. nita, nulla fuori di un insieme A / di misura nita.
Allora per ogni > 0 esiste una funzione g C
0
0
(R) tale che
m(x R : f(x) ,= g(x)) < ,
ed inoltre si ha |g|
|f|
.
Ricordiamo che lo spazio C
0
0
(R) è stato introdotto nellesercizio 3.3.3. Per
una lieve generalizzazione del teorema di Lusin si veda lesercizio 3.4.1.
Dimostrazione Faremo quattro passi successivi.
(a) A compatto, 0 f 1. Sia
n
la successione crescente di funzioni
semplici convergente uniformemente a f costruita nella dimostrazione della
proposizione 3.1.7, vale a dire
n
(x) =
k
2
n
se
k
2
n
f(x) <
k + 1
2
n
, k = 0, 1, . . . , 2
n
, n N.
59
Poniamo
0
=
0
,
n
=
n
n1
n N
+
;
allora si ha f =
n=0
n
in R. Osserviamo anche che
n
assume soltanto
i valori 0 e 2
n
, cosicche 2
n
n
è la funzione caratteristica
Tn
di un certo
insieme misurabile T
n
A.
Sia ora V un aperto contenente A, tale che V sia compatto. Per ogni n
scegliamo poi un compatto K
n
ed un aperto V
n
tali che
K
n
T
n
V
n
V, m(V
n
K
n
) <

2
n
(proposizione 1.7.3). Adesso costruiamo una funzione h
n
C
0
0
(R) tale che
0 h
n
1, h
n
= 1 in K
n
, h
n
= 0 in V
c
n
:
ad esempio si può prendere
h
n
(x) =
d(x, V
c
n
)
d(x, V
c
n
) + d(x, K
n
)
, x R,
ove d(x, K) = inf[x y[ : y K per ogni K R; h
n
è continua su R in
virt` u della maggiorazione
[d(x, K) d(x
t
, K)[ [x x
t
[ x, x
t
R, K R.
Denendo
g(x) =
n=0
2
n
h
n
(x), x R,
si ottiene una funzione che è continua, in quanto la serie converge unifor-
memente su R, e che è nulla fuori di V ; dunque g C
0
0
(R). Si noti ora
che
2
n
h
n
(x) =
n
(x) x K
n
V
c
n
= (V
n
K
n
)
c
;
quindi avremo
g(x) = f(x) x
n=0
(V
n
K
n
)
c
.
Se ne deduce
m(x R : g(x) ,= f(x)
n=0
m(V
n
K
n
) 2,
60
cioè la tesi nel caso (a).
(b) A compatto, f limitata. Posto M = sup
X
[f[, le funzioni
f
+
M
,
f
M
sono
comprese fra 0 e 1, quindi per il passo (a) esistono due funzioni g
+
, g

C
0
0
(R) tali che
m
__
x R : g
+
(x) ,=
f
+
(x)
M
__
<

2
, m
__
x R : g
(x) ,=
f
(x)
M
__
<

2
.
Allora la funzione g = M(g
+
g
) verica la tesi nel caso (b): infatti se

in un punto x si ha g(x) ,= f(x), necessariamente deve essere g
+
(x) ,=
f
+
(x)
M
oppure g
(x) ,=
f
(x)
M
, e dunque
m(x R : g(x) ,= f(x)) <

2
+

2
= .
(c) m(A) < , f limitata. Sia K un compatto contenuto in A tale che
m(A K) < /2 : lesistenza di tale compatto è facile conseguenza del fatto
che m(A) = lim
n
m(A [n, n]) e della proposizione 1.7.3. La funzione
f
K
verica le ipotesi del passo (b), quindi esiste g C
0
0
(R) tale che
m(x R : g(x) ,= f(x)
K
(x)) <

2
;
ne segue
m(x R : g(x) ,= f(x)) <

2
+m(A K) < ,
il che prova (c).
(d) Caso generale. Per ogni n N sia B
n
= x R : [f(x)[ > n. Gli in-
siemi B
n
sono ovviamente contenuti in A, inoltre B
n
B
n+1
e m(
nN
B
n
) =
0; in particolare, lim
n
m(B
n
) = 0 (proposizione 1.7.2). Scelto n in modo
che m(B
n
) < /2, la funzione f
B
c
n
verica le ipotesi del passo (c), quindi
esiste g C
0
0
(R) tale che
m(x R : g(x) ,= f(x)
B
c
n
(x)) <

2
,
ed allora si ha anche
m(x R : g(x) ,= f(x)) <

2
+m(B
n
) < .
Ci` o prova il passo (d).
61
Inne resta da osservare che la condizione |g|
|f|
è evidentemente au-
tomatica se f è illimitata; se invece f è limitata, per ottenerla basta sostituire
g con
G(x) =
_
g(x) se [g(x)[ |f|
|f|
se [g(x)[ > |f|
.
La G verica ancora la tesi di (d) perche G dierisce da g soltanto in punti
dove sicuramente g(x) ,= f(x), cosicche
x R : g(x) = f(x) x R : G(x) = f(x),
da cui a maggior ragione
(x R : G(x) ,= f(x)) < .
Non bisogna enfatizzare troppo la portata del teorema di Lusin: esso non
aerma che ogni funzione misurabile è continua salvo che su un insieme di
punti di misura arbitrariamente piccola. Ad esempio, la funzione
Q[0,1]
è
discontinua in ogni punto di [0, 1], pur coincidendo addirittura q.o. con la
funzione continua g(x) = 0.
Teorema 3.4.2 (di Severini-Egorov) Sia (X, T, ) uno spazio misurato
con (X) < , e sia f
n
una successione di funzioni misurabili che converge
q.o. in X ad una funzione f. Allora per ogni > 0 esiste un insieme E T
con (E) < , tale che f
n
f uniformemente in E
c
per n .
Dimostrazione Per m N e k N
+
poniamo
E
k,m
=
n=m
_
x X : [f
n
(x) f(x)[ <
1
k
_
;
allora si ha
x X : lim
n
f
n
(x) = f(x)
_
m=0
E
k,m
k N
+
,
e quindi
__

_
m=0
E
k,m
_
c
_
=
_

m=0
E
c
k,m
_
= 0 k N
+
.
62
Poiche (X) < , per la proposizione 2.1.5 si ottiene
lim
m
(E
c
k,m
) = 0 k N
+
.
Di conseguenza, per ogni > 0 e per ogni k N
+
possiamo scegliere m
k
N
tale che
(E
c
k,m
k
) <

2
k
.
Dunque, posto E =
k=1
E
c
k,m
k
, si ha
(E)
k=1
(E
c
k,m
k
) < .
Daltra parte per ogni x E
c
si ha che x E
k,m
k
per ogni k N
+
, ossia
[f
n
(x) f(x)[ <
1
k
n m
k
, k N
+
.
Ci` o prova che per ogni k N
+
risulta
sup
xE
c
[f
n
(x) f(x)[
1
k
n m
k
,
cioè la tesi.
Osservazione 3.4.3 Nel teorema di Severini-Egorov lipotesi (X) < è
indispensabile: in (R, /, m), posto f
n
=
[n1,n][n.n+1]
, si ha f
n
0
puntualmente, ma non uniformemente al di fuori di alcun sottointervallo di
R; ed infatti m(R) = +.
Anche il teorema di Severini-Egorov non va enfatizzato: la convergenza pun-
tuale q.o. si trasforma in convergenza uniforme al di fuori di un insieme di
misura arbitrariamente piccola, ma linsieme su cui si realizza la convergenza
uniforme può essere estremamente irregolare e frastagliato: di conseguenza,
anche se le f
n
erano continue, le proprietà di continuità ereditate da f sono
ben poco signicative.
63
Esercizi 3.4
1. Si provi che se f : R R è una funzione misurabile q.o. nita,
allora per ogni > 0 esiste una funzione continua g : R R tale che
|g|
|f|
e
m(x R : g(x) ,= f(x)) < .
[Traccia: Supponendo dapprima f 0, per ogni n N si conside-
ri f
]n,n[
e si determini una g
n
C
0
0
([n, n] non negativa tale che
|g
n
|
|f|
e m(x [n, n] : g
n
(x) ,= f(x)) < . Poi si denisca
g(x) =
_
g
1
(x) se [x[ 1,
maxg
1
(x), . . . g
n
(x) se n 1 < [x[ n, n > 1,
e si mostri che g verica la tesi. Inne si generalizzi al caso di f di
segno qualunque.]
2. Sia f =
C
, ove C
è linsieme di Cantor (paragrafo 1.6). Fissato

> 0, si determini esplicitamente una funzione continua g, nulla fuori
di [0, 1], tale che m(x R : f(x) ,= g(x)) < .
3. Sia f
n
(x) = max1n d(x, C), 0, ove C = C
1/3
è linsieme ternario di
Cantor. Si verichi che f
n
0 q.o. in [0, 1] e, ssato > 0, si determini
esplicitamente un insieme misurabile E [0, 1] tale che m(E) < e
f
n
0 uniformemente in [0, 1] E.
3.5 Convergenza in misura
Sia (X, T, ) uno spazio misurato. Introduciamo ora un tipo di convergenza
per funzioni che è di grande importanza in teoria della probabilità.
Denizione 3.5.1 Siano f
n
, f funzioni misurabili q.o. nite su X. Diciamo
che f
n
f in misura per n se per ogni > 0 si ha
lim
n
(x X : [f
n
(x) f(x)[ > ) = 0.
Diciamo che f
n
è fondamentale in misura se è una successione di Cauchy
rispetto alla convergenza in misura, ossia se per ogni > 0 e per ogni > 0
esiste N tale che
(x X : [f
n
(x) f
m
(x)[ > ) < n, m .
64
Quando (X) = 1, la convergenza in misura viene chiamata, come è giusto,
convergenza in probabilità.
Le proprietà della convergenza in misura ed i suoi legami con la convergenza
puntuale sono illustrati nella seguente
Proposizione 3.5.2 Sia (X, T, ) uno spazio misurato, siano f
n
, f, g fun-
zioni misurabili q.o. nite su X.
(i) Se f
n
f in misura e f
n
g in misura, allora f = g q.o. in X.
(ii) Se f
n
f q.o. in X ed inoltre (X) < , allora f
n
f in misura.
(iii) Se f
n
f in misura, allora f
n
è fondamentale in misura.
(iv) Se f
n
è fondamentale in misura, allora esiste una sottosuccessione
f
n
k
f
n
che converge q.o. in X ad una funzione f misurabile e
q.o. nita su X.
(v) Se f
n
è fondamentale in misura, allora esiste f misurabile e q.o. nita
su X tale che f
n
f in misura.
Dimostrazione (i) Basta osservare che, per ogni k N
+
e per ogni n N,
_
x X : [f(x) g(x)[ >
1
k
_
_
x X : [f(x) f
n
(x)[ >
1
2k
_
_
x X : [f
n
(x) g(x)[ >
1
2k
_
,
e che quindi dallipotesi segue che
__
x X : [f(x) g(x)[ >
1
k
__
= 0 k N
+
,
da cui (x X : f(x) ,= g(x)) = 0.
(ii) Per il teorema di Severini-Egorov, per ogni > 0 esiste E T con
(E) < tale che f
n
c
; ne segue che per ogni > 0
si ha
x X : [f
n
(x) f(x)[ > E denitivamente,
da cui
(x X : [f
n
(x) f(x)[ > ) < denitivamente:
65
ciò prova la tesi.
(iii) Basta notare che
x X : [f
n
(x) f
m
(x)[ >
_
x X : [f
n
(x) f(x)[ >

2
_
_
x X : [f(x) f
m
(x)[ >

2
_
.
(iv) Poiche f
n
è fondamentale in misura, è possibile scegliere induttiva-
mente una sequenza n
k
N tale che n
k
< n
k+1
e
(x X : [f
n
(x) f
m
(x)[ > 2
k
) < 2
k
n, m n
k
, k N
+
.
Poniamo X
0
= X N, ove
N =
_
n
x X : [f
n
(x)[ = +.
Allora, posto per k, j N
+
A
k
= x X
0
: [f
n
k+1
(x) f
n
k
(x)[ > 2
k
, B
j
=
_
k=j
A
k
, B =
j=1
B
j
,
otteniamo
(B
j
)
k=j
(A
k
) <
k=j
2
k
,
ed essendo (B
1
) < 1 si conclude che
(B) = lim
j
(B
j
) = 0.
Notiamo ora che la successione f
n
k
converge uniformemente su X
0
B
j
per
ogni j N
+
: infatti dalluguaglianza X
0
B
j
=
k=j
(X
0
A
k
) segue che se
q > p j si ha
[f
nq
(x) f
np
(x)[
q1
k=p
[f
n
k+1
(x) f
n
k
(x)[
q1
k=p
2
k
x X
0
B
j
.
Ponendo allora f(x) = lim
k
f
n
k
(x), la funzione f è ben denita per ogni
x

j=1
(X
0
B
j
) = X
0
B, ossia q.o. in X, ed è ovviamente misurabile.
Inoltre, essendo
[f(x)[ [f
n
j
(x)[ + 1 x X
0
B
j
, j N
+
,
66
si ha che f è nita in X
0
B, e quindi è nita q.o. in X. Ciò prova (iv).
(v) Sia > 0; poiche la successione f
n
è fondamentale in misura, per ogni
> 0 esiste N tale che
(x X : [f
n
(x) f
m
(x)[ > ) < n, m .
Da (iv) segue che esiste una sottosuccessione f
n
k
f
n
che converge
puntualmente q.o. in X ad una funzione f q.o. nita. Inoltre in corri-
spondenza di esiste un insieme B T con (B) < , tale che f
n
k
f
uniformemente in B
c
: basta prendere come B uno dei B
j
della dimostrazio-
ne di (iv), con j sucientemente grande. Allora per ogni > 0 linsieme
x X : [f
n
k
(x)f(x)[ > è contenuto in B per ogni k abbastanza grande,
cosicche esiste k
0
N tale che
(x X : [f
n
k
(x) f(x)[ > ) (B) < k k
0
.
Ma allora per ogni n si ha, scelto k tale che k k
0
e n
k
,
x X : [f
n
(x) f(x)[ > 2
x X : [f
n
(x) f
n
k
(x)[ > x X : [f
n
k
(x) f(x)[ > ,
da cui
(x X : [f
n
(x) f(x)[ > 2 < 2.
Ne segue la tesi per larbitrarietà di .
Esercizi 3.5
1. Supponiamo che f
n
f in misura e che g
n
g in misura. Si provi
che:
(i) f
n
+g
n
f +g in misura;
(ii) f
n
f in misura per ogni R;
(iii) [f
n
[ [f[ in misura;
(iv) se (X) < , allora f
n
g
n
fg in misura;
(v) se (X) < e f
n
, f sono q.o. diverse da 0, allora
1
fn
1
f
in
misura.
2. Sia (X) = . Esibire esempi di successioni f
n
, g
n
tali che:
67
(i) f
n
f in misura, g
n
g in misura, ma f
n
g
n
, fg in misura;
(ii) f
n
f in misura, f
n
, f sono q.o. diverse da 0, ma
1
fn
,
1
f
in
misura.
3. Esibire esempi di successioni f
n
tali che:
(i) f
n
f q.o. in X ma f
n
, f in misura;
(ii) f
n
f in misura ma f
n
, f q.o. in X.
4. Sia (X) < , sia f
n
una successione di funzioni misurabili q.o.
nite e sia f unaltra funzione misurabile e q.o. nita. Si provi che
f
n
f in misura se e solo se per ogni sottosuccessione f
n
k
kN
di
f
n
esiste unulteriore sottosuccessione f
n
k
h
hN
che converge a f
q.o. in X.
5. Sia g : R R una funzione uniformemente continua. Si provi che se
f
n
f in misura, allora g f
n
g f in misura.
`
E vero questo
risultato se g è soltanto continua?
68
Capitolo 4
Lintegrale
4.1 Integrale di funzioni semplici
Sia (X, T, ) uno spazio misurato. Introdurremo la nozione di integrale ri-
spetto alla misura per una sottoclasse di funzioni misurabili (quelle, ap-
punto, integrabili). Se, in particolare, lo spazio misurato è (R, /, m) op-
pure (R
N
, /
N
, m
N
), otterremo lintegrale di Lebesgue 1-dimensionale o N-
dimensionale.
Cominciamo allora col denire lintegrale per le funzioni semplici. Ricordia-
mo che, in base allesempio 3.1.4 (2), ogni funzione semplice si può scrivere
in modo canonico come
=
n
i=0
A
i
, A
i
= x X : (x) =
i
,
dove gli
i
sono i valori non nulli assunti da ; in particolare gli A
i
sono
elementi disgiunti di T e la loro unione è tutto X.
Per introdurre lintegrale, bisognerà distinguere tra funzioni di segno co-
stante (sicuramente integrabili) e di segno variabile (non necessariamente
integrabili).
Denizione 4.1.1 Sia o, e sia
n
i=0
A
i
la sua rappresentazione
canonica (con A
i
= x X : (x) =
i
).
Se 0, l integrale di su X rispetto e alla misura è il numero non
negativo (eventualmente +)
_
X
d =
n
i=0
i
(A
i
)
69
(si ricordi la convenzione 0 = 0).
Se assume anche valori negativi, posto
+
= max, 0,
= min, 0,
diciamo che è integrabile su X (rispetto a ) se almeno uno fra i due
integrali
_
X

+
d,
_
X

d è nito; in tal caso lintegrale di rispetto alla

misura è
_
X
d =
_
X
+
d
_
X
d.
(In particolare, le funzioni semplici non negative sono sempre integrabili.)
Se entrambi gli integrali
_
X

+
d,
_
X

d sono niti, diciamo che è

sommabile su X (rispetto a ).
Osservazioni 4.1.2 (1) Una funzione semplice è sommabile su X se e
solo se si ha o
0
, ossia è nulla al di fuori di un insieme di misura
nita. Infatti, sia
n
i=0
A
i
la rappresentazione canonica di : se è
sommabile, allora tutti gli A
i
relativi a valori
i
,= 0 devono avere misura
nita, altrimenti ci sarebbe un addendo innito nella somma
n
i=0
i
(A
i
).
Viceversa, è chiaro che se tutti gli A
i
relativi ad
i
,= 0 hanno misura nita
allora è sommabile.
(2) Se o
0
, e se
m
j=0
B
j
è una qualunque rappresentazione della
funzione tale che
j
R e B
j
T, con (B
j
) < allorche
j
,= 0, allora
si ha
m
j=0
j
(B
j
) =
_
X
d
(esercizio 4.1.1); dunque lintegrale di funzioni di o
0
non dipende dal modo
in cui si rappresenta la funzione come combinazione lineare di funzioni carat-
teristiche di insiemi di misura nita. Si noti che questo non è vero se si toglie
la condizione che gli insiemi abbiano misura nita: ad esempio in (R, /, m)
possiamo scrivere
[0,1]
=
[0,[
]1,[
e benche risulti
_
R
[0,1]
dm = 1, la somma m([0, [) m(]1, [) non ha
senso.
Lemma 4.1.3 Siano , o non negative. Allora
70
(i) per ogni R si ha
_
X
() d =
_
X
d;
(ii) risulta
_
X
( +) d =
_
X
d +
_
X
d.
Dimostrazione (i) Se 0 è unovvia conseguenza della denizione 4.1.1;
se < 0, basta osservare che ()
+
= [[
e ()
= [[
+
.
(ii) Siano
n
i=0
A
i
e
m
j=0
B
j
le rappresentazioni canoniche di e
; sia inoltre
p
h=0
E
h
la rappresentazione canonica di + (in par-
ticolare, si ha X =
n
i=0
A
i
=
m
j=0
B
j
=
p
h=0
E
h
). A ciascun valore
h
,
h = 0, 1, . . . , p, corrisponde una coppia, non necessariamente unica, di indici
(i, j) (con i 0, 1, . . . , n e j 0, 1, . . . , m) tale che
h
=
i
+
j
. Detto
F
h
linsieme di tali coppie di indici, si ha (i, j) F
h
se e solo se
h
=
i
+
j
;
quindi si può scrivere
E
h
= x X : (x) +(x) =
h
=
_
(i,j)F
h
A
i
B
j
,
da cui
(E
h
) =
(i,j)F
h
(A
i
B
j
).
Si deduce allora, per ladditività della misura ,
_
X
( +) d =
p
h=0
h
(E
h
) =
p
h=0
(i,j)F
h
(
i
+
j
)(A
i
B
j
) =
=
n
i=0
m
j=0
i
(A
i
B
j
) +
m
j=0
n
i=0
j
(A
i
B
j
) =
=
n
i=0
i
(A
i
) +
m
j=0
j
(B
j
) =
_
X
d +
_
X
d.
Esercizi 4.1
1. Si verichi che se o
0
, e se risulta
(x) =
r
i=0
A
i
(x) =
s
j=0
B
j
(x), x X,
71
con (A
i
) < e (B
j
) < allorche
i
,= 0 e
j
,= 0, allora
r
i=0
i
(A
i
) =
s
j=0
j
(B
j
),
cosicche lintegrale di una funzione semplice è indipendente dalla rap-
presentazione usata per descriverla.
[Traccia: si osservi che se i B
j
sono disgiunti la verica è facile.
Altrimenti, risulta
s
_
j=0
B
j
=
s
_
h=1
_
0i
1
<...<i
h
s
C
i
1
,...,i
h
, C
i
1
,...,i
h
=
h
q=1
B
iq

_
j,=i
1
,...,i
h
B
j
;
si provi che i C
i
1
,...,i
h
sono disgiunti e che C
i
1
,...,i
h
B
j
= se j ,=
i
1
, . . . , i
h
, e se ne deduca che
s
j=0
j
(B
j
) =
s
h=1
j,=i
1
,...,i
h
s
j=0
j
(C
i
1
,...,i
h
B
j
) =
=
s
h=1
j,=i
1
,...,i
h
h
p=1
ip
(C
i
1
,...,i
h
).
Da qui si ricavi luguaglianza cercata.]
2. Siano
n
(x), x R, le funzioni introdotte nellesercizio 3.1.7. Si calcoli
per ogni n N
+
lintegrale
_
R
[0,1]
dm,
ove m è la misura di Lebesgue.
3. Sia W [0, 1] un insieme non misurabile secondo Lebesgue. Posto
= sup
__
1
0
dm, o, 0
W
_
,
si provi che:
(i) = supm(E) : E /, E W;
(ii) m
(W) = infm(F) : F /, F W > ;

(iii) m
(W) +m
([0, 1] W) > 1.
72
4.2 Integrale di funzioni misurabili
Estenderemo ora lintegrale ad una vasta sottoclasse delle funzioni misurabili.
In tutto il discorso che segue (X, T, ) è un ssato spazio misurato.
Denizione 4.2.1 Sia f /
X
. Se f 0, l integrale di f su X rispetto
alla misura è il numero (eventualmente +)
_
X
f d = sup
__
X
d : o, 0 f
_
.
Se f assume anche valori negativi, posto
f
+
= maxf, 0, f
= minf, 0,
diciamo che f è integrabile su X (rispetto a ) se almeno uno fra i due
integrali
_
X
f
+
d,
_
X
f
d è nito; in tal caso lintegrale di f rispetto alla

misura è
_
X
f d =
_
X
f
+
d
_
X
f
d.
(In particolare, le funzioni misurabili non negative sono sempre integrabili.)
Se entrambi gli integrali
_
X
f
+
d,
_
X
f
d sono niti, diciamo che f è

sommabile su X (rispetto a ).
Denizione 4.2.2 Sia D T, sia f /
D
. Diciamo che f è integrabile
su D rispetto alla misura se, estesa f in modo arbitrario su tutto X, la
funzione f
D
è integrabile su X; in tal caso si pone
_
D
f d =
_
X
f
D
d.
Se tale integrale è nito, si dice che f è sommabile su D (rispetto a ).
Denoteremo con /
1
(D, T, ), o semplicemente con /
1
(D), linsieme delle
funzioni sommabili su D.
Osservazioni 4.2.3 (1) Per le funzioni o, la denizione 4.2.1 è in
accordo con la denizione 4.1.1.
(2) Se f è non negativa e sommabile su X, allora
_
X
f d = sup
__
X
d : o
0
, 0 f
_
73
(esercizio 4.2.9).
(3) Se f è una funzione misurabile su X, e se B T con (B) = 0, allora f
è integrabile su B e
_
B
f d = 0. Infatti, per denizione, gli integrali su B di
f
+
e f
sono entrambi nulli in quanto ogni funzione semplice non negativa

su B ha integrale nullo su B.
(4) Se f non è misurabile, la quantità introdotta nella denizione 4.2.1 ha
ancora senso, ma non gode di buone proprietà (si veda lesercizio 4.2.16).
Analizziamo le proprietà dellintegrale appena denito.
Proposizione 4.2.4 Sia D T, siano f, g integrabili su D. Valgono i
seguenti fatti:
(i) (monotonia) se f g, allora
_
D
f d
_
D
g d;
(ii)
_
D
f d
_
D
[f[ d;
(iii) (omogeneità)
_
D
f d =
_
D
f d per ogni R.
Dimostrazione (i) Se si ha 0 f g, la tesi è facile conseguenza delle
denizioni 4.2.1 e 4.2.2. Nel caso generale, si osservi che da f g segue
f
e f
+
g
+
; dunque, per il caso precedente,
_
D
f
+
d
_
D
g
+
d,
_
D
f
d
_
D
g
d.
Sommando le due disuguaglianze, per ipotesi non si ottiene mai (),
cosicche si deduce la tesi.
(ii) Ovvia conseguenza di (i).
(iii) Se 0 e f 0, la tesi segue facilmente dalle denizioni 4.2.1 e 4.2.2
e dal lemma 4.1.3; se 0 e f è arbitraria, scrivendo f = f
+
f
e osser-
vando che (f)
= f
, la tesi segue utilizzando la parte già dimostrata. Se

0, basta applicare nuovamente la denizione di integrale, tenendo conto
del fatto che (f)
+
= [[f
e (f)
= [[f
+
.
Prima di dimostrare ladditività - e quindi la linearità - dellintegrale, pro-
viamo che lintegrale è numerabilmente additivo rispetto allinsieme di inte-
grazione:
74
Proposizione 4.2.5 Sia f una funzione integrabile su X. Se A
n
nN
è una
famiglia di insiemi misurabili fra loro disgiunti, allora posto A =
nN
A
n
si
ha _
A
f d =
nN
_
An
f d.
Osservazione 4.2.6 Si noti che, essendo ovviamente
_
f d = 0 per ogni f
integrabile, nel caso in cui f 0 questa proposizione ci dice che la funzione
di insieme
(E) =
_
E
f d, E T,
è una misura denita sulla -algebra T.
Dimostrazione della proposizione 4.2.5 Se f =
E
, con E T, la tesi
segue dalla denizione 4.1.1 e dalla numerabile additività di . Se f o e
f 0, il risultato segue allo stesso modo.
Sia ora f misurabile e non negativa e supponiamo dapprima che f sia som-
mabile su A. Fissato > 0, dalla denizione 4.2.2 segue che esiste o
tale che 0 f
A
e
_
A
d =
_
X
d >
_
X
f
A
d .
Poiche, per quanto già dimostrato,
_
A
d =
nN
_
An
d,
si deduce, essendo 0
An
f
An
, che
_
A
f d =
_
X
f
A
d <
nN
_
An
d +
nN
_
An
f d +,
e dallarbitrarietà di segue
_
A
f d
nN
_
An
f d.
Proviamo ora la disuguaglianza opposta. Per ogni > 0 e n N, esiste
n
o tale che 0
n
f
An
e
_
X
n
d >
_
An
f d

2
n+1
;
75
posto, per ogni N N,
N
=
N
n=0
n
, grazie al lemma 4.1.3 si ha
N
o
e 0
N
f
A
; ne segue
N
n=0
_
X
n
d =
_
X
N
d
_
X
f
A
d =
_
A
f d,
da cui
_
A
f d >
N
n=0
__
An
f d

2
n+1
_
>
N
n=0
_
An
f d .
Per N si ha allora
_
A
f d
n=0
_
An
f d > 0,
cioè _
A
f d
nN
_
An
f d.
Ci` o conclude la dimostrazione nel caso in cui f è non negativa e sommabile
su A. Il caso in cui f 0 e
_
A
f d = + è analogo (ssato M > 0, basta
selezionare o tale che 0 f
A
e
_
X
d > M, e poi procedere
come prima).
Inne se f è unarbitraria funzione integrabile, basta applicare la parte già
dimostrata a f
+
e f
e poi sottrarre le uguaglianze ottenute (una delle quali

è sicuramente tra quantità nite).
Osservazione 4.2.7 Dalla precedente proposizione segue questa utile pro-
prietà: se g è integrabile su D e f è una funzione misurabile su D tale
che f(x) = g(x) q.o. in D, ove D T, allora f è integrabile su D e
_
D
f d =
_
D
g d. Infatti, posto B = x D : f(x) ,= g(x), si ha B T e
(B) = 0; quindi, scrivendo D = (D B) B e utilizzando la proposizione
4.2.5 si ottiene
_
D
f
+
d =
_
D\B
f
+
d +
_
B
f
+
d =
_
D\B
g
+
d +
_
B
f
+
d;
poiche, per losservazione 4.2.3,
_
B
f
+
d =
_
B
g
+
d = 0, si deduce
_
D
f
+
d =
_
D\B
g
+
d =
_
D
g
+
d.
76
Analogamente,
_
D
f
d =
_
D\B
g
d =
_
D
g
d,
da cui, essendo g integrabile su D, la tesi.
Proposizione 4.2.8 Sia D T, siano f, g integrabili su D. Vale la seguen-
te proprietà:
(additività) se non si ha
_
D
f d =
_
D
g d = , allora
_
D
(f +g) d =
_
D
f d +
_
D
g d.
Notiamo che in eetti f +g non è denita sullinsieme
N = x D : f(x) = g(x) =
il quale, per ipotesi, ha misura nulla (si veda anche lesercizio 4.2.7). Quindi,
ponendo ad esempio f + g = 0 su N, nellintegrale a primo membro si può
sostituire D con DN senza alterarne il valore, in virt` u dellosservazione pre-
cedente. Si osservi anche che, combinando questo risultato con la proprietà
di omogeneità (proposizione 4.2.4), si ottiene che lintegrale è unapplicazione
lineare: _
D
(f +g) d =
_
D
f d +
_
D
g d,
purche naturalmente siano ben deniti i due membri.
Dimostrazione Proveremo la tesi distinguendo vari casi.
I - f, g 0. Siano , o tali che 0 f
D
, 0 g
D
: allora
0 + (f +g)
D
e dunque, per il lemma 4.1.3,
_
X
d +
_
X
d =
_
X
( +) d
_
D
(f +g) d;
per larbitrarietà di e si ottiene
_
D
f d +
_
D
g d
_
D
(f +g) d.
Per provare laltra disuguaglianza, introduciamo gli insiemi misurabili
D
m
= x D : m f(x) +g(x) < m + 1, m N
+
,
77
D
= x D : f(x) +g(x) = +,
D
m
=
_
x D :
1
m+ 1
f(x) +g(x) <
1
m
_
, m N
+
,
D
= x D : f(x) +g(x) = 0.
Fissiamo ]0, 1[ e scegliamo o tale che 0 (f +g)
D
. Siano poi
n
e
n
due successioni di funzioni semplici, costruite con la procedu-
ra descritta nella proposizione 3.1.7, convergenti puntualmente alle funzioni
f
D
e g
D
rispettivamente. Per losservazione 3.1.8, la convergenza delle
n
e delle
n
è uniforme in ciascuno degli insiemi D
m
e D
m
(m ,= ). Dunque,
poiche
(f +g) (1 )(f +g) (1 )m in D
m
,
(f +g) (1 )(f +g)
1
m+ 1
in D
m
,
< f +g = + in D
,
= f +g = 0 in D
,
per ogni m N
+
esiste
m
N tale che per qualunque n
m
risulta
(f +g) (1 )m
n
+
n
f +g in D
m
,
(f +g)
1
m+ 1

n
+
n
f +g in D
m
,

n
+
n
< + = f +g in D
,
=
n
+
n
= 0 = f +g in D
.
Per ladditività dellintegrale sulle funzioni semplici non negative e per la
monotonia, si ricava per ogni m N
+

_
D
m
d
_
D
m
(
n
+
n
) d =
=
_
D
m
n
d +
_
D
m
n
d
_
D
m
f d +
_
D
m
g d,
_
Dm
d
_
Dm
(
n
+
n
) d =
=
_
Dm
n
d +
_
Dm
n
d
_
Dm
f d +
_
Dm
g d,
78
cioè _
D
m
d
_
D
m
f d +
_
D
m
g d m N
+
,
_
Dm
d
_
Dm
f d +
_
Dm
g d m N
+
.
Sommiamo rispetto a m N
+
: dato che
D =
_
_
mN
+
D
m
_
D
_
_
mN
+
D
m
_
D
,
per la proposizione 4.2.8 si deduce
_
X
d =
_
D
d
_
D
f d +
_
D
g d,
e per larbitrarietà di ,
_
D
(f +g) d
_
D
f d +
_
D
g d.
Per 1
si ottiene la disuguaglianza cercata.

II - f, g 0. In questo caso basta applicare il risultato del caso I alle
funzioni f, g e poi usare lomogeneità.
Prima di passare agli altri casi, osserviamo che f +g è sicuramente integrabile
su D: infatti si ha (f +g)
+
f
+
+g
+
e (f +g)
+g
, e daltra parte,
per ipotesi e per la parte I già dimostrata, una almeno fra le funzioni f
+
+g
+
e f
+g
è sommabile su D.
III - f 0, g 0. In questo caso una almeno tra f e g è sommabile.
Deniamo
S
+
= x D : f(x) +g(x) 0, S
= x D : f(x) +g(x) < 0 :

dato che f
S
= (f +g)
S
+(g)
S
, per le parti I e II già dimostrate si
ha _
S
+
f d =
_
S
+
(f +g) d
_
S
+
g d,
_
S
g d =
_
S
(f +g) d
_
S
f d.
79
Supponiamo ora che, ad esempio, sia sommabile la f. Aggiungiamo ai due
membri delle uguaglianze precedenti rispettivamente le quantità
_
S
+
f d e
_
S
f d, e sottraiamo poi nella prima la quantità

_
S
+
(f +g) d (che è nita
essendo 0 f +g f su S
+
), Si ottiene
_
S
+
f d +
_
S
+
g d =
_
S
+
(f +g) d =
_
D
(f +g)
+
d,
_
S
f d +
_
S
g d =
_
S
(f +g) d =
_
D
(f +g)
d.
A queste stesse uguaglianze si arriva supponendo sommabile g in luogo di f.
Sommando le due equazioni (il che è lecito perche f +g è integrabile) si ha,
grazie alla proposizione 4.2.8, la tesi.
Notiamo che se è f 0 e g 0, anziche f 0 e g 0, si ottiene la tesi
scambiando i ruoli di f e di g.
IV - f, g di segno qualunque. Poniamo
F
+
= x D : f(x) 0, F
= x D : f(x) < 0,
G
+
= x D : g(x) 0, G
= x D : g(x) < 0,
e decomponiamo X nellunione disgiunta
X = (F
+
G
+
) (F
+
G
) (F
G
+
) (F
).
Su ciascuno di tali quattro insiemi vale la relazione di additività richiesta, in
virt` u dei passi precedenti; quindi, tenuto conto dellintegrabilità di f +g, la
tesi segue grazie alla proposizione 4.2.8.
Osservazione 4.2.9 Se f è una funzione misurabile su X, allora [f[ è inte-
grabile su ogni D T e si ha
_
D
[f[ d =
_
D
f
+
d +
_
D
f
d.
Infatti [f[ = f
+
+ f
, quindi la tesi segue dalladditività dellintegrale (pro-

posizione 4.2.8).
80
Esercizi 4.2
1. Sia f : R R cos` denita:
f(x) =
_
_
0 se x Q
n se x / Q e la sua prima cifra decimale
non nulla è la n-sima.
Si provi che f è misurabile rispetto alla misura di Lebesgue e si calcoli
lintegrale
_
R
f
[0,1]
dm.
2. Si verichi che se f è sommabile su X, allora f è sommabile su D per
ogni D T.
3. Si verichi che se D T e f /
D
, allora f è sommabile su D se e
solo se lo è [f[.
4. Si provi che se f è una funzione denita in [a, b], misurabile secondo
Lebesgue e Riemann-integrabile in [a, b], allora f è sommabile in [a, b].
5. Siano A, B T con (B) = 0. Si provi che se f è integrabile su X,
allora _
A
f d =
_
AB
f d.
6. Sia D T e sia f misurabile su D. Se esiste una funzione g, sommabile
su D, tale che [f[ g q.o. in D, si provi che anche f è sommabile su
D e che _
D
[f[ d
_
D
g d.
7. Sia D T e sia f sommabile su D. Si dimostri che
(x D : [f(x)[ = +) = 0.
8. Sia D T e sia f misurabile su D. Si provi che
_
D
[f[ d = 0 se e solo
se f = 0 q.o. in D.
81
9. Se f è sommabile su X e f 0, si verichi che
_
X
f d = sup
__
X
d : o
0
, 0 f
_
;
utilizzando la funzione
]0,[
nello spazio misurato (R, T, m), ove m è
la misura di Lebesgue e T è la -algebra denita da
T = /
],0]
E / : E = A]0, [, A /
],0]
,
si provi che lenunciato precedente non vale se f è soltanto integrabile.
10. Se (X, T, ) è uno spazio misurato -nito, si provi che per ogni fun-
zione f non negativa ed integrabile su X si ha
_
X
f d = sup
__
X
d : o
0
, 0 f
_
.
11. Se f è sommabile su X (oppure (X, T, ) è uno spazio misurato -
nito) e f 0, si verichi che
_
X
f d = inf
__
X
d : o
0
, 0 f
_
.
12. Sia f sommabile su X; si provi che linsieme x X : f(x) ,= 0 è
-nito, cioè è unione numerabile di insiemi misurabili A
n
A
n+1
di
misura nita.
13. Sia f misurabile e q.o. nita su X, con (X) < . Posto, per ogni
n N
+
, E
n
= x X : n 1 [f(x)[ < n, si provi che f è
sommabile se e solo se la serie
n=1
n (E
n
) è convergente. Che succede
se (X) = +?
14. Sia f sommabile su X. Posto, per ogni n N, F
n
= x X : [f(x)[ >
n, si provi che risulta lim
n
n(F
n
) = 0.
`
15. Sia (X, T, ) uno spazio misurato con (X) < . Si denisca linsieme
M = f : X R : f è misurabile e q.o. nita
82
e si consideri linsieme quoziente M
0
= M/ , ove
f g f = g q.o. in X.
Posto
d(f, g) =
_
X
[f g[
1 +[f g[
d, f, g M
0
,
si provi che:
(i) d è una distanza su M
0
e (M
0
, d) è uno spazio metrico completo;
(ii) si ha d(f
n
, f) 0 se e solo se f
n
f in misura.
16. Si mostri che la denizione 4.2.1 è applicabile anche a funzioni non
misurabili, ma che in tal caso lintegrale non è necessariamente additivo.
[Traccia: si considerino f =
W
e g =
[0,1]\W
, con W [0, 1] non
misurabile secondo Lebesgue, e si applichi lesercizio 4.1.3.]
4.3 Passaggio al limite sotto il segno di inte-
grale
Una delle pi` u importanti caratteristiche della teoria dellintegrazione che stia-
mo esponendo è il fatto di poter scambiare fra loro le operazioni di limite e
di integrazione sotto ipotesi molto blande. Il primo risultato di questo tipo
riguarda successioni crescenti di funzioni non negative, ed è di grande impor-
tanza perche si applica in modo naturale alle serie di funzioni assolutamente
convergenti.
Teorema 4.3.1 (di B. Levi, o della convergenza monotona) Sia (X,
T, ) uno spazio misurato, e sia f
n
nN
una successione di funzioni mi-
surabili denite su X, tali che 0 f
n
f
n+1
per ogni n N. Posto
f(x) = lim
n
f
n
(x), si ha
lim
n
_
X
f
n
d =
_
X
f d.
Osserviamo che il risultato è falso se si sopprime qualcuna delle ipotesi. Ad
esempio, in (R, /, m) le funzioni f
n
=
[n,[
formano una successione
crescente ma non positiva, e risulta
_
X
f
n
d = n N,
_
X
lim
n
f
n
d = 0;
83
invece le funzioni f
n
=
[n,n+1]
sono non negative ma non formano una
successione crescente, e risulta
_
X
f
n
d = 1 n N,
_
X
lim
n
f
n
d = 0.
Dimostrazione () Evidente conseguenza della monotonia dellintegrale
(proposizione 4.2.4).
() Fissiamo o tale che 0 f, e sia ]0, 1[. Gli insiemi
A
n
= x X : f
n
(x) (x) appartengono a T, si ha A
n
A
n+1
e
nN
A
n
= X. Per monotonia ed omogeneità (proposizione 4.2.4) si ha per
ogni n N
_
An
d =
_
An
d
_
An
f
n
d
_
X
f
n
d.
Poiche, per losservazione 4.2.6, (E) =
_
E
d è una misura, utilizzando la
proposizione 2.1.5 si ricava per n
_
X
d = lim
n
_
An
d lim
n
_
X
f
n
d ]0, 1[.
Passando al limite per 1
, si ottiene
_
X
d =
_
X
0
d lim
n
_
X
f
n
d o con 0 f,
da cui la tesi per denizione di integrale.
Se la successione di funzioni non negative non è crescente, il teorema di B.
Levi non è applicabile, ma vi è comunque un criterio di passaggio al limite.
Proposizione 4.3.2 (lemma di Fatou) Sia (X, T, ) uno spazio misurato
e sia f
n
nN
una successione di funzioni misurabili e non negative. Allora
posto f(x) = liminf
n
f
n
(x), si ha
_
X
f d liminf
n
_
X
f
n
d.
Dimostrazione Si ha f = sup
n
inf
mn
f
m
; quindi, posto g
n
= inf
mn
f
m
,
la successione g
n
nN
verica le ipotesi del teorema di B. Levi. Ne segue,
essendo ovviamente g
n
f
n
,
_
X
f d = lim
n
_
X
g
n
d liminf
n
_
X
f
n
d.
84
Il pi` u importante teorema di passaggio al limite sotto il segno di integrale è
però il seguente:
Teorema 4.3.3 (di Lebesgue o della convergenza dominata) Sia (X,
T, ) uno spazio misurato, e sia f
n
nN
una successione di funzioni misu-
rabili tali che:
(i) lim
n
f
n
(x) = f(x) per ogni x X;
(ii) [f
n
(x)[ g(x) per ogni x X, ove g è una funzione sommabile su X.
Allora
lim
n
_
X
f
n
d =
_
X
f d.
Si osservi che la tesi del teorema si può raorzare: in eetti si può concludere
che lim
n
_
X
[f
n
f[ d = 0 (basta considerare le funzioni [f
n
f[ in luogo
delle f
n
, ed osservare che esse tendono puntualmente a 0 e sono dominate
dalla funzione sommabile 2g).
Dimostrazione Applichiamo il lemma di Fatou alle successioni g + f
n
e g f
n
, entrambe puntualmente convergenti e costituite da funzioni non
negative. Si ottiene
_
X
(g +f) d liminf
n
_
X
(g +f
n
) d =
_
X
g d + liminf
n
_
X
f
n
d,
_
X
(g f) d liminf
n
_
X
(g f
n
) d =
_
X
g d limsup
n
_
X
f
n
.
Sottraendo la quantità nita
_
X
g d, si ottiene
limsup
n
_
X
f
n
d
_
X
f d liminf
n
_
X
f
n
d,
cioè la tesi.
Il teorema di Lebesgue ha anche una versione continua, di grande impor-
tanza nelle applicazioni.
Teorema 4.3.4 Sia (X, T, ) uno spazio misurato, sia t
0
R e sia f :
X R t
0
R una funzione tale che:
(i) f(, t) è misurabile su X per ogni t R t
0
;
85
(ii) [f(x, t)[ g(x) per ogni x X e t R t
0
, con g sommabile su X;
(iii) lim
tt
0
f(x, t) = F(x) per ogni x X.
Allora
lim
tt
0
_
X
f(, t) d =
_
X
F d.
Dimostrazione Sia t
n
nN
Rt
0
unarbitraria successione che tende a
t
0
per n ; posto f
n
= f(, t
n
), la successione f
n
converge puntualmente
a F in X ed è dominata dalla funzione sommabile g. Dunque per il teorema
di Lebesgue
lim
n
_
X
f(, t
n
) d =
_
X
F d.
Dallarbitrarietà della successione t
n
segue la tesi.
Esempio 4.3.5 Sia f : R
2
R tale che:
(i) f(, t) è sommabile su R per ogni t R;
(ii) f è derivabile rispetto a t in ogni punto (x, t) R
2
;
(iii)
f
t
(x, t)
(x) per ogni (x, t) R

2
, ove è una funzione sommabile
su R.
In queste ipotesi si ha, indicando con m
x
la misura di Lebesgue rispetto alla
variabile x,
d
dt
_
R
f(x, t) dm
x
=
_
R
f
t
(x, t) dm
x
.
Infatti, ssato t R, i rapporti incrementali
f
h
(x) =
f(x, t +h) f(x, t)
h
x R, h ,= 0,
vericano le ipotesi del teorema 4.3.4 perche, grazie al teorema del valor
medio,
[f
h
(x)[ =
f
t
(x,
t,x,h
)
(x) h ,= 0, x R,
con
t,x,h
compreso fra t e t +h; ne segue che
lim
h0
_
R
f
h
(x) dm
x
=
_
R
f
t
(x, t) dm
x
,
86
Esercizi 4.3
1. Dimostrare che il teorema di B. Levi è ancora valido se si suppone che
per ogni n N le relazioni 0 f
n
f
n+1
siano vericate soltanto q.o.
in X.
2. Si provi questa generalizzazione del teorema 4.3.1: se le funzioni f
n
sono
misurabili e vericano f
n+1
f
n
g, ove g è una funzione sommabile
su X, allora posto f(x) = lim
n
f
n
(x), si ha
lim
n
_
X
f
n
d =
_
X
f d.
3. Sia f
n
nN
una successione di funzioni misurabili e non negative su
X. Si provi che
n=0
_
X
f
n
d =
_
X
n=0
f
n
d.
4. Dimostrare che il lemma di Fatou ed il teorema di Lebesgue sono ancora
validi supponendo che per ogni n N la relazione puntuale richiesta
per f
n
sia vericata soltanto q.o. in X, anziche per ogni x X.
5. Esibire una successione f
n
di funzioni misurabili tale che
_
X
liminf
n
f
n
d < liminf
n
_
X
f
n
d < limsup
n
_
X
f
n
d <
_
X
limsup
n
f
n
d.
[Traccia: per ogni n N si ponga f
2n+1
=
[1/3,1]
, f
2n+2
=
[0,1/3]
.]
6. Sia f
n
una successione di funzioni integrabili su X, tale che:
(i) f
n
(x) f(x) q.o. in X per n ;
(ii) [f
n
(x)[ g
n
(x) q.o. in X per ogni n N;
(iii) g
n
(x) g(x) q.o. in X per n ;
(iv) g
n
e g sono sommabili su X e
_
X
g
n
d
_
X
g d per n .
Si provi che
lim
n
_
X
f
n
d =
_
X
f d.
87
7. Sia f
n
una successione di funzioni misurabili su X. Se
n=0
_
X
[f
n
[ d < ,
si provi che
n=0
f
n
è sommabile su X e che
_
X
n=0
f
n
d =
n=0
_
X
f
n
d.
8. Sia (X, T, ) uno spazio misurato. Se f è sommabile su X, si provi che
lim
n
_
X
[f[
1/n
d = (x X : f(x) ,= 0).
9. Si provi che se f
n
è una successione di funzioni sommabili tale che
_
X
[f
n
f[ d 0, allora f
n
f in misura.
`
10. (Teorema di Severini-Egorov con convergenza dominata) Sia f
n
una
successione di funzioni misurabili su X, tali che f
n
(x) f(x) q.o. in X,
e supponiamo che esista g sommabile su X per cui risulti [f
n
(x)[ g(x)
q.o. in X per ogni n N. Si provi che per ogni > 0 esiste un insieme
misurabile E con (E) < , tale che f
n
c
per
n .
[Traccia: si ripeta, con le modiche necessarie, la dimostrazione del
teorema 3.4.2.]
11. (Lemma di Fatou per la convergenza in misura) Sia f
n
una succes-
sione di funzioni misurabili e q.o. nite su X, con f
n
0 q.o.; si provi
che se f
n
f in misura, allora
0
_
X
f d liminf
n
_
X
f
n
.
[Traccia: per assurdo, usando la denizione di minimo limite, si tro-
verà una sottosuccessione di f
n
, dalla quale si estrarrà unulteriore
sottosuccessione a cui applicare il lemma di Fatou . . . ]
12. Si provi che se f
n
f in misura, e se esiste una funzione sommabile g
tale che [f
n
[ g q.o., allora
_
X
[f
n
f[ d 0.
[Traccia: si applichi lesercizio precedente a 2g [f
n
f[.]
88
13. Sia T
t
t[0,1]
una famiglia di -algebre di sottoinsiemi di un ssato
insieme X. Per ogni t [0, 1], sia
t
una misura su (X, T
t
); posto
T =
t[0,1]
T
t
, supponiamo che per ogni E T la funzione t
t
(E)
sia misurabile secondo Lebesgue.
(i) Si provi che la funzione
(E) =
_
1
0
t
(E) dt
è una misura su (X, T);
(ii) si descriva esplicitamente la misura nei casi seguenti:
(a) X = [0, 1], T
t
= /,
t
= misura di Dirac concentrata nel
punto t,
(b) X = [0, 1], T
t
= /,
t
(E) = m(E [0, t]).
4.4 Confronto fra integrale di Riemann ed
integrale di Lebesgue
Consideriamo lo spazio misurato (R, /, m). Come suggerisce lesercizio
4.2.4, sembra esserci una relazione fra lintegrabilità secondo Riemann e la
sommabilità secondo Lebesgue: come vedremo subito, la prima implica la se-
conda e lintegrale di Riemann di una funzione, se esiste, coincide con quello
di Lebesgue. Ciò, fra laltro, ci permetterà di dire che il calcolo esplicito di
un integrale di Lebesgue, quando è possibile, si fa esattamente come siamo
da sempre abituati a fare. Questo paragrafo è dedicato al confronto tra le
due nozioni di integrale, compreso il caso degli integrali di Riemann impro-
pri; daremo anche una caratterizzazione delle funzioni Riemann integrabili
in termini della misura di Lebesgue.
Indicheremo con 1(a, b) linsieme delle funzioni Riemann integrabili sullin-
tervallo [a, b] R, e con /
1
(a, b) quello delle funzioni Lebesgue sommabili su
[a, b]; denoteremo rispettivamente con
_
b
a
f(x) dx,
_
b
a
f dm
gli integrali di f su [a, b] secondo Riemann e secondo Lebesgue.
Per quanto riguarda lintegrale di Riemann su un intervallo, vale il seguente
risultato:
89
Proposizione 4.4.1 Se f 1(a, b), allora f /
1
(a, b) e
_
b
a
f dm =
_
b
a
f(x) dx;
viceversa, esistono funzioni sommabili su [a, b] che non sono Riemann inte-
grabili su [a, b].
Dimostrazione La funzione
Q
è sommabile in ogni [a, b] R, con inte-
grale nullo, ma non è Riemann integrabile su alcun intervallo di ampiezza
positiva.
Dimostriamo lenunciato principale. Sia f 1(a, b): proviamo per pri-
ma cosa che f è misurabile (rispetto alla misura di Lebesgue). Anzitutto
osserviamo che per ogni funzione costante a tratti e nulla fuori di [a, b],
=
k
i=1
I
i
, I
i
[a, b] intervalli disgiunti,
lintegrale di Riemann e quello di Lebesgue su [a, b] coincidono:
_
b
a
(x) dx =
_
b
a
dm =
k
i=1
i
m(I
i
).
Per denizione, poi, f è limitata in [a, b] e si ha
_
b
a
f(x)dx = sup
__
b
a
dm : costante a tratti, f in [a, b]
_
=
= inf
__
b
a
dm : costante a tratti, f in [a, b]
_
.
Quindi esistono due successioni
n
,
n
di funzioni costanti a tratti tali
che
n
f
n
in [a, b] e
_
b
a
(
n
n
) dm <
1
n
per ogni n N
+
. Inoltre si
pu` o supporre che
n

n+1
e
n

n+1
per ogni n (rimpiazzando
n
con
max
kn
k
e
n
con min
kn
k
).
Deniamo ora
= sup
n
n
= lim
n
n
= inf
n
n
= lim
n
n
.
Le funzioni e sono misurabili (proposizione 3.1.6), e si ha f ;
dimostriamo che = q.o. in [a, b].
90
Poiche 0
n
n
per ogni n N
+
, per la monotonia dellintegrale
deduciamo
0
_
b
a
( ) dm
1
n
n N
+
;
quindi , essendo non negativa ed avendo integrale nullo, è q.o. nulla in
[a, b] per lesercizio 4.2.7.
Pertanto abbiamo = f = q.o. in [a, b]: dunque f coincide q.o. con
una funzione misurabile e quindi, in virt` u della completezza della misura di
Lebesgue, è essa stessa misurabile (osservazione 3.2.2).
Poichè f è limitata in [a, b], f è sommabile su [a, b]. Inoltre, per la monotonia
dellintegrale, per ogni coppia di funzioni costanti a tratti , , tali che
f in [a, b], risulta
_
b
a
dm
_
b
a
f dm
_
b
a
dm;
ne segue, per denizione di integrale di Riemann,
_
b
a
f(x) dx
_
b
a
f dm
_
b
a
f(x) dx.
il che prova che gli integrali di Riemann e di Lebesgue di f coincidono.
Per quanto riguarda gli integrali di Riemann impropri, la situazione è meno
facile. Ci limiteremo per semplicità a trattare il caso di integrali impropri su
[0, [; indicheremo con 1
(0, ) la classe delle funzioni che sono Riemann

integrabili in senso improprio su tale semiretta: per denizione, si ha f
1
(0, ) se e solo se f 1(a, b) per ogni [a, b] [0, [ ed esiste nito il

limite
lim
b+
_
b
0
f(x) dx,
il quale denisce appunto lintegrale improprio
_
0
f(x) dx.
Proposizione 4.4.2 (i) Se f /
1
(0, ), allora in generale f / 1
(0, ).
(ii) Se f /
1
(0, ), e se f 1(a, b) per ogni [a, b] [0, [, allora f
1
(0, ) e
_

0
f(x) dx =
_

0
f dm .
91
(iii) Se f 1
(0, ) allora in generale f / /

1
(0, ).
(iv) Se f, [f[ 1
(0, ) allora f /
1
(0, ) e
_

0
f dm =
_

0
f(x) dx.
Dimostrazione (i) La funzione
Q
è sommabile su [0, [ con integrale
nullo, e non appartiene a 1
(0, ).
(ii) La funzione f è sommabile su [0, [, e poiche per ipotesi essa è anche
Riemann integrabile su ogni [a, b] [0, [, dalla proposizione 4.4.1 segue che
_
b
0
f(x)dx =
_
b
0
f dm b > 0.
Passiamo al limite per b +: per ogni x > 0 si ha
lim
b+
f(x)
[0,b]
(x) = f(x)
[0,+[
(x),
ed inoltre
[f(x)
[0,b]
(x) [f(x)[ x > 0;
quindi dalla sommabilità di f e dal teorema 4.3.4 segue che
_

0
f(x) dx =
_

0
f dm,
da cui la tesi.
(iii) La funzione
f(x) =
_
sin x
x
se x 0
1 se x = 0
è continua su [0, [; inoltre, come si sa, f 1
(0, ) mentre [f[ / 1
(0, ).
Ne segue che f non è sommabile su [0, [: infatti se fosse f /
1
(0, ),
avremmo anche [f[ /
1
(0, ), e allora da (ii) seguirebbe [f[ 1
(0, ),
cosa che non è vera.
(iv) Se f, [f[ 1
(0, ), allora in particolare f, [f[ 1(a, b) per ogni

[a, b] [0, [; dalla proposizione 4.4.1 segue allora che f
[a,b]
è misurabile
per ogni [a, b] [0, [, e quindi f, essendo il limite puntuale di f
[0,n]
per
92
n , è misurabile. Inoltre, applicando il teorema di B. Levi (teorema
4.3.1) alla successione [f[
[0,n]
, si ottiene
_

0
[f[ dm = lim
n
_
n
0
[f[ dm = lim
n
_
n
0
[f(x)[ dx =
_
+
0
[f(x)[ dx.
In particolare, tale integrale è nito e pertanto [f[ è sommabile su [0, [. Di
conseguenza f è sommabile su [0, [ ed applicando (ii) si ottiene la tesi.
`
E possibile caratterizzare, tramite la misura di Lebesgue, le funzioni di
/
1
(a, b) che appartengono alla sottoclasse 1(a, b). Si ha infatti:
Proposizione 4.4.3 Sia f : [a, b] R una funzione limitata. Si ha f
1(a, b) se e solo se linsieme dei punti di discontinuità di f è misurabile
secondo Lebesgue ed ha misura nulla.
Dimostrazione (=) Sia f 1(a, b). Come abbiamo visto nella dimo-
strazione della proposizione 4.4.1, per ogni n N
+
esistono
n
,
n
costanti
a tratti in [a, b] tali che
n

n+1
f
n+1

n
in [a, b],
_
b
a
(
n
n
) dm <
1
n
,
ed inoltre, posto = sup
n
n
e = inf
n
n
, si ha f in [a, b] e
= f = q.o. in [a, b].
Deniamo ora
B = x [a, b] : n N
+
: x è punto di discontinuità per
n
o per
n
,
P = x [a, b] : (x) < (x);
come si è visto P ha misura nulla, ed anche B ha misura nulla essendo al pi` u
numerabile. Quindi
A B P / e m(A) = 0.
Dimostriamo che f è discontinua al pi` u nei punti di A: ciò proverà la tesi.
Se x è un punto di discontinuità per f, devono esistere > 0 e x
k
kN
tali
che
lim
k
x
k
= x, [f(x
k
) f(x)[ k N.
93
Per provare che x A, notiamo che se x B allora evidentemente x A;
se invece x / B, allora x è punto di continuità per tutte le funzioni
n
,
n
.
Dato che tali funzioni sono costanti a tratti, ciò implica che per ogni n N
+
esiste k
n
N tale che
n
(x
k
) =
n
(x),
n
(x
k
) =
n
(x) k k
n
.
Ne segue, ssando arbitrariamente n e scegliendo k k
n
,
n
(x)
n
(x) =
_

n
(x)
n
(x
k
) f(x) f(x
k
) se f(x
k
) f(x)
n
(x
k
)
n
(x) f(x
k
) f(x) se f(x
k
) f(x) +.
In entrambi i casi si deduce
n
(x)
n
(x) [f(x
k
) f(x)[ n N
+
,
e passando al limite per n otteniamo
(x) (x) + > (x).
Pertanto x P ed inne, come si voleva, x A.
(=) Sia f limitata in [a, b] e continua salvo che in un insieme di punti di
misura di Lebesgue nulla. Per ogni n N consideriamo la partizione
n
di
[a, b[ i cui nodi sono
x
i
= a +
i
2
n
(b a), i = 0, 1, . . . , 2
n
,
e poniamo I
in
= [x
i1
, x
i
[, i = 1, . . . , 2
n
; deniamo poi le seguenti funzioni
costanti a tratti:
n
=
2
n
i=1
inf
I
in
f
I
in
,
n
=
2
n
i=1
sup
I
in
f
I
in
.
Dato che, per ogni n,
n+1
è pi` u ne di
n
, è chiaro che
inf
[a,b[
f =
0

n

n+1
f
n+1

n

0
= sup
[a,b[
f .
Quindi, posto = sup
n
n
e = inf
n
n
, si ha per il teorema di Lebesgue
lim
n
_
b
a
n
dm =
_
b
a
dm, lim
n
_
b
a
n
dm =
_
b
a
dm,
94
da cui
lim
n
_
b
a
(
n
n
) dm =
_
b
a
( ) dm.
Osserviamo ora che se x è un punto di continuità di f, allora deve essere
(x) = (x). Infatti, se f è continua in x, ssato > 0 esiste > 0 tale che
[x
t
x[ < = [f(x
t
) f(x)[ <

2
;
allora, per n abbastanza grande, lunico intervallo I
in
a cui appartiene x è
contenuto in ]x , x +[. Di conseguenza si ha, per n abbastanza grande,
x
t
I
in
= [f(x
t
) f(x)[ <

2
,
e dunque
n
(x)
n
(x) = sup
I
in
f inf
I
in
f

2
denitivamente.
Quindi, a maggior ragione,
0 (x) (x) < .
Poiche è arbitrario, deve essere (x) = (x).
Per ipotesi, i punti di discontinuità di f formano un insieme di misura nulla:
ne segue, essendo f in [a, b],
= f = q.o. in [a, b],
cosicche f è misurabile grazie alla completezza della misura di Lebesgue.
Inoltre
_
b
a
dm =
_
b
a
f dm =
_
b
a
dm,
ed in particolare
lim
n
_
b
a
(
n
n
) dm = 0.
Per denizione di integrale di Riemann si conclude che f 1(a, b) e
_
b
a
f(x) dx =
_
b
a
f dm.
95
Esercizi 4.4
1. Determinare una successione di funzioni f
n
denite in [0, 1], tali che:
(i) lim
n
f
n
(x) = 0 x [0, 1], (ii) lim
n
_
1
0
f
n
dm = 1.
2. Determinare una funzione f, sommabile su R, ed illimitata sul comple-
mentare di ogni compatto.
3. Si consideri la funzione di Eulero, già incontrata nel teorema 2.6.1.
Si provi che è una funzione di classe C
, ed anzi analitica, su ]0, [,

e che
(n)
(p) =
_

0
x
p1
(log x)
n
e
x
dx p > 0.
4. Si consideri la funzione
F(a) =
_
/2
0
dt
_
1 a sin
2
t
, 0 < a < 1.
(i) Si verichi che F è di classe C
su ]0, 1[.
(ii) Si calcolino, se esistono, i limiti
lim
a0
+
F(a), lim
a1
F(a).
5. Sia
f
n
(x) =
_
n +x
n + 2x
_
n
, x [0, [.
Dimostrare che f
n
f
n+1
e calcolare lim
n
f
n
(x); dire inoltre se si
può passare al limite sotto il segno di integrale nei due casi seguenti:
(i)
_
0
f
n
(x)e
x/2
dm, (ii)
_
0
f
n
(x)e
x/2
dm.
6. Dimostrare le seguenti uguaglianze:
(i)
_
1
0
x
p
1x
[ log x[ dx =
n=1
1
(n+p)
2
p > 1,
(ii)
_
0
sin x
e
x
t
dx =
n=0
t
n
1+(n+1)
2
t [1, 1],
96
(iii)
_
1
0
sin x log x dx =
n=1
(1)
n
2n(2n)!
,
(iv) lim
n
_
n
0
(1
x
n
)
n
x
p1
dx = (p) p > 0,
(v)
_
1
0
n=1
x
n1
n
dx =
n=1
1
n
3/2
,
(vi)
_
0
cos x
e
x
+1
dx =
n=1
(1)
n1 n
n
2
+1
,
(vii)
_
n=1
n
2
sin nx
a
n
dx =
2a(1+a
2
)
(a
2
1)
2
a > 1,
(viii)
_
0
e
x
cos
x dx =
n=0
(1)
n n!
(2n)!
,
(ix) lim
n
_
0
(1 +
x
n
)
n
x
1/n
dx = 1,
(x)
_
1
0
_
log x
1x
_
2
dx =

2
3
,
(xi)
_
1
0
(e
x
1)(log x +
1
x
) dx =
n=1
n
2
+n+1
(n1)!(n
2
+n)
2
,
(xii)
_
1
0
(xlog x)
2
1+x
2
dx = 2
n=0
(1)
n+1
(2n+1)
3
,
(xiii)
_
0
sinhax
sinh bx
dx =
n=0
2a
(2n+1)
2
b
2
a
2
b > a > 0,
(xiv)
_
0
e
x
2
sin x dx =
n=0
(1)
n
n!
2(2n+1)!
.
(xv)
1
k!
_
1
0
[ log x[
k
1+x
dx =
n=1
(1)
n1
n
k+1
k N.
7. Calcolare, se esistono, i limiti
(i) lim
n
_
n
0
1
x
n
+x
2
dx, (ii) lim
n
_
0
nx+x
2
1+nx
3/2
e
x
dx.
(iii) lim
n
_
0
sin n
xcos nxe
x
nx+x
2
dx.
8. Si verichi che se a > 0 si ha
lim
n
_

a
n
2
xe
n
2
x
2
1 +x
2
dx = 0,
e che ciò è falso per a = 0.
97
9. Si provi che per p, q > 0 risulta
_
1
0
x
p1
1 +x
q
dx =
n=0
(1)
n
p +nq
;
dedurne che
n=0
(1)
n
n + 1
= log 2,
n=0
(1)
n
2n + 1
=

4
,
n=0
(1)
n
3n + 1
=
1
3
log 2 +

3
3
.
10. Si provi che per [a[ 1 risulta
_
1
0
1 x
1 ax
3
dx =
n=0
a
n
(3n + 1)(3n + 2)
;
dedurne che
n=0
1
(3n + 1)(3n + 2)
=

3
3
,
n=0
1
(6n + 1)(6n + 2)
=

6
3
+
1
3
log 2.
11. Sia f :]0, [R una funzione misurabile, tale che le funzioni x
f(x),
x
f(x) siano sommabili su ]0, [, ove , sono numeri reali con < .
Provare che x
f(x) è sommabile su ]0, [ per ogni ], [, e che la

funzione F() =
_
0
x
f(x) dm è continua in [, ].
12. Poniamo
F
n
(t) =
n
_
R
f(x)
1 +n
2
(x t)
2
dm, t R,
ove f L
(R). Provare che se f è continua in un punto t R, allora

lim
n
F
n
(t) = f(t).
13. Sia C
linsieme di Cantor di parametro ]0,

1
3
[ (paragrafo 1.6). Le
funzioni
C
sono Riemann integrabili su [0, 1]?

14. Sia f : [a, b] R una funzione tale che per ogni x
0
[a, b] esista nito
il limite
g(x
0
) lim
xx
0
f(x).
Dimostrare che f è limitata, che f è misurabile, e che f è Riemann
integrabile.
15. Si costruisca un elemento f L
1
(0, 1) tale che nessuna funzione equi-
valente a f sia Riemann integrabile.
98
4.5 Assoluta continuità
Vogliamo analizzare certe relazioni che possono intercorrere fra diverse misure
denite su una stessa -algebra. Consideriamo dunque un insieme X ed una
-algebra T di sottoinsiemi di X; siano poi , due misure denite su T.
Denizione 4.5.1 Diciamo che è assolutamente continua rispetto a , e
scriviamo , se
E T, (E) = 0 = (E) = 0.
Una misura è quindi assolutamente continua rispetto ad unaltra misura
se ha (almeno) gli stessi insiemi di misura nulla che ha .
Denizione 4.5.2 Sia A T; diciamo che la misura è concentrata su A
se si ha
(E) = (E A) E T.
Questa denizione è stata già incontrata nellesempio 2.1.3 (2). Si può dire,
equivalentemente, che è concentrata su A se e solo se risulta (E) = 0
per ogni E T disgiunto da A. Si noti che linsieme A non è univocamente
determinato: se è concentrata su A, allora è concentrata anche su tutti
gli insiemi di T che contengono A, ed anche su quelli che dieriscono da A
per un insieme di misura nulla (esercizio 4.5.1).
Denizione 4.5.3 Diciamo che è singolare rispetto a , e scriviamo
, se esistono due insiemi disgiunti A, B T tali che sia concentrata su
A e sia concentrata su B.
Notiamo che la relazione di assoluta continuità è riessiva e transitiva, mentre
quella di singolarità è simmetrica. Inoltre le due nozioni sono fra loro duali,
nel senso precisato dalla seguente
Proposizione 4.5.4 Siano
1
,
2
, misure sulla -algebra T. Allora:
(i) se
1
e
2
, allora
1
+
2
;
(ii) se
1
e
2
, allora
1
+
2
;
(iii) se
1
e
2
, allora
1

2
;
(iv) se
1
e
1
, allora
1
= 0.
99
Dimostrazione Vedere lesercizio 4.5.3.
Il termine assoluta continuità, che sembra avere poca anità con il con-
cetto espresso nella denizione 4.5.1, è giusticato dalla proposizione che
segue:
Proposizione 4.5.5 Siano , misure denite sulla -algebra T, e suppo-
niamo che (X) < +. Si ha se e solo se per ogni > 0 esiste > 0
tale che
E T, (E) < = (E) < .
Dimostrazione (=) Sia . Ragioniamo per assurdo: negando la
tesi, otteniamo che esiste > 0 tale che, per ogni n N, si può trovare
E
n
T per il quale risulta (E
n
) < 2
n
e (E
n
) . Posto allora
F
n
=
_
k=n
E
k
, F =
nN
F
n
= limsup
n
E
n
,
si ha
(F
n
)
k=n
(E
k
)
k=n
2
k
,
da cui (F
n
) 0 per n ; dato che F F
n
per ogni n N, si deduce
(F) (F
n
) per ogni n N e pertanto (F) = 0. Daltra parte, essendo
F
n
E
n
, risulta (F
n
) (E
n
) per ogni n N; e poiche F
n
F
n+1
,
dal fatto che (X) < e dalla proposizione 2.1.5 segue che
(F) = lim
n
(F
n
) .
Quindi non verica la denizione di assoluta continuità rispetto a .
(=) Ragionando nuovamente per assurdo, sia E T tale che (E) = 0 e
(E) > 0: allora, scelto ]0, (E)], si ha che
(E) = 0 < > 0, ma (E) ,
contraddicendo cos` lipotesi.
Osserviamo che la caratterizzazione fornita dalla proposizione precedente non
vale in generale per misure non nite (esercizio 4.5.4).
Lesempio tipico di una misura nita ed assolutamente continua rispetto ad
una misura assegnata è dato dallintegrale di una funzione -sommabile.
Vale infatti la proprietà seguente (assoluta continuità dellintegrale):
100
Proposizione 4.5.6 Sia (X, T, ) uno spazio misurato. Se f è una funzione
misurabile su X, allora la misura
(E) =
_
E
[f[ d, E T,
è assolutamente continua rispetto a . Se in particolare f /
1
(X), allora
è una misura nita su X.
Dimostrazione Sia f /
1
(X). Ovviamente allora risulta
(X) =
_
X
[f[ d < .
Inoltre, se f è misurabile su X, allora [f[ è integrabile e per ogni E T con
(E) = 0 si ha (E) = 0 grazie allosservazione 4.2.3.
Uno dei pi` u importanti risultati di teoria della misura è costituito dal vice-
versa di questa proposizione, noto come teorema di Radon-Nikodym; da esso
segue che se (X, T, ) è uno spazio misurato -nito, allora ogni misura nita
denita su T, assolutamente continua rispetto a , è del tipo
(E) =
_
E
[f[ d
per qualche f -sommabile su X. Dimostreremo questo teorema pi` u avanti
nel corso.
Esercizi 4.5
1. Si provi che se è una misura concentrata su un insieme A T, allora
è concentrata in ogni insieme B T tale che (A B) = 0, mentre
non è concentrata su alcun insieme D tale che (A D) > 0.
2. Sia (X, T, ) uno spazio misurato e sia f /
X
.
(i) Si verichi che o = B R : f
1
(B) T è una -algebra di
sottoinsiemi di R che contiene i boreliani ma non è necessariamente
contenuta in /.
101
(ii) Posto
f
(B) = (f
1
(B)) B o,
si provi che
f
è una misura su o, che
f
è concentrata su f(X),
e che se è completa, oppure nita, allora
f
è completa, oppu-
re nita. Se è -nita, è vero che
f
è -nita? (Ricordiamo
che, allorche X è uno spazio probabilizzato, la misura è chia-
mata misura immagine, o legge, della variabile aleatoria f; si veda
lesercizio 3.1.6.)
(iii) Si verichi che
_
R
B
(t) d =
_
X
B
(f(x)) d B o,
e si deduca che se (X) < allora
_
R
g(t) d =
_
X
g(f(x)) d g L
1
(R, o, ).
(iv) Si provi che se f, g /
X
, e se risulta (f
1
(g(X))) = 0, oppure
(g
1
(f(X))) = 0, allora
f

g
.
(v) Sia X = [1, 1] e sia la misura di Lebesgue su X. Se f(x) =
max x, 0 e g(x) = min x, 0, è vero che
f

g
?
3. Si dimostrino gli enunciati della proposizione 4.5.4.
4. Sia la misura di Lebesgue su ]0, 1[, e poniamo
(E) =
_
E
dt
t
, E /, E ]0, 1[.
Si provi che è assolutamente continua rispetto a , ma non vale la
condizione espressa nella proposizione 4.5.6.
5. Sia (X, T, ) uno spazio misurato con (X) < . Se f
n
, f sono fun-
zioni misurabili tali che f
n
f in misura, si provi che, dette
n
e le
leggi di f
n
e f rispettivamente, risulta
lim
n
_
R
g d
n
=
_
R
g d g C
0
(R) L
(R).
(Se (X) = 1, in linguaggio probabilistico si dice che le variabili alea-
torie f
n
convergono in legge alla variabile aleatoria f.)
Traccia: Si utilizzi la formula illustrata nellesercizio 4.5.2(iii).]
102
4.6 Lo spazio L
1
Poiche due funzioni sommabili che coincidono q.o. hanno lo stesso integrale,
conviene identicare fra loro le funzioni q.o. coincidenti, come si è fatto per
lo spazio /
.
Sia dunque (X, T, ) uno spazio misurato e introduciamo nello spazio vet-
toriale /
1
(X) delle funzioni sommabili su X la seguente relazione di equiva-
lenza, già introdotta nel paragrafo 3.2:
f g f(x) = g(x) q.o. in X.
Denizione 4.6.1 Lo spazio quoziente /
1
(X)/ si indica con L
1
(X).
Gli elementi di L
1
(X) sono dunque classi di equivalenza di funzioni sommabili
su X; la struttura vettoriale di L
1
è la stessa di L
ed è ovvia.
Teorema 4.6.2 Lo spazio L
1
(X) è uno spazio di Banach con la norma
|f|
1
=
_
X
[f[ d.
Dimostrazione La quantità |f|
1
dipende solo dalla classe [f] e non dal
rappresentante f, in virt` u dellosservazione 4.2.7; le proprietà che fanno di
essa una norma sono pressocche ovvie. Proviamo che L
1
è completo rispetto
a questa norma.
Sia [f
n
]
nN
una successione di Cauchy in L
1
: ciò signica che per ogni
> 0 esiste
N tale che
|[f
n
] [f
m
]|
1
= |[f
n
f
m
]|
1
< n, m
.
Dunque, scelto = 2
k
, k N, si costruisce una successione strettamente
crescente
k
kN
tale che
|[f
k+1
f
k
]|
1
< 2
k
k N.
Scegliamo, per ogni n N, un elemento g
n
[f
n
]: allora si ha
_
X
[g
k+1
g
k
[ d < 2
k
k N.
Notiamo ora che
g
k
= g
0
+
k1
h=0
(g
h+1
g
h
) k N
+
,
103
e che la serie
h=0
(g
h+1
g
h
) converge assolutamente q.o. in X; infatti,
per lesercizio 4.3.3,
_
X
h=0
[g
h+1
g
h
[ d =
h=0
_
X
[g
h+1
g
h
[ d <
h=0
2
h
= 2,
e quindi la funzione
h=0
[g
h+1
g
h
[, essendo sommabile, è q.o. nita su
X (esercizio 4.2.7). Pertanto
f(x) lim
k
g
k
(x) q.o. in X.
Completiamo la denizione di f ponendo f(x) = 0 nei punti x in cui la serie
sopra scritta non converge: la funzione f cos` denita risulta allora misurabile
su X. Essa è inoltre sommabile, essendo limite puntuale q.o. delle g
k
, le
quali sono dominate dalla funzione sommabile [g
0
[+
h=0
[g
h+1
g
h
[; quindi
la funzione f denisce un elemento [f] L
1
(X). Proviamo che [f
n
] [f] in
L
1
: in virt` u del lemma di Fatou per ogni n
si ha
|[f
n
] [f]|
1
=
_
X
[g
n
f[ d
liminf
k
_
X
[g
n
g
k
[ d = liminf
k
|[f
n
] [f
k
]|
1
,
il che prova la tesi.
Osserviamo che dalla dimostrazione precedente discende, in particolare, la
seguente proprietà:
Proposizione 4.6.3 Se f
n
f in L
1
(X), allora esiste una sottosuccessione
f
n
k
kN
f
n
nN
che converge q.o. a f in modo dominato, cioè verica
[f
n
k
(x)[ g(x) q.o. in X, con g L
1
(X).
Dimostrazione Le g
k
della dimostrazione precedente convergono q.o. a f
e sono dominate dalla funzione sommabile [g
0
[ +
h=0
[g
h+1
g
h
[.
Osservazione 4.6.4 Nella proposizione precedente si è volutamente confuso
il generico elemento di L
1
, cioè la classe di equivalenza, con uno dei rappre-
sentanti di tale classe, che è una funzione sommabile. Questo modo di fare
semplica i discorsi e non provoca guai, quindi verrà sistematicamente adot-
tato nel seguito. Lunica dierenza che ne risulta è che le relazioni puntuali
tra funzioni di L
1
valgono solamente quasi ovunque, perche tali funzioni
sono denite a meno di insiemi di misura nulla.
104
Esercizi 4.6
1. Si consideri lo spazio misurato (N, T(N), ) ove (E) è la cardinalità
di E. Si caratterizzi lo spazio L
1
(N), e si discutano le connessioni fra
convergenza puntuale, convergenza uniforme, convergenza in misura e
convergenza in L
1
.
2. Sia (X, T, ) uno spazio misurato e sia f L
1
(X, ). Posto (E) =
_
E
[f[ d, si provi che risulta g L
1
(X, ) se e solo se fg L
1
(X, ) e
che in tal caso _
X
[g[ d =
_
X
[fg[ d.
[Traccia: provare il risultato per g o e poi usare la proposizione
3.1.7 ed il teorema di Lebesgue.]
3. Sia (X, T, ) uno spazio misurato e sia f integrabile su X. Provare la
seguente formula di integrazione per fette:
_
X
[f[ d =
_

0
(x X : [f(x)[ > t)dm.
[Traccia: si tratti dapprima il caso f o, scrivendo f nella forma
f =
m
i=1
E
i
, con i numeri [
i
[ ordinati in modo crescente e con
E
i
= f
1
(
i
); poi si usi il teorema di B.Levi.]
4. Siano f
n
, f funzioni di L
1
(X) tali che f
n
(x) f(x) q.o. in X. Si provi
che se, inoltre,
_
X
[f
n
[ d
_
X
[f[ d, allora f
n
f in L
1
(X), e che la
tesi è in generale falsa senza questa ipotesi.
5. Sia (X, T, ) uno spazio misurato -nito e sia f L
1
(X). Si provi
che per ogni > 0 esiste un insieme A T tale che (A) < e
_
A
c
[f[ d < .
6. Provare che le funzioni f
n
denite da
f
n
(x) =
sin x
n(e
x/n
1)
x
, x > 0,
appartengono a L
1
(0, ) (rispetto alla misura di Lebesgue). Si dica se
esiste nito il limite
lim
n
_

0
f
n
dm.
105
7. Poniamo per ogni n N
+
f
n
(x) =
_
1
nx
_
, x > 0,
ove [y] indica la parte intera di y.
(i) Si verichi che f
n
converge puntualmente a 0 in ]0, [.
(ii) Si dica se f
n
converge a 0 in L
1
(]0, [) (rispetto alla misura di
Lebesgue).
(iii) Si dica se f
n
converge a 0 in misura.
8. Sia L
1
w
(R) linsieme delle funzioni misurabili f : R R per le quali
esiste c > 0 tale che
m(x R : [f(x)[ > t)
c
t
t > 0.
(i) Si verichi che L
1
w
(R) è uno spazio vettoriale.
(ii) Si dimostri che L
1
(R) L
1
w
(R) con inclusione stretta.
(iii) Si provi che se f
n
L
1
w
(R), se f
n
f in misura, e se esiste
K > 0 tale che
sup
t>0
t m(x R : [f
n
(x)[ > t) K n N,
allora f L
1
w
(R).
4.7 Teoremi di densità in L
1
Sia (X, T, ) uno spazio misurato.
`
E utile sapere se e quando sia possibile
approssimare gli elementi di L
1
(X), oppure di L
(X), rispetto alla corrispon-

dente norma, mediante funzioni migliori in qualche senso. Come vedremo,
vi sono svariati risultati di questo tipo.
Il primo di questi riguarda un arbitrario spazio misurato.
Proposizione 4.7.1 Sia (X, T, ) uno spazio misurato. Allora o
0
è denso
in L
1
(X).
106
Dimostrazione Sia f L
1
. Poiche linsieme dove f è diversa da 0 è -
nito (esercizio 4.2.12), applicando losservazione 3.1.8 possiamo trovare una
successione
n
nN
o
0
tale che
lim
n
n
(x) = f(x) q.o. in X, [
n
(x)[ [f(x)[ q.o. in X
(si ricordi losservazione 4.6.4). Dato che
[
n
(x) f(x)[ 2[f(x)[ q.o. in X,
il teorema di Lebesgue, nella variante dellesercizio 4.3.4, fornisce la tesi.
Osservazione 4.7.2 Come già sappiamo (proposizione 3.1.7 ed osservazione
3.1.8), lo spazio o è denso in L
(X), ma lo spazio o
0
non lo è, a meno che
non sia (X) < .
Consideriamo adesso lo spazio misurato (R, /, m). In questo ambito pres-
socche tutti gli spazi di funzioni regolari risultano densi in L
1
(R).
Proposizione 4.7.3 C
0
(R) L
1
(R) è denso in L
1
(R).
Dimostrazione Poiche o
0
è denso in L
1
, basterà dimostrare che ogni f o
0
è arbitrariamente vicina ad una funzione continua e sommabile g, ed a questo
scopo è chiaro che è suciente considerare il caso f =
E
, con E / e
m(E) < .
Sia dunque > 0; per la proposizione 1.7.3 esistono un aperto A ed un chiuso
C tali che C E A e m(AC) < ; in particolare, m(A) < m(E)+ < .
Poniamo, come nella dimostrazione del teorema 3.4.1,
g(x) =
d(x, A
c
)
d(x, A
c
) + d(x, C)
, x R;
si ha 0 g 1, g = 1 su C, g = 0 su A
c
ed inoltre g è continua. Daltra
parte g L
1
(R) perche
_
R
g dm =
_
A
g dm m(A) < .
La tesi segue allora dal fatto che
_
R
[
E
g[ dm =
_
A\C
[
E
g[ dm m(A C) < .
107
Osservazione 4.7.4 Lo stesso risultato vale in ogni spazio misurato (X, T,
) dotato delle seguenti proprietà:
(i) X è uno spazio topologico T
4
, cioè tale che chiusi disgiunti abbiano intorni
disgiunti;
(ii) T è una -algebra contenente gli aperti;
(iii) è una misura regolare, cioè per ogni E T e per ogni > 0 esiste un
aperto A E tale che (A E) < .
Ad esempio, ciò è vero per (R
N
, /
N
, m
N
), qualunque sia N N
+
, ed in
(R
N
, H
p
, H
p
), per ogni N N
+
e p ]0, N].
Consideriamo ora lo spazio C
0
0
(R) delle funzioni continue il cui supporto, cioè
la chiusura dellinsieme x R : g(x) ,= 0, è compatto.
0
0
(R) è denso in L
1
(R).
Dimostrazione Basta provare che le funzioni di C
0
0
(R) approssimano nel-
la norma di L
1
(R) quelle di C
0
(R) L
1
(R). Sia f C
0
(R) L
1
(R), e
consideriamo le funzioni
n
(x) =
_
_
_
1 se [x[ n
n + 1 [x[ se [x[ [n, n + 1]
0 se [x[ n + 1;
allora si ha f
n
C
0
0
(R), f
n
f puntualmente in R, [f
n
[ [f[ in R; ne
segue, per il teorema di Lebesgue, f
n
f in L
1
(R).
0
(R) è denso in L
1
(R).
Dimostrazione Basta provare che C
0
(R) è denso in C
0
0
(R) rispetto alla
norma di L
1
(R). Sia f C
0
0
(R), e sia M > 0 tale che il supporto di f sia
contenuto in ] M, M[, cosicche f = 0 per [x[ M. Utilizziamo il fatto che
C
0
(] M, M[) è denso in C
0
0
(] M, M[) rispetto alla norma uniforme (una
dimostrazione di questo fatto è tratteggiata negli esercizi 4.7.10 e 4.7.11);
dunque, ssato > 0, esiste C
0
(] M, M[) tale che
sup
[x[M
[(x) f(x)[ <

2M
.
Ne segue
| f|
1
=
_
M
M
[ f[ dm 2M sup
[x[M
[(x) f(x)[ < .
108
Esercizi 4.7
1. Si provi che linsieme delle funzioni che sono costanti a tratti e nulle
fuori di un insieme di misura nita è denso in L
1
(R).
[Traccia: si osservi che ogni g C
0
0
(R) è Riemann integrabile in un
opportuno intervallo [a, b].]
2. Esibire un esempio di successione f
n
che converga in L
1
(X) ma tale
che per ogni x X la successione f
n
(x) non abbia limite.
3. (Continuità in L
1
delle traslazioni) Sia f L
1
(R). Posto, per h R,
f
h
(x) = f(x +h), si provi che:
(i) f
h
L
1
(R) e |f
h
|
1
= |f|
1
per ogni h R;
(ii) lim
h0
|f
h
f|
1
= 0.
[Traccia: utilizzare la densità di o
0
e di C
0
0
(R) in L
1
(R).]
4. Sia f L
1
(R). Posto, per R 0, F
(x) = f(x), si provi che:

(i) F
L
1
(R) e |F
|
1
=
1
[[
|f|
1
per ogni R 0;
(ii) lim
1
|F
f|
1
= 0.
5. Determinare per quali valori di R esiste nito il limite
lim
n
_
2
0
x
n
2
_
1 cos
x
n
_
dx,
e calcolarlo.
6. Sia g C
0
(R) con lim
[x[
g(x) = 0. Provare che per ogni f L
1
(R)
si ha
lim
n
1
n
_
R
g(x)f
_
x
n
_
dm = 0.
7. (Lemma di Riemann-Lebesgue) Se f L
1
(R), si provi che
lim
t
_
R
f(x) cos tx dm = lim
t
_
R
f(x) sin tx dm = 0.
109
8. Sia E / con m(E) < . Provare che
_
E
1
2 sin nx
dm =
m(E)
3
.
[Traccia: se E è un intervallo, lintegrale si calcola esplicitamente
e, usando la periodicità, si ottiene il risultato passando al limite; si
approssimi poi
E
con funzioni costanti a tratti (esercizio 4.7.1).]
9. Sia X un insieme, sia T una -algebra di sottoinsiemi di X, e sia
nN
una successione crescente di misure denite su T. Denita la
misura (E) = lim
n
n
(E) per E T, si provi che:
(i) se f L
1
(X, ) allora f L
1
(X,
n
) per ogni n, e
_
X
f d = lim
n
_
X
f d
n
;
(ii) in generale L
1
(X, ) ,=
n=0
L
1
(X,
n
).
10. Fissata f C
0
[0, 1], per ogni n N
+
ln-simo polinomio di Bernstein
di f è denito da
P
n
(t) =
n
k=0
_
n
k
_
t
k
(1 t)
nk
f
_
k
n
_
, t R.
(i) Si verichi che P
n
(0) = f(0) e P
n
(1) = f(1) per ogni n N
+
.
(ii) Si mostri che
P
n
(t) f(t) =
n
k=0
_
n
k
_
t
k
(1 t)
nk
_
f
_
k
n
_
f(t)
_
t [0, 1].
(iii) Si provino le seguenti identità (x R):
n
k=0
k
_
n
k
_
x
k
(1 x)
nk
= nx ,
n
k=0
k(k 1)
_
n
k
_
x
k
(1 x)
nk
= n(n 1)x
2
,
n
k=0
k
2
_
n
k
_
x
k
(1 x)
nk
= n(n 1)x
2
+nx .
110
(iv) Fissato > 0 e posto, per ogni t [0, 1],
A
t
=
_
k N : 0 k n,
k
n
t

_
,
B
t
=
_
k N : 0 k n,
k
n
t
<
_
,
si dimostri che
kAt
_
n
k
_
t
k
(1 t)
nk
_
f
_
k
n
_
f(t)
_
kAt
(k nt)
2
2
n
2
_
n
k
_
t
k
(1 t)
nk
2|f|
2|f|
2
n
2
[nt(1 t)]
|f|
2
2
n
,
kBt
_
n
k
_
t
k
(1 t)
nk
_
f
_
k
n
_
f(t)
_
se
,
e si concluda che P
n
f uniformemente in [0, 1] per n .
(v) Si deduca che, per ogni [a, b] R, C
[a, b] è denso in C
0
[a, b] nella
norma uniforme.
11. Sia f C
0
0
(]a, b[) e sia ]0, (ba)/4[ tale che f(x) = 0 per x a+2
e per x b 2. Sia poi Q
n
nN
una successione di polinomi che
converge uniformemente a f in [a, b]. Utilizzando le funzioni
(x) =
_
exp
_
1
x(1x)
_
se 0 < x < 1
0 se x R]0, 1[,
(x) =
_
1
x
dm
_
1
0
dm
x 0,
ed inne
(x) =
_
_
0 se x a +
_
a+2x
_
se a + < x < a + 2
1 se a + 2 x b 2
_
xb+2
_
se b 2 < x < b
0 se x b ,
111
si provi che Q
n
nN
C
0
(]a, b[) e che tale successione converge
uniformemente a f in R; si concluda che C
0
(]a, b[) è denso in C
0
0
(]a, b[)
nella norma uniforme.
112
Capitolo 5
Misure prodotto
5.1 Rettangoli misurabili
Abbiamo già introdotto (paragrafo 2.2) la misura di Lebesgue in R
N
, ma
non siamo ancora in grado, come vorremmo, di ricondurre il calcolo degli
integrali multipli a N integrazioni semplici successive, ne di stabilire quando
sia lecito scambiare lordine di integrazione. Tutto ciò è reso possibile, come
si vedrà, dalla costruzione delle misure negli spazi prodotto.
Siano dunque (X, T, ) e (Y, (, ) due spazi di misura. Nel prodotto carte-
siano X Y introduciamo la classe 1 dei rettangoli misurabili:
1 = E X Y : E = A B, A T, B (.
La classe 1non è ne una -algebra ne unalgebra, perche non è chiusa rispetto
allunione e nemmeno rispetto al passaggio al complementare; essa è soltanto
chiusa rispetto allintersezione, dato che
(A B) (C D) = (A C) (B D).
Inoltre 1è una classe troppo ristretta di sottoinsiemi di XY : nel caso X =
Y = R, ad esempio, vorremmo poter annoverare tra gli insiemi misurabili di
R
2
i triangoli, i cerchi, e tanti altri insiemi che non sono elementi di 1.
Daltra parte, su 1 possiamo denire una misura prodotto in modo naturale:
se E = A B 1, poniamo (con la solita convenzione 0 = 0)
(E) = (A B) = (A)(B).
113
Indichiamo con / lalgebra generata da 1, cioè la pi` u piccola algebra con-
tenente i rettangoli misurabili: è facile, anche se noioso, vericare che / è
costituita da tutte le unioni nite di elementi di 1; altrettanto noioso. ma
sempre facile, è provare che /è costituita da tutte le unioni nite di elementi
disgiunti di 1 (esercizi 5.1.1, 5.1.2 e 5.1.3).
Ci sarà utile la seguente nozione:
Denizione 5.1.1 Una famiglia /di sottoinsiemi di un insieme qualunque
Z è detta classe monotona se:
(i) per ogni P
n
nN
/ tale che P
n
P
n+1
si ha
nN
P
n
/;
(ii) per ogni P
n
nN
/ tale che P
n
P
n+1
si ha
nN
P
n
/.
Osserviamo che ogni -algebra è una classe monotona ma che il viceversa è
falso (esercizi 5.1.6 e 5.1.7). Inoltre lintersezione di una famiglia arbitraria
di classi monotone è ancora una classe monotona.
Introduciamo adesso la -algebra di sottoinsiemi di XY su cui costruiremo
la misura prodotto, ponendo
T ( = la minima -algebra contenente 1.
Ovviamente, T ( è anche la minima -algebra contenente /.
Vedremo in seguito che la funzione si può estendere alla -algebra T (,
e che tale estensione è una misura, che verrà denominata misura prodotto di
e ed indicata col simbolo .
Esercizi 5.1
1. Si provi che se E = A B 1, allora E
c
è unione nita di elementi
disgiunti di 1.
2. Si provi che se R
1
, . . . , R
m
1, allora
m
i=1
R
i
è unione nita di
elementi disgiunti di 1.
3. Sia / la pi` u piccola algebra contenente la classe 1. Si provi che
/ =
_
m
_
i=1
R
i
: R
1
, . . . , R
m
1, m N
_
=
=
_
m
_
i=1
R
i
: R
1
, . . . , R
m
1 disgiunti, m N
_
.
114
4. Sia (A B) = (A)(B) per ogni A B 1; si provi che se R 1
è lunione nita o numerabile di elementi disgiunti R
i
1, allora
(R) =
i
(R
i
).
5. Si estenda allalgebra / la funzione denita nellesercizio precedente,
ponendo
(A) =
m
i=1
(R
i
) se A =
m
_
i=1
R
i
, R
i
disgiunti.
Si verichi che questa è una buona denizione, ossia non dipende dal
modo in cui si decompone A in rettangoli disgiunti; si provi poi che
se A / è lunione nita o numerabile di elementi disgiunti A
i
/,
allora
(A) =
i
(A
i
).
6. Provare che la famiglia di tutti gli intervalli di R (compreso linsieme
vuoto ed i singoli punti x) è una classe monotona che non è una
-algebra.
7. Trovare una classe monotona di sottoinsiemi di R che sia chiusa rispetto
al passaggio al complementare ma non sia una -algebra.
8. Dimostrare che la -algebra dei boreliani di R
2
è strettamente conte-
nuta nella -algebra //.
5.2 Insiemi misurabili in X Y
Analizziamo adesso le proprietà della -algebra T ( e dei suoi elementi.
Cominciamo con unutile caratterizzazione di T (:
Proposizione 5.2.1 Siano (X, T, ) e (Y, (, ) spazi misurati. Allora la -
algebra T( è la minima classe monotona che contiene lalgebra / generata
dalla famiglia 1 dei rettangoli misurabili di X Y .
115
Dimostrazione Indichiamo con / la minima classe monotona contenente
/; poiche ogni -algebra è una classe monotona, è chiaro che / T (.
Per provare luguaglianza, basterà mostrare che anche / è una -algebra,
essendo T ( la minima -algebra contenente /.
Cominciamo col dimostrare il seguente
Lemma 5.2.2 Se P, Q /, allora P Q, P Q /.
Dimostrazione Per ogni P X Y sia
(P) = Q X Y : Q P, P Q, P Q /.
Allora si vericano facilmente i seguenti fatti:
(a) Q (P) se e solo se P (Q) (a causa della simmetria nella
denizione di (P));
(b) (P) è una classe monotona per ogni P X Y (perche tale è /);
(c) / (P) per ogni P / (infatti, se P / e Q /, allora, essendo
/ unalgebra, si ha P Q, Q P, P Q / /: dunque se P /
risulta Q (P) per ogni Q /, ossia / (P));
(d) / (P) per ogni P / (per (b), (c) e per denizione di /);
(e) / (Q) per ogni Q / (infatti se Q / si ha, per (d), Q
(P) per ogni P /, ossia, per (a), P (Q) per ogni P /,
il che signica / (Q): dunque, per (b) e per denizione di /,
/ (Q)).
Lenunciato (e) fornisce allora la dimostrazione del lemma.
`
E facile adesso provare che / è una -algebra. Anzitutto, X Y 1
/ /; poi, per il lemma precedente, se Q / si ha Q
c
= (X Y ) Q
/. Inne, sia P
n
una successione di elementi di /: posto, per ogni N,
Q
N
=
N
n=0
P
n
, si ha Q
N
/ (per il lemma precedente) e Q
N
Q
N+1
, da
cui, per la monotonia della classe /,
_
n=0
P
n
=
_
n=0
Q
n
/.
Ci` o conclude la dimostrazione della proposizione 5.2.1.
Passiamo ora ad esaminare gli elementi di T (. Se E T (, deniamo
gli insiemi proiezione di E su X e su Y :
116
Denizione 5.2.3 Sia E T (. Le proiezioni di E su Y sono gli insiemi
E
x
= y Y : (x, y) E, x X;
le proiezioni di E su X sono gli insiemi
E
y
= x X : (x, y) E, y Y.
`
E immediato constatare che gli insiemi E
x
vericano per ogni x X
(E
c
)
x
= (E
x
)
c
,
_
_
A
E
_
x
=
_
A
(E
)
x
,
_
A
E
_
x
=
A
(E
)
x
,
ed analoghe relazioni valgono per gli insiemi E
y
, per ogni y Y .
Proposizione 5.2.4 Se E T(, allora E
x
( per ogni x X, e E
y
T
per ogni y Y .
| = E X Y : E
x
( x X, 1 = E X Y : E
y
T y Y .
Grazie alle proprietà degli insiemi E
x
, E
y
sopra scritte, si verica subito che
| e 1 sono -algebre; daltra parte entrambe contengono 1, in quanto se
Q = A B 1, allora
Q
x
=
_
B se x A
se x X A,
Q
y
=
_
A se y B
se y Y B,
cosicche Q
x
( per ogni x X e Q
y
T per ogni y Y , ossia Q | 1.
Ne segue |, 1 T ( per denizione di T (, cioè la tesi.
La proposizione precedente garantisce la misurabilità delle proiezioni su X e
su Y di qualunque insieme E T ( (si noti che il viceversa è falso, come
mostra lesercizio 5.2.2); dunque possiamo calcolare (E
x
) per ogni x X
e (E
y
) per ogni y Y . Con il fondamentale teorema che segue si mostra
che, sotto ragionevoli ipotesi sugli spazi misurati, le quantità (E
x
) e (E
y
)
sono funzioni misurabili della variabile da cui dipendono, e per di pi` u hanno
integrali uguali; ciò ci consentirà di denire la misura prodotto sugli
elementi di T (.
117
Teorema 5.2.5 Siano (X, T, ) e (Y, (, ) spazi misurati -niti, e sia E
T (. Allora la funzione
E
: X [0, ],
E
(x) = (E
x
) x X
è T-misurabile, la funzione
E
: Y [0, ],
E
(y) = (E
y
) y Y
è (-misurabile, ed inoltre
_
X
E
d =
_
Y
E
d.
Si noti che la tesi di questo teorema ci dice che
_
X
__
Y
E
(x, y)d
_
d =
_
X
E
d =
_
Y
E
d =
_
Y
__
X
E
(x, y)d
_
d,
quindi abbiamo potuto scambiare lordine di integrazione. Questo ci per-
mette anche, come vedremo fra poco, di denire la misura (E) come il
valore comune di tali integrali.
Dimostrazione Anzitutto, se E T ( allora, come si è già osservato, le
proiezioni E
x
, E
y
appartengono rispettivamente a ( e T, cosicche le funzioni
E
,
E
sono ben denite.
Sia la famiglia degli elementi E T ( che vericano la tesi del teorema:
proveremo che è una classe monotona che contiene lalgebra / generata
dalla famiglia 1 dei rettangoli misurabili di X Y ; dalla proposizione 5.2.1
seguirà che T (, e quindi la tesi.
Dividiamo la dimostrazione in quattro passi.
(i) /. Infatti, se anzitutto Q = A B 1, allora risulta
Q
(x) = (B)
A
(x),
Q
(y) = (A)
B
(y),
quindi la prima funzione è T-misurabile e la seconda è (-misurabile; inoltre
_
X
Q
d = (A)(B) =
_
Y
Q
d,
e dunque Q . Sia ora A /: per lesercizio 5.1.3, si ha A =
k
i=1
R
i
con
gli R
i
elementi disgiunti di 1. Si verica allora facilmente che
A
=
k
i=1

R
i
118
e
A
=
k
i=1

R
i
; quindi la T-misurabilità di
A
e la (-misurabilità di
A
,
nonche luguaglianza
_
X

A
d =
_
Y

A
d, si ottengono per additività. Ciò
prova che A , ossia / .
(ii) Se Q
n
è una successione di elementi di tale che Q
n
Q
n+1
, al-
lora
nN
Q
n
. Infatti, posto Q =
nN
Q
n
si ha, per la proposizione
2.1.5,
Q
(x) = lim
n

Qn
(x) e
Q
(y) = lim
n

Qn
(y), quindi (proposi-
zione 3.1.6) la prima funzione è T-misurabile e la seconda è (-misurabile;
luguaglianza dei due integrali segue dal teorema di B. Levi. Ciò prova che
Q .
(iii) Se Q
n
è una successione di elementi disgiunti di , allora
nN
Q
n

. Infatti, posto Q =
nN
Q
n
si ha, per numerabile additività,
Q
=
nN

Qn
e
Q
=
nN

Qn
, da cui, analogamente a (ii), si ottiene Q .
(iv) Se Q
n
è una successione di elementi di tale che Q
n
Q
n+1
, allora
nN
Q
n
. Per provare ciò, posto Q =
nN
Q
n
, distinguiamo due casi.
(a) Se (X) < e (Y ) < , allora ((Q
0
)
x
) (Y ) < e ((Q
0
)
y
)
(X) < . Nuovamente per la proposizione 2.1.5, si ha
Q
(x)
Qn
(x)
e
Q
(y)
Qn
(y) per n ; quindi la prima funzione è T-misurabile e
la seconda è (-misurabile. Inoltre, luguaglianza degli integrali si ottiene in
virt` u del teorema di Lebesgue, il quale è applicabile perche
Qn
(x)
Q
0
(x) x X,
Qn
(y)
Q
0
(y) y Y,
_
X

Q
0
d
_
X

XY
d
_
Y

Q
0
d
_
Y

XY
d
_
= (X)(Y ) < .
Dunque in questo caso si ha Q .
(b) Se invece (X) = oppure (Y ) = , utilizziamo il fatto che, essendo
i due spazi misurati -niti, esistono due successioni di insiemi disgiunti
X
k
kN
T, Y
m
mN
(, tali che X =
k=0
X
k
, Y =
m=0
Y
m
, (X
k
) <
per ogni k e (Y
m
) < per ogni m. Pertanto XY =
k,mN
(X
k
Y
m
)
e tale unione è disgiunta.
Poniamo Q
nkm
= Q
n
(X
k
Y
m
) e dimostriamo anzitutto che Q
nkm
nN

. Consideriamo la famiglia
= P T ( : P (X
k
Y
m
) k, m N :
essa è una classe monotona contenente /, come segue subito da (i), (ii) e dal
caso (a) già provato. Quindi, per la minimalità di T (, si ha = T (
119
e dunque : ciò mostra che Q
n
nN
e dunque, come si voleva,
Q
nkm
nN
.
Ci` o premesso, si ottiene che anche Q =
nN
Q
n
, ossia Q (X
k

Y
m
) =
nN
Q
nkm
. Da (iii) concludiamo allora che Q, essendo lunione
disgiunta dei Q (X
k
Y
m
) , sta anchesso in .
Da (ii) e (iv) segue che è una classe monotona; per (i), essa contiene /.
La tesi è provata.
Denizione 5.2.6 Siano (X, T, ), (Y, (, ) spazi misurati -niti. La mi-
sura prodotto è denita come segue:
(E) =
_
X
E
d =
_
Y
E
d E T (,
ove le funzioni
E
,
E
sono denite nel teorema 5.2.5.
Si noti che è davvero una misura: risulta () = 0 (infatti
sono identicamente nulle), e se E

n
è una successione di elementi disgiunti
di T (, allora posto E =
nN
E
n
si ha
E
=
nN

En
e
E
=
nN

En
,
e dunque luguaglianza (E) =
nN
(E
n
) segue dal teorema di B.
Levi. Si osservi inoltre che (A B) = (A)(B) per ogni A B 1,
come si è visto nel passo (i) della dimostrazione del teorema 5.2.5.
Osservazione 5.2.7 La misura prodotto non è in generale completa,
neanche se e lo sono: ad esempio, se X = Y = R, T = ( = / e
= = m, la misura prodotto mm non è completa. Infatti, sia V [0, 1]
un insieme non misurabile, e sia B ,= un insieme misurabile di misura
nulla: allora V B / //, perche altrimenti, per la proposizione 5.2.4,
scelto y B la proiezione (V B)
y
= V sarebbe un elemento di /. Daltra
parte, V B [0, 1] B, e questultimo insieme è //-misurabile con
misura nulla. Peraltro, è immediato vericare che V B /
2
, essendo
m
2
(v B) = 0.
Esercizi 5.2
1. Siano k, h, N N
+
con k +h = N. Indicando con B
N
la -algebra dei
boreliani di R
N
, si provi luguaglianza
B
N
= B
k
B
h
.
120
[Traccia: () si verichi che gli aperti di R
N
appartengono a B
k
B
h
.
() Si provi che per ogni aperto B R
h
la classe |
B
= A R
k
:
A B B
N
è una -algebra che contiene gli aperti di R
k
. Poi,
analogamente, si provi che per ogni A B
k
la classe 1
A
= B R
h
:
A B B
N
è una -algebra che contiene gli aperti di R
h
.]
2. Sia F [0, 1] un insieme tale che F / B. Si provi che linsieme
E = (x, x) R
2
: x F appartiene a /
2
, che le sue proiezioni E
x
e E
y
sono elementi di B per ogni x, y [0, 1], ma che E / B
2
.
3. Sia g : [0, 1] [0, 1] R una funzione tale che g
x
sia continua in [0, 1]
per ogni x [0, 1] e g
y
sia continua su [0, 1] per ogni y [0, 1]. Si provi
che g è una funzione boreliana, cioè tale che (x, y) : g(x, y) > B
2
per ogni R.
[Traccia: si approssimi la g con le seguenti funzioni g
n
: posto a
i
=
i
n
,
se (x, y) [a
i1
, a
i
] [0, 1] si denisca
g
n
(x, y) =
a
i
x
a
i
a
i1
f(a
i1
, y) +
x a
i1
a
i
a
i1
f(a
i
, y).]
4. Poniamo X = Y = [0, 1], T = E [0, 1] : E / e ( = T([0, 1]);
siano poi = m e denita da
(E) = cardinalità di E V E (,
ove V è un insieme non misurabile di [0, 1]. Si verichi che, scelto
= (x, y) [0, 1] [0, 1] : x = y, le funzioni
non sono
entrambe misurabili. Giusticare il risultato.
5. Siano (X, T, ) e (Y, (, ) spazi misurati -niti, e sia : T (
[0, ] una misura tale che (A B) = (A)(B) per ogni rettangolo
A B con A T e B (. Si provi che = .
5.3 Teoremi di integrazione successiva
Il nostro prossimo obiettivo è quello di provare che per una vasta famiglia di
funzioni integrabili nello spazio misurato (XY, T (, ) si ha una for-
mula di integrazione una variabile per volta, in ordine arbitrario. Il passo
pi` u faticoso è già stato fatto: in eetti il teorema 5.2.5 e la denizione 5.2.6
121
ci dicono che la formula in questione è valida per le funzioni caratteristiche
di insiemi T (-misurabili. Si tratta ora di estendere tale risultato ad una
classe pi` u ampia di funzioni.
Anzitutto, per ogni funzione f : X Y R deniamo le sezioni f
x
, f
y
di
f nel modo seguente: se x è un ssato elemento di X, la funzione f
x
è data
da
f
x
: Y R, f
x
(y) = f(x, y) y Y,
e se y è un ssato elemento di Y , la funzione f
y
è data da
f
y
: X R, f
y
(x) = f(x, y) x X.
Se f è continua, è chiaro che le sezioni f
x
, f
y
sono continue. Anche la
misurabilità viene preservata; infatti si ha:
Proposizione 5.3.1 Se f : X Y R è T (-misurabile, allora per ogni
x X la funzione f
x
è (-misurabile, e per ogni y Y la funzione f
y
è
T-misurabile.
Dimostrazione Per ogni R si ha, per ipotesi,
E
= (x, y) X Y : f(x, y) > T (.

In virt` u della proposizione 5.2.4, si deduce
y Y : f
x
(y) > = (E
)
x
(, x X : f
y
(x) > = (E
)
y
T,
che è la tesi.
Veniamo ai teoremi sullo scambio dellordine di integrazione. Il primo ri-
guarda funzioni misurabili non negative, anche non sommabili, il secondo
riguarda funzioni sommabili, di segno qualunque.
Teorema 5.3.2 (di Tonelli) Siano (X, T, ) e (Y, (, ) spazi misurati -
niti, e sia f una funzione T (-misurabile e non negativa. Allora:
(i) f
x
è (-misurabile per ogni x X e f
y
è T-misurabile per ogni y Y ;
(ii) la funzione x
_
Y
f
x
d è T-misurabile e la funzione y
_
X
f
y
d è
(-misurabile;
122
(iii) si hanno le uguaglianze
_
X
__
Y
f
x
d
_
d =
_
XY
f d =
_
Y
__
X
f
y
d
_
d.
Dimostrazione (i) Già dimostrato nella proposizione precedente.
(ii)-(iii) Se f =
E
, con E T (, allora la tesi è stata già provata nel
teorema 5.2.5. Per linearità, lo stesso risultato vale quindi per ogni funzione
f semplice rispetto alla -algebra T ( e non negativa. Inne se f è una
funzione T (-misurabile non negativa, per la proposizione 3.1.7 esiste una
successione crescente
n
di funzioni semplici non negative che converge
puntualmente a f in X Y . Per il teorema di B. Levi si ha allora
lim
n
_
XY
n
d =
_
XY
f d ;
daltra parte, essendo (
n
)
x
e (
n
)
y
due successioni crescenti di funzioni
semplici (la prima rispetto a (, la seconda rispetto a T) non negative, che
convergono puntualmente rispettivamente a f
x
in Y ed a f
y
in X, applicando
nuovamente il teorema di B. Levi si ha
lim
n
_
Y
(
n
)
x
d =
_
Y
f
x
d x X, lim
n
_
X
(
n
)
y
d =
_
X
f
y
d y Y.
Applicando allora ancora una volta il teorema di B. Levi deduciamo
lim
n
_
X
__
Y
(
n
)
x
d
_
d =
_
X
__
Y
f
x
d
_
d,
lim
n
_
Y
__
X
(
n
)
y
d
_
d =
_
Y
__
X
f
y
d
_
d,
e dato che le
n
soddisfano la tesi del teorema, la stessa proprietà si deduce
per la f.
Teorema 5.3.3 (di Fubini) Siano (X, T, ) e (Y, (, ) spazi misurati -
niti, e sia f una funzione T (-misurabile e sommabile su XY . Allora:
(i) f
x
è sommabile su Y per -q.o. x X e f
y
è sommabile su X per -q.o.
y Y ;
123
(ii) la funzione x
_
Y
f
x
d è sommabile su X e la funzione y
_
X
f
y
d
è sommabile su Y ;
_
X
__
Y
f
x
d
_
d =
_
XY
fd =
_
Y
__
X
f
y
d
_
d.
Dimostrazione Le funzioni f
+
, f
soddisfano le ipotesi del teorema di

Tonelli; quindi le funzioni (f
)
x
sono (-misurabili per ogni x X, le funzioni
x
_
Y
(f
)
x
d sono T-misurabili e
_
X
__
Y
(f
)
x
d
_
d =
_
XY
f
d .
In particolare, essendo il secondo membro nito per ipotesi, le funzioni x
_
Y
(f
)
x
d sono sommabili su X; ciò a sua volta implica che
_
Y
(f
)
x
d < + per -q.o. x X,
ossia che (f
+
)
x
e (f
)
x
sono sommabili su Y per -q.o. x X.
In modo assolutamente uguale si verica che per (f
+
)
y
, (f
)
y
valgono gli
analoghi risultati. Ciò mostra che f
+
, f
vericano la tesi del teorema. Per

sottrazione, f = f
+
f
verica (i), e dato che gli integrali sono niti, f

verica anche (ii) e (iii).
Le ipotesi dei teoremi di Tonelli e Fubini sono essenzialmente minimali, come
mostrano i seguenti esempi.
Esempi 5.3.4 (1) Nel teorema di Fubini la f deve essere sommabile, o alme-
no integrabile (esercizio 5.3.13): in caso contrario, può capitare che lintegrale
doppio non esista mentre esistono niti e diversi i due integrali iterati. Ad
esempio, se X = Y = [0, 1], T = ( = / e = = m, consideriamo la
funzione
f(x, y) =
x
2
y
2
(x
2
+y
2
)
2
, (x, y) [0, 1] [0, 1],
che è continua in tutti i punti tranne che nellorigine, quindi è certamen-
te / /-misurabile. Essa non è integrabile: infatti, applicando a f
+
il
124
teorema di Tonelli si ha
_
[0,1][0,1]
f
+
dmm =
_
1
0
__
x
0
x
2
y
2
(x
2
+y
2
)
2
dy
_
dx
_
1
0
__
x
0
x
2
y
2
4x
4
dy
_
dx =
_
1
0
1
6x
dx = +,
e similmente
_
[0,1][0,1]
f
dmm =
_
1
0
__
y
0
y
2
x
2
(x
2
+y
2
)
2
dx
_
dy
_
1
0
1
6y
dy = +.
Per questa funzione i due integrali iterati esistono niti e diversi fra loro:
infatti, come si verica facilmente,
_
1
0
__
1
0
x
2
y
2
(x
2
+y
2
)
2
dy
_
dx =
_
1
0
__
1
0
y
y
x
2
+y
2
dy
_
dx =

4
,
_
1
0
__
1
0
x
2
y
2
(x
2
+y
2
)
2
dx
_
dy =
_
1
0
__
1
0
x
x
x
2
+y
2
dx
_
dy =
4
.
(2) Nel teorema di Tonelli la f deve essere non negativa, o almeno integrabile
(esercizio 5.3.13). Ciò è provato dalla funzione f dellesempio precedente, che
è a segno variabile e non è integrabile.
(3) Abbiamo denito la misura prodotto solo nel caso in cui sia , sia sono
misure -nite. In eetti si può fare a meno di questa ipotesi, introducendo
per altra via (esercizio 5.4.6), ma comunque il teorema di Tonelli non
vale senza la -nitezza: consideriamo ad esempio X = Y = [0, 1], T = /,
( = T([0, 1]), e siano = m e la misura cardinalità, che ovviamente non
è -nita. Allora, posto = (x, y) [0, 1] [0, 1] : x = y, per la funzione
si ha
_
1
0
__
1
0
(
)
y
dm
_
d =
_
1
0
m(y)d = 0,
_
1
0
__
1
0
(
)
x
d
_
dm =
_
1
0
(x)dm = 1.
125
Esercizi 5.3
1. Provare che
lim
b
_
b
0
sin x
x
dx =

2
.
[Traccia: utilizzare luguaglianza
1
x
=
_
0
e
xt
dt ed i teoremi di
Tonelli e Fubini.]
2. Dimostrare che la funzione f(x, y) = ye
(1+x
2
)y
2
è sommabile nellin-
sieme [0, [[0, [, e dedurre che
_

0
e
t
2
dt =
2
.
3. Provare le uguaglianze
lim
b
_
b
0
sin x
x
dx =
_
2
, lim
b
_
b
0
cos x
x
dx =
_
2
.
[Traccia: Si calcoli dapprima lintegrale
_
0
e
xy
2
dy...]
4. Provare che
_

0
e
x
(sin x)
2
x
dx =
1
4
log 5,
_

0
e
x
sin 2x
x
dx = arctan 2.
5. Si consideri la funzione
f(x, y, t) =
1
(1 +x
2
t
2
)(1 +y
2
t
2
)
, x [0, 1], y [0, 1], t > 0.
Si provi che f L
1
(]0, 1[]0, 1[]0, [) e se ne deduca che
_

0
_
arctan t
t
_
2
dt = log 2.
6. Siano (X, T, ) e (Y, (, ) spazi misurati. Se f L
1
(X) e g L
1
(Y ),
si mostri che (x, y) f(x)g(y) appartiene a L
1
(X Y ) e che
|fg|
1
= |f|
1
|g|
1
.
126
7. Sia (X, T, ) uno spazio misurato -nito, sia f : X R una funzione
T-misurabile. Si provi che se t R risulta (x X : f(x) = t) = 0
ad eccezione al pi` u di un insieme numerabile di valori di t.
8. Sia f : R [0, ]. Si provi che f è /-misurabile se e solo se linsieme
E = (x, y) R[0, [: y f(x) appartiene a //, e che in tal
caso si ha
_
R
f dm = mm(E) =
_

0
m(x R : f(x) y)dm;
si confronti questo risultato con quello dellesercizio 4.6.3.
9. Sia f : R R una funzione /-misurabile. Si provi che il graco di f
è //-misurabile ed ha misura mm nulla, ma che il viceversa è
falso.
10. Sia f L
1
(R). Per > 0 si denisca
g
(x) =
_
x
0
(x t)
1
f(t)dt, x 0;
si provi che
_
y
0
g
(x)dx = g
+1
(y) y 0.
11. Si verichi che la funzione f(x, y) = e
xy
2e
2xy
non è integrabile
rispetto alla misura mm in [0, 1] [1, [.
12. Posto
f(x) =
1
x
1 x ]0, 2], g(x, y) = f(x)f(y) (x, y) ]0, 2]]0, 2],
si provi che f è integrabile in ]0, 2], mentre g non è integrabile in
]0, 2]]0, 2].
13. Dimostrare che sia nel teorema di Tonelli che nel teorema di Fubini il
terzo enunciato vale per ogni funzione integrabile su XY rispetto alla
misura .
[Traccia: si utilizzi la linearità dellintegrale.]
127
5.4 Completamento delle misure prodotto
Come abbiamo visto (osservazione 5.2.7), le misure prodotto non sono in ge-
nerale complete. In particolare non è completa la misura prodotto m m,
ove m è la misura di Lebesgue su R, ne, pi` u generalmente, lo sono le misure
prodotto m
k
m
h
: ciò signica che per adesso non possiamo applicare i teo-
remi di Tonelli e Fubini al calcolo di integrali di funzioni Lebesgue sommabili
in R
N
.
Se vogliamo una misura completa nello spazio prodotto, occorre in generale
prendere il completamento della misura prodotto: ricordiamo che il comple-
tamento di una generica misura (o meglio, di uno spazio misurato (Z, c, ))
è stato descritto nellesercizio 2.1.1, e consiste nellintrodurre nello spazio Z
la -algebra completata
c = E Z : E = A B, A c, B F, F c, (F) = 0,
sulla quale si denisce la misura ponendo (E) = (A). La funzione
risulta ben denita, ed è una misura completa su c che estende la misura di
partenza .
Per quanto riguarda il prodotto di misure di Lebesgue, il legame fra la misura
prodotto m
k
m
h
e la misura (k + h)-dimensionale m
k+h
è descritto nella
seguente
Proposizione 5.4.1 Se k, h N
+
e N = k+h, allora la misura di Lebesgue
m
N
è il completamento della misura prodotto m
k
m
h
.
Dimostrazione Anzitutto osserviamo che (esercizio 5.2.1)
B
N
= B
k
B
h
/
k
/
h
(dove B
p
è la famiglia dei boreliani di R
p
e /
p
denota la famiglia degli insiemi
Lebesgue misurabili in R
p
).
Notiamo adesso che per ogni aperto A R
N
si ha che m
N
(A) (ben denita
in quanto B
N
/
N
) coincide con m
k
m
h
(A) (ben denita per quanto
appena visto): infatti se A è un N-parallelepipedo ciò segue dalla denizione
di m
N
, m
k
e m
h
; il caso generale è conseguenza del fatto che A è unione
numerabile di N-parallelepipedi P
n
disgiunti, cosicche
m
N
(A) =
nN
m
N
(P
n
) =
nN
m
k
m
h
(P
n
) = m
k
m
h
(A).
128
Proviamo ora che
/
k
/
h
/
N
.
Sia E F 1 /
k
/
h
, cioè E /
k
e F /
h
, e supponiamo
per cominciare che si abbia m
k
(E) < e m
h
(F) < . Tenuto conto della
proposizione 1.7.3 (che vale anche per m
N
), per provare che E F /
N
basta far vedere che si possono trovare un aperto A ed un chiuso C tali che
C EF A, e per i quali m
N
(AC) sia arbitrariamente piccola. Fissato
> 0, selezioniamo un aperto U ed un chiuso G in R
k
, nonche un aperto V
ed un chiuso H in R
h
, in modo che risulti
G E U, m
k
(U G) < ; H F V, m
h
(V H) < .
Allora U V è aperto in R
N
, GH è chiuso in R
N
, si ha GH EF
U V ed inoltre
m
N
((U V ) (GH)) m
N
((U G) V ) +m
N
(U (V H));
daltra parte
m
N
((UG)V ) = m
k
m
h
((UG)V ) = m
k
(UG)m
h
(V ) < (m
h
(F)+),
ed analogamente
m
N
(U(V H)) = m
k
m
h
(U(V G)) = m
k
(U)m
h
(V H) < (m
k
(E)+).
Ci` o prova che E F /
N
quando m
k
(E) e m
h
(F) sono nite. Si noti che
risulta anche m
N
(E F) = m
k
(E)m
h
(F): infatti per monotonia si ha
m
N
(GH) m
N
(E F) m
N
(U V ),
m
k
m
h
(GH) m
k
m
h
(E F) m
k
m
h
(U V );
ma dato che il primo ed il terzo membro della prima disuguaglianza coincido-
no rispettivamente con il primo ed il terzo membro della seconda, otteniamo
[m
N
(E F) m
k
m
h
(E F)[ m
N
(U V ) m
N
(GH) C
ove è arbitrario e C = m
k
(E) + m
h
(F) + 2. Dunque m
N
(E F) =
m
k
m
h
(E F) = m
k
(E)m
h
(F).
Nel caso che almeno una fra m
k
(E) e m
h
(F) sia innita, E F è comunque
unione numerabile di insiemi disgiunti E
n
F
m
con m
k
(E
n
) < e m
h
(F
m
) <
129
, i quali sono tutti in /
N
per quanto visto: dunque anche in questo caso
E F /
N
e, per numerabile additività, si ha ancora m
N
(E F) =
m
k
m
h
(EF) = m
k
(E)m
h
(F). Abbiamo cos` provato che /
k
/
h
/
N
e che m
N
e m
k
m
h
coincidono su /
k
/
h
.
Proviamo inne che m
N
è il completamento di m
k
m
h
. Se E /
N
, per la
proposizione 1.7.3 esistono D, B B
N
tali che D E B e m
N
(BD) = 0;
quindi possiamo scrivere E = D (E D), e si ha
D B
N
/
k
/
h
, E D B D, B D B
N
/
k
/
h
,
e m
k
m
h
(B D) = m
N
(B D) = 0. Ciò prova che E /
k
/
h
.
Viceversa, sia E /
k
/
h
: allora si ha E = A B, con
A /
k
/
h
/
N
, B F, F /
k
/
h
/
N
e m
k
m
h
(F) = m
N
(F) = 0. Per la completezza di m
N
, si deduce B /
N
e m
N
(B) = 0, e dunque E = AB /
N
; ciò mostra che /
N
= /
k
/
h
.
Inoltre
m
N
(E) = m
N
(A) = m
k
m
h
(A) = m
k
m
h
(E),
cosicche m
N
coincide con m
k
m
h
.
I teoremi di Fubini e Tonelli continuano a valere, con lievi modiche, per il
completamento delle misure prodotto, a patto di partire con spazi di misura
completi, oltre che -niti. Si ha infatti:
Teorema 5.4.2 (di Tonelli) Siano (X, T, ) e (Y, (, ) spazi misurati -
niti e completi, e sia f una funzione T (-misurabile e non negativa.
Allora:
(i) f
x
è (-misurabile per -q.o. x X e f
y
è T-misurabile per -q.o. y Y ;
(ii) la funzione x
_
Y
f
x
d è T-misurabile e la funzione y
_
X
f
y
d è
(-misurabile;
_
X
__
Y
f
x
d
_
d =
_
XY
f d =
_
Y
__
X
f
y
d
_
d.
Dimostrazione Cominciamo con il seguente
130
Lemma 5.4.3 Siano (X, T, ) e (Y, (, ) spazi misurati -niti e completi,
e sia f una funzione T (-misurabile. Allora esistono due funzioni g, h, ove
g è T (-misurabile e h è T (-misurabile e nulla per -q.o. (x, y)
X Y , tali che f(x, y) = g(x, y) +h(x, y) per ogni (x, y) X Y .
Dimostrazione
`
E chiaro che se il risultato vale per f
+
e per f
, esso si
deduce anche per f: quindi si può supporre f 0. Allora per la proposizione
3.1.7 esiste una successione crescente
n
di funzioni semplici (rispetto a
T (), tale che
n
(x, y) f(x, y) per ogni (x, y) XY ; quindi possiamo
scrivere
f =
0
+
n=0
(
n+1
n
) =
k=0
c
k
E
k
per opportuni numeri c
k
0 ed opportuni insiemi E
k
T (. Sarà E
k
=
A
k
B
k
, ove A
k
T (, B
k
F
k
, F
k
T (, (F
k
) = 0 per ogni
k N. Deniamo
g =
k=0
c
k
A
k
, h = f g;
allora g è T (-misurabile e h è T (-misurabile, cosicche linsieme
P = (x, y) X Y : h(x, y) ,= 0
appartiene a T ( e si ha
P
_
k=0
(E
k
A
k
)
_
k=0
B
k

_
k=0
F
k
.
Essendo (
k=0
F
k
)
k=0
(F
k
) = 0, si conclude che h è -q.o.
nulla in X Y . Ciò prova il lemma.
Proviamo ora il teorema 5.4.2. La funzione f, per il lemma precedente, può
scriversi come f = g + h, con g funzione T (- misurabile e h funzione
T (-misurabile e nulla per -q.o. (x, y) X Y . Osserviamo che
nella dimostrazione del lemma 5.4.3 abbiamo mostrato, pi` u precisamente,
che si ha
P = (x, y) X Y : h(x, y) ,= 0 Q,
ove Q =
k=0
F
k
T ( e (Q) = 0. Quindi, per il teorema 5.2.5,
_
X
Q
d =
_
Y
Q
d = (Q) = 0.
131
Siano
H = x X :
Q
(x) = (Q
x
) > 0, K = y Y :
Q
(y) = (Q
y
) > 0 :
dalle uguaglianze precedenti segue che (H) = 0 e (K) = 0.
Ora per ogni x / H (ossia per -q.o. x X) si ha (Q
x
) = 0; dato che
P
x
Q
x
, la completezza di implica che per -q.o. x X risulta P
x
( e
(P
x
) = 0. Essendo poi h
x
(y) = 0 per ogni y / P
x
(ovvero per -q.o. y Y ),
otteniamo che per -q.o. x X si ha, grazie alla completezza di , che h
x
è
(-misurabile e h
x
è -q.o. nulla in Y . Un analogo risultato si ottiene per h
y
.
Ci` o prova che:
(a) per -q.o. x X si ha f
x
= g
x
-q.o. in Y ;
(b) per -q.o. y Y si ha f
y
= g
y
-q.o. in X.
Dato che g
x
è (-misurabile e g
y
è T-misurabile per il teorema 5.3.2, dalla
completezza di e segue (osservazione 3.2.2) la parte (i) del teorema.
Inoltre da (a) e (b) segue che
_
Y
f
x
d =
_
Y
g
x
d per -q.o. x X,
_
X
f
y
d =
_
X
g
y
d per -q.o. y Y,
e ciò prova, sempre per il teorema 5.3.2 e losservazione 3.2.2, la parte (ii)
del teorema.
Inne la parte (iii) si ricava integrando rispettivamente su X e su Y le ultime
due uguaglianze, ed osservando che, poiche f e g coincidono -q.o. in
X Y , risulta
_
XY
f d =
_
XY
g d =
_
XY
g d .
Il teorema 5.4.2 è completamente dimostrato.
Teorema 5.4.4 (di Fubini) Siano (X, T, ) e (Y, (, ) spazi misurati -
niti e completi, e sia f una funzione T (-misurabile e sommabile su X
Y . Allora:
(i) f
x
è sommabile su Y per -q.o. x X e f
y
è sommabile su X per -q.o.
y Y ;
132
(ii) la funzione x
_
Y
f
x
d è sommabile su X e la funzione y
_
X
f
y
d
è sommabile su Y ;
_
X
__
Y
f
x
d
_
d =
_
XY
fd =
_
Y
__
X
f
y
d
_
d.
Dimostrazione Per le funzioni f
+
e f
sono validi i risultati del teorema

5.4.2. Allora per sottrazione si ottiene che f
x
è (-misurabile per -q.o. x X,
e che f
y
è T-misurabile per -q.o. y Y ; inoltre le funzioni x
_
Y
(f
+
)
x
d
e x
_
Y
(f
)
x
d sono T-misurabili e le funzioni y
_
X
(f
+
)
y
d e y
_
X
(f
)
y
d sono (-misurabili, ed inne f
+
e f
vericano le uguaglianze
(iii) nelle quali, essendo f sommabile su XY , tutti gli integrali sono niti.
Dunque f
+
e f
(e, per sottrazione, anche f) vericano (ii): in particolare

(esercizio 4.2.7)
_
Y
f
x
d è nito per -q.o. x X e
_
X
f
y
d è nito per
-q.o. y Y . Di conseguenza, per -q.o. x X la funzione f
x
è sommabile
su Y e per -q.o. y Y la funzione f
y
è sommabile su X; dunque f verica
(i). Tornando a (iii), sottraendo le relazioni vericate da f
+
e da f
, il che
è lecito trattandosi di quantità nite, si ottiene che f verica (iii).
Dalla proposizione 5.4.1 e dai due teoremi precedenti si deduce, in particolare,
che se f : R
2
R è /
2
-misurabile e non negativa, oppure sommabile, allora
si ha
_
R
2
f dm
2
=
_
R
__
R
f(x, y)dm(y)
_
dm(x) =
_
R
__
R
f(x, y)dm(x)
_
dm(y).
Qesto fatto si estende in modo ovvio agli integrali in R
N
, i quali sono dun-
que decomponibili in N integrali iterati. Abbiamo dunque un metodo per il
calcolo eettivo degli integrali multipli, che naturalmente per funzioni con-
tinue su insiemi buoni si riduce al sistema consueto usato per gli integrali
multipli di Riemann, sia propri che impropri. Per questa ragione, gli inte-
grali rispetto alla misura di Lebesgue verranno dora in poi scritto nel modo
consueto:
_
D
f(x) dx anziche
_
D
f dm.
Esercizi 5.4
1. Si provi che se k, h N
+
e k +h = N allora le inclusioni
B
N
/
k
/
h
/
N
133
sono strette.
2. Sia c una -algebra di sottoinsiemi di R
N
contenente i boreliani, nonche
tutti gli insiemi E /
N
tali che m
N
(E) = 0. Si provi che c /
N
.
3. Per ogni E R poniamo E
t
= (x, y) R
2
: x y E. Provare che
se E / allora E
t
/
2
.
4. (Convoluzioni) Si provino i fatti seguenti:
(i) se f è /-misurabile, allora (x, y) f(x y) è /
2
-misurabile;
(ii) se f, g L
1
(R), allora la convoluzione f g, denita da
f g(x) =
_
R
f(x y)g(y)dy, x R,
è una funzione di L
1
(R) e si ha |f g|
1
|f|
1
|g|
1
;
(iii) loperazione di convoluzione è commutativa, associativa e distri-
butiva rispetto alla somma;
(iv) se f C
k
0
(R) e g L
1
(R), allora f g C
k
(R) e (f g)
(k)
= f
(k)
g.
5. Sia C
0
(R
N
) con 0, = 0 fuori della palla unitaria e
_
R
N
dm
N
= 1; per ogni > 0 sia
(x) =
1
N

_
x
_
. Per f L
1
(R
N
)
si ponga f
(x) = f
(x). Si provi che f
(R
N
), e che f
f in
L
1
(R
N
) per 0
+
; si mostri anche che se f è uniformemente continua
su R
N
allora f
f uniformemente su R
N
.
6. Siano (X, T, ) e (Y, (, ) spazi misurati. Poniamo
(E) = inf
_

n=0
(A
n
)(B
n
) : E
_
n=0
(A
n
B
n
), A
n
T, B
n
(
_
.
(i) Si provi che
è una misura esterna, ossia è non negativa, monotona

e numerabilmente subadditiva.
(ii) Posto
c = E XY :
(A) =
(AE) +
(AE
c
) A XY ,
si provi che c è una -algebra contenente i rettangoli misurabili
di X Y .
134
(iii) Si provi che la restrizione di
a c è una misura completa.

(iv) Si provi che se e sono -nite, allora
c = T (, = .
7. Sia la misura costruita nellesercizio 5.4.6, essendo = m la misura
di Lebesgue in [0, 1] e la misura cardinalità in [0, 1] (esempio 5.3.4
(3)). Posto = (x, y) [0, 1]
2
: x = y, si provi che () = +.
[Traccia: supposto per assurdo () < , si provi che esistono
R
n
1, disgiunti, tali che
n
R
n
,
n
(R
n
) < e R
n
= A
n
A
n
con gli A
n
disgiunti e
n
A
n
= [0, 1]. Posto poi N
1
= n : m(A
n
) > 0,
si provi che 1 (A
n
) < per ogni n N
1
; se ne deduca che
m(
nN
1
A
n
) = 0 e quindi lassurdo.]
8. Sia f una funzione misurabile secondo Lebesgue in [a, b]. Si provi che
f L
1
(a, b) se e solo se la funzione G(x, y) = f(x)f(y) appartiene a
L
1
([a, b] [a, b]), e che in tal caso si ha
|G|
1
= |f|
2
1
.
135
Capitolo 6
Derivazione
6.1 Teorema fondamentale del calcolo inte-
grale
Vogliamo analizzare le connessioni fra lintegrazione secondo Lebesgue in R
e loperazione di derivazione di funzioni reali: in particolare, cercheremo un
analogo, per lintegrale di Lebesgue, di ciò che è il teorema fondamentale del
calcolo integrale rispetto allintegrazione secondo Riemann. Ricordiamo che
se f è una funzione continua in [a, b], allora si ha
d
dx
_
x
a
f(t)dt = f(x) x [a, b],
e che se f è una funzione di classe C
1
su [a, b] allora risulta
f(x) f(a) =
_
x
a
f
t
(t)dt x [a, b].
In altre parole, le operazioni di derivata e di integrale commutano fra loro
nellambito delle funzioni sucientemente regolari in [a, b] che si annullano
nel primo estremo.
Sia ora f L
1
(a, b). Posto F(x) =
_
x
a
f(t)dt, ci domandiamo:
(i) F è derivabile, almeno q.o., in [a, b]?
(ii) Sarà F
t
(x) = f(x), almeno q.o., in [a, b]?
136
Viceversa, se g è derivabile in [a, b] e la sua derivata è sommabile in [a, b], ci
chiediamo:
(iii) Risulterà
_
x
a
g
t
(t)dt = g(x) g(a) in [a, b]?
Per rispondere a queste domande dovremo introdurre alcune nozioni ed alcu-
ne classi di funzioni interessanti di per se, sulle quali comunque insisteremo
soltanto lo stretto necessario. Gli sviluppi matematici che partono da questa
problematica sono innumerevoli, profondi ed assai ranati, ma al di là della
portata del nostro corso.
Esercizi 6.1
1. Stabilire in quali punti esiste la derivata della funzione
f(x) =
_
x
0
[
1
2
,
3
4
[
(t) dt, x [0, 1],
e calcolarla.
2. Per ogni n N, sia f
n
la funzione denita da
f
n
(x) = inf
_
x
m
10
n
: m N
_
, x [0, 1].
Si provi che la funzione
f(x) =
n=0
f
n
(x), x [0, 1],
è continua, ma non è derivabile in alcun punto di [0, 1].
[Traccia: si verichi che la serie è uniformemente convergente. Fissato
poi x =
n=1
n
10
n
, ove
n
0, 1, . . . , 9 e lo sviluppo decimale è
innito, per ogni k N
+
si ponga
x
k
=
_
x 10
k
se
k
= 4, 9
x + 10
k
se
k
= 0, 1, 2, 3, 5, 6, 7, 8.
Si verichi che f
n
(x) = f
n
(x
k
) per n k, mentre f
n
(x) f
n
(x
k
) =
(x x
k
) per n < k. Se ne deduca che f(x) f(x
k
) = p (x x
k
),
ove p, qualunque sia il suo segno, è un intero con la stessa parità di
k 1; si concluda che, per k , x
k
x mentre p =
f(x
k
)f(x)
x
k
x
non
ha limite.]
137
6.2 Punti di Lebesgue
Data una qualunque funzione f sommabile su R
N
, N 1, le sue proprietà
di misurabilità e di sommabilità non cambiano se essa viene modicata su
un insieme di misura nulla. In questo paragrafo ci poniamo il problema
di trovare, se possibile, una versione canonica di f, che ne ottimizzi la
regolarità buttando via, ad esempio, le discontinuità eliminabili.
Cominciamo con la seguente
Denizione 6.2.1 Sia f sommabile su R
N
. Un punto x R
N
si dice punto
di Lebesgue per f se f(x) R e
lim
r0
+
1
m
N
(B
r
)
_
B(x,r)
[f() f(x)[dm
N
= 0,
ove B(x, r) è la palla di centro x e raggio r in R
N
e m
N
(B
r
) è la sua misura
(ovviamente indipendente dal centro).
Osserviamo che se f è continua, allora ogni punto x R
N
è di Lebesgue
per f, ma per una generica f sommabile non è detto a priori che i punti di
Lebesgue esistano. In eetti però si ha:
Teorema 6.2.2 Se f è sommabile su R
N
, allora quasi ogni x R
N
è punto
di Lebesgue per f.
Dimostrazione Per ogni x R
N
introduciamo le seguenti quantità:
A
r
f(x) =
1
m
N
(B
r
)
_
B(x,r)
[f() f(x)[dm
N
, r > 0,
Af(x) = limsup
r0
+
A
r
f(x),
Mf(x) = sup
r>0
1
m
N
(B
r
)
_
B(x,r)
[f[dm
N
.
Dobbiamo dimostrare che
m
N
(x R
N
: Af(x) > 0) = 0,
ed a questo scopo basterà provare che
m
N
(x R
N
: Af(x) > t) = 0 t > 0,
138
in quanto da questo fatto e dalla subadditività di m
N
segue che linsieme
x R
N
: Af(x) > 0 =
_
kN
+
_
x R
N
: Af(x) >
1
k
_
ha misura esterna nulla (e quindi è misurabile, con misura nulla).
Sia dunque t > 0. Fissato n N
+
, sia g
n
C
0
0
(R
N
) una funzione tale che
|f g
n
|
1
<
1
n
(proposizione 4.7.5). Si noti che si ha Ag
n
0 in R
N
. Utilizzando il fatto
che
Af(x) A(f g
n
)(x) +Ag
n
(x) = A(f g
n
)(x),
possiamo scrivere
Af(x) A(f g
n
)(x)
limsup
r0
+
1
m
N
(B
r
)
_
B(x,r)
[f g
n
[dm
N
+[f(x) g
n
(x)[
M(f g
n
)(x) +[f(x) g
n
(x)[ n N
+
.
Ne segue
m
N
(x R
N
: Af(x) > 2t)
m
N
(x R
N
: M(f g
n
)(x) > t) +
+ m
N
(x R
N
: [f(x) g
n
(x)[ > t) ;
osserviamo che i due insiemi a secondo membro sono misurabili, il secondo
per la misurabilità di f e g
n
, il primo perche è addirittura un aperto (esercizio
6.2.1).
Il secondo addendo si stima facilmente:
m
N
(x R
N
: [f(x) g
n
(x)[ > t)
1
t
|f g
n
|
1
n N
+
;
per maggiorare il primo addendo ci occorre un enunciato apposito.
Proposizione 6.2.3 Se L
1
(R
N
) e t > 0, allora
m
N
(x R
N
: M(x) > t)
3
N
t
||
1
.
139
Dimostrazione Sia K un arbitrario compatto contenuto nellinsieme x
R
N
: M(x) > t. Ogni punto x K è allora il centro di una palla aperta
B
x
= B(x, r
x
) tale che
_
Bx
[[dm
N
> t m
N
(B
x
).
Dato che le palle B
x
xK
ricoprono K, esisterà una famiglia nita di palle
B
x
1
, . . . , B
xp
B
x
xK
tale che
K
p
_
i=1
B
x
i
.
Proveremo ora che si può trovare una ulteriore sottofamiglia B
x
i
1
, . . . , B
x
i
k
contenuta in B
x
1
, . . . , B
xp
, ove B
x
i
j
= B(x
i
j
, r
i
j
), tale che:
(i) le palle B(x
i
j
, r
i
j
), j = 1, . . . k, sono tutte disgiunte;
(ii) K
k
j=1
B(x
i
j
, 3r
i
j
);
(iii) m
N
(K) 3
N
k
j=1
m
N
(B(x
i
j
, r
i
j
)).
Per provare ciò, non è restrittivo supporre che si abbia r
1
r
2
. . . r
p
. Sce-
gliamo i
1
= 1 e buttiamo via tutte le palle B(x
i
, r
i
) che intersecano B(x
i
1
, r
i
1
).
Sia ora B(x
i
2
, r
i
2
) la prima palla, secondo lordinamento degli indici, che è
disgiunta da B(x
i
1
, r
i
1
) (ammesso che ci sia). Nuovamente, buttiamo via le
palle B(x
i
, r
i
), con i > i
2
, che intersecano B(x
i
2
, r
i
2
), e prendiamo come terza
palla B(x
i
3
, r
i
3
) la prima che è disgiunta da B
(
x
i
2
, r
i
2
). Procedendo in questa
maniera, dopo un numero nito di passi esauriamo le palle a disposizione ed
il processo si arresta. Il risultato è la famiglia B(x
i
1
, r
i
1
), . . . , B(x
i
k
, r
i
k
),
che per costruzione è fatta di palle tra loro disgiunte. Dunque vale (i). Inol-
tre notiamo che se B(x
i
, r
i
) è una della palle scartate, allora deve essere
B(x
i
, r
i
) B(x
i
j
, r
i
j
) ,= per qualche j = 1, . . . , k con i > i
j
; in particolare si
ha r
i
r
i
j
e di conseguenza B(x
i
, r
i
) B(x
i
j
, 3r
i
j
). La stessa inclusione vale
ovviamente se B(x
i
, r
i
) è invece una delle palle B(x
i
j
, r
i
j
). Per larbitrarietà
di B(x
i
, r
i
), si conclude che
K
p
_
i=1
B(x
i
, r
i
)
k
_
j=1
B(x
i
j
, 3r
i
j
),
140
ossia vale (ii). Inne, (iii) è facile conseguenza di (ii) in quanto
m
N
(B(x
i
j
, 3r
i
j
)) = 3
N
m
N
(B(x
i
j
, r
i
j
)).
Dunque (denotando per semplicità con B
j
le palle B(x
i
j
, r
i
j
))
m
N
(K) 3
N
k
j=1
m
N
(B
j
)
3
N
t
k
j=1
_
B
j
[[dm
N
,
ed essendo le palle B
j
disgiunte, si conclude che
m
N
(K)
3
N
t
||
1
.
Questa disuguaglianza vale per ogni compatto K contenuto nellinsieme x
R
N
: M(x) > t; dato che ogni chiuso F R
N
è unione al pi` u numerabile
dei compatti F B(0, k), k N
+
, la stessa disuguaglianza vale per ogni chiu-
so contenuto in x R
N
: M(x) > t. Poiche tale insieme è misurabile, ne
segue la tesi.
Torniamo alla dimostrazione del teorema. Per quanto abbiamo visto, possia-
mo dedurre che
m
N
(x R
N
: Af(x) > 2t)
m
N
(x R
N
: M(f g
n
)(x) > t) +
+ m
N
(x R
N
: [f(x) g
n
(x)[ > t)
1 + 3
N
t
|f g
n
|
1
,
e dunque, per come si è scelta g
n
,
m
N
(x R
N
: Af(x) > 2t)
1 + 3
N
nt
n N
+
.
Passando al limite per n otteniamo
m
N
(x R
N
: Af(x) > 2t) = 0,
da cui la tesi del teorema.
Dal teorema precedente otteniamo subito la risposta alle domande (i) e (ii)
che ci siamo posti alla ne del paragrafo 6.1.
141
Corollario 6.2.4 Se f è sommabile in R, e F(x) =
_
x
f(t) dt, allora si

ha F
t
(x) = f(x) in ogni punto x di Lebesgue per f, ossia q.o. in R.
Dimostrazione Sia x un punto di Lebesgue per f. Per ogni successione
reale innitesima
n
, tale che
n
,= 0 per ogni n, si ha
F(x +
n
) F(x)
n
f(x)
n
_
x+n
x
f(t) dt f(x)
n
_
x+n
x
[f(t) f(x)[dt
1
[
n
[
_
x+[n[
x[n[
[f(t) f(x)[dt =
=
2
m(B(x, [
n
[))
_
B(x,[n[)
[f(t) f(x)[dt 0 per n
in virt` u della denizione 6.2.1. Per larbitrarietà della successione
n
, si ha
la tesi.
Corollario 6.2.5 Se f è sommabile in [a, b], allora
d
dx
_
x
a
f(t) dt = f(x) q.o. in [a, b].
Dimostrazione Basta prolungare f a 0 fuori di [a, b] ed applicare il corol-
lario precedente a f
[a,b]
.
Osservazione 6.2.6
`
E possibile denire la nozione di punto di Lebesgue
di un arbitrario elemento di L
1
(R
N
), e non solo di una arbitraria funzione
sommabile su R
N
; in altre parole, la denizione 6.2.1 può essere modicata in
modo da dipendere solo dalla classe di equivalenza in L
1
, e non dal particolare
rappresentante. Questa variante è descritta nellesercizio 6.2.2.
Esercizi 6.2
1. Provare che se f L
1
(R
N
) allora per ogni t > 0 linsieme
x R
N
: Mf(x) > t
è aperto in R
N
.
2. Sia F L
1
(R
N
). Diciamo che un punto x R
N
è di Lebesgue per F,
e scriviamo x L(F), se esistono y
x
R e g F tali che
lim
r0
+
1
m
N
(B
r
)
_
B(x,r)
[g y
x
[dm
N
= 0.
142
(i) Si provi che se x L(F) allora il limite sopra scritto è 0 per ogni
h F.
(ii) Si provi che se g F e x è punto di Lebesgue per g secondo la
denizione 6.2.1, allora x L(F); se ne deduca che R
N
L(F) ha
misura nulla.
(iii) Posto
f(x) =
_
y
x
se x L(F)
0 se x / L(F),
si provi che f F; si provi anche che se g F e x è punto di
Lebesgue per g secondo la denizione 6.2.1, allora f(x) = g(x); se
ne deduca che L(F) è lunione di tutti i punti di Lebesgue delle
g F, e che f è il rappresentante canonico della classe F.
3. Dimostrare che se f L
1
(R
N
) allora f(x) Mf(x) q.o. in R
N
.
4. Se E R
N
è un insieme misurabile, la densità di E nel punto x è
denita da
E
(x) = lim
r0
+
m
N
(E B(x, r))
m
N
(B(x, r))
nei punti dove il limite esiste (si confronti con lesercizio 1.4.3). Si provi
che
E
(x) = 1 q.o. in E,
E
(x) = 0 q.o. in E
c
.
6.3 Derivabilità delle funzioni monotone
La risposta alla domanda (iii) che ci siamo posti nel paragrafo 6.1 è, come
vedremo, alquanto articolata. Per cominciare, analizziamo a questo riguardo
il comportamento delle funzioni monotone.
Una funzione monotona in un intervallo [a, b] può avere inniti punti di di-
scontinuità (ma mai pi` u di uninnità numerabile, come mostra lesercizio
6.3.1): un esempio è la funzione f(x) =
[
1
x
]
1+[
1
x
]
, x [0, 1]. Nondimeno,
le funzioni monotone godono di una proprietà sorprendente, espressa nel
fondamentale e classico risultato che andiamo ad esporre.
143
Teorema 6.3.1 (di derivazione di Lebesgue) Sia f : [a, b] R una
funzione monotona crescente. Allora f è derivabile q.o. in [a, b], f
t
è som-
mabile in [a, b] e
_
b
a
f
t
dm f(b) f(a).
Dimostrazione Tutto si basa sul seguente lemma di ricoprimento:
Lemma 6.3.2 (di Vitali) Sia E un sottoinsieme di R con m
(E) < , e
sia T una famiglia di intervalli chiusi dotati di queste proprietà:
(a) T è un ricoprimento di E;
(b) per ogni x E e per ogni > 0 esiste I T tale che x I e m(I) < .
Allora per ogni > 0 esistono I
1
, . . . , I
N
T, disgiunti, tali che
m
_
E
N
_
i=1
I
i
_
< .
Dimostrazione Sia A un aperto contenente E, tale che m(A) < ; si può
supporre allora che sia I A per ogni I T. Costruiamo una sottofamiglia
disgiunta I
n
nN
+ T nel modo seguente. Scegliamo I
1
T in modo
arbitrario; se E I
1
, ci fermiamo perche il singolo intervallo I
1
soddisfa la
tesi del lemma, essendo m
(EI
1
) = m
() = 0. Altrimenti, esiste x EI
1
;
quindi, per le proprietà (a) e (b), esiste almeno un intervallo I T tale che
I I
1
= . Posto allora
k
1
= supm(I) : I T, I I
1
= ,
si ha 0 < k
1
m(A) < . Si può dunque scegliere I
2
T, disgiunto da I
1
,
tale che
m(I
2
) >
1
2
k
1
.
Induttivamente, costruiti I
1
, . . . I
n
disgiunti, e supposto che non risulti E
n
i=1
I
i
(nel qual caso avremmo ottenuto la tesi del lemma), si osserva che
per le proprietà (a) e (b) esistono intervalli I T disgiunti da I
1
, . . . , I
n
.
Dunque, posto
k
n
= supm(I) : I T, I I
i
= per i = 1, . . . , n,
144
risulta 0 < k
n
k
n1
k
1
m(A) < . Pertanto si può scegliere
I
n+1
T, disgiunto da I
1
, . . . , I
n
e tale che
m(I
n+1
) >
1
2
k
n
.
Se non accade mai che E
n
i=1
I
i
(nel qual caso abbiamo la tesi del lemma),
otteniamo una successione I
n
T costituita da intervalli disgiunti, ln-
esimo dei quali ha misura maggiore di
1
2
k
n
. Poiche
nN
+
I
n
A, si ha
anche
nN
+
m(I
n
) m(A) < .
Sia ora > 0: esiste N N
+
tale che
n=N+1
m(I
n
) <

5
.
Poniamo F = E
N
i=1
I
i
, e dimostriamo che si ha m
(F) < : ciò concluderà

la dimostrazione. Sia x F: poiche x non appartiene al chiuso
N
i=1
I
i
, esiste
I T tale che x I e I A
N
i=1
I
i
. Daltra parte, I deve intersecare
qualcuno degli I
n
con n > N, poiche in caso contrario per denizione di k
n
avremmo
m(I) k
n
< 2m(I
n+1
) n N
+
,
e dunque m(I) = 0, il che è assurdo. Pertanto esiste n > N tale che I I
n
,=
e I I
k
= per k = 1, . . . , n. Detto x
n
il punto medio di I
n
, si ha allora
[x
n
x[ m(I) +
1
2
m(I
n
) k
n1
+
1
2
m(I
n
) < 2m(I
n
) +
1
2
m(I
n
) =
5
2
m(I
n
).
Indicando con J
n
lintervallo chiuso di centro x
n
e ampiezza quintupla di quel-
la di I
n
, risulta quindi x J
n
: abbiamo cos` mostrato che F

n=N+1
J
n
,
da cui
m
(F)
n=N+1
m(J
n
) = 5
n=N+1
m(I
n
) < .
Torniamo alla dimostrazione del teorema. Per x ]a, b[ consideriamo i quat-
tro numeri derivati (o derivate del Dini) cos` deniti:
D
+
f(x) = limsup
h0
+
f(x +h) f(x)
h
, D
+
f(x) = liminf
h0
+
f(x +h) f(x)
h
,
D
f(x) = limsup
h0
f(x +h) f(x)

h
, D
f(x) = liminf
h0
f(x +h) f(x)

h
.
145
Ovviamente si ha sempre D
+
f(x) D
+
f(x) e D
f(x) D
f(x); provere-
mo che per q.o. x ]a, b[ risulta D
+
f(x) = D
+
f(x) = D
f(x) = D
f(x) e
che per q.o. x ]a, b[ tale valore è nito e quindi è la derivata f
t
(x).
Per mostrare luguaglianza dei quattro numeri derivati basterà far vedere che
D
+
f(x) D
f(x) q.o. in ]a, b[, D
f(x) D
+
f(x) q.o. in ]a, b[;
proveremo in eetti la prima disuguaglianza perche laltra è del tutto analoga
(cambia solo il segno dellincremento h).
Sia
E = x ]a, b[: D
+
f(x) > D
f(x);
sarà allora E =
,Q
E
, dove
E
=
_
se
x ]a, b[: D
f(x) < < < D

+
f(x) se < ;
quindi basterà mostrare che
m
(E
) = 0 , Q con < .
Fissiamo > 0: allora esiste un aperto B, contenente E
, tale che m(B) <

m
(E
) +. Se x E
, si ha
D
f(x) = liminf
h0
f(x +h) f(x)

h
= liminf
h0
+
f(x) f(x h)
h
< ,
quindi per ogni > 0 esiste h
]0, ] tale che

[x h
, x] B, f(x) f(x h
) < h
.
La famiglia di intervalli [x h
, x] : x E
, > 0 è un ricoprimento di
E
che verica le ipotesi del lemma di Vitali ed è costituito da sottoinsiemi

di B. Dal lemma 6.3.2 segue che esistono [x
1
h
1
, x
1
], . . . , [x
N
h
N
, x
N
]
disgiunti, tali che
N
_
i=1
[x
i
h
i
, x
i
] B, m
_
E

N
_
i=1
[x
i
h
i
, x
i
]
_
< .
Perciò laperto A =
N
i=1
]x
i
h
i
, x
i
[ è contenuto in B e verica m
(EA) < ;
inoltre si ha, applicando ad A la denizione di misurabilità:
m
(A E
) = m
(E
) m
(E
A) > m
(E
) .
146
Consideriamo ora linsieme A E
e ripetiamo lo stesso ragionamento: se

y A E
si ha
D
+
f(x) = limsup
k0
+
f(x +k) f(x)
k
> ,
quindi per ogni > 0 esiste k
]0, ] tale che

[y, y +k
] A, f(y +k
) f(y) > k
.
La famiglia di intervalli [y, y +k
] : y AE
, > 0 è un ricoprimento di
AE
che verica le ipotesi del lemma di Vitali ed è costituita da sottoin-

siemi di A. Dal lemma 6.3.2 segue che esistono [y
1
, y
1
+k
1
], . . . , [y
M
, y
M
+k
M
]
disgiunti, tali che
M
_
j=1
[y
j
, y
j
+k
j
] A, m
_
(A E
)
M
_
j=1
[y
j
, y
j
+k
j
]
_
< .
Perciò laperto C =
M
j=1
]y
j
, y
j
+ k
j
[ è contenuto in A e verica m
((A
E
) C) < . Tenuto conto della precedente stima per m
(A E
), ne
deduciamo, per la misurabilità di C,
m(C) m
(C A E
) = m
(A E
) m
((A E
) C) >
> m
(A E
) > m
(E
) 2,
da cui
M
j=1
(f(y
j
+k
j
) f(y
j
)) >
M
j=1
k
j
= m(C) (m
(E
) 2).
Daltra parte, essendo C A, per ogni ssato j 1, . . . , M esiste un unico
i 1, . . . , N tale che ]y
j
, y
j
+ k
j
[]x
i
h
i
, x
i
[; dal fatto che f è crescente
segue allora
M
j=1
(f(y
j
+k
j
) f(y
j
))
N
i=1
(f(x
i
) f(x
i
h
i
)),
il che implica
(m
(E
) 2) < (m
(E
) +),
147
cioè
m
(E
) <
+ 2

.
Poiche è arbitrario, si ottiene che m
(E
) = 0. Ne segue che E =
,Q
E
ha misura esterna nulla, ossia risulta D

+
f(x) D
f(x) q.o.
in ]a, b[, come si voleva dimostrare. In modo analogo, come già osservato, si
trova che D
f(x) D
+
f(x) q.o. in ]a, b[.
Abbiamo mostrato che per q.o. x ]a, b[ esiste la funzione
g(x) = lim
h0
g(x +h) g(x)
h
;
resta da far vedere che [g(x)[ < per q.o. x ]a, b[.
Dopo aver esteso la funzione f oltre b ponendo f(x) = f(b) per ogni x b,
deniamo per ogni n N
+
g
n
(x) =
f(x +
1
n
) f(x)
1
n
, x [a, b].
Chiaramente, g
n
(x) g(x) q.o. in [a, b]; inoltre le g
n
sono misurabili (perche
tale è f, essendo monotona), e dunque g è una funzione misurabile, oltre che
non negativa dal momento che f è crescente. Dal lemma di Fatou segue
perciò
_
b
a
g dm liminf
n
_
b
a
f(x +
1
n
) f(x)
1
n
dm =
= liminf
n
n
_
_
b+
1
n
a+
1
n
f dm
_
b
a
f dm
_
=
= liminf
n
n
_
_
b+
1
n
b
f dm
_
a+
1
n
a
f dm
_
liminf
n
n
_
_
b+
1
n
b
f(b) dm
_
a+
1
n
a
f(a) dm
_
= f(b) f(a).
Quindi g è sommabile in [a, b] e in particolare g è q.o. nita in [a, b]. Ciò
signica che f è q.o. derivabile in [a, b] e che f
t
è sommabile: in particolare
_
b
a
f
t
dm f(b) f(a).
Ci` o conclude la dimostrazione del teorema di Lebesgue.
148
Osservazioni 6.3.3 (1) La disuguaglianza
_
b
a
f
t
dm f(b) f(a) può es-
sere stretta, come si vedrà; nel paragrafo 6.5 caratterizzeremo la classe delle
funzioni per le quali vale il segno di uguaglianza.
(2) Se f è monotona decrescente, applicando il teorema di Lebesgue a f si
ottiene che f è derivabile q.o., che f
t
è sommabile e che
_
b
a
f
t
dm f(b)f(a).
Esercizi 6.3
1. Si provi che se f : R R è una funzione monotona, allora f ha al pi` u
uninnità numerabile di punti di discontinuità.
2. Si costruisca una funzione f : [0, 1] R monotona e discontinua in
ogni punto di Q [0, 1].
3. Si calcolino i quattro numeri derivati nel punto 0 per la funzione
f(x) =
_
0 se x = 0
x sin
1
x
se x ,= 0.
4. Si verichi che, assegnati a 0
0 se x = 0
cx sin
2 1
x
+dx cos
2 1
x
se x < 0
soddisfa D
+
f(0) = a, D
+
f(0) = b, D
f(0) = c, D
f(0) = d.
5. Si calcolino i quattro numeri derivati nel generico punto x R per la
funzione
R\Q
.
6. Provare che se f : R R è continua, allora le funzioni D
+
f, D
+
f,
D
f e D
f sono misurabili rispetto alla misura di Lebesgue.

7. Siano f, g : R R. Dimostrare che se esiste f
t
(x), allora
D
+
(f +g)(x) = f
t
(x) +D
+
g(x),
e che analoghi risultati valgono per gli altri numeri derivati.
8. Fornire un esempio nel quale risulti D
+
(f +g) ,= D
=
f +D
+
g.
149
6.4 Funzioni a variazione limitata
Questo paragrafo è dedicato alla descrizione di unimportante classe di fun-
zioni: quelle a variazione limitata.
Denizione 6.4.1 Sia f : [a, b] R. Per ogni partizione : a = x
0
< x
1
<
. . . < x
k
= b di [a, b] poniamo
t
b
a
(f, ) =
k
i=1
[f(x
i
) f(x
i1
)[ ;
la quantità
T
b
a
(f) = sup
t
b
a
(f, )
si chiama variazione totale di f in [a, b]. Se T
b
a
(f) < diciamo che f è a
variazione limitata in [a, b], e scriviamo f BV [a, b].
Osservazioni 6.4.2 (1) Ogni funzione monotona in [a, b] è a variazione
limitata in [a, b] e si ha
T
b
a
(f) = [f(b) f(a)[.
(2) BV [a, b] è uno spazio vettoriale: infatti se f, g BV [a, b] e , R si
ha, come è facile vericare,
T
b
a
(f +g) [[T
b
a
(f) +[[T
b
a
(g).
(3) Ogni funzione di BV [a, b] è limitata in [a, b]: infatti se f BV [a, b] si
ha
[f(x)[ [f(a)[ +[f(x) f(a)[
[f(a)[ +[f(b) f(x)[ +[f(x) f(a)[ [f(a)[ +T
b
a
(f).
Daltra parte ovviamente esistono funzioni limitate che non sono a variazione
limitata: ad esempio la funzione
A
, ove A =
1
n
nN
+, è limitata in [0, 1]
ma non sta in BV [0, 1]. Infatti per ogni N N
+
, scelta la partizione
N
:
0 <
1
N
<
1
N1/2
<
1
N1
<
1
N3/2
< . . . <
1
2
<
1
21/2
< 1, lincremento di f
da un nodo al successivo è sempre 1, e quindi t
1
0
(
A
,
N
) = 2N; ne segue
T
1
0
(
A
) = +.
La variazione totale di una funzione è additiva rispetto alle decomposizioni
di [a, b] in sottointervalli adiacenti. Si ha infatti:
150
Proposizione 6.4.3 Se f BV [a, b], allora
T
b
a
(f) = T
c
a
(f) +T
b
c
(f) c ]a, b[.
Dimostrazione () Per ogni partizione di [a, b], laggiunta del nodo c
determina due partizioni
1
di [a, c] e
2
di [c, b], la cui unione è . Si ha
allora
t
b
a
(f, ) t
c
a
(f,
1
) +t
b
c
(f,
2
) T
c
a
(f) +T
b
c
(f),
e quindi, per larbitrarietà di ,
T
b
a
(f) T
c
a
(f) +T
b
c
(f).
() Per ogni coppia di partizioni
1
di [a, c] e
2
di [c, b], la loro unione è
una partizione di [a, b] contenente il nodo c: ne segue
t
c
a
(f,
1
) +t
b
c
(f,
2
) = t
b
a
(f, ) T
b
a
(f),
e per larbitrarietà di
1
e
2
,
T
c
a
(f) +T
b
c
(f) T
b
a
(f).
Ladditività della variazione totale ci permette di arrivare al risultato che
segue, che è il punto chiave della teoria delle funzioni a variazione limitata.
Corollario 6.4.4 Sia f : [a, b] R. Allora f BV [a, b] se e solo se f è
dierenza di due funzioni crescenti in [a, b].
Dimostrazione (=) Poiche le funzioni crescenti in [a, b] sono a variazione
limitata, la tesi segue dal fatto che BV [a, b] è uno spazio vettoriale.
(=) La funzione x T
x
a
(f) è crescente in [a, b]: infatti, per la proposizione
precedente,
T
y
a
(f) = T
x
a
(f) +T
y
x
(f) T
x
a
(f) se y > x.
Si osservi inoltre che T
a
a
(f) = 0.
Daltra parte, anche la funzione x T
x
a
(f)f(x) è crescente in [a, b], perche
se y > x si ha, ancora dalla proposizione 6.4.3,
f(y) f(x) [f(y) f(x)[ T
y
x
(f) = T
y
a
(f) T
x
a
(f).
151
Quindi, scrivendo
f(x) = T
x
a
(f) (T
x
a
(f) f(x)),
si ha la tesi.
Da questo corollario e dal teorema di derivazione di Lebesgue (teorema 6.3.1)
segue subito:
Corollario 6.4.5 Ogni funzione f BV [a, b] è derivabile q.o., e la derivata
f
t
è sommabile in [a, b].
Esercizi 6.4
1. Si provi che
|f|
BV [a,b]
= sup
x[a,b]
[f(x)[ +T
b
a
(f)
è una norma nello spazio BV [a, b], e che BV [a, b] con questa norma è
completo. Si provi inoltre che BV [a, b] non è chiuso in /
(a, b).
2. Calcolare la variazione totale delle seguenti funzioni:
(i) f(x) = x(x
2
1), x [2, 2];
(ii) f(x) = 3
[0,1/2]
(x) 6
[1/4,3/4]
(x), x [0, 1];
(iii) f(x) = sin x, x [0, 2];
(iv) f(x) = x [x], x [50, 50].
3. Sia g(x) =

x, x [0, 1], e sia f : [0, 1] R denita da:
f(x) =
_
1
n
2
se x
_
1
n
,
1
n
+
1
n
2
, n 2,
0 se x [0, 1]
n=2
_
1
n
,
1
n
+
1
n
2
.
(i) Provare che f, g BV [0, 1] e calcolarne le rispettive variazioni
totali.
(ii) Dimostrare che g f / BV [0, 1].
4. Siano f, g BV [a, b]. Provare che f g, f g BV [a, b].
152
5. Sia f C[a, b]. Si provi che f BV [a, b] se e solo se il graco di f è
una curva retticabile, e che in tal caso si ha
T
b
a
(f) () T
b
a
(f) +b a.
6. Sia f : [a, b] R una funzione continua e monotona e sia
f
il suo
graco.
(i) Si verichi che
_
(b a)
2
+[f(b) f(a)[
2
(
f
) b a +[f(b) f(a)[.
(ii) Si determinino le funzioni f continue e monotone per le quali
(
f
) =
_
(b a)
2
+[f(b) f(a)[
2
.
(iii) Si trovi una classe di funzioni f continue e monotone per le quali
(
f
) = b a +[f(b) f(a)[.
7. Sia f BV [a, b]; si dimostri che f è continua in x
0
[a, b] se e solo se
x T
x
a
(f) è continua in x
0
.
8. Siano f, g BV [a, b]. Si provi che fg BV [a, b] e che (v. esercizio
6.4.1)
|fg|
BV [a,b]
|f|
BV [a,b]
|g|
BV [a,b]
.
9. Siano f, g BV [a, b], con g ,= 0 in [a, b]. Provare che se inf
[a,b]
[g[ > 0
allora
f
g
BV [a, b].
`
10. Siano f : [a, b] R e g : [c, d] [a, b], con g strettamente crescente.
Provare che se f BV [a, b], allora f g BV [c, d].
6.5 Funzioni assolutamente continue
Introduciamo adesso una classe di funzioni allinterno della quale sarà possi-
bile dare una risposta positiva alla domanda (iii) del paragrafo 6.1.
153
Denizione 6.5.1 Una funzione f : [a, b] R è detta assolutamente conti-
nua in [a, b], e scriveremo f AC[a, b], se per ogni > 0 esiste > 0 tale che
per ogni collezione nita di intervalli disgiunti ]
i
,
i
[, i = 1, . . . , k, contenuti
in [a, b] e vericanti
k
i=1
(
i
i
) < , risulta
k
i=1
[f(
i
) f(
i
)[ < .
Osservazioni 6.5.2 (1)
`
E immediato vericare che se f è assolutamente
continua, allora la condizione richiesta dalla denizione è soddisfatta anche
nel caso di famiglie innite di intervalli disgiunti.
(2) Se f è assolutamente continua in [a, b], allora ovviamente f è anche con-
tinua in [a, b]; il viceversa, come vedremo nellesempio 6.5.6, non è vero.
(3) Se g L
1
(a, b), allora la funzione f(x) =
_
x
a
g(t) dt appartiene ad
AC[a, b], a causa dellassoluta continuità dellintegrale (proposizione 4.5.6).
Tutte le funzioni assolutamente continue in [a, b] hanno necessariamente
variazione limitata in [a, b], come mostra la seguente
Proposizione 6.5.3 Risulta AC[a, b] BV [a, b].
Linclusione è ovviamente propria, dato che esistono funzioni discontinue a
variazione limitata; ad esempio,
[1,2]
BV [0, 3] con T
3
0
(
[1,2]
) = 2.
Dimostrazione Sia f AC[a, b]. Scelto = 1, sia il corrispondente
numero con il quale la f verica la denizione 6.5.1. Dividiamo [a, b] in N
parti uguali di ampiezza
ba
N
< , e poniamo x
n
= a +
n
N
(b a), 0 n N.
Risulta allora, per costruzione,
T
x
n+1
xn
(f) 1, n = 0, 1, . . . , N 1.
Dunque, per la proposizione 6.4.3 si ha
T
b
a
(f) =
N1
n=0
T
x
n+1
xn
(f) N < .
In particolare, dal corollario 6.4.5 segue che ogni funzione assolutamente con-
tinua in [a, b] è derivabile q.o. con derivata sommabile in [a, b]. Vericheremo
fra breve che per tali funzioni f lintegrale della derivata vale esattamente
f(b) f(a). Intanto osserviamo che il risultato del corollario 6.4.4 si può
ulteriormente precisare:
154
Corollario 6.5.4 Sia f : [a, b] R. Allora f AC[a, b] se e solo se f è
dierenza di due funzioni assolutamente continue e crescenti in [a, b].
Dimostrazione (=)
`
E suciente osservare che AC[a, b] è uno spazio
vettoriale.
(=) Per il corollario 6.4.4 si ha
f(x) = T
x
a
(f) (T
x
a
(f) f(x)),
e le due funzioni a secondo membro sono crescenti in [a, b]. Basterà allora
provare che x T
x
a
(f) appartiene ad AC[a, b].
Sia > 0 e sia il numero fornito dalla denizione 6.5.1 applicata a f. Sia
]
i
,
i
[
1iN
una famiglia di sottointervalli disgiunti di [a, b] con
N
i=1
(
i
i
) < , e per ogni i sia
i
una partizione di ]
i
,
i
[; allora risulta, grazie
allassoluta continuità di f,
N
i=1
t
i
(f,
i
) < ;
di conseguenza, per larbitrarietà delle partizioni
i
,
N
i=1
_
T
i
a
(f) T
i
a
(f)
_
=
N
i=1
T
i
(f) ,
Il teorema che segue caratterizza la classe delle funzioni assolutamente con-
tinue proprio in termini della proprietà (iii) del paragrafo 6.1.
Teorema 6.5.5 Sia f : [a, b] R una funzione continua. Sono fatti equi-
valenti:
(i) f AC[a, b];
(ii) f è derivabile q.o. in [a, b], f
t
è sommabile in [a, b] e
f(x) f(a) =
_
x
a
f
t
(t) dt x [a, b].
155
Dimostrazione [(i) = (ii)] Sappiamo già che f è derivabile q.o. in
[a, b]; dobbiamo solo provare luguaglianza sopra scritta. A questo scopo,
ricordando il corollario 6.5.4, possiamo supporre che f sia crescente in [a, b].
Essendo f crescente, esiste la misura di Lebesgue-Stieltjes
f
associata a f,
introdotta nellesempio 2.1.3(3) e ben denita grazie alla continuità di f:
proviamo che
f
è denita su / e che
f
m (denizione 4.5.1).
Sia E / con m(E) = 0. Fissiamo > 0; scelto > 0 in modo da
soddisfare la denizione di assoluta continuità di f, esiste un aperto A E
tale che m(A) < . Per lesercizio 1.3.3, sarà A =
n
]
n
,
n
[ con gli ]
n
,
n
[
disgiunti; poiche f è crescente, da
n
(
n

n
) < segue
n
(f(
n
)
f(
n
)) < . Quindi
f
(E)
f
(A)
f
([
n
,
n
[) =
n
(f(
n
) f(
n
)) < .
Dato che è arbitrario, si ottiene
f
(E) = 0; quindi, per la completezza di
f
, si ha E /
f
e
f
(E) = 0. Poiche ogni insieme G / è lunione di un
boreliano B e di un insieme E / di misura nulla, ne segue G = B E
/
f
; quindi / /
f
, ossia
f
è denita su /. Inoltre, come si è visto, se
m(E) = 0 allora
f
(E) = 0. Ciò prova che
f
m.
Adesso facciamo uso del teorema di Radon-Nikodym, già citato nel paragrafo
4.5, e che verrà dimostrato nel capitolo 8 in modo ovviamente indipendente
dalla teoria svolta n qui; in base a questo risultato (che certamente vale per
misure nite) possiamo concludere che esiste una funzione h L
1
(a, b), q.o.
non negativa, tale che
f
(E) =
_
E
h(t) dt E /.
In particolare
f(x) f(a) =
f
([a, x[) =
_
x
a
h(t) dt x [a, b];
applicando allora il corollario 6.2.5 si ottiene che f è derivabile q.o. in [a, b]
(cosa che già sapevamo), e che f
t
= h q.o. in [a, b] (fatto nuovo). Quindi
possiamo sostituire nellintegrale h con f
t
, e pertanto vale (ii).
[(ii) = (i)] La misura , denita da (E) =
_
E
[f
t
(t)[dt, è assolutamente
continua rispetto a m in quanto f
t
L
1
(a, b); dato che entrambe le misure
156
sono nite, in virt` u della proposizione 4.5.5 per ogni > 0 esiste > 0 tale
che
m(E) < =
_
E
[f
t
(t)[dt < .
In particolare, quindi, se ]
i
,
i
[
i=1,...,k
è una collezione nita di sottointer-
valli disgiunti di [a, b] tale che
k
i=1
(
i
i
) < , risulterà
k
i=1
[f(
i
) f(
i
)[ =
i=1
_

i
i
f
t
(t)dt
i=1
_

i
i
[f
t
(t)[dt < ,
il che mostra che f AC[a, b]. Ciò prova (i).
Non tutte le funzioni continue in [a, b] sono assolutamente continue in [a, b],
come mostra il sorprendente esempio che segue: esistono funzioni continue,
crescenti, q.o. derivabili, con derivata q.o. nulla, e tuttavia non costanti.
Funzioni di questo tipo non possono essere assolutamente continue a causa
del teorema 6.5.5, ma sono certamente a variazione limitata: per tali funzioni,
in particolare, la disuguaglianza del teorema 6.3.1 è stretta.
Esempio 6.5.6 Sia C linsieme ternario di Cantor C
1/3
introdotto nel para-
grafo 1.6: si ha
C =
nN
+
E
n
, E
n
E
n+1
, E
n
=
2
n
_
k=1
J
kn
,
dove gli J
kn
sono intervalli chiusi disgiunti con m(J
kn
) = 3
n
. Deniamo per
ogni n N
+
g
n
(x) =
_
3
2
_
n
En
(x), f
n
(x) =
_
x
0
g
n
(t)dt, x [0, 1].
Si noti che
_
J
kn
g
n
(t)dt =
_
3
2
_
n
m(J
kn
) =
1
2
n
,
_
J
kn
g
n+1
(t)dt =
_
3
2
_
n+1
m(J
kn
E
n+1
) =
_
3
2
_
n+1
2
3
n+1
=
1
2
n
,
Risulta allora
f
n
(0) = 0, f
n
(1) =
_
3
2
_
n
m(E
n
) = 1;
157
inoltre se x E
c
n
vale luguaglianza
f
n+1
(x) =
_
x
0
g
n+1
(t)dt =
_
x
0
g
n
(t)dt = f
n
(x)
(perche si integra solo sugli intervalli J
kn
contenuti in [0, x], dove gli integrali
di g
n
e g
n+1
coincidono), mentre invece se x E
n
, ad esempio x J
kn
, vale
la stima
[f
n+1
(x) f
n
(x)[ =
_
x
0
[g
n+1
(t) g
n
(t)]dt
_
J
kn
[g
n+1
(t) g
n
(t)[dt
_
J
kn
[g
n+1
(t) +g
n
(t)]dt =
1
2
n1
(perche gli integrali fra 0 ed il primo estremo di J
kn
si cancellano). In
denitiva
sup
x[0,1]
[f
n+1
(x) f
n
(x)[
1
2
n1
n N
+
,
cosicche la successione f
n
converge uniformemente in [0, 1] ad una funzione
f. Poiche le f
n
sono continue e crescenti, anche f è continua e crescente, e
verica f(0) = 0, f(1) = 1. Inoltre, dato che f
n
è costante su ogni intervallo
disgiunto da E
n
, si ha f
t
n
= 0 in E
c
n
ed a maggior ragione f
t
m
= 0 in E
c
n
per ogni m n, visto che in tal caso E
c
m
E
c
n
; quindi se I è un intervallo
contenuto in
n=1
E
c
n
, ossia disgiunto da C, si ha f
n
f uniformemente in
I e f
t
n
= 0 denitivamente in I: ciò implica che f è derivabile con f
t
= 0 in
I. Pertanto f è derivabile con f
t
= 0 in C
c
, ossia q.o. in [0, 1] (dal momento
che C ha misura nulla).
Come si è già osservato, f / AC[0, 1] perche
1 = f(1) f(0) >
_
1
0
f
t
(t) dt = 0.
La funzione f è chiamata funzione di Lebesgue o anche, pi` u informalmente,
scala del diavolo.
Esercizi 6.5
1. Provare che se f, g AC[a, b], allora f g, f g AC[a, b].
158
2. Sia f crescente ed assolutamente continua in [a, b]. Posto f(x) = f(b)
per x > b e f(x) = f(a) per x < a, si verichi che la misura di
Lebesgue-Stieltjes
f
su R è data da
f
(E) =
_
E
f
t
(t) dt E /.
3. Sia f AC[a, b]; si provi che per ogni E [a, b] misurabile con m(E) =
0 si ha m
(f(E)) = 0; si provi inoltre che per ogni E [a, b] misurabile

linsieme f(E) è misurabile.
4. Sia f crescente e continua a sinistra in [a, b] e sia
f
la misura di
Lebesgue-Stieltjes associata a f. Si provi che
f
m se e solo se
f AC[a, b].
5. Si provi che
|f|
AC[a,b]
= sup
x[a,b]
[f(x)[ +
_
b
a
[f
t
(t)[dt
è una norma nello spazio AC[a, b], e che AC[a, b] con questa norma è
completo. Si provi inoltre che AC[a, b] non è chiuso in C[a, b].
6. Sia f AC[a, b]; si provi che T
b
a
(f) = |f
t
|
L
1
(a,b)
, e se ne deduca che
AC[a, b] è un sottospazio chiuso di BV [a, b].
[Traccia: Per provare che T
b
a
(f) |f
t
|
L
1
(a,b)
si utilizzi il fatto che le
funzioni costanti a tratti sono dense in L
1
(a, b).]
7. Sia f : [a, b] R. Si provi che f è lipschitziana su [a, b] se e solo se
f AC[a, b] e f
t
L
(a, b).
8. Sia
f(x) =
_
x
sin x
se 0 < x 1
0 se x = 0.
Si provi che se 0 < < allora f AC[0, 1], mentre se 0 <
allora f / BV [0, 1].
9. Siano f AC[a, b] e g AC[c, d], con f([a, b]) [c, d]. Si provi che:
(i) se f è monotona, allora g f AC[a, b];
159
(ii) se g è lipschitziana, allora g f AC[a, b];
(iii) per f(x) = x
2
[ sin 1/x[ e g(x) = x
1/2
si ha f, g AC[0, 1] ma
g f / AC[0, 1].
10. Sia f : [a, b] R. Si dimostri che:
(i) se f AC[, 1] per ogni ]0, 1[ e f è continua in 0, allora non è
detto che f AC[0, 1];
(ii) se f AC[, 1] per ogni ]0, 1[, f BV [0, 1] e f è continua in 0,
allora f AC[0, 1];
(iii) se f AC[, 1] per ogni ]0, 1[, f
t
L
1
(0, 1) e f è continua in
0, allora f AC[0, 1].
11. Siano f, g AC[a, b]. Si provi che fg AC[a, b] e che vale la formula
di integrazione per parti
_
b
a
f(t)g
t
(t) dt +
_
b
a
f
t
(t)g(t) dt = f(b)g(b) f(a)g(a).
12. Provare che una funzione f : R R è della forma f(x) =
_
x
g(t) dt,
con g L
1
(R), se e solo se
f AC[a, a] a > 0, lim
a+
T
a
a
(f) < , lim
x
f(x) = 0.
13. (i) Siano F AC[a, b] e C
1
(R). Si provi che F AC[a, b].
(ii) Si dimostri che per ogni p [1, [ e f L
1
(a, b) esiste g L
1
(a, b)
tale che
__
x
a
[f(t)[dt
_
p
=
_
x
a
g(t)dt x [a, b].
14. Sia f la funzione di Lebesgue dellesempio 6.5.6; si provi che, detto
il suo graco, risulta
() = 2
(si confronti questo risultato con quello degli esercizi 6.4.5 e 6.4.6).
160
15. Sia f la funzione di Lebesgue dellesempio 6.5.6; si provi che f è holde-
riana di esponente
log 2
log 3
.
[Traccia: posto =
log 2
log 3
, e dati x, y [0, 1], sia n N tale che
3
n1
< [x y[ 3
n
; si provi che allora [f(x) f(y)[ 2
n
. Osser-
vato che 2 3
= 1, si deduca che [f(x) f(y)[ 3
[x y[
per ogni
x, y [0, 1].]
6.6 Cambiamento di variabile
Per lintegrale di Riemann la formula del cambiamento di variabile
_
g(b)
g(a)
f(x) dx =
_
b
a
f(g(t))g
t
(t) dt
vale per ogni f continua in un intervallo [c, d] e per ogni funzione g : [a, b]
[c, d] di classe C
1
. Ci chiediamo ora se questa formula si possa estendere
al caso dellintegrale di Lebesgue, e sotto quali condizioni ciò sia possibile.
Proveremo il seguente risultato:
Teorema 6.6.1 Sia f L
1
(c, d) e sia g : [a, b] [c, d] una funzione deriva-
bile q.o. in [a, b]. Posto F(x) =
_
x
c
f()d per x [c, d], i seguenti fatti sono
equivalenti:
(i) (f g)g
t
L
1
(a, b) e
_
g(v)
g(u)
f(x) dx =
_
v
u
f(g(t))g
t
(t) dt u, v [a, b];
(ii) F g AC[a, b].
In tal caso risulta (F g)
t
= (f g)g
t
q.o. in [a, b].
Per dimostrare il teorema faremo uso di tre lemmi preliminari.
Lemma 6.6.2 Sia g : [a, b] R una funzione derivabile in ogni punto di
un sottoinsieme E [a, b]. Se risulta [g
t
(x)[ per ogni x E, allora
m
(g(E)) m
(E).
161
Dimostrazione Sia > 0. Per ogni n N
+
poniamo
E
n
=
_
x E : [g(t) g(x)[ ( +)[t x[ t
_
x
1
n
, x +
1
n
_
[a, b]
_
.
Allora risulta
E
n
E
n+1
n N
, E =
_
nN
+
E
n
.
Per ogni n N
+
consideriamo un ricoprimento I
jn
jN
di E
n
, fatto da
intervalli di lunghezza minore di
1
n
, tale che
jN
m(I
jn
) < m
(E
n
) +.
Si ha allora, per denizione di E
n
e per il fatto che m(I
jn
) <
1
n
,
m
(g(E
n
))
jN
m
(g(E
n
I
jn
)) (+)
jN
m(I
jn
) < (+)(m
(E
n
)+);
passando inne al limite per n , e ricordando lesercizio 1.7.2, otteniamo
m
(E) = m
_
_
nN
+
g(E
n
)
_
= lim
n
m
(g(E
n
))
( +)
_
lim
n
m
(E
n
) +
_
= ( +) [m
(E) +] ,
da cui la tesi del lemma per larbitrarietà di .
Lemma 6.6.3 Sia g : [a, b] R una funzione, e sia E [a, b] un insieme
tale che g sia derivabile in ogni punto x E. Allora si ha m
(g(E)) = 0 se
e solo se g
t
= 0 q.o. in E.
Dimostrazione (=) Sia g
t
= 0 q.o. in E. Poniamo
E
0
= x E : g
t
(x) = 0, E
k
= x E : k1 < [g
t
(x)[ k k N
+
.
Per il lemma 6.6.2 si ha m
(g(E
0
)) = 0 ed anche
m
(g(E E
0
))
kN
+
m
(g(E
k
))
kN
+
km
(E
k
) = 0,
162
da cui m
(g(E)) = 0.
(=) Sia m
(g(E)) = 0: Posto B = x E : g
t
(x) ,= 0, sarà B =
n=1
B
n
,
ove
B
n
=
_
x E : [g(t) g(x)[
1
n
[t x[ x
_
x
1
n
, x +
1
n
_
[a, b]
_
.
Fissato n N
+
, sia A = B
n
I, ove I è un qualunque sottointervallo di [a, b]
di lunghezza minore di
1
n
. Se dimostriamo che m(A) = 0, avremo m(B
n
) = 0
a causa dellarbitrarietà di I; dunque, essendo arbitrario anche n, otterremo
m(B) = 0, cioè la tesi. Proviamo in denitiva che m(A) = 0.
Sia > 0: dato che m(g(A)) m(g(E)) = 0, esiste un ricoprimento I
j
jN
di g(A), fatto di intervalli, tale che
jN
m(I
j
) < . Poiche A g(g
1
(A))
jN
g
1
(I
j
), denendo U
j
= g
1
(I
j
) A avremo anche A =
jN
U
j
. Perciò
m
(A)
jN
m
(U
j
)
jN
sup
t,xU
j
[t x[
_
per denizione di B
n
, essendo U
j
I B
n
e m(I)
1
n
_
jN
n sup
t,xU
j
[g(t) g(x)[ (essendo g(U
j
) I
j
)
jN
n m(I
j
) < n,
ove è arbitrario e n è ssato. Quindi m
(A) = 0. Ne segue la tesi.

Lemma 6.6.4 Siano F AC[c, d] e g : [a, b] [c, d], e supponiamo che g e
F g siano derivabili q.o. in [a, b]. Allora si ha (F g)
t
= (F
t
g)g
t
q.o. in
[a, b].
M = y [c, d] : F
t
(y) non esiste, N = g
1
(M), G = [a, b] N.
Notiamo che se y [c, d] M e k [c y, d y] si ha
F(y +k) F(y) = k[F
t
(y) +(y, k)], lim
k0
(y, k) = 0;
163
quindi se x G risulta g(x) [c, d] M e pertanto, scelti h [a x, b x]
e k = g(x +h) g(x), avremo
F(g(x +h)) F(g(x)) = [g(x +h) g(x)][F
t
(g(x)) +(x, h)],
ove
(x, h) = (g(x), g(x +h) g(x)) 0 per g(x +h) g(x) 0.
Supponiamo ora che x G e che esista g
t
(x): ciò accade q.o. in G. In tal
caso si ha g(x + h) g(x) 0 per h 0, quindi (x, h) 0 per h 0;
allora dividendo per h la relazione precedente e passando al limite per h 0
otteniamo
(F g)
t
(x) = g
t
(x)F
t
(g(x)) q.o. in G.
Daltra parte,
m(g(N)) = m(M) = 0,
ed essendo F AC[c, d], si deduce m(F(g(N))) = 0 in virt` u dellesercizio
6.5.3. Posto
N
0
= x [a, b] : (F g)
t
(x) non esiste,
si ha a maggior ragione m(F(g(N N
0
))) = 0; quindi, per il lemma 6.6.3, si
ha (F g)
t
= 0 q.o. in N N
0
, cioè q.o. in N. Similmente, posto
N
1
= x [a, b] : g
t
(x) non esiste,
si ha a maggior ragione m(g(N N
1
)) = 0, e ancora dal lemma 6.6.3 segue
g
t
= 0 q.o. in N N
1
, ossia q.o. in N. Inne, ricordando che F
t
è q.o. nita
in [a, b] (essendo ivi sommabile), otteniamo
(F g)
t
= 0 = (F
t
g)g
t
q.o. in N.
Pertanto si conclude che
(F g)
t
= (F
t
g)g
t
q.o. in N G = [a, b].
Dimostrazione del teorema 6.6.1 (i) = (ii) Per ipotesi, (f g)g
t

L
1
(a, b) e vale la formula di cambiamento di variabile, cioè per ogni x [a, b]
si ha
F(g(x)) F(g(a)) =
_
g(x)
g(a)
f(y) dy =
_
x
a
f(g(t))g
t
(t) dt;
164
quindi F g AC[a, b] per il teorema 6.5.5.
(ii) = (i) Dato che F g AC[a, b] e F AC[c, d], siamo nelle ipotesi del
lemma 6.6.4: pertanto
(F g)
t
= (F
t
g)g
t
q.o. in [a, b].
Come nella dimostrazione del lemma 6.6.4, siano
M = y [c, d] : F
t
(y) non esiste, N = g
1
(M).
Fuori di N si ha F
t
(g(x)) = f(g(x)) q.o., da cui
(F g)
t
= (f g)g
t
q.o. in [a, b] N;
dentro N, ragionando come nella dimostrazione del lemma 6.6.4, troviamo
(F g)
t
(x) = 0 q.o. e g
t
(x) = 0 q.o., da cui, essendo f sommabile e quindi
q.o. nita,
(F g)
t
= 0 = (f g)g
t
q.o. in N.
In denitiva
(F g)
t
= (f g)g
t
q.o. in [a, b],
e inoltre (f g)g
t
risulta sommabile in [a, b] dato che F g AC[a, b]. Perciò
_
g(v)
g(u)
f(x) dx = F(g(v)) F(g(u)) =
=
_
v
u
(F g)
t
(t) dt =
_
v
u
f(g(t))g
t
(t) dt u, v [a, b],
Esercizi 6.6
1. Siano f L
1
(c, d), g AC[a, b] e F(x) =
_
x
c
f(t)dt. Si provi che se,
in pi` u, f L
(c, d), oppure g è monotona, allora F g AC[a, b] e

quindi la formula di cambiamento di variabile è applicabile.
2. Posto
g(t) = t
3
sin
1
t
, t [0, 1], f(x) = x
2
3
, x [1, 1],
si provi che la formula di cambiamento di variabile è falsa per u = 0 e
v > 0. Come mai?
165
3. Posto
g(t) = t sin
1
t
, t [0, 1], f(x) = x, x [1, 1],
si provi che la formula di cambiamento di variabile è valida, benche
g / AC[0, 1] (e infatti nel teorema 6.6.1 lipotesi g AC[a, b] non cè).
4. Sia f : [a, b] R misurabile e sia E [a, b] un insieme misurabile tale
che la derivata f
t
(x) esista nita in ogni punto x E. Si provi che
m
(f(E))
_
E
[f
t
[dm.
[Traccia: si supponga dapprima [f
t
[ N, e si denisca E
kn
= x
E : 2
n
(k 1) [f
t
(x)[ < 2
n
k (n N, k = 1, 2, . . . , N2
n
). Si
provi che per ogni n N si ha m
(f(E))

N2
n
k=1
2
n
k m(E
kn
)
_
E
[f
t
[dm+ 2
n
m(E) . . .]
5. Sia F C[a, b] BV [a, b], tale che per ogni E [a, b] con m(E) = 0 si
abbia m(F(E)) = 0. Si provi che F AC[a, b].
[Traccia: se ]x
i
, y
i
[ (1 i N) sono disgiunti, sia E
i
= x ]x
i
, y
i
[:
F
t
(x); si mostri che m(F(]x
i
, y
i
[) = m(F(E
i
)) e che
N
i=1
[F(x
i
)
F(y
i
)[
N
i=1
_
y
i
x
i
[F
t
[dm.]
6. Siano F AC[a, b] e G AC[c, d], con [c, d] = F([a, b]). Si provi che
G F AC[a, b] se e solo se G F BV [a, b].
6.7 Cambiamento di variabili
Scopo di questo paragrafo è ricavare la formula del cambiamento di variabili
negli integrali di Lebesgue N-dimensionali: vedremo che sotto opportune
ipotesi sulla trasformazione T : R
N
R
N
è ancora valida la medesima
formula che sussiste per gli integrali multipli di Riemann: in altre parole
risulta, indicando con J
T
il determinante della matrice Jacobiana di T,
_
T(E)
f dm
N
=
_
E
(f T)[J
T
[dm
N
per ogni insieme misurabile E e per ogni funzione misurabile e non negativa
f.
166
Nella dimostrazione faremo uso di diversi enunciati preliminari. Il pi` u impor-
tante di essi è il teorema del punto sso di Brouwer, risultato fondamentale
in vari contesti e del quale si conoscono numerose dimostrazioni: per comple-
tezza il prossimo paragrafo ne contiene una, dovuta a G. Stampacchia, che
fa uso di strumenti puramente analitici.
Teorema 6.7.1 (di Brouwer) Sia K R
N
un insieme non vuoto, conves-
so e compatto; sia F : K K una funzione continua. Allora F ha almeno
un punto sso.
Iniziamo la trattazione del cambiamento di variabili con un lemma che è una
conseguenza diretta del teorema di Brouwer.
Lemma 6.7.2 Sia B
r
la palla aperta di R
N
di centro 0 e raggio r, e sia S
r
la sua frontiera. Sia F : B
r
R
N
unapplicazione continua e sia ]0, 1[
tale che
[F(x) x[ < r x S
r
.
Allora F(B
r
) B
(1)r
.
Dimostrazione Ragioniamo per assurdo: sia a B
(1)r
tale che a / F(B
r
).
Allora dallipotesi segue
[F(x)[ [x[ [x F(x)[ > (1 )r x S
r
,
e dunque a non appartiene nemmeno a F(S
r
). Poniamo allora
G(x) =
r(a F(x))
[a F(x)[
, x B
r
:
G è unapplicazione continua da B
r
in se. Proviamo che G non ha punti ssi:
ciò, contraddicendo il teorema di Brouwer, ci darà lassurdo.
Se x S
r
, allora x x = r
2
e quindi
x (a F(x)) = x a +x (x F(x)) r
2
< r[a[ +r
2
r
2
< 0,
da cui x G(x) < 0 e pertanto x ,= G(x).
Se invece x B
r
, allora x ,= G(x) in quanto G(x) S
r
. Ne segue che G è
priva di punti ssi.
Il lemma che segue mette in luce il ruolo chiave giocato dal determinante
Jacobiano.
167
Lemma 6.7.3 Sia V un aperto di R
N
, sia T : V R
N
unapplicazione
continua. Se T è dierenziabile in un punto x V , allora, detta B(x, r) la
palla aperta di centro x e raggio r,
lim
r0
+
m
N
(T(B(x, r)))
m
N
(B(x, r))
= [ det T
t
(x)[.
Dimostrazione Osserviamo che T(B(x, r)) è misurabile: infatti B(x, r) è
unione numerabile di compatti e T è continua, cosicche anche T(B(x, r)) è
unione numerabile di compatti.
Possiamo supporre, a meno di traslazioni, che x = 0 e T(0) = 0. Poniamo
A = T
t
(0); si hanno due casi: lapplicazione lineare A è bigettiva oppure no.
1
o
caso: A è bigettiva. Posto F(x) = A
1
T(x) per ogni x V , si
ha F(0) = 0, F
t
(0) = I e, dalla teoria dellintegrazione secondo Riemann
otteniamo, per ogni palla contenuta in V ,
m
N
(T(B)) = m
N
(A(F(B))) = [ det A[ m
N
(F(B)),
cosicche la tesi sarà provata se faremo vedere che
lim
r0
+
m
N
(F(B(x, r)))
m
N
(B(x, r))
= 1.
Osserviamo esplicitamente che questo fatto sarebbe stato di dimostrazione
abbastanza semplice se avessimo supposto T di classe C
1
su V , perche avrem-
mo potuto far uso del teorema di inversione locale per applicazioni da R
N
in
R
N
. Nelle nostre ipotesi, invece, occorrerà utilizzare il teorema di Brouwer.
Sia > 0. Dallipotesi di dierenziabilità segue che esiste > 0 tale che
0 < [x[ < = [F(x) x[ < [x[,
e in particolare
[F(x)[ [F(x) x[ +[x[ < (1 +)[x[ per 0 < [x[ < .
Il lemma 6.7.2 applicato a F e la relazione precedente ci dicono che
B(0, (1 )r) F(B(0, r)) B(0, (1 +)r) r ]0, ].
Da qui si ricava
(1 )
N
m
N
(F(B(0, r)))
m
N
(B(0, r))
(1 +)
N
,
168
da cui, come osservato, la tesi quando A è bigettiva.
2
o
caso: A non è bigettiva. In particolare A non è surgettiva: quindi
limmagine di A ha misura N-dimensionale nulla. Sia > 0: esiste > 0
tale che, posto
E
= x R
N
: d(x, A(B(0, 1))) < ,
si ha m
N
(E
) < . Inoltre, essendo A = T

t
(0), esiste > 0 per cui
[x[ < = [T(x) Ax[ [x[.
Se r < si ha
T(B(0, r)) x R
N
: d(x, A(B(0, r))) < r;
denotando questultimo insieme con E, si vede immediatamente che E =
rE
, cosicche m
N
(E) < r
N
. Dunque
m
N
(T(B(0, r))) < r
N
=
m
N
(B(0, r))
m
N
(B(0, 1))
r ]0, [,
da cui
lim
r0
+
m
N
(T(B(0, r)))
m
N
(B(0, r))
= 0 = [ det A[.
La tesi è provata anche quando A non è bigettiva.
Il lemma seguente fornisce condizioni anche gli insiemi di misura nulla
vengano trasformati in insiemi di misura nulla.
Lemma 6.7.4 Sia E un insieme misurabile di R
N
con m
N
(E) = 0. Se
T : E R
N
è unapplicazione tale che
limsup
yx, yE
[T(y) T(x)[
[y x[
< + x E,
allora T(E) è misurabile con m
N
(T(E)) = 0.
Dimostrazione Per ogni n, p N
+
poniamo
E
np
= x E : [T(y) T(x)[ < n[y x[ y E B(x, 1/p);
169
ovviamente m
N
(E
np
) = 0. Fissato > 0, possiamo ricoprire E
np
con una
famiglia al pi` u numerabile di palle B
i
= B(x
i
, r
i
) con r
i
< 1/p e x
i
E
np
, tali
che
i
m
N
(B
i
) < : questo può essere fatto scegliendo un aperto W E
np
con m
N
(W) < /2, decomponendolo in cubi semiaperti disgiunti di diametro
sucientemente piccolo, e prendendo per ogni cubo C che interseca E
np
una
palla B centrata in un punto di C E
np
e raggio pari al diametro di C.
Se allora x E
np
B
i
, si ha [x x
i
[ < 1/p, da cui
[T(x) T(x
i
)[ < n[x
i
x[ < nr
i
;
quindi T(E
np
B
i
) B(T(x
i
), nr
i
) e pertanto
T(E
np
)
_
i
B(T(x
i
), nr
i
).
Ne segue
m
N
(T(E
np
) n
N
i
m
N
(B
i
), n
N
,
e per larbitrarietà di si conclude che m
N
(T(E
np
)) = 0 per ogni n, p N
.
Inne, essendo E =
n,pN
+
E
np
, si ricava che m
N
(T(E)) = 0.
Come ovvia conseguenza del lemma precedente si ottiene il
Corollario 6.7.5 Se V è un aperto di R
N
e T : V R
N
è unapplicazio-
ne dierenziabile, allora T trasforma sottoinsiemi di V di misura nulla in
insiemi di misura nulla.
Enunciamo nalmente il teorema del cambiamento di variabili.
Teorema 6.7.6 Sia V un aperto non vuoto di R
N
, sia T : V R
N
unap-
plicazione continua, e sia Y V un insieme misurabile tale che:
(i) T sia dierenziabile in ogni punto di Y ;
(ii) T[
Y
sia iniettiva;
(iii) m
N
(T(V Y )) = 0.
Allora per ogni funzione f misurabile e non negativa denita su T(Y ) si ha
_
T(Y )
f dm
N
=
_
Y
(f T)[J
T
[dm
N
,
ove J
T
(x) è il determinante della matrice Jacobiana di T nel punto x Y .
170
Dimostrazione Procederemo in tre passi.
1
o
passo: se E V è misurabile, allora T(E) è misurabile.
Sappiamo dal lemma 6.7.4 che se E
0
V è misurabile con m
N
(E
0
) = 0, allora
m
N
(T(E
0
Y )) = 0, mentre per lipotesi (iii) si ha m
N
(T(E
0
Y )) = 0: ne
segue m
N
(T(E
0
)) = 0. Inoltre, se E
1
è un boreliano intersezione numerabile
di aperti, allora E
1
è unione numerabile di compatti; poiche T è continua,
anche T(E
1
) è unione numerabile di compatti e quindi T(E
1
) è misurabile.
Dato che ogni insieme E misurabile è unione di un boreliano intersezione
numerabile di aperti e di un insieme di misura nulla, anche T(E) è misurabile.
Ci` o prova il primo passo.
2
o
passo: se E è misurabile, allora m
N
(T(E Y )) =
_
Y

E
[J
T
[ dm
N
.
Per ogni n N
+
consideriamo laperto V
n
= x V : [T(x)[ < n e linsieme
Y
n
= Y V
n
, e deniamo
n
(E) = m
N
(T(E Y
n
)), E /
N
.
Dal primo passo segue che
n
è ben denita, mentra dalliniettività di T su
Y otteniamo che
n
è una misura. Inoltre
n
è nita (perche è la misura di
Lebesgue di insiemi contenuti nella palla di centro lorigine e raggio n) e, per
il corollario 6.7.5,
n
è assolutamente continua rispetto a m
N
. Quindi, per il
teorema di Radon-Nikod ym, che verrà dimostrato pi` u avanti nel corso, esiste
una funzione h
n
L
1
(R
N
), non negativa e nulla fuori di Y
n
, tale che
n
(E) =
_
E
h
n
dm
N
E /
N
.
Dimostriamo che h
n
(x) = [J
T
(x)[ q.o. in Y
n
. Sia x Y
n
e sia > 0 tale che
B(x, r) V
n
per r ]0, [; poiche V
n
Y
n
V Y , per lipotesi (iii) si ha
n
(E) = m
N
(T(E V
n
)), da cui per r ]0, [ possiamo scrivere
n
(B(x, r))
m
N
(B(x, r))
=
m
N
(T(B(x, r) V
n
))
m
N
(B(x, r))
=
m
N
(T(B(x, r)))
m
N
(B(x, r))
,
da cui, per il lemma 6.7.3,
lim
r0
+
n
(B(x, r))
m
N
(B(x, r))
= [J
T
(x)[.
Daltronde, se x Y
n
è punto di Lebesgue per h
n
si ha
lim
r0
+
n
(B(x, r))
m
N
(B(x, r))
= lim
r0
+
1
m
N
(B(x, r))
_
B(x,r)
h
n
dm
N
= h
n
(x),
171
cosicche le funzioni h e [J
T
[ coincidono q.o. in Y
n
. Si conclude allora che
m
N
(T(E Y
n
)) =
n
(E) =
_
Yn
[J
T
[dm
N
E /
N
.
Utilizzando il teorema di B. Levi, per n otteniamo la tesi del secondo
passo.
3
o
passo: se E è misurabile, allora
_
T(Y )
E
dm
N
=
_
Y
(
E
T)[J
T
[ dm
N
.
Sia A un boreliano di R
N
e sia E = x V : T(x) A, cosicche
E
=
A
T.
Per lesercizio 3.1.16,
E
è misurabile, quindi anche
E
[J
T
[ lo è; inoltre si ha
T(E Y ) = A T(Y ), da cui, per il secondo passo,
_
T(Y )
A
dm
N
= m
N
(A T(Y )) = m
N
(T(E Y )) =
_
Y
(
A
T)[J
T
[ dm
N
.
Sia ora G un insieme misurabile di misura nulla. Allora esiste un boreliano
A G di misura nulla, e dunque (
A
T)[J
T
[ = 0 q.o. in R
N
. Ne segue,
essendo 0
G

A
,
_
T(Y )
G
dm
N
= 0 =
_
Y
(
N
T)[J
T
[ dm
N
.
Dato che ogni insieme misurabile E è unione (disgiunta) di un boreliano A e
di un insieme di misura nulla G, sommando le relazioni relative ad A e a G
si ottiene la tesi del terzo passo.
La dimostrazione del teorema 6.7.6 si conclude ora facilmente: per additività
la tesi del terzo passo vale per ogni funzione semplice, e inne utilizzando il
teorema di B. Levi essa si estende ad ogni funzione misurabile non negativa.
Osservazioni 6.7.7 (1) Ovviamente il teorema di cambiamento di variabili
vale anche per funzioni che cambiano segno, purche siano sommabili o almeno
integrabili.
(2) Dalla dimostrazione segue in particolare che la funzione (f T)[J
T
[ è
misurabile; in generale tuttavia f T non lo è (esercizio 6.7.4).
(3) Il teorema 6.7.6 vale anche per N = 1, ma in questo caso il risultato che
si ottiene è meno generale di quello del teorema 6.6.1.
172
Esercizi 6.7
1. (Coordinate polari in R
N
) Sia x = T(r,
1
, . . . ,
N2
, ) la trasforma-
zione denita da
T : [0, [[0, ]
N2
[0, 2] R
N
,
_
_
x
1
= r cos
1
x
2
= r sin
1
cos
2
x
3
= r sin
1
sin
2
cos
3
. . . . . . . . .
x
N2
= r sin
1
sin
2
sin
3
. . . sin
N3
cos
N2
x
N1
= r sin
1
sin
2
sin
3
. . . sin
N3
sin
N2
cos
x
N
= r sin
1
sin
2
cos
3
. . . sin
N3
sin
N2
sin
Si provi che
[J
T
(r,
1
, . . . ,
N2
, )[ = r
N1
(sin
1
)
N2
. . . sin
N2
e che il teorema 6.7.6 è applicabile.
2. Posto
N
= m
N
(B(0, 1)) (ove B(0, 1) è la palla aperta di centro lori-
gine e raggio 1), si provi che
N
=
2
N

N2
N > 2,
e si deduca che, in accordo con losservazione 2.6.2,
N
=

N
2
_
N
2
+ 1
_ =
_

n
n!
se N = 2n
2
n
n1
(2n1)!!
se N = 2n 1,
n N
+
,
ove k!! è il prodotto di tutti i naturali non superiori a k che hanno la
stessa parità di k.
3. Sia f : [0, R] R una funzione integrabile. Si provi che
_
B(0,r)
f([x[)dm
N
= N
N
_
r
0
f()
N1
dm() r [0, R].
173
4. Sia C
linsieme di Cantor di parametro >

1
3
e sia W
n
nN
la colle-
zione di intervalli aperti rimossi durante la costruzione di C
; siano poi
g
n
funzioni continue nulle su W
c
n
e tali che 0 < g
n
< 2
n
in W
n
. Posto
g =
nN
g
n
, deniamo
T(x) =
_
x
0
g(t)dt, t [0, 1].
Si provi che:
(i) T verica le ipotesi del teorema 6.7.6 con N = 1 e Y = V =]0, 1[;
(ii) T è derivabile in [0, 1], T
t
(x) = 0 per ogni x C
e m(T(C
)) = 0;
se V è un sottoinsieme non misurabile di C
e A = T(V ), allora
A
è
una funzione misurabile ma
A
T non lo è.
6.8 Appendice: dimostrazione del teorema di
Brouwer
Riportiamo per comodità lenunciato del teorema.
Teorema (di Brouwer) Sia K R
N
un insieme non vuoto, convesso e
compatto; sia F : K K una funzione continua. Allora F ha almeno un
punto sso.
Dimostrazione Facciamo vari passi.
1
o
passo. Cominciamo col mostrare che, se la tesi vale quando K = B(0, R),
con R > 0, allora vale anche nel caso generale. Infatti, essendo K un convesso
compatto, esisterà R > 0 tale che K B(0, R); detta P
K
la proiezione
sul convesso K, lapplicazione composta F P
K
è continua da B(0, R) in
K, e quindi da B(0, R) in se. Quindi cè un punto x B(0, R) tale che
x = F P
K
(x); dato che F è a valori in K, si ha x K, e di conseguenza
P
K
(x) = x. Ciò prova che x = F(x), ossia x è punto sso di F.
2
o
passo. Ora proviamo che se la tesi vale quando K è la palla unitaria
chiusa, allora vale anche quando K = B(0, R), R > 0. A questo scopo basta
porre
G(x) =
1
R
F(Rx) x B(0, 1),
174
ed osservare che, per ipotesi, G ha un punto sso x B(0, 1); di conseguenza
y = Rx appartiene a B(0, R) ed è punto sso di F.
3
o
passo. Dora in poi, dunque, supporremo che K = B(0, 1). In questo
terzo passo facciamo vedere che, supposta vera la tesi quando F è di classe
C
, essa è vera anche per F continua. Infatti, consideriamo per ogni m N

+
la proiezione P
m
sulla palla B(0, 1
1
m
); la funzione composta P
m
F man-
da K in tale palla. Per la densità di C
(K) in C(K), esiste una funzione
m
C
(K) tale che |

m
P
m
F|

1
m
. Da questa stima segue che
m
è a valori in K: quindi, per ipotesi, per ogni m N
+
esiste un punto sso
x
m
K per lapplicazione
m
. La successione x
m
mN
+ è limitata, e dun-
que vi è una sottosuccessione x
mn
nN
+ convergente ad un punto x K.
Proviamo che x è punto sso per F. Poiche [x
mn
P
mn
(x
mn
)[
N

1
mn
,
si ha P
mn
(x
mn
) x per n ; essendo F continua, si deduce che
F(P
mn
(x
mn
)) F(x) e F(x
mn
) F(x) per n . Dato che P
m
(x)
converge a x per ogni x K, si deduce che P
mn
(F(x
mn
)) F(x) per
n . Utilizzando la relazione |
m
P
m
F|

1
m
, si ricava anche
mn
(x
mn
) F(x) per n . Di conseguenza, passando al limite nelle-
quazione x
mn
=
mn
(x
mn
) si ottiene x = F(x).
4
o
passo. Dimostriamo nalmente la tesi nel caso a cui ci siamo ridotti,
ossia F : K K di classe C
, con K = B(0, 1). Supponiamo per assurdo

che risulti F(x) ,= x per ogni x K. Consideriamo lequazione
[x +a(x F(x))[
2
N
= 1, a R, x K,
ovvero
a
2
[x F(x)[
2
N
+ 2a (x, x F(x))
N
(1 [x[
2
N
) = 0.
Fissato x K, il discriminante di questa equazione di 2
o
grado è
(x) = (x, x F(x))
2
N
+ (1 [x[
2
N
)[x F(x)[
2
N
.
Ovviamente, (x) 0; proviamo che (x) > 0 per ogni x K. Ciò è
evidente quando [x[
N
< 1; se invece [x[
N
= 1, non può essere (x, xF(x))
N
=
1 (x, F(x))
N
= 0, in quanto si ha sempre
(x, F(x))
N
[x[
N
[F(x)[
N
= [F(x)[
N
1,
e vale luguaglianza (x, F(x))
N
= 1 se e solo se F(x) = x, il che è vietato dal
nostro ragionamento per assurdo.
175
Possiamo considerare allora la maggiore delle due radici dellequazione, che
denotiamo con a(x):
a(x) =
(x, x F(x))
N
+
_
(x)
[x F(x)[
2
N
.
Osserviamo che per [x[
N
= 1 le radici dellequazione sono
0, 2
1 (x, F(x))
N
[x F(x)[
2
N
< 0,
cosicche se [x[
N
= 1 si ha a(x) = 0.
Deniamo
f(t, x) = x +t a(x)(x F(x)), t R, x K.
Questa funzione è di classe C
(perche (x) > 0 in K) e verica

f(0, x) = x, [f(1, x)[
N
= 1 x K; f
t
(t, x) = 0 per [x[
N
= 1 :
infatti la prima uguaglianza è banale, la seconda segue dal fatto che a(x) è
radice dellequazione [x + a(x F(x))[
2
N
= 1, e la terza si ottiene notando
che f
t
(t, x) = a(x)(x F(x)) e ricordando che a(x) = 0 per [x[
N
= 1.
Poniamo adesso, per ogni t R,
D
0
(t, x) = det
_
_
f
i
x
j
(t, x)
_
i,j=1,...,N
_
, I(t) =
_
K
D
0
(t, x) dx.
Dato che D
0
(0, x) = det(I) = 1 per ogni x K, è chiaro che I(0) = m
N
(K);
verichiamo che si ha inoltre I(1) = 0. Derivando la relazione [f(1, x)[
2
N
= 1,
valida per ogni x K, si ottiene il sistema
2
N
i=1
f
i
(1, x)
f
i
x
j
(1, x) = 0, j = 1, . . . , N, x K;
dunque il sistema lineare omogeneo N N con coecienti
f
i
x
j
(1, x) ha
per soluzione il vettore di componenti f
i
(1, x), il quale è non nullo, essen-
do [f(1, x)[
N
= 1 per ogni x K. Di conseguenza il determinante dei
coecienti, che è D
0
(1, x), deve essere nullo per ogni x K, e pertanto
I(1) =
_
K
0 dx = 0.
Vogliamo ora dimostrare che I
t
(t) = 0 per ogni t R: da ciò seguirà ov-
viamente lassurdo, essendo I C
e I(1) I(0) ,= 0. A questo scopo è

essenziale il seguente
176
Lemma 6.8.1 Sia g : R
N+1
R
N
unapplicazione di classe C
nelle
variabili (x
0
, x
1
, . . . , x
N
). Posto
j
(x) = det(D
j
(x)), D
j
(x) =
_
_
g
i
x
j
(x)
_
i=1,...,N, j=0,...,N, j,=i
_
,
risulta
N
j=0
(1)
j
j
x
j
(x) = 0 x R
N+1
.
Dimostrazione Si ha
N
j=0
(1)
j
j
x
j
(x) =
N
j=0
(1)
j
N
i=1
det(A
i
(x)),
ove A
i
(x) è la matrice N N che si ottiene da D
j
(x) rimpiazzandone la
i-sima riga con
_

2
f
i
x
0
x
j
(x), . . . ,

2
f
i
x
j1
x
j
(x),

2
f
i
x
j+1
x
j
(x), . . . ,

2
f
i
x
N
x
j
(x)
_
.
Gli addendi di questa sommatoria sono N(N + 1), quindi sono in numero
pari. Un generico termine del determinante relativo alladdendo di indici
(j, i), con 0 j N e 1 i N ssati, ha la forma seguente:
2
f
i
x
s
x
j
(x)
1kN, k,=i
f
k
x
r
k
(x),
ove s 0, 1, . . . , N j, e r : 1, . . . , N 0, 1, . . . , N j è una
permutazione degli indici tale che r
i
= s (e, in particolare, r
k
,= j, s per
k ,= i); il segno di questo termine è (1)
j
(r), ove (r) è il segno della
permutazione r. Lo stesso termine compare in un altro determinante: quello
relativo alladdendo di indici (s, i), e che corrisponde alla permutazione :
1, . . . , N 0, 1, . . . , N s tale che
i
= j e
k
= r
k
per ogni k
1, . . . , N i; il suo segno è, stavolta, (1)
s
().
Adesso osserviamo che (1)
j
(r) è il segno della permutazione r
t
S
N+1
che
si ottiene ponendo r
t
0
= j e r
t
k
= r
k
per ogni k 1, . . . , N; analogamente,
(1)
s
() è il segno della permutazione
t
S
N+1
tale che
t
0
= s e
t
k
=
k
177
per ogni k 1, . . . , N. Dato che
t
si ottiene da r
t
scambiando r
t
0
con r
t
i
,
i segni di
t
e r
t
sono opposti: dunque (1)
j
(r) = (1)
s
() e pertanto i
due termini corrispondenti si cancellano fra loro. Ciò accade per ogni coppia
di termini ed in denitiva lintera somma è nulla.
Torniamo alla dimostrazione del teorema di Brouwer. Applichiamo il lemma
6.8.1 alla funzione f(t, x
1
, . . . , x
N
): ponendo
D
j
(t, x) = det
_
_
f
i
x
k
(t, x)
_
i=1,...,N, k=0,1,...,N, k,=j
_
, j = 1, . . . , N,
si ha
I
t
(t) =
_
K
D
0
t
(t, x)dx =
N
j=1
(1)
j
_
K
D
j
x
j
(t, x)dx;
applicando le formule di Gauss-Green, si deduce
I
t
(t) =
N
j=1
(1)
j
_
K
D
j
(t, x)
j
(x)d,
ove (x) è il versore normale esterno a K e è la misura di Hausdor (N1)-
dimensionale su K. Ma poiche per j = 1, . . . , N i D
j
sono determinanti
di matrici tutte contenenti il vettore colonna f
t
(t, x), il quale è nullo per
[x[
N
= 1, tutti i D
j
sono nulli su K. Pertanto I
t
(t) = 0 per ogni t R, e
ciò implica lassurdo. Il teorema di Brouwer è cos` dimostrato.
Esercizi 6.8
1. Vericare che il teorema di Brouwer è falso per la palla unitaria chiusa
di
2
.
[Traccia: se B è la palla unitaria chiusa di
2
, si consideri lapplicazione
f(x) =
_
_
1 |x|
2
2
, x
1
, x
2
, . . .
_
, x B.]
2. Sia f : R
N
R
N
unapplicazione continua tale che esista R > 0 per
cui si abbia
(f(x), x)
N
0 x B(0, R).
Si provi che esiste x B(0, R) tale che f(x) = 0.
[Traccia: ragionare per assurdo, applicando il teorema di Brouwer alla
funzione F : B(0, R) B(0, R) denita da F(x) = R
f(x)
[f(x)[
N
.]
178
Capitolo 7
Spazi di Banach
7.1 Norme
Abbiamo già incontrato vari esempi di spazi vettoriali dotati di norme; alcuni
sono completi rispetto alla distanza indotta dalla norma, altri no. Vogliamo
ora ricapitolare alcuni fatti già noti ed ampiamente usati, e descrivere in
modo pi` u organico questi spazi. Cominciamo con la denizione di norma.
Denizione 7.1.1 Sia X uno spazio vettoriale su R o su C. Una norma su
X è una funzione | | : X [0, [ dotata delle seguenti proprietà:
(i) |x| = 0 x = 0;
(ii) |x| = [[|x| per ogni x X e per ogni R (oppure per ogni C);
(iii) |x +y| |x| +|y| per ogni x, y X.
La coppia (X, | |) è detta spazio normato ed è uno spazio metrico con la
distanza indotta d(x, y) = |xy|; se tale spazio metrico è completo, (X, ||)
è detto spazio di Banach.
Notiamo che da (iii) segue
[ |x| |y| [ |x y| x, y X;
quindi la norma è una funzione continua da X in [0, +[.
Abbiamo già incontrato i seguenti spazi di Banach:
179
(1) R
N
e C
N
, con |x| =
_
N
i=1
[x
i
[
2
, oppure |x| =
N
i=1
[x
i
[, oppure
|x| = max
1iN
[x
i
[;
(2) L
1
(X, T, ), con |f|
1
=
_
X
[f[d;
(3) L
(X, T, ), con |f|
= supess
X
[f[;
(4) C
k
[a, b] (k N), con |f|
C
k
[a,b]
=
k
h=0
max
[a,b]
[f
(h)
[;
(5) AC[a, b], con |f|
AC[a,b]
= max
[a,b]
[f[ +
_
b
a
[f
t
(t)[dt;
(6) BV [a, b], con |f|
BV [a,b]
= sup
[a,b]
[f[ +T
b
a
(f).
Il seguente lemma caratterizza gli spazi normati che sono anche spazi di Ba-
nach, ossia fornisce un criterio per stabilire se una data norma rende completo
lo spazio X oppure no.
Lemma 7.1.2 Sia X uno spazio normato. Allora X è uno spazio di Ba-
nach se e solo se per ogni successione x
n
nN
X, per la quale risulti
n=0
|x
n
| < , esiste y X tale che la serie
n=0
x
n
converge a y in X,
ossia
lim
N
_
_
_
_
_
N
n=0
x
n
y
_
_
_
_
_
= 0.
Dimostrazione (=) Sia
n=0
|x
n
| < . Allora la successione delle
somme parziali
N
n=0
x
n
NN
è di Cauchy in X, dato che
_
_
_
_
_
N
n=M+1
x
n
_
_
_
_
_
n=M+1
|x
n
| N, M N con N > M;
poiche X è completo, tale successione convergerà ad un opportuno y X.
(=) Sia y
n
una successione di Cauchy in X: allora per ogni k N esiste
n
k
N (e non è restrittivo supporre n
k+1
> n
k
) tale che
|y
m
y
n
k
| < 2
k
m n
k
.
Poniamo
_
x
0
= y
n
0
x
k+1
= y
n
k+1
y
n
k
, k N;
180
allora x
k
kN
X e
k=0
|x
k
| = |y
n
0
| +
k=0
|y
n
k+1
y
n
k
| |y
n
0
| +
k=0
2
k
< .
Quindi, per ipotesi, esiste y X tale che
y
nm
=
m
k=0
x
k
y in X;
ma dato che y
n
è di Cauchy, lintera successione y
n
converge a y. Dunque
X è completo.
Ricordiamo che due norme | |, [ [ su uno spazio vettoriale X si dicono
equivalenti se esistono due costanti positive c
1
, c
2
tali che
c
1
[x[ |x| c
2
[x[ x X;
ciò accade se e solo se entrambe le norme inducono su X la stessa topologia
(esercizio 7.1.1). In generale, uno spazio può essere di Banach rispetto a due
norme diverse e non confrontabili; se però lo spazio vettoriale ha dimensione
nita, questo non può accadere, come mostra la proposizione che segue.
Proposizione 7.1.3 In uno spazio vettoriale nito-dimensionale X tutte le
norme sono fra loro equivalenti.
Dimostrazione Supponiamo che lo spazio vettoriale X sia reale, e sia
dimX = n. Scelta una base e
1
, . . . , e
n
di X, ogni z X si scrive in modo
unico come z =
n
i=1
z
i
e
i
, con z
i
R
n
. Quindi possiamo considerare su
X la norma
|z|
1
=
n
i=1
[z
i
[ z X
e su R
n
la norma
[z
i
[ =
n
i=1
[z
i
[ z
i
R
n
;
vi è una ovvia isometria bigettiva j : (X, | |
1
) (R
n
, [ [), data da j(z) =
z
i
per ogni z X.
Sia ora | | una norma qualunque su X. Per subadditività si trova subito
|z| =
_
_
_
_
_
n
i=1
z
i
e
i
_
_
_
_
_
i=1
[z
i
[|e
i
| M|z|
1
z X,
181
ove M = max
1in
|e
i
|.
Daltra parte, consideriamo la funzione
f : X R, f(z) = |z| z X;
essa è continua, quindi f j
1
è continua da R
n
in R e positiva su R
n
0.
Pertanto f j
1
ha minimo m > 0 sul compatto = z
i
R
n
: [z
i
[ = 1.
Per omogeneità si ricava allora, posto z = j
1
(z
i
),
|z| = f j
1
(z
i
) m[z
i
[ = m[j(z)[ z
i
R
n
,
ossia
|z| m|z|
1
z X.
Ne segue che la generica norma | | è equivalente a | |
1
. Il discorso è
esattamente lo stesso se lo spazio X è complesso.
Esercizi 7.1
1. Dimostrare che due norme su uno spazio vettoriale X sono equivalenti
se e solo se esse inducono su X la stessa topologia.
2. Si provi che in BV [a, b] le tre norme
|f|
BV
= sup
[a,b]
[f[ +T
b
a
(f), |f|
1
= |f|
+T
b
a
(f), |f|
2
= [f(a)[ +T
b
a
(f)
sono fra loro equivalenti.
3. Si provi che C
0
[a, b] è uno spazio normato con |f|
1
=
_
b
a
[f(t)[dt.
`
E
completo?
4. Provare che in C
0
[a, b] le due norme |f|
e |f|
1
non sono equivalenti.
5. Poniamo
= x = x
n
nN
R : x
n
è limitata,
c
0
= x = x
n
nN
R : x
n
è innitesima,
c
00
= x = x
n
nN
R : x
n
è denitivamente nulla.
Provare che |x|
= sup
n
[x
n
[ è una norma in questi tre spazi; mostrare
poi che i primi due sono spazi di Banach, ed il terzo no.
182
6. Fissato ]0, 1[, si consideri linsieme delle funzioni -holderiane su
[a, b], cioè
C
[a, b] =
_
f C
0
[a, b] : [f]
= sup
x,=y
[f(x) f(y)[
[x y[
<
_
.
(i) Si verichi che C
[a, b] è un sottospazio denso in C

0
[a, b].
(ii) Si dimostri che
|f|
= |f|
+ [f]
è una norma in C
[a, b] che rende tale spazio uno spazio di Banach.

(iii) Posto g
r
(x) = [x r[
, si mostri che g
r
C
[a, b].
(iv) Si provi che
[g
r
g
s
]
2 r, s [a, b],
e se ne deduca che C
[a, b] non è separabile (uno spazio topologico

X si dice separabile se esiste un sottoinsieme numerabile D denso
in X).
7.2 Prodotti scalari
Una particolare categoria di spazi normati è costituita da quegli spazi in cui
la norma è generata da un prodotto scalare. Questa circostanza rende tali
spazi particolarmente ricchi di proprietà geometriche simili a quelle di R
N
.
Denizione 7.2.1 Sia H uno spazio vettoriale complesso. Un prodotto
scalare è una applicazione (, ) : H H C con le seguenti proprietà:
(i) (x, x) è reale non negativo, e (x, x) = 0 se e solo se x = 0;
(ii) (x, y) = (y, x) per ogni x, y H;
(iii) x (x, y) è lineare per ogni ssato y H.
Da (ii) e (iii) segue che y (x, y) è antilineare, ossia
(x, y +w) = (x, y) +(x, w) , C, x, y, w H.
Lo spazio H, munito di un prodotto scalare, si dice spazio con prodotto scalare
o spazio pre-hilbertiano. Nel caso in cui H sia uno spazio vettoriale reale, la
183
denizione è perfettamente analoga: spariscono i complessi coniugati ed il
prodotto scalare risulta lineare nei suoi due argomenti.
Per mostrare che ogni prodotto scalare genera una norma, è fondamentale la
seguente proprietà:
Proposizione 7.2.2 (Disuguaglianza di Cauchy-Schwarz) Sia H uno
spazio con prodotto scalare (, ). Allora
[(x, y)[ (x, x)
1/2
(y, y)
1/2
x, y H.
Dimostrazione Siano x, y H. Se x = 0 la tesi è banale perche i due
membri della disuguaglianza sono nulli. Sia allora x ,= 0 cosicche (x, x) > 0.
Per ogni C abbiamo
0 (x +y, x +y) = [[
2
(x, x) +(x, y) +(y, x) + (y, y) =
= [[
2
(x, x) + 2Re ((x, y)) + (y, y),
e scegliendo
=
(x, y)
(x, x)
si ricava
0
[(x, y)[
2
(x, x)
+ (y, y),
che è la tesi.
Corollario 7.2.3 Sia H uno spazio con prodotto scalare (, ). Allora
|x| =
_
(x, x)
è una norma su H, che è detta indotta dal prodotto scalare.
Dimostrazione Le prime due proprietà della denizione 7.1.1 sono evidenti.
Verichiamo la subadditività: per la disuguaglianza di Cauchy-Schwarz si ha
|x +y|
2
= (x +y, x +y) = (x, x) + 2Re(x, y) + (y, y) =
= |x|
2
+ 2Re(x, y) +|y|
2
|x|
2
+ 2|x| |y| +|y|
2
=
= (|x| +|y|)
2
.
Uno spazio con prodotto scalare è dunque anche uno spazio normato.
184
Denizione 7.2.4 Uno spazio con prodotto scalare si dice spazio di Hilbert
se è completo rispetto alla norma indotta.
Osservazione 7.2.5 Il prodotto scalare è continuo rispetto alla norma in-
dotta: infatti per ogni x, x
0
, y, y
0
H si ha la stima
[(x, y) (x
0
, y
0
)[ = [(x x
0
, y y
0
) + (x x
0
, y
0
) + (x
0
, y y
0
)[
|x x
0
| |y y
0
| +|x x
0
| |y
0
| +|x
0
| |y y
0
|,
e quindi (x, y) (x
0
, y
0
) per |x x
0
| 0 e |y y
0
| 0.
Esempi 7.2.6 (1) C
N
è uno spazio di Hilbert su C col prodotto scalare
usuale
(x, y) =
N
i=1
x
i
y
i
x, y C
N
,
che induce la norma euclidea
|x| =
_
N
i=1
[x
i
[
2
;
la restrizione a R
N
R
N
di questo prodotto scalare rende R
N
uno spazio di
Hilbert su R col prodotto scalare
(x, y) =
N
i=1
x
i
y
i
x, y R
N
,
il quale induce la stessa norma.
(2) Lo spazio C
0
[a, b], con il prodotto scalare
(f, g) =
_
b
a
f(t)g(t) dt f, g C
0
[a, b],
è uno spazio pre-hilbertiano, ma non di Hilbert: ad esempio, le funzioni
f
n
(x) =
_
_
0 se a x
a+b
2

1
n
n
2
_
x
a+b
2
+
1
n
_
se
x
a+b
2
<
1
n
1 se
a+b
2
+
1
n
x b
185
convergono nella norma indotta, cioè
|f| =
_
b
a
[f(t)[
2
dt ,
alla funzione discontinua
[
a+b
2
,b]
, quindi formano una successione di Cauchy
che non converge nello spazio (C
0
[a, b], | |).
(3) In un arbitrario spazio misurato (X, T, ) consideriamo lo spazio /
2
(X)
delle funzioni misurabili tali che [f[
2
è sommabile su X; indichiamo con L
2
(X)
lo spazio quoziente rispetto alla solita relazione di equivalenza che identica
le funzioni q.o. coincidenti. L
2
(X) è uno spazio di Hilbert con il prodot-
to scalare dellesempio precedente. La dimostrazione della completezza di
questo spazio rispetto alla norma indotta ricalca quella della completezza di
L
1
(X) (teorema 4.6.2), e per essa si rimanda allesercizio 7.2.1.
(4) Prendendo tutte le funzioni complesse f tali che Ref e Imf sono misu-
rabili, e denendo lintegrale di f come
_
X
f d =
_
X
Re f d +i
_
X
Imf d,
possiamo considerare, sullo spazio L
2
(X, C) delle funzioni di quadrato som-
mabile a valori complessi, il prodotto scalare
(f, g) =
_
X
fg d f, g L
2
(X, C);
esso induce la stessa norma di prima, la quale risulta ancora completa.
Tramite il prodotto scalare si può dare la nozione di ortogonalità.
Denizione 7.2.7 Sia H uno spazio con prodotto scalare. Due elementi
x, y H sono fra loro ortogonali, e scriviamo x y, se risulta (x, y) = 0.
Proposizione 7.2.8 (teorema di Pitagora) Sia H uno spazio con pro-
dotto scalare, e siano x, y H con x y. Allora se H è reale
|x +y|
2
= |x y|
2
= |x|
2
+|y|
2
,
mentre se H è complesso
|x +y|
2
= |x y|
2
= |x +iy|
2
= |x iy|
2
= |x|
2
+|y|
2
.
186
Dimostrazione Supponiamo H complesso. Allora
|x y|
2
= |x|
2
2Re(x, y) +|y|
2
= |x|
2
+|y|
2
,
|xiy|
2
= |x|
2
2Re(x, iy)+|y|
2
= |x|
2
2Im(x, y)+|y|
2
= |x|
2
+|y|
2
.
Il caso H reale è compreso nel precedente.
Dato un qualunque spazio normato, come si fa a riconoscere se la norma è
indotta da un prodotto scalare? La risposta è nella seguente
Proposizione 7.2.9 Sia X uno spazio normato. La norma di X è hilber-
tiana, ossia è indotta da un prodotto scalare, se e solo se vale l identità del
parallelogrammo:
|x +y|
2
+|x y|
2
= 2|x|
2
+ 2|y|
2
x, y H.
In tal caso, il prodotto scalare è dato da
(x, y) =
1
4
_
|x +y|
2
|x y|
2
_
se H è reale, e da
(x, y) =
1
4
__
|x +y|
2
|x y|
2
_
+i
_
|x +iy|
2
|x iy|
2
_
se H è complesso.
Dimostrazione (=) Si tratta di unovvia verica.
(=) Si tratta di vericare che le espressioni sopra scritte soddisfano le ri-
chieste della denizione 7.2.1: la cosa è facile ma noiosa e per essa rimandiamo
allesercizio 7.2.2.
Esercizi 7.2
1. Sia (X, T, ) uno spazio misurato. Si dimostri che L
2
(X, T, ) è uno
spazio di Hilbert.
[Traccia: si ripeta, con le dovute modiche, la dimostrazione del
teorema 4.6.2.]
187
2. Dimostrare che se nello spazio normato (X, | |) è vera lidentità del
parallelogrammo, allora la norma | | è indotta da uno dei prodotti
scalari introdotti nella proposizione 7.2.9.
[Traccia: se X è reale, si provi dapprima che dallipotesi segue
(2x, y) + (2x
t
, y) = 2(x + x
t
, y), da cui, se x
t
= 0, (2x, y) = 2(x, y).
Se ne deduca, per induzione, che (nx, y) = n(x, y) per ogni n N e
poi che (x, y) = (x, y) per ogni Q; si usi, poi, la continuità della
norma. Lestensione al caso X complesso è facile.]
3. Si deniscano
1
=
_
x = x
n
nN
:
n=0
[x
n
[ <
_
, |x|
1
=
n=0
[x
n
[,
2
=
_
x = x
n
nN
:
n=0
[x
n
[
2
<
_
, |x|
2
=
n=0
[x
n
[
2
.
Si provi che
1
e
2
sono spazi di Banach, e che il secondo è uno spazio
di Hilbert mentre il primo no. Si provi inoltre che questi due spazi sono
separabili (v. esercizio 7.1.6).
4. Si dimostri che (C
0
[a, b], | |
) non è uno spazio di Hilbert.

5. Si provi che f AC[a, b] : f
t
L
2
(a, b) è uno spazio di Hilbert con
il prodotto scalare
(f, g)
AC
=
_
b
a
[f(t)g(t) +f
t
(t)g
t
(t)]dm.
6. Sia H uno spazio con prodotto scalare. Se x
n
, y
n
H sono due
successioni tali che |x
n
| 1, |y
n
| 1 e (x
n
, y
n
) 1, si provi che
|x
n
y
n
| 0.
7. Sia H uno spazio con prodotto scalare. Si provi che:
(i) se x, y ,= 0, allora |x +y| = |x| +|y| se e solo se esiste > 0 tale
che x = y;
188
(ii) si ha x y se e solo se |x + y| = |x y| per ogni C, ed
anche se e solo se |x +y| |x| per ogni C.
8. Sia H uno spazio con prodotto scalare. Si provi che per ogni x, y, z, w
H vale la disuguaglianza
|x y| |z w| |x z| |y w| +|x w| |y z|.
[Traccia: Si osservi anzitutto che si può supporre w = 0. Se a primo
membro cè Re(x y, z), la disuguaglianza è facile. Fissato u H,
si scelga z = e
i
u con R tale che (x y, z) = |x y| |u| =
|x y| |z|...]
9. Sia f L
1
(a, b). Si provi che f L
2
(a, b) se e solo se esiste una
funzione g AC[a, b] tale che
__
y
x
f(t)dt
_
2
[g(x) g(y)](x y) x, y [a, b].
[Traccia: per limplicazione (=), provare preliminarmente che le
funzioni costanti a tratti sono dense in L
2
(a, b), ed utilizzare poi questo
fatto e la disuguaglianza di Cauchy-Schwarz.]
7.3 Operatori lineari e continui
Siano X, Y spazi normati. Le pi` u importanti fra le applicazioni da X in Y
sono quelle che rispettano la struttura lineare degli insiemi di partenza e di
arrivo, ossia sono le applicazioni lineari. Ad esse è dedicato questo paragrafo.
Denizione 7.3.1 Unapplicazione F : X Y è detta operatore lineare se
si ha F(x + x
t
) = F(x) + F(x
t
) per ogni x, x
t
X e per ogni , R
(oppure per ogni , C).
Per gli operatori lineari si usa la scrittura Fx in luogo di F(x).
Denizione 7.3.2 Un operatore lineare F : X Y si dice limitato se esiste
M 0 tale che |Fx|
Y
M|x|
X
per ogni x X.
Dunque, se F : X Y è un operatore lineare e limitato, risulta
sup
x,=0
|Fx|
Y
|x|
X
< +;
189
si noti che, a causa della linearità,
sup
x,=0
|Fx|
Y
|x|
X
= sup
|u|
X
=1
|Fu|
Y
= sup
|v|
X
1
|Fv|
Y
,
ed in particolare un operatore lineare è limitato se e solo se esso è una funzione
limitata (in norma) sulla palla unitaria di X (ossia linsieme
B = u X : |u|
X
1).
Linsieme degli operatori lineari limitati da X in Y ha unovvia struttura di
spazio vettoriale e si indica con /(X, Y ); se X = Y si scrive /(X) anziche
/(X, X).
Per gli operatori lineari fra spazi normati, la condizione di limitatezza
equivale alla continuità. Si ha infatti:
Proposizione 7.3.3 Siano X, Y spazi normati e sia F : X Y un opera-
tore lineare. Sono fatti equivalenti:
(i) F è limitato;
(ii) esiste x
0
X tale che F è continuo nel punto x
0
;
(iii) F è lipschitziano, cioè esiste K 0 tale che
|Fx Fx
t
|
Y
K|x x
t
|
X
x, x
t
X.
Dimostrazione (i) = (iii) Per ipotesi esiste M 0 tale che
|Fx|
Y
M|x|
X
x X;
grazie alla linearità si deduce
|Fx Fx
t
|
Y
= |F(x x
t
)|
Y
M|x x
t
|
X
x, x
t
X.
(iii) = (ii) Evidente.
(ii) = (i) Per ipotesi, per ogni > 0 esiste > 0 tale che
|x x
0
|
X
= |Fx Fx
0
|
Y
.
190
Sia z X0 (si noti che se X = 0, allora per linearità deve essere F = 0
e quindi la tesi è ovvia). Posto w = z/|z|
X
, si ha
|z|
X
Fz = Fw = F(w +x
0
) Fx
0
,
e poiche |(w +x
0
) x
0
|
X
= |w|
X
= , si ha |Fw|
Y
. Pertanto
|Fz|
Y
=
|z|
X
|Fw|
Y

|z|
X
z X 0.
Dato che per z = 0 la stima precedente è ovvia, si conclude che F è limitato.
Lo spazio vettoriale /(X, Y ) diventa uno spazio normato con la norma
|F|
/(X,Y )
= sup
x,=0
|Fx|
Y
|x|
X
(le veriche sono immediate).
Teorema 7.3.4 Siano X, Y spazi normati. Se Y è uno spazio di Banach,
allora /(X, Y ) è uno spazio di Banach.
Dimostrazione Sia F
n
una successione di Cauchy in /(X, Y ): ciò signi-
ca che per ogni > 0 esiste N tale che |F
n
F
m
|
/(X,Y )
< per ogni
n, m ; quindi
|F
n
x F
m
x|
Y
< |x|
X
x X, n, m .
In particolare, per ogni ssato x X la successione F
n
x è di Cauchy in Y ;
poiche Y è completo, essa ha limite, per ogni ssato x X, nella norma di
Y . Chiamiamo F(x) tale limite: è immediato vericare che lapplicazione F
cos` denita è lineare da X in Y . Inoltre per ogni x X si ha
|Fx|
Y
= lim
n
|F
n
x|
Y
liminf
n
_
|F
n
F
|
/(X,Y )
|x|
X
+|F
x|
Y
_
+|F
|
/(X,Y )
|x|
X
,
cosicche F è un operatore limitato. Inne, se x X con |x|
X
= 1 si ha
|F
n
xFx|
Y
= lim
m
|F
n
xF
m
x|
Y
liminf
n
|F
n
F
m
|
/(X,Y )
n ,
da cui F
n
F in /(X, Y ).
Vale anche il viceversa di questo teorema, salvo casi patologici: si veda
lesercizio 7.3.9.
191
Denizione 7.3.5 Il duale di uno spazio normato X è lo spazio /(X, R)
(oppure /(X, C), se X è complesso); esso si denota con X
. Gli elementi
del duale X
di X si dicono funzionali lineari e limitati su X (ovvero lineari

e continui, per la proposizione 7.3.3).
Osserviamo che, essendo R e C completi, X
è uno spazio di Banach per ogni

spazio normato X. Vediamo qualche esempio.
Esempi 7.3.6 (1) Se X = R
N
, il duale (R
N
)
è isomorfo ed isometrico a
R
N
. Infatti ogni funzionale lineare F su R
N
è completamente caratterizzato
dai valori Fe
1
, . . . , Fe
N
assunti nei vettori della base canonica e
1
, . . . , e
N
;
posto allora a = (Fe
1
, . . . , Fe
N
), lelemento a R
N
cos` denito è tale che
Fx =
N
i=1
x
i
a
i
= (x, a)
R
N, e si ha anche |F|
(R
N
)
= |a|
R
N (poiche per la
disuguaglianza di Cauchy-Schwarz risulta [Fx[ = [(x, a)
R
N[ |x|
R
N|a|
R
N e
per x = a vale luguaglianza).
(2) Se X = C
N
, il duale (C
N
)
è isomorfo ed isometrico a C
N
(stesso discor-
so, solo che stavolta i numeri a
i
= Fe
i
sono complessi anziche reali).
(3) Sia (X, T, ) uno spazio misurato. Per ogni ssata f L
1
(X), il
funzionale
Fg =
_
X
fg d, g L
(X),
è ovviamente lineare; inoltre risulta
[Fg[
_
X
[fg[d |f|
1
|g|
g L
(X),
quindi F è continuo, cioè è un elemento di (L
(X))
, e si ha |F| |f|
1
.
Proviamo che vale luguaglianza: ciò è evidente quando f = 0; altrimenti, se
scegliamo
g(x) =
_
0 se f(x) = 0
f(x)
[f(x)[
se f(x) ,= 0,
otteniamo |g|
= 1 e quindi
[Fg[ =
_
X
fg d
=
_
X
[f[d = |f|
1
|g|
.
Si ha dunque limmersione isometrica i : L
1
(X) (L
(X))
, denita da
i(f) = F; come vedremo, questa immersione non è surgettiva.
192
(4) Sia (X, T, ) uno spazio misurato -nito. Per ogni ssata f L
(X),
consideriamo ancora il funzionale F dellesempio precedente, o pi` u precisa-
mente
Fg =
_
X
fg d, g L
1
(X).
Il calcolo fatto sopra mostra che F (L
1
(X))
e che |F| |f|
. Per
provare luguaglianza, supposto f ,= 0 (altrimenti è tutto ovvio) e dato > 0,
si sfrutti la -nitezza di X per scegliere un insieme A T con 0 < (A) <
tale che
[f(x)[ > |f|
x A;
allora, scelta g =
f
[f[
A
, risulta
[Fg[ =
_
X
fg d
=
_
A
[f[d > (|f|
)(A) = (|f|
)|g|
1
,
cosicche
|F| |f|
> 0,
e dunque |F| = |f|
. Quindi si ha limmersione isometrica i : L
(X)
(L
1
(X))
, denita da i(f) = F; vedremo nel seguito che tale isometria è

surgettiva e che dunque, se la misura è -nita, il duale di L
1
(X) è isomorfo
a L
(X). Se manca la -nitezza, questo risultato è in generale falso (esercizi

7.3.7 e 7.3.8).
Esercizi 7.3
1. Provare che se X è uno spazio normato nito-dimensionale, allora X è
completo ed ogni funzionale lineare F : X R è continuo.
2. Siano X, Y, Z spazi normati; provare che se A /(X, Y ) e B /(Y, Z),
allora B A /(X, Z) e
|B A|
/(X,Z)
|A|
/(X,Y )
|B|
/(Y,Z)
.
3. Sia T : C
0
[0, 1] C
0
[0, 1] denito da
Tf(x) =
x
1 +x
2
f(x), x [0, 1], f C
0
[0, 1].
(i) Si calcoli la norma di T.
193
(ii) Si determini limmagine R(T) C
0
[0, 1].
(iii) Si verichi che T è iniettivo.
(iv) Si provi che T
1
: R(T) C
0
[0, 1] non è limitato.
4. Posto
T : C
0
[0, 1] C
0
[0, 1], Tf(x) =
_
x
0
(x s)f(s)ds, x [0, 1],
si provi che T è continuo, se ne calcoli la norma e se ne determini
limmagine R(T).
5. Si consideri loperatore F denito per ogni g L
(R) da
Fg(x) =
1
2x
_
x
x
g(t) dt, x R 0.
(i) Si provi che F /(L
(R)) con norma uguale a 1.

(ii) Si determini il nucleo di F, ossia linsieme ker F = g L
(R) :
Fg = 0.
(iii) Si caratterizzi R(F).
(iv) Per quali g L
(R) si ha Fg C
0
(R)?
6. Si denisca
Af =
_
R
f(t) t e
[t[
dt.
Si provi che il funzionale A è limitato su L
2
(R), su L
1
(R) e su L
(R),
e se ne calcoli la norma in tutti e tre i casi.
7. Siano X = [0, 1], T = E [0, 1] : E, oppure E
c
, è numerabile, =
misura cardinalità. Si provi che:
(i) per ogni f L
1
(X) la funzione x xf(x) appartiene a L
1
(X);
(ii) il funzionale F, denito da Ff =
_
1
0
xf(x) d per ogni f L
1
(X),
è un elemento di (L
1
(X))
;
(iii) non esiste alcuna g L
(X) per cui si abbia

Ff =
_
1
0
fg d f L
1
(X).
194
8. Sia (X, T, ) lo spazio misurato dellesempio 2.1.3 (8). Si provi che se
f L
(X) e |f|
> 0, allora il funzionale

Fg =
_
X
fg d, g L
1
(X),
appartiene a (L
1
(X))
ma |F|
(L
1
(X))
< |f|
.
9. Siano X, Y spazi normati, e si supponga che X
,= 0. Si provi che se
/(X, Y ) è completo, allora Y è completo.
[Traccia: se y
n
è una successione di Cauchy in Y , si ssi G
X
0 e si denisca F
n
x = Gxy
n
. Osserviamo che lipotesi X
,= 0
può essere sostituita dalla condizione pi` u naturale X ,= 0; ciò seguirà
dal teorema di Hahn-Banach (teorema 10.1.3).]
10. Siano X, Y spazi di Banach. Si verichi che X Y è uno spazio di
Banach con la norma
[[(x, y)[[
XY
= [[x[[
X
+[[y[[
Y
,
e si provi che (X Y )
è isomorfo a X
.
11. Si denisca
Fx =
n=0
x
n
n!
x = x
n
c
0
(lo spazio c
0
è denito nellesercizio 7.1.5). Si provi che F c
0
, se ne
calcoli la norma e si verichi che |F|
c
0
non è un massimo.
12. Sia a = a
n

. Poniamo
A :
1

1
, (Ax)
n
= a
n
x
n
n N
(lo spazio
1
è denito nellesercizio 7.2.3). Si provi che:
(i) |A|
/(
1
)
= |a|
;
(ii) A è iniettivo se e solo se a
n
,= 0 per ogni n N;
(iii) A è surgettivo e A
1
è continuo se e solo se inf
n
[a
n
[ > 0.
195
13. Sia T : L
1
(R
2
) L
1
(R) denito da
Tf(x) =
_
R
f(x, y)dy f L
1
(R
2
).
Si provi che T è ben denito ed appartiene a /(L
1
(R
2
), L
1
(R)), e se ne
calcoli la norma.
14. Sia X uno spazio di Banach, sia F X
0. Posto M = x X :
Fx = 1, si provi che
dist(0, M) =
1
|F|
X
.
15. Sia X uno spazio normato e sia A : X X un operatore lineare
tale che Ax
n
sia una successione limitata in X per ogni successione
x
n
X innitesima in norma. Si provi che A è continuo.
16. Sia H uno spazio di Hilbert e sia A /(H) tale che (Ax, x) = 0 per
ogni x H. Si provi che se H è complesso allora A = 0, mentre se H
è reale ciò non è detto in generale.
17. Siano X, Y spazi di Banach, sia A
n
/(X, Y ) una successione di
operatori tali che
lim
n
A
n
x in Y x E,
ove E è un sottoinsieme denso in X. Provare che se esiste M > 0 tale
che |A
n
|
/(X,Y )
M per ogni n N, allora
lim
n
A
n
x in Y x X,
mentre la cosa è in generale falsa senza lipotesi |A
n
|
/(X,Y )
M.
18. Sia X uno spazio di Banach, sia A /(X).
(i) Provare che la serie
n=0
t
n
n!
A
n
, t R, ove A
0
= I, A
n
= AA A (n volte),
196
converge in /(X), e che quindi per ogni t R loperatore
T(t)x =
n=0
t
n
n!
A
n
x, x X,
è lineare e continuo su X con
|T(t)|
/(X)
e
[t[|A|
L(X)
t R.
(ii) Vericare la legge di gruppo
T(0) = I, T(t +s) = T(t) T(s) t, s R.
(iii) Dimostrare che per ogni t R risulta
lim
h0
T(t +h) T(t)
h
= A T(t) in /(X).
(Loperatore T(t) si chiama esponenziale delloperatore A e si
indica con e
tA
.)
19. Sia X uno spazio di Banach, sia F /(X) tale che |F|
/(X)
< 1. Si
provi che I F è invertibile con inversa continua, e che
(I F)
1
=
n=0
F
n
, |(I F)
1
|
/(X)

1
1 |F|
/(X)
,
ove F
n
= F F F (n volte).
20. Sia X uno spazio di Banach. Si provi che linsieme E = F /(X) :
F
1
/(X) è aperto in /(X).
[Traccia: se F E, si scriva G = F(I+F
1
(GF)) e si osservi che
esiste > 0 tale che se |GF|
/(X)
< , allora |F
1
(GF)|
/(X)
< 1;
quindi si può applicare lesercizio precedente.]
21. Si provi che c
0
1
(esercizi 7.1.5 e 7.2.3).
22. Si provi che (
1
)
.
23. Per ogni n N si consideri il funzionale T
n
denito da
T
n
f =
_
n
0
f(t) arctan nt dt, f L
1
(0, ).
197
(i) Si provi che T
n
(L
1
(0, ))
e se ne calcoli la norma.
(ii) Si dimostri che esiste T (L
1
(0, ))
tale che
lim
n
T
n
f = Tf f L
1
(0, ).
(iii) Si dica se T
n
converge a T in (L
1
(0, ))
per n .
24. Sia T :
loperatore lineare denito da

(Tx)
n
= x
2n
, n N.
(i) Si provi che per ogni k N
+
loperatore T
k
è continuo e surgettivo,
e se ne calcoli la norma.
(ii) Si descriva esplicitamente il sottospazio
ker T
k
= x
: T
k
x = 0.
(iii) Si determini la chiusura di
k=1
ker T
k
in
.
(iv) Si consideri la restrizione di T a
1
, si verichi che tale restrizione
manda
1
in
1
e si risponda nuovamente ai tre quesiti precedenti.
198
Capitolo 8
Spazi di Hilbert
8.1 Proiezioni su convessi chiusi
Abbiamo già visto nel paragrafo 7.2 alcuni aspetti della geometria degli spazi
dotati di prodotto scalare. Se lo spazio è anche completo rispetto alla norma
indotta, le analogie fra le sue proprietà e quelle caratteristiche di R
N
sono
ancora pi` u strette ed interessanti.
Sia dunque H uno spazio di Hilbert. Per ssare le idee, supporremo H com-
plesso; le modiche da fare agli enunciati nel caso di H reale sono evidenti.
In questo paragrafo consideriamo i sottoinsiemi convessi e chiusi di H, i qua-
li possiedono speciali proprietà. Notiamo che in questa classe rientrano in
particolare i sottospazi chiusi di H.
Proposizione 8.1.1 Sia K un sottoinsieme convesso, chiuso e non vuoto di
uno spazio di Hilbert H. Allora per ogni y H esiste uno ed un solo x
0
K
tale che
|y x
0
| = min
xK
|y x|.
Tale elemento si chiama proiezione di y sul convesso K e si indica con P
K
(y).
Dimostrazione Sia = inf
xK
|y x|: ovviamente 0. Se = 0,
allora y K = K, quindi si ha la tesi con x
0
= y (e tale x
0
è unico). Sia
dunque > 0: in tal caso possiamo costruire una successione x
n
K
tale che |y x
n
| < +
1
n
per ogni n N
+
. Applichiamo lidentità
del parallelogrammo (proposizione 7.2.9) ai vettori
xny
2
,
xmy
2
: dato che
199
xn+xm
2
K, si trova
_
_
_
_
x
n
x
m
2
_
_
_
_
2
=
_
_
_
_
x
n
+x
m
2
y
_
_
_
_
2
+ 2
_
_
_
_
x
n
y
2
_
_
_
_
2
+ 2
_
_
_
_
x
m
y
2
_
_
_
_
2

2
+
1
2
_
|x
n
y|
2
+|x
m
y|
2
,
e lultimo membro tende a 0 per n, m . Perciò x
n
è una successione
di Cauchy in H, la quale dunque converge in H ad un elemento x
0
K (in
quanto H è completo e K è chiuso). Se ne deduce
= lim
n
|y x
n
| = |y x
0
|,
cosicche è un minimo.
Proviamo lunicità del punto di minimo. Se x è un altro punto di minimo
in K, applicando lidentità del parallelogrammo ai vettori
x
0
y
2
,
xy
2
si trova,
essendo
x
0
+x
2
K e |x
0
y| = |x y| = ,
_
_
_
_
x
0
x
2
_
_
_
_
2
=
_
_
_
_
x
0
+x
2
y
_
_
_
_
2
+ 2
_
_
_
_
x
0
y
2
_
_
_
_
2
+ 2
_
_
_
_
x y
2
_
_
_
_
2

2
+
1
2
_
2
+
2
,
cioè x = x
0
.
Osservazioni 8.1.2 (1) Se il convesso K non è un sottospazio, loperatore
di proiezione P
K
non è lineare: ad esempio, se 0 / K si ha P
K
(0) ,= 0.
(2) Se x
0
K, allora ovviamente P
K
(x
0
) = x
0
; ciò mostra che limmagine
di P
K
è esattamente uguale al convesso K.
La proprietà di minimalità della proiezione su un convesso si traduce nella
seguente caratterizzazione:
Proposizione 8.1.3 Sia H uno spazio di Hilbert, sia K H un convesso
chiuso e non vuoto e siano y, x
0
H. Risulta x
0
= P
K
(y) se e solo se x
0
verica la seguente disequazione variazionale:
_
x
0
K
Re(y x
0
, x x
0
) 0 x K.
200
Dimostrazione Osserviamo preliminarmente che per ogni x H si ha
|yx|
2
= |(yx
0
)(xx
0
)|
2
= |yx
0
|
2
2Re(yx
0
, xx
0
)+|xx
0
|
2
,
da cui
|y x
0
|
2
|y x|
2
= 2Re(y x
0
, x x
0
) |x x
0
|
2
x H.
Ci` o premesso, supponiamo che x
0
verichi la disequazione variazionale; allora
da questa e dalla relazione precedente si ottiene
|y x
0
|
2
|y x|
2
0 x K,
e dato che x
0
K si deduce che x
0
= P
K
(y).
Supponiamo viceversa che x
0
= P
K
(y); allora per denizione x
0
K e
|y x
0
|
2
|y x|
2
0 x K,
cosicche, tenendo conto della relazione dimostrata allinizio, si ricava
2Re(y x
0
, x x
0
) |x x
0
|
2
x K.
Ora, ssato x K, poniamo v = (1 t)x
0
+ tx, con t ]0, 1]. Poiche K è
convesso, si ha v K, e sostituendo v al posto di x si ottiene
2Re(y x
0
, t(x x
0
)) t
2
|x x
0
|
2
x K, t ]0, 1].
Quindi, dividendo per t,
2Re(y x
0
, x x
0
) t|x x
0
|
2
x K, t ]0, 1],
e nalmente al limite per t 0
+
si ottiene che x
0
verica la disequazione
variazionale.
Corollario 8.1.4 Sia K un convesso chiuso non vuoto di uno spazio di Hil-
bert H. Allora la proiezione P
K
è un operatore lipschitziano; pi` u precisa-
mente si ha
|P
K
(y) P
K
(z)| |y z| y, z H.
201
Dimostrazione Poniamo u = P
K
(y), v = P
K
(z). Per la proposizione 8.1.3
si ha
_
u K
Re(y u, x u) 0 x K,
_
v K
Re(z v, x v) 0 x K.
Sostituiamo x = v nella prima disequazione e x = u nella seconda: si ottiene
Re(y u, v u) 0, Re(v z, v u) 0.
Sommando le due relazioni abbiamo
Re(y u +v z, v u) = Re(y z, v u) +|v u|
2
0,
da cui
|v u|
2
Re(z y, v u) |z y| |v u|.
Se |v u| = 0, la tesi è ovvia; altrimenti, semplicando, si trova
|v u| |z y|
che è la tesi.
Dunque loperatore non lineare P
K
è lipschitziano su H, con costante di Lip-
schitz non superiore a 1 (in eetti la costante è esattamente 1 se K contiene
almeno due punti distinti, in quanto P
K
(y) = y per ogni y K). Nel caso
particolare in cui K è un sottospazio chiuso, vedremo che la proiezione P
K
risulta lineare, ed avrà lo stesso signicato geometrico di proiezione ortogo-
nale che conosciamo nel caso di R
N
. Per illustrare questi fatti, premettiamo
la seguente
Denizione 8.1.5 Sia S un sottoinsieme non vuoto di uno spazio di Hilbert
H. L ortogonale di S è linsieme
S
= x H : (x, y) = 0 y S.
Notiamo che, a causa della linearità e della continuità del prodotto scalare,
S
è un sottospazio chiuso di H, comunque sia fatto linsieme S. Inoltre si

ha
S S
=
_
se 0 / S
0 se 0 S :
infatti se x S S
allora (x, x) = 0 e quindi x = 0.

La linearità della proiezione su un sottospazio chiuso è conseguenza del
seguente risultato:
202
Teorema 8.1.6 (delle proiezioni) Sia H uno spazio di Hilbert, sia M un
sottospazio chiuso di H. Allora esiste ununica coppia di operatori P, Q :
H H tali che:
(i) R(P) = M e R(Q) = M
;
(ii) x = Px +Qx per ogni x H;
(iii) x = Px per ogni x M, x = Qx per ogni x M
;
(iv) P e Q sono operatori lineari e continui;
(v) se M ,= 0 allora |P|
/(H)
= 1, e se M ,= H allora |Q|
/(H)
= 1.
Gli operatori P, Q si chiamano proiezioni ortogonali su M e su M
rispetti-
vamente.
Ricordiamo che R(P), R(Q) sono le immagini degli operatori P, Q.
Dimostrazione (i) Poniamo
P(x) = P
M
(x), Q(x) = x P
M
(x) x H :
questa denizione è lecita dato che M è un convesso chiuso non vuoto. Poiche
P
M
(x) M per ogni x H e P
M
(x) = x per ogni x M, si ha R(P) = M;
inoltre per la proposizione 8.1.3 risulta per ogni x H
Re(x P(x), z P(x)) 0 z M.
Poiche M è un sottospazio, possiamo scegliere z = P(x) v, con v M,
ottenendo
Re(x P(x), v) 0 v M, x H,
e dunque
Re(x P(x), v) = 0 v M, x H.
Sostituendo poi in questa relazione iv al posto di v, troviamo anche
Im(x P(x), v) = Re(x P(x), iv) = 0 v M, x H :
ne segue
(x P(x), v) = 0 v M, x H,
203
ossia Q(x) = xP(x) M
per ogni x H; in particolare se x M
questa
relazione implica (P(x), v) = 0 per ogni v M, da cui P(x) MM
ossia
P(x) = 0. Ciò prova che Q(x) = x per ogni x M
e pertanto R(Q) = M
.
Ci` o prova (i).
(ii) Evidente per denizione di P e Q.
(iii) Se x M, allora x = P
M
(x) = P(x), mentre se x M
si ha, come si
è visto, Q(x) = x.
(iv) Se x, y H e , C, si ha da (ii)
x = P(x) +Q(x), y = P(y) +Q(y),
x +y = P(x +y) +Q(x +y),
da cui, sommando,
P(x) +Q(x) +P(y) +Q(y) = x +y = P(x +y) +Q(x +y),
cioè
P(x) +P(y) P(x +y) = Q(x) Q(y) +Q(x +y).
Ricordando (i), in questa relazione il primo membro appartiene a M ed
il secondo membro appartiene a M
; essa perciò denisce un elemento di

M M
= 0. Dunque entrambi i membri sono nulli e questo prova la

linearità di P e Q (in particolare, quindi, le proiezioni su sottospazi chiusi
sono lineari). Inoltre, poiche Px Qx per ogni x H, dal teorema di
Pitagora (proposizione 7.2.8) segue
|Px|
2
+|Qx|
2
= |x|
2
x H,
il che mostra che P, Q /(H) con norme non superiori a 1.
(v) Sappiamo che |P|
/(H)
1 e |Q|
/(H)
1. Se M ,= 0, essendo
Px = x per x M, si ottiene |P|
/(H)
= 1. Se M ,= H, per x M
si ha
Px = 0 e quindi Qx = x: pertanto |Q|
/(H)
= 1. Ciò prova (v) e conclude
la dimostrazione.
Esercizi 8.1
1. Sia H uno spazio di Hilbert, sia u H con |u| = 1. Si verichi che
la palla aperta B(u, 1) = x H : |x u| < 1 è un convesso non
chiuso, privo di elementi di norma minima.
204
2. Si verichi che, posto K = f L
2
(0, 1) :
_
1/2
0
f(t) dt
_
1
1/2
f(t) dt =
1, si ha min
fK
|f|
2
= 1.
3. Poniamo K = f C
0
[0, 1] :
_
1/2
0
f(t) dt
_
1
1/2
f(t) dt = 1. Si provi
che K è un convesso chiuso negli spazi (C
0
[0, 1], ||
) e (C
0
[0, 1], ||
2
),
privo in entrambi i casi di elementi di norma minima.
4. Poniamo
Lip[a, b] =
_
f C
0
[a, b] : [f]
1
= sup
x,=x
[f(x) f(x
t
)[
[x x
t
[
<
_
,
e sia K = f Lip[0, 1] : |f|
4, [f]
1
8,
_ 1
2
0
f(t)dt
_
1
1
2
f(t)dt =
1. Si provi che K è un convesso chiuso e non vuoto di L
2
(0, 1), e che
min
fK
|f|
2
> 1.
5. Poniamo
K
2
= f L
2
(a, b) : |f|
2
1, K
= f L
(a, b) : |f|
1.
Dimostrare che K
2
e K
sono convessi chiusi di L

2
(a, b) e determinare
esplicitamente le proiezioni ortogonali P
K
2
e P
K
.
6. Poniamo
K = f L
2
(a, b) : f 0 q.o. in [a, b], K
0
= K C
0
[a, b].
(i) Si verichi che K e K
0
sono sottoinsiemi convessi di L
2
(a, b).
(ii) Si provi che K è chiuso in L
2
(a, b) e che K L
(a, b) è chiuso in
L
(a, b), mentre K

0
è chiuso in L
(a, b) ma non in L
2
(a, b).
(iii) Si determini esplicitamente la proiezione P
K
.
7. Determinare M
nei casi seguenti:

(i) M = f L
2
(a, b) : f = costante q.o.,
(ii) M = f L
2
(R) : f è dispari,
(iii) M = [x
n
nN
] L
2
(a, b)
205
(ove [f
i
iI
] indica il sottospazio chiuso generato dalla famiglia f
i
iI
,
cioè la chiusura dellinsieme delle combinazioni lineari nite di elementi
della famiglia).
8. Sia (X, T, ) uno spazio misurato e sia ( T unaltra -algebra.
(i) Si provi che L
2
(X, (, ) è un sottospazio chiuso di L
2
(X, T, ).
(ii) Si caratterizzi esplicitamente tale sottospazio nei due casi seguenti:
(a) X = R, ( = B, T = /, = m;
(b) X = [0, 1], ( = , [0, 1], T = /, = m.
9. Si provi che le funzioni 1, cos nx, sin nx (n N
+
) sono a due a due
ortogonali in L
2
(, ).
10. Determinare:
(i) min
_
[x a b sin x c sin
2
x[
2
dx : a, b, c R;
(ii) min
_
1
1
[x
3
a bx cx
2
[
2
dx : a, b, c R;
(iii) la proiezione del vettore 1 + sin x + cos x + sin
3
x sul sottospazio
[1, sin x, sin 3x] di L
2
(, ).
11. Sia H uno spazio di Hilbert, sia S H, S ,= . Provare che S
= [S].
12. Sia H = (c
00
, | |
2
), e sia S = x c
00
:
n=1
xn
n
= 0. Provare che S
è un sottospazio chiuso di H con S
,= [S].
[Traccia: si verichi per induzione che z S
se e solo se z
n
=
1
n
z
1
per ogni n N
+
, e se ne deduca che S
= 0.]
13. Sia M un sottospazio chiuso di uno spazio di Hilbert H. Si dimostri
che
min
xM
|x y| = max[(z, y)[ : z M
, |z| = 1.
14. Siano P
1
, . . . , P
n
proiezioni ortogonali sui sottospazi chiusi M
1
, . . . , M
n
di uno spazio di Hilbert H. Dimostrare che le seguenti aermazioni
sono equivalenti:
(i) P
i
P
j
= 0 se i ,= j;
(ii) M
1
, . . . , M
n
sono a due a due ortogonali;
206
(iii) loperatore P =
n
i=1
P
i
è una proiezione ortogonale.
Descrivere in tal caso limmagine R(P).
15. Siano P
1
, P
2
proiezioni ortogonali sui sottospazi chiusi M
1
, M
2
di uno
spazio di Hilbert H. Dimostrare che le seguenti aermazioni sono
equivalenti:
(i) M
1
M
2
;
(ii) P = P
2
P
1
è una proiezione ortogonale.
Descrivere in tal caso limmagine R(P).
16. Sia B = x = (x
1
, x
2
) R
2
: [x[
2
=
_
(x
1
)
2
+ (x
2
)
2
< 1, e consideria-
mo linsieme delle funzioni di L
2
(B) di tipo radiale:
R = f L
2
(B) : f = f([x[
2
).
(i) Provare che R è un sottospazio chiuso di L
2
(B).
(ii) Descrivere il sottospazio R
.
(iii) Determinare esplicitamente la proiezione ortogonale P
R
.
17. Sia H uno spazio di Hilbert, e siano M
1
, M
2
due sottospazi chiusi di H
con M
1
M
2
= 0; poniamo M
1
+M
2
= x +y : x M
1
, y M
2
.
(i) Provare che se M
1
e M
2
sono ortogonali, allora M
1
+ M
2
è un
sottospazio chiuso.
(ii) Dimostrare che se H ha dimensione nita allora M
1
+M
2
è chiuso.
(iii) Vericare che
M
1
= x
2
: x
2n
= 0 n N,
M
2
=
_
x
2
: x
2n
=
x
2n+1
2n + 1
n N
_
sono sottospazi chiusi di
2
tali che M
1
M
2
= 0, mentre M
1
+M
2
non è un sottospazio chiuso di
2
.
[Traccia: per (iii) si mostri che c
00
M
1
+M
2

2
.]
207
8.2 Il duale di uno spazio di Hilbert
Unaltra somiglianza fra gli spazi di Hilbert e gli spazi euclidei R
N
e C
N
è il
fatto che linsieme dei funzionali lineari e continui su uno spazio di Hilbert
H è uno spazio isomorfo ed isometrico ad H stesso. Vale infatti il seguente
fondamentale risultato:
Teorema 8.2.1 (di Riesz-Frechèt) Sia H uno spazio di Hilbert. Per ogni
F H
esiste un unico z H tale che

Fx = (x, z)
H
x H,
ed inoltre si ha
|F|
H
= |z|
H
.
Dimostrazione Sia F H
: se F = 0, allora scelto z = 0 si ha ovviamente

la tesi. Supponiamo dunque F ,= 0; allora il sottospazio
M = ker F = x H : Fx = 0
è chiuso e non coincide con H, cosicche il suo sottospazio ortogonale M
contiene propriamente 0. Scegliamo allora un arbitrario elemento w

M
0: per ogni x H si ha
F
_
x
Fx
Fw
w
_
= 0
cioè
x
Fx
Fw
w M.
Dunque, essendo w M
,
(x
Fx
Fw
w, w)
H
= 0 x H,
da cui
Fx =
Fw
|w|
2
H
(x, w)
H
x H;
in denitiva, scelto
z =
Fw
|w|
2
H
w,
208
risulta
Fx = (x, z)
H
x H.
Da questa relazione segue subito |F|
H
|z|
H
, mentre dalla denizione di
z otteniamo
|z|
H
=
[Fw[
|w|
H
|F|
H
.
Ci` o prova che il vettore z ha i requisiti richiesti. Resta da vericare lunicità
di z: se z
t
H è un altro vettore tale che
Fx = (x, z
t
)
H
x H,
allora avremo
(x, z z
t
)
H
= Fx Fx = 0 x H,
e scelto x = z z
t
otteniamo subito z = z
t
.
Osservazione 8.2.2 Vi è dunque una isometria bigettiva j : H H
,
denita da z j
z
ove
j
z
(x) = (x, z)
H
x H,
che rende ogni spazio di Hilbert isomorfo al suo duale. Si noti che j è un
operatore antilineare, in quanto per ogni , C e per ogni x, z, z
t
H si
ha
j
z+z
(x) = (x, z +z
t
)
H
= (x, z)
H
+(x, z
t
)
H
= j
z
(x) +j
z
(x).
Il teorema di Riesz-Frechèt ha unimportante applicazione, che riguarda un
fondamentale risultato di decomposizione e classicazione delle misure in
termini delle nozioni di assoluta continuità e mutua singolarità introdotte
nel paragrafo 4.5: il teorema di Lebesgue-Radon-Nikod ym. Si tratta in eetti
di due enunciati distinti, che però dimostreremo simultaneamente, cosicche
il secondo gurerà come un facile corollario del primo. Lingrediente basilare
sarà il teorema 8.2.1.
Teorema 8.2.3 (di decomposizione di Lebesgue) Sia (X, T, ) un s-
sato spazio misurato -nito; sia unaltra misura denita su T, anchessa
-nita. Allora esiste ununica coppia di misure -nite
a
,
s
denite su T,
tali che
=
a
+
s
,
a
,
s
.
La coppia (
a
,
s
) è chiamata decomposizione di Lebesgue di relativa a .
209
Dimostrazione Proviamo anzitutto lunicità della decomposizione. Sup-
poniamo che (
t
a
,
t
s
) sia unaltra decomposizione di con
t
a
e
t
s
;
dobbiamo provare che
a
(E) =
t
a
(E) e
s
(E) =
t
s
(E) per ogni E T,
e a questo scopo, ricordando la proposizione 2.1.5, è suciente provare che
tali relazioni valgono per ogni E T con (E) < . Poiche, per ipotesi,
=
a
+
s
=
t
a
+
t
s
, si ha
a
(E)
t
a
(E) =
t
s
(E)
s
(E) E T con (E) < .
Consideriamo gli insiemi B, A
s
, A
t
s
dove sono concentrate rispettivamente le
misure ,
s
,
t
s
: a causa della mutua singolarità, deve essere B(A
s
A
t
s
) = .
Di conseguenza per ogni E T con (E) < risulta:
(E) = (E B), (E B) = 0;
s
(E B) =
t
s
(E B) = 0,
a
(E B) =
t
a
(E B).
a
(E B) =
t
a
(E B) = 0,
s
(E B) =
t
s
(E B);
Ne segue, usando ladditività delle misure,
a
(E) =
a
(E B) +
a
(E B) =
t
a
(E B) +
t
a
(E B) =
t
a
(E),
e similmente si ottiene
s
(E) =
t
s
(E). Ciò prova lunicità della decomposi-
zione.
Passiamo alla dimostrazione dellesistenza, supponendo dapprima che sia
nita. Osserviamo anzitutto che esiste una funzione w L
1
(X, ) tale che
0 < w(x) < 1 per ogni x X. Infatti, usando la -nitezza di X, se
X =
n=0
X
n
con gli X
n
disgiunti e tali che (X
n
) < , basta porre
w(x) =
n=0
w
n
(x), ove w
n
(x) =
2
n1
1 +(X
n
)
Xn
(x).
Lutilità di w sta nel fatto che la misura E
_
E
w d ha esattamente gli
stessi insiemi di misura nulla che ha , ma è nita anziche -nita come .
Deniamo una misura ausiliaria nel modo seguente:
(E) = (E) +
_
E
w d E T;
è una misura nita su T.
Il modo in cui è denita suggerisce che gli integrali rispetto alla misura
210
si rappresentino come somma di due opportuni integrali rispetto a e ; in
eetti si dimostra la seguente relazione, fondamentale per noi, che vale per
ogni funzione T-misurabile e non negativa:
_
X
f d =
_
X
f d +
_
X
fw d.
Infatti, per denizione di la relazione vale per tutte le funzioni semplici T-
misurabili; il passaggio alle arbitrarie funzioni T-misurabili e non negative si
ottiene in virt` u dellosservazione 3.1.8 e del teorema di B. Levi.
Sia ora f L
2
(X, ); poiche si ha, utilizzando la disuguaglianza di
Cauchy-Schwarz (proposizione 7.2.2),
_
X
f d

_
X
[f[d = ([f[, 1)
L
2
(X,)

|f|
L
2
(X,)
|1|
L
2
(X,)
= |f|
L
2
(X,)
_
(X).
Dunque il funzionale lineare Tf =
_
X
f d è continuo su L
2
(X, ), cioè è un
elemento di (L
2
(X, ))
. Per il teorema di Riesz-Frechèt (caso di uno spazio

di Hilbert reale), esiste ununica g L
2
(X, ) tale che
_
X
f d = Tf = (f, g)
L
2
(X,)
=
_
X
fg d f L
2
(X, ).
Proviamo che si ha 0 g(x) 1 -q.o. in X. Scegliendo f =
E
, con E T
tale che (E) > 0 (scelta lecita perche f è limitata, quindi in L
2
(X, ) essendo
nita), troviamo
(E) = T
E
=
_
E
g d
da cui, dividendo per (E),
0
1
(E)
_
E
g d =
(E)
(E)
1.
Se, per assurdo, fosse (x X : g(x) > 1) > 0, dalla relazione
x X : g(x) > 1 =
_
kN
+
_
x X : g(x) > 1 +
1
k
_
211
segue che esisterebbe k N
+
tale che (x X : g(x) > 1 + 1/k) > 0;
prendendo come E questo insieme, otterremmo
1 +
1
k

1
(E)
_
E
g d 1,
il che è assurdo. Similmente si prova la disuguaglianza g 0. Modicando
eventualmente g su un insieme di misura nulla, possiamo supporre che sia
0 g(x) 1 x X.
Osserviamo adesso che dalla denizione delloperatore T, nonche dalla for-
mula di rappresentazione degli integrali rispetto a precedentemente dimo-
strata, si ricava
_
X
fd = Tf =
_
X
fg d =
_
X
fg d +
_
X
fgw d f L
2
(X, ), f 0,
da cui
_
X
(1 g)f d =
_
X
fgw d f L
2
(X, ), f 0.
Poniamo A = x X : 0 g(x) < 1 e B = x X : g(x) = 1, e
deniamo nalmente
a
(E) = (E A),
s
(E) = (E B) E T.
Scegliendo f =
B
nella relazione precedente, si ottiene
0 =
_
B
(1 g)d =
_
B
w d,
da cui, per la proprietà di w già osservata, (B) = 0. Dato che
s
è concen-
trata su B, ne segue che
s
.
Scegliendo invece nella relazione precedente f = (1 + g + + g
n
)
E
, con
E T, otteniamo
_
E
(1 g
n+1
)d =
_
E
g(1 +g + +g
n
)w d n N;
per n , in virt` u del teorema di B. Levi luguaglianza precedente diventa
(E A) =
_
E
gw
1 g
d.
212
Dunque, posto h =
gw
1g
, la funzione h è non negativa ed appartiene a L
1
(X, )
(come si vede scegliendo E = X e ricordando che è una misura nita); di
conseguenza si trova
a
(E) = (E A) =
_
E
h d E T.
In virt` u della proposizione 4.5.6, si conclude che
a
. La tesi è dimostrata
nel caso in cui la misura sia nita.
Supponiamo adesso che sia -nita. In questo caso esiste una successione
X
n
nN
T con queste proprietà: gli X
n
sono disgiunti, (X
n
) < per
ogni n N e
n=0
X
n
= X. Per ogni n N poniamo
n
(E) = (E X
n
) E T :
le misure
n
sono nite. Per quanto già dimostrato, per ogni n N si
ha
n
=
an
+
sn
, ove
an
e
sn
; inoltre esiste una funzione
h
n
L
1
(X
n
, ) non negativa, tale che
an
(E) =
_
E
h
n
d E T, E X
n
.
Utilizzando ancora una volta il teorema di B. Levi è facile allora riconoscere
che, posto
a
=
n=0
an
,
s
=
n=0
sn
,
le funzioni
a
e
s
sono misure -nite tali che
=
a
+
s
,
a
,
s
,
e in particolare. posto h =
n=0
h
n
, la funzione h è misurabile, non negativa
e si ha
a
(E) =
_
X
h d E T.
La tesi è completamente dimostrata.
Corollario 8.2.4 (teorema di Radon-Nikod ym) Sia (X, T, ) uno spa-
zio misurato -nito; sia unaltra misura denita su T, anchessa -nita.
Allora si ha se e solo se esiste una funzione T-misurabile e non
negativa h tale che
(E) =
_
E
h d E T.
213
Dimostrazione (=)
`
E la proposizione 4.5.6.
(=) Poiche , per il teorema 8.2.3 la decomposizione di Lebesgue
di rispetto a è necessariamente data, per unicità, da = + 0. Dalla
dimostrazione del teorema 8.2.3 segue che esiste una funzione non negativa
e misurabile h per cui si ha
(E) =
_
E
h d E T,
il che prova la tesi. Osserviamo che nel caso in cui è nita la funzione h
risulta -sommabile su X.
Esercizi 8.2
1. Sia H uno spazio di Hilbert, sia M un sottospazio di H; sia inoltre
F un funzionale lineare e continuo su M. Provare che esiste un unico
funzionale F lineare e continuo su H, tale che
F[
M
= F, |F|
H
= |F|
M
.
2. Sia H uno spazio di Hilbert, e sia F : H R un funzionale lineare non
continuo. Si provi che ker F è denso in H.
[Traccia: sia y
n
tale che |y
n
| 0 e Fy
n
= 1; se z (ker F)
, si
provi che
z
Fz
y
n
ker F e se ne deduca che z = 0.]
3. Sia H uno spazio di Hilbert. Fissato T /(H), si verichi che la
relazione
(Sx, y)
H
= (x, Ty)
H
x, y H
denisce univocamente un operatore S : H H lineare e limitato, e
che risulta |S|
/(H)
= |T|
/(H)
. Loperatore S si dice aggiunto di T e si
denota con T
.
4. Sia H uno spazio di Hilbert e sia T /(H) un operatore autoaggiunto,
ossia tale che
(Tx, y) = (x, Ty) x, y H;
supponiamo inoltre che esista c > 0 per cui risulti |Tx| c|x| per
ogni x H. Provare che T è bigettivo e T
1
è continuo.
214
5. Sia H uno spazio di Hilbert. Si provi che un operatore P /(H) è
una proiezione ortogonale se e solo se si ha P
2
= P e P è autoaggiunto
(secondo la denizione fornita nellesercizio precedente).
6. Sia H uno spazio di Hilbert. Se A /(H), detto A
laggiunto di A
introdotto nellesercizio 8.2.3, si provi che:
(i) |A A
|
/(H)
= |A
A|
/(H)
= |A|
2
/(H)
;
(ii) Se A è autoaggiunto, allora |A
n
|
/(H)
= |A|
n
/(H)
per ogni n N
+
.
7. Sia H uno spazio di Hilbert e sia A /(H) è un operatore autoaggiunto
e positivo, ossia tale che (Ax, x) 0 per ogni x H. Si provi che
[(Ax, y)[
_
(Ax, x)
_
(Ay, y) x, y H,
e che se Aè strettamente positivo, ossia (Ax, x) > 0 per ogni x H0,
allora (x, y)
1
= (Ax, y) denisce un prodotto scalare in H.
8.3 Sistemi ortonormali
In R
N
ed in C
N
, come sappiamo, ogni elemento x si può scrivere in modo
unico come combinazione lineare degli elementi di una ssata base. Vediamo
se è possibile trovare una proprietà analoga negli spazi di Hilbert.
Denizione 8.3.1 Una famiglia e
A
di elementi di uno spazio di Hilbert
H si chiama sistema ortonormale se si ha
(e
, e
)
H
=
=
_
1 se =
0 se ,=
, A.
Esempi 8.3.2 (1) Fissato e H con |e| = 1, linsieme e costituisce un
sistema ortonormale in H.
(2) e
1
, . . . , e
N
è un sistema ortonormale in R
N
ed in C
N
.
(3) In
2
un sistema ortonormale è dato dalla famiglia e
n
nN
, ove e
n
è
lelemento con tutte le componenti nulle tranne la n-sima che vale 1.
(4) Se f, g L
2
(R) e se f è pari e g è dispari, con |f|
L
2
(R)
= |g|
L
2
(R)
= 1,
215
allora f, g è un sistema ortonormale in L
2
(R).
(5) Il sistema trigonometrico
_
1
2
,
1
cos nx ,
1
sin nx ; n N
+
_
è un sistema ortonormale in L
2
(, ) (esercizio 8.1.9).
(6) In L
2
(a, b) esistono altri sistemi ortonormali: vedere ad esempio gli
esercizi 8.3.10 e 8.3.12.
Osservazione 8.3.3 Se H è separabile, allora ogni sistema ortonormale
e
A
è composto al pi` u da uninnità numerabile di elementi. Infatti
si ha
|e
| =
2 ,= ,
e dunque le palle B(e
,
1
2
) son tutte disgiunte; quindi un insieme denso in
H deve avere almeno la stessa cardinalità di A. Essendo H separabile, si
conclude che A è al pi` u numerabile.
Esempio 8.3.4 Costruiamo uno spazio di Hilbert non separabile. Sia
E = f : R C : x R : f(x) ,= 0 è numerabile,
e poniamo
H =
_
f E :
xR
[f(x)[
2
<
_
:
la denizione ha senso perche la somma è fatta al pi` u su uninnità numera-
bile di punti, la serie è a termini positivi e lordine degli addendi è irrilevante.
Linsieme H è dotato del prodotto scalare
(f, g) =
xR
f(x)g(x),
ed è uno spazio di Hilbert, come è facile vericare; H non è separabile perche
possiede il sistema ortonormale
x
xR
, il quale è pi` u che numerabile. Si
noti che H coincide con L
2
(R, T, ), ove è la misura cardinalità e
T = A R : A, oppure A
c
, è numerabile.
Veniamo alla proprietà fondamentale dei sistemi ortonormali, ossia la disu-
guaglianza di Bessel. Premettiamo un po di terminologia.
216
Denizione 8.3.5 Sia H uno spazio di Hilbert e sia e
A
un sistema
ortonormale in H. Se x H, i numeri (x, e
)
H
si chiamano coecienti di
Fourier di x relativi al sistema e
. La serie
A
(x, e
)
H
e
(la quale, co-

me si vedrà nellosservazione 8.3.7(1), contiene al pi` u uninnità numerabile
di termini) si chiama serie di Fourier di x relativa al sistema e
.
A priori non sappiamo dire se la serie di Fourier di un elemento x H
converga, ne, tantomeno, se essa converga proprio a x come sarebbe lecito
aspettarsi.
Proposizione 8.3.6 (disuguaglianza di Bessel) Sia e
A
un sistema
ortonormale in uno spazio di Hilbert H. Allora
sup
_
N
i=1
[(x, e
i
)
H
[
2
: N N
+
,
1
, . . .
N
A
_
|x|
2
H
x H.
Dimostrazione Per ogni N N
+
e per ogni N-pla di indici distinti
1
, . . .
N
si ha, grazie allortonormalità di e
,
0
_
_
_
_
_
x
N
i=1
(x, e
i
)e
i
_
_
_
_
_
2
H
=
= |x|
2
H
2Re
_
x,
N
i=1
(x, e
i
)
H
e
i
_
H
+
_
_
_
_
_
N
i=1
(x, e
i
)
H
e
i
_
_
_
_
_
2
H
=
= |x|
2
H
2Re
N
i=1
(x, e
i
)
H
(x, e
i
)
H
+
N
i,j=1
(x, e
i
)
H
(x, e
j
)
H
ij
=
= |x|
2
H
2
N
i=1
[(x, e
i
)
H
[
2
+
N
i=1
[(x, e
i
)
H
[
2
=
= |x|
2
H

N
i=1
[(x, e
i
)
H
[
2
.
Ne segue la tesi.
Osservazioni 8.3.7 (1) Se lo spazio H non è separabile, dato un qualunque
sistema ortonormale e
A
è facile vericare che per ogni x H linsieme
degli indici A tali che (x, e
)
H
,= 0 è al pi` u numerabile: infatti per
ogni k N
+
linsieme A : [(x, e
)
H
[ > 1/k è nito in virt` u della
disuguaglianza di Bessel.
217
(2) Dalla disuguaglianza di Bessel e da (1) segue che la serie di Fourier di un
generico x H, relativa a un qualunque sistema ortonormale, converge in
H; infatti con un conto del tutto analogo a quello svolto nella dimostrazione
precedente si verica che, detti
n
gli indici tali che (x, e
n
)
H
,= 0 e posto
w
N
=
N
n=0
(x, e
n
)
H
e
n
, si ha
|w
N
w
M
|
2
H
=
N
n=M+1
[(x, e
n
)
H
[
2
N, M N con N > M,
e dunque w
N
NN
, essendo una successione di Cauchy, converge in H. Non
è detto che la somma della serie di Fourier di x sia proprio x: basta pensare
al caso banale di un sistema ortonormale costituito da un solo elemento.
Denizione 8.3.8 Un sistema ortonormale e
A
in uno spazio di Hilbert
H si dice completo se [e
A
] = H, ossia se le combinazioni lineari nite
di elementi di e
A
sono dense in H.
In altre parole, un sistema ortonormale e
A
è completo se e solo se
e
= 0: ciò è facile conseguenza del teorema delle proiezioni (teorema

8.1.6). Vediamo alcuni esempi di sistemi ortonormali completi.
Esempi 8.3.9 (1) Il sistema e
1
, . . . , e
N
è completo in R
N
ed in C
N
.
(2) Il sistema e
n
nN
è completo in
2
.
(3) Il sistema trigonometrico è completo in L
2
(, ) (esercizio 8.3.3).
(4) I polinomi di Legendre, deniti da
P
n
(x) =
1
n! 2
n
_
n +
1
2
d
n
dx
n
(x
2
1)
n
, x [1, 1], n N,
costituiscono un sistema ortonormale in L
2
(1, 1) (esercizio 8.3.10); esso è
anche completo. Ciò segue dalla densità dei polinomi in C
0
[1, 1] (esercizio
4.7.10) e dalla densità di C
0
[1, 1] in L
2
(1, 1) (proposizione 4.7.3 ed osser-
vazione 4.7.4).
(5) I polinomi di Hermite, deniti da
H
n
(x) =
(1)
n
_
n! 2
n
e
x
2 d
n
dx
n
e
x
2
, x R, n N
+
,
formano un sistema ortonormale completo in L
2
(R, /, e
x
2
dx) (esercizio
8.3.11).
218
Proposizione 8.3.10 Ogni spazio di Hilbert H ,= 0 ha un sistema orto-
normale completo.
Dimostrazione Faremo uso del lemma di Zorn. Ricordiamo che un ordina-
mento parziale su un insieme P è una relazione riessiva, antisimmetrica
e transitiva, e si dice che (P, ) è un insieme parzialmente ordinato. Un sot-
toinsieme Q di P si dice totalmente ordinato se per ogni a, b Q si ha a b
oppure b a. Un elemento c P è un maggiorante per Q se si ha q c per
ogni q Q, e un elemento m P è massimale se non esiste alcun x P,
diverso da m, tale che m x (ossia, se x P e m x implica x = m). Ciò
posto, vale questo risultato che non dimostriamo:
Lemma 8.3.11 (di Zorn) Sia (P, ) un insieme parzialmente ordinato. Se
ogni sottoinsieme totalmente ordinato Q di P ha un maggiorante in P, allora
in P esiste un elemento massimale.
Prendiamo ora
P = B H : B è un sistema ortonormale in H :
chiaramente P è un insieme non vuoto che è parzialmente ordinato rispetto
alla relazione di inclusione . Verichiamo le ipotesi del lemma di Zorn.
Se Q è un sottoinsieme totalmente ordinato di P, verichiamo che linsieme
B
0
=
BQ
B è un elemento di P che è maggiorante per Q: per cominciare,
ogni e B
0
ha norma unitaria, in quanto è membro di un certo sistema orto-
normale B Q. Poi, se e, e
t
B
0
ed e ,= e
t
, allora sarà e B ed e
t
B
t
per
certi B, B
t
Q; dato che Q è totalmente ordinato, sarà ad esempio B B
t
.
Ma allora avremo e, e
t
B
t
e quindi, per lortonormalità del sistema B
t
, ri-
sulterà (e, e
t
)
H
= 0. Ciò prova che B
0
è un sistema ortonormale in H; dunque
B
0
è un elemento di P. Daltronde è chiaro per denizione di B
0
che B B
0
per ogni B Q, cosicche B
0
è un maggiorante di Q.
Per il lemma di Zorn, deduciamo che in P esiste un elemento massimale B;
proviamo che il sistema ortonormale B è completo. Se cos` non fosse, esiste-
rebbe x B
0, e quindi B
x
|x|
sarebbe un sistema ortonormale, cioè
un elemento di P, che contiene strettamente B, contraddicendo la massima-
lità di B.
La proposizione che segue caratterizza i sistemi ortonormali completi.
Proposizione 8.3.12 Sia H uno spazio di Hilbert e sia e
A
un sistema
ortonormale in H. I seguenti fatti sono equivalenti:
219
(i) e
è completo;
(ii) e
= 0;
(iii) vale l uguaglianza di Bessel
|x|
2
H
=
A
[(x, e
)
H
[
2
x H;
(iv) vale l identità di Parseval
(x, y)
H
=
A
(x, e
)
H
(y, e
)
H
x, y H;
(v) per ogni x H la serie di Fourier di x, cioè
A
(x, e
)
H
e
, converge
in H ed ha somma x.
Ricordiamo che in virt` u dellosservazione 8.3.7 le serie che compaiono nelle-
nunciato contengono al pi` u uninnità numerabile di termini.
Dimostrazione (i) (ii) Lo sappiamo già, come osservato subito dopo
la denizione 8.3.8.
(ii) (v) Se vale (v) e x e
, allora
x =
A
(x, e
)
H
e
A
0 e
= 0.
Viceversa, supponiamo che valga (ii). Dallosservazione 8.3.7 segue che la
serie di Fourier di x converge in H ad un certo elemento w; si tratta di
vericare che w = x. Ma per ogni ssato A si ha, in virt` u della continuità
del prodotto scalare,
(w, e
)
H
=
_
A
(x, e
)
H
e
, e
_
H
=
A
(x, e
)
H
(e
, e
)
H
= (x, e
)
H
,
da cui, per larbitrarietà di , otteniamo wx e
; per (ii), ciò signica

w x = 0.
(iii) (v) Questa doppia implicazione è immediata conseguenza della
220
seguente uguaglianza che già conosciamo: per ogni x H, per ogni N N
+
e per ogni
1
, . . . ,
N
A si ha
_
_
_
_
_
x
N
n=1
(x, e
n
)
H
e
n
_
_
_
_
_
2
H
= |x|
2
H

N
n=1
[(x, e
n
)
H
[
2
.
(iii) (iv) Se vale (iv), allora basta scegliere y = x per ottenere (iii).
Viceversa, se vale (iii), possiamo scrivere
|x +y|
2
H
= |x|
2
H
+|y|
2
H
+ 2Re(x, y)
H
ed anche
|x +y|
2
H
=
A
[(x, e
)
H
+ (y, e
)
H
[
2
=
=
A
[(x, e
)
H
[
2
+
A
[(y, e
)
H
[
2
+ 2Re
A
(x, e
)
H
(y, e
)
H
,
da cui
Re(x, y)
H
= Re
A
(x, e
)(y, e
).
In modo analogo, considerando x +iy in luogo di x +y, si ricava
Im(x, y)
H
= Im
A
(x, e
)
H
(y, e
)
H
.
Ci` o conclude la dimostrazione.
Esercizi 8.3
1. (Proprietà di miglior approssimazione) Sia e
A
un sistema orto-
normale nello spazio di Hilbert H; ssati
1
, . . . ,
N
A, sia M =
[e
1
, . . . , e
N
]. Si provi che
P
M
x =
N
n=1
(x, e
n
)
H
e
n
.
2. Per ogni n N deniamo
P
n
(t) = k
n
_
1 + cos t
2
_
n
, t [, ],
ove k
n
è una costante scelta in modo che
_
P
n
(t)dt = 1. Si provi che:
221
(i) P
n
è un polinomio trigonometrico di grado n, ossia è combinazione
lineare delle 2n + 1 funzioni 1, cos kx, sin kx, 1 k n, ed è
strettamente positivo in ] , [;
(ii) risulta
k
n
=
1
_
_
1+cos t
2
_
n
dt
n + 1
4
n N,
e dunque
lim
n
sup
[t[
P
n
(t) = 0 ]0, [;
(iii) se f è una funzione continua su R e periodica di periodo 2, allora
posto
f
n
(t) =
_

f(t s)P
n
(s)ds, t [, ],
si ha che f
n
è un polinomio trigonometrico di grado al pi` u n;
(iv) si ha f
n
f uniformemente in [, ] per n .
3. Si provi che il sistema trigonometrico
_
1
2
,
1
cos nx ,
1
sin nx ; n N
+
_
,
o, equivalentemente, il sistema
_
e
ikx
2
; k Z
_
,
è ortonormale completo in L
2
(, ).
[Traccia: si provi che i polinomi trigonometrici sono densi nello spa-
zio C
0
0
[, ], e quindi anche in L
2
(, ), facendo uso dellesercizio
precedente.]
4. Sia f L
2
(, ). Si verichi che la serie di Fourier di f (relativa al
sistema trigonometrico) si può scrivere nei due modi equivalenti
kZ
k
e
ikt
=
a
0
2
+
n=1
(a
n
cos nt +b
n
sin nt),
ove
k
=
1
2
_

f(s)e
iks
ds k Z,
222
a
n
=
1
f(s) cos ns ds n N,
b
n
=
1
f(s) sin ns ds n N
+
.
Si verichi inoltre che a
0
= 2
0
, a
n
=
n
+
n
, b
n
= i(
n

n
) per
ogni n N
+
.
5. Posto
P = f L
2
(, ) : f è pari, D = f L
2
(, ) : f è dispari,
si provi che P e D sono sottospazi chiusi di L
2
(, ) tali che P = D
.
6. Provare che i sistemi
_
_
2
sin nx
_
nN
+
,
_
1
_
_
2
cos nx
_
nN
+
sono entrambi ortonormali e completi in L
2
(0, ).
[Traccia: per la completezza si prolunghi una f L
2
(0, ), ortogonale
a tutti gli elementi di uno dei due sistemi, in modo pari oppure dispari
su ] , [. . . .]
7. Si scriva la serie di Fourier (relativa al sistema trigonometrico) di
f(x) =
_
[x[
2
_
2
, x [, ];
si provi che tale serie converge uniformemente e se ne deduca che
n=1
1
n
2
=

2
6
,
n=1
1
n
4
=

4
90
.
8. Fissata f L
2
(, ), la si prolunghi a tutto R per periodicità. Posto,
per ogni g L
2
(, ),
f g(x) =
_

f(x y)g(y)dy, x [, ],
si provi che f g è continua e che la sua serie di Fourier, relativa al
sistema
e
inx
kZ
, converge uniformemente in [, ].
223
9. Sia f AC[, ] tale che f() = f(), e per ogni k Z poniamo
k
=
1
2
_
f(s)e
iks
ds. Si provi che:
(i) f
t
L
2
(, ) se e solo se
kZ
k
2
[
k
[
2
< ;
(ii) in tal caso la serie
kZ
k
e
ikt
converge assolutamente ed unifor-
memente a f in [, ];
(iii) tale serie è inoltre derivabile termine a termine, e la serie delle
derivate converge a f
t
in L
2
(, ).
10. Si verichi che il sistema dei polinomi di Legendre
P
n
(x) =
1
n! 2
n
_
n +
1
2
d
n
dx
n
(x
2
1)
n
, x [1, 1], n N,
è ortonormale in L
2
(1, 1).
11. Si provi che il sistema dei polinomi di Hermite
H
n
(x) =
(1)
n
_
n! 2
n
e
x
2 d
n
dx
n
e
x
2
, x R, n N
+
,
2
(R, /, e
x
2
dx).
[Traccia: si osservi che C
0
0
(R) è denso in L
2
(R, /, e
x
2
dx), e si utilizzi
la densità dei polinomi nello spazio C
0
[a, b] per ogni [a, b] R.]
12. Per ogni n N sia
n
: [0, 1] R denita da
n
(x) = (1)
[2
n
x]
, ove
[a] denota la parte intera di a. Dimostrare che:
(i)
n
nN
è un sistema ortonormale in L
2
(0, 1);
(ii) il sistema non è completo perche la funzione g = 1 2
[1/4,3/4]
è
ortogonale a tutte le
n
;
(iii) risulta
lim
n
_
1
0
n
(t)f(t) dt = 0 f L
1
(0, 1).
13. Siano
n
nN
e
n
nN
due sistemi ortonormali completi in L
2
(a, b)
e L
2
(c, d) rispettivamente. Provare che il sistema f
nm
n,mN
, ove
f
nm
(x, y) =
n
(x)
m
(y), (x, y) ]a, b[]c, d[,
2
(]a, b[]c, d[).
224
14. Sia V il sottospazio di
2
generato dagli elementi x =
1
n
nN
+ e y =
1
2
n
nN
+; determinare un sistema ortonormale in V .
15. Sia H uno spazio di Hilbert separabile e sia e
n
nN
+ un sistema orto-
normale completo in H. Per ogni h N
+
poniamo
M
h
=
_
x H : c > 0 : [(x, e
n
)
H
[
c
n
h
n N
+
_
,
K
h
=
_
x H : [(x, e
n
)
H
[
1
n
h
n N
+
_
.
(a) Vericare che:
(i) K
h
è un convesso chiuso contenuto in M
h
e K
h
K
h+1
per
ogni h N
+
;
(ii) M
h
è un sottospazio denso in H e M
h
M
h+1
per ogni
h N
+
.
(b) Caratterizzare il convesso K =
h=1
K
h
e provare che il sottospa-
zio M =
h=1
M
h
è denso in H.
(c) Scrivere esplicitamente gli operatori P
K
h
, h N
+
, e P
K
.
16. Sia H uno spazio di Hilbert separabile e sia e
n
nN
+ un sistema orto-
normale completo in H; si denisca
M =
_
x H : (x, e
n+2
)
H
=
1
2
(x, e
n
)
H
n N
+
_
.
(i) Si verichi che M è un sottospazio nito-dimensionale di H.
(ii) Si trovi una base di M.
(iii) Si determini la proiezione ortogonale P
M
.
17. Sia H uno spazio di Hilbert e sia v
n
nN
una successione di elementi
di H fra loro ortogonali, e tali che la serie
n=0
v
n
sia convergente in
H. Si dimostri che per ogni permutazione : N N la serie riordinata
n=0
v
(n)
è convergente e che si ha
n=0
v
(n)
=
n=0
v
n
.
Cosa succede se si toglie lipotesi (v
n
, v
m
) = 0 per n ,= m?
225
18. Sia H uno spazio di Hilbert separabile e siano e
n
, f
m
sistemi or-
tonormali completi in H. Se T /(H), si provi che
n=0
|Te
n
|
2
converge se e solo se
m=0
|T
f
m
|
2
converge (T
è denito nelleser-
cizio 8.2.3), e che in tal caso le somme delle due serie coincidono con
n,m=0
[(Te
n
, f
m
)[
2
.
19. Sia H uno spazio di Hilbert separabile, e sia A /(H) un operatore di
Hilbert-Schmidt, ossia tale che esista un sistema ortonormale completo
e
n
nN
in H per cui
n=0
|Ae
n
|
2
< . Dimostrare che:
(i) loperatore A
(denito nellesercizio 8.2.3) è di Hilbert-Schmidt;

(ii) per ogni sistema ortonormale completo f
m
mN
in H risulta
m=0
|Af
m
|
2
=
n=0
|Ae
n
|
2
< ;
(iii) la famiglia degli operatori di Hilbert-Schmidt su H è uno spazio
di Hilbert col prodotto scalare
(S, T) =
j=0
(Sh
j
, Th
j
)
H
,
ove h
j
jN
è un arbitrario sistema ortonormale completo in H;
(iv) il prodotto scalare sopra denito non dipende dalla scelta del si-
stema ortonormale, ossia per ogni coppia di sistemi ortonormali
completi f
m
mN
, g
k
kN
si ha
m=0
(Sf
m
, Tf
m
)
H
=
k=0
(Sg
k
, Tg
k
)
H
.
[Traccia: per (ii) si osservi che (A
= A e si utilizzi lesercizio prece-

dente; per (iv) si faccia uso di (ii) e dellidentità del parallelogrammo.]
20. (i) Fissato [a, b] R, si verichi che
lim
n
_
F
sin nx dx = lim
n
_
F
cos nx dx = 0
per ogni sottoinsieme misurabile F di [a, b].
226
(ii) Sia n
k
kN
una successione crescente di numeri naturali; posto
E = x [a, b] : lim
k
sin n
k
x = (x),
si provi che (x) = 0 q.o. in E.
(iii) Si deduca che
lim
k
_
E
sin
2
n
k
x dx = 0.
(iv) Si concluda che risulta m(E) = 0.
8.4 Trasformata di Fourier
Vogliamo descrivere brevemente un operatore che è di fondamentale impor-
tanza in analisi ed in molti settori della matematica applicata: la trasformata
di Fourier. Si tratta di uno strumento utilissimo, ad esempio, per trovare so-
luzioni esplicite di molte equazioni dierenziali alle derivate parziali; interi
capitoli dellanalisi numerica sono dedicati allo studio di algoritmi e proce-
dure legati alla struttura di questo operatore e delle sue versioni discre-
te. Noi ci limiteremo allo studio delle sue proprietà basilari, senza troppi
approfondimenti.
Denizione 8.4.1 Sia f L
1
(R
N
). La trasformata di Fourier di f è la
funzione

f cos` denita:
f() =
_
R
N
f(x)e
i(x,)
dm
N
(x), R
N
,
dove (x, ) è il prodotto scalare in R
N
. Loperatore f

f si indica con F.
La funzione

f è dunque a valori complessi, anche se f è reale; ma in questo
contesto è naturale prendere anche f a valori complessi. Ricordiamo che
lintegrale per funzioni complesse è stato introdotto nellesempio 7.2.6 (4) ed
è soggetto alle usuali regole di calcolo. Calcoliamo la trasformata di Fourier
in qualche caso signicativo.
Esempi 8.4.2 (1) Sia N = 1 e f =
[1,1]
: allora per ogni R si ha
f() =
_
1
1
e
ix
dx =
_
e
ix
i
_
1
1
=
=
i
_
e
i
e
i
_
= 2
sin
.
227
Si osservi che

f / L
1
(R): quindi loperatore F non preserva la sommabilità
delle funzioni.
(2) Calcoliamo la trasformata di Fourier di f(x) = e
a[x[
2
, con a > 0 ssato:
si ha
f() =
_
R
N
e
a[x[
2
e
i(x,)
dm
N
(x) =
N
j=1
_

e
ax
2
j
ix
j
j
dx
j
R
N
;
quindi lintegrale multiplo da calcolare si riduce agli N integrali unidimen-
sionali
_
e
ax
2
ix
j
dx. Poniamo
g() =
_

e
ax
2
ix
dx, R;
risulta allora, utilizzando il teorema 4.3.4 ed integrando per parti,
g
t
() = i
_

xe
ax
2
ix
dx =
i
2a
_

d
dx
e
ax
2
e
ix
dx =
=
i
2a
_
e
ax
2
e
ix
_
+

2a
_

e
ax
2
ix
dx =

2a
g().
Lequazione dierenziale g
t
() =

2a
g() ha le soluzioni g() = ke
2
4a
, con
k R; daltra parte per lesercizio 5.3.2 si ha
k = g(0) =
_
+
e
ax
2
dx =
1
2a
_
+
y
2
2
dy =
_
a
,
cosicche
g() =
_

e
ax
2
ix
dx =
_
a
e
2
4a
R
ed in denitiva
f() =
N
j=1
_

e
ax
2
j
ix
j
j
dx
j
=
_
a
_N
2
e
||
2
4a
R
N
.
Proposizione 8.4.3 La trasformata di Fourier è un operatore lineare e con-
tinuo da L
1
(R
N
) in L
(R
N
), con norma uguale a 1. Inoltre per ogni f
L
1
(R
N
) la funzione

f è uniformemente continua su R
N
e verica
lim
[[
f() = 0.
228
Dimostrazione Dalla denizione segue subito
[
f()[ |f|
L
1
(R
N
)
R
N
,
e dunque F /(L
1
(R
N
), L
(R
N
)) con |F| 1. Daltra parte scegliendo
f(x) = e
1
2
[x[
2
si ha, ricordando lesempio 8.4.2 (2),
|f|
L
1
(R
N
)
=
__

1
2
x
2
dx
_
N
= (2)
N
2
= |
f|
,
e dunque |F| = 1.
Proviamo luniforme continuità. Se , h R
N
si ha
[
f( +h)

f()[ =
_
R
N
f(x)[e
i(x,h)
1]e
i(x,)
dm
N
(x)
=
=
F([e
i(,h)
1]f())()
|[e
i(,h)
1]f()|
L
1
(R
N
)
,
e lultimo membro tende a 0 per [h[ 0, in virt` u del teorema di convergenza
dominata (teorema 4.3.4).
Proviamo inne che

f() tende a 0 per [[ . Osservando che
e
i
(,)
||
2
= 1 R
N
0,
posto v
[[
2
ed eettuando il cambiamento di variabile x v
= y,
possiamo scrivere
f() =
_
R
N
f(x)e
i(x+

||
2
,)
dm
N
(x) =
_
R
N
f(y)e
i(y,)
dm
N
(y),
ove
v
f(y) = f(y +v
); ne segue
[2
f()[ =
_
R
N
[f(y)
v
f(y)]e
i(y,)
dm
N
(y)
|f
v
f|
L
1
(R
N
)
.
Se ora [[ , si ha [v
[ 0 e dunque, ricordando lesercizio 4.7.3 (che è

relativo a L
1
(R) ma vale anche, con analoga dimostrazione, in L
1
(R
N
)), si
conclude che [
f()[ 0. Ciò prova la tesi.

Osservazione 8.4.4 La trasformata di Fourier regolarizza le funzioni: se
f è solo sommabile, come abbiamo visto

f è continua; analogamente, se
x [x[f(x) è sommabile, utilizzando come in precedenza il teorema 4.3.4 si
deduce che

f è di classe C
1
e
229
D
j
f() = [F(ix
j
f(x))]().
La trasformata di Fourier ha anche limportante proprietà di tramutare il
prodotto di convoluzione (v. esercizio 5.4.4) in un prodotto ordinario:
Proposizione 8.4.5 Per f, g L
1
(R
N
) si ha
f g() =

f() g() R
N
.
Dimostrazione Notiamo che per ogni R
N
la funzione
(x, y) f(x y)g(y)e
i(x,)
è sommabile su R
N
R
N
; quindi, applicando il teorema di Fubini (teorema
5.4.4) otteniamo
f g() =
_
R
N
f g(x)e
i(x,)
dm
N
(x) =
=
_
R
N
__
R
N
f(x y)g(y)e
i(x,)
dm
N
(y)
_
dm
N
(x) =
=
_
R
N
__
R
N
f(x y)g(y)e
i(x,)
dm
N
(x)
_
dm
N
(y) =
=
_
R
N
__
R
N
f(u)g(y)e
i(u+y,)
dm
N
(u)
_
dm
N
(y) =
=
__
R
N
f(u)e
i(u,)
dm
N
(u)
___
R
N
g(y)e
i(y,)
dm
N
(y)
_
=
=

f() g().
Osservazione 8.4.6 Lo spazio L
1
(R
N
), munito del prodotto di convoluzio-
ne, è unalgebra, ossia è chiuso rispetto al prodotto, ed è priva di unità, cioè
non esiste alcuna funzione h L
1
(R
N
) tale che risulti h f = f per ogni
f L
1
(R
N
). Infatti se tale funzione h esistesse, avremmo per la proposi-
zione precedente

f =

h
f; dunque, scegliendo f in modo che

f() ,= 0 per
ogni R
N
dedurremmo

h 1 in R
N
. Ma ciò è in contraddizione con la
proposizione 8.4.3, perchè
h() non sarebbe innitesima per [[ .

Introduciamo adesso uno spazio di funzioni regolari, lo spazio di Schwartz,
sul quale, come vedremo fra poco, la trasformata di Fourier è bigettiva ed è
un isomorsmo.
230
Denizione 8.4.7 Lo spazio di Schwartz o(R
N
) è denito da
o(R
N
) = C
(R
N
) : x x
(x) L
(R
N
) , N
N
.
Ricordiamo che x
= x
1
1
. . .x
N
N
e che D
= D
1
1
. . . D
N
N
; inoltre si denisce
[[ =
1
+. . . +
N
per N
N
.
`
E immediato vericare che o(R
N
) è un sottospazio di L
p
(R
N
) per ogni p
[1, ]. Si noti poi che C
0
(R
N
) o(R
N
) e che linclusione è propria in
quanto la funzione f(x) = e
[x[
2
appartiene a o(R
N
) e non ha supporto
compatto; da questa inclusione segue in particolare che o(R
N
) è denso in
tutti gli spazi L
p
(R
N
) con p [1, [.
Nello spazio di Schwartz la trasformata di Fourier mostra la sua caratteristica
pi` u importante, che è quella di scambiare fra loro le operazioni di derivazione
e di moltiplicazione per monomi: di qui scaturisce lutilità di questo operatore
per la risoluzione di equazioni dierenziali.
Proposizione 8.4.8 Se o(R
N
) allora
() = i
[[
() R
N
,
D
() = (i)
[[
F(x
(x))() R
N
.
Dimostrazione La prima proprietà si ottiene integrando per parti [[ volte
nellintegrale che denisce

D
; ciò è possibile perche

lim
[x[
[x
(x)[ = 0 , N
N
, o(R
N
).
La seconda proprietà si ottiene per induzione a partire dal risultato dellos-
servazione 8.4.4.
Proposizione 8.4.9 La trasformata di Fourier manda o(R
N
) in se.
Dimostrazione Basta osservare che se o(R
N
) e , N
N
si ha, per
la proposizione precedente,
() =
(i)
[[
F(x
(x))() = (1)
[[
i
[[[[
F(D
(x
(x)))(),
da cui, per la proposizione 8.4.3,
[
()[ |D
(x
(x))|
L
1
(R
N
)
< R
N
.
La trasformata di Fourier non avrebbe limportanza applicativa che ha se
non ci fosse un modo per ricostruire la funzione originaria a partire dalla sua
trasformata. Ciò è possibile nello spazio o(R
N
):
231
Teorema 8.4.10 (formula di inversione) Se o(R
N
), allora si ha
(x) = (2)
N
_
R
N
()e
i(x,)
dm
N
() = (2)
N
(x) x R
N
;
in particolare F : o(R
N
) o(R
N
) è bigettiva.
Dimostrazione Non possiamo procedere nel modo pi` u naturale, che è quello
di sostituire la denizione di () nellintegrale candidato a fornire la formula
di inversione, in quanto per qualunque ssato x R
N
la funzione
(y, ) (y)e
i(y,)
e
i(x,)
non è sommabile in R
N
R
N
, cosicche non possiamo applicare il teorema
di Fubini. Otterremo il risultato con un procedimento di approssimazione.
Premettiamo il
Lemma 8.4.11 Per ogni , o(R
N
) si ha
_
R
N
() ()e
i(x,)
dm
N
() =
_
R
N
(u)(x +u)dm
N
(u) x R
N
.
(y, ) (y)()e
i(y,)
e
i(x,)
appartiene a L
1
(R
N
R
N
); dunque per il teorema 5.4.4 si ha
_
R
N
() ()e
i(x,)
dm
N
() =
=
_
R
N
()
__
R
N
(y)e
i(y,)
dm
N
(y)
_
e
i(x,)
dm
N
() =
=
_
R
N
(y)
__
R
N
()e
i(yx,)
dm
N
()
_
dm
N
(y) =
=
_
R
N
(y x)(y)dm
N
(y),
e la tesi del lemma segue tramite il cambiamento di variabile u = y x.
Dimostriamo la formula di inversione per una ssata o(R
N
). Scegliamo
f() = e
1
2
[[
2
; osserviamo che si ha
f(0) = 1,

f(u) = (2)
N
2
e
1
2
[u[
2
,
_
R
N
f(u)dm
N
(u) = (2)
N
.
232
Adesso, ssato > 0, applichiamo il lemma precedente alla funzione () =
f(): ricordando lesempio 8.4.2 (2), si ha
(u) =
N
f
_
u
_
=
N
(2)
N
2
e
1
2
|u|
2
2
,
cosicche dal lemma 8.4.11 ricaviamo
_
R
N
f() ()e
i(x,)
dm
N
() =
=
N
_
R
N
f
_
u
_
(x +u)dm
N
(u) =
_
y =
u
_
=
_
R
N
f(y)(x +y)dm
N
(y).
Per 0 dal teorema di Lebesgue (teorema 4.3.4) segue la relazione
_
R
N
()e
i(x,)
dm
N
() = (2)
N
(x),
che è la tesi del teorema.
Osservazione 8.4.12 Dal lemma 8.4.11 segue in particolare, scelto x = 0,
_
R
N
() ()dm
N
() =
_
R
N
(u)(u)dm
N
(u) , o(R
N
).
Enunciamo adesso il pi` u importante risultato della teoria della trasformata
di Fourier: esso esprime il fatto che loperatore F è un isomorsmo dello
spazio normato (o(R
N
), | |
L
2
(R
N
)
) in se, e che di conseguenza esso si può
estendere in modo unico, per densità, ad un isomorsmo di L
2
(R
N
) in se.
Teorema 8.4.13 (di Plancherel) Per ogni f, g o(R
N
) vale la formula
di Parseval
(
f, g)
L
2
(R
N
)
= (2)
N
(f, g)
L
2
(R
N
)
;
in particolare
|
f|
L
2
(R
N
)
= (2)
N
2
|f|
L
2
(R
N
)
f o(R
N
).
233
Dimostrazione Applicando losservazione precedente si ha
(
f, g)
L
2
(R
N
)
=
_
R
N
f() g() dm
N
() =
_
R
N
f(u)
g (u) dm
N
(u).
g() = g() =
_
R
N
g(x)e
i(x,)
dm
N
(x) =
_
R
N
g(x)e
i(x,)
dm
N
(x) =
g(),
ed anche, posto y = x,
g() =
_
R
N
g(x)e
i(x,)
dm
N
(x) =
_
R
N
g(y)e
i(y,)
dm
N
(y) =

g()();
quindi, per la formula di inversione,
g (u) =
g()(u) = (2)
N
g()(u) = (2)
N
g(u).
Pertanto
(
f, g)
L
2
(R
N
)
= (2)
N
_
R
N
f(u)g(u)dm
N
(u) = (2)
N
(f, g)
L
2
(R
N
)
.
Corollario 8.4.14 La trasformata di Fourier si estende in modo unico ad
un isomorsmo di L
2
(R
N
) in se, che denotiamo con lo stesso simbolismo. In
particolare si ha
(
f, g)
L
2
(R
N
)
= (2)
N
(f, g)
L
2
(R
N
)
f, g L
2
(R
N
),
f(x) = (2)
N
f (x) q.o. in R
N
f L
2
(R
N
);
inoltre, posto per ogni f L
2
(R
N
)
R
() =
_
[x[R
f(x)e
i(x,)
dm
N
(x),
R
(x) = (2)
N
_
[[R
f()e
i(x,)
dm
N
(),
risulta
lim
R
|
R

f|
L
2
(R
N
)
= 0, lim
R
|
R
f|
L
2
(R
N
)
= 0.
234
Dunque la formula esplicita della trasformata di Fourier si estende a tut-
te le funzioni di L
2
(R
N
) non in modo automatico, ma soltanto in un senso
opportuno:

f è limite in L
2
(R
N
) delle funzioni
R
il cui valore è una appros-
simazione della formula della trasformata di Fourier.
Dimostrazione Se f L
2
(R
N
), e
n
è una successione contenuta in
o(R
N
) che converge a f in L
2
(R
N
), poniamo

f = lim
n

n
; questo limite
esiste in L
2
(R
N
) grazie al teorema di Plancherel.
`
E immediato vericare che
la denizione non dipende dalla successione approssimante, ma solo dalla
f.
`
E allora facile vericare che loperatore F, denito da F(f) =

f, è un
isomorsmo vericante la prima uguaglianza dellenunciato. La seconda pro-
prietà dellenunciato si ottiene passando ad una sottosuccessione di
n
che
converga q.o. a f.
Proviamo lultima parte della tesi. Posto
R
=
[x[R
per ogni R > 0,
osservato che
R
f L
1
(R
N
) L
2
(R
N
) si vede subito che
R
=

(
R
f), lim
R
|
R
f f|
L
2
(R
N
)
= 0,
da cui
lim
R
|
R

f|
L
2
(R
N
)
= 0.
Similmente, si ha
R
(x) = (2)
N
(
R
f)(x), lim
R
|
R
f

f|
L
2
(R
N
)
= 0,
da cui
lim
R
|(2)
N
R
()

f |
L
2
(R
N
)
= 0,
e inne, invertendo il segno della variabile di integrazione ed applicando poi
la formula di inversione,
lim
R
|
R
f|
L
2
(R
N
)
= 0.
Concludiamo il paragrafo mostrando come applicare la trasformata di Fourier
per risolvere unequazione alle derivate parziali. Consideriamo lequazione del
calore
u
t
(x, t) = u(x, t), (x, t) R
N
]0, [,
235
dove è loperatore di Laplace, denito da
u =
N
i=1
D
2
i
u, D
i
=

x
i
.
Procederemo formalmente, cercando di ricavare in forma esplicita una fun-
zione candidata al ruolo di soluzione: a posteriori, poi, potremo vericare
rigorosamente che essa risolverà davvero lequazione.
Applichiamo la trasformata di Fourier ad entrambi i membri dellequazione
del calore: coinvolgendo solo le variabili x
i
ma non la t, essa commuta con la
derivazione rispetto a t e quindi, ricordando la proposizione 8.4.8, troviamo
lequazione
0 =

u
u
t
= [[
2
u
u
t
, (, t) R
N
]0, [.
Risolviamo questa equazione dierenziale ordinaria nella variabile t: le solu-
zioni sono della forma
u(, t) = c()e
[[
2
t
,
con c() funzione arbitraria. Dato che la trasformata di Fourier è un iso-
morsmo, possiamo porre c() = (), con funzione altrettanto arbitraria,
mentre dallesempio 8.4.2 (2), con a =
1
4t
, segue che
e
[[
2
t
= T
_
e
||
2
4t
(4t)
N/2
_
();
quindi possiamo scrivere
u(, t) = () T
_
e
||
2
4t
(4t)
N/2
_
() = T
_

e
||
2
4t
(4t)
N/2
_
(),
ovvero
u(x, t) =
e
||
2
4t
(4t)
N/2
(x) =
1
(4t)
N/2
_
R
N
e
|xy|
2
4t
(y) dm
N
(y).
Non è troppo dicile vericare che questa funzione risolve il problema di
Cauchy
_
u
t
= u in R
N
]0, [
u(, 0) = in R
N
,
236
nel senso che essa è soluzione dellequazione dierenziale in R
N
]0, [ ed
inoltre verica
lim
t0
+
u(x, t) = (x) x R
N
,
purche la funzione sia continua in R
N
e soddis la condizione
x e
[x[
(x) L
1
(R
N
) per qualche > 0
(ad esempio è ovviamente suciente che sia continua e limitata su R
N
).
Il nucleo dellintegrale di convoluzione che denisce la soluzione u, ossia la
funzione
K(x, t) =
e
|x|
2
4t
(4t)
N/2
, (x, t) R
N
]0, [,
si chiama soluzione fondamentale dellequazione del calore, o anche nucleo
del calore.
Esercizi 8.4
1. Per R 0 e f L
1
(R
N
) si ponga m
f(x) = f(x). Si provi che
f = [[
N
m
1/
f.
2. Per ogni v R
N
e f L
1
(R
N
) si ponga
v
f(x) = f(x +v), e
v
f(x) = e
i(v,x)
f(x).
Si provi che
v
f = e
v
f,
v
f =

(e
v
f).
3. Sia A una matrice reale N N unitaria, ossia tale che [ det A[ = 1.
Provare che per ogni f L
1
(R
N
) si ha
f A =

f A.
4. Sia f L
1
(R
N
) una funzione reale strettamente positiva. Provare che
[
f()[ <

f(0) R
N
0.
237
5. Sia N = 1 e sia f L
1
(R); si provi che se f è pari allora
f() = 2
_

0
f(x) cos x dx R,
mentre se f è dispari allora
f() = 2i
_

0
f(x) sin x dx R.
6. Calcolare la trasformata di Fourier delle funzioni
f(x) = e
[x[
, g(x) =
1
2
+x
2
, x R,
ove è una costante positiva.
7. Calcolare esplicitamente la funzione f
n
=
[n,n]

[1,1]
; trovare poi la
funzione tale che f
n
= .
8. Calcolare la trasformata di Fourier delle seguenti funzioni denite su
R:
f
1
(x) = max1 [x[, 0,
f
2
(x) = sgn(x) f
1
(x),
f
3
(x) = cos
x
2

[,]
(x),
f
4
(x) = sgn(x)
[1,1]
(x) e
[x[
,
f
5
(x) = sgn(x) max1 [x[,
1
2

[1,1]
(x).
9. Sia una misura nita su (R, /). Si denisca la seguente funzione
: R C:
() =
_
R
e
ix
d(x), R.
(i) Si provi che è una funzione continua e limitata.
(ii) Se inoltre è concentrata su un insieme limitato, si mostri che
C
(R).
(iii) Si scriva esplicitamente nei casi seguenti:
(a) = f dm, f L
1
(R); (b) =
0
; (c) =
n=1
2
n
n
.
238
Capitolo 9
Spazi L
p
9.1 La norma di L
p
Descriviamo in questo capitolo una nuova famiglia di spazi di Banach, assai
importanti per la ricchezza delle proprietà di cui godono: gli spazi L
p
. Fra
tutti gli spazi di Banach, la struttura di questi spazi è quella che pi` u si avvi-
cina a quella hilbertiana. Di questa famiglia conosciamo già alcuni membri,
e cioè L
(paragrafo 3.3), L
1
(paragrafo 4.6) e L
2
(esempio 7.2.6 (3)).
Sia (X, T, ) uno spazio misurato, e sia 1 p < . Poniamo
/
p
(X) =
_
f : X R : f è misurabile e
_
X
[f[
p
d <
_
;
si vede facilmente che /
p
(X) è uno spazio vettoriale. Infatti se f /
p
(X)
allora ovviamente f /
p
(X); poi, se f, g /
p
(X) allora anche f + g
/
p
(X), in quanto tale funzione è misurabile ed inoltre, per la convessità in
[0, [ della funzione t t
p
, si ha
[f(x) +g(x)[
p
[[f(x)[ +[g(x)[]
p
2
p1
[[f(x)[
p
+[g(x)[
p
],
da cui, integrando su X,
_
X
[f +g[
p
d 2
p1
__
X
[f[
p
d +
_
X
[g[
p
d
_
< .
Indicata con labituale relazione dequivalenza che identica le funzioni
q.o. coincidenti, diamo la seguente
239
Denizione 9.1.1 Lo spazio quoziente /
p
(X)/ si indica con L
p
(X).
`
E chiaro che L
p
(X) è uno spazio vettoriale. Deniamo
|f|
p
=
__
X
[f[
p
d
_1
p
;
dimostreremo che ||
p
è una norma che rende L
p
(X) uno spazio di Banach. Si
osservi che le prime due proprietà caratteristiche della norma sono immediate,
e che lunica verica non banale è quella della subadditività.
A questo scopo proveremo dapprima unaltra fondamentale disuguaglianza.
Per 1 p indichiamo con q lesponente coniugato di p, cioè il numero
denito dalla relazione
1
p
+
1
q
= 1;
dunque
q =
_
_
1 se p =
p
p1
se 1 < p <
se p = 1.
`
E chiaro che q è lesponente coniugato di p se e solo se p è lesponente
coniugato di q. Si noti anche che 2 è il coniugato di se stesso.
Proposizione 9.1.2 (disuguaglianza di Holder) Sia p [1, ] e sia q
lesponente coniugato di p. Se f L
p
(X) e g L
q
(X), allora fg L
1
(X) e
|fg|
1
|f|
p
|g|
q
.
Dimostrazione La disuguaglianza è banale se p = 1 (oppure, simmetrica-
mente, se p = ): in tal caso infatti la tesi segue integrando la disuguaglianza
[f(x)g(x)[ [f(x)[|g|
q.o. in X.
Supponiamo dunque p ]1, [ e, di conseguenza, q =
p
p1
]1, [. Si osservi
anche che se p = q = 2 la disuguaglianza di Holder si riduce a quella di
Cauchy-Schwarz (proposizione 7.2.2). Si noti poi che se |f|
p
= 0 oppure
|g|
q
= 0 allora si ha fg = 0 q.o. in X, cosicche la tesi è evidente; supporremo
pertanto |f|
p
e |g|
q
non nulle.
240
Proviamo la disuguaglianza di Holder. In virt` u della convessità di t e
t
,
per ogni a, b > 0 vale la relazione (disuguaglianza di Young)
ab = e
1
p
log a
p
+
1
q
log b
q
1
p
e
log a
p
+
1
q
e
log b
q
=
a
p
p
+
b
q
q
;
daltronde questa disuguaglianza è ovviamente vera anche per a = 0 oppure
b = 0. Perciò, essendo f e g q.o. nite su X,
[f(x)g(x)[
[f(x)[
p
p
+
[g(x)[
q
q
q.o. in X,
da cui, integrando su X,
|fg|
1

1
p
|f|
p
p
+
1
q
|g|
q
q
.
Ora, se |f|
p
= |g|
q
= 1 la tesi è provata perche otteniamo |fg|
1

1
p
+
1
q
= 1;
altrimenti, posto
F(x) =
f(x)
|f|
p
, G(x) =
g(x)
|g|
q
,
risulta |F|
p
= |G|
q
= 1 e dunque, per quanto già dimostrato,
|fg|
1
|f|
p
|g|
q
= |FG|
1
1,
che è la tesi.
Osservazione 9.1.3 Si noti che la dimostrazione precedente dice qualcosa di
pi` u: la relazione [f(x)g(x)[
[f(x)[
p
p
+
[g(x)[
q
q
q.o. in X vale anche , ovviamente,
nei punti in cui [f(x)[ oppure [g(x)[ valgono +, e pertanto, integrando su
X, si ottiene che la disuguaglianza vale per ogni coppia di funzioni misurabili
f, g (eventualmente nella forma + +). In particolare, se p e q sono
esponenti coniugati e se fg non appartiene a L
1
, si deduce che o f / L
p
, o
g / L
q
.
Corollario 9.1.4 (disuguaglianza di Minkowski) Se p [1, ] e f, g
L
p
(X), allora
|f +g|
p
|f|
p
+|g|
p
.
241
Dimostrazione I casi p = 1 e p = (ed anche quello in cui p = 2) sono
già noti. Se 1 < p < si ha
_
X
[f+g[
p
d =
_
X
[f+g[[f+g[
p1
d
_
X
[f[[f+g[
p1
d+
_
X
[g[[f+g[
p1
d.
Osservando che [f + g[
p1
L
q
(X) ( in quanto (p 1)q = p) ed applicando
la disuguaglianza di Holder si ottiene
|f +g|
p
p
=
_
X
[f +g[
p
d |f|
p
|[f +g[
p1
|
q
+|g|
p
|[f +g[
p1
|
q
=
= (|f|
p
+|g|
p
)
__
X
[f +g[
(p1)q
d
_1
q
=
= (|f|
p
+|g|
p
) |f +g|
p1
p
.
Ne segue la tesi se |f +g|
p
> 0; daltronde quando |f +g|
p
= 0 la tesi stessa
è banale.
La funzione f |f|
p
è dunque una norma sullo spazio L
p
(X).
Proposizione 9.1.5 L
p
(X) è uno spazio di Banach.
Dimostrazione Utilizzando il lemma 7.1.2, sarà suciente mostrare che
per ogni successione f
n
L
p
, tale che
n=0
|f|
p
< , la serie
n=0
f
n
è
convergente nella norma | |
p
. Per ogni n N poniamo
g
n
(x) =
n
k=0
[f
k
(x)[, g(x) =
k=0
[f
k
(x)[, x X;
allora g
n
L
p
e
|g
n
|
p

n
k=0
|f
k
|
p
M < n N,
e per il teorema di B. Levi
_
X
g
p
d = lim
n
_
X
g
p
n
d M
p
,
242
cioè g L
p
. Ne segue che g è q.o. nita, ossia la serie
k=0
f
k
(x) è assolu-
tamente convergente per q.o. x X, e dunque la sua somma f(x) è denita
q.o. in X; per di pi` u, tale funzione f individua un elemento di L
p
in quanto
_
X
[f[
p
d
_
X
g
p
d M
p
.
Inoltre, posto
s
n
(x) =
n
k=0
f
k
(x), x X,
si ha s
n
f q.o. per n e [s
n
[ g q.o. per ogni n; dunque [s
n
f[
p
(2g)
p
q.o. per ogni n. Per il teorema di convergenza dominata, si ottiene
s
n
f in L
p
, ossia la serie
n=0
f
n
è convergente nella norma | |
p
.
Osservazione 9.1.6 La proposizione precedente si può dimostrare anche
ripetendo le argomentazioni usate per provare la completezza di L
1
(teorema
4.6.2). In tal modo si ottiene qualcosa di pi` u, e cioè il fatto che se f
n
f in
L
p
, allora esiste una sottosuccessione f
n
k
tale che f
n
k
(x) f(x) per q.o.
x X, e [f
n
k
(x)[ g(x) q.o. in X, con g L
p
.
Osservazione 9.1.7 In analogia con lesempio 7.2.6 (4), si può considerare
anche lo spazio L
p
(X, C) delle funzioni f : X C tali che [f[
p
è sommabile
su X. Ciò accade se e solo se Re f e Im f appartengono a L
p
(X). La norma
su tale spazio è ancora |f|
p
=
__
X
[f[
p
d
1
p
.
Esercizi 9.1
1. Siano p, q > 1 con
1
p
+
1
q
= 1. Dimostrare che la disuguaglianza di Holder
diventa unuguaglianza se e solo se esistono , 0, non entrambi
nulli, tali che
[f(x)[
p
= [g(x)[
q
q.o. in X.
2. Siano f, g L
1
(X): si provi che |f + g|
1
= |f|
1
+ |g|
1
se e solo se
fg 0 q.o. in X.
3. Sia p ]1, [. Dimostrare che la disuguaglianza di Minkowski diventa
unuguaglianza se e solo se esistono , 0, non entrambi nulli, tali
che
f(x) = g(x) q.o. in X.
243
4. Si provi che se (X) < si ha L
p
(X) L
r
(X) per p > r, mentre ciò
è falso se (X) = .
5. Posto per 1 p < (v. anche gli esercizi 7.2.3 e 7.1.5)
p
= x = x
n
nN
: |x|
p
p
=
n=0
[x
n
[
p
< ,
si verichi che
p
coincide con L
p
(N, T(N), ), ove è la misura car-
dinalità; si provi poi che
1

p

r

per 1 < p < r < , e che

le corrispondenti inclusioni sono continue con norme uguali a 1.
6. Sia a = a
n
nN

p
, 1 0,
appartiene a L
2
(0, ) ma non sta in alcun L
p
(0, ) con p ,= 2. Fis-
sato p [1, ], si trovi poi, analogamente, una funzione g che stia in
L
p
(0, ) ma non in L
r
(0, ) per r ,= p.
8. Sia X =
1p<
L
p
(0, 1); si verichi che L
(0, 1) è contenuto pro-

priamente in X. Si provi che, similmente, si ha linclusione propria
L
p
(0, 1)
1r 1. Si provi che F(x) =
_
x
a
f(t) dt è una
funzione holderiana in [a, b] di esponente 1
1
p
, ossia esiste K 0 tale
che
[F(x) F(y)[ K[x y[
1
1
p
x, y [a, b],
e che anzi risulta addirittura
lim
r0
+
sup
0<[xy[r
[F(x) F(y)[
[x y[
1
1
p
= 0.
244
10. Sia f L
p
(R), con 1 < p < . Posto F(x) =
_
x
0
f(t) dt, si provi che
se
1
p
+
1
q
= 1 si ha
lim
x0
[x[
1
q
F(x) = 0, lim
x
[x[
1
q
F(x) = 0.
11. Sia (X, T, ) uno spazio misurato con (X) < . Se f è misurabile
su X, si provi che
lim
p
|f|
p
= |f|
.
12. Sia (X, T, ) uno spazio misurato con (X) < . Se f è misurabile e
tale che 0 <
_
X
[f[
n
d < denitivamente, si provi che
lim
n
_
X
[f[
n+1
d
_
X
[f[
n
d
= |f|
.
13. Sia f L
p
L
r
, con p < r; si provi che f L
s
per ogni s ]p, r[, e che
si ha
(i) |f|
s
|f|
p
|f|
1
r
, ove
1
s
=

p
+
1
r
;
(ii) |f|
s
|f|
r
+
|f|
p
> 0, ove =
1
p
1
s
1
s
1
r
.
14. Sia una misura -nita e sia f L
p
; si provi che per ogni > 0
esiste un insieme misurabile A
, di misura nita, tale che

_
A
[f[
p
d < .
15. Sia (X) < e sia f
n
una successione limitata in L
r
, ove 1 < r .
Se f
n
(x) f(x) q.o. in X e se 1 p < r, si provi che f
n
f in L
p
.
Si verichi che il risultato è falso se p = r oppure se (X) = .
[Traccia: usare il teorema di Severini-Egorov.]
16. Sia (X, T, ) uno spazio misurato con (X) < , e sia f
n
nN
una
successione di funzioni sommabili su X, tali che
(a) f
n
0 in misura;
(b) sup
nN
|f
n
|
1
< .
245
Si provi che risulta
lim
n
_
X
_
[f
n
g[ d = 0 g L
1
(X).
17. Sia f
n
una successione limitata in L
p
, con p > 1. Se f
n
(x) f(x)
q.o., si provi che f L
p
e che
lim
n
_
X
f
n
g d =
_
X
fg d g L
q
,
ove
1
p
+
1
q
= 1. Si provi anche che lenunciato è falso per p = 1.
[Traccia: dopo avere ridotto il problema al caso (X) < , usare il
teorema di Severini-Egorov.]
18. Sia (X) = , e sia f una funzione misurabile, illimitata sul comple-
mentare di ogni insieme di misura nita.
`
E possibile che f appartenga
a L
p
?
19. Trovare una funzione f L
p
(R), 1 p < , illimitata sul comple-
mentare di ogni compatto. Trovarne unaltra che, in pi` u, sia di classe
C
su R.
20. Sia f
n
una successione di funzioni misurabili tali che f
n
(x) f(x)
q.o. e [f
n
(x)[ g(x) q.o., con g L
p
, 1 p < ; si provi che f
n
f
in L
p
.
21. Se f
n
f in L
p
, e ]0, p], si provi che [f
n
[
[f[
in L
p
.
22. Dimostrare che se f L
p
(R), 1 p < , e f è uniformemente continua
su R, allora lim
[x[
f(x) = 0.
23. Si considerino le convoluzioni denite nellesercizio 5.4.5. Nelle nota-
zioni ivi introdotte, si provi che se f L
p
(R
N
), 1 p < , allora
f
f in L
p
(R
N
) per 0
+
.
24. Si provi che o è denso in L
p
(X) per 1 p , e che o
0
è denso in
L
p
(X) per 1 p < .
25. Si provi che C
0
0
(R) e C
0
(R) sono densi in L
p
(R) per 1 p < .
246
26. Si provi che le funzioni costanti a tratti sono dense in L
p
(a, b), 1 p <
.
27. Sia f L
p
(R), 1 p < ; provare che
lim
1
_
R
[f(x) f(x)[
p
dx = 0, lim
h0
_
R
[f(x +h) f(x)[
p
dx = 0.
[Traccia: utilizzare la densità di C
0
0
(R).]
28. Si provi che L
p
(R) è separabile per 1 p < .
29. Siano f L
1
(R) e g L
p
(R). Si provi che la convoluzione f g (v.
esercizio 5.4.4) appartiene a L
p
(R) e che |f g|
p
|f|
1
|g|
p
. Si provi
inoltre che se g L
(R), allora f g è uniformemente continua su R.

30. Sia la misura su ]0, [ denita da
(E) =
_
E
dt
t
E /, E ]0, [,
e si consideri la convoluzione moltiplicativa
(f g)() =
_

0
f(t)g(t) d(t), f, g L
1
().
(i) Si verichi che f g = g f per ogni f, g L
1
().
(ii) Si provi che se f L
1
() e g L
p
(), 1 p , allora f g
L
p
() e
|f g|
p
|f|
1
|g|
p
.
31. Per ogni h R si consideri loperatore
(T
h
f)(x) = f(x +h) f(x h), x R.
(i) Si provi che T
h
/(L
p
(R)) per ogni p [1, ], con
|T
h
|
/(L
p
(R))
= 2.
(ii) Si dimostri che se p [1, [ allora per ogni f L
p
(R) si ha
T
h
f 0 in L
p
(R) per h 0,
e che ciò è falso per p = .
247
32. Fissata una successione a
1
, sia K loperatore denito da:
(Kx)
n
=
n
k=0
a
nk
x
k
, x
p
.
(i) Si provi che K /(
p
) per ogni p [1, ], e che
|K|
/(
p
)
|a|
1 .
(ii) Per p = 1 si calcoli la norma |K|
/(
1
)
.
Traccia: Si provi che, detto
m
:
p

p
loperatore denito da
(
m
x)
k
=
_
x
mk
se k m
0 se 0 k < m,
risulta Kx =
m=0
a
m
m
x per ogni x
p
, ove la serie converge nel
senso di
p
. . . ]
33. Sia : R R una funzione misurabile e sia T loperatore denito
da Tf(x) = (x)f(x). Determinare condizioni necessarie e sucienti
anche:
(a) T sia continuo da L
p
(R) in L
p
(R);
(b) T sia continuo ed iniettivo;
(c) T sia continuo con inverso continuo.
34. Per p ]0, 1[ si denisca L
p
(X) come nella denizione 9.1.1. Si provi
che:
(i) | |
p
non è subadditiva;
(ii) la funzione
d(f, g) =
_
X
[f g[
p
d, f, g L
p
(X),
è una distanza su L
p
(X) ed inoltre lo spazio (L
p
(X), d) è completo.
248
35. (Disuguaglianza di Jensen) Sia (X, T, ) uno spazio misurato con (X)
= 1; sia f : X R una funzione misurabile tale che a < f(x) < b per
ogni x X (ove a < b +), e sia :]a, b[ R una funzione
convessa. Si provi che
__
X
f d
_
_
X
f d
[Traccia: si verichi anzitutto che f è misurabile. Poi, posto
t =
_
X
f d e = sup
s]a,t[
(t)(s)
ts
, si provi che
(f(x)) (t) (f(x) t) x X . . . ]
36. (Disuguaglianza di Hardy) Sia 1 < p < . Posto F(x) =
1
x
_
x
0
f(t) dt
per ogni f L
p
(0, ), si provi che |F|
p

p
p1
|f|
p
, e che
p
p1
è la
migliore costante possibile.
[Traccia: supponendo dapprima f 0 e f C
0
0
(]0, [), si integri
per parti
_
0
F(t)
p
dt, e si osservi che xF
t
(x) = f(x) F(x). . . . Poi
si passi al caso generale. Per lultima aermazione si considerino le
funzioni x x
1
p
]0,n[
(x), n N.]
37. Si provi la disuguaglianza
n=0
_
1
n + 1
n
k=0
[x
k
[
_
p
_
2p
p 1
_
p
k=0
[x
k
[
p
x
p
, p [1, [.
Traccia: si applichi la disuguaglianza di Hardy alla funzione f che vale
x
n
sullintervallo [n, n + 1[, n N.]
38. Sia T loperatore cos` denito:
Tf(x) =
_
x+1
x
f(t)dt, x R.
(i) Si provi che per ogni p [1, ] si ha T /(L
1
(R), L
p
(R)) e se ne
calcoli la norma;
(ii) Si dimostri che per ogni f L
1
(R) si ha:
(a) la funzione Tf è uniformemente continua su R;
(b) la funzione Tf è assolutamente continua in ogni [a, b] R;
249
(c) la funzione Tf è innitesima per x .
39. Fissato [0, 1] si consideri linsieme X
costituito dalle funzioni

f : R
N
R misurabili che vericano la seguente proprietà:
C > 0 :
_
E
[f[dm
N
Cm
N
(E)
E /
N
con m
N
(E) 1.
(i) Vericare che se si ha X
.
(ii) Provare che L
p
(R
N
) X
1
1
p
per ogni p [1, [.
(iii) Dimostrare che L
(R
N
) = X
1
.
9.2 Il duale di L
p
Questo paragrafo è dedicato alla caratterizzazione del duale dello spazio
L
p
(X), 1 p < , nel caso in cui la misura sia -nita e che le funzioni
siano a valori reali. Vale il seguente, importante risultato:
Teorema 9.2.1 (di Riesz-Fischer) Sia (X, T, ) uno spazio misurato -
nito e sia p [1, [. Per ogni F (L
p
(X))
esiste ununica funzione

f L
q
(X), ove q è lesponente coniugato di p, tale che
Fg =
_
X
gf d g L
p
(X);
si ha inoltre
|F|
(L
p
)
= |f|
q
.
Dimostrazione Proviamo anzitutto lultima aermazione, ossia che se F
è il funzionale g
_
X
gf d, con f L
q
, allora la norma di F è uguale
a |f|
q
. Se p = 1, questo lo sappiamo già (esempio 7.3.6 (4)). Se 1 <
p < , dalla disuguaglianza di Holder segue subito [Fg[ |g|
p
|f|
q
e
quindi |F|
(L
p
)
|f|
q
; daltra parte, scelta g = [f[
q
p
sgnf, si trova Fg =
_
X
[f[
q
d = |g|
p
|f|
q
, da cui |F|
(L
p
)
= |f|
q
.
Proviamo ora lunicità della funzione f: se due funzioni f
1
, f
2
L
q
soddisfano
entrambe la tesi, allora risulta
_
X
g(f
1
f
2
)d = 0 g L
p
.
250
Dunque il funzionale F
0
, denito da F
0
g =
_
X
g(f
1
f
2
)d è identicamente
nullo; ne segue, per quanto appena visto, 0 = |F
0
|
(L
p
)
= |f
1
f
2
|
q
, cosicche
f
1
= f
2
.
Veniamo alla dimostrazione dellesistenza di f. Proveremo dapprima il ri-
sultato per i funzionali positivi, cioè i funzionali F (lineari e continui) tali
che
g 0 q.o. in X = Fg 0;
nel primo passo supporremo (X) < , e nel secondo passo tratteremo il
caso generale in cui è -nita. Inne, il terzo passo consisterà in una propo-
sizione in cui si mostrerà che ogni funzionale lineare e continuo si decompone
nella dierenza di due funzionali positivi, e da qui seguirà il teorema per
qualunque elemento di (L
p
)
.
1
o
passo Sia dunque (X) < e ssiamo un funzionale positivo F (L
p
)
.
Se F = 0, la tesi è evidentemente soddisfatta prendendo f = 0; supponiamo
quindi |F|
(L
p
)
> 0. Deniamo
(E) = F
E
E T,
e verichiamo che la funzione di insieme è una misura su T. Intanto,
essa è non negativa per la positività di F, ed è nitamente additiva sugli
insiemi disgiunti grazie alla linearità di F. La numerabile additività di
è conseguenza dalla continuità di F: infatti se E =
n=0
E
n
, con gli E
n
elementi disgiunti di T, allora posto A
n
=
n
k=0
E
k
si ha A
n
A
n+1
per ogni
n N e
n=0
A
n
= E. Ne segue, in virt` u della proposizione 2.1.5,
|
E

An
|
p
= ((E A
n
))
1
p
0 per n ,
da cui, essendo F continuo, F
An
F
E
; osservato che
An
=
n
k=0
E
k
,
ricaviamo
n
k=0
(E
k
) =
n
k=0
F
E
k
= F
An
F
E
= (E).
Ci` o prova che (E) =
n=0
(E
n
). Dato che, ovviamente, () = F(0) = 0,
concludiamo che è una misura; essendo poi (X) = F
X
|F|
(L
p
)
(X)
1
p
,
la misura è nita. Notiamo inne che poiche
E T, (E) = 0 =
E
= 0 q.o. = |
E
|
p
= 0 =
= F
E
= 0 = (E) = 0.
251
Possiamo allora applicare il teorema di Radon-Nikod ym (corollario 8.2.4),
ottenendo che esiste ununica funzione f L
1
(X, ), q.o. non negativa, tale
che
F
E
= (E) =
_
E
f d E T.
Per la linearità di F, ed essendo (X) < , si deduce subito
F =
_
X
f d o;
dalla densità di o in L
(X, ) (esercizio 3.3.4, ovvero osservazione 3.1.8),

otteniamo che per ogni g L
esiste
n
o tale che
n
g in L
p
e in
L
. Dunque dalla relazione precedente scritta per le

n
, per la continuità
di F su L
p
e per convergenza dominata si deduce
Fg =
_
X
gf d g L
.
Per concludere il 1
o
passo, dobbiamo vericare che f L
q
(e non solo f
L
1
), e che la relazione sopra scritta vale per ogni g L
p
(e non solo g L
).
Se p > 1, deniamo
f
n
(x) =
_
f(x) se [f(x)[ n
0 se [f(x)[ > n,
g
n
(x) = sgnf(x) [f
n
(x)[
q
p
.
Allora f
n
L
, g
n
L
; inoltre |g
n
|
p
= (|f
n
|
q
)
q
p
, e
|f
n
|
q
q
=
_
X
g
n
f d = Fg
n
|F|
(L
p
)
|g
n
|
p
= |F|
(L
p
)
(|f
n
|
q
)
q
p
,
da cui |f
n
|
q
|F|
(L
p
)
. Dal teorema di B. Levi si deduce allora |f|
q

|F|
(L
p
)
.
Se invece p = 1 e q = , consideriamo per ogni k N
+
linsieme E
k
= x
X : [f(x)[ > |F|
(L
1
)
+
1
k
, e poniamo g
k
= sgnf
E
k
; allora g
k
L
1
L
e |g
k
|
1
= (E
k
). Quindi
_
|F|
(L
1
)
+
1
k
_
(E
k
)
_
E
k
[f[d =
_
X
g
k
f d = Fg
k

|F|
(L
1
)
|g
k
|
1
= |F|
(L
1
)
(E
k
),
252
il che implica (E
k
) = 0 per ogni k N
+
: dunque [f(x)[ |F|
(L
1
)
q.o. e
pertanto |f|
|F|
(L
1
)
.
Sia ora g L
p
. Poniamo
g
n
(x) =
_
g(x) se [g(x)[ n
0 se [g(x)[ > n,
ed osserviamo che g
n
L
, g
n
g in L
p
(per convergenza dominata) e
g
n
f gf in L
1
(per la disuguaglianza di Holder). Quindi otteniamo
Fg = lim
n
Fg
n
= lim
n
_
X
g
n
f d =
_
X
gf d g L
p
.
Ci` o conclude la dimostrazione del 1
o
passo.
2
o
passo Supponiamo ora -nita e sia F (L
p
)
un funzionale positivo.
Come si è osservato nel corso della dimostrazione del teorema 8.2.3, dal fatto
che è -nita segue che esiste una funzione w L
1
() tale che 0 < w(x) < 1
per ogni x X. Deniamo
(E) =
_
E
w d, E T;
è una misura nita su T. Lapplicazione g gw
1
p
è unisometria di L
p
()
in L
p
(): infatti
|gw
1
p
|
p
L
p
()
=
_
X
[g[
p
w d =
_
X
[g[
p
d = |g|
p
L
p
()
.
Di conseguenza, denendo F = F(w
1
p
) per ogni L
p
(), si ha che F
appartiene a (L
p
())
ed è un funzionale positivo. Dunque, per il 1

o
passo
esiste h L
q
(), q.o. non negativa, tale che
F =
_
X
h d L
p
().
Deniamo f = hw
1
q
(nel caso q = , prenderemo f = h e largomento che
segue funziona ugualmente): per quanto sopra osservato, risulta f L
q
() e
|f|
L
q
()
= |h|
L
q
()
; inoltre, per ogni g L
p
() si ha
Fg = F(gw
1
p
) =
_
X
gw
1
p
h d =
_
X
gw
1
p
fw
1
q
w d =
_
X
gf d.
Ci` o prova il 2
o
passo.
3
o
passo Dimostriamo la seguente
253
Proposizione 9.2.2 Sia Y = C
0
oppure Y = L
p
, 1 p . Allora ogni
elemento F Y
si può scrivere nella forma F = G H ove G, H Y
e
G, H sono funzionali positivi.
Dimostrazione Fissato F Y
, deniamo il funzionale G ponendo per

ogni Y
G =
_
supFg : 0 g se 0
G
+
G
altrimenti,
ove
+
= max, 0,
= min, 0 (e le disuguaglianze sono da inten-

dersi q.o. nel caso che sia Y = L
p
); deniamo poi il funzionale H in modo
che valga la tesi:
H = G F.
Si tratta ora di provare che G e H sono funzionali lineari, continui e positivi.
Procederemo in varie tappe.
(1) Se Y e 0, allora G 0 e H 0; quindi G e H sono funzionali
positivi.
Infatti per denizione si ha G F(0) = 0, e G F.
(2) Se
1
,
2
Y e
1
,
2
0, allora G(
1
+
2
) = G
1
+G
2
.
Infatti, se 0 g
1

1
e 0 g
2

2
, allora 0 g
1
+ g
2

1
+
2
e quindi
G(
1
+
2
) F(g
1
+g
2
) = Fg
1
+Fg
2
; per larbitrarietà di g
1
e g
2
si deduce
G(
1
+
2
) G
1
+G
2
. Daltra parte, se 0 g
1
+
2
, ponendo
g
1
(x) = ming(x),
1
(x), g
2
(x) = g(x) g
1
(x),
si ha 0 g
1

1
e g
2
= g g
1
= maxg
1
, 0, da cui 0 g
2

2
. Ne
segue
G
1
+G
2
Fg
1
+Fg
2
= F(g
1
+g
2
) = Fg,
da cui, per larbitrarietà di g, G
1
+G
2
G(
1
+
2
).
(3) Se Y e = , con , 0, allora G = G G; in altre
parole, il valore di G è indipendente dal modo in cui scriviamo come
dierenza di funzioni non negative.
Ricordiamo che per denizione G = G
+
G
, ove
+
= max, 0,
= min, 0; quindi se = si ha
+
+ = +
, e dunque
dalla proprietà (2) si deduce G
+
+G = G +G
, da cui la tesi.
(4) G(
1
+
2
) = G
1
+G
2
per ogni
1
,
2
Y .
254
Infatti
1
+
2
= (
+
1
+
+
2
) (
1
+
2
), da cui la tesi per (3) e (2).
(5) Se Y e 0, allora G(c) = c G per ogni c > 0.
Infatti, per denizione di G,
G(c) = supFg : 0 g c = c sup
_
F
_
g
c
_
: 0
g
c

_
= c G.
(6) Se Y , allora G(c) = c G per ogni c > 0.
Infatti, dalla denizione e da (5) si deduce
G(c) = G(c
+
) G(c
) = c G
+
c G
= c G.
(7) Se Y , allora G(c) = c G per ogni c 0.
Infatti, se c = 0 il risultato è ovvio; se c < 0 si ha da (3) e (5)
G(c) = G([c[
[c[
+
) = G([c[
) G([c[
+
) =
= [c[G
[c[G
+
= c G
+
c G
= c G.
Abbiamo cos` provato la linearità di G, e dunque, per dierenza, anche quella
di H. Rimane da vericare che G e H sono elementi di Y
: in eetti si ha
per ogni Y
[G[ G
+
+G
= G([[) = supFg : 0 g [[
|F|
Y
sup|g|
Y
: 0 g [[ = |F|
Y
||
Y
.
Ci` o prova che G (e quindi anche H) è un operatore limitato. La proposizione
è dimostrata.
La dimostrazione del teorema di Riesz-Fischer si conclude subito: se F
(L
p
)
, si scrive F = GH con G, H funzionali positivi di (L

p
)
, e per il 2
o
passo esistono due funzioni , L
q
, entrambe q.o. non negative, tali che
Gg =
_
X
g d, Hg =
_
X
g d g L
p
.
Quindi, posto f = , si ha f L
q
e
Fg =
_
X
gf d g L
p
.
Ci` o prova il teorema.
255
Osservazioni 9.2.3 (1) Se la misura non è -nita, il teorema di Riesz-
Fischer non è vero per p = 1, come mostrano gli esercizi 7.3.7, 7.3.8 e 9.2.2;
invece per p ]1, [ il teorema vale ancora (esercizio 9.2.5).
(2) Come si vedrà in seguito, per p = il teorema di Riesz-Fischer è falso,
ossia linclusione L
1
(L
, che vale in virt` u dellesempio 7.3.6 (3), è

propria (vedere anche lesercizio 9.2.4).
(3) Il teorema di Riesz-Fischer si estende al caso degli spazi L
p
di funzioni
complesse, nel senso che per ogni F (L
p
)
, 1 p < , esiste ununica

f L
q
tale che
Fg =
_
X
gf d g L
p
(vedere lesercizio 9.2.1).
Esercizi 9.2
1. Si deduca il caso complesso del teorema di Riesz-Fischer dal caso reale.
2. Siano X = [0, 1], T = E [0, 1] : E, oppure E
c
, è numerabile, =
misura cardinalità. Si provi che la funzione xf(x) appartiene a L
1
per ogni f L
1
, e che, posto Fg =
_
1
0
xg(x)d, si ha F (L
1
)
, ma
non esiste alcuna f L
per cui si abbia Fg =

_
1
0
fg d per ogni
g L
1
.
3. Sia una misura -nita, e sia p [1, ]. Se f è una funzione mi-
surabile tale che fg L
1
per ogni g L
p
, si provi che f L
q
, ove
1
p
+
1
q
= 1.
4. Sia X = a, b, e poniamo () = 0, (a) = 1, (b) = (X) = .
Caratterizzare gli spazi L
p
(X, ) e i loro duali.
5. Si provi che se 1 < p < il teorema di Riesz-Fischer vale anche per
misure non -nite.
[Traccia: sia la famiglia degli insiemi misurabili che sono -niti,
ossia sono unione numerabile di insiemi misurabili di misura nita.
Fissato F (L
p
)
, per ogni E si mostri che esiste ununica funzione

f
E
L
q
, nulla fuori di E, tale che Fg =
_
X
gf
E
d per ogni g L
p
;
si provi anche che se E, E
t
ed E E
t
si ha f
E
= f
E
q.o. in
256
E. Posto poi (E) =
_
X
[f
E
[
q
d per ogni E , si provi che è
una funzione crescente rispetto allinclusione e limitata superiormente.
Scelta una successione E
n
tale che (E
n
) m = sup
(E), si
provi che H =
n=0
E
n
è un elemento di per cui (H) = m. Se ne
deduca che, posto f = f
H
, si ha f = f
E
q.o. in E per ogni E ,
e che se g L
q
, posto N = x X : g(x) ,= 0, risulta N e
Fg =
_
X
gf
NH
d =
_
X
gf d. Si verichi inne che |F|
(L
p
)
= |f|
q
.]
6. Sia F (C
0
[a, b])
un funzionale positivo. Si provi che esiste ununica

funzione f : [a, b] R crescente, continua a sinistra, con f(a) = 0 e
tale che
Fg =
_
b
a
g d
f
g C
0
[a, b],
ove
f
è la misura di Lebesgue-Stieltjes associata a f.
[Traccia: per lunicità, si ragioni per assurdo e si approssimi
[a,t[
dal basso con funzioni continue. Per lesistenza, per ogni t ]a, b] si
denisca, per n sucientemente grande,
h
t,n
(x) =
_
_
1 se a x t
1
n
n(t x) se t
1
n
x t
0 se t x b.
Si verichi che esiste f(t) = lim
n
Fh
t,n
per ogni t ]a, b]; posto
f(t) = 0 per ogni t a e f(t) = F
[a,b]
= |F| per ogni t > b, si
verichi che f è crescente e che f(a) = 0. Posto poi, per t ]a, b] e n
sucientemente grande,
k
t,n
(x) =
_
_
1 se a x t
1
n

1
n
2
tx
1
n
2
1
n
2
n
2
se t
1
n
+
1
n
2
x t
1
n
2
0 se t
1
n
2
x b,
si provi che |h
t,n
k
t,n
|
=
1
n
e che Fh
t,n
Fk
t,n
+
1
n
|F| f(t
1
n
2
) +
1
n
|F|; se ne deduca che f è continua a sinistra. Consideriamo
ora la misura
f
; ssiamo g C
0
[a, b] e, dato > 0, sia > 0 tale che
[g(x) g(x
t
)[ < per [x x
t
[ < . Se a = t
0
< t
1
< . . . < t
m
= b con
t
k
t
k1
<

2
, si deniscano costante a tratti e
n
C
0
[a, b] (per
257
n >
2
) nel modo seguente:

=
m
k=1
g(t
k
)
[t
k1
,t
k
[
+g(b)
b
,
n
= g(t
1
)h
t
1
,n
+
m
k=2
g(t
k
)[h
t
k
,n
h
t
k1
,n
] +g(b)[
[a,b]
h
b,n
];
si dimostri che |g |
e che |g
n
|
2, e se ne deduca che
[Fg F
n
[ 2|F| e [
_
b
a
g d
f

_
b
a
d
f
[ |F|. Si provi daltra
parte che F
n

_
b
a
d
f
. . .]
7. Si caratterizzi il duale di C
0
[a, b].
[Traccia: fare uso dellesercizio precedente e della proposizione 9.2.2.]
258
Capitolo 10
Operatori lineari
10.1 Estensione di funzionali lineari
Questo capitolo è dedicato allo studio di alcuni fra i principali teoremi del-
lanalisi funzionale: si tratta di importanti risultati relativi alla struttura ed
alle proprietà degli operatori lineari fra spazi normati o di Banach, che tro-
vano assai frequente utilizzazione nei pi` u svariati campi dellanalisi e della
matematica applicata.
Il primo enunciato di cui ci occupiamo riguarda la possibilità di estendere
a tutto lo spazio funzionali lineari deniti su sottospazi, senza alterarne la
norma. Premettiamo la seguente
Denizione 10.1.1 Sia X uno spazio normato, sia p : X R. Il fun-
zionale p è detto positivamente omogeneo (o, pi` u semplicemente, benche
impropriamente, omogeneo) se si ha
p(x) = p(x) x X, > 0.
Il funzionale p è detto subadditivo se
p(x +y) p(x) +p(y) x, y X.
Osservazioni 10.1.2 (1) Se p è omogeneo, allora p(0) = 0, in quanto
p(0) = p(2 0) = 2p(0); inoltre se < 0 si ha p(x) = p(()(x)) =
p(x) per ogni x X.
259
(2) Se p è omogeneo e subadditivo, allora p è convesso: infatti per ogni
x, y X e per ogni [0, 1] si ha
p(x + (1 )y) p(x) +p((1 )y) = p(x) + (1 )p(y).
Viceversa, se p è omogeneo e convesso, allora p è subadditivo: infatti per
ogni x, y X risulta
p(x +y) = p
_
2
x +y
2
_
= 2p
_
x +y
2
_
2
_
1
2
p(x) +
1
2
p(y)
_
= p(x) +p(y).
I funzionali omogenei e subadditivi coincidono dunque con quelli omogenei
e convessi. Si può dimostrare facilmente (esercizio 10.1.1 che essi coincidono
anche con quelli subadditivi e convessi tali che p(0) = 0. Invece nessuna di
queste tre proprietà, da sola, implica le altre (esercizio 10.1.2).
Ad esempio, sono funzionali omogenei e convessi in uno spazio normato: la
norma, ogni funzionale lineare, ed anche il valore assoluto di un funzionale
lineare; un altro esempio importante è quello dei cosiddetti funzionali di
Minkowski associati ai sottoinsiemi convessi di X (esercizio 10.1.3).
Il problema di estendere un funzionale lineare, denito su un sottospazio M
propriamente contenuto in uno spazio normato X, senza alterarne la norma,
è di facile soluzione se, ad esempio, X = R
N
e M = R
k
con k < N, ma non
è altrettanto facile in generale, a meno che X non sia uno spazio di Hilbert
(nel qual caso si rimanda allesercizio 8.2.1). Il teorema che segue fornisce
una risposta molto generale a questa questione.
Teorema 10.1.3 (di Hahn-Banach) Sia X uno spazio normato reale, e
sia p : X R un funzionale omogeneo e subadditivo. Siano inoltre M
un sottospazio proprio di X e f : M R un funzionale lineare tale che
fx p(x) per ogni x M. Allora esiste almeno un funzionale lineare
F : X R tale che F[
M
= f e Fx p(x) per ogni x X.
Osserviamo che se si sceglie p(x) = c|x|, allora si ha f M
e F X
, in
quanto per ipotesi
[fx[ = maxfx, f(x) c|x| x M,
e dal teorema segue
[Fx[ = maxFx, F(x) c|x| x X;
260
in particolare, prendendo c = |f|
M
, otteniamo anche |F|
X
= |f|
M
.
Notiamo inoltre che se X è uno spazio di Hilbert e p(x) = |f|
M
|x|
X
, allora
in virt` u del teorema di Riesz-Frechèt lestensione è unica ed è nulla su M
(esercizio 8.2.1).
Dimostrazione Per ipotesi, esiste z X M. Il primo passo della dimo-
strazione consiste nellestendere f allo spazio M
1
= [M, z] generato da M e
da z, denendo lestensione f
1
nel modo seguente:
f
1
(x +tz) = fx +tc x M, t R,
ove c R è una costante da ssare (se possibile!) in modo che risulti
fx +tc = f
1
(x +tz) p(x +tz) x M, t R 0.
Dividendo per t ed usando lomogeneità si ricavano le condizioni
f
_
x
t
_
+c p
_
x
t
+z
_
x M, t > 0,
f
_
x
t
_
+c p
_
x
t
z
_
x M, t < 0,
ossia, essendo M un sottospazio,
c p(y +z) fy y M, c p(y
t
z) fy
t
y
t
M.
Daltra parte, usando la subadditività di p si ha per ogni y, y
t
M:
fyfy
t
= f(yy
t
) p(yy
t
) = p((y+z)(y
t
+z)) p(y+z)+p(y
t
z),
cioè
p(y
t
z) fy
t
p(y +z) fy y, y
t
M.
Dunque possiamo scegliere c R in modo che
sup
y
M
p(y
t
z) fy
t
c inf
yM
p(y +z) fy,
ed in generale ci sarà pi` u di una scelta possibile per c.
Se nello spazio X vi è una successione z
n
tale che X = [z
n
] (è il caso, per
esempio, di c
00
), si può ripetere il procedimento sopra descritto, ottenendo
estensioni successive su M
1
= [M, z
1
], su M
2
= [M
1
, z
2
], ed induttivamente
su M
n
= [M
n1
, z
n
] per ogni n N
+
; dato che X =
n=1
M
n
, resterà inne
261
denita unestensione F su X, la quale vericherà la tesi del teorema.
Ma in generale questo non accadrà, e quindi occorre seguire unaltra strada.
Ricorriamo al lemma di Zorn (lemma 8.3.11): consideriamo le coppie (g, N)
ove N è un sottospazio di X contenente M e g : N R è un funzionale
lineare tale che g[
M
= f e gx p(x) per ogni x N; linsieme P a cui
applicare il lemma di Zorn sarà costituito da tutte queste coppie, ordinate
nel modo seguente:
(g, N) (g
t
, N
t
) N N
t
e g
t
[
N
= g.
Si noti che P non è vuoto perche (f, M) P, ed è chiaro che è una
relazione dordine su P. Sia Q P un insieme totalmente ordinato: sarà
Q = (g
i
, N
i
)
iI
, ove I è un qualunque insieme di indici. Deniamo
N =
_
iI
N
i
, gx = g
i
x se x N
i
;
una facile verica mostra che (g, N) P e che (g
i
, N
i
) (g, N) per ogni
i I, ossia (g, N) è un maggiorante per Q. Per il lemma di Zorn, esiste allora
un elemento (F, N
0
) P che è massimale per P; questo implica N
0
= X,
altrimenti la procedura esposta allinizio della dimostrazione permetterebbe
di ottenere unestensione propria di F, contraddicendo la massimalità di
(F, N
0
). Ciò mostra che F è lestensione di f richiesta.
Osservazione 10.1.4 Il teorema di Hahn-Banach vale anche negli spazi nor-
mati complessi, modicando opportunamente lenunciato ed anche la deni-
zione di funzionale omogeneo: si veda lesercizio 10.1.6.
Il teorema di Hahn-Banach ha alcune importanti conseguenze.
Corollario 10.1.5 Se X è uno spazio normato con X ,= 0, e x
0
X0,
allora esiste F X
tale che |F|

X
= 1 e Fx
0
= |x
0
|
X
.
Dimostrazione Scegliamo p(x) = |x|
X
, e sul sottospazio 1-dimensionale
M = [x
0
] poniamo
f(tx
0
) = t|x
0
|
X
t R.
Ovviamente f è lineare e si ha
f(tx
0
) = t|x
0
|
X
[t[|x
0
|
X
= |tx
0
|
X
= p(tx
0
) t R.
262
Per il teorema di Hahn-Banach esiste un funzionale lineare F : X R tale
che
F(tx
0
) = t|x
0
|
X
t R, Fx |x|
X
x X;
in particolare Fx
0
= |x
0
|
X
e
[Fx[ = maxFx, F(x) |x|
X
x X,
e ciò prova che |F|
X
= 1.
In particolare il corollario precedente mostra che se X ,= 0 allora X
,= 0.
Corollario 10.1.6 Sia X uno spazio normato e sia M un sottospazio pro-
prio di X. Se x
0
X M e se d(x
0
, M) = > 0, allora esiste F X
tale
che
|F|
X
= 1, F[
M
= 0, Fx
0
.
Dimostrazione Scegliamo p(x) = |x|
X
, e sul sottospazio M
t
= [M, x
0
]
poniamo
f(x +tx
0
) = t x M, t R.
Ovviamente f è lineare, f è nullo su M e, per denizione di ,
f(x+tx
0
) = t [t[
_
_
_
x
t
+x
0
_
_
_
X
= |x+tx
0
|
X
= p(x+tx
0
) x M, t ,= 0.
Il teorema di Hahn-Banach fornisce allora unestensione lineare F
0
di f a
tutto X, tale che
F
0
x
0
= , [F
0
x[ = maxF
0
x, F
0
(x) |x|
X
x X;
il funzionale F = F
0
/|F
0
|
X
è il funzionale cercato.
Corollario 10.1.7 Linclusione L
1
(L
è in generale stretta.
Dimostrazione Ricordiamo che linclusione è valida in virt` u dellesempio
7.3.6 (3). Consideriamo lo spazio misurato ([0, 1], /, m). Supponiamo, per
assurdo, che ogni funzionale F (L
(0, 1))
si rappresenti nella forma

Fg =
_
1
0
g(t)h(t) dt g L
(0, 1)
per unopportuna funzione h L
1
(0, 1). Consideriamo il funzionale lineare
f : C[0, 1] R denito da fg = g(0): ovviamente si ha [fg[ |g|
per ogni
263
g C[0, 1]; quindi per il teorema di Hahn-Banach esiste F (L
(0, 1))
tale
che
Fg |g|
g L
(0, 1), F[
C[0,1]
= f.
Detta h la funzione di L
1
(0, 1) che rappresenta F, si ha allora
1 = f(e
nt
) = F(e
nt
) =
_
1
0
e
nt
h(t)dt n N,
ma ciò è assurdo in quanto, per convergenza dominata, lultimo membro
tende a 0 per n .
Esercizi 10.1
1. Sia X uno spazio normato e sia p : X R un funzionale subadditivo
e convesso con p(0) = 0; si provi che p è omogeneo.
2. Si provi che:
(i) se X = R e p(x) =
_
[x[, p è subadditivo ma non omogeneo ne
convesso;
(ii) se X = R
2
e p(x, y) = x
2
+ y
2
, p è convesso ma non omogeneo ne
subadditivo;
(iii) se X = R
2
e p(x, y) = (
_
[x[ +
_
[y[)
2
, p è omogeneo ma non
subadditivo ne convesso.
3. (Funzionale di Minkowski) Sia X uno spazio normato e sia K X un
insieme convesso che abbia 0 come punto interno. Poniamo
p
K
(x) = inf
_
r > 0 :
x
r
K
_
x X.
Si verichi che linsieme di cui p
K
(x) è lestremo inferiore non è vuoto,
e si provi che:
(i) p
K
è un funzionale omogeneo e subadditivo;
(ii) esiste M > 0 tale che p
K
(x) M|x|
X
per ogni x X;
(iii) p
K
(x) 1 per ogni x K.
264
[Traccia: per la subadditività, siano r, s > 0 tali che
x
r
,
y
s
K e
r 0.]
4. Si determini il funzionale di Minkowski relativo ai seguenti insiemi
convessi K:
(i) X spazio normato, K = X;
(ii) X spazio normato, K = x X : |x| R;
(iii) X =
2
, K = x
2
: [x
j
[ 1, con j N ssato;
(iv) X = R
2
, K = (x, y) R
2
: ax + by c, con a, b R e c > 0
ssati.
5. Sia X = (c
00
, | |
2
), e sia K = x c
00
: [x
n
[ < 2
n
n N. Si
verichi che K ha parte interna vuota ma che malgrado ciò il funzionale
di Minkowski di K è ben denito.
6. Sia X uno spazio normato su C, e sia p : X R un funzionale subad-
ditivo e tale che p(x) = [[p(x) per ogni x X ed C. Siano poi
M un sottospazio proprio di X e f : M C un funzionale lineare tale
che [fx[ p(x) per ogni x M. Provare che esiste F : X C lineare,
tale che F[
M
= f e [Fx[ p(x) per ogni x X.
[Traccia: utilizzando il teorema 10.1.3 si costruisca unestensione rea-
le G del funzionale reale Ref; si denisca poi Fx = Gx iG(ix) e si
verichi che deve essere [Fx[ p(x).]
7. Sia X uno spazio normato e sia K X un convesso aperto contenente
0. Si provi che per ogni x
0
X K esiste F X
tale che Fx Fx
0
per ogni x K.
[Traccia: sia f : [x
0
] R denita da f(tx
0
) = t; si verichi che
fx p
K
(x) per ogni x [x
0
], si applichi il teorema di Hahn-Banach
e si provi che lestensione F verica la tesi.]
8. Sia X uno spazio normato e siano K, M sottoinsiemi convessi di X,
non vuoti e disgiunti, con K aperto. Si provi che esiste F : X R
lineare e non nullo che separa K e M, ossia verica
sup
xK
Fx inf
yM
Fy.
265
[Traccia: posto H = K M = x = y z : y K, z M, si
verichi che H è un convesso aperto che non contiene 0, e si applichi
lesercizio precedente.]
9. Siano K, M convessi dello spazio normato X, non vuoti e disgiunti. Se
K è chiuso e M è compatto, si provi che esiste F X
che separa K
e M strettamente, ossia
sup
xK
Fx < inf
yM
Fy.
[Traccia: si provi che K
= K + B(0, ) e M
= M + B(0, ) so-
no convessi aperti non vuoti, e sono disgiunti per sucientemen-
te piccolo; si scelga F X
0 che li separa, e si deduca che

sup
K
F inf
M
F 2|F|
X
.]
10. Sia M un sottospazio di uno spazio normato X. Si provi che M è denso
in X se e solo se per ogni F X
vale limplicazione
F[
M
= 0 = F = 0.
11. Sia M un sottospazio chiuso e proprio dello spazio normato X. Si provi
che per ogni > 0 esiste x
XM tale che |x
| = 1 e |xx
| > 1
per ogni x M.
12. Siano X, Y spazi normati con X diverso da 0. Si provi che /(X, Y )
è uno spazio di Banach se e solo se lo è Y .
13. Siano g, f
1
, . . . , f
n
funzionali lineari e continui sullo spazio normato X.
Si provi che risulta
n
k=1
ker f
k
ker g
se e solo se g è combinazione lineare degli f
k
.
[Traccia: per la necessità si consideri loperatore T : X R
n
denito
da Tx = (f
1
x, . . . , f
n
x), e sia poi h : R(T) R data da h(Tx) = gx;
si verichi che h è ben denita e continua, e poi si applichi il teorema
di Hahn-Banach.]
266
14. Per ogni x = x
n
nN
+
e per ogni m N
+
poniamo
T
m
x =
1
m
m
k=1
x
k
,
e consideriamo il sottospazio
M = x
: Tx = lim
m
T
m
x.
Si provi che esiste un funzionale lineare e continuo T :
R, detto
limite di Banach, tale che:
(i) Tx = Tx per ogni x M;
(ii) liminf
n
x
n
Tx limsup
n
x
n
per ogni x
;
(iii) Tx = T(x) per ogni x
, ove :
è loperatore di
shift denito da (x)
n
= x
n+1
.
[Traccia: si ponga p(x) = limsup
n
x
n
e si applichi il teorema di
Hahn-Banach.]
10.2 Uniforme limitatezza di operatori
Un altro fondamentale risultato dellanalisi funzionale permette di trasforma-
re una stima puntuale per unarbitraria famiglia di operatori lineari e limitati
in una stima uniforme. Pi` u precisamente, vale il seguente enunciato:
Teorema 10.2.1 (di Banach-Steinhaus) Sia X uno spazio di Banach e
sia Y uno spazio normato; sia inoltre T
A
una qualsiasi famiglia di
elementi di /(X, Y ). Se risulta
sup
A
|T
x|
Y
< x X,
allora
sup
A
|T
|
/(X,Y )
< ;
se invece esiste z X tale che sup
A
|T
z|
Y
= , allora
sup
A
|T
x|
Y
= + x D,
ove D è un sottoinsieme denso in X.
267
Dimostrazione
`
E necessario fare uso di un importante risultato di topologia
generale: il teorema di Baire.
Teorema 10.2.2 (di Baire) Sia (Z, d) uno spazio metrico completo. Se
V
n
è una successione di aperti densi in Z, allora la loro intersezione è un
insieme denso in Z (in particolare è non vuota).
Dimostrazione Sia W un aperto non vuoto di Z. Poiche V
1
è denso in Z,
laperto W V
1
contiene una palla chiusa B(x
1
, r
1
) con r
1
< 1; poiche V
2
è
denso in Z, laperto B(x
1
, r
1
) V
2
2
, r
2
) con
r
2
<
1
2
, e procedendo induttivamente si ottiene che per ogni n N
+
laperto
B(x
n
, r
n
) V
n+1
n+1
, r
n+1
) con r
n+1
<
1
n+1
. Si
ha allora
d(x
i
, x
j
) r
n
<
1
n
i, j n,
da cui, per la completezza di Z, esiste x Z tale che x
n
x; si ha anzi
d(x
n
, x) r
n
per ogni n N
+
. Pertanto
x
n=1
B(x
n
, r
n
) B(x
1
, r
1
) W
_
n=1
V
n
_
.
In particolare, linsieme
n=1
V
n
è non vuoto.
Veniamo alla dimostrazione del teorema di Banach-Steinhaus. Poniamo
(x) = sup
A
|T
x|
Y
, V
n
= x X : (x) > n.
Ciascun V
n
è aperto in X: infatti se x V
n
, allora per denizione di (x)
esiste A tale che |T
x|
Y
> n; quindi per la continuità di T
esiste una
palla B(x, ) tale che |T
z|
Y
> n per ogni z B(x, ), da cui a maggior
ragione (z) > n per ogni z B(x, ): ciò mostra che B(x, ) V
n
e dunque
V
n
è aperto.
Adesso i casi sono due: risulta (x) < per ogni x X, oppure al contrario
esiste z X tale che (z) = +. Nel primo caso, non tutti gli aperti V
n
possono essere densi in X, altrimenti per il teorema di Baire dedurremmo
che linsieme
n=1
V
n
= x X : (x) = +
268
sarebbe non vuoto. Dunque almeno uno fra i V
n
non è denso in X, ossia
esistono n
0
N
+
, x
0
X e r > 0 per i quali
|x x
0
|
X
r = (x) n
0
;
di conseguenza se |x
t
|
X
r si ha
|T
x
t
|
Y
= |T
(x
t
+x
0
) T
x
0
|
Y
2n
0
A,
da cui, se |x|
X
1
|T
x|
Y
=
1
r
|T
(rx)|
Y

2n
0
r
A.
In denitiva, nel caso in cui (x) < per ogni x X abbiamo ricavato che
sup
A
|T
|
/(X,Y )
< +.
Nel caso contrario, in cui esiste z X per cui (z) = +, avremo a maggior
ragione
sup
A
|T
|
/(X,Y )

(z)
|z|
X
= +;
quindi ciascun V
n
deve essere denso in X (altrimenti, per largomentazio-
ne precedente, dedurremmo che sup
A
|T
|
/(X,Y )
< ). Ma allora per il
teorema di Baire linsieme D =
n=1
V
n
è addirittura denso in X e si ha
(x) = + per ogni x D. Ciò conclude la dimostrazione del teorema di
Banach-Steinhaus.
Vediamo unapplicazione del teorema precedente alla convergenza puntuale
delle serie di Fourier di funzioni continue. Introduciamo lo spazio di Banach
C
0
#
[.] = f C[, ] : f() = f(),
munito della norma | |
. Se f è una funzione di tale spazio, in particolare

f L
2
(, ) e quindi la sua serie di Fourier, relativa al sistema trigonome-
trico, converge a f nella norma | |
2
. Possiamo scrivere le somme parziali
della serie di Fourier di f nel modo seguente:
S
n
f(x) =
n
k=n
k
e
ikx
=
1
2
_

f(t)D
n
(x t)dt,
ove il nucleo di Dirichlet D
n
è denito da
D
n
(t) =
n
k=n
e
ikt
, t R;
269
moltiplicando D
n
(t) per e
it/2
e sottraendo le relazioni ottenute, si vede
subito che
D
n
(t) =
_
sin (n+
1
2
)t
sin
t
2
se t ,= 0
2n + 1 se t = 0;
in particolare, D
n
è una funzione reale. Quindi, ssato x [, ], per ogni
n N il funzionale
T
n
f = S
n
f(x) f C
0
#
[, ]
è lineare e continuo con
|T
n
|
(C
0
#
[,])

|D
n
|
1
2
n N,
ed anzi vale luguaglianza, come si vede prendendo una successione g
j

C
0
#
[, ] tale che 0 g
j
1 e lim
j
g
j
(t) = sgnD
n
(t) per ogni t R. Si
osservi che
|T
n
|
(C
0
#
[,])
=
|D
n
|
1
2

2
_

0
sin
_
n +
1
2
_
t
dt
t
=
2
_
(n+
1
2
)
0
[ sin s[
ds
s
,
e poiche la funzione s
[ sin s[
s
non è sommabile in [0, [, si conclude che
sup
nN
|T
n
|
(C
0
#
[,])
= +.
Per il teorema di Banach-Steinhaus si deduce che esiste un insieme D, interse-
zione di aperti densi in C
0
#
[, ]) e dunque esso stesso denso in C
0
#
[, ]),
tale che
sup
nN
[S
n
f(x)[ = + f D.
In denitiva, cè un insieme denso di funzioni continue la cui serie di Fourier
non converge puntualmente nel punto x, che era stato ssato arbitrariamente
in [, ]. Un ranamento di questo risultato è descritto nellesercizio 10.2.9.
Esercizi 10.2
1. Per ogni r > 0 sia B
r
= f L
2
(a, b) : |f|
2
r. Si provi che
B
r
L
1
(a, b), e che B
r
è un chiuso in L
1
(a, b) privo di punti interni.
Se ne deduca che linclusione L
2
(a, b) L
1
(a, b) è propria.
270
2. Sia T
n
/(X, Y ), con X spazio di Banach e Y spazio normato.
Supponiamo che per ogni x X la successione T
n
x converga in Y .
Si provi che:
(i) la successione |T
n
|
/(X,Y )
è limitata;
(ii) x lim
n
T
n
x è un elemento T di /(X, Y );
(iii) si ha |T|
/(X,Y )
liminf
n
|T
n
|
/(X,Y )
.
3. Sia X uno spazio normato e sia B un sottoinsieme di X
. Se per ogni
x X linsieme Tx : T B è limitato in R, si provi che B è limitato
in X
.
4. Sia X uno spazio di Banach e sia B un sottoinsieme di X. Se per ogni
T X
linsieme T(B) è limitato in R, si provi che B è limitato in X.

[Traccia: per ogni x B si consideri il funzionale J
x
: X
R
denito da J
x
(T) = Tx.]
5. Si consideri lo spazio (c
00
, | |
1
). Per ogni k N sia T
k
: c
00
R il
funzionale denito da T
k
x = kx
k
. Si provi che T
k
è lineare e continuo,
che
sup
kN
[T
k
x[ < + x c
00
,
ma che sup
kN
|T
k
| = +. Giusticare il risultato.
6. Sia x
n
una successione reale. Per ogni k N poniamo
T
k
: c
0
R, T
k
a =
k
h=0
x
h
a
h
a = a
n
c
0
.
(i) Provare che |T
k
|
c
0
=
k
h=0
[x
h
[.
(ii) Supponiamo che per ogni a c
0
la successione reale T
k
a abbia
limite nito; si provi allora che il funzionale
T : c
0
R, Ta = lim
k
T
k
a
è lineare e continuo, con
|T|
c
0
=
h=0
[x
h
[,
e che T
k
T in c
0
.
271
7. Sia a = a
n
una successione reale;
(i) se la serie
n=0
a
n
b
n
è convergente per ogni successione b = b
n

1
, si provi che a
;
(ii) se la serie
n=0
a
n
b
n
è convergente per ogni successione b = b
n

c
0
, si provi che a
1
.
8. Sia T
A
/(X, Y ), con X spazio di Banach e Y spazio normato.
Se risulta
sup
A
[(T
x)[ < + x X, Y
,
si provi che sup
A
|T
|
/(X,Y )
< +.
9. Si provi che esiste un insieme D denso in C
0
#
[, ], tale che per ogni
f D linsieme
x [, ] : sup
nN
[S
n
f(x)[ = +
è denso in [, ].
10.3 Applicazioni aperte
Gli operatori lineari fra spazi di Banach godono di una importante pro-
prietà topologica, assai utile nelle applicazioni. Essa è espressa dal seguente
enunciato:
Teorema 10.3.1 (dellapplicazione aperta) Siano X ed Y spazi di Ba-
nach. Se T /(X, Y ) è un operatore surgettivo, allora T è un applicazione
aperta, ossia per ogni aperto A X linsieme T(A) è aperto in Y .
Osserviamo che se T non è lineare il teorema non vale: ad esempio se X =
Y = R la funzione f(x) = x
3
x è continua e surgettiva, ma non lineare, e
trasforma laperto ] , 0[ nellinsieme ] ,
2
3
3
] che non è aperto.
Dimostrazione Siano U, V le palle unitarie in X e Y rispettivamente: la
tesi del teorema equivale a dire che esiste > 0 tale che V T(U) (ove
V = y : y V è la palla di centro 0 e raggio in Y ). Infatti, se vale
272
questa condizione ed A è un aperto di X, ssato y
0
T(A) (dunque y
0
= Tx
0
con x
0
A) e scelto r > 0 in modo che x
0
+rU = B(x
0
, r) A, si ha
B(y
0
, r) = y
0
+rV Tx
0
+T(rU) = T(B(x
0
, r)) T(A),
e quindi T(A) è aperto; viceversa, se T è unapplicazione aperta allora T(U)
è aperto in Y e quindi contiene una palla V centrata nel proprio punto
T(0) = 0.
Dimostriamo dunque che esiste > 0 per cui V T(U). Proveremo la tesi
in tre passi.
1
o
passo Y =
k=1
T(kU).
Infatti, essendo T surgettivo, ogni y Y è immagine di qualche x X; sarà
|x|
X
< k per qualche k N
+
, da cui y T(kU) T(kU).
2
o
passo Esiste > 0 tale che per ogni y Y ed > 0 cè un x X che
verica |x|
X
<
1
|y|
Y
e |y Tx|
Y
< .
Anzitutto, per il teorema di Baire almeno uno fra gli insiemi T(kU) ha parte
interna non vuota; quindi esistono k N
+
ed un aperto W Y tali che
W T(kU). Dunque, scelto y
0
W, esiste > 0 tale che B(y
0
, ) W, da
cui
V = B(0, ) T(kU) y
0
T(2kU).
Dora in poi k, W ed sono ssati. Dalla relazione precedente segue che
y B(0, 2|y|
Y
) = 2|y|
Y
V T
_
4k
|y|
Y
U
_
y Y ;
questa è esattamente la tesi del 2
o
passo con =

4k
.
3
o
passo Proviamo la tesi del teorema.
Applicheremo il 2
o
passo iterativamente. Sia =

4k
. Fissati > 0 e y V ,
per il 2
o
passo esiste x
1
X tale che
|x
1
|
X
<
1
|y|
Y
< 1, |y Tx
1
|
Y
<

2
.
Analogamente, in corrispondenza di y Tx
1
esiste x
2
X tale che
|x
2
|
X
<
1
|y Tx
1
|
Y
< 2
1
, |y Tx
1
Tx
2
|
Y
< 2
2
,
273
e procedendo induttivamente, per ogni n N
+
esiste x
n+1
X tale che
|x
n+1
|
X
<
1
_
_
_
_
_
y
n
k=1
Tx
k
_
_
_
_
_
Y
< 2
n
,
_
_
_
_
_
y
n+1
k=1
Tx
k
_
_
_
_
_
Y
< 2
(n+1)
.
Poniamo ora s
n
=
n
k=1
x
k
; poiche X è completo, la successione s
n
, che è
di Cauchy in X, converge ad un elemento x X per il quale risulta
|x|
X
|x
1
|
X
+
k=2
|x
k
|
X
< 1 +;
inoltre, per continuità, Ts
n
Tx in y. Daltra parte si ha, per costruzione,
Ts
n
y, e dunque y = Tx T((1 + )U); ne segue, per larbitrarietà di y,
V T((1 +)U), ossia
T(U)

1 +
V > 0.
In denitiva
T(U)
_
>0
1 +
V = V.
Corollario 10.3.2 Siano X, Y spazi di Banach e sia T /(X, Y ). Se T è
bigettivo, allora T è un isomorsmo, ossia T
1
/(Y, X).
Dimostrazione Ovviamente T
1
è lineare; inoltre per il teorema dellap-
plicazione aperta T trasforma aperti in aperti e dunque la controimmagine
di un aperto mediante T
1
è un aperto. Pertanto T
1
è continua e quindi
T
1
/(Y, X). Notiamo in particolare che si ha
|x|
X
c|Tx|
Y
x X,
ove c = |T
1
|
/(Y,X)
.
Corollario 10.3.3 (teorema del graco chiuso) Siano X ed Y spazi di
Banach e sia T : X Y lineare. Se T è un operatore chiuso, ossia il
graco G
T
di T è un sottoinsieme chiuso dello spazio prodotto XY , allora
T /(X, Y ).
274
Osserviamo che se T è non lineare il risultato è falso: la funzione f : R R,
data da f(x) =
1
x
per x ,= 0 e f(0) = 0, ha graco chiuso pur essendo
discontinua.
Dimostrazione Dallesercizio 7.3.10 segue che XY è uno spazio di Banach
con la norma |(x, y)|
XY
= |x|
X
+ |y|
Y
; poiche G
T
è chiuso in X Y ,
(G
T
, | |
XY
) è uno spazio di Banach. Lapplicazione : G
T
X denita
da
(x, Tx) = x (x, Tx) G
T
è ben denita, lineare e, ovviamente, continua con norma non superiore a 1.
Inoltre è bigettiva; quindi, per il corollario precedente, è un isomorsmo
ed in particolare esiste c > 0 tale che
|(x, Tx)|
XY
c|x|
X
x X,
da cui c 1 e |Tx|
Y
(c 1)|x|
X
per ogni x X, cioè la tesi.
Osservazioni 10.3.4 (1) Un operatore lineare T, denito su un sottospazio
M di uno spazio normato X, a valori in uno spazio normato Y , è chiuso se
e solo se vale limplicazione seguente:
x
n
M, x
n
x in X, Tx
n
y in Y = x M e Tx = y.
Infatti ciò signica esattamente che G
T
è chiuso in X Y .
(2) Come vedremo nellesempio successivo, il teorema del graco chiuso è fal-
so in generale se X non è completo, oppure se X è completo ma T è denito
su un sottospazio proprio e non chiuso di X (le due cose sono equivalenti,
dato che ogni spazio normato non completo è sottospazio non chiuso dello
spazio di Banach costituito dal suo completamento).
Nelle applicazioni, ad esempio nel campo delle equazioni dierenziali, si
incontrano spesso operatori chiusi non continui; lesempio principale è il
seguente:
Esempio 10.3.5 Consideriamo loperatore derivata prima:
A : C
1
[a, b] C[a, b], Af = f
t
f C
1
[a, b].
Rispetto alle norme naturali di C
1
[a, b] e di C[a, b], loperatore derivata è
lineare e continuo con norma uguale a 1: infatti ovviamente
|Af|
|f|
+|f
t
|
= |f|
C
1
[a,b]
,
275
e daltra parte prendendo le funzioni f
(x) = sin
xa
, con 0 < <

2
(b a),
si ottiene subito
|Af
= 1, |f
|
C
1
[a,b]
= + 1
e dunque
|A|
/(C
1
[a,b],C[a,b])

1
1 +
> 0.
Notiamo che A è surgettivo: ogni g C[a, b] è la derivata delle funzioni
c +
_
x
a
g(t)dt, che sono tutte in C
1
[a, b]. Quindi A è unapplicazione aperta.
La restrizione di A al sottospazio
M = f C
1
[a, b] : f(x
0
) = 0 (x
0
punto ssato di [a, b]),
è anche iniettiva (ogni g C[a, b] ha come unica controimmagine in M
la soluzione del problema di Cauchy f
t
= g, f(x
0
) = 0); quindi A[
M
è un
isomorsmo. In eetti si ha
(A[
M
)
1
g(x) =
_
x
x
0
g(t)dt,
ed è immediato vericare che
|(A[
M
)
1
|
/(C[a,b],C
1
[a,b])
= 1 + maxb x
0
, x
0
a.
Cambiamo punto di vista, mettendo su C
1
[a, b] la norma ||
: allora C
1
[a, b]
diventa un sottospazio non chiuso di C[a, b], ovvero uno spazio normato non
completo. Loperatore A agisce allora nello spazio C[a, b]: il suo dominio,
denito da
D(A) = f C[a, b] : Af = f
t
C[a, b],
è il sottospazio C
1
[a, b] di C[a, b]. In questo modo A non è pi` u continuo,
perche scegliendo f
n
(x) = (x a)
n
si trova subito
|f
t
n
|
= n(b a)
n1
, |f
n
|
= (b a)
n
,
e dunque
sup
nN
|f
t
n
|
|f
n
|
= +.
Tuttavia A è un operatore chiuso: infatti se (f
n
, f
t
n
) è una successione del
graco G
A
che converge nella norma dello spazio prodotto ad un elemento
276
(f, g) (ossia f
n
f uniformemente in [a, b] e f
t
n
g uniformemente in [a, b]),
passando al limite nella relazione
f
n
(x) f
n
(x
t
) =
_
x
x
f
t
n
(t)dt x, x
t
[a, b]
si trova subito che
f(x) f(x
t
) =
_
x
x
g(t)dt x, x
t
[a, b],
da cui è facile dedurre, dividendo per x x
t
e facendo tendere x
t
ad x, che f
è derivabile e f
t
(x) = g(x) per ogni x [a, b]: dunque f C
1
[a, b] e Af = g,
ovvero (f, g) G
A
. Quindi G
A
è chiuso.
Esercizi 10.3
1. Sia X uno spazio normato e sia M un sottospazio di X. Si consideri
loperatore di restrizione r : X
, denito da
r(F) = F[
M
F X
.
(i) Si verichi che r /(X
, M
) e se ne calcoli la norma.
(ii) Loperatore r è iniettivo? è surgettivo?
(iii) Si provi che r è unapplicazione aperta.
2. Siano X, Y spazi di Banach e sia T /(X, Y ) un operatore surgettivo.
Si provi che esiste c > 0 dotata della seguente proprietà:
y Y x X : Tx = y e |x|
X
c|y|
Y
.
3. Sia H uno spazio di Hilbert e sia T /(H). Si provi che R(T
) =
(ker T)
e R(T) = (ker T
.
4. Sia H uno spazio di Hilbert e sia T /(H). Si provi che i seguenti
fatti sono equivalenti:
(i) R(T) è chiuso in H;
(ii) R(T
) è chiuso in H (si ricordi lesercizio 8.2.3);

(iii) R(T) = (ker T
;
277
(iv) R(T
) = (ker T)
;
(v) esiste c > 0 tale che |x| c|Tx| per ogni x (ker T)
;
(vi) esiste c
t
> 0 tale che |y| c
t
|T
y| per ogni y (ker T
.
5. Sia X uno spazio di Banach e sia T /(X) un operatore iniettivo. Si
provi che
|x|
R(T)
= |T
1
x|
X
è una norma in R(T) e che R(T) è uno spazio di Banach con tale norma.
Si verichi poi che limmersione i : R(T) X è continua e se ne calcoli
la norma.
6. Sia X uno spazio di Banach e sia T /(X) tale che T
sia surgettivo.
Si provi che T è invertibile e T
1
/(X).
7. Sia X uno spazio di Banach e siano M, N sottospazi chiusi di X tali
che M N = 0. Posto Z = x = a +b : a M, b N, si provi che
Z è chiuso in X se e solo se esiste c > 0 tale che
|a|
X
c|a +b|
X
a M, b N.
[Traccia: supponendo Z chiuso si dimostri che P : Z M, denito
da P(a +b) = a, è un operatore chiuso.]
8. Sia M = f L
1
(R) : t tf(t) L
1
(R), e sia T : M R denito
da Tf(t) = tf(t), t R. Si provi che M è denso in L
1
(R) e che T è
chiuso ma non continuo.
9. Sia X uno spazio normato, sia M un sottospazio di X e sia T : M R
un operatore lineare.
(i) Se M è chiuso in X e T è continuo, si provi che T è chiuso. Cosa
può succedere se M non è chiuso?
(ii) Se X è completo, M è chiuso in X e T è chiuso, si provi che T è
continuo. Cosa può succedere se M non è chiuso?
(iii) Se T è chiuso, è vero che T trasforma insiemi chiusi in insiemi
chiusi?
278
10. Si provi che loperatore derivata prima A =
d
dt
: AC[a, b] L
1
(a, b) è
continuo rispetto alle norme naturali di questi spazi, ed è chiuso, ma
non continuo, se lo si denisce come operatore nello spazio L
1
(a, b) con
dominio D(A) = AC[a, b].
11. Sia H uno spazio di Hilbert e sia T : H H un operatore lineare
autoaggiunto (vedere lesercizio 8.2.4). Si provi che T /(H).
[Traccia: si mostri che T è un operatore chiuso.]
12. Sia M un sottospazio di C[a, b] chiuso rispetto alla topologia indotta
dalla norma | |
2
; si provi che M ha dimensione nita.
[Traccia: Si verichi che (M, | |
) e (M, | |
2
) sono spazi di Banach
e si deduca che esiste c > 0 tale che |u|
c|u|
2
per ogni u M;
poi, se e
n
è un sistema ortonormale completo in M, si ssi y [a, b]
e si denisca v(x) =
N
n=0
e
n
(y)e
n
(x): si verichi che v M e si ricavi
la maggiorazione
N
n=0
[e
n
(y)[
2
c
2
. Inne si integri rispetto a y su
[a, b]. . . .]
13. Per ogni f L
1
(, ) si deniscano i coecienti di Fourier rispetto
al sistema trigonometrico:
k
=
1
2
_

f(t)e
ikt
dt, k Z.
(i) Si provi che
k
0 per [k[ .
(ii) Posto
c
0
(Z) = x = x
k
kZ
: lim
[k[
x
k
= 0,
si verichi che lapplicazione Tf =
k
kZ
è lineare e continua da
L
1
(, ) in c
0
(Z) con norma uguale a
1
2
.
(iii) Si provi che T è iniettiva, ma non surgettiva.
10.4 Operatore aggiunto
Questo paragrafo è dedicato allimportante nozione di aggiunto di un ope-
ratore lineare, nozione già incontrata, in un caso particolare, negli esercizi
8.2.3 e successivi. Dati due spazi normati complessi X, Y , considereremo
279
operatori lineari A : D(A) X Y , ove D(A), il dominio di A, è un oppor-
tuno sottospazio di X: abbiamo già incontrato questa situazione nellesempio
10.3.5.
Sia dunque A : D(A) X Y un operatore lineare. Poniamo
M = Y
: A : D(A) C è continuo nella norma di X;

ovviamente M è un sottospazio di Y
. Fissato M, per il teorema di

Hahn-Banach esiste un funzionale Y
tale che [
D(A)
= A. Tale
funzionale non è in generale unico; se però D(A) è denso in X, allora lesten-
sione da A a è unica.
Supporremo allora che D(A) sia denso in X.
Denizione 10.4.1 Siano X e Y spazi normati e sia A : D(A) X Y
un operatore lineare con dominio denso. Loperatore lineare A
: D(A
)
X
denito da
D(A
) = M, A
= M,
ove M e sono deniti come sopra, si chiama operatore aggiunto di A; esso
è caratterizzato dalla relazione
(A
)x = (Ax) x D(A), D(A
).
Un caso importante è quello in cui D(A) = X e A è continuo: in questo caso
si ha
Proposizione 10.4.2 Siano X, Y spazi normati. Se A /(X, Y ), allora
A
/(Y
, X
) e
|A|
/(X,Y )
= |A
|
/(Y
,X
)
.
Dimostrazione Se A = 0 la tesi è ovvia: supponiamo dunque A ,= 0.
Anzitutto
|A
|
X
= sup
|x|
X
=1
[(Ax)[ ||
Y
|A|
/(X,Y )
,
da cui |A
|
/(Y
,X
)
|A|
/(X,Y )
. Daltra parte, sia x X tale che Ax ,= 0:
posto y =
Ax
|Ax|
Y
, per il teorema di Hahn-Banach (pi` u precisamente per il
corollario 10.1.5) esiste Y
tale che ||
Y
= 1 e y = |y|
Y
= 1.
Dunque (Ax) = |Ax|
Y
e pertanto
|Ax|
Y
= (Ax) |A
|
X
|x|
X
|A
|
/(Y
,X
)
|x|
X
,
da cui |A|
/(X,Y )
|A
|
/(Y
,X
)
.
Le principali proprietà degli aggiunti sono elencate nellenunciato che segue.
280
Proposizione 10.4.3 Siano X, Y, Z spazi normati. Allora:
(i) Se A, B /(X, Y ), allora (A +B)
= A
+B
.
(ii) Se C e A /(X, Y ), allora (A)
= A
.
(iii) Se A /(Y, Z) e B /(X, Y ), allora (AB)
= B
/(Z
, X
).
(iv) Se A /(X) ed esiste A
1
/(X), allora esiste anche (A
)
1
/(X
) e si ha (A
)
1
= (A
1
)
.
Dimostrazione Le veriche sono tutte facili; in particolare, per (iv) si os-
servi che (AA
1
)
= (A
1
A)
= I
= I : X
, e si applichi (iii).
Osservazione 10.4.4 Se X = Y = H, con H spazio di Hilbert, la nozione di
operatore aggiunto va precisata, in accordo con quanto esposto negli esercizi
8.2.3 e 8.2.4. Indichiamo con j : H H
lisomorsmo canonico fornito dal

teorema di Riesz-Frechèt, tale che
x = (x, j
1
)
H
x H, H
.
Se A /(H), per la proposizione 10.4.2 si ha A
/(H
) e risulta
(x, j
1
(A
))
H
= A
(x) = (Ax) = (Ax, j

1
)
H
x H, H
,
ossia, posto y = j
1
,
(x, (j
1
A
j)y)
H
= (Ax, y)
H
x, y H.
Nel caso di operatori A /(H) è consuetudine identicare loperatore ag-
giunto A
/(H
) con loperatore j
1
A
j /(H). Nel seguito indicheremo

senzaltro con A
loperatore j
1
A
j; quindi A
sarà un elemento di /(H) e

sarà caratterizzato dalla relazione
(x, A
y)
H
= (Ax, y)
H
x, y H.
`
E necessario però osservare che, con questa identicazione, lapplicazione di
/(H) in se, denita da A A
, è antilineare, ossia risulta

(A +B)
= A
+B
, (A)
= A
A, B /(H), C
in contrasto con la proposizione 10.4.3: questo fatto è conseguenza dellanti-
linearità dellisomorsmo canonico j (osservazione 8.2.2).
281
Denizione 10.4.5 Sia H uno spazio di Hilbert. Un operatore A : D(A)
H H, con dominio D(A) denso in H, si dice autoaggiunto se si ha
D(A
) = D(A) e A
= A (nel senso dellosservazione 10.4.4), ossia se

(Ax, y)
H
= (x, Ay)
H
x D(A), y D(A
).
Esempi 10.4.6 (1) Sia A : C
n
C
m
un operatore lineare: allora, scelte su
C
n
e C
m
le basi canoniche, A si rappresenta con una matrice a
ij
m n.
Allora A
si rappresenta con la matrice trasposta coniugata a

ji
. Infatti
z = Ax z
i
=
n
j=1
a
ij
x
j
, i = 1, . . . , m,
da cui
(Ax, y) =
m
i=1
z
i
y
i
=
m
i=1
n
j=1
a
ij
x
j
y
i
=
m
j=1
x
j
m
i=1
a
ij
y
i
= (x, A
y).
In particolare, A è autoaggiunto se e solo se la matrice a
ij
è reale e
simmetrica.
(2) Sia H = L
2
(a, b), sia K L
2
(]a, b[]a, b[) e consideriamo loperatore
integrale A : H H denito da
Af(x) =
_
b
a
K(x, y)f(y) dy, x ]a, b[, f H.
Allora si verica facilmente che A /(H) e che
|A|
/(H)
|K|
L
2
(]a,b[]a,b[)
.
Inoltre, utilizzando il teorema di Fubini,
(Af, g)
H
=
_
b
a
__
b
a
K(x, y)f(y) dy
_
g(x) dx =
=
_
b
a
__
b
a
K(x, y)g(x) dx
_
f(y) dy =
=
_
b
a
_
_
b
a
K(x, y)g(x) dx
_
dy = (f, A
g)
H
,
282
da cui si ottiene
A
g(y) =
_
b
a
K(x, y)g(x) dx y ]a, b[, g H.
In particolare, A è autoaggiunto se e solo se K(x, y) = K(y, x).
Esercizi 10.4
1. Determinare A
, essendo A /(
2
) denito da (Ax)
n
= x
n+1
per ogni
n N.
2. Fissata
, sia A /(
2
) denito da (Ax)
n
=
n
x
n
per ogni
n N. Determinare A
e vericare che:
(i) AA
= A
A;
(ii) A è autoaggiunto se e solo se
n
R per ogni n N;
(iii) AA
= A
A = I se e solo se [a
n
[ = 1 per ogni n N.
3. Dato loperatore B /(
2
), denito da (Bx)
0
= 0 e (Bx)
n
= x
n1
per ogni n N
+
, si determini B
e si verichi che B
B = I mentre
BB
,= I.
4. Sia I : N N unapplicazione bigettiva e si consideri loperatore A
/(
2
) denito da (Ax)
n
= x
i(n)
per ogni n N. Si provi che A
A =
AA
. Loperatore A è autoaggiunto?
5. Sia H uno spazio di Hilbert e sia A : D(A) H H lineare e
autoaggiunto. Si provi che A è un operatore chiuso (corollario 10.3.3),
e che se D(A) = H allora A è continuo.
6. Siano X, Y spazi di Banach e sia A : D(A) X Y lineare e iniettivo,
con dominio D(A) denso in X e immagine R(A) densa in Y . Si provi
che (A
)
1
esiste e coincide con (A
1
)
. Si provi anche che A

1
è
continuo se e solo se (A
)
1
è continuo.
7. Sia K(x, y) = 1+
1
2
e
2i(xy)
, x, y [0, 1], e sia A loperatore dellesempio
10.4.6 (2) in L
2
(0, 1). Si provi che
|A|
/(L
2
(0,1))
< |K|
L
2
(]0,1]]0,1[)
.
[Traccia: Per calcolare la norma di Af si utilizzi luguaglianza di
Bessel per il sistema e
2ikt
kZ
.]
283
10.5 Riessività
Introduciamo ora una nozione, quella di riessività, che pur essendo di natura
algebrica, condiziona fortemente la geometria dello spazio: infatti, fra tutti
gli spazi di Banach, quelli riessivi sono i pi` u vicini, per ricchezza di proprietà,
agli spazi di Hilbert.
Sia dunque X uno spazio di Banach, sia X
il suo duale, e sia X
= (X
il duale del duale, o biduale di X. Vi è una immersione naturale di X nel

suo biduale X
, che indichiamo con J e che è cos` denita: ad ogni x X

associamo il funzionale J
x
X
che agisce su X
nel modo seguente:

J
x
(T) = Tx T X
.
Lapplicazione J : X X
è chiaramente lineare, perche per ogni x, x

t
X
e per ogni , R (oppure , C) si ha
J
x+x
(T) = T(x +x
t
) = Tx +Tx
t
= J
x
(T) +J
x
(T) T X
.
Inoltre J è continua, poiche per ogni x X risulta
[J
x
(T)[ = [Tx[ |T|
X
|x|
X
T X
,
da cui |J
x
|
X
|x|
X
; ma scegliendo, grazie al corollario 10.1.5, un elemento
T
0
X
tale che |T
0
|
X
= 1 e T
0
x = |x|
X
, si trova
[J
x
(T
0
)[ = [T
0
x[ = |x|
X
= |T
0
|
X
|x|
X
,
e dunque
|J
x
|
X
= |x|
X
x X.
Pertanto lapplicazione J è unisometria fra X e la sua immagine J(X)
X
. Essa si chiama immersione canonica di X in X
. Limmagine J(X)
è un sottospazio chiuso di X
(esercizio 10.5.1), in generale strettamente

contenuto in X
.
Denizione 10.5.1 Diciamo che lo spazio di Banach X è riessivo se ri-
sulta J(X) = X
, ossia limmersione canonica J è surgettiva.

Valgono le seguenti proprietà, per la dimostrazione delle quali si rimanda agli
esercizi 10.5.2, 10.5.3 e 10.5.4.
284
Proposizione 10.5.2 Sia X uno spazio di Banach; allora X è riessivo se
e solo se X
è riessivo.
Proposizione 10.5.3 Sia M un sottospazio chiuso dello spazio di Banach
X; se X è riessivo, allora M è riessivo.
Proposizione 10.5.4 Se lo spazio di Banach X ha dimensione nita, allora
X è riessivo.
Esempi 10.5.5 (1) Ogni spazio di Hilbert H è riessivo. Infatti, sia
H
e consideriamo lisomorsmo antilineare j : H H
fornito dal teorema

di Riesz-Frechèt, che ad ogni z H associa il funzionale j
z
H
denito da
j
z
(x) = (x, z)
H
per ogni x H; allora il funzionale x j(x) è lineare,
dunque è un elemento di H
, e sarà pertanto della forma j = j

u
per uno
ed un solo u H, che dipenderà da . Quindi si ha
(j
x
) = j(x) = j
u
(x) = (x, u)
H
x H.
Sia adesso T un arbitrario elemento di H
, quindi T = j
z
con z H: si ha,
per denizione di immersione canonica J,
(T) = (j
z
) = (z, u)
H
= (u, z)
H
= Tu = J
u
(T),
e pertanto = J
u
. Ciò prova che J : H H
è surgettiva.
(2) Se (X, T, ) è uno spazio misurato -nito, allora L
p
(X) è riessivo per
ogni p ]1, [. Infatti, sia (L
p
)
: proveremo che esiste una funzione

a L
p
(necessariamente unica, essendo J unisometria) tale che J
a
= .
Sia q ]1, [ lesponente coniugato di p ; indichiamo con i
q
: L
q
(L
p
)
lisometria bigettiva lineare indotta dal teorema di Riesz-Fischer, denita

dalla relazione
[i
q
f](g) =
_
X
gf d g L
p
.
Dimostreremo che = J
i
1
p
(iq)
. Si noti che i
q
q
)
in
virt` u della relazione
[(i
q
f)[ ||
(L
p
)
|i
q
f|
(L
p
)
= ||
(L
p
)
|f|
q
f L
q
;
285
dunque, come è giusto, i
1
p
( i
q
) è un elemento di L
p
che denotiamo con a.
Sia F (L
p
)
e sia f lunico elemento di L

q
per cui F = i
q
f: si ha allora,
dalle denizioni di i
p
ed i
q
,
J
a
(F) = F(a) =
_
X
fa d = i
p
a(f) = ( i
q
)(f) = (F).
Pertanto = J
a
e ciò prova che J : L
p
(L
p
)
è surgettivo, ossia L
p
è
riessivo. Si noti che, indicando con J
p
e J
q
le immersioni canoniche di L
p
ed L
q
(
1
p
+
1
q
= 1) nei rispettivi biduali, si ha
J
p
f
(i
q
g) =
_
X
fg d =
_
X
gf d = J
q
g
(i
p
f) f L
p
, g L
q
.
(3) Lo spazio L
1
non è riessivo in generale. Ad esempio, sappiamo dal
teorema di Riesz-Fischer che il duale di L
1
(a, b) è isomorfo ed isometrico a
L
(a, b) mediante lapplicazione i
che ad ogni f L
associa il funzionale
[i
f](g) =
_
b
a
g(t)f(t) dt per ogni g L
1
; quindi, detta J
1
: L
1
(L
1
)
limmersione canonica, limmagine di J

1
in (L
1
)
è
J
1
(L
1
) =
_
(L
1
)
: h L
1
: (i
f) =
_
b
a
f(t)h(t) dt f L
_
.
Ma se consideriamo una qualunque estensione a L
del funzionale
f = f(a) f C[a, b],
allora i
1
1
)
che non può appartenere a J

1
(L
1
):
infatti in tal caso otterremmo, per ogni F = i
f (L
1
)
, ossia per ogni

f L
,
i
1
(F) = f =
_
b
a
f(t)h(t) dt
per unopportuna h L
1
, il che, come sappiamo dal corollario 10.1.7, è im-
possibile.
Come vedremo nei prossimi paragra, gli spazi riessivi sono importanti per-
che in essi gli insiemi limitati e chiusi sono debolmente compatti in un senso
che preciseremo: questo consente di ottenere, in svariati problemi applicativi,
risultati di esistenza di soluzioni, anche se non sempre vale lunicità.
286
Esercizi 10.5
1. Sia X uno spazio di Banach; si provi che J(X) è un sottospazio chiuso
di X
.
2. Si dimostri la proposizione 10.5.2.
[Traccia: se X
è riessivo, e se per assurdo esiste X
J(X),
si trovi un elemento X
tale che [
J(X)
= 0 e () ,= 0. Per la
riessività di X
, si avrà = J
F
con F X
(ove J
è limmersione
canonica di X
in X
); si provi che necessariamente F = 0, e se ne

deduca lassurdo essendo ,= 0. Se X è riessivo, si osservi che ogni
X
sarà della forma = J

x
con x X, da cui J
F
() = (F) =
J
x
(F) = Fx per ogni F X
; quindi se X
si verichi che J
è un elemento di X
e che risulta = J
J
.]
[Traccia: ovviamente, (M, | |
X
) è uno spazio di Banach. Se M
,
detta F
r
la restrizione a M di un arbitrario funzionale F X
, si
verichi che F (F
r
) è un elemento X
. Se x è lelemento di
X tale che J
x
= , supponendo per assurdo che x / M si trovi un
funzionale G X
con G ,= 0 ma G
r
= 0, e si concluda che ciò è
impossibile. Si deduca che = J
M
x
, ove J
M
è limmersione canonica di
M in M
.]
[Traccia: sia e
1
, . . . , e
n
una base per X, sia f
1
, . . . , f
n
la base duale
di X
(cioè quella tale che f

i
(e
j
) =
ij
), e sia
1
, . . . ,
n
la base di
X
tale che
k
(f
i
) =
ki
. Si provi che J
e
i
(F) =
i
(F) per ogni F X
e si deduca la tesi.]
5. Si provi che L
(a, b) e L
(R) non sono riessivi.

6. Si provi che
1
e
non sono riessivi.

7. Siano X, Y spazi di Banach, sia T /(X, Y ). Dette J, J
t
le immersioni
canoniche di X in X
e di Y in Y
rispettivamente, si verichi che

T
J = J
t
T, ove T
= (T
: X
è laggiunto delloperatore
T
: Y
, a sua volta aggiunto di T.

8. Siano X, Y spazi di Banach e sia T /(X, Y ). Se T è surgettivo, si
provi che T
è iniettivo e che R(T
) è chiuso in Y .
287
[Traccia: per la seconda aermazione, sia F
n
R(T
) tale che
F
n
F in X
; si verichi che esiste un unico G

n
Y
tale che F
n
=
T
G
n
, ed usando lesercizio 10.3.2 si provi che G
n
è una successione
di Cauchy in Y
. Detto G Y
il suo limite, si verichi che F = T
G.]
9. Siano X, Y spazi di Banach con X riessivo. Se T /(X, Y ), si provi
che
R(T
) = F X
: F[
ker T
= 0.
[Traccia: per provare linclusione , si ragioni per assurdo: se F[
ker T
=
0 e F / R(T
), si trovi X
tale che (F) > 0 e [

R(T
)
= 0; se
x X è tale che J
x
= , si deduca che G(Tx) = 0 per ogni G Y
e
si ricavi lassurdo.]
10. Siano X, Y spazi di Banach. Se T /(X, Y ) e R(T) è chiuso in Y , si
provi che
R(T
) = F X
: F[
ker T
= 0.
[Traccia: per provare linclusione , si osservi che se F[
ker T
= 0, allora
ha senso denire G(y) = F(x) per ogni y R(T), ove x T
1
(y)
è scelto ad arbitrio. Dato che R(T) è chiuso, esso è uno spazio di
Banach; si usi lesercizio 10.3.2 per provare che esiste c > 0 tale che
[G(y)[ c|y|
Y
per ogni y R(T). Si estenda il funzionale G, col
teorema di Hahn-Banach, ad un elemento G Y
e si concluda che
F = T
G.]
11. Siano X, Y spazi di Banach; se X è riessivo ed esiste un operatore
T /(X, Y ) surgettivo, si provi che anche Y è riessivo.
[Traccia: per lesercizio 10.5.8 si ha ker T
= 0 e R(T
) chiuso; se
ne deduca, per lesercizio 10.5.10, che R(T
) = X
: [
ker T
=
0 = X
, e quindi che T
è surgettivo. Dallesercizio 10.5.7 si ricavi

che Y è riessivo.]
12. Si provi che uno spazio normato è separabile se e solo se si ha X =
[x
n
], ove x
n
è unopportuna successione di elementi di X.
13. Sia X uno spazio di Banach. Si provi che:
(i) se X
è separabile, allora anche X è separabile, ma che il viceversa

è falso;
288
(ii) se X è separabile e riessivo, allora anche X
è separabile e ries-
sivo.
[Traccia: (i) se X
= F
n
, si scelga x
n
X tale che |x
n
|
X
= 1
e F
n
(x
n
)
1
2
|F
n
|
X
; posto M = [x
n
], si dimostri che M = X
ragionando per assurdo: se esistesse x
0
XM, utilizzando il corollario
10.1.6 si costruisca un elemento F X
lontano da tutti gli F

n
e si
deduca il risultato. (ii) Si provi che se X = [x
n
] allora X
=
[J
xn
], e quindi X
è separabile.]
14. Se X e Y sono spazi riessivi, si provi che X Y è riessivo.
[Traccia: si utilizzi lesercizio 7.3.10.]
10.6 Convergenze deboli
Negli spazi normati vi è un altro tipo di convergenza, pi` u debole di quella
rispetto alla norma e dunque pi` u facile da ottenere, che è molto utile nelle
applicazioni.
Denizione 10.6.1 Sia X uno spazio normato e sia x
n
una successione
contenuta in X. Diciamo che x
n
converge debolmente ad un elemento
x X se si ha Fx
n
Fx in R per ogni funzionale F X
; in tal caso
scriviamo x
n
x.
Osserviamo che la convergenza debole, ovviamente, è pi` u debole della con-
vergenza rispetto alla norma: infatti se x
n
x in X, allora
[Fx
n
Fx[ |F|
X
|x
n
x|
X
0 F X
,
e quindi x
n
x in X.
Altrettanto ovviamente, se x
n
x in X non è detto che x
n
x. Ad
esempio, ogni sistema ortonormale numerabile e
n
in uno spazio di Hilbert
H converge debolmente allelemento 0 H: ricordando il teorema di Riesz-
Frechèt, questo segue dal fatto che
lim
n
(e
n
, z)
H
= 0 z H
in virt` u della disuguaglianza di Bessel (proposizione 8.3.6). Daltra parte non
pu` o essere e
n
0 dato che |e
n
|
H
= 1 per ogni n N.
289
Si può facilmente vericare (esercizio 10.6.9) che se X ha dimensione nita
allora la convergenza debole è equivalente a quella forte (cioè a quella rispetto
alla norma di X). Si noti che questa asserzione non si può invertire, come
mostra lesercizio 10.6.10.
La seguente proprietà della convergenza debole è di uso assai frequente.
Proposizione 10.6.2 Sia X uno spazio normato. Se x
n
x in X, allora
x
n
è limitata in X e
|x|
X
liminf
n
|x
n
|
X
.
Dimostrazione Sia J : X X
limmersione canonica. Per ipotesi si ha

lim
n
J
xn
(F) = lim
n
Fx
n
= Fx F X
;
quindi
sup
nN
[J
xn
(F)[ < F X
.
Per il teorema di Banach-Steinhaus, applicato agli spazi X
e R, si ottiene
sup
nN
|J
xn
|
X
< ,
e ricordando che J è unisometria, otteniamo la limitatezza in X della suc-
cessione x
n
.
Inoltre, per ogni F X
si ha
[Fx[ = lim
n
[Fx
n
[ liminf
n
|F|
X
|x
n
|
X
,
da cui
|x|
X
= |J
x
|
X
= sup
FX
\0
[Fx[
|F|
X
liminf
n
|x
n
|
X
.
Nello spazio duale X
vi è un altro tipo di convergenza, ancora pi` u debole.

Denizione 10.6.3 Sia X uno spazio normato e sia F
n
una successione
contenuta in X
. Diciamo che F
n
converge debolmente* in X
(e leggiamo
debolmente star) ad un elemento F X
se si ha F
n
x Fx in R per ogni
x X. In tal caso scriviamo F
n
F.
290
La convergenza debole* è dunque semplicemente la convergenza puntuale per
funzionali lineari deniti su X. Si noti che in X
si hanno entrambi i tipi di

convergenza debole:
F
n
F in X
(F
n
) (F) X
,
F
n
F in X
F
n
x Fx x X.
In particolare, la convergenza debole in X
implica la convergenza debole*

in X
, mentre il viceversa è falso in generale, come vedremo nel prossimo

esempio; le due convergenze deboli in X
coincidono nel caso che X sia uno

spazio di Banach riessivo.
Esempio 10.6.4 La successione e
n
(ove e
n
= 0, 0, . . . , 0, 1, 0, 0, . . . con
1 al posto n-simo) converge debolmente* a 0 in
. Infatti
è isomorfo a
(
1
)
; detto i :
(
1
)
tale isomorsmo, per ogni x

1
si ha
[i(e
n
)]x =
k=0
(e
n
)
k
x
k
= x
n
0 per n .
Inoltre, e
n
0 in
1
: infatti, analogamente,
1
è isomorfo a (c
0
)
e quindi,
detto j : l
1
(c
0
)
tale isomorsmo, si ha
[j(e
n
)]x =
n=0
(e
n
)
k
x
k
= x
n
0 x c
0
.
Daltra parte e
n
, 0 in
1
, perche scelto lelemento 1 = 1, 1, 1, . . .
,
risulta
[i(1)]e
n
= (e
n
)
n
= 1 , 0.
Le convergenze deboli sono importanti perche forniscono buoni teoremi di
compattezza. Esamineremo alcuni risultati di questo tipo nel prossimo pa-
ragrafo.
Esercizi 10.6
1. Sia X uno spazio normato. Si provi che:
(i) se x
n
x in X e F
n
F in X
, allora F
n
x
n
Fx in R;
(ii) se x
n
x in X e F
n
F in X
, allora F
n
x
n
Fx in R;
291
(iii) se x
n
x in X e F
n
F oppure F
n
F in X
, allora non è
detto che si abbia F
n
x
n
Fx in R.
2. Sia 1 < p < . Se f
n
L
p
, si provi che f
n
f in L
p
se e solo se:
(i) f
n
è limitata in L
p
,
(ii)
_
E
f
n
d
_
E
f d per ogni insieme misurabile E con (E) < .
Lenunciato è ancora vero per p = ?
3. Sia f
n
L
1
. Se f
n
f in L
1
, si provi che valgono (i) e (ii) del
precedente esercizio, ma che il viceversa è falso se (X) = .
4. Sia X uno spazio normato e sia M un sottospazio di X. Si provi che
M è chiuso in X se e solo se è chiuso rispetto alla convergenza debole.
Si provi che lo stesso enunciato vale supponendo soltanto M convesso.
[Traccia: per la seconda parte si utilizzi lesercizio 10.1.9.]
5. Dimostrare che il limite debole, o debole*, è unico (se esiste).
6. Si provi che se X è uno spazio di Banach e se F
n
F in X
, allora
F
n
è limitata in X
e
|F|
X
liminf
n
|F
n
|
X
.
7. Siano X, Y spazi normati e sia T /(X, Y ). Si provi che se x
n
x in
X allora Tx
n
Tx in Y .
8. Sia 1 p . Si provi che linsieme e
m
+me
n
n,mN
non ha alcuna
sottosuccessione che converga debolmente a 0 in
p
.
9. Si provi che se X ha dimensione nita, allora la convergenza debole
equivale a quella forte.
10. Si provi che in
1
la convergenza debole è equivalente alla convergenza
forte.
[Traccia: per assurdo sia x
(n)

1
tale che x
(n)
0 ma |x
(n)
|
1
;
si osservi che lim
n
x
(n)
k
= 0 per ogni k N. Deniamo induttiva-
mente: n
0
= 0, m
0
= 0 e poi, noti n
h1
e m
h1
, n
h
= minn > n
h1
:
m
h1
k=0
[x
(n)
k
[ <

5
, m
h
= minm > m
h1
:
i=m+1
[x
(n
h
)
i
[ <

5
. Posto
292
z = z
k
, ove z
k
= sgnx
(n
h
)
k
se m
h1
< k m
h
, si ha z
; si mostri
che [
i=0
z
i
x
(n
h
)
i
[

5
per ogni h N, e si deduca lassurdo.]
11. Dimostrare con esempi che:
(i) f
n
f in L
p
,= f
n
f q.o.;
(ii) f
n
f in L
p
,= f
n
f in misura;
(iii) f
n
, f L
p
e f
n
f q.o. ,= f
n
f in L
p
;
(iv) f
n
, f L
p
e f
n
f in misura ,= f
n
f L
p
.
12. Si provi che sin nx 0 in L
p
(R) per ogni p [1, [, e che sin nx

0
in L
(R).
13. Sia (X, T, ) uno spazio misurato -nito. Se f
n
f in L
p
, 1 p <
, oppure f
n
f in L
, si provi che
liminf
n
f
n
(x) f(x) limsup
n
f
n
(x) q.o. in X.
[Traccia: supposto p = 1, e posto M(x) = limsup
n
f
n
(x), si
osservi che per provare che f M q.o. basta mostrare che f M
q.o. in E, ove E è un arbitrario insieme misurabile di misura nita.
Si utilizzi lesercizio 10.6.2 e si provi che
_
F
f d
_
F
M d per ogni
insieme misurabile F contenuto in Q = x X : [M(x)[ < , od in
Q
+
= x X : M(x) = +, od in Q
= x X : M(x) = .
Per laltra disuguaglianza, si consideri f. Il caso p 1 è analogo.]
10.7 Compattezza
Come si sa, in uno spazio metrico completo (X, d) un insieme K è compatto se
e solo se è chiuso e totalmente limitato; ricordiamo che K è totalmente limita-
to se per ogni > 0 esiste una -rete, cioè una famiglia nita x
1
, . . . , x
N
di
punti di K tali che K
N
j=1
B(x
j
, ), ove B(x
j
, ) = x X : d(x, x
j
) < .
Se lo spazio X è immerso in R
n
od in C
n
per qualche n, allora la nozione di
totale limitatezza equivale a quella di limitatezza; altrimenti, come nel caso
degli spazi di Banach di dimensione innita, gli insiemi limitati e chiusi non
saranno compatti. Ad esempio, gli spazi
p
hanno dimensione innita e lin-
sieme K = e
n
nN
, essendo (e
n
)
k
=
nk
, è limitato, chiuso ma non compatto
293
(vedere gli esercizi 10.7.5 e 10.7.6).
Esistono svariati criteri di compattezza per sottoinsiemi di spazi di Banach.
Ne esamineremo solamente alcuni fra i principali.
Teorema 10.7.1 (di Ascoli-Arzelà) Sia X uno spazio metrico separabile
e sia T una famiglia di funzioni X R. Se:
(i) T è equicontinua, cioè per ogni > 0 esiste > 0 tale che
d(x, y) < = [f(x) f(y)[ < f T,
(ii) T è puntualmente equilimitata, ossia per ogni x X esiste M
x
0 tale
che
[f(x)[ M
x
f T,
allora da ogni successione f
n
nN
T si può estrarre una sottosuccessione
che converge uniformemente in ogni sottoinsieme compatto di X.
Dimostrazione Poiche X è separabile, esiste un insieme numerabile E =
x
n
nN
denso in X. Poniamo S
0
= N; poiche, per (ii), f
n
(x
0
)
nS
0
è
limitato in R, esiste S
1
S
0
tale che la sottosuccessione f
n
(x
0
)
nS
1
è
convergente. Per induzione, costruito S
k
S
k1
tale che f
n
(x
j
)
nS
k
è
convergente per ogni j = 0, 1, . . . , k 1, poiche f
n
(x
k
)
nS
k
è limitato in
R esiste S
k+1
S
k
tale che la sottosuccessione f
n
(x
k
)
nS
k+1
è convergente
(al pari delle sottosuccessioni f
n
(x
j
)
nS
k+1
, j = 0, 1, . . . , k 1). Resta
cos` denita uninnita sequenza di sottosuccessioni, ognuna inclusa nella
precedente, delle quali la k + 1-sima è tale che f
n
(x
j
)
nS
k+1
converge in R
per ogni j = 0, 1, . . . , k.
Adesso indichiamo con r
k
il k-simo elemento dellinsieme S
k
(che è ordinato
secondo lordinamento naturale di N); ponendo S = r
0
, r
1
, . . . , r
k
, . . ., si ha
S N ed inoltre, per ogni k N, al pi` u i primi k termini di S, da r
0
a r
k1
,
non appartengono a S
k
. Di conseguenza, la sottosuccessione diagonale
f
n
nS
è tale che f
n
(x
k
)
nS
converge in R per ogni k N, ovvero
lim
nS, n
f
n
(x) x E.
Adesso, ssato un compatto K X, proveremo che f
n
(x)
nS
converge
uniformemente in K. Fissiamo > 0, e scegliamo > 0 in modo che valga
(i). Poiche K è compatto, esso può essere ricoperto da una famiglia nita
294
di palle B(y
1
,

2
), . . . , B(y
N
,

2
); dato che E è denso in X, in ciascuna palla
B(y
i
,

2
) cadrà un punto x
k
i
E. Quindi, per (i), avremo
[f
n
(x
k
i
) f
n
(x)[ < x B
_
y
i
,

2
_
, i = 1, . . . , N,
e dunque se x K, scelto i in modo che x B(y
i
,

2
), e ricordando che
f
n
(x
k
i
)
nS
è convergente, otteniamo per ogni n, m S sucientemente
grandi:
[f
n
(x)f
m
(x)[ [f
n
(x)f
n
(x
k
i
)[+[f
n
(x
k
i
)f
m
(x
k
i
)[+[f
m
(x
k
i
)f
m
(x)[ < 3.
Ci` o prova che f
n
nS
è una successione di Cauchy rispetto alla convergenza
uniforme in K, ove K è un arbitrario compatto contenuto in X. La tesi è
provata.
Corollario 10.7.2 Sia X uno spazio di Banach separabile e sia F
n
una
successione limitata in X
. Allora esiste una sottosuccessione F

n
k
di F
n
che converge debolmente* in X
ad un elemento F X
.
Dimostrazione Posto M = sup
nN
|F
n
|
X
, si ha
[F
n
x[ M|x|
X
x X, n N,
[F
n
x F
n
y[ M|x y|
X
x, y X, n N;
quindi la famiglia F
n
nN
verica le ipotesi del teorema di Ascoli-Arzelà.
Dunque, essendo x un compatto di X per ogni x X, per unopportuna
sottosuccessione F
n
k
F
n
si avrà
lim
k
F
n
k
(x) x X.
`
E chiaro che il limite cos` denito è un funzionale lineare F tale che [Fx[
M|x|
X
per ogni x X; ne segue la tesi.
Corollario 10.7.3 Sia X uno spazio di Banach riessivo e sia x
n
una
successione limitata in X. Allora esiste una sottosuccessione x
n
k
di x
n
che converge debolmente in X ad un elemento x X.

295
Dimostrazione Il sottospazio M = [x
n
] è separabile (esercizio 10.5.12) e
riessivo, essendo un sottospazio chiuso dello spazio riessivo X (proposizione
10.5.3). Poiche J
xn
è una successione limitata in M
, per il corollario
10.7.2 cè una sottosuccessione J
xn
k
di J
xn
che converge debolmente* ad
un elemento M
. Per la riessività di M sarà = J

x
per un certo
x M: quindi J
xn
k
J
x
in M
, ovvero Fx
n
k
Fx per ogni F M
.
Dato che ogni funzionale lineare continuo su X è anche continuo su M, si ha
in particolare che x
n
k
x in X. Ciò prova la tesi.
Esercizi 10.7
1. Si provi che se X è uno spazio di Banach riessivo, ogni funzionale
F X
assume massimo sulla palla unitaria chiusa di X.

2. Si provi che M = f C[a, b] : f(a) = 0 non è riessivo, e se ne
deduca che C[a, b] non è riessivo.
[Traccia: si consideri il funzionale
Fg =
n=0
1
n!
g
_
a +
b a
n + 1
_
, f M,
e si utilizzi lesercizio precedente.]
3. Si provi che c
0
non è riessivo.
[Traccia: si utilizzi lesercizio 7.3.11.]
4. Sia X uno spazio di Banach innito-dimensionale e riessivo. Si provi
che esistono una successione x
n
X ed un elemento x X tali che
x
n
x ma x
n
, x in X.
[Traccia: utilizzando lesercizio 10.1.11, si costruisca induttivamente
x
n
X tale che |x
n
|
X
= 1 e |x
n
x
m
|
X

1
2
per ogni n > m . . . ]
5. Si provi che in
1
, in
2
e in
la palla unitaria chiusa non è compatta.

6. Si provi che se p [1, [ e
n=0
a
n
è una serie convergente di numeri
positivi, allora linsieme
K = x
p
: [x
n
[ a
n
n N
è compatto in
p
. Se p = 2 e a
n
=
1
n+1
linsieme K è detto cubo di
Hilbert.
296
7. Si provi che un sottoinsieme K C[a, b] è relativamente compatto
se e solo se è limitato ed equicontinuo (secondo la denizione data
nellenunciato del teorema 10.7.1).
8. Sia K un sottoinsieme di L
p
(a, b), 1 p < . Si provi che K è
relativamente compatto se e solo se è limitato ed inoltre, prolungate a
0 fuori di ]a, b[ le funzioni di K, risulta
lim
h0
sup
fK
_
b
a
[f(x +h) f(x)[
p
dx = 0.
[Traccia: per la necessità, ssata una -rete per K, si utilizzi lesercizio
9.1.25. Per la sucienza, ssato > 0, per > 0 sia B
= f
: f K,
ove f
è la convoluzione dellesercizio 9.1.23; si mostri che B
è limitato
ed equicontinuo in C[a, b], e se ne deduca che per piccolo vi è una
-rete A per B
in C[a, b], con =

2
(b a)
1
p
; si concluda che A è una
-rete per K in L
p
(a, b).]
9. (Teorema di Frechèt-Kolmogorov) Sia p [1, [ e sia K L
p
(R). Si
provi che K è relativamente compatto se e solo se è limitato ed inoltre
verica:
(i) lim
h0
sup
fK
_
R
[f(x +h) f(x)[
p
dx = 0,
(ii) lim
r
sup
fK
_
[x[r
[f(x)[
p
dx = 0.
[Traccia: per la sucienza, estrarre da K una sottosuccessione con-
vergente in L
p
con un procedimento diagonale, utilizzando lesercizio
precedente.]
10. (Teorema di Peano) Sia G un aperto limitato di R
2
, e sia f : G R
continua. Si provi che per ogni (x
0
, y
0
) G il problema di Cauchy
y
t
(x) = f(x, y(x)), y(x
0
) = y
0
ha almeno una soluzione y C
1
(I), ove I è un opportuno intervallo di
R centrato in x
0
.
[Traccia: sia M = sup
G
[f[, e per ogni > 0 sia > 0 tale che
[x x
t
[ < , [y y
t
[ < 2M = [f(x, y) f(x
t
, y
t
)[ < .
297
Sia G lunione dei due triangoli chiusi delimitati dalle due rette
per (x
0
, y
0
) di coecienti angolari M e dalle rette verticali x = a e
x = b (con a, b opportuni e tali che a < x
0
< b). Si costruiscano le
spezzate di Eulero nel modo seguente: si tracci da (x
0
, y
0
) la retta di
coeciente angolare f(x
0
, y
0
), si ssi su di essa un altro punto (x
1
, y
1
),
e si tracci da esso la retta di coeciente angolare f(x
1
, y
1
); ssato su
questa un altro punto (x
2
, y
2
), si tracci da esso la retta di coeciente
angolare f(x
2
, y
2
), e cos` via. Sia ora
n
una successione di funzioni
i cui graci siano spezzate di Eulero passanti per (x
0
, y
0
), con nodi
(
(n)
i
,
(n)
i
), tali che
n
= max
i
(
(n)
i

(n)
i1
) tenda a 0 per n . Si
verichi che
n
è un sottoinsieme limitato ed equicontinuo di C[a, b]
e sia
n
una sottosuccessione di
n
uniformemente convergente in
[a, b] (esercizio 10.7.7). Indichiamo con il limite; sia N N tale che
|
n
|
< 2M e
n
< per ogni n > N. Siano [x x
t
[ < , con
(ad esempio) x < x
t
, e n > N; detti (x
(n)
i
, y
(n)
i
) i nodi della spezzata
graco di
n
, sarà x
r
x < x
r+1
< . . . < x
s
< x
t
x
s+1
. Si verichi
che
n
(x)
n
(x
t
) = [
n
(x)
n
(x
r+1
)]+
+
s1
i=r+1
[
n
(x
i
)
n
(x
i+1
)] + [
n
(x
s
)
n
(x
t
)] =
= f(x
r
, y
r
)(x x
r+1
) +
+
s1
i=r+1
f(x
i
, y
i
)(x
i
x
i+1
) +f(x
s
, y
s
)(x
s
x
t
),
e dal fatto che [f(x
i
, y
i
) f(x,
n
(x))[ < per i = r, r + 1, . . . , s si
deduca che
n
(x)
n
(x
t
)
x x
t
f(x,
n
(x))
< n > N, x
t
]x , x +[.
Si concluda, passando al limite per n e per x
t
x, che risolve
il problema di Cauchy.]
298
Capitolo 11
Teoria spettrale
11.1 Spettro e risolvente
Questo capitolo è dedicato alla teoria spettrale degli operatori lineari su uno
spazio normato X: se T : X X è lineare, studieremo la struttura dellin-
sieme dei valori tali che I T è invertibile con inverso continuo. Questa
proprietà è di grande importanza nelle applicazioni, poiche permette di ot-
tenere teoremi di esistenza di soluzioni per equazioni vettoriali, con le quali
è possibile modellizzare svariatissimi fenomeni.
Sia A : D(A) X X un operatore lineare in uno spazio di Banach com-
plesso X (se lo spazio X è reale, si può considerare il complessicato di X: si
veda lesercizio 11.1.1).
Denizione 11.1.1 Sia C. Il punto è detto regolare per A se lope-
ratore I A : D(A) X è iniettivo con immagine R(I A) densa in X,
e se il suo inverso (I A)
1
: R(I A) D(A) è continuo (rispetto alla
norma di X). Linsieme
(A) = C : è regolare per A
si dice insieme risolvente di A. Loperatore (I A)
1
, che si denota con
R(, A), si chiama operatore risolvente di A. Linsieme
(A) = C (A) = C : non è regolare per A
si dice spettro di A.
A sua volta lo spettro di A si decompone in questo modo:
spettro puntuale = P
(A) = C : I A non è iniettivo,

299
spettro continuo = C
(A) = C :
I A è iniettivo, R(I A) = X, (I A)
1
non è continuo,
spettro residuo = R
(A) = C : I A è iniettivo , R(I A) X.

Osservazione 11.1.2 Se A è un operatore lineare chiuso, e se (A),
allora R(I A) = X, cioè I A è bigettivo con inverso (I A)
1
denito
su tutto X. Infatti, se y X = R(I A), esiste x
n
D(A) tale che
x
n
Ax
n
y; la continuità di (I A)
1
implica che x
n
è di Cauchy in X
e quindi converge a un elemento x X. Ne segue che Ax
n
y+x: poiche
A è chiuso, si conclude che x D(A) e Ax = y x, cioè y R(I A).
Esempio 11.1.3 Sia A : C
n
C
n
unapplicazione lineare, rappresentata
dalla matrice a
ij
che denotiamo ancora, seppur impropriamente, con A.
Lequazione x Ax = 0 ha lunica soluzione x = 0 se e solo se non è un
autovalore della matrice A; in tal caso, loperatore (I A)
1
è denito su
tutto C
n
ed è continuo. Quindi (A) se e solo se non è un autovalore.
In denitiva, (A) è linsieme degli autovalori della matrice A.
In analogia con il caso delle matrici, si ha la seguente
Denizione 11.1.4 Sia A : D(A) X X un operatore lineare in uno
spazio di Banach complesso X. I punti dello spettro puntuale di A si dicono
autovalori di A; i vettori non nulli x X tali che x Ax = 0 si dicono
autovettori di A relativi allautovalore .
Proposizione 11.1.5 Sia X uno spazio di Banach. Se A : D(A) X X
è un operatore lineare chiuso, allora (A) è aperto in C e quindi (A) è
chiuso.
Dimostrazione Se (A) è vuoto, allora è aperto. Altrimenti, ssiamo
(A): per losservazione 11.1.2, (I A)
1
/(X); proviamo che se C
e |(I A)
1
|
/(X)
[[ < 1 allora risulta (A).
Per ogni k N sia B
k
=
k
n=0
n
(I A)
n
; per la scelta di , B
k
è una
successione di Cauchy in /(X) e B =
n=0
n
(I A)
n
appartiene a /(X).
Verichiamo che B(I A)
1
è linverso di ( )I A. Per ogni k N si
ha
B
k
(I A)
1
[( )I A] = B
k
[I (I A)
1
] =
=
k
n=0
n
(I A)
n
[I (I A)
1
] = I
k+1
(I A)
(k+1)
,
300
ed essendo |
k+1
(I A)
(k+1)
|
/(X)
([[|(I A)
1
|
/(X)
)
k+1
, per k
segue che
B(I A)
1
[( )I A] = I[
D(A)
.
Analogamente si verica che per ogni k N e per ogni x X risulta
[( )I A]B
k
(I A)
1
x = x
k+1
(I A)
(k+1)
x;
posto z
k
= B
k
(I A)
1
x, si ha allora z
k
D(A) e, per k , z
k

B(I A)
1
x e [()I A]z
k
x. Poiche ()I A è chiuso, si ottiene
che B(I A)
1
x D(A) e
[( )I A]B(I A)
1
)x = x x X.
Proposizione 11.1.6 Sia X uno spazio di Banach. Se A /(X) e se
[[ > |A|
/(X)
, allora (A).
Dimostrazione Se [[ > |A|
/(X)
, si verica che loperatore B =
1
n=0
A
n
n
inverte I A.
Esempi 11.1.7 (1) Poniamo X = C[a, b], D(A) = X, (Af)(t) = tf(t) per
ogni t [a, b]. Allora A /(X) e |A|
/(X)
= max[a[, [b[. Poiche
[(I A)f](t) 0 ( t)f(t) 0 f(t) 0,
si ha che I A è iniettivo per ogni C, e quindi P
(A) = . Poi, se
/ [a, b], allora per ogni g X la funzione f(t) =
g(t)
t
appartiene a X e
verica la relazione f = (I A)
1
g. Inoltre
|f|
sup
t[a,b]
1
[ t[
|g|
,
cosicche [a, b] (A). Viceversa, se [a, b] si ha
R(I A) = g X : g() = 0 e g è derivabile nel punto ,
e questo insieme non è denso in X. Pertanto C
(A) = e R
(A) = (A) =
[a, b].
(2) Sia X = C[a, b], D(A) = C
1
[a, b] e A =
d
dt
. Poiche f(t) f
t
(t) 0
se e solo se f(t) = c e
t
, si ha che ogni C è autovalore per A. Pertanto
(A) = P
(A) = C.
301
(3) Poniamo stavolta X = C[a, b], D(A) = f C
1
[a, b] : f(a) = 0, A =
d
dt
: lequazione f f
t
= g ha lunica soluzione f(t) = e
t
_
t
a
e
g()d;
di conseguenza (I A)
1
è denito su tutto X ed è continuo. Pertanto
(A) = .
(4) Sia ancora X = C[a, b], con D(A) = f C
1
[a, b] : f(a) = f(b) = 0
e A =
d
dt
. Si vede subito che lo spettro puntuale è vuoto. Daltra parte
lequazione f f
t
= g ha lunica soluzione f(t) = e
t
_
t
a
e
g()d se e
solo se g verica la condizione di compatibilità
_
b
a
e
g()d = 0. Dunque
limmagine R(I A) non è densa in X e pertanto (A) = R
(A) = C.
(5) Consideriamo ancora una volta A =
d
dt
nello spazio X = C[a, b], con
dominio D(A) = f C
1
[a, b] : f(a) = Kf(b), essendo K un ssato
numero reale non nullo. Lequazione f f
t
= 0 ha soluzione non nulla per
=
log [K[+2ki
ab
, k Z, per cui P
(A) è dato dallinsieme di questi punti. Gli

altri punti di C sono in (A) in quanto risulta per ogni g X
[(I A)
1
g](t) =
Ke
b
_
b
a
e
g()d
e
a
Ke
b
e
t
e
t
_
t
a
e
g()d.
In denitiva, (A) = P
(A) =
_
log [K[+2ki
ab
_
kZ
.
(6) Sia X =
2
e A /(
2
) denito da (Ax)
n
= x
n+1
. Lo spettro puntuale è
C : [[ < 1, mentre lo spettro continuo è C : [[ = 1 e lo spettro
residuo è vuoto (si vedano la proposizione 11.1.6 e lesercizio 11.1.5).
Esercizi 11.1
1. (Complessicazione di uno spazio normato reale) Sia X uno spazio
normato reale. Su X
2
= X X consideriamo le operazioni di somma
e di prodotto per scalari complessi cos` denite:
(x, y) + (u, v) = (x +u, y +v), ( +i)(x, y) = (x y, x +y).
(i) Si denisca x +iy = (x, y) e si verichi che
(x +iy) + (u +iv) = (x +u) +i(y +v) x, y, u, v X,
(+i)(x+iy) = (xy) +i(x+y) , R, x, y X.
302
(ii) Posto X
C
= x + iy : x, y X, si verichi che X
C
è uno spazio
vettoriale complesso, che
|x +iy|
X
C
= sup
[0,2[
|x cos +y sin |
X
è una norma su X
C
e che X si immerge isometricamente in X
C
.
(iii) Si mostri che, in generale, la funzione p(x + iy) = |x|
X
+ |y|
X
non è una norma su X
C
.
2. Sia X uno spazio di Banach di dimensione nita. Se T : X X è
lineare, si provi che (T) ,= , e che quando X è reale può capitare che
(T) R = .
3. Sia X uno spazio di Banach e sia A : D(A) X X un operatore
lineare chiuso. Si provi lidentità del risolvente
R(, A) R(, A) = ( )R(, A)R(, A) , (A).
4. Sia X uno spazio di Banach e sia T /(X). Si provi che R(, T)
è unapplicazione da (T) in /(X) olomorfa e si calcoli
d
d
R(, T). Se
ne deduca che se T /(X) allora (T) ,= .
5. Sia X uno spazio di Banach e sia A /(X). Se appartiene alla
frontiera di (A), si provi che P
(A) C
(A).
6. Sia X uno spazio di Banach e sia A /(X). Dimostrare che:
(i) se (A), allora
n
(A
n
) per ogni n N;
(ii) se [[ > liminf
n
|A
n
|
1/n
/(X)
allora (A).
(iii) esiste il limite lim
n
|A
n
|
1/n
/(X)
. Tale limite si chiama raggio
spettrale di A e si indica con r
(A).
[Traccia: per (iii), posto r = liminf
n
|A
n
|
1/n
/(X)
e ssato > 0, si
scelga m N
+
tale che |A
m
|
1/m
/(X)
]r , r + [; si osservi che per
n > m risulta, scelto k N
+
in modo che km < n (k + 1)m:
|A
n
|
1
n
/(X)
|A
km
|
1
n
/(X)
|A
nkm
|
1
n
/(X)

_
|A
m
|
1
m
/(X)
_
km
n
|A|
nkm
n
/(X)
.
303
Si deduca che
|A
n
|
1
n
/(X)
(r +)
km
n
|A|
m
n
/(X)
n > m;
essendo 1
m
n

km
n
< 1, si concluda che limsup
n
|A
n
|
1/n
/(X)
(r +).]
7. Sia A : D(A) X X un operatore lineare chiuso nello spazio di
Banach X, tale che 0 (A). Si provi che se ,= 0 si ha (A) se
e solo se
1
(A
1
).
8. Siano X =
2
, D(A) = x X :
n=1
n
2
[x
n
[
2
< , (Ax)
n
= nx
n
per ogni n N. Loperatore A è chiuso? Laggiunto A
esiste? Si
determini (A).
9. Sia T :
2

2
loperatore denito da
(Tx)
n
= x
n+2
n N, x
2
.
(i) Si calcoli la norma di T.
(ii) Si scriva loperatore aggiunto T
.
(iii) Si trovino gli autovalori di T.
10. Sia X uno spazio di Banach e sia T /(X) unisometria. Si provi che
P
(T) C : [[ = 1.
11. Sia H uno spazio di Hilbert e sia T /(H) un operatore unitario (cioè
tale che TT
= T
T = I). Si provi che (T) C : [[ = 1.

12. Sia H uno spazio di Hilbert e sia T /(H) autoaggiunto. Si provi che
R
(T) = .
13. Sia H uno spazio di Hilbert e sia T /(H). Si provi che (T) se
e solo se (T
).
11.2 Operatori compatti
Mentre per gli operatori lineari su spazi di dimensione nita si può formulare
una teoria esauriente, lo studio degli operatori lineari su spazi di dimensione
304
innita costituisce un problema vastissimo e complicato. Tuttavia, alcune no-
tevoli classi di operatori possono essere descritte in maniera sucientemente
completa. Una delle pi` u importanti è la classe degli operatori compatti: essi
infatti da una parte godono di proprietà analoghe a quelle degli operatori a
immagine nito-dimensionale, e quindi se ne può fornire una descrizione ac-
curata, e dallaltra giocano un ruolo fondamentale in numerose applicazioni,
e in particolare nella teoria delle equazioni integrali.
Denizione 11.2.1 Siano X e Y spazi normati. Un operatore A : X
Y si dice compatto, o completamente continuo, se è continuo e trasforma
insiemi limitati di X in insiemi relativamente compatti di Y .
A noi interesseranno esclusivamente gli operatori compatti lineari. Dalla
denizione segue che gli operatori compatti sono continui; si noti che il vice-
versa è falso se dimY = : lidentità I : Y Y non è compatta. Notia-
mo anche che, evidentemente, per ottenere la compattezza di un operatore
A /(X, Y ) basta mostrare che limmagine della palla unitaria di X è
relativamente compatta in Y .
Esempi 11.2.2 (1) Se dimY < , ogni operatore A /(X, Y ) è compat-
to.
(2) Sia A :
2

2
denito da (Ax)
n
=
xn
n+1
per ogni n N. Limmagine
della palla unitaria è contenuta nel cubo di Hilbert (esercizio 10.7.6), il quale
è un sottoinsieme compatto di
2
: ne segue che A è un operatore compatto.
(3) Se M è un sottospazio chiuso di uno spazio di Hilbert H, la proiezione
ortogonale P
M
è un operatore compatto se e solo se M ha dimensione nita.
(4) Sia K una funzione di due variabili continua in [a, b] [a, b] e sia A :
C[a, b] C[a, b] loperatore integrale denito da Af(t) =
_
b
a
K(t, s)f(s)ds
per ogni t [a, b]. Utilizzando il teorema di Ascoli-Arzelà (teorema 10.7.1)
non è dicile vericare che A è un operatore compatto.
(5) Un caso particolare dellesempio precedente si ha quando K(t, s) = 0
per t < s: in questo caso si ha Af(t) =
_
t
a
K(t, s)f(s)ds e A viene chiamato
operatore integrale di Volterra. Per tale operatore valgono le stime, vericabili
per induzione,
|A
n
|
/(C[a,b])
|K|
n
(b a)
n
n!
n N;
305
dunque la serie
n=0
[[
n1
|A
n
|
/(C[a,b])
è convergente per ogni C0,
e di conseguenza la serie
n=0
n1
A
n
denisce un operatore che, come
si verica facilmente, coincide con R(, A). In denitiva, per ogni ssata
g C[a, b] lequazione integrale di Volterra
f(t)
_
t
a
K(t, s)f(s)ds = g(t), t [a, b],
è univocamente risolubile in C[a, b] qualunque sia C 0. Al contrario,
come si vedrà in seguito, si ha 0 (A).
Vediamo adesso le principali proprietà degli operatori compatti fra due spazi
normati X e Y .
`
E evidente dalla denizione che essi formano un sottospazio
di /(X, Y ); il risultato che segue mostra che tale sottospazio è chiuso allorche
Y è completo.
Proposizione 11.2.3 Sia X uno spazio normato e sia Y uno spazio di Ba-
nach. Sia A
n
nN
+ una successione di operatori compatti da X a Y tale
che A
n
A in /(X, Y ): allora A è un operatore compatto.
Dimostrazione Sia x
n
X tale che |x
n
|
X
K per ogni n N: dob-
biamo provare che Ax
n
ha una sottosuccessione convergente in Y . Poiche
A
1
è compatto, esistono un elemento y
1
Y e una prima sottosuccessione
x
(1)
n
x
n
tale che A
1
x
(1)
n
y
1
in Y per n . Poiche A
2
è com-
patto, esistono un altro elemento y
2
Y e una seconda sottosuccessione
x
(2)
n
x
(1)
n
tale che A
i
x
(2)
n
y
i
in Y per n , i = 1, 2. Iterando il
ragionamento, per ogni k N
+
, essendo A
k
compatto, esisteranno un k-simo
elemento y
k
Y e una k-sima sottosuccessione x
(k)
n
x
(k1)
n
tale che
A
i
x
(k)
n
y
i
in Y per n , i = 1, 2, . . . , k.
Consideriamo adesso la successione x
(n)
n
, la quale, salvo che per i suoi primi
k termini, è estratta da x
(k)
n
e in particolare è una sottosuccessione della
successione originaria x
n
: per essa risulta A
i
x
(n)
n
y
i
in Y per n
qualunque sia i N
+
. Fissiamo dunque > 0: esiste k
N
+
tale che
|A A
k
|
/(X,Y )
< . Allora, dato che A
k
x
(n)
n
y
k
, esiste
N tale che
|A
k
(x
(n)
n
x
(m)
m
)|
Y
< per ogni n, m
. Ne segue, per ogni n, m
,
|Ax
(n)
n
Ax
(m)
m
|
Y
= |Ax
(n)
n
A
k
x
(n)
n
|
Y
+
+|A
k
(x
(n)
n
x
(m)
m
)|
Y
+|A
k
x
(m)
m
Ax
(m)
m
|
Y
<
< 2K +.
306
Dunque la successione Ax
(n)
n
è di Cauchy in Y . Poiche Y è completo, essa
è convergente in Y .
Nella proposizione precedente la completezza di Y è essenziale, come mostra
il seguente
Esempio 11.2.4 Sia B : c
0

2
denito da (Bx)
n
=
xn
n+1
per ogni n N.
Poniamo X = (c
0
, | |
), Y = (R(B), | |
2), e consideriamo gli operatori

B
n
/(X, Y ) cos` deniti:
(B
n
x)
k
=
_
x
k
k+1
se k n,
0 se k > n;
i B
n
, avendo immagine nito-dimensionale, sono compatti. Si ha B
n
B in
/(X, Y ) per n ; daltra parte, considerando la successione y
(n)
X
data da y
(n)
k
=
_
1 se k n
0 se k > n,
essa è chiaramente limitata in X mentre,
essendo (By
(n)
)
k
=
_
1/k se k n
0 se k > n,
si ha By
(n)

1
k
k
N
+
/ Y . Ciò
prova che By
(n)
è una successione di Cauchy in Y che non converge in
Y (e in particolare Y non è completo), cosicche By
(n)
è un insieme non
relativamente compatto in Y . In particolare B : X Y non è un operatore
compatto. Si osservi tuttavia che B : c
0

2
è compatto.
Dalla proposizione 11.2.3 segue subito:
Corollario 11.2.5 Sia X uno spazio normato e sia Y uno spazio di Banach.
Allora gli operatori che sono limiti in /(X, Y ) di successioni di operatori ad
immagine nito-dimensionale sono compatti.
Il viceversa del corollario precedente è falso in generale, ma è vero, come
vedremo, se X e Y coincidono con uno stesso spazio di Hilbert H.
Proposizione 11.2.6 Siano X, Y, Z spazi normati, siano A /(X, Y ) e
B /(Y, Z). Se uno dei due operatori è compatto, allora B A è compatto.
Dimostrazione Immediata conseguenza della denizione 11.2.1.
Proposizione 11.2.7 Sia X uno spazio normato e sia A /(X) un opera-
tore compatto e iniettivo. Allora si ha 0 (A) se e solo se X ha dimensione
nita.
307
Dimostrazione Se X ha dimensione nita, gli operatori lineari da X in
se sono tutti continui e compatti, e se sono iniettivi sono anche surgettivi
con inverso continuo. Quindi 0 appartiene al loro risolvente. Viceversa, sia
A /(X) compatto e iniettivo e sia 0 (A): allora A è anche surgettivo
e A
1
/(X). Dunque I = A
1
A è un operatore compatto in virt` u della
proposizione precedente: pertanto X ha dimensione nita.
Corollario 11.2.8 Sia X uno spazio normato di dimensione innita. Se
A /(X) è un operatore compatto, allora 0 (A).
Proposizione 11.2.9 Siano X e Y spazi normati e sia A /(X, Y ). Se
A è compatto, allora A
è compatto; viceversa, se A
è compatto e Y è uno
spazio di Banach, allora A è compatto.
Dimostrazione (=) Per provare che A
è compatto dimostreremo che se

W è un sottoinsieme limitato di Y
allora A
(W) è totalmente limitato in X
:
dato che X
è completo, ciò implicherà che A
(W) è relativamente compatto

in X
, che è quanto basta. Sia > 0: posto S = x X : |x|

X
= 1, essendo
A compatto linsieme A(S) è totalmente limitato in Y . Quindi esistono
x
1
, . . . , x
n
S tali che
min
1in
|Ax Ax
i
|
Y
< x S.
Deniamo loperatore B : Y
C
n
ponendo Bg = (g(Ax
1
), . . . , g(Ax
n
)) per
ogni g Y
. Allora
[Bg[
2
n
=
n
i=1
[g(Ax
i
)[
2
n|g|
2
Y
|A|
2
/(X,Y )
,
cosicche B /(Y
, C
n
). Dato che B ha immagine nito-dimensionale, lin-
sieme B(W) è totalmente limitato in C
n
: quindi esistono g
1
, . . . , g
m
W tali
che
min
1jm
[Bg
j
Bg[
n
< g W.
Dunque, ssata g W, è possibile scegliere un indice j
0
fra 1 e m (dipendente
da g) in modo che
[g(Ax
i
) g
j
0
(Ax
i
)[ < , i = 1, . . . , n.
308
Vogliamo adesso valutare la quantità
|A
g
j
0
A
g|
X
= sup
xS
[g
j
0
(Ax) g(Ax)[.
Per ogni ssato x S, sia i
0
lindice fra 1 e n (dipendente da x) tale che
|Ax Ax
i
0
|
Y
< ; allora si ha
[g
j
0
(Ax) g(Ax)[
[g
j
0
(Ax) g
j
0
(Ax
i
0
)[ +[g
j
0
(Ax
i
0
) g(Ax
i
0
)[ +[g(Ax
i
0
) g(Ax)[
(|g
j
0
|
Y
+|g|
Y
) +
_
1 + 2 sup
gW
|g|
Y
_
.
Da questa relazione, per larbitrarietà di x S, segue che
min
1jm
|A
g
j
A
g|
X
|A
g
j
0
A
g|
X

_
1 + 2 sup
gW
|g|
Y
_
g W.
Ci` o prova che A
(W) è totalmente limitato in X
.
(=) Largomentazione è del tutto analoga.
Proposizione 11.2.10 Siano X e Y spazi normati e sia A /(X, Y ) un
operatore compatto. Allora limmagine R(A) è separabile; inoltre R(A) è uno
spazio normato completo se e solo se ha dimensione nita.
Dimostrazione Proviamo la separabilità. Dato che R(A) =
n=1
A(nB),
ove B è la palla unitaria chiusa di X, basta mostrare che A(B) è separabile.
Poiche Aè compatto, linsieme A(B) è relativamente compatto in Y e dunque
totalmente limitato: quindi per ogni m N
+
esistono y
m
1
, . . . , y
m
pm
A(B)
tali che
inf
1ipm
|y y
m
i
|
Y
<
1
m
y A(B).
Ne segue che y
m
i
: 1 i p
m
, m N
+
è un sottoinsieme numerabile denso
in A(B).
Dimostriamo laltro enunciato. Ovviamente, se la dimensione di R(A) è
nita, allora R(A) è completo. Viceversa, supponiamo che Z = R(A) sia
completo. Siccome A : X Z è compatto, anche A
: Z
è compatto
(proposizione 11.2.9). Inoltre A
è iniettivo: infatti se f Z
e A
f = 0
allora f(Ax) = 0 per ogni x X, ovvero, per la surgettività di A : X Z,
fy = 0 per ogni y Z: pertanto f = 0. In denitiva, A
: Z
R(A
) è
309
bigettivo. Proviamo che (A
)
1
: R(A
) Z
è continuo: se cos` non fosse,

esisterebbe f
n
Z
tale che
lim
n
|A
f
n
|
X
= 0, lim
n
|f
n
|
Z
= +.
Quindi (A
f
n
)x 0 in C per ogni x X, cioè f
n
y 0 in C per ogni y Z.
Essendo Z completo, per il teorema di Banach-Steinhaus si conclude che
f
n
è limitata in Z
, e ciò è assurdo. Dunque A
: Z
R(A
) è compatto,
bigettivo e ha inverso continuo. Dalla proposizione 11.2.7 si ottiene allora
che Z
ha dimensione nita e inne che dimZ = dimZ
< .
Esercizi 11.2
1. Siano X, Y spazi normati e sia A
n
/(X, Y ) una successione di
operatori compatti tale che A
n
x Ax in Y per n . Loperatore
A è necessariamente compatto?
`
E continuo?
2. Siano X, Y spazi di Banach con X riessivo, e sia A /(X, Y ). Si
provi che A è compatto se e solo se Ax
n
Ax in Y per ogni x
n
x
in X; si provi poi che quando X non è riessivo tale condizione non è
suciente per la compattezza di A (ma è sempre necessaria).
3. Sia X uno spazio di Banach. Se A /(X) è bigettivo, si provi che A
è compatto se e solo se dimX < .
4. Sia Tf(x) = x
2
f(x) per f L
2
(a, b).
(i) Si provi che T /(L
2
(a, b)) e se ne calcoli la norma.
(ii) Si mostri che T non ha autovalori e che (T) = [0, |T|].
5. Fissata g C[a, b], sia A : C[a, b] C[a, b] denito da Af(x) =
f(x)g(x).
(i) Si calcoli |A| e si provi che se g ,= 0 allora A non è compatto.
(ii) Per quali g loperatore A ha autovalori?
(iii) Se A ha autovalori, si provi che essi sono al pi` u uninnità nume-
rabile.
310
6. Sia A loperatore dellesempio 11.2.2 (2). Si provi che (I A)
1
,
quando è denito, è un operatore compatto, e se ne determini lo spettro.
Si analizzi poi la situazione per gli operatori degli esempi 11.2.2 (3) e
11.2.2 (4).
7. Siano X, Y spazi di Banach e siano A, B /(X, Y ) con B compatto.
Si provi che se R(A) R(B), allora anche A è compatto.
8. Sia X = C[0, 1] e poniamo Tf(t) =
_
t
0
f(s)
s
ds.
(i) Si calcoli |T|
/(X)
;
(ii) Si provi che T è compatto e se ne determini lo spettro;
(iii) per (T) si scriva esplicitamente loperatore R(, T).
[Traccia: per ,= 0 si consideri lequazione f Tf = g supponendo
dapprima g C
1
[0, 1]: si osservi che se f è soluzione allora f C
1
.
Derivando, si ottiene lequazione f
t
f = g
t
, la cui soluzione (metodo
di variazione delle costanti seguito da una integrazione per parti) è
f(t) =
1
g(t) +
1
2
_
t
0
e
(ts)/
g(s)ds. Inne si noti che tale espressione ha
senso per ogni g C[0, 1]. . . ]
9. Sia A loperatore integrale dellesempio 10.4.6 (2). Si provi che A :
L
2
(a.b) L
2
(a, b) è compatto.
11.3 Operatori compatti in spazi di Hilbert
Nel caso di operatori compatti da uno spazio di Hilbert in se, la teoria diventa
pi` u interessante e completa. Per cominciare, analizziamo il comportamento
di un operatore compatto rispetto alla convergenza debole.
Proposizione 11.3.1 Sia H uno spazio di Hilbert e sia A /(H). Allora
A è compatto se e solo se per ogni x
n
H tale che x
n
x in H risulta
Ax
n
Ax in H.
Dimostrazione (=) Sia K H un insieme limitato e sia x
n
una suc-
cessione contenuta in K. Per il corollario 10.7.3 esiste una sottosuccessione
x
n
k
tale che x
n
k
x H. Per ipotesi, ciò implica Ax
n
k
Ax, il che mo-
stra che A(K) è relativamente compatto. Dunque loperatore A è compatto.
311
(=) Viceversa, sia A compatto e sia x
n
una successione tale che x
n
x
in H. Allora per lesercizio 10.6.7 si ha Ax
n
Ax in H. Se, per as-
surdo, |Ax
n
Ax|
H
non tendesse a 0, esisterebbe una sottosuccessione
x
n
k
x
n
tale che |Ax
n
k
Ax|
H

0
> 0 per ogni k N. Daltra
parte, per la limitatezza di x
n
k
e la compattezza di A, sarebbe possibile
estrarre unulteriore sottosuccessione x
t
n
k
x
n
k
tale che Ax
t
n
k
y H.
A maggior ragione allora Ax
t
n
k
y, e per lunicità del limite debole (eserci-
zio 10.6.5) si deduce che y = Ax, e ciò è assurdo. Pertanto Ax
n
Ax in H.
Proposizione 11.3.2 Sia H uno spazio di Hilbert e sia A /(H). Allora
A è compatto se e solo se per ogni x
n
H tale che x
n
x in H risulta
(Ax
n
, x
n
)
H
(Ax, x)
H
.
Dimostrazione (=) Sia A compatto e sia x
n
x in H. Per avere la tesi
basta osservare che
[(Ax
n
, x
n
)
H
(Ax, x)
H
[ [(Ax
n
Ax, x
n
)
H
[ +[(Ax, x
n
x)
H
[
|Ax
n
Ax|
H
|x
n
|
H
+[(Ax, x
n
x)
H
[
e che lultimo membro è innitesimo per n in virt` u della limitatezza di
|x
n
|.
(=) Viceversa, osserviamo anzitutto che se z
n
0 e y
n
0 in H, allora si
ha anche z
n
+y
n
0 per ogni C: quindi, per ipotesi,
(Az
n
, z
n
)
H
0, (Ay
n
, y
n
)
H
0, (A(z
n
+y
n
), z
n
+y
n
)
H
0.
Scegliendo = 1 e = i, per dierenza si ottiene che (Az
n
, y
n
)
H
0.
Ci` o premesso, sia x
n
x in H e sia z
n
= x
n
x, cosicche z
n
0. Poiche, per
lesercizio 10.6.7, Az
n
0, scegliendo y
n
= Az
n
largomentazione precedente
mostra che |Az
n
|
H
0, ossia Ax
n
Ax. La proposizione 11.3.1 implica
allora che A è compatto.
Analizziamo ora la struttura dello spettro degli operatori compatti e autoag-
giunti in uno spazio di Hilbert. Il primo enunciato estende un noto risultato
algebrico valido per le matrici hermitiane.
Proposizione 11.3.3 Sia H uno spazio di Hilbert e sia A /(H) un
operatore autoaggiunto. Allora:
(i) gli autovalori di A sono reali;
312
(ii) autovettori relativi ad autovalori distinti sono fra loro ortogonali.
Dimostrazione (i) Se Ax = x con x ,= 0, allora
|x|
2
H
= (Ax, x)
H
= (x, Ax)
H
= |x|
2
H
,
da cui R.
(ii) Se Ax = x e Ax
t
=
t
x
t
con x, x
t
,= 0 e ,=
t
, allora a causa di (i) si
ha
(x, x
t
)
H
= (Ax, x
t
)
H
= (x, Ax
t
)
H
=
t
(x, x
t
)
H
=
t
(x, x
t
)
H
,
da cui x x
t
.
Proposizione 11.3.4 Sia H uno spazio di Hilbert, sia A /(H) un ope-
ratore compatto e autoaggiunto e sia Q(x) = (Ax, x)
H
la forma quadratica
associata ad A; poniamo
m = inf
|x|
H
=1
Q(x), M = sup
|x|
H
=1
Q(x).
Allora:
(i) si ha < m M < + e |A|
/(H)
= max[m[, [M[;
(ii) se m < 0 allora m è autovalore di A, se M > 0 allora M è autovalore
di A.
Dimostrazione (i) Anzitutto, evidentemente, Q(x) è reale per ogni x H,
si ha m M e
max[m[, [M[ sup
|x|
H
=1
[Q(x)[ |A|
/(H)
< .
Se A = 0 allora, banalmente, 0 = |A|
/(H)
= max[m[, [M[; supponiamo
dunque A ,= 0 e poniamo
N = max[m[, [M[ = sup
|x|
H
=1
[Q(x)[ :
allora, come si è osservato, 0 < N |A|
/(H)
. Daltra parte, essendo A
autoaggiunto,
(A(x +y), x +y)
H
(A(x y), x y)
H
= 4Re(Ax, y)
H
,
313
da cui, grazie allidentità del parallelogrammo (proposizione 7.2.9), otteniamo
per ogni x, y H
4Re(Ax, y)
H
[(A(x +y), x +y)
H
[ +[(A(x y), x y)
H
[
N
_
|x +y|
2
H
+|x y|
2
H
= 2N
_
|x|
2
H
+|y|
2
H
.
Per ogni x H tale che |x|
H
= 1 e Ax ,= 0, scegliendo y =
Ax
|Ax|
H
si ricava
|Ax|
H
N: dunque |A|
/(H)
N.
(ii) Sia m < 0 e sia x
n
H tale che |x
n
|
H
= 1 e (Ax
n
, x
n
)
H
m: allora
esiste una sottosuccessione x
n
k
x
n
tale che x
n
k
x, con x H; per
la proposizione 10.6.2 risulta |x|
H
1. Poiche A è compatto, in virt` u della
proposizione 11.3.2 otteniamo
(Ax, x)
H
= lim
k
(Ax
n
k
, x
n
k
)
H
= m < 0,
e in particolare x ,= 0.
Osserviamo ora che si ha necessariamente |x|
H
= 1: se infatti fosse 0 <
|x|
H
< 1, avremmo (Ax, x)
H
= m < m|x|
2
H
, da cui
_
A
x
|x|
H
,
x
|x|
H
_
H
< m
il che è assurdo.
Consideriamo allora loperatore AmI: esso è autoaggiunto e positivo, ossia
verica
((A mI)x, x)
H
= 0, ((A mI)z, z)
H
0 z H.
Per lesercizio 8.2.7, si ha
[((A mI)x, z)
H
[
2
((A mI)x, x)
H
((A mI)z, z)
H
= 0 z H,
da cui Ax = mx. Essendo x ,= 0, il numero m è autovalore di A con
autovettore x. Discorso analogo se M > 0.
Osservazioni 11.3.5 (1) Se i due numeri m e M hanno lo stesso segno,
non è detto che entrambi siano autovalori per A: ad esempio, in H =
2
per
loperatore (Ax)
n
= (1 +
1
n
)x
n
, n N
+
, si ha M = |A|
/(H)
= 2 e m = 1, ma
Ax = x se e solo se x = 0.
314
(2) Dalla proposizione 11.3.4 (i) segue facilmente, analizzando tutti i casi
possibili, che almeno uno fra i due numeri |A|
/(H)
è autovalore di A.
Siamo ora in grado di dimostrare il seguente teorema, che è unestensione
della proprietà di diagonalizzazione delle matrici hermitiane in C
N
.
Teorema 11.3.6 (spettrale) Sia A /(H) un operatore compatto e au-
toaggiunto nello spazio di Hilbert H.
(i) Se dimR(A) = n < , allora A possiede n autovalori reali
1
, . . . ,
n
diversi da 0 (non necessariamente distinti), pi` u lautovalore 0 quando
dimH > n, ed esiste un sistema ortonormale x
1
, . . . , x
n
di autovet-
tori relativi ai
k
, tale che
Ax =
n
k=1
k
(x, x
k
)
H
x
k
x H;
inoltre
(A) =
_

k
1kn
se dimH = n,
1kn
0 se dimH > n.
(ii) Se dimR(A) = , allora A possiede uninnità numerabile di autovalori
reali
k
kN
+, diversi da 0 (non tutti necessariamente distinti), tali
che [
k
[ [
k+1
[ per ogni k N
+
e
k
0 per k , ed esiste un
sistema ortonormale x
k
kN
+ di autovettori relativi ai
k
, tale che
Ax =
k=1
k
(x, x
k
)
H
x
k
x H;
inoltre
(A) =
k
kN
+ 0.
In particolare, ogni autovalore di A ha molteplicità nita. Inne, il si-
stema ortonormale x
k
è completo in H se e solo se 0 non è autovalore
di A.
Dimostrazione Se A = 0 tutti gli enunciati sono banalmente veri: si ha
n = 0 e lunico autovalore di A è 0. Supporremo dunque A ,= 0. Ricordando
losservazione 11.3.5 (2), sia
1
R un autovalore di A con [
1
[ = |A|
/(H)
e
315
sia x
1
un corrispondente autovettore di norma unitaria. Detto M
1
il sotto-
spazio generato da x
1
, notiamo che il sottospazio M
1
è invariante per A, in
quanto
y M
1
= (Ay, x
1
)
H
= (y, Ax
1
)
H
=
1
(y, x
1
)
H
= 0 = Ay M
1
.
Consideriamo allora la restrizione A[
M
1
: essa è un operatore compatto e
autoaggiunto nello spazio di Hilbert M
1
. In virt` u dellosservazione 11.3.5
(2), esiste un autovalore
2
R con [
2
[ = |A|
/(M
1
)
[
1
[; scelto un
autovettore corrispondente x
2
di norma unitaria, consideriamo il sottospazio
M
2
generato da M
1
e da x
2
: esso è ancora invariante per A e dunque la
restrizione A[
M
2
è un operatore compatto e autoaggiunto nello spazio di
Hilbert M
2
. Iterando questo procedimento si presentano due casi:
(a) dimR(A) < : in questo caso esiste n N
+
tale che A[
M
n
= 0. Se
dimH = n, ciò signica che M
n
= 0, mentre se dimH > n allora
M
n
= ker A, ossia tale sottospazio è generato da autovettori relativi
allautovalore 0;
(b) dimR(A) = : in questo caso esiste una successione
k
kN
+ R tale
che
k
è autovalore non nullo di A e [
k
[ [
k+1
[ per ogni k N
+
.
Si ha inoltre
k
0 per k : infatti i corrispondenti autovettori
x
k
formano un sistema ortonormale e pertanto convergono debolmente
a 0 in H, da cui, essendo A compatto, |Ax
k
|
H
[
k
[ 0 in virt` u della
proposizione 11.3.1.
Da quanto detto segue in particolare che ogni autovalore ha molteplicità
nita. Nel caso (a) si ha anche, ovviamente, la formula di rappresentazione
Ax =
n
k=1
(Ax, x
k
)
H
x
k
=
n
k=1
(x, Ax
k
)
H
x
k
=
n
k=1
k
(x, x
k
)
H
x
k
x H.
Proviamo la formula di rappresentazione nel caso (b). Sia x H e poniamo
y
k
= x
k
h=1
(x, x
h
)
H
x
h
. Poiche y
k
M
k
, per denizione dei
k
sarà
|Ay
k
|
H
[
k+1
[ |y
k
|
H
; ma essendo
|y
k
|
2
H
= |x|
2
H

k
h=1
[(x, x
h
)
H
[
2
|x|
2
H
k N
+
,
316
si ricava |Ay
k
|
H
[
k+1
[ |x|
H
0 per k . Pertanto, osservando che
Ay
k
= Ax
k
h=1
(x, x
h
)
H
Ax
h
= Ax
k
h=1
h
(x, x
h
)
H
x
h
,
si conclude che
Ax =
k=1
k
(x, x
k
)
H
x
k
x H.
Proviamo inne le asserzioni relative allo spettro di A. Mostriamo anzitutto
che A non ha altri autovalori ,= 0 distinti dai
k
: se infatti x
0
fosse un
autovettore di norma unitaria relativo a , allora per la proposizione 11.3.3
avremmo
x
0
= Ax
0
=
k
(x
0
, x
k
)
H
x
k
= 0,
da cui x
0
= 0, il che è assurdo.
Sia ora C 0 distinto dai
k
e proviamo che (A). Non è escluso
che 0 sia autovalore di A con molteplicità qualunque: ricordando lesercizio
10.3.3, dato che A è autoaggiunto risulta R(A) = (ker A)
. Sia dunque
y H. Lequazione x Ax = y si scrive nel modo seguente:
k
(
k
)(x, x
k
)
H
x
k
+P
ker A
x =
k
(y, x
k
)
H
x
k
+P
ker A
y.
Ne segue
(
k
)(x, x
k
)
H
= (y, x
k
)
H
k,
P
ker A
x = P
ker A
y.
Pertanto lequazione x Ax = y ha lunica soluzione
x =
k
(y, x
k
)
H

k
x
k
+
1
P
ker A
y;
lespressione a secondo membro denisce anche loperatore R(, A). Inoltre,
posto d = min
k
[
k
[ (si noti che d > 0), vale la maggiorazione
|x|
2
H
= |R(, A)y|
2
H
=
=
k
[(y, x
k
)
H
[
2
[
k
[
2
+
|P
ker A
y|
2
H
[[
2

_
1
d
2
+
1
[[
2
_
|y|
2
H
;
317
perciò (A). Tenuto conto del corollario 11.2.8, si ottiene la tesi.
La rappresentazione fornita dal teorema spettrale caratterizza gli operatori
compatti e autoaggiunti. Vale infatti la seguente
Proposizione 11.3.7 Sia H uno spazio di Hilbert e sia A /(H) denito
da
Ax =
k
(x, x
k
)
H
x
k
x H,
ove la somma è nita o innita, x
k
è un sistema ortonormale in H al pi` u
numerabile e
k
è una famiglia di numeri reali tali che [
k
[ [
k+1
[ e
k
0. Allora A è un operatore compatto e autoaggiunto, i
k
sono i suoi
autovalori non nulli e gli x
k
sono i corrispondenti autovettori.
Dimostrazione Si verica immediatamente che (Ax, y)
H
= (x, Ay)
H
per
ogni x, y H, cosicche A è autoaggiunto.
Proviamo che A è compatto: sia y
n
H una successione tale che y
n

y H. Allora
A(y
n
y) =
k
(y
n
y, x
k
)
H
x
k
.
Poiche
k
0, per ogni > 0 esiste N
+
tale che [
k
[ < per ogni k > .
Daltra parte si ha lim
n
(y
n
y, x
k
)
H
= 0 per k = 1, 2, . . . , . Perciò,
grazie allortonormalità degli x
k
e alla disuguaglianza di Bessel (proposizione
8.3.6), si ha
limsup
n
|A(y
n
y)|
2
H

limsup
n
k=1
[
k
[
2
[(y
n
y, x
k
)
H
[
2
+ limsup
n
k>
2
[(y
n
y, x
k
)
H
[
2
0 +
2
sup
n
|y
n
y|
2
H
,
e per larbitrarietà di otteniamo Ay
n
Ay. Dalla proposizione 11.3.1 se-
gue la tesi.
Come mostra la proposizione precedente, la rappresentazione fornita dal teo-
rema spettrale non è vera per gli operatori che sono compatti ma non au-
toaggiunti, nemmeno in dimensione nita: ad esempio, come si sa, non tutte
le matrici N N possono essere diagonalizzate. Anche la proprietà di posse-
dere almeno un autovalore non sussiste in generale per gli operatori soltanto
318
compatti, come mostra lesempio che segue; tuttavia essa è sempre vera in
dimensione nita, dato che ogni matrice N N ha autovalori.
Esempio 11.3.8 Sia A /(
2
) denito da
(Ax)
n
=
_
_
_
0 se n = 0
x
n1
n
se n > 0.
Si vede facilmente che A è compatto e che non possiede autovalori. Chiara-
mente 0 (A) poiche A è compatto; in realtà lo spettro di questo operatore
è costituito dal solo punto 0. Infatti si verica per induzione che
(A
m
y)
n
=
_
_
_
0 se n < m
y
nm
n(n 1) . . . (n m+ 1)
se n m,
cosicche
|A
m
y|
2
H
=
n=m
[y
nm
[
2
[n(n 1) . . . (n m+ 1)]
2

1
[m!]
2
|y|
2
H
y
2
,
ossia |A
m
|
/(
2
)

1
m!
per ogni m N, il che ci dice che A ha raggio spettrale
nullo:
r
(A) = lim
m
|A
m
|
1/m
/(
2
)
= 0.
Ricordando lesercizio 11.1.6 si conclude che (A) = 0.
Terminiamo il paragrafo con unaltra caratterizzazione degli operatori com-
patti.
Teorema 11.3.9 Sia H uno spazio di Hilbert e sia A /(H). Allora A è
compatto se e solo se esiste una successione di operatori A
n
/(H), tali
che dimR(A
n
) < per ogni n N e A
n
A in /(H).
Dimostrazione (=) La tesi segue dallesempio 11.2.2 (1) e dalla proposi-
zione 11.2.3.
(=) Per ipotesi, detta B la palla unitaria di H, linsieme A(B) è relativa-
mente compatto in Y : dunque, ssato n N
+
, esistono y
1
, . . . y
mn
A(B)
tali che
A(B)
mn
_
i=1
B
_
y
i
,
1
n
_
.
319
Sia allora M
n
= [y
1
, . . . , y
mn
]: per ogni n, M
n
è un sottospazio nito-
dimensionale di H, e se P
n
è la proiezione ortogonale su M
n
risulta P
n
y
i
= y
i
per i = 1, . . . , m
n
. Quindi per ogni x B si ha, scegliendo y
j
in modo che
Ax B(y
j
, 1/n):
|Ax P
n
Ax|
H
|Ax y
j
|
H
+|y
j
P
n
Ax|
H
<
1
n
+|P
n
(y
j
Ax)|
H
<
2
n
.
Ci` o prova che
|A P
n
A|
calL(H)

2
n
,
da cui la tesi.
Esercizi 11.3
1. Sia T /(
2
) denito per ogni x
2
da (Tx)
n
= n
3
4
x
n
, n N
+
.
Provare che T è compatto e autoaggiunto e determinarne lo spettro.
2. Sia a
ij
una matrice innita tale che
i,j=1
[a
ij
[
2
< . Posto (Ax)
i
=
j=1
a
ij
x
j
per ogni x
2
, si provi che A /(
2
) e che A è compatto.
3. Sia
e si denisca (Ax)
n
=
n
x
n
per ogni x
2
. Si verichi che
A /(
2
), si calcoli |A|
/(
2
)
e si provi che A è compatto se e solo se
c
0
.
4. Sia H uno spazio di Hilbert e sia A /(H) un operatore compatto e
autoaggiunto; posto
m = inf
|x|
H
=1
(Ax, x)
H
, M = sup
|x|
H
=1
(Ax, x)
H
,
si provi che (A) [m, M].
[Traccia: si ricordi che lo spettro è reale; se ad esempio > M, si
applichi alloperatore strettamente positivo I A lesercizio 10.3.3.]
5. Sia H uno spazio di Hilbert e sia A /(H) un operatore compatto.
Dimostrare che:
(i) se ,= 0 allora R(I A) è un sottospazio chiuso di H;
(ii) se ,= 0 e (A), allora è un autovalore di A;
320
(iii) gli autovalori di A non hanno punti daccumulazione diversi da 0;
(iv) (A) è al pi` u numerabile.
6. Si provi lesercizio precedente nel caso in cui X è uno spazio di Banach
e A /(X) è compatto.
Traccia: per sopperire allassenza della nozione di ortogonalità, si
utilizzi lesercizio 10.1.11.]
7. Sia H uno spazio di Hilbert non separabile e sia T /(H) compatto e
autoaggiunto. Si provi che 0 è un autovalore di T.
11.4 Lalternativa di Fredholm
La particolare struttura dello spettro degli operatori compatti in uno spazio
di Hilbert H permette di analizzare in dettaglio la risolubilità di equazioni
nellincognita x H della forma
x Ax = y
con y H assegnato e C 0 ssato. Accanto a tale equazione sarà
utile considerare lequazione omogenea associata
x Ax = 0
nonche le due equazioni aggiunte delle precedenti:
z A
z = w
con w H assegnato, e
z A
z = 0.
Il legame fra queste quattro equazioni è fornito dal seguente teorema del-
lalternativa:
Teorema 11.4.1 (di Fredholm) Sia H uno spazio di Hilbert, sia A
/(H) un operatore compatto e sia C 0. Allora:
(i) Fissato y H, lequazione x Ax = y ha soluzione se e solo se y
è ortogonale a ogni soluzione z dellequazione z A
z = 0: in altre
parole, R(I A) = [ker(I A
)]
.
321
(ii) Fissato w H, lequazione z A
z = w ha soluzione se e solo se w
è ortogonale a ogni soluzione x dellequazione x Ax = 0: in altre
parole, R(I A
) = [ker(I A)]
.
(iii) Lequazione x Ax = y ha soluzione unica per ogni y H se e solo
se lequazione xAx = 0 ha lunica soluzione x = 0, ovvero (A)
se e solo se ker(I A) = 0.
(iv) Lequazione z A
z = w ha soluzione unica per ogni w H se e

solo se lequazione z A
z = 0 ha lunica soluzione z = 0, ovvero

(A
) se e solo se ker(I A
) = 0.
(v) Le equazioni xAx = 0 e zA
z = 0 hanno lo stesso numero (nito)

di soluzioni linearmente indipendenti, ossia
dimker(I A) = dimker(I A
) < .
Dimostrazione Faremo cinque passi successivi (per i primi due si veda anche
lesercizio 10.3.2).
1
o
passo: R(I A) e R(I A
) sono chiusi.
Sia y
n
R(I A) una successione tale che y
n
y H: dobbiamo
provare che y R(I A). Esiste x
n
H tale che x
n
Ax
n
= y
n
; si
pu` o supporre che x
n
[ker(I A)]
, perche altrimenti si prenderà x

t
n
=
x
n
Px
n
, essendo P la proiezione ortogonale su ker(I A). Inoltre si
pu` o supporre x
n
limitata: infatti se esistesse una sottosuccessione (sempre
indicata con x
n
) tale che |x
n
|
H
, avremmo, per la limitatezza di
y
n
,
lim
n
x
n
Ax
n
|x
n
|
H
= 0.
Ma allora, per la limitatezza di
_
xn
|xn|
H
_
e la compattezza di A, passando a
unulteriore sottosuccessione
_
Axn
|xn|
H
_
convergerebbe, per cui anche
_
xn
|xn|
H
_
convergerebbe a un elemento z H. Ovviamente avremmo |z|
H
= 1 e z
Az = 0; ma dato che x
n
[ker(I A)]
, dovrebbe essere z [ker(I A)]
e quindi z = 0: ciò è assurdo, e pertanto x

n
è limitata.
Esiste allora una sottosuccessione x
n
k
tale che Ax
n
k
converge in H, quindi
anche x
n
k
=
1
[y
n
k
Ax
n
k
] converge a un certo elemento x H. Ne segue
y = x Ax, cioè y R(I A). Pertanto R(I A) è chiuso. In modo
322
assolutamente analogo si prova che R(I A
) è chiuso.
2
o
passo: ker(I A) = R(I A
e ker(I A
) = R(I A)
.
Sia z ker(I A): allora
(z, (I A
)x)
H
= ((I A)z, x)
H
= 0 x H,
e quindi z R(I A
. Viceversa, se z R(I A
, allora
((I A)z, x)
H
= (z, (I A
)x)
H
= 0 x H,
da cui (I A)z = 0. In modo del tutto analogo si prova laltra uguaglianza.
3
o
passo: Posto H
k
= R((I A)
k
), esiste j N tale che H
k
= H
j
per ogni
k j.
Ovviamente si ha H = H
0
H
1
H
2
. . ., e gli H
k
sono sottospazi chiusi
di H in virt` u del 1
o
passo. Se fosse H
k
H
k+1
per ogni k N, si troverebbe
un sistema ortonormale x
k
H con x
k
H
k
e x
k
H
k+1
. Allora per
h > k si troverebbe
Ax
h
Ax
k
= x
k
+ [x
h
(I A)x
h
+ (I A)x
k
] = x
k
+y,
dove y = x
h
(I A)x
h
+(I A)x
k
è un elemento di H
k+1
; ne seguirebbe
|Ax
h
Ax
k
|
2
H
= |x
k
|
2
H
+|y|
2
H
[[
2
,
cosicche da Ax
k
sarebbe impossibile estrarre sottosuccessioni convergenti:
ciò è assurdo perche A è compatto.
4
o
passo: ker(I A) = 0 se e solo se R(I A) = H.
Sia ker(I A) = 0 e sia y H: se y / R(I A), allora y ,= (I A)x
per ogni x H, da cui, per liniettività di I A,
(I A)
k
y (I A)
k+1
x ,= 0 x H, k N,
e ciò contraddice il 3
o
passo.
5
o
passo: dimker(I A) = dimker(I A
) < .
Se fosse dimker(I A) = +, esisterebbe un sistema ortonormale x
k
kN
contenuto in ker(I A); da Ax
k
= x
k
seguirebbe |Ax
k
Ax
h
|
H
=
[[|x
k
x
h
|
H
= [[
2, per cui Ax
k
kN
sarebbe priva di sottosuccessio-
ni convergenti: assurdo. Analogamente si prova che dimker(I A
) < .
Poniamo ora
= dimker(I A), = dimker(I A
)
323
e proviamo che = . Siano x
1
, . . . , x
e z
1
, . . . , z
sistemi ortonormali
in ker(I A) e in ker(I A
) rispettivamente. Supponiamo per assurdo

che sia < , e poniamo
Sx = (I A)x
k=1
(x, x
k
)
H
z
k
, x H.
Loperatore S è del tipo I B con B operatore compatto; quindi ad esso è
applicabile tutto quanto n qui dimostrato. Proviamo che S è iniettivo: da
Sx = 0 segue
(I A)x =
k=1
(x, x
k
)
H
z
k
:
poiche il primo membro di questa uguaglianza appartiene a R(I A) e il
secondo a ker(I A
), per il 2
o
passo si deduce (I A)x = 0 e (x, x
k
)
H
= 0
per k = 1, 2, . . . , , cioè x ker(I A)[ker(I A)]
, e in denitiva x = 0.
Applichiamo adesso alloperatore S il 4
o
passo: si ottiene R(S) = H. Per-
tanto esiste y H tale che
z
+1
= Sy = (I A)y
k=1
(y, x
k
)
H
z
k
,
da cui
1 = (z
+1
, z
+1
)
H
= ((I A)y, z
+1
)
H

k=1
(y, x
k
)
H
(z
k
, z
+1
)
H
=
= (y, (I A
)z
+1
)
H
= (y, 0)
H
= 0
il che è assurdo. Analogamente si mostra che non può essere < . Il
teorema di Fredholm è dimostrato.
Osservazione 11.4.2 Dal teorema di Fredholm si ricava che se A /(H)
è compatto e C 0, allora per lequazione
x Ax = y H
vale la seguente alternativa:
o non è autovalore per A, e allora lequazione ha soluzione unica per
ogni y H,
324
oppure è autovalore per A, e allora lequazione è risolubile, non
univocamente, se e solo se y [ker(I A
)]
In altre parole, se ,= 0 allora o è un punto regolare per A, oppure è un

autovalore di A (di molteplicità nita): questo fatto, nel caso di un operatore
A compatto e autoaggiunto, ci era già noto dal teorema spettrale (teorema
11.3.6).
Torniamo allequazione
x Ax = y H
supponendo stavolta che A sia un operatore compatto e autoaggiunto nello
spazio di Hilbert H. Vogliamo rappresentare le soluzioni x, analogamente a
quanto fatto nel teorema spettrale, esclusivamente in termini degli autovalori
non nulli di A e dei corrispondenti autovettori.
Proposizione 11.4.3 Sia H uno spazio di Hilbert, sia A /(H) compatto
e autoaggiunto, sia
k
kN
+ la successione degli autovalori non nulli di A e
sia x
k
kN
+ il corrispondente sistema ortonormale di autovettori. Allora:
(i) Se ,= 0 non è autovalore per A, lequazione x Ax = y ha soluzione
unica per ogni y H, data da
x =
1
k=1
k
(y, x
k
)
H

k
x
k
+y
_
.
(ii) Se ,= 0 è autovalore per A, lequazione x Ax = y ha soluzione se
e solo se y [ker(I A)]
; in tal caso tutte le soluzioni sono della

forma
x =
1
k
,=
k
(y, x
k
)
H

k
x
k
+y
_
+v,
ove v è un arbitrario elemento di ker(I A), il quale è un sottospazio
nito-dimensionale di H.
Dimostrazione (i) Dal teorema spettrale segue che lequazione xAx = y
pu` o scriversi nel modo seguente:
x =
1
k=1
k
(x, x
k
)
H
x
k
+y
_
;
325
ne segue
n
(x, x
n
)
H
=

n
[
n
(x, x
n
)
H
+ (y, x
n
)
H
] n N
+
,
da cui
n
(x, x
n
)
H
=

n
(y, x
n
)
H

n
n N
+
e quindi la rappresentazione cercata. Si noti che si tratta della stessa formula
ottenuta nellultima parte della dimostrazione del teorema spettrale (teorema
11.3.6): la dierenza è che adesso x è espresso in funzione di y e dei soli
autovettori x
k
, senza far intervenire gli elementi di ker A.
(ii) Sarà =
s
per un certo s N
+
: per il teorema di Fredholm (teorema
11.4.1) esistono soluzioni se e solo se y ker(
s
I A)]
= ker(
s
I A)]
.
In tal caso per i
n
,=
s
si ha ancora
n
(x, x
n
)
H
=

n
(y, x
n
)
H
n
,
mentre, tenuto conto che y [ker(
s
I A)]
, i coecienti (x, x
n
)
H
relativi
ai
n
=
s
saranno arbitrari. Ne segue la formula cercata.
Il fatto che dimker(
s
I A) < segue dal teorema spettrale.
Esempio 11.4.4 Consideriamo lequazione integrale
f(t)
_
b
a
K(t, s)f(s) ds = h(t), t [a, b],
che è detta equazione di Fredholm di seconda specie. La funzione K(t, s),
detta nucleo dellequazione, appartiene a L
2
(]a, b[]a, b[), il secondo membro
h è una funzione assegnata in L
2
(a, b) e è un parametro complesso non
nullo, mentre f è lincognita.
Come si sa (esercizio 11.2.9), loperatore A : L
2
(a, b) L
2
(a, b) denito da
Af(t) =
_
b
a
K(t, s)f(s) ds, t [a, b],
è compatto (nonche autoaggiunto se K(t, s) = K(s, t)). Lequazione integrale
si può scrivere nella forma
f Af = g,
ove =
1
e g =
1
h, e ad essa è applicabile la teoria precedente. In base alla

proposizione 11.4.3 otteniamo che, se
1
non è autovalore di A, la soluzione

si rappresenta in questo modo:
326
f(t) =
k=1
k

(h,
k
)
L
2
(a,b)
k
(t) +h(t) q.o. in [a, b],
ove
k
kN
+ è un sistema ortonormale di autovettori relativi alla famiglia
kN
+ degli autovalori non nulli di A, e la serie converge nel senso di
L
2
(a, b) (si veda anche lesercizio 11.4.2).
Esercizi 11.4
1. Sia
k
kN
+ una successione innitesima tale che
k=1
[
k
[
2
= +.
Posto
Af(t) =
k=1
k
(f, e
k
)
L
2
(a,b)
e
k
(t),
ove e
k
(t) =
_
2
sin kt, si provi che /(L

2
(0, 1)) e che A è compatto,
ma non è un operatore integrale con nucleo in L
2
(]0, 1[]0, 1[).
2. Sia K L
2
(]a, b[]a, b[) tale che K(t, s) = K(s, t), e sia A loperato-
re dellesempio 11.4.4. Se
k
kN
+ è la successione degli autovalori
non nulli di A e u
k
kN
+ è un corrispondente sistema ortonormale di
autovettori, si provi che:
(i) K(t, s) =
k=1
k
u
k
(t)u
k
(s) q.o. in L
2
(]a, b[]a, b[);
(ii)
k=1
[
k
[
2
< .
3. Sia A loperatore dellesempio 11.4.4, sia
k
kN
+ la successione degli
autovalori non nulli di A e sia u
k
kN
+ un corrispondente sistema
ortonormale di autovettori. Posto
K
1
(t, s) = K(t, s), K
n+1
(t, s) =
_
b
a
K(t, )K
n
(, s) ds n N
+
,
si provi che:
(i) K
n
L
2
(]a, b[]a, b[) e |K
n
|
2
|K|
n
2
per ogni n N
+
;
(ii) A
n
è un operatore integrale il cui nucleo è K
n
(t, s);
(iii) A
n
è compatto, (
k
)
n
kN
+ è la successione dei suoi autovalo-
ri non nulli e u
k
è un corrispondente sistema ortonormale di
autovettori;
327
(iv) |K
n
|
2
L
2
(a,b)
=
k=1
[
k
[
2n
per ogni n N
+
;
(v) se K(t, s) = K(s, t) allora K
n
(t, s) = K
n
(s, t) per ogni n N
+
.
11.5 Lequazione di Sturm - Liouville
Consideriamo loperatore dierenziale del secondo ordine
Mu = pu
tt
+ru
t
+qu, u C
2
[a, b],
ove p, q, r sono funzioni reali continue in [a, b] con p(x) ,= 0 in [a, b].
`
E ben
noto dalla teoria delle equazioni dierenziali lineari il seguente risultato:
Teorema 11.5.1 Fissati g C[a, b] e , C, nelle ipotesi sopra scritte il
problema di Cauchy
_
_
Mu = g in [a, b]
u(a) =
u(b) =
ha una e una sola soluzione u C
2
[a, b].
Osserviamo che un operatore del tipo sopra descritto si può sempre trasfor-
mare in un operatore della forma
Lv = (v
t
)
t
+v, v C
2
[a, b],
ove C
1
[a, b] e inoltre (x) > 0 in [a, b]: basta moltiplicare loperatore M
per la funzione
1
p(x)
exp
__
x
a
r(t)
p(t)
dt
_
e scegliere
(x) = exp
__
x
a
r(t)
p(t)
dt
_
, (x) =
q(x)
p(x)
exp
__
x
a
r(t)
p(t)
dt
_
.
Con questo articio, lo studio delle equazioni dierenziali del secondo ordi-
ne, a coecienti reali, si può ridurre, almeno per certi scopi, allo studio di
operatori dierenziali della particolare forma sopra descritta. Considereremo
dunque lequazione di Sturm-Liuville
Lf f = g,
328
con L operatore del tipo sopra illustrato e f soggetta a condizioni agli estremi
di natura pi` u generale di quelle del teorema 11.5.1. Ciò comporterà una
restrizione sul dominio delloperatore L, ma ci permetterà di fare uso della
teoria sviluppata nei due paragra precedenti.
Deniamo
D(L) = u C
1
[a, b] : u
t
AC[a, b], u
tt
L
2
(a, b), B
1
u = B
2
u = 0,
ove
B
1
u =
1
u(a) +
1
u
t
(a), B
2
u =
2
u(b) +
2
u
t
(b),
essendo
1
,
1
,
2
,
2
numeri reali tali che [
1
[ +[
1
[ > 0, [
2
[ +[
2
[ > 0. La
scelta di questo tipo di condizioni agli estremi è dettata dal fatto che, grazie
ad esse, loperatore L risulta autoaggiunto in L
2
(a, b). La verica di questo
fatto è una semplice applicazione della formula di integrazione per parti per
funzioni assolutamente continue (esercizio 6.5.11). In particolare, posto
D = u C
2
[a, b] : B
1
u = B
2
u = 0,
si ha
(Lu, v)
L
2
(a,b)
= (u, Lv)
L
2
(a,b)
u, v D.
Nel seguito restringeremo talvolta loperatore L al dominio D, che è pi` u
piccolo del dominio naturale D(L) ma che garantisce la continuità di tutte le
funzioni coinvolte. Notiamo che ogni autovalore di L è necessariamente un
elemento di D (esercizio 11.5.1).
Proposizione 11.5.2 Sia L loperatore denito nello spazio L
2
(a, b) da
Lu = (u
t
)
t
+u, u D,
ove C
1
[a, b] con > 0 in [a, b], C[a, b] e linsieme D è quello sopra
introdotto. Allora:
(i) gli autovalori di L sono reali;
(ii) autovettori corrispondenti ad autovalori distinti sono ortogonali in H;
(iii) gli autovalori di L formano un insieme al pi` u numerabile.
329
Dimostrazione GLi enunciati (i) e (ii) si provano come nella proposizione
11.3.3. Per (iii) si osservi che se linsieme degli autovalori fosse pi` u che
numerabile, esisterebbe, per (i), un sistema ortonormale di autovettori pi` u
che numerabile nello spazio di Hilbert separabile L
2
(a, b), il che è assurdo per
losservazione 8.3.3.
Proposizione 11.5.3 Nelle ipotesi della proposizione 11.5.2, gli autovalori
di L costituiscono una successione limitata inferiormente.
Notiamo che se fosse < 0 in [a, b], la successione degli autovalori sarebbe
limitata superiormente.
Dimostrazione Sia u D un autovettore relativo allautovalore , con
|u|
L
2
(a,b)
= 1. Si ha
= |u|
2
L
2
(a,b)
= (Lu, u)
L
2
(a,b)
=
_
b
a
[(u
t
)
t
+u]udx =
= (b)u
t
(b)u(b) +(a)u
t
(a)u(a) +
_
b
a
([u
t
[
2
+[u[
2
)dx.
Si tratta di minorare gli addendi dellultimo membro. Osserviamo prelimi-
narmente che [u[, essendo una funzione continua in [a, b], ha minimo non
negativo in un punto z [a, b]: poiche |u|
L
2
(a,b)
= 1, deve essere
[u(z)[ = min
x[a,b]
[u(x)[
1
b a
,
altrimenti avremmo
_
b
a
[u(x)[
2
dx >
1
b a
_
b
a
dx = 1.
Di conseguenza si ha, in virt` u della disuguaglianza di Holder (proposizione
9.1.2),
[u(x)[ [u(x) u(z)[ +[u(z)[ =
_
z
x
u
t
(y) dy
+[u(z)[
b a
__
b
a
[u
t
(y)[
2
dy
_
1
2
+
1
b a
x [a, b].
330
Ciò premesso, se u(a) = 0 oppure u
t
(a) = 0, certamente (a)u
t
(a)u(a) = 0;
altrimenti se u(a)u
t
(a) ,= 0 allora dalla condizione B
1
u = 0 segue che
1
,= 0
e quindi
[(a)u
t
(a)u(a)[ ||
[u(a)[
2
c
_
b a
__
b
a
[u
t
(y)[
2
dy
_
1
2
+
1
b a
_
c
1
__
b
a
[u
t
(y)[
2
dy
_
1
2
+c
2
.
In modo del tutto analogo,
[(b)u
t
(b)u(b)[ c
1
__
b
a
[u
t
(y)[
2
dy
_
1
2
+c
2
.
Pertanto si ottiene
[(a)u
t
(a)u(a)[ [(b)u
t
(b)u(b)[ + min
x[a,b]
(x)
_
b
a
[u
t
[
2
dy
c
3
_
b
a
[u
t
[
2
dy c
4
__
b
a
[u
t
(y)[
2
dy
_
1
2
c
5
=
=
_
_
c
3
_
b
a
[u
t
[
2
dy
c
4
2
c
3
_
_
2
c
6
> .
Proposizione 11.5.4 Nelle ipotesi della proposizione 11.5.2, ogni autovalo-
re di L ha molteplicità 1.
Dimostrazione Siano u, v D autovettori non nulli relativi allautovalore
u. Allora
_
Lu = u
B
1
u = B
2
u = 0,
_
Lv = v
B
1
v = B
2
v = 0.
In particolare,
1
u(a) +
1
u
t
(a) =
1
v(a) +
1
v
t
(a) = 0,
il che implica, essendo
1
e
1
non entrambi nulli,
det
_
u(a) v(a)
u
t
(a) v
t
(a)
_
= 0.
331
Perciò esistono p, q C, non entrambi nulli, tali che
p
_
u(a)
u
t
(a)
_
+q
_
v(a)
v
t
(a)
_
=
_
0
0
_
.
Ne segue che la funzione pu +qv risolve
_
(L I)(pu +qv) = 0 in [a, b]
(pu +qv)(a) = (pu +qv)
t
(a) = 0
e per il teorema 11.5.1 si conclude che pu + qv 0 in [a, b], cioè u e v sono
linearmente dipendenti.
Osservazione 11.5.5 La proposizione 11.5.2 (iii) ci autorizza a supporre,
senza restrizione alcuna, che 0 non sia autovalore per L. Infatti in caso
contrario, scelto un numero R che non sia autovalore per L, lequazione
Lu u = g si può riscrivere come
(u
t
)
t
+ ( )u ( )u = g;
dunque posto L
0
= L I e
0
= , L
0
è ancora un operatore di
Sturm-Liouville che non ha 0 come autovalore, e si ha
L
0
u
0
u = Lu u = g.
Esercizi 11.5
1. Nelle ipotesi della proposizione 11.5.2 si provi che ogni autovalore di L
appartiene a C
2
[a, b].
2. Trovare autovalori e autovettori del problema
_
[(1 +x)
2
u
t
]
t
+u = 0 in [0, 1]
u(0) = u(1) = 0;
dedurre che le funzioni
_
1
1 +x log 2
sin
_
k
2 log 2
log(1 +x)
__
kN
+
formano un sistema ortonormale completo in L
2
(0, 1).
[Traccia: Si mostri che u è soluzione del problema proposto se e solo
se la funzione v(t) = u(e
t
1) risolve v
tt
+ v
t
+ v = 0 in [0, log 2] con
le condizioni ai limiti v(0) = v(log 2) = 0.]
332
3. Si provi che unequazione della forma
(()u
t
)
t
+u = 0, [0, a],
con C[0, a] e > 0, si può trasformare nellequazione
v
tt
+q(x)v +v = 0, x [0, b],
con opportuni b > 0 e q C[0, b], facendo uso delle sostituzioni
x = () =
_

0
dt
_
(t)
. v(x) = u(
1
())
4
_
(
1
()).
4. Determinare landamento asintotico degli autovalori del problema
_
u
tt
+u = 0 in [0, 1]
u(0) = u(1) +u
t
(1) = 0.
11.6 Risolubilità dellequazione di Sturm -
Liouville
Consideriamo ancora loperatore di Sturm-Liouville L, sotto le ipotesi della
proposizione 11.5.2. Nellipotesi che 0 non sia autovalore di L, il che, come
si è osservato, non è restrittivo, andiamo a dimostrare linvertibilità di L in
C[a, b]. Proviamo anzitutto il seguente
Lemma 11.6.1 Nelle ipotesi della proposizione 11.5.2, supponiamo inoltre
che 0 non sia autovalore per L. Allora i due problemi
_
Lu
1
= 0 in [a, b]
B
1
u
1
= 0,
_
Lu
2
= 0 in [a, b]
B
2
u
2
= 0,
hanno rispettivamente soluzioni u
1
, u
2
C
2
[a, b] reali, non identicamente
nulle e tali che per ogni x [a, b] i vettori (u
1
(x), u
t
1
(x)) e (u
2
(x), u
t
2
(x))
sono linearmente indipendenti in R
2
.
333
Dimostrazione Per determinare u
1
e u
2
è suciente risolvere i problemi di
Cauchy
_
_
Lu
1
= 0 in [a, b]
u
1
(a) =
1
u
t
1
(a) =
1
,
_
_
Lu
2
= 0 in [a, b]
u
2
(b) =
2
u
t
2
(b) =
2
,
i quali per il teorema 11.5.1 hanno ununica soluzione reale di classe C
2
non identicamente nulla. Se (u
1
(x), u
t
1
(x)) e (u
2
(x), u
t
2
(x)) fossero linear-
mente dipendenti per qualche x [a, b], esisterebbe x
0
[a, b] tale che
u
1
(x
0
)u
t
2
(x
0
) u
t
1
(x
0
)u
2
(x
0
) = 0. Daltra parte è facile vericare che
d
dx
((x)[u
1
(x)u
t
2
(x) u
t
1
(x)u
2
(x)]) = 0 x [a, b],
e poiche tale funzione è nulla in x
0
si deduce che (u
1
u
t
2
u
t
1
u
2
) = 0 in [a, b],
da cui
u
1
(x)u
t
2
(x) u
t
1
(x)u
2
(x) = 0 x [a, b].
In particolare, calcolando nei punti x = a e x = b, si ha subito B
2
u
1
=
B
1
u
2
= 0. Dunque u
1
e u
2
sono soluzioni del problema
_
Lu = 0 in [a, b]
B
1
u = B
2
u = 0,
e dato che 0 non è autovalore per L, questo implica u
1
= u
2
= 0: ciò è
assurdo poiche, per ipotesi, u
1
e u
2
sono non identicamente nulle.
Osservazione 11.6.2 Dalla dimostrazione del lemma 11.6.1 segue che la
funzione (u
1
u
t
2
u
t
1
u
2
) è costante in [a, b]; si può quindi supporre (sosti-
tuendo ad esempio
1
e
1
con
1
e
1
, e corrispondentemente u
1
con u
1
,
per un opportuno numero reale ) che tale costante sia 1, cioè che
(x)(u
1
(x)u
t
2
(x) u
t
1
(x)u
2
(x)) = 1 x [a, b].
Siamo ora in grado di provare il seguente
Teorema 11.6.3 Nelle ipotesi della proposizione 11.5.2, supponiamo inoltre
che 0 non sia autovalore per L e che risulti (u
1
u
t
2
u
t
1
u
2
) = 1 in [a, b],
ove u
1
e u
2
sono le funzioni introdotte nel lemma 11.6.1. Allora esiste una
334
funzione G C([a, b] [a, b]) reale e simmetrica, tale che per ogni g C[a, b]
il problema
_
Lf = g in [a, b]
B
1
f = B
2
f = 0
ha lunica soluzione
f(x) =
_
b
a
G(x, y)g(y) dy, x [a, b].
Dimostrazione Cerchiamo una soluzione dellequazione Lf = g con il meto-
do della variazione delle costanti arbitrarie: cerchiamo dunque una soluzione
del tipo
f(x) = c
1
(x)u
1
(x) +c
2
(x)u
2
(x),
ove c
1
(x) e c
2
(x) sono soluzioni del sistema
_
_
_
c
t
1
u
1
+c
t
2
u
2
= 0
c
t
1
u
t
1
+c
t
2
u
t
2
=
g
.
Il determinante di questo sistema è u
1
u
t
2
u
t
1
u
2
= 1/ ,= 0, quindi con
facili calcoli si ottiene
c
t
1
= u
2
g, c
t
1
= u
1
g
e pertanto si può scegliere
c
1
(x) =
_
b
x
u
2
(y)g(y) dy, c
2
(x) =
_
x
a
u
1
(y)g(y) dy.
Ne segue
f(x) = u
1
(x)
_
b
x
u
2
(y)g(y) dy +u
2
(x)
_
x
a
u
1
(y)g(y) dy =
_
b
a
G(x, y)g(y) dy,
avendo posto
G(x, y) =
_
u
1
(x)u
2
(y) se x y
u
1
(y)u
2
(x) se x y.
`
E chiaro che G è continua in [a, b][a, b] e che è reale e simmetrica. Si verica
allora facilmente che la funzione f appartiene a C
2
[a, b], verica B
1
f = B
2
f =
335
0 e risolve lequazione Lf = g.
Inne, se f
1
è unaltra soluzione del problema, allora la funzione ff
1
verica
_
L(f f
1
) = 0 in [a, b]
B
1
(f f
1
) = B
2
(f f
1
) = 0,
e quindi f f
1
= 0, dato che 0 non è autovalore per L.
Osservazioni 11.6.4 (1) Dal teorema precedente segue che loperatore in-
tegrale g Gg, denito da
Gg(x) =
_
b
a
G(x, y)g(y) dy, x [a, b],
ove G(x, y) è la funzione sopra denita, agisce su R(L) = C[a, b] a valori in
D; inoltre GL = I
D
, LG = I
C[a,b]
, ossia G = L
1
.
(2) La funzione G, oltre che continua in [a, b] [a, b], è di classe C
2
fuori
della diagonale a x = y b. Si può dimostrare (esercizio 11.6.1) che la
derivata parziale G
x
(x, y) ha un salto pari a 1/
t
(y) per x y.
Esercizi 11.6
1. Sia G(, ) la funzione denita nella dimostrazione del teorema 11.6.3.
Si provi che:
(i) G è continua in [a, b] [a, b] ed è di classe C
2
per x ,= y;
(ii) lim
xy
+
G
x
(x, y) lim
xy
G
x
(x, y) =
1
t
(y)
per ogni y [a, b];
(iii) B
1
G(, y) = B
2
G(, y) = 0 per ogni y [a, b];
(iv) [LG(, y)](x) = 0 per x [a, b] y, per ogni y [a, b].
11.7 Rappresentazione delle soluzioni
Analizziamo adesso le proprietà delloperatore G, introdotto nellosservazione
11.6.4 (1), pensandolo come un operatore integrale su L
2
(a, b). Ricordiamo
che il suo nucleo G(x, y) è la funzione
G(x, y) =
_
u
1
(x)u
2
(y) se x y
u
1
(y)u
2
(x) se x y,
336
ove u
1
e u
2
sono le soluzioni dei problemi di Cauchy
_
_
Lu
1
= 0 in [a, b]
u
1
(a) =
1
u
t
1
(a) =
1
,
_
_
Lu
2
= 0 in [a, b]
u
2
(b) =
2
u
t
2
(b) =
2
,
e vericano la relazione
(x)(u
1
(x)u
t
2
(x) u
t
1
(x)u
2
(x)) = 1 x [a, b].
Proposizione 11.7.1 Nelle ipotesi della proposizione 11.5.2, supponiamo
inoltre che 0 non sia autovalore per L. Allora loperatore G è compatto e
autoaggiunto in L
2
(a, b).
Dimostrazione Loperatore G è compatto per lesempio 10.4.6 (2) e leser-
cizio 11.2.9. Inoltre, in virt` u del teorema 11.6.3, per ogni g
1
, g
2
C[a, b]
esistono uniche f
1
, f
2
D tali che Lf
1
= g
1
e Lf
2
= g
2
. Pertanto, essendo L
autoaggiunto,
(g
1
, Gg
2
)
L
2
(a,b)
= (Lf
1
, f
2
)
L
2
(a,b)
= (f
1
, Lf
2
)
L
2
(a,b)
= (Gg
1
, g
2
)
L
2
(a,b)
.
Dalla densità di C[a, b] in L
2
(a, b) segue la tesi.
Proposizione 11.7.2 Nelle ipotesi della proposizione 11.5.2, supponiamo
inoltre che 0 non sia autovalore per L. Se C 0, allora è autovalore
per G, e g L
2
(a, b) è un autovettore per G relativo a , se e solo se 1/ è
autovalore per L e g è un autovettore per L relativo a 1/. In particolare gli
autovalori di G sono reali, non nulli e di molteplicità 1, e gli autovettori di
G appartengono a D.
Dimostrazione Sia C 0 tale che Gg = g con g L
2
(a, b) 0.
Poiche G(x, y) è continua, si ha g =
1
Gg C[a, b] e di conseguenza Gg
D, da cui g D. Applicando L si trova Lg =
1
g. In particolare, dalla
proposizione 11.5.2 (i) segue R. Viceversa, se f D e Lf =
1
f, allora
in particolare f C[a, b], e applicando G si deduce f = Gf.
Resta da far vedere che 0 non è autovalore per G. Supponiamo che g
L
2
(a, b) sia tale che Gg = 0: dobbiamo provare che g = 0. Ricordando la
denizione di G(x, y), si vede immediatamente che deve essere
c
1
(x)u
1
(x) +c
2
(x)u
2
(x) = 0 x [a, b]
337
ove
c
1
(x) =
_
b
x
u
2
(y)g(y) dy, c
2
(x) =
_
x
a
u
1
(y)g(y) dy.
Osservato che c
1
, u
1
, c
2
, u
2
AC[a, b], derivando si ottiene
c
1
u
t
1
+c
2
u
t
2
+ (c
t
1
u
1
+c
t
2
u
2
) = 0 q.o. in [a, b];
ricordando che
_
_
_
c
t
1
u
1
+c
t
2
u
2
= 0
c
t
1
u
t
1
+c
t
2
u
t
2
=
g
,
si deduce
c
1
u
t
1
+c
2
u
t
2
= 0 q.o. in [a, b].
Poiche c
1
, c
2
, u
t
1
, u
t
2
AC[a, b], derivando una seconda volta si trova
c
1
u
tt
1
+c
2
u
tt
2
+ (c
t
1
u
t
1
+c
t
2
u
t
2
) = 0 q.o. in [a, b]
e moltiplicando per
u
tt
1
c
1
+u
tt
2
c
2
g = 0 q.o. in [a, b].
Tenendo conto delle relazioni Lu
1
= Lu
2
= 0 si ricava
(u
1
t
u
t
1
)c
1
+ (u
2
t
u
t
2
)c
2
g = 0 q.o. in [a, b],
cioè, nalmente,
(c
1
u
1
+c
2
u
2
)
t
(c
1
u
t
1
+c
2
u
t
2
) g = 0 q.o. in [a, b]
ovvero g = 0 q.o. in [a, b].
Corollario 11.7.3 Nelle ipotesi della proposizione 11.5.2, supponiamo inol-
tre che 0 non sia autovalore per L. Allora gli autovalori di G formano una
successione reale
k
kN+
tale che [
k
[ [
k+1
[ > 0 per ogni k N
+
e
k
0 per k ; inoltre ogni autovalore ha molteplicità 1, ed esiste un
sistema ortonormale di autovettori corrispondenti u
k
kN
+ D, il quale è
completo in L
2
(a, b).
Dimostrazione La tesi è conseguenza del teorema spettrale (teorema 11.3.6)
e delle proposizioni 11.7.1 e 11.7.2.
338
Proposizione 11.7.4 Nelle ipotesi della proposizione 11.5.2, gli autovalori
di L formano una successione reale
k
kN
+, tale che [
k
[ + per k
; inoltre ogni autovalore ha molteplicità 1 ed esiste un sistema ortonormale
di autovettori corrispondenti u
k
kN
+ D, il quale è completo in L
2
(a, b).
Si noti che non si fa lipotesi che 0 non sia autovalore per L.
Dimostrazione Se 0 non è autovalore per L, la tesi segue dal corollario
11.7.3 e dalle proposizioni 11.7.2 e 11.5.2. Se invece 0 è autovalore per L,
sia
0
R un numero che non sia autovalore per L (esso esiste per la pro-
posizione 11.5.2): posto L
0
= L
0
I, L
0
è un operatore di Sturm-Liouville
che non ha 0 come autovalore. Sia G
0
loperatore integrale che inverte L
0
:
indicata con
k
la successione degli autovalori di L (reali e di moltepli-
cità 1 in virt` u delle proposizioni 11.5.2 e 11.5.4), gli autovalori di G
0
sono i
mumeri
1
kN
+, e i relativi autovettori sono esattamente gli autovettori
u
k
kN
+ di L relativi ai
k
kN
+. La tesi segue applicando a G
0
il corollario
11.7.3.
Le proposizioni precedenti, insieme col teorema spettrale, forniscono una rap-
presentazione delle soluzioni del problema di Sturm-Liouville. La situazione
è chiarita dal seguente
Teorema 11.7.5 Nelle ipotesi della proposizione 11.5.2, valgono i seguenti
fatti.
(i) Se 0 non è autovalore per L, allora il problema
_
Lf = g C[a, b]
B
1
f = B
2
f = 0
è univocamente risolubile in C
2
[a, b] per ogni g C[a, b], e la soluzione
f è somma in L
2
(a, b) della serie
k=1
1
k
(g, u
k
)
L
2
(a,b)
u
k
,
dove
k
kN
+ è la successione degli autovalori di L e u
k
è un corri-
spondente sistema ortonormale completo di autovettori.
339
(ii) Se 0 è autovalore per L, allora il problema sopra scritto è risolubile (non
univocamente) se e solo se g (ker L)
; in tal caso le soluzioni sono

tutte e sole le funzioni f della forma
f(x) = cu
0
(x) +
k=1
1
k
(g, u
k
)
L
2
(a,b)
u
k
(x),
ove c C,
k
kN
+ è la successione degli autovalori non nulli di L,
u
k
è un corrispondente sistema ortonormale di autovettori, comple-
to in (ker L)
, e u
0
è un arbitrario versore di ker L, il quale è un
sottospazio 1-dimensionale di L
2
(a, b); la serie converge nel senso di
L
2
(a, b).
In eetti si può dimostrare (esercizio 11.7.refMerc) che le serie sopra scritte
convergono assolutamente e uniformemente in [a, b].
Dimostrazione (i) Per il teorema spettrale (teorema 11.3.6)
f = Gg =
k=1
1
k
(g, u
k
)
L
2
(a,b)
u
k
in L
2
(a, b),
da cui la tesi.
(ii) Sia
0
R un numero che non sia autovalore per L. Allora L
0
= L
0
I
non ha 0 come autovalore. Sia G
0
= (L
0
)
1
: lequazione Lf = g equivale
a f +
0
G
0
f = G
0
g. Questultima equazione, per il teorema di Fredholm
(teorema 11.4.1) e per losservazione 11.4.2, è risolubile se e solo se G
0
g
[ker(I +
0
G
0
)]
. Daltra parte, in virt` u della relazione

(g, v)
L
2
(a,b)
= (g,
0
G
0
v)
L
2
(a,b)
=
0
(G
0
g, v)
L
2
(a,b)
v ker(I +
0
G
0
),
risulta
G
0
g [ker(I +
0
G
0
)]
g [ker(I +
0
G
0
)]
.
Inoltre, grazie allinvertibilita di G
0
si ha
ker(I +
0
G
0
) = ker L
in quanto
v +
0
G
0
v = 0 (G
0
)
1
v +
0
v = 0 Lv = 0.
340
Si conclude che lequazione Lf = g ha soluzione se e solo se g (ker L)
.
Sia ora g (ker L)
e sia f D(L) tale che Lf = g: allora, ssato un versore

u
0
ker L, possiamo scrivere f = (f, u
0
)
L
2
(a,b)
u
0
+ f
1
, dove f
1
(ker L)
è
univocamente determinata dalla f scelta. Inoltre
(g, u
k
)
L
2
(a,b)
= (Lf, u
k
)
L
2
(a,b)
= (Lf
1
, u
k
)
L
2
(a,b)
=
= (f
1
, Lu
k
)
L
2
(a,b)
=
k
(f
1
, u
k
)
L
2
(a,b)
k N
+
,
e quindi
f
1
=
k=1
1
k
(g, u
k
)
L
2
(a,b)
u
k
in L
2
(a, b),
da cui la tesi.
Esempi 11.7.6 (1) Sia
D = u C
2
[0, ] : u(0) = u() = 0, Lu = u
tt
.
Si scelgono quindi 1 e 0, e nelle condizioni agli estremi
1
=
2
= 1,
1
=
2
= 0. Cerchiamo gli autovalori e i corrispondenti autovettori: la
soluzione generale dellequazione u
tt
+u = 0 è
u(x) = a cos
x +b sin
x, a, b C,
e le condizioni agli estremi implicano a = 0, =
k
= k
2
, k N
+
. In
particolare, 0 non è autovalore. Il corrispondente sistema ortonormale di
autovettori è
__
2
sin kx
_
kN
+
.
Andiamo a costruire il nucleo G(x, y) delloperatore G = L
1
. Le funzioni
u
1
(x) = cx e u
2
(x) = c( x) vericano rispettivamente
_
u
tt
1
= 0
u
1
(0) = 0,
_
u
tt
2
= 0
u
2
() = 0,
e si ha
u
1
u
t
2
u
t
1
u
2
= 1 c =
1
.
Quindi il nucleo di G è
G(x, y) =
_
_
x( y)
se x y
y( x)
se x y.
341
Perciò se g C[0, ] la soluzione del problema
_
f
tt
= g in [a, b]
f(0) = f() = 0
è la funzione
f(x) =
_

0
G(x, y)g(y) dy =
2
k=1
1
k
2
__

0
g(t) sin kt dt
_
sin kx.
(2) Sia D = u C
2
[0, ] : u
t
(0) = u
t
() = 0, Lu = u
tt
. In questo caso
1, 0,
1
=
2
= 0,
1
=
2
= 1. Gli autovalori sono
k
= k
2
, k N;
in particolare 0 è autovalore per L. Il corrispondente sistema ortonormale di
autovettori è
_
1
__
2
cos kx
_
kN
+
. Si ha
ker L = c
cC
, (ker L)
=
_
u L
2
(a, b) :
_

0
u(x) dx = 0
_
.
Perciò se g C[a, b] (ker L)
le soluzioni del problema

_
f
tt
= g in [a, b]
f
t
(0) = f
t
() = 0
sono date dalla famiglia f
c
cC
, ove
f
c
(x) =
2
k=1
1
k
2
__

0
g(t) cos kt dt
_
cos kx +c.
Si noti che in questi due esempi le serie convergono assolutamente e unifor-
memente in [0, ]; inoltre esse sono derivabili termine a termine e le serie delle
derivate convergono ancora assolutamente e uniformemente in [0, ]. Invece
le serie delle derivate seconde convergono soltanto in L
2
(a, b).
Esercizi 11.7
1. Si denisca
H = f C
1
[a, b] : f
t
AC[a, b], f
tt
L
2
(a, b),
342
e sia L loperatore denito da
D(L) = f H : B
1
f = B
2
f = 0, Lf = (f
t
)
t
+f,
ove C
1
[a, b] con > 0, C[a, b] e le condizioni agli estremi B
1
f
e B
2
f sono denite nel modo usuale. Si provi che L è autoaggiunto.
[Traccia: per provare che D(L
) D(L), si supponga dapprima che

0 non sia autovalore per L. Se v D(L
), si verichi che GL
v è un
ben denito elemento di H e si osservi che per ogni u D(L) si ha
u = GLu e quindi (Lu, v)
L
2
(a,b)
= (u, L
v)
L
2
(a,b)
= (GLu, L
v)
L
2
(a,b)
=
(Lu, GL
v)
L
2
(a,b)
; se ne deduca che v = GL
v H. Integrando per par-

ti si ricavi, per ogni u D(L), che (Lu, v)
L
2
(a,b)
=
_
u
t
v +uv
t
b
a
+
(u, Lv)
L
2
(a,b)
; si concluda che, anche u (Lu, v)
L
2
(a,b)
sia continua
nella norma di L
2
(a, b), deve aversi B
1
v = B
2
v = 0, cioè v D(L). Si
passi inne al caso generale. . . ]
2. Siano C[a, b] e C
1
[a, b] con 0 e > 0, e sia L denito da
D(L) = f H : f(a) = f(b) = 0, Lf = (f
t
)
t
+f,
essendo H lo spazio introdotto nellesercizio precedente. Indichiamo
con
k
gli autovalori di L, necessariamente positivi (perche?), con
u
k
un sistema ortonormale di autovettori corrispondenti e con G(x, y)
il nucleo delloperatore integrale G = L
1
/(L
2
(a, b)). Si provino i
seguenti fatti:
(i) si ha Lf =
k=1
k
(f, u
k
)
L
2
(a,b)
u
k
in L
2
(a, b) per ogni f D(L);
(ii) si ha
k=1
k
[(f, u
k
)
L
2
(a,b)
[
2
=
_
b
a
[[f
t
[
2
+ [f[
2
]dx per ogni f
D(L);
(iii) si ha
k=1
k
(f, u
k
)
L
2
(a,b)
(g, u
k
)
L
2
(a,b)
=
_
b
a
[f
t
g
t
+fg]dx per ogni
f, g D(L);
(iv) risulta (Gf, f)
L
2
(a,b)
0 per ogni f D(L) e G(x, x) 0 per ogni
x [a, b];
(v) la funzione G
n
(x, y) = G(x, y)
k=n+1
1
k
u
k
(x)u
k
(y) è ben de-
nita e continua in [a, b] [a, b], il corrispondente operatore inte-
grale G
n
è compatto e autoaggiunto in L
2
(a, b), e si ha G
n
f =
k=n+1
1
k
(f, u
k
)
L
2
(a,b)
u
k
in L
2
(a, b) e (G
n
f, f)
L
2
(a,b)
0 per ogni
f L
2
(a, b);
343
(vi) la serie
k=1
1
k
[u
k
(x)[
2
converge per ogni x [a, b] e, di con-
seguenza, la serie
k=1
1
k
u
k
(x)u
k
(y) converge assolutamente in
[a, b] [a, b], con somma uguale a G(x, y);
(vii) le serie
k=1
1
k
[u
k
(x)[
2
e
k=1
1
k
u
k
(x)u
k
(y) convergono unifor-
memente in [a, b] e in [a, b] [a, b] rispettivamente;
(viii) si ha
k=1
1
k
=
_
b
a
G(x, x)dx < +;
(ix) per ogni f D(L) la serie
k=1
(f, u
k
)
L
2
(a,b)
u
k
(x) converge a f(x)
assolutamente e uniformemente in [a, b];
(x) (teorema di Mercer) per ogni g C[a, b] lequazione Lf = g ha so-
luzione unica f D(L) data da f(x) =
k=1
1
k
(g, u
k
)
L
2
(a,b)
u
k
(x),
e la serie converge assolutamente e uniformemente in [a, b].
[Traccia: per provare (vii) si dimostri dapprima il lemma del Dini: se
f
n
C[a, b], se f C[a, b] e se f
n
(x) f(x) per n , allora
f
n
f uniformemente in [a, b].]
344
Bibliograa
[1] G. Bachman, L. Narici, Functional analysis, Academic Press, New York 1973.
[2] J. J. Benedetto, Real variable and integration, B. G. Teubner, Stuttgart 1967.
[3] H. Brezis, Analyse fonctionnelle. Theorie et applications, Masson, Paris 1983.
[4] F. Conti, Appunti di istituzioni di analisi superiore (manoscritto), Pisa 1980.
[5] G. de Barra, Teoria della misura e dellintegrazione, LArciere, Cuneo 1987.
[6] N. Dunford, J. T. Schwartz, Linear operators, Interscience Publ., New York
1958.
[7] R. E. Edwards, Fourier series: a modern introduction, vol.1 e vol. 2, Holt,
Rinehart and Winston inc., New York 1967.
[8] R. E. Edwards, Functional analysis. Theory and applications, Holt, Rinehart
and Winston inc., New York 1965.
[9] C. C. Evans, R. F. Gariepy, Measure theory and ne properties of functions,
CRC Press, Boca Rabon 1992.
[10] E. Hewitt, K. Stromberg, Real and abstract analysis, Springer Verlag, Berlin
1965.
[11] A. N. Kolmogorov, S. V. Fomin, Elementi di teoria delle funzioni e di analisi
funzionale, Mir, Mosca 1980.
[12] E. R. Lorch, Spectral theory, Oxford Univ. Press, New York 1962.
[13] C. A. Rogers, Hausdor measures, Cambridge Univ. Press, Cambridge 1970.
[14] H. L. Royden, Real analysis, MacMillan, New York 1968.
345
[15] W. Rudin, Real and complex analysis, McGraw Hill, New York 1987.
[16] M. Schechter, Principles of functional analysis, Academic Press, New York
1971.
[17] A. E. Taylor, Introduction to functional analysis, J. Wiley, New York 1961.
[18] R. L. Wheeden, A. Zygmund, Measure and integral: an introduction to real
analysis, Marcel Dekker, New York 1977.
[19] H. Widom, Lectures on integral equations, notes by D. Drasin and A. Tromba,
Van Nostrand-Reinhold Co., New York 1969.
[20] A. C. Zaanen, Integration, North-Holland Publ. Company, Amsterdam 1967.
[21] A. Zygmund, Trigonometric series, vol. 1 e vol. 2, Cambridge Univ. Press,
Cambridge 1959.
346
Indice analitico
-algebra, 11
degli eventi, 27
degli insiemi Lebesgue - Stieltjes mi-
surabili, 26
degli insiemi Lebesgue misurabili in
R, 11, 14, 26
degli insiemi Lebesgue misurabili in
R
N
, 128
dei boreliani di R, 14, 26
dei boreliani di R
N
, 121, 128
generata, 14, 32, 115
prodotto, 115
-rete, 293
additività
dellintegrale, 77
della variazione totale, 151
nita, 6
numerabile, 3, 74
algebra
di funzioni, 230
di insiemi, 3, 114
applicazione aperta, 272
assioma della scelta, 22
assoluta continuità dellintegrale, 100,
154
autovalore, 300
autovettore, 300
base duale, 287
biduale, 284
cambiamento di variabile, 161
cambiamento di variabili, 166, 170
classe di equivalenza
di funzioni q.o. coincidenti, 57, 103,
104, 142, 239
in [0, 1]/Q, 22
classe monotona, 114, 115, 118
coecienti di Fourier, 217, 279
complessicazione di uno spazio norma-
to reale, 299
completamento
del prodotto di misure di Lebesgue,
128
di una misura, 29, 128
convergenza
debole, 289
debole*, 290
dominata, 52, 85
in L
1
, 104, 105
in L
p
, 242
in L
, 58
in legge, 102
in misura, 64
in probabilità, 65
monotona, 83
puntuale, 51
puntuale q.o., 56, 59, 62
uniforme, 58, 59, 62
convoluzione, 134, 246, 247
moltiplicativa, 247
coordinate polari in R
N
, 173
cubo di Hilbert, 296, 305
347
curva retticabile, 153
decomposizione di Lebesgue, 209
densità
dei polinomi, 218
delle funzioni costanti a tratti,
109, 110, 159, 189, 247
di un insieme, 12, 143
in C
0
, 111
in L
1
, 106109
in L
p
, 246
in L
, 59, 252
derivate del Dini, 145
diametro di un insieme, 32, 36
dierenza simmetrica, 22
dimensione
di Hausdor, 40
nita, 181, 193, 207, 279, 285, 292
innita, 293, 296
disequazione variazionale, 200
disuguaglianza
di Bessel, 217
di Cauchy-Schwarz, 184, 211
di Holder, 240
di Hardy, 249
di Jensen, 249
di Minkowski, 241
dominio
della derivata prima, 276
di un operatore, 280
duale
di C
N
, 192
di
1
, 197
di R
N
, 192
di C
0
, 258
di c
0
, 197
di L
1
, 193195
di L
p
, 250
di L
, 192, 263
di uno spazio di Hilbert, 208
di uno spazio normato, 192
elemento
maggiorante, 219
massimale, 219
equazione
del calore, 235
di Fredholm di 2
a
specie, 326
di Sturm-Liouville, 328
integrale, 326
di Volterra, 306
esponente coniugato, 240
esponenziale di un operatore, 197
estensione di funzionali lineari, 259
estremo inferiore essenziale, 55
estremo superiore essenziale, 55
evento, 27
famiglia
equicontinua, 294
puntualmente equilimitata, 294
forma quadratica, 313
formula
di inversione, 232
di Parseval, 233
funzionale
convesso, 260
di Minkowski, 264
lineare
continuo, 192
limitato, 192
positivo, 251
positivamente omogeneo, 259
subadditivo, 259
funzione
, 44, 96
a variazione limitata, 150
assolutamente continua, 154
boreliana, 54, 121
caratteristica, 17, 49
costante a tratti, 90
348
denita q.o., 57
derivabile q.o., 144, 152, 154
di Lebesgue, 157, 160, 161
di scelta, 22
dispari, 223
essenzialmente limitata, 55
indicatrice, 49
integrabile, 73
Lebesgue misurabile, 50, 53
Lebesgue sommabile, 90
misurabile, 49
pari, 223
q.o. nita, 59, 65
Riemann integrabile, 17, 90, 93
semplice, 49
integrabile, 70
sommabile, 70
sezione, 122
sommabile, 73
identità
del parallelogrammo, 187, 199
del risolvente, 303
di Parseval, 220
immagine di un operatore, 194, 203
immersione canonica nel biduale, 284
insieme
-nito, 82
boreliano in R, 14
boreliano in R
N
, 31
di Cantor, 15, 17, 40, 64, 98, 157
di Vitali, 22
Hausdor misurabile, 36
Lebesgue misurabile in R, 8
Lebesgue misurabile in R
N
, 31
Lebesgue-Stieltjes misurabile, 26
misurabile, 25
non Lebesgue misurabile, 22
parzialmente ordinato, 219
proiezione, 117
Riemann misurabile, 1
risolvente, 299
test, 8
totalmente limitato, 293
totalmente ordinato, 219
integrale
di funzioni misurabili, 73
di Lebesgue in R, 69, 90, 91, 136
di Lebesgue in R
N
, 69, 133, 170
di Riemann in R, 90, 136
di Riemann in R
N
, 133
dipendente da parametro, 86
improprio di Riemann in R, 91
improprio di Riemann in R
N
, 133
integrazione
per cambiamento di variabili,
166, 170
per fette, 105
per cambiamento di variabile, 161
per parti, 160
invarianza per traslazioni, 3
legge
di gruppo, 197
di una variabile aleatoria, 52, 102
lemma
del Dini, 344
di Fatou, 84
per la convergenza in misura, 88
di Riemann-Lebesgue, 109
di Vitali, 144
di Zorn, 219, 262
limite
debole, 292
debole*, 292
di Banach, 267
linearità dellintegrale, 77
lunghezza
di un intervallo, 2
349
di una curva, 38
massimo limite di insiemi, 21
minimo limite di insiemi, 21
misura, 25
-nita, 25
assolutamente continua, 99, 100, 156,
209
cardinalità, 27, 194, 216
completa, 25
concentrata, 26, 99
di Borel, 26
di Dirac, 27
di Hausdor, 36
di Lebesgue - Stieltjes , 26, 156, 159,
257
di Lebesgue in R, 17
di Lebesgue in R
N
, 31
di probabilità, 27
discreta, 28
nita, 25
immagine, 52, 102
prodotto, 113, 115, 120, 125
regolare, 20
singolare, 99, 209
misura esterna
di Hausdor, 33
di Lebesgue in R, 4
di Lebesgue in R
N
, 31
di Lebesgue-Stieltjes, 26
prodotto, 134
monotonia
dellintegrale, 74
della misura, 28
della misura di Lebesgue, 4
norma, 179
di un funzionale lineare, 192
di un operatore lineare, 191
equivalente, 181
hilbertiana, 187
in C
N
, 180
in
1
, 188
in
2
, 188
in
p
, 244
in
, 182
in R
N
, 180
in AC, 159
in BV , 152
in C
k
, 180
in C
, 183
in c
0
, 182
in c
00
, 182
in L
1
, 103
in L
p
, 242
in L
, 57
in /(X, Y ), 191
indotta da un prodotto scalare, 184,
187, 199
nucleo
del calore, 237
di Dirichlet, 269
di un operatore lineare, 194, 198,
214
di unequazione integrale, 326
numeri derivati, 145
operatore
aggiunto, 280
in uno spazio di Hilbert, 214, 281
antilineare, 209
autoaggiunto, 214, 282
compatto, 305
completamente continuo, 305
derivata prima, 275, 279
di shift, 267
di Hilbert-Schmidt, 226
di Laplace, 236
di restrizione, 277
integrale, 282, 305, 311
di Volterra, 305
350
lineare, 189
chiuso, 274, 275
continuo, 190
limitato, 189
lipschitziano, 190, 201
positivo, 215, 314
risolvente, 299
strettamente positivo, 215, 320
ordinamento parziale, 219
ortogonalità
fra insiemi, 202
fra vettori, 186
passaggio al limite sotto il segno di inte-
grale, 8385
polinomi
di Bernstein, 110
di Hermite, 218, 224
di Legendre, 218, 224
trigonometrici, 222
probabilità, 27
discreta, 28
problema di Cauchy, 297
prodotto
di convoluzione, 134, 230
scalare, 183, 215
in C
N
, 185
in R
N
, 185
in AC, 188
in C
0
, 185
in L
2
, 186
proiezione
ortogonale, 203
su un convesso chiuso, 199
su un sottospazio chiuso, 202
proprietà di miglior approssimazione, 221
punto
di Lebesgue, 138, 142
sso
regolare, 299
quasi certamente, 27
quasi ovunque, 54
raggio spettrale, 303, 319
rappresentazione canonica
di una funzione di L
1
, 143
di una funzione semplice, 49
rettangolo misurabile, 113
riessività, 284, 287
degli spazi di Hilbert, 285
di L
p
, 285
scala del diavolo, 158
scambio dellordine di integrazione,
118, 122, 130
separabilità, 288
di L
p
, 247
separazione di insiemi convessi, 265
serie di Fourier, 217
relativa al sistema trigonometrico,
222, 269
sezione di una funzione, 122
sistema
ortonormale, 215, 217, 289
completo, 218, 220
trigonometrico, 216, 279
soluzione fondamentale, 237
sottospazio, 200
chiuso, 202, 287
generato, 206
sottosuccessione
convergente in L
p
, 297
convergente q.o., 65, 104
debolmente convergente, 295
debolmente* convergente, 295
diagonale, 294
uniformemente convergente, 294
spazio
L
1
, 103
351
L
p
, 240
L
, 57
con prodotto scalare, 183, 199
degli operatori lineari limitati, 190
di Banach, 57, 103, 179, 242
di Hilbert, 185, 199
non separabile, 216
di Schwartz, 230
duale, 192
metrico
completo, 268
separabile, 294
misurabile, 25
misurato, 25
normato, 57, 179
pre-hilbertiano, 183
probabilizzato, 27, 49, 102
riessivo, 284, 295
separabile, 183, 216, 295
spettro, 299
puntuale, 299
residuo, 300
spezzate di Eulero, 298
subadditività numerabile, 3
successione
di Cauchy, 64, 103
fondamentale in misura, 64
teorema
del graco chiuso, 274
dellalternativa, 321
dellapplicazione aperta, 272
delle proiezioni, 203
di Ascoli-Arzelà, 294
di B. Levi, 83
di Baire, 268
di Banach-Steinhaus, 267
di Brouwer, 167, 174
di derivazione di Lebesgue, 143
di Frechèt-Kolmogorov, 297
di Fredholm, 321
di Fubini, 123, 132
di Hahn-Banach, 195, 260
di Lebesgue, 85
di Lusin, 59
di Mercer, 344
di Peano, 297
di Pitagora, 186
di Plancherel, 233
di Radon - Nikod ym, 101, 156, 213,
252
di Riesz-Fischer, 250
di Riesz-Frechèt, 208, 211
di Severini-Egorov, 62
con convergenza dominata, 88
di Tonelli, 122, 130
di decomposizione di Lebesgue,
209
fondamentale del calcolo integrale,
136
spettrale, 315
trasformata di Fourier
di una misura, 238
trib` u, 11
uguaglianza di Bessel, 220
uniforme limitatezza di operatori, 267
unità di unalgebra, 230
variabile aleatoria, 49
variazione totale, 150
volume di un parallelepipedo, 31
352
Introduzione alla teoria delle
equazioni alle derivate parziali
Paolo Acquistapace
9 gennaio 2007
Indice
1 Generalità 1
1.1 Preliminari . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Linee caratteristiche . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Risoluzione delle equazioni del primo ordine . . . . . . . . . . 7
1.4 Derivata normale e derivate tangenziali . . . . . . . . . . . . . 14
1.5 Il teorema di Cauchy-Kovalevskaya . . . . . . . . . . . . . . . 18
1.6 Equazioni risolubili elementarmente . . . . . . . . . . . . . . . 30
1.7 Il metodo di separazione delle variabili . . . . . . . . . . . . . 35
1.8 Classicazione delle equazioni del secondo ordine . . . . . . . 44
2 Lequazione di Laplace 48
2.1 Motivazioni siche . . . . . . . . . . . . . . . . . . . . . . . . 48
2.2 Il problema di Cauchy . . . . . . . . . . . . . . . . . . . . . . 52
2.3 Principio del massimo . . . . . . . . . . . . . . . . . . . . . . 53
2.4 Formule di rappresentazione . . . . . . . . . . . . . . . . . . . 56
2.5 La funzione di Green per la sfera . . . . . . . . . . . . . . . . 62
2.6 Proprietà delle funzioni armoniche . . . . . . . . . . . . . . . . 72
2.7 Successioni di funzioni armoniche . . . . . . . . . . . . . . . . 77
2.8 Funzioni subarmoniche . . . . . . . . . . . . . . . . . . . . . . 80
2.9 Il problema di Dirichlet . . . . . . . . . . . . . . . . . . . . . . 84
3 Lequazione del calore 88
3.2 Principio del massimo . . . . . . . . . . . . . . . . . . . . . . 91
3.3 La soluzione fondamentale . . . . . . . . . . . . . . . . . . . . 100
3.4 Il problema di Cauchy non omogeneo . . . . . . . . . . . . . . 110
3.5 Equazioni integrali di Volterra . . . . . . . . . . . . . . . . . . 114
3.6 I problemi di Cauchy-Neumann e di Cauchy-Dirichlet . . . . . 121
i
4 Lequazione di DAlembert 136
4.2 Il caso di una variabile spaziale . . . . . . . . . . . . . . . . . 143
4.3 Il metodo dellenergia . . . . . . . . . . . . . . . . . . . . . . . 152
4.4 Il problema di Cauchy in due e tre variabili spaziali . . . . . . 155
4.5 Il problema di Cauchy in R
n
[0, [ . . . . . . . . . . . . . . 164
4.6 Il problema non omogeneo . . . . . . . . . . . . . . . . . . . . 173
4.7 Il metodo di Riemann . . . . . . . . . . . . . . . . . . . . . . 178
Bibliograa 190
ii
Capitolo 1
Generalità
1.1 Preliminari
Una equazione alle derivate parziali è unequazione dierenziale della forma
F(x, u(x), Du(x), . . . , D
m
u(x)) = 0, x , (1.1)
n
, m è un intero positivo (detto ordine dellequazione),
e F è una funzione assegnata, che supporremo sempre regolare quanto basta
per poter fare tutte le derivate che sono necessarie. Lincognita è la funzione
u, che sarà a priori denita su un certo sottoinsieme aperto di ; con Du
si denota linsieme delle n derivate parziali D
i
u, e in generale D
k
u denota
linsieme di tutte le derivate D
u di u di ordine uguale a k; ricordiamo che

se N
n
si ha
D
u =

||
u
x
1
1
x
n
n
, ove [[ =
1
+. . . +
n
,
e che per , N
n
sono di uso comune le notazioni
! =
1
! . . .
n
!, x
= x
1
1
. . . x
n
n
x R
n
,
_
_
=
_
1
_
. . .
_
n
_
.
Lequazione alle derivate parziali (1.1) è totalmente non lineare. Unequa-
zione è invece quasi-lineare se dipende linearmente dalle derivate di ordine
massimo e non linearmente dalle altre, mentre è semilineare se ha parte prin-
cipale lineare: la parte principale di una equazione è costituita dai termini
1
contenenti le derivate di ordine massimo. Inne, una equazione è lineare
se dipende in modo lineare da u e dalle sue derivate. Per esempio, delle
equazioni del secondo ordine
n
i,j=1
a
ij
(x, u(x), Du(x))D
i
D
j
u(x) +b(x, u(x), Du(x)) = 0,
n
i,j=1
a
ij
(x)D
i
D
j
u(x) +b(x, u(x), Du(x)) = 0,
n
i,j=1
a
ij
(x)D
i
D
j
u(x) +
n
i=1
b
i
(x)D
i
u(x) +c(x)u(x) = f(x)
la prima è quasi-lineare, la seconda è semilineare e la terza è lineare (omoge-
nea se f 0, non omogenea altrimenti).
La prima questione che ci poniamo è la seguente: che tipo di condizioni ai
limiti occorrono per determinare una (possibilmente unica) soluzione di una
equazione alle derivate parziali? Come vedremo, la risposta a questa doman-
da non è univoca: per certe classi di equazioni sarà ben posto il problema
di Cauchy, generalizzazione di quello relativo alle equazioni dierenziali or-
dinarie, mentre per altre equazioni lesistenza e unicità delle soluzioni sarà
garantita da dierenti tipi di problemi ai limiti.
1.2 Linee caratteristiche
Consideriamo unequazione quasi-lineare del primo ordine in due variabili:
a(x, y, u(x, y))u
x
(x, y) +b(x, y, u(x, y))u
y
(x, y) = c(x, y, u(x, y)), (1.2)
ove a, b, c sono funzioni regolari assegnate, denite su un aperto R
3
.
Denizione 1.2.1 Le linee caratteristiche dellequazione (1.2) sono le curve
(t) = (x(t), y(t), z(t)) che sono soluzioni del sistema di equazioni dieren-
ziali ordinarie
_
_
_
x
(t) = a(x(t), y(t), z(t))

y
(t) = b(x(t), y(t), z(t))

z
(t) = c(x(t), y(t), z(t))

t I,
ove I R è un opportuno intervallo tale che (x(t), y(t), z(t)) .
2
Ci sono innite linee caratteristiche per la (1.2): anzi, per ogni (x
0
, y
0
, z
0
)
ne passa una e una sola, in virt` u del teorema di esistenza e unicità per i sistemi
di equazioni dierenziali ordinarie. Per capire il nesso che intercorre fra linee
caratteristiche e soluzioni della (1.2), è utile il seguente
Lemma 1.2.2 Sia u una soluzione della (1.2). Allora, ssato un punto
(x
0
, y
0
, z
0
) tale che z
0
= u(x
0
, y
0
), la linea caratteristica passante per
tale punto giace interamente sul graco di u.
Dimostrazione La normale al graco di u è
(x, y) =
1
_
u
x
(x, y)
2
+u
y
(x, y)
2
+ 1
(u
x
(x, y), u
y
(x, y), 1),
e la (1.2) ci dice che (x, y) è perpendicolare al vettore
(a(x, y, u(x, y)), b(x, y, u(x, y)), c(x, y, u(x, y))).
Quindi in ogni punto le linee caratteristiche passanti per il graco di u sono
ad esso tangenti. Ciò suggerisce che se una linea caratteristica tocca il graco
di u in un punto, non potrà pi` u staccarsene. Per vericare questa illazione,
sia (x(t), y(t), z(t)) la caratteristica che per t = 0 tocca il graco di u in
(x
0
, y
0
, z
0
): essa risolve il problema di Cauchy
_
_
x
(t) = a(x(t), y(t), z(t))

y
(t) = b(x(t), y(t), z(t))

z
(t) = c(x(t), y(t), z(t))

x(0) = x
0
, y(0) = y
0
, z(0) = z
0
,
t I. (1.3)
Sia poi ((t), (t)) la soluzione del problema di Cauchy
_
_
_
(t) = a((t), (t), u((t), (t)))
(t) = b((t), (t), u((t), (t)))

x(0) = x
0
, y(0) = y
0
,
t I, (1.4)
e consideriamo la curva di componenti ((t), (t), u((t), (t))), che è evi-
dentemente contenuta nel graco di u. Anche questa curva risolve il problema
(1.3): infatti, le condizioni iniziali sono ovviamente vericate; inoltre, dato
che u risolve la (1.2), si ha
d
dt
u(, ) = u
x
(, )a(, , u(, )) +u
y
(, )b(, , u(, )) = c(, , u(, )),
3
e di conseguenza anche le prime due equazioni sono soddisfatte. Per unicità,
deve perciò essere x(t) = (t), y(t) = (t) e z(t) = u((t), (t)) = u(x(t), y(t))
per ogni t I. Questo ci dice che la caratteristica giace interamente sul
graco di u.
Dal lemma precedente segue che il graco di ogni soluzione è lunione di linee
caratteristiche. Vale anche il viceversa, nel senso che lunione di una famiglia
a un parametro di linee caratteristiche forma il graco di una soluzione della
(1.2). Sia infatti
s
la famiglia di caratteristiche che per t = 0 attraversa
una ssata curva regolare (x
0
(s), y
0
(s), u
0
(s)), s J; supponiamo che valga
la condizione di trasversalità
det
_
x
0
(s) y
0
(s)
a(x
0
(s), y
0
(s), u
0
(s)) b(x
0
(s), y
0
(s), u
0
(s))
_
,= 0 s J, (1.5)
che esprime il fatto che la curva dei dati iniziali non è mai parallela alle ca-
ratteristiche. Siano (x(s, t), y(s, t), z(s, t)) le componenti di
s
(t). A causa di
(1.5), lapplicazione (s, t) (x(s, t), y(s, t)) è invertibile in un intorno di cia-
scun punto (s, 0). Scriviamo linversa nella forma (x, y) (s(x, y), t(x, y)):
essa è denita in un intorno U di (x
0
(s), y
0
(s)), e si ha
_
s
x
s
y
t
x
t
y
_
=
_
x
s
x
t
y
s
y
t
_
1
=
1
x
s
y
t
y
s
x
t
_
y
t
x
t
y
s
x
s
_
(x, y) U,
ove le quantità negli ultimi due membri sono calcolate in (s(x, y), t(x, y)).
Proviamo che la funzione u(x, y) = z(s(x, y), t(x, y)), il cui graco è unione
di tratti delle curve
s
, è soluzione della (1.2). Si ha, utilizzando (1.3),
au
x
+bu
y
= a(z
s
s
x
+z
t
t
x
) +b(z
s
s
y
+z
t
t
y
) =
=
1
x
s
b y
s
a
(az
s
b az
t
y
s
bz
s
a +bz
t
x
s
) = z
t
= c(x, y, u).
Inoltre
u(x
0
(s), y
0
(s)) = u(x(s, 0), y(s, 0)) = z(s, 0) = u
0
(s),
ossia il graco di u contiene la curva iniziale .
Da questa discussione si conclude che per trovare una soluzione dellequazione
(1.2) si deve prescriverne il valore u
0
(s) su una data curva piana (x
0
(s), y
0
(s))
che sia trasversale al vettore (a, b), cioè sia tale che valga (1.5): questo è il
problema di Cauchy associato allequazione. Il metodo sopra esposto consen-
te allora di determinare la soluzione riducendo lo studio dellequazione alle
4
derivate parziali a quello di innite equazioni dierenziali ordinarie lungo le
caratteristiche.
Si osservi che se invece prescriviamo il dato iniziale su una linea caratteristi-
ca, in generale non troveremo soluzioni: infatti, imponendo che una soluzione
u verichi u(x(s), y(s)) = (s) lungo una curva che nel punto s è parallela
ad una caratteristica, poiche i vettori
(x
(s), y
(s)) e (a(x(s), y(s), (s)), b(x(s), y(s), (s)))

sono paralleli, esisterà un numero k(s) tale che
x
(s) = k(s)a(x(s), y(s), (s)), y
(s) = k(s)b(x(s), y(s), (s));

pertanto nel punto s dovrà aversi
c(x(s), y(s), (s)) =
= a(x(s), y(s), (s))u
x
(x(s), y(s)) +b(x(s), y(s), (s))u
y
(x(s), y(s)) =
=
1
k(s)
(x
(s)u
x
(x(s), y(s)) +y
(s)u
y
(x(s), y(s)) =
1
k(s)

(s),
il che in generale non sarà vero per una generica funzione .
Esempio 1.2.3 Consideriamo lequazione semilineare del primo ordine
u
x
(x, y) +u
y
(x, y) = u(x, y)
2
, (x, y) R
2
.
Le linee caratteristiche sono le soluzioni del sistema
_
_
_
x
(t) = 1
y
(t) = 1
z
(t) = z(t)
2
t I,
e quindi sono le curve
x = t +h, y = t +k, z =
t
t +m
, t R,
ove h, k, m sono costanti arbitrarie. Fissiamo la curva iniziale denita da
x
0
(s) = s, y
0
(s) = s (che soddisfa ovviamente alla condizione di trasver-
salità (1.5)) e prescriviamo su di essa un dato regolare u
0
(s). Si noti che,
essendo lequazione semilineare, la trasversalità è indipendente dalla scelta
5
del dato u
0
. Le linee caratteristiche uscenti da punti di hanno equazioni
parametriche x = t s, y = t + s, z = u
0
(s), da cui, invertendo le prime
due relazioni, si trova s =
1
2
(y x), t =
1
2
(y +x), e di conseguenza un facile
calcolo mostra che
z(s, t) =
u
0
(s)
1 tu
0
(s)
.
Questa funzione, per s ssato, è denita sulla semiretta ] ,
1
u
0
(s)
[ quando
u
0
(s) > 0, sulla semiretta ]
1
u
0
(s)
, +[ quando u
0
(s) < 0, e (ovviamente) su
tutto R quando u
0
(s) = 0. Se ne deduce che la soluzione del problema
_
u
x
(x, y) +u
y
(x, y) = u(x, y)
2
u[
(s)
= u
0
(s)
è la funzione
u(x, y) =
u
0
(
yx
2
)
1
y+x
2
u
0
(
yx
2
)
(1.6)
denita sullaperto (x, y) R
2
:
y+x
2
u
0
(
yx
2
) < 1, il quale ovviamente
contiene la curva iniziale.
Si può notare che la soluzione dipende non da una costante arbitraria, come
succede per le equazioni ordinarie del primo ordine, ma da una funzione
arbitraria (di classe C
1
).
Osservazione 1.2.4 In modo analogo, per una equazione quasi-lineare del
primo ordine in n variabili
n
i=1
a
i
(x, u(x))D
i
u(x) = c(x, u(x)), x ,
le linee caratteristiche sono le curve x(t) che risolvono il sistema
_
d
dt
x
i
(t) = a
i
(x(t)), i = 1, . . . , n,
d
dt
z(t) = c(x(t), z(t)),
,
e occorrerà precisare il dato iniziale u
0
(s) lungo una supercie (n 1)-
dimensionale S, parametrizzata da x = (s), s U R
n1
, in modo che in
ogni punto essa sia trasversale al vettore dei coecienti a((s), u
0
(s)) (ove
a = (a
1
, . . . , a
n
)). Ciò si esprime scrivendo che
a((s), u
0
(s)) (s) ,= 0 s U,
6
ove (s) è la normale a S nel punto (s). Questa condizione si esprime
dicendo che i dati (S, u
0
) sono non caratteristici.
Osserviamo, per concludere, che vi è unampia teoria delle caratteristiche
anche per le equazioni del primo ordine totalmente non lineari, nonche per
sistemi di equazioni del primo ordine: per approfondimenti si rimanda a [3],
[5].
1.3 Risoluzione delle equazioni del primo or-
dine
Per determinare linsieme delle soluzioni dellequazione quasi-lineare in due
variabili
a(x, y, u)u
x
+b(x, y, u)u
y
= c(x, y, u), (1.7)
vi è un metodo, dovuto a Lagrange, che fa uso delle linee caratteristiche
dellequazione, cioè delle soluzioni del sistema di equazioni ordinarie (1.3).
Se supponiamo ad esempio a(x, y, z) ,= 0 in una ssata regione R
3
, tale
sistema equivale a questaltro:
_
_
dy
dx
=
b(x, y, z)
a(x, y, z)
dz
dx
=
c(x, y, z)
a(x, y, z)
, (1.8)
ovvero, in forma vettoriale, ponendo Y =
_
y
z
_
e A =
_
b/a
c/a
_
,
dY
dx
= A(x, Y ), x I,
ove I è un opportuno intervallo tale che (x, Y (x)) per ogni x I. Le
soluzioni di questo sistema saranno della forma
Y = (x, C), x I,
ovvero, in forma scalare,
_
y = (x, h, k)
z = (x, h, k)
, x I, (1.9)
7
ove h e k sono costanti arbitrarie. Supponiamo di poter risolvere questo
sistema rispetto a (h, k), cioè che risulti
det
(, )
(h, k)
,= 0 (1.10)
in tutti i punti (h, k) tali che si abbia (x, (x, h, k), (x, h, k)) . Possiamo
allora scrivere, almeno localmente,
_
h = p(x, y, z)
k = q(x, y, z)
, (1.11)
e le (1.11) esprimono implicitamente le soluzioni del sistema (1.8). Si osservi
che allo stesso sistema saremmo arrivati supponendo b(x, y, z) ,= 0 in ; si
noti anche che la matrice
_
p
x
p
y
p
z
q
x
q
y
q
z
_
(1.12)
ha rango massimo, poichè il suo terzo minore è linverso del determinante
(1.10). Si ha allora:
Teorema 1.3.1 Si consideri lequazione quasi-lineare (1.7), ove a, b, c sono
funzioni regolari sullaperto R
3
tali che a
2
+ b
2
> 0 in . Allora tutte
e sole le soluzioni u(x, y) di tale equazione sono le funzioni di classe C
1
che
sono esprimibili implicitamente nella forma
F(p(x, y, u(x, y)), q(x, y, u(x, y)) = 0 (1.13)
ove F è unarbitraria funzione di classe C
1
con gradiente mai nullo, e p, q
sono le funzioni che compaiono in (1.11), sulle quali si assume che la matrice
(1.12) abbia rango massimo.
Dimostrazione La chiave di tutto il ragionamento sta nel seguente
Lemma 1.3.2 Siano f, g funzioni di classe C
1
su un aperto R
2
. Si ha
det
_
f
x
(x, y) f
y
(x, y)
g
x
(x, y) g
y
(x, y)
_
= 0 (x, y) (1.14)
se e solo se per ogni (x
0
, y
0
) esistono un intorno U di (x
0
, y
0
),
un intorno V R
2
di (f(x
0
, y
0
), g(x
0
, y
0
)) ed una funzione F C
1
(V ) con
gradiente mai nullo, tali che
F(f(x, y), g(x, y)) = 0 (x, y) U. (1.15)
8
Dimostrazione (=) Supponiamo che valga la (1.15), ove F(s, t) è di classe
C
1
con gradiente mai nullo. Derivando tale identità si trova il sistema
_
F
s
(f, g)f
x
+F
t
(f, g)g
x
= 0
F
s
(f, g)f
y
+F
t
(f, g)g
y
= 0
in U,
e poiche F
2
s
+ F
2
t
> 0, deve valere la (1.14) in U. Ma U è un intorno del
punto (x
0
, y
0
), arbitrariamente scelto in : ne segue che la (1.14) vale in .
(=) Supponiamo che valga (1.14) in . Sia (x
0
, y
0
) . Se in sono
identicamente nulli tutti gli elementi della matrice, allora le funzioni f e g
sono costanti in un intorno connesso U di (x
0
, y
0
):
f(x, y) h, g(x, y) k in U,
e si ottiene la tesi con la funzione F(, ) = + h k. Se invece la
matrice ha rango 1 in un punto (x
0
, y
0
), allora esistono un aperto rettangolare
AB contenente quel punto, ed una funzione c(x, y), denita su AB,
tale che
grad g(x, y) = c(x, y) grad f(x, y) (x, y) A B. (1.16)
Possiamo inoltre supporre, ad esempio, che sia f
x
(x
0
, y
0
) ,= 0, cosicche,
restringendo opportunamente lintorno, avremo f
x
,= 0 in A B. Posto
0
= f(x
0
, y
0
), la funzione G(x, y, ) = f(x, y) verica
G(x
0
, y
0
,
0
) = 0, G
x
(x, y, ) = f
x
(x, y) ,= 0 (x, y, ) A B R;
quindi, per il teorema del Dini, esistono un parallelepipedo aperto IJK
A B R centrato in (x
0
, y
0
,
0
) ed una funzione : J K I di classe
C
1
, tali che per ogni (y, ) J K vi è un unico x I per il quale valgono
le tre condizioni, fra loro equivalenti,
G(x, y, ) = 0 = f(x, y) x = (y, ),
e in particolare si ha
f((y, ), y) 0 in J K, x (y, f(x, y)) 0 in U,
ove U è laperto non vuoto (I J) f
1
(K). Inoltre vale la relazione
f
x
((y, ), y)
y
(y, ) f
y
((y, ), y) 0 in J K.
9
Poniamo adesso
(y, ) = g((y, ), y) (y, ) J K :
allora si ha, utilizzando la (1.16),
y
(y, ) = g
x
((y, ), y)
y
(y, ) +g
y
((y, ), y) =
= c((y, ), y) [f
x
((y, ), y)
y
(y, ) +f
y
((y, ), y)] = 0 in J K.
Dunque la funzione (y, ) dipende in realtà soltanto da . Consideriamo
allora la funzione
F(, ) = (), (, ) K R :
il suo gradiente non è mai nullo, e in U si ha, essendo x (y, f(x, y)) 0,
F(f(x, y), g(x, y)) = g(x, y) (f(x, y)) = g(x, y) g((x, f(x, y)), y) = 0.
Ci` o prova la tesi del lemma.
Osservazione 1.3.3 Due funzioni f, g che vericano la (1.15) in un aperto
si dicono funzionalmente dipendenti in . Si noti che questa nozione è pi` u de-
bole della lineare dipendenza: due funzioni f, g linearmente dipendenti sono
anche funzionalmente dipendenti, perche se risulta c
1
f(x, y) + c
2
g(x, y) 0
è suciente scegliere F(a, b) = c
1
a + c
2
b, però il viceversa non è vero, come
mostrano le funzioni cos x e sin x.
Torniamo alla dimostrazione del teorema 1.3.1. Proviamo anzitutto che se
u è denita implicitamente dalla (1.13), allora u è soluzione della (1.7). Dal
lemma 1.3.2 ricaviamo che si ha
det
_
p
x
+p
z
u
x
q
x
+q
z
u
x
p
y
+p
z
u
y
q
y
+q
z
u
y
_
= 0, (1.17)
ossia, svolgendo i calcoli,
u
x
[p
z
q
y
p
y
q
z
] +u
y
[p
x
q
z
p
z
q
x
] + [p
x
q
y
p
y
q
x
] = 0.
In altre parole, si ottiene la relazione
u
x
det
(p, q)
(y, z)
+u
y
det
(p, q)
(z, x)
= det
(p, q)
(x, y)
. (1.18)
10
Adesso analizziamo le soluzioni implicite del sistema (1.8), ossia le (1.11). Si
tratta di due superci la cui intersezione è una curva caratteristica: ne segue
che in ogni punto in cui vale (1.11) deve valere anche il sistema
_
ap
x
+bp
y
+cp
z
= 0
aq
x
+bq
y
+cq
z
= 0,
che esprime il fatto che le normali alle due superci sono ortogonali ad (a, b, c).
Da qui si ricava, con noioso ma facile calcolo,
_
a det
(p,q)
(z,x)
b det
(p,q)
(y,z)
= 0
a det
(p,q)
(x,y)
c det
(p,q)
(y,z)
= 0,
. (1.19)
Per ipotesi, uno dei tre minori della matrice
(p,q)
(x,y,z)
è non nullo: supponiamo
ad esempio che sia
det
(p, q)
(y, z)
,= 0. (1.20)
Allora, sostituendo le relazioni (1.19) nella (1.18), si ottiene
c det
(p, q)
(y, z)
= a det
(p, q)
(x, y)
= au
x
det
(p, q)
(y, z)
+bu
y
det
(p, q)
(y, z)
,
e da (1.20) si conclude, nalmente, che u(x, y) è soluzione dellequazione
(1.7).
Proviamo ora, viceversa, che se u(x, y) è soluzione di (1.7), allora esiste una
funzione F tale che u si rappresenta nella forma (1.13). Moltiplichiamo
lequazione (1.7) per la quantità (non nulla, in virt` u di (1.20))
det
(p, q)
(y, z)
;
utilizzando le (1.19), e supponendo ad esempio a ,= 0, si ricava la (1.18),
la quale, come si è visto in precedenza, è equivalente alla condizione (1.14).
Pertanto otteniamo
det
_

x
p(x, y, u(x, y))
de
y
p(x, y, u(x, y))
x
q(x, y, u(x, y))

y
q(x, y, u(x, y))
_
= 0 in . (1.21)
Dal lemma 1.3.2 segue allora che vale la (1.13).
11
Esempi 1.3.4 (1) Lequazione semilineare dellesempio 1.2.3 ha le due fa-
miglie di caratteristiche y x = h e
1
z
+ x = k: e in eetti, come è giusto,
la soluzione del problema l` considerato, ossia la funzione (1.6), soddisfa
lequazione implicita
1
u(x, y)
+x =
1
u
0
(
yx
2
)

y x
2
,
e dunque fa parte della famiglia F
_
y x,
1
u
+x
_
= 0, scegliendo
F(s, t) = t
1
u
0
(s/2)

s
2
.
(2) Consideriamo lequazione quasi-lineare
x uu
x
+y uu
y
= (x
2
+y
2
). (1.22)
I tre coecienti a(x, y, z) = xz, b(x, y, z) = yz e c(x, y, z) = (x
2
+ y
2
)
sono funzioni di classe C
1
su tutto R
3
. Il sistema (1.8) diventa, in qualunque
regione in cui xz ,= 0,
dy
dx
=
y
x
,
dz
dx
=
x
2
+y
2
xz
,
e le sue soluzioni sono, come si verica per integrazione diretta,
y = (x, h, k) = hx, z = (x, h, k) =
_
k (1 +h
2
)x
2
(h R, k > 0),
ove il segno di z dipende dalla regione in cui ci si trova. Si noti però che tale
segno cambia per x =
_
k
1+h
2
, e la funzione z(x) risultante è di classe C
1
anche in tali punti, avendo una discontinuità solo per x = 0: quindi si può
rimuovere la condizione z ,= 0. Risulta inoltre
det
(, )
(h, k)
= det
_
_
x
hx
2
k(1+h
2
)x
2
0
1
2
k(1+h
2
)x
2
_
_
=
x
2
_
k (1 +h
2
)x
2
;
tale determinante è non nullo per ogni h, k quando x ,= 0. Risolvendo il
sistema sopra scritto rispetto a h, k si ottiene facilmente
h =
y
x
p(x, y, z), k = z
2
+x
2
+y
2
q(x, y, z).
12
Si conclude che linsieme delle soluzioni della (1.22) nella regione (x, y, z) :
x ,= 0 è dato da
F
_
y
x
, x
2
+y
2
+z
2
_
= 0
con F funzione arbitraria di classe C
1
tale che F ,= 0.
(3) In certi casi per risolvere il sistema delle caratteristiche è utile il metodo
dei moltiplicatori. Si osserva anzitutto che se a, b, c, d, e, f sono numeri reali
tali che
a
b
=
c
d
=
e
f
, allora per ogni , , R non tutti nulli risulta, come è
immediato vericare,
a +c +e
b +d +f
=
a
b
=
c
d
=
e
f
.
Vediamo come luso di questo trucco possa talvolta semplicare di molto il
calcolo: consideriamo ad esempio lequazione dierenziale quasi-lineare
(x
2
y
2
u
2
)u
x
+ 2xyu
y
= 2xu,
le cui caratteristiche sono le soluzioni del sistema
x
x
2
y
2
z
2
=
y
2xy
=
z
2xz
= 1.
Si ha allora
dz
dy
=
z
y
, da cui
y
z
= h;
inoltre, scelti = x, = y, = z, troviamo
z
2xz
=
xx
+yy
+zz
x(x
2
y
2
z
2
) +y(2xy) +z(2xz)
=
xx
+yy
+zz
x(x
2
+y
2
+z
2
)
,
da cui
z
z
=
d
dt
ln(x
2
+y
2
+z
2
)
e, integrando,
x
2
+y
2
+z
2
z
= k.
Dunque linsieme delle soluzioni dellequazione data è, in forma implicita,
F
_
y
z
,
x
2
+y
2
+z
2
z
_
= 0.
13
1.4 Derivata normale e derivate tangenziali
Sia un aperto di R
n
e sia S = x : (x) = 0 una supercie regolare
(n1)-dimensionale con versore normale (x) =
D(x)
|D(x)|
. Se u è una funzione
regolare denita su , la sua derivata normale rispetto a S è
u
(x) = (x) Du(x) =

n
i=1
i
(x)D
i
u(x), x S,
mentre tutte le derivate direzionali di u della forma
u
(x) =
n
i=1
i
(x)D
i
u(x), con (x) (x) = 0
si dicono derivate tangenziali di u rispetto a S.
Deniamo adesso le derivate normali e tangenziali di ordine superiore.
Denizione 1.4.1 Sia S = x : (x) = 0 una supercie regolare con
versore normale (x) =
D(x)
|D(x)|
. Se u è una funzione regolare denita su
, ogni espressione della forma
||=k
a
(x)D
u(x), ove gli a
vericano la
relazione
||=k
a
(x)
(x) = 0, si chiama derivata tangenziale di ordine

k di u rispetto a S. Lespressione
||=k
(x)
u(x) si chiama derivata

normale di ordine k di u rispetto a S, e si denota con

k
u
k
(x).
In particolare, per k = 2 sono derivate tangenziali di u rispetto a S le quantità
n
i,j=1
q
ij
(x)D
i
D
j
u(x) se vale la condizione
n
i,j=1
q
ij
(x)
i
(x)
j
(x) = 0, men-
tre la derivata normale seconda

2
u
2
(x) è data da
n
i,j=1
i
(x)
j
(x)D
i
D
j
u(x).
Il lemma che segue mostra come decomporre una qualunque derivata di
una assegnata funzione u nella somma di una derivata normale pi` u una
tangenziale.
Lemma 1.4.2 Sia R
n
un aperto, sia S una supercie regolare
(n 1)-dimensionale, e sia u : R una funzione regolare. Allora:
(i) per k = 1, . . . , n si ha
D
k
u(x) =
k
(x)
u
(x) +
u
k
(x),
ove
k
= e
k
(e
k
) è un vettore tangente a S;
14
(ii) per h, k = 1, . . . , n si ha
D
k
D
h
u(x) =
k
(x)
h
(x)
2
u
2
(x) +
n
i,j=1
q
hkij
(x)D
i
D
j
u(x),
ove lultimo addendo è unopportuna derivata tangenziale di ordine 2
rispetto a S;
(iii) il valore di ogni derivata tangenziale di u di ordine 2 rispetto a S dipende
soltanto dai valori di u[
S
e di
u
S
(oltre che, naturalmente, da S
stessa).
Dimostrazione (i) Basta osservare che
D
k
u
k
u
=
n
i=1
(
ki
i
)D
i
u
(ove
ij
= 0 per i ,= j e
ij
= 1 per i = j), e che il vettore
k
di componenti
(
k
)
i
=
ki
i
è tangente a S in quanto
n
i=1
(
ki
i
)
i
=
k
(1[[
2
) = 0.
(ii) Si ha, applicando (i) alla funzione D
h
u,
D
k
D
h
u =
k
D
h
u +

k
D
h
u =
n
i=1
i
D
h
(D
i
u) +

k
D
h
u =
=
n
i,j=1
hj
D
j
D
i
u +

k
D
h
u =
=
n
i,j=1
i
[(
h
)
j
+
h
j
]D
j
D
i
u +

k
D
h
u =
=
n
i=1
h
D
i
u +
k
h
n
i,j=1
j
D
i
D
j
u +

k
D
h
u.
Da qui segue intanto
D
k
D
h
u
k
h
n
i,j=1
j
D
i
D
j
u =
n
i=1
h
D
i
u +

k
D
h
u; (1.23)
15
inoltre, proseguendo il calcolo, e applicando (i) a D
j
u,
D
k
D
h
u
k
2
u
2
=
=
n
i,j=1
i
(
h
)
j
D
j
D
i
u +
n
j=1
(
k
)
j
D
h
D
j
u =
=
n
i,j=1
i
(
h
)
j
D
j
D
i
u +
n
j=1
(
k
)
j
_
D
j
u +

h
D
j
u
_
=
=
n
i,j=1
_
i
(
h
)
j
+
h
i
(
k
)
j
+ (
k
)
j
(
h
)
i
_
D
i
D
j
u.
La tesi segue osservando che
n
i,j=1
_
i
(
h
)
j
+
h
i
(
k
)
j
+ (
k
)
j
(
h
)
i
_
j
=
=
k
[[
2
(
h
) +
h
[
2
[(
k
) + (
k
)(
h
) = 0.
(iii) In virt` u di (i), i valori di D
i
u su S, per i = 1, . . . , n, sono determinati
dai valori di u[
S
=
0
e
u
S
=
1
:
D
i
u[
S
=
i
1
+

0
i
.
Fissiamo adesso una qualunque derivata tangenziale
n
h,k=1
q
hk
D
h
D
k
u: poi-
che
n
h,k=1
q
hk
h
= 0, da (1.23) si avrà
n
h,k=1
q
hk
D
h
D
k
u =
n
h,k,j=1
q
hk
k
D
j
u +
n
h,k=1
q
hk
h
D
k
u,
e in denitiva tale derivata dipende soltanto, tramite le D
i
u e D
h
u, dai valori
0
= u[
S
e
1
=
u
S
.
Utilizzando le derivate normali e tangenziali a una supercie, siamo in grado
di vedere come sono fatte le caratteristiche nel caso di equazioni alle derivate
parziali del secondo ordine. Consideriamo lequazione quasi-lineare
n
i,j=1
a
ij
(x, u, Du)D
i
D
j
u = b(x, u, Du), x R
n
, (1.24)
16
ed il problema di Cauchy che si ottiene accoppiando tale equazione con le
condizioni ai limiti
u[
S
=
0
,
u
S
=
1
. (1.25)
In analogia con il caso delle equazioni quasi-lineari del primo ordine, diremo
che la terna (S,
0
,
1
) è caratteristica per lequazione (1.24) se risulta
n
i,j=1
a
ij
(x, u(x), Du(x))
i
(x)
j
(x) = 0 x S. (1.26)
Si noti che in virt` u di (1.25) e del lemma 1.4.2 i valori di u[
S
e delle derivate
D
k
u[
S
sono noti, poiche dipendono dai valori di
0
e
1
. Dunque, lo stesso
accade per il valore su S dei coecienti a
ij
(x, u, Du) e del secondo membro
b(x, u, Du) dellequazione (1.24). Daltronde, la parte principale L(u) =
n
i,j=1
a
ij
(x, u, Du)D
i
D
j
u della (1.24) vale, sempre in virt` u del lemma 1.4.2,
L(u) =
n
i,j=1
a
ij
(x, u, Du)
i
2
u
2
+
n
i,j=1
a
ij
(x, u, Du)
n
r,s=1
q
ijrs
D
r
D
s
u,
ove nel secondo addendo vi è una derivata tangenziale rispetto a S. Se ora
supponiamo che la terna (S,
0
,
1
) sia caratteristica, troviamo che il primo
addendo è nullo: pertanto anche il valore di L(u) dipende solo dai valori di
0
e
1
. Quindi, il valore in S della quantità L(u) b(x, u, Du) è determinato,
e in generale esso non sarà necessariamente nullo. Ciò signica che, quando
(S,
0
,
1
) è caratteristica, di regola non esisteranno soluzioni dellequazione
(1.24) soddisfacenti alle condizioni ai limiti (1.25).
Quando al contrario i dati sono non caratteristici, il lemma 1.4.2 mostra
che i valori delle derivate seconde D
i
D
j
u dipendono da
0
,
1
e dalla de-
rivata normale seconda

2
u
2
; ma questultima si può ricavare dallequazione
dierenziale, poiche risulta
2
u
2
=
1
n
i,j=1
a
ij
j
_
L(u)
n
i,j=1
a
ij
n
r,s=1
q
ijrs
D
r
D
s
u
_
=
=
1
n
i,j=1
a
ij
j
_
i,j=1
a
ij
n
r,s=1
q
ijrs
D
r
D
s
u +b(x, u, Du)
_
,
ove il termine
n
i,j=1
a
ij
n
r,s=1
q
ijrs
D
r
D
s
u è una derivata seconda tangenzia-
le, dunque anchesso dipendente solo da
0
e
1
. Questo rende plausibile
17
lidea che sia ben determinata una soluzione del problema di Cauchy (1.24)-
(1.25): in eetti il teorema di Cauchy-Kovalevskaya, che dimostreremo nel
paragrafo successivo, assicurerà invece lesistenza e lunicità della soluzione
quando i dati (S,
0
,
1
) sono non caratteristici.
Osservazione 1.4.3 Se lequazione è semilineare, ossia della forma
n
i,j=1
a
ij
(x)D
i
D
j
u = b(x, u, Du), x R
n
, (1.27)
allora la condizione che la terna (S,
0
,
1
) sia caratteristica si riduce a
n
i,j=1
a
ij
(x)
i
(x)
j
(x) = 0,
ed è dunque indipendente dai dati
0
,
1
. In questo caso si parla perciò di
supercie caratteristica per il problema (1.27)-(1.25).
1.5 Il teorema di Cauchy-Kovalevskaya
Il principale enunciato di esistenza per equazioni alle derivate parziali di for-
ma generale è senza dubbio il teorema di Cauchy-Kovalevskaya, che stabilisce
lesistenza di una soluzione (locale) analitica quando i coecienti dellequa-
zione e i dati ai limiti sono analitici e non caratteristici. Si tratta di un
risultato importante, ma non sempre decisivo, nel senso che per molte equa-
zioni alle derivate parziali il problema di Cauchy non è signicativo; del resto
non sempre i dati e i coecienti di unequazione sono analitici e in tal caso
questo teorema non si applica. Inoltre, esso garantisce una soluzione unica
nella classe delle funzioni analitiche, ma non è escluso a priori che vi possano
essere altre soluzioni, non analitiche.
Teorema 1.5.1 (di Cauchy-Kovalevskaya) Si consideri lequazione alle
derivate parziali quasi lineare del secondo ordine
n
i,j=1
a
ij
(x, u(x), Du(x))D
i
D
j
u(x) +a(x, u(x), Du(x)) = 0, x , (1.28)
con le condizioni ai limiti
u[
S
=
0
,
u
S
=
1
, (1.29)
18
n
, S = x : (x) = 0 è una supercie regolare
(n 1)-dimensionale con, in particolare, [D[ , = 0 in S. Se ,
0
,
1
, a
ij
, a
sono funzioni analitiche dei loro argomenti, e se i dati (S,
0
,
1
) sono non
caratteristici, ossia
n
i,j=1
a
ij
(x,
0
(x), Du(x))
i
(x)
j
(x) ,= 0 x S,
allora per ogni x
0
S esiste > 0 tale che il problema ha ununica soluzione
u analitica in B(x
0
, ).
Si noti che nei punti di S le derivate D
i
u(x) dipendono soltanto dai dati
0
e
1
in virt` u del lemma 1.4.2.
Dimostrazione Procederemo in varie tappe.
1
a
tappa: riduzione al caso in cui S x R
n
: x
n
= 0.
Fissato x
0
S, poiche [D(x
0
)[ , = 0 possiamo supporre che sia D
n
(x
0
) ,= 0.
Consideriamo la trasformazione : R
n
R
n
denita da
(x) = y, ove
_
y
i
= x
i
, i = 1, . . . , n 1,
y
n
= (x
1
, . . . , x
n
).
Allora la matrice Jacobiana di è
J
(x) =
_
_
_
_
_
I
n1
0
.
.
.
0
D
1
(x) D
n1
D
n
(x)
_
_
_
_
_
,
cosicche det J
(x
0
) = D
n
(x
0
) ,= 0. Per il teorema di invertibilità loca-
le, esiste un intorno U di x
0
tale che [
U
è invertibile; in particolare si
ha := (S U) = y V : y
n
= 0, ove V è un intorno del pun-
to y
0
= (x
0
) . Naturalmente, il versore normale alla supercie è
e
n
= (0, . . . , 0, 1) R
n
.
Vediamo come si trasforma lequazione. Sia v(y) = u(
1
(y)) la nuova
incognita: dalla relazione u(x) = v((x)) = v(x
1
, . . . , x
n1
, (x
1
, . . . , x
n
))
segue
D
i
u(x) = D
i
v((x)) +D
n
v((x))D
i
(x), i = 1, . . . , n 1,
D
n
u(x) = D
n
v((x))D
n
(x),
19
ed anche
D
j
D
i
u(x) = D
j
D
i
v((x)) +D
n
D
i
v((x))D
j
(x)+
+ [D
j
D
n
v((x)) +D
2
n
v((x))D
j
(x)]D
i
(x)+
+ D
n
v((x))D
j
D
i
(x), i, j = 1, . . . , n 1,
D
n
D
i
u(x) = D
n
D
i
v((x))D
n
(x) +D
2
n
v((x))D
n
(x)D
i
(x)+
+ D
n
v((x))D
n
D
i
(x), i = 1, . . . , n 1,
D
2
n
u(x) = D
2
n
v((x))[D
n
(x)]
2
+D
n
v((x))D
2
n
(x).
(1.30)
Osserviamo che la dipendenza di queste derivate dalle derivate seconde di
v è lineare. Quindi, raggruppando, per ogni derivata D
h
D
k
v, in un singolo
termine b
hk
gli addendi a
ij
relativi a derivate D
j
D
i
u che contengono D
h
D
k
v,
otteniamo che la (1.28) si trasforma in unequazione del tipo
n
h,k=1
b
hk
(y, v(y), Dv(y))D
h
D
k
v(y) +b(y, v(y), Dv(y)) = 0, y V, (1.31)
ove nella funzione b sono inglobati tutti i termini che non contengono derivate
seconde di v. Si vede dunque che la (1.31) ha la stessa forma della (1.28).
Vediamo come si trasformano le condizioni ai limiti. Chiaramente la prima,
u[
S
=
0
, è equivalente a v[
=
0
1
. La seconda condizione,
u
S
=
1
,
diventa:
1

1
(y) =
n
i=1
D
i
u(
1
(y))
i
(x) =
=
n1
i=1
[D
i
v(y) +D
n
v(y)D
i
(x)]
i
(x) +D
n
v(y)D
n
(x)
n
(x) =
=
n1
i=1
D
i
v(y)
D
i
(x)
[D(x)[
+D
n
v(y)[D(x)[,
ossia
D
n
v(y) =
1
[D(
1
(y))[
_
1
(
1
(y))
n1
i=1
D
i
(
0

1
)(y)
D
i
(
1
(y))
[D(
1
(y))[
_
y .
20
Quindi le nuove condizioni ai limiti sono del tipo
v[
=
0
, D
n
v[
=
1
, (1.32)
con
0
e
1
funzioni analitiche al pari dei coecienti b
hk
e b della (1.31).
Inoltre i nuovi dati sono ancora non caratteristici, ossia risulta in ogni punto
di
n
h,k=1
b
hk
(e
n
)
h
(e
n
)
k
= b
nn
(y
1
, . . . , y
n1
, 0,
0
, D
1
0
, . . . , D
n1
0
,
1
) ,= 0.
Infatti, poichè b
nn
è la somma di tutti i coecienti a
ij
tali che lespressione
di D
i
D
j
u contiene la derivata D
2
n
v, dalle (1.30) è facile riconoscere che
b
nn
(y
1
, . . . , y
n1
, 0,
0
, D
1
0
, . . . , D
n1
0
,
1
) =
= b
nn
(y, v, Dv)[
=
_
n
i,j=1
a
ij
(x, u, Du)D
i
D
j
S
=
=
_
n
i,j=1
a
ij
(x, u, Du)
i
j
[D[
2
_
S
,= 0.
(1.33)
Abbiamo cos` ottenuto il nuovo problema (1.31)-(1.32), che è equivalente a
quello originario.
2
a
tappa: trasformazione del problema (1.31)-(1.32) in un sistema quasi
lineare del primo ordine.
Aggiungiamo allincognita v altre n variabili p
1
, . . . , p
n
, corrispondenti alle
derivate prime di v. Corrispondentemente, aggiungiamo alla (1.31) nuove
equazioni che legano le nuove incognite in modo coerente:
D
n
v = p
n
,
D
n
p
i
= D
i
p
n
, i = 1, . . . , n 1.
(1.34)
Si tratta di n equazioni, alle quali si aggiunge la (1.31), che riscriviamo cos`:
n
h,k=1
b
hk
(y, v, p
1
, . . . , p
n
))D
h
p
k
+b(y, v, p
1
, . . . , p
n
) = 0, y V,
ovvero, isolando il termine che contiene D
n
p
n
e ricordando (1.33),
D
n
p
n
=
1
b
nn
(y, v, p
1
, . . . , p
n
)
_
n1
h=1
n
k=1
b
hk
(y, v, p
1
, . . . , p
n
)D
h
p
k
+
+
n1
k=1
b
nk
(y, v, p
1
, . . . , p
n
)D
n
p
k
+b(y, v, p
1
, . . . , p
n
)
_
.
(1.35)
21
Al sistema di equazioni (1.34)-(1.35) associamo le condizioni ai limiti che
ricaviamo dalle (1.32):
v[
=
0
, p
i
[
= D
i
0
(i = 1, . . . , n 1), p
n
[
=
1
. (1.36)
Occorre però vericare che il problema di Cauchy (1.34)-(1.35)-(1.36) è equi-
valente al problema di Cauchy (1.31)-(1.32).
`
E chiaro, per costruzione, che
se v è soluzione del problema (1.31)-(1.32) allora (v, D
1
v, . . . D
n
v) è soluzione
del sistema (1.34)-(1.35)-(1.36). Per provare il viceversa, poniamo
i
(y) = p
i
(y) D
i
v(y). i = 1, . . . , n,
e proviamo che i
i
sono tutti nulli. Lequazione D
n
v = p
n
dice intanto che
n
0. Allora per i = 1, . . . , n 1 si ha, grazie allequazione D
n
p
i
= D
i
p
n
,
D
n
i
= D
n
p
i
D
n
D
i
v = D
i
(p
n
D
n
v) = D
i
n
= 0;
poiche per y
n
= 0 è
i
= D
i
0
D
i
0
= 0, si deduce che
i
0.
Dato che p
i
= D
i
v per i = 1, . . . , n, si ottiene che se (v, p
1
, . . . p
n
) risolve il
sistema (1.34)-(1.35)-(1.36), allora v è soluzione del problema (1.31)-(1.32).
In denitiva, i due problemi di Cauchy sono equivalenti.
3
a
tappa: riduzione a dati iniziali nulli.
Il sistema che dobbiamo risolvere ha acquisito la forma
_
D
n
q
i
=
N
r=1
n1
h=1
B
i
rh
(y, q
1
, . . . , q
N
)D
h
q
r
+B
i
(y, q
1
, . . . , q
N
),
q
i
[
=
i
, i = 1, . . . , N,
(1.37)
ove i coecienti B
i
rh
, B
i
e i dati
i
sono funzioni analitiche nellaperto V .
Scriviamo y = (y
, y
n
) per ogni y R
n
, e introduciamo le nuove incognite
w
i
(y) = q
i
(y)
i
(y
), i = 1, . . . , N,
w
N+1
(y) = y
n
,
ove la w
N+1
serve a rappresentare i coecienti B
i
rh
e B
i
come funzioni delle
sole variabili y
= (y
1
, . . . , y
n1
), oltre che delle incognite w
i
.
Sostituendo le funzioni w
i
in (1.37), otteniamo un nuovo sistema del tipo
_
_
D
n
w
i
=
N+1
r=1
n1
h=1
A
i
rh
(y
, w
1
, . . . , w
N+1
)D
h
w
r
+
+A
i
(y
, w
1
, . . . , w
N+1
), i = 1, . . . , N + 1,
w
i
[
= 0, i = 1, . . . , N + 1,
(1.38)
22
ove la (N + 1)-sima equazione è semplicemente D
n
w
N+1
= 1. Osserviamo
che dentro gli A
i
sono conglobati i B
i
e anche i termini della forma B
i
rh
D
h
r
.
`
E immediato riconoscere che i sistemi (1.37) e (1.38) sono equivalenti. Mo-
streremo che il sistema (1.38) ha ununica soluzione analitica.
4
a
tappa: costruzione di una candidata soluzione sotto forma di serie di
potenze.
Per ipotesi i coecienti A
i
rh
e A
i
sono analitici: quindi possiamo scrivere
A
i
rh
(y
, z) =
N
n1
N
N+1
a
irh
(y
,
A
i
(y
, z) =
N
n1
N
N+1
a
i
(y
,
e queste serie convergono assolutamente per [y
[ + [z[ < , essendo un

opportuno numero positivo. Scriviamo anche le incognite w
i
come somme di
serie di potenze
w
i
(y) =
N
n
c
i
, i = 1, . . . , N + 1, (1.39)
delle quali occorre determinare i coecienti c
i
. A questo scopo andiamo a

sostituire questa serie nel sistema dierenziale (1.38): poiche
D
k
w
i
=
N
n
:
k
1
k
c
i
y
e
k
=
N
n
(
k
+ 1)c
i
+e
k
y
, k = 1, . . . , n,
scrivendo
N
n
c
:=
_
N
n
c
1
, . . . ,
N
n
c
N+1
_
,
si ottiene
N
n
c
i
+en
(
n
+ 1)y
=
=
N+1
r=1
n1
h=1
_
_

N
n1
N
N+1
a
irh
(y
N
n
c
_
_

N
n
(
h
+ 1)c
r
+e
h
y
+
+
N
n1
N
N+1
a
i
(y
N
n
c
.
23
I due membri sono due serie di potenze nelle variabili y
1
, . . . y
n
, che devono
coincidere per [y[ < , per un opportuno . Quindi i coecienti devono
essere uguali. Osserviamo che il coeciente della generica potenza y
è,
a sinistra, c
i
+en
, mentre a destra è una certa espressione polinomiale nei
coecienti a
irh
, a
i
e c
i
; si riconosce agevolmente che questo polinomio ha

coecienti non negativi, e che in esso compaiono solo coecienti c
i
con
n-sima componente
n

n
. Possiamo scrivere allora
c
i
+en
=
1
n
+ 1
p
i
(a
irh
, a
i
, c
i
), (1.40)
con p
i
polinomio a coecienti non negativi, i quali dipendono dalle quantità

incognite c
i
, ma solo da quelle relative a multi-indici con

n

n
.
Ricordando che w
i
è nulla per y
n
= 0, si ha
c
i
= 0 N
n
con
n
= 0, (1.41)
e dunque la (1.40), unita alla (1.41), ci permette di ricavare i coecienti c
i
per induzione su
n
. Abbiamo cos` costruito una candidata soluzione: la
funzione (w
1
, . . . w
n
), con w
i
denita in (1.39).
5
a
tappa: la candidata soluzione è uneettiva soluzione.
Utilizzeremo il metodo cosiddetto delle serie maggioranti. Ci basiamo
sullevidente fatto che, date due serie di potenze
N
n
f
N
n
g
,
se la seconda è assolutamente convergente per [y[ < r e se [f
[ [g
[ per
ogni N
n
, allora anche la prima è assolutamente convergente per [y[ < r.
Consideriamo un nuovo sistema dierenziale della stessa forma di (1.38), vale
a dire
_
_
D
n
i
=
N+1
r=1
n1
h=1
A
i
rh
(y
,
1
, . . . ,
N+1
)D
h
r
+
+A
i
(y
,
1
, . . . ,
N+1
),
i
[
= 0, i = 1, . . . , N + 1,
(1.42)
con coecienti analitici,
A
i
rh
(y
, z) =
N
n1
N
N+1
a
irh
(y
, [y
[ +[z[ < ,
24
A
i
(y
, z) =
N
n1
N
N+1
a
i
(y
, [y
[ +[z[ < ,
e tali inoltre che a
irh
, a
i
0.
Supponiamo inoltre che questo sistema abbia ununica soluzione analitica
i
(y) =
N
n
(1.43)
denita per [y[ < . Vale la seguente
Proposizione 1.5.2 Nelle ipotesi sopra dette, supponiamo inoltre che
[a
irh
[ a
irh
, [a
i
[ a
i
N
n1
, N
N+1
. (1.44)
Allora
[c
i
[ [
i
[ N
n
.
Dimostrazione Sostituendo la serie (1.43) nel sistema (1.42) e procedendo
come in precedenza, si ricava
i
+en
=
1
n
+ 1
p
i
(a
irh
, a
i
,
i
) N
n
,
ove p
i
è lo stesso polinomio che compare nella (1.40). Poiche tale polinomio

ha coecienti non negativi, e poiche
i
= 0 quando
n
= 0 in virt` u delle
condizioni ai limiti, si deduce intanto, per induzione sullindice
n
, che
i
0
per ogni multi-indice . Inoltre si ha
[c
i
+en
[ =
1
n
+ 1
[p
i
(a
irh
, a
i
, c
i
)[
n
+ 1
p
i
([a
irh
[, [a
i
[, [c
i
[)
1
n
+ 1
p
i
(a
irh
, a
i
, [c
i
[).
Proveremo ora che [c
i
[ [
i
[ =
i
per induzione su
n
. Poiche [c
i
[ = 0 =
i
per ogni N
n
con
n
= 0, è chiaro che la relazione desiderata è vera quando
n
= 0. Supponiamo vera la disuguaglianza per tutti i multi-indici con
n
= k 1, e proviamola per quelli con
n
= k. Sia dunque N
n
con
n
= k e poniamo = e
n
: allora
[c
i
[ = [c
i
+en
[
1
n
+ 1
p
i
(a
irh
, a
i
, [c
i
[),
25
ove, come sappiamo, p
i
dipende da coecienti [c
i
[ con
n

n
=
n
1 =
k 1. Quindi, per ipotesi induttiva, si ha [c
i
[
i
; ne segue
[c
i
[
1
n
+ 1
p
i
(a
irh
, a
i
, [c
i
[)
1
n
+ 1
p
i
(a
irh
, a
i
,
i
) =
i
+en
=
i
,
e dunque il passo induttivo è dimostrato. Ciò prova la tesi della proposizione
1.5.2.
A questo punto non ci resta che costruire un sistema del tipo (1.42), i cui
coecienti siano analitici e soddisno le relazioni (1.44), ed una sua soluzione
= (
1
, . . . ,
N+1
) che sia analitica per [y[ < , per qualche > 0; dalla
proposizione 1.5.2 dedurremo allora che la serie (1.39) converge per [y[ <
e denisce una soluzione analitica w = (w
1
, . . . , w
N+1
) del sistema (1.38),
cosicche la dimostrazione del teorema di Cauchy-Kovalevskaya sarà conclusa.
Scegliamo le funzioni A
i
rh
e A
i
come segue:
A
i
rh
(y
, z) = A
i
(y
, z) =
C

n1
p=1
y
p
N+1
j=1
z
j
, (1.45)
ove C è una costante positiva. Come si vede, si tratta di ununica funzione
indipendente dagli indici i, r, h e analitica per [y
[ + [z[ < . Il suo sviluppo

in serie si calcola facilmente per mezzo del seguente
Lemma 1.5.3 Sia g(x) =
r
r
P
n
p=1
xp
, [x[ <
r
n
. Allora
g(x) =
N
n
[[!
r
||
!
x
per [x[ <

r
n
.
Dimostrazione Essendo
n
p=1
[x
p
[ [x[
n, risulta
g(x) =
1
1
1
r
n
p=1
x
p
=
k=0
_
1
r
n
p=1
x
p
_
k
per [x[ <
r
n
.
Daltronde è noto, e si verica agevolmente per induzione, che
_
n
p=1
x
p
_
k
=
N
n
, ||=k
[[!
!
x
k N, x R
n
, (1.46)
26
da cui
g(x) =
k=0
1
r
k
N
n
, ||=k
[[!
!
x
N
n
[[!
r
||
!
x
per [x[ <

r
n
.
Da questo lemma segue subito che per [y
[ +[z[ <

n
si ha
A
i
rh
(y
, z) = A
i
(y
, z) =
N
n1
, N
N+1
C
([[ +[[)!
||+||
!!
(y
,
e, come si vede, i coecienti di questa serie di potenze sono non negativi. La
costante C va scelta sucientemente grande da garantire che sia
[a
irh
[ a
irh
, [a
i
[ a
i
N
n1
, N
N+1
.
Ci` o è sempre possibile: infatti, ssato ]0, [, basta scegliere
C = sup
N
n1
,N
N+1
([a
irh
[
||+||
+[a
i
[
||+||
) <
(il che è lecito, visto che le serie
,
[a
irh
[
||+||
e
,
[a
i
[
||+||
conver-
gono) per ottenere
[a
irh
[ +[a
i
[
C
r
||+||
C
([[ +[[)!
r
||+||
!!
= a
irh
= a
i
.
Il sistema (1.42) con i coecienti (1.45) diventa
_
_
_
D
n
i
=
C
P
n1
p=1
yp
P
N+1
j=1

j
_
N+1
r=1
n1
h=1
D
h
r
+ 1
_
,
i
[
= 0, i = 1, . . . , N + 1.
(1.47)
Questo sistema, che è in eetti una sola equazione ripetuta N + 1 volte, ha
una soluzione esplicita
i
= (indipendente da i), data da
(y) =
1
n(N + 1)
_
_

n1
p=1
y
p
_
_

n1
p=1
y
p
_
2
2Cn(N + 1)y
n
_
_
,
denita, nonche analitica, per [y[ < , con < sucientemente piccolo.
Per vericare che essa è soluzione, conviene porre
x =
n1
p=1
y
p
, y = y
n
, g =
_
( x)
2
2Cn(N + 1)y.
27
Allora possiamo scrivere
(x, y) =
1
n(N + 1)
( x g),
e lequazione che questa funzione deve risolvere è
y
=
C
x (N + 1)
_
(N + 1)(n 1)
x
+ 1
_
.
Risulta in eetti
y
=
1
n(N + 1)
g
y
=
C
g
,
x
=
1
n(N + 1)

1
n(N + 1)
g
x
=
1
n(N + 1)
_
1 +
x
g
_
,
da cui, come si voleva,
C
x (N + 1)
_
(N + 1)(n 1)
x
+ 1
_
=
=
C
( x)(1
1
n
) +
g
n
_
1
n
+
x
g
_
1
1
n
__
=
C
g
=

y
.
`
E chiaro inoltre che [
= 0 e, in virt` u di tutta la costruzione precedente,

i coecienti della serie di potenze di cui è somma vericano le relazioni
[c
i
per ogni N
n
. Ciò completa la dimostrazione del teorema di
Cauchy-Kovalevskaya.
Osservazione 1.5.4 Il teorema di Cauchy-Kovalevskaya vale pi` u in generale
per equazioni totalmente non lineari della forma
_
_
_
F(x, u(x), Du(x), . . . , D
m
u(x)) = 0
u[
S
=
0
,
u
S
=
1
, . . . ,

m1
u
m1
S
=
m1
,
con dati F, s,
0
, . . . ,
m1
analitici, sotto la condizione che essi non siano
caratteristici, ossia
||=m
F
q
(x, u, . . . , D
m
u)
,= 0 su S.
La dimostrazione è del tutto simile, anche se formalmente pi` u complicata.
28
Esempio 1.5.5 (Kovalevskaya) Consideriamo il problema di Cauchy
_
u
t
= u
xx
in R
2
,
u(x, 0) =
1
1+x
2
, x R.
(1.48)
Osserviamo che la retta iniziale, t = 0, è caratteristica. Assegnando solo il
dato iniziale per la u, comunque, per t = 0 sono note le derivate rispetto a x,
mentre quelle rispetto a t si ricavano dallequazione; quindi il problema do-
vrebbe avere una soluzione ben determinata (e in eetti è proprio cos`, come
vedremo nel terzo capitolo). Aermiamo però il fatto seguente: nonostante
che tutti i dati siano analitici, questo problema non ha alcuna soluzione ana-
litica.
Ragioniamo per assurdo e sia u(x, t) una soluzione analitica di (1.48). Essa
avr` a uno sviluppo in serie di centro (0, 0) della forma
u(x, t) =
m,h=0
u
m,h
t
m
x
h
;
dobbiamo ora calcolare i coecienti u
m,h
. Poiche per t = 0 si ha
h=0
u
0,h
x
h
= u(x, 0) =
1
1 +x
2
=
k=0
(1)
k
x
2k
,
si deduce intanto
u
0,h
=
_
(1)
k
se h = 2k,
0 se h = 2k + 1.
Poi, dallequazione dierenziale si ricava
u
t
=
m=1
h=0
mu
m,h
t
m1
x
h
= u
xx
=
m=0
h=2
h(h 1)u
m,h
t
m
x
h2
,
ovvero
p=0
k=0
(p + 1)u
p+1,k
t
p
x
k
=
p=0
k=0
(k + 2)(k + 1)u
p,k+2
t
p
x
k
,
29
e dunque otteniamo le relazioni
_
_
u
p+1,h
=
1
p+1
(h + 1)(h + 2)u
p,h+2
p, h N,
u
0,h
=
_
(1)
k
se h = 2k,
0 se h = 2k + 1.
h N.
(1.49)
Da qui segue subito u
p,h
= 0 se h è dispari. Se invece h è pari si ha
_
u
p+1,2k
=
1
p+1
(2k + 1)(2k + 2)u
p,2k+2
p, k N,
u
0,k
= (1)
k
k N.
(1.50)
Induttivamente si deduce allora
u
p,2k
=
1
p
(2k + 1)(2k + 2)u
p1,2k+2
=
=
1
p(p 1)
(2k + 1)(2k + 2)(2k + 3)(2k + 4)u
p2,2k+4
=
= =
1
p!
(2k + 1)(2k + 2) . . . (2k + 2p 1)(2k + 2p)u
0,2k+2p
=
=
(1)
k+p
(2k + 2p)!
p!(2k)!
p, k N.
Ma la serie
p,k=0
(1)
k+p
(2k+2p)!
p!(2k)!
t
p
x
2k
non può convergere, salvo che nel punto
(0, 0): infatti per ogni t > 0 e x ] 1, 1[ si ha
p,k=0
(2k + 2p)!
p!(2k)!
t
p
x
2k
p=0
(2p)!
p!
t
p
1
1 x
2
= +,
come agevolmente si verica utilizzando il criterio del rapporto. Si conclude
pertanto che non esiste alcuna soluzione analitica del problema (1.48).
1.6 Equazioni risolubili elementarmente
Certe equazioni alle derivate parziali sono risolubili con metodi elementari: in
questo paragrafo ne forniamo una breve rassegna per mezzo di alcuni esempi.
Andremo alla ricerca sempre e soltanto di soluzioni classiche, ossia tali che
tutte le derivate che compaiono nellequazione siano continue.
30
Esempio 1.6.1 La pi` u semplice equazione alle derivate parziali è senza
dubbio la seguente:
u
x
(x, y) = 0,
che peraltro rientra fra quelle studiate nel paragrafo 1.3. Le sue soluzioni
sono, evidentemente, tutte e sole le funzioni della forma u(x, y) = g(y), con
g funzione continua arbitraria.
Esempio 1.6.2 Consideriamo lequazione
au
x
(x, y) +bu
y
(x, y) = 0,
ove a, b sono costanti reali non entrambe nulle. Anche questa equazione fa
parte di quelle analizzate nel paragrafo 1.3. Posto = (a, b), lequazione
ci dice che
u
= 0, quindi ogni soluzione u(x, y) deve essere costante lungo

le rette che hanno la direzione di , ossia quelle di equazione bx ay = k,
con k R (che sono le linee caratteristiche associate allequazione). Con il
cambiamento di variabili
_
= bx +ay
= ax +by,
_
x =
b+a
a
2
+b
2
y =
a+b
a
2
+b
2
,
scrivendo v(, ) = u(
b+a
a
2
+b
2
,
a+b
a
2
+b
2
), si trova che v verica
v
=
u
x
a +u
y
b
a
2
+b
2
= 0.
Dallesempio 1.6.1 segue allora v(, ) = g(), con g arbitraria funzione
continua. Pertanto
u(x, y) = v(, ) = g() = g(bx +ay),
con g arbitraria funzione di classe C
1
.
Allo stesso risultato si arriva con la teoria del paragrafo 1.3: si trova infatti
che le soluzioni sono date implicitamente dalla relazione
F(bx +ay, u(x, y)) = 0,
con F di classe C
1
avente gradiente non nullo.
31
Esempio 1.6.3 Lequazione del secondo ordine
u
xy
(x, y) = 0
si risolve facilmente utilizzando lesempio 1.6.1: si ha successivamente
u
x
(x, y) = g(x), g arbitraria funzione continua,
u(x, y) =
_
x
c
g() d +h(y), h arbitraria funzione di classe C
1
,
ove c è una costante qualunque. Si conclude che
u(x, y) = k(x) +h(y),
con h, k arbitrarie funzioni di classe C
1
.
Esempio 1.6.4 Fissata g C
1
(), ove è un aperto di R
2
, consideriamo
lequazione
u
x
(x, y)g
y
(x, y) u
y
(x, y)g
x
(x, y) = 0, (x, y) . (1.51)
Sulla base del lemma 1.3.2, possiamo dire che le soluzioni sono tutte le
funzioni denite in forma implicita da
F(u(x, y), g(x, y)) = 0,
con F funzione arbitraria di classe C
1
con gradiente mai nullo.
Esempio 1.6.5 Consideriamo lequazione
u
xx
u
yy
= 0;
quando x è la variabile tempo, questa è lequazione uni-dimensionale del-
le onde, o di DAlembert. Le caratteristiche di questa equazione sono, in
accordo con la (1.26), le rette
x +y = c, x y = d, c, d R.
Con il cambiamento di variabili
_
= x +y
= x y

_
x =
+
2
y =

2
, u(x, y) = v(x +y, x y) = v(, ),
32
lequazione diventa, come è facile vericare
0 = u
xx
u
yy
= 4v
,
ossia v
= 0. Come sappiamo dallesempio 1.6.3, questa equazione ha le

soluzioni v(, ) = a()+b(), con a, b arbitrarie funzioni di classe C
1
; dunque
otteniamo che lequazione originaria ha le soluzioni
u(x, y) = a(x +y) +b(x y),
ove stavolta però a e b sono arbitrarie funzioni di classe C
2
.
In modo analogo, lequazione
u
xx
1
c
2
u
yy
= 0, (1.52)
ove c R 0, ha per soluzioni le funzioni
u(x, y) = a(x +cy) +b(x cy),
con a, b arbitrarie funzioni di classe C
2
.
Esempio 1.6.6 Lequazione di Laplace bidimensionale è la seguente:
u
xx
+u
yy
= 0.
Essa non ha caratteristiche. Formalmente, si ottiene dalla (1.52) scegliendo
c = i: otteniamo come soluzioni tutte le funzioni della forma
u(x, y) = a(x +iy) +b(x iy) (1.53)
con a e b funzioni di classe C
2
.
In eetti quello dellesempio precedente è molto di pi` u di un calcolo formale:
vale infatti la seguente
Proposizione 1.6.7 Sia u C
2
(), ove R
2
è un aperto semplicemente
connesso. Sono fatti equivalenti:
(i) u
xx
+u
yy
= 0 in ,
(ii) esiste una funzione f : C olomorfa tale che u(x, y) = Re f(x, y).
33
(iii) esiste una funzione g : C olomorfa tale che u(x, y) = Img(x, y).
Dimostrazione Anzitutto, (ii) e (iii) sono equivalenti: basta porre g = if,
ovvero f = ig. Dunque basta provare che (i) è equivalente a (ii).
Se vale (ii), ssato (x, y) = x +iy = z esiste il limite
lim
w0
f(z +w) f(z)
w
= f
(z) C.
Poniamo u = Ref, v = Imf: scegliendo w = h R, si ricava
f
(z) = lim
h0
f(x +h +iy) f(x +iy)
h
=
f
x
(z) = u
x
(x, y) +iv
x
(x, y);
scegliendo invece w = ik, k R, si trova analogamente
if
(z) = lim
k0
f(x +iy +ik) f(x +iy)
k
=
f
y
(z) = u
y
(x, y) +iv
y
(x, y).
Uguagliando parte reale e parte immaginaria deduciamo
u
x
= v
y
, u
y
= v
x
in .
Queste sono le equazioni di Cauchy-Riemann. Da esse, derivando, ricaviamo
subito
u
xx
= v
xy
= u
yy
in ,
ossia vale (i). Si noti che anche v verica la stessa equazione.
Se, viceversa, vale (i), allora la forma dierenziale lineare = u
y
dx +u
x
dy
è chiusa in : poiche è semplicemente connesso, essa è esatta in . Sia v
una primitiva di : si ha allora
v
x
= u
y
, v
y
= u
x
in ,
ossia u e v risolvono le equazioni di Cauchy-Riemann in . Posto, per ogni
z = x +iy = (x, y) ,
f(z) = u
_
z +z
2
,
z z
2i
_
+iv
_
z +z
2
,
z z
2i
_
= u(x, y) +iv(x, y),
34
proviamo che f è olomorfa: se z = x +iy si ha, con w = h +ik,
f(z +w) f(z)
w
=
=
u(x +h, y +k) u(x, y)
h +ik
+i
v(x +h, y +k) v(x, y)
h +ik
=
=
1
h +ik
_
1
0
d
dt
[u(x +th, y +tk) +iv(x +th, y +tk)]dt =
=
1
h +ik
_
1
0
[u
x
h +u
y
k +iv
x
h +iv
y
k]dt =
=
1
h +ik
_
1
0
[u
x
h +u
y
k iu
y
h +iu
x
k]dt =
=
1
h +ik
_
1
0
(u
x
iu
y
)[h +ik]dt =
=
_
1
0
[u
x
(x +th, y +tk) iu
y
(x +th, y +tk)]dt,
e per w 0, con un passaggio al limite sotto il segno di integrale, otteniamo
che f è olomorfa con f
(z) = u
x
(x, y) iu
y
(x, y): ciò prova (ii).
Ad esempio, risolvono lequazione di Laplace le funzioni
x
2
y
2
, 2xy (scegliendo in (1.53) a(s) = b(s) = s
2
/2),
x
3
3xy
2
, 3x
2
y y
3
(con a(s) = b(s) = s
3
/2),
e
x
cos y, e
x
sin y (con a(s) = b(s) = e
s
/2),
log(x
2
+y
2
) (con a(s) = b(s) = log s).
1.7 Il metodo di separazione delle variabili
Talvolta è possibile risolvere unequazione dierenziale alle derivate parzia-
li in due variabili x, y ricercando dapprima soluzioni della forma X(x)Y (y)
(cioè a variabili separate), e poi cercando soluzioni pi` u generali sotto forma
di combinazioni lineari (nite o innite) delle precedenti. Il metodo è rivol-
to alla ricerca di soluzioni che soddisno, insieme allequazione, determinate
condizioni ai limiti. Esso è alquanto generale, ma si presta ad essere meglio
descritto tramite qualche esempio.
35
Consideriamo ancora lequazione di Laplace in due dimensioni, u
xx
+u
yy
= 0,
in un aperto R
2
.
`
E naturale che una soluzione della forma u(x, y) =
X(x)Y (y) sia denita sul prodotto cartesiano di due intervalli di R: suppor-
remo quindi =]a, b[]c, d[. Inoltre, a meno di omotetie (x, y) (
xa
ba
,
yc
ba
)
ci si può ridurre al caso =]0, 1[]0, L[ (con L =
dc
ba
). Studieremo in
denitiva lequazione di Laplace bidimensionale in un rettangolo:
u
xx
+u
yy
= 0, (x, y) ]0, 1[]0, L[. (1.54)
Sostituendo in (1.54) u(x, y) = X(x)Y (y), si ottiene
X
(x)Y (y) +X(x)Y
(y) = 0,
ovvero, dividendo per XY (che ovviamente si suppone non nullo),
X
(x)
X(x)
=
Y
(y)
Y (y)
(x, y) ]0, 1[]0, L[.
Dato che il primo membro dipende solo da x e il secondo soltanto da y, si
deduce che entrambi i membri sono costanti: in altre parole, anche una
funzione a variabili separate u(x, y) = X(x)Y (y) risolva lequazione (1.54), è
necessario e suciente che esista R tale che
_
X
(x) = X(x) in ]0, 1[,

Y
(y) = Y (y) in ]0, L[.

(1.55)
Le due equazioni che compaiono in (1.55) sono equazioni ordinarie del secon-
do ordine: le soluzioni sono
X(x) =
_
_
c
1
cos
x +c
2
sin
x se > 0
c
1
+c
2
x se = 0
c
1
cosh
x +c
2
sinh
x se < 0,
(1.56)
Y (y) =
_
_
c
3
cosh
y +c
4
sinh
y se > 0
c
3
+c
4
y se = 0
c
3
cos
y +c
4
sin
y se < 0.
(1.57)
Dunque il loro prodotto u(x, y) dipenderà da quattro costanti arbitrarie: per
selezionarne una, occorreranno perciò quattro condizioni ai limiti. Per le-
quazione di Laplace, tipicamente, si prescrive il valore della soluzione sulla
36
frontiera dellaperto dove lequazione stessa è soddisfatta: questo è il proble-
ma di Dirichlet. Nel nostro caso prescriveremo il valore di u sui quattro lati
del rettangolo ]0, 1[]0, L[:
_
_
u(x, 0) = f
1
(x), x [0, 1],
u(1, y) = f
2
(y), y [0, L],
u(x, L) = f
3
(x), x [0, 1],
u(0, y) = f
4
(y), y [0, L],
(1.58)
ove f
1
, f
2
, f
3
e f
4
sono funzioni di classe C
1
assegnate. Naturalmente, se
vogliamo che la soluzione sia continua sul rettangolo chiuso, dovremo imporre
condizioni di compatibilità fra i dati negli estremi:
f
1
(1) = f
2
(0), f
2
(L) = f
3
(1), f
3
(0) = f
4
(L), f
4
(0) = f
1
(0). (1.59)
Sfruttando la linearità del problema, possiamo costruire la soluzione come
somma delle soluzioni di problemi in cui tre su quattro dei dati alla frontiera
siano nulli: in altre parole, si studiano quattro problemi di Dirichlet in cui i
dati sono
_
_
_
_
f
1
0
0
0
_
_
_
_
,
_
_
_
_
0
f
2
0
0
_
_
_
_
,
_
_
_
_
0
0
f
3
0
_
_
_
_
,
_
_
_
_
0
0
0
f
4
_
_
_
_
,
rimandando ad un secondo momento la questione di come imporre la (1.59).
Consideriamo il primo problema: cerchiamo una funzione u
1
(x, y) tale che
_
_
(u
1
)
xx
+ (u
1
)
yy
= 0 in ]0, 1[]0, L[
u
1
(x, 0) = f
1
(x), u
1
(x, L) = 0, x [0, 1],
u
1
(0, y) = 0, u
1
(1, y) = 0, y [0, L],
(1.60)
Cominciamo a determinare la funzione X(x): vogliamo che sia
X(1)Y (y) = u(1, y) = 0, X(0)Y (y) = u(0, y) = 0,
e avendo supposto Y ,= 0 deduciamo per la X le condizioni ai limiti
X(0) = X(1) = 0.
37
Si vede subito che se la (1.56) deve fornire una soluzione non nulla che verichi
queste condizioni, il numero deve essere positivo. In tal caso, però, si ha
X(0) = 0 = c
1
= 0, X(1) = 0 = c
2
sin
= 0,
e poiche non vogliamo che X sia nulla, ciò implica = k
2
2
, k N
+
. Per
questi valori di si hanno le soluzioni non banali
X
k
(x) = sin kx, k N
+
.
Avendo ormai stabilito che i possibili valori di sono i numeri k
2
2
, andiamo
a determinare la funzione Y = Y
k
corrispondente al valore
k
= k
2
2
: essendo
k
> 0, da (1.57) segue che Y
k
sarà del tipo
Y
k
(y) = c
3
cosh ky +c
4
sinh ky,
e la condizione u(x, L) = X(x)Y (L) = 0 implica che sia Y (L) = 0. Impo-
nendo questo vincolo, troviamo che deve aversi
0 = c
3
cosh kL +c
4
sinh kL;
si può allora prendere (e la scelta è unica a meno di una costante moltiplica-
tiva)
c
3
= sinh kL, c
4
= cosh kL,
e dunque
Y
k
(y) = c
k
[cosh ky sinh kL sinh ky cosh kL] = c
k
sinh k(L y)
ove c
k
è una costante arbitraria. Abbiamo cos` costruito la funzione
u
1k
(x, y) = X
k
(x)Y
k
(y) = c
k
sin kx sinh k(L y),
la quale verica lequazione e tre delle quattro condizioni ai limiti: in gene-
rale, infatti, non sarà vero che u
1k
(x, 0) = f
1
(x).
Consideriamo però la sovrapposizione delle u
1k
, cioè la serie
u
1
(x, y) =
k=1
c
k
sin kx sinh k(L y), (1.61)
la quale sarà convergente per ogni punto (x, y) del rettangolo, purche i numeri
c
k
tendano a 0 abbastanza rapidamente.
`
E chiaro che u
1
verica ancora le
38
tre condizioni ai limiti con dato nullo. La quarta condizione è anchessa
vericata se e solo se risulta
k=1
c
k
sin kx sinh kL = f
1
(x) x [0, 1].
Questo è possibile solo se il primo membro è la serie di Fourier di f
1
relativa
al sistema ortonormale
1
2
, cos kx, sin kx relativo allintervallo [1, 1];
trattandosi di una serie di soli seni, ciò implica che la sua somma è una
funzione dispari e dunque f
1
, a priori denita su [0, 1], va prolungata per
disparità su [1, 1]. Dunque in (1.61) deve aversi
c
k
=
b
k
sinh kL
, ove b
k
= 2
_
1
0
f
1
() sin k d k N
+
.
Poiche b
k
0 per k , è facile vericare che la serie (1.61), ossia
u
1
(x, y) =
k=1
b
k
sin kx
sinh k(L y)
sinh kL
, b
k
= 2
_
1
0
f
1
() sin k d, (1.62)
converge in ogni punto interno al rettangolo, insieme con tutte le sue derivate.
Inoltre nei punti (x, 0) essa ha per somma il prolungamento dispari di f
1
,
laddove questo è continuo: ciò accade quando x ]0, 1[, ma non negli estremi,
a meno che non si abbia f
1
(0) = f
1
(1) = 0.
Cos` la soluzione u
1
denita in (1.62) sarà di classe C
2
, anzi C
, allinterno
del rettangolo, e prenderà i dati al bordo ovunque tranne che nei vertici (0, 0)
e (0, 1) dove il suo valore sarà 0.
Procedendo in modo del tutto analogo si trovano le soluzioni degli altri tre
problemi di Dirichlet:
u
2
(x, y) =
k=1
d
k
sinh
k
L
x
sinh
k
L
sin
k
L
y, d
k
=
2
L
_
L
0
f
2
() sin
k
L
d, (1.63)
u
3
(x, y) =
k=1
a
k
sin kx
sinh ky
sinh kL
, a
k
= 2
_
1
0
f
3
() sin k d, (1.64)
u
4
(x, y) =
k=1
f
k
sinh
k
L
(1 x)
sinh
k
L
sin
k
L
y, f
k
=
2
L
_
L
0
f
4
() sin
k
L
d. (1.65)
39
Anche le funzioni u
2
, u
3
e u
4
sono di classe C
nellinterno del rettango-

lo, e si attaccano ai dati al bordo in tutti i punti tranne che nei vertici del
rettangolo, malgrado la presenza delle condizioni di compatibilità (1.59). In
denitiva, la somma u = u
1
+ u
2
+ u
3
+ u
4
è di classe C
nellinterno del
rettangolo, ove risolve lequazione di Laplace, ed è continua sullintero ret-
tangolo chiuso ad eccezione dei vertici, prendendo i dati al bordo lungo i lati
del rettangolo e valendo 0 nei vertici. Essa dunque coincide con i dati nei
quattro vertici solo se si fa lipotesi che tutte le quantità presenti in (1.59)
siano nulle.
Osserviamo però che un piccolo ranamento del metodo permette di costrui-
re una soluzione regolare del problema di Dirichlet (1.54)-(1.58) sotto la sola
ipotesi di compatibilità (1.59). Consideriamo la funzione
z(x, y) = p +qx +ry +sxy, (1.66)
la quale risolve lequazione di Laplace su tutto R
2
per ogni scelta dei para-
metri p, q, r, s. Scegliamo tali parametri in modo che sia
z(0, 0) = d, z(1, 0) = a, z(0, L) = c, z(1, L) = b, (1.67)
dove a, b, c, d sono i valori presenti in (1.59):
a = f
1
(1) = f
2
(0), b = f
2
(L) = f
3
(1),
c = f
3
(0) = f
4
(L), d = f
4
(0) = f
1
(0).
Si ricava subito
p = d, q = a d, r =
c d
L
, s =
b a c +d
L
.
La funzione z, oltre allequazione dierenziale (1.54) e alle condizioni (1.67),
verica
z(x, 0) = p +qx, z(x, L) = p +qx +rL +sLx x [0, 1],
z(0, y) = p +ry, z(1, y) = p +q +ry +sy y [0, L].
(1.68)
Sia adesso v(x, y) la funzione che risolve il problema di Dirichlet per le-
quazione di Laplace sul rettangolo [0, 1] [0, L] con dati f
1
(x) p qx,
f
2
(y) pq ry sy, f
3
(x) pqxrLsLx, f
4
(y) pry, ottenuta col
metodo di separazione delle variabili visto in precedenza: si noti che questi
40
dati, nei quattro vertici, forniscono il valore 0. La funzione v, come si è visto,
è la somma di quattro funzioni v
1
, v
2
, v
3
, v
4
, ciascuna delle quali è nulla su
tre dei quattro lati e, in particolare, è nulla sui quattro vertici. Si conclude
che la funzione
u(x, y) = v(x, y) +z(x, y),
ove z è data da (1.66), risolve lequazione di Laplace sul rettangolo [0, 1]
[0, L], prende sul bordo i dati originari f
1
, f
2
, f
3
, f
4
, e sui vertici assume gli
stessi valori di z forniti dalla (1.67), cioè i numeri che compaiono nella (1.59).
Quindi u risolve lequazione di Laplace nellinterno del rettangolo ed è con-
tinua sulla frontiera, ove coincide esattamente con i dati.
La separazione delle variabili si può applicare anche ad altri problemi, come
mostrano gli esempi che seguono.
Esempi 1.7.1 (1) Consideriamo il problema di Cauchy-Dirichlet per lequa-
zione del calore uni-dimensionale:
_
_
u
t
u
xx
= 0 in ]0, L[]0, [
u(0, t) = u(L, t) = 0 in [0, [
u(x, 0) = f(x) in [0, L].
Cercando una soluzione della forma u(x, t) = X(x)T(t) si trova una equazio-
ne lineare del primo ordine per T(t) e del secondo ordine per X(x), con dati
X(0) = X(L) = 0. Procedendo nel modo consueto, si trova la soluzione
u(x, t) =
n=1
b
n
e
n
2
2
L
2
t
sin
n
L
x, b
n
=
2
L
_
L
0
f(t) sin
n
L
t dt.
La serie converge con tutte le sue derivate in R]0, [, grazie alla presenza
dellesponenziale. Per t = 0 la u si attacca al dato f se il prolungamento
dispari di f è di classe C
1
.
(2) Consideriamo ora il problema di Cauchy-Dirichlet per lequazione della
corda vibrante (equazione delle onde uni-dimensionale):
_
_
u
tt
u
xx
= 0 in ]0, L[]0, [
u(0, t) = u(L, t) = 0 in [0, [
u(x, 0) = u
0
(x), u
t
(x, 0) = u
1
(x) in [0, L].
41
Con i soliti metodi, la soluzione u(x, t) = X(x)T(t) si trova della forma
u(x, t) =
n=1
_
b
n
cos
n
L
t +
L
n
n
sin
n
L
t
_
sin
n
L
x,
ove
b
n
=
2
L
_
L
0
u
0
() sin
n
L
d,
n
=
2
L
_
L
0
u
1
() sin
n
L
d.
Questa serie converge in tutti i punti della semistriscia [0, L] [0, [, purche
risulti ad esempio
n=1
(n[b
n
[ +[
n
[) < ,
il che è certamente vero se si suppone che i prolungamenti dispari di u
0
e u
1
siano rispettivamente di classe C
2
e C
1
.
(3) Si può usare il metodo di separazione della variabili anche in pi` u di
due dimensioni. Ad esempio, consideriamo lequazione di Laplace in tre
dimensioni,
u
xx
+u
yy
+u
zz
= 0
nel cubo [0, ]
3
, con le condizioni ai limiti
_
u = 0 per x = 0, x = , y = 0, y = , z = ,
u(x, y, 0) = g(x, y).
Cercando una soluzione u(x, y, z) = X(x)Y (y)Z(z), si arriva alla relazione
X
Y Z +XY
Z +XY Z
= 0,
da cui
X
X
+
Y
Y
=
Z
Z
;
ciò implica
X
X
+
Y
Y
= c
1
=
Z
Z
,
e quindi
X
X
= c
1
Y
= c
2
.
42
In denitiva
X
X
= c
2
,
Y
Y
= c
1
c
2
,
Z
Z
= c
1
.
Le condizioni ai limiti forniscono
X(0) = X(), Y (0) = Y (), Z() = 0.
Risolvendo lequazione per X, si trova c
2
= n
2
, n N
+
, e X
n
(x) = sin nx.
Risolvendo per la Y si ottiene poi c
1
c
2
= m
2
, m N
+
, e y
m
(y) = sin my.
Inne per la Z si ricava c
1
= m
2
n
2
e Z
mn
(z) = c
mn
sinh
m
2
+n
2
(z).
In denitiva, sovrapponendo le soluzioni trovate, la soluzione u ha la forma
u(x, y, z) =
m,n=1
c
mn
sinh
m
2
+n
2
( z) sin nx sin my.
Imponendo inne che u(x, y, 0) coincida con g(x, y) si deduce che
c
mn
=
g
mn
sinh
m
2
+n
2
, g
mn
=
4
2
_

0
_

0
g(, ) sin n sin m dd.
Si può vericare che se i g
mn
sono limitati, il che è vero se si suppone
_
0
_
0
[g(x, y)[dxdy < , allora la serie che denisce u converge uniforme-
mente con tutte le sue derivate in [0, ] [0, ] [, ] per ogni ]0, [.
Quindi, u è di classe C
nel cubo aperto e risolve ivi lequazione; inoltre u

è nulla su tutte le facce del cubo eccetto z = 0. Se, in pi` u, il prolungamento
dispari di g(x, y) rispetto a x e a y è di classe C
1
, allora la serie della u
converge uniformemente su tutto il cubo e si attacca a tutti i dati al bordo.
Per concludere, osserviamo che molti altri problemi ai limiti sono trattabi-
li col metodo di separazione delle variabili, come ad esempio quelli relativi
alle equazioni di Sturm-Liouville: rimandiamo a [10] per approfondimenti.
Naturalmente, il metodo non è onnipotente: per applicarlo, occorrono le tre
condizioni che seguono.
1. Loperatore dierenziale L[u] deve essere separabile, ossia tale che esista
una funzione (x, y) che verichi
L[X(x)Y (y)]
(x, y)X(x)Y (y)
= a(x) +b(y);
si noti che L può comunque avere coecienti non costanti.
43
2. Le condizioni ai limiti devono essere assegnate su un rettangolo.
3. Le condizioni su un lato x = c non devono contenere derivate rispetto a
y, ne coecienti che dipendano da y; analoghe condizioni devono valere
per i lati y = c.
1.8 Classicazione delle equazioni del secon-
do ordine
Come sappiamo, unequazione del secondo ordine lineare, omogenea, a coef-
cienti costanti ha la forma seguente:
L[u] =
n
i,j=1
a
ij
D
i
D
j
u +
n
i=1
b
i
D
i
u +cu = 0, (1.69)
ove la matrice A = a
ij
è reale e simmetrica. In particolare, A ha n autova-
lori reali (non necessariamente tutti distinti), ed è diagonalizzabile mediante
una matrice ortogonale U:
U
1
AU = U
t
AU = D =
_
_
_
1
0
.
.
.
.
.
.
.
.
.
0
n
_
_
_
.
Con il cambiamento di variabili = Ux, posto U = q
ij
e v() = v(Ux) =
u(x), è facile vericare che
D
i
u(x) =
n
k=1
D
k
v(Ux)q
ki
, D
j
D
i
u(x) =
n
h,k=1
D
h
D
k
v(Ux)q
hj
q
ki
,
cosicche
0 =
n
i,j=1
a
ij
D
i
D
j
u +
n
i=1
b
i
D
i
u +cu =
=
n
h,k=1
_
n
i,j=1
q
ki
a
ij
q
hj
_
D
h
D
k
v() +
n
k=1
_
n
i=1
q
ki
b
i
_
D
k
v() +cv() =
=
n
k=1
k
D
2
k
v() +
n
k=1
B
k
D
k
v() +cv().
44
Inoltre, se tutti gli autovalori
k
sono non nulli, è possibile rendere nulli i
coecienti B
k
=
n
i=1
q
ki
b
i
con lulteriore sostituzione
w() = v()e
P
n
k=1
B
k
2
k
k
:
si ottiene infatti per w, come è facile vericare, lequazione nella sua forma
canonica
n
k=1
k
D
2
k
w() +w() = 0, (1.70)
ove
= c
1
4
n
k=1
B
2
k
k
.
Se vi sono m autovalori non nulli, 0 < m < n, ad esempio
m+1
= =
n
= 0, con la sostituzione
w() = v()e
P
m
k=1
B
k
2
k
k
si trova analogamente la forma canonica
m
k=1
k
D
2
k
w() +
n
k=m+1
B
k
D
k
w() +w() = 0, (1.71)
con
= c
1
4
m
k=1
B
2
k
k
.
La classicazione delle equazioni si fa sulla base del segno degli autovalori, e
naturalmente è invariante rispetto a trasformazioni ortogonali delle variabili
indipendenti. Cominciamo con il caso n = 2, dove si chiarisce lorigine della
terminologia.
Denizione 1.8.1 Sia L loperatore denito in (1.69). Diciamo che esso è
ellittico se i due autovalori della matrice A hanno lo stesso segno; è iperbolico
se i due autovalori hanno segno opposto; è parabolico se uno (e uno solo)
dei due autovalori è nullo. Lequazione L[u] = 0 è detta ellittica, iperbolica,
parabolica se tale è loperatore L.
45
Lorigine dei tre nomi è legata alla forma delle curve di livello del polinomio
caratteristico associato alloperatore L, che è
P(x, y) = a
11
x
2
+ 2a
12
xy +a
22
y
2
+b
1
x +b
2
y +c
e, nel caso di n variabili,
P() =
n
i,j=1
a
ij
j
+
n
i=1
b
i
i
+c.
Quando n = 2, linsieme (x, y) R
2
: P(x, y) = t, se non vuoto, è una
ellisse se gli autovalori sono non nulli e concordi, è uniperbole se gli autovalori
sono non nulli e discordi, è una parabola se uno dei due autovalori è nullo.
Quando n > 2, la casistica si complica. Per n = 3 si hanno i seguenti casi:
tre autovalori concordi: loperatore è ellittico e le curve di livello del
polinomio caratteristico sono ellissoidi;
due autovalori concordi, uno discorde: loperatore è iperbolico e le curve
di livello sono iperboloidi a due falde;
due autovalori concordi e uno nullo: loperatore è parabolico e le curve
di livello sono paraboloidi;
due autovalori discordi e uno nullo: loperatore è iperbolico degenere
e le curve di livello sono iperboloidi a una falda;
due autovalori nulli e uno non nullo: loperatore è parabolico degenere
e le curve di livello sono cilindri obliqui a sezione parabolica.
Nel caso generale, i casi sono ancora di pi` u e non tutti sono studiati:
n autovalori concordi: loperatore è ellittico;
n 1 autovalori concordi, uno discorde: loperatore è iperbolico;
k autovalori positivi e n k negativi, con 2 k n 2: loperatore è
ultra-iperbolico: questo è un caso non studiato, poiche non vi è nessun
problema sico che conduca ad operatori di questo tipo;
n 1 autovalori concordi, uno nullo: loperatore è parabolico;
46
n 2 autovalori concordi, due nulli: loperatore è ultra-parabolico: se
ne trovano alcuni esempi in problemi di tipo biologico (dinamica delle
popolazioni);
k autovalori nulli, n k non tutti concordi: loperatore è iperbolico
degenere, ed è poco studiato per lassenza di esempi applicativi.
Se loperatore (1.69) è a coecienti variabili (continui), la sua natura (ellitti-
cit` a, iperbolicità, parabolicità) sarà un fatto puntuale o locale: ad esempio si
dice che Lè ellittico in se per ogni x la matrice A
ij
(x) ha n autovalori
concordi, ossia la forma quadratica associata alla sua parte principale,
(x, ) =
n
i,j=1
a
ij
(x)
i
j
è denita positiva per ogni x , ovvero denita negativa per ogni x .
Ci` o equivale alla condizione
i,j=1
a
ij
(x)
i
(x)[[
2
R
n
, x ,
con (x) > 0 in .
Ovviamente, esistono anche operatori che cambiano tipo in un ssato aperto:
ad esempio, loperatore
L[u] = u
xx
+xu
yy
+u
y
è ellittico per x > 0, parabolico per x = 0, iperbolico per x < 0.
Gli operatori che studieremo in dettaglio nel seguito sono i seguenti:
loperatore di Laplace n-dimensionale u =
n
i=1
D
2
i
u,
loperatore del calore (n + 1)-dimensionale u
t
u,
loperatore di DAlembert (n + 1)-dimensionale u = u
tt
u.
47
Capitolo 2
Lequazione di Laplace
2.1 Motivazioni siche
Loperatore di Laplace è senza dubbio il pi` u importante e il pi` u studiato fra
tutti gli operatori dierenziali alle derivate parziali, essendo il prototipo di
quelli di tipo ellittico ed entrando nella denizione dei pi` u semplici fra quelli
parabolici e iperbolici. Le soluzioni dellequazione di Laplace hanno anche
un nome speciale:
Denizione 2.1.1 Le funzioni u di classe C
2
in un aperto di R
n
, che
risolvono lequazione u = 0 in , si dicono armoniche in .
Invece lequazione non omogenea u = f prende il nome di equazione di
Poisson.
Loperatore di Laplace interviene in numerosi fenomeni sici: ci limitiamo
ad illustrarne alcuni.
Esempio 2.1.2 Nella teoria della gravitazione, la forza con cui una massa
m, concentrata in un punto x
0
R
3
, agisce su una massa unitaria concentrata
in un altro punto x è data, secondo la legge di Newton, da
F(x) = m
x
0
x
[x
0
x[
3
, x R
3
x
0
.
Il campo di forze F(x) è conservativo, ossia esiste un potenziale gravitazionale
U(x) tale che
F(x) = U(x) x R
3
x
0
:
48
precisamente, se vogliamo che allinnito il potenziale sia nullo, si ha U(x) =
m
|xx
0
|
.
`
E facile vericare che il potenziale U è una funzione armonica nella-
perto R
3
x
0
.
Esempio 2.1.3 Una carica elettrica q, posta in un punto x
0
R
3
, agisce su
una carica unitaria situata in un altro punto x con una forza elettrostatica
F(x) =
q
4
0
x x
0
[x x
0
[
3
,
che è repulsiva se le cariche sono dello stesso segno, attrattiva altrimenti. La
costante
0
è detta costante dielettrica (nel vuoto). Questo campo di forze
ha la stessa forma del campo gravitazionale: in particolare è conservativo
e ammette il potenziale elettrostatico U(x) =
q
4
0
1
|xx
0
|
, il quale è una
funzione armonica in R
3
x
0
.
Esempio 2.1.4 Sia T un aperto semplicemente connesso in R
3
, delimita-
to da una supercie regolare , in cui transita una corrente di uido in-
compressibile (dunque di densità (x, y, z) indipendente dal tempo), con
velocità v(x, y, z) costante nel tempo. Supponiamo anche assenza di vor-
tici: ciò signica che il campo vettoriale v è tale che lintegrale curvilineo
_
(v
1
dx +v
2
dy +v
3
dz) è nullo per ogni curva chiusa T. Dal teorema di
Stokes segue che lintegrale
_
S
rot v nd è nullo per ogni supercie regolare
S T; per larbitrarietà di S si ricava rot v = 0 in T. Dunque la forma
dierenziale v
1
dx + v
2
dy + v
3
dz è chiusa e quindi, per lipotesi fatta su T,
esatta. Pertanto esiste un potenziale di velocità :
v(x, y, z) = (x, y, z) (x, y, z) T.
A causa dellincompressibilità, la quantità di uido che entra in una qualun-
que palla B T è pari a quella che ne esce: dunque il usso di v attraverso
B è nullo, da cui, per il teorema della divergenza e per larbitrarietà di B,
segue div v = 0 in T; quindi
= div = 0 in T,
cioè il potenziale della velocità è una funzione armonica.
Esempio 2.1.5 Sia u(x, y, z, t) la temperatura in un punto P = (x, y, z)
dello spazio al tempo t. Se d è un elemento di supercie centrato in P e
49
con normale , la quantità di calore Q che passa attraverso d nellunità di
tempo è, per la legge di Fourier,
Q = k
u
d,
ove k(x, y, z) è il coeciente di diusione termica. La legge di conservazione
del calore in un corpo di volume V delimitato da una supercie regolare S è
espressa dalluguaglianza
_
V
c[u(x, y, z, t)]
t
2
t
1
dxdydz =
_
t
2
t
1
_
S
k
u
ddt +
_
t
2
t
1
_
V
F(x, y, z, t) dxdydzdt.
Il primo membro è la variazione della quantità di calore in V nel generico
intervallo di tempo [t
1
, t
2
] [0, [, la quale è misurata dalla variazione di
temperatura del corpo, moltiplicata per la sua densità (x, y, z) e per la sua
capacità termica c; a secondo membro gurano il usso di calore attraverso
S nello stesso intervallo, pi` u il contributo nello stesso tempo di sorgenti o
pozzi di calore interni a V . Applicando il teorema della divergenza possiamo
scrivere
_
V
c[u(, t)]
t
2
t
1
dxdydz =
_
t
2
t
1
_
V
(div(ku) +F) dxdydzdt.
Sostituendo al posto di V una palla di centro (x, y, z) V e raggio r,
dividendo per il volume di B e passando al limite per r 0
+
si ottiene
c(x, y, z)[u(x, y, z, t)]
t
2
t
1
=
_
t
2
t
1
(div(k(x, y, z)u(x, y, z, t)) +F(x, y, z, t)) dt;
dividendo ancora per t
2
t
1
e passando al limite per t
2
t
1
si deduce inne,
scrivendo t in luogo di t
1
, lequazione della conduzione termica:
c(x, y, z)
u
t
(x, y, z, t) = div(k(x, y, z)u(x, y, z, t)) +F(x, y, z, t)
in V [0, [. Se poi supponiamo che il corpo sia omogeneo ( costante)
e isotropo (k costante), e non contenga sorgenti ne pozzi interni (F = 0),
allora lequazione diventa
u
t
= u in V [0, [, (2.1)
50
ove =
k
c
è il coeciente di conduzione termica. Se, inne, il corpo è in
equilibrio termico, allora
u
t
= 0 e la temperatura u è una funzione armonica
in V .
La ragione per cui loperatore di Laplace compare in relazione a fenomeni
sici di natura cos` diversa è legato al fatto che esso è, a meno di un fattore
costante, lunico operatore dierenziale lineare omogeneo del secondo ordine
che sia invariante rispetto alle rototraslazioni del sistema di coordinate.
`
E
dunque naturale che il Laplaciano intervenga in fenomeni in cui tale inva-
rianza deve sicamente sussistere.
Come sono fatte le funzioni armoniche? In una dimensione (n = 1) lequa-
zione di Laplace diventa semplicemente u
= 0, e quindi ha per soluzioni

tutte e sole le funzioni ani u(x) = ax + b. Se n = 2, come sappiamo dalla
proposizione 1.6.7, sono armoniche in un aperto R
2
tutte le funzioni che
sono parte reale o immaginaria di funzioni olomorfe in .
In dimensione qualunque, unimportante famiglia di funzioni armoniche è
quella delle armoniche radiali, ossia delle soluzioni dellequazione di Lapla-
ce che dipendono da [x[ (oppure da [x x[, essendo x un punto ssato di
R
n
). Per determinarle, poniamo r = [x x[; se u(x) = v([x x[) = v(r) è
armonica, risulta:
D
i
u(x) = v
(r)
x
i
x
i
r
, D
2
i
u(x) = v
(r)
(x
i
x
i
)
2
r
2
+
v
(r)
r
v
(r)
(x
i
x
i
)
2
r
3
,
da cui
0 = u(x) = v
(r) +
v
(r)
r
(n 1).
Risolviamo questa equazione ordinaria: si ha
v
(r)
v
(r)
=
n 1
r
= log v
(r) = (n1) log r+c = v
(r) =
K
r
n1
,
e dunque
v(r) =
_
_
_
c
r
n2
+d se n > 2
c log r +d se n = 2.
Queste sono tutte e sole le funzioni armoniche che hanno simmetria sferi-
ca. In particolare il potenziale newtoniano e il potenziale elettrostatico sono
funzioni armoniche in R
3
x.
51
2.2 Il problema di Cauchy
Poiche lequazione di Laplace non ha caratteristiche, se S è una supercie
(n1)-dimensionale analitica, e u
0
, u
1
sono dati analitici deniti su S, esiste
unica la soluzione analitica del problema di Cauchy
_
_
u = 0 in un intorno di S
u[
S
= u
0
,
u
S
= u
1
.
Però in generale non vi è dipendenza continua dai dati, come mostra il
seguente
Esempio 2.2.1 Sia n = 2 e poniamo S = (x, y) : y = 0. Il problema di
Cauchy
_
_
_
u = 0 in R R
+
u(x, 0) = cos
x
:= u
0
(x),
u
y
(x, 0) = 0 := u
1
(x)
ha la soluzione
u(x, y) = cos
x
cosh
y
,
che è lunica analitica. Tuttavia, si ha
lim
0
+
(|u
0
|
+|u
1
|
) = 0
mentre
lim
0
+
|u(, y)|
lim
0
+
[u(0, y)[ = lim
0
+
cosh
y
= + y > 0,
cosicche non cè dipendenza continua dai dati nella norma uniforme.
In eetti, lequazione di Laplace descrive fenomeni stazionari, in cui non cè
una variabile privilegiata che funga da tempo, cosa che accade invece, in
maniera naturale, nei problemi di Cauchy. Saranno invece ben posti, sotto
opportune condizioni, altri tipi di problemi ai limiti, quali il problema di
Dirichlet
_
u = 0 in
u = su ,
52
nel quale si prescrivono i valori che la funzione armonica deve assumere sulla
frontiera di un aperto limitato , oppure il problema di Neumann
_
_
_
u = 0 in
u
= su ,
ove invece si prescrivono i valori della derivata di u rispetto alla direzione
normale a . Dimostreremo risultati di unicità, esistenza e dipendenza
continua dai dati per il problema di Dirichlet e, parzialmente, anche per il
problema di Neumann.
2.3 Principio del massimo
Sia R
n
un aperto limitato con frontiera di classe C
1
a tratti, in modo
che valgano le formule di Green: in particolare, se u, v C
2
() C
1
(), si
ha allora
_
(uv vu)dx =
_
_
u
v
v
u
_
d, (2.2)
ove, al solito, (x) è il versore normale esterno a nel punto x .
Un primo, facile risultato riguarda lunicità della soluzione del problema di
Dirichlet per lequazione di Poisson:
Proposizione 2.3.1 Sia R
n
un aperto limitato con frontiera di classe
C
1
a tratti; sia u C
2
() C
1
() soluzione del problema
_
u = f in
u = su .
(2.3)
Se v C
2
() C
1
() è unaltra soluzione, allora v u in .
Dimostrazione Posto w = uv, la funzione w è armonica in e nulla sulla
frontiera. Integrando per parti ricaviamo
_
[Dw[
2
dx =
_
wd
_
wwdx = 0,
da cui segue che w è costante in ogni componente connessa di : ma siccome
w è nulla sulla frontiera, w è nulla in tutto .
53
Osservazione 2.3.2 Con lo stesso metodo, e altrettanto facilmente, si prova
che la soluzione del problema di Neumann per lequazione di Poisson è unica
a meno di costanti additive. Si noti però che tale soluzione può anche non
esistere aatto: infatti, ssato un aperto limitato con frontiera di classe
C
1
a tratti, anche il problema
_
_
_
u = f in
u
= su
(2.4)
abbia soluzione per due ssate funzioni f C() e C(), è necessario
che f e verichino la condizione di compatibilità
_
f dx =
_
d,
come si verica subito applicando la formula di Green (2.2) alle funzioni u e
v(x) 1.
Proposizione 2.3.3 (principio del massimo debole) Sia un aperto
limitato di R
n
; sia u C
2
() C() tale che u 0 in . Allora
max
u = max
u.
Similmente, se u C
2
() C() è tale che u 0 in , allora
min
u = min
u.
Dimostrazione Sia x
0
. Fissato > 0, la funzione v(x) = u(x) +
[x x
0
[
2
è continua in , quindi ha massimo in un punto x . Vediamo
dove sta questo punto. Se risulta x , allora deve essere v(x) = 0 e
D
2
i
v(x) 0 per i = 1, . . . , n; dunque v(x) 0. Daltronde
v(x) = u(x) + 2n > 0,
il che è assurdo. Quindi x , da cui, per ogni x e per ogni > 0,
u(x) = v(x) [x x
0
[
2
v(x) = max
v max
u + diam()
2
,
54
ossia, per larbitrarietà di ,
max
u max
u.
Ci` o prova la prima parte. La seconda segue applicando a u la parte già
dimostrata.
Osservazioni 2.3.4 (1) Dal principio del massimo segue lunicità per il
problema di Dirichlet in una forma lievemente pi` u forte: se R
n
è un
aperto limitato, se u, v C
2
()C() e se tali funzioni risolvono il problema
di Dirichlet per lequazione di Poisson con gli stessi dati f, , allora u v in
. Infatti la funzione w = u v è armonica e nulla sulla frontiera, quindi è
identicamente nulla per il principio del massimo:
max
w = max
w = 0, min
w = min
w = 0.
(2) La proposizione 2.3.3 si chiama principio del massimo debole perche
non si esclude che la funzione u assuma il suo massimo anche in punti interni
a , senza essere costante; vedremo tuttavia pi` u avanti un enunciato pi` u
forte (corollario 2.6.6) che elimina questa eventualità. Si noti che il principio
del massimo è falso quando è un aperto illimitato: ad esempio, la funzione
u(x) =
_
log [x[ se n = 2
1 [x[
2n
se n > 2
è armonica nellaperto = x R
n
: [x[ > 1 ed è nulla sul bordo di , ma
tuttavia essa è strettamente positiva in .
Proposizione 2.3.5 (maggiorazione a priori) Sia R
n
un aperto li-
mitato. Se u C
2
() C(), allora
[u(x)[ max
[u[ +
diam()
2
2n
sup
[u[ x .
Dimostrazione Se sup
[u[ = +, non cè niente da dimostrare. Altri-

menti, ssato x
0
, consideriamo le funzioni
v
(x) = max
[u[ +
diam()
2
[x x
0
[
2
2n
sup
[u[ u(x), x ,
55
e notiamo che si ha
v
(x) = sup
[u[ u(x) 0 in ,
v
(x) max
[u[ u(x) 0 su .
Per il principio del massimo debole, deve essere v
(x) 0 in , cioè la tesi.

Come immediata conseguenza della maggiorazione a priori si ottiene la di-
pendenza continua dai dati per il problema di Dirichlet su un aperto limitato
: infatti se u risolve il problema (2.3), e se
|f|
C()
+||
C()
,
allora dalla proposizione 2.3.5 segue
|u|
C()

_
1 +
diam()
2
2n
_
.
2.4 Formule di rappresentazione
Il nostro prossimo obiettivo è quello di trovare una formula di rappresenta-
zione per la soluzione del problema di Dirichlet per lequazione di Poisson
in funzione dei dati, supponendo che la soluzione esista. Una volta ottenuta
tale formula, cercheremo di dimostrare che essa in eetti risolve il problema.
Ci occorre anzitutto una denizione.
Denizione 2.4.1 La soluzione fondamentale dellequazione di Laplace è la
funzione
K() =
_
_
1
2
log
1
[[
se n = 2
1
(n 2)
n
[[
n2
se n > 2,
ove
n
è la misura (n 1)-dimensionale della frontiera della palla unitaria
di R
n
:
n
=
2
n/2
(n/2)
= H
n1
(S
n1
).
56
Osserviamo che, ovviamente, K() = K(), e che K() è armonica
in R
n
0. Fisicamente, la quantità K() (nel caso n = 3) rappresenta il
potenziale elettrostatico generato da una carica unitaria posta nellorigine.
Dalla formula di Green (2.2) segue una prima, ancora incompleta, formula
di rappresentazione:
Teorema 2.4.2 Sia un aperto limitato con frontiera di classe C
1
a tratti.
Se u C
2
(), si ha per ogni ssato x
u(x) =
_
_
K(x y)
u
(y) u(y)
K
y
(x y)
_
d(y)
_
K(xy)u(y)dy.
Si noti che la formula ha senso: il primo integrale non presenta singolarità,
in quanto x appartiene a mentre la variabile di integrazione y sta sulla
frontiera; daltra parte nel secondo integrale la funzione y K(x y),
avendo una singolarità logaritmica (per n = 2) oppure del tipo [x y[
2n
(per n > 2), è certamente sommabile su .
Dimostrazione Sia x e sia > 0 tale che la palla B(x, ) di centro x e
raggio abbia chiusura contenuta in ; il parametro è destinato a tendere
a 0. Applichiamo la formula di Green (2.2) alle funzioni u e y K(x y)
nellaperto B(x, ) :
_
\B(x,)
K(x y)u(y)dy =
=
__
+
_
B(x,)
__
K(x y)
u
(y) u(y)

K(x y)
_
d(y).
(2.5)
Analizziamo i due integrali su B(x, ): si ha
_
B(x,)
K(x y)
u
(y)d(y) =
_
_
_
1
2
log
1
_
B(x,)
u
(y)d(y) se n = 2
1
(n2)n
n2
_
B(x,)
u
(y)d(y) se n > 2,
cosicche
_
B(x,)
K(x y)
u
(y)d(y)
_
log
1
sup
B(x,)
[u[ se n = 2
n 2
sup
B(x,)
[u[ se n > 2,
57
e dunque
lim
0
+
_
B(x,)
K(x y)
u
(y)d(y) = 0.
Osserviamo adesso che il gradiente della funzione K(x y) è dato, sia per
n = 2 che per n > 2, da
x
K(x y) =
y
K(x y) =
x y
n
[x y[
n
y ,= x, (2.6)
e che inoltre per ogni y B(x, ) la normale esterna a ( B(x, )) punta
verso linterno di B(x, ), ed è quindi data da (y) =
xy
.
`
E allora facile
vericare che per ogni y B(x, ) si ha, per n 2,
y
K(x y) =
y
K(x y)
x y
=
1
n1
=
1
H
n1
(B(x, ))
. (2.7)
Se ne deduce che
lim
0
+
_
_
B(x,)
u(y)

y
K(x y)d(y)
_
=
= lim
0
+
_
1
H
n1
(B(x, ))
_
B(x,)
u(y)d(y)
_
= u(x).
Inne, osservando che, in virt` u della sommabilità di y K(x y),
lim
0
+
_
\B(x,)
K(x y)u(y)dy =
_
K(x y)u(y)dy,
da (2.5) si ottiene la tesi per 0
+
.
Sia ora h C
2
() C
1
() una funzione armonica in : allora la formula di
Green (2.2) ci dice che per ogni u C
2
() C
1
() si ha
0 =
_
_
h
u
u
h
_
d
_
hudy;
dunque, sommando questa relazione con quella fornita dal teorema 2.4.2 e
denendo G(x, y) = K(x y) +h(y), si ricava per ogni x
u(x) =
_
_
G(x, y)
u
(y) u(y)

y
G(x, y)
_
d(y)
_
G(x, y)u(y) dy.

58
Se si avesse anche G(x, y) = 0 per ogni y , potremmo scrivere
u(x) =
_
u(y)

y
G(x, y) d(y)
_
G(x, y)u(y) dy, (2.8)

e questa sarebbe una vera e propria formula di rappresentazione per leven-
tuale soluzione del problema di Dirichlet, poiche, noti i valori di u su e
di u in , sarebbe nota la u su tutto .
Siamo cos` ricondotti alla seguente
Denizione 2.4.3 Sia un aperto di R
n
. Una funzione di Green (di prima
specie) per il Laplaciano in è una funzione G(x, y) continua, denita per
x, y , x ,= y, con le seguenti proprietà:
(i) per ogni x , la funzione G(x, y)K(xy), che è armonica in x,
è prolungabile ad una funzione armonica h
x
(y) denita su tutto ;
(ii) G(x, y) = 0 per ogni y e per ogni x y.
Osservazione 2.4.4 Non è aatto detto che una funzione di Green esista:
tuttavia, se essa esiste, allora è unica, almeno quando laperto è limitato.
In tal caso, infatti, se ve ne fossero due, G(x, y) = K(x y) + h
x
(y) e
G
0
(x, y) = K(x y) + h
0x
(y), allora per ogni x la funzione G(x, y)
G
0
(x, y) = h
x
(y)h
0x
(y) sarebbe prolungabile con continuità ad una funzione
armonica in e nulla sulla frontiera: quindi, per il principio del massimo,
h
x
h
0x
sarebbe nulla in , ossia G G
0
.
La funzione di Green, se esiste, gode di varie proprietà; lenunciato che segue
ne segnala due, utili per il seguito:
Proposizione 2.4.5 Sia un aperto di R
n
tale che esista la funzione di
Green G per il Laplaciano. Allora:
(i) G(x, y) = G(y, x) per ogni x, y , x ,= y;
(ii) G(x, y) 0 per ogni x, y , x ,= y.
Dimostrazione (i) Siano x, y con x ,= y. Posto v(z) = G(x, z) e
w(z) = G(y, z), si ha v(z) = 0 per ogni z x, w(z) = 0 per ogni
59
z y, e v = w = 0 su . Applicando alle funzioni v, w la formula di
Green nellaperto [B(x, ) B(y, )], si trova
_
B(x,)
_
v
w
w
v
_
d =
_
B(y,)
_
w
v
v
w
_
d. (2.9)
Poiche w è regolare intorno al punto x, mentre v si comporta (per n > 2)
come
2n
su B(x, ), si ha
_
B(x,)
w
v d
c
n1
sup
B(x,)
[v[ = o(1) per 0
+
;
daltronde, essendo v(z) = K(x z) + h
x
(z), con h
x
armonica e quindi
regolare in , si ha anche, utilizzando (2.7),
lim
0
+
_
B(x,)
v
wd =
= lim
0
+
_
B(x,)
z
K(x z) w(z) d(z) + lim
0
+
_
B(x,)
h
x
wd =
= lim
0
+
1
H
n1
(B(x, ))
_
B(x,)
wd + 0 = w(x).
In modo del tutto analogo si prova che
lim
0
+
_
B(y,)
v
wd = 0, lim
0
+
_
B(y,)
w
v d = v(y).
Quindi, al limite per 0
+
, la (2.9) si riduce a w(x) = v(y), ossia G(y, x) =
G(x, y). Per continuità, la tesi vale per ogni x, y con x ,= y.
(ii) Sia x e sia > 0 tale che B(x, ) . La funzione y G(x, y) è
armonica in B(x, ) per ogni < e verica (per n > 2)
G(x, y) = 0 su , G(x, y)
1
(n 2)
n
n2
M su B(x, ),
essendo M il massimo su B(x, ) del modulo della funzione y G(x, y)
K(x y) la quale, per denizione di funzione di Green, è armonica in e
dunque continua su B(x, ). Dunque G(x, y) 0 per ogni y (B(x, )),
se è sucientemente piccolo. Dal principio del massimo segue G(x, y) 0
60
per ogni y B(x, ). Ne segue, per larbitrarietà di , G(x, y) 0 per
ogni y x. Per continuità, la tesi vale per ogni x, y con x ,= y.
Nel caso n = 2 le argomentazioni sono esattamente le stesse.
Se esiste la funzione di Green per possiamo concludere con il seguente
Corollario 2.4.6 Sia un aperto limitato di R
n
1
a tratti. Se esiste la funzione di Green G(x, y) per il Laplaciano in , e se
u C
2
() è soluzione del problema di Dirichlet (2.3), allora vale la formula
di rappresentazione
u(x) =
_
y
G(x, y) (y) d(y)
_
G(x, y) f(y) dy x . (2.10)

Naturalmente il corollario 2.4.6 non è un teorema di esistenza. Però è un buon
inizio: se sappiamo costruire la funzione di Green, abbiamo una candidata
soluzione e si può cercare di provare che essa è soluzione per davvero; questo
è ciò che faremo nel caso in cui è una palla, poiche in tal caso la funzione
di Green si sa scrivere esplicitamente.
Osservazione 2.4.7 In eetti è possibile costruire la funzione di Green per
ogni aperto di R
n
quando n > 2, e per una vastissima classe di aperti quando
n = 2; si veda [4] per approfondimenti.
Osservazione 2.4.8 In modo analogo si può rappresentare la soluzione del
problema di Neumann per lequazione di Poisson:
_
_
_
u = f in
u
= su .
(2.11)
Si cerca una funzione di Green di seconda specie N(x, y), ossia una funzione
tale che N(x, y) = K(x y) + k
x
(y), con k
x
funzione di classe C
2
armonica
in , e
N
y
(x, y) = c per ogni y , con c costante opportuna. Tale
funzione, come è facile vericare, è unica a meno di una costante additiva.
Si trova allora, in analogia con la (2.8),
u(x) =
_
_
N(x, y)
u
(y) +c u(y)
_
d(y)
_
N(x, y) u(y) dy x .
Applicando questa formula alla funzione u 1, che sicuramente risolve il
problema di Neumann (2.11) con dati f e nulli, si trova 1 = cH
n1
(),
61
da cui segue che lunico valore possibile è c = [H
n1
()]
1
. Con questa
scelta di c si deduce la formula di rappresentazione per le eventuali soluzioni
del problema di Neumann (2.11):
u(x) =
_
N(x, y) (y) d(y)

_
N(x, y) f(y) dy +
+
1
H
n1
()
_
u(y) d(y) x .
Si noti che, come è giusto, questa formula individua la funzione u a meno di
una costante additiva.
2.5 La funzione di Green per la sfera
La funzione di Green per un aperto si può interpretare sicamente come
il potenziale elettrostatico generato, allinterno di una supercie chiusa con-
duttrice posta a potenziale zero (a terra), da una carica unitaria, situata
in un punto x .
Per costruire la funzione G nel caso in cui è la palla S = B(0, R) ado-
periamo il metodo di riessione, che trae origine proprio dallinterpretazione
elettrostatica sopra delineata. Se x S e x ,= 0, poniamo x
=
xR
2
|x|
2
, cosicche
[x[ [x
[ = R
2
; cerchiamo una funzione di Green della forma
G(x, y) = K(x y) K(x
y),
ove è una costante da ssare. Notiamo che la funzione y K(x
y) è
armonica su S, poiche x
è al di fuori di S. Il numero rappresenta una carica

incognita da collocare in x
, in modo da ottenere un campo elettrostatico che,

sommato a quello indotto dalla carica posta in x e descritto dalla soluzione
fondamentale K(xy), generi un potenziale che sia nullo sulla supercie S.
Per determinare , osserviamo anzitutto che per ogni y S vale la proprietà
seguente: nel piano generato dai punti 0, x, y i due triangoli di vertici 0, x, y
e 0, y, x
sono simili. Infatti essi hanno in comune langolo x0y e i lati a due
a due proporzionali, in quanto
0y
0x
=
R
[x[
=
[x
[
R
=
0x
0y
.
62
Per la terza coppia di lati si ha dunque
R
[x
y[
=
0y
x
y
=
0x
xy
=
[x[
[x y[
,
ovvero
[x
y[ = [x y[
R
[x[
y S. (2.12)
Ci` o premesso, nel caso n > 2, anche G(x, ) sia nulla su S basta scegliere
= (R/[x[)
n2
, perche in questo caso si ha, in virt` u di (2.12),
G(x, y) = K(x y)
_
R
[x[
_
n2
K(x
y) =
=
1
(n 2)
n
_
1
[x y[
n2

R
n2
[x[
n2
[x
y[
n2
_
=
=
1
(n 2)
n
_
1
[x y[
n2

1
[x y[
n2
_
= 0 y S.
Se n = 2, si verica direttamente che la funzione di Green per la palla
S = B(0, R) è data da
G(x, y) =
1
2
log
1
[x y[

1
2
log
R
[x[[x
y[
.
In denitiva, la funzione di Green per la sfera S = B(0, R) in qualunque
dimensione n 2 è
G(x, y) = K(x y) K
_
[x[
R
(x
y)
_
, ove x
=
xR
2
[x[
2
. (2.13)
Si osservi che dalla proposizione 2.4.5 segue che per x = 0, nel qual caso x
non è denito, la G è data da

G(0, y) = G(y, 0) = K(y) K
_
[y[
R
y
_
= K(y) K
_
R
y
[y[
_
.
Vediamo ora come si usa la funzione di Green per risolvere il problema di
Dirichlet per lequazione di Poisson sulla sfera.
63
Teorema 2.5.1 Sia S la palla B(0, R) e siano f C
1
(S) e C(S).
Allora il problema di Dirichlet
_
u = f in S
u = su S
ha come unica soluzione la funzione
u(x) =
R
2
[x[
2
R
n
_
S
(y)
[x y[
n
d(y)
_
S
G(x, y)f(y) dy x S, (2.14)
ove G è la funzione di Green per la sfera B(0, R), ossia la funzione (2.13).
Dimostrazione Dal corollario 2.4.6 sappiamo che la soluzione, se esiste, è
data dalla (2.10), ossia
u(x) =
_
S
y
G(x, y)(y)d(y)
_
S
G(x, y)f(y)dy x ,
con G data da (2.13). Calcoliamo la derivata normale di questa funzione nei
punti y S. Nel caso n > 2, per x S ssato si ha, ricordando (2.6),
y
G(x, y) =
y
G(x, y) (y) =
=
_
y
K(x y)
y
K
_
[x[
R
(x
y)
__

y
R
=
=
(x y) y
R
n
[x y[
n

_
R
[x[
_
n2
(x
y) y
R
n
[x
y[
n
=
=
1
R
n
[x y[
n
_
(x y) y
[x[
2
R
2
_
R
2
x
[x[
2
y
_
y
_
=
=
[x[
2
R
2
R
n
[x y[
n
.
Alla stessa formula si perviene nel caso n = 2. Si conclude allora che la
candidata soluzione è proprio la funzione (2.14), che è formata da due addendi
che denominiamo u
1
(x) e u
2
(x).
Proviamo che il primo addendo
u
1
(x) :=
R
2
[x[
2
R
n
_
S
(y)
[x y[
n
d(y)
64
verica
_
u
1
= 0 in S
u
1
= su S.
(2.15)
Poiche x S, mentre lintegrale è fatto su S, si può derivare sotto il segno
di integrale e si ricava che la funzione u
1
è di classe C
. Inoltre è facile,
benche laborioso, vericare che per ogni y S si ha
R
2
[x[
2
[x y[
n
= 0 x S.
Pertanto la funzione u
1
è armonica in S.
Adesso notiamo che il corollario 2.4.6, applicato alla costante v(x) 1 che
certamente risolve il problema
_
v = 0 in S
v = 1 su S,
ci dà lidentità
1 =
R
2
[x[
2
R
n
_
S
1
[x y[
n
d(y) x S.
Ci` o premesso, sia x un punto di S. Possiamo scrivere
u
1
(x) (x) =
R
2
[x[
2
R
n
_
S
(y) (x)
[x y[
n
d(y).
Per la continuità di , dato > 0 esiste > 0 tale che
[(y) (x)[ < y I
,
ove I
= y S : [y x[ < . Ne segue, per [x x[ <

2
,
[u
1
(x) (x)[
R
2
[x[
2
R
n
__
I
[x y[
n
d(y) +
_
S\I
[(y) (x)[
[x y[
n
d(y)
_
+
R
2
[x[
2
R
n
_
2
_
n
2||
C(S)

n
R
n1
;
poiche per x x si ha [x[ R, otteniamo
limsup
xx
[u
1
(x) (x)[ ,
65
e per larbitrarietà di si ottiene u
1
= su S. Ciò prova (2.15).
Dimostriamo adesso che il secondo addendo di (2.14), vale a dire
u
2
(x) :=
_
S
G(x, y)f(y) dy,
appartiene a C
2
(S) C(S) e verica
_
u
2
= f in S
u
2
= 0 su S.
(2.16)
Mostriamo anzitutto che u
2
appartiene a C(S) e che è nulla su S. Per
la simmetria della funzione di Green, se x S si ha G(x, y) = 0, da cui
u
2
(x) = 0. Inoltre, per x S, x x, possiamo scrivere
u
2
(x) =
_
S
[G(x, y) G(x, y)]f(y) dy.
Lintegrando è innitesimo per x x, ma non è dominato da alcuna funzione
sommabile indipendente dal parametro x: infatti esso è singolare proprio per
y = x. Ricorriamo allora al seguente corollario del teorema di Lebesgue:
Lemma 2.5.2 Sia f
k
una successione di funzioni integrabili sullo spazio
misurato (X, T, ). Supponiamo che:
(i) f
k
(x) f(x) q.o. in X per k ;
(ii) [f
k
(x)[ g
k
(x) q.o. in X per ogni k N;
(iii) g
k
(x) g(x) q.o. in X per k ;
(iv) g
k
e g siano sommabili su X e
_
X
g
k
d
_
X
g d per k .
Allora
lim
k
_
X
f
k
d =
_
X
f d.
Dimostrazione Basta applicare il lemma di Fatou alle due successioni di
funzioni non negative g
k
+f
k
e g
k
f
k
, e sfruttare la sommabilità di g.
66
Applichiamo il lemma 2.5.2 nel modo seguente: per ogni successione x
k

S convergente a x, si ha
[[G(x
k
, y) G(x
0
, y)]f(y)[ C[[x
k
y[
2n
+[x y[
2n
] =: g
k
(y),
e inoltre risulta
lim
k
g
k
(y) = 2C[x y[
2n
per quasi ogni y S,
lim
k
_
S
g
k
(y) dy = 2C
_
S
[x y[
2n
dy;
quindi il lemma 2.5.2 ci dice che
lim
k
_
S
[G(x
k
, y) G(x, y)]f(y) dy = 0,
e dallarbitrarietà della successione x
k
si ricava
lim
xx
u
2
(x) = lim
xx
_
S
[G(x, y) G(x, y)]f(y) dy = 0 x S,
cosicche u
2
è continua in S.
Proviamo ora larmonicità di u
2
in S. Sia x
0
S e sia r > 0 tale che
B(x
0
, r) S. Decomponiamo la funzione u
2
come segue:
u
2
(x) =
_
B(x
0
,r)
f(y)G(y, x) dy
_
S\B(x
0
,r)
f(y)G(y, x)dy =: v
r
1
(x) +v
r
2
(x),
ove abbiamo usato la simmetria della funzione di Green (proposizione 2.4.5).
Poiche, per y / B(x
0
, r), x G(y, x) è armonica in S y e quindi in
B(x
0
, r), si può derivare sotto il segno di integrale ottenendo
v
r
2
(x) =
_
S\B(x
0
,r)
f(y)G(y, x) dy = 0 x B(x
0
, r)
ed in particolare
v
r
2
(x
0
) = 0. (2.17)
67
Per quanto riguarda v
r
1
(x), scrivendo esplicitamente la funzione di Green
secondo la (2.13), ma a variabili scambiate, otteniamo
v
r
1
(x) =
_
B(x
0
,r)
f(y) G(y, x) dy =
=
_
B(x
0
,r)
f(y) K(y x) dy
_
B(x
0
,r)
f(y) K
_
[y[
R
(y
x)
_
dy =:
=: v
r
10
(x) +v
r
11
(x).
Dato che la funzione x K(
|y|
R
(y
x)) è singolare nel punto y
che è fuori
dalla palla S per ogni y B(x
0
, r), possiamo derivare v
r
11
(x) sotto il segno
di integrale, ottenendo
v
r
11
(x) =
_
B(x
0
,r)
f(y) K
_
[y[
R
(y
x)
_
dy = 0 x B(x
0
, r)
ed in particolare
v
r
11
(x
0
) = 0. (2.18)
Resta da calcolare il Laplaciano di v
r
10
(x). Dobbiamo anzitutto determinare le
derivate parziali D
i
v
r
10
per i = 1, . . . , n. A questo scopo proviamo il seguente
Lemma 2.5.3 Per ogni g C(B(x
0
, r)) risulta
D
i
_
B(x
0
,r)
g(y)K(x y) dy =
_
B(x
0
,r)
g(y)D
x
i
K(x y) dy x B(x
0
, r).
Dimostrazione Fissato x B(x
0
, r), scriviamo il rapporto incrementale
nella i-sima direzione:
1
h
_
B(x
0
,r)
g(y)[K(x +he
i
y) K(x y)] dy =
=
1
(n 2)
n
h
_
B(x
0
,r)
g(y)
_
1
0
d
dt
1
[x +hte
i
y[
n2
dt dy =
=
1
n
_
B(x
0
,r)
g(y)
_
1
0
x
i
+ht y
i
[x +the
i
y[
n
dt dy.
Scambiando lordine di integrazione, il che è lecito perche lintegrando, per
h ssato, è certamente sommabile in [0, 1] B(x
0
, r), otteniamo
1
h
_
B(x
0
,r)
g(y)[K(x +he
i
y) K(x y)] dy =
68
=
1
n
_
1
0
_
B(x
0
,r)
g(y)
x
i
+ht y
i
[x +the
i
y[
n
dy dt.
Dobbiamo passare al limite per h 0 sotto il segno di integrale. Fissiamo
> 0 tale che B(x, 2) B(x
0
, r), e scegliamo h tale che [h[ < : allora per
ogni t [0, 1] si ha B(x + the
i
, ) B(x
0
, r). Vogliamo provare che per la
funzione
G
h
(t, y) =
1
n
g(y)
x
i
+ht y
i
[x +the
i
y[
n
(2.19)
valgono i fatti seguenti, dai quali segue subito la tesi del lemma:
lim
h0
G
h
(t, y) =
1
n
g(y)
x
i
y
i
[x y[
n
q.o. in [0, 1] B(x
0
, r), (2.20)
lim
h0
_
1
0
_
B(x
0
,r)
G
h
(t, y) dydt =
_
1
0
_
B(x
0
,r)
1
n
g(y)
x
i
y
i
[x y[
n
dydt. (2.21)
La relazione (2.20) è ovvia; la (2.21) invece non è aatto banale. Per dimo-
strarla, ancora una volta non possiamo fare uso del teorema di convergenza
dominata di Lebesgue, poiche lintegrando G
h
(t, y) ha una singolarità nel
punto x + the
i
, che si muove durante il passaggio al limite. Applicheremo
allora il lemma 2.5.2 ad unarbitraria successione innitesima h
k
kN
. Per
le corrispondenti funzioni G
h
k
(t, y) denite in (2.19) si ha allora, per quasi
ogni (t, y) [0, 1] B(x
0
, r):
[G
h
k
(t, y)[
1
n
|g|
C(B(x
0
,r))
1
[x
t
h
k
e
i
y[
n1
=:
k
(t, y) (2.22)
k
(t, y)
1
n
|g|
C(B(x
0
,r))
1
[x
t
h
k
e
i
y[
n1
=:
k
(t, y) =: (t, y); (2.23)
inoltre, utilizzando le coordinate polari,
_
1
0
_
B(x
0
,r)
k
(t, y) dydt =
|g|
C(B(x
0
,r))
n
_
1
0
_
B(x
0
,r)
dydt
[x +th
k
e
i
y[
n1
=
=
|g|
C(B(x
0
,r))
n
__
1
0
_
B(x
0
,r)\B(x+th
k
e
i
,)
dydt
[x +th
k
e
i
y[
n1
+
+
_
1
0
_
B(x+th
k
e
i
,)
dydt
[x +th
k
e
i
y[
n1
_
=
69
=
|g|
C(B(x
0
,r))
n
__
1
0
_
B(x
0
,r)
(1
B(x+th
k
e
i
,)
(y))
dydt
[x +th
k
e
i
y[
n1
+
+
n
_
1
0
_

0
1
n1

n1
ddt
_
.
Nel primo integrale si ha [x +th
k
e
i
y[
1n

1n
e quindi, per convergenza
dominata,
lim
k
_
1
0
_
B(x
0
,r)\B(x+th
k
e
i
,)
dydt
[x +th
k
e
i
y[
n1
=
_
1
0
_
B(x
0
,r)\B(x,)
dydt
[x y[
n1
.
Il secondo integrale diventa
n
_
1
0
_

0
1
n1

n1
ddt =
_
1
0
_
B(x,)
dydt
[x y[
n1
.
Dunque, sommando,
lim
k
_
1
0
_
B(x
0
,r)
k
(t, y) dydt =
_
1
0
_
B(x
0
,r)
(t, y) dydt. (2.24)
Da (2.22), (2.23 e (2.24), grazie al lemma 2.5.2 segue che
lim
k
_
1
0
_
B(x
0
,r)
G
h
k
(t, y) dydt =
1
n
_
1
0
_
B(x
0
,r)
g(y)
x
i
y
i
[x y[
n
dydt,
e per larbitrarietà della successione h
k
si ricava la (2.21). Ciò. come già
osservato, prova il lemma 2.5.3.
Torniamo alle derivate parziali prime di v
r
10
(x). Si ha anzitutto, usando il
lemma 2.5.3 e integrando per parti,
D
i
v
r
10
(x) =
_
B(x
0
,r)
f(y)D
x
i
K(y x) dy =
_
B(x
0
,r)
f(y)D
y
i
K(y x) dy =
=
_
B(x
0
,r)
f(y)K(y x)
i
(y) d(y)
_
B(x
0
,r)
D
i
f(y)K(y x) dy.
Applicando ancora il lemma 2.5.3, similmente si ottiene, per i = 1, . . . , n,
D
2
i
v
r
10
(x) =
=
_
B(x
0
,r)
f(y)D
x
i
K(y x)
i
(y)d(y)
_
B(x
0
,r)
D
i
f(y)D
x
i
K(y x)dy =
=
_
B(x
0
,r)
f(y)D
y
i
K(y x)
i
(y)d(y) +
_
B(x
0
,r)
D
i
f(y)D
y
i
K(y x)dy,
70
e di conseguenza troviamo, per ogni x B(x
0
, r),
v
r
10
(x) =
_
B(x
0
,r)
f(y)

y
K(yx) d(y)+
_
B(x
0
,r)
f(y)
y
K(yx) dy;
in particolare, da (2.7) segue
v
r
10
(x
0
) =
=
_
B(x
0
,r)
f(y)

K(y x
0
)d(y) +
_
B(x
0
,r)
f(y)
y
K(y x
0
)dy =
=
1
n
r
n1
_
B(x
0
,r)
f(y)d(y) +
1
n
_
B(x
0
,r)
f(y)
y x
0
[y x
0
[
n
dy.
Dunque, da (2.17) e (2.18) segue che
u
2
(x
0
) = (v
r
10
+v
r
11
+v
r
2
)(x
0
) = v
r
10
(x
0
),
e poiche il primo membro non dipende da r, possiamo scrivere
u
2
(x
0
) = lim
r0
+
v
r
10
(x
0
) =
= lim
r0
+
_
1
n
r
n1
_
B(x
0
,r)
f(y)d(y) +
1
n
_
B(x
0
,r)
f(y)
y x
0
[y x
0
[
n
dy
_
=
= f(x
0
) + 0 = f(x
0
).
Poiche x
0
è un punto arbitrario di S, la (2.16) è provata. Ciò conclude la
dimostrazione del teorema 2.5.1
Terminiamo il paragrafo con un corollario assai utile per il seguito.
Corollario 2.5.4 Se u è una funzione armonica in una palla B(x, r) R
n
e continua sulla chiusura B(x, r), allora
u(z) =
r
2
[z x[
2
r
n
_
B(x,r)
u()
[ z[
n
d() z B(x, r).
v() = u(x +), B(0, r),
71
è armonica nella palla B(0, r). Per il teorema 2.5.1, si ha la formula di
rappresentazione
v() =
r
2
[[
2
r
n
_
B(0,r)
v(y)
[ y[
n
d(y) B(0, r);
ne segue, posto z = x +,
u(z) = u(x +) =
r
2
[z x[
2
r
n
_
B(0,r)
u(x +y)
[z x y[
n
d(y) =
=
r
2
[z x[
2
r
n
_
B(x,r)
u()
[z [
n
d() z B(x, r).
2.6 Proprietà delle funzioni armoniche
Una delle pi` u importanti proprietà di cui godono le funzioni armoniche è
la cosiddetta proprietà della media: il valore di una funzione u, armonica
in , in un punto x è la media dei valori che assume sulla frontiera di una
qualunque palla B(x, r) contenuta in . In questo paragrafo proveremo tale
proprietà e ne analizzeremo alcune notevoli conseguenze.
n
. Diciamo che una funzione u
C() ha la proprietà della media in se per ogni palla B(x, r) risulta
u(x) =
1
n
r
n1
_
B(x,r)
u(y) d(y). (2.25)
Stabiliamo anzitutto una formulazione equivalente della proprietà della me-
dia.
n
. Una funzione u C() verica
u(x) =
1
n
r
n1
_
B(x,r)
u(y) d(y) B(x, r)
se e solo se
u(x) =
n
n
r
n
_
B(x,r)
u(y) dy B(x, r) . (2.26)
72
Dimostrazione Supponiamo che valga (2.25) e sia B(x, r) . Per ogni
]0, r[ si ha, per ipotesi,
u(x) =
1
n1
_
B(x,)
u(y) d(y).
Moltiplichiamo entrambi i membri per
n1
e integriamo fra 0 e r: si ottiene
u(x)
r
n
n
= u(x)
_
r
0
n1
d =
1
n
_
r
0
_
B(x,)
u(y)d(y)d =
1
n
_
B(x,r)
u(y)dy,
e quindi la (2.26).
Supponiamo viceversa che valga (2.26) e sia B(x, r) . Moltiplichiamo
entrambi i membri per
r
n
n
e deriviamo rispetto a r: il risultato è
r
n1
u(x) =
d
dr
1
n
_
r
0
_
B(x,)
u(y) d(y) d =
1
n
_
B(x,r)
u(y) d(y),
cioè la (2.25).
n
e sia u C(). Se u è armonica
in , allora u ha la proprietà della media in .
Dimostrazione Sia B(x
0
, r) . Per il corollario 2.5.4, la funzione u(x) è
data dalla formula di rappresentazione
u(z) =
r
2
[z x
0
[
2
r
n
_
B(x
0
,r)
u()
[z [
n
d() z B(x
0
, r).
Scelto z = x
0
, si ricava la tesi:
u(x
0
) =
r
n
r
n
_
B(x
0
,r)
u() d().
Vale anche il viceversa della proposizione precedente, ma occorre prima
dimostrare un risultato intermedio che ha interesse di per se.
Proposizione 2.6.4 Sia un aperto connesso di R
n
e sia u C() una
funzione che verica la proprietà della media in . Se il massimo (oppure il
minimo) di u in esiste, ed è assunto in un punto interno a , allora u è
costante in .
73
Dimostrazione Sia M = max
u, e supponiamo che esista x tale che

u(x) = M. Poniamo
A = x : u(x) = M;
allora Aè un sottoinsieme non vuoto e chiuso in , in virt` u della continuità di
u. Dimostriamo che A è anche aperto in : essendo connesso, ciò proverà
che A = e quindi la tesi.
Sia x A e sia r
0
> 0 tale che B(x, r
0
) : vogliamo mostrare che u M
su B(x, r) per ogni r < r
0
(e quindi u M su B(x, r
0
)). In eetti se
esistessero r ]0, r
0
[ e B(x, r) tale che u() < M, troveremmo anche una
palla B(, ) B(x, r) per cui u(y) < M per ogni y B(, ). Ma allora,
utilizzando la proprietà della media (2.26) nellaperto B(x, r
0
), avremmo
M = u(x) =
n
n
r
n
_
B(x,r)
u(y) dy =
=
n
n
r
n
__
B(x,r)\B(,)
u(y) dy +
_
B(,)
u(y) dy
_
< M,
il che è assurdo. Pertanto B(x, r
0
) A ed A è aperto in .
In modo analogo si ragiona quando u assume il minimo in un punto interno.
n
e sia u C(). Allora u è armonica
in se e solo se u ha la proprietà della media in .
Dimostrazione (=) Questa implicazione è stata provata nella proposizio-
ne 2.6.3.
(=) Sia S = B(x
0
, r) . Indichiamo con v la soluzione, fornita dal
teorema 2.5.1, del problema di Dirichlet
_
v = 0 in S
v = u su S.
Allora v C(S) ed inoltre v, essendo armonica in S, ha la proprietà della
media in S. Quindi la dierenza w = u v ha la proprietà della media in
S e si annulla su S. Siano x
1
e x
2
punti di massimo e di minimo per w su
S: se almeno uno dei due punti è interno a S, la proposizione 2.6.4 implica
che w è costante in S, e dunque è nulla in S; se invece entrambi sono su S,
allora w ha sia minimo che massimo nulli. Ne segue che u v e pertanto u è
armonica in S. Dato che S è unarbitraria palla contenuta in , si conclude
che u è armonica in .
74
Corollario 2.6.6 (principio del massimo forte) Sia un aperto connes-
so di R
n
e sia u C() una funzione armonica in . Se il massimo (oppure
il minimo) di u in esiste, ed è assunto in un punto interno, allora u è
costante in .
Dimostrazione Poiche u è armonica in , u verica la proprietà della media
in ; la tesi segue allora applicando la proposizione 2.6.4.
Dal fatto che le funzioni armoniche vericano la proprietà della media discen-
de limportante conseguenza che tali funzioni sono analitiche (reali): questo
non ci sorprende, poiche in dimensione n = 2 ci era già noto. Per prova-
re questo fatto, dobbiamo preliminarmente procurarci opportune stime sulle
derivate di funzioni armoniche.
Proposizione 2.6.7 Sia un aperto limitato di R
n
e sia u C() una
funzione armonica in . Allora
[D
u(x)[
n
||
e
||1
[[!
[d(x, )]
||
max
[u[ N
n
, x . (2.27)
Dimostrazione Sia x e siano = d(x, ) e M = max
[u[. Dal
corollario 2.5.4 otteniamo la formula di rappresentazione
u(z) =

2
[z x[
2
n
_
B(x,)
u()
[ z[
n
d() z B(x, ),
da cui segue che u è di classe C
. Derivando lequazione u = 0 si deduce

che tutte le derivate D
u sono armoniche in B(x, ); quindi esse vericano

la proprietà della media in B(x, ).
Ci` o premesso, proviamo la (2.27) per induzione su N = [[. Se [[ = 1,
allora = e
i
, con 1 i n, e dal teorema della divergenza si ha
[D
i
u(x)[ =
n
_
B(x,)
D
i
u(y) dy
n
_
B(x,)
u(y)
i
(y) d(y)
n
M
n
n1
=
n
M,
e ciò prova la tesi per [[ = 1.
Se la tesi è vera quando [[ = N, proviamola per i multi-indici di lunghezza
[[ = N +1. Poniamo = +e
i
, con [[ = N e 1 i n: allora scrivendo
75
la proprietà della media per D
u nella palla B(x,

N+1
) si ottiene, utilizzando
lipotesi induttiva,
[D
u(x)[ =
n
(

N+1
)
n
_
B(x,

N+1
)
D
u(y) dy
=
=
n
(

N+1
)
n
_
B(x,

N+1
)
D
u(y)
i
(y) d(y)
n
(

N+1
)
n
_
B(x,

N+1
)
n
N
e
N1
N!
[d(y, )]
N
M d(y).
Dato che
d(y, ) d(x, ) [x y[ =

N + 1
=
N
N + 1
y B(x,

N+1
),
si deduce
[D
u(x)[
n
n
(

N+1
)
n
n
N
e
N1
N!
(
N
N+1
)
N
M
n
(

N + 1
)
n1
=
=
n
N+1
e
N
(N + 1)!
N+1
M
(N + 1)
N
e N
N
<
n
N+1
e
N
(N + 1)!
N+1
M,
che è la tesi quando [[ = N + 1. La (2.27) è provata.
n
. Se u è una funzione armonica in
, allora u è analitica in .
Dimostrazione Sia x e sia S = B(x, R) tale che S . Come
sappiamo, u è di classe C
in . Possiamo scrivere i punti y S nella forma

equivalente
y = x +ha, ove h ]0, R[, a R
n
con [a[ = 1.
Scrivendo la formula di Taylor per u nel punto x, si trova per ogni m N
+
u(y) = u(x +ha) =
||m1
D
u(x)
!
h
||
a
+R
m
(y),
ove il resto R
m
(y) può scriversi nella forma
R
m
(y) =
||=m
D
u(x +
m
ha)
!
h
||
a
76
per un opportuno
m
]0, 1[. Se scegliamo h ]0,
R
2
[, allora d(y, )
R
2
,
cosicche dalla proposizione 2.6.7 otteniamo
[R
m
(y)[
||=m
h
m
!
n
m
e
m1
m!
(
R
2
)
m
max
S
[u[ =
= h
m
_
_
||=m
m!
!
_
_
2
m
n
m
e
m1
R
m
max
S
[u[.
Daltra parte, per la formula (1.46),
||=m
m!
!
= n
m
m N
+
,
da cui nalmente
[R
m
(y)[
_
2n
2
eh
R
_
m
max
S
[u[ 2
m
max
S
[u[ h ]0,
R
4n
2
e
[.
Ci` o prova che la serie di Taylor di u ha per somma u(y) per ogni y
B(x,
R
4n
2
e
). La tesi è provata.
2.7 Successioni di funzioni armoniche
Il limite di funzioni armoniche, sotto opportune ipotesi, è a sua volta una
funzione armonica. Dedichiamo il presente paragrafo alla precisazione e al-
lanalisi di questo enunciato.
Un primo risultato è il seguente:
n
e sia u
k
C() una successione
di funzioni armoniche in . Se u
k
u uniformemente in per k ,
allora u è armonica in .
Dimostrazione Per il teorema 2.6.5, le u
k
vericano la proprietà della media
in . La funzione u, limite uniforme delle u
k
, è continua in e verica
anchessa la proprietà della media in . Ne segue la tesi applicando ancora
il teorema 2.6.5.
Ci occorre adesso una stima puntuale per funzioni armoniche non negative,
dalla quale trarremo notevoli conseguenze.
77
Proposizione 2.7.2 Sia S = B(x
0
, r) e sia u C(S) una funzione armo-
nica in S e non negativa in S. Allora
1
|xx
0
|
r
_
1 +
|xx
0
|
r
_
n1
u(x
0
) u(x)
1 +
|xx
0
|
r
_
1
|xx
0
|
r
_
n1
u(x
0
) x S. (2.28)
Dimostrazione Per il corollario 2.5.4 si ha la formula
u(x) =
r
2
[x x
0
[
2
r
n
_
S
u(y)
[y x[
n
d(y) x S. (2.29)
Daltra parte si ha
1
(r +[x x
0
[)
n

1
[x y[
n

1
(r [x x
0
[)
n
y S, x S,
da cui
r [x x
0
[
(r +[x x
0
[)
n1

r
2
[x x
0
[
2
[x y[
n

r +[x x
0
[
(r [x x
0
[)
n1
y S, x S
Moltiplichiamo per
u(y)
rn
e integriamo su S: tenendo conto di (2.29), si ottiene
r [x x
0
[
(r +[x x
0
[)
n1
1
r
n
_
S
u(y) d u(x)
r +[x x
0
[
(r [x x
0
[)
n1
1
r
n
_
S
u(y) d
ossia, ricordando che u verica la proprietà della media in S,
r
n2
r [x x
0
[
(r +[x x
0
[)
n1
u(x
0
) u(x) r
n2
r +[x x
0
[
(r [x x
0
[)
n1
u(x
0
) x S,
da cui la tesi.
Corollario 2.7.3 (teorema di Liouville) Sia u una funzione armonica in
R
n
. Se u è limitata inferiormente, oppure limitata superiormente, allora u è
costante.
Dimostrazione Sia u(x) K per ogni x R
n
: applicando la proposizione
2.7.2 a u()K, che è armonica e non negativa in ogni palla B(0, r), si ottiene
per ogni x B(0, r) e per ogni r > 0,
1
|x|
r
_
1 +
|x|
r
_
n1
(u(0) K) (u(x) K)
1 +
|x|
r
_
1
|x|
r
_
n1
(u(0) K);
78
dunque, per r , si ricava u(x) u(0).
Se u(x) M per ogni x R
n
, si applica lo stesso ragionamento a M u().
La proposizione 2.7.2 si generalizza nel modo seguente:
Teorema 2.7.4 (disuguaglianza di Harnack) Sia un aperto di R
n
e
sia K compatto e connesso. Allora esiste una costante A ]0, 1[ tale che
per ogni funzione u armonica in e non negativa in si ha
Au(x) u(x
)
1
A
u(x) x, x
K.
Dimostrazione Siano x e x
punti distinti di K e sia R = d(K, ). Per com-

pattezza, possiamo ricoprire K con un numero nito N di palle B(x
i
, R/4),
1 i N, centrate in punti di K. Possiamo porre x
0
= x, x
N+1
= x
, e
considerare le N+2 palle B(x
i
, R)
0iN+1
. Un facile argomento di connes-
sione mostra che esiste una sottofamiglia B(x
i
j
, R)
1jk
, con 2 k N,
tale che
x
i
1
= x, x
i
k
= x
, r
j
:= [x
i
j
x
i
j+1
[ <
R
2
per j = 1, . . . , k 1.
Poiche u è armonica e non negativa in B(x
i
1
, R), dalla proposizione 2.7.2
segue
1
r
1
R
(1 +
r
1
R
)
n1
u(x
i
1
) u(x
i
2
)
1 +
r
1
R
(1
r
1
R
)
n1
u(x
i
1
),
ed essendo r
1
< R/2 deduciamo
2
n2
3
n1
u(x
i
1
) u(x
i
2
) 3 2
n2
u(x
i
1
). (2.30)
Similmente si ha
2
n2
3
n1
u(x
i
2
) u(x
i
3
) 3 2
n2
u(x
i
2
),
il che, insieme a (2.30), implica
_
2
n2
3
n1
_
2
u(x
i
1
) u(x
i
3
)
_
3 2
n2
_
2
u(x
i
1
).
79
Iterando questa procedura, dopo k 1 passi si ricava
_
2
n2
3
n1
_
k1
u(x
i
1
) u(x
i
k
)
_
3 2
n2
_
k1
u(x
i
1
),
e a maggior ragione
_
2
n2
3
n1
_
N1
u(x) u(x
)
_
3 2
n2
_
N1
u(x),
che è la tesi con A = (3 2
n2
)
(N1)
.
Dalla disuguaglianza di Harnack discende immediatamente il seguente risul-
tato:
Corollario 2.7.5 Sia un aperto connesso di R
n
e sia u
k
una successione
crescente di funzioni armoniche in . Se u
k
converge in un punto x
0
,
allora essa converge uniformemente su ogni compatto contenuto in .
2.8 Funzioni subarmoniche
In vista del teorema di esistenza e unicità per il problema di Dirichlet rela-
tivo allequazione di Laplace con dato al bordo continuo, risultato che sarà
dimostrato nel prossimo paragrafo in ipotesi molto blande sullaperto , in-
troduciamo e analizziamo una classe di funzioni molto importante e utile:
quella delle funzioni subarmoniche.
n
. Una funzione u C() si dice
subarmonica in se per ogni aperto limitato
e per ogni funzione

v C(
), armonica in
, risulta
max
(u v) = max
(u v).
Una funzione u C() si dice superarmonica in se per ogni aperto limitato
e per ogni funzione v C(
), armonica in
, risulta
min
(u v) = min
(u v).
80
In denitiva una funzione u, continua in , è subarmonica in se e solo se
accade che ogni funzione armonica v, che sia al di sopra di u sulla frontiera
di un arbitrario sotto-aperto
, sta al di sopra di u su tutto
.
Si verica facilmente che una funzione u è subarmonica se e solo se u è
superarmonica.
`
E chiaro inoltre che ogni funzione armonica è sia subarmo-
nica che superarmonica.
`
E immediato riconoscere, poi, che per n = 1 sono
subarmoniche in ]a, b[ tutte e sole le funzioni convesse in ]a, b[. Si osservi
anche che se è limitato, la condizione di subarmonicità vale anche per .
Vediamo alcune proprietà delle funzioni subarmoniche.
Proposizione 2.8.2 Se u
1
, . . . , u
m
sono funzioni subarmoniche in un aperto
di R
n
, allora la funzione
u(x) = maxu
1
(x), . . . , u
m
(x), x ,
è subarmonica in .
Dimostrazione Sia
un qualunque aperto limitato contenuto in . Se v

è una funzione continua in
e armonica in
, la funzione u v è continua
su
e quindi ha massimo in un punto x

0

. Inoltre, per denizione

di u, esiste un indice i 1, . . . , m tale che u(x
0
) = u
i
(x
0
). Poiche u
i
è
subarmonica in , si ha
max
(u v) = u(x
0
) v(x
0
) = u
i
(x
0
) v(x
0
)
max
(u
i
v) = max
(u
i
v) max
(u v),
da cui
max
(u v) = max
(u v).
Ci` o prova che u è subarmonica in .
Introduciamo adesso una particolare trasformazione funzionale denita sullo
spazio C(), ove è un aperto di R
n
, la quale, come vedremo tra poco,
preserva la subarmonicità. Sia u C(): se S è una palla contenuta in ,
denotiamo con u
S
la soluzione del problema di Dirichlet
_
u
S
= 0 in S
u
S
= u su S,
(2.31)
81
che esiste unica in virt` u del teorema 2.5.1. Sia poi M
S
[u] la funzione denita
da
M
S
[u] =
_
u in S
u
S
in S.
(2.32)
Chiaramente M
S
[u] è continua su . Inoltre:
Proposizione 2.8.3 Se u è una funzione subarmonica in un aperto di
R
n
, allora per ogni palla S la funzione M
S
[u] è subarmonica in .
Dimostrazione Anzitutto, se S è una palla contenuta in , per la subar-
monicità di u e per denizione di M
S
[u], si ha
max
S
(u M
S
[u]) = max
S
(u M
S
[u]) = 0,
ossia u M
S
[u] in S, e quindi
u M
S
[u] in . (2.33)
Sia adesso
un qualunque aperto limitato contenuto in . Se v è una

funzione continua in
e armonica in
, la funzione M
S
[u]v ha massimo in
un punto x
0

. Se questo punto appartiene a
, allora si ha banalmente
max
(M
S
[u] v) = M
S
[u](x
0
) v(x
0
) = max
(M
S
[u] v),
che è ciò che si vuole. Se invece x
0

, allora esso starà in S, oppure starà

fuori di S. Se x
0

S, allora, per la subarmonicità di u e per (2.33),

max
(M
S
[u] v) = M
S
[u](x
0
) v(x
0
) = u(x
0
) v(x
0
)
max
(u v) = max
(u v) max
(M
S
[u] v),
il che, nuovamente, è ciò che si vuole. Se, inne, x
0

S, si ha, essendo
M
S
[u] v armonica in
S,
max
(M
S
[u] v) = M
S
[u](x
0
)v(x
0
) = max
S
(M
S
[u] v) = max
(
S)
(M
S
[u] v);
pertanto esiste x
1
(
S) tale che
max
(M
S
[u] v) = max
(
S)
(M
S
[u] v) = M
S
[u](x
1
) v(x
1
).
82
Se x
1

, già sappiamo che

max
(M
S
[u] v) = max
(M
S
[u] v),
mentre se x
1
S otteniamo, per la subarmonicità di u e la (2.33),
max
(M
S
[u] v) = M
S
[u](x
1
) v(x
1
) = u(x
1
) v(x
1
)
max
(u v) = max
(u v) max
(M
S
[u] v).
In denitiva, risulta
max
(M
S
[u] v) = max
(M
S
[u] v)
e ciò prova che M
S
[u] è subarmonica in .
La parentela fra funzioni subarmoniche ed armoniche è completamente chia-
rita dal risultato che segue.
n
e sia u una funzione continua
in . Valgono i seguenti fatti:
(i) u è subarmonica in se e solo se u verica
u(x)
1
n
r
n1
_
B(x,r)
u(y) d(y) B(x, r) ; (2.34)
(ii) se u C
2
(), allora u è subarmonica in se e solo se u 0 in .
Dimostrazione (i) Supponiamo che u verichi la (2.34): allora, per ogni
aperto limitato
e per ogni funzione v C(
) armonica in
, la
funzione uv verica ancora la (2.34) in ogni palla contenuta in
. Quindi,
ripetendo esattamente la dimostrazione della proposizione 2.6.4, si ottiene
che per ogni componente connessa U
i
di
risulta
max
U
i
(u v) = max
U
i
(u v).
Ne segue che se x
0
è punto di massimo per u v in
i
U
i
, allora esiste
i tale che x
0
U
i
, da cui
max
(u v) = max
U
i
(u v) = max
U
i
(u v).
83
Daltronde, è facile vericare che
i
U
i
, e quindi dalla relazione
precedente deduciamo
max
(u v) = max
U
i
(u v) max
(u v).
Ne segue che u è subarmonica in .
Viceversa, se u è subarmonica in , allora per ogni palla S = B(x, r) con-
tenuta in si ha, per la (2.33) e per denizione di M
S
[u] (si veda (2.32) e
(2.31)),
u(x) M
S
[u](x) =
1
n
r
n1
_
B(x,r)
M
S
[u](y) d(y) =
=
1
n
r
n1
_
B(x,r)
u(y) d(y),
cosicche u verica (2.34).
(ii) Sia u C
2
() subarmonica in . Supponiamo, per assurdo, che esista
x
0
tale che u(x
0
) < 0. Per continuità esiste una palla S = B(x
0
, r),
con S , tale che u(x) < 0 per ogni x S. Consideriamo la funzione
M
S
[u]: la dierenza u M
S
[u] è nulla su S e, per la (2.33), non positiva in
S; dunque il minimo di u M
S
[u] in S è raggiunto in un punto x interno a
S. Ne segue che in tale punto deve essere u(x) = (u M
S
[u])(x) 0,
contro lipotesi u < 0 in S.
Viceversa, sia u C
2
() C() tale che u 0 in . Fissiamo un aperto
limitato
e una funzione v C(
) armonica in
. Allora (uv) 0
in
; per il principio del massimo debole (proposizione 2.3.3), si ha

max
(u v) = max
(u v),
ossia u è subarmonica in .
Osservazione 2.8.5 Dalla proposizione 2.8.4 segue in particolare che la
somma, nonche il prodotto per scalari positivi, di funzioni subarmoniche
è una funzione subarmonica.
2.9 Il problema di Dirichlet
Riprendiamo in esame il problema di Dirichlet per lequazione di Laplace in
un aperto limitato di R
n
. Già sappiamo che per questo problema vi è
84
unicità e dipendenza continua dai dati, ma lesistenza è per adesso garantita
solo nel caso in cui è una palla (teorema 2.5.1). Prenderemo in esame ora
aperti (limitati) molto generali.
Teorema 2.9.1 Sia un aperto limitato di R
n
, tale che per ogni y
esista una palla B tale che B = y. Allora per ogni g C() esiste
ununica funzione u C
2
() C() che risolve il problema di Dirichlet
_
u = 0 in
u = g su .
(2.35)
Di questo teorema esistono numerose dimostrazioni molto diverse fra loro.
Noi seguiremo quella, elementare anche se non banale, dovuta a Perron.
Dimostrazione Consideriamo le famiglie di funzioni
A = v C() : v è subarmonica in , v g su
B = w C() : w è superarmonica in , w g su .
(2.36)
Le due classi sono non vuote poiche
min
g A, max
g B.
Inoltre risulta
v w v A, w B; (2.37)
infatti, per ogni v A e w B la funzione v w è subarmonica in virt` u
dellosservazione 2.8.5, ed è non positiva su , da cui, per denizione di
subarmonicità e per il fatto che è limitato, essa è non positiva in .
Osserviamo che la soluzione u del problema (2.35), se esiste, appartiene ad
AB, e quindi verica v u w per ogni v A e per ogni w B. Questo
ci suggerisce di denire la candidata soluzione nel modo seguente:
u(x) = sup
vA
v(x) x . (2.38)
Proviamo dunque che questa funzione risolve (2.35). Sia x
0
un arbitrario
punto di . Per denizione di u(x
0
) esiste una successione u
k
A tale che
u
k
(x
0
) u(x
0
). Posto
v
k
(x) = maxu
1
(x), . . . , u
k
(x), x ,
85
è chiaro che v
k
è una successione crescente di elementi di A (proposizione
2.8.2), tale che v
k
(x
0
) u(x
0
).
Sia ora S una palla contenuta in contenente x
0
, e poniamo w
k
= M
S
[v
k
]
(si veda (2.32) e (2.31)). Allora w
k
A; infatti le w
k
sono subarmoniche
in (proposizione 2.8.3) e, coincidendo con v
k
in S, non superano g
su . Inoltre la successione w
k
è crescente, in virt` u della crescenza di
v
k
e del principio del massimo, e si ha w
k
(x
0
) u(x
0
), poiche in S si ha
v
k
w
k
u per (2.33) e (2.38). In virt` u del corollario 2.7.5 e del teorema
2.7.1, concludiamo che le w
k
convergono uniformemente in ogni palla chiusa
S
S a una funzione w armonica in S, tale che w(x

0
) = u(x
0
).
Adesso ssiamo un generico punto S: esiste unaltra successione u
k

A (dipendente da ), tale che u
k
() u(). Deniamo
z
k
(x) = maxv
k
(x), u
1
(x), . . . , u
k
(x), x
e sia y
k
= M
S
[z
k
] (anche queste funzioni dipendono da ). Allora, come
prima, risulta z
k
A e y
k
A, y
k
è crescente e, per il principio del
massimo, w
k
y
k
in ; inoltre y
k
() u() (perche u
k
z
k
y
k
u
in S). Quindi, analogamente, le y
k
convergono uniformemente in ogni palla
chiusa S
S a una funzione y armonica in S (dipendente da ), tale che

y() = u(). Risulta pertanto
y w in S, y(x
0
) = w(x
0
) = u(x
0
).
Dunque la funzione y w, armonica e non negativa su S, ha minimo uguale
a 0 nel punto x
0
interno a S: per il principio del massimo forte (corollario
2.6.6), y w è nulla in S e, in particolare, w() = y() = u().
Abbiamo cos` eliminato la dipendenza da e provato che nel generico punto
S si ha u() = w(), ove w è una ssata funzione armonica: ossia u è
armonica in S. Poiche S è una palla contenente un arbitrario punto x
0
,
possiamo dedurre nalmente che u è armonica in .
Dimostriamo adesso che per ogni y risulta
lim
x, xy
u(x) = g(y); (2.39)
ciò concluderà la dimostrazione.
Ci occorre il seguente
Lemma 2.9.2 Sia un aperto limitato di R
n
, tale che per ogni y
esista una palla B tale che B = y. Allora per ogni y esiste una
86
funzione barriera, vale a dire una funzione x
y
(x), denita e continua in
, tale che
(i)
y
è superarmonica in ,
(ii)
y
è non negativa in ,
(iii)
y
(x) = 0 se e solo se x = y.
Dimostrazione Fissato y , sia B(, r) una palla tale che B(, r) =
y. Una funzione barriera è allora, come è immediato vericare,
y
(x) =
_
r
2n
[x [
2n
se n > 2
log
|x|
r
se n = 2.
Proviamo la (2.39). Sia y e sia > 0: per la continuità di g, esiste un
intorno aperto I di y tale che
[g(x) g(y)[ < x I .
Dunque, posto
K =
osc(g, )
min
y
(x) : x I
,
si ha
[g(x) g(y)[ < +K
y
(x) x ,
ove
y
è la funzione barriera fornita dal lemma 2.9.2. Inoltre, essendo
g(y) K
y
() A, g(y) + +K
y
() B,
si ha
g(y) K
y
(x) u(x) g(y) + +K
y
(x) x ,
ovvero
[u(x) g(y)[ +K
y
(x) x .
Se ne deduce che
limsup
x, xy
[u(x) g(y)[ ,
e poiche è arbitrario, la (2.39) è provata.
Osservazione 2.9.3 Si noti che nella dimostrazione precedente abbiamo
usato le condizioni (ii) e (iii) della denizione di funzione barriera solamente
per x .
87
Capitolo 3
Lequazione del calore
Lequazione del calore
u
t
(x, t) ku(x, t) = f(x, t), (3.1)
ove k è una costante positiva e f è una funzione continua assegnata, è la pi` u
importante e la pi` u semplice fra le equazioni di tipo parabolico. Essendo pre-
sente la variabile t, naturalmente identicata con il tempo, questa equazione
descrive quei fenomeni di tipo evolutivo nei quali interviene una diusione,
ossia quando si ha il trasferimento di una data quantità di sostanza, o di
energia, dalle zone di alta concentrazione a quelle di bassa concentrazione.
La funzione f ha il signicato di una sorgente di gas, o di calore, interna alla
regione che si considera. Come vedremo, molte delle proprietà matematiche
dellequazione del calore sono simili a quelle dellequazione di Laplace.
Abbiamo già visto nellesempio 2.1.5 che lequazione (3.1) descrive la propa-
gazione del calore nello spazio, essendo u(x, t) la temperatura nel punto x
allistante t. Vediamo ora un altro esempio di diusione.
Esempio 3.1.1 Consideriamo un mezzo vuoto, oppure riempito di una
sostanza porosa. Se immettiamo in una certa quantità di gas, come si
è già detto, esso si dionderà dalle zone di alta concentrazione a quelle di
rarefazione. Indichiamo con u(x, t) la concentrazione di gas nel punto x
allistante t. La legge (sperimentale) di Fick ci dice che la massa dF
di gas
che attraversa nellunità di tempo una supercie d centrata in x con versore
88
normale è proporzionale al gradiente della concentrazione:
dF
= D
u
d, (3.2)
ove D è il coeciente di diusione e compare il segno poiche la diusio-
ne deve andare nelle direzioni di concentrazione decrescente. Il coeciente D
potrebbe dipendere dal punto x se il mezzo non è omogeneo, dalla temperatu-
ra del mezzo, dalla concentrazione stessa, ma noi supporremo per semplicità
che D sia una costante positiva. Dunque possiamo rappresentare la quantità
di gas che si allontana da x mediante il vettore
F = Du. (3.3)
Sia allora B una palla centrata in x di raggio r, contenuta in , e sia [t
0
, ]
un intervallo di tempo. La variazione di concentrazione in B in tale periodo
di tempo è
_
B
c(x)[u(x, ) u(x, t
0
)]dx,
ove c(x) è il coeciente di porosità, che supponiamo costante; se siamo nel
vuoto possiamo prendere c(x) 1. Risulta
_
B
[u(x, ) u(x, t
0
)]dx =
_

t
0
_
B
(F ) ddt,
poiche la concentrazione decresce se il vettore della diusione F punta verso
lesterno. Se ne deduce, tenuto conto di (3.2) e integrando per parti,
_

t
0
_
B
u
t
(x, t) dxdt =
_
B
[u(x, ) u(x, t)]dx =
=
_

t
0
_
B
D
u
(x, t) ddt =
_

t
0
_
B
Du(x, t) dxdt.
Inne, per larbitrarietà di B e di [t
0
, ], si deduce
u
t
= Du in [0, [.
Quali condizioni ai limiti sono signicative per lequazione (3.1)? Poiche
in R
n+1
la supercie n-dimensionale t = 0 è caratteristica, non possiamo
assegnare condizioni iniziali su u e su
u
t
, perche questultima quantità è
89
determinata dallequazione. Fisicamente, tornando allinterpretazione della
(3.1) come modello della propagazione del calore in un corpo , ha senso
assegnare la temperatura del corpo allistante iniziale
u(x, 0) = (x), x ,
e prescrivere poi, per esempio,
u
(x, t) = (x) x , t > 0,

il che corrisponde a supporre che il corpo scambi calore con lesterno in modo
pressato (in particolare, se = 0 vi è isolamento termico), oppure
u(x, t) = (x) x , t > 0,
il che signica che la temperatura sul bordo di è mantenuta a un determi-
nato livello. Ma altre condizioni ai limiti sono possibili: se il corpo è immerso
in un uido, con il quale vi è scambio di calore per convezione, allora per
la legge di Newton la quantità di calore che passa dal corpo al uido è pro-
porzionale (localmente) alla dierenza delle temperature. In altre parole, se
(x, t) è la temperatura del uido a contatto con il corpo (dunque x ),
si ha
h(x)u(x, t) (x) = (x)[u(x, t) (x, t)],
ove h(x) è la conducibilità termica nel punto x e (x) è un fattore
di proporzionalità. Supponendo per semplicità e h funzioni costanti, si
ottiene
u +h
u
= =: su [0, [.
Abbiamo dunque tre tipi di problemi ai limiti per lequazione del calore: il
problema di Cauchy-Dirichlet
_
_
u
t
u = f in ]0, [,
u(x, 0) = (x) in ,
u(, t)[
= t > 0,
(3.4)
il problema di Cauchy-Neumann
_
_
u
t
u = f in ]0, [,
u(x, 0) = (x) in ,
u
(, t)
= t > 0,
(3.5)
90
e il problema di Cauchy con condizioni di Robin
_
_
u
t
u = f in ]0, [,
u(x, 0) = (x) in ,
_
u(, t) +
u
(, t)
_
= t > 0.
(3.6)
Osserviamo inne che linsieme dei tempi può essere un qualunque intervallo
[t
0
, T], o una semiretta [t
0
, [, o anche tutto R. Noi assumeremo sempre
t
0
= 0 e inoltre, con una diversa scala dei tempi, non è restrittivo supporre
che in (3.1) il coeciente di diusione k sia uguale a 1.
3.2 Principio del massimo
Consideriamo dunque lequazione del calore omogenea
u
t
u = 0. (3.7)
Sarà naturale considerare il seguente spazio funzionale:
Denizione 3.2.1 Se A è un aperto di R
n+1
, lo spazio C
2,1
(A) è costituito
dalle funzioni u C(A) tali che D
i
u, D
i
D
j
u, u
t
appartengono a C(A) per
ogni i, j 1, . . . , n.
Per le soluzioni dellequazione del calore in un aperto A vale, sotto ipotesi
molto blande, un principio di massimo simile a quello relativo alle funzioni
armoniche (proposizione 2.3.3).
Proposizione 3.2.2 (principio del massimo) Sia A un aperto di R
n+1
.
Poniamo per T R:
A
T
= (x, t) A : t < T,
S
T
= (x, t) A : t < T,
T
= (x, t) A : t = T.
Supponiamo che esista T R tale che laperto A
T
sia non vuoto e limitato,
e sia u C(A) C
2,1
(A). Se risulta u
t
u 0 in A, allora
max
A
T
u = max
S
T
u;
91
se invece risulta u
t
u 0 in A, allora
min
A
T
u = min
S
T
u.
Dimostrazione Supponiamo che u
t
u 0. Sia (x, t) un arbitrario punto
di A
T
e scegliamo ]t, T[. Per > 0, la funzione
v(x, t) = u(x, t) t
è continua in A
e soddisfa
v
t
v = u
t
u in A.
Sia (x
0
, t
0
) un punto di massimo per v in A
: tale punto può stare in A, e

dunque in A
, oppure in A, dunque in S
. Nel primo caso avremmo

v
t
(x
0
, t
0
) 0, D
2
i
u(x
0
, t
0
) 0, i = 1, . . . , n,
da cui v
t
v 0, assurdo. Dunque si ha (x
0
, t
0
) S
S
T
. Pertanto
u(x, t) = v(x, t) +t max
S
T
v +T max
S
T
u + 2K,
ove K è unopportuna costante (si ricordi che A
T
è limitato). Per 0 si
ottiene u(x, t) max
S
T
u. Dato che il punto (x, t) era arbitrario, si ha la tesi
grazie alla continuità di u su A
T
.
Se u
t
u 0, si fa un ragionamento del tutto analogo.
Il principio del massimo ora dimostrato è in forma debole, perche non esclude
che la funzione u assuma massimo anche in punti di A
T
S
T
; tuttavia esso
è pi` u che suciente per i nostri scopi, e daltronde la versione forte è di
dimostrazione intricata e alquanto lunga, seppure non dicile.
Osservazioni 3.2.3 (1) Se laperto A
T
non è limitato, il principio del mas-
simo in generale non vale. Ad esempio, se n = 1 le funzioni
u
k
(x, t) = ce
k
2
t
sin kx
sono tutte soluzioni in A =]0, [R del problema
_
u
t
u
xx
= 0 in A
u(0, t) = u(, t) = 0 t R,
92
ma sono illimitate in A. Si noti che in questo caso A
T
=]0, [] , T[ e
che per questo problema non cè unicità della soluzione.
(2) Dal principio del massimo segue che il problema di Dirichlet per lequa-
zione del calore non è ben posto: scelti ad esempio n = 1 e A =]0, 1[]0, T[,
il problema
_
u
t
u
xx
= 0 in A
u = su A
non può avere alcuna soluzione se si prende una C(A) che abbia (
1
2
, T)
come unico punto di massimo assoluto.
Una prima conseguenza del principio del massimo, di immediata dimostra-
zione, è lunicità e la dipendenza continua dai dati per il problema di Cauchy-
Dirichlet:
Corollario 3.2.4 Sia A = ]0, T[, ove è un aperto limitato di R
n
. Se
f C(A), C() e C( [0, T]), allora il problema
_
_
u
t
u = f in A,
u(x, 0) = (x) in ,
u(, t)[
= t [0, T],
(3.8)
ha al pi` u una soluzione u C(A) C
2,1
(A). Se inoltre f 0, risulta
|u|
C(A)
= max||
C()
, ||
C([0,T])
. (3.9)
Il risultato espresso dal corollario precedente può essere migliorato. Si ha:
Teorema 3.2.5 Sia A = ]0, T[, ove è un aperto limitato di R
n
con
di classe C
1
a tratti. Se f C(A), C() e C([0, T]), allora il
problema
_
_
u
t
u = f in A
u(x, 0) = (x) in ,
_
u(, t) +
u
(, t)
_
= t [0, T],
(3.10)
ove e sono costanti non negative e non entrambe nulle, ha al pi` u una
soluzione nella classe delle funzioni u C(A) C
2,1
(A) per le quali
u

93
C(A). Inoltre, se = 0, oppure se i numeri e sono entrambi positivi,
risulta per ogni t [0, T]
_
[u(x, t)[
2
dx e
t
_
[(x)[
2
dx +
+
_
t
0
e
ts
__
[f(x, s)[
2
dx +K
_
[(x, s)[
2
d
_
ds,
ove K è unopportuna costante.
Come si vede, qui si ha dipendenza continua dai dati rispetto alla norma
L
2
nello spazio, anziche nella norma uniforme. Vedremo fra poco che per
il problema di Cauchy-Dirichlet vale anche la dipendenza continua rispetto
alla norma uniforme, generalizzando la (3.9) al caso di secondo membro non
nullo.
Dimostrazione Utilizziamo il metodo dellenergia, che avrà molte applica-
zioni anche nel seguito. Sia u una soluzione del problema. Moltiplichiamo
lequazione per u(x, t) e integriamo su per t [0, T] ssato: utilizzando la
formula di Green (si noti che la derivata normale di u è continua in A) si ha
1
2
d
dt
_
[u(x, t)[
2
dx =
_
u
t
udx =
_
(f + u)udx =
=
_
f udx +
_
ud
_
[Du[
2
dx.
(3.11)
Se > 0 e > 0, possiamo scrivere ad esempio u =
1
(
u
) su :
quindi
_
ud =
_
2
d +
_
d.
Sostituendo in (3.11) si ricava, utilizzando la relazione ab

2
a
2
+
1
2
b
2
, valida
per ogni a, b R e per ogni > 0,
1
2
d
dt
_
[u(x, t)[
2
dx
_
2
d +
_
d +
_
f udx
+

2
__
2
d +
1
2
_
[[
2
d +
+
1
2
_
[f[
2
dx +
1
2
_
[u[
2
dx.
94
Scelto = 2, otteniamo
d
dt
_
[u(x, t)[
2
dx
_
[u(x, t)[
2
dx
_
C
_
[[
2
d +
_
[f[
2
dx
_
. (3.12)
Questa stessa relazione si ottiene anche quando = 0, osservando che in tal
caso su si ha
u
u
2
0 se > 0, u
u
[u[
2
0 se > 0;
ciò implica
_
u
u
d 0,
cosicche la (3.12) segue direttamente dalla (3.11).
La (3.12) è una disequazione dierenziale ordinaria del primo ordine nellin-
cognita v(t) =
_
[u(x, t)[
2
dx; con facile calcolo si vede che essa equivale alla
relazione
v(t) e
t
v(0) +
_
t
0
e
ts
_
C
_
[[
2
d +
_
[f[
2
dx
_
ds,
che è precisamente la tesi.
Come si è visto nellosservazione 3.2.3, il principio del massimo non vale in
generale per aperti illimitati di R
n+1
. Tuttavia, se si assume unipotesi sul
comportamento allinnito della funzione u, tale principio si può estendere
in varie versioni: ci limitiamo a fornire lenunciato pi` u semplice relativo al
caso A = R
n
]0, T[.
Teorema 3.2.6 (di Phragmen-Lindelof) Sia T > 0 e sia u C(R
n
[0, T]) C
2,1
(R
n
]0, T[) una funzione vericante le seguenti proprietà:
(i) u
t
u 0 in R
n
]0, T[,
(ii) u(x, 0) 0 per ogni x R
n
,
(iii) esistono R > 0, K > 0, > 0 tali che
u(x, t) Ke
|x|
2
per [x[ R, t [0, T].
Allora u 0 in R
n
[0, T].
95
Dimostrazione Supponiamo dapprima che valga, in luogo di (iii), lipotesi
pi` u forte
(iii) liminf
|x|
u(x, t) 0 uniformemente rispetto a t [0, T].
Sia > 0. Esiste allora R
> 0 tale che u(x, t) per [x[ R
e t [0, T].
La funzione v = u + verica
_
_
v
t
v 0 in C
= (x, t) R
n
]0, T[: [x[ < R
v(x, 0) 0 per [x[ R
v(x, t) 0 per [x[ = R
, t [0, T].
Per il principio del massimo (proposizione 3.2.2) si ha v 0 in C
. Dunque
u = v per [x[ R
e t [0, T]; pertanto si ha u in R

n
[0, T].
Poiche è arbitrario, concludiamo che u 0 in R
n
[0, T].
Torniamo allipotesi pi` u generale (iii). Fissato > , consideriamo la
funzione ausiliaria
v(x, t) =
e
|x|
2
14t
(1 4t)
n/2
, x R
n
, t
_
0,
1
8
_
.
Con un calcolo laborioso ma non dicile si verica che
v
t
v = 0 in R
n
_
0,
1
8
_
,
e inoltre, ovviamente,
v(x, t) e
|x|
2
in R
n
_
0,
1
8
_
.
Quindi, per > 0 la funzione w = u +v verica
_
_
w
t
w 0 in R
n
_
0,
1
8
T
_
,
w(x, 0) = u(x, 0) +e
|x|
2
0 in R
n
liminf
|x|
w(x, t) 0 uniformemente rispetto a t
_
0,
1
8
_
,
ove lultima proprietà segue osservando che, essendo > , si ha per [x[
sucientemente grande
w(x, t) Ke
|x|
2
+e
|x|
2
> 0.
96
In denitiva w soddisfa le condizioni (i), (ii) e (iii); dunque, per quanto già
dimostrato, si ha w 0 in R
n
[0,
1
8
T], ossia
u(x, t) v(x, t) (x, t) R
n
_
0,
1
8
T
_
.
Ne segue, per larbitrarietà di ,
u 0 in R
n
_
0,
1
8
T
_
.
Se
1
8
T, abbiamo concluso; altrimenti, lintera argomentazione si può
ripetere per le funzioni
u
1
(x, t) = u(x, t +
1
8
), u
2
(x, t) = u(x, t +
2
8
), u
3
(x, t) = u(x, t +
3
8
), ecc.,
e si ottiene la non negatività di u nelle strisce R
n
[
1
8
,
2
8
], R
n
[
2
8
,
3
8
],
R
n
[
3
8
,
4
8
], eccetera, no a ricoprire R
n
[0, T] dopo un numero nito di
passi.
Corollario 3.2.7 (maggiorazione a priori) Sia T > 0 e sia u C(R
n
[0, T]) C
2,1
(R
n
]0, T[) una funzione tale che esistano R > 0, > 0, K > 0
per cui
[u(x, t)[ Ke
|x|
2
per [x[ R, t [0, T].
Allora
[u(x, t)[ sup
xR
n
[u(x, 0)[ +T sup
R
n
[0,T]
[u
t
u[ x R
n
, t [0, T].
Dimostrazione Se il secondo membro della disuguaglianza è innito, non
cè nulla da dimostrare: supponiamo quindi che i due estremi superiori siano
niti. Consideriamo le funzioni
w
(x, t) = sup
xR
n
[u(x, 0)[ +t sup
R
n
[0,T]
[u
t
u[ u(x, t).
Allora si ha, denotando entrambe le funzioni con w,
_
_
w
t
w = sup
R
n
[0,T]
[u
t
u[ (u
t
u) 0 in R
n
[0, T],
w(x, 0) = sup
xR
n
[u(x, 0)[ u(x, 0) 0 in R
n
,
w(x, t) [u(x, t)[ Ke
|x|
2
per [x[ R, t [0, T].
Dal teorema di Phragmen-Lindelof segue che w 0, ossia w
0, in R
n
[0, T], cioè la tesi.

97
Osservazioni 3.2.8 (1) La maggiorazione a priori è ottimale: infatti se
u(x, t) = 1 + t, si ha u
t
u = 1, u(x, 0) = 1 e il corollario precedente
fornisce la stima 1 +t 1 +T in [0, T], che è la pi` u precisa possibile.
(2) Dal corollario precedente si ricava lunicità e dipendenza continua dai
dati in norma uniforme per la soluzione del problema di Cauchy
_
_
u
t
u = f in R
n
]0, T[
u(x, 0) = (x) in R
n
> 0 : [u(x, t)[ = O(e
|x|
2
) uniformemente in [0, T] per [x[ .
(3) In modo del tutto analogo, utilizzando il principio del massimo (propo-
sizione 3.2.2), si dimostra la maggiorazione a priori per un aperto limitato
e per una funzione u C( [0, T]) C
2,1
(]0, T[):
[u(x, t)[ max
_
max
x
[u(x, 0)[, max
[0,T]
[u[
_
+T sup
]0,T[
[u
t
u[
per ogni (x, t) [0, T]; da questa stima si deduce lunicità e la dipendenza
continua dai dati per il problema di Cauchy-Dirichlet (3.8), generalizzando
il corollario 3.2.4.
Finora abbiamo visto teoremi di unicità e di dipendenza continua dai dati,
supponendo, nel caso = R
n
, che le soluzioni avessero un comportamento al-
linnito non peggiore di e
|x|
2
. Ma in realtà esistono soluzioni dellequazione
del calore in R
n
]0, [ che tendono allinnito ancora pi` u rapidamente.
Esempio 3.2.9 (Tikhonov) Consideriamo la funzione olomorfa
g(z) = e
1/z
2
, z C 0,
e deniamo la funzione
u(x, t) =
_
k=0
g
(k)
(t)
(2k)!
x
2k
se t > 0, x R
0 se t = 0, x R.
(3.13)
Formalmente si ha, derivando la serie termine a termine,
_
u
t
= u
xx
in R]0, [
u(x, 0) = 0 in R,
(3.14)
98
e tra poco giusticheremo rigorosamente questi fatti. Da ciò segue che il
problema di Cauchy
_
w
t
w
xx
= f in R]0, [
w(x, 0) = (x) in R,
in cui non si prescrive per la w un andamento al pi` u esponenziale allinnito,
non può avere soluzione unica, poiche se w è soluzione, anche w + u lo è, se
u è la funzione di Tikhonov (3.13). Naturalmente, dato che tutto questo non
deve contraddire il teorema di Phragmen-Lindelof, la funzione (3.13) non può
soddisfare alcuna disuguaglianza della forma
[u(x, t)[ Ke
|x|
2
(x, t) R [0, T]
con , T > 0.
Dimostriamo che vale (3.14). Cominciamo a far vedere che la serie in (3.13) è
uniformemente convergente in ogni semi-striscia della forma [a, a] [, [.
Fissato t , la formula di Cauchy, applicata alla circonferenza C
t
del piano
complesso di centro t e raggio t/2, fornisce
g
(k)
(t) =
k!
2i
_
Ct
g(z)
(z t)
k+1
dz k N. (3.15)
Poiche vale la relazione, di facile verica,
1
z

4
3t
=
2
3t
z C
t
,
si deduce che per ogni z C
t
esiste [0, 2] tale che
1
z
=
4
3t
_
1 +
e
i
2
_
,
da cui
1
z
2
=
16
9t
2
_
1 +
e
2i
4
+e
i
_
,
e dunque
Re
1
z
2
=
16
9t
2
_
1 +
cos 2
4
+ cos
_
4
9t
2
t ,
99
ove lultima disuguaglianza si ottiene minimizzando rispetto a in [0, 2] (il
minimo si ha per = ). Da qui, ricordando (3.15), ricaviamo
[g
(k)
(t)[
k!
2
_
Ct
[g(z)[
[z t[
k+1
[dz[ =
k!
2
_
2
0
e
Re(1/z
2
)
(t/2)
k+1
t
2
d
k!
_
2
t
_
k
e
4
9t
2
;
ottenendo inne
k=0
[g
(k)
(t)[
(2k)!
x
2k
e
4
9t
2
k=0
2
k
k!
(2k)!
x
2k
t
k
e
4
9t
2
k=0
1
k!
x
2k
t
k
= e
4
9t
2
+
x
2
t
, (3.16)
cosicche la serie in (3.13) è convergente. Inoltre è facile constatare che, in
particolare,
lim
N
sup
(x,t)[a,a][,[
k=N
g
(k)
(t)
(2k)!
x
2k
= 0,
il che prova la convergenza uniforme. In modo analogo si dimostra che le
serie
k=0
t
g
(k)
(t)
(2k)!
x
2k
,
k=0
2
x
2
g
(k)
(t)
(2k)!
x
2k
sono uniformemente convergenti in [a, a] [, [. Ne segue u
t
u
xx
= 0 in
R]0, [. Dalla (3.16) segue anche
lim
t0
+
u(x, t) = 0 uniformemente rispetto a x [a, a],
e quindi u C(R [0, [) e u(x, 0) = 0. La validità di (3.14) è provata.
3.3 La soluzione fondamentale
In questo paragrafo ci dedicheremo alla risoluzione esplicita del problema di
Cauchy
_
_
u
t
u = 0 in R
n
]0, [
u(x, 0) = (x) x R
n
,
[u(x, t)[ Ke
|x|
2
(x, t) R
n
[0, [
(3.17)
100
per opportuni , K > 0, ove C(R
n
) L
(R
n
). La soluzione sarà de-
terminata attraverso la costruzione della cosiddetta soluzione fondamentale
dellequazione del calore, per mezzo della quale, come vedremo in segui-
to, risolveremo anche i problemi di Cauchy-Dirichlet e Cauchy-Neumann in
[0, T], con aperto limitato di tipo assai generale.
Denizione 3.3.1 Si chiama soluzione fondamentale dellequazione del ca-
lore la funzione
(x, t) =
e
|x|
2
4t
(4t)
n/2
, (x, t) R
n
]0, [. (3.18)
Osserviamo che, come promette il suo nome, la funzione (x, t) verica
t
= 0 in R
n
]0, [. (3.19)
Infatti risulta, come è facile vericare,
t
(x, t) =
e
|x|
2
4t
(4t)
n/2
_
n
2t
+
[x[
2
4t
2
_
, (3.20)
D
i
(x, t) =
e
|x|
2
4t
(4t)
n/2
_
x
i
2t
_
, i = 1, . . . , n, (3.21)
D
j
D
i
(x, t) =
e
|x|
2
4t
(4t)
n/2
_
x
j
x
i
4t
2

ij
2t
_
, i, j = 1, . . . , n, (3.22)
e in particolare
D
2
i
(x, t) =
e
|x|
2
4t
(4t)
n/2
_
x
2
i
4t
2

1
2t
_
, i = 1, . . . , n, (3.23)
da cui la (3.19).
Da dove scaturisce e come si utilizza la soluzione fondamentale? Cominciamo
con un calcolo euristico. Supponiamo che u sia una soluzione (che sappiamo
essere unica) del problema (3.17). Andiamo ad applicare la trasformata di
Fourier allequazione u
t
u = 0.
Ricordiamo che la trasformata di Fourier è loperatore T denito su L
1
(R
n
)
dalla corrispondenza f

f, ove
Tf() =

f() =
_
R
n
e
i x
f(x) dx, R
n
;
101
esso è bigettivo da o(R
n
) in o(R
n
), ove
o(R
n
) = f C
(R
n
) : x x
f(x) L
(R
n
) , N
n
,
e si estende univocamente ad un isomorsmo dello spazio di Hilbert L
2
(R
n
)
in se, con
|Tf|
L
2
(R
n
)
= (2)
n
2
|f|
L
2
(R
n
)
f L
2
(R
n
).
Inoltre la trasformata di Fourier gode delle seguenti proprietà:
D
j
u() = i
j
u() R
n
, u C
1
(R
n
) con u, D
j
u L
1
(R
n
), (3.24)
f g() =

f() g() R
n
, f, g L
1
(R
n
), (3.25)
ove il simbolo denota il prodotto di convoluzione fra due funzioni:
g h(x) = h g(x) =
_
R
n
g(x y)h(y) dy, x R
n
.
Applichiamo dunque la trasformata di Fourier (rispetto alla variabile x, con
t > 0 ssato), senza preoccuparci troppo del fatto che, a priori, la funzione
u(, t) potrebbe non essere in L
1
(R
n
): il conto che segue, in eetti, serve solo a
costruire una candidata soluzione. Si ottiene, tenuto conto della proprietà
(3.24),
u
t
(, t) +[[
2
u(, t) = 0 (, t) R
n
]0, [, (3.26)
mentre dalla condizione iniziale si ricava
u(, 0) = () R
n
. (3.27)
Le condizioni (3.26)-(3.27) determinano un problema di Cauchy per una
equazione ordinaria del primo ordine, dipendente dal parametro . La sua
unica soluzione è
u(, t) = () e
||
2
t
, (, t) R
n
]0, [.
Daltra parte è noto, benche la verica richieda qualche accorgimento tecnico,
che
e
||
2
t
=
1
(4t)
n/2
| |
2
4t
() = T
_
e
| |
2
4t
(4t)
n/2
_
(),
102
cosicche
u(, t) = T()() T
_
e
| |
2
4t
(4t)
n/2
_
(),
e, per la proprietà (3.25), concludiamo che se u è soluzione di (3.17), allora
u è data da
u(x, t) =
e
| |
2
4t
(4t)
n/2
(x) =
1
(4t)
n/2
_
R
n
e
|xy|
2
4t
(y) dy, (3.28)
ossia
u(x, t) =
_
R
n
(x y, t)(y) dy, (x, t) R
n
]0, [. (3.29)
La soluzione fondamentale, pertanto, permette di scrivere la (candidata) so-
luzione del problema di Cauchy (3.17) come un integrale di convoluzione, in
termini del dato iniziale.
Osservazione 3.3.2 Prendiamo, in particolare, una successione di dati ini-
ziali della forma
(y) =
1
_
y
_
,
con C
0
(R
n
) ssata, nulla fuori di B(0, 1) e tale che
_
R
n
(y) dy = 1;
allora le misure
(y)dy convergono debolmente alla misura di Dirac

0
(ossia risulta, come è facile vericare,
lim
0
+
_
R
n
g(y)
(y) dy =
0
, g) = g(0) g C(R
n
)).
Dunque, detta u
(x, t) la corrispondente funzione (3.29), si ha

lim
0
+
u
(x, t) = (x, t).

Possiamo dunque interpretare la soluzione fondamentale come la risposta,
allistante t, di un impulso partito allistante 0 nel punto x.
Proviamo ora che la candidata soluzione (3.29) è davvero una soluzione
dimostrando il teorema di esistenza seguente:
103
Teorema 3.3.3 Se C(R
n
) L
(R
n
), allora il problema (3.17) ha unu-
nica soluzione u data dalla (3.29), ove è la soluzione fondamentale delle-
quazione del calore denita da (3.18). Inoltre u C
2,1
(R
n
]0, [) C(R
n
[0, [) L
(R
n
]0, [) e si ha
|u|
L
(R
n
[0,[)
||
L
(R
n
)
.
Dimostrazione Dobbiamo far vedere che la funzione (3.29) è soluzione di
(3.17). Questo non è troppo complicato: infatti nella soluzione fondamentale
è presente unesponenziale negativa che permette di derivare la funzione u
quante volte si vuole portando la derivata sotto il segno di integrale.
`
E facile
allora vericare che u
t
= u in ogni punto di R
n
]0, [.
Pi` u delicato è vericare che
u(x
0
, 0) = lim
(x,t)(x
0
,0)
u(x, t) = (x
0
) x
0
R
n
: (3.30)
a questo scopo, notiamo per cominciare che
_
R
n
e
|xy|
2
4t
(4t)
n/2
dy =
n/2
_
R
n
e
||
2
d = 1 t > 0, (3.31)
per cui, ssato x
0
R
n
, possiamo scrivere la dierenza u(x, t) (x
0
) nel
modo seguente:
u(x, t) (x
0
) =
_
R
n
e
|xy|
2
4t
(4t)
n/2
[(y) (x
0
)] dy. (3.32)
Sia > 0: poiche è continua in x
0
, esiste > 0 tale che [(y) (x
0
)[ <
per [y x
0
[ < . Inoltre esiste > 0 tale che
_
||>r
e
||
2
d < r .
Da (3.32) segue allora, posto = y x
0
e successivamente =
xx
0
t
,
[u(x, t) (x
0
)[ =
_
R
n
e
|xx
0
|
2
4t
(4t)
n/2
[(x
0
+) (x
0
)] d

_
||<
e
|xx
0
|
2
4t
(4t)
n/2
d + 2||
_
||
e
|xx
0
|
2
4t
(4t)
n/2
d <
< + 2
n/2
||
_
|2
t+xx
0
|
e
||
2
d.
104
Dunque, per ogni (x, t) tale che [x x
0
[ <

2
e 0 < t <

2
16
2
, otteniamo
[u(x, t) (x
0
)[ < + 2
n/2
||
_
||
e
||
2
d < C,
ove C è unopportuna costante. Pertanto la (3.30) è vericata.
Inne, utilizzando (3.31) si verica immediatamente che
|u|
||
,
e ciò prova che la funzione (3.28) risolve il problema (3.17).
Osservazioni 3.3.4 (1) La soluzione dellequazione del calore fornita dal
teorema 3.3.3 è di classe C
(anzi analitica, come vedremo) in R

n
]0, [,
anche se il dato iniziale è solo una funzione continua: cè quindi un feno-
meno di regolarizzazione nel tempo che è tipico delle equazioni paraboliche
e non si riscontra invece nelle iperboliche. Questa proprietà è unaltra simi-
litudine fra equazioni paraboliche ed ellittiche.
(2) Se, invece della condizione u C(R
n
[0, [) e u(x, 0) = (x) per ogni
x R
n
, richiedessimo la condizione (pi` u debole di (3.30))
lim
t0
+
u(x, t) = (x) x R
n
,
perderemmo lunicità della soluzione. Ad esempio, per n = 1, la funzione
(3.21), ossia
v(x, t) =

x
(x, t) =
2
x e
x
2
4t
(4t)
3/2
risolve lequazione v
t
v
xx
= 0 in R]0, [, è continua in R[0, [(0, 0)
ed ha limite nullo per t 0 in ogni punto x R, senza essere identica-
mente nulla; daltra parte la funzione identicamente nulla gode delle stesse
proprietà.
(3) Abbiamo sempre preso t = 0 come istante iniziale nel problema di Cau-
chy: nulla vieta però di scegliere invece un qualunque s R. La soluzione
del problema (3.17) con istante iniziale s è
u(x, t) =
_
R
n
(x y, t s) (y) dy, (x, t) R
n
]s, [. (3.33)
105
(4) Il problema di Cauchy a ritroso nel tempo non è ben posto, perche manca
la dipendenza continua dai dati: ad esempio, per ogni > 0, la funzione
u
(x, t) = e
2
sin
x
risolve lequazione del calore in R R ed anche, in particolare, il problema

di Cauchy allindietro
_
(u
)
t
u
= 0 in R] , 0[
u
(x, 0) = sin
x
x R.
Benche si abbia sin
x
0 uniformemente per 0
+
, risulta per ogni
T > 0
|u
|
C(R
n
[T,0])
= e
T/
2
+ per 0
+
.
Questo fatto illustra in qualche senso lirreversibilità dei fenomeni di diu-
sione.
(5) Sia una funzione continua e non negativa su R
n
, non identicamen-
te nulla e tale che = 0 fuori della palla B(x
0
, r). Allora la soluzione
u(x, t) =
_
R
n
(x , t)() d è strettamente positiva per ogni t > 0 e
x R
n
. Questo ci dice che nei problemi parabolici le perturbazioni si propa-
gano con velocità innita.
(6) Cè una versione pi` u generale del teorema 3.3.3, nella quale il dato iniziale
verica la condizione
C(R
n
), x (x)e
|x|
2
L
(R
n
)
per un ssato > 0. Sotto queste ipotesi si può provare che la funzione (3.29)
è soluzione del problema in R
n
]0, T] per ogni T <
1
4
. La dimostrazione
è analoga, con qualche complicazione in pi` u per vericare che le derivazioni
sotto il segno di integrale sono ancora lecite.
La soluzione fondamentale (x, t) utilizzata nella dimostrazione del teorema
3.3.3 gode, come abbiamo visto, di svariate interessanti proprietà, che qui
rielenchiamo. Anzitutto (si veda (3.19)) essa risolve lequazione del calore in
R
n
]0, [. Poi, per (3.31), per ogni t > 0 tale funzione è la densità di una
misura
t
su R
n
di massa unitaria:
t
(E) =
_
E
(x, t) dx,
t
(R
n
) = 1 t > 0. (3.34)
106
Inoltre, le relazioni (3.30) e (3.29) ci dicono che le misure
t
, pensate come
operatori lineari e continui sullo spazio di Banach C(R
n
) L
(R
n
), conver-
gono debolmente* alla misura di Dirac
0
per t 0
+
, ossia risulta, per ogni
C(R
n
) L
(R
n
):
lim
t0
+
t
, ) = lim
t0
+
_
R
n
(x, t)(x) dx = (0) =
0
, ).
Inne, osserviamo che, denotando con u(x, t; s, ) la funzione (3.33), ossia la
soluzione del problema (con K > 0, > 0 e s R ssati)
_
_
u
t
u = 0 in R
n
]s, [
u(x, s) = (x) x R
n
[u(x, t)[ Ke
|x|
2
(x, t) R
n
[s, [,
(3.35)
si vede immediatamente che essa è continua rispetto a (x, t, s) in R
n
(t, s) :
0 t s, nonche lineare rispetto a . Inoltre, per unicità, si ha
u(x, t; s, ) = u(x, t; , u(, ; s, )) [s, t].
Introducendo loperatore
t
: C(R
n
) L
(R
n
) C(R
n
) L
(R
n
), denito
per ogni t > 0 da
(
t
)(x) = u(x, t; 0, ) x R
n
, C(R
n
) L
(R
n
),
si ottiene allora che ciascun
t
è lineare e continuo sullo spazio C(R
n
)
L
(R
n
), con norma uguale a 1, e la famiglia
t
t0
è un semigruppo di
operatori, ossia verica
0
= I,
t+
=
t

t, 0;
scrivendo esplicitamente questa relazione applicata a una generica , e ap-
plicando il teorema di Fubini, si ottiene in particolare, per larbitrarietà di
, la seguente identità soddisfatta dalla soluzione fondamentale:
(x , t +) =
_
R
n
(x y, t)(y , ) dy x, R
n
, t, > 0.
La formula (3.33) ha uninterpretazione sica in termini di calore e tempe-
ratura, alla quale si è già sommariamente accennato (osservazione 3.3.2). La
107
quantità (x , t s) è la temperatura che si ha nel punto x allistante
t, indotta da unemanazione di calore unitaria, avvenuta istantaneamente
al tempo s e concentrata nel punto . Il contributo alla temperatura in
x al tempo t dovuto al calore presente in al tempo s è dunque pari a
(x , t s)(). La somma di tutti i contributi emanati allistante s, che
determina la temperatura eettiva u(x, t) nel punto x al tempo t, è dunque
data dallintegrale
_
R
n
(x , t s)() d.
Useremo la soluzione fondamentale per costruire le soluzioni di svariati pro-
blemi ai limiti. A questo scopo è necessario procurarci alcune utili maggio-
razioni per essa e per le sue derivate.
Proposizione 3.3.5 Sia la soluzione fondamentale dellequazione del ca-
lore. Allora esistono C, L > 0 tali che per ogni x, x
0
R
n
e per ogni t > 0 si
ha:
(i) [(x, t)[ C t
n
2
e
L
|x|
2
t
;
(ii) [D
i
(x, t)[ C t
n+1
2
e
L
|x|
2
t
, i = 1, . . . , n;
(iii) [
t
(x, t)[ C t
n+2
2
e
L
|x|
2
t
;
(iv) [D
i
D
j
(x, t)[ C t
n+2
2
e
L
|x|
2
t
, i, j = 1, . . . , n;
(v) [(x, t) (x
0
, t)[ C [x x
0
[
n+
2
e
L
(|x||x
0
|)
2
t
per ogni [0, 1];
(vi) [D
i
(x, t) D
i
(x
0
, t)[ C [x x
0
[
n+1+
2
e
L
(|x||x
0
|)
2
t
, i = 1, . . . , n,
per ogni [0, 1].
Dimostrazione Sono tutte veriche facili che si fanno per mezzo di una
stima esplicita, partendo dalle (3.18), (3.20), (3.21) e (3.22). Verichiamo la
(vi) che si ottiene invece per interpolazione (come la (v), ma questultima è
analoga e ancora pi` u semplice). Usando (ii) si ha
[D
i
(x, t) D
i
(x
0
, t)[ [D
i
(x, t)[ +[D
i
(x
0
, t)[
2C t
n+1
2
e
L
(|x||x
0
|)
2
t
,
mentre usando (iv) e il teorema del valor medio si trova
[D
i
(x, t) D
i
(x
0
, t)[ = [D
i
(, t) (x x
0
)[
nC [x x
0
[ t
n+2
2
e
L
(|x||x
0
|)
2
t
;
108
dunque, ssato [0, 1], possiamo scrivere
[D
i
(x, t) D
i
(x
0
, t)[ = [D
i
(x, t) D
i
(x
0
, t)[
(1)+
_
2C t
n+1
2
e
L
(|x||x
0
|)
2
t
_
1
_
nC [x x
0
[ t
n+2
2
e
L
(|x||x
0
|)
2
t
_
,
da cui segue subito la tesi.
Concludiamo questo paragrafo mostrando che la soluzione del problema di
Cauchy (3.17) è una funzione analitica per qualunque dato C(R
n
)
L
(R
n
), come annunciato nellosservazione 3.3.4(1).
Teorema 3.3.6 Se u risolve il problema di Cauchy (3.17) in R
n
]0, [,
allora u è analitica in R
n
]0, [.
Dimostrazione Anzitutto, la soluzione fondamentale è ben denita in cam-
po complesso: infatti lespressione
(z, ) =
e
z z
4
(4)
n/2
ha senso, ed è anzi olomorfa, per z C
n
e C con Re > 0, se si prende
come radice quadrata di quella con parte reale positiva. Inoltre, per ogni
R
n
, per ogni z = x + iy C
n
, e per ogni = t + i con t > 0 si ha,
ponendo =

t
(cosicche
1 +
2
=
||
t
):
[(z , )[ =
(4)
n/2
(z) (z)
4
=
= (4t
1 +
2
)
n/2
(x+iy) (x+iy)
4t(1+i)
1i
1i
=
= (4t
1 +
2
)
n/2
e
|x|
2
+|y|
2
2y (x)
4t(1+
2
)
e
2
|y|
2
4t(1+
2
)
e

2
|y|
2
4t(1+
2
)
=
= (1 +
2
)
n/4
(4t(1 +
2
))
n/2
e
|y|
2
4t
e
|x+y|
2
4t(1+
2
)
=
= (1 +
2
)
n/4
e
|y|
2
4t
(x +y, t(1 +
2
)).
Ne segue che per ogni C(R
n
) L
(R
n
) lintegrale
_
R
n
(z , )() d
è convergente per ogni (z, ) C
n+1
con Re > 0; quindi esso denisce una
funzione u(z, ) continua che estende la soluzione del problema (3.17) alla
109
regione di C
n+1
sopra descritta.
Analogamente si verica che tutte le derivate di u rispetto a x, y, t, si ot-
tengono derivando sotto il segno di integrale e sono continue in A = (z, )
C
n+1
: Re > 0. Ma allora, poiche , essendo olomorfa, verica in quella
regione le equazioni di Cauchy-Riemann
_
D
y
j
= iD
x
j
, j = 1, . . . , n
= i
t
,
lo stesso accadrà per la u, che dunque è anchessa olomorfa nella regione A.
In particolare, u(x, t) è una funzione analitica in R
n
]0, [.
Osservazione 3.3.7 Un risultato analogo vale per la soluzione del problema
di Cauchy (3.17) quando il dato iniziale è supposto continuo e tale che
x (x)e
|x|
2
L
(R
n
); lunica dierenza è che la soluzione u si estenderà
olomorcamente nella regione
_
(z, ) C
n+1
: Re > 0, [Im[ <
_
1 4T
4T
Re
_
T
_
0,
1
4
_
.
In particolare, u sarà analitica in R
n
]0, T[ per ogni T ]0,
1
4
[.
3.4 Il problema di Cauchy non omogeneo
La soluzione fondamentale è basilare anche per costruire la soluzione del
problema di Cauchy non omogeneo
_
_
u
t
u = f in R
n
]0, [,
u(x, 0) = 0 x R
n
,
[u(x, t)[ Ke
|x|
2
(x, t) R
n
[0, [,
(3.36)
con f C(R
n
[0, [)L
(R
n
]0, [). Vale un metodo di variazione delle
costanti arbitrarie analogo al caso delle equazioni dierenziali ordinarie.
Dal punto di vista sico, infatti, f(, s) rappresenta una sorgente che emana
calore nel punto allistante s: quindi (x, t s)f(, s) è il contributo di
calore, emesso nel punto al tempo s, che va ad inuenzare la temperatura
110
nel punto x allistante t. La somma di tutti questi contributi, al variare del
punto e dellistante di emanazione, è lintegrale
_
t
0
_
R
n
(x , t s)f(, s) dds,
il quale dunque deve coincidere con la soluzione calcolata in (x, t). E in eetti
vale il seguente risultato:
Teorema 3.4.1 Se f C(R
n
[0, [) L
(R
n
[0, [) e se inoltre
essa è holderiana di esponente ]0, 1] rispetto a x oppure rispetto a t,
uniformemente nellaltra variabile, allora la funzione
u(x, t) =
_
t
0
_
R
n
(x , t s)f(, s) dds, (x, t) R
n
[0, [, (3.37)
appartiene a C(R
n
[0, [) C
2,1
(R
n
]0, [) e risolve il problema (3.36).
Inoltre si ha
|u|
L
(R
n
[0,T])
T|f|
L
(R
n
[0,T])
T > 0.
Dimostrazione Lipotesi su f dice che esiste K 0 tale che
[f(x, t) f(x
, t)[ K[x x
x, x
R
n
, t 0, (3.38)
oppure
[f(x, t) f(x, t
)[ K[t t
x R
n
, t, t
0. (3.39)
Abbiamo una candidata soluzione u, data da (3.37), e motivata dalle conside-
razioni siche sopra esposte. Per vericare che essa è soluzione per davvero,
dobbiamo derivare sotto il segno di integrale: cominciamo dunque col giu-
sticare tale possibilità. Il problema non è banale, perche lintegrando che
compare nella denizione di u contiene una singolarità nellestremo t.
Supponiamo che f soddis (3.38) e ssiamo > 0. Per 0 < h < conside-
riamo le funzioni
u
h
(x, t) =
_
th
0
_
R
n
(x , t s)f(, s) dds, (x, t) R
n
[, [.
Esse sono ovviamente derivabili rispetto a t (abbiamo tolto la singolarità
dellintegrando in s = t) e si ha
u
h
t
(x, t) =
_
R
n
(x, h)f(, th) d +
_
th
0
_
R
n
t
(x, ts)f(, s) dds;
111
osservando che, in virt` u della (3.34), risulta
_
R
n
t
(x , t s) d =
d
dt
1 = 0 t > s,
possiamo anche scrivere
u
h
t
(x, t) =
_
R
n
(x , h)f(, t h) d +
+
_
th
0
_
R
n
t
(x , t s)[f(, s) f(x, s)] dds.
Daltra parte si ha
[u
h
(x, t) u(x, t)[ =
_
t
th
_
R
n
(x , t s)f(, s) dds
|f|
_
t
th
_
R
n
(x , t s) dds = |f|
h,
cosicche u
h
u per h 0 uniformemente in R
n
[, [. In particolare, u è
continua in R
n
]0, [. Inoltre la continuità di u per t = 0, con u(x, 0) = 0,
è evidente dallesame della formula (3.37).
Per quanto riguarda (u
h
)
t
, tenuto conto di (3.32) e (3.30) lipotetico limite
per h 0 dovrebbe essere, almeno formalmente,
w(x, t) := f(x, t) +
_
t
0
_
R
n
t
(x , t s)[f(, s) f(x, s)] dds. (3.40)
Verichiamo intanto che questa espressione ha senso: si ha, ricordando la
proposizione 3.3.5(ii) e la (3.38), e utilizzando il cambiamento di variabili
_
L
ts
( x) = y,
_
t
0
_
R
n
t
(x , t s)[f(, s) f(x, s)] dds
C
_
t
0
_
R
n
(t s)
n
2
1
K[ x[
L|x|
2
(ts)
dds =
= L
n/2
CK
_
t
0
_
R
n
(t s)
1+
2
[y[
e
|y|
2
dyds < .
112
Valutiamo allora la dierenza (u
h
)
t
w:
u
h
t
(x, t) w(x, t)
_
R
n
(x , h)f(, t h) d f(x, t)
+
+
_
t
th
_
R
n
t
(x , t s)[f(, s) f(x, s)] dds
.
Per il primo addendo si ha, con un cambiamento di variabili, e ricordando la
proposizione 3.3.5(i) e il fatto che t f(x, t) è continua,
_
R
n
(x , h)f(, t h)d f(x, t)
_
R
n
(x , h)[f(, t h) f(x, t h)]d
+[f(x, t h) f(x, t)[

L
n/2
CK[h[
/2
_
R
n
[[
e
||
2
d + o(1) = o(1) per h 0,
mentre il secondo termine è evidentemente anchesso innitesimo per h 0,
trattandosi dellintegrale di una funzione sommabile su un intervallo che va
riducendosi a un punto. Si noti inoltre che le convergenze ottenute sono
uniformi in R
n
[, M] per ogni M > .
Abbiamo cos`
u
h
u,
u
h
t
w uniformemente in R
n
[, M] :
ciò implica, essendo e M arbitrari, che esiste
u
t
= w in R
n
]0, [.
In maniera assolutamente analoga si prova che esiste u in R
n
]0, [, e che
u(x, t) =
_
t
0
_
R
n
(x , t s)[f(, s) f(x, s)] dds, (3.41)
e poiche verica lequazione del calore, da (3.40) e (3.41) si ottiene subito
u
t
u = f in R
n
]0, [. La tesi del teorema è provata nel caso in cui f è
holderiana rispetto alla variabile x.
Se invece vale la condizione (3.39), si procede nello stesso modo, trovando
stavolta:
u
t
(x, t) =
_
t
0
_
R
n
t
(x , t s)[f(, s) f(, t)] dds+
+
_
R
n
(x , t)f(, t) d,
u(x, t) =
_
t
0
_
R
n
(x , t s)[f(, s) f(, t)] dds+
+
_
R
n
(x , t)f(, t) d f(x, t),
113
da cui nuovamente si ottiene u
t
u = f in R
n
]0, [.
La soluzione fondamentale verrà anche impiegata, nel seguito, per risolvere
i problemi di Cauchy-Dirichlet e di Cauchy-Neumann per lequazione del
calore omogenea, con dato iniziale nullo, in un aperto R
n
:
_
_
u
t
u = 0 in ]0, T],
u(x, 0) = 0 in ,
u(x, t) = (x, t) (x, t) [0, T],
(3.42)
_
_
u
t
u = 0 in ]0, T],
u(x, 0) = 0 in ,
u
(x, t) = (x, t) (x, t) [0, T].

(3.43)
ove, in entrambi i casi, supporremo che C( [0, T]), e che sia un
aperto limitato con frontiera regolare.
Prima di avviarci alla risoluzione di tali problemi, occorre però uno studio
preliminare delle equazioni integrali di Volterra, che, come vedremo, gioche-
ranno un ruolo fondamentale. A questo studio è dedicato il paragrafo che
segue.
3.5 Equazioni integrali di Volterra
Le equazioni integrali di Volterra sono equazioni funzionali del tipo
g(x) +
_
X
K(x, y) g(y) d(y) = f(x), x X,
ove (X, ) è uno spazio misurato, la funzione K (detta nucleo) è sommabile
in X X rispetto alla misura prodotto , f è una funzione nota, ap-
partenente a L
p
(X, ), 1 p , oppure a C(X) (quando X è anche uno
spazio metrico compatto), e g è lincognita, che si cerca nello stesso spazio a
cui appartiene f. Piuttosto che fare uno studio generale, noi ci limiteremo
ad equazioni integrali della forma seguente:
q(x, t)+
_
t
0
_
K(x, , t, )q(, ) d
d = p(x, t), (x, t) [0, T], (3.44)

114
ove è un aperto limitato di R
n
1
, p C([0, T])
è assegnata, q C( [0, T]) è lincognita, e inne il nucleo K(x, , t, ) è
una funzione continua in [0, T] [0, T] ad eccezione dei punti in
cui x = oppure t = , e verica la stima
[K(x, , t, )[ H[t [
1
[x [
n+1
x ,= , t ,= , (3.45)
ove , sono numeri positivi.
Deniamo loperatore integrale J sullo spazio C( [0, T]) nel modo se-
guente:
(Jq)(x, t) =
_
t
0
_
K(x, , t, )q(, ) d
d, q C( [0, T]). (3.46)

Allora lequazione (3.44) si può scrivere cos`:
(I +J)q = p;
la sua soluzione è
q = (I +J)
1
p =
m=0
(1)
m
J
m
p, (3.47)
purche la serie sopra scritta converga in qualche senso; naturalmente J
m
signica J J J (m volte). Proveremo:
(a) che J e le sue potenze J
m
sono operatori lineari e continui di C(
[0, T]) in se;
(b) che tali operatori sono operatori integrali con nucleo costruito esplicita-
mente;
(c) che la serie in (3.47) converge nello spazio C( [0, T]).
Questi fatti ci permetteranno di risolvere univocamente lequazione di Vol-
terra (3.44), con soluzione che dipenderà con continuità dal secondo membro.
Cominciamo lo studio della (3.44) con alcuni lemmi.
Lemma 3.5.1 Sia R
n
1
. Se
0 < n 1, esiste N
0 tale che
_
[x [
n+1
[ y[
n+1
d
[x y[
n+1
x, y .
115
Dimostrazione Per ogni x, , y si ha
[x [
n+1
[ y[
n+1
=
_
[x y[
[x [ [ y[
_
n1
[x y[
n+1
_
[x [ +[ y[
[x [ [ y[
_
n1
[x y[
n+1
=
=
_
1
[ y[
+
1
[x [
_
n1
[x y[
n+1
.
Integrando rispetto a su si trova (per subadditività se 0 n1 < 1,
per convessità se n 1 1):
_
[x [
n+1
[ y[
n+1
d
C[x y[
n+1
sup
1
[ [
n1
d
,
ove C = max2, 2
n1
. La tesi segue osservando che lesponente dellin-
tegrando a secondo membro è strettamente minore della dimensione della
varietà dove si integra, cosicche lestremo superiore è certamente nito.
Lemma 3.5.2 Sia la funzione di Eulero, denita da
() =
_

0
q
1
e
q
dq, > 0.
Allora
_
1
0
q
1
(1 q)
1
dq =
()()
( +)
, > 0.
Dimostrazione Calcoliamo lintegrale
I =
_

0
_

0
q
21
p
21
e
p
2
q
2
dpdq
in due modi. Separando le variabili si trova
I =
_

0
q
21
e
q
2
dq
_

0
p
21
e
p
2
dp =
=
1
4
_

0
t
1
e
t
dt
_

0
t
1
e
t
dt =
()()
4
.
116
Utilizzando le coordinate polari si ha invece
I =
_

0
_
/2
0
2+22
cos
21
sin
21
e
2
dd =
=
_

0
2+21
e
2
d
_
/2
0
cos
21
sin
21
d,
da cui, posto r =
2
e p = cos
2
,
I =
( +)
4
_
1
0
p
1
(1 p)
1
dp.
Uguagliando le due espressioni di I, si ha la tesi.
Lemma 3.5.3 Sia la funzione di Eulero. Allora per ogni > 0 la serie
di potenze
m=0
x
m
(m)
ha raggio di convergenza +.
Dimostrazione La tesi segue facilmente applicando il criterio del rapporto,
il lemma 3.5.2 ed il teorema di convergenza dominata.
Nel lemma che segue si introducono i nuclei per mezzo dei quali si rappre-
sentano le potenze delloperatore integrale J denito in (3.46).
Lemma 3.5.4 Sia R
n
1
.
Sia J loperatore denito in (3.46) e supponiamo che il suo nucleo K sia una
funzione continua per x ,= e t ,= , vericante la condizione (3.45). Allora
per ogni m N
+
si ha
(J
m
q)(x, t) =
_
t
0
_
K
m
(x, , t, )q(, ) d
d, q C([0, T]), (3.48)

ove K
m
è denito da
_
K
1
(x, , t, ) = K(x, , t, ),
K
m
(x, , t, ) =
_
t
K(x, , t, s)K
m1
(, , s, ) d
ds m > 1.
Inoltre K
m
è continuo per x ,= e t ,= , e per ogni m N
+
vale la stima
[K
m
(x, , t, )[ H
m
N
m1
()
m
(m)
[t [
m1
[x [
n+1
. (3.49)
117
Dimostrazione La stima è banale per m = 1. Se essa è vera per m 1,
allora dalla (3.45) e dallipotesi induttiva, utilizzando i lemmi 3.5.2 e 3.5.1,
segue
[K
m
(x, , t, )[
H
m
N
m2
()
m1
((m1))

_
t
[t s[
1
[x [
n+1
[s [
(m1)1
[ [
n+1
d
ds
H
m
N
m2
()
m1
((m1))
_
t
(t s)
1
[s [
(m1)1
ds
[x [
n+1
[ [
n+1
d

H
m
N
m1
()
m
(m)
[t [
m1
[x y[
n+1
.
Ci` o prova la (3.49). Questa, a sua volta, permette di denire loperatore
integrale che appare in (3.48); occorre provare che tale operatore coincide
con la potenza J
m
. In eetti ciò è banalmente vero per m = 1; se poi la
(3.48) vale per m1, allora
(J
m
q)(x, t) =
_
t
0
_
K(x, , t, s)(J
m1
q)(, s) d
ds =
=
_
t
0
_
K(x, , t, s)
_
s
0
_
K
m1
(, , s, )q(, ) d
dd
ds =
=
_
t
0
_
__
t
K(x, , t, s)K
m1
(, , s, ) d
ds
_
q(, ) d
d =
=
_
t
0
_
K
m
(x, , t, )q(, ) d
d,
e la formula (3.48) è provata.
Corollario 3.5.5 Sia J loperatore integrale denito da (3.46). Allora per
ogni m N
+
risulta J
m
/(C( [0, T])), con
|J
m
|
L(C([0,T]))
BH
m
N
m1
T
m
()
m
(m)
,
ove B = sup
x
_
[x [
n+1
d
.
118
Dimostrazione Dal lemma precedente e dalla stima (3.49) segue facilmente
che per ogni (x, t) [0, T] si ha
[J
m
q(x, t)[
_
t
0
_
[K
m
(x, , t, )q(, )[ d
_
t
0
_
H
m
N
m1
()
m
(m)
[t [
m1
[x [
n+1
d
d |q|
C([0,T])

H
m
N
m1
T
m
()
m
(m)
_
[x [
n+1
d
|q|
C([0,T])
da cui la tesi.
Come conseguenza del lemma precedente e del lemma 3.5.3, è ben denito il
nucleo
Q(x, , t, ) =
m=1
(1)
m
K
m
(x, , t, ) (3.50)
per ogni x, e t, [0, T] con x ,= e t ,= : infatti tale serie è
totalmente convergente in ogni insieme della forma
(x, , t, ) [0, T] [0, T] : [x [ , [t [ ,
in virt` u della maggiorazione
[Q(x, , t, )[
m=1
H
m
N
m1
()
m
(m)
[t [
m1
[x [
n+1
K[t [
1
[x [
n+1
.
Si noti che in eetti, salvo i primi addendi in cui m < 1, i termini della
serie (3.50) sono regolari anche per t = .
Possiamo nalmente enunciare il risultato fondamentale relativo allequazio-
ne (3.44):
Teorema 3.5.6 Sia R
n
1
e sia K(x, , t, ) una funzione continua per x ,= e t ,= , vericante la
condizione (3.45). Allora per ogni p C([0, T]) lequazione integrale di
Volterra
q(x, t) +
_
t
0
_
K(x, , t, )q(, ) d
d = p(x, t), (x, t) [0, T],

119
ha lunica soluzione
q(x, t) = p(x, t) +
_
t
0
_
Q(x, , t, )p(, ) d
d,
ove Q è il nucleo denito in (3.50). Inoltre si ha
|q|
C([0,T])
C|p|
C([0,T])
. (3.51)
Dimostrazione Sia R loperatore integrale di nucleo Q. Allora, per (3.50)
e (3.48), e per convergenza dominata,
(Rp)(x, t) =
_
t
0
_
m=1
(1)
m
K
m
(x, , t, )p(, ) d
d =
=
m=1
(1)
m
_
t
0
_
K
m
(x, , t, )p(, ) d
d =
m=1
(1)
m
(J
m
p)(x, t);
dunque, posto q = p +Rp, si ha
q +Jq = p +Rp +Jp +JRp =
= p +
m=1
(1)
m
J
m
p +Jp +
m=1
(1)
m
J
m+1
p =
= p +
k=1
(1)
k
J
k
p +
k=1
(1)
k1
J
k
p = p.
La stima (3.51) segue subito dalla formula di rappresentazione di q.
Lunicità della soluzione dellequazione si dimostra facilmente: se q è una
soluzione dellequazione (3.44) con p = 0, allora per ogni b ]0, T] si ha
[q(x, t)[
_
t
0
_
K(x, , t, )q(, ) d
|q|
C([0,b])
_
t
0
_
H[t [
1
[x [
n+1
d
d
C|q|
C([0,b])
t
(x, t) [0, b],

da cui q = 0 in [0, b], pur di scegliere b in modo che Cb
< 1. Allora
lequazione (3.44) diventa
q(x, t) +
_
t
b
_
K(x, , t, )q(, ) d
d = 0, (x, t) [b, T].

Ripetendo la precedente argomentazione un numero nito di volte si ottiene
q = 0 in [0, T].
120
3.6 I problemi di Cauchy-Neumann e di Cau-
chy-Dirichlet
Consideriamo i problemi di Cauchy-Dirichlet (3.42) e di Cauchy-Neumann
(3.43) per lequazione del calore omogenea, con dato iniziale nullo, in un
aperto R
n
. Supporremo che C( [0, T]) e che sia un aperto
limitato con frontiera di classe C
1+
, 0 < 1: ciò signica che per ogni
x
0
esistono un intorno U di x
0
in R
n
ed una funzione F : U B(0, 1)
R
n
, tale che
_
_
F C
1+
(U, R
n
);
F è biunivoca e [ det F(x)[ , = 0 per ogni x U;
F(U ) = y B(0, 1) : y
n
> 0;
F(U ) = y B(0, 1) : y
n
= 0.
(3.52)
Come si sa (teorema 3.2.5), cè unicità della soluzione per entrambi i pro-
blemi; vogliamo determinare la soluzione nel modo pi` u esplicito possibile.
Useremo ancora, come si è già preannunciato, la soluzione fondamentale
(x , t ) =
e
|x|
2
4(t)
(4(t ))
n/2
.
Poiche il metodo è lo stesso per i due problemi, faremo tutti i conti nel caso
del problema di Cauchy-Neumann, mentre ci limiteremo ad alcuni accenni
per il problema di Cauchy-Dirichlet (osservazione 3.6.5(3)).
Teorema 3.6.1 Sia R
n
1+
,
ove ]0, 1]. Per ogni C( [0, T]) il problema (3.43) ha ununica
soluzione u C( [0, T]) C
2,1
(]0, T]).
Osserviamo che la soluzione non appartiene, in generale, a C
1
( [0, T]), e
quindi la condizione
u
(x, t) = (x, t), (x, t) ]0, T], vale in un oppor-

tuno senso generalizzato.
Dimostrazione Cercheremo una soluzione del problema (3.43) nella forma
cosiddetta di potenziale di semplice strato (single-layer potential), cioè del
tipo
u(x, t) =
_
t
0
_
(x , t )(, ) d
d, (3.53)
121
ove C( [0, T]) è una funzione da determinare. Si noti che questa
funzione è denita in (R
n
) e non solamente in . Il motivo che
ci spinge a cercare una soluzione di questa forma è che essa certamente ha
senso e, come vedremo fra poco, verica lequazione dierenziale; inoltre è
chiaro che u(x, 0) = 0. Per ottenere anche la condizione alla frontiera, poi,
abbiamo a disposizione la funzione , che è arbitraria; essa sarà determinata
risolvendo unopportuna equazione integrale di Volterra del tipo analizzato
nel paragrafo precedente.
Mostriamo che la funzione (3.53) risolve lequazione del calore in ]0, T].
Risulta
u
t
(t, x) u(x, t) =
_
(x , 0)(, t) d
+
+
_
t
0
_
[
t
(x , t )
x
(x , t )](, ) d
d = 0
in virt` u del fatto che risolve lequazione del calore e inoltre verica (y, 0) =
0 per ogni y ,= 0.
`
E anche chiaro che risulta u(x, 0) = 0 per ogni x . Meno facile, invece,
è dimostrare che la condizione alla frontiera sulla derivata normale di u è
soddisfatta: in eetti, se i 1, . . . , n si ha per (x, t) (R
n
)]0, T]
D
i
u(x, t) =
_
t
0
_
D
i
(x , t )(, ) d
d,
ma quando x tende verso un punto x
0
le stime fornite dalla proposizione
3.3.5(ii)-(vi) non sono sucienti a far convergere lintegrale.
Prima di proseguire, proviamo due ulteriori lemmi utili nel seguito.
Lemma 3.6.2 Se x R
n
0 e s R con n +s > 2, allora
_
t
0
e
|x|
2
n+s
2
d C
s
[x[
2ns
,
e in particolare risulta
lim
t0
+
_
t
0
e
|x|
2
n+s
2
d = 0 x ,= 0.
122
Dimostrazione Si tratta di un facile calcolo:
_
t
0
e
|x|
2
n+s
2
d =
_

|x|
2
t
e
q
[x[
2ns
q
n+s
2
2
dq
[x[
2ns
_

0
e
q
q
n+s
2
2
dq = (
n+s
2
1) [x[
2ns
,
ove è la funzione di Eulero. Se x ,= 0 la prima uguaglianza mostra anche
che il limite richiesto vale 0.
Lemma 3.6.3 Sia R
n
1
.
Per ogni x
0
esiste > 0 tale che, posto S
r
= B(x
0
, r), r ]0, ],
risulta
_
S
\Sr
[x
0
[
n+1
d
r ]0, [, > 0.
0
. Poiche è di classe C
1
, esiste > 0
per il quale vi è un dieomorsmo F, di classe C
1
, che verica le condizioni
(3.52), con = 0. Sia > 0 tale che B(x
0
, ) U; mostriamo che esistono
due numeri positivi c
1
e c
2
tali che
B(0, c
1
r) F(B(x
0
, r)) B(0, c
2
r)
per ogni r ]0, ] sucientemente piccolo. Infatti, sia y B(0, c
1
r) e sia
= F
1
(y) B(x
0
, ): allora, dalla formula di Taylor, se r è piccolo si ha
[ x
0
[ = [F
1
(y) F
1
(0)[ = [F
1
(0)y + o(y)[ K[y[ < Kc
1
r,
da cui la prima inclusione scegliendo c
1
=
1
K
. Similmente, se B(x
0
, r) e
se r è piccolo si ha
[F()[ = [F() F(x
0
)[ = [F(x
0
)( x
0
)[ + o( x
0
) Mr,
da cui la seconda inclusione prendendo c
2
= M.
Adesso osserviamo che, per denizione di integrale sulla varietà (n 1)-
dimensionale , si ha
_
S
\Sr
[ x
0
[
n+1
d
=
=
_
{yn=0}F(B(x
0
,)\B(x
0
,r))
[F
1
(y) F
1
(0)[
n+1
M(y) dy
,
123
ove dy
= dy
1
. . . dy
n1
e
M(y) =
_
n
i=1
M
i
(y)
2
_1
2
, M
i
(y) = det
_
(F
1
)
h
y
k
(y)
_
h=i, k=n
.
Dato che le derivate di F
1
sono (in particolare) limitate, deduciamo
_
S
\Sr
[ x
0
[
n+1
d
=
=
_
{yn=0}[B(0,1)\F(B(x
0
,r))]
[F
1
(y) F
1
(0)[
n+1
M(y) dy

C
_
{yn=0}[B(0,1)\B(0,c
1
r)]
[y[
n+1
dy
= C
_
1
c
1
r
n+1
n2
d =
= C
_
1
r
1
_
C
1
r
,
e la tesi è provata per r > 0 sucientemente piccolo, diciamo 0 < r < r
0
.
Ma se r [r
0
, [, la tesi è banale:
_
S
\Sr
[ x
0
[
n+1
d
Cr
n+1
0
_
1 d
K
K
r
.
Possiamo adesso enunciare il lemma che costituisce il punto chiave dellintera
argomentazione.
Lemma 3.6.4 Sia R
n
1+
,
]0, 1], e sia u la funzione (3.53). Se x
0
e se x x
0
lungo la retta
normale a in x
0
, allora
n
j=1
D
j
u(x, t)
j
(x
0
) W(x
0
, t)
1
2
(x
0
, t) t ]0, T],
ove
W(x
0
, t) =
_
t
0
_
(x
0
)
(x
0
, t )(, ) d
d, (3.54)
e il segno è positivo oppure negativo a seconda che x x
0
dallinterno di
oppure dallesterno di . Inoltre la funzione (x
0
, t) W(x
0
, t) è continua
su [0, T].
124
Dimostrazione Accertiamoci anzitutto che W(x
0
, t) abbia senso. Dalla
(3.21) segue
(x
0
)
(x
0
, t ) =
(x
0
, t )
2(t )
(x
0
) (x
0
). (3.55)
B(x
0
, ) = x B(x
0
, ) : F
n
(x) = 0,
ove F è il dieomorsmo di classe C
1+
fra B(x
0
, ) e B(0, 1) che verica
le condizioni (3.52). Dunque, per ogni B(x
0
, ) si ha F
n
() = 0 e
() =
Fn()
|Fn()|
. Ne segue
[(x
0
) (x
0
)[ =
1
[F
n
(x
0
)[
[F
n
(x
0
) ( x
0
) +F
n
(x
0
) F
n
()[ =
=
1
[F
n
(x
0
)[
_
1
0
(F
n
(x
0
) F
n
(x
0
+t( x
0
))) ( x
0
) dt
[F
n
(x
0
)[
_
1
0
t
[ x
0
[
1+
dt C
[ x
0
[
1+
,
cosicche da (3.55) e dalla proposizione 3.3.5(i) otteniamo
(x
0
)
(x
0
, t )
C(t )
n+2
2
[ x
0
[
1+
e
L|x
0
|
2
t
, (3.56)
ed anche, di conseguenza,
(x
0
)
(x
0
, t )
C
_
(t )
n
2
4
[ x
0
[
n+
2
e
L|x
0
|
2
t
_
(t )
4
1
[ x
0
[
2
n+1
da cui, per ogni B(x
0
, ) e per ogni t, [0, T] con t ,= ,
(x
0
)
(x
0
, t )
C(t )
4
1
[ x
0
[
2
n+1
. (3.57)
Questa stima prova che lintegrale che denisce W(x
0
, t) nella (3.54) è conver-
gente. Inoltre un facile argomento basato sulla convergenza dominata mostra
125
che W(x
0
, t) è continua nei suoi argomenti in [0, T].
Adesso dobbiamo valutare la dierenza
n
j=1
D
j
u(x, t)
j
(x
0
) W(x
0
, t) =
=
_
t
0
_
j=1
[D
j
(x , t ) D
j
(x
0
, t )]
j
(x
0
)(, ) d
d
(3.58)
al tendere di x a x
0
lungo la normale a in x
0
. Se stimiamo direttamente
questa dierenza con lausilio della proposizione 3.3.5(vi) e del lemma 3.6.2,
non otteniamo lo scopo perche troviamo
_
t
0
_
j=1
[D
j
(x , t ) D
j
(x
0
, t )]
j
(x
0
)(, ) d
C||
_
t
0
_
(t )
n+1+
2
e
L(|x||x
0
|)
2
t
[x x
0
[
d
C||
[x x
0
[
([x [ [x
0
[)
n+1
d
,
ma lultimo integrale su non è convergente.
Dobbiamo dunque aggiungere e togliere termini nella (3.58) in modo oppor-
tuno. Poniamo per brevità di scrittura
N
j,x
(, t ) = D
j
(x , t ) D
j
(x
0
, t );
allora possiamo riscrivere la (3.58) come segue:
n
j=1
D
j
u(x, t)
j
(x
0
) W(x
0
, t) =
=
_
t
0
_
j=1
N
j,x
(, t )
j
(x
0
)(, ) d
d = I
1
+I
2
+I
3
+I
4
,
(3.59)
ove
I
1
=
_
t
0
_
j=1
N
j,x
(, t )
j
(x
0
)[(, ) (x
0
, )] d
d,
126
I
2
=
_
t
0
_
j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d
d,
I
3
=
_
t
0
_
j=1
N
j,x
(, t )[
j
(x
0
)
j
()](x
0
, t) d
d,
I
4
= (x
0
, t)
_
t
0
_
j=1
N
j,x
(, t )
j
() d
d.
Proveremo che per x x
0
(lungo la retta normale a in x
0
) i termini I
1
,
I
2
e I
3
sono innitesimi, mentre I
4
il quale, come si vedrà, ha senso come
integrale improprio di Riemann converge a
1
2
(x
0
, t).
Sia > 0 e sia > 0 tale che
[ x
0
[ < , [0, t] = [(, ) (x
0
, )[ < .
Poniamo = B(x
0
, ) e S = B(x
0
, 2[x x
0
[); se [x x
0
[ < /2,
si ha S . Allora possiamo decomporre I
1
spezzando gli integrali:
I
1
=
_
t
0
_
S
. . . +
_
t
0
_
\S
. . . +
_
t
0
_
\
. . . = I
11
+I
12
+I
13
.
Stimiamo I
11
rimpiazzando con lincremento della e con una somma la
dierenza delle D
j
: dalla proposizione 3.3.5(ii), dalla (3.56) e dal lemma
3.6.2 segue
[I
11
[ =
_
t
0
_
S
n
j=1
N
j,x
(, t )
j
(x
0
)[(, ) (x
0
, )] d
_
t
0
_
S
_
[(x , t )[ +
(x
0
)
(x
0
, t )
_
d
d
C
_
t
0
_
S
_
_
e
L|x|
2
t
(t )
n+1
2
+
e
L|x
0
|
2
t
(t )
n+2
2
[x x
0
[
1+
_
_
d
d
C
__
S
[x [
n+1
d
+
_
S
[x
0
[
n+1+
d
_
.
Osserviamo a questo punto che x appartiene alla retta normale a in x
0
;
poiche S, per [xx
0
[ sucientemente piccolo la dierenza [ P()[ fra
127
e la sua proiezione P() sulliperpiano tangente a in x
0
è un innitesimo
di ordine superiore a [x x
0
[: pertanto si ha, per [x x
0
[ piccolo,
[ x[ [P() x[ [ P()[ [x
0
x[
1
2
[x x
0
[ =
1
2
[x x
0
[.
Ne segue, per [x x
0
[ piccolo,
[I
11
[ C
_
[x x
0
[
n+1
_
S
d
+
_
S
[x
0
[
n+1+
d
_
C.
Il termine I
12
si stima essenzialmente allo stesso modo. Si osserva che se
S si ha
[ x[ [P() x[ [ P()[ [P() x
0
[ [ P()[
[ x
0
[ 2[P() [
1
2
[ x
0
[
a patto di aver scelto abbastanza piccolo. Quindi, per i lemmi 3.6.2 e 3.6.3,
[I
12
[ =
_
t
0
_
\S
n
j=1
N
j,x
(, t )
j
(x
0
)[(, ) (x
0
, )] d
C
_
t
0
_
\S
e
L|x
0
|
2
2(t)
(t )
n+2
2
[x x
0
[ d
d
C[x x
0
[
_
\S
[x
0
[
n
d
C.
Per I
13
si rimpiazza lincremento di con una costante, e si controlla lin-
cremento delle D
j
con la proposizione 3.3.5(ii). Si trova, con lausilio del
lemma 3.6.2,
[I
13
[ =
_
t
0
_
\
n
j=1
N
j,x
(, t )
j
(x
0
)[(, ) (x
0
, )] d
C
_
t
0
_
\
e
L|x
0
|
2
t
(t )
n+2
2
[x x
0
[ d
d
C[x x
0
[
_
\
[x
0
[
n
d
[x x
0
[.
128
Ciò prova che I
1
0 per x x
0
, x x
0
.
Analizziamo ora il termine I
2
. In corrispondenza del numero già ssato,
esiste > 0 tale che
, [t [ < = [(, t) (, )[ < .
Allora decomponiamo I
2
spezzando gli integrali:
I
2
=
_
t
0
_
. . . +
_
t
t
_
S
. . . +
_
t
t
_
\S
. . . +
_
t
t
_
\
. . . =
= I
21
+I
22
+I
23
+I
24
,
ove stavolta = B(x
0
, ) e si suppone [x x
0
[ < /2.
Utilizzando la proposizione 3.3.5(vi), la (3.56) ed il lemma 3.6.2 si ottiene,
procedendo come per la stima di I
1
:
[I
21
[ =
_
t
0
_
j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d
C
_
t
0
_
L(|x
0
||x|)
2
t
(t )
n+2
2
[x x
0
[ d
d C
[x x
0
[,
[I
22
[ =
_
t
t
_
S
n
j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d
C
_
t
t
_
S
_
_
e
L|x|
2
t
(t )
n+1
2
+
e
L|x
0
|
2
t
(t )
n+2
2
[x x
0
[
1+
_
_
d
d
C
__
S
[x [
n+1
d
+
_
S
[x
0
[
n+1+
d
C
_
[x x
0
[
n+1
_
S
d
+
_
S
[x
0
[
n+1+
d
_
C,
[I
23
[ =
_
t
t
_
\S
n
j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d
C
_
t
t
_
\S
e
L|x
0
|
2
2(t)
(t )
n+2
2
[x x
0
[ d
d
C[x x
0
[
_
\S
[x
0
[
n
d
C,
129
[I
24
[ =
_
t
t
_
\
n
j=1
N
j,x
(, t )
j
(x
0
)[(x
0
, ) (x
0
, t)] d
C
_
t
t
_
\
e
L
2
2(t)
(t )
n+2
2
[x x
0
[ d
d C
[x x
0
[.
Da tutte queste maggiorazioni segue che I
2
0 per x x
0
, x x
0
.
La stima di I
3
è pi` u semplice: essendo [(x
0
) ()[ c[x
0
[
, si ha,
utilizzando ancora la proposizione 3.3.5(vi) con 0 < < , nonche il lemma
3.6.2,
[I
3
[ C
_
t
0
_
L(|x
0
||x|)
2
t
(t )
n+1+
2
[x x
0
[
[x
0
[
d
C
_
[x x
0
[
([x
0
[ [x [)
n1+
d
C[x x
0
[
,
e dunque anche I
3
0 per x x
0
, x x
0
.
Vediamo inne il termine I
4
, che verrà esplicitamente calcolato. Veriche-
remo che si tratta di un integrale improprio di Riemann convergente, ossia
che
I
4
= (x
0
, t)
lim
0
+
_
t
0
_
j=1
[D
j
(x , t ) D
j
(x
0
, t )]
j
() d
d.
Sia infatti, per x e [0, t[,
E(x, ) =
_
j=1
[D
j
(x , t ) D
j
(x
0
, t )]
j
() d
,
allora risulta, per la formula di Green, ed osservando che
(x, t ) +
(x , t ) = 0,
E(x, ) =
_
j=1
j
[(x , t ) (x
0
, t )]
j
() d
=
=
_
[(x , t ) (x
0
, t )] d =
=

[(x , t ) (x
0
, t )] d,
130
cosicche
_
t
0
E(x, ) d =
_
[(x , ) (x
0
, )] d
[(x , t) (x
0
, t)] d = I
41
(x, ) +I
42
(x),
per cui otteniamo
I
4
= (x
0
, t)
_
lim
0
+
I
41
(x, ) +I
42
(x)
_
(3.60)
ammesso che il limite a secondo membro esista, cosa che vericheremo fra
poco. Poiche inoltre
[I
42
(x)[ Ct
n+1
2
[x x
0
[
_
L(|x||x
0
|)
2
t
d c(t)[x x
0
[,
è chiaro che I
42
(x) tende a 0 quando x tende a x
0
lungo la normale a in
x
0
. In denitiva ci si riduce a dover dimostrare che esistono i due limiti
lim
0
+
I
41
(x, ) = I
4
, lim
xx
0
, xx
0
_
lim
0
+
I
41
(x, )
_
.
Analizziamo il primo limite, ricordando che
I
41
(x, ) =
_
[(x , ) (x
0
, )] d.
Si ha, utilizzando un opportuno cambiamento di variabili,
_
(x , ) d =
n
2
_
A
e
|z|
2
dz,
ove A
= z R
n
: 2
z +x .
Notiamo che se x allora per ogni z R
n
si ha z A
per ogni
sucientemente piccolo; analogamente, se x / , allora z / A
per ogni
sucientemente piccolo. Dunque, per convergenza dominata,
lim
0
n
2
_
A
e
|z|
2
dz =
_
_
_
n
2
_
R
n
e
|z|
2
dz = 1 se x ,
0 se x / .
(3.61)
131
Analogamente
_
(x
0
, ) d =
n
2
_
B
e
|z|
2
dz,
ove stavolta B
= z R
n
: 2
z + x
0
. Dato che x
0
, detto
il semispazio aperto di R
n
che contiene B(x
0
, ), se z si ha z B
per ogni sucientemente piccolo, mentre se z / si ha z / B
per ogni
sucientemente piccolo; se ne deduce, a causa dellinvarianza per rotazioni
dellintegrando,
lim
0
n
2
_
B
e
|z|
2
dz =
n
2
_
e
|z|
2
dz =
1
2
n
2
_
R
n
e
|z|
2
dz =
1
2
. (3.62)
Da (3.61) e (3.62) segue inne
lim
0
I
41
(x, ) = lim
0
+
_
[(x , ) (x
0
, )] d =
_
_
1
2
se x ,
1
2
se x / .
Abbiamo pertanto provato che per x x
0
(lungo la retta perpendicolare a
in x
0
) si ha, in virt` u di (3.60),
I
4

_
_
1
2
(x
0
, t) se x ,
1
2
(x
0
, t) se x / .
Ci` o conclude la dimostrazione del lemma 3.6.4.
Possiamo ora vedere se la nostra candidata soluzione u, data da (3.53), risolve
davvero il problema di Cauchy-Neumann (3.43). La u è una funzione regolare
in ]0, T], e continua in [0, T], come si verica facilmente usando la
proposizione 3.3.5(v) (con ]0, 1[); essa risolve lequazione del calore in
]0, T] ed è nulla in per t = 0. Come si è già osservato, Le stime sulle
derivate di fornite dalla proposizione 3.3.5(vi) non garantiscono che u abbia
derivate prime continue su [0, T]; tuttavia il lemma 3.6.4 ci dice che
si può dare senso alla derivata normale su ]0, T], e che tale derivata
normale vale
u
(x
0
, t) = lim
xx
0
, xx
0
j=1
u
x
j
(x, t)
j
(x
0
) =
= W(x
0
, t) +
1
2
(x
0
, t) (x
0
, t) ]0, T],
(3.63)
132
ove W(x
0
, t) è dato da (3.54); essa è dunque una funzione continua su
[0, T]. Perciò, anche u risolva il problema (3.43), occorre che sia
W(x
0
, t) +
1
2
(x
0
, t) = (x
0
, t) (x
0
, t) [0, T],
ossia che valga, per ogni (x, t) [0, T], lequazione integrale
(x, t) + 2
_
t
0
_
(x , t )(, ) d
d = 2(x, t). (3.64)

Il nucleo di questa equazione, in virt` u della sua continuità per x ,= e t ,=
e grazie a (3.57), verica le ipotesi del teorema 3.5.6. Quindi lequazione
integrale ha ununica soluzione , la quale, inserita nellespressione di u,
permette di mostrare che u è la soluzione del problema di Cauchy-Neumann
(3.43). Ciò conclude la dimostrazione del teorema 3.6.1
Osservazioni 3.6.5 (1) Anche se abbiamo risolto la (3.64) in [0, T], la
soluzione u verica la condizione
u
(x
0
, t) = (x
0
, t) soltanto in ]0, T]:
infatti si vede facilmente, utilizzando la proposizione 3.3.5, che per t = 0 le
derivate prime di u sono continue, e dunque nulle in , essendo u(, 0) 0
in . Dunque, quando t = 0 si ha
u
(x
0
, 0) = lim
xx
0
, xx
0
j=1
u
x
j
(x, 0)
j
(x
0
) = 0.
Per vericare la condizione alla frontiera anche per t = 0, dovrebbe dunque
essere (x
0
, 0) = 0: questa è una condizione di compatibilità che potrebbe
non essere vericata dal dato . Se questa condizione è soddisfatta, lequa-
zione integrale ci dà (x
0
, 0) = 0, la (3.64) vale in [0, T] e la relazione
u
(x
0
, t) = (x
0
, t) è valida in [0, T], ma soltanto nel senso sopra de-
scritto, perche la u non è di classe C
1
; infatti le derivate prime di u, nulle su
per t = 0, non sono però continue, come funzioni di (x, t), nei punti (x
0
, 0)
con x
0
.
(2) Con lo stesso metodo si vede che la funzione u, denita da (3.53), è
soluzione del problema di Cauchy-Neumann esterno
_
_
u
t
u = 0 in
c
]0, T],
u(x, 0) = 0 in
c
,
u
(x, t) = (x, t) (x, t) [0, T],

[u(x, t)[ Me
|x|
2
(x, t)
c
[0, T] per qualche M > 0, > 0,
133
purche la funzione che compare nelle denizione di u soddis lequazione
integrale di Volterra
(x, t) 2
_
t
0
_
()
(x , t )(, ) d
d =
= 2(x, t) (x, t) [0, T];
la limitazione sulla crescenza allinnito serve a garantire lunicità.
(3) Per il problema di Cauchy-Dirichlet (3.42) in un aperto limitato con
frontiera di classe C
1+
vale un enunciato analogo a quello del teorema 3.6.1:
esiste ununica soluzione u, che è esprimibile nella forma di potenziale di
doppio strato (double-layer potential), vale a dire
u(x, t) =
_
t
0
_
j=1
j
(x , t )
j
() (, ) d
d, (3.65)
ove C([0, T]) è lunica soluzione dellequazione integrale di Volterra
in [0, T]
(x, t) + 2
_
t
0
_
()
(x , t ) (, ) d
d = 2(x, t).
La stessa funzione u risolve il problema di Cauchy-Dirichlet esterno
_
_
u
t
u = 0 in
c
]0, T],
u(x, 0) = 0 in
c
,
u(x, t) = (x, t) (x, t) [0, T],
[u(x, t)[ Me
|x|
2
(x, t)
c
[0, T] per qualche M > 0, > 0,
purche la funzione che compare nella (3.65) risolva lequazione integrale
(x, t) 2
_
t
0
_
()
(x , t ) (, ) d
d = 2(x, t).
(4) La versioni pi` u generali dei problemi (3.43) e (3.42), ossia quelle con dati
non omogenei, sono rispettivamente:
_
_
u
t
u = f(x, t) (x, t) ]0, T],
u(x, 0) = (x) x ,
u
(x, t) = (x, t) (x, t) [0, T],

134
_
_
u
t
u = f(x, t) (x, t) ]0, T],
u(x, 0) = (x) x ,
u(x, t) = (x, t) (x, t) [0, T].
Questi problemi sono risolubili con metodi analoghi a quelli visti n qui;
ne tralasciamo lo studio per mancanza di tempo. Osserviamo che vi sono
condizioni non banali di compatibilità fra i dati, se si vogliono soluzioni
regolari in [0, T]. Per approfondimenti si può consultare [6]. Le equazioni
paraboliche, come le iperboliche, si possono utilmente arontare, in modo pi` u
astratto e generale, per mezzo della teoria dei semigruppi: si tratta di uno
strumento potente e versatile, applicabile a varie problematiche, per il quale
rimandiamo a [7].
135
Capitolo 4
Lequazione di DAlembert
Il prototipo delle equazioni iperboliche è lequazione delle onde, o di DAlem-
bert,
u
tt
c
2
u = f(x, t), (4.1)
cui si perviene nello studio di svariatissimi fenomeni sici di tipo evolutivo,
tutti però accomunati dalla caratteristica fondamentale di descrivere moti
ondulatori: di particelle subatomiche, di materiali elastici, di uidi, di cor-
rente elettrica. Il mondo delle equazioni iperboliche è vastissimo e presenta
caratteristiche matematiche proprie, molto diverse da quelle tipiche del ca-
so parabolico: cercheremo di analizzarle nei paragra successivi. Vediamo
qualche esempio sico in cui compare lequazione delle onde.
Esempio 4.1.1 Analizziamo le vibrazioni trasversali di una corda tesa, ossia
di un lo elastico, essibile, teso orizzontalmente tra due estremi, i punti 0
e L dellasse x. Ci interessa solamente lo spostamento u(x, t) (nel punto x,
allistante t) in direzione verticale. Denotiamo con T(x, t) la tensione della
corda nel punto x allistante t: essa è diretta tangenzialmente alla corda
in ogni punto (x, u(x, t)) di essa; ciò traduce matematicamente il fatto che
la corda non esercita resistenza alla essione. Detta (x) la densità lineare
della corda, la variazione della componente verticale della quantità di moto
relativa ad un tratto di corda [x
1
, x
2
] in un intervallo di tempo [t
1
, t
2
] è data
da
_
x
2
x
1
()[u
t
(, t
2
) u
t
(, t
1
)] d.
136
Essa coincide con limpulso, nello stesso intervallo di tempo, delle componenti
verticali delle forze che agiscono sul tratto di corda in esame, cioè la tensione
ai due estremi e le forze esterne quali la gravità, che denoteremo globalmente
con F. Si ha dunque
_
x
2
x
1
()[u
t
(, t
2
) u
t
(, t
1
)] d =
=
_
t
2
t
1
[T
y
(x
2
, t) T
y
(x
1
, t)]dt +
_
t
2
t
1
_
x
2
x
1
F(, t) ddt.
Supponendo che u e T siano funzioni regolari, lequazione precedente si può
riscrivere nel modo seguente:
_
t
2
t
1
_
x
2
x
1
_
()u
tt
(, t)

T
y
(, t) +F(, t)
_
ddt = 0.
Per larbitrarietà del rettangolo [x
1
, x
2
] [t
1
, t
2
], si ricava
(x)u
tt
(x, t)

x
T
y
(x, t) +F(x, t) = 0.
Adesso scriviamo una formula per la tensione: secondo la legge di Hooke,
possiamo assumere
T
y
(x, t) = k(x)u
x
(x, t),
ove k(x) è il cosiddetto modulo di Young; ciò è plausibile, considerando che
la tensione in un tratto di corda deve essere tanto maggiore quanto pi` u gli
spostamenti ai due estremi dieriscono fra loro. Si deduce allora lequazione
(x)u
tt
(x, t)

x
(k(x)u
x
(x, t)) +F(x, t) = 0.
Se ora si ammette che la densità e il modulo di Young k siano costanti, si
ottiene lequazione delle onde (4.1) con c =
_
k/.
Le linee caratteristiche per lequazione (4.1) sono le rette x ct = h con h
costante. Dunque la retta t = 0 non è caratteristica ed è quindi naturale
ssare, al tempo t = 0, condizioni iniziali della forma
u(x, 0) = (x), u
t
(x, 0) = (x) x [0, L],
con le quali si forniscono la congurazione e la velocità iniziale della corda.
Occorre inoltre una condizione agli estremi: se i due capi della corda sono
ssati, imporremo
u(0, t) = u(L, t) = 0 t 0.
137
Esempio 4.1.2 Consideriamo le oscillazioni trasversali di una membrana,
ossia di una pellicola non resistente a essioni e trazioni, ssata lungo il suo
contorno giacente nel piano z = 0. Indicheremo con la proiezione della
membrana sul piano z = 0. Ci interessano gli spostamenti verticali u(x, y, t)
in corrispondenza del punto (x, y) allistante t, e supporremo, per semplicità,
che quelli tangenziali siano nulli. Denotiamo con T(x, y, t) la tensione che
viene esercitata sulla membrana in corrispondenza del punto (x, y) ad un
ssato istante t: essa in ogni punto è tangente alla supercie, proprio perche
non vi è opposizione alle essioni e alle trazioni.
Consideriamo un pezzetto di membrana, la cui proiezione sul piano orizzon-
tale sia un aperto regolare S. Esso è sottoposto a tensione in tutti i punti
della sua frontiera, e la tensione agisce in direzione normale a S (eventuali
componenti tangenziali determinerebbero spostamenti non verticali dei punti
della membrana, contro lipotesi fatta). A noi interessa la componente verti-
cale T
z
della tensione: la tensione complessiva, in direzione verticale, a cui è
sottoposto il pezzo di membrana allistante t si misura attraverso lintegrale
curvilineo _
S
T
z
(x, y) ds.
Facciamo ora lipotesi che nei punti di S risulti
T
z
(x, y, t) = k(x, y)u(x, y, t) n(x, y),
ove n è il versore normale esterno a S nel piano orizzontale: ciò, in analogia
con il caso unidimensionale della corda, è plausibile, perche dove u è gran-
de in modulo la tensione dovrebbe avere una componente verticale grande;
daltra parte dove u punta in direzione trasversale a n, vuol dire che nella
direzione di n la u è quasi costante e quindi la tensione dovrebbe essere pic-
cola.
Utilizzando il teorema della divergenza, otteniamo
_
S
T
z
(x, y, t) ds =
_
S
div(ku) dxdy.
Uguagliando la variazione in [t
1
, t
2
] della componente verticale della quantità
di moto allimpulso delle forze nello stesso intervallo, indicate con F(x, y, t)
le forze esterne si può scrivere
_
t
2
t
1
_
S
u
tt
dxdydt =
_
t
2
t
1
_
S
[div(ku) +F] dxdydt,
138
da cui per larbitrarietà di S e di [t
1
, t
2
] ricaviamo, supponendo lintegrando
continuo,
(x, y)u
tt
(x, y, t) div(k(x, y)u(x, y, t)) = F(x, y, t) (x, y) , t > 0.
Se poi si suppone che e k siano costanti, si trova lequazione
u
tt
u =
F
in ]0, [.
Ad essa vanno aggiunte le condizioni iniziali u(x, y, 0) = (x, y) e u
t
(x, y, 0) =
(x, y), nonche una condizione al contorno: dato che la membrana è tenuta
ssa al bordo, si impone la condizione u(x, y, t) = 0 per (x, y, t) [0, [.
Esempio 4.1.3 Il passaggio di corrente in un lo conduttore è caratteriz-
zato dalla conoscenza di due grandezze: lintensità di corrente i(x, t), cioè
la quantità di carica che attraversa una sezione unitaria del lo nellunità di
tempo, e la tensione v(x, t), che dipende dalla dierenza di potenziale alle
estremità del lo. La legge di Ohm, applicata ad un trattino dx di lo, lega
queste due quantità nel modo seguente:
v(x, t) v(x +dx, t) v
x
dx = Ri dx +Li
t
dx f dx. (4.2)
Il termine v
x
dx rappresenta la caduta di tensione nel tratto di lo consi-
derato, che deve uguagliare la somma delle dispersioni di carica lungo il lo.
Le costanti R e L sono la resistenza e linduttanza del circuito, f è una forza
elettromotrice esterna, fornita ad esempio da una batteria. Daltra parte la
quantità di carica presente nel tratto di lo considerato nellunità di tempo
è pari a i(x, t) i(x+dx, t) i
x
dx; essa è uguale a Cv
t
dxGv dx, ossia a
ciò che serve a caricare lelemento dx, meno ciò che si perde per isolamento
imperfetto: C è la capacità del circuito, G è un coeciente di perdita, di soli-
to molto piccolo se il lo è ben isolato. Abbiamo cos` una seconda equazione,
i
x
dx = Cv
t
dx Gv dx. Otteniamo in questo modo il sistema
_
i
x
+Cv
t
Gv = 0,
v
x
+Li
t
+Ri f = 0
(4.3)
Se deriviamo rispetto a x la prima equazione e rispetto a t la seconda,
ricaviamo
_
i
xx
+Cv
tx
Gv
x
= 0,
v
xt
+Li
tt
+Ri
t
f
t
= 0
139
Inserendo al posto di v
x
la sua espressione ottenuta dalla (4.2), e ricavando
v
tx
dalla seconda equazione, la prima equazione si riscrive nella forma
i
xx
+LGi
t
+GRi Gf CLi
tt
CRi
t
+Cf
t
= 0. (4.4)
In modo analogo, derivando la prima equazione del sistema (4.3) rispetto a
t e la seconda rispetto a x, ricaviamo
v
xx
CLv
tt
+GLv
t
RCv
t
+GRv f
x
= 0. (4.5)
Se il lo è ben isolato, come si è detto si ha G 0; se inoltre esso è un buon
conduttore, si ha anche R 0, e le due equazioni diventano rispettivamente
v
tt
=
1
LC
v
xx
f
x
LC
, i
tt
=
1
LC
i
xx
+
f
t
L
,
e dunque sia v, sia i risolvono lequazione di DAlembert.
Esempio 4.1.4 Questo esempio è un po pi` u elaborato dei precedenti. Con-
sideriamo il moto di un uido o di un gas compressibile, che supporremo
perfettamente non viscoso, ossia con completa assenza di attrito fra le mo-
lecole. Denotiamo con v(x, y, z, t) la sua velocità, con (x, y, z, t) la sua
densità, con p(x, y, z, t) la sua pressione, e con F(x, y, z, t) le forze esterne
per unità di massa. La somma delle forze agenti su un volume di liquido T
(semplicemente connesso) è data da F e dalla pressione esercitata dal liqui-
do circostante, diretta perpendicolarmente su T. Uguagliando la somma di
tali forze allaccelerazione, si può scrivere lequazione
_
T
d
dt
v dxdydz =
_
T
Fdxdydz
_
T
p nd,
ove n è il versore normale esterno. Dal teorema della divergenza deduciamo
_
T
d
dt
v dxdydz =
_
T
[ F p] dxdydz.
Daltra parte, se (x(t), y(t), z(t)) è la legge oraria di una particella di uido,
si ha v = (x
, y
, z
) e
d
dt
v(x, y, z, t) =
v
x
x
+
v
y
y
+
v
z
z
+
v
t
= (v )v +
v
t
,
140
ove (v )v è il vettore
3
i=1
v
i
D
i
v. Per larbitrarietà di T, otteniamo
lequazione del moto
v
t
+ (v )v =
1
p +F. (4.6)
Vi è poi un altro legame fra le variabili: se in T non ci sono ne sorgenti ne
pozzi, la variazione della quantità di liquido nellunità di tempo è pari al suo
usso attraverso la frontiera:
d
dt
_
T
dxdydz =
_
T
v nd,
ovvero, ancora per larbitrarietà di T,
t
+ div(v) = 0. (4.7)
Questa è lequazione di continuità.
Inne, ipotizziamo che la pressione nel uido dipenda soltanto dalla densità;
se il fenomeno di moto del uido è adiabatico, ossia non provoca scambi di
calore con lesterno, allora si ammette che valga una equazione di stato del
tipo
p = p
0
_
0
_
k
,
ove p
0
e
0
sono dati iniziali per la pressione e per la densità. Otteniamo cos
il sistema
_
_
v
t
+ (v )v =
1
p +F,
t
+ div(v) = 0
p = p
0
_
0
_
k
.
(4.8)
Osserviamo adesso che se, inizialmente, v = 0, oppure rot v = 0, allora,
purche sia anche F(, t) = 0 o rot F(, t) = 0 per ogni t > 0, risulterà anche
rot v(, t) 0. Infatti, ssato un punto (x, y, z), e scrivendo v(t) in luogo di
v(x, y, z, t), si ha
rot v(t) = rot v(0) +
_
t
0
rot
d
ds
v(s) ds = 0 +
_
t
0
rot
_
v
s
+ (v )v
_
ds =
=
_
t
0
rot
_
+F
_
ds =
_
t
0
rot
_
p
_
ds.
141
Daltronde, per ogni funzione scalare e per ogni funzione vettoriale A si
verica facilmente che
rot(A) = rot A+ A.
Nel nostro caso si ha =
1
e A = p; essendo p =
p
0
0
k (

0
)
k1
, il
vettore p è parallelo a , da cui
rot v(t) = rot
_
p
_
=
1
rotp +
1
2
p = 0.
Supponiamo, per semplicità, F = 0. Allora da rot v = 0 segue, essendo T
semplicemente connesso, che esiste un potenziale cinetico U(x, y, z, t) tale che
v = U in T. In particolare, si noti che
(v )v = (U )U =
3
i=1
D
i
UD
i
U =
1
2
i=1
(D
i
U)
2
=
1
2
[U[
2
.
Sostituendo la relazione v = U nel sistema (4.8), questultimo diventa
_
_
U
t
+
1
2
[U[
2
=
1
p,
t
div(U) = 0
p = p
0
_
0
_
k
,
(4.9)
ed è ancora troppo complicato. Facciamo qualche approssimazione: poniamo
s =

0
0
, ossia

0
= s+1, e supponiamo

0
1, da cui s 0. Di conseguenza,
p = p
0
(1 +s)
k
p
0
(1 +ks) e p p
0
ks. Allora, posto a
2
=
p
0
k
0
, il sistema
(4.9) si riduce a
_
_
U
t
+
1
2
[U[
2
= a
2
s,
s
t
U = 0
p = p
0
(1 +ks).
(4.10)
La prima equazione del sistema si può integrare, ottenendo
U
t
+
1
2
[U[
2
+a
2
s = c(t)
con c(t) funzione indipendente da (x, y, z). Ma si può supporre c(t) = 0
modicando il potenziale U, ossia rimpiazzandolo con U(x, y, z, t)
_
t
0
c(s)ds:
142
dunque possiamo supporre senzaltro U
t
+
1
2
[U[
2
+ a
2
s = 0. Derivando
questa equazione rispetto a t, troviamo
0 = U
tt
+
1
2
t
[U[
2
+a
2
s
t
= U
tt
+
1
2
t
[U[
2
+a
2
U,
e dunque U verica
U
tt
a
2
U =
1
2
t
[U[
2
.
Questa è unequazione non lineare, la cui parte principale è loperatore di
DAlembert. Se supponiamo che il modulo della velocità sia indipendente
dal tempo, si ottiene che U verica lequazione delle onde.
4.2 Il caso di una variabile spaziale
Consideriamo lequazione delle onde in una variabile spaziale: questo è il caso
pi` u semplice ma permette già di analizzare i fenomeni tipici delle equazioni
iperboliche. La prima cosa da osservare è che, come peraltro già sappiamo
dallesempio 1.6.5, si ha:
Teorema 4.2.1 Sia D un aperto convesso di R
2
. Tutte e sole le soluzioni
di classe C
2
dellequazione
u
tt
c
2
u
xx
= 0 in D (4.11)
sono le funzioni u della forma
u(x, t) = (x +ct) +(x ct), (4.12)
con e funzioni di classe C
2
di una sola variabile. In particolare, esse
sono estendibili ad un opportuno parallelogramma contenente D.
Dimostrazione
`
E ovvio che tutte le funzioni della forma sopra scritta risol-
vono lequazione (4.11).
Viceversa, loperatore di DAlembert D
2
t
c
2
D
2
x
si può fattorizzare nella for-
ma (D
t
cD
x
)(D
t
+cD
x
), cosicche lequazione (4.11) è equivalente al sistema
del primo ordine
_
(D
t
+cD
x
)u = v
(D
t
cD
x
)v = 0.
(4.13)
143
Se u è una soluzione di classe C
2
dellequazione (4.11), allora v = u
t
+cu
x
è
di classe C
1
e risolve lequazione v
t
cv
x
= 0. Poniamo, per R,
S
= (x, t) D : x +ct = .
La funzione v è costante su S
(ammesso che questo non sia vuoto): infatti,

nei punti di S
, che sono della forma ( ct, t) con t I
(ove I
, essendo
D convesso, è un opportuno intervallo di R), si ha
d
dt
v( ct, t) = c v
x
( ct, t) +v
t
( ct, t) = (v
t
cv
x
)( ct, t) = 0.
Sia w() il valore costante che v assume su S
: allora per ogni (x, t) D,

posto = x +ct, si ha v(x, t) = w() = w(x +ct), e in denitiva
v(x, t) = w(x +ct) (x, t) D.
In particolare, la funzione w è di classe C
1
. Dunque, se è una funzione di
classe C
2
tale che
() =
1
2c
w(), si avrà
(D
t
+cD
x
)(x+ct) = 2c
(x+ct) = w(x+ct) = v(x, t) = (D

t
+cD
x
)u(x, t),
ossia la funzione z(x, t) = u(x, t) (x +ct) risolve lequazione z
t
+cz
x
= 0
ed è di classe C
2
.
Se ora poniamo
T
= (x, t) D : x ct = ,
si trova che nei punti ( + ct, t) di T
, sempre che questo sia non vuoto, si

ha
d
dt
z( +ct, t) = cu
x
( +ct, t) +u
t
( +ct, t) w( + 2ct) =
= (u
t
+cu
x
v)( +ct, t) = 0,
e dunque z è costante su T
: detto () tale valore, come in precedenza si

ricava che
z(x, t) = (x ct) (x, t) D,
e in particolare è di classe C
2
. Pertanto
u(x, t) = (x +ct) +(x ct) (x, t) D
144
con e funzioni di classe C
2
. Inoltre, è denita su un certo intervallo I
e è denita su un certo intervallo J: si conclude che u è denita sullintero
parallelogramma
P = (x, t) : x +ct I, x ct J,
il quale contiene D poiche la soluzione è denita, per ipotesi, su tutto D.
Osservazione 4.2.2 Per un osservatore che si muova con velocità c lungo
la direzione positiva dellasse x, il valore di x ct resta costante nel tempo:
quindi (x ct) rimane costante. In altre parole, il graco di z = (x ct)
nel piano xz si sposta con velocità c verso destra (asse delle x positive). Ana-
logamente, il graco z = (x+ct) si sposta con velocità c verso sinistra (asse
delle x negative). Le funzioni x (x ct) e x (x + ct) si chiamano
onde piane, e come abbiamo visto queste onde si propagano con velocità c
lungo lasse x mantenendo la propria forma. In denitiva, il teorema 4.2.1
ci dice che ogni soluzione dellequazione di DAlembert si ottiene sovrappo-
nendo due onde piane, la prima progressiva (che si propaga con velocità c),
la seconda regressiva (che si propaga con velocità c).
Enunciamo ora il teorema di esistenza per il problema di Cauchy in una
variabile spaziale.
Teorema 4.2.3 Se C
2
(R) e C
1
(R), allora il problema di Cauchy
_
_
u
tt
c
2
u
xx
= 0 in R
2
,
u(x, 0) = (x), x R,
u
t
(x, 0) = (x), x R,
(4.14)
è ben posto e la sua unica soluzione, che appartiene a C
2
(R[0, [), è data
dalla formula di DAlembert
u(x, t) =
1
2
[(x +ct) +(x ct)] +
1
2c
_
x+ct
xct
() d. (4.15)
Dimostrazione Se la soluzione esiste, sappiamo dal teorema 4.2.1 che essa
ha la forma (4.12), con , funzioni di classe C
2
. Le condizioni iniziali ci
dicono che
(x) +(x) = (x), c[
(x)
(x)] = (x) x R.
145
Daltra parte vale lidentità, di facile verica,
(x +ct) +(x ct) =
=
1
2
[(x +ct) +(x +ct) +(x ct) +(x ct)] +
+
1
2
_
x+ct
xct
[
()
()] d,
quindi la soluzione u, se esiste, è data dalla formula (4.15).
Daltra parte, sempre per il teorema 4.2.1 la funzione (4.15) è davvero solu-
zione del problema (4.14), essendo somma di due funzioni calcolate rispetti-
vamente in x + ct e x ct, la cui regolarità C
2
è assicurata dalla regolarità
dei dati e .
Inne, verichiamo che il problema è ben posto: se , L
(R), allora per

ogni (x, t) R [T, T] si ha
[u(x, t)[ ||
+
1
2c
_
x+|ct|
x|ct|
[()[d ||
+T||
,
Dal punto di vista qualitativo, la formula (4.15) ci rivela immediatamente
che il valore della soluzione u del problema (4.14) in un punto (x
0
, t
0
), con
t
0
positivo, dipende soltanto dai valori assunti dal dato nei due punti
x
0
ct
0
e da nellintervallo [x
0
ct
0
, x
0
+ ct
0
]. Questo intervallo si dice
dominio di dipendenza del punto (x
0
, t
0
). Pi` u in generale, dato un intervallo
I = [a r, a + r] R, linsieme dei punti (x, t), per i quali il valore di u in
(x, t) dipende solo dai valori dei dati , in punti di I, è il rombo
B(I) = (x, t) R
2
: [x a[ r c[t[.
Le rette di pendenza
1
c
nel piano xt, come sappiamo, sono le caratteristiche
dellequazione. Conducendo per un punto (x
0
, 0) le due caretteristiche, si
determina il cono
c(x
0
) = (x, t) R
2
: [x x
0
[ c[t[,
il quale si chiama dominio di inuenza del punto x
0
R. Esso è costituito
dai punti (x, t) tali che il valore u(x, t) è inuenzato dai valori assunti in x
0
dai dati , . Osserviamo che, per giunta, il valore di in x
0
inuenza la so-
luzione solamente nei punti delle rette xx
0
= ct. In altre parole, possiamo
146
dire che le perturbazioni si propagano lungo le linee caratteristiche. Cè da
osservare inoltre un fatto fondamentale: a dierenza che nel caso parabolico,
i fenomeni iperbolici sono reversibili nel tempo: questo segue dallinvarianza
dellequazione delle onde rispetto alla trasformazione t t, e ce lo confer-
ma la forma della soluzione (4.15).
Consideriamo ora un altro problema unidimensionale: quello della corda
semi-nita, ossia lequazione di DAlembert sulla semiretta [0, [. Ci li-
miteremo, per semplicità, alla semiretta dei tempi positivi. Il problema è il
seguente:
_
_
u
tt
c
2
u
xx
= 0 in ]0, [
2
,
u(x, 0) = (x), x 0,
u
t
(x, 0) = (x), x 0
u(0, t) = h(t), t 0,
(4.16)
ove e h sono funzioni di classe C
2
mentre è di classe C
1
. Poiche cerchiamo
una soluzione di classe C
2
, dobbiamo imporre le condizioni di compatibilità
h(0) = (0), h
(0) = (0), h
(0) = c
2
(0). (4.17)
Si ha allora questo risultato:
Teorema 4.2.4 Se C
2
([0, [), h C
2
([0, [), C
1
([0, [), e se val-
gono le condizioni (4.17), allora il problema (4.16) è ben posto e la soluzione
u C
2
([0, [[0, [) è data da
u(x, t) =
_
_
(x +ct) +(x ct)
2
+
1
2c
_
x+ct
xct
() d se x ct,
h(t
x
c
) +
(ct +x) (ct x)
2
+
1
2c
_
ct+x
ctx
() d se x ct.
Dimostrazione Sappiamo dal teorema 4.2.1 che la soluzione u, se esiste, ha
la forma u(x, t) = (x +ct) +(x ct), con e di classe C
2
. Imponendo
le condizioni al contorno, otteniamo
_
_
(x) +(x) = (x) x 0,
c
(x) c
(x) = (x) x 0,
(ct) +(ct) = h(t) t 0.
(4.18)
147
Derivando la prima equazione, si ha il sistema
_

(x) +
(x) =
(x) x 0,
c
(x) c
(x) = (x) x 0,
da cui
(x) =
1
2
(x) +
1
2c
_
x
0
() d, (x) =
1
2
(x)
1
2c
_
x
0
() d x 0.
Si noti che dovremmo aggiungere ad e due costanti arbitrarie h e k, ma
la condizione (x) + (x) = (x) implica che h + k = 0; tenuto conto che
u = +, non è restrittivo scegliere h = k = 0.
Invece per ogni < 0 si ha dalla terza equazione del sistema (4.18)
() = () +h(/c) =
1
2
()
1
2c
_

0
() d +h(/c).
Sostituendo le espressioni delle funzioni e nella denizione della candidata
soluzione, si ottengono senza dicoltà le formule relative a u. Si noti che,
in virt` u delle condizioni di compatibilità (4.17), la funzione u è di classe C
2
anche nei punti in cui x = ct. Inne, il problema è ben posto perche si ha,
per ogni T > 0 e per ogni (x, t) [0, [[0, T],
[u(x, t)[
_
||
+T||
se x ct,
|h|
+||
+T||
se x ct.
Osservazione 4.2.5 Quando h(t) 0, la soluzione in un punto (x
0
, t
0
) è,
per x
0
ct
0
,
u(x
0
, t
0
) =
_
1
2
(ct
0
+x
0
) +
1
2c
_
ct
0
+x
0
0
() d
_
_
1
2
(ct
0
x
0
) +
1
2c
_
ct
0
x
0
0
() d
_
,
ossia è somma di unonda diretta (regressiva, con velocità c, partita dal
punto di ascissa x = x
0
+ ct
0
allistante t = 0) e di unonda riessa, pro-
gressiva (velocità c), che è il risultato della riessione, avvenuta nellestremo
x = 0 allistante t = t
0

x
0
c
, di unonda regressiva, partita allistante t = 0
148
dal punto di ascissa x = ct
0
x
0
. Se prolunghiamo per disparità le funzioni
e a tutto R, la soluzione si estende a tutto R[0, [ nel modo seguente:
u(x, t) =
(x +ct) +(x ct)
2
+
1
2c
_
x+ct
xct
() d (x, t) R [0, [,
cioè ritroviamo la formula (4.15). Si noti che le estensioni dispari di e sono
rispettivamente di classe C
2
e C
1
, in virt` u delle condizioni di compatibilità
(4.17).
Concludiamo lesame dei problemi in una dimensione spaziale con il caso
della corda di lunghezza nita L, ssata agli estremi 0 e L:
_
_
u
tt
c
2
u
xx
= 0 in ]0, L[]0, [,
u(x, 0) = (x), x [0, L],
u
t
(x, 0) = (x), x [0, L],
u(0, t) = u(L, t) = 0, t 0,
(4.19)
Le condizioni di compatibilità per avere una soluzione in C
2
([0, L] [0, [)
sono:
(0) = (0) =
(0) = 0, (L) = (L) =
(L) = 0. (4.20)
Si ha allora:
Teorema 4.2.6 Se C
2
([0, L]) e C
1
([0, L]), e se valgono le con-
dizioni (4.20), allora il problema (4.19) è ben posto e la soluzione u
C
2
([0, L] [0, [) è data da
u(x, t) =
(x +ct) +(x ct)
2
+
1
2c
_
x+ct
xct
() d, (4.21)
ove e sono i prolungamenti dispari e 2L-periodici di e di a tutto R.
In particolare, la soluzione u è periodica nella variabile t di periodo 2L/c.
Dimostrazione La soluzione u, se esiste, ha la forma u(x, t) = (x + ct) +
(x ct). Le condizioni u(0, t) = u(L, t) = 0 ci dicono che
(ct) +(ct) = 0, (L +ct) +(L ct) = 0,
149
il che implica () = () per ogni 0 ed anche (L+) = (L) =
( L) per ogni L. Pertanto (x) = (x + 2L) per ogni x 0 e
(x) = (x 2L) per ogni x 0. Possiamo dunque prolungare e a
funzioni e denite su R e 2L-periodiche.
Dalle condizioni iniziali del sistema (4.19) ricaviamo poi
(x) = (x) +(x), (x) = c
(x) c
(x) x [0, L] (4.22)

da cui si deduce facilmente, come nel caso della corda semi-nita,
(x) =
1
2
(x) +
1
2c
_
x
0
()d,
(x) =
1
2
(x)
1
2c
_
x
0
()d
x [0, L]. (4.23)
Utilizzando la periodicità delle estensioni e , è facile riconoscere che
(x) = (x),
(x) =
(x) x R,
e in particolare, quindi,
(x) = (x) (x), (x) = c(
(x)
(x)) x [0, L].

Volendo estendere i dati e in modo che la (4.22) valga per ogni x R,
bisogna che le estensioni siano esse stesse, come e , funzioni dispari e 2L-
periodiche. Dette e tali estensioni, si ottiene che la (4.23) vale anchessa
per ogni x R. Da qui segue subito che u, se esiste, ha la forma prescritta
nellenunciato ed è quindi a sua volta prolungabile ad una funzione denita
su [0, L] R, periodica nella variabile t di periodo
2L
c
. Si noti che
2L
c
è il
tempo impiegato da unonda per partire da un punto, percorrere la corda
in un senso, riettersi a una estremità, percorrerla nellaltro senso, riettersi
alla seconda estremità e tornare al punto di partenza.
Dalla forma (4.21) della soluzione segue inne immediatamente la dipendenza
continua dai dati nella norma uniforme in [0, L] [T, T].
Osservazione 4.2.7 Talvolta è pi` u utile cercare la soluzione del problema
(4.19) sotto forma di serie di Fourier, quantunque questa scelta comporti
ipotesi pi` u restrittive sui dati: occorre infatti prendere C
3
([0, L]) e
C
2
([0, L]), tali che valgano le condizioni (4.20). Possiamo sviluppare le
funzioni e in serie di soli seni:
(x) =
n=1
a
n
sin
nx
L
, (x) =
n=1
b
n
sin
nx
L
.
150
Si noti che in tal modo e possono pensarsi prolungate a R in modo
dispari e 2L-periodico e che le serie sopra scritte convergono uniformemente
in R, al pari delle serie relative a
. Con il metodo della separazione

di variabili non è dicile mostrare che la soluzione u è data da
u(x, t) =
1
2
n=1
a
n
_
sin
n(x +ct)
L
+ sin
n(x ct)
L
_
L
2c
n=1
b
n
n
_
cos
n(x +ct)
L
cos
n(x ct)
L
_
Questa è la rappresentazione di u come somma di onde progressive e regres-
sive. Con evidenti modiche si può anche rappresentare la soluzione come
somma di onde stazionarie,
u(x, t) =
n=1
_
A
n
cos
nct
L
+B
n
sin
nct
L
_
sin
nx
L
=
=
n=1
N
n
sin
_
nct
L
+
n
_
sin
nx
L
,
ove
A
n
=
2
L
_
L
0
() sin
n
L
d, B
n
=
2
nc
_
L
0
() sin
n
L
d,
A
n
= N
n
sin
n
, tan
n
=
A
n
B
n
.
Questo modo di scrivere la soluzione del problema (4.19) si presta a una
analisi musicale del suono prodotto dalla vibrazione della corda: ogni onda
stazionaria N
n
sin
_
nct
L
+
n
_
sin
nx
L
, che viene detta armonica del suono,
determina per ciascun punto x della corda un moto armonico di ampiezza
N
n
sin
nx
L
e fase
n
(che è la stessa per tutti i punti). La corda, di conse-
guenza, emette un suono di altezza pari alla frequenza di oscillazione
nx
L
, in-
tensità [N
n
[ e timbro determinato dalla struttura dellinsieme delle ampiezze
(che decrescono verso 0 per n ).
151
4.3 Il metodo dellenergia
In questo paragrafo inizieremo lo studio dellequazione delle onde in n varia-
bili spaziali. Mostreremo che il problema di Cauchy
_
_
u
tt
c
2
u = 0 in R
n
]0, [,
u(x, 0) = (x), x R
n
,
u
t
(x, 0) = (x), x R
n
,
(4.24)
ha al pi` u una soluzione e proveremo la dipendenza continua della soluzione
dai dati in opportune norme integrali, rimandando la costruzione esplicita
della soluzione ai paragra successivi.
Per stabilire lunicità della soluzione faremo uso del metodo dellenergia.
Tutto si basa sul seguente
Lemma 4.3.1 Se u C
2
(R
n
[0, [) è soluzione dellequazione delle onde
in R
n
]0, [ e se
u(x, 0) = u
t
(x, 0) = 0 per [x x
0
[ a,
allora u 0 sul cono (x, t) : ct +[x x
0
[ a.
Dimostrazione Sia t
0
]0,
a
c
[, e consideriamo il tronco di cono D = (x, t) :
ct +[x x
0
[ a, 0 < t < t
0
. Moltiplichiamo lequazione delle onde per 2u
t
e integriamo su D:
0 =
_
D
2u
t
(u
tt
c
2
u)dxdt =
_
D
t
[u
t
[
2
dxdt 2c
2
_
D
u
t
udxdt;
daltra parte risulta
2u
t
u =
_
2u
t
u + 2
n
i=1
D
i
u
t
D
i
u
_
2
n
i=1
D
i
u
t
D
i
u =
= 2
n
i=1
D
i
(u
t
D
i
u)

t
[u[
2
,
cosicche sostituendo nella relazione precedente ricaviamo
0 =
_
D
t
([u
t
[
2
+c
2
[u[
2
) dxdt 2c
2
_
D
n
i=1
D
i
(u
t
D
i
u) dxdt.
152
Notando che D è di classe C
1
a tratti possiamo utilizzare il teorema della
divergenza, ottenendo
0 =
_
D
_
([u
t
[
2
+c
2
[u[
2
)
t
2c
2
n
i=1
u
t
D
i
u
i
_
d,
ove è il versore normale esterno a D in R
n+1
. Decomponendo D nelle sue
tre parti
1
(la base),
2
(la sommità) e
3
(la supercie laterale), si ha:
su
1
, = (0, . . . , 0, 1) e t = 0,
su
2
, = (0, . . . , 0, 1) e t = t
0
,
su
3
, = (
1
, . . . ,
n
,
t
) con
t
=
c
1 +c
2
,
n
i=1
2
i
= 1
2
t
=
1
1 +c
2
=

2
t
c
2
.
Notiamo inoltre che su
1
lintegrando è nullo a causa delle condizioni iniziali.
Pertanto deduciamo
0 =
_
2
_
[u
t
(x, t
0
)[
2
+c
2
[u(x, t
0
)[
2
dx +
+
1
t
_
3
n
i=1
_
c
2
[u
t
[
2
2
i
+c
2
(D
i
u)
2
2
t
2c
2
u
t
D
i
u
i
d =
=
_
2
_
[u
t
(x, t
0
)[
2
+c
2
[u(x, t
0
)[
2
dx +
c
2
2
t
_
3
n
i=1
(u
t
i
D
i
u
t
)
2
d,
da cui
u
2
t
+c
2
[u[
2
= 0 su
2
.
Poiche t
0
è arbitrario, si ha
u
t
(x, t) = 0, u(x, t) = 0 per t ]0, a/c[ e [x x
0
[ a ct;
per continuità deduciamo che u è costante per ct +[x x
0
[ a. Daltronde,
essendo u(x, 0) = 0 concludiamo che u 0 per ct +[x x
0
[ a.
153
Corollario 4.3.2 Il problema di Cauchy
_
_
u
tt
c
2
u = f in R
n
[0, [,
u(x, 0) = (x), x R
n
,
u
t
(x, 0) = (x), x R
n
,
(4.25)
con f C(R
n
[0, [), C
2
(R
n
) e C
1
(R
n
), ha al pi` u una soluzione.
Dimostrazione Se u e v sono due soluzioni, la loro dierenza risolve il
problema (4.24) con e nulle; dunque si può applicare il lemma 4.3.1 per
ogni scelta di x
0
R
n
e a ]0, [. Ne segue che u v è identicamente nulla.
Osservazione 4.3.3 Pi` u in generale, per il problema di Cauchy (4.24) vale
un principio di conservazione dellenergia: se u risolve lequazione delle
onde in R
n
[0, [ e se e hanno supporto compatto in R
n
(cosicche
anche u ha supporto compatto rispetto a x per ogni t [0, T], con T > 0
opportuno), allora lintegrale dellenergia
E(t) =
_
R
n
[[u
t
(x, t)[
2
+c
2
[u(x, t)[
2
] dx
è costante in [0, T]. Infatti, procedendo come nella dimostrazione del lemma
4.3.1, otteniamo per t [0, T]
0 =
_
R
n
2u
t
(x, t)(u
tt
(x, t) c
2
u(x, t)) dx =
=
d
dt
_
R
n
[u
t
(x, t)[
2
dx 2c
2
_
R
n
u
t
(x, t)
n
i=1
D
2
i
u(x, t) dx =
=
d
dt
_
R
n
[u
t
(x, t)[
2
dx + 2c
2
_
R
n
n
i=1
D
i
u
t
(x, t) D
i
u(x, t) dx =
=
d
dt
_
R
n
([u
t
(x, t)[
2
+c
2
[u(x, t)[
2
) dx =
d
dt
E(t),
ove si è integrato per parti in R
n
usando il fatto che u(x, t) è identicamente
nulla fuori di un compatto. Pertanto
d
dt
E(t) = 0 t [0, T],
il che prova lenunciato.
154
4.4 Il problema di Cauchy in due e tre varia-
bili spaziali
Veniamo ora al problema dellesistenza per il problema (4.24) nel caso n = 2
oppure n = 3. Ci proponiamo di fornire una formula esplicita per la soluzione.
A questo scopo occorre provare alcuni fatti preliminari che valgono per n
arbitrario.
Sia (x, t) un punto ssato di R
n
]0, [, e consideriamo per ogni r > 0 le
medie sferiche di una soluzione u di classe C
2
del problema (4.24):
U(x, r, t) =
1
n
r
n1
_
B(x,r)
u(y, t) d
y
=:
_
B(x,r)
u(y, t) d
y
, (4.26)
e, analogamente, per un ssato x R
n
, quelle dei dati e :
(x, r) =
_
B(x,r)
(y) d
y
, (x, r) =
_
B(x,r)
(y) d
y
. (4.27)
Useremo, pi` u in generale, il simbolo
_
A
per denotare la media integrale su un
qualunque insieme (misurabile) A.
Vale allora questo lemma:
Lemma 4.4.1 Sia u C
2
(R
n
[0, [) soluzione del problema (4.24). Allo-
ra, per ogni x R
n
, la funzione U(x, , ) appartiene a C
2
([0, [
2
) e risolve
il problema
_
_
U
tt
(x, , ) c
2
_
U
rr
(x, , ) +
n1
r
U
r
(x, , )
_
= 0 in [0, [
2
,
U(x, r, 0) = (x, r), r 0,
U
t
(x, r, 0) = (x, r), r 0,
U(x, 0, t) = u(x, t), t 0.
(4.28)
Se, in pi` u, u C
k
(R
n
[0, [), con k > 2, allora U(x, , ) C
k
([0, [
2
).
Lequazione che compare in questo enunciato si chiama equazione di Eulero-
Poisson-Darboux. Si noti che lespressione U
rr
+
n1
r
U
r
corrisponde al La-
placiano applicato alle funzioni radiali, nel senso che se v è una funzione
radiale, cioè tale che v(x) = [u(r)]
r=|x|
= u([x[), allora risulta v(x) =
u
rr
([x[) +
n1
|x|
u
r
([x[).
155
Dimostrazione Nel calcolo delle derivate U
r
e U
rr
non è restrittivo supporre
u C
(R
n
[0, [), poiche, per ogni ssato compatto di R
n
[0, [, u è
limite in C
2
(K) di una successione di funzioni di classe C
.
Anzitutto, per omotetia si vede che
U(x, r, t) =
1
n
_
B(0,1)
u(x +rz, t) d
z
=
_
B(0,1)
u(x +rz, t) d
z
,
da cui
lim
r0
+
U(x, r, t) = u(x, t);
inoltre, derivando sotto il segno di integrale,
U
t
(x, r, t) =
_
B(0,1)
u
t
(x +rz, t) d
z
, U
tt
(x, r, t) =
_
B(0,1)
u
tt
(x +rz, t) d
z
.
In particolare, è chiaro che risulta, grazie alla continuità di u e u
t
,
U(x, r, 0) = (x, r), U
t
(x, r, 0) = (x, r) r > 0.
Per quanto riguarda le derivazione rispetto a r, possiamo scrivere
U
r
(x, r, t) =

r
1
n
_
B(0,1)
u(x +rz, t) d
z
=
=
1
n
_
B(0,1)
u(x +rz, t) z d
z
,
il che ci dice che U
r
dipende dalle derivate prime di u. Proseguendo il calcolo,
risulta
U
r
(x, r, t) =
1
n
r
n1
_
B(x,r)
u(y, t)
y x
r
d
y
=
=
1
n
r
n1
_
B(x,r)
u
(y, t) d
y
=
1
n
r
n1
_
B(x,r)
u(y, t) dy =
=
r
n
_
B(x,r)
u(y, t) dy =
r
n
_
B(0,1)
u(x +rz, t) dz,
e, in particolare, otteniamo lim
r0
+ U
r
(x, r, t) = 0. Inoltre
U
rr
(x, r, t) =

r
r
n
_
B(0,1)
u(x +rz, t) dz =
=
1
n
_
B(0,1)
u(x +rz, t) dz +
r
n
_
B(0,1)
u(x +rz, t) z dz;
156
ora, poiche risulta, per il teorema della divergenza,
r
n
_
B(0,1)
u(x +rz, t) z dz =
1
n
_
B(0,1)
n
i=1
z
i
[u(x +rz, t)] z
i
dz =
=
1
n
_
B(0,1)
n
i=1
u(x +rz, t) z
i
i
d
z

n
_
B(0,1)
n
i=1
u(x +rz, t) D
i
z
i
dz =
=
1
n
_
B(0,1)
u(x +rz, t) d
z

n
n
_
B(0,1)
u(x +rz, t) dz =
=
_
B(0,1)
u(x +rz, t) d
z

_
B(0,1)
u(x +rz, t) dz,
deduciamo che
U
rr
(x, r, t) =
_
1
n
1
__
B(0,1)
u(x +rz, t) dz +
_
B(0,1)
u(x +rz, t) d
z
.
In particolare, lim
r0
+ U
rr
(x, r, t) =
1
n
u(x, t).
`
E allora facile vericare che
U(x, , ) e le sue derivate U
r
, U
t
, U
rr
, U
rt
, U
tt
sono funzioni continue in [0, [
2
.
Ci` o prova che U(x, , ) C
2
([0, [
2
).
Se, poi, u C
k
([0, [
2
), allora partendo dalle espressioni di U, U
r
e U
rr
è
possibile calcolare tutte le derivate di ordine k di U, e mostrarne senza par-
ticolari dicoltà la continuità in [0, [
2
.
Verichiamo inne che U risolve lequazione di Eulero-Poisson-Darboux. Dal-
lespressione di U
r
in termini di media integrale su B(x, r) ricaviamo
r
n1
U
r
(x, r, t) =
r
n
n
_
B(x,r)
u(y, t) dy =
1
c
2
n
_
B(x,r)
u
tt
(y, t) dy,
da cui
r
(r
n1
U
r
(x, r, t)) =
1
c
2
r
_
r
0
_
B(x,)
u
tt
(y, t) d
y
d =
=
r
n1
c
2
_
B(x,r)
u
tt
(y, t) d
y
=
r
n1
c
2
U
tt
(x, r, t).
Ne segue
U
tt
=
c
2
r
n1
r
(r
n1
U
r
) = c
2
_
U
rr
+
n 1
r
U
r
_
,
157
Passiamo ora a dimostrare i teoremi di esistenza per il problema (4.24) nei
casi n = 2 e n = 3. Considereremo anzitutto il caso n = 3; laltro, co-
me vedremo, si deduce dal primo. Il caso di n qualunque sarà trattato nel
paragrafo successivo.
Teorema 4.4.2 Sia n = 3, siano C
2
(R
3
) e C
1
(R
3
), e sia u
C
2
(R
3
[0, [) una soluzione del problema
_
_
u
tt
c
2
u = 0 in R
3
[0, [,
u(x, 0) = (x), x R
3
,
u
t
(x, 0) = (x), x R
3
,
(4.29)
Allora u è data dalla formula di Kirchho
u(x, t) =

t
_
t
_
B(0,1)
(x +ctz) d
z
_
+t
_
B(0,1)
(x +ctz) d
z
=
=
_
B(x,ct)
[t(y) +(y) +(y) (y x)] d
y
(x, t) R
3
]0, [.
(4.30)
Viceversa, se C
3
(R
3
) e C
2
(R
3
), allora il problema (4.29) è ben
posto e la sua unica soluzione è la funzione (4.30), la quale appartiene a
C
2
(R
3
[0, [).
Dimostrazione Poniamo per un ssato x R
3
e per ogni (r, t) ]0, [
2
:
V (x, r, t) = r U(x, r, t), G(x, r) = r (x, r), H(x, r) = r (x, r). (4.31)
Proviamo che V (x, , ) risolve il seguente problema di Cauchy, in una dimen-
sione spaziale, per la corda semi-nita:
_
_
V
tt
(x, , ) c
2
V
rr
(x, , ) = 0 in [0, [
2
,
V (x, r, 0) = G(x, r), r 0,
V
t
(x, r, 0) = H(x, r), r 0,
V (x, 0, t) = 0, t 0.
(4.32)
Si noti che in questo problema le condizioni di compatibilità necessarie per
avere una soluzione di classe C
2
sono vericate: infatti, procedendo come si
158
è fatto in precedenza per la funzione U(x, r, t), si verica in modo un po
laborioso ma non dicile che
lim
r0
G(x, r) = 0, lim
r0
H(x, r) = 0, lim
r0
G
rr
(x, r) = 0.
Le condizioni ai limiti per V sono soddisfatte: infatti, essendo u soluzione di
(4.29), utilizzando (4.26) e (4.27) si ha
V (x, r, 0) = r
_
B(x,r)
u(y, 0) d
y
= r
_
B(x,r)
(y) d
y
= r(x, r) = G(x, r),
V
t
(x, r, 0) = r
_
B(x,r)
u
t
(y, 0) d
y
= r
_
B(x,r)
(y) d
y
= r(x, r) = H(x, r).
ed anche, ovviamente,
V (x, 0, t) = lim
r0
rU(x, r, t) = 0.
Inoltre, per il lemma 4.4.1,
V
tt
= r U
tt
= r c
2
_
U
rr
+
2
r
U
r
_
= c
2

r
(U +rU
r
) = c
2

r
V
r
= c
2
V
rr
. (4.33)
Dunque, per V (x, , ) vale il teorema 4.2.4, in base al quale quando r < ct si
ha
V (x, r, t) =
G(x, ct +r) G(x, ct r)
2
+
1
2c
_
ct+r
ctr
H(x, ) d.
Essendo
u(x, t) = lim
r0
U(x, r, t) = lim
r0
V (x, r, t)
r
,
si deduce facilmente, ricordando (4.31) e (4.27),
u(x, t) = G
r
(x, ct) +
1
c
H(x, ct) =
1
c
_
t
G(x, ct) +H(x, ct)
_
=
=
1
c
t
(ct (x, ct)) +t (x, ct) =

t
(t (x, ct)) +t (x, ct) =
=
d
dt
_
t
_
B(0,1)
(x +ctz) d
z
_
+t
_
B(0,1)
(x +ctz) d
z
.
Svolgendo la derivata rispetto a t, si ottiene facilmente la seconda rappresen-
tazione in (4.30). Ciò prova la prima parte del teorema 4.4.2.
159
Adesso dobbiamo provare che se C
3
(R
3
) e C
2
(R
3
), allora la funzione
u, data da (4.30), risolve il problema (4.29). Per la verica delle condizioni
iniziali si utilizza la prima formulazione della formula di Kirchho:
u(x, 0) = lim
t0
__
B(0,1)
(x +ctz) d
z
+ct
_
B(0,1)
(x +ctz) z d
z
+
+t
_
B(0,1)
(x +ctz) d
z
_
= (x),
e analogamente
u
t
(x, 0) = lim
t0
_
2c
_
B(0,1)
(x +ctz) z d
z
+
+ c
2
t
_
B(0,1)
[
2
(x +ctz) z] z d
z
+
_
B(0,1)
(x +ctz) d
z
+
+ ct
_
B(0,1)
(x +ctz) z d
z
_
=
= 2c
_
B(0,1)
(x) z d
z
+(x) = (x).
Per quanto riguarda lequazione dierenziale, è suciente provare, pi` u in
generale, che se C
2
(R
3
) allora la funzione
v(x, t) = t
_
B(0,1)
(x +ctz) d
z
è soluzione dellequazione delle onde: infatti, da ciò si ha come conseguenza
che se C
3
(R
3
) allora anche v
t
risolve tale equazione, essendo evidente-
mente (v
t
)
tt
= v
ttt
= c
2
(v)
t
= c
2
v
t
.
In eetti, risulta
v
tt
(x, t) =

t
__
B(0,1)
(x +ctz) dz +ct
_
B(0,1)
(x +ctz) z d
z
_
=
=
2c
4
_
B(0,1)
(x +ctz) z d
z
+
ct
4
t
_
B(0,1)
(x +ctz) z d
z
=
=
1
2ct
2
_
B(x,ct)
(y)
y x
ct
d
y
+
160
+
ct
4
t
_
1
c
2
t
2
_
B(x,ct)
(y)
y x
ct
d
y
_
=
=
1
2ct
2
_
B(x,ct)
(y) d
y
+
ct
4
t
_
1
c
2
t
2
_
B(x,ct)
(y) d
y
_
=
=
1
2ct
2
_
B(x,ct)
(y) dy +
+
t
4c
_
2
t
3
_
B(x,ct)
(y) dy +
1
t
2
t
_
ct
0
_
B(x,)
(y) d
y
d
_
=
=
1
4t
_
B(x,ct)
(y) d
y
=
c
2
t
4
_
B(0,1)
(x +ctz) d
z
= c
2
v(x, t).
Per concludere la dimostrazione, osserviamo che dalla formula di Kirchho
segue facilmente che la dipendenza continua dai dati vale nel senso seguente:
per ogni T > 0 e per ogni (x, t) R
3
[0, T] si ha
[u(x, t)[ C[||
+||
+T ||
],
sempre che, naturalmente, il secondo membro sia nito. Il teorema 4.4.2 è
provato.
Passiamo ora al caso n = 2. Qui non si riesce pi` u a ridurre lequazione di
Eulero-Poisson-Darboux allequazione della corda semi-nita, perche manca
lanalogo della (4.33). Allora si ricorre allarticio di considerare una soluzio-
ne u C
2
(R
2
[0, [) come una funzione di tre variabili, costante rispetto
alla terza, che risolve il problema di Cauchy in R
3
[0, [ con dati a loro vol-
ta costanti rispetto alla terza variabile spaziale. Questa procedura si chiama
metodo di discesa.
Teorema 4.4.3 Sia n = 2, siano C
2
(R
2
) e C
1
(R
2
), e sia u
C
2
(R
2
[0, [) una soluzione del problema
_
_
u
tt
c
2
u = 0 in R
2
[0, [,
u(x, 0) = (x), x R
2
,
u
t
(x, 0) = (x), x R
2
,
(4.34)
161
Allora u è data dalla formula di Parseval
u(x, t) =

t
_
t
2
_
B(0,1)
(x +ctz)
_
1 [z[
2
dz
_
+
t
2
_
B(0,1)
(x +ctz)
_
1 [z[
2
dz =
=
c
2
_
B(x,ct)
t
2
(y) +t[(y) +(y) (y x)]
_
c
2
t
2
[y x[
2
dy.
(4.35)
Viceversa, se C
3
(R
2
) e C
2
(R
2
C
2
(R
2
[0, [) .
Dimostrazione Sia u C
2
(R
2
[0, [) soluzione del problema (4.34).
Per ogni x = (x
1
, x
2
, z) R
3
scriviamo x
= (x
1
, x
2
), cosicche x = (x
, z).
Deniamo
u(x, t) = u(x
, t) (x, t) R
3
[0, [.
Analogamente, poniamo
(x) = (x
), (x) = (x
) x R
3
.
Se deniamo, per lestensione (x) = (x
) di una generica funzione

C(R
2
),
Z(x, r) =
_
B(x,r)
(y) d
y
, x R
3
, r > 0,
risulta, parametrizzando i due emisferi di B(x, r) mediante le funzioni z =
(y
) con (y
) =
_
r
2
[y
[
2
,
Z(x, r) =
2
4r
2
_
B(x
,r)
(y
)
_
1 +[(y
)[
2
dy
=
=
1
2r
_
B(x
,r)
(y
)
_
r
2
[y
[
2
dy
=
r
2
_
B(x
,r)
(y
)
_
r
2
[y
[
2
dy
,
e in particolare
Z(x, ct) =
ct
2
_
B(x
,ct)
(y
)
_
c
2
t
2
[y
[
2
dy
=
=
1
2
_
B(0
,1)
(x
+ctz
)
_
1 [z
[
2
dz
.
(4.36)
162
Ciò premesso, la funzione u risolve il problema di Cauchy
_
_
u
tt
c
2
u = 0 in R
3
[0, [,
u(x, 0) = (x), x R
3
,
u
t
(x, 0) = (x), x R
3
,
(4.37)
e quindi è data dalla formula di Kirchho (4.30):
u(x, t) =

t
_
t
_
B(0,1)
(x +ctz) d
z
_
+t
_
B(0,1)
(x +ctz) d
z
=
=
_
B(x,ct)
[t(y) +(y) +(y) (y x)] d
y
;
ne segue, in virt` u della (4.36),
u(x, t)=

t
_
t
2
_
B(0
,1)
(x
+ctz
)
_
1 [z
[
2
dz
_
+
t
2
_
B(0
,1)
(x
+ctz
)
_
1 [z
[
2
dz
=
=
ct
2
_
B(x
,ct)
t(y
) +(y
) +(y
) (y
)
_
c
2
t
2
[y
[
2
dy
,
(4.38)
formula che, notazioni a parte, coincide con la (4.35).
Se poi C
3
(R
2
) e C
2
(R
2
), poiche la formula (4.30) fornisce leettiva
soluzione (di classe C
2
) del problema (4.37), otteniamo che u, data dalla
(4.38), risolve lo stesso problema: ma essendo tale funzione indipendente da
z al pari dei dati e , essa, o meglio u, è anche soluzione (di classe C
2
) del
problema (4.34).
Inne, la dipendenza continua dai dati vale nello stesso senso in cui vale nel
caso n = 3: per ogni T > 0 e per ogni (x, t) R
2
[0, T] si ha
[u(x, t)[ C[||
+||
+T ||
],
sempre che il secondo membro sia nito.
Osservazione 4.4.4 Analizziamo le dierenze qualitative fra le soluzioni del
problema di Cauchy in R
n
[0, [ nei casi n = 1, 2, 3.
Quando n = 1, la soluzione u è data dalla formula di DAlembert (4.15) e,
come sappiamo, il valore di u in (x
0
, t
0
) dipende solo dai valori assunti da
nel dominio di dipendenza [x
0
ct
0
, x
0
+ ct
0
], e dai valori assunti da
163
nel bordo di tale dominio; viceversa, una perturbazione dei dati nel punto
x allistante t = 0 modicherà i valori assunti da u nellintero dominio di
inuenza (x, t) : [x x[ ct: infatti la perturbazione si propagherà no a
toccare x
0
allistante [x
0
x[/c e continuerà ad inuire (tramite la funzione
, ma non tramite la ) negli istanti successivi.
Quando n = 2 la soluzione u è fornita dalla formula di Parseval (4.35): il
valore u(x
0
, t
0
) dipende dai valori assunti da , e sullintero disco
B(x
0
, ct
0
). Leetto di una perturbazione avvenuta in x allistante iniziale è
risentito da tutti i punti del cono (x, t) : [x x[ ct, quindi nel punto x
0
linuenza agisce a partire dallistante [x
0
x[/c. Si noti che, a dierenza
del caso n = 1, ciò accade anche quando = 0. Questo è precisamente quel-
lo che succede quando si getta un sasso in uno stagno, prescindendo dagli
smorzamenti del moto ondoso dovuti a forze esterne ed attriti.
Nel caso n = 3, inne, la soluzione è data dalla formula di Kirchho (4.30) e
il valore u(x
0
, t
0
) dipende unicamente dai valori di , e su B(x
0
, ct
0
).
Una perturbazione avvenuta in x per t = 0 determinerà un eetto in x
0
sol-
tanto allistante [x
0
x[/c, senza lasciare traccia negli istanti successivi: in
altre parole, i segnali si propagano senza deformazione. Questo è il principio
di Huygens. Ad esempio, un battito di mani emesso a un dato istante viene
percepito dopo un certo tempo e il suo eetto cessa subito dopo. Natural-
mente, questo è vero quando non vi sono ostacoli sici alla propagazione:
in presenza di ostacoli, invece, le onde sonore si riettono dando luogo ai
fenomeni di eco.
4.5 Il problema di Cauchy in R
n
[0, [
Consideriamo il problema di Cauchy (4.24) in dimensione n qualunque. Pri-
ma di enunciare il teorema di esistenza, stabiliamo alcune utili identità.
Lemma 4.5.1 Sia k N
+
e sia C
k+1
(R). Allora per ogni r R si ha
(i)
d
2
dr
2
_
1
r
d
dr
_
k1
(r
2k1
(r)) =
_
1
r
d
dr
_
k
(r
2k
(r));
(ii)
_
1
r
d
dr
_
k1
(r
2k1
(r)) =
k1
j=0
k
j
r
j+1
(j)
(r), ove per j = 0, 1, . . . , k 1 le
quantità
k
j
sono costanti indipendenti da , e in particolare
k
0
= (2k 1)!! =: (2k 1) (2k 3) . . . 3 1;
164
(iii)
_
_
1
r
d
dr
_
k
(r)
_
r=ct
=
1
c
2k
_
1
t
d
dt
_
k
[(ct)] per ogni c > 0 e t > 0.
Dimostrazione (i) Utilizziamo linduzione su k. Per k = 1 la relazione da
dimostrare è vera perche per ogni C
2
(R) i due membri coincidono con
2
(r) +r
(r).
Supponiamo che la tesi valga per un ssato k e per ogni C
k+1
(R), e
dimostriamola per k + 1. Risulta per ogni C
k+2
(R)
d
2
dr
2
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
d
2
dr
2
_
1
r
d
dr
_
k1
__
1
r
d
dr
_
(r
2k+1
(r))
_
=
=
d
2
dr
2
_
1
r
d
dr
_
k1
_
(2k + 1)r
2k1
(r) +r
2k
(r)
=
=
d
2
dr
2
_
1
r
d
dr
_
k1
_
r
2k1
((2k + 1)(r) +r
(r))
.
Dallipotesi induttiva applicata alla funzione r (2k + 1)(r) + r
(r), che
appartiene a C
k+1
(R), segue
d
2
dr
2
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
_
1
r
d
dr
_
k
_
r
2k
d
dr
[(2k + 1)(r) +r
(r)]
_
=
=
_
1
r
d
dr
_
k
[r
2k
(2k + 2)
(r) +r
2k+1
(r)] =
=
_
1
r
d
dr
_
k
_
1
r
d
dr
(r
2k+2
(r))
_
=
_
1
r
d
dr
_
k+1
[r
2k+2
(r)],
e ciò prova (i).
(ii) Per k = 1 i due membri coincidono con r(r) e risulta
1
0
= 1, cosicche
la tesi è vera.
Se vale la tesi per un certo k, andiamo a provarla per lintero k + 1. Si ha
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
_
1
r
d
dr
_
k1
_
1
r
d
dr
(r
2k+1
(r))
_
=
=
_
1
r
d
dr
_
k1
[r
2k1
((2k + 1)(r) +r
(r))];
165
per lipotesi induttiva applicata alla funzione (2k +1)(r) +r
(r), si ottiene
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
k1
j=0
k
j
r
j+1
[(2k + 1)
(j)
(r) + (r
(r))
(j)
].
Adesso osserviamo che
(r
(r))
(j)
= r
j+1
(r) +j
(j)
(r) : (4.39)
infatti questa relazione è vera per j = 0, e se vale per un dato j allora
(r
(r))
(j+1)
=
d
dr
(r
(r))
(j)
=
d
dr
[r
(j+1)
(r) +j
(j)
(r)] =
= r
(j+2)
(r) + (1 +j)
(j+1)
(r).
Quindi, utilizzando la (4.39), si ricava
_
1
r
d
dr
_
k
(r
2k+1
(r)) =
=
k1
j=0
k
j
r
j+1
(2k + 1 +j)
(j)
(r) +
k
h=1
k
h1
r
h+1
(h)
(r) =
=
k
s=0
k+1
s
r
s+1
(s)
(r),
ove
_

k+1
0
= (2k + 1)
k
0
se s = 0,
k+1
s
= (2k + 1 +s)
k
s
+
k
s1
se s = 1, . . . , k.
Ci` o prova la formula enunciata in (ii). In particolare, il coeciente
k
0
si
ottiene dalla formula ricorsiva
_

0
0
= 1
k+1
0
= (2k + 1)
k
0
k N,
che dà immediatamente
k
0
= (2k 1)!! .
(iii) La formula è vera per k = 1, dato che si ha
__
1
r
d
dr
_
(r)
_
r=ct
=
1
ct
(ct) =
1
c
2
t
d
dt
[(ct)].
166
Se k > 1 e se la formula vale per tutti gli h k 1, allora nel caso di k,
applicando lipotesi induttiva, dapprima per h = 1 e poi per h = k 1, alla
funzione
_
1
r
d
dr
_
k1
(r), si trova che
_
_
1
r
d
dr
_
k
(r)
_
r=ct
=
_
_
1
r
d
dr
_
_
_
1
r
d
dr
_
k1
(r)
__
r=ct
=
1
c
2
t
d
dt
_
_
1
r
d
dr
_
k1
(r)
_
r=ct
=
1
c
2k
_
1
t
d
dt
_
k
[(ct)],
il che prova la tesi.
Veniamo ora al teorema di esistenza per il problema di Cauchy. Come è già
accaduto nel caso di due e tre dimensioni spaziali, è necessario separare il
caso di n dispari dal caso di n pari, perchè la struttura stessa della soluzione
è dierente nei due casi. Cominciamo con il caso di n dispari: laltro ne è
conseguenza quasi immediata tramite il metodo di discesa.
Teorema 4.5.2 Sia n = 2k + 1, e sia u C
k+1
(R
n
[0, [) soluzione del
problema di Cauchy (4.24). Allora u è data dalla formula
u(x, t) =
1
(n 2)!!
_
t
_
1
t
t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
+
+
_
1
t
t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
_
.
(4.40)
Se, in pi` u, C
n+3
2
(R
n
) e C
n+1
2
(R
n
C
2
(R
n
[0, [).
Dimostrazione Poniamo, per un ssato x R
n
,
V (x, r, t) =
_
1
r
r
_
k1
[r
2k1
U(x, r, t)],
G(x, r) =
_
1
r
r
_
k1
[r
2k1
(x, r)],
H(x, r) =
_
1
r
r
_
k1
[r
2k1
(x, r)],
(4.41)
167
ove le funzioni U(x, r, t), (x, r) e (x, r) sono denite dalle (4.26) e (4.27).
Si noti che risulta
V (x, r, 0) = G(x, r), V
t
(x, r, 0) = H(x, r) x R
n
, r > 0. (4.42)
Come nel caso di tre variabili spaziali, proviamo che V (x, , ) risolve il pro-
blema unidimensionale per la corda semi-nita:
_
_
V
tt
(x, , ) c
2
V
rr
(x, , ) = 0 in [0, [
2
,
V (x, r, 0) = G(x, r), r 0,
V
t
(x, r, 0) = H(x, r), r 0,
V (x, 0, t) = 0, t 0.
(4.43)
In eetti, le condizioni iniziali sono vericate grazie a (4.42), e la condizione
V (x, 0, t) = 0 segue passando al limite per r 0 nella prima delle (4.41),
ricordando il lemma 4.5.1(ii). Quanto allequazione dierenziale, si ha dal
lemma 4.5.1(i)
V
rr
=

2
r
2
_
1
r
r
_
k1
[r
2k1
U] =
_
1
r
r
_
k
[r
2k
U
r
] =
=
_
1
r
r
_
k1
[r
2k1
U
rr
+ 2k r
2k2
U
r
] =
=
_
1
r
r
_
k1
_
r
2k1
_
U
rr
+
n 1
r
U
r
__
;
utilizzando il lemma 4.4.1, si conclude che
V
rr
=
1
c
2
_
1
r
r
_
k1
[r
2k1
U
tt
] =
1
c
2
V
tt
.
Come nel caso n = 3, si può vericare senza troppa fatica che le condizioni
di compatibilità per avere la soluzione di classe C
2
, vale a dire
lim
r0
G(x, r) = 0, lim
r0
H(x, r) = 0, lim
r0
G
rr
(x, r) = 0,
sono soddisfatte.
Possiamo allora dire che, in virt` u del teorema 4.2.4, si ha per r < ct
V (x, r, t) =
1
2
[G(x, ct +r) G(x, ct r)] +
1
2c
_
ct+r
ctr
H(x, y) dy.
168
Ora dobbiamo ricavare u(x, t) da V (x, r, t). Il lemma 4.5.1(ii) dice che
V (x, r, t) =
k1
j=0
k
j
r
1+j

j
r
j
U(x, r, t),
e quindi
lim
r0
V (x, r, t)
k
0
r
= lim
r0
U(x, r, t) = u(x, t).
Perciò
u(x, t) =
1
k
0
lim
r0
_
G(x, ct +r) G(x, ct r)
2r
+
1
2cr
_
ct+r
ctr
H(x, y) dy
_
=
=
1
(2k 1)!!
_
t
G(x, ct) +
1
c
H(x, ct)
_
=
=
1
(n 2)!!
_
1
c
G
r
(x, ct) +
1
c
H(x, ct)
_
.
Dalle ultime due delle (4.41) e dal lemma 4.5.1(iii) ricaviamo inne
u(x, t) =
1
(n 2)!!
_
1
c
t
1
c
2k2
_
1
t
t
_
k1
[(ct)
2k1
(x, ct)] +
+
1
c
2k1
_
1
t
t
_
k1
[(ct)
2k1
(x, ct)]
_
=
=
1
(n 2)!!
_
t
_
1
t
t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
+
+
_
1
t
t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
_
.
Questa è la formula (4.40). Si noti che per n = 3 essa si riduce alla (4.30).
Resta da provare che la funzione (4.40) è davvero una soluzione del problema
(4.24). La verica delle condizioni iniziali si fa senza fatica, applicando il
lemma 4.5.1(ii). Per lequazione dierenziale, come già fatto nel caso n = 3,
proveremo pi` u in generale che se C
n+1
2
(R
n
) allora la funzione
v(x, t) =
_
1
t
t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
169
è soluzione dellequazione delle onde, e che, di conseguenza, se C
n+3
2
(R
n
)
allora anche v
t
risolve tale equazione.
In eetti si ha dal lemma 4.5.1(i)
v
tt
=

2
t
2
_
_
1
t
t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
_
=
=
_
_
1
t
t
_n1
2
_
t
n1

t
_
B(x,ct)
(y) d
y
_
_
.
Daltronde
t
n1

t
_
B(x,ct)
(y) d
y
= t
n1

t
1
n
_
B(0,1)
(x +ctz) d
z
=
=
c t
n1
n
_
B(0,1)
(x +ctz) z d
z
=
=
1
c
n2
n
_
B(x,ct)
(y)
y x
ct
d
y
=
=
1
c
n2
n
_
B(x,ct)
(y) d
y
=
1
c
n2
n
_
B(x,ct)
(y) dy =
=
c
2
t
n
n
_
B(x,ct)
(y) dy.
Se ne deduce
v
tt
=
_
1
t
t
_n1
2
_
c
2
t
n
n
_
B(x,ct)
(y) dy
_
=
=
_
1
t
t
_n1
2
_
1
c
n2
n
_
B(x,ct)
(y) dy
_
=
=
1
c
n2
n
_
1
t
t
_n3
2
_
1
t
t
_
B(x,ct)
(y) dy
_
=
=
1
c
n2
n
_
1
t
t
_n3
2
_
c
t
_
B(x,ct)
(y) dy
_
=
= c
2
_
1
t
t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
=
170
= c
2
_
_
1
t
t
_n3
2
_
t
n2
_
B(x,ct)
(y) d
y
_
_
= c
2
v.
Si noti che, avendo supposto C
n+1
2
(R
n
), risulta v
tt
, v C
2
(R
n
). Inoltre
dalla (4.40) si ottiene facilmente che per ogni T > 0 vi è dipendenza continua
dai dati nel senso seguente:
[u(x, t)[ C
T
_
_
n1
2
h=0
|
h
|
+
n3
2
h=0
|
h
|
_
_
(x, t) R
n
[0, T].
Ci` o conclude la dimostrazione del teorema 4.5.2.
Passiamo ora al teorema di esistenza per il problema di Cauchy in R
n
[0, [
nel caso di n pari.
Teorema 4.5.3 Sia n = 2k e sia u C
k+1
(R
n
[0, [) soluzione del
problema di Cauchy (4.24). Allora u è data dalla formula
u(x, t) =
c
n!!
_
t
_
1
t
t
_n2
2
_
t
n
_
B(x,ct)
(y)
_
c
2
t
2
[y x[
2
dy
_
+
+
_
1
t
t
_n2
2
_
t
n
_
B(x,ct)
(y)
_
c
2
t
2
[y x[
2
dy
__
.
(4.44)
Se, in pi` u, C
n+4
2
(R
n
) e C
n+2
2
(R
n
C
2
(R
n
[0, [).
Dimostrazione Come nel caso bi-dimensionale, si fa uso del metodo di
discesa. Per x R
n+1
, si scrive x = (x
, z) con x
R
n
, z R, e si
introducono le funzioni
u(x, t) = u(x
, t), (x) = (x
), (x) = (x
).
La funzione u risolve il problema di Cauchy
_
_
u
tt
c
2
u = 0 in R
n+1
[0, [,
u(x, 0) = (x), x R
n+1
,
u
t
(x, 0) = (x), x R
n+1
,
(4.45)
171
e quindi è data dalla formula (4.40) con n + 1 al posto di n:
u(x, t) =
1
(n 1)!!
_
t
_
1
t
t
_n2
2
_
t
n1
_
B(x,ct)
(y) d
y
_
+
+
_
1
t
t
_n2
2
_
t
n1
_
B(x,ct)
(y) d
y
_
_
.
(4.46)
Daltra parte, posto (y
) =
_
c
2
t
2
[y
[
2
, si ha
_
B(x,ct)
(y) d
y
=
2
n+1
c
n
t
n
_
B(x
,ct)
(y
)
_
1 +[(y
)[
2
dy
=
=
2
n+1
c
n1
t
n1
_
B(x
,ct)
(y
)
_
c
2
t
2
[y
[
2
dy
=
=
2ct
n
n
n+1
_
B(x
,ct)
(y
)
_
c
2
t
2
[y
[
2
dy
,
e analogamente
_
B(x,ct)
(y) d
y
=
2ct
n
n
n+1
_
B(x
,ct)
(y
)
_
c
2
t
2
[y
[
2
dy
.
Se ne deduce
u(x
, t) = u(x, t) =
2c
n
(n 1)!! n
n+1
t
_
1
t
t
_n2
2
_
2ct
n
n
n+1
_
B(x
,ct)
(y
)
_
c
2
t
2
[y
[
2
dy
_
+
+
_
1
t
t
_n2
2
_
2ct
n
n
n+1
_
B(x
,ct)
(y
)
_
c
2
t
2
[y
[
2
dy
__
.
A parte le notazioni e la costante moltiplicativa che compare allinizio, questa
formula coincide con la (4.44). Per precisare la costante, osserviamo che il
numero
n
, cioè la misura (n1)-dimensionale della sfera B(0, 1), coincide
con n
n
, essendo
n
la misura della palla n-dimensionale B(0, 1); inoltre si
prova facilmente per induzione che
n
=

n/2
(
n+2
2
)
.
172
Si deduce allora, ricordando che n è pari e utilizzando le note proprietà della
funzione ( e cioè (p + 1) = p(p), (1) = 1, (
1
2
) =

):
2c
n
(n 1)!! n
n+1
=
2c (
n+3
2
)
(n + 1)!! (
n+2
2
)
=
2c (n + 1)!! 2
n+2
2
(n + 1)!! n!! 2
n
2
=
c
n!!
.
Questo valore è esattamente quello che compare nella (4.44). Si noti che per
n = 2 la formula (4.44) si riduce alla (4.35).
Quando C
n+4
2
(R
n
) e C
n+2
2
(R
n
), la funzione (4.44) è soluzione del
problema perche coincide con u, la quale è soluzione eettiva del problema
(4.45) in virt` u del teorema 4.5.2. Da questo teorema si deduce anche la
dipendenza continua dai dati nel senso seguente:
[u(x, t)[ C
T
_
_
n
2
h=0
|
h
|
+
n2
2
h=0
|
h
|
_
_
(x, t) R
n
[0, T].
Ci` o conclude la dimostrazione del teorema 4.5.3.
4.6 Il problema non omogeneo
Consideriamo ora il problema di Cauchy non omogeneo
_
_
u
tt
c
2
u = f in R
n
[0, [,
u(x, 0) = 0, x R
n
,
u
t
(x, 0) = 0, x R
n
,
(4.47)
ove f è una funzione continua su R
n
[0, [ che rappresenta una sorgente,
o del rumore. Naturalmente, se sappiamo risolvere questo problema, poi per
sovrapposizione sapremo risolvere il problema con secondo membro f e dati
iniziali e non nulli.
Costruiremo la soluzione di (4.47), che sappiamo già essere unica, seguendo
un metodo generale che va sotto il nome di principio di Duhamel. Si considera
il problema di Cauchy omogeneo ad istante iniziale s 0
_
_
u
tt
c
2
u = 0 in R
n
[s, [,
u(x, s) = 0, x R
n
,
u
t
(x, s) = f(x, s), x R
n
,
(4.48)
173
del quale esiste la soluzione v(x, t; s) in virt` u dei teoremi 4.5.2 e 4.5.3, a patto
di sostituire t con t s nelle formule esplicite (4.40) e (4.44). Poi si denisce
la funzione
u(x, t) =
_
t
0
v(x, t; s) ds (x, t) R
n
[0, [; (4.49)
il principio di Duhamel stabilisce appunto che questa funzione risolve il
problema (4.47).
Teorema 4.6.1 Sia n N
+
e sia f C
[
n
2
]+1
(R
n
[0, [). Allora il proble-
ma (4.47) è ben posto e la sua unica soluzione è la funzione (4.49), la quale
appartiene a C
2
(R
n
[0, [).
Dimostrazione Si ha
_
n
2
_
+ 1 =
_
n+1
2
se n è dispari,
n+2
2
se n è pari,
cosicche dai teoremi 4.5.2 e 4.5.3 deduciamo che v(, ; s) C
2
(R
n
[s, [).
Di pi` u, dalle formule (4.40) e (4.44), scritte con t s al posto di t, si vede
facilmente che v è di classe C
2
sullinsieme R
n
(t, s) : 0 s t. Quindi,
in particolare, la denizione di u(x, t) ha senso. Per vericare che u soddisfa
lequazione delle onde, bisogna anzitutto calcolarne la derivata u
t
: la cosa è
meno banale di quello che sembra, perche la funzione integranda è denita
solo per s t. Fissato (x, t) con x R
n
e t > 0, si ha per h 0
+
u(x, t +h) u(x, t)
h
=
=
1
h
_
t+h
t
v(x, t +h; s) ds +
_
t
0
v(x, t +h; s) v(x, t; s)
h
ds,
e dunque otteniamo facilmente, in virt` u della continuità di v e della condi-
zione iniziale v(x, t; t) = 0,
lim
h0
+
u(x, t +h) u(x, t)
h
=
_
t
0
v
t
(x, t; s) ds. (4.50)
Per fare il limite da sinistra non si può usare la decomposizione precedente,
perche v(x, t + h; s) non è denita quando h < 0 e s [t + h, t]. Allora
scriviamo
u(x, t +h) u(x, t)
h
=
_
t+h
0
v(x, t +h; s) v(x, t; s)
h
ds+
1
h
_
t+h
t
v(x, t; s) ds;
174
per h 0
il secondo addendo a secondo membro tende evidentemente

a v(x, t; t), ossia a 0, mentre il primo termine del secondo membro si può
ulteriormente decomporre come segue:
_
t+h
0
v(x, t +h; s) v(x, t; s)
h
ds =
_
t+h
0
1
h
_
t+h
t
v
t
(x, ; s) dds =
=
_
t+h
0
1
h
_
t+h
t
[v
t
(x, ; s) v
t
(x, t; s)] dds +
_
t+h
0
v
t
(x, t; s) ds,
e utilizzando la continuità di v
t
, chiaramente il secondo membro tende a
_
t
0
v
t
(x, t; s) ds; si conclude perciò che
u
t
(x, t) =
_
t
0
v
t
(x, t; s) ds (x, t) R
n
[0, [, (4.51)
dato che per t = 0 si ottiene il risultato in modo ancora pi` u semplice.
Con gli stessi ragionamenti, facendo uso della continuità di v
t
e v
tt
, si prova
che per ogni (x, t) R
n
[0, [
u
tt
(x, t) = v
t
(x, t; t) +
_
t
0
v
tt
(x, t; s) ds = f(x, t) +
_
t
0
v
tt
(x, t; s) ds.
Per le derivate rispetto alle variabili spaziali non vi è alcun problema a deri-
vare sotto il segno di integrale, e quindi possiamo dire che la funzione (4.49)
appartiene a C
2
(R
n
[0, [). Inoltre da (4.51) ricaviamo
u
tt
(x, t) = f(x, t) +
_
t
0
v
tt
(x, t; s) ds =
= f(x, t) +c
2
_
t
0
v(x, t; s) ds = f(x, t) +c
2
u(x, t).
Inne è chiaro che u(x, 0) = u
t
(x, 0) = 0. La tesi è provata.
Esempio 4.6.2 Scriviamo esplicitamente la soluzione (4.49) nel caso n = 3.
Si ha dalla formula (4.30) con t s al posto di t e tenendo conto che = 0
e = f(, s),
v(x, t; s) =
t s
4
_
B(0,1)
f(x +c(t s)z, s) d
z
.
175
Quindi
u(x, t) =
_
t
0
t s
4
_
B(0,1)
f(x +c(t s)z, s) d
z
ds =
=
_
t
0
4
_
B(0,1)
f(x +cz, t ) d
z
d =
=
_
t
0
4
_
B(x,c)
1
c
2
2
f(y, t ) d
y
d =
=
_
ct
0
_
B(x,)
1
4c
2
f
_
y, t

c
_
d
y
d =
=
1
4c
2
_
B(x,ct)
f(y, t [x y[/c)
[x y[
dy.
Questa soluzione si chiama potenziale ritardato. Possiamo chiarire il motivo
di tale denominazione come segue. Il valore di u in un punto (x
0
, t
0
) dipende
solo dai valori di f nei punti del cono (x, t) : [x x
0
[ = c(t
0
t): ciò segue
dallespressione sopra scritta, valutata in x = x
0
e t = t
0
, in cui f è calcolata
in y = x
0
+ c(t
0
s)z, t = s, e si ha appunto [y x
0
[ = c(t
0
s). Quindi
leetto di una perturbazione di f avvenuta nel punto x allistante t viene
avvertita in x
0
solo nellistante t
0
= t+
|xx
0
|
c
; cioè leetto della perturbazione
è ritardato del tempo occorrente a percorrere la distanza [xx
0
[ con velocità
c.
Esempio 4.6.3 Consideriamo una sorgente concentrata in una piccola palla
di centro lorigine di R
3
: ciò signica prendere in (4.47) un secondo membro
della forma
f
(x, t) =
1
3
f
_
x
, t
_
,
ove f è una funzione continua nulla fuori dal cilindro (x, t) : [x[ < 1 e tale
che
_
B(0,1)
f(x, t) dx = (t), con C
2
([0, [) ssata. Quindi, quanto pi` u
è piccolo, tanto pi` u la sorgente f
è concentrata e intensa, dal momento che

_
B(0,)
f
(x, t) dx =
_
B(0,1)
f(x, t) dx = (t) > 0.
La corrispondente soluzione di (4.47) è
u
(x, t) =
1
4c
2
_
B(x,ct)
f
(y, t [x y[/c)
[x y[
dy.
176
Vediamo cosa succede quando 0
+
: quando [x[ > ct si ha denitivamente
B(0, ) B(x, ct) = , cosicche u
(x, t) 0, mentre quando [x[ < ct risulta

denitivamente B(0, ) B(x, ct), e pertanto, per convergenza dominata,
lim
0
+
u
(x, t) = lim
0
+
1
4c
2
_
B(0,)
f
(y, t [x y[/c)
[x y[
dy =
= lim
0
+
1
4c
2
_
B(0,1)
f(z, t [x z[/c)
[x z[
dz =
1
4c
2
(t [x[/c)
[x[
.
La funzione
u(x, t) =
_
_
_
1
4c
2
(t [x[/c)
[x[
se [x[ < ct,
0 se [x[ > ct,
(4.52)
è singolare per x = 0 e discontinua quando [x[ = ct; tuttavia essa risolve
lequazione delle onde in (R
3
]0, [) (x, t) : [x[ = ct. Ciò è evidente
quando [x[ > ct; se invece [x[ < ct si tratta di una verica un po laboriosa
ma non dicile. La funzione (4.52) rappresenta unonda sferica, generata da
una sorgente puntuale posta nellorigine, che si propaga nello spazio (proble-
ma di radiazione). Se in particolare (t) = 0 fuori da un intorno di t = 0, si
pu` o vericare che ad un dato istante t la funzione u è diversa da 0 soltanto in
un intorno della supercie sferica B(0, ct): questa è unaltra formulazione
del principio di Huygens.
Si può comprendere allora per quale ragione il principio di Huygens non fun-
ziona nel caso di due variabili spaziali: la soluzione si ottiene col metodo di
discesa, e dunque il problema di radiazione in R
2
[0, [ corrisponde ad un
problema in R
3
[0, [ in cui è presente una linea di sorgenti sullasse z.
Quindi un osservatore, posto a distanza dallorigine nel piano xy, riceverà
allistante /c il segnale irradiato al tempo t = 0 dalla sorgente situata nel-
lorigine; però, negli istanti successivi, perverranno allosservatore i segnali
irradiati, sempre al tempo t = 0, da punti situati lungo lasse z alle quote
=
_
c
2
2
. Questo spiega perche il segnale sia percepito in tutti gli
istanti /c.
Concludiamo il nostro studio dellequazione delle onde osservando che natu-
ralmente esso è tuttaltro che esaurito. La teoria delle equazioni iperboliche
presenta al contrario enormi sviluppi in svariatissime direzioni: equazioni
non lineari, sistemi iperbolici, leggi di conservazione, equazioni di Hamilton-
Jacobi, soluzioni viscosità, eccetera. Per una introduzione a questi importanti
177
settori di ricerca si può consultare [2]. Noi ci limiteremo, nel paragrafo che
segue, allanalisi di un metodo classico, dovuto a Riemann, per lo studio di
equazioni iperboliche lineari in R
2
a coecienti variabili.
4.7 Il metodo di Riemann
Consideriamo unequazione iperbolica lineare in due variabili:
a(x, y)u
xx
+ 2b(x, y)u
xy
+c(x, y)u
yy
+
+d(x, y)u
x
+e(x, y)u
y
+g(x, y)u = h(x, y), (x, y) D,
(4.53)
dove a, b, c, d, e, g, h sono funzioni regolari sullaperto connesso D R
2
. La
condizione di iperbolicità è la seguente:
b(x, y)
2
a(x, y)c(x, y) > 0 (x, y) D. (4.54)
Essa assicura lesistenza di due distinte famiglie di caratteristiche in ogni
punto di D: infatti, detta (x, y) = (
x
(x, y),
y
(x, y)) la normale ad una
curva regolare C D, la condizione che C sia una linea caratteristica si
esprime richiedendo che in ogni punto (x, y) si abbia
a
2
x
+ 2b
x
y
+c
2
y
= 0,
ovvero, supposto ad esempio
y
,= 0,
a
_
y
_
2
+ 2b

x
y
+c = 0.
La condizione (4.54) equivale a dire che questa equazione ha per ogni (x, y)
due soluzioni reali distinte, il che fornisce due diverse direzioni per la normale
alla curva in (x, y). Quindi per ogni punto di D passano due curve caratte-
ristiche.
Se una curva C è descritta dallequazione F(x, y) = 0, allora =
F
|F|
; quindi
C è caratteristica se e solo se
aF
2
x
+ 2bF
x
F
y
+cF
2
y
= 0 (x, y) C. (4.55)
Se in particolare C è cartesiana, allora F(x, y) = y k(x), con k di classe
C
1
, e la condizione (4.55) diventa
a(k
)
2
2bk
+c = 0, (4.56)
178
ossia
k
(x) =
b(x, k(x))
_
b(x, k(x))
2
a(x, k(x))c(x, k(x))
a(x, k(x))
.
Queste due equazioni dierenziali avranno due famiglie di soluzioni,
y =
1
(x, ), y =
2
(x, ), (4.57)
ove e sono i valori attribuiti alle singole curve delle famiglie in corri-
spondenza di un ssato x
0
. Se non ci si allontana troppo dai punti (x
0
, ) e
(x
0
, ), le derivate (
1
)
e (
2
)
saranno non nulle, e quindi in (4.57) potremo

ricavare e in funzione di (x, y):
=
1
(x, y), =
2
(x, y). (4.58)
In particolare
(
1
)
x
=
(
1
)
x
(
1
)
, (
1
)
y
=
1
(
1
)
, (
2
)
x
=
(
2
)
x
(
2
)
, (
2
)
y
=
1
(
2
)
,
cosicche
1
(x, y) ,= 0,
2
(x, y) ,= 0. (4.59)
Poiche
1
(, ) e
2
(, ) soddisfano la (4.56), si riconosce subito che
1
e
2
vericano la (4.55).
Il problema di Cauchy per lequazione (4.53) consiste nel ssare i valori di
u e
u
lungo una curva non caratteristica. Lo studio risulta pi` u semplice

se dapprima riduciamo lequazione in forma normale: a questo scopo con-
viene utilizzare proprio il cambiamento di variabili (4.58). In eetti, con
facili ma noiosi calcoli, la sostituzione u(x, y) = v(
1
(x, y),
2
(x, y)) porta
allequazione
2v
[a(
1
)
x
(
2
)
x
+b((
1
)
x
(
2
)
y
+ (
1
)
y
(
2
)
x
) +c(
1
)
y
(
2
)
y
]+
+v
[a(
1
)
xx
+ 2b(
1
)
xy
+c(
1
)
yy
+d(
1
)
x
+e(
1
)
y
]+
+v
[a(
2
)
xx
+ 2b(
2
)
xy
+c(
2
)
yy
+d(
2
)
x
+e(
2
)
y
] +gv = h,
(4.60)
ove i coecienti a, b, c, d, e, g, h sono calcolati in (
1
(x, y),
2
(x, y)). Non è
dicile però vericare che il coeciente che moltiplica v
è sempre diverso
da 0. Infatti, detta A la matrice
_
a b
b c
_
, dobbiamo far vedere che
(A
1
)
2
,= 0 in D : (4.61)
179
daltronde, poiche
1
verica la (4.55), si ha
(A
1
)
1
= 0 in D, (4.62)
e dunque basta far vedere che per ogni (x, y) D i vettori
1
e
2
sono
linearmente indipendenti. Infatti, ammesso questo fatto, da (4.61) e (4.62)
seguirebbe che il vettore A
1
è nullo; ma allora, essendo det A ,= 0 in virt` u
di (4.54), dedurremmo
1
= 0, in contraddizione con (4.59). Ma provare
la lineare indipendenza di
1
e
2
è immediato: se fosse
1
=
2
,
infatti, dedurremmo subito
=
(
2
)
(
1
)
, (
1
)
x
= (
2
)
x
,
mentre invece, per denizione,
1
e
2
soddisfano
(
1
)
x
=
b +
b
2
ac
a
, (
2
)
x
=
b
b
2
ac
a
.
In conclusione, in (4.60) possiamo dividere per il coeciente di v
, ottenendo
unequazione della forma
v
+(, )v
+(, )v
+(, )v = f(, ),
le cui caratteristiche sono le rette = m e = n, con m, n costanti. Per co-
modità, riscriviamo questa equazione nelle incognite x, y; il nostro problema
di Cauchy sarà dunque il seguente:
_
_
_
v
xy
+v
x
+v
y
+v = f in D,
v,
v
assegnate su C,
(4.63)
ove , , , f sono funzioni regolari denite su D, e C D è il graco di una
funzione strettamente monotona.
Prima di arontare questo problema col metodo di Riemann è necessaria una
parentesi sugli operatori aggiunti formali.
Denizione 4.7.1 Sia L un operatore dierenziale denito su un aperto
limitato D R
n
, della forma
L[u] =
n
i,j=1
a
ij
(x)D
i
D
j
u +
n
i=1
b
i
(x)D
i
u +c(x)u,
180
con a
ij
C
2
(D), b
i
C
1
(D) e c C(D). L aggiunto formale di L è
loperatore L
cos` denito:
L
[v] =
n
i,j=1
D
i
D
j
[a
ij
(x)v]
n
i=1
D
i
[b
i
(x)v] +c(x)v.
Osservazione 4.7.2 Fra un operatore dierenziale denito su D e il suo
aggiunto formale intercorre la seguente relazione integrale:
_
D
(L[u]v uL
[v]) dx =
_
D
_
(b )uv +
u
A
v u
v
_
d, (4.64)
ove si è posto
u
A
(x) =
n
i,j=1
a
ij
(x)D
j
u(x)
i
(x),
v
(x) =
n
i,j=1
D
i
[a
ij
(x)v(x)]
j
(x).
Questa relazione si dimostra facilmente attraverso la formula di Green.
Nel caso specico delloperatore dierenziale
L[u] = u
xy
+(x, y)u
x
+(x, y)u
y
+(x, y)u, (4.65)
risulta ovviamente
L
[v] = v
xy
(v)
x
(v)
y
+v,
e si ha in particolare
L[u]v uL
[v] = u
xy
v v
xy
u +u
x
v + (v)
x
u +u
y
v + (v)
y
u =
=

x
(uv v
y
u) +

y
(uv +u
x
v);
ovvero, sommando e sottraendo la quantità
1
2
(uv)
xy
,
L[u]v uL
[v] =

x
_
1
2
[u
y
v v
y
u] +uv
_
+

y
_
1
2
[u
x
v v
x
u] +uv
_
.
Ne segue che per loperatore (4.65) la relazione (4.64) assume la forma
_
D
(L[u]v uL
[v]) dx =
_
D
__
1
2
[u
y
v v
y
u] +uv
_
x
+
+
_
1
2
[u
x
v v
x
u] +uv
_
y
_
ds.
(4.66)
181
Questa formula sarà il nostro punto di partenza per calcolare la soluzione u
del problema (4.63) in un generico punto P = (, ) D.
Anzitutto osserviamo che la curva C su cui sono assegnati i dati iniziali è
il graco di una funzione strettamente monotona, ad esempio strettamente
crescente. Se P D e P è non troppo lontano da C, le due caratteristiche
uscenti da P, cioè x = e y = , incontrano la curva C in due punti (e due
soli) P
1
= (,
) e P
2
= (
, ). Ammetteremo, per esempio, che P si trovi

al di sopra di C, cosicche risulta <
e >
; quando P invece sta al

di sotto di C, si trova >
e <
. Naturalmente se, al contrario, C

fosse strettamente decrescente, otterremmo, a seconda di come è situato P,
due altre coppie di disuguaglianze, stavolta concordi.
Consideriamo la regione
P
delimitata dai segmenti
1
= P
1
P,
2
= P
2
P
e dallarco
P
di C di estremi P
1
e P
2
. Applichiamo la relazione (4.66) alla
regione
P
, con una generica v C
1
(D) e con la nostra ipotetica soluzione
u: poiche su
1
la normale è = (1, 0), mentre su
2
è = (0, 1), si ha
_
P
(L[u]v uL
[v]) dxdy =
=
_
P
__
1
2
[u
y
v v
y
u] +uv
_
x
+
_
1
2
[u
x
v v
x
u] +uv
_
y
_
ds
1
_
1
2
[u
y
v v
y
u] +uv
_
ds +
_
2
_
1
2
[u
x
v v
x
u] +uv
_
ds.
(4.67)
Calcoliamo gli ultimi due integrali di linea. Per quanto riguarda quello su
1
, si ha
_
1
_
1
2
[u
y
v v
y
u] +uv
_
ds =
=
_

_
1
2
[u
y
(, y)v(, y) v
y
(, y)u(, y)] +(, y)u(, y)v(, y)
_
dy =
=
1
2
[u(P)v(P) u(P
1
)v(P
1
)]
_

u(, y)[v
y
(, y) (, y)v(, y)] dy,
mentre per lintegrale su
2
risulta
_
2
_
1
2
[u
x
v v
x
u] +uv
_
ds =
182
=
_

_
1
2
[u
x
(x, )v(x, ) v
x
(x, )u(x, )] +(x, )u(x, )v(x, )
_
dx =
=
1
2
[u(P
2
)v(P
2
) u(P)v(P)]
_

u(x, )[v
x
(x, ) (x, )v(x, )] dx.
Sostituendo in (4.67), e ricordando che L[u] = f, ricaviamo lespressione
_
P
(fv uL
[v]) dxdy =
=
_
P
__
1
2
[u
y
v v
y
u] +uv
_
x
+
_
1
2
[u
x
v v
x
u] +uv
_
y
_
ds
u(P)v(P) +
1
2
[u(P
2
)v(P
2
) +u(P
1
)v(P
1
)] +
+
_

u(, y)[v
y
(, y) (, y)v(, y)] dy
u(x, )[v
x
(x, ) (x, )v(x, )] dx.
A questo punto notiamo che lintegrale su
P
è noto, perche coinvolge i valori
di u e delle sue derivate su C, nonche quelli di v. Possiamo ora scegliere la
funzione v, in modo da semplicare il pi` u possibile gli integrali. Ci piacerebbe
che v vericasse
_
_
L
[v] = v
xy
(v)
x
(v)
y
+v = 0 in
P
,
v
y
= v su
1
,
v
x
= v su
2
,
v(P) = 1,
(4.68)
perche in tal caso lespressione precedente si semplicherebbe nel modo se-
guente:
_
P
vf dxdy =
=
_
P
__
1
2
[u
y
v v
y
u] +uv
_
x
+
_
1
2
[u
x
v v
x
u] +uv
_
y
_
ds
u(P) +
1
2
[u(P
2
)v(P
2
) +u(P
1
)v(P
1
)],
183
ossia
u(P) =
1
2
[u(P
2
)v(P
2
) +u(P
1
)v(P
1
)]
_
P
vf dxdy+
+
_
P
__
1
2
[u
y
v v
y
u] +uv
_
x
+
_
1
2
[u
x
v v
x
u] +uv
_
y
_
ds.
(4.69)
Se riusciamo a determinare v attraverso il problema (4.68), che è detto proble-
ma di Goursat, allora la formula (4.69) è una rappresentazione della soluzione
del problema di Cauchy (4.63) in termini dei suoi dati sulla curva C, e co-
stituisce pertanto il punto di partenza per provare lesistenza della soluzione
stessa. Se la funzione v esiste, essa si chiama funzione di Riemann relativa
ai dati attribuiti ad u lungo C. Si noti che tale funzione dipende dal punto
P ssato in partenza, che è il vertice della regione
P
: quindi la funzione di
Riemann in eetti dipende dalle coordinate (x, y)
P
e anche dalle coor-
dinate (, ) di P; essa deve essere dunque denominata v
P
anziche v.
Occupiamoci allora dellesistenza per nulla scontata della funzione di
Riemann v
P
, cioè della soluzione del problema (4.68).
Teorema 4.7.3 Sia D R
2
un aperto connesso e sia (, ) un punto di D.
Se , C
1
(D) e C(D), allora per ogni rettangolo R
1
= [,
1
][
1
, ]
D il problema di Goursat
_
_
v
xy
(v)
x
(v)
y
+v = 0 in R
1
,
v
y
(, y) = (, y)v(, y) y [
1
, ],
v
x
(x, ) = (x, )v(x, ) x [,
1
],
v(, ) = 1,
(4.70)
ha ununica soluzione v
P
C
1
(R
1
) con (v
P
)
xy
C(R
1
).
Dimostrazione Trasformeremo il problema (4.70) in unopportuna equa-
zione integrale. Sia R D il rettangolo di vertici P = (, ), Q = (,
),
S = (
), T = (
, ), con S = (
) R
1
. Sia v una soluzione in R
1
del
problema di Goursat: allora applicando la relazione (4.66) con il rettangolo
R in luogo di D e con u 1, tenendo conto che L[u] = , L
[v] = 0 e
u
y
= u
x
= 0, si ha:
_
R
v dxdy =
_
R
__
1
2
v
y
+v
_
x
+
_
1
2
v
x
+v
_
y
_
ds.
184
Il bordo R è costituito dai quattro segmenti PQ, QS, ST, TP. Su PQ si
ha
x
= 1,
y
= 0 e v
y
= v, per cui lintegrando è
vy
2
; su QS è
x
= 0
e
y
= 1, e lintegrando vale
vx
2
v; su ST risulta
x
= 1 e
y
= 0, con
integrando pari a
vy
2
+v; inne su TP troviamo
x
= 0,
y
= 1 e v
x
= v,
da cui lintegrando è uguale a
vx
2
. In conclusione, ricordando che v(P) = 1,
otteniamo
_
R
v dxdy =
v
y
(, y)
2
dy +
_

_
v
x
(x,
)
2
(x,
)v(x,
)
_
dx +
+
_

v
y
(
, y)
2
+(
, y)v(
, y)
_
dy +
_

v
x
(x, )
2
dx =
=
1
2
[v(P) v(Q)] +
1
2
[v(S) v(Q)]
_

(x,
)v(x,
) dx
1
2
[v(T) v(S)] +
_

, y)v(
, y) dy +
1
2
[v(T) v(P)] =
= 1 +v(S)
_

(x,
)v(x,
) dx +
_

, y)v(
, y) dy,
ovvero
v(
) = 1 +
_

(x, y) v(x, y) dydx+

+
_

(x,
)v(x,
) dx
_

, y)v(
, y) dy.
(4.71)
Questa relazione vale per ogni S = (
) R
1
ed è soddisfatta da ogni
soluzione v del problema (4.70). Viceversa, è facile vericare che ogni fun-
zione v C(R
1
), vericante la (4.71), ha derivate prime continue e derivata
seconda mista continua, e soddisfa lequazione dierenziale in (4.70); inoltre
facendo tendere S a P, ossia
, si vericano anche le condizioni

ai limiti.
`
E dunque suciente determinare ununica soluzione v
P
C(R
1
)
dellequazione integrale non lineare (4.71).
Possiamo riscrivere la (4.71) nella forma v = T(v), ove T : C(R
1
) C(R
1
)
è loperatore
T[v](
) = 1 +
_

v dxdy +
185
+
_

(x,
)v(x,
) dx
_

, y)v(
, y) dy, (
) R
1
.
Proveremo che T è una contrazione da C(R
1
) in se allorche si munisca lo
spazio C(R
1
) della norma
|v|
= sup
(x,y)R
1
e
(x)(y)
[v(x, y)[ v C(R
1
), (4.72)
ove è un numero positivo da scegliere opportunamente. Questa è chiara-
mente una norma su C(R
1
), ed è equivalente alla norma | |
poiche, come
si verica facilmente,
|v|
|v|
e
(
1
)+(
1
)
|v|
v C(R
1
), > 0.
Si ha allora, per ogni (
) R
1
e per ogni v, w C(R
1
),
e
(
)(
)
[T[v](
) T[w](
)[
||
e
(
x)(y
)
_
e
(x)(y)
[v(x, y) w(x, y)[
dxdy +
+||
e
(
x)(
)
_
e
(x)
[v(x,
) w(x,
)[
dx +
+||
e
(
)(y
)
_
e
(y)
[v(
, y) w(
, y)[
dy
|v w|
[||
+||
+||
] ,
da cui
|T[v] T[w]|
|v w|
[||
+||
+||
] .
Se ne deduce che per sucientemente grande loperatore T è una contra-
zione nello spazio di Banach C(R
1
) e quindi vi è ununico punto sso, ossia
vi è ununica soluzione v
P
dellequazione v = T[v], che equivale alla (4.71).
Ci` o prova il teorema 4.7.3.
Osservazione 4.7.4
`
E importante conoscere come la funzione v
P
dipenda
da P. Questo si può vedere per mezzo dellequazione integrale (4.71): siccome
v
P
ne è soluzione, si ha
v
P
(
) = 1 +
_

(x, y) v
P
(x, y) dydx+
+
_

(x,
)v
P
(x,
) dx
_

, y)v
P
(
, y) dy;
186
Se noi deriviamo formalmente rispetto a e rispetto a questa equazione,
troviamo che le derivate (v
P
)
e (v
P
)
si ottengono come soluzioni di equazioni

integrali analoghe alla precedente:
(v
P
)
) =
_

(, y) v
P
(, y) dy+
+
_

(x, y) (v
P
)
(x, y) dydx (,
) v
P
(,
)+
+
_

(x,
) (v
P
)
(x,
) dx
_

, y) (v
P
)
, y) dy,
(v
P
)
) =
_

(x, ) v
P
(x, ) dx+
+
_

(x, y) (v
P
)
(x, y) dydx +
_

(x,
) (v
P
)
(x,
) dx
(
, ) v
P
(
, )
_

, y) (v
P
)
, y) dy.
Rispetto alla (4.71), è cambiato solamente il termine noto, che non è pi` u 1
ma è, in entrambi i casi, la somma di due quantità note che coinvolgono v
P
,
e . Queste due equazioni integrali si risolvono con il solito punto sso, ed
è facile provare che le loro soluzioni sono davvero le derivate parziali di v
P
rispetto alle coordinate e di P. In denitiva, la funzione di Riemann v
P
dipende in modo C
1
da P; per giunta, in modo simile si verica che anche
(v
P
)
è continua.
Avendo costruito la funzione di Riemann, è facile ora provare lesistenza della
soluzione del problema (4.63).
Corollario 4.7.5 Sia D R
2
un aperto connesso e siano , C
1
(D),
, f C(D). Sia inoltre C = (x, y) : x [a, b], y = (x), ove C
1
[a, b] è
una funzione strettamente monotona tale che R = [a, b][min , max ] D.
Se C
1
[a, b] e C[a, b], allora il problema di Cauchy
_
_
u
xy
+u
x
+u
y
+u = f in R,
u(x, (x)) = (x), x [a, b],
u
(x, (x)) = (x), x [a, b],

(4.73)
187
ha soluzione unica u, tale che u C
1
(R) e u
xy
C(R).
Dimostrazione Fissato un punto P = (, ) R, sia v
P
la soluzione del
problema di Goursat (4.70). Come sappiamo, se u risolve il problema (4.73)
allora u(P) si rappresenta nella forma (4.69). Si tratta di vericare che, nelle
ipotesi fatte sui dati, la funzione (4.69) è davvero soluzione del problema
(4.73). Ciò può essere fatto, con enorme fatica, ma in modo concettualmente
facile. Occorre anzitutto parametrizzare gli insiemi
P
e
P
in funzione delle
coordinate (, ):
P
= (x, y) : x
1
(), (x) y ,
P
= (x, (x)) : x
1
();
dopodiche, osservato che lungo
P
si ha =
_

(x)
1+
(x)
2
,
1
1+
(x)
2
_
, bisogna
esplicitare la funzione (4.69):
u(, ) =
1
2
_
u(
1
(), ) v
P
(
1
(), ) +u(, ()) v
P
(, ())
_

1
()
_

(x)
v
P
(x, y)f(x, y) dydx +
+
_

1
()
__
1
2
[u
y
(x, (x)) v
P
(x, (x)) (v
P
)
y
(x, (x)) u(x, (x))]+
+ (x, (x)) u(x, (x)) v(x, (x))
_
(x)
_
1
2
[u
x
(x, (x)) v
P
(x, (x)) (v
P
)
x
(x, (x)) u(x, (x))] +
+ (x, (x)) u(x, (x)) v
P
(x, (x))
__
dx.
Si deve poi osservare che nel secondo membro la u viene calcolata in punti
di C, nei quali è u(x, (x)) = (x) e
u
(x, (x)) = (x), il che a sua volta

implica
u
x
+u
y
, u
x
u
y
=
_
1 + (
)
2
,
188
da cui, facilmente,
_
_
u
x
(x, (x)) =
(x)
(x)
_
1 +
(x)
2
+

(x)
1 +
(x)
2
,
u
y
(x, (x)) =
(x)
_
1 +
(x)
2
+

(x)
(x)
1 +
(x)
2
.
Questi valori di u, u
x
e u
y
vanno sostituiti nellespressione di u(, ) sopra
scritta. A questo punto, è abbastanza agevole rendersi conto che le derivate
u
, u
e u
(le quali, si ricordi, sulla base dellosservazione 4.7.4 coinvolgono

anche le derivate (v
P
)
, (v
P
)
e (v
P
)
) esistono e sono continue; assai pi` u

intricato, noioso e lungo è controllare, utilizzando le proprietà della funzione
di Riemann v
P
, che u(, ) risolve lequazione: non riporteremo questa ve-
rica. Inne, le condizioni ai limiti per u e per la sua derivata normale si
vericano facendo tendere P a un generico punto P
0
C e osservando che
di conseguenza anche P
1
e P
2
tendono a P
0
mentre
P
e
P
si riducono a
P
0
. Il calcolo è facile per la condizione su u, perche gli integrali spariscono
mentre v
P
(P
2
) e v
P
(P
1
) tendono a v
P
0
(P
0
) = 1; pi` u laborioso è il controllo
della condizione sulla derivata normale. Omettiamo i dettagli.
189
Bibliograa
[1] R. Courant, D. Hilbert, Methods of mathematical physics, vol. II: partial
dierential equations, Wiley, New York 1962.
[2] L. C. Evans, Partial dierential equations, American Mathematical Society,
Providence 1998.
[3] P. E. Garabedian, Partial dierential equations, John Wiley & Sons, New
York 1964.
[4] L. L. Helms, Introduction to potential theory, Wiley-Interscience, New York
1964.
[5] F. John, Partial dierential equations, Springer, Berlin 1971.
[6] O. A. Ladyzhenskaja, V. A. Solonnikov, N. N. Uralceva, Linear and quasi-
linear equations of parabolic type, Amer. Math. Soc., Providence 1968.
[7] A. Lunardi, Analytic semigroups and optimal regularity in parabolic equa-
tions, Birkhauser, Basel 1995.
[8] V. P. Michajlov, Equazioni dierenziali alle derivate parziali, Mir, Mosca
1984.
[9] A. N: Tichonov, A.A. Samarskij, Equazioni della sica matematica, Mir,
Mosca 1981.
[10] H. F Weinberger, A rst course in partial dierential equations, Blaisdell
Publishing Company, New York 1965.
190

Analisi

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Analisi

Caricato da

Copyright:

Formati disponibili

Appunti di Analisi matematica

; quello che non pu`o succedere `e che ad un x X vengano associati

2 non `e un numero razionale.

2. In altre parole, nellinsieme Q non vale lassioma di

`e linverso di [x[, ossia vale la tesi.

< x tali che

> x, tali che

Q tali che 0 < r

< xy, si ottiene

+1 n, e osservando che da <

1, mentre nel passaggio da t a t + `e pari a a

1). Dunque `e lo stesso di prima, dilatato o contratto di un fattore a

la retta per P parallela

la retta per Q parallela allasse y: tali rette sono perpendicolari

su r, e ripetiamo la stessa co-

, il quale `e simile al precedente. Quindi fra le lunghezze dei rispettivi

= P, pensando P sso e facendo variare Q, si ottiene

sono parallele se e solo se hanno lo stesso coeciente angola-

= 0, esse sono parallele se e solo

`e orizzontale. Supponiamo r obliqua: se P e Q sono punti

sono punti distinti di r

di intersezione delle rette

sono ancora simili,

, scritte stavolta in forma parametrica:

siano scritte in forma cartesiana:

e passanti per lorigine:

) sono fra loro perpendicolari se e solo se i vettori (a, b) e

) sono fra loro ortogonali, cio`e se e solo se

sono, a meno di un fattore

QOP acuto P Q > 0,

QOP ottuso P Q < 0.

passante per U e perpendicolare a r: essa intersecher`a

3). Si osservi allora che lequazione

il poligono regolare inscritto di 2n lati, di vertici w

`e data dalla somma delle aree degli n quadrilateri OW

< /2 < 2; se ne deduce allora

(v, w); si tratta evidentemente di due archi:

(v, w) va da V a W in verso orario, cio`e con orientazione negati-

(v, w) = z C : z = t, t [0, 1],

(v, w) relativi a numeri v, w C

(v, w) `e il numero reale

(v, w) `e il numero reale non

(v, w)) = +a(

la spezzata i cui vertici sono tutti quelli di P seguiti da tutti quelli

) > (P). Inoltre tale spezzata `e lunione di due

, luna formata da tutti i vertici fra v e z (inclusi) e inscritta

2 (la diagonale del

tali che la semiretta positiva dellasse x

per tutti gli , R per i quali le formule hanno senso.

3 cos x = 0, (ii) sin x + (2 +

3i; (iv) le radici ottave di i.

assume ciclicamente i quattro valori 1, i, 1, i.

converge a L per n che tende a +, se vale la condizione seguente:

. Quindi la denizione `e soddisfatta se

; se si vuole N, si potr`a prendere =

(purche sia 1).

n) `e divergente a + perche confrontandola con

= + (esercizio 2.1.11). Quindi siamo in un caso

possiamo estrarre una ulteriore sottosuccessione x

sono quelle dellesercizio precedente.

E `e il pi` u grande insieme aperto contenuto in E.

E quando E = z C : 1 [z[ 2, [arg z[ /3.

log x = 0 > 0, lim

= f(x) < f(x