Sei sulla pagina 1di 121

Appunti del corso di

Metodi matematici per lIngegneria


Simona Fornaro e Diego Pallara
a.a. 2011/12
Introduzione
In queste dispense sono esposti gli argomenti che costituiscono la prima parte
del corso di Metodi matematici per lingegneria rivolto agli studenti del primo
anno della Laurea specialistica in Ingegneria delle telecomunicazioni. Malgrado
gli argomenti siano classici e trovino posto in numerosi libri, alcuni dei quali sono
consigliati per la preparazione dellesame, ci auguriamo che la presente sintetica
esposizione possa essere utile come guida alla lettura di testi pi` u approfonditi. Il
fascicolo contiene probabilmente pi` u di quanto sia poi esposto in aula (e richiesto
allesame), perche, essendo rivolto a studenti maturi, si `e voluta dare la possibilit`a
di qualche approfondimento individuale.
Questo testo non ha carattere denitivo, ed anzi contiamo di poterlo migliorare,
giovandoci anche delle osservazioni di tutti i lettori, ed in particolare degli studenti.
Ringraziamo in anticipo tutti coloro che ci forniranno suggerimenti utili.
3
Indice
1 Teoria della misura e dellintegrazione 7
1.1 Misure positive . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.2 Funzioni misurabili . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.3 Integrazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.4 La misura di Lebesgue in R
n
. . . . . . . . . . . . . . . . . . . . . . 18
1.5 Passaggio al limite sotto il segno di integrale . . . . . . . . . . . . . 23
1.6 Misure reali e vettoriali . . . . . . . . . . . . . . . . . . . . . . . . . 30
1.7 Singolarit` a e assoluta continuit` a di misure . . . . . . . . . . . . . . 33
1.8 Misura prodotto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
1.9 Formule di riduzione e cambiamento di variabili in R
n
. . . . . . . . 41
1.10 Integrali dipendenti da un parametro . . . . . . . . . . . . . . . . . 45
1.11 Prodotto di convoluzione . . . . . . . . . . . . . . . . . . . . . . . . 50
2 Teoria delle distribuzioni 55
2.1 Denizioni ed esempi . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.2 Successioni e serie di distribuzioni . . . . . . . . . . . . . . . . . . . 59
2.3 Derivazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.4 Supporto e convoluzione . . . . . . . . . . . . . . . . . . . . . . . . 64
2.5 Distribuzioni temperate . . . . . . . . . . . . . . . . . . . . . . . . 68
2.6 Trasformata di Fourier . . . . . . . . . . . . . . . . . . . . . . . . . 70
3 Misure di Lebesgue-Stieltjes e funzioni a variazione limitata 75
3.1 Misura di Lebesgue-Stieltjes . . . . . . . . . . . . . . . . . . . . . . 75
3.2 Misura immagine ed esempi di applicazioni . . . . . . . . . . . . . . 79
3.3 Funzioni a variazione limitata . . . . . . . . . . . . . . . . . . . . . 81
3.4 Funzioni assolutamente continue . . . . . . . . . . . . . . . . . . . . 88
4 Teoria elementare degli spazi di Hilbert 91
4.1 Generalit` a . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5
6 INDICE
4.2 Basi ortonormali e serie di Fourier astratte . . . . . . . . . . . . . . 95
4.3 Teoria spettrale degli operatori autoaggiunti compatti . . . . . . . . 104
A Richiami 115
A.1 Massimo e minimo limite . . . . . . . . . . . . . . . . . . . . . . . . 115
A.2 Insiemi numerabili . . . . . . . . . . . . . . . . . . . . . . . . . . . 116
A.3 Il teorema di Riemann sui riordinamenti . . . . . . . . . . . . . . . 117
A.4 Il teorema della divergenza . . . . . . . . . . . . . . . . . . . . . . . 118
A.5 Il Teorema di Ascoli-Arzel` a . . . . . . . . . . . . . . . . . . . . . . 119
Capitolo 1
Teoria della misura e
dellintegrazione
In questo capitolo svilupperemo una teoria dellintegrazione pi` u moderna di
quella di Riemann, gi` a studiata, che consente di ovviare ad alcuni inconvenienti. I
principali difetti della teoria di Riemann sono infatti:
(i) La non completezza dello spazio 1([a, b]) delle funzioni integrabili in [a, b],
munito della metrica
d(f, g) =
_
b
a
[f(x) g(x)[ dx.
Questo vuol dire che esistono successioni di funzioni (f
k
) integrabili su [a, b]
tali che
lim
k,j+
_
b
a
[f
k
f
j
[dx = 0,
ma non esiste alcuna funzione integrabile f tale che
lim
k+
_
b
a
[f
k
f[dx = 0.
(ii) Il fatto che non tutte le funzioni caratteristiche di aperti o chiusi siano in-
tegrabili, a meno che laperto o il chiuso non siano costituiti da un numero
nito di intervalli. Inoltre, in generale le funzioni denite mediante serie non
sono integrabili secondo Riemann, a meno che la somma della serie non sia
continua.
7
8 Misura e integrazione
(iii) La possibilit` a di passare al limite sotto il segno di integrale
f
h
f =
_
b
a
f
h
(t) dt
_
b
a
f(t) dt
solo se le funzioni convergono uniformemente. Vedremo invece che nellam-
bito della teoria di Lebesgue la classe delle funzioni integrabili `e molto pi` u
ricca e comprende molte funzioni che sono limiti di successioni anche non uni-
formemente convergenti. Inoltre, vi sono formule molto generali di passaggio
al limite sotto il segno di integrale.
Lidea di base della teoria di Lebesgue consiste nel suddividere non il dominio
della funzione da integrare, come nella teoria di Riemann, ma il suo codominio. Per
esempio, come vedremo, se una funzione assume solo un numero nito di valori,
per esempio
(1.1) f(x) =
k

i=1
c
i

E
i
(x)
con c
i
R e gli E
i
a due a due disgiunti, `e naturale denire il suo integrale ponendo
_
f =
k

i=1
c
i
mis (E
i
).
Per avere una suciente essibilit` a nellapprossimare funzioni generiche con fun-
zioni del tipo (1.1) non basta (in R) prendere come insiemi di livello E
i
degli
intervalli, ma bisogna considerare insiemi pi` u generali. Questo pone il problema
di denire opportunamente una misura su classi molto ampie di insiemi. Ecco
perche trattiamo prima la misura e poi lintegrale (e non viceversa, come nella
teoria di Riemann). La trattazione che presentiamo `e generale (non si limita alla
misura standard su R
n
) per poter essere applicata fra laltro nellambito della
teoria delle distribuzioni, che vedremo in un capitolo successivo, e della teoria delle
probabilit` a.
1.1 Misure positive
Denizione 1.1 Sia X un insieme non vuoto. Una famiglia c di sottoinsiemi di
X si chiama algebra, se
(a) c;
1.1 Misure positive 9
(b) c `e chiusa rispetto allunione: per ogni A, B c, risulta A B c;
(c) c `e chiusa rispetto alla complementazione: per ogni A c, risulta XA c.
Osservazione 1.2 Equivalentemente, c `e unalgebra se sono soddisfatte le pro-
priet` a (a), (b) e (c), dove
(b) c `e chiusa rispetto allintersezione: per ogni A, B c, risulta A B c.
In virt` u della propriet`a associativa di unione e intersezione, si ha che lunione
e lintersezione di un numero nito di elementi di c `e ancora in c.
Denotando con T(X) linsieme di tutti i sottoinsiemi di X, deniamo lunione
e lintersezione di una successione (E
h
)
hN
come segue:
_
hN
E
h
=
_
x X : h N : x E
h
_
,

hN
E
h
=
_
x X : x E
h
h N
_
.
Denizione 1.3 Una famiglia c di sottoinsiemi di X si chiama -algebra se `e
chiusa rispetto alle operazioni insiemistiche numerabili, cio`e se presi E
h
c risulta
che

hN
E
h
,

hN
E
h
c.
`
E facile vedere che , X e T(X) sono -algebre, rispettivamente la pi` u piccola
e la pi` u grande (rispetto allinclusione) tra tutte quelle che si possono formare con
sottoinsiemi di X.
A partire da ( T(X), `e possibile considerare la pi` u piccola -algebra conte-
nente ( e denita da
(() =

_
c [ c algebra, ( c T(X)
_
.
La denizione `e ben posta, in quanto esiste almeno una -algebra, T(X), che
gode delle propriet`a richieste. Inoltre, `e facile vericare che lintersezione di una
qualunque famiglia di -algebre `e ancora una -algebra. In R
N
, la -algebra di
Borel B(R
N
) `e quella generata dalla famiglia di tutti i sottoinsiemi aperti (o,
equivalentemente, generata da tutti i sottoinsiemi chiusi).
La coppia (X, c), dove c `e una -algebra di sottoinsiemi di X, si chiama spazio
misurabile e gli elementi di c prendono il nome di insiemi misurabili. Uno spazio
misurabile rappresenta lambiente adatto per lintroduzione del concetto di misura.
Data una funzione dinsieme : c [0, +], diremo che
- `e additiva se (A B) = (A) + (B), per ogni scelta degli insiemi A, B
in c con A B = ;
10 Misura e integrazione
- `e -subadditiva (o equivalentemente numerabilmente subadditiva) se per
ogni successione E
h

hN
c e per ogni E c tali che E

_
h=1
E
h
risulta
(E)

h=1
(E
h
);
- `e -additiva (o equivalentemente numerabilmente additiva) se, posto E =

_
h=1
E
h
, con E
h
E e E
h
E
k
= per ogni h ,= k, risulta
(E) =

h=1
(E
h
);
- `e nita se (X) < +.
Denizione 1.4 Chiamiamo misura positiva su uno spazio misurabile (X, c) ogni
funzione dinsieme -additiva : c [0, +] tale che () = 0. La terna
(X, c, ) si chiama spazio di misura.
Un insieme E c si dice -nito se si pu`o decomporre nellunione numerabile
di insiemi aventi misura nita, cio`e E =

h=1
E
h
con (E
h
) < +. Se X `e
-nito, allora la misura si dice -nita.
Se `e una misura positiva nita su X con (X) = 1, allora `e una misura di
probabilit` a e la terna (X, c, ) si dice, in questo caso, uno spazio di probabilit`a.
Osservazione 1.5 Ogni misura positiva `e
(a) crescente rispetto allinclusione insiemistica
E F = (E) (F),
in quanto (F) = (E)+(FE). In realt` a, per questa propriet` a `e suciente
che sia una funzione dinsieme positiva e additiva. In particolare, se `e
nita allora (E) < + per ogni E c.
(b) continua rispetto alle successioni crescenti di insiemi misurabili
E
1
E
2
E
n
=
_
_
n
E
n
_
= lim
n
(E
n
).
1.1 Misure positive 11
Infatti, posto E
0
= e F
n
= E
n
E
n1
, per n 1, abbiamo una nuova
successione di insiemi misurabili a due a due disgiunti, la cui unione `e uguale
a quella degli E
n
. Siccome `e -additiva, possiamo scrivere

_
_
n
F
n
_
=

n
(F
n
) =

n
((E
n
) (E
n1
))
= lim
n
n

k=1
((E
k
) (E
k1
)) = lim
n
(E
n
),
avendo ottenuto una somma telescopica nel penultimo passaggio.
(c) continua anche rispetto a successioni decrescenti di insiemi misurabili
E
1
E
2
E
n
=
_

n
E
n
_
= lim
n
(E
n
)
se vale, in aggiunta, che (E
1
) < +. Infatti, applicando la (b) alla
successione crescente E
1
E
n
, la cui unione `e E
1
E, otteniamo
(E
1
) (E) = (E
1
E) = lim
n+
(E
1
E
n
)
= (E
1
) lim
n+
(E
n
).
Sottraendo (E
1
) ad ambo i membri si ha la tesi.
Osserviamo che nellOsservazione 1.5(c) basta che uno degli E
n
abbia misura
nita. Tale richiesta per passare al limite non pu` o essere rimossa. Infatti, se
X = R, E
n
= [n, +[ e `e la misura sulla retta, allora E
n
= , mentre
lim
n
(E
n
) = +.
Nelle applicazioni, risulta utile il seguente criterio per stabilire se una data
funzione dinsieme `e -additiva.
Proposizione 1.6 Sia (X, c) uno spazio misurabile e sia : c [0, +] una
funzione dinsieme additiva e -subadditiva. Allora `e -additiva.
Dim. Consideriamo una successione di insiemi in c a due a due disgiunti, E
h
, e
sia E la loro unione. In virt` u delle ipotesi abbiamo
(E)

h=1
(E
h
) = lim
n
n

h=1
(E
h
) = lim
n

_
n
_
h=1
E
h
_
(E).
12 Misura e integrazione
Esempi 1.7 Vediamo degli esempi classici di misure positive.
(1) Sia X un insieme non vuoto e sia c = T(X). Deniamo la cosiddetta misura
del contare nel modo seguente: () = 0, (E)= cardinalit` a di E, se E `e
nito, (E) = , altrimenti.
(2) Per ogni x X, poniamo
x
(E) = 1, se x E,
x
(E) = 0, se x / E, per ogni
E X.
x
prende il nome di misura di Dirac concentrata in x.
(3) La costruzione di Riemann per lintegrale induce la misura di Peano-Jordan

PJ
in R
n
. Sulla retta R un insieme E si dice misurabile secondo Peano-
Jordan se per ogni > 0 esistono intervalli a due a due disgiunti I
1
, . . . , I
k
e
J
1
, . . . , J
n
tali che
k
_
i=1
I
i
E
n
_
j=1
J
j
, e
n

j=1
(J
j
)
k

i=1
(I
i
) < ,
dove se I = (a, b) abbiamo posto (I) = b a. La famiglia degli insiemi

PJ
-misurabili non `e per`o una -algebra: per esempio, E = Q [0, 1] non `e

PJ
-misurabile. Infatti, per la numerabilit` a E `e lunione di una successione
crescente di insiemi niti (perci`o misurabili, e di misura nulla), ma gli unici
intervalli I
i
contenuti in E sono costituiti da un solo punto, mentre il pi` u
piccolo intervallo J
j
contenente E `e [0, 1]. Segue che per ogni scelta degli
(I
i
) e dei (J
j
) come sopra risulta

n
j=1
(J
j
)

k
i=1
(I
i
) 1 ed E non pu` o
essere
PJ
-misurabile.
Denizione 1.8 Chiameremo insiemi di misura nulla, o trascurabili, gli insiemi
E c tali che (E) = 0. Diremo che una certa propriet`a P(x) `e vera per -quasi
ogni x se linsieme
_
x X : P(x) `e falsa
_
`e trascurabile.
1.2 Funzioni misurabili
Introduciamo in questa sezione il concetto di funzione misurabile, che `e quello
naturale da considerare quando si ha a che fare con spazi misurabili. Dora in poi,
indicheremo per brevit`a linsieme
f
1
((t, +)) = x X : f(x) > t
con f > t. Con signicato analogo scriveremo f t, f < t, f t.
1.2 Funzioni misurabili 13
Denizione 1.9 Sia (X, c) uno spazio misurabile e sia f : X R. Diremo che
f `e misurabile se
f > t c, per ogni t R.
Se f : X R
m
, diremo che f `e misurabile se lo sono tutte le sue componenti
scalari.
Condizioni equivalenti alla misurabilit`a si hanno imponendo la misurabilit` a di
tutti gli insiemi f t o, passando ai complementari, la misurabilit` a di tutti gli
insiemi f < t oppure di tutti gli insiemi f t. Si ha infatti
f t =

h=1
f > t 1/h f > t =

_
h=1
f t + 1/h
quindi dalla misurabilit` a degli insiemi con la disuguaglianza stretta si deduce la
misurabilit` a di quelli con la disuguaglianza non stretta e viceversa. Inoltre, possi-
amo notare che se f `e misurabile allora per ogni a < b linsieme a < f < b =
x X : a < f(x) < b `e misurabile e quindi, siccome ogni insieme aperto di
R `e unione numerabile di intervalli, per ogni aperto A di R linsieme f
1
(A) `e
misurabile. Le funzioni misurabili sono una classe stabile rispetto alle principali
operazioni algebriche.
Proposizione 1.10 Siano f, g funzioni misurabili. Allora per , R sono
funzioni misurabili le funzioni f +g, f g, f g = maxf, g, f g = minf, g.
Inoltre, se (f
h
) `e una successione di funzioni misurabili convergenti puntualmente
a f, anche f `e misurabile. Inoltre, se f `e misurabile e f ,= g `e trascurabile,
anche g `e misurabile. Inne, se f `e misurabile e : R R `e continua allora f
`e misurabile.
Dim. Se ,= 0 allora f > t `e uguale a f > t/ o f < t/ a seconda che
> 0 o < 0. Se = 0 linsieme `e vuoto oppure coincide con X. In ogni caso
f > t `e misurabile e quindi f `e misurabile. Analogamente, g `e misurabile.
Per la somma, si ha
f + g > t =
_
qQ
f > t q g > q
quindi anche la somma `e misurabile, dal momento che i soprallivelli sono esprimibili
come unione numerabile di insiemi misurabili. La stabilit` a rispetto a massimi e
minimi segue subito dalle identit` a
f g > t = f > t g > t
f g > t = f > t g > t.
14 Misura e integrazione
Siano f
h
funzioni misurabili convergenti puntualmente a f. Si ha
f > t =

_
k=1
x X : f
h
(x) > t + 1/k denitivamente
=

_
k=1

_
h=1

i=h
f
i
> t + 1/k.
Inne, se f `e misurabile e E = f ,= g allora
f > tg > t E
quindi essendo E trascurabile e f > t misurabile anche g > t `e misurabile.
Sia ora : R R continua. Allora, per ogni A R linsieme
1
(A) `e aperto
in R e quindi (sapendo che ogni aperto di R`e unione numerabile di intervalli aperti)
f
1
(
1
(A)) `e misurabile.
Se f : X R `e misurabile, poniamo
(1.2) |f|
L

(X)
= inft 0 : (x X : [f(x)[ t) = 0
e diciamo che f `e essenzialmente limitata se |f|
L

(X)
< +. Lo spazio delle
funzioni essenzialmente limitate in E si denota con L

(E) e la norma si denota


con |f|
L

(E)
.
Tra tutte le funzioni misurabili godono di particolare interesse le funzioni carat-
teristiche di insiemi misurabili e le loro combinazioni lineari. Ricordiamo che, per
ogni E X

E
(x) =
_
1 se x E,
0 se x / E.
Si verica immediatamente che
E
`e misurabile se e solo se E `e misurabile: infatti,

E
> t =
_
_
_
t 1
E 0 t < 1
R t < 0
e quindi
E
`e misurabile se e solo se E `e misurabile.
Denizione 1.11 Indicheremo con o
+
(X) linsieme delle funzioni semplici posi-
tive, cio`e linsieme delle funzioni esprimibili nella forma
f(x) =
N

i=1
z
i

E
i
(x),
con z
1
, . . . , z
N
positivi e E
1
, . . . , E
N
c.
1.2 Funzioni misurabili 15
Osserviamo che tutte le funzioni semplici sono misurabili. La rappresentazione
come combinazione lineare di funzioni caratteristiche non `e certo unica: ad esempio
(con X = R)

[1,1]
+
[0,2]
+
(1,3]
=
[1,0)
+ 2
[0,2]
+
(2,3]
.
`
E facile vedere che ogni funzione semplice `e rappresentabile in modo unico nel
seguente modo
(1.3) f(x) =
k

i=1
z
i

E
i
(x),
dove imf = f(X) = z
1
, . . . , z
k
, con z
i
,= z
j
per i ,= j e E
i
= f
1
(z
i
).
Vale il seguente importante risultato di approssimazione.
Teorema 1.12 Sia f : X [0, +] una funzione misurabile. Allora esiste una
successione di funzioni semplici (s
n
), tali che 0 s
n
(x) s
n+1
(x) e
lim
n
s
n
(x) = f(x), per ogni x X.
Se f `e limitata, allora la convergenza `e uniforme.
Dim. Per ogni n N e k = 0, 1, . . . , n2
n
1, deniamo
E
k,n
= f
1
__
k
2
n
,
k + 1
2
n
__
.
Tali insiemi sono misurabili, dato che f lo `e. Poniamo poi
s
n
(x) =
n2
n
1

k=0
k
2
n

E
k,n
(x) + n
E
n
(x),
dove E
n
= f n. Chiaramente, le s
n
sono funzioni semplici, costituiscono una
successione crescente e convergono puntualmente ad f. Infatti, ssato n, per ogni
k gli E
k,n
sono a due a due disgiunti e, siccome x E
k,n
implica k/2
n
f(x) <
(k + 1)/2
n
e s
n
(x) = k/2
n
, si ha che per ogni x f n vale la diseguaglianza
(1.4) [f(x) s
n
(x)[ 2
n
;
inoltre, linsieme f n invade linsieme f < + e nei punti x in cui f(x) =
+ risulta s
n
(x) = n f(x).
Se f `e limitata si vede che la convergenza `e uniforme, visto che per n > sup f
la stima (1.4) vale uniformemente. [f(x) s
n
(x)[ 1/2
n
per ogni x X.
16 Misura e integrazione
1.3 Integrazione
Dopo le premesse fatte, possiamo nalmente denire lintegrale rispetto ad una
generica misura positiva. La costruzione avviene per passi, considerando dapprima
le funzioni semplici positive, quindi quelle misurabili positive, per arrivare, inne,
ad integrare funzioni misurabili di segno qualunque.
Siano (X, c) uno spazio misurabile e una misura positiva in tale spazio.
Supponiamo anche che sia completa, cio`e che ogni sottoinsieme di un insieme
misurabile con misura nulla sia ancora misurabile (ed abbia misura nulla). Di fatto,
la costruzione dellintegrale `e possibile anche senza questa ulteriore condizione.
Tuttavia, per una misura completa valgono alcune propriet` a in pi` u, che preferiamo
mettere in evidenza.
Se s o
+
(X), s(x) =

k
i=1
z
i

E
i
(x), con E
i
E
j
= , per i ,= j, deniamo
_
X
s d =
k

i=1
z
i
(E
i
),
adottando la convenzione che z
i
(E
i
) = 0 se z
i
= 0 e (E
i
) = . La denizione
non dipende dalla rappresentazione di s ed in particolare risulta
_
X
s d =

z Im(s)
z
_
s
1
(z)
_
.
Inoltre, lapplicazione che ad una funzione semplice s associa il suo integrale `e
lineare, pur di moltiplicare per numeri positivi, e gode della seguente propriet` a di
monotonia:
s, t o
+
(X), s t =
_
X
s d
_
X
t d.
Estendiamo ora loperazione di integrazione ad una classe pi` u ampia di funzioni.
Denizione 1.13 Sia f misurabile e positiva. Allora poniamo
_
X
f d = sup
_
_
X
sd : d : s o
+
(X), s f
_
.
Notiamo che lintegrale di una funzione misurabile positiva `e ben denito, ma
pu` o essere +. Inoltre, si vede facilmente che se f o
+
(X), il suo integrale
coincide con quello gi` a denito.
In generale, se f `e misurabile (e di segno qualunque), consideriamo la parte
positiva f
+
= f 0 e la parte negativa f

= (f) 0 di f, il cui integrale `e


denito nella Denizione 1.13. Se f
+
ed f

hanno integrale nito poniamo


_
X
f d =
_
X
f
+
d
_
X
f

d.
1.3 Integrazione 17
Diremo che f `e sommabile in X se `e misurabile e la parte positiva e la parte
negativa hanno entrambe integrale nito.
Notiamo che tutte le funzioni limitate, misurabili, nulle fuori di un insieme
di misura nita sono sommabili. Linsieme delle funzioni sommabili in X verr` a
indicato con L
1
(X) oppure L
1
(X, ) se sar`a opportuno mettere in evidenza la
misura.
Teorema 1.14 Linsieme L
1
(X) delle funzioni sommabili in X `e uno spazio vet-
toriale. Inoltre valgono le propriet`a
(i) (Linearit`a)
_
X
[f + g] d =
_
X
f d +
_
X
g d
(ii) (Monotonia)
f g =
_
X
f d
_
X
g d
(iii) (Indipendenza da insiemi di misura nulla) Se f L
1
(X) e
_
x X : f(x) ,=
g(x)
_
= 0 allora
g L
1
(X) e
_
E
f d =
_
X
g d.
(iv)
f misurabile, [f[ g L
1
(X) q.o. = f L
1
(X).
Per quanto riguarda la propriet`a (iv), basta osservare che [f[ g implica
0 f
+
g e 0 f

g e quindi
_
X
sd
_
X
gd per ogni funzione semplice
minorante f
+
(risp. f

).
Una conseguenza della linearit` a dellintegrale `e la disuguaglianza tra il modulo
dellintegrale e lintegrale del modulo:

_
X
f d


_
X
[f[ d.
Infatti si ha

_
X
f d

_
X
f
+
d
_
X
f

_
X
f
+
d +
_
X
f

d =
_
X
[f[ d.
18 Misura e integrazione
La nozione di integrale si estende immediatamente alle funzioni a valori vettoriali
f = (f
1
, . . . , f
m
) : X R
m
ponendo
_
X
fd =
_
_
X
f
1
d, . . . ,
_
X
f
m
d
_
purche le componenti f
i
siano integrabili. In particolare, se m = 2 con la consueta
identicazione del piano con il campo complesso resta denito anche lintegrale
dimuna funzione complessa f = u + iv : X C,
_
X
fd =
_
X
ud + i
_
X
vd.
Dato un insieme misurabile E X e f : X R misurabile diremo che f `e
sommabile in E se f
E
`e sommabile in X. In tal caso porremo
_
E
f d =
_
X
f
E
d.
Avremmo ottenuto lo stesso risultato se, per denire lintegrale in E avessimo usato
la restrizione della misura ad E. Linsieme delle funzioni sommabili in E verr` a
indicato con L
1
(E, ) o semplicemente L
1
(E).
1.4 La misura di Lebesgue in R
n
In questo paragrafo vediamo come sia possibile denire una nozione di misura
n-dimensionale per un sottoinsieme E di R
n
. Lidea `e quella di assegnare ai
rettangoli
R = [a
1
, b
1
[ [a
n
, b
n
[
una misura (lunghezza per n = 1, area per n = 2, volume per n = 3,...) uguale a
m
n
(R) = (b
1
a
1
) (b
2
a
2
) (b
n
a
n
)
e poi di denire la misura di un insieme generico mediante ricoprimenti fatti con
rettangoli. Per n = 1 si tratta evidentemente di intervalli, per n = 2 di rettangoli
veri e propri, per n = 3 di parallelepipedi. Useremo la parola rettangoli, senza
introdurre ulteriori termini. Chiameremo invece plurirettangolo ununione nita
di rettangoli del tipo detto.
Denizione 1.15 Sia E R
n
un insieme. Deniamo m
n
(E), misura esterna
n-dimensionale di Lebesgue di E, nel seguente modo:
m
n
(E) = inf
_

i=1
m
n
(R
i
) : E

_
i=1
R
i
_
.
1.4 La misura di Lebesgue in R
n
19
Quindi la misura esterna di E si ottiene cercando, tra tutti i ricoprimenti di E
mediante successioni di rettangoli n-dimensionali, quello che minimizza la somma
dei volumi. Osserviamo che i rettangoli del ricoprimento non sono necessariamente
disgiunti. Vediamo alcune propriet`a della misura esterna che seguono direttamente
dalla denizione:
(a) La misura esterna di E `e sempre compresa tra 0 e +. Inoltre m
n
(E) < +
se E `e un insieme limitato e m
n
() = 0. Daltra parte, come vedremo,
esistono insiemi non limitati di misura nita ed insiemi non vuoti di misura
nulla.
(b) La misura esterna `e invariante per traslazioni
m
n
(x + E) = m
n
(E) E R
n
, x R
n
ed ha il seguente comportamento rispetto ad omotetie
(1.5) m
n
(E) =
n
m
n
(E) E R
n
, > 0.
Infatti, se E si ricopre con rettangoli R
i
allora x + E si ricopre con rettan-
goli x + R
i
, che hanno lo stesso volume, mentre linsieme E si ricopre con
rettangoli R
i
, il cui volume `e
n
m
n
(R
i
).
(c) La misura esterna `e una funzione crescente dinsieme:
E
1
E
2
= m
n
(E
1
) m
n
(E
2
).
Inoltre `e numerabilmente subadditiva:
(1.6) E

_
h=1
E
h
= m
n
(E)

h=1
m
n
(E
h
).
La diseguaglianza `e infatti ovvia se la sommatoria di m
n
(E
h
) vale +. In ca-
so contrario, per ogni > 0 ed ogni h 1 esiste una successione di rettangoli
(R
h,i
)
iN
tale che
E
h

_
i=1
R
h,i

i=1
m
n
(R
h,i
) < m
n
(E
h
) + 2
h
.
Sommando in h si ha

h=1

i=1
m
n
(R
h,i
) <

h=1
m
n
(E
h
) +
20 Misura e integrazione
e dato che i rettangoli R
h,i
ricoprono E si ottiene
m
n
(E) <

h=1
m
n
(E
h
) + .
Basta allora mandare a zero per ottenere la (1.6).
La misura esterna di x (il singoletto costituito dal solo x) `e zero. Questo
perche x `e contenuto in cubi di volume arbitrariamente piccolo. Dalla numerabile
subadditivit` a di m
n
si ottiene che ogni insieme numerabile ha misura esterna nulla.
Infatti, data x : N E surgettiva, si ha
E =

_
h=0
x
h
.
In particolare linsieme dei punti a coordinate razionali Q
n
, essendo numerabile,
ha misura nulla.
Anche insiemi continui e quindi non numerabili possono avere misura esterna
nulla. Ad esempio il segmento E = (0, 1)0 in R
2
ha misura esterna nulla: dato
infatti > 0 ed un intero h tale che h > 4, basta ricoprire E con gli h cubi Q
i
centrati in i/h e di lato 1/h per avere m
n
(E) h (2/h)
2
= 4/h < .
Vediamo alcune propriet` a degli insiemi trascurabili.
Proposizione 1.16 Ogni sottoinsieme di un insieme trascurabile `e trascurabile.
Lunione di una successione di insiemi trascurabili `e trascurabile. Un insieme E `e
trascurabile se e solo se per ogni > 0 esiste un aperto A

E tale che m
n
(A

) < .
Dim. I primi due enunciati seguono facilmente dalle propriet` a (c) della misura
esterna. Se E `e contenuto in aperti di misura esterna arbitrariamente piccola, per
la monotonia della misura esterna deve essere m
n
(E) = 0. Viceversa, se m
n
(E) = 0
allora per ogni > 0 esiste una successione di rettangoli aperti R
i
tale che
E

_
i=1
R
i
e

i=1
m
n
(R
i
) < .
Detta A

lunione dei rettangoli R


i
si ha, per la denizione di misura esterna,
m
n
(A

) < .
1.4 La misura di Lebesgue in R
n
21
La misura esterna di Lebesgue ha il vantaggio di essere denita per ogni sot-
toinsieme di R
n
. Il prezzo di questo `e per`o una perdita di additivit`a: esistono
esempi di insiemi limitati E, F di R
n
disgiunti e tali che
(1.7) m
n
(E F) < m
n
(E) + m
n
(F).
Individueremo ora una -algebra di insiemi, detti insiemi misurabili, sui quali la
misura esterna di Lebesgue ha un comportamento migliore, cio`e una -algebra
/(R
n
) tale che la restrizione di m
n
ad /(R
n
) risulti -additiva, denendo una
misura.
Denizione 1.17 Posto EF = (EF)(F E), diremo che un insieme limitato
E R
n
`e misurabile se per ogni > 0 esiste un plurirettangolo P tale che
m
n
(EP) < .
Se E non `e limitato diremo che E `e misurabile se E B
R
(0) `e misurabile per ogni
R > 0. Indicheremo con /(R
n
) la classe dei sottoinsiemi misurabili di R
n
.
La proposizione precedente implica che tutti gli insiemi trascurabili sono misurabili
(si prende P = ).
Vediamo ora alcune propriet` a di stabilit` a degli insiemi misurabili:
Teorema 1.18
(i) Gli aperti e i chiusi di R
n
sono misurabili.
(ii) La classe /(R
n
) `e una -algebra.
(iii) La classe /(R
n
) `e stabile per omotetie e traslazioni:
E /(R
n
) = x + E, E /(R
n
) x R
n
, > 0.
(iv) Se E `e misurabile e F `e tale che m
n
(EF) = 0 allora anche F `e misurabile.
In base al teorema precedente sono misurabili le unioni numerabili di chiusi,
le intersezioni numerabili di aperti e cos` via. La classe degli insiemi misurabili `e
quindi estremamente ricca.
A confermare questo c`e anche il fatto che i soli esempi di sottoinsiemi di R
n
non misurabili per i quali vale (1.7) si ottengono in modo non costruttivo. Tutti gli
insiemi operativamente costruiti a partire dai chiusi e dagli aperti con operazioni
nite o numerabili sono misurabili.
Possiamo ora denire mediante restrizione ai misurabili la misura di Lebesgue
in R
n
:
22 Misura e integrazione
Denizione 1.19 Dato E R
n
misurabile poniamo m
n
(E) = m
n
(E). Il numero
m
n
(E) `e detto misura di Lebesgue di E.
Teorema 1.20 La misura di Lebesgue `e numerabilmente additiva su /(R
n
): per
ogni E misurabile ed ogni sua partizione in insiemi misurabili E
h
si ha
m
n
(E) =

h=1
m
n
(E
h
).
Inoltre m
n
`e invariante per traslazioni, soddisf`a alla (1.5) e m
n
([0, 1]
n
) = 1.
Dal teorema precedente possiamo dedurre altre utili propriet` a della misura di
Lebesgue, semplici riformulazioni delle propriet` a viste nellOsservazione 1.5. La
misura di Lebesgue `e certamentee la pi` u importante fra quelle che si incontreranno
nel Corso. La sua costruzione ha richiesto una certa fatica, e ovviamente le di-
mostrazioni omesse non sono semplici, ma in conclusione possiamo dire che negli
spazi euclidei esiste una funzione dinsieme che verica, come quella di Peano-
Jordan, tutte le propriet` a naturali (invarianza per traslazione, comportamento
rispetto alle omotetie, ecc.), ma, a dierenza di quella di Peano-Jordan, `e denita
su una -algebra di insiemi misurabili ed `e -additiva su tale -algebra, sicche gode
di tutte le propriet` a viste in generale per le misure positive.
Corollario 1.21 Per ogni coppia di insiemi E, F /(R
n
) si ha
m
n
(E F) + m
n
(E F) = m
n
(E) + m
n
(F).
Data una successione crescente di insiemi (E
h
) /(R
n
) si ha
m
n
_

_
h=1
E
h
_
= lim
h+
m
n
(E
h
).
Data una successione decrescente di insiemi (E
h
) /(R
n
), si ha
m
n
(E
1
) < + = m
n
_

h=1
E
h
_
= lim
h+
m
n
(E
h
).
Osserviamo che, com`e naturale aspettarsi, se una funzione `e integrabile nel senso
di Riemann allora `e integrabile anche nel senso di Lebesgue e i due integrali hanno
lo stesso valore.
`
E naturale chiedersi se in un insieme X qualunque `e sempre lecito introdurre
una misura positiva. La risposta `e aermativa. Come nel caso della misura di
1.5 Passaggio al limite sotto il segno di integrale 23
Lebesgue, si pu` o dimostrare che tramite una misura esterna `e possibile costruire
una classe di misurabili e una misura positiva. Non vedremo questa costruzione
nella massima generalit` a, bens` in un caso particolare che sar` a quello della misura
di Stieltjes.
Una funzione dinsieme denita su tutte le parti di X, : T(X) [0, +], si
chiama misura esterna se
(i) () = 0;
(ii) (A) (B) se A B;
(iii) (

k
A
k
)

k
(A
k
) per ogni collezione numerabile di insiemi A
k
.
Diremo che E X `e misurabile se
(A) = (A E) + (A E), A X.
Si dimostra (Teorema di Caratheodory) che la classe dei misurabili `e una -algebra
e che ristretta a questa famiglia `e -additiva, quindi `e una misura. Natural-
mente, la bont` a di una misura dipender` a dalla ricchezza della classe degli insiemi
misurabili che si ottengono.
1.5 Passaggio al limite sotto il segno di integrale
In questo paragrafo vedremo sotto quali condizioni vale limplicazione
(1.8) f
h
f =
_
X
f
h
d
_
X
f d.
Vedremo che in molti casi la sola convergenza puntuale della successione implica la
convergenza degli integrali. Incominceremo col considerare il caso in cui f
h
`e una
successione monotona crescente. Per poter dare lenunciato nella sua forma pi` u
generale ci sar`a utile estendere la nozione di integrale al caso di funzioni a valori
in R = [, +] = R , +.
Denizione 1.22 Sia f : X R. Diremo che f `e misurabile se per ogni t R l
insieme f > t `e misurabile. Se f `e misurabile gli insiemi
f = + =

h=1
f > h f = =

h=1
f h
24 Misura e integrazione
sono misurabili. Se f 0 poniamo
_
X
f d = lim
R+
_
X
f Rd
e nel caso generale poniamo
_
X
f d =
_
X
f
+
d
_
X
f

d
purche almeno uno degli integrali sia nito.
Restano vere le propriet`a di monotonia, invarianza e linearit` a dellintegrale, con
leccezione di indeterminazioni del tipo .
`
E importante osservare che vale
limplicazione
_
X
[f[ d < + =
_
X [f[ = +
_
= 0.
Quindi se f L
1
(X) (cio`e il suo modulo ha integrale nito su X) allora gli insiemi
f = sono trascurabili. Usando la disuguaglianza [f[ R
[f[>R
si ha
infatti
_
X
[f[ d R
_
[f[ > R
_
R
_
[f[ = +
_
.
Dividendo ambo i membri per R e passando al limite per R + si ottiene

_
[f[ =
_
= 0.
Teorema 1.23 (di Beppo Levi della convergenza monotona) Sia (f
h
) una
successione crescente di funzioni misurabili a valori in [0, +]. Posto, per ogni
x X,
f(x) = sup
h1
f
h
(x) = lim
h+
f
h
(x),
si ha
_
X
f d = lim
h+
_
X
f
h
d.
Dim. Notiamo che la convergenza puntuale delle f
h
ad f non va dimostrata,
perche `e ovvia per monotonia, cos` come la convergenza degli integrali,
lim
h+
_
X
f
h
d = .
Inoltre, dalla convergenza puntuale segue anche che f `e integrabile, e per la mono-
tonia delintegrale, che
_
X
fd. Pertanto, se = + non c`e nulla da
dimostrare. Altrimenti, ssati s o
+
(X) tale che s f e 0 < c < 1, poniamo
E
h
= x X : f
h
(x) > cs(x)
1.5 Passaggio al limite sotto il segno di integrale 25
e osserviamo che E
h
c per ogni h, e che

h
E
h
= X. Per ogni x X, o f(x) = 0,
e allora x E
1
, oppure f(x) > 0 e cs(x) < f(x); ne segue:
= lim
h+
_
X
f
h
d lim
h+
_
E
h
f
h
d lim
h+
c
_
E
h
s d = c
_
X
s d,
da cui, per c 1,
_
X
s d. Per larbitrariet`a di s f, si ha
_
X
f d e la
tesi `e provata.
Osservazione 1.24 Lipotesi di non negativit` a sulle funzioni f
h
pu` o essere inde-
bolita richiedendo che esista una funzione g L
1
(X) tale che
f
h
(x) g(x) x X, h 1.
Basta infatti applicare il teorema sopra a f
h
g. Senza alcuna ipotesi il teorema
di convergenza monotona pu` o essere falso: ad esempio se X = R e f
h
=
R\[h,h]
allora f 0 e
_
R
f
h
(x) dx = h, mentre
_
R
f(x) dx = 0.
Una importante conseguenza del teorema di convergenza monotona `e il fatto
che le operazioni di serie e di integrale commutano
(1.9)
_
X
_

h=1
f
h
_
d =

h=1
_
X
f
h
d
purche tutte le funzioni f
h
siano non negative. Infatti basta passare al limite per
N + nelluguaglianza
_
X
N

h=1
f
h
d =
N

h=1
_
X
f
h
d
ed il teorema di convergenza monotona garantisce che
lim
N+
_
X
N

h=1
f
h
d =
_
X
lim
N+
N

h=1
f
h
d =
_
X

h=1
f
h
d.
`
E importante osservare che quando limplicazione (1.8) non vale, c`e comunque una
relazione tra il limite degli integrali e lintegrale del limite.
26 Misura e integrazione
Lemma 1.25 (Lemma di Fatou) Sia (f
h
) L
1
(X) una successione di funzioni
misurabili a valori in [0, +]. Allora
_
X
liminf
h+
f
h
d liminf
h+
_
X
f
h
d.
Dim. Posto per ogni h N, f = liminf
h
f
h
e g
h
= inf
kh
f
k
, si ha che g
h
`e una
successione crescente che converge puntualmente a f in X, ed inoltre ovviamente
vale g
h
f
h
per ogni h. Applicando il teorema della convergenza monotona alla
successione (g
h
), risulta:
_
X
f d = lim
h
_
X
g
h
d = liminf
h
_
X
g
h
d liminf
h
_
X
f
h
d.
Osserviamo che, come per il teorema della convergenza monotona, si pu`o so-
stituire lipotesi che le f
h
siano tutte positive con lipotesi che esista una funzione
g L
1
(X) tale che f
h
g per ogni h.
Per trattare limiti non monotoni di successioni `e utile il
Teorema 1.26 (Teorema di Lebesgue della convergenza dominata) Se la
successione (f
h
) L
1
(X) converge puntualmente a f : X R per -quasi ogni
x X ed esiste una funzione g L
1
(X) tale che
(1.10) [f
h
(x)[ g(x) per q.o. x X, h 1,
allora f L
1
(X) e
lim
h+
_
X
f
h
d =
_
X
f d.
Dim. Notiamo che f(x) g(x) q.o. in X, e che [f f
h
[ 0, sicche 0
2g [f f
h
[ 2g. Ricordiamo anche che vale la seguente relazione tra liminf
e limsup, che segue subito dalle propriet` a dellestremo superiore e dellestremo
inferiore:
liminf
h
a
h
= limsup
h
a
h
per ogni successione reale (a
h
) (vedi lAppendice). Applicando il Lemma di Fatou
alla successione 2g [f f
h
[ si ha:
0
_
X
2g =
_
X
lim
h
(2g [f f
h
[) liminf
h
_
X
(2g [f f
h
[)
=
_
X
2g + liminf
h
_

_
X
[f f
h
[
_
=
_
X
2g limsup
h
_
X
[f f
h
[
1.5 Passaggio al limite sotto il segno di integrale 27
da cui limsup
h
_
X
[f f
h
[ = 0 e quindi
limsup
h

_
X
f
_
X
f
h

limsup
h
_
X
[f f
h
[ = 0
e il teorema `e dimostrato.
Osservazione 1.27
(a) Il teorema della convergenza dominata pu` o essere falso se non vale la (1.10):
sia ad esempio X = R e
f
h
(x) =
_
h
3
x(1/h x) se x [0, 1/h];
0 altrimenti.
Allora f
h
converge puntualmente a zero in R ma
_
R
f
h
(x) dx =
1
6
.
(b) Con lo stesso ragionamento usato per dedurre la (1.9) si dimostra che

h=1
_
X
f
h
d =
_
X

h=1
f
h
d
purche esista una funzione g L
1
(X) tale che

i=1
f
i
(x)

g(x) x X, N 1.
Per descrivere meglio la struttura dello spazio L
1
(X) introduciamo le nozioni
contenute nella seguente
Denizione 1.28 (Spazi di Banach) Se E `e uno spazio vettoriale (reale o com-
plesso), si dice norma una funzione | | su E tale che
|x| 0 x E, |x| = 0 x = 0;
|x| = [[|x| R (C), x E;
|x + y| |x| +|y| x, y E (diseguaglianza triangolare).
28 Misura e integrazione
La norma induce una distanza tra i punti di E, d(x, y) = |x y|, e quindi una
nozione di convergenza di successioni, x
n
x per n se e solo se d(x
n
, x) =
|x
n
x| 0 per n . Una successione (x
n
) E si dice successione di Cauchy
se per ogni > 0 esiste > 0 tale che |x
n
x
k
| < per ogni n, k > . Uno spazio
normato E si dice completo, o spazio di Banach, se ogni successione di Cauchy in
E converge ad un punto di E.
Consideriamo ora per f L
1
(X) la funzione
|f|
L
1
(X)
=
_
X
[f[ d.
Si osservi che a rigore questa non `e una norma in quanto |f|
L
1
(X)
= 0 non implica
f = 0 ma solo f(x) = 0 per -quasi ogni x. A tutti gli eetti si pu` o lavorare
con |f|
L
1
(X)
come se fosse una norma, considerando equivalenti due funzioni che
dieriscono in un insieme trascurabile.
Sia ora (f
h
) come nel teorema della convergenza dominata. Passando al limite
nella (1.10) otteniamo che [f[ g quasi ovunque in E. Cambiando se necessario
f in un insieme di misura nulla possiamo supporre che la diseguaglianza valga
ovunque; dato che [f
h
f[ 2g otteniamo
lim
h+
_
X
[f
h
(x) f(x)[ d = 0.
Quindi convergenza puntuale e dominata implica la convergenza nella metrica di
L
1
(X). In generale la convergenza in L
1
(X) non implica la convergenza quasi
ovunque: ad esempio le funzioni
_

_
f
1
=
[0,1]
f
2
=
[0,1/2]
, f
3
=
[1/2,1]
f
4
=
[0,1/3]
, f
5
=
[1/3,2/3]
, f
6
=
[2/3,1]
. . .
convergono a 0 in L
1
([0, 1]) ma non convergono quasi ovunque. Si ha tuttavia
convergenza quasi ovunque di sottosuccessioni:
Proposizione 1.29 Sia (f
h
) L
1
(X) convergente a f L
1
(X). Allora esiste
una sottosuccessione g
k
= f
h
k
convergente -quasi ovunque in X a f.
Dim. Siano, per k 1, h
k
indici scelti in modo tale che |f
h
k
f|
L
1
(X)
< 2
k
.
Posto g
k
= f
h
k
abbiamo

k=1
_
X
[g
k
(x) f(x)[ d 1.
1.5 Passaggio al limite sotto il segno di integrale 29
Commutando lintegrale con la serie otteniamo
_
X

k=1
[g
k
(x) f(x)[ d 1 < +
quindi la (1.9) implica

k=1
[g
k
(x) f(x)[ < +
per -quasi ogni x X. Per ogni x con la propriet`a sopra i numeri g
k
(x) convergono
a f(x).
Con un ragionamento simile a quello usato nella proposizione precedente si
verica la propriet`a di completezza di L
1
(X):
Proposizione 1.30 Sia (f
h
) L
1
(X) una successione di Cauchy. Allora esiste
una funzione f L
1
(X) tale che |f
h
f|
L
1
(X)
tende a zero.
Dim. Ragionando come nella dimostrazione precedente, estraiamo dalla (f
h
) una
sottosuccessione (f
h
k
) tale che |f
h
k+1
f
h
k
|
L
1
(X)
2
k
. Posto
g
n
=
n

k=1
[f
h
k+1
f
h
k
[, g =

k=1
[f
h
k+1
f
h
k
[,
dalla diseguaglianza triangolare segue che |g
k
|
L
1
(X)
1 per ogni k, e quindi dal
Lemma di Fatou |g|
L
1
(X)
1. In particolare, g(x) < q.o., sicche la serie
f
h
1
+

k=1
f
h
k+1
f
h
k
converge assolutamente ad una funzione che possiamo denotare f e che, essendo la
serie precedente telescopica, `e anche il limite puntuale delle f
h
k
). A questo punto,
ssato > 0, sia > 0 tale che |f
n
f
k
|
L
1
(X)
> per n, k > . Allora, dal Lemma
di Fatou
_
X
[f f
k
[d liminf
n
_
X
[f
n
f
k
[d >
e quindi f L
1
(X) e, per larbitrariet` a di , |f f
k
|
L
1
(X)
0.
La proposizione precedente si pu` o riformulare dicendo che L
1
(X) `e uno spazio
di Banach.
`
E di estremo interesse nelle applicazioni anche lo spazio
(1.11) L
2
(E) =
_
u : E R :
_
E
[u[
2
d[[ <
_
30 Misura e integrazione
dove `e una misura su uno spazio misurabile (X, c) ed E c. Lo spazio L
2
(E) `e
uno spazio normato completo con norma
|u|
L
2
(E)
=
_
_
E
[u[
2
d[[
_
1/2
.
Ricordiamo che `e stato introdotto anche lo spazio L

(E) delle funzioni misurabili


f essenzialmente limitate, cio`e tali che esiste una costante C tale che

_
x E : [f(x)[ > C
_
= 0
o, equivalentemente
[f(x)[ C per -q.o. x E.
La minima costante C con questa propriet`a (esiste per la numerabile additivit` a
della misura) `e indicata con |f|
L

(E)
. Per la norma | |
L

(E)
in L

(E) valgono le
stesse considerazioni gi` a fatte per gli spazi L
1
(E), L
2
(E), ed inoltre anche L

(E)
`e completo.
Introduciamo anche la seguente notazione. Diciamo che f : R
n
R `e in
L
1
loc
(R
n
) se f L
1
(E) per ogni insieme misurabile e limitato E R
n
. In modo
analogo si denisce L
2
loc
(R
n
)
1.6 Misure reali e vettoriali
In questo paragrafo introduciamo le nozioni di misura reale e vettoriale, che
sono utili in varie applicazioni e ritroveremo nellambito delle distribuzioni.
Denizione 1.31 Se (X, c) `e uno spazio misurabile, m N, deniamo misura
vettoriale ogni funzione dinsieme : c R
m
, tale che () = 0 e
(1.12)
_

_
j=1
E
j
_
=

j=1
(E
j
),
per ogni successione E
j
c di insiemi a due a due disgiunti.
In particolare, se nella denizione precedente m = 1, allora si parla di misura reale.
Per m = 2, abbiamo una misura complessa. Siccome le componenti di una misura
vettoriale sono misura reali, spesso, in ci` o che segue, sar` a suciente restringersi al
caso reale.
1.6 Misure reali e vettoriali 31
Osservazione 1.32 Una misura positiva non `e un caso particolare di misura reale.
Infatti, direttamente dalla denizione discende che una misura reale `e nita, mentre
una misura positiva generalmente non lo `e. Inoltre, se `e una misura reale, allora
in (1.12) abbiamo una serie convergente, la cui somma non dipende dallordine
degli addendi, in quanto lunione insiemistica a primo membro `e indipendente
dallordine. Pertanto la serie in questione `e assolutamente convergente, dal teorema
del riordinamento di Riemann, vedi in Appendice.
Esempio 1.33 Siano x
k
X e c
k
R
m
due successioni con

k
[c
k
[ < +.
Deniamo =

k=1
c
k

x
k
, ossia
(E) =

k : x
k
E
c
k
, E X.
Otteniamo cos` una misura vettoriale denita in T(X).
Vogliamo arontare ora il problema di costruire a partire da una misura reale
(o vettoriale), , una misura positiva che domini , nel senso che [(E)[
(E), per ogni misurabile E, e che sia, in qualche modo, la pi` u piccola. A tal
proposito, notiamo che, se E
n
`e una partizione misurabile di E, allora deve
essere necessariamente
(1.13) (E) =

n=1
(E
n
)

n=1
[(E
n
)[.
Dato che la partizione `e arbitraria, (E) sar` a almeno uguale allestremo superiore
delle somme nellultimo membro di (1.13). Ci`o giustica la seguente denizione.
Denizione 1.34 Sia una misura vettoriale su (X, c). Per ogni E c, ponia-
mo
[[(E) = sup
_

j=1
[(E
j
)[

E =

_
j=1
E
j
, E
i
c, E
i
E
j
= , i ,= j
_
.
[[ si chiama variazione totale di .
`
E immediato vedere che [(E)[ [[(E) (basta prendere la partizione costituita
dal solo E). Il risultato pi` u importante riguardante la variazione totale di una
misura `e stabilito nel teorema che segue, di cui `e omessa la dimostrazione.
Teorema 1.35 [[ `e una misura positiva nita.
32 Misura e integrazione
La variazione totale [[ `e minimale, nel senso che se `e unaltra misura positiva
tale che [(E)[ (E) per ogni E c, allora [[(E) (E).
Esempio 1.36 Sia (X, c, ) uno spazio di misura, prendiamo f L
1
(X) e denia-
mo (E) =
_
E
fd per ogni E c. Allora [[(E) =
_
E
[f[d.
Infatti, `e facile vedere che [[(E)
_
E
[f[. Daltra parte, se decomponiamo E
nellunione disgiunta di E
+
= E f 0 ed E

= E f < 0 e consideriamo
E
+
h
, E

h
partizioni misurabili di E
+
ed E

, rispettivamente, allora

h=1
[(E
+
h
)[ =
_
E
+
f =
_
E
+
[f[,

h=1
[(E

h
)[ =
_
E

f =
_
E

[f[.
Siccome E
+
h
E

h
`e una partizione di E, troviamo che [[(E)

h
[(E
+
h
)[ +

h
[(E

h
)[ =
_
E
+
[f[ +
_
E

[f[ =
_
E
[f[, che `e laltra disuguaglianza.
Osservazione 1.37 [Decomposizioni di una misura reale]
(a) Per ogni misura reale le funzioni

+
=
+[[
2
,

=
[[
2
,
sono misure positive nite, dette rispettivamente parte positiva e parte ne-
gativa di . Valgono dunque le relazioni
=
+

, [[ =
+
+

.
La prima delle due identit` a di sopra `e nota come decomposizione di Jordan.
(b) Se `e una misura reale su (X, c), posto
(E) = sup(A): A E, (E) = sup(A): A E
per ogni E c, si pu` o provare che esistono due insiemi disgiunti X
+
, X

c
tali che (E) = (E X
+
) e (E) = (E X

) per ogni E c, e che


=
+
, =

. Questa propriet`a `e nota come decomposizione di Hahn.


1.7 Singolarit`a e assoluta continuit` a di misure 33
1.7 Singolarit`a e assoluta continuit`a di misure
Denizione 1.38 Siano (X, c) uno spazio misurabile, una misura positiva e
una misura vettoriale in (X, c). Diremo che `e assolutamente continua rispetto
a e scriveremo

se
B c, (B) = 0 = [[(B) = 0.
Diremo che due misure positive
1
,
2
in (X, c) sono (mutuamente) singolari e
scriveremo

1

2
,
se esiste un insieme misurabile E tale che

1
(E) = 0 e
2
(X E) = 0.
Se
1
o
2
o entrambe sono vettoriali, allora si diranno singolari se lo sono le
rispettive variazioni totali.
Se `e una misura positiva in (X, c), diremo che `e concentrata in E c, se
(X E) = 0. Se `e vettoriale, come al solito la precedente condizione va intesa
per [[.
Direttamente dalle denizioni discende che due misure sono singolari se e solo
se sono concentrate in insiemi disgiunti, per cui due misure singolari vivono su
porzioni diverse di X.
Esempio 1.39 Consideriamo A = r
n
un sottoinsieme numerabile di R e sia
la misura di Lebesgue. Prendiamo una successione di numeri reali positivi p
n

tale che

n=1
p
n
< e deniamo =

n=1
p
n

r
n
. Si verica facilmente che .
Unutile caratterizzazione dellassoluta continuit`a `e stabilita nella seguente pro-
posizione.
Proposizione 1.40 Siano una misura vettoriale e una misura positiva in
(X, c). Sono equivalenti
(a) ,
(b) > 0 > 0 t.c. se E c e (E) < allora [[(E) < .
34 Misura e integrazione
Dim. (b)(a): Sia B c tale che (B) = 0. Se [[(B) > 0, allora esisterebbe
> 0 tale che [[(B) . Per ipotesi, in corrispondenza di troveremmo > 0
con la propriet`a che [[(E) < non appena (E) < . La scelta E = B porta ad
una contraddizione.
(a)(b): Supponiamo per assurdo che esistano > 0 ed una successione di
insiemi misurabili E
n
tali che (E
n
) < 2
n
e [[(E
n
) . Posto E =

n=0

_
j=n
E
j
,
risulta che E c e
(E) = lim
n

_

_
j=n
E
j
_
lim
n

j=n
(E
j
) lim
n

j=n
2
j
= 0,
mentre [[(E) = lim
n
[[
_

_
j=n
E
j
_
lim
n
[[(E
n
) .
Osserviamo che se la misura non `e nita, allora nella proposizione precedente
limplicazione (b)(a) continua a valere, mentre quella inversa non `e garantita.
Ad esempio, se prendiamo al posto di la misura di Lebesgue in (0, 1) e deniamo
(E) =
_
E
1
t
dt,
per ogni insieme E (0, 1) misurabile secondo Lebesgue, allora , nel senso
che (E) = 0 se (E) = 0. Tuttavia, per ogni n N linsieme E
n
= (0, 1/n) `e tale
che (E
n
) = 1/n mentre (E
n
) = +.
Vediamo adesso una classe importante di misure assolutamente continue.
Proposizione 1.41 Sia una misura positiva in (X, c) spazio misurabile e sia
f L
1
(X, ). Poniamo

f
(E) =
_
E
f d, E c.
Allora
f
`e una misura reale e [
f
[(E) =
_
E
[f[ d. In particolare,
f
`e assoluta-
mente continua rispetto a .
Dim. La prima parte dellenunciato `e conseguenza del teorema di convergenza
dominata. Verichiamo la formula relativa alla variazione totale. La diseguaglianza
segue dalla Denizione 1.34 e dalla relazione [
f
(B)[
_
B
[f[d. Viceversa, per
ogni E c possiamo considerare la partizione E = (Ef 0) (Ef < 0),
ottenendo
[
f
[(E) [
f
(E f 0)[ +[
f
(E f < 0)[ =
_
E
[f[d.
1.7 Singolarit`a e assoluta continuit` a di misure 35
Osservazione 1.42 Lasserto della proposizione precedente vale anche per f :
X R
m
, ma non si pu` o dedurre ragionando componente per componente, quindi
presentiamo per completezza la relativa dimostrazione.
Sia z
n
una successione densa in S
m1
= x R
m
: [x[ = 1. Per ogni > 0
e x X, poniamo
s(x) = minh N[ f(x), z
h
) (1 )[f(x)[.
La denizione di s(x) `e ben posta perche la densit` a della successione z
n
in S
m1
assicura che linsieme in questione sia non vuoto. Poniamo
B
n
= B s
1
(n).
Si vede che B
n
c, B
n
B
k
= se n ,= k e

nN
B
n
= B. Pertanto
(1 )
_
B
[f[ d = (1 )

n=1
_
B
n
[f[ d

n=1
_
B
n
f(x), z
n
) d
=

n=1

_
B
n
f(x) d, z
n
)

n=1

_
B
n
f(x) d

n=1
[
f
(B
n
)[ [
f
[(B).
Abbiamo cos` stabilito che
_
B
[f[ d [
f
[(B). Dato che laltra disuguaglianza `e
evidente, lasserto risulta provato.
`
E importante sapere che questa rappresenta di fatto lunico esempio di misura
assolutamente continua, come mostra il seguente risultato concernente la continuit` a
assoluta, ma anche uno dei pi` u importanti in teoria della misura.
Teorema 1.43 Siano una misura positiva e una misura vettoriale, a valori
in R
m
, denite in uno spazio misurabile (X, c). Assumiamo che sia -nita.
Allora esiste ununica coppia (
a
,
s
) di misure vettoriali, a valori in R
m
, tali che
(1.14)

a
,

s
,
=
a
+
s
.
Inoltre, esiste ununica f [L
1
(X, )]
m
tale che
a
=
f
.
36 Misura e integrazione
La coppia formata da
a
e
s
viene chiamata la decomposizione di Lebesgue di
rispetto a . Lunicit` a della decomposizione si verica facilmente, poiche se
a
1
e
s
1
`e unaltra coppia che soddisf` a alla (1.14), si ha
a
1

a
=
s
1

s
. Siccome

a
1

a
e
s
1

s
, necessariamente
a
1

a
=
s
1

s
= 0. Lesistenza della
decomposizione (1.14) `e la parte signicativa del primo punto. La seconda parte
del Teorema 1.43 `e nota sotto il nome di Teorema di Radon-Nikodym. Lunicit`a di
f `e ancora una volta immediata, mentre il punto essenziale `e lesistenza. Di fatto,
si aerma che ogni misura assolutamente continua `e del tipo
f
, per qualche f.
La funzione f si chiama derivata di Radon-Nikodym di
a
rispetto a e si indica
a volte con
d
a
d
.
Il teorema pu` o essere esteso al caso in cui `e una misura positiva -nita.
Si pu`o far vedere che lipotesi che le misure siano -nite non pu` o essere rimossa.
Per esempio, se `e la misura di Lebesgue in (0, 1) e la misura del contare in
(0, 1), allora non esiste una decomposizione di Lebesgue di rispetto a .
1.8 Misura prodotto
Siano (X, c) e (Y, T) due spazi misurabili. Per ogni E c ed F T, chia-
miamo E F rettangolo misurabile. Se e sono due misure positive su (X, c) e
(Y, T), rispettivamente, ci poniamo il problema di costruire una misura su una
-algebra opportuna di X Y con la propriet` a che
(E F) = (E)(F), E c , F T.
Individuiamo innanzitutto la -algebra adatta. Deve necessariamente contenere
i rettangoli misurabili, ma questi da soli non costituiscono una -algebra, quindi
consideriamo
c T := (E F [ E c , F T) .
La scrittura c T non indica il prodotto cartesiano tra c ed T, ma la -algebra
generata da tale prodotto. Per ogni Q c T, deniamo le sezioni di Q tramite
le seguenti espressioni
Q
x
= y Y [ (x, y) Q, x X,
Q
y
= x X [ (x, y) Q, y Y.
Lemma 1.44 Per ogni x X, y Y , Q c T risulta Q
x
T e Q
y
c.
Dim. Poniamo ( = Q c T [ Q
x
T , x X. Si vede facilmente che ( `e
una -algebra. Inoltre, se E F `e un rettangolo misurabile, allora (E F)
x
= F,
1.8 Misura prodotto 37
se x E, (EF)
x
= se x / E. In ogni caso, (EF)
x
`e misurabile in Y , per cui
( contiene i rettangoli misurabili. Allora contiene anche la -algebra generata da
questi, ossia c T. Pertanto Q
x
T, per ogni x X e Q c T. Analogamente
si dimostra che Q
y
c, per ogni y Y e Q c T.
Data una funzione f : X Y R e presi x X e y Y , deniamo le funzioni
f
x
: Y R
y f(x, y)
f
y
: X R
x f(x, y)
Lemma 1.45 Nella notazione introdotta, se f `e c T-misurabile, allora f
x
`e
T-misurabile e f
y
`e c-misurabile, per ogni x X, y Y .
Dim. Sia S
t
= [t, +]. Per ipotesi, f
1
(S
t
) c T. Per il Lemma 1.44,
(f
1
(S
t
))
x
T e (f
1
(S
t
))
y
c, per ogni x e y. Siccome (f
1
(S
t
))
x
= f
1
x
(S
t
) e
(f
1
(S
t
))
y
= f
1
y
(S
t
), la tesi `e provata.
Teorema 1.46 Siano (X, c, ) e (Y, T, ) due spazi dotati di misura positiva -
nita e sia Q c T. Allora
x (Q
x
) `e c misurabile,
y (Q
y
) `e T misurabile
e risulta
(1.15)
_
X
(Q
x
) d =
_
Y
(Q
y
) d.
Osserviamo che (Q
x
) e (Q
y
) sono ben poste grazie al Lemma 1.44. Inoltre,
siccome
(Q
x
) =
_
Y

Q
x
(y) d,
e
Q
x
(y) = (
Q
)
x
(y) =
Q
(x, y) e analogamente per (Q
y
), possiamo riscrivere
lidentit` a (1.15) nella forma
_
X
__
Y

Q
(x, y) d
_
d =
_
Y
__
X

Q
(x, y) d
_
d,
cos` da riconoscere una formula di inversione dellordine di integrazione per le
funzioni caratteristiche. Il Teorema 1.46 rappresenta il passo pi` u importante nella
costruzione della misura prodotto. Infatti, grazie a quanto stabilito nel suddetto
teorema, se (X, c, ) e (Y, T, ) sono spazi di misura positiva, -nita, per ogni
Q c T possiamo denire
(1.16) (Q) =
_
X
(Q
x
) d
_
=
_
Y
(Q
y
) d
_
.
38 Misura e integrazione
Proposizione 1.47 La funzione dinsieme denita in (1.16) `e una misura pos-
itiva -nita in c T e verica (EF) = (E)(F). Inoltre, `e lunica misura
con queste propriet`a.
Dim. Evidentemente () = 0. Se Q =

Q
n
, con Q
n
c T, disgiunti, allora
Q
x
=

(Q
n
)
x
e, dato che `e -additiva, risulta (Q
x
) =

n
((Q
n
)
x
). Per la
(1.9), possiamo scrivere
(Q) =
_
X
(Q
x
) d =
_
X

n
((Q
n
)
x
) d =

n
_
X
((Q
n
)
x
) d =

n
(Q
n
),
da cui la -additivit` a di . La dimostrazione del fatto che (E F) = (E)(F)
segue immediatamente dalla formula (1.16). Lunicit`a di tiene conto del fatto
che `e univocamente determinata sui rettangoli misurabili, che costituiscono un
sistema di generatori per c T.
La misura prende il nome di misura prodotto. A volte `e indicata con .
Il seguente teorema ora `e facile conseguenza della costruzione fatta.
Teorema 1.48 (Fubini) Siano (X, c, ) e (Y, T, ) due spazi dotati di misura
positiva -nita. Sia f : c T R una funzione c T-misurabile.
(a) Se f 0 allora le funzioni
: x
_
Y
f
x
(y) d, : y
_
X
f
y
(x) d
sono c-misurabile e T-misurabile, rispettivamente, e vale
_
X
__
Y
f(x, y) d
_
d =
_
XY
f(x, y) d =
_
Y
__
X
f(x, y) d
_
d.
(formula di riduzione)
(b) Se f `e a valori reali e se

(x) =
_
Y
[f[
x
d e
_
X

d < ,
allora f L
1
(X Y, ).
(c) Se f L
1
(X Y, ) allora f
x
L
1
(Y, ) per -q.o. x e f
y
L
1
(X, ) per
-q.o. y. Le funzioni denite in (a) sono sommabili nei rispettivi spazi e vale
ancora la formula di riduzione per f.
1.8 Misura prodotto 39
Dim. (a): Se f =
Q
, con Q c T, allora la tesi `e gi`a vericata grazie al
Teorema 1.46. Per linearit` a, essa si estende al caso delle funzioni semplici positive.
Supponiamo ora che f sia come in (a). Allora, per il teorema di approssimazione
(Teorema 1.12), esiste una successione di funzioni semplici positive s
n
che conver-
gono a f puntualmente e in modo crescente. Dato che (s
n
)
x
convergono nello stesso
modo a f
x
, per il teorema di convergenza monotona risulta che
_
Y
(s
n
)
x
(y) d
_
Y
f
x
(y) d = (x), per n ,
da cui segue che `e c-misurabile, in quanto limite di funzioni che sono a loro
volta c-misurabili grazie al passo precedente. Analogamente, `e T-misurabile.
Inne, la formula di riduzione per f `e conseguenza del fatto che le approssimanti
s
n
la vericano e si pu` o passare al limite, grazie ancora al teorema di convergenza
monotona.
(b): Segue subito applicando (a) a [f[.
(c): Sia f una funzione sommabile nello spazio prodotto. Indichiamo con
1
e

2
le funzioni che corrispondono a f
+
e f

cos` come corrisponde a f. Siccome


(a) `e vericata da f
+
, possiamo scrivere
_
X

1
(x) d =
_
XY
f
+
(x, y) d
_
XY
[f(x, y)[ d,
da cui segue che
1
L
1
(X, ). Allo stesso modo
2
L
1
(X, ). Ne segue che
per -q.o. x X,
1
(x) < e
2
(x) < . Per tali x, risulta f
x
L
1
(Y, ),
essendo f
x
= (f
+
)
x
(f

)
x
. Inoltre, per gli stessi x, (x) =
1
(x)
2
(x), per
cui L
1
(X, ). Scambiando il ruolo di x e y si ottiene lasserto relativo a f
y
e . Inne, la formula di riduzione per f si ottiene da quelle per f
+
ed f

(che
vericano (a)), sottraendo membro a membro.
Notiamo che (b) e (c) insieme implicano il seguente risultato: se f `e c
T-misurabile e se
_
X
__
Y
[f(x, y)[ d
_
d < ,
allora i due integrali iterati della formula di riduzione sono niti e coincidono.
Esempio 1.49 Siano X = Y = [0, 1] e prendiamo al posto di la misura del
contare e al posto di la misura di Lebesgue, denite nelle rispettive -algebre.
Consideriamo la funzione f =

dove = (x, y) [0, 1]


2
: x = y `e la parte
di diagonale nel quadrato unitario. Per vedere che f `e misurabile, basta provare
che `e misurabile. Per ogni n N, suddividiamo lintervallo [0, 1] in n parti
40 Misura e integrazione
uguali I
j

1jn
e consideriamo Q
n
= I
2
1
I
2
n
. Q
n
`e unione nita di rettangoli
misurabili e come tale `e misurabile nello spazio prodotto. Siccome =
n
Q
n
,
abbiamo che anche `e misurabile. Per la funzione f considerata non vale la
formula di riduzione giacche
_
1
0
f
y
(x) d = 0, per ogni y [0, 1],
e
_
1
0
f
x
(y) d = 1, per ogni x [0, 1],
per cui
_
Y
__
X
f(x, y) d
_
d = 0 ,= 1 =
_
X
__
Y
f(x, y) d
_
d.
Il problema `e dovuto al fatto che la misura non `e -nita.
Osservazione 1.50 La misura prodotto di due misure complete non `e necessaria-
mente completa.
Come applicazione del Teorema di Fubini, proviamo il seguente risultato dovuto a
Choquet.
Teorema 1.51 Sia f : X [0, +] una funzione misurabile in (X, c, ), spazio
di misura positiva e -nita. Allora
_
X
f d =
_
+
0
(x X : f(x) > t) dt,
dove, al secondo membro, compare lintegrale di Lebesgue in dimensione uno.
Dim. Applichiamo il Teorema di Fubini al prodotto della misura assegnata con
la misura di Lebesgue L
1
ristretta alla semiretta [0, +[. Posto E
t
= f > t,
otteniamo
_
X
f(x) d =
_
X
__
f(x)
0
dt
_
d =
_
X
__
+
0

E
t
(x) dt
_
d
=
_
+
0
__
X

E
t
(x) d
_
dt =
_
+
0
(E
t
) dt
=
_
X[0,+[

E
t
(x) d( L
1
) =
= ( L
1
)
_
(x, t) [ t < f(x)
_
.
Notiamo anche che luguaglianza tra il primo e lultimo membro esprime il fatto
che lintegrale di una funzione misurabile positiva non `e altro che la misura del suo
sottograco.
1.9 Formule di riduzione e cambiamento di variabili in R
n
41
1.9 Formule di riduzione e cambiamento di varia-
bili in R
n
In questo paragrafo specializziamo la teoria delle misure prodotto allo spazio
R
n
, pensato come prodotto cartesiano R
p
R
k
, con p + k = n e otteniamo, come
gi` a visto per lintegrale di Riemann, le formule di riduzione per gli integrali mul-
tipli. Queste sono una conseguenza immediata del Teorema di Fubini, e sono lo
strumento essenziale per il calcolo eettivo degli integrali multipli. Naturalmente,
in ciscuno spazio euclideo consideriamo la misura di Lebesgue della dimensione
corrispondente.
Teorema 1.52 (Formula di riduzione) Siano p, k 1 interi, n = p + k e
scriviamo x = (y, z) con y R
p
e z R
k
. Data f : R
n
R sommabile, per
m
p
-quasi ogni y R
p
la funzione z f(y, z) `e sommabile in R
k
e
y
_
R
k
f(y, z) dz
`e sommabile in R
p
. Si ha inoltre
_
R
n
f(x) dx =
_
R
p
__
R
k
f(y, z) dz
_
dy.
Analogamente, per m
k
-quasi ogni z R
k
la funzione y f(y, z) `e sommabile in
R
p
e
z
_
R
p
f(y, z) dy
`e sommabile in R
k
. Si ha inoltre
_
R
n
f(x) dx =
_
R
k
__
R
p
f(y, z) dy
_
dz.
Notiamo che in particolare si ha
_
R
p
__
R
k
f(y, z) dz
_
dy =
_
R
k
__
R
p
f(y, z) dy
_
dz.
Luguaglianza sopra `e detta formula di inversione dellordine di integrazione. For-
mule simili a quella di riduzione valgono naturalmente anche nel caso in cui la
variabile y non sia data dalle prime p componenti di x e la variabile z non sia
data dalle ultime k componenti di x.
42 Misura e integrazione
Dato E R
n
misurabile, applicando la formula di riduzione alla funzione
f =
E
otteniamo che gli insiemi
E
y
=
_
z R
k
: (y, z) E
_
_
E
z
=
_
y R
p
: (y, z) E
_
_
sono misurabili in R
k
(R
p
) per m
p
-quasi ogni y R
p
(m
k
-quasi ogni z R
k
) e
_
R
p
m
k
(E
y
) dy = m
n
(E)
__
R
k
m
p
(E
z
) dz = m
n
(E)
_
.
Nel caso dellintegrale su un insieme E R
n
, applicando il teorema precedente
alla funzione f
E
troviamo
_
R
p
__
E
y
f(y, z) dz
_
=
_
E
f(x) dx =
_
R
k
__
E
z
f(y, z) dy
_
dz.
Inne, vediamo una relazione notevole tra lintegrale di una funzione misurabile
f 0 e la misura (n + 1)-dimensionale del sottograco di f:
S
f
=
_
(x, t) R
n
R : 0 t f(x)
_
.
Teorema 1.53 (Teorema del sottograco) Sia f : R
n
[0, +) misurabile.
Allora linsieme S
f
`e misurabile in R
n+1
e
m
n+1
(S
f
) =
_
R
n
f(x) dx.
Dim. Non dimostreremo la misurabilit`a di S
f
. Usando la formula di riduzione
verichiamo luguaglianza sopra:
m
n+1
(S
f
) =
_
R
n
m
1
((S
f
)
x
) dx =
_
R
n
f(x) dx
dato che (S
f
)
x
= [0, f(x)] per ogni x R
n
.
Per funzioni di segno qualunque si ha
_
R
n
f(x) dx =
_
R
n
f
+
(x) dx
_
R
n
f

(x) dx
= m
n+1
_
S
f
+
_
m
n+1
_
S
f

_
= m
n+1
_
(x, t) R
n
R : 0 t f(x)
_
m
n+1
_
(x, t) R
n
R : f(x) t 0
_
.
purche la parte positiva o la parte negativa di f abbiano integrale nito.
Ricordiamo anche la formula di cambiamento di variabili negli integrali multipli,
che vale per lintegrale di Lebesgue nella stessa forma in cui s`e visto per lintegrale
di Riemann.
1.9 Formule di riduzione e cambiamento di variabili in R
n
43
Teorema 1.54 Siano D, E R
n
misurabili e : D E bigettiva. Supponiamo
che sia di classe C
1
in un insieme aperto contenente D. Data f : R
n
R si ha
che f `e sommabile in E se e solo se
f((x))[detJ(x)[
`e sommabile in D e vale luguaglianza
(1.17)
_
D
f((x))[detJ(x)[ dx =
_
E
f(y) dy.
Nel caso particolare f =
E
si ha
m
n
(E) = m
n
((D)) =
_
D
[detJ(x)[ dx.
Intuitivamente, la comparsa del determinante di J nel passaggio da un integrale
allaltro tiene conto di come lapplicazione dilata o contrae gli insiemi. Con-
sideriamo ad esempio E = B
1
((2, 0)) B
1
((2, 0)) R
2
, D = B
1/2
((2, 0))
B
2
((2, 0)) e una funzione tale che J = 2Id su B
1/2
((2, 0)) e J = Id/2 su
B
2
((2, 0)). Allora
m
2
(E) = + = 4m
2
_
B
1/2
((2, 0))
_
+
1
4
m
2
_
B
2
((2, 0))
_
=
_
D
[detJ[ dx.
In generale, si pu` o vericare che la formula di cambiamento di variabili vale per
funzioni lineari ; nel caso generale, dividendo un insieme D in parti molto piccole
sulle quali `e prossimo ad una funzione lineare (data dal dierenziale di ) ed
usando ladditivit` a della misura si perviene alla formula nel caso generale.
Non dimostreremo la formula di cambiamento di variabili ma la vericheremo
in due casi particolari:
(a) Supponiamo n = 1, D = [a, b], E = [c, d], di classe C
1
in D e monotona, f
continua in E. Dalla formula di cambiamento di variabili vista ad Analisi I
otteniamo
(1.18)
_
b
a
f((x))
t
(x) dx =
_
(b)
(a)
f(y) dy.
Se
t
0 allora `e crescente e (a) = c, (b) = d; si ottiene quindi
(1.19)
_
[a,b]
f((x))[
t
(x)[ dx =
_
[c,d]
f(y) dy.
Se invece
t
0 in [a, b] allora (a) = d e (b) = c; cambiando i segni ad
ambo i membri nella (1.18) otteniamo di nuovo (1.19).
44 Misura e integrazione
(b) Supponiamo che tutte le componenti di tranne una siano lidentit` a. Per
ssare le idee poniamo x = (z, y) con z R e y R
n1
e supponiamo che
(1.20) (x) = (z, y) =
_
(z, y), y
1
, . . . , y
n1
_
.
Si ha allora detJ = /z(z, y) =
t
y
(z), ove
y
(z) = (z, y). Posto
D
y
=
_
z R : (z, y) D
_
E
y
=
_
z R : (z, y) E
_
.
abbiamo anche
E
y
=
_
(z, y) : (z, y) D
_
=
y
(D
y
).
Usando allora la formula di riduzione e le relazioni scritte sopra otteniamo
_
E
f(z, y) dzdy =
_
R
n1
__
E
y
f(z, y) dz
_
dy
=
_
R
n1
__
D
y
f(
y
(z), y)[
t
y
[(z) dz
_
dy
=
_
R
n1
__
D
y
f((y, z))[detJ(y, z)[ dz
_
dy
=
_
D
f((z, y))[detJ(z, y)[ dzdy.
In generale, si dimostra che localmente ogni applicazione avente matrice jaco-
biana non singolare `e composizione di applicazioni
1
, . . . ,
n
del tipo considerato
in (1.20), quindi la (1.17) pu` o essere dedotta, almeno localmente, usando n volte
largomento nel punto 2. Si passa poi alla formula globale usando ladditivit`a della
misura. La formula di cambiamento di variabili `e cos` ricondotta a quella di una
variabile.
Tra i vari cambiamenti di variabili ricordiamo le coordinate polari in R
2
:
(, ) =
_
cos , sin
_
> 0, 0 < 2
con [detJ(, )[ = , le coordinate cilindriche in R
3
:
(, , z) =
_
cos , sin , z
_
> 0, 0 < 2, z R
con [detJ(, , z)[ = e le coordinate sferiche in R
3
:
(, , ) =
_
cos sin , sin sin , cos
_
> 0, 0 < 2, 0 < <
1.10 Integrali dipendenti da un parametro 45
con [detJ(, , )[ =
2
sin .
Pi` u in generale, si possono denire coordinate sferiche in R
n
, usando una varia-
bile lineare = [x[ come in R
3
ed n 1 variabili angolari
1
, . . . ,
n1
. Non
esponiamo i dettagli, limitandoci a segnalare che in questo caso il determinante
del cambio di variabili `e (
1
, . . . ,
n1
)
n1
, dove `e una funzione limitata delle
variabili angolari.
1.10 Integrali dipendenti da un parametro
Sia A R
m
un aperto, E R
n
un insieme misurabile e sia f(t, x) : AE R.
Supponiamo che per ogni t A la funzione x f(t, x) sia sommabile in E.
`
E
allora denita la funzione
F(t) =
_
E
f(t, x) dx t A.
Il problema che aronteremo in questo paragrafo `e quello della regolarit` a di F in
funzione di quella di f. Incominciamo dalla continuit` a:
Teorema 1.55 Supponiamo che t f(t, x) sia continua in A per m
n
-quasi ogni
x E ed esista una funzione g L
1
(E) tale che
(1.21) [f(t, x)[ g(x) t A, x E.
Allora F `e continua in A.
Dim. Grazie alla caratterizzazione del limite di funzioni tramite limiti di succes-
sioni, basta vericare la continuit` a per successioni. Sia t Ae (t
h
) Aconvergente
a t. Essendo le funzioni t f(t, x) continue per m
n
-quasi ogni x E, abbiamo
lim
h+
f(t
h
, x) = f(t, x)
per m
n
-quasi ogni x E. Dallipotesi (1.21) segue che si pu`o applicare il teorema
della convergenza dominata:
lim
h+
F(t
h
) = lim
h+
_
E
f(t
h
, x) dx =
_
E
f(t, x) dx = F(t).
46 Misura e integrazione
Esempio. Il teorema precedente pu` o essere falso se non vale la (1.7): sia A =
E = R e
f(t, x) =
_
[t[[x[
t
2
se [x[ < [t[;
0 se [x[ [t[.
Si trova allora F(t) = 1 per t ,= 0 e F(0) = 0, quindi F non `e continua.
Passiamo ora allo studio della regolarit`a C
k
. Premettiamo la seguente no-
tazione, che sar`a utile anche nel seguito. Chiamiamo multiindice un vettore di
numeri naturali, 0 incluso, cio`e N
n
0
, e per = (
1
, . . . ,
n
) deniamo la
lunghezza [[ =
1
+
2
+ . . . +
n
e poniamo per x R
n
x

= x

1
1
x

n
n
, e per
f C
k
, D

f = D

1
x
1
D

2
x
2
D

n
x
n
f.
Teorema 1.56 Supponiamo che t f(t, x) sia di classe C
k
in A per ogni x E
ed esista una funzione g L
1
(E) tale che
(1.22)

[[k
[D

f(t, x)[ g(x) t A, x E.


Allora F `e di classe C
k
in A e
D

F(t) =
_
E
D

f(t, x) dx t A, [[ k.
Dim. La dimostrazione si pu` o fare per induzione su k. Limitiamoci al caso k = 1:
sia i 1, . . . , m e verichiamo che
(1.23) D
i
F(t) =
_
E
D
i
f(t, x) dx t A.
Si osservi che se vale la (1.23) allora D
i
F `e continua in A per il teorema precedente.
Fissato t A ed una successione (r
h
) R 0 tendente a zero osserviamo che
F(t + r
h
e
i
) F(t)
r
h
=
_
E
f(t + r
h
e
i
, x) f(t, x)
r
h
dx.
Fissato un x E, per il teorema di Lagrange esistono s
h
(x) compresi tra 0 e r
h
tali che
f(t + r
h
e
i
, x) f(t, x)
r
h
= D
i
f(t + s
h
(x), x).
Passando al limite in h si ha
lim
h+
f(t + r
h
e
i
, x) f(t, x)
r
h
= D
i
f(t, x).
1.10 Integrali dipendenti da un parametro 47
Inoltre, usando la (1.22) otteniamo

f(t + r
h
e
i
, x) f(t, x)
r
h

= [D
i
f(t + s
h
(x), x)[ g(x),
quindi il teorema della convergenza dominata implica
lim
h+
F(t + r
h
e
i
) F(t)
r
h
= lim
h+
_
E
f(t + r
h
e
i
, x) f(t, x)
r
h
dx
=
_
E
D
i
f(t, x) dx.
Essendo la successione r
h
arbitraria, la funzione F ha derivata parziale i-esima in
t e vale la (1.23).
Il teorema sopra continua a valere se si suppone solamente che t f(t, x) `e di
classe C
k
in A per m
n
-quasi ogni x E.
In tal caso la funzione D

f(t, x), il cui integrale su E d` a D

F(t), `e denita in
modo arbitrario nellinsieme trascurabile degli x E tali che t f(t, x) non `e C
k
.
Esempi Vediamo quali formule si ottengono nel caso che anche linsieme di in-
tegrazione dipenda da t.
1. Nel caso m = n = 1 possiamo considerare:
F(t) =
_
(t)
(t)
f(t, x) dx.
Allora F(t) = G(t, (t), (t)) con
G(t, u, v) =
_
v
u
f(t, x) dx.
Se f `e continua nelle variabili (t, x) e C
1
nella variabile t abbiamo (si usa il teorema
fondamentale del calcolo integrale)
G
t
(t, u, v) =
_
v
u
f
t
(t, x) dx
G
u
(t, u, v) = f(t, u)
G
v
(t, u, v) = f(t, v)
quindi dal teorema di derivazione della funzione composta otteniamo
F
t
(t) = G
t
(t, (t), (t)) + G
u
(t, (t), (t))
t
(t) + G
v
(t, (t), (t))
t
(t)
=
_
(t)
(t)
f
t
(t, x) dx +
t
(t)f(t, (t))
t
(t)f(t, (t)).
48 Misura e integrazione
2. Nel caso m = 1, n > 1, consideriamo una famiglia di aperti E(t) = < t,
dove : R
n
R `e una funzione di classe C
1
con ,= 0 ovunque. In tal caso,
E(t) = = t per ogni t e, posto per f C
1
(R R
n
)
F(t) =
_
E(t)
f(t, x)dx,
si ha
F
t
(t) =
_
E(t)
f
t
(t, x)dx +
_
=t
f(t, x)
[(x)[
d,
dove d `e una misura (n1)-dimensionale (il caso n = 3 degli integrali superciali
`e stato studiato in dettaglio nel corso di Analisi Matematica II). Qui non scendiamo
in ulteriori dettagli, ma ci limitiamo ad esaminare il caso particolare in cui (x) =
[x x
0
[ ed E(t) = B
t
(x
0
) `e una famiglia di palle concentriche il cui raggio cresce
linearmente. In questo caso la formula precedente si riduce a
d
dt
_
B
t
(x
0
)
f(t, x)dx =
_
B
t
(x
0
)
f
t
(t, x)dx +
_
B
t
(x
0
)
f(t, x)d.
3. La funzione di Eulero. La funzione denita dallintegrale
(1.24) (z) =
_

0
t
z1
e
t
dt, z > 0,
si dice funzione di Eulero.
`
E facile vedere che lintegrale `e convergente: infatti,
per t 0 la funzione integranda `e innita di ordine minore di 1 e quindi `e somma-
bile in ]0, 1] ed inoltre per ogni z > 0 esiste C > 0 tale che t
z1
e
t/2
C in [1, +[,
sicche la funzione integranda `e maggiorata da Ce
t/2
ed `e sommabile in [1, +[.
In realt` a si pu` o dimostrare che la funzione `e analitica reale, quindi si estende
anche ai valori complessi di z (questa `e la ragione per cui abbiamo indicato con z
la variabile), presentando in campo complesso dei poli nei punti n, n N (0
incluso). Qui ci limiteremo a considerare in campo reale.
La funzione gode di molte propriet`a che la rendono utile in vari calcoli. La
prima relazione interessante `e la seguente:
(1.25) (1) =
_

0
e
t
dt = 1, (z + 1) = z(z).
Infatti, integrando per parti e tenendo conto che i termini di bordo si annullano,
si ha
(z + 1) =
_

0
t
z
e
t
dt =
_
t
z
e
t
_

0
+ z
_

0
t
z1
e
t
dt = z(z).
1.10 Integrali dipendenti da un parametro 49
Da (1.25) segue che (n + 1) = n! per ogni n N, quindi la funzione estende
ai numeri reali positivi il fattoriale di un numero naturale. Calcolando la derivata
di e studiando lequazione dierenziale da essa risolta si deduce la formula di
Stirling che in particolare d` a unidea precisa dellordine di grandezza del fattoriale
per n :
(1.26) (z) =

2z
z+1/2
e
z
e
J(z)
,
con J(z) 0 per z +. La (1.26), per z = n N, si pu`o dimostrare in modo
molto semplice nella forma n! = n
n
n
1/2
e
n
, cio`e senza calcolare la costante .
Supponiamo noto che
n

k=1
1
k
= log(n + 1) + c
n
con c
n
0 per n (questo segue per confronto con lintegrale
_
n
0
1
1+x
dx)
e ricordiamo che per la formula di Taylor con il resto di Lagrange applicata alla
funzione f(x) = log(1 + x) si ha
log(1 + x) = x
1
2
x
2
+ D
3
f()x
3
, [[ [x[,
per x 0. Scrivendo la formula precedente per x =
1
k
, k N, si deduce
log
_
1 +
1
k
_
=
1
k

1
2
1
k
2
+ r
k
con [r
k
[ ck
3
. Posto allora
0
= 1,
n
=
n
n
n!
, risulta

n+1

n
=
_
1 +
1
n
_
n
,
da cui, posto
n
= log
n
,

n
=
n

k=1

k

k1
=
n1

k=1
log
__
1 +
1
k
_
k
_
=
n1

k=1
k
_
1
k

1
2k
2
+ r
k
)
_
= n
1
2
(log n + c
n
) + d
n
,
con d
n
=

k
r
k
d per n . Segue
n
= e

n
= e
n
n
1/2

n
con
n
= e
d
n
c
n
/2

1
< con > 0 e da qui (1.26).
Vediamo altre propriet` a della . Osserviamo che posto t = s
2
/2 si ha
(1.27) (z) = 2
1z
_

0
s
2z1
e
s
2
/2
ds,
50 Misura e integrazione
da cui
(z)(w) = 2
2zw
_

0
s
2z1
e
s
2
/2
ds
_

0
t
2w1
e
t
2
/2
dt.
Il prodotto degli integrali si pu` o interpretare come un integrale doppio sul qua-
drante Q = (s, t) : s > 0, t > 0, che espresso in coordinate polari fornisce:
(z)(w) = 2
2zw
_
Q
s
2z1
t
2w1
e
s
2
/2t
2
/2
dsdt
= 2
2zw
_

0

(z+w)1
e

2
/2
d
_
/2
0
(cos )
2z1
(sin )
2w1
d.
Da (1.27) il primo integrale al secondo membro `e 2
z+w1
(z + w), quindi se
deniamo la funzione beta di Eulero ponendo
(1.28) B(z, w) = 2
_
/2
0
(cos )
2z1
(sin )
2w1
d
(la B `e la lettera greca maiuscola), otteniamo la formula
(z)(w) = B(z, w)(z + w).
In particolare, per z = w = 1/2 si ottiene B(
1
2
,
1
2
) = e (
1
2
) =

. La funzione B
si pu` o esprimere anche in un altro modo, con il semplice cambiamento di variabile
= cos
2
:
B(z, w) =
_
1
0

z1
(1 )
w1
d.
1.11 Prodotto di convoluzione
Siano f e g funzioni misurabili in R
n
. Il prodotto di convoluzione f g `e denito
(formalmente) dalla formula
f g(x) :=
_
R
n
f(x y)g(y) dy,
tutte le volte che lintegrale converge. Col cambiamento di variabile x y = y
t
si vede facilmente che il prodotto di convoluzione `e commutativo. Diamo ora
condizioni anche il prodotto di convoluzione di due funzioni sia ben denito.
Teorema 1.57 Se f appartiene a L
p
(R
n
) con p = 1 o p = 2 e g L
1
(R
n
) allora il
prodotto di convoluzione `e denito per m
n
-quasi ogni x R
n
, appartiene a L
p
(R
n
)
e
(1.29) |f g|
L
p
(R
n
)
|f|
L
p
(R
n
)
|g|
L
1
(R
n
)
.
1.11 Convoluzione 51
Inoltre, se f C

(R
n
) `e tale che D

f L
1
(R
n
) per ogni N
n
0
allora f g
C

(R
n
) e
D

(f g) = (D

f) g per ogni multiindice .


Dim. Per quanto riguarda lappartenenza di f g a L
p
(R
n
) e la (1.29) nel caso
p = 1, basta osservare che
_
R
n

_
R
n
f(x y)g(y) dy

dx
_
R
n
_
R
n
[f(x y)g(y)[ dy dx
=
_
R
n
_
R
n
[f(x y)g(y)[ dx dy = |f|
1
_
R
n
[g(y)[ dy = |f|
1
|g|
1
,
dove abbiamo applicato il teorema di Fubini ed abbiamo tenuto conto che lintegrale
in R
n
di f(x y) rispetto ad x non dipende da y. Nel caso p = 2 il discorso `e
simile: si pu` o porre g nella forma g = g
1/2
g
1/2
, e dalla diseguaglianza di Cauchy-
Schwarz (Proposizione 4.3), che sar`a discussa in generale nel Capitolo 4, si ottiene
dapprima:
_
R
n
[f(x y)[ [g(y)[
1/2
[g(y)[
1/2
dy |g|
1/2
L
1
(R
n
)
_
_
R
n
[f(x y)[
2
[g(y)[ dy
_
1/2
e poi
_
R
n

_
R
n
f(x y)g(y) dy

2
dx
_
R
n
__
R
n
[f(x y)g(y)[ dy
_
2
dx
|g|
L
1
(R
n
)
_
R
n
_
R
n
[f(x y)[
2
[g(y)[ dx dy
= |g|
2
L
1
(R
n
)
|f|
2
L
2
(R
n
)
e la (1.29) segue prendendo le radici quadrate di ambo i membri ed osservando che
_
R
n
[f(x y)g(y)[ dy
`e nito per m
n
-quasi ogni x ed `e maggiore di f g(x).
Inne, la derivabilit`a di f g e la commutazione della derivata col prodotto
di convoluzione seguono direttamente dierenziando sotto il segno di integrale e
applicando il Teorema 1.56.
Denizione 1.58 [Supporto di una funzione continua] Per f : R
n
R con-
tinua, deniamo il supporto di f, denotato supp f, come la chiusura dellinsieme
x : f(x) ,= 0.
52 Misura e integrazione
Se f : R
n
R non `e continua ma solo misurabile, questa nozione di
supporto non `e signicativa. Infatti si possono avere funzioni che dieriscono solo
un insieme che ha misura nulla ma chiusura molto grande. Per esempio, la funzione
che vale 1 su Q e 0 in R Q coincide con la funzione identicamente nulla e quindi
`e ad essa equivalente agli eetti della teoria dellintegrazione, ma ha supporto R,
l` a dove la funzione nulla ha supporto vuoto. Per questo di d` a una denizione
dierente di supporto per le funzioni misurabili. Ovviamente, se f `e continua le
due nozioni coincidono.
Denizione 1.59 [Supporto di una funzione misurabile]
Per f : R
n
R misurabile, deniamo il supporto di f, denotato ancora
supp f, come il complementare dellinsieme dei punti x
0
di che godono della
seguente propriet`a: esiste un intorno B

(x
0
) di x
0
tale che f(x) = 0 per quasi ogni
x B

(x
0
).
Introduciamo ore un altro spazio funzionale di grande utilit`a; per R
n
aperto, poniamo
(1.30) C

c
() =
_
f C

() : supp f
_
,
dove K signica che K `e un insieme chiuso e limitato contenuto in ; in par-
ticolare, questo vuol dire che c`e una distanza non nulla tra K e il complementare
di , ossia, in termini delle funzioni di C

c
(), che esse si annullano in un intorno
della frontiera di .
Osservazione 1.60 Come esempi di funzioni f nel teorema 1.57 possiamo con-
siderare funzioni in C

c
(R
n
) oppure la funzione gaussiana f(x) = exp[x[
2
.
`
E
facile vericare che per ogni N
n
la sua derivata `e della forma P

(x)f(x) con
P

polinomio, e quindi appartiene ad L


1
(R).
Osservazione 1.61 Ragionando come nel Teorema 1.57 si verica che il prodotto
di convoluzione `e anche associativo:
f (g h) = (f g) h f, g, h L
1
(R
n
).
1.11 Convoluzione 53
Infatti, risulta
f (g h)(x) =
_
R
n
f(x y)
_
_
R
n
g(y z)h(z)dz
_
dy
=
_
R
n
_
_
R
n
f(x y)g(y z)dy
_
h(z)dz
=
_
R
n
_
_
R
n
f(t)g(x z t)dt
_
h(z)dz
=
_
R
n
(f g)(x z)h(z)dz = (f g) h(x).
Come prima applicazione del concetto di convoluzione vediamo un metodo che
consente di approssimare funzioni L
p
(p = 1, 2) con funzioni regolari. Diremo che
una funzione C

(R
n
) `e un nucleo di convoluzione se `e non negativa, pari, il
suo integrale vale 1 ed il suo supporto `e contenuto in B
1
(0), vale a dire, (x) = 0
per [x[ > 1. Dato un nucleo di convoluzione , le funzioni

(x) :=
n

_
x

_
> 0
sono una famiglia di funzioni regolarizzanti (o anche mollicatori). Osserviamo
che le funzioni

sono non negative, pari, hanno supporto contenuto in B

(0) e
integrale uguale a 1. Un esempio di nucleo di convoluzione `e la funzione radiale
(1.31) (x) :=
_
ce
1
|x|
2
1
se [x[ < 1;
0 se [x[ 1.
, c tale che
_
R
n
(x) dx = 1
Dato un nucleo di convoluzione le funzioni f

sono dette funzioni regolarizzate


di f. Il nome viene dal fatto che f

(R
n
) per il teorema precedente. Vale
anche il
Teorema 1.62 Sia p = 1 o 2. Per ogni funzione f L
p
(R
n
) le funzioni regolariz-
zate f

:= f

convergono a f in L
p
(R
n
) e m
n
-quasi ovunque in E per 0. In
particolare, per ogni insieme aperto E di R
n
, lo spazio C

(E) `e denso in L
p
(E),
vale a dire, ogni funzione di L
p
(E) pu`o essere approssimata in L
p
(E) da funzioni
in C

(E) con precisione arbitraria.


Notiamo che con un cambiamento di variabili si ottiene
f

(x) =
_
R
n
f(x y)

(y) dy =
_
R
n
f(x y)(y) dy =
_
B
1
(0)
f(x y)(y) dy.
Possiamo quindi rappresentare il valore f

(x) come una media (rispetto alla


misura di probabilit` a indotta da ) dei valori di f nella palla B

(x). Usando
questa caratterizzazione `e facile vedere che f

(x) converge a f(x) in ogni punto


di continuit` a di f.
Capitolo 2
Teoria delle distribuzioni
La teoria delle distribuzioni inizia con S.L. Sobolev nel 1936, ma riceve piena for-
mulazione ad opera di L.Schwartz (1950); oggi costituisce un capitolo fondamentale
dellanalisi funzionale. Il concetto di distribuzione generalizza quello di funzione in
molte situazioni in cui viene meno la regolarit`a della funzione in questione, soprat-
tutto, come vedremo, nella derivazione. Esempi di distribuzioni sono le funzioni
impulsive, molto usate nellelettromagnetismo, nella meccanica quantistica, ancor
prima che ne venisse data unopportuna interpretazione matematica.
2.1 Denizioni ed esempi
Sia un aperto di R
n
. Ricordiamo che C

c
() `e linsieme delle funzioni f, reali
o complesse, di classe C

e a supporto
1
compatto contenuto in . Nellambito della
teoria delle distribuzioni, si conviene di porre
D() = C

c
().
Chiameremo gli elementi di D() funzioni test. Con le usuali operazioni di somma
e prodotto per uno scalare, D() `e uno spazio vettoriale. Osserviamo che esso `e
chiuso rispetto alloperazione di derivazione. Se f D(), poniamo come in (1.2)
|f|
L

()
= sup
x
[f(x)[.
Un esempio classico di funzione test `e dato dalla funzione in (1.31) che ricordiamo
(2.1) (x) =
_
e
1
|x|
2
1
se [x[ < 1,
0 se [x[ 1.
1
suppf = x [ f(x) ,= 0.
55
56 Teoria delle distribuzioni
Diamoora la denizione di limite in D(), tenendo conto delle propriet` a peculiari
dei suoi elementi.
Denizione 2.1 Siano
h
, D(). Diremo che
h
converge a in D() se
valgono le seguenti due condizioni:
a. esiste un compatto K tale che supp
h
K, per ogni h N;
b. per ogni multiindice N
n
0
, risulta lim
h
|D

h
D

|
L

(K)
= 0.
Osserviamo che sulla base della denizione appena data, se
h
in D(), allora
D

h
D

in D(), per ogni N


n
0
.
Esempio 2.2 Prendiamo n = 1, = R. Sia D(R) la funzione data in (2.1)
e deniamo
h
(x) = e
k
(x) sin(kx). Proviamo che
k
0 in D(R). Si vede
facilmente che supp
k
supp . Inoltre, per ogni k N, risulta
D
n

k
(x) = e
k
n

j=0
_
n
j
_
D
j
(x) D
nj
sin(kx),
per cui
|D
n

k
|
L

(R)
e
k
n

j=0
_
n
j
_
k
nj
|D
j
|

0.
Osserviamo che se al posto di e
k
avessimo scelto k
q
, con q intero positivo, allora

k
0 in D(R), in quanto |D
q

k
|
L

(R)
0.
Denizione 2.3 Sia T un funzionale lineare su D(). Diremo che T `e una dis-
tribuzione se T `e continuo rispetto alla convergenza denita, ossia se per ogni
successione
k
0 in D(), risulta T(
k
) 0.
Siccome T `e lineare, `e suciente considerare il caso in cui la funzione limite `e 0.
Notiamo che il termine funzionale viene usato per il fatto che T `e denito in uno
spazio di funzioni. Lanalisi funzionale suggerisce anche la seguente notazione:
D
t
() = lo spazio delle distribuzioni in (ossia il duale topologico di D());
T, ) = il valore di T sull
t
elemento D().
D
t
() `e uno spazio vettoriale con le operazioni naturali di somma e prodotto per
uno scalare. Per vericare se un dato funzionale lineare in D() denisce una
distribuzione, pu`o essere utile conoscere la seguente caratterizzazione.
2.1 Denizioni ed esempi 57
Proposizione 2.4 Sia T un funzionale lineare in D(). Sono equivalenti:
(i) T D
t
();
(ii) per ogni compatto K , esistono C > 0 e j N
0
(che dipendono da K),
tali che
(2.2) [T, )[ C

[[j
sup
xK
[D

(x)[,
per ogni D(K).
La seconda condizione esprime il fatto che una distribuzione, localmente, agisce
solo su un numero nito di derivate.
Denizione 2.5 Se nella (2.2) la scelta di j `e indipendente dal compatto K, allora
la distribuzione T si dice di ordine nito, e si denisce ordine di T il minimo intero
per cui vale (2.2).
Esempi 2.6
1. Sia u L
1
loc
() una funzione localmente sommabile secondo Lebesgue. De-
niamo la distribuzione T
u
ponendo
(2.3) T
u
, ) =
_

u(x)(x)dx, D().
Osserviamo che T
u
`e ben posta, perche ha supporto compatto ed `e limitata
e u `e sommabile su ogni compatto. Inoltre T
u
`e lineare, dato che linte-
grale `e lineare, ed `e continuo, come si verica facilmente usando diretta-
mente la denizione o tramite la Proposizione 2.4. Pertanto T
u
D
t
(). In
particolare, T
u
`e una distribuzione di ordine zero.
Notiamo che la corrispondenza u T
u
`e iniettiva, cio`e se u
1
, u
2
sono due
funzioni in L
1
loc
() che individuano, tramite la (2.3), la stessa distribuzione,
allora u
1
= u
2
q.o.
`
E possibile cos` identicare u con T
u
e, di conseguenza,
L
1
loc
() con un sottospazio di D(). Dunque, le distribuzioni sono funzioni
generalizzate.
2. Sia x
0
. Deniamo
x
0
come segue
(2.4)
x
0
, ) = (x
0
), D().
58 Teoria delle distribuzioni
Anche stavolta, `e facile vedere che
x
0
`e una distribuzione di ordine zero,
chiamata delta di Dirac di polo x
0
. Se x
0
= 0, poniamo semplicemente al
posto di
0
.
`
E signicativo vedere che

x
0
/ L
1
loc
(),
per cui linclusione L
1
loc
() D() `e stretta. Infatti, se esistesse u L
1
loc
()
tale che
x
0
, ) =
_

u(x)(x)dx, per ogni D(), allora si avrebbe


_

u(x)(x)dx = 0, se x
0
/ supp . Ci`o implica che u = 0 q.o. in x
0
e
quindi, dato che x
0
ha misura nulla, u = 0 q.o. in . Ci` o `e assurdo, perche

x
0
,= 0.
2. La (2.4) si pu` o interpretare come lintegrale di rispetto alla misura di Dirac

x
0
denita nellEsempio 1.7(2). Pi` u in generale, ad ogni misura nita sui
compatti si pu` o associare la distribuzione T

denita da
(2.5) T

, ) =
_

d, D().
Questa formula contiene entrambi gli esempi precedenti come casi particolari.
3. Prendiamo = I = (0, 1) e deniamo T, ) =

j=2
D
j

_
1
j
_
. La denizione
`e ben posta, perche per ogni D(I), la somma che denisce T, ) `e nita.
T `e lineare. Per provare che T `e continuo usiamo la Proposizione 2.4. Sia K
un compatto contenuto in I. Sia N il minimo intero tale che 1/j / K
per ogni j . Se D(K), allora [T, )[
1

j=2
|D
j
|
L

(K)
, da cui la
tesi. Notare che dipende da K, per cui, in questo caso, la distribuzione ha
ordine innito.
4.
`
E noto che la funzione f(x) = 1/x, x ,= 0, non `e sommabile in alcun intorno
dellorigine, e non `e neanche integrabile in senso generalizzato secondo la teo-
ria dellintegrale di Riemann; infatti, il limite che dovrebbe denire lintegrale
generalizzato di f
lim
0,0
_

1
1
x
dx +
_
1

1
x
dx
non esiste. Pertanto, non si pu` o associare ad f una distribuzione su R come
si `e fatto nellEsempio 2.6 con le funzioni L
1
loc
. Si pu`o per`o associare ad f
2.2 Successioni e serie di distribuzioni 59
una distribuzione osservando che seguente limite esiste per ogni c R e per
ogni M > 0:
(2.6) lim
0
_

M
c
x
dx +
_
M

c
x
dx = 0.
Presa allora una qualunque funzione test , deniamo la distribuzione PV
1
x
ponendo
PV
1
x
, ) = lim
0
_

(x)
x
dx +
_

(x)
x
dx.
Il limite esiste per ogni T(R). Infatti si ha
lim
x0
(x) (0)
x
=
t
(0)
e quindi, usando la (2.6) con c = (0) ed M tale che supp [M, M], il
limite
lim
0
_
<[x[<M
(x)
x
dx = lim
0
_
<[x[<M
(x) (0)
x
dx
esiste perche in un intorno di 0 la funzione integranda `e continua. A dierenza
dalle funzioni L
1
loc
per`o, la distribuzione PV
1
x
`e di ordine 1 e non di ordine
0.
Deniamo il prodotto Tf tra una distribuzione T D
t
() ed una funzione f
di classe C

in mediante la formula
(2.7) Tf, ) = T, f), D().
Siccome f C

(), il prodotto f D(), per cui la denizione appena data `e


ben posta. In particolare, se T = allora f = f(0), come `e immediato vericare.
2.2 Successioni e serie di distribuzioni
Denizione 2.7 Siano T
n
, T D
t
(). Diremo che T
n
converge a T nel senso
delle distribuzioni se lim
n
T
n
, ) = T, ), per ogni D().
In particolare, una successione di funzioni (f
n
) L
1
loc
() converge ad una dis-
tribuzione T, se lim
n
_

f
n
(x)(x)dx = T, ), per ogni D(). Il fatto di
considerare il limite puntuale della successione non aiuta, giacche in generale il
limite nel senso delle distribuzioni non `e pi` u una funzione in generale. Tuttavia,
se f
n
converge ad una funzione f puntualmente ed esiste una funzione g L
1
loc
()
tale che [f
n
(x)[ g(x), per quasi ogni x, allora f
n
converge a f anche in D
t
().
60 Teoria delle distribuzioni
Esempio 2.8 Sia la funzione test denita in (2.1), normalizzata, e sia
n
(x) =
n(nx). Vogliamo provare che lim
n

n
= in D
t
(R). Tenendo conto del fatto che
_
R

n
= 1, abbiamo
_
R

n
(x)(x)dx(0) =
_
R

n
(x)
_
(x)(0)
_
dx =
_
1/n
1/n
n(nx)
_
(x)(0)
_
dx.
Poniamo
n
= max
x[1/n,1/n]
[(x) (0)[. Cos` , risulta

_
R

n
(x)(x)dx (0)


n
_
1/n
1/n
n(nx)dx =
n
0,
grazie alla continuit` a di . Questo esempio chiarisce la natura di come funzione
impulsiva e conferma il fatto che essa non `e propriamente una funzione. Infatti,
avremmo (x) = 0, per ogni x ,= 0, (0) = + ma
_
R
= 1.
Analogamente, si pu`o provare che lim
n
f
n
= in D
t
(R), dove
f
n
(x) =
_
n se [x[
1
2n
0 se [x[ >
1
2n
Alla denizione di limite di una successione in D
t
() si associa, in modo naturale,
quella di serie di distribuzioni.
Denizione 2.9 Se T
n
, T D
t
(), diremo che

n=1
T
n
= T in D
t
(), se accade
che lim
n
n

k=1
T
k
= T in D
t
().
Osservazione 2.10 La denizione del prodotto tra una distribuzione e una fun-
zione C

data in precedenza non `e casuale. Essa `e unoperazione continua nel


senso che se T
n
T in D
t
(), allora T
n
f Tf in D
t
().
2.3 Derivazione
Uno dei principali vantaggi oerti dalla teoria delle distribuzioni concerne la
derivazione. Vedremo che le distribuzioni sono derivabili innite volte e che basta
sapere che una successione di distribuzioni converge, per avere la convergenza di
tutte le derivate. Ci`o spiega il motivo per cui le distribuzioni sono largamente
impiegate nella risoluzione di equazioni dierenziali.
2.3 Derivazione 61
Prima di dare la denizione di derivata di una distribuzione, vediamo un es-
empio che chiarisce ancora una volta il ruolo delle distribuzioni come funzioni
generalizzate. Sia f C
1
(R). Allora per ogni D(R) risulta
_
R
f(x)
t
(x)dx =
_
R
f
t
(x)(x)dx,
grazie alla formula di integrazione per parti.
Denizione 2.11 Siano T D
t
() e N
n
0
. Deniamo
(2.8) D

T, ) = (1)
[[
T, D

),
derivata di T.
Notiamo che, in eetti, lidentit` a (2.8) generalizza la formula di integrazione per
parti per le funzioni regolari. Pertanto, se f C
1
(), derivate classiche e dis-
tribuzionali coincidono. In realt` a, ci` o continua ad essere vero anche sotto con-
dizioni di minore regolarit` a. Per esempio, se f C
1
(R 0) e la derivata prima
`e localmente sommabile, allora la formula (2.8) `e ancora vericata dalla derivata
classica.
Dalla denizione discende subito che D

T `e ancora una distribuzione. Perci` o,


`e possibile iterare la derivazione e di fatto ogni distribuzione pu`o essere derivata
innite volte. In particolare, una funzione localmente sommabile `e derivabile in-
nite volte nel senso delle distribuzioni. Non `e detto, per`o, che le derivate siano
ancora funzioni localmente sommabili.
Osservazione 2.12 Osserviamo che loperazione di derivazione `e continua rispet-
to alla convergenza in D
t
(), cio`e se lim
n
T
n
= T, allora per ogni multiindice
anche lim
n
D

T
n
= D

T in D
t
(). Un risultato analogo pu` o essere enunciato per
la derivata di una serie di distribuzioni.
Queste propriet` a non hanno riscontro nellambito delle funzioni e costituiscono
un valido argomento a favore della teoria delle distribuzioni.
Osservazione 2.13 Calcoliamo una derivata prima del prodotto Tf. Se
D(), risulta
D
i
(Tf), ) = Tf, D
i
) = T, fD
i
) = T, D
i
(f)) +T, (D
i
f))
= (D
i
T)f + TD
i
f, ),
62 Teoria delle distribuzioni
cio`e
D
i
(Tf) = (D
i
T)f + TD
i
f.
Ritroviamo cos` lusuale regola di derivazione di un prodotto (che vale per f C
1
).
Tale regola pu`o essere estesa alle derivate di ordine superiore (richiedendo la giusta
regolarit` a ad f) e d` a luogo alla formula di Leibniz in D
t
().
Esempio 2.14 Consideriamo la funzione di Heaviside
H(x) =
_
1 se x > 0,
0 se x < 0.
Siccome H L
1
loc
(R), H D(R). Calcoliamo H
t
. Per ogni D(R), risulta
H,
t
) =
_

0

t
(x)dx = (0) = , ),
pertanto H
t
= / L
1
loc
(R). Questo risultato si pu`o interpretare dicendo che H `e
una soluzione (discontinua) dellequazione dierenziale T
t
= .
Esempio 2.15 Calcoliamo la derivata della distribuzione T
f
associata alla fun-
zione f : (a, b) R R regolare a tratti, cio`e tale che esistono punti a = t
0
<
t
1
< < t
N
e funzioni f
h
C
1
([t
h1
, t
h
]) tali da avere
f(t) =
N

h=1
f
h
(t)
(t
h1
,t
h
)
(t)
(notiamo che il valore di f nei punti t
h
`e irrilevante). Usando la regola di derivazione
del prodotto presentata nellOsservazione 2.13, otteniamo
DT
f
(t) =
N

h=1
f
t
h
(t)
(t
h1
,t
h
)
(t) +
N

h=1
[f
h+1
(t
h
) f
h
(t
h
)]
t
h
.
Nella formula precedente si riconosce nella prima sommatoria quella che possiamo
chiamare parte classica della derivata distribuzionale di f e nella seconda la parte
propriamente distribuzionale, che consiste di delta di Dirac nei punti di salto t
h
,
pesate con lampiezza dei salti stessi, data dalla dierenza tra il limite destro
f
h+1
(t
h
) e il limite sinistro f
h
(t
h
).
Esempio 2.16 Calcoliamo la derivata nel senso delle distribuzioni della funzione
g(x) = log [x[, x ,= 0; questa `e L
1
loc
(R) e quindi denisce una distribuzione T
g
.
2.3 Derivazione 63
Otteniamo:
T
t
g
, ) = T
g
,
t
) =
_

log [x[
t
(x)dx
= lim
0
_

log [x[
t
(x)dx +
_

log [x[
t
(x)dx
= lim
0
_

(x)
x
dx +
_

(x)
x
dx + log (() ())
= PV
1
x
, ),
dal momento che
lim
0
log (() ()) = lim
0
log
() ()

= 0.
Perci` o T
t
g
= PV
1
x
, dove PV
1
x
`e la distribuzione denita nellEsempio 2.6.4.
Esempio 2.17 Sia u(x) = 1/[x[, x R
3
0. Calcoliamo u nel senso delle
distribuzioni. Sia D(R
3
) e sia R > 0 grande abbastanza anche supp
B
R
(0). Osserviamo che
u, ) = u, ) = lim
0
_
B
R
(0)\B

(0)
u(x)(x)dx.
Dato che u `e di classe C

in R
3
0, integrando per parti come spiegato nellAp-
pendice A.4, risulta
_
B
R
(0)\B

(0)
u(x)(x)dx =
_
B
R
(0)\B

(0)
(u)(x)(x)dx
+
_
B

(0)
u(x)(x) (x)d

_
B

(0)
u(x) (x)(x)d
dove (x) `e la normale esterna unitaria al dominio di integrazione, quindi (x) =
x/. Con un semplice calcolo si vede che u(x) = x/[x[
3
e u(x) = 0, se
x ,= 0. Quindi, il primo integrale `e zero. Poi

_
B

(0)
u(x)(x) (x)d

||
L

(R
3
)
[B

(0)[

= ||
L

(R
3
)
4 0
64 Teoria delle distribuzioni
per 0, e
_
B

(0)
u(x) (x)(x)d =
1

2
_
B

(0)
(x)d
= 4
_
B

(0)
(x)d 4(0), se 0.
In denitiva, abbiamo provato che
1
4[x[
= .
Esempio 2.18 Procediamo come nellesempio precedente per calcolare u (nel
senso delle distribuzioni) con u(x) = log [x[ in R
2
. Risulta u(x) = 0 per x ,= 0 e
u, ) = u, ) = lim
0
_
B
R
(0)\B

(0)
u(x)(x)dx
lim
0
_
_
B

(0)
u(x)(x) (x)d
_
B

(0)
u(x) (x)(x)d
_
= 2(0).
Infatti,

_
B

(0)
u(x)(x) (x)d

[ log [||
L

(R
2
)
0,

_
B

(0)
u(x) (x)(x)d =
1

_
B

(0)
(x) d 2(0).
Segue che u = 2.
Gli esempi appena svolti rientrano in una teoria molto generale nello studio
delle equazioni dierenziali lineari a coecienti costanti e costituiscono il calcolo
della cosiddetta soluzione fondamentale delloperatore in R
3
ed R
2
. Questo
punto sar` a spiegato meglio dopo aver parlato di convoluzione con distribuzioni,
nellosservazione 2.26.
2.4 Supporto e convoluzione
Abbiamo visto che cosa si intende per supporto di una funzione continua (Deni-
zione 1.58) e di una funzione misurabile (Denizione 1.59). Questultima si estende
alle distribuzioni come segue.
Denizione 2.19 Sia T D
t
(). Diciamo che un punto x
0
non appartiene
al supporto supp T di T quando esiste un esiste un intorno B

(x
0
) di x
0
tale che
T, ) = 0 per ogni D() con supp B

(x
0
).
2.4 Supporto e convoluzione 65
Esempio 2.20 Il supporto di `e 0.
Linsieme supp T `e chiuso in . Inoltre, se supp T `e non vuoto e D()
ha supporto contenuto in supp T allora T, ) = 0. In realt`a, supp T `e il pi` u
piccolo chiuso tale che T, ) = 0, per ogni D(), tale che supp supp T = .
Proposizione 2.21 Ogni distribuzione a supporto compatto `e di ordine nito.
Dim. Sia T D
t
() e supponiamo che K = supp T sia compatto in . Conside-
riamo due aperti limitati
1
e
2
tali che K
1

2
e la chiusura
2
di
2
sia
ancora contenuta in . Sia C

() tale che = 1 in
1
e = 0 in
2
.
Se D(), la funzione (1 ) ha supporto in
1
, dunque disgiunto da K.
Pertanto T, (1 )) = 0, cio`e
(2.9) T, ) = T, ).
Applicando ora la Proposizione 2.4(ii) relativamente al compatto
2
, otteniamo
che esistono una costante C e un intero j N
0
tali che
[T, )[ C

[[j
|D

|
L

()
, D(
2
).
Per ogni D(), la funzione = verica la stima di sopra da cui, tenendo
conto di (2.9), deduciamo
[T, )[ C

[[j
|D

()|
L

()


C

[[j
|D

|
L

()
,
dove, nellultimo passaggio, abbiamo utilizzato la regola di Leibniz per esplicitare
D

() e abbiamo inglobato nella costante



C tutte le norme |D

|
L

()
, con
multiindice di lunghezza compresa tra 0 e j. Dunque lasserto `e provato.
Le distribuzioni a supporto compatto hanno un certo interesse, dovuto al fatto
che esse possono essere estese ad uno spazio pi` u ampio di D(). Lidea per costruire
tale spazio `e la seguente: le funzioni test dovranno essere ancora di classe C

,
perche laltro oggetto `e una distribuzione e non una funzione, ma non c`e motivo
di imporre che esse abbiano supporto compatto. Infatti, la distribuzione (quando
a supporto compatto) non vede ci`o che avviene vicino al bordo. Il modo di rendere
rigorosa questidea intuitiva poggia sul seguente lemma.
Lemma 2.22 Siano T D() una distribuzione a supporto compatto K, v
C

() e
1
,
2
D() tali ch
1
=
2
= 1 in un intorno aperto di K. Allora
T, v
1
) = T, v
2
).
66 Teoria delle distribuzioni
Dim. Basta osservare che i supporti di (
1

2
)v e T sono disgiunti, per cui
T, (
1

2
)v) = 0, che `e la tesi.
Risulta dunque ben posta la seguente denizione.
Denizione 2.23 Siano T D
t
() una distribuzione a supporto compatto K e
v C

(). Allora
T, v) := T, v),
dove `e una qualunque funzione di D() tale che = 1 in un intorno aperto di
K.
Non `e dicile provare che con questa estensione la distribuzione T risulta
continua rispetto ad una nuova denizione di limite in C

(). Pi` u precisamente


se v
h
, v C

() e se la successione v
h
converge a v con le derivate di
qualunque ordine uniformemente sui compatti di , allora
T, v
h
) T, v).
La Denizione 2.23 rende possibile, per una distribuzione a supporto compatto T
in , il prolungamento a tutto lo spazio R
n
. Basta infatti porre

T, v) = T, v
[
), v D(R
n
).
Allora

T D
t
(R
n
),

T ha lo stesso supporto di T e la sua restrizione a D() coincide
con T. Naturalmente, una distribuzione arbitraria potrebbe non ammettere alcun
prolungamento. Di solito, in questo contesto si denota con c(R
n
) lo spazio C

(R
n
)
e con c
t
(R
n
) lo spazio delle distribuzioni a supporto compatto.
Alle distribuzioni si pu` o anche estendere loperazione di convoluzione. Iniziamo
col denire la convoluzione tra una distribuzione e una funzione test.
Denizione 2.24 Per T(R
n
) e T T
t
(R
n
) sia T la distribuzione denita
da (T ), ) = T, ), dove (x) = (x).
Ovviamente, una verica immediata mostra che la precedente denizione `e
lestensione naturale della formula che si ottiene quando T `e associata ad una
funzione L
1
loc
(R
n
) e la convoluzione `e denita dalla solita formula integrale.
Osservazione 2.25 Valgono le seguenti propriet` a:
(1) supp T supp T + supp
2.4 Supporto e convoluzione 67
(2) (T ) = T ( ) per ogni T(R
n
)
(3) T C

(4) D

(T ) = (D

T) = T (D

) per ogni N
n
(5) Se almeno una tra le distribuzioni T, S ha supporto compatto, si pu` o denire
la convoluzione tra S e T ponendo
(S T), ) = S(x), T(y), (x + y)))
per ogni test, dove la notazione ha il signicato che la distribuzione T(y)
agisce sulla variabile y producendo una funzione della x a cui si applica poi
la distribuzione S(x). Per esempio, T = T per ogni T T
t
; infatti,
(y), (x+y)) = (x) (T ), ) = T(x), (y), (x+y))) = T, ).
Verichiamo solo la (i), le altre essendo immediate, ponendoci per semplicit`a nel
caso in cui T sia associata ad una f L
1
loc
(R
n
). in tal caso
f g(x) =
_
(xsupp f)supp g
f(x y)g(y)dy
e quindi se x / supp f +supp g allora (x supp f) supp g = e f g(x) = 0. Ne
segue che f g = 0 q.o. nel complementare di supp f + supp g.
Osservazione 2.26 La denizione di convoluzione tra distribuzioni permette di
introdurre un concetto molto importante e molto utile nella teoria generale delle
equazioni dierenziali lineari a coecienti costanti. Si dice operatore dierenziale
lineare a coecienti costanti di ordine m un operatore del tipo
(2.10) Pu =

[[m
a

u, a

R(o C)
e si dice soluzione fondamentale di P una distribuzione E tale che
(2.11) PE = .
Abbiamo visto negli esempi 2.18, 2.17 che se P = allora E =
1
2
log [x[ in R
2
ed
E =
4
[x[
in R
3
. Limportanza della soluzione fondamentale consiste nel fatto che
essa fornisce un metodo esplicito per calcolare la soluzione dellequazione Pu = f,
con f molto generali (la classe delle f per cui il metodo che stiamo spiegando
68 Teoria delle distribuzioni
funziona dipende dalle propriet`a della soluzione fondamentale trovata, ma non
scendiamo in dettagli). Formalmente, ponendo u = E f si ottiene
Pu = P(E f) = (PE) f = f = f,
quindi u `e la soluzione cercata, purche f ed E siano tali per cui tutte le operazioni
eseguite siano giusticate (certamente questo `e il caso per f C

c
(R
n
)).
2.5 Distribuzioni temperate
Le distribuzioni temperate sono particolari distribuzioni in R
n
che allinnito
hanno un comportamento pi` u controllato di rispetto alle generiche distribuzioni.
In questo modo `e consentita maggiore generalit`a alle funzioni test. Cominciamo
proprio a denire queste ultime.
Denizione 2.27 Diremo che una funzione appartiene alla classe di Schwartz
S(R
n
) se C

(R
n
) e per ogni , N
n
0
risulta
sup
xR
n
[x

(x)[ < .
Un elemento di S(R
n
) si chiama anche funzione a decrescita rapida allinnito.
Osserviamo che D(R
n
) S(R
n
), ma il viceversa non `e vero: basti considerare la
funzione gaussiana e
[x[
2
, che appartiene ad S(R
n
) ma non a D(R
n
).
Denizione 2.28 Date
k
, S(R
n
), diremo che
k
converge a in S(R
n
) se
lim
k
sup
xR
n
[x

(D

k
(x) D

(x))[ = 0, per ogni , N


n
0
.
Chiameremo distribuzione temperata ogni funzionale T su S(R
n
) lineare e con-
tinuo rispetto alla convergenza introdotta. In simboli, T S
t
(R
n
).
Siccome D(R
n
) S(R
n
) e la convergenza nel primo spazio implica quella
nel secondo, ogni distribuzione temperata, ristretta a D(R
n
), `e una distribuzione
classica.
Osservazione 2.29 Notiamo che se S(R
n
) allora non solo per ogni , N
n
0
la funzione x

(x) `e limitata, ma `e anche sommabile. Infatti


[x

(x)[
[x[
[[+2n
[D

(x)[
1 +[x[
2n
e dalla sommabilit` a della funzione (1+[x[
2n
)
1
segue la sommabilit` a della funzione
x

(x).
2.5 Distribuzioni temperate 69
A dierenza di quanto avviene per D
t
(), lo spazio L
1
loc
(R
n
) non `e interamente
contenuto in S
t
(R
n
). Anche una funzione f L
1
loc
(R
n
) dia origine ad una dis-
tribuzione `e necessario che essa soddisfaccia a condizioni supplementari allinnito
(vedi Esempio 2.31).
Proposizione 2.30 Ogni polinomio `e associato in modo canonico ad una dis-
tribuzione temperata.
Dim. Sia p(x) =

k
a

un polinomio. Anzituto, osserviamo che


(2.12) [p(x)[ C(1 +[x[
k
) x R
n
dove C =

[a

[. Infatti, per [x[ 1 risulta [p(x)[ C, mentre per [x[ 1


si ha [x[
[[
[x[
k
. In accordo con lOsservazione 2.29, per ogni S(R
n
) il
prodotto p `e sommabile e possiamo associare a p il funzionale lineare T
p
su S(R
n
)
ponendo T
p
, ) =
_
pdx. Verichiamo che tale funzionale `e continuo rispetto
alla convergenza in S. Sia
h
S(R
n
) tale che
h
0 in S(R
n
). Allora da
(2.12) segue che

_
R
n
p(x)
h
(x) dx

C
_
R
n

h
(x)(1 +[x[
k
)

dx
C
__
R
n
dx
1 +[x[
2n
_
sup
xR
n
[(1 +[x[
k
)
h
(x)[ 0.
La dimostrazione della precedente proposizione prova di fatto che ogni funzione
a crescita lenta, ossia decomponibile nel prodotto di un polinomio e di una funzione
sommabile, denisce una distribuzione temperata. Tuttavia, una distribuzione
temperata non pu` o crescere esponenzialmente, come dimostra il seguente esempio.
Esempio 2.31 Proviamo che e
x
/ S
t
(R). Sia D(R), con le seguenti pro-
priet` a: 0, 1 in [0, 1] e supp (2, 2). Poniamo
k
(x) =
1
2
k

_
x
k
_
e
notiamo che il supporto di
k
`e contenuto in (2k, 2k). Allora
k
0 in S
t
(R),
poiche per ogni scelta di interi positivi p, q risulta x
p
D
q

k
(x) = 2
k
k
q
x
p
D
q

_
x
k
_
e quindi
sup
xR
[x
p
D
q

k
(x)[
k
pq
2
p
2
k
|D
q
|
L

(R)
0.
Tuttavia
_
R
e
x

k
(x)dx
1
2
k
_
k
0
e
x
dx =
e
k
1
2
k
+.
70 Teoria delle distribuzioni
Proposizione 2.32 Se T `e una distribuzione a supporto compatto allora T `e anche
una distribuzione temperata.
Dim. Per quanto osservato nella sezione 2.4, T verica la seguente propriet`a: se
v
h
, v C

() e se la successione v
h
converge a v con le derivate di qualunque
ordine uniformemente sui compatti di , allora T, v
h
) T, v). Sulla base di
questo fatto, non `e dicile provare che se
h
S(R
n
) e
h
0 in S(R
n
) allora
T,
h
) 0.
La classe delle distribuzioni temperate `e chiusa rispetto alloperazione di deriva-
zione. Cos` ogni distribuzione temperata pu`o essere derivata innite volte. La
moltiplicazione per una funzione f `e lecita se f verica delle condizioni sucienti
a garantire che f S(R
n
), per ogni S(R
n
). Ad esempio, il prodotto di una
distribuzione temperata per un polinomio `e ancora una distribuzione temperata.
In modo del tutto analogo a quanto visto in D
t
(R
n
), `e possibile denire limite
e serie di una successione di distribuzioni temperate in S
t
(R
n
).
2.6 Trasformata di Fourier
Concludiamo il capitolo con alcuni richiami sulla trasformata di Fourier, che
per certi versi trova il suo ambiente naturale in S(R
n
) e in S
t
(R
n
). Iniziamo
col ricordare che se L
1
(R
n
) allora la sua trasformata di Fourier = T() `e
denita da
(2.13) () =
_
R
n
e
ix
(x)dx,
e questa formula ovviamente vale, in particolare, se S(R
n
). Si osserva in-
nanzitutto che lintegrale ha senso in quanto per ogni x, R
n
, [e
ix
[ = 1.
Inoltre, la trasformata di Fourier `e lineare, come segue direttamente dalla linearit` a
dellintegrale, ed inoltre

() = (). Richiamiamo le principali propriet`a di .
Proposizione 2.33 Valgono le seguenti propriet`a.
1. Per ogni L
1
(R
n
) si ha C
0
(R
n
) L

(R
n
) ed inoltre
(2.14) | |
L

(R
n
)
||
L
1
(R
n
)
.
2. (Lemma di Riemann-Lebesgue) Per ogni L
1
(R
n
), si ha
lim
[[
() = 0 .
2.6 Trasformata di Fourier 71
3. Se S(R
n
), per ogni N
n
0
risulta
T(x

(x))() = i
[[
D

().
4. Se S(R
n
), per ogni N
n
0
risulta
T(D

x
)() = i
[[

().
5. Per S(R
n
) vale la formula di inversione
(2.15) (x) =
1
(2)
n
_
R
n
e
ix
()d
6. T( )() = ()

() tutte le volte che entrambi i termini siano deniti.
7. Analogamente al punto precedente, risulta T() = (2)
2n


.
8. Per n 2 si pu`o sempre pensare ad R
n
come un prodotto del tipo R
k
R
m
con k +m = n, indicando la variabile R
n
z = (x, y), con x R
k
e y R
m
.
Si possono denire allora le trasformate di Fourier parziali rispetto ad una
sola variabile ponendo per f : R
n
C:
T
x
(f)(, y) =
_
R
k
e
ix
f(x, y) dx, T
y
(f)(x, ) =
_
R
m
e
iy
f(x, y) dy
(ogni volta che le trasformate indicate sono denite) e valgono tutte le pro-
priet`a gi`a viste, considerando y e rispettivamente x come parametri. In
particolare, se f(x, y) = (x)(y) allora si verica immediatamente che
T(f)(, ) = T
x
()()T
y
()().
Le stesse considerazioni valgono per le trasformate delle distribuzioni, operan-
do al solito per dualit`a.
Queste proprier` a sono gi` a note e non ne riprendiamo le dimostrazioni, limitandoci
ad osservare che, siccome [e
ix
[ = 1 si ha
| |
L

(R
n
)
= sup
R
n

_
R
n
(x)e
ix
dx

sup
R
n
_
R
n
[(x)[ [e
ix
[ dx = ||
L
1
(R
n
)
.
Le regole analitiche di trasformazione 3 e 4 si possono dimostrare usando il Teorema
1.56.
72 Teoria delle distribuzioni
Segue che se S(R
n
), allora la sua trasformata di Fourier `e ancora un e-
lemento di S(R
n
). Infatti, per lOsservazione 2.29 la funzione
,
(x) = x

(x)
appartiene ad L
1
(R
n
) e se ne pu` o calcolare la trasformata di Fourier attraverso la
formula (2.13), ottenendo, grazie alle propriet` a elencate nella Proposizione 2.33,

,
() = i
[[[[
D

()
_
,
e tale funzione `e limitata. Poiche questo vale per ogni , N
n
0
, S(R
n
).
Pertanto, `e ben posta la seguente denizione

T, ) = T, ), S(R
n
),
dove T S
t
(R
n
). Proviamo che

T `e una distribuzione temperata, cio`e che se

h
in S allora

T,
h
)

T, ). Notiamo che se
h
in S allora
x

h
x

in L
1
(R
n
) per ogni , N
n
0
e quindi dalla (2.14) segue che
|

(D


h
() D

())|
L

(R
n
)
|D

(x

(
h
(x) (x)))|
L
1
(R
n
)
e il secondo membro tende a 0 per h che tende allinnito. Di conseguenza,

T,
h
) = T,
h
) T, ) =

T, ).
In questo modo, molte propriet`a della trasformata di Fourier gi` a note per le funzioni
si trasferiscono automaticamente alle distribuzioni temperate.
Esempio 2.34 Calcoliamo la trasformata di Fourier della delta di Dirac in 0:

, ) = , ) = (0) =
_
R
n
(x)dx,
sicche

= 1, dove leguaglianza ha il signicato che la distribuzione

coincide
con quella associata alla funzione costante di valore 1, che appartiene ad L
1
loc
(R
n
).
Questo esempio va confrontato con il Teorema 1.62: infatti, ricordando che T(f
g) =

f g, dire che f

f equivale formalmente a dire che T(f

) =

f



f,
cio`e che

1, o

, che segue appunto dal Teorema 1.62.


Terminiamo il capitolo discutendo le propriet` a della trasformata di Fourier nel-
lo spazio L
2
(R
n
). Per f L
2
(R
n
) non si pu` o usare la formula (2.13) in quanto in
generale lintegrale non `e convergente. Si pu` o per` o denire T(f) attraverso unap-
prossimazione con funzioni della classe di Schwartz. Ricordiamo che in L
2
(R
n
) `e
denito il prodotto scalare
f, g) =
_
R
n
f(x)g(x) dx
2.6 Trasformata di Fourier 73
(conviene pensare a funzioni complesse dal momento che la trasformata di Fourier
`e complessa). Studieremo successivamente la struttura astratta di spazio di Hilbert
di L
2
, mentre per ora ci soermiamo sulla seguente propriet` a: per , S(R
n
)
risulta:
(2.16)
_
R
n
=
_
R
n

Infatti, dalla denizione e dal teorema di Fubini segue che


_
R
n
(x)(x)dx =
_
R
n
(x)
_
R
n
e
ixy
(y)dy dx =
_
R
n
(y)
_
R
n
e
ixy
(x)dx dy
=
_
R
n
(y)

(y)dy.
Segue luguaglianza di Plancherel
(2.17) | |
L
2
(R
n
)
= (2)
n/2
||
L
2
(R
n
)
.
Basta applicare la (2.16) con (x) = (x), e le relazioni

(x) = (x), T
1
(x) =
(2)
n

(x):
_
R
n
[ [
2
=
_
R
n
=
_
R
n

=
_
R
n
(x)

(x)dx
=
_
R
n
(x)(2)
n
T
1
(x)dx = (2)
n
_
R
n
[[
2
.
Passiamo ora a denire la trasformata di fourier in L
2
(R
n
). Dal Teorema 1.62
sappiamo che lo spazio delle funzioni test `e denso il L
2
, quindi in particolare per
ogni f L
2
(R
n
) esiste una successione (
h
) S(R
n
) tale che
h
f in L
2
, cio`e
lim
h
|
h
f|
L
2
(R
n
)
= 0. La successione (
h
), essendo convergente, `e di Cauchy
come spiegato nella Denizione 4.5. Dalla (2.17) segue che anche la successione
(
h
) `e di Cauchy, e quindi, per la completezza di L
2
(R
n
), esiste una funzione
g L
2
(R
n
) tale che
h
g in L
2
(R
n
). Vogliamo porre per denizione

f = g, ma
questa denizione `e ben posta solo se non dipende dalla successione approssimante
(
h
). In realt` a, se (
h
) S(R
n
) e
h
f in L
2
, allora

h
g. Infatti,
evidentemente |
h

h
|
L
2
(R
n
)
0 per h e di conseguenza, ancora per la
(2.17),
|

h
g|
L
2
(R
n
)
|
h
g|
L
2
(R
n
)
+|

h

h
|
L
2
(R
n
)
0.
Possiamo perci` o porre per denizione = g. Con lo stesso procedimento di
approssimazione si verica che le (2.16), (2.17) valgono in L
2
(R
n
) e non solo in
S(R
n
).
Concludiamo questo paragrafo con qualche esempio di trasformazione di Fourier
in S(R
n
).
74 Teoria delle distribuzioni
Esempio 2.35 Sia T = PV
1
x
la distribuzione studiata nellEsempio 2.6.4, ed os-
serviamo che questa `e evidentemente una distribuzione temperata. Allora vale
lequazione xT = 1, nel senso che il prodotto tra la funzione (x) = x in c e la
distribuzione temperata T coincide con la distribuzione temperata associata alla
funzione f = 1 L
1
loc
(R) (in particolare, osserviamo che non ci sono problemi nel-
lorigine perche pur denendo f(x) solo per x ,= 0 si ottiene la stessa distribuzione).
Prendendo la trasformata di Fourier si deduce
T
_
xPV
1
x
_
= i
d
d
T
_
PV
1
x
_
= 2,
da cui T(PV
1
x
) = 2iH() + c; tenendo conto che T `e dispari e quindi anche

T
devessere dispari, si ricava c = e quindi
(2.18) T(PV
1
x
) = i sgn().
Viceversa,
PV
1
x
=
1
2
T
_
TPV
1
x
_
() =
1
2
T (isgn()) = T(sgn() = 2iPV
1

.
Consideriamo ora la distribuzione T S
t
(R
2
) data dalla funzione sgn(x)1(y)
L
1
loc
(R
2
). Usando lenunciato della Proposizione 2.33.8 ed i risultati precedenti, si
ottiene

T(, ) = 2iPV
1


y=0
(),
lespressione precedente dovendo essere intesa come segue:

T, ) = 2i lim
0
_
[[>
(, 0)
1

d
per ogni S(R
2
).
Capitolo 3
Misure di Lebesgue-Stieltjes e
funzioni a variazione limitata
3.1 Misura di Lebesgue-Stieltjes
Nellintrodurre il concetto di misura di Lebesgue in R
n
, si `e partiti dalla deni-
zione ordinaria di area o volume di un rettangolo. In particolare, la costruzione
per il caso unidimensionale poggia sulla nozione di lunghezza di un intervallo. In
questa sezione, arontiamo il problema di introdurre in dimensione uno il concetto
di misura in un modo pi` u generale.
Sia F : R R una funzione crescente e continua a destra. Per ogni a b,
poniamo
m
F
(]a, b]) = F(b) F(a)
m
F
([a, b]) = F(b) F(a

)
m
F
([a, b[) = F(b

) F(a

)
m
F
(]a, b[) = F(b

) F(a).
Indichiamo con 1 la famiglia di tutti gli intervalli aperti, chiusi o semiaperti di R.
La funzione m
F
cos` denita `e non negativa e additiva in 1, cio`e
I =
n
_
h=1
I
h
= m
F
(I) =
n

h=1
m
F
(I
h
),
per ogni I, I
h
1, con I
k
I
h
= .
Al ne di estendere m
F
ad una classe pi` u ampia di insiemi, ragioniamo come per
la misura di Lebesgue, corrispondente al caso F(x) = x e introduciamo il concetto
di misura esterna.
75
76 Misure di Lebesgue-Stieltjes
Denizione 3.1 Sia E R. Deniamo
m
F
(E) = inf
_

h=1
m
F
(I
h
)

_
h=1
I
h
, I
h
1
_
.
Dunque, m
F
(E) `e lestremo inferiore tra tutte le misure dei ricoprimenti di E con
famiglie nite o numerabili di intervalli. Vediamo subito di quali propriet`a gode la
funzione m
F
.
Propriet`a
a) per ogni E R, m
F
(E) [0, +] e m
F
() = 0;
b) m
F
`e -subadditiva, cio`e
E

_
h=1
E
h
= m
F
(E)

h=1
m
F
(E
h
).
La propriet`a b) implica, in particolare, che m
F
`e crescente, ossia
E
1
E
2
= m
F
(E
1
) m
F
(E
2
).
La verica di a) `e immediata, quella di b) si fa come nel caso della misura
esterna di Lebesgue m
n
. Una funzione dinsieme denita su tutte le parti di un
insieme che soddisfaccia alle a) e b) si chiama, in generale, misura esterna.
A dierenza di m
n
, la misura esterna m
F
non `e, in generale, invariante per
traslazioni, ne omogenea.
Si pu` o vericare che se I 1, allora m
F
(I) = m
F
(I), pertanto m
F
`e unesten-
sione di m
F
. Tuttavia, m
F
non `e additiva. Per rimediare a questo problema,
`e necessario restringere m
F
ad unopportuna classe di insiemi (che chiameremo
misurabili).
Denizione 3.2 Se E R `e limitato, diremo che E `e misurabile se per ogni
> 0 esiste un pluriintervallo P, cio`e ununione nita di intervalli, tale che
m
F
(EP) < .
Dunque, E si approssima in modo arbitrariamente preciso mediante un insieme
elementare.
Se E non `e limitato, diremo che `e misurabile se per ogni R > 0 linsieme
E] R, R] `e misurabile.
Indicheremo con /
F
la classe dei sottoinsiemi misurabili di R.
3.1 Misura di Lebesgue-Stieltjes 77
Teorema 3.3 La collezione /
F
costituisce una -algebra e la funzione m
F
ristret-
ta a /
F
`e una misura, che denoteremo con m
F
, chiamata misura di Lebesgue-
Stieltjes generata da F.
Ogni insieme la cui misura esterna `e nulla `e misurabile. Basta scegliere P = nella
Denizione 3.2. Naturalmente, la classe /
F
dipende dalla scelta della funzione
F. Tuttavia, si pu` o vedere che essa contiene sempre gli insiemi aperti (e quindi i
chiusi) di R.
Osserviamo che la misura cos` costruita `e automaticamente completa.
Esempi 3.4
1. Siano x
1
< x
2
< < x
n
n punti in R e h
1
, . . . , h
n
numeri positivi. Deniamo
F(x) =

x
j
x
h
j
.
La funzione F `e crescente, continua in R x
1
, . . . , x
n
e continua a destra
in ogni x
i
ove il salto `e pari ad h
i
. Allora
/
F
= T(R) e m
F
=
n

i=1
h
i

x
i
.
Infatti, m
F
(x
i
) = F(x
i
)F(x

i
) = h
i
, per ogni i, e m
F
(Rx
1
, . . . , x
n
) = 0.
Se A R, allora A (R x
1
, . . . , x
n
) `e misurabile, perche sottoinsieme
di un insieme misurabile di misura nulla, e A x
1
, . . . , x
n
`e misurabile
perche unione di singoletti x
i
= [x
i
, x
i
], che sono misurabili. Pertanto, A `e
misurabile e m
F
(A) = m
F
(A x
1
, . . . , x
n
) =

x
i
A
h
i
.
Questo risultato si estende al caso di uninnit`a numerabile di punti x
n
e
di numeri positivi h
n
tali che

h
n
< .
2. Sia ora F C
1
(R) con f = F
t
a supporto compatto. Allora /
F
= /(R),
classe dei misurabili secondo Lebesgue e
m
F
(A) =
_
A
f(x) dx, per ogni A /(R).
Infatti, basta osservare che
m
F
(]a, b]) = F(b) F(a) =
_
b
a
f(x) dx =
_
]a,b]
f(x) dx.
Lunicit` a del prolungamento di m
F
assicura la tesi.
78 Misure di Lebesgue-Stieltjes
3. Combiniamo ora i due esempi precedenti considerando una funzione F : R
R che sia al solito crescente, continua a destra e C
1
a tratti, cio`e di classe
C
1
([a.b[) (con derivata limitata) per ogni coppia a, b di punti di discontinuit`a.
Allora per ogni intervallo aperto I R risulta
m
F
(I) =
_
I
F
t
(x) dx +

x
j
I
[F(x
j
) F(x
j
)]
x
j
,
dove (x
j
) sono i punti di discontinuit` a di F. In termini distribuzionali, questa
`e la derivata di F, che risulta essere una misura.
Osservazione 3.5 Se `e una misura positiva nita sui boreliani di R, allora
F(x) = (] , x]), x R
denisce una funzione crescente, limitata, continua a destra, la cui misura di
Lebesgue Stieltjes coincide con . Inoltre, lim
x
F(x) = 0. Viceversa, se F `e
una siatta funzione, allora posto

F(x) = m
F
(] , x]), risulta F =

F. Pertanto,
le misure di Lebesgue-Stieltjes esauriscono tutte le misure positive sulla retta.
Sia m
F
la misura di Lebesgue-Stieltjes generata dalla funzione F. Per questa
misura si denisce in modo ordinario la classe delle funzioni sommabili e si intro-
duce la nozione di integrale. Lintegrale fatto rispetto a m
F
si chiama integrale di
Lebesgue-Stieltjes e si denota con il simbolo
_
f dF.
Se F `e la funzione dellEsempio 3.41. allora
(3.1)
_
A
f dF =

x
i
A
f(x
i
)h
i
, A R.
Ci` o si verica considerando dapprima funzioni caratteristiche, quindi funzioni sem-
plici, per passare poi alle funzioni misurabili positive e inne alle funzioni somma-
bili.
Nel caso in cui F soddisfaccia alle condizioni dellEsempio 3.42. si trova che
(3.2)
_
A
g dF =
_
A
gF
t
dx, A /(R).
Anche qui, la verica si fa per passi.
3.2 Misura immagine ed esempi di applicazioni 79
3.2 Misura immagine ed esempi di applicazioni
Lintegrale di Lebesgue-Stieltjes trova uso in numerose questioni applicative.
In particolare, questa nozione si usa largamente nella teoria delle probabilit` a.
Mostriamo unapplicazione che fa uso della nozione di misura immagine.
Siano (, c, ) uno spazio con misura e : R una funzione misurabile. La
formula

#
(A) =
1
(A) = (
1
(A)), A R aperto,
denisce una misura in R, detta misura immagine di mediante . Il caso ele-
mentare `e quello in cui = R e : R R `e C
1
e crescente; allora ,
#
`e la
misura di Lebesgue su R se (a, b) = (b) (a) per ogni intervallo (a, b). Infatti,
preso (a, b) in R e posto d =
1
(b), c =
1
(a),
b a = (
#
)(a, b) = (d c) = (d) (c) =
_
d
c

t
(t)dt.
Limportanza della nozione di misura immagine `e quella di produrre in modo
automatico un teorema di cambiamento di variabili.
Teorema 3.6 Per ogni f funzione sommabile rispetto alla misura
#
, risulta
che f `e sommabile rispetto a e vale
_
R
f d
#
=
_

f ) d.
Notiamo che nel caso elementare ricordato prima il teorema si riduce alla formula
usuale di cambiamento di variabili
_
b
a
f(t)dt =
_

1
(b)

1
(a)
f((x))
t
(x)dx.
Passando alle applicazioni, ricordiamo che si chiama spazio di probabilit`a uno spazio
(, c, P) dotato di una misura positiva P con P() = 1. Una variabile aleatoria
reale `e una funzione X : R misurabile. Si chiama legge o distribuzione di X
la funzione denita da
F(x) = P(X x) = P( [ X() x),
per ogni x R. Dunque, F(x) `e la probabilit` a che la variabile aleatoria X assuma
valori pi` u piccoli di x. Osserviamo che F(x) = P(X
1
(] , x])), cio`e F `e la
misura immagine di P mediante X.
`
E evidente che F `e crescente, continua a
80 Misure di Lebesgue-Stieltjes
destra e verica F() = 0, F(+) = 1. Inoltre si pu` o vericare che la misura
P(X
1
()) coincide con la misura di Lebesgue-Stieltjes generata da F, e ci`o si pu`o
esprimere sinteticamente scrivendo
(3.3) m
F
= P X
1
.
Tra le caratteristiche essenziali di una variabile aleatoria, c`e la sua media o
speranza, denita da
E[X] =
_

X dP.
In virt` u del Teorema 3.6 e della relazione (3.3), otteniamo che
(3.4) E[X] =
_
R
(X X
1
) d(P X
1
) =
_
R
x dm
F
.
In questo modo, per conoscere E[X] `e suciente calcolare lintegrale a secon-
do membro che `e in R, quindi sicuramente pi` u semplice da maneggiare rispetto
allintegrale in .
Di solito in probabilit` a si incontrano variabili aleatorie discrete o assolutamente
continue. Una variabile aleatoria X si dice discreta se pu` o assumere solo un numero
nito o numerabile di valori x
1
, . . . , x
n
, . . .. In questo caso, la distribuzione di X
sar` a una funzione di salto come quella considerata nellEsempio 3.41. Infatti,
posto p
j
= P(X = x
j
), risulta F(x) =

x
j
x
p
j
. Grazie alla formula (3.1) troviamo
che E[X] =

j=1
x
j
p
j
.
Unaltra categoria di variabili aleatorie sono quelle per cui la misura immagine
P X
1
`e assolutamente continua rispetto alla misura di Lebesgue, per cui esiste
f L
1
(R) tale che la distribuzione di X si esprime nella forma
F(x) =
_
x

f(t)dt.
Siccome F
t
(x) = f(x), la formula (3.2) permette di ottenere E[X] =
_
R
xf(x) dx.
Esempio 3.7 [Equazione del calore e moto browniano] Dato uno spazio di
probabilit` a (, c, P), si dice variabile aleatoria in R
n
una funzione X : R
n
che sia c-misurabile e, analogamente al caso reale, si dice legge di X la misura
immagine = X
#
P su R
n
tale che (A) = P( : X() A). Una
variabile aleatoria X in R
n
si dice gaussiana se la sua legge `e una misura gaussiana
3.3 Funzioni a variazione limitata 81
(distribuzione normale ^(, Q)), cio`e se esistono R
n
(media) e Q, matrice
quadrata n n simmetrica e denita positiva (varianza), tali che
(A) =
1
_
(2)
n
detQ
_
A
e

1
2
Q
1
(x),(x))
dx, A /(R
n
).
Si dice processo stocastico in R
n
una funzione X
t
, t 0 tale che X
t
sia una variabile
aleatoria in R
n
per ogni t 0. Si dice che il processo stocastico W
t
`e un moto
browniano in R
n
se W
0
= 0, t W
t
() `e una funzione continua per P-q.o. ,
W
t
W
s
`e una variabile aleatoria (con legge) gaussiana ^(0, (t s)I) per ogni
0 s < t (qui I `e la matrice identit`a in R
n
) e per ogni 0 < t
1
< . . . < t
k
le variabili
aleatorie W
t
2
W
t
1
, . . . , W
t
k
W
t
k1
sono indipendenti. Non `e ovvio, ma si pu` o
dimostrare che un moto browniano in R
n
esiste. Posto allora, per ogni x R
n
,
t > 0 ed f : R
n
R continua a limitata,
u(x, t) = E[f(x + W
t
)] =
_

f(x + W
t
()) dP()
ragionando come per (3.4) otteniamo
u(x, t) =
_
R
n
f(y) d^(x, tI)(y) =
1
_
(2t)
n
_
R
n
f(y) e

|xy|
2
2t
dy = (f G
t
)(x),
dove G
t
(x) = (2t)
n/2
e
[x[
2
/(2t)
`e il nucleo di Gauss-Weierstrass. Un calcolo
diretto mostra che u `e soluzione del problema di Cauchy per lequazione del calore
_
u
t
(x, t) =
1
2

x
u(x, t) x R
n
, t > 0
u(x, 0) = f(x) x R
n
.
3.3 Funzioni a variazione limitata
Sia I = (a, b) un intervallo di R con a < b + e sia u : I R.
Deniamo
pV(u, I) = sup
_
n

i=1
[u(t
i
) u(t
i1
)[ [ a < t
0
< t
1
< < t
n
< b
_
variazione puntuale di u in I. Essa dipende fortemente dai valori puntuali di u.
Dato che avremo a che fare con funzioni che sono solo in L
1
loc
(I) e dato che queste
possono essere modicate arbitrariamente su insiemi di misura nulla senza che
cambi il loro integrale su alcun intervallo, `e utile introdurre la seguente quantit`a
eV(u, I) = infpV(v, I) [ v = uq.o.,
82 Misure di Lebesgue-Stieltjes
detta variazione essenziale di u in I. Inne, chiamiamo
V(u, I) = sup
__
b
a
u(x)
t
(x) dx [ C
1
c
(I), [(x)[ 1, x I
_
,
variazione di u in I.
Vediamo una serie di osservazioni ed esempi relativi alla variazione puntuale.
Se pV(u, I) < + allora u `e limitata in I.
Infatti, ssato t
0
I, se t < t
0
consideriamo la partizione t < t
0
. Dalla
denizione deduciamo che
[u(t
0
) u(t)[ pV(u, I),
da cui [u(t)[ [u(t
0
)[ + pV(u, I). Il caso t < t
0
`e analogo.
Se u `e monotona e limitata, allora pV(u, I) < + e pV(u, I) = [u(b

)
u(a
+
)[.
Supponiamo u crescente per ssare le idee. Per ogni partizione a < t
0
< t
1
<
< t
n
< b, risulta

n
i=1
[u(t
i
) u(t
i1
)[ = u(t
n
) u(t
0
). Al variare della
partizione, t
n
b

e t
0
a
+
per cui pV(u, I) = u(b

) u(a
+
).
Se u C
1
[a, b], con a, b niti, allora pV(u, I) =
_
b
a
[u
t
(t)[ dt.
Se a t
0
< t
1
< < t
n
b `e una partizione di [a, b], allora per il Teorema
fondamentale del calcolo si ha
n

i=1
[u(t
i
) u(t
i1
)[ =
n

i=1

_
t
i
t
i1
u
t
(t)dt

i=1
_
t
i
t
i1
[u
t
(t)[dt =
_
b
a
[u
t
(t)[dt.
Viceversa, siccome u
t
`e uniformemente continua in [a, b], ssato > 0 esiste
> 0 tale che se 0 < t
i
t
i1
< allora [u
t
(t) u
t
(s)[ < per s, t [t
i1
, t
i
].
Fissata allora una partizione a = t
0
< t
1
< . . . < t
n
= b con t
i
t
i1
< per
ogni i, per il teorema di Lagrange esistono
i
[t
i1
, t
i
] tali che
n

i=1
[u(t
i
) u(t
i1
)[ =
n

i=1
[u
t
(
i
)[(t
i
t
i1
)
e quindi, per le considerazioni che precedono,
n

i=1
[u(t
i
) u(t
i1
)[
n

i=1
_
t
i
t
i1
[u
t
(t)[dt (t
i
t
i1
) =
_
b
a
[u
t
(t)[dt (b a).
Per larbitrariet` a di si ha la tesi.
3.3 Funzioni a variazione limitata 83
Se a < c < b, allora pV(u, [a, b]) = pV(u, [a, c]) + pV(u, [c, b]), cio`e la
variazione puntuale `e additiva.
Consideriamo la seguente funzione
u(x) =
_
x cos(/x), x ]0, 1]
0, x = 0.
Allora u `e continua in [0, 1], ma pV(u, [0, 1]) = +. Infatti, osservato che
cos(/x) = 1, se x = 1/(2k), k N,
cos(/x) = 1, se x = 1/(2k + 1), k N,
in corrispondenza della partizione P
N
= 1/n[ n = 1, . . . , N si ha che
N

n=1

u(1n + 1) u
_
1
n
_

=
N

n=1
_
1
n + 1
+
1
n
_
+
per N +.
Proposizione 3.8 Sia u : I R una funzione tale che pV(u, I) < +. Allora
esistono due funzioni u
1
, u
2
: I R limitate e crescenti tali che u = u
1
u
2
e
pV(u, I) = pV(u
1
, I) + pV(u
2
, I).
Inoltre, se u `e continua a destra (risp. a sinistra), anche u
1
, u
2
sono continue
a destra (risp. a sinistra).
Dim. Per ogni t I = (a, b), poniamo
g(t) = pV(u, (a, t]) = sup
_
n

i=1
[u(t
i
) u(t
i1
)[ [ a < t
0
< t
1
< < t
n
t
_
.
Siccome 0 g(t) pV(u, I) < +, g `e limitata. Proviamo che g `e crescente.
Siano t < s e a < t
0
< t
1
< < t
n
t < s. Allora
[u(t) u(s)[ +
n

i=1
[u(t
i
) u(t
i1
)[ g(s),
da cui, al variare della partizione
[u(t) u(s)[ + g(t) g(s),
84 Misure di Lebesgue-Stieltjes
che, in forma equivalente si legge
(3.5) [u(s) u(t)[ g(s) g(t).
Deniamo ora
u
1
=
g + u
2
, u
2
=
g u
2
.
Chiaramente u = u
1
u
2
, u
1
, u
2
sono limitate e, in virt` u di (3.5) u
1
, u
2
sono anche
crescenti. In particolare, si ha pV(u
i
, I) = u
i
(b

) u
i
(a
+
), i = 1, 2 e quindi
pV(u
1
, I) + pV(u
2
, I) = g(b

) g(a
+
) g(b

) = pV(u, I). Per il viceversa, basta


osservare che
n

i=1
[u(t
i
) u(t
i1
)[
n

i=1
[u
1
(t
i
) u
1
(t
i1
)[ +
n

i=1
[u
2
(t
i
) u
2
(t
i1
)[
pV(u
1
, I) + pV(u
2
, I).
Osserviamo che se pV(u, I) < allora le funzioni u
1
ed u
2
sono limitate.
Inoltre aver rappresentato u tramite funzioni crescenti e limitate `e un grande van-
taggio tecnico. Infatti, le funzioni monotone limitate hanno buone propriet` a di
continuit`a, nel senso che possono avere solo discontinuit`a di prima specie, cio`e di
salto, e linsieme dei punti di salto `e al pi` u numerabile. Infatti, per un ben noto
risultato elementare di Analisi I (noto in genere come Teorema fondamentale sulle
funzioni monotone), le funzioni monotone limitate ammettono limiti destro e sin-
istro niti in ogni punto. Supposto per ssare le idee di considerare una funzione
f crescente, ogni punto di salto t determina un intervallo I
t
= (f(t), f(t+)) e
tali intervalli sono disgiunti a causa della monotonia. Segue che si pu`o scegliere in
ciascuno di essi un numero razionale in modo che tali numeri siano tutti distinti.
Quindi la famiglia T = I
t
: t punto di salto di f degli intervalli determinati dai
punti di salto di f (che `e in corrispondenza biunivoca con linsieme dei punti di
salto di f) `e al pi` u numerabile. In particolare, linsieme dei punti di salto di una
funzione monotona ha misura nulla.
Vediamo ora un teorema importante che mette in luce la relazione tra le nozioni
introdotte allinizio del capitolo.
Teorema 3.9 Sia u L
1
loc
(I). Allora V(u, I) = eV(u, I) ed esiste una funzione u
tale che u = u q.o. e pV( u, I) = eV(u, I) (cio`e u realizza il minimo).
Non entriamo nei dettagli, ma lidea della dimostrazione `e molto semplice: basta
rappresentare u = u
1
u
2
come nella proposizione 3.8 e scegliere u
1
ed u
2
in modo
3.3 Funzioni a variazione limitata 85
tale che u
j
(t) [u
j
(t), u
j
(t+)] in ogni punto di salto t di u
j
(con j = 1, 2). Per
le considerazioni precedenti, questo comporta una modica su un insieme
La funzione u la cui esistenza `e garantita dal teorema precedente prende il nome
di buon rappresentante di u. Ogni funzione monotona `e buon rappresentante di se
stessa.
Denizione 3.10 Se u L
1
(I) e V(u, I) < +, allora u si dice a variazione
limitata e si scrive u BV (I).
Dalla dimostrazione del Teorema 3.9 si ricavano alcune propriet` a fondamentali
delle funzioni a variazione limitata che enunciamo nella proposizione e nel teorema
seguenti.
Proposizione 3.11 Se u BV (I), allora la derivata distribuzionale di u `e una
misura reale denita sui boreliani contenuti in I, B(I), cio`e
_
I
u(x)
t
(x) dx =
_
I
d, C
1
c
(I).
Inoltre, [[(I) = V(u, I).
Dora in avanti, indicheremo la derivata distribuzionale di u con Du.
Teorema 3.12 Se u BV (I) e u `e buon rappresentante di u allora u `e deriv-
abile q.o. in I e la derivata puntuale di u coincide con la densit`a (della parte
assolutamente continua) di Du rispetto a L
1
, ossia
Du = u
t
L
1
+ (Du)
s
,
con (Du)
s
L
1
.
Spesso, in quello che segue, trattando una funzione in BV (I) intenderemo
riferirci al suo buon rappresentante.
In virt` u di quanto visto sinora possiamo aermare che
(1) ogni funzione u BV (I) `e dierenza di due funzioni crescenti;
(2) ogni funzione u BV (I) ammette limiti sinistro e destro in x I niti
ed esistono al pi` u uninnit` a numerabile di punti di discontinuit` a (di prima
specie).
Notiamo che la propriet`a (2) discende da (1) e dalle propriet` a delle funzioni mono-
tone.
86 Misure di Lebesgue-Stieltjes
Esempio 3.13 [Linsieme di Cantor] Poniamo E
0
= [0, 1]. Prendiamo ora in E
0
i due intervalli [0,
1
3
] e [
2
3
, 1], ciascuno di ampiezza 1/3 e deniamo E
1
= [0,
1
3
]
[
2
3
, 1]. In ogni intervallo che compone E
1
ripetiamo lo spesso discorso prendendo
i sottointervalli [0,
1
9
], [
2
9
,
1
3
], ecc... e chiamiamo E
2
lunione dei quattro intervalli,
ciascuno di ampiezza
1
9
, cos` ottenuti.
Al passo n-simo, E
n
sar` a costituito da 2
n
intervalli disgiunti ciascuno di ampiez-
za
1
3
n
. Notiamo che E
n
E
n1
E
0
. Poniamo inne E =

nN
0
E
n
e chiamiamo
E insieme di Cantor. Risulta
L
1
(E) = lim
n
L
1
(E
n
) = lim
n
(2/3)
n
= 0.
Di seguito elenchiamo le propriet` a fondamentali di E.
(i) E `e compatto, cio`e chiuso e limitato.
(ii) E `e perfetto, cio`e ogni suo punto `e di accumulazione e non ce ne sono fuori.
Infatti, sia x E, dunque x E
n
per ogni n. Fissato > 0, prendiamo
n N tale che
1
3
n
< . Sia I
n
= [a
n
, b
n
] lunico intervallo tra quelli di E
n
contenente x. Se, ad esempio, x ,= a
n
allora [x a
n
[
1
3
n
< .
(iii) E `e in nessuna parte denso, cio`e E non contiene intervalli.
Se E contenesse un intervallo di ampiezza > 0, allora, scegliendo n abbas-
tanza grande, si avrebbe che E
n
`e formato da intervalli disgiunti di ampiezza
1
3
n
< , assurdo!
(iv) E ha la cardinalit`a del continuo. Infatti, se si scrivono i punti di [0, 1] in forma
ternaria x = 0, a
1
a
2
a
3
. . . a
n
. . . con a
i
0, 1, 2, per costruzione i punti di C
sono esattamente quelli per cui a
n
non `e mai 1 (questi punti corrispondono
ai terzi medi di ogni suddivisione); allora, la funzione che ad x C associa
f(x) = 0,
a
1
2
a
2
2
a
3
2
. . .
a
n
2
. . .
`e ben denita (perche per x C ogni a
n
/2 `e 0 o 1) e, pensando lo sviluppo
di f(x) in base 2, la funzione f risulta bigettiva su [0, 1].
Esempio 3.14 [La funzione di Cantor] Poniamo
f
n
(x) =
_
x
0
_
3
2
_
n

E
n
(t) dt, x [0, 1], n = 0, 1, . . .
3.3 Funzioni a variazione limitata 87
dove E
n
`e linsieme costruito nellesempio precedente. Ogni f
n
`e continua, crescente
e costante a tratti in E
c
n
. Inoltre, f
n
`e derivabile a tratti con f
t
n
L
1
(0, 1). La
successione (f
n
(x)) `e denitivamente costante se x / E. Si pu`o anche dimostrare
che vale la seguente stima
[f
n+1
(x) f
n
(x)[
1
2
n1
, n N, x [0, 1].
Pertanto la successione (f
n
) soddisf`a al criterio di Cauchy uniformemente in [0, 1]
e, di conseguenza, esiste f C([0, 1]) limite uniforme di (f
n
). Possiamo aggiungere
che f(0) = 0, f(1) = 1 e f `e crescente. Alla luce di queste propriet` a, si vede che
f BV (0, 1).
Se x
0
/ C, allora esiste k N tale che x / E
k
. Essendo E
n+1
E
n
, passando
al complementare risulta E
c
n
E
c
n+1
. Dunque x
0
/ E
n
, per ogni n k. Se I `e la
componente di E
c
k
contenente x, allora f
n
(x) = f
k
(x) = f
k
(x
0
), per ogni x I. Ci` o
dimostra che f `e costante in I, pertanto esiste f
t
(x
0
) = 0. Data larbitrariet` a di
x
0
, ricaviamo che f
t
esiste ed `e uguale a zero in E
c
, cio`e q.o., essendo L
1
(E) = 0.
Per la Proposizione 3.11, la derivata distribuzionale di f, Df, `e una misura
sui boreliani di [0, 1]. Dato che f `e crescente, essa `e buon rappresentante di se
stessa. Quindi, la Proposizione 3.11 insieme al fatto che f
t
= 0 q.o. provano che
Df non ha parte assolutamente continua rispetto alla misura di Lebesgue. Ne
segue che Df L
1
. Proviamo che tale misura `e singolare rispetto alla misura
di Lebesgue. Risulta L
1
(E) = 0, in virt` u dellesempio precedente. Se facciamo
vedere che Df(E
c
) = 0, allora il nostro asserto `e provato. Sia I una componente
connessa di E
c
, ossia uno degli intervalli scartati durante la costruzione di E. Sia
C

c
(I). Per denizione di Df risulta allora
_
I
f
t
dx =
_
I
d(Df).
Ma f `e costante in I. Dunque pu` o essere portata fuori dallintegrale a primo
membro e ci`o che rimane `e zero, essendo nulla agli estremi di I. Pertanto
_
I
d(Df) = 0 per ogni C

c
(I), che implica Df(I) = 0. Essendo I arbitrario,
ne segue che Df(E
c
) = 0.
Osserviamo che la funzione di Cantor costituisce un controesempio al Teorema
Fondamentale del Calcolo Integrale per lintegrale di Lebesgue. Infatti, risulta
f(1) f(0) = 1 > 0 =
_
1
0
f
t
.
88 Misure di Lebesgue-Stieltjes
Pertanto, le funzioni a variazione limitata non sono il candidato ideale per ot-
tenere lestensione del Teorema Fondamentale del Calcolo Integrale allintegrale di
Lebesgue. Peraltro, lesempio della funzione di Cantor dimostra che il problema
non `e legato ne allesistenza q.o. della derivata puntuale, ne alla sua integrabilit`a.
A questo proposito per`o `e opportuno indicare il seguente risultato.
Proposizione 3.15 Sia f : [a, b] R una funzione tale che esiste f
t
(x) per ogni
x [a, b] e f
t
L
1
(a, b). Allora
f(x) f(a) =
_
x
a
f
t
, x [a, b].
Nel paragrafo seguente introduciamo nellambito delle funzioni a variazione lim-
itata la pi` u grande sottofamiglia di funzioni per cui vale il Teorema Fondamentale
del Calcolo Integrale.
3.4 Funzioni assolutamente continue
Denizione 3.16 Sia I un intervallo in R. Diciamo che una funzione f BV (I)
`e assolutamente continua in I se la sua derivata distribuzionale Df `e assolutamente
continua rispetto alla misura di Lebesgue in I. Scriveremo, in tal caso, che f
AC(I).
Se f AC(I), ricordando il Teorema 3.12, abbiamo che
Df([, ]) =
_

f
t
dx, [, ] I.
Osservazione 3.17 Siccome ogni funzione assolutamente continua `e anche a vari-
azione limitata, essa pu` o essere scritta come dierenza di due funzioni crescenti
limitate. Non `e dicile vericare che la funzione g, denita nella dimostrazione
della Proposizione 3.8, `e assolutamente continua se u lo `e. Pertanto, se u AC(I)
allora u = u
1
u
2
con u
1
, u
2
crescenti, limitate e assolutamente continue.
La risposta al nostro problema `e stabilita nel seguente importante teorema.
Teorema 3.18 Se f : I R `e assolutamente continua allora per ogni [, ] I
risulta
(3.6)
_

f
t
dx = f() f().
3.4 Funzioni assolutamente continue 89
Dim. Sia f AC(I). Per lOsservazione 3.17 possiamo scrivere f = f
1
f
2
,
con f
1
, f
2
crescenti, limitate e assolutamente continue. Pertanto, non `e restrittivo
dimostrare lidentit`a (3.6) per una funzione assolutamente continua crescente. Se
[, ] I, risulta allora
f() f() = pV(f, [, ]) = V(f, [, ]) = [Df[([, ]) =
_

[f
t
[dx =
_

f
t
dx.
Per dierenza, la tesi `e vera nel caso generale.
Grazie alla formula (3.6) `e facile dimostrare la seguente propriet`a.
Proposizione 3.19 Sia f : I R una funzione assolutamente continua. Allora
per ogni > 0, esiste > 0 tale che comunque si scelgano n intervalli disgiunti
(t
0
, t
1
), . . . , (t
n1
, t
n
) I con
n

i=1
(t
i
t
i1
) < risulta
n

i=1
[f(t
i
) f(t
i1
)[ < .
Dim. In virt` u della Proposizione 1.40, ssato > 0 esiste > 0 tale che se E
`e un boreliano con L
1
(E) < allora [Df[(E) < . Scegliamo ora n intervalli
disgiunti (t
0
, t
1
), . . . , (t
n1
, t
n
) I, la cui ampiezza complessiva sia minore di .
Posto E =
n
i=1
(t
i1
, t
i
), si ha allora [Df[(
n
i=1
(t
i1
, t
i
)) < . Daltra parte, grazie
a (3.6) possiamo fare la seguente stima
n

i=1
[f(t
i
) f(t
i1
)[
n

i=1
_
t
i
t
i1
[f
t
[dt =
n

i=1
[Df[(t
i1
, t
i
) = [Df[(
n
i=1
(t
i1
, t
i
)) < ,
che `e quanto si voleva provare.
Notiamo che la Proposizione precedente implica che ogni funzione assoluta-
mente continua `e uniformemente continua e quindi continua. Mentre non vale il
viceversa. La funzione di Cantor ne `e un controesempio. Inoltre, se I `e limitato
allora vale anche il viceversa della Proposizione 3.19, sicch`e essa rappresenta una
caratterizzazione delle funzioni assolutamente continue su intervalli limitati.
Le propriet` a dellintegrale di Lebesgue permettono di dimostrare il seguente
risultato.
Proposizione 3.20 Sia f L
1
(a, b). Allora la funzione g(x) =
_
x
a
f `e assolu-
tamente continua. Inoltre, g `e derivabile per quasi ogni x I e risulta g
t
= f
q.o.
Questultima proposizione `e il viceversa del Teorema 3.18. Quindi, possi-
amo concludere che tutte e sole le funzioni per cui vale la formula del Teorema
Fondamentale del Calcolo Integrale con lintegrale di Lebesgue sono le funzioni
assolutamente continue.
90 Misure di Lebesgue-Stieltjes
Capitolo 4
Teoria elementare degli spazi di
Hilbert
Nelle applicazioni, soprattutto in Fisica, lo spazio ambiente naturale per nu-
merosissimi modelli `e lo spazio L
2
introdotto nella (1.11). Estenderemo ora ad
alcuni spazi di dimensione innita le nozioni di prodotto scalare, base, proiezione
ortogonale. In seguito vedremo lapplicazione di questi concetti generali allo spazio
L
2
.
4.1 Generalit`a
Denizione 4.1 Sia E uno spazio vettoriale complesso. Unapplicazione u, v) :
E E C `e detta prodotto scalare se soddisfaccia alle seguenti propriet`a di
linearit` a, simmetria e positivit` a:
u + v, w) = u, w) + v, w) u, v, w E, , R
u, v) = v, u) u, v E
u, u) > 0 u E 0.
In particolare si ha (anti)linearit`a rispetto anche alla seconda variabile, cio`e
u, v) = u, v) C, u, v E.
Inoltre
0, v) = v, 0) = 0 v E.
Esempi 4.2
91
92 Teoria elementare degli spazi di Hilbert
(1) Lo spazio R
n
`e in genere munito del prodotto scalare euclideo
u, v) =
n

i=1
u
i
v
i
.
(2) Sia A una matrice simmetrica n n denita positiva; allora
u, v)
A
:= Au, v) =
n

i,j=1
a
ij
u
j
v
i
denisce un nuovo prodotto scalare in R
n
.
(3) Lo spazio C
n
`e in genere munito del prodotto scalare (detto hermitiano)
(4.1) u, v) =
n

i=1
u
i
v
i
.
(4) Sia
2
lo spazio vettoriale delle successioni complesse (a
n
) a quadrato somma-
bile:
(a
n
)
2

n=1
[a
n
[
2
< +.
Il fatto che
2
sia una spazio vettoriale segue dalla disuguaglianza [a +b[
2

2[a[
2
+2[b[
2
. Inoltre, la disuguaglianza 2[ab[ [a[
2
+[b[
2
consente di denire
un prodotto scalare in
2
:
(a
n
), (b
n
)) :=

n=1
a
n

b
n
.
(5) Per (X, c, ) spazio di misura, possiamo denire il prodotto scalare
u, v) =
_
X
u v d
per u, v : X C appartenenti ad L
2
(X), e risulta |u|
2
=
_
u, v).
Proposizione 4.3 Ogni prodotto scalare in E soddisf`a alla disuguaglianza di Cau-
chy-Schwarz
(4.2) [u, v)[
_
u, u)v, v) u, v E.
Inoltre la funzione |u| :=
_
u, u) `e una norma in E.
4.1 Generalit`a 93
Dim. Fissiamo u e v in E; per ogni t R si ha
0 tu + v, tu + v) = t
2
u, u) + 2tu, v) +v, v).
Il discriminante del trinomio di secondo grado dovr`a allora essere negativo; si trova
quindi

4
= u, v)
2
u, u)v, v) 0
e (4.2) `e dimostrata. Verichiamo ora che le propriet`a delle norme sono soddisfat-
te. La positivit` a e la omogeneit`a sono evidenti. Per vericare la disuguaglianza
triangolare osserviamo che
|u + v| |u| +|v|
equivale, elevando al quadrato ambo i membri, a
u + v, u + v) u, u) +v, v) + 2|u||v|
quindi semplicando si ottiene
u, v) |u||v|
che segue dalla disuguaglianza di Cauchy-Schwarz (4.2).
Osservazione 4.4 La disuguaglianza di Cauchy-Schwartz implica che, a v ssato,
le applicazioni u u, v) sono Lipschitziane di costante |v|. Vedremo in seguito
che, sotto opportune ipotesi, ogni funzionale lineare e continuo `e di questo tipo.
Dati u, v E non nulli, langolo tra u e v `e a volte denito come lunico
[0, 2) tale che
cos = Re
u, v)
|u||v|
.
Tale angolo esiste per la disuguaglianza di Cauchy-Schwarz.
Denizione 4.5 Chiameremo spazio pre-Hilbertiano ogni spazio vettoriale muni-
to di un prodotto scalare e della norma corrispondente. La distanza indotta dal
prodotto scalare sar`a naturalmente
d(u, v) = |u v| =
_
u v, u v).
Se E, munito della norma | |, `e completo (di Banach) allora diremo che E `e uno
spazio di Hilbert.
94 Teoria elementare degli spazi di Hilbert
Esempio 4.6 Linsieme C([a, b]) delle funzioni continue in [a, b], munito del pro-
dotto scalare
f, g) =
_
b
a
f(x)g(x) dx
`e uno spazio pre-Hilbertiano.
Osservazione 4.7
(1) Si pu` o vericare che ogni norma derivata da un prodotto scalare soddisf`a
allidentit` a del parallelogramma
(4.3) |x y|
2
+|x + y|
2
= 2|x|
2
+ 2|y|
2
.
Viceversa, se
_
E, | |
_
`e uno spazio normato e la norma verica lidentit` a del
parallelogramma, allora
Re x, y) :=
|x + y|
2
|x y|
2
4
Imx, y) :=
|x iy|
2
|x + iy|
2
4i
denisce un prodotto scalare in E che induce la norma di partenza.
(2) Negli spazi di pre-hilbertiani, che sono ovviamente dei particolari spazi nor-
mati, sussistono le nozioni di convergenza di successioni e di completezza.
Vale il seguente teorema di completamento:
Per ogni spazio pre-Hilbertiano E esistono uno spazio di Hilbert
H ed una isometria j : E H tali che limmagine J(E) `e densa
in H, vale a dire, ogni x H pu`o essere approssimato da una
successione (x
h
) j(E). Lo spazio H `e unico a meno di isometrie
ed `e detto completamento di E.
(3) Nello spazio L
2
(X) ovviamente una successione di funzioni (u
n
) converge ad
u se e solo se
lim
n
_
X
[u
n
u[
2
d = 0,
e notiamo che, ragionando come nel caso di L
1
, si prova che se u
n
u in
L
2
allora esiste una sottosuccessione (u
k
n
) convergente ad u -q.o. Notiamo
anche che, regionando ancora come in L
1
, si dimostra che L
2
(X) `e completo
(per X R
n
aperto pu`o essere costruito come completamento di C(X)).
4.2 Basi ortonormali e serie di Fourier astratte 95
Esempio 4.8 Il completamento di C([a, b]) `e lo spazio L
2
(a, b) (pi` u precisamente,
lo spazio quoziente) munito del prodotto scalare
f, g) :=
_
b
a
f(t)g(t) dt.
4.2 Basi ortonormali e serie di Fourier astratte
Il concetto di base in dimensione innita richiede il passaggio da combinazioni
lineari nite a combinazioni lineari innite ma con coecienti a quadrato somma-
bile.
Denizione 4.9 Sia H uno spazio di Hilbert di dimensione innita e sia (v
n
) H
un insieme di vettori. Diremo che (v
n
) `e una base ortonormale di H se
(1) v
n
, v
m
) =
nm
per ogni n, m 1;
(2) per ogni u H esiste una successione (a
n
) R
n
tale che
(4.4) u =

n=1
a
n
v
n
.
Diremo che uno spazio di Hilbert `e separabile se ha almeno una base ortonormale.
La propriet`a di separabilit`a `e legata al fatto di avere uninnit` a al pi` u numerabile
di direzioni indipendenti e a due a due ortogonali. Tra gli spazi di Hilbert separabili
vi `e
2
: basta scegliere
v
n
= (0, 0, . . . , 0, 1, 0, . . .)
con il numero 1 alln-mo posto. I vettori v
n
sono a due a due ortogonali ed hanno
norma 1. Data inoltre (a
n
)
2
deniamo
(a
n
)
N
=
N

i=1
a
i
v
i
=
_
a
1
, a
2
, . . . , a
N
, 0, 0 . . .
_
.
Si ha quindi
(a
n
) (a
n
)
N
=
_
0, 0, . . . , 0, a
N+1
, a
N+2
, . . .
_
lim
N+
|(a
n
) (a
n
)
N
|
2
= lim
N+

i=N+1
[a
i
[
2
= 0
96 Teoria elementare degli spazi di Hilbert
il che vuol dire
(a
n
) = lim
N+
(a
n
)
N
=

n=1
a
n
v
n
.
La seguente proposizione mostra che
2
`e il modello isometrico di tutti gli spazi di
Hilbert separabili di dimensione innita.
Proposizione 4.10 Sia H uno spazio di Hilbert separabile di dimensione innita
e sia (v
n
) una base ortonormale. Allora i coecienti (a
n
), detti coordinate di
u rispetto alla base (v
n
), sono univocamente determinati dalla (4.4) e valgono le
relazioni a
n
= u, v
n
). Vale inoltre lidentit`a di Parseval:
|u|
2
=

n=1
[a
n
[
2
=

n=1
[u, v
n
)[
2
.
Inne, lapplicazione
(4.5) u (u, v
n
))
`e una isometria lineare e bigettiva di H con
2
.
Dim. Supponiamo che valga la (4.4) e prendiamo i prodotti scalari di ambo i
membri con v
m
, per m ssato. Essendo il prodotto scalare continuo e lineare
otteniamo
u, v
m
) =

n=1
a
n
v
n
, v
m
) = lim
N+

n=1
a
n
v
n
, v
m
)
= lim
N+
N

n=1
a
n

nm
= a
m
. (4.6)
Posto u
N
=
N

i=1
a
i
v
i
abbiamo
|u
N
|
2
=
N

i=1
a
i
v
i
,
N

j=1
a
j
v
j
) =
N

i,j=1
a
i
a
j
v
i
, v
j
)
=
n

i,j=1
a
i
a
j

ij
=
N

i=1
[a
i
[
2
.
Passando al limite per N + ed usando la continuit`a della norma si ottiene
lidentit` a di Parseval.
4.2 Basi ortonormali e serie di Fourier astratte 97
Inne lapplicazione : H
2
in (4.5) `e evidentemente lineare ed `e una
isometria tra i due spazi per lidentit` a di Parseval. Liniettivit`a di segue dalle
implicazioni
(u) = (v) |(u v)| = 0 |u v| = 0 u = v.
Data (a
n
)
2
si verica facilmente che la successione u
N
=
N

n=1
a
n
v
n
`e di Cauchy:
|u
M
u
N
|
2
= |
M

i=N+1
a
i
v
i
|
2
=
M

i=N+1
[a
i
[
2

i=N+1
[a
i
[
2
N < M.
Dato che (a
n
)
2
si ha
lim
N+

i=N+1
[a
i
[
2
= 0.
Denendo
u :=

n=1
a
n
v
n
il ragionamento usato in (4.6) mostra che a
n
= u, v
n
), quindi (u) = (a
n
).
Osservazione 4.11 Si osservi che le serie del tipo

n=1
a
n
v
n
(a
n
)
2
non convergono totalmente in generale (si prenda ad esempio a
n
= 1/n).
Quali spazi di Hilbert sono separabili?
`
E ben noto che il metodo di ortonor-
malizzazione di Gram-Schmidt fornisce una base ortonormale negli spazi di Hilbert
di dimensione nita, che sono quindi separabili. Una caratterizzazione degli spazi
di Hilbert separabili `e fornita dal seguente teorema, che si dimostra anchesso col
metodo di Gram-Schmidt.
Teorema 4.12 Uno spazio di Hilbert H `e separabile se e solo se esiste un insieme
al pi` u numerabile D denso in H.
Osservazione 4.13 Sia E uno spazio pre-Hilbertiano, sia F E un sottospazio
di dimensione N e v
1
, . . . , v
N
una base ortonormale di F. Vericare che per ogni
u E la funzione
|u
N

i=1
a
i
v
i
|
2
98 Teoria elementare degli spazi di Hilbert
ha valore minimo per a
i
= u, v
i
). Il vettore
N

i=1
u, v
i
)v
i
`e detto proiezione di u su F.
Tra le propriet` a fondamentali che gli spazi di Hilbert hanno in comune con gli
spazi di dimensione nita ricordiamo lesistenza di proiezioni sui convessi chiusi
(anche di dimensione innita) e la possibilit`a di rappresentare ogni funzionale lin-
eare e continuo mediante il prodotto scalare per un opportuno vettore (teorema di
Riesz).
Teorema 4.14 Sia H uno spazio di Hilbert e C H un insieme convesso, chiuso,
non vuoto. Allora per ogni x H esiste unico y C tale che
|x y| = min
zC
|x z|.
Il vettore y `e detto proiezione di x sul convesso C ed `e caratterizzato dalla propriet`a:
(4.7) x y, z y) 0 z C.
Dim. Sia (y
h
) C una successione minimizzante, vale a dire
lim
h+
|y
h
x| = m := inf
yC
|y x|.
Usando lidentit` a del parallelogramma (4.3) otteniamo
2
_
_
_
y
h
y
k
2
_
_
_
2
= |y
h
x|
2
+|y
k
x|
2
2
_
_
_
y
h
+ y
k
2
x
_
_
_
2
|y
h
x|
2
+|y
k
x|
2
2m
quindi
lim
h, k+
|y
h
y
k
| = 0
e per la completezza di H possiamo concludere che y
h
converge a y. Inoltre, dato
che C `e chiuso, y C e
|y x| = lim
h+
|y
h
x| = m
quindi y `e il minimo cercato. Lunicit` a del minimo segue ancora dallidentit` a del
parallelogramma: se y, y
t
sono minimi si ha
2
_
_
_
y y
t
2
_
_
_
2
= |y x|
2
+|y
t
x|
2
2
_
_
_
y + y
t
2
x
_
_
_
2
m + m2m = 0
4.2 Basi ortonormali e serie di Fourier astratte 99
quindi y = y
t
. Verichiamo ora la (4.7): scelto z C, poniamo y
t
:= y+t(zy) C
ed usiamo la disguaglianza (per t (0, 1])
|x y|
2
|x y
t
|
2
= |x y|
2
2tx y, z y) + t
2
|z y|
2
.
Semplicando |x y|
2
, dividendo ambo i membri per t e facendo tendere t a zero
otteniamo la (4.7). Viceversa, se la (4.7) vale per un certo y C, ssiamo z C
e consideriamo la funzione
(t) := |(y + t(z y)) x|
2
.
Dalla (4.7) deduciamo che `e crescente (basta sviluppare la norma) quindi
|z x|
2
= (1) (0) = |y x|
2
.
Essendo z arbitrario, y `e minimo.
Osservazione 4.15 Elenchiamo alcune propriet` a di cui lasciamo la verica come
esercizio.
(1) Se C `e uno spazio vettoriale ane la formula sopra equivale
x y, z y) = 0 z C
e se C `e uno spazio vettoriale, x y, z) = 0 per ogni z C. Si dice in tal
caso che xy `e ortogonale a C. Linsieme dei vettori ortogonali a C si indica
con C

. Possiamo quindi dire che x si decompone in un vettore (xy) C

ed un vettore y C.
(2) Siano g
1
, g
2
: (a, b) R funzioni misurabili e sia
C :=
_
f L
2
(a, b) : g
1
(x) f(x) g
2
(x) per q.o. x (a, b)
_
.
Vericare che C `e un convesso chiuso di L
2
(a, b) e determinare loperatore di
proiezione da L
2
(a, b) in C e trovare condizioni su g
1
e g
2
che garantiscano
che C `e non vuoto.
(3) Siano
_
E
1
, | |
1
_
,
_
E
2
, | |
2
_
spazi normati completi e E := E
1
E
2
. Vericare
che
|(x, y)| :=
_
|x|
2
1
+|y|
2
2
rende E uno spazio normato completo.
100 Teoria elementare degli spazi di Hilbert
Teorema 4.16 (Teorema di Riesz) Sia H uno spazio di Hilbert e L : H R
un operatore lineare e continuo, non identicamente nullo. Allora esiste unico x H
tale che L(y) = x, y) per ogni y H.
Dim. (esistenza) Sia C la spazio vettoriale chiuso L
1
(0) e sia v H C. Detta
u C la proiezione ortogonale di v su C, indichiamo con w il vettore v u
normalizzato e verichiamo che le applicazioni lineari
L(y), L(w)w, y)
coincidono. Infatti sono entrambe nulle su C, per denizione di C e per lortogo-
nalit` a di w (Osservazione 4.15.1). Inoltre le due applicazioni coincidono per y = w,
quindi sullo spazio vettoriale R
w
generato da w. La coincidenza delle due funzioni
seguir` a allora dal fatto che ogni y H pu` o essere decomposto nella somma di un
vettore di C ed un vettore di R
w
, infatti
y =
_
y
L(y)
L(w)
w
_
+
L(y)
L(w)
w
ed il vettore tra parentesi appartiene a C:
L
_
y
L(y)
L(w)
w
_
= L(y)
L(y)
L(w)
L(w) = 0.
Basta allora porre x := L(w)w per avere la tesi.
(unicit` a) Se x, y) = x
t
, y) per ogni y H, prendendo y = x x
t
otteniamo
|x x
t
|
2
= 0 quindi x = x
t
.
Vediamo ora lapplicazione di questi discorsi astratti ad un particolare spazio
di funzioni, lo spazio L
2
(, ).
Denizione 4.17 Diremo che f `e regolare a tratti in [, ] se f `e di classe C
1
in [, ] privato di al pi` u un numero nito di punti ed in questi punti f e f
t
hanno limiti destro e sinistro niti.
Consideriamo ora una funzione regolare a tratti in [, ] (estesa per periodicit` a
ad R) e la serie di Fourier ad essa associata:
(4.8) f(x) =

n=0
a
n
cos nx +

n=1
b
n
sin nx
4.2 Basi ortonormali e serie di Fourier astratte 101
con i coecienti dello sviluppo dati da
a
n
=
_

_
1
2
_

f(x) dx se n = 0;
1

f(x) cos nx dx se n > 0


(4.9)
b
n
=
1

f(x) sin nx dx. (4.10)


Vale allora il
Teorema 4.18 Sia f regolare a tratti e 2 periodica in R.
(a) la serie di Fourier di f converge puntualmente alla media dei limiti destro e
sinistro:

n=0
a
n
cos nx +

n=1
b
n
sin nx =
1
2
_
lim
yx
+
f(y) + lim
yx

f(y)
_
;
(b) la serie di Fourier di f converge uniformemente in tutti gli intervalli chiusi
che non contengono punti di discontinuit`a di f.
Linterpretazione della serie di Fourier nel contesto degli spazi di Hilbert `e data
dal
Teorema 4.19 Lo spazio H = L
2
(, ) `e di Hilbert e separabile. Una base
ortonormale di H `e costituita dalle funzioni
v
0
=
1

2
v
n
=
1

cos nx n = 1, 2, . . . w
n
=
1

sin nx n = 1, 2, . . . .
Dim. Si verica immediatamente che le funzioni v
n
, w
n
sono a due a due ortogonali
ed hanno norma 1. Consideriamo lo spazio H delle funzioni f del tipo
f =

n=0
c
n
v
n
+

n=1
d
n
w
n
con coecienti (c
n
), (d
n
) in
2
. Lipotesi di sommabilit`a sui coecienti garantisce
che H `e un sottospazio di L
2
(, ), vale a dire, le somme parziali convergono nella
norma L
2
(, ). Gli stessi calcoli visti nel caso dellidentit` a di Parseval mostrano
inoltre che
|f|
2
=

n=0
[a
n
[
2
+

n=1
[b
n
[
2
102 Teoria elementare degli spazi di Hilbert
quindi H `e isometrico allo spazio
2

2
munito della norma prodotto introdotta
nellesercizio 6. Lo spazio H, essendo isometrico ad uno spazio completo `e completo
e, in particolare, chiuso.
Osserviamo ora che le funzioni C
1
([, ]) appartengono ad H. Infatti, data f
di questo tipo, integrando per parti abbiamo (per n 1)
c
n
=
1

n
_

f
t
(t) sin nt dt,
d
n
=
1

n
_
f() f()
_
cos n +
_

f
t
(t) cos nt dt
dalle quali `e facile dedurre che (c
n
), (d
n
) appartengono a
2
. Quindi la somma
della serie `e anche una funzione g H in quanto i coecienti sono di quadrato
sommabile. Dette ora s
n
(t) le somme parziali della serie di Fourier, sappiamo che
esse convergono puntualmente (tranne, in generale, i punti ) a f(t). Daltronde,
sappiamo anche, dallOsservazioneconvqo.3, che vi `e una sottosuccessione s
n
k
(t)
convergente quasi ovunque in (a, b) a g(t). Ne segue che f = g H.
Inne, sapendo che ogni funzione f L
2
(, ) `e limite, in norma L
2
, di
funzioni di classe C
1
([, ]), concludiamo che H = L
2
(, ).
Per ogni funzione f L
2
(, ) abbiamo quindi
(4.11) f =

n=0
c
n
v
n
+

n=1
d
n
w
n
con
c
n
= f, v
n
), d
n
= f, w
n
)
e
_

[f(x)[
2
dx =

n=0
[c
n
[
2
+

n=1
[d
n
[
2
per lidentit`a di Parseval.
Osservazione 4.20
(a) (Casi particolari)
`
E facile vedere che se f `e pari allora tutti i coecienti b
n
sono nulli e se f `e dispari tutti i coecienti a
n
sono nulli. Di fatto, la prima
sommatoria e la seconda sommatoria in (4.11) rappresentano rispettivamente
la proiezione di f sullo spazio delle funzioni pari e la proiezione di f sullo
spazio delle funzioni dispari.
4.2 Basi ortonormali e serie di Fourier astratte 103
(b) (Serie di Fourier complesse) Quanto detto nora vale senza cambiamen-
ti per funzioni a valori complessi (un caso utile in varie applicazioni), dal
momento che si pu` o ragionare separatamente sulla parte reale e sulla parte
immaginaria. Per le funzioni a valori complessi valgono quindi ancora le
formule nelle (4.9), (4.10), ma si pu` o scrivere la serie di Fourier in modo
pi` u naturale usando esponenziali complessi anziche funzioni trigonometriche
reali. Tenendo conto delle relazioni di Eulero
sin x =
1
2i
(e
ix
e
ix
), cos x =
1
2
(e
ix
+ e
ix
),
si ottiene la serie di Fourier complessa
+

k=
c
k
e
ikx
con
_
c
k
=
1
2
(a
k
ib
k
)
c
k
=
1
2
(a
k
+ ib
k
)
_
a
k
= c
k
+ c
k
b
k
= i(c
k
c
k
)
e i coecienti c
k
possono essere calcolati tramite le
c
k
=
1
2
_

f(x)e
ikx
dx, k Z.
inoltre, leguaglianza di Parseval diviene
_

[f(x)[
2
dx = 2

kZ
[c
k
[
2
.
(c) (Serie di Fourier multiple) Per avere basi ortonormali nei rettangoli di
R
k
basta considerare prodotti di seni e coseni dipendenti da una sola delle
coordinate ed aventi tutte le possibili frequenze, cio`e espressioni del tipo
cos(n
1
x
1
) cos(n
2
x
2
) sin(n
3
x
3
) . . . cos(n
x
x
k
).
In questo caso il formalismo complesso `e quasi dobbligo per semplicare le
notazioni. Ad esempio, nel rettangolo ()
k
una base ortonormale `e
v
n
(x) :=
1
(2)
k/2
e
in,x)
n Z
k
.
(d) Osserviamo che la convergenza della serie in (4.11) ha luogo in L
2
(, ),
quindi in una metrica di tipo integrale. In base ad un teorema dimostrato da
Lennart Carleson nel 1966 la serie di Fourier converge anche quasi ovunque
in (, ) per ogni f L
2
(, ).
104 Teoria elementare degli spazi di Hilbert
(c) Inne, ricordiamo altre possibili scelte di basi ortonormali in L
2
(a, b). Si
chiamano polinomi di Chebyschev in (a, b) i polinomi ottenuti applicando il
metodo di Gram-Schmidt ai vettori
(4.12) 1, t, t
2
, t
3
. . . .
Nel caso (a, b) = (1, 1) i polinomi sono anche detti polinomi di Legendre.
Nel caso (a, b) = R, per ovviare al fatto che i polinomi non sono a quadrato
sommabile si denisce
L
2

(R) :=
_
f : R R : f misurabile,
_
+

f
2
(s)e
s
2
ds < +
_
con prodotto scalare
f, g) :=
_
+

f(s)g(s)e
s
2
ds.
I polinomi ottenuti ortonormalizzando i vettori (4.12) si chiamano polinomi
di Hermite.
4.3 Teoria spettrale degli operatori autoaggiunti
compatti
`
E noto dallalgebra lineare che ogni spazio vettoriale complesso X `e isomorfo a
C
n
(che penseremo sempre dotato del prodotto scalare (4.1)), dove n `e la dimen-
sione di X. Ne segue che ogni operatore lineare T : X X si pu`o identicare con
una matrice quadrata A di dimensione n a coecienti complessi. Se ci si pone lob-
biettivo di ottenere la pi` u semplice rappresentazione matriciale di T ci si scontra
con il problema spettrale, cio`e quello di determinare gli autovalori e gli autovettori
di T. Questo permette infatti di deteminare la base di X in cui lo studio di T
risulta il pi` u semplice possibile. Nella migliore delle situazioni alloperatore T si
pu` o associare una matrice diagonale ed in tal caso loperatore T (o la matrice di
partenza A) si dice diagonalizzabile. Questo non `e sempre possibile, e quando non
`e possibile la pi` u semplice forma della matrice associata a T `e la forma canonica di
Jordan, che qui non studiamo. Il legame tra diagonalizzabilit` a e problema spettrale
`e nellequivalenza tra la diagonalizzabilit`a e lesistenza di una base di X formata
da autovettori di T.
Ricordiamo che si dice spettro delloperatore T : C
n
C
n
linsieme
(T) = C : I T non `e invertibile
4.3 Teoria spettrale degli operatori autoaggiunti compatti 105
e ricordiamo che
(T) = C : det (I A) = 0,
dove A `e una qualunque matrice associata a T. Per il Teorema del rango, secondo
il quale n = dim Ker T +dim rg T, se (T) allora I T non `e ne iniettivo ne
surgettivo.
Se cerchiamo di formulare gli analoghi problemi in spazi di Hilbert di dimensione
innita, vediamo subito che la situazione `e completamente diversa. La prima
osservazione `e che un operatore lineare in uno spazio di Hilbert potrebbe non essere
continuo (questo ovviamente non `e possibile in C
n
, ove gli operatori lineari sono
semplicemente polinomi di primo grado). Osserviamo anzitutto che T : H H `e
continuo in H se e solo se `e continuo in 0: infatti, Tx Tx
0
= T(x x
0
) e quindi
lim
xx
0
Tx = Tx
0
x
0
H lim
h0
Th = 0,
semplicemente ponendo h = x x
0
. Si pu` o inoltre provare che T : H H `e
continuo se e solo se T `e limitato, cio`e se
(4.13) |T| := sup|Tx| : |x| 1 < +.
Se T `e limitato il valore |T| si dice norma delloperatore T. Proviamo lequivalenza
tra continuit` a e limitatezza. Se T `e limitato allora
(4.14) |Tx| |T| |x| x H
e quindi Tx 0 per x 0. Viceversa, se T non `e limitato allora esiste una
successione (x
n
) tale che |x
n
| 1 e Tx
n
n; di conseguenza
x
n
n
0 e
_
_
_T
_
x
n
n
__
_
_ 1
sicche T non `e continuo. Lesistenza di operatori lineari non limitati e il fatto che
evidentemente non valga un analogo del Teorema del rango fanno capire che la
descrizione dello spettro di un operatore `e in questo caso pi` u complicata. Intanto,
in questo caso la denizione di spettro va corretta:
(T) = C : I T non ha inverso limitato
e di conseguenza se (T) si verica una delle seguenti eventualit` a:
1. I T non `e iniettivo;
2. I T non `e surgettivo;
106 Teoria elementare degli spazi di Hilbert
3. I T `e invertibile, ma linverso non `e limitato.
Nel primo caso esiste un vettore x ,= 0 tale che Tx = x, come nel caso nito
dimensionale, ma negli altri casi non `e detto, come mostra il seguente
Esempio 4.21 (Operatore di shift) Consideriamo in
2
loperatore T che alla
successione = (
1
, . . . ,
n
, . . .) associa la successione T = (0,
1
,
2
, . . . ,
n
, . . .).
`
E chiaro che T `e iniettivo e non `e surgettivo, quindi non `e invertibile e 0 (T):
non esiste per`o alcun vettore x ,= 0 tale che Tx = 0, quindi 0 non `e un autovalore.
Chiameremo spettro puntuale di T, denotato
p
(T), linsieme degli autovalori di T,
cio`e del numeri C tali che esiste un vettore x ,= 0 (autovettore associato a )
con Tx = x.
Veniamo ora ad un altro aspetto della teoria. Da (4.14) segue che T `e un
operatore limitato se e solo se TB H `e limitato per ogni B H limitato:
infatti, |x| L per ogni x B implica |Tx| L|T|. In dimensione nita
questo equivale a dire che la chiusura di TB `e un insieme compatto per ogni insieme
B limitato. In dimensione innita questo non `e pi` u vero perche non tutti gli
insiemi chiusi e limitati sono compatti. Ricordiamo che C si dice compatto se ogni
successione (x
n
) di elementi di C ammette unestratta convergente ad un punto di
C. La palla unitaria chiusa di H per`o, pur essendo un insieme chiuso e limitato,
non `e compatto. Basta considerare come successione gli elementi di una base
ortonormale (e
n
) e vericare che |e
n
e
k
| =

2 per n ,= k: `e chiaro che (e


n
) non
ha alcuna estratta convergente. Da quanto detto risulta signicativa la seguente
Denizione 4.22 Loperatore T : H H si dice compatto se per ogni B H
limitato la chiusura TB dellinsieme immagine `e compatta.
Dato un insieme C, la propriet` a che C sia compatto si esprime dicendo che C
`e relativamente compatto. Non tutti gli operatori limitati sono compatti: per
esempio lidentit` a, Tx = x, `e ovviamente limitato ma non `e compatto, dal momento
che TB = B per ogni B H e per esempio B = |x| 1 `e limitato ma
non `e compatto, come abbiamo visto. Vediamo due esempi di operatori integrali
compatti.
Esempio 4.23 Siano I = [0, 1] ed H = L
2
(I); consideriamo loperatore
Tu(x) =
_
x
0
u(t) dt, u H.
4.3 Teoria spettrale degli operatori autoaggiunti compatti 107
T `e un operatore limitato; infatti per la diseguaglianza di Cauchy-Schwarz si ha
|Tu|
2
H
=
_
1
0

_
x
0
u(t) dt

2
dx
_
1
0
x
_
x
0
[u(t)[
2
dt |u|
2
H
.
Loperatore T `e anche compatto, e per provarlo sfrutteremo il Teorema di Ascoli-
Arzel` a presentato in Appendice, vedi Teorema A.3. Se B `e un insieme limitato,
diciamo |u|
H
M per ogni u B, proviamo che T = TB `e limitato in norma
| |
L

(I)
ed equicontinuo. Intanto, ragionando come prima, si ha
[Tu(x)[ |u|
H
per ogni x I, quindi |Tu|
L

(I)
M per ogni u B. Per quanto riguarda
lequicontinuit`a, osserviamo che
[Tu(x) Tu(y)[ =

_
y
x
u(t) dt

_
y
x
[u(t)[
2
dt

1/2_
[x y[ M
_
[x y[
e quindi, ssato > 0, la (A.5) vale con =
2
/M
2
(indipendente da u B). Per
il Teorema di Ascoli-Arzel`a linsieme TB `e relativamente compatto rispetto alla
convergenza uniforme. Siccome la convergenza uniforme implica quella L
2
linsieme
TB `e relativamente compatto anche in H.
Esempio 4.24 Siano R
n
un aperto limitato ed H = L
2
(). Data la funzione
K C( ), consideriamo loperatore integrale
(4.15) Tf(x) =
_

K(x, y)f(y) dy, f H.


Tenendo conto che K `e uniformemente continua e limitata in , verichiamo
che T `e continuo. Dalla diseguaglianza di Cauchy-Schwarz segue infatti
[Tf(x)[
_

[K(x, y)[ [f(y)[ dy sup


(x,y)
[K(x, y)[[m
n
()]
1/2
|f|
H
,
quindi TB `e limitato in norma L

ed in norma L
2
. Loperatore T `e anche com-
patto: ssato M > 0, sia B f H : |f| M. Per ogni f B si
ha
[Tf(x
1
) Tf(x
2
)[
_

[K(x
1
, y) K(x
2
, y)[ [f(y)[ dy
sup
y
[K(x
1
, y) K(x
2
, y)[[m
n
()]
1/2
M
e per luniforme continuit`a di K la famiglia T = TB `e equicontinua. Per il Teo-
rema di Ascoli-Arzel`a TB `e relativamente compatto in C(). Di conseguenza, `e
relativamente compatto anche in L
2
().
108 Teoria elementare degli spazi di Hilbert
Una classe di operatori compatti sono quelli di rango nito cio`e quegli operatori
T : H H tali che limmagine rg T sia un sottospazio di H di dimensione nita.
Si pu` o dimostrare che per ogni operatore compatto T esiste una successione (T
n
)
di operatori di rango nito tale che |T
n
T| 0 per n . In generale, vale il
seguente
Teorema 4.25 Linsieme degli operatori compatti in H `e chiuso, cio`e se T `e un
aoperatore lineare su H e (T
h
) `e una successione di operatori compatti tale che
lim
h
|T
h
T| = 0 allora T `e compatto.
Osservazione 4.26 Pi` u in generale rispetto allesempio 4.24, consideriamo una
funzione K L
2
( ); loperatore (4.15) `e ancora compatto. Questo si pu`o
dimostrare approssimando in L
2
( ) il nucleo K con una successione K
h
di
nuclei continui in e vericando che gli operatori integrali associati, siano T
h
,
convergano in norma a T, lim
h
|T
h
T| = 0. Gli operatori T
h
sono compatti,
e per il Teorema 4.25 `e compatto anche T.
Veniamo ora alla diagonalizzabilit` a: in dimensione nita una classe impor-
tante di operatori diagonalizzabili `e quella degli operatori hermitiani, cio`e tali che
Tx, y) = x, Ty) per ogni x, y C
n
. Tali operatori hanno anche la fondamentale
propriet` a che il loro autovalori sono reali. Infatti, se (T) e x `e un autovettore
associato a si ha
(4.16) |x|
2
= x, x) = Tx, x) = x, Tx) = x, x) =

|x|
2
,
da cui =

e R. Inoltre, se T `e hermitiano allora autovettori associati ad
autovalori distinti sono ortogonali. Infatti, se ,= sono due autovalori di T = T

ed x, y sono autovettori associati rispettivamente a , risulta


(4.17) x, y) = x, y) = Tx, y) = x, Ty) = x, y) = x, y)
e questo `e possibile solo se x, y) = 0. Un operatore hermitiano coincide col proprio
aggiunto T

, denito da
(4.18) y = T

x Tz, x) = z, y) z C
n
.
In termini di matrici, se A = (a
hk
) `e la matrice associata a T, la matrice associata
a T

`e A

= (a

hk
) con a

hk
= a
kh
e quindi T `e hermitiano se e solo se a
hk
= a
kh
.
In uno spazio H di dimensione innita si pu` o denire loperatore aggiunto T

di T usando (4.18), con H al posto di C


n
, la classe degli operatori autoaggiunti
4.3 Teoria spettrale degli operatori autoaggiunti compatti 109
come quella per cui T

= T, e gli stessi calcoli (4.16), (4.17) mostrano che gli


autovalori di un operatore autoaggiunto sono reali e che autovettori relativi ad
autovalori distinti sono ortogonali. Vale anche in dimensione innita il seguente
fondamentale risultato di diagonalizzabili`a degli operatori autoaggiunti compatti.
Teorema 4.27 Sia T : H H un operatore autoaggiunto e compatto. Allora
1. 0 (T), quindi T non `e invertibile;
2. (T) 0
p
(T) [|T|, |T|], cio`e (escludendo al pi` u lo 0, che potrebbe
non essere un autovalore) lo spettro `e formato solo da autovalori reali ed `e
un insieme limitato;
3. autovettori corrispondenti ad autovalori distinti sono ortogonali tra loro;
4. si verica una delle seguenti situazioni:
(i) (T) = 0; in questo caso T = 0;
(ii) (T) 0 `e un insieme nito;
(iii) (T) 0 `e una successione che tende a 0.
5. ogni autospazio relativo ad un autovalore ,= 0 ha dimensione nita;
6. esiste una base hilbertiana ortogonale di H formata da autovettori di T;
7. rispetto alla base e
n
data dal punto precedente e detti
n
gli autovalori di
T, risulta
Tx =

n=1

n
x, e
n
)e
n
per ogni x H.
La classe principale di operatori a cui sar` a applicata la teoria esposta n qui
`e quella degli operatori dierenziali ordinari del secondo ordine con condizioni ai
limiti. Specicamente, considereremo operatori dierenziali del tipo
(4.19) Lu = (pu
t
)
t
+ qu,
in un intervallo I = [a, b], dove p C
1
(I), p(x) > 0 per ogni x I, e q C(I),
con condizioni ai limiti
(4.20)
_

0
u(a) +
1
u
t
(a) = 0

0
u(b) +
1
u
t
(b) = 0
(
0
,
1
) ,= (0, 0), (
0
,
1
) ,= (0, 0).
110 Teoria elementare degli spazi di Hilbert
In varie applicazioni si ha interesse a studiare loperatore
L

u = (pu
t
)
t
+ (q + r)u,
al variare del parametro , che ovviamente non compare come un autovalore del-
loparatore L in senso stretto (anche se la terminologia usuale `e un po ambigua),
ma piuttosto come un autovalore delloperatore
1
r
L. Lo spazio di Hilbert H sar` a
uno spazio L
2
(I, ), con d = r(x)dx una misura assolutamente continua rispetto
a quella di Lebesgue con un peso r C(I), r(x) > 0 in I. Notiamo che questo tipo
di problema `e di natura diversa dal problema di Cauchy, in quanto le condizioni
che determinano la soluzione del problema (4.19), (4.20) sono assegnate in punti
diversi. Dalla teoria generale delle equazioni lineari sappiamo che tutte le soluzioni
della (4.19) sono globali e che la soluzione generale `e data da tutte le combinazioni
lineari di due soluzioni linearmente indipendenti. Supposto di averle determinate,
siano u
1
ed u
2
, le condizioni ai limiti si possono soddisfare se `e possibile determinare
coecienti c
1
, c
2
tali che u = c
1
u
1
+ c
2
u
2
verichi (4.20).
Osservazione 4.28 Pu` o sembrare arbitrario studiare equazioni della forma (4.19),
ma in realt`a la forma di L `e generale: se si considera un operatore del tipo
m
0
u
tt
+ m
1
u
t
+ m
2
u, supposto m
0
(x) > 0 in I (altrimenti si cade nel caso di ope-
ratori degeneri per i quali la teoria `e ben diversa) dividendo per m
0
ci si riconduce
anzitutto al caso delloperatore u
tt
+mu
t
+qu, e poi, posto p(x) = exp
_
m(x)dx,
si ha
u
tt
+ mu
t
+ qu =
1
p
(pu
t
)
t
+ qu
quindi studiare lequazione u
tt
+mu
t
+qu = f in L
2
(I, rdx) `e equivalente a studiare
lequazione Lu = pf in L
2
(I, (r/p)dx.
Tenendo conto di tutte le considerazioni esposte n qui, possiamo enunciare il
Teorema 4.29 (Teorema di Sturm-Liouville) Esiste una successione di nu-
meri reali (L) =
n
+ tale che lequazione
(4.21) L

u = (pu
t
)
t
+ (q + r)u = 0,
con le condizioni ai limiti (4.20), ha soluzioni non nulle solo per (L). Per ,=
0 ogni autospazio ha dimensione 1, autofunzioni relative ad autovalori diversi sono
ortogonali e le autofunzioni linearmente indipendenti formano una base ortogonale
di L
2
(I, rdx).
4.3 Teoria spettrale degli operatori autoaggiunti compatti 111
Come abbiamo spiegato, usiamo a volte la terminologia della teoria spettrale
anche se (L) non `e lo spettro delloperatore L ma delloperatore
1
r
L (vedi anche
lOsservazione 4.31.2 e il Teorema 4.33. In realt`a `e pi` u naturale scrivere lequazione
nella forma (4.21), ma le autofunzioni sono ortogonali in L
2
(I, rdx).
Se , (L) si pu`o rappresentare la soluzione dellequazione L

u = f con le
condizioni (4.20) attraverso un operatore integrale.
Teorema 4.30 Se non `e un autovalore delloperatore L e u
1
, u
2
sono due solu-
zioni linearmente indipendenti di L

u = 0 vericanti (4.20), u
1
in a ed u
2
in b,
posto W(x) = u
1
(x)u
t
2
(x) u
t
1
(x)u
2
(x), deniamo la funzione di Green
(4.22) G(x, y) =
1
p(x)W(x)
_
u
1
(x)u
2
(y) a x y b
u
1
(y)u
2
(x) a y x b
.
Allora, per ogni f L
2
(I, rdx) la funzione
(4.23) u(x) =
_
I
G(x, y) f(y) dy
`e la soluzione del problema ai limiti L

u = f, (4.20).
Osservazione 4.31
1. La dimostrazione del teorema precedente consiste in una verica diretta di
cui non presentiamo i dettagli. Sembra pi` u interessante segnalare alcune
propriet` a della funzione di Green G:
(i) G C
2
(I
2
x = y) ed `e soluzione dellequazione L

u = 0, sia rispetto
ad x che ad y, fuori dalla diagonale x = y;
(ii) G verica le condizioni (4.20);
(iii) le derivate prime di G sono discontinue sulla diagonale, e vale la re-
lazione
lim
h0

x
G(x + h, x)

x
G(x h, x) =
1
p(x)
.
2. Le condizioni ai limiti (4.20) garantiscono che loperatore
1
r
L sia simmetrico
in L
2
(I, rdx); denotando al solito con , ) il prodotto scalare, risulta infatti,
integrando due volte per parti,

1
r
Lu, v) =
_
I
[(pu
t
)
t
+ qu] v dx =
_
pu
t
v
_
b
a

_
I
pu
t
v
t
dx
=
_
pu
t
v
_
b
a

_
pu v
t
_
b
a
+
_
I
u L v dx = u,
1
r
Lv)
112 Teoria elementare degli spazi di Hilbert
grazie alle condizioni (4.20). Pi` u in generale, si possono considerare le con-
dizioni ai limiti
_

00
u(a) +
01
u
t
(a) =
00
u(b) +
01
u
t
(b)

10
u(a) +
11
u
t
(a) =
10
u(b) +
11
u
t
(b) = 0
(in cui rientrano, ad esempio, le condizioni di periodicit`a), purche
p(b) det
_

00

01

10

11
_
= p(a) det
_

00

01

10

11
_
Sotto tali ipotesi la condizione di simmetria delloperatore
1
r
L `e ancora sod-
disfatta e il Teorema di Sturm-Liouville 4.29 vale ancora, con lunica variante
che gli autospazi associati agli autovalori non nulli possono avere dimensione
2.
3. Le condizioni di simmetria delloperatore
1
r
L garantiscono che linverso di L

per , , dato dalloperatore integrale (4.23), compatto come nellEsempio


4.24, `e anche autoaggiunto e quindi si pu` o applicare il Teorema 4.27.
Esempio 4.32 Consideriamo loperatore Lu = u
tt
in I = [0, 1] con condizioni di
Dirichlet negli estremi, cio`e il problema ai limiti
_
u
tt
+ u = 0
u(0) = u(1) = 0
.
Si trova che il problema ammette soluzioni non nulle solo se = n
2
con n N,
n 1 e le autofunzioni sono
n
(x) = sin(nx), che com`e noto formano un sistema
ortogonale completo in L
2
(I). In particolare, 0 non `e un autovalore, quindi si pu` o
scrivere la funzione di Green del problema
_
u
tt
= f
u(0) = u(1) = 0
ottenendo u
1
(x) = x, u
2
(x) = 1 x, W(x) = 1 e quindi
G(x, y) =
_
x(1 y) 0 x y 1
y(1 x) 0 y x 1
.
La soluzione del problema `e quindi data da
u(x) =
_
I
G(x, y) f(y) dy = x
_
x
0
(1 y)f(y) dy (1 x)
_
1
x
yf(y) dy.
4.3 Teoria spettrale degli operatori autoaggiunti compatti 113
Il Teorema 4.30 mostra in particolare che se non `e un autovalore delloperatore
L allora il problema ai limiti L

u = f, (4.20) ha lunica soluzione data da (4.23).


Che cosa accade se `e un autovalore?
Teorema 4.33 Se (L), cio`e `e un autovalore delloperatore
1
r
L, allora il
problema ai limiti L

u = rf, (4.20), ha innite soluzioni se f, )


L
2
(I,rdx)
= 0 per
ogni autofunzione associata a , e non ha alcuna soluzione altrimenti.
Dim. Per risolvere il problema, detti
n
gli autovalori e
n
le autofunzioni di
1
r
L,
e sviluppata f nella forma
f =

n=1
f
n

n
, f
n
=
_
I
f
n
r dx,
cerchiamo la soluzione u nella forma
u =

n=1
u
n

n
, u
n
=
_
I
u
n
r dx.
Supposto =
k
con k N, sostituendo u ed f nellequazione L

k
u = f, si ha
1
r
L

k
u =
1
r

n=1
u
n
[(p
t
n
)
t
+ (q +
k
r)
n
] =

n=1
u
n
(
k

n
)
n
=

n=1
f
n

n
da cui si ricava la successione di equazioni
(
k

n
)u
n
= f
n
, n N,
che ha innite soluzioni
u
n
=
1

k

n
f
n
, n N, n ,= k, u
k
arbitrario,
se f
k
= 0 e non ne ha nessuna se f
k
,= 0.
114 Teoria elementare degli spazi di Hilbert
Appendice A
Richiami
A.1 Massimo e minimo limite
Ricordiamo che per una successione reale (a
n
) si deniscono il minimo limite
ed il massimo limite ponendo
liminf
n+
a
n
= sup
nN
inf
kn
a
k
, limsup
n+
a
n
= inf
nN
sup
kn
a
k
.
Commentiamo solo la denizione di minimo limite, lasciano per esercizio la ri-
formulazione delle considerazioni che seguono al caso del massimo limite. Data
(a
n
), si pu` o costruire la successione (e
t
n
) ponendo e
t
n
= inf
kn
a
k
per ogni n N.
Siccome ad ogni passo si calcola lestremo inferiore su un insieme pi` u piccolo, la
Successione (e
t
n
) `e crescente e quindi esiste il suo limite, e coincide con sup
n
e
t
n
.
Inoltre, dalle propriet` a dellestremo inferiore e dellestremo superiore si ricava la
seguente caratterizzazione del minimo limite:
= liminf
n+
a
n
se e solo se valgono le condizioni:
(a) per ogni > 0 esiste > 0 tale che a
n
> per ogni n > ;
(b) per ogni > 0 e per ogni N esiste n > tale che a
n
< + .
Ne segue in particolare che liminf
n+
a
n
`e il pi` u piccolo tra i numeri reali che
godono della propriet` a che esiste una successione estratta da (a
n
) convergente ad
. Analogamente,
= limsup
n+
a
n
se e solo se valgono le condizioni:
(a) per ogni > 0 esiste > 0 tale che a
n
< + per ogni n > ;
115
116 Richiami
(b) per ogni > 0 e per ogni N esiste n > tale che a
n
> .
e limsup
n+
a
n
`e il pi` u grande tra i numeri reali che godono della propriet`a
che esiste una successione estratta da (a
n
) convergente ad . Ovvia conseguenza
di quanto detto `e che liminf
h
f
h
limsup
h
f
h
, con uguaglianza se e solo se
esiste il limite di a
n
.
A.2 Insiemi numerabili
Agli insiemi costituiti da un numero nito di elementi associamo in modo ele-
mentare il numero naturale che ci dice quanti elementi contiene, e fra due insiemi
niti esiste unapplicazione biunivoca se e solo se essi contengono lo stesso numero
di elementi. Di conseguenza, non pu` o esistere unapplicazione biunivoca tra un in-
sieme nito ed una sua parte propria. Questa propriet` a distingue gli insiemi niti
da quelli inniti. Infatti, un insieme si dice innito se `e in corrispondenza biunivo-
ca con una sua parte propria. Lesempio pi` u semplice `e probabilmente quello degli
insiemi N e P dei numeri pari. Ovviamente P N, e quindi P `e un sottoinsieme
proprio di N, ma ci` o non ostante lapplicazione f : N P denita da f(n) = 2n `e
biunivoca (N contiene solo il doppio degli elmenti di P). Questo per` o non vuol
dire che fra due insiemi inniti esista sempre unapplicazione biunivoca, e quindi
bisogna accettare lidea che esiste una gerarchia fra gli insiemi inniti, cio`e che
anche fra gli insiemi inniti ce ne siano di pi` u o meno numerosi. Questidea vaga
si pu` o formalizzare, ma ci` o esula dagli scopi del corso: ci limitiamo ad osservare
che se X `e un insieme innito allora non c`e mai unapplicazione biunivoca tra X
e linsieme T(X) di tutti i suoi sottoinsiemi, che risulta molto pi` u numeroso di
X. Linsiemie N `e il pi` u piccolo insieme innito, e si dice che un insieme E `e
numerabile se esiste unapplicazione surgettiva x = x
n
: N E. Rivolgendo il nos-
tro interesse agli insiemi numerici, `e ovvio che anche linsieme Z dei numeri interi
`e numerabile (contiene solo il doppio degli elmenti di N), mentre la situazione `e
di gran lunga meno intuitiva per quanto riguarda Q ed R. Risulta:
Teorema A.1 Linsieme Q `e numerabile, mentre R non lo `e.
A.3 Il teorema di Riemann sui riordinamenti 117
Dim. Scriviamo Q come matrice innita
1
1

2
1
3
1

4
1


1
2
2
2
3
2
4
2


1
3
2
3
3
3
4
3

.
.
.
dove le frecce hanno il seguente signicato: partendo dallelemento in alto a sin-
istra (il numero 1) la freccia porta induttivamente il numero razionale f(n) nel
termine successivo f(n+1) della successone (f(n))
nN
che stiamo denendo. Ci si
convince immediatamente che la funzione cos` denita `e surgettiva e quindi che Q
`e numerabile.
Viceversa, supponiamo che R sia numerabile. allora lo sar`a anche linterval-
lo [0, 1], sicche, ssata una convenzione che induca ununica rappresentazione
decimale con parte intera nulla, possiamo scrivere lintero intervallo [0, 1] come
successione (x
n
) in modo tale che
x
1
= 0, a
11
a
12
a
13

x
2
= 0, a
21
a
22
a
23

x
3
= 0, a
31
a
32
a
33

.
.
.
x
n
= 0, a
n1
a
n2
a
n3
a
nn

.
.
.
e le cifre decimali a
nk
sono numeri interi tra 0 e 9. Allora, scelta la successione
(b
n
) tale che b
n
,= a
nn
per ogni n, il numero reale x = 0, b
1
b
2
b
3
b
n
appartiene
a [0, 1] perche ha parte intera nulla, ma non `e nessuno degli x
n
perche per ogni n
dierisce da x
n
(almeno) per ln-esima cifra decimale. Questo prova che [0, 1] ( e
quindi R) non `e numerabile.
A.3 Il teorema di Riemann sui riordinamenti
Richiamiamo alcune propriet` a delle serie numeriche usate in relazione alle mis-
ure reali. Le considerazioni che seguono dovrebbero far capire quanta distanza ci
sia tra le serie e le somme nite. Una delle propriet`a pi` u ovvie delle somme
118 Richiami
nite `e la propriet` a commutativa.
`
E naturale domandarsi se essa valga anche per
le serie. Per formulare correttamente il problema bisogna introdurre il concetto
di permutazione dei termini di una serie. Date la serie

k
a
k
ed una funzione
bigettiva : N N (permutazione), si dice serie ottenuta permutando i termini di

k
a
k
secondo la serie

k
a
(k)
. Notiamo che i valori assunti dalla successione
(a
(k)
)
kN
sono gli stessi di (a
k
)
kN
, e vengono assunti lo stesso numero di volte,
per cui se avessimo a che fare con una somma nita passare da

k
a
k
a

k
a
(k)
si ridurrebbe a cambiare lordine degli addendi, ed `e ben noto che in tal caso la
somma non cambia. Per le serie innite le cose vanno in modo completamente
diverso, a meno che non si abbia convergenza assoluta.
Teorema A.2 Sia

k
a
k
una serie semplicemente convergente. Allora:
(i) se la serie

k=0
a
k
converge assolutamente e la sua somma `e S, allora per ogni
permutazione la serie

k=0
a
(k)
converge assolutamente ed ha per somma
S.
(ii) se la serie

k=0
a
k
non converge assolutamente, allora nessuna serie permuta-
ta converge assolutamente, ed inoltre per ogni S R esiste una permutazione
tale che la serie permutata

k=0
a
(k)
converga (semplicemente) ad S.
Non presentiamo la dimostrazione di questo risultato, ma ci limitiamo a sot-
tolineare ancora la dierenza tra le somme nite e le serie non assolutamente
convergenti: queste, cambiando lordine degli addendi, possono dare qualunque
somma!
A.4 Il teorema della divergenza
In questo paragrafo richiamiamo lenunciato del teorema della divergenza ed
alcune sue applicazioni. Un aperto A R
n
si dice regolare se si pu` o scrivere nella
forma < 0 per una funzione C
1
(R
n
) con (x) ,= 0 per ogni x tale che
(x) = 0. Sotto queste condizioni la frontiera di A coincide con linsieme = 0
e il versore =

[[
= (
1
, . . . ,
n
) `e perpendicolare a A ed ha direzione uscente
da A. Supposto n = 3, vale allora la seguente uguaglianza:
(A.1)
_
A
gD
i
fdx =
_
A
gf
i
d
_
A
fD
i
gdx,
per ogni coppia di funzioni f, g C
1
(R
3
) e per igni i = 1, 2, 3. Questa formula
generalizza al caso 3-dimensionale la formula di integrazione per parti in una vari-
abile (in questultimo caso, con A = (a, b), allintegrale sul bordo corrisponde la
A.5 Il Teorema di Ascoli-Arzel` a 119
quantit` a f(b)g(b) f(a)g(a), che coinvolge ancora i valori di f e g negli estremi
il bordo! dellintervallo). Notiamo anche che non c`e ragione di limitarsi al caso
3-dimensionale, se non per il fatto che non si suppone nota una nozione di misura
(n 1)-dimensionale in R
n
che generalizzi la misura di supercie d e, corrispon-
dentemente, non si suppone nota la teoria degli integrali (n 1)-dimensionali in
R
n
. In realt` a le generalizzazioni dette sono ben note, ma esulano dagli scopi del
corso. Fatto ci` o, la (A.1) e tutto quello che seguir`a vale in R
n
.
Se consideriamo ora un campo vettoriale F = (F
1
, F
2
, F
3
) di classe C
1
(R
3
) e
sommiamo la (A.1) per i = 1, 2, 3 otteniamo
(A.2)
_
A
g divFdx =
_
A
gF, )d
_
A
F, g)dx,
che `e lenunciato classico del teorema della divergenza. Se poi, come caso partico-
lare, prendiamo F = f con f C
2
(R
n
), ricordando che divf = f =

i
D
2
ii
f
(Laplaciano di f, denotato anche
2
f), otteniamo
(A.3)
_
A
g fdx =
_
A
gf, )d
_
A
f, g)dx;
supponendo anche g C
2
(R
n
), possiamo applicare la (A.1) agli addendi nellultimo
integrale e scrivere
_
A
D
i
gD
i
fdx =
_
A
fD
i
g
i
d
_
A
D
i
fD
2
ii
gdx,
da cui
_
A
f, g) dx =
_
A
fDg, ) d
_
A
fg dx
e nalmente la formula di Green
(A.4)
_
A
g fdx =
_
A
gf, )d
_
A
fg, )d
_
A
f gdx.
Questa formula `e stata usata negli Esempi 2.17, 2.18.
A.5 Il Teorema di Ascoli-Arzel`a
Il Teorema di Ascoli-Arzel` a caratterizza le famiglie relativamente compatte di
funzioni continue, cio`e gli insiemi T di funzioni continue su un insieme compatto
D R
n
tali che ogni successione (f
h
) T ammetta unestratta uniformemente
convergente. Dato T C(D), ricordiamo che a tal ne `e condizione necessaria che
120 Richiami
linsieme T sia limitato in norma, cio`e che esista M > 0 tale che |f|
L

(D)
M
per ogni f T. Inoltre, diciamo che T `e un insieme equicontinuo se per ogni > 0
esiste > 0 tale che
(A.5) x, y D, [x y[ < = [f(x) f(y)[ < f T.
Notiamo che lequicontinuit`a consiste nel fatto che dipende solo da ma non
dipende da f T.
Teorema A.3 Se T C(D) `e limitato ed equicontinuo allora ogni successione
(f
h
) T ammette unestratta uniformemente convergente in C(D).
Dim. Poiche X = D Q `e numerabile, possiamo scrivere X = x
j
, j N come
una successione in D. Notiamo che per j N ssato ogni successione (f
h
(x
j
))
hN
`e limitata, e perci` o, grazie al teorema di Bolzano-Weierstrass, ammette unestrat-
ta convergente. Usiamo iterativamente questargomento, partendo da (f
h
(x
1
))
hN
.
Al primo passo otteniamo una successione f
(1)
h
ed un numero reale y
1
tali che
f
(1)
h
(x
1
) y
1
per h ; al secondo passo applichiamo largomento alla succes-
sione (f
(1)
n
(x
2
))
nN
e otteniamo una successione (f
(2)
h
), estratta da (f
(1)
h
), ed y
2
R
tali che f
(2)
h
(x
2
) y
2
per h . Al passo k troveremo una successione (f
(k)
h
)
hN
tale che f
(k)
h
(x
j
) y
j
per h per ogni j = 1, . . . , k. La successione diagonale
g
h
= f
(h)
h
quindi `e tale che g
h
(x
j
) y
j
per h per ogni x
j
X. Notiamo
che se |f|
L

(D)
M allora [y
j
[ M per ogni j: n qui abbiamo usato solo la
limitatezza di T. Sia ora > 0, e sia > 0 tale che valga (A.5). Ricopriamo D
con s palle B
j
, j = 1, . . . , s, di diametro minore di , e scegliamo in ciascuna di
esse un punto
j
X B
j
. Le s successioni (g
h
(
j
))
hN
sono di Cauchy e sono un
numero nito s, quindi esiste un > 0 tale che per h > risulta
(A.6) [g
h
(
j
) g
k
(
j
)[ < j = 1, . . . , s.
Sfruttiamo ora lequicontinuit` a di T. Per ogni x D esiste un indice j tale che
x,
j
B
j
, quindi [x
j
[ < , e grazie a (A.5) ed (A.6) si ha
[g
h
(x) g
k
(x)[ [g
h
(x) g
h
(
j
)[ +[g
h
(
j
) g
k
(
j
)[ +[g
k
(
j
) g
k
(x)[ < 3
per ogni h, k > . La relazione precedente vale per ogni x D, quindi prova
che la successione (g
h
)
hN
verica la condizione di Cauchy uniforme in D e di
conseguenza, per il criterio di Cauchy uniforme, `e ivi uniformemente convergente
ad una funzione f C(D).
A.5 Il Teorema di Ascoli-Arzel` a 121
Osservazione A.4 Vediamo alcuni casi particolari del Teorema di Ascoli-Arzel` a.
1.
`
E molto frequente il caso in cui T `e una successione di funzioni di cui si
vuol sapere se ha unestratta convergente.
`
E semplice vericare che la sola
limitatezza in norma non basta; per esempio la successione f
n
(x) = sin(nx)
in [0, 2] non ha estratte uniformemente convergenti: se ce ne fosse una,
convergerebbe anche in L
2
([0, 2]), mentre sappiamo che ci`o non pu`o accadere
a causa dellortogonalit`a.
2. A volte la verica dellequicontinuit`a si basa su una stima del tipo
[f(x) f(y)[ C[x y[ f T,
da cui segue subito che si pu` o prendere = /C in (A.5). Sappiamo che
le funzioni vericanti la stima precedente sono quelle lipschitziane e se tale
stima vale per ogni f T con la stessa C si dice che T `e equilipschitziana.
In dimensione 1 la stima di lipschitzianit` a `e equivalente ad una stima del
rapporto incrementale delle f T del tipo

f(x) f(y)
x y

C f T.
3. Pu` o accadere che le funzioni in T non siano equilipschitziane, ma che si riesca
ad ottenere una stima (signicativa in ogni dimensione) del tipo
[f(x) f(y)[ C([x y[) f T,
dove (t) 0 per t 0. Questo `e il caso dellEsempio 4.23, con (t) =

t.
Pi` u in generale, si punta ad una stima del tipo
[f(x) f(y)[ (x, y) f T,
con vericante la condizione che per ogni > 0 esiste > 0 tale che
[x y[ < implica [(x, y)[ < . Questo `e il caso dellEsempio 4.24.