Elementi Di Analisi Funzionale PDF

Prefazione
Questa breve monografia si propone di presentare in modo piano e sintetico, ma con dimo-
strazioni rigorose e generalmente complete, i principali temi e metodi dell’Analisi funzionale. Si
è cercato di selezionare e proporre percorsi che siano quanto piú possibile “naturali”, partendo
da nozioni elementari e procedendo verso argomenti classici piú avanzati, quali i teoremi fon-
damentali dell’Analisi funzionale, le topologie deboli e deboli*, gli operatori duali e il teorema
dell’immagine chiusa, le questioni di compattezza e compattezza sequenziale. Si sono voluti
inserire brevemente temi non frequenti in monografie di questo tipo, quali risultati di punto
fisso (Brouwer, Schuauder) e di punti di equilibrio (Nash, Ky Fan, Aubin), teoria dei giochi o
gamma-convergenza (DeGiorgi), accanto a temi tradizionali quali elementi di teoria spettrale,
problemi ellittici in dimensione 1, serie di Fourier e risultati fondamentali sulle funzioni continue
(Baire, Stone-Weierstrass). Spesso si è avuto cura di presentare significativi controesempi per
illuminare a fondo i concetti essenziali.
Il testo che presentiamo nasce da una lunga riflessione sui principi fondamentali, riduzione
all’essenziale, rielaborazione, completamento ed estensione di parte degli appunti di un corso
di Istituzioni di Analisi superiore tenuto per molti anni per il Corso di laurea in Matematica
della Facoltà di Scienze M.F.N. dell’Università di Torino. Ha tuttavia l’ambizione di non essere
semplicemente un’opera didattica, ma di fornire un supporto direttamente utile per l’attivià di
ricerca, anzi di sollecitare interrogativi sui fondamenti che potrebbero suggeririre nuove indagini.
Il corso di Istituzioni di Analisi superiore del vecchio ordinamento era diviso in due moduli.
Il primo modulo, rivolto a tutti gli studenti del secondo biennio, oltre a primi elementi di ana-
lisi funzionale e di teoria delle funzioni olomorfe, proponeva le basi della teoria della misura e
dell’integrazione e svolgeva inoltre essenzialmente il contenuto dei Capitoli 1 e 3 e presentando
una sintesi dei risultati dei Capitoli 4 e 5 di questo testo. Il materiale degli altri capitoli era
utilizzato, parzialmente, nel secondo modulo, che aveva un carattere più avanzato e presentava,
oltre a complementi di teoria della misura, temi concernenti i fondamenti dell’analisi funzionale,
alcuni metodi di compattezza, elementi di teoria spettrale e di analisi armonica.
Con il nuovo ordinamento, la teoria delle funzioni olomorfe e i primi elementi di analisi funziona-
le sono presentati in Analisi IV (laurea triennale e laurea specialistica), mentre le questioni piú
avanzate di analisi funzionale e di teoria generale della misura e dell’integrazione sono trattate
nel corso di Istituzioni di Analisi (laurea specialistica). Molti temi presenti in questa monografia
potrebbero essere utili per un corso base di Analisi per il Dottorato.
Torino, novembre 2004

ANGELO NEGRO
Indice
1 Spazi normati 5
1.1 Spazi metrici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Spazi normati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Seminorme e spazi localmente convessi . . . . . . . . . . . . . . . . . . . . 12
1.4 Insiemi ordinati e spazi di Riesz . . . . . . . . . . . . . . . . . . . . . . . . 14
2 Punti fissi. Punti di equilibrio e Teoremi di min-max. Γ-convergenza 17

2.1 Punti fissi di contrazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Punti fissi in insiemi parzialmente ordinati e Lemma di Zorn . . . . . . 20
2.3 I teoremi di Brouwer e Schauder . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 Punti di equilibrio. Teoremi di minimax . . . . . . . . . . . . . . . . . . . 31
2.5 Gamma convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3 Operatori lineari. Equazioni integrali 47

3.1 Lo spazio L(X, Y ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 La serie di Neumann e l’inseme GL(X, Y ). . . . . . . . . . . . . . . . . . . 49
3.3 Operatori integrali in C([a, b]) . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.4 Equazioni integrali in C([a, b]) . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5 Approssimazione di equazioni integrali mediante nuclei separabili di
rango finito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4 Spazi di Hilbert 63
4.1 Forme sesquilineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.2 Il teorema delle proiezioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.3 Basi ortonormali e serie di Fourier generalizzate . . . . . . . . . . . . . . 70
4.4 Il duale di uno spazio di Hilbert e il teorema di Riesz. La convergenza
debole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
5 Operatori autoaggiunti compatti negli spazi di Hilbert. Problemi ellittici in

dimensione 1 77
5.1 Definizioni e proprietà elementari. . . . . . . . . . . . . . . . . . . . . . . . 77
5.2 Autovalori e autofunzioni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.3 I teoremi di Hilbert e Fischer-Courant. . . . . . . . . . . . . . . . . . . . . 82
5.4 Risoluzioni dell’identità e rappresentazioni spettrali. . . . . . . . . . . . 84
3
5.5 L’ideale degli operatori compatti. . . . . . . . . . . . . . . . . . . . . . . . . 86
5.6 Compattezza di operatori integrali. . . . . . . . . . . . . . . . . . . . . . . 87
5.7 Problemi ellittici in dimensione 1. Minorazione degli autovalori . . . . 92
5.8 La funzione di Green e l’equazione integrale equivalente. . . . . . . . . 94
5.9 Autovalori ed autofunzioni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
6 Compattezza negli spazi metrici. Equicontinuità 99

6.1 Equicontinuità. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.2 Compattezza negli spazi metrici. . . . . . . . . . . . . . . . . . . . . . . . . 101
6.3 Criterio di compattezza in C(K; F ). . . . . . . . . . . . . . . . . . . . . . . 105
6.4 Criteri di compattezza in Lp (Ω). . . . . . . . . . . . . . . . . . . . . . . . . 106
6.5 Il teorema di Peano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
7 I teoremi fondamentali dell’Analisi funzionale 109

7.1 Premesse: Spazi di Baire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.2 Il teorema di uniforme limitatezza . . . . . . . . . . . . . . . . . . . . . . . 112
7.3 Spazi duali. Topologie deboli . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.4 I teoremi dell’applicazione aperta e del grafico chiuso . . . . . . . . . . 117
7.5 Il teorema di Hahn-Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.6 Operatori duali e aggiunti. Continuità forte e debole . . . . . . . . . . . 124
7.7 Il Teorema dell’immagine chiusa di Banach . . . . . . . . . . . . . . . . . 126
7.8 Compattezza e compattezza sequenziale debole . . . . . . . . . . . . . . 128
8 Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie 131

8.1 Spazi pre-Hilbertiani di funzioni continue e serie di Fourier ordinarie. 131
8.2 Convergenza monotona. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
8.3 Approssimazione di funzioni continue mediante funzioni speciali. . . . 133
8.4 Presentazioni equivalenti della serie di Fourier. . . . . . . . . . . . . . . . 141
8.5 Nucleo di Dirichlet. Convergenza puntuale. . . . . . . . . . . . . . . . . . 142
8.6 Nucleo di Fejér. Convergenza uniforme e in Lp . . . . . . . . . . . . . . . 144
Bibliografia 147
Capitolo 1
Spazi normati
1.1 Spazi metrici.

Definizione. Una applicazione d
d : S × S → R+
si dice distanza in S se e solo se, per elementi arbitrari x, y, z ∈ S, sono soddisfatte le seguenti
tre proprietà:
1) d(x, y) = 0 ⇔ x = y ,
2) d(x, y) = d(y, x) (simmetria),
3) d(x, y) ≤ d(x, z) + d(z, y) (disuguaglianza triangolare).
(S, d), cioè S munito della particolare metrica d, si dice spazio metrico.
È noto ed è immediato verificare che in ogni spazio metrico tutte le successioni {xn }n∈N
convergenti, cioè tali che, detto l il loro limite, si abbia
∀ε > 0 ∃ν ∀n > ν d(xn , l) < ε ,
sono successioni di Cauchy, cioè tali che
∀ε > 0 ∃ν ∀n, m > ν d(xn , xm ) < ε .
Definizione. Se in (S, d) tutte le successioni di Cauchy sono convergenti si dice che (S, d)
è uno spazio metrico completo .
È noto che (Cn , dp ), p ∈ [1, +∞], dove

n
( i=1 |xi − yi |p )1/p 1 ≤ p < +∞
dp (x, y) = ,
max1≤i≤n |xi − yi | p = +∞
5
6 Capitolo 1. Spazi normati
è uno spazio metrico completo.
* * *
Lo spazio (C(K), d∞ ) delle funzioni a valori complessi, continue su un compatto K e munito

della distanza del massimo:
d∞ (f, g) = max |f (t) − g(t)| ,
t∈K
è uno spazio metrico completo.
Lo spazio delle funzioni olomorfe su un aperto Ω di C, munito della distanza

+∞

d(ϕ, ψ) = 1/2j min(1, max |ϕ(z) − ψ(z)|) ,
z∈Kj
j=0
dove K0 , K1 ... è una successione esaustiva di compatti ( K0 ⊂ K1 ⊂ ... e ∪+∞

j=0 Kj = Ω ) è uno
spazio metrico completo.
Lo spazio Lp (Ω) delle (classi di) funzioni reali definite q.o. nell’aperto Ω di Rn e di potenza
p-esima (p ≥ 1) integrabile rispetto alla misura di Lebesgue è uno spazio metrico completo
rispetto alla distanza
d(u, v) = ( |u(x) − v(x)|p dx)1/p .
Ω
Se si considerassero soltanto funzioni integrabili nel senso di Cauchy-Riemann non si otterrebbe
uno spazio completo.
& & &
Un sottoinsieme chiuso C di S, dove (S, d) è completo, munito delle metrica indotta che
indicheremo ancora con d, dà luogo ad uno spazio metrico completo (C, d).
1.2 Spazi normati.

In molti casi che si presentano in Analisi l’insieme S è munito di una struttura di spazio vet-
toriale e la distanza è indotta da una norma. Ci limiteremo a considerare solo spazi vettoriali
su R o su C.
Definizione. Si dice che (S, · ) è uno spazio normato se:

1) S è uno spazio vettoriale su R o su C ,
2) · : S → R+ è una norma,
cioè se per qualsiansi x, y ∈ S e per qualunque scalare λ
a) x = 0 ⇔ x = 0 ,
b) λx = |λ|x ,
c) x + y ≤ x + y .
Quaderni Didattici del Dipartimento di Matematica

A.Negro, Elementi di Analisi Funzionale 7
La norma induce naturalmente la distanza

d(x, y) = x − y ,
e quindi (S, d) è uno spazio metrico. Se (S, d) risulta completo, allora (S, · ) si dice spazio di
Banach .
Ad esempio (Cn , · p ) è uno spazio di Banach, avendo posto

n
( i=1 |xi |p )1/p 1 ≤ p < +∞
xp = .
max1≤i≤n |xi | p = +∞
È immediato verificare che · ∞ è una norma, osservando in particolare che

max |xj + yj | ≤ max(|xj | + |yj |) ≤ max |xi | + max |yk | .
j j i k
Per il caso p ∈ [1, +∞[ conviene ricorrere ad alcune disuguaglianze fondamentali.
Disuguaglianza di Young. Sia p > 1 e si definisca l’esponente coniugato q nel modo

seguente
1 1
+ =1.
p q
È evidente che p è a sua volta l’esponente coniugato di q, che 1/2 è coniugato di sé stesso e che
q tende a +∞ quando p tende a 1.
Conviene anche osservare che
1 1 p−1 p q 1
=1− = , =p−1 , =q−1= .
q p p q p p−1
Per a e b reali nonnegativi arbitrari risulta
ap bq
ab ≤ + .
p q
Dimostrazione. Si consideri la figura seguente, dalla quale appare evidente che il rettangolo
di lati a e b ha un’area minore o uguale della somma delle aree dei due triangoli (in genere
curvilinei) S1 e S2, individuati dalla curva di equazione
y = xp−1 ovvero x = y q−1 .
Pertanto
a b
ab ≤ area(S1) + area(S2) = xp−1 dx + y q−1 dy q.e.d.
0 0
Altra dimostrazione della disuguaglianza di Young. Se a o b è uguale a 0 la disuguagianza è

ovvia. Altrimenti dividiamo per ab ed otteniamo la disuguaglianza equivalente
1 ap−1 1 bq−1
1≤ + .
p b q a
Università di Torino, a.a. 2003-2004

p=3
y S2
2
S1
0 1 2 3 4
x
Figura 1.1: Triangoli curvilinei S1 ed S2 individuati dalla curva y = xp−1 con p = 3.
Poniamo
ap−1 ap/q bq−1
x= = , dunque = x−q/p ,
b b a
x x−q/p
f (x) = 1 − − .
p q
Risulta
1 1 q 1
f (1) = 0 , f (x) = − + x−q/p−1 , f (1) = 0 , f (x) = (− − 1) x−q/p−2 ≤ 0 .
p p p p
Dunque f (x) è concava, assume il valore massimo 0 per x = 1 e per ogni x positivo si ha
f (x) ≤ 0, q.e.d.
Disuguaglianza di Hölder.Per qualsiansi x, y ∈ Cn risulta

n
n
n
|xi yi | ≤ ( |xi |p )1/p ( |yi |q )1/q ,
i=1 i=1 i=1

dove p e q sono esponenti coniugati e se p = 1 allora q = +∞. La disuguaglianza si può anche

scrivere, ponendo (xy)j = xj yj ,
xy1 ≤ xp yq .
Dimostrazione. La disuguaglianza si verifica immediatamente se p = 1 oppure se x = 0 o y = 0.

Supponiamo allora x e y non nulli e p ≥ 1. Normalizziamo x e y, ponendo
x y
u= ,v = ,
xp yq
allora, per la disuguaglianza di Young
|ui |p |vi |q
|ui ||vi | ≤ +
p q
e sommando al variare di i si trova

up vq 1 1
uv1 ≤ + = + =1.
p q p q
E per la positiva omogeneità delle funzioni · p si ottiene il risultato.
Possiamo ora controllare che ·p è una norma. Mentre le prime due proprietà caratteristiche
delle norme sono evidenti, la verifica della disuguaglianza triangolare (detta in questo caso
anche disuguaglianza di Minkowski) si può ottenere ricorrendo alla disuguaglianza di Hölder.
Supporremo p > 1 ; in caso contrario il risultato è immediato. Supporremo inoltre x + y = 0 .

n
n
n
|xk + yk |p ≤ |xk + yk |p−1 |xk | + |xk + yk |p−1 |yk | ≤
k=1 k=1 k=1

n
n
n
≤( |xk + yk |q(p−1) )1/q (( |xk |p )1/p + ( |yk |p )1/p ) .
k=1 k=1 k=1
Ma essendo q(p − 1) = p, si trova

n
n
n
( |xk + yk |p )1−1/q ≤ ( |xk |p )1/p + ( |yk |p )1/p ) . q.e.d.
k=1 k=1 k=1
La norma · ∞ = max1≤k≤n |xk | si ottiene al limite per p → +∞ :
lim xp = x∞ ,
p→+∞
infatti, per x = 0
|xk |
xp = ( |xk |p )1/p = x∞ ( ( )p )1/p ,
x∞
k k

|xk | p
1≤ ( ) ≤n
x∞
k
e
lim 11/p = lim n1/p = 1 .
p→+∞ p→+∞
Anche negli spazi Lp (Ω) (e più generalmente negli spazi Lp (X, A, µ) ) valgono le disugua-
glianze di Hölder e di Minkowski:

|f (x)g(x)|dx ≤ ( |f (x)| ) ( |g(x)|q )1/q ,
p 1/p
Ω Ω Ω

( |f (x) + g(x)|p )1/p ≤ ( |f (x)|p )1/p + ( |g(x)|p )1/p .
Ω Ω Ω
Le dimostrazioni sono analoghe, sostituendo integrali a somme e facendo riferimento alla di-
suguaglianza di Young. In questi casi sarebbe però necessario controllare, come si può fare
agevolmente, che f ∈ Lp , g ∈ Lq implica f g ∈ L1 e che f, g ∈ Lp implica f + g ∈ Lp , ovvero
che esistono gli integrali che appaiono nelle formule precedenti.
L’integrabilità di f g , viste le proprità dell’integrale, discende ancora dalla disuguaglianza di

Young: |f (x)g(x)| ≤ |f (x)|p /p + |g(x)|q /q.
Nel secondo caso f + g ∈ Lp perchè ad esempio
|f (x) + g(x)|p ≤ 2p max(|f (x)|p , |g(x)|p ) ≤ 2p (|f (x)|p + |g(x)|p ) .
In effetti si ha la disuguaglianza più precisa seguente.
Proposizione. Siano a, b numeri reali non negativi e p ≥ 1. Allora
(a + b)p ≤ 2p−1 (ap + bp ) .
Dimostrazione. Se p = 1 la disuguaglianza è ovvia. Per p > 1, ricorrendo alla disuguaglianza di

Hölder si ha
(a + b) ≤ (1q + 1q )1/q (ap + bp )1/p = 2(p−1)/p (ap + bp )1/p
e il risultato segue immediatamente.
Alternativamente si può ragionare nel modo seguente: se p = 1 oppure a = 0 la proposizione è
ovvia. Se p > 1 e a = 0, dividendo per ap , posto x = b/a e
ψ(x) = (1 + x)p − 2p−1 (1 + xp ) ,
risulta
ψ (x) = p(1 + x)p−1 − 2p−1 pxp−1
che si annulla soltanto per x = 1 . Inoltre
ψ(1) = 0 , ψ(0) = 1 − 2p−1 < 0 , lim ψ(x) = −∞

x→+∞

e quindi la funzione ψ assume il valore massimo in 1 e si mantiene sempre ≤ 0. q.e.d.
Negli spazi Lp (X, A, µ) , se µ(X) < +∞ , si ha, come in Rn ,

lim f p = f ∞ ,
p→+∞
essendo in questo caso

f ∞ = essential sup |f (x)| .
x∈X
Anche (C(K), · ∞ ), spazio delle funzioni continue (ad esempio a valori complessi) sul
compatto K , munito della norma
f ∞ = max |f (t)| ,
t∈K
è uno spazio di Banach. Infatti si verifica subito che f ∞ è una norma e vale il seguente
Teorema. (C(K), · ∞ ), o come diremo più semplicemente, sottintendendo la norma,

C(K) è completo.
Dimostrazione. Sia {fn } una successione di Cauchy in C(K). Allora per ogni t ∈ K {fn (t)}
è una successione di Cauchy in C , che è completo. Dunque fn (t) converge ad un limite in C
dipendente da t, che indicheremo con f (t).
Inoltre, la convergenza delle fn ad f non è soltanto puntuale, ma anche uniforme, in quanto,
per ogni ε, per n sufficientemente grande si ha per ogni t:
|fn (t) − f (t)| = lim |fn (t) − fn+q (t)| ≤ ε ,
q→+∞
perchè
fn − fn+q ∞ ≤ ε ,
essendo fn di Cauchy per · ∞ .
La funzione f ∈ C(K) : infatti, fissato s, per ogni ε esiste un indice N ed esiste un intorno
VN (s) tali che
|f (t) − f (s)| ≤ |f (t) − fN (t)| +|fN (t) − fN (s)| +|fN (s) − f (s)|
≤ε ≤ε ≤ε
∀t ∈ K ∀t ∈ VN (s) ∀s ∈ K .
Allora la convergenza uniforme delle fn ad f si esprime scrivendo
lim fn − f ∞ = 0 q.e.d.
n→+∞
Si dice che due norme · a e · b in uno spazio vettoriale V sono equivalenti se e solo se
esistono due costanti c, C tali che
∀x ∈ V cxa ≤ xb ≤ Cxa .

Teorema. In Rn (più in generale su ogni spazio vettoriale di dimensione finita su R o su

C) tutte le norme sono equivalenti.
Dimostrazione. Sia {ek } la base canonica di Rn e per

x= xk ek sia x1 = |xk | .
k k
L’insieme S = {x ∈ R | x1 = 1} è compatto. Se · è una norma arbitraria su Rn , posto

n
C = maxk ek , si ha

∀x x = xk ek ≤ |xk |ek ≤ Cx1 .
k k
Dunque la funzione x → x è continua ovunque, quindi su S, per la distanza d1 (x, y) = x−y1 :
| x − y | ≤ x − y ≤ Cx − y1 .
Allora c = minx∈S x > 0 perchè 0 ∈ S. Ne segue, qualsiasi x,

x x
z= ∈S e c ≤ z = .
x1 x1
Dunque cx1 ≤ x ≤ Cx1 q.e.d.
1.3 Seminorme e spazi localmente convessi

Si dice spazio vettoriale topologico uno spazio vettoriale munito di una topologia com-
patibile con la struttura di spazio vettoriale, cioè una topologia per la quale le operazioni di
somma di vettori e di moltiplicazione di uno scalare per un vettore sono continue.
Abbiamo in precedenza sempre considerato spazi vettoriali nei quali la topologia era indotta
da una norma, cioè spazi vettoriali normati. Gli spazi localmente convessi costituiscono una
classe più ampia e molto importante di spazi vettoriali, nei quali una topologia compatibile
con la struttura di spazio vettoriale è indotta da una famiglia di seminorme, invece che da una
singola norma.
Anche partendo da uno spazio normato E, gli spazi E ed E ∗ muniti delle topologie deboli o
deboli*, quelle che inducono le convergenze deboli o deboli* che considereremo al Capitolo 7,
risultano essere spazi localmente convessi.
Definizione. Si dice che p : X → R è una seminorma nello spazio vettoriale X su K,

dove K = R o K = C, se e solo se
a) ∀x ∈ X p(x) ≥ 0,
b) ∀x, y ∈ X p(x + y) ≤ p(x) + p(y),
c) ∀x ∈ X ∀λ ∈ K p(λx) = |λ|p(x).

Ovviamente segue da c) che p(0) = 0. Ma può essere p(x) = 0 anche se x = 0. Una norma è
una seminorma per la quale p(x) = 0 ⇒ x = 0.
Definizione. Sia X uno spazio vettoriale su R o su C e sia S = {pa (x); a ∈ A} una famiglia
di seminorme in X soddisfacenti l’assioma di separazione:
∀x ∈ X ∃a ∈ A pa (x) = 0 .
A è un insieme arbitrario di indici. Lo spazio X munito della famiglia S di seminorme si dice

spazio vettoriale localmente convesso (separato).
In X viene indotta canonicamente una topologia, compatibile con la struttura vettoriale, asse-
gnando ad ogni punto x0 il sistema fondamentale di intorni V della forma:
V = x0 + U ,
dove
U = { x ∈ X | paj (x) ≤ εj , j = 1, 2, ...n} ,
con n intero arbitrario, aj , indici arbitrari e εj , numeri positivi arbitrari.
Gli insiemi U sono ovviamente un sistema fondamentale di intorni di 0 e generano per traslazione
un sistema fondamentale di intorni di ogni altro punto.
La dizione “localmente convesso è dovuta al fatto che gli insiemi U sono convessi, e dunque ogni
punto ammette un sistema fondamentale di intorni convessi, come risulta dalla proposizione
seguente.
Proposizione. Sia p(x) una seminorma su X . Allora, per ogni c > 0 , l’insieme W = { x ∈
X | p(x) ≤ c } ha le proprietà seguenti:
1) 0∈W ;
2) W è convesso : λ ∈ [0, 1] e x, y ∈ W implicano (1 − λ)x + λy ∈ W ;
3) W è equilibrato : |λ| ≤ 1 e x ∈ W implicano λx ∈ W ;
4) W è assorbente : per ogni x ∈ X , esiste ρ > 0 tale che x ∈ ρW ;
5) la seminorma p è univocamente individuata da W , mediante la formula
p(x) = inf ρc .
ρ>0,x∈ρW
La dimostrazione comporta soltanto verifiche immediate. Per il punto 5) basta osservare che
p(x) ≤ ρc equivale a p(x/ρ) ≤ c, cioè x/ρ ∈ W ovvero x ∈ ρW . Si controlla anche che, se W
è un qualunque sottoinsieme di X convesso, equilibrato ed assorbente, la formula del punto 5)
definisce una seminorma in X. Come vedremo nel capitolo 2, p è il funzionale di Minkowski
del convesso assorbente W ; essendo W equilibrato il funzionale di Minkowski di W soddisfa la
condizione p(λx) = |λ|p(x).
Esempio 1. Sia Ω un aperto del piano complesso. In C(Ω), spazio delle funzioni contine in
Ω a valori complessi, la topologia della convergenza uniforme sui compatti è localmente covessa
ed è definita dalla famiglia di seminorme
{ pK (f ) = max |f (x)| } , K ⊂ Ω ,
x∈K

dove K è un qualunque compatto contenuto in Ω. È chiaro che può essere pK (f ) = 0 anche se

f = 0, per esempio se non si annulla ovunque in Ω − K.
È sufficiente considerare una famiglia numerabile ed esaustiva di compatti:
K1 ⊂ K2 ⊂ ... , ∪j Kj = Ω
e le seminorme associate p1 , p2 , ... . La topologia è dunque metrizzabile, cioè è indotta da una

distanza, per esempio
1 pn (f − g)
d(f, g) = ,
n
2n 1 + pn (f − g)
oppure
1
d∗ (f, g) = min(1, pn (f − g)) .
n
2n
Le funzioni olomorfe in Ω, H(Ω), sono un sottospazio chiuso di C(Ω) relativamente a questa

topologia localmente convessa.
* * *
Esempio 2. Sia E uno spazio di Banach ed E ∗ il suo duale topologico. La convergenza debole
in E è indotta da una topologia debole, più debole della topologia iniziale indotta dalla norma.
Tale topologia debole è localmente convesse e generata, per esempio, dalle seminorme
pF (x) = max(|f1 (x)|, |f2 (x)|, ..., |fn (x)|) ,
dove F = { f1 , f2 , ..., fn } è un generico sottoinsieme finito di E ∗ .
In modo analogo si introduce la topologia debole* in E ∗ .
& & &
1.4 Insiemi ordinati e spazi di Riesz

Definizione. Uno spazio vettoriale X su R è uno spazio di Riesz se e solo se:
1) X è munito di una relazione d’ordine (parziale) compatibile con la struttura di spazio vetto-
riale, cioè:
i) qualsiansi x, y, z ∈ X si ha x ≤ y ⇒ x + z ≤ y + z,
ii) qualsiansi x, y ∈ X e λ > 0 si ha x ≤ y ⇒ λx ≤ λy;
2) qualsiansi x, y ∈ X esistono in X x ∨ y = sup(x, y) e x ∧ y = inf(x, y). (sup(x, y) è definito
come (unico) elemento che maggiora x e y ed è ≤ di ogni maggiorante di x e y; inf(x, y) è definito
analogamente.)
Esempio. C(K) con la relazione d’ordine parziale
f ≤g ↔ ∀x ∈ K f (x) ≤ g(x)

è uno spazio di Riesz.
In uno spazio di Riesz si pone, come usuale:
x+ = x ∨ 0 , x− = −(x ∧ 0) , |x| = x+ + x−
e quindi ogni elemento x si può presentare come differenza di due elementi positivi, essendo
canonica la presentazione:
x = x+ − x− , x+ ≥ 0 , x− ≥ 0 .
Per un primo approfondimento si può vedere Bourbaki[3].


Capitolo 2
Punti fissi. Punti di equilibrio e

Teoremi di min-max.
Γ-convergenza
2.1 Punti fissi di contrazioni

Teorema del punto fisso per le contrazioni (di Banach-Caccioppoli). Sia (S, d)
uno spazio metrico completo ed A : S → S una applicazione da S in sé stesso. Se A è una
contrazione, cioè se
∃L < 1 ∀x, y ∈ S d(Ax, Ay) ≤ Ld(x, y) ,
allora esiste un unico punto fisso di A, cioè
∃!z ∈ S z = Az .
Si osservi che A è una applicazione uniformemente continua, in quanto Lipschitziana (con co-
stante di Lipschitz L < 1 ).
Osservazione. Si potrebbero dire contrazioni le applicazioni A per le quali d(Ax, Ay) ≤ d(x, y)
e contrazioni strette quelle per le quali d(Ax, Ay) < d(x, y). Per queste tuttavia l’esistenza di
un punto fisso non è garantita.
Dimostrazione. L’unicità è immediata. Infatti se z e z ∗ fossero due punti fissi diversi:
0 < d(z, z ∗ ) = d(Az, Az ∗ ) ≤ Ld(z, z ∗ ) < d(z, z ∗ ) ,
che risulta palesemente assurdo. Per quanto concerne l’esistenza si può utilizzare il metodo
“costruttivo delle approssimazioni successive :

dato x0 ∈ S arbitrario
sia xn+1 = Axn , n ≥ 1 .
17
18 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max
Allora:
a) xn è una successione di Cauchy in quanto

n+p−1
n+p−1
d(xn+p , xn ) ≤ d(xk+1 , xk ) = d(Axk , Axk−1 ) =
k=n k=n

n+p−1
n+p−1
p−1
Ln
= d(Ak x1 , Ak x0 ) ≤ Lk d(x1 , x0 ) = Ln d(x1 , x0 ) Li ≤ d(x1 , x0 ) ,
i=0
1−L
k=n k=n
tendente a 0 per n → +∞ indipendentemente da p ;

b) per la completezza di S esiste z tale che
lim xn = z ;
n→+∞
c) per la continuità dell’applicazione A
Az = lim Axn = lim xn+1 = z .

n→+∞ n→+∞
Dunque z è (l’unico) punto fisso di A. q.e.d.
Si osservi che valgono inoltre le seguenti
maggiorazioni dell’errore
Ln
d(xn , z) = lim d(xn , xn+p ) ≤ d(x1 , x0 ) ,
p→+∞ 1−L

p−1
d(xn , z) = lim d(xn , xn+p ) ≤ lim sup d(xn+i , xn+i+1 ) ≤
p p
i=0

p−1
L
≤ lim sup d(xn−1 , xn ) Li+1 ≤ d(xn−1 , xn ) .
p
i=0
1−L
La prima di queste permette, noti x0 e L , di progettare a priori un numero di passi n sufficiente
(ma in genere non necessario) per ottenere con certezza un’approssimazione con una tolleranza
ε prescritta: si determina x1 , poi si calcola d(x1 , x0 ) e infine si prende
(1 − L)ε
n > ln / ln L .
d(x1 , x0 )
La seconda disuguaglianza permette di controllare il processo di approssimazione in corso d’ope-
ra. Calcolando ad ogni passo d(xk , xk−1 ) , se questo valore risulta inferiore a ε(1 − L)/L allora
xk approssima z con un errore inferiore alla tolleranza ε prescritta. Può succedere che k sia
inferiore al valore n fornito dalla prima maggiorazione.
Il teorema del punto fisso ammette una semplice generalizzazione al caso di un’applicazione
una cui iterata sia una contrazione. Scriveremo come al solito An = A ◦ A ◦ ... ◦ A per indicare

la composizione di n applicazioni uguali ad A , cioè l’iterata n-esima di A .
Teorema. Sia (S, d) uno spazio metrico completo ed A : S → S una applicazione da S in

sé stesso. Se esiste un intero ν tale che Aν è una contrazione, allora A ammette un unico punto
fisso z, coincidente con il punto fisso di B = Aν . Inoltre z si può ottenere con il metodo delle
approssimazioni successive

 dato x0 ∈ S arbitrario
sia xn+1 = Axn , n ≥ 1 ,

allora z = limn xn .
Dimostrazione. Se f = Af allora A2 f = Af = f ... e Bf = Aν f = f . Dunque gli eventuali

punti fissi di A sono punti fissi di B . Ma B è una contrazione stretta e ammette pertanto un
unico punto fisso z : z = Bz. Osserviamo che A commuta con B : A ◦ B = B ◦ A = Aν+1 .
Allora
z = Bz ⇒ Az = A(Bz) = B(Az) ⇒ z = Az
per l’unicità del punto fisso di B . Abbiamo quindi dimostrato che z è punto fisso di A .
Osserviamo ora che la successione An x0 si decompone nelle ν sottosuccessioni Akν+j x0 , j =
0, 1, ...ν − 1 e:
lim Akν+j x0 = lim B k (Aj x0 ) = z j = 0, 1...ν − 1 ,
k k
perché il metodo delle approssimazioni successive per B fornisce il punto fisso z, indipendente-
mente dal dato iniziale.
Talvolta si deve considerare una famiglia di problemi di punto fisso, dipendenti da un pa-
rametro t . Se t ∈ T , dove T è uno spazio topologico, è interessante studiare l’eventuale
dipendenza continua del punto fisso dal parametro. A tal fine si ha il seguente
Teorema. Sia (S, d) uno spazio metrico completo e T uno spazio topologico. Sia
f : S × T → S tale che
1) ∀x ∈ S t → f (x, t) è continua da T → S ,
2) Esiste L < 1 tale che
∀t ∈ T d(f (x, t), f (y, t)) ≤ Ld(x, y) ,
cioè esiste una costante di Lipschitz L < 1 indipendente da t .
Allora, se x(t) = f (x(t), t) è l’unico punto fisso della contrazione f (·, t) , l’applicazione t → x(t)
è continua da T → S.
Dimostrazione. Fissato s ∈ T :
d(x(t), x(s)) = d(f (x(t), t), f (x(s), s)) ≤
≤ d(f (x(t), t), f (x(s), t)) + d(f (x(s), t), f (x(s), s)) ≤
≤ Ld(x(t), x(s)) + ε ,
cioè (1 − L)d(x(t), x(s)) ≤ ε, se t ∈ V (s) , con V (s) intorno sufficientemente piccolo di s
(dipendente dal valore arbitrario ε > 0). q.e.d.

2.2 Punti fissi in insiemi parzialmente ordinati e Lemma di Zorn

Teorema. Sia (I, ≤) un insieme non vuoto e parzialmente ordinato tale che ogni suo sot-
toinsieme J totalmente ordinato ammetta un estremo superiore (sup J ∈ I).
Sia f : I → I un’applicazione tale che ∀x ∈ I x ≤ f (x).
Allora esiste almeno un elemento x∗ ∈ I tale che x∗ = f (x∗ ).
Dimostrazione. Se I è totalmente ordinato, posto m = sup I, si ha m ≤ f (m) ≤ m e dunque

m = f (m). Se I non è totalmente ordinato, possiamo cercare di restringere la ricerca di un
punto fisso ad un adeguato sottoinsieme totalmente ordinato. A questo fine, fissato un elemento
arbitrario a ∈ I, consideriamo la famiglia A dei sottoinsiemi S di I, che diremo ammissibili ,
aventi le seguenti proprietà
1) a ∈ S,
2) f (S) ⊆ S,
3) per ogni sottoinsieme totalmente ordinato T di S si ha sup T ∈ S.
La famiglia A non è vuota, perché I ∈ A ed è immediato verificare che qualunque intersezione
di sottoinsiemi ammissibili è ammissibile. Poniamo allora
A = ∩S∈A S
e verifichiamo che A è totalmente ordinato. Avremo allora che, se x∗ = sup A, x∗ ∈ A, f (x∗ ) ∈ A

e x∗ ≤ f (x∗ ) ≤ x∗ , cioè x∗ è punto fisso.
Osserviamo in primo luogo che M = {x|a ≤ x} ∈ A (a ∈ M, x ∈ M ⇒ f (x) ≥ x ≥ a e se T è
un sottoinsieme di M totalmente ordinato, sup T ≥ a, cioè sup T ∈ M ), pertanto
∀x ∈ A a ≤ x .
Per vedere che A è totalmente ordinato basta vedere che per ogni coppia di elementi z, x ∈ A si
ha z ≤ x ∨ z ≥ f (x), perché allora o z ≤ x o z ≥ x, perché z ≥ f (x) ≥ x. Fissato allora x ∈ A,
consideriamo l’insieme
B(x) = {z ∈ A|z ≤ x ∨ z ≥ f (x)}
e ci proponiamo di controllare che B(x) = A. Essendo B(x) ⊆ A e A è minimale, basta
dimostrare che B(x) è ammissibile:
1) a ≤ x e dunque a ∈ B(x);
2) f (z) ∈ A e:
se z ≥ f (x) allora f (z) ≥ z ≥ f (x) e dunque f (z) ∈ B,
se z = x, ovviamente f (z) ≥ f (x) e f (z) ∈ B,
se z < x implicasse f (z) ≤ x, allora avremmo f (z) ∈ B.
Dunque, almeno per le
x ∈ C = {x ∈ A | ∀y ∈ A y < x ⇒ f (y) ≤ x} ,
risulta f (B(x)) ⊆ B;
3) indipendentemente dall’essere x ∈ C, se T è un sottoinsieme totalmente ordinato di B(x),
sup T ∈ A e:
o per ogni t ∈ T si ha t ≤ x, allora sup T ≤ x e sup T ∈ B(x),

o per qualche t ∈ T si ha t ≥ f (x), allora sup T ≥ t ≥ f (x) e sup T ∈ B(x).

Abbiamo cosı́ dimostrato che
∀x ∈ C B(x) = A .
Vediamo ora che C = A e la dimostrazione del teorema sarà completa. Per questo sfruttiamo
nuovamente il fatto che C ⊆ A e A è minimale, controllando che C è ammissibile:
1) a ∈ C, perché non esiste alcun y ∈ A tale che y < a;
2) per x ∈ C si ha f (x) ∈ A e, se A = B(x) y < f (x) allora y ≤ x (altrimenti, essendo
y ∈ B(x), dovrebbe essere y ≥ f (x) e non y < f (x)); dunque o y = x e banalmente f (y) ≤ f (x)
oppure y < x e allora f (y) ≤ x ≤ f (x) (la prima disuguaglianza dipende dal fatto che x ∈ C e
la seconda dall’ipotesi base su f ); in ogni caso y < f (x) ⇒ f (y) ≤ f (x), cioè f (x) ∈ C, o ancora
f (C) ⊆ C;
3) sia T un sottoinsieme totalmente ordinato di C e τ = sup T ∈ A; sia A y < τ :
∀t ∈ T y ≤ t ∨ y ≥ f (t) ≥ t ,
perché ogni t ∈ C e dunque B(t) = A. Allora esiste un t ∈ T tale che non vale y ≥ f (t)
(altrimenti per tutti i t ∈ T si avrebbe y ≥ t e allora y ≥ τ ), cioè tale che y ≤ t; ma se y < t si
ha f (y) ≤ t ≤ τ (t ∈ C), se invece y = t, non essendo y = τ , esiste un s ∈ T ⊆ C tale che y < s
e pertanto f (y) ≤ s ≤ τ ; in ogni caso
A y < τ ⇒ f (y) ≤ τ ,
cioè τ ∈ C.
Dunque C ⊆ A è ammissibile ed essendo A minimale C = A. q.e.d.
Dal teorema precedente si possono dedurre quasi immediatamente, con l’ausilio dell’Assioma
della Scelta , i teoremi di Hausdorff e di Zorn.
Teorema (di Haussdorff di massimalità). Ogni insieme parzialmente ordinato (I, ≤)

contiene un sottoinsieme totalmente ordinato (o come si dice una catena) C massimale per la
relazione di inclusione.
Dimostrazione. Sia C l’insieme di tutte le catene C di I, ordinato ponendo C ≤ C ∗ ⇒ C ⊆ C ∗ .
In C ogni sottoinsieme totalmente ordinato T ammette un estremo superiore: D = ∪C∈T C.
Supponiamo per assurdo che C non ammetta elementi massimali. Allora per ogni C ∈ C consi-
deriamo il sottoinsieme non vuoto F(C) delle catene C ∗ tali che C < C ∗ . Per l’Assioma della
Scelta esiste una funzione f : C → C tale che f (C) ∈ F(C), dunque C < f (C) e, per il teo-
rema precedente f dovrebbe avere un punto fisso F per il quale si avrebbe F < F : assurdo. q.e.d.
Teorema (Lemma di Zorn). Ogni insieme parzialmente ordinato (I, ≤) per il quale esista
un maggiorante in I di ogni catena (cioè di ogni suo sottoinsieme totalmente ordinato) ammette
almeno un elemento massimale.
Dimostrazione. Sia C una catena massimale di I, la cui esistenza è assicurata dal Teorema di
Hausdorff, e sia x un suo maggiorante. L’elemento x è massimale. Infatti, se y ∈ C si ha y ≤ x,
/ C, allora l’insieme C ∗ = C ∪ {y} è una catena tale che C < C ∗ e C non può
e se x ≤ y con y ∈
essere massimale. q.e.d.

2.3 I teoremi di Brouwer e Schauder

Teorema di Brouwer. Sia B = B1∗ (0) = { x ∈ Rn | ||x|| ≤ 1 } la sfera chiusa unitaria
di centro l’origine di Rn . Ogni applicazione continua T da B in sé stesso ammette almeno un
punto fisso, cioè esiste z ∈ B tale che z = T (z).
Corollario. Sia D ⊂ Rn un insieme e omeomorfo a B. Ogni applicazione continua T da D

in sé stesso ammette almeno un punto fisso.
Dimostrazione del Corollario. Sia f : D → B un omeomorfismo (esiste f −1 e sia f che f −1 sono

continue). Allora U = f ◦ T ◦ f −1 è continua da B in B e per il teorema di Brouwer ammette
un punto fisso z ∈ B:
(f ◦ T ◦ f −1 )(z) = z .
Posto x = f −1 (z) ∈ D, si ha dunque T (x) = x. q.e.d.
Dimostreremo direttamente l’esistenza di un punto fisso nel caso in cui D è un simplesso

n-dimensionale, e poi controlleremo che una sfera è omeomorfa ad un simplesso. La dimostra-
zione nel caso del simplesso seguirà da un fondamentale risultato topologico noto come Lemma
di Knaster-Kuratowski-Mazurckiewicz (o lemma KKM), il quale si basa su un semplice ma im-
portante risultato combinatorio, noto come Lemma di Sperner.
Per svolgere questo percorso serviranno alcune nozioni e risultati sugli insiemi convessi, che rias-
sumiamo brevemente.
Sia V uno spazio vettoriale reale (cioè su R). Un sottoinsieme C di V si dice convesso se e
solo se
∀x, y ∈ V ∀λ ∈ [0, 1] (1 − λ)x + λy ∈ C .
Indichiamo con CO la famiglia di tutti i convessi in V . Si verificano facilmente le proprietà

seguenti, che il lettore potrà controllare senza difficoltà.
1) Se Ca ∈ CO per ogni a ∈ A, allora ∩a∈A Ca ∈ CO.
2) Sia V ∗ il duale algebrico di V ed f ∈ V ∗ , allora per ogni c ∈ R si ha { x ∈ V | f (x) ≤ c } ∈ CO.

Analogamente { f < c }, { f ≥ c }, { f > c } ∈ CO.
3) Sia V uno spazio normato, allora per ogni x ∈ V ed r > 0 si ha Br (x) ∈ CO.
4) Si indica con co(A), detto inviluppo convesso di A, il più piccolo insieme convesso contenente
A ⊆ V , dunque
co(A) = ∩A⊆C∈CO C .
Allora risulta

p
p
+
co(A) = { λk xk | p ∈ N , xk ∈ A, λk ≥ 0, λk = 1 } .
k=1 k=1

Infatti il secondo membro contiene A ed è convesso; inoltre se C è un convesso contenete A deve

contenere il secondo membro.
6) Se V è normato co(A) ha lo stesso diametro di A.

Infatti se ||x − y|| ≤ d per x, y ∈ A, allora

n
n
x, xk ∈ A, z = λk xk ∈ co(A) ⇒ ||x − z|| ≤ λk ||x − xk || ≤ d
k=1 k=1
m
e quindi se xj ∈ A e w = j=1 µj xj ∈ co(A) si ha

m
m
||w − z|| = || µj (xj − z)|| ≤ µj ||xj − z|| ≤ d .
j=1 j=1
Definizione. Un simplesso n-dimensionale S è l’invuppo convesso di n + 1 punti x0 , x1 ...xn

linearmente indipendenti, cioè tali che i vettori xj − x0 , j = 1...n sono linearmente indipendenti.
È immediato verificare che è equivalente fissare k = 0 e chiedere che i vettori xj − xk , j = k
siano linearmente indipendenti: xj − x0 = xj − xk + xk − x0 e dunque se

cj (xj − xk ) = 0 ⇒ ∀j = k cj = 0 ,
j=k

allora l’ipotesi j=0 aj (xj − x0 ) = 0, cioè

aj (xj − xk ) + ( aj )(xk − x0 ) = 0 ⇒ ∀j = k, 0 aj = 0 e aj = ak + aj = ak = 0 .
j=k,0 j=0 j=0 j=k,0
Per quanto visto al punto 4) precedente, il simplesso generato dai punti x0 ...xn è l’insieme delle
combinazioni convesse di tali punti:

n
n
S = S(x0 , x1 ...xn ) = { λ k xk | λ ≥ 0 e λk = 1 } .
k=0 k=0
Ogni x ∈ S si scrive in modo unico come combinazione convessa delle xk (per l’indipendenza
delle xk − x0 ) e i coefficienti λk (x) si dicono le sue coordinate baricentriche. I punti xk sono
i vertici del simplesso.
Con λk = 1/(n + 1) per ogni k si ottiene il baricentro di S: bn = k xk /(n + 1).
Il diametro di S = S(x0 , x1 ...xn ) è, per quanto visto al punto 6), uguale al maxi,j ||xj − xi ||.
Si dice faccia k-dimensionale di S il simplesso generato da k + 1 vertici distinti di S:

S(xj0 , xj1 ...xjk ).
Se Si è la faccia n − 1-dimensionale di S opposta a xi (cioè xi ∈

/ Si ) e bn−1
i è il baricentro di
n
Si , mentre b è il baricentro di S, allora
n n−1 1 n
||bn − xi || = || bi + xi − xi || = ||bn−1 − xi || .
n+1 n+1 n+1 i

Si osservi che di conseguenza

n n
∀k d(bn , xk ) ≤ diam S e quindi d(bn , z) ≤ diam S
n+1 n+1
per ogni z appartenente ad una qualunque faccia n − 1 dimensionale di S.
Suddivisione simpliciale. Sia S = S(x0 , x1 ...xn ) un simplesso n-dimensionale. Una colle-

zione {S1 , S2 ...SN } di simplessi n-dimensionali si dice suddivisione simpliciale di S se l’unione
degli Sj coincide con S e l’intersezione di Si e Sj ,con i = j, o è vuota o è esattamente una loro
faccia comune di dimensione inferiore.
Suddividendo ogni Sj si ottiene una suddivisione del simplesso iniziale S “più fine.
Nel seguito ricorreremo quasi esclusivamente a suddivisioni baricentriche, che possiamo de-
finire induttivamente:
1) per n = 1 la suddivisione è costituita da due simplessi (segmenti) aventi per vertici il bari-
centro e uno dei due vertici di S;
2) per n > 1, dopo aver effettuato la suddivisione baricentrica di tutte le facce di dimensione
inferiore, si ottiene la suddivisione baricentrica di S come collezione di tutti i simplessi aventi
come vertici il baricentro di S e gli n − 1 vertici di un qualunque simplesso della suddivisione di
qualunque faccia n − 1-dimensionale di S.
Se si suddividono in modo analogo i simplessi di questa suddivisione, che diremo di ordine 1, si
ottiene una suddivisione baricentrica di S, che diremo di ordine 2, e cosı̀ via.
Se d = d0 è il diametro di S e dq quello di una sua suddivisione baricentrica di ordine q, cioè il
massimo dei diametri dei simplessi che le appartengono, si vede facilmente che
n
dq+1 ≤ dq .
n+1
Dunque per q → +∞ risulta dq → 0.
Lemma di Sperner. Sia S(x0 , x1 , ...xn ) un simplesso n-dimensionale e Σ = {S1 , S2 , ...SM }

una sua suddivisione simpliciale. Sia ν un’applicazione che associa ad ogni vertice z di ogni
simplesso di Σ un intero ν(z) ∈ {0, 1...n}, con la proprietà che
z ∈ S(xj0 , xj1 , ...xjk ) ⇒ ν(z) ∈ {j0 , j1 , ...jk } ,
cioè tale che se z appartiene ad una faccia k-dimensionale del simplesso iniziale S allora la sua
etichetta ν(z) appartiene all’insieme degli indici dei vertici della faccia.
Definita l’etichetta ν(Si ) di un simplesso della suddivisione come
ν(Si ) = { ν(z) | z è vertice di Si } ,
diremo che Si è normale se e solo se ν(Si ) = {0, 1, ...n}.

Allora il numero N ∗ dei simplessi normali è dispari, e in particolare N ∗ = 0.
Dimostrazione. Per induzione su n. Per n = 0 la tesi è banalmente vera. Supposta vera la tesi per
n−1, segnamo le facce Sia n−1-dimensionali dei simplessi di Σ per le quali ν(Sia ) = {0, 1, ...n−1},
e indichiamo con Nk il numero di facce segnate di Sk e sia N = k Nk .
Se Sk è normale ha una sola faccia segnata: Nk = 1, altrimenti Nk = 0 oppure Nk = 2. Dunque
N ha la stessa parità di N ∗ .

Se una faccia segnata non è contenuta in S(x0 , x1 , ...xn−1 ), essa è comune a due divesi simplessi
Sk della suddivisione e quindi contribuisce con 2 unità ad N . Se N è il numero di tali facce,
N = N − 2N è il numero di facce segnate contenute in S(x0 , x1 , ...xn−1 ), che è dispari per
ipotesi induttiva. Dunque N e di conseguenza N ∗ sono dispari. q.e.d.
Teorema KKM (di Knaster-Kuratowski-Mazurckiewicz). Sia S = S(x0 , x1 , ...xn )

un simplesso n-dimensionale e siano F0 , F1 , ...Fn n + 1 insiemi chiusi tali che per ogni faccia
k-dimensionale di S, qualsiasi k ≤ n, si abbia
S(xj0 , xj1 , ...xjk ) ⊆ ∪kp=0 Fjp .
Allora risulta ∩nj=0 Fj = ∅.

Dimostrazione. Consideriamo una suddivisione baricentrica di S di ordine arbitrario q: Σq .
Per ogni vertice z di Σq consideriamo la faccia di S di dimensione minima tale che z ∈
S(xj0 , xj1 , ...xjk ). Per l’ipotesi z ∈ ∪kp=0 Fjp , cioè esiste s, con 0 ≤ s ≤ k, tale che z ∈ Fjs :
scelto comunque un tale indice s, poniamo ν(z) = js . L’etichetta ν soddisfa le condizioni del
lemma di Sperner.
Dunque esiste un simplesso S q normale e quindi i vertici, che supponiamo di aver enumerato con-
venientemente, zjq di S q , avendo etichette 0, 1, ...n, appartengono rispettivamente a F0 , F1 ...Fn ,
cioè ∀j S q ∩ Fj = ∅ perché zjq ∈ Fj .

Per la compattezza di S possiammo estrarre una sottosuccessione z0q convergente a a qualche

elemento z ∗ ∈ F0 . Ma, il diametro di S q tende a zero per q → +∞, d(zjq , z0q ) → 0 e quindi

zjq → z ∗ ∈ Fj . Dunque {z ∗ } ⊆ ∩j Fj q.e.d.
Teorema di Brouwer per i simplessi (o teorema di Bohl). Sia Sia S = S(x0 , x1 , ...xn )
un simplesso n-dimensionale ed f : S → S una funzione continua. Allora esisite almeno un
punto fisso z di f : z ∈ S e z = f (z).
Dimostrazione. Siano λ(x) = (λ0 (x), λ1 (x), ...λn (x)) le coordinate baricentriche di x ∈ S:

n
x= λk (x)xk , λk (x) ≥ 0 , λk (x) = 1 ,
k=0 k
essendo unica tale rappresentazione di x come combinazione convessa delle xk . Viceversa dato
µ = (µ0 , µ1 , ...µn ), con µk ≥ 0 e k µk = 1 esiste un unico elemento x(µ) ∈ S con coordinate
baricentriche µ.
Le funzioni λ(·) e x(·) sono continue e ciascuna è l’inversa dell’altra. (La continuità di x(·) è
evidente. Inoltre i vettori xj − x0 formano una base per ipotesi, quindi è univocamente indi-

viduata la basen duale: fk ∈ V e fk (xj − x0 ) = δkj ; dunque λk (x) = fk (x − x0 ) per k ≥ 1 e
λ0 (x) = 1 − k=1 λk (x)).
Le funzioni fj (µ) = λj (f (x(µ)), che rappresentano la trasformazione f in coordinate baricentri-
che, sono allora continue.
Poniamo
Fj = { x ∈ S | λj (x) ≥ fj (λ(x))} .
Essi sono ovviamente insiemi chiusi e soddisfano le ipotesi del teorema KKM: infatti se fosse
x ∈ S(xj0 , xj1 ...xjk ) ∧ x ∈

/ ∪ki=0 Fji ,

allora si avrebbe λji (x) < fji (λ(x)) per i = 0, 1, ..k, e dunque

n
k
k
n
1= λl (x) = λji (x) < fji (λ(x)) ≤ fl (λ(x)) = 1 ,
l=0 i=0 i=0 l=0
che è manifestamente impossibile.

Allora per il teorema KKM esiste z ∈ ∩j Fj e quindi

n
n
λj (z) ≥ fj (λ(z)) , j = 0, 1, ...n , 1 = λj (z) ≥ fj (λ(z)) = 1 .
j j
Necessariamente allora λj (z) = fj (λ(z)) per j = 0, 1, ..., n, e z è punto fisso. q.e.d.
Per dimostrare che un simplesso è omeomorfo ad una sfera di ugual dimensione, conviene far
uso del funzionale di Minkowski di un corpo convesso, del quale si è già fatto cenno nel Capitolo
1, quando si è introdotto il concetto di seminorma. Premettiamo allora qualche definizione.
Definizione. Si dice che un insieme convesso C in uno spazio vettoriale V è un corpo

convesso se e solo se esiste x ∈ C tale che per ogni vettore v risulta x + tv ∈ C se t > 0 è
sufficientemente piccolo (t < tv ):
∃x ∈ C ∀v ∈ V ∃tv > 0 ∀t ∈ (0, tv ) x + tv ∈ C .
L’insieme dei punti di C che hanno questa proprietà si chiama il nucleo del convesso e si indica
con J(C).
In dimensione n finita se x ∈ J(C) allora x è un punto interno a C. Infatti, se {ek } è una base
ortonormale, poniamo θ = mink min(tek , t−ek ). Allora
θ
{x + v | v ∈ V | ||v||∞ ≤ } ⊆ x + co({θek , −θek }k ) = {y | ||y − x||1 ≤ θ} ⊆ C .
n
Definizione. sia V uno spazio lineare su R. Una funzione p(x) definita su V a valori reali
si dice convessa e positivamente omogenea, se e solo se
1) p(x) ≥ 0 ∀x ∈ V ,
2) p(x + y) ≤ p(x) + p(y) ∀(x, y) ∈ E × E,
3) p(λx) = λp(x) ∀(x, λ) ∈ V × R+ .
(Più in generale si potrebbero considerare funzioni a valori reali estesi, ottenendo nella Propo-
sizione successiva risultati meno precisi.)
In effetti si verifica immediatamente che p è convessa nel senso usuale:
0 ≤ λ ≤ 1 ⇒ p((1 − λ)x + λy) ≤ (1 − λ)p(x) + λp(y) .

Viceversa, se p è convessa in senso usuale e positivamente omogenea, allora soddisfa la disugua-

glianza triangolare:
x+y x+y x y
p(x + y) = p(2 ) = 2p( ) ≤ 2p( ) + 2p( ) = p(x) + p(y) .
2 2 2 2
Si osservi che si ha necessariamente p(0) = 0.
Proposizione. Sia p(x) una funzione convessa e positivamente omogenea su V . Allora, per
ogni c > 0 , l’insieme C = { x ∈ V | p(x) ≤ c } ha le proprietà seguenti:
1) 0 ∈ C ;
2) C è convesso ;
3) l’insieme { x ∈ V | p(x) < c } coincide con J(C);
4) C è assorbente : per ogni x ∈ V , esiste ρ > 0 tale che x ∈ ρC ;
5) la funzione p è univocamente individuata da C , mediante la formula
p(x) = inf ρc .
ρ>0,x∈ρC
6) vale la disuguaglianza
|p(x) − p(y)| ≤ max(p(x − y), p(y − x)) .
La dimostrazione comporta soltanto verifiche immediate.

Viceversa:
Proposizione, se C è un qualunque corpo convesso di V , tale che 0 ∈ J(C), la formula

del punto 5), con c = 1, definisce una funzione convessa e positivamente omogenea in V , detta
funzionale di Minkowski di C, che talvolta per maggior chiarezza si indicherà con pC (x).
Dimostrazione.
1) per t > 0 si ha p(tx) = tp(x), perché tx ∈ ρC equivale a x ∈ ρ/tC;
2) sia p(xk ) < ρk < p(xk ) + ε, k = 1, 2, dunque xk /ρk ∈ C, e poniamo ρ = ρ1 + ρ2 , allora
x1 + x 2 ρ 1 x1 ρ 2 x2
= + ∈C .
ρ ρ ρ1 ρ ρ2
Pertanto p(x1 + x2 ) ≤ ρ < p(x1 ) + p(x2 ) + 2ε. Per l’arbitrarietà di ε > 0 si conclude la dimo-
strazione.
Osservazione. È immediato verificare che { x ∈ V | pC (x) < 1 } ⊆ C ⊆ { x ∈ V | pC (x) ≤ 1 }.
Teorema. Ogni (corpo) convesso chiuso, limitato e con interno non vuoto C in uno spazio
normato reale V è omeomorfo alla sfera unitaria chiusa B = B1∗ (0) = {x | ||x|| ≤ 1}.
Dimostrazione. Non è restrittivo supporre 0 ∈ J(C), B ⊆ C e C ⊆ BR , dove BR è la sfera
chiusa di centro l’origine e raggio R. Sia p = pC il funzionale di Minkowski di C, per ogni x ∈ V
non nullo si ha
x x
∈ C ⇒ p( ) ≤ 1 ⇒ p(x) ≤ ||x|| ,
||x|| ||x||

dunque anche |p(x) − p(y)| ≤ ||x − y|| e p è continua. Inoltre C = {x | p(x) ≤ 1}: infatti per
l’Osservazione relativa alla proposizione precedente basta controllare che p(x) = 1 = infx∈ρC ρ ←
x ∈ C; ma poiché esiste ρn → 1 tale che x/ρn ∈ C e x/ρn → x, la chiusura di C garantisce il
controllo. Infine
Rx 1
p( ) ≥ 1 ⇒ ||x|| ≤ p(x) .
||x|| R
Definiamo ora la trasformazione T mediante le formule
p(x)
T (0) = 0 e T (x) = x per x = 0 .
||x||
Ovviamente T (C) = B, perché x ∈ C ⇒ p(x) ≤ 1.

T è biunivoca: per x = 0 si ha
p(x) p(x)2 ||y||2

y= x ⇒ ||y|| = p(x) , p(y) = , ||x|| = ,
||x|| ||x|| p(y)
e quindi
||x|| ||y||2 ||y||
x= y= y , cioè T −1 (y) = y.
p(x) p(y)||y|| p(y)
T e T −1 sono continue: ovviamente, per x e y diversi da 0, vista la continuità di p. Inoltre
xn → 0 ⇒ p(xn ) → 0 ⇒ T (xn ) → T (0) ,
yn → 0 ∧ ||T −1 (y)|| ≤ R||y|| ⇒ T −1 (yn ) → 0 ,

pertanto T e T −1 sono continue anche in 0. q.e.d.
Il Teorema di Brouwer è dunque completamente dimostrato.
È molto interessante un risultato enunciato già da Poincaré nel 1883, solo con un rapido
cenno ad un possibile percorso di dimostrazione, che generalizza il noto ed elementare teorema
di esistenza degli zeri delle funzioni continue e risulta equivalente al teorema di Brouwer.
Teorema (di Poincarè-Miranda). Siano F1 , F2 ...Fn n funzioni delle variabili reali x1 , x2 ...xn
continue nell’ipercubo Q = [−L, L]n , tali che, per ogni j sulle facce Q±
j = {xj = ±L} valgano
le disuguaglianze
Fj (x1 ...xj−1 , −L, xj+1 ...xn ≥ 0 ∧ Fj (x1 ...xj−1 , +L, xj+1 ...xn ≤ 0 .
Allora esiste in Q almeno una soluzione del sistema
Fj (x1 , x2 ...xn ) = 0 , j = 1, 2, ...n ,
cioè uno zero comune a tutte le funzioni Fj .

Dimostrazione (Miranda, 1940).
1) Supponiamo in primo luogo che sulle facce Q±j valgano ovunque le disuguaglianze strette. Sia

A+ − − + ±
j = {x ∈ Q | Fj > 0} ⊃ Qj , Aj = {x ∈ Q | Fj < 0} ⊃ Qj . Siano d le distanze (positive)
di A± ±
j da Qj , mj e Mj il minimo (negativo) e il massimo (positivo) di Fj in Q, e
d− d+
0 < εj < min( , ).
−mj Mj
Posto
f = (f1 , f2 ...fn ) , fj (x) = xj + εj Fj (x) ,
si controlla facilmente che f : Q → Q, cioè |fj | ≤ L per ogni j:
se Fj (x) ≤ 0 ⇒ fj (x) ≤ xj ≤ L,
se invece x ∈ A+ + +
j , cioè Fj (x) > 0 ⇒ xj ≤ L − d ⇒ fj (x) < xj + d Fj (x)/Mj ≤ L;
e in modo analogo si vede che fj (x) ≥ −L.
Allora il sistema di equazioni equivale al problema di punto fisso x = f (x), che ammette almeno
una soluzione grazie al teorema di Brouwer, essendo Q un corpo convesso compatto.
2) Se non si può garantire che sulle facce Q± j valgano ovunque le disuguaglianze strette, si
ricorre ad un metodo di approssimazione. Per ogni intero p le disuguaglianze strette valgono
per le Fjp = Fj − xj /p e quindi esiste xp ∈ Q tale che Fjp (xp ) = 0, j = 1, ...n. Sia xq una
sottosuccessione convergente a x ∈ Q, allora:
xq
0 = Fj (xq ) − → Fj (x) = 0
q
e dunque x risolve il sistema dato. q.e.d.
Proposizione (Miranda). Il Teorema di Poincaré-Miranda è equivalente al teorema di

Brouwer.
Dimostrazione. È sufficiente dimostrare che ogni applicazione continua da f : Q → Q ammet-
te almeno un punto fisso, cioè che il sistema di equazioni Fj (x) = fj (x) − xj = 0 ammette
una soluzione in Q. Basta prolungare per continuità le fj a tutto Rn in modo che sussista-
no le maggiorazioni |fj | ≤ L. Allora per L∗ sufficientemente grande i prolungamenti delle Fj
soddisfano alle disuguaglianze previste dal teorema di Poincaré-Miranda sulle facce del cubo
Q∗ = [−L∗ , L∗ ]n e quindi il sistema Fj (x) = 0, j = 1...n, ammette una soluzione x in Q∗ . Ma
per essa xj = fj (x) e dunque x ∈ Q. q.e.d.
Una importante estensione del teorema di Brouwer a spazi di Banach di dimensione infinita
è il seguente
Teorema di Schauder. Sia B uno spazio di Banach, C un suo sottoinsieme convesso e

compatto e T un’applicazione continua da C in sé stesso. Allora T ammette un punto fisso in
C: esiste z ∈ C tale che z = T (z).
Un’ulteriore estensione di questo risultato a spazi più generali, e precisamente agli spazi lo-
calmente convessi è nota come Teorema di Tychonov.
Il teorema di Schauder si ottiene immediatamente come corollario del seguente

Teorema. Sia B uno spazio di Banach, C un suo sottoinsieme (omeomorfo a un)convesso,

chiuso e limitato e T un’applicazione compatta da C in sé stesso. Allora T ammette un punto
fisso in C: esiste z ∈ C tale che z = T (z).
Spesso questo risultato viene ugualmente indicato come Teorema di Shauder.
Ricordiamo che una trasformazione T si dice compatta se e solo se è continua e inoltre trasforma
insiemi limitati in insiemi relativamente compatti (cioè a chiusura compatta).
Dimostrazione che questo teorema implica il teorema di Schauder nella versione iniziale. Sia
C compatto, T continua e L un sottoinsieme di C. Allora L è necessariamente limitato, L è
compatto e T (L) è relativamente compatto in quanto sottoinsieme di T (L), che è compatto.
Dunque T è compatta e ammette un punto fisso. q.e.d.
Prima di dimostrare il teorema sui punti fissi di operatori compatti, ricordiamo alcuni risul-
tati sulla compattezza negli spazi metrici e poi dimostriamo un risultato di approssimazione
di operatori compatti mediante operatori con immagine in dimensione finita.
1) Un insieme K in uno spazio metrico (S, d) è (relativamente) compatto se e solo se è (re-

lativamente) sequenzialmente compatto, cioè se e solo se da ogni successione xi ∈ K si può
estrarre una sottosuccessione xij convergente a un elemento di K;
2) In uno spazio metrico (S, d) un insieme K è relativamente limitato se e solo se esso è

totalmente limitato, cioè se e solo se, dato ε > 0 arbitrario esiste un insieme finito R =
{a1 , a2 ...aN } tale che
∀x ∈ K ∃j ∈ {1, 2, ...N } d(x, aj ) < ε .
(Si dice che R è un ε-reticolo finito per K). Si vede facilmente che non è restrittivo supporre
R ⊆ K.
3) Se C è totalmente compatto allora anche co(C) è totalmente limitato.

Infatti, sia R = {a1 , a2 , ...aN } un ε-reticolo finito
per C e y = i λi xi , xi ∈ C, un elemento di
co(R). Sia ai ∈ R tale che d(xi , ai ) < ε e b = i λi ai ∈ co(C); dunque si controlla immediata-
mente che d(y, b) < ε. Ma co(R) è chiuso e limitato in dimensione finita, quindi compatto. Sia
S un suo ε-reticolo finito e s ∈ S tale che d(b, s) < ε. Ne segue che d(y, s) ≤ 2ε e dunque S è
un 2ε-reticolo finito per co(C).
Teorema (approssimazione di operatori compatti). Nelle ipotesi del teorema di Schau-

der (B spazio di Banach, T : C → C operatore compatto definito su C ⊂ B comvesso chiuso e
limitato),
∀ε > 0 ∃Mε ∃Tε : C → coT (C) ∩ Mε ,
dove Mε è un sottospazio di dimensione finita, e sia Nε , tali che
∀f ∈ C ||T (f ) − Tε (f )|| ≤ ε .
Dimostrazione. Poiché coT (C) ⊆ C è compatto, sia R = {g1 , g2 ...gq } un suo ε-reticolo finito,
che non è restrittivo supporre ⊂ coT (C). Introduciamo poi il corrispondente proiettore di

Schauder Pε , definito per f ∈ T (C) da

(ε − ||f − gi ||)+
Pε f = λi (f )gi ∈ coT (C) , λi (f ) = +
.
i i (ε − ||f − gi ||)
Il denominatore non si annulla e Pε è ben definito e continuo. Inoltre

||Pε f − f || ≤ λi (f )||gi − f || ≤ ε .
i
Se ora si pone Tε = Pε ◦ T , si ha
||Tε (f ) − T (f )|| = ||Pε T (f ) − T (f )|| < ε , Tε (C) ⊆ Sε = coT (C) ∩ Mε ,
dove Mε è il sottospazio generato da R e di dimensione finita Nε = q. q.e.d.
Dimostrazione del Teorema di Schauder (nella seconda versione). Sia ε una successione
convergente a 0 e Tε l’approsimazione di T sopra definita. Tε (C) ⊆ Sε ⊆ C. Ma, essendo Sε un
compatto e convesso nel sottospazio di dimensione finita Mε e
Θε = Tε |sε : Sε → Sε ,
continua, per il Teorema di Brouwer, esiste un punto fisso fε = Θε fε ∈ coT (C). Per la
compattezza di questo insieme esiste una sottosuccessione fa convergente ad un limite f . Allora
f = lim fa = lim Ta (fa ) = lim[(Ta (fa ) − T (fa )) + (T (fa ) − T (f )) + T (f )] = T (f )

a a a
e f è un punto fisso. q.e.d.
2.4 Punti di equilibrio. Teoremi di minimax

Definiamo in primo luogo i punti di equilibrio di Nash, dei quali i punti sella sono un caso
particolare.
Definizione. Siano f1 , f2 , ...fn n funzioni reali di n variabili x1 , x2 ...xn , che variano rispet-
tivamente negli insiemi A1 , A2 , ...An . Dunque
fk : A1 × A2 ... × An → R , k = 1, 2...n .
Un punto c = (c1 , c2 ...cn ) è un punto di equilibrio di Nash per le fj se e solo se
∀k ∈ {1, 2...n} fk (c1 , ...ck−1 , ck , ck+1 , ...cn ) = max fk (c1 , ...ck−1 , xk , ck+1 , ...cn ) .
xk ∈Ak
Nel caso particolare n = 2 e f = f1 = −f2 si ha
∀x1 ∈ A1 f (x1 , c2 ) ≤ f (c1 , c2 ) ,

∀x2 ∈ A2 − f (c1 , x2 ) ≤ −f (c1 , c2 ) ,

e dunque
∀x1 ∈ A1 ∀x2 ∈ A2 f (x1 , c2 ) ≤ f (c1 , c2 ) ≤ f (c1 , x2 ) ;
e si dice che c è punto sella di f .
Consideriamo qualche proprietà immediata dei punti sella di una funzione f (x, y) delle va-
riabili x ∈ A e y ∈ B.
Ripetiamo che, se f : A × B → R, (x∗ , y ∗ ) è punto sella se e solo se
∀x ∈ A ∀y ∈ B f (x, y ∗ ) ≤ f (x∗ , y ∗ ) ≤ f (x∗ , y) .
Conviene premettere il lemma sguente.
Lemma. Vale sempre la disuguaglianza
sup inf f (x, y) ≤ inf sup f (x, y) .

x∈A y∈B y∈B x∈A
Dimostrazione.
∀x ∈ A ∀y ∈ B inf f (x, y) ≤ f (x, y) ,
y∈B
dunque
∀y ∈ B sup inf f (x, y) ≤ sup f (x, y) .
x∈A y∈B x∈A
Basta allora applicare l’operatore inf y∈B ad entrambi i membri per ottenere il risultato. q.e.d.
Proposizione 1. Condizione necessaria e sufficiente per l’esistenza di un punto sella è
max inf f (x, y) = min sup f (x, y) .

Dimostrazione.
i) Supponiamo che valga l’uguaglianza e sia V il valore comune dei due membri. Sia x∗ un punto
di massimo e y ∗ un punto di minimo:
V = max inf f (x, y) = inf f (x∗ , y) ≤ f (x∗ , y ∗ ) ≤ sup f (x, y ∗ ) = min sup f (x, y) = V ,
x y y x y x
allora
V = inf f (x∗ , y) = f (x∗ , y ∗ ) = sup f (x, y ∗ ) ,
y x
∗ ∗ ∗
cioè f (x, y∗) ≤ f (x , y ) ≤ f (x , y), per x ed y arbitrari.
ii) Sia (x∗ , y ∗ ) un punto sella, allora
max f (x, y ∗ ) = f (x∗ , y ∗ ) = min f (x∗ , y),

x∈A y∈B

quindi
inf sup f (x, y) ≤ f (x∗ , y ∗ ) ≤ sup inf f (x, y) .
y∈B x∈A x∈A y∈B
∗ ∗
(Si osservi che con x o y fissati si ha inf = min o sup = max, ma per altri valori x o y min o
max potrebbero non esistere.)
Tenendo conto del lemma precedente si trova il risultato. q.e.d.
Proposizione 2. (Criterio di esistenza di un punto sella). Se
∃x∗ , y ∗ , V (∀y V ≤ f (x∗ , y)) ∧ (∀x f (x, y ∗ ) ≤ V ) ,
allora (x∗ , y ∗ ) è punto sella di f e V = f (x∗ , y ∗ ).

Infatti l’ipotesi implica f (x∗ , y ∗ ) ≤ V ≤ f (x∗ , y ∗ ) e dunque
∀x, y f (x, y ∗ ) ≤ f (x∗ , y ∗ ) ≤ f (x∗ , y) .
Proposizione 3. L’insieme dei punti sella di f è della forma A∗ × B ∗ .

Infatti, se (x1 , y1 ) e (x2 , y2 ) sono punti sella, per la Proposizione 1 si ha f (x1 , y1 ) = f (x2 , y2 ),
e, indicando con V il valore comune, segue
∀y V ≤ f (x1 , y) ∧ ∀x f (x, y2 ) ≤ V ,
cioè (x1 , y2 ) è punto sella.
Teorema di Nash (1950). Siano g1 , g2 ...gn funzioni reali multilineari delle variabili
s1 , s2 ...sn definite in Σ = Σ1 × Σ2 ...Σn , dove ciascun Σk è un simplesso νk dimensionale. Allora
esiste almeno un punto di equilibrio di Nash per le gk :
gk (s) = max gk (< s; tk ; k >) k = 1, 2...n ,

tk ∈Σk
dove s = (s1 ...sn ) e < ·; ·; k > è la trasformazione definita da
< s; tk ; k >= (s1 ...sk−1 , tk , sk+1 ...sn ) ,
che sostituisce tk a sk nella posizione k.
Dimostrazione. Siano σkα , α = 1, 2...µk = νk + 1 i vertici del simplesso Σk e pkα = pkα (sk )
le coordinate baricentriche di sk :

µk
µk
sk = σkα pkα , pkα ≥ 0 , pkα = 1 .
α=1 α=1
Sia pk (sk ) il vettore di componenti pkα (sk ), α = 1, ...µk e p(s) = (p1 (s1 )...pn (sn )), cioè p(s)k =
pk (sk ).
Per la linearità di gk (s) in sk ed essendo sk combinazione convessa delle σkα , si ha
max gk (< s; tk ; k >) = max gk (< s; σkα ; k >) , k = 1, ...n .

tk α

Dunque s è punto di equilibrio se e solo se, posto gkα (s) = gk (< s; σkα ; k >), risulta
gk (s) = max gkα (s) .

α
(In ogni caso gk (s) è combinazione convessa delle gkα (s), dunque si ha sempre gk (s) ≤ maxα gkα (s).)
Osserviamo che, dicendo che sk dipende da σkα se e solo se pkα > 0, s è punto di equilibrio
se e solo se, per ogni k, vale l’implicazione
sk dipende da σkα ⇒ gkα (s) = max gkβ (s) .

β
Poniamo ora, per ogni k e α:
ϕkα (s) = max(0, gkα (s) − gk (s)) .
Per quanto visto sopra, l’essere s punto di equilibrio di Nash si può esprimere con le equazioni
∀k ∀α ϕkα (s) = 0 .
Definiamo la trasformazione T da Σ in sé stesso mediante le formule

sk + α ϕkα (s)σkα
T (s)k = , k = 1...n ,
1 + β ϕkβ (s)
ovvero in coordinate baricentriche

pkα (s) + ϕkα (s)
T (p(s))k = p∗k , dove p∗kα = , α = 1...µk .
1 + β ϕkβ (s)

L’applicazione T è continua e Σ è un corpo convesso in dimensione k νk , e quindi, per il teo-
rema di Brouwer, T ammette almeno un punto fisso.
Verifichiamo che s (o p(s)) è un punto fisso di T se e solo se è un punto di equilibrio di Nash
per le gk .
a) Per ogni k, essendo

µk
pkα ≥ 0 , pkα = 1 , gk (s) = gkα (s)pkα ,
α=1 α
deve esistere almeno un α tale che gkα (s) ≤ gk

(s) e quindi ϕkα (s) = 0. Allora se s è punto fisso
deve essere anche per tale α p∗kα = pkα , cioè β ϕkβ (s) = 0, quindi ϕkβ (s) = 0 per ogni β e
pertanto s è punto di equilibrio.
b) Se s è punto di equilibrio, per ogni k e per ogni β, risulta gk (s) ≥ gkβ (s) e quindi tutte le
ϕkβ (s) si annullano. Allora p∗kα = pkα per ogni k e α, cioè s è punto fisso di T . q.e.d.
Il Teorema precedente è stato dimostrato da Nash[16] nell’ambito del suo studio sui giochi
non-cooperativi, dove ci si muove nell’ambito della formulazione matematica della teoria dei

giochi stabilita da von Neumann nell’articolo del 1928[19].

Il problema affrontato da Nash prevede n giocatori: 1,2,..n che agiscono indipendentemente. Il
giocatore k dispone di un numero finito µk strategie “pure σkα . Ciascun giocatore sceglie una
strategia e ottiene come risultato la vincita (positiva o negativa) Vk (σ1α ...σnα ) che dipente da
tutte le scelte indipendenti dei giocatori.
Più generalmente il giocatore k può adottare una strategia mista sk che è definita come una
variabile aleatoria discreta, la quale può assumere quali valori le stategie pure σkα con probabilità
pkα . Spesso si rappresenta sk come combinazione convessa delle strategie pure:

sk ∼ σkα pkα .
α
Per l’indipendenza, la probabilità di un sistema assegnato di strategie pure è data dalla formula
P (s1 = σ1α , s2 = σ2β ...) = P (s1 = σ1α )P (s2 = σ1β )... = p1α p2β ... = p(s)(σ) ,
se σ = (σ1α σ2β ...) e s = (s1 , s2 ...).
Le variabili aleatorie Vk (s) = Vk (s1 ...sn ) assumo quindi i valori Vk (σ) = Vk (σ1α σ2β ...) con
probabilità p(s)(σ) e ne possiamo considerare il valor medio o guadagno atteso

gk (s) = E(Vk (s)) = Vk (σ)p(s)(σ) .
σ
Ciascun giocatore vorrebbe che il suo guadagno atteso fosse massimo.

Un punto di equilibrio di Nash del gioco è una collezione s di strategie miste sk tale che nessuno
dei giocatori può far crescere il suo guadagno atteso agendo indipendentemente, se tutti gli altri
giocatori mantengono la strategia scelta.
Il teorema di Nash si può allora formulare dicendo che ogni gioco finito ammette un punto
di equilibrio.
Teorema del minimax di von Neumann (1928). Sia f (x, y) una funzione bilineare
definita in A × B, dove A e B sono due simplessi, rispettivamente M e N dimensionali. Allora
esiste un punto sella (x∗ , y ∗ ) per f su A × B:
∀x ∈ A ∀y ∈ B f (x, y ∗ ) ≤ f (x∗ , y ∗ ) ≤ f (x∗ , y) .
e quindi vale l’uguaglianza di minimax:
max min f (x, y) = min max f (x, y) .
∗

Infine, se x = p∗i
i xi
∗
ey = ∗
k yk qk ,
dove xi e yk sono i vertici dei simplessi A e B, mentre
p∗i , qk∗ ≥ 0 e i pi = q
k k = 1, si ha

min p∗i f (xi , yk ) = max qk∗ f (xi , yk ) .
k i
i k
Dimostrazione. Possiamo ottenere questo risultato fondamentale come corollario del Teorema
di Nash. Infatti, come abbiamo già osservato, i punti sella sono un caso particolare di punti di
equilibrio di Nash. Basta porre
g1 (x, y) = f (x, y) , g2 (x, y) = −f (x, y) , s1 = x, s2 = y , Σ1 = A , Σ2 = B ,

per ricondursi al teorema precedente.

Inoltre, vista la Proposizione 1 che fornisce una condizione necessaria e sufficiente perchè (x∗ , y ∗ )
sia un punto sella, e poiché la continuità di f implica l’esistenza del miny f (x, y) e del maxx f (x, y),
si ottiene la validità dell’uguaglianza di minmax. Infine, ricordando che nella dimostrazio-
ne del Teorema di Nash abbiamo caratterizzato i punti di equilibrio mediante le relazioni
gk (s) = maxα gkα (s), abbiamo
f (x∗ , y ∗ ) = max f (xi , y ∗ ) = min f (x∗ , yk ) . q.e.d.

i k
Il Teorema di minimax di von Neumann ammette estensioni in contesti estremamente più

ampi. Prima di presentare queste estensioni, converrà premettere qualche definizione e ricordare
qualche risultato importante.
Ricordiamo che una funzione f : T → R, dove T è uno spazio topologico, si dice semicon-
tinua inferiormente (s.c.i.) in x ∈ T se e solo se, indicando con V (x) un generico intorno di
x, risulta
∀ε > 0 ∃V (x) ∀z ∈ V (x) f (x) − ε < f (z) .
In modo analogo una funzione f : T → R si dice semicontinua superiormente (s.c.s.) in

x ∈ T se e solo se
∀ε > 0 ∃V (x) ∀z ∈ V (x) f (z) < f (x) + ε .
Ovviamente le funzioni continue sono sia s.c.i. che s.c.s.
Se f è s.c.i. in ogni punto di T , per ogni livello l l’insieme F = {x ∈ T | f (x) ≤ l} è

chiuso, essendo il complementare aperto (x ∈ / F ⇒ f (x) > l e quindi esiste un intorno di x
dove f (z) > l). Analogamente, se f è s.c.s. in ogni punto di T , per ogni livello l l’insieme
F = {x ∈ T | f (x) ≥ l} è chiuso.
Se f è s.c.i. in x e xn → x allora lim inf n f (xn ) ≥ f (x) (infatti per ogni ε > 0 si ha, per n
sufficientemente grande, f (xn ) > f (x) − ε e quindi lim inf n f (xn ) ≥ f (x) − ε). Analogamente
se f è s.c.s. in x e xn → x allora lim supn f (xn ) ≤ f (x). Negli spazi metrici queste condizio-
ni sono anche sufficienti affinché f sia s.c.i. o s.c.s. (ad esempio nel primo caso, se esistesse
ε > 0 tale che in nessun intorno di x si avesse sempre f (z) > f (x) − ε, per ogni n potremmo
trovare xn tale che d(xn , x) < 1/n e f (xn ) ≤ f (x) − ε, ma allora si avrebbe il risultato assurdo
lim inf n f (xn ) < f (x)).
Ricordiamo ancora che il clasico teorema di Weierstrass sui massimi e minimi può
essere precisato affermando che una funzione f s.c.i. su un compatto K ammette minimo e che
una funzione f s.c.s. su un compatto K ammette massimo. (Ad esempio nel primo caso, posto
m = inf x∈K f (x), se Fn = {x | m ≤ f (x) ≤ m+1/n}, Fn è chiuso per la s.c.i. di f ; l’intersezione
di un numero finito arbitrario di insiemi Fn non è vuota, quindi per la compattezza di K esiste
x ∈ ∩n Fn ⊆ K; allora f (x) = m).

Siamo ora in grado di enunciare un primo risultato (suscettibile di ulteriori generalizzazioni)

di grande importanza.
Teorema. Siano X e Y due spazi vettoriali topologici, A ⊂ X e B ⊂ Y sottoinsiemi

convessi e compatti, e f (x, y) una funzione a valori reali definita su A × B tale che
1) ∀y ∈ B l’applicazione x → f (x, y) è concava e s.c.s.
2) ∀x ∈ A l’applicazione y → f (x, y) è convessa e s.c.i.
Allora esistono x∗ ∈ A e y ∗ ∈ B tali che
∀x ∈ A ∀y ∈ B f (x, y ∗ ) ≤ f (x∗ , y ∗ ) ≤ f (x∗ , y) ,
ovvero (x∗ , y ∗ ) è un punto di sella della funzione f .

L’esistenza di un punto di sella per f è equivalente all’eguaglianza

Osservazione. Se y → f (x, y) è s.c.i. per ogni x, la funzione g(y) = supx f (x, y) è ancora s.c.i.
Infatti, se x0 è tale che f (x0 , y) > g(y) − ε e per ogni z ∈ V (y) si ha f (x0 , z) > f (x0 , y) − ε,
allora
g(z) = sup f (x, z) ≥ f (x0 , z) > g(y) − 2ε .
x
Similmente se f (x, y) è s.c.s. per ogni y, la funzione h(x) = inf y f (x, y) è ancora s.c.s.
Essendo la funzione g(y) = maxx∈A f (x, y) s.c.i., ha senso considerare miny∈B g(y). In modo
analogo la funzione h(x) = miny∈B f (x, y) è s.c.s. e ammette massimo in B.
Possiamo ottenere questo risultato come corollario della successiva generalizzazione del Teo-
rema di Nash oppure di un teorema di Ky Fan (K.Fan[10]) del 1952. Definiamo prima le nozioni
di funzione convexlike o concavelike, cioè di tipo convesso o concavo.
Definizione. Sia f una funzione a valori reali definita sul prodotto X × Y di due insiemi
arbitrari.
1) f è convexlike su Y se e solo se
∀θ ∈ [0, 1] ∀y1 , y2 ∈ Y ∃y0 ∈ Y ∀x ∈ X f (x, y0 ) ≤ (1 − θ)f (x, y1 ) + θf (x, y2 ) .
2) f è concavelike su X se e solo se
∀θ ∈ [0, 1] ∀x1 , x2 ∈ X ∃x0 ∈ X ∀y ∈ Y f (x0 , y) ≥ (1 − θ)f (x1 , y) + θf (x2 , y) .
Osservazione. Se X eY sono insiemi convessi di spazi vettoriali e se f è concava in x o convessa

in y, ovviamente essa è rispettivamente concavelike su X o convexlike su Y .
Teorema di Ky Fan (1952). Siano X e Y due insiemi compatti ed f una funzione a

valori reali definita su X × Y .
Sia f (x, y) s.c.s su X per ogni y e s.c.i. su Y per ogni x. Allora l’uguaglianza
max min f (x, y) = min max f (x, y)

x∈X y∈Y y∈Y x∈X

vale se e solo se è soddisfatta la condizione seguente:

Per ogni coppia di sottoinsiemi finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X e Y esistono x0 ∈ X e
y0 ∈ Y tali che
f (xi , y0 ) ≤ f (x0 , yk ) , i = 1...n, k = 1...m .
In particolare, se f è concavelike su X e convexlike su Y , allora l’uguaglianza di minmax vale.
Osservazione 1. È evidente che il teorema precedente, sull’uguaglianza di minmax in presenza

di convessità, concavità e semicontinuità, è un corollario immediato del Teorema di Ky Fan.
Osservazione 2. Come nel teorema precedente, la s.c.s. in x e la s.c.i. in y assicurano l’esistenza
dei massimi e dei minimi che compaiono nella tesi.
Dimostrazione.
La condizione è ovviamente necessaria: sia
min max f (x, y) = max f (x, y0 ) e max min f (x, y) = min f (x0 , y),
y x x x y y
allora ∀i, k f (xi , y0 ) ≤ f (x0 , yk ).

Per verificarne la sufficienza, osserviamo che essa implica che per ogni coppia di sottoinsiemi
finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X e Y si ha
min max f (xi , y) ≤ max min f (x, yk ) .

y∈Y i x∈X k
Quindi per ogni reale ρ vale una almeno delle seguenti disuguaglianze:
min max f (xi , y) ≤ ρ , ρ ≤ max min f (x, yk ) .

y∈Y i x∈X k
Poniamo
L(x, ρ) = {y ∈ Y | f (x, y) ≤ ρ} , U (y, ρ) = {x ∈ X | ρ ≤ f (x, y)} ,
insiemi chiusi in virtù delle proprietà di semicontinuità di f .
Allora per ogni reale ρ e per ogni coppia di sottoinsiemi finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X
e Y , le due intersezioni
∩ni=1 L(xi , ρ) e ∩mk=1 U (yk , ρ)
non sono entrambe vuote, in quanto caratterizzano gli insiemi nei quali rispettivamente maxi f (xi , y) ≤
ρ e ρ ≤ mink f (x, yk ). Ne segue, vista la compattezza di X e Y , che le intersezioni
∩x∈X L(x, ρ) e ∩y∈Y U (y, ρ)
non sono entrambe vuote. Infatti, se per esempio la seconda intersezione fosse vuota, per
la compattezza di Y , esisterebbe almeno un sottoinsieme finito {y1 , y2 ...ym } di Y tale che
∩y∈Y U (y, ρ) = ∅. Ma allora, per ogni sottoinsieme finito {x1 , x2 ...xn } di X si avrebbe ∩ni=1 L(xi , ρ) =
∅ e quindi, per la compattezza di X, dovrebbe essere ∩x∈X L(x, ρ) = ∅.
Dunque o esiste x0 ∈ X tale che per ogni y ∈ Y risulta ρ ≤ f (x0 , y), oppure esiste y0 ∈ Y tale
che per ogni x ∈ X risulta f (x, y0 ) ≤ ρ.
Allora, per ogni ρ, deve essere soddisfatta almeno una delle disuguaglianze
min max f (x, y) ≤ ρ , ρ ≤ max min f (x, y) ,

y∈Y x∈X x∈X y∈Y

e ciò è possibile solo se

min max f (x, y) ≤ max min f (x, y) ,
y∈Y x∈X x∈X y∈Y
il che dimostra la prima parte della tesi.
Per ogni coppia di sottoinsiemi finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X e Y , per il teorema
∗ ∗ ∗ ∗ ∗ ∗
di
minmax
∗
von∗ Neumann esistono due vettori (p1 , ...pn ) e (q1 ...qm ), con pi ≥ 0, qk ≥ 0 ,
di
i pi = 1 e k qk = 1, tali che

V = max qk∗ f (xi , yk ) = min p∗i f (xi , yk ) .
i k
k i
Supponiamo ora che f sia concavelike su X e convexlike su Y . Allora esistono x0 ∈ X e y0 ∈ Y

tali che
∀i f (xi , y0 ) ≤ qk∗ f (xi , yk ) ≤ V, ∀k V ≤ p∗i f (xi , yk ) ≤ f (x0 , yk )
k i
e pertanto
∀i∀k f (xi , y0 ) ≤ V ≤ f (x0 , yk ) ,
quindi la condizione necessaria e sufficiente per l’uguaglianza di minmax è soddisfatta. q.e.d.
Una generalizzazione diversa dei concetti di convessità e concavità è la seguente.
Definizione. Sia f una funzione a valori reali definita in uno spazio vettoriale V .
a) f è quasicovessa su V se e solo se
∀l { v | f (v) ≤ l } è convesso .
b) f è quasiconcava su V se e solo se
∀l { v | f (v) ≥ l } è convesso .
Osservazione. Le nozioni di quasiconvessità e quasiconcavità sono già presenti, senza che ad

esse venga assegnato un nome, nel lavoro di von Neumann del 1928.
Siamo ora in grado di enunciare un risultato di M.Sion del 1957[23], la cui dimostrazione
venne derivata direttamente dal Teorema KKM, senza ricorrere al teorema di Brouwer.
Teorema di Sion (1957). Siano X e Y due insiemi compatti e covessi, ed f una funzione
a valori reali definita su X × Y .
Sia f (x, y) s.c.s e quasiconcava su X per ogni y, e s.c.i. e quasiconvessa su Y per ogni x.
Allora vale l’uguaglianza di minmax:

x∈X y∈Y y∈Y x∈X

I risultati precedenti sui punti di equilibrio e sui punti di infsup possono essere generalizzati
in varie direzioni.
Risultano strumenti essenziali, non solo per le generalizzazioni sopra menzionate, i seguenti
Teoremi del minsup e di Ky Fan. Per un più facile confronto con la letteratura corrente, scam-
bieremo il ruolo delle variabili x e y: nel senso che cercheremo il minimo in x e il massimo in y.
Data una funzione f (x, y) definita su X × Y , introduciamo i valori (il primo e il terzo già
considerati in precedenza)
v− = sup inf f (x, y) ≤ v ∗ = sup inf sup f (x, y) ≤ v + = inf sup f (x, y) ,
y∈Y x∈X F ∈F x∈X y∈F x∈X y∈Y
dove F indica la famiglia dei sottoinsiemi finiti di Y.
La prima disuguaglianza si ottiene considerando soltanto gli insiemi costituiti da un solo

elemento F = {y} nelle operazioni che conducono a v ∗ ; la seconda disuguaglianza segue dall’os-
servazione che ovviamente per ogni F si ha inf x∈X supy∈F f (x, y) ≤ v + .
Premettendo che una funzione g(x) si dice inferiormente semi-compatta in X se e solo se per
ogli livello l risulta x ∈ X | g(x) ≤ l è compatto su X, possiamo ora enunciare il
Teorema del minsup. Supponiamo che valgano le seguenti condizioni

1) per ogni y ∈ Y f (·, y) è s.c.i. su X,
2) esiste y0 ∈ Y tale che f (·, y0 ) è inferiormente semi-compatta su X.
Allora esiste x∗ tale che
sup f (x∗ , y) = v ∗
y∈Y
e quindi
v∗ = v+ .
Dimostrazione. Gli insiemi C(y) = {x | f (x, y) ≤ v ∗ } sono chiusi per la s.c.i. Basta dimostrare
che C = ∩y∈Y C(y) = ∅ e prendere x∗ ∈ C. Per la compattezza di C(y0 ) basta dimostrare che
per ogni F = {y1 , y2 ...yn } ∈ F si ha CF = C(y0 ) ∩ ∩y∈F C(y) = ∅. Ma maxk f (x, yj ) è s.c.i. in
x e dunque esiste xF tale che
max f (xF , yj ) = inf max f (x, yj ) ≤ v ∗

j x j
e quindi xF ∈ CF . Dunque esiste x∗ tale che supy f (x∗ , y) ≤ v ∗ . Tuttavia
v + ≤ sup f (x∗ , y) ≤ v ∗ ≤ v +
y
e le tesi seguono immediatamente. q.e.d.
Teorema di Ky Fan. Sia X un sottospazio convesso e compatto di uno spazio vettoriale

topologico (separato). Supponiami che la funzione f : X × X → R soddisfi le condizioni:
1) per ogni y ∈ Xf (·, y) è s.c.i. ,

2) per ogni x ∈ Xf (x, ·) è quasi-concava,

3) supy∈X f (y, y) ≤ 0.
Allora esiste x∗ ∈ X tale che supy∈X f (x∗ , y) ≤ 0.
Dimostrazione. Poniamo M = supy∈X f (y, y). Poiché le ipotesi del Teorema del minsup sono
soddisfatte e quindi esiste x∗ tale che supy f (x∗ , y) = v + = v ∗ , basta dimostrare che v ∗ ≤ M .
Sia F = {y1 , y2 ...yn } un sottoinsieme finito arbitrario; controlliamo che
inf sup f (x, yj ) ≤ sup f (y, y) = M .

x j y∈X
Infatti, posto
g(λ, y) = f ( λj yj , y) , Fj = {λ | g(λ, yj ) ≤ M } ,
j

), λj ≥ 0,
dove λ = (λ1 , ...λn j λj = 1, vediamo che per il Teorema KKM esiste λF ∈ ∩j Fj e
quindi, con xF = j (λF )j yj risulta maxj f (xF , yj ) ≤ M , dimostrando cosı́ la tesi.
Gli insiemi Fj soddisfano le ipotesi del Teorema KKM. Infatti sono chiusi per la s.c.i. Inoltre se
J(λ) = {j | λj = 0} allora λ ∈ ∪j∈J(λ) Fj , altrimenti esisterebbe µ tale che

∀j ∈ J(µ) g(µ, yj ) = f ( µi yi , yj ) > M .
i
Ma, per la quasi-concavità di f nella seconda variabile, si avrebbe

f( µi yi , µi y) ≥ µi f ( µi yi , yi ) > M ,
i i i i
in contraddizione con la definizione di M . q.e.d.
Usiamo ora il Teorema di Ky Fan per dimostrare una notevole generalizzazione del Teorema
di Nash.
Ricordiamo la definizione di punti di equilibrio di Nash, considerando ora però problemi di

minimo (equivalenti a problemi di massimo per le funzioni proposte cambiate di segno):
n f1 , f2 , ...fn n funzioni reali della variabile x = (x1 , x2 ...xn ), che varia in un sottoinsieme
Siano
A di j=1 Aj , essendo Aj l’insieme dei valori ammissibili per xj . Dunque
fk : A ⊆ A1 × A2 ... × An → R , k = 1, 2...n .
Un punto c = (c1 , c2 ...cn ) ∈ A è un punto di equilibrio di Nash per le fj se e solo se
∀j ∈ {1, 2...n} fj (c) = min fj (< c; xj , j >) .

{xj | <c;xj ,j>∈A}
Definiamo la funzione g : A × A → R mediante la formula

n
g(x, y) = (fj (x) − fj (< x; yj , j >)) .
j=1

Lemma. Se x ∈ A soddisfa la disuguaglianza
sup g(x, y) ≤ 0 ,
y∈A
allora x è un punto di equilibrio di Nash.

Dimostrazione. Per y =< x; yk , k >∈ A, solo il termine k-esimo della somma non è nullo e si
ottiene g(x, y) = fk (x)−fk (< x; yk , k >) ≤ 0, cioè fk (x) = min{yk | <x;yk ,k>∈A} fk (< x; yk , k >).
q.e.d.
Teorema (Nash). Supponiamo che

1) l’insieme A sia convesso e compatto;
2) le funzioni fj siano continue e
3) qualsiasi j la funzione fj sia convessa nella variabile xj per tutti i valori ammissibili delle
altre variabili.
Allora esiste un punto di equilibrio.
Dimostrazione. Per il lemma precedente basta vedere che esiste x ∈ A tale che supy∈A g(x, y) ≤
0. Ma le ipotesi del Teorema di Ky Fan sono soddisfatte: A è convesso e compatto per ipotesi;
g è s.c.i in x, con y arbitrario, per la continuità delle fj ; g è concava in y, con x arbitrario, per
la convessità delle fj e infine per ogni y si ha ovviamente g(y, y) = 0. q.e.d.
Corollario (sui punti sella). Nen caso particolare di due sole variabili (due giocatori)
x = (x1 , x2 ) e con
f1 (x1 , x2 ) = f (x1 , x2 ) = −f2 (x1 , x2 )
(gioco a somma zero), basta chiedere che f (·, x2 ) sia s.c.i. per ogni x2 e f (x1 , ·) sia s.c.s. per
ogni x1 , invece di chiedere la continuità di f (·, ·). Si deve ovviamente chiedere che f sia convessa
in x1 e concava in x2 . In tal caso il punto di equilibrio del quale si garantisce l’esistenza (x∗1 , x∗2 )
è ovviamente un punto sella:
min max f (x1 , x2 ) = f (x∗1 , x∗2 ) = max min x1 f (x1 , x2 ) .

x1 x2 x2
Dimostrazione. Riprendendo la dimostrazione del Teorema di Nash, si ha in questo caso
g(x, y) = f (x1 , x2 ) − f (y1 , x2 ) + (−f (x1 , x2 ) + f (x1 , y2 ) = f (x1 , y2 ) − f (y1 , x2 ) ,
e dunque g è s.c.i. in y sotto le ipotesi di semicontinuità alle quali f soddisfa. Si osservi che f
è concava in x2 essendo −f convessa. Il resto della deduzione non cambia. q.e.d.
Per ulteriori approfondimenti si veda Aubin[1].
2.5 Gamma convergenza

Dobbiamo ad Ennio De Giorgi l’introduzione e lo sviluppo di una nozione di convergenza
per successioni a valori reali (estesi) di grande importanza per lo studio di problemi variazionali.
Si tratta di un tipo di convergenza adatto a controllare il comportamento asintotico dei minimi

e dei massimi, come dei punti di minimo e di massimo, in un contesto estremamente generale.
Proponiamo in questa sezione alcuni cenni, rinviando per una trattazione dettagliata al lavoro
di De Giorgi - Franzoni[6].
Sia X uno spazio topologico, τ la sua topologia, fn una successione di funzioni definite in X
a valori relai estesi.
Definizione. Si dice Γ− -liminf della successione la funzione
Γ− (τ ) lim inf f (x) = sup lim inf inf fn (y) ,

n V ∈Vτ (x) n y∈V
che indicheremo brevemente con γi− (x). Vτ (x) è la famiglia degli intorni di x per la topologia τ .
Definizione. Si dice Γ− -limsup della successione la funzione
Γ− (τ ) lim sup f (x) = sup lim sup inf fn (y) ,

n V ∈Vτ (x) n y∈V
che indicheremo brevemente con γs− (x).
Definizione. Si dice che la successione fn Γ− -converge se γi− (x) = γs− (x). Il valore comune
è il Γ− -limite delle fn e verrà indicato con γ − (x).
Lemma. Le funzioni γi− (x) e γs− (x) sono semicontinue inferiormente.

Dimostrazione. Sia c < γi− (x) = supV (x) lim inf n inf y∈V (x) , dove con V (x) indichiamo un
generico intorno di x. Allora esiste W (x) tale che
c < lim inf inf ≤ sup lim inf inf fn (x) ,

n y∈W (x) V (z) n y∈V (z)
per ogni z ∈ W (x) e dunque γi− (x) è s.c.i. Per γs− (x) si procede nello stesso modo. q.e.d.
Osservazione. Si ha sempre ovviamente
γi− (x) ≤ lim inf fn (x) , γs− (x) ≤ lim sup fn (x) .
n n
Se le funzioni fn sono equisemicontinue in x, cioè se per ogni ε > 0 esiste un intorno V (x)
tale che per ogni n e per ogni y ∈ V (x) si abbia fn (y) > fn (x) − ε, allora valgono le relazioni
precedenti con il segno di uguaglianza.
Dimostrazione. Dato ε > 0 arbitrario e considerato un intorno V (x) con le proprietá sopra dette
si trova ∈y∈V (x) fn (y) ≥ fn (x) − ε e dunque si ha γi− (x) ≥ lim inf n fn (x) − ε. q.e.d.
Esempio 1. Sia X = [0, 1[ con la topologia indotta da R; sia
χn,k = χ[(k−1)/n,k/n[ n = 1, 2, ... , k = 1, 2, ..., n .
Ordiniamo queste funzioni caratteristiche formando la successione fp = χn,k , p = 1 + 2 + ...(n −

1) + k . Per ogni x ∈ [0, 1[ vi sono infiniti indici p per i quali fp (x) = 1 e infiniti per i quali

fp (x) = 0 : quindi lim inf n fn = 0 e lim supn fn = 1, mentre la successione fp non converge in
nessun punto.
Se ora fissiamo un intorno arbitrario V di un punto x, per n sufficientemente grande vi saranno
in V punti z per i quali fn (z) = 0 e dunque inf y∈V fn (y) = 0. Ne segue che γi− (x) = γs− (x) = 0
e la successione Γ− -converge alla funzione nulla.
Esempio 2. Si consideri in [0, 1] , munito della usuale misura di Lebesgue, un sottoinsieme

numerabile denso (eventualmente i razionali dell’intervallo) E = {r0 , r1 , r2 ...}. Sia
1/n 1/n
A = ∩+∞
n=1 An , An = ∪k ]rk − k
, rk + k [ .
2 2
An è un aperto denso di misura di Lebesgue ≤ 4/n, An+1 ⊂ An e l’insieme A è un Gδ , denso,
di misura di Lebesgue 0. Mentre il complementare C = Ac = ∪n Cn , con Cn = Acn , ha misura
di Lebesgue 1 e Cn ⊂ Cn+1 . Sia fn la funzione caratteristica di Cn , complementare di An . La
successione fn dunque converge q.o. e in ogni Lp alla funzione costante uguale a 1. Ma fissato
un intorno arbitrario V di un punto x in V vi sono sempre punti di An e quindi inf y∈V fn (y) = 0.
Si conclude allora che la successione Γ− -converge alla funzione nulla.
Proposizione A. Sia A un aperto, allora
inf γi− (x) ≥ lim inf inf fn (x) ,

x∈A n x∈A
inf γs− (x) ≥ lim sup inf fn (x) .

x∈A n x∈A
Dimostrazione. Risulta, essendo A aperto e dunque intorno di ogni suo punto:
∀x ∈ A γi− (x) = sup lim inf inf fn (x) ≥ lim inf inf fn (x) .
V (x) n y∈V (x) n y∈A
Prendendo l’estremo inferiore su A di entrambi i membri si ottiene il primo risultato. Analoga-

mente si procede per la seconda disuguaglianza.
Proposizione L. Sia xn → x. Allora
γi− (x) ≤ lim inf fn (xn ) ,

n
γs− (x) ≤ lim sup fn (xn ) .

n
Dimostrazione. Fissato comunque V (x), per n sufficientementente grande si ha xn ∈ V (x) e

dunque fn (xn ) ≥ inf y∈V (x) fn (x), dunque
lim inf fn (xn ) ≥ sup lim inf inf fn (x) . q.e.d.

n V (x) n y∈V (x)
Proposizione K. Sia K un sottoinsieme di X sequenzialmente compatto, allora
min γi− (x) ≤ lim inf inf fn (x) .

x∈K n x∈K

Dimostrazione. Indichiamo con l il secondo membro della disuguaglianza precedente. Sia fn
una sottosuccessione di fn e xn una successione di punti di K tali che
lim inf fn (x) = l = lim fn (xn ) .

n x∈K n
Sia poi xnj una sottosuccessione convergente in K e chiamiamo x il suo limite. Ricordando
che ovviamente il liminf lungo una successione è minore o uguale al liminf lungo una qualunque
sottosuccessione, si trova:
γi− (x) ≤ Γ− lim inf fn (x) ≤ Γ− lim inf fn j (x) ≤ lim inf fn j (xnj ) = lim fn j (xnj ) = l ,
n j j j
l’ultima disuguaglianza essendo assicurata dalla Proposizione L. q.e.d.
Teorema. Sia K un insieme sequenzialmente compatto contenuto nell’aperto A di X.

Supponiamo che valga l’ipotesi (di “coercività)
∀n inf fn (x) = inf fn (x) .

x∈K x∈A
Supponiamo inoltre che la successione fn sia Γ− - convergente a γ − (x). Allora
min γ − (x) = min γ − (x) = lim inf fn (x) = lim inf fn (x) .
x∈A x∈K n x∈K n x∈A
Inoltre, se xn → x ∈ A e fn (xn ) → µ = miny∈A γ − (y) allora
γ − (x) = min γ − (y) .

y∈A
Dimostrazione. Per la prima tesi, osservando che γ − (x) è s.c.i., usando la Proposizione K e
quindi la Proposizione A, si ottiene
min γ − (x) ≤ lim inf inf fn (x) ≤ lim sup inf fn (x) ≤ inf γ − (x) .
x∈K n x∈K n x∈A x∈A
Per la seconda tesi basta applicare la Proposizione L:
γ − (x) ≤ lim fn (xn ) = µ . q.e.d.

n


Capitolo 3
Operatori lineari. Equazioni

integrali
3.1 Lo spazio L(X, Y ).

Definizione. Siano X e Y due spazi vettoriali su K (K = R o K = C) normati. Sia D(A)
un sottospazio vettoriale di X e
A : D(A) ⊆ X → Y
un’applicazione lineare definita in D(A) a valori in Y :
∀f, g ∈ D(A) ∀λ, µ ∈ K A(λf + µg) = λAf + µAg ∈ Y .
Si dice che A è un’operatore lineare da X in Y di dominio D(A) .
Un operatore lineare può non essere definito su tutto X e può, diversamente da quanto av-
viene in dimensione finita, non essere continuo. Ad esempio, se X = Y = C([0, 1]), l’operatore
di derivazione d/dx ha per dominio l’insieme C 1 ([0, 1]) delle funzioni derivabili con derivata
continua, che è un sottospazio proprio di C([0, 1]), e non è continuo, perché successioni unifor-
memente convergenti di funzioni derivabili non hanno necessariamente derivate uniformemente
convergenti:
1 1
sin (2πnx) − 0∞ = → 0 , ma 2π cos (2πnx)∞ = 2π .
n n
(Se cos (2πnx) → g(x) uniformemente, g dovrebbe essere la derivata della funzione nulla, cioè
g ≡ 0.)
Definizione. L(X, Y ) è l’insieme degli operatori lineari ovunque definiti in X e continui da

X in Y :
A ∈ L(X, Y ) ⇔ D(A) = X e fn → f in X ⇒ Afn → Af in Y .
47
48 Capitolo 3. Operatori lineari. Equazioni integrali
Si vede immediatamente che L(X, Y ) è uno spazio vettoriale su K .
Definizione. Un’applicazione A da X in Y si dice limitata se trasforma ogni insieme

limitato di X in un insieme limitato di Y .
(Si osservi che nell’esempio precedente d/dx non è limitato: {sin (2πnx)}n è limitato in X , ma
{2πn cos (2πnx)}n non è limitato in Y = X.)
Per gli operatori lineari ovunque definiti continuità e limitazione sono equivalenti. Più pre-
cisamente vale la
Proposizione. Sia A : X → Y lineare con D(A) = X. Allora le proprietà seguenti sono

equivalenti:
1) A è continuo in 0;
2) A è continuo ovunque;
3) A è limitato;
4) Esiste M ≥ 0 tale che
∀f ∈ X Af Y ≤ M f X .
Dimostrazione.
Ovviamente 2) implica 1).
Anche 1) implica 2): infatti se fn → f , fn −f → 0 e quindi A(fn −f ) → A0 = 0, cioè Afn → Af .
1) implica 3): se B è limitato esiste L tale che ∀b ∈ B b ≤ L. Allora, se Af ≤ 1 per f ≤ δ
(continuità in 0), poiché δb/L ≤ δ,
L δb L
∀b ∈ B Ab = A ≤ ,
δ L δ
cioè A(B) è limitato.
3) implica 4): B = {b ∈ X | b ≤ 1} è limitato e pertanto è limitato A(B), cioè esiste M tale
che b ≤ 1 ⇒ Ab ≤ M . Allora, se f = 0:
f
Af = A f ≤ M f .
f
4) implica 2):
Af − Ag ≤ M f − g ,
cioè A è Lipschitziana e pertanto continua. q.e.d.
Teorema. L(X, Y ) è uno spazio vettoriale normato per la norma

AL(X,Y ) = inf{M ≥ 0 | ∀f ∈ X Af Y ≤ M f X } .
Risulta inoltre
∀f ∈ X Af ≤ Af
(quindi l’estremo inferiore nella definizione della norma è un minimo) e
Af Y Af Y
AL(X,Y ) = sup = sup = sup Af Y .
f =0 f X f =0, f ≤1 f X f =1

Dimostrazione. L(X, Y ) è uno spazio vettoriale, perché tale è Y , definendo
(λA + µB)f = λAf + µBf .
Le disuguaglianze della tesi seguono immediatamente dalle proprietà degli estremi inferiore e
superiore e dalla positiva omogeneità delle norme (il rapporto Af /f resta costante sulle
semirette uscenti da 0 e sup f =r Af /f è indipendente da r).
Teorema. Sia Y uno spazio di Banach. Allora L(X, Y ) con la norma AL(X,Y ) è uno
spazio di Banach.
Dimostrazione. Sia An ∈ L(X, Y ) una successione di Cauchy:
∀ε ∃N ∀n > N ∀p An+p − An < ε .
Allora ∀f ∈ X An+p f − An f < εf e An f è di Cauchy in Y , che è completo. Dunque An f

converge ad un limite dipendente da f , che indicheremo con Af . Per le proprietà dei limiti si
vede subito che A è lineare e D(A) = X. Inoltre per n > N
An+p ≤ An + ε
e dunque
Af = lim An+p f ≤ (An + ε)f ,
p→+∞
cioè A è limitato: A ∈ L(X, Y ). Infine
An f − Af = lim An f − An+p f ≤ εf ,
p→+∞
cioè An − AL(X,Y ) ≤ ε per n > N e quindi An → A ∈ L(X, Y ). q.e.d.
3.2 La serie di Neumann e l’inseme GL(X, Y ).

Tra gli operatori limitati hanno particolare importanza quelli, se esistono, che stabiliscono una
corrispondenza biunivoca tra X e Y . Tali operatori sono invertibili e l’applicazione inversa A−1
è ovviamente lineare e ovunque definita in Y : D(A−1 ) = Y . L’insieme delle applicazioni bijetive
di L(X, Y ) si indica con GL(X, Y ). Ricorrendo ad uno dei teoremi fondamentali dell’Analisi
funzionale, il teorema dell’applicazione aperta di Banach, che si vedrà al Capitolo 7, si
può ottenete il seguente risultato, che useremo sistematicamente nel seguito:
Teorema. Se X e Y sono spazi di Banach, allora
A ∈ GL(X, Y ) ⇒ A−1 ∈ GL(Y, X) ,
ovvero l’inverso di un operatore limitato, se esiste, è anch’esso limitato.
Prima di studiare alcune proprietà di GL(X, Y ), consideriamo il caso particolare, molto im-
portante, in cui X = Y . In tal caso si scrive brevemente L(X) in luogo di L(X, X) e GL(X) in

luogo di GL(X, X) .
Proposizione. L(X) è un’algebra (in generale non commutativa), essendo il prodotto

definito come composizione di applicazioni, cioè nel modo seguente:
∀f ∈ X (A · B)f = A(Bf ) .
In generale AB = BA . Inoltre:
AB ≤ AB .
La dimostrazione è immediata (ABf ≤ ABf ≤ ABf ).
Osservazione. Più in generale, se A ∈ L(X, Y ) e B ∈ L(Y, Z), allora l’operatore composto

BA = B ◦ A ∈ L(X, Z) e si ha
BAL(X,Z) ≤ BL(Y,Z) AL(X,Y ) .
In L(X) l’operatore identico I (talvolta scriveremo 1) è ovviamente invertibile. Risulta

che perturbazioni sufficientemente piccole di I sono ancora invertibili e la loro inversa si può
rappresentare come una serie, analoga alla serie geometrica del caso scalare. Precisamente vale il
Teorema (Serie di Neumann). Sia A ∈ L(X) con AL(X) < 1 , allora

+∞

(I − A)−1 ∈ L(X) e (I − A)−1 = Ak .
k=0
(Si pone A0 = I.)

Dimostrazione. La serie di Neumann k Ak è convergente “assolutamente per A < 1 (ad
un elemento di L(X)), essendo
+∞
+∞

Ak ≤ Ak < +∞ .
k=0 k=0
(In ogni spazio di Banach, per il criterio di Cauchy, la convergenza di una serie con termini ck
è implicata dalla convergenza della serie delle loro norme ck . Come per le serie numeriche, in
questo caso la convergenza è indipendente dall’ordine dei termini ck .)
Inoltre si ha
n n
(I − A) Ak = ( Ak )(I − A) = I − An+1 → I ,
0 0
per n → +∞ (A ≤ A → 0). Dunque, passando al limite e ricordando che I − A e Ak

n n
sono continue, si trova

+∞
+∞

∀f ∈ X (I − A) Ak f = ( Ak )(I − A)f = f = If
0 0

+∞
e pertanto (I − A)−1 = k=0 A
k
. q.e.d.
Osservazione. L’inversione di I − A è legata alla risoluzione dell’equazione (I − A)f = g per

ogni g , ovvero ala determinazione di un punto fisso di M definita da M f = Af + g. M è una
contrazione stretta se A < 1. Il teorema sulle contrazioni fornisce la soluzione nella forma
+∞

f = lim M n f0 = lim (g + Ag + A2 g + ...An−1 g + An−1 f0 ) = Ak g .
n→+∞ n→+∞
k=0
+∞
Nel teorema precedente però si ha non soltanto la convegenza della serie k=0 Ak g per ogni g ,
ma anche la convergenza della serie degli operatori Ak stessi, equivalente alla convergenza della
serie precedente uniformemente sui limitati di X.
Siamo ora in grado di dimostrare i seguenti risultati fondamentali.
Teorema. GL(X, Y ) è un insieme aperto in L(X, Y ) e l’applicazione i : A → i(A) = A−1 è

continua.
Dimostrazione. Vediamo che se A ∈ GL(X, Y ) e H < A−1 −1 allora A + H ∈ GL(X, Y ).

Infatti per ogni g ∈ Y
(A + H)f = g ⇔ (I + A−1 H)f = A−1 g ⇔ f = M f ,
dove M è definito da
M φ = −A−1 Hφ + A−1 g .
Dunque
M φ − M ψ ≤ A−1 Hφ − ψ
e M è una contrazione stretta se H < A−1 −1 . Allora per ogni g esiste una e una sola
soluzione f dell’equazione (A + H)f = g e A + H è bijettivo.
Si può anche, e forse con vantaggio, ricorrere alla serie di Neumann, osservando che, se I è
l’operatore identità in L(Y ),
+∞

(A + H)−1 = [(I + HA−1 )A]−1 = A−1 (I + HA−1 )−1 = A−1 (−HA−1 )k ,
k=0
se HA−1 < 1 , e a maggior ragione se HA−1 < 1. Abbiamo pertanto la maggiorazione

+∞
A−1
(A + H)−1 L(Y,X) ≤ A−1 L(Y,X) (HA−1 )k L(X) ≤ .
1 − HA−1
k=0
Da questa maggiorazione si ottiene facilmente la continuità dell’applicazione i. Infatti
(A + H)−1 − A−1 = (A + H)−1 (A + H − A)A−1 ≤
A−1 2
≤ (A + H)−1 HA−1 ≤ H
1 − HA−1

e per H → 0 il primo membro tende a 0. q.e.d.
Nel caso di un operatore limitato A ∈ L(X) si possono definire altri operatori che sono sue
funzioni, mediante serie convergenti. Se f (z) è una serie convergente: f (z) = +∞ c
n=0 n z n
, con
raggio di convergenza ρ e ||A|| < ρ si può definire:
+∞

f (A) = cn An ∈ L(X) .
n=0
Tale serie converge “assolutamente in L(X) perchè i suoi termini sono maggiorati in norma da
|cn |An , che per ipotesi sono termini di una serie convergente.
Ad esempio, per ogni t ∈ R , poniamo

+∞
(tA)n
etA = .
n=0
n!
La serie è “assolutamente convergente perchè le norme dei suoi termini sono maggiorate dai
numeri |t|n An /n! che sono i termini di una ordinaria serie esponenziale.
La funzione
t → etA ∈ L(X)
ha proprietà analoghe a quelle della funzione esponenziale et :
1) Per t ed s arbitrari
e(t+s)A = etA esA .
Infatti
+∞
ti A i s j A j
etA esA = =
n=0 i+j=n
i! j!
+∞
n
An n
= sj tn−j .
n! j
n=0 j=0
2) È una funzione di t continua nell’origine (e quindi per la proprietà precedente continua

ovunque):
lim etA = e0A = I .
t→0
Infatti se |t| ≤ M
+∞
M j Aj+1
etA − I ≤ |t| .
j=0
(j + 1)!

3) È una funzione derivabile rispetto al parametro t per t = 0 (e quindi ovunque per la prima
proprietà):
def etA − I
Dt etA |t=0 = lim =
t→0 t
+∞ j

tA2 t ||A||j+2
= lim (A + + ...) = A + lim t =A,
t→0 2! t→0
j=0
(j + 2)!
e dunque
etA − et0 A t0 A e(t−t0 )A − I t0 A

Dt etA |t=t0 = lim e = lim e = Aet0 A .
t→0 t − t0 t−t0 →0 t − t0
4) Per ogni x0 ∈ X la funzione

t → x(t) = etA x0
è soluzione (unica) del problema di Cauchy lineare omogeneo


 dx(t) = Ax(t)
dt


x(0) = x0
Viste le proprietà di etA la proposizione precedente si verifica in modo immediato.
Ad esempio se X = C([a, b]), K ∈ C([a, b]2 ) e ϕ ∈ C([a, b]) , introducendo l’operatore, che
verificheremo nei paragrafi successivi essere limitato:
b
Af (y) = K(x, y)f (y)dy , A ∈ L(X) ,
a
l’equazione integro-differenziale
 b

 ∂u(t, x) = K(x, y)u(t, y)dy
∂t a


u(0, x) = ϕ(x)
ha un’unica soluzione rappresentabile mediante la formula
u(t, x) = etA ϕ(x) .

3.3 Operatori integrali in C([a, b])

Sia K(x, y) una funzione (a valori reali o complessi) definita in [a, b]2 tale che
1) Per ogni x ∈ [a, b] sia finito l’integrale

b
|K(x, y)|dy ;
a
2) Per ogni x0 e ε > 0 esista δ tale che

b
|x − x0 | < δ ⇒ |K(x, y) − K(x0 , y)|dy < ε .
a
Allora l’operatore integrale A, definito da

b
(Af )(x) = K(x, y)f (y)dy ,
a
è lineare e continuo da C([a, b]) in sè stesso: A ∈ L(C([a, b])) (e si dice che K è il nucleo
(kernel) di A).
Infatti, per ogni funzione continua f :
b
|Af (x) − Af (x0 )| ≤ |K(x, y) − K(x0 , y)||f (y)|dy ≤
a
b
≤ f ∞ |K(x, y) − K(x0 , y)|dy < εf ∞ ,
a
se |x − x0 | < δ e quindi Af è una funzione continua.

Inoltre A è ovviamente lineare e
b
Af ≤ max |K(x, y)|dy f .
x∈[a,b] a
b
Si osservi che la funzione x → a
|K(x, y)|dy è continua sul compatto [a, b] , perché
b b b
| |K(x, y)|dy − |K(x0 , y)|dy| ≤ ||K(x, y)| − |K(x0 , y||dy ≤
a a a
b
≤ |K(x, y) − K(x0 , y)|dy < ε
a
se |x − x0 | < δ , e quindi il massimo precedente esiste.

Dunque A è limitato e
b
AL(C([a,b])) ≤ max |K(x, y)|dy .
x∈[a,b] a

***
Si può dimostrare che nella relazione precedente vale il segno di uguaglianza: sia x∗ tale che
b b
|K(x∗ , y)|dy = C = max |K(x, y)|dy
a x∈[a,b] a
e consideriamo la funzione integrabile f ∗ (x) = K(x∗ , x) . Indichiamo brevemente con A l’in-

tervallo [a, b]. Siano A+ , A− gli insiemi misurabili sui quali f ∗ è rispettivamente nonnegativa o
negativa. Ovviamente A è unione disgiunta di A+ e A− . Siano χ+ (x), χ− (x) le loro funzioni
caratteristiche e k(x) = χ+ (x) − χ− (x), ovvero k(x) = segn K(x∗ , x) (asumendo segn(0) = 1).
Essendo A+ ∩ A− = ∅, risulta maxx |k(x)| = 1 . Allora per la funzione
b
l(x) = K(x, y)k(y)dy
a
si ha maxx |l(x)| = C , perché

|l(x)| ≤ C e l(x∗ ) = C .
Tuttavia la funzione k(x) non è continua. Ma possiamo approssimarla tanto bene quanto vo-
gliamo mediante funzioni continue di norma uguale a 1 : dato ε > 0 arbitrario, indicando con λ
la misura di Lebesgue in R , sia
F+ε ⊆ A+ ⊆ O+
ε ε
, λ(O+ − F+ε ) < ε ,
F−ε ⊆ A− ⊆ O−
ε ε
, λ(O− − F−ε ) < ε ,
dove F+ε , F−ε sono chiusi e O+
ε ε
, O− aperti. I due insiemi A+ , A− sono disgiunti e a maggior ragione
sono disgiunti F+ε , F−ε . Poiché A è uno spazio topologico compatto e quindi normale, esistono
due aperti disgiunti V+ε , V−ε che contengono rispettivamente F+ , F− . Allora, introducendo gli
aperti W±ε = O± ε
∩ V±ε si ha
W+ε ∩ W−ε = ∅ e F±ε ⊆ W±ε .
Poniamo allora
d(x, X − W±ε )
φε± (x) = , φε (x) = φε+ (x) − φε− (x) .
d(x, F±ε ) + d(x, X − W±ε )
La funzione φε è continua, coincide con k su F = F+ε ∪ F−ε , φε ∞ = 1 e quindi Aφε ≤ C . Il

complementare di F è contenuto in (O+ ε
− F+ε ) ∪ (O−
ε
− F−ε ) e quindi λ(F c ) < 2ε. Ma
b b b
C −| K(x∗ , y)φε (y)dy| ≤ K(x∗ , y)k(y)dy − K(x∗ , y)φε (y)dy ≤
a a a
b
≤ |K(x∗ , y)||k(y) − φε (y)|dy == |K(x∗ , y)||k(y) − φε (y)|dy ≤
a Fc

2 |K(x∗ , y)|dy ≤ η ,
Fc

se ε è sufficientemente piccolo, in virtù dell’assoluta continuità dell’integrale. Pertanto, per ogni

η>0
b b
C ≥ Aφε = max | K(x, y)φε (y)dy| ≥ | K(x∗ , y)φε (y)dy| ≥ C − η ,
x a a
e quindi A = C .
& & &
Se la funzione K(x, y) è continua si ottiene immediatamente la stima meno precisa
A ≤ M (b − a) dove M = max |K(x, y)| .

(x,y)∈[a,b]2
3.4 Equazioni integrali in C([a, b])

Un’equazione integrale lineare è un’equazione della forma
b
λa(x)u(x) − k(x, y)u(y)dy = g(x) , x ∈ [a, b] ,
a
dove λ è un parametro complesso, k è il nucleo dell’equazione (o dell’operatore integrale asso-

ciato), u è la funzione incognita e g è il termine noto.
Se λ = 0 l’equazione integrale è detta di prima specie. Se λa(x) = 0 per ogni x ∈ [a, b] l’equa-
zione è detta di seconda specie. In questo caso si può dividere per a(x) e presentare l’equazione
nella forma b
u(x) − µ K(x, y)u(y)dy = f (x) , x ∈ [a, b] ,
a
K(x, y) = k(x, y)/a(x) , µ = 1/λ .
Se infine λ = 0 e a(x) si annulla, ma non identicamente in [a, b] , l’equazione si dice di terza specie.
Ci occuperemo in primo luogo di equazioni integrali di seconda specie, supponendo che il

termine noto sia una funzione continua e l’operatore integrale K̂ di nucleo K(x, y) sia limitato
in C([a, b]) . Se il parametro µ è sufficientemente piccolo si può ricorrere al teorema sul punto
fisso delle contrazioni.
Teorema. Sia f ∈ C([a, b]) e |µ|K̂ < 1 , allora esiste un’unica funzione continua u(x) tale
che b
u(x) = µ K(x, y)u(y)dy + f (x) .
a
Dimostrazione. L’applicazione
A : g → Ag = µK̂g + f
opera dallo spazio di Banach (quindi metrico e completo) C([a, b]) in sè stesso e nell’ipotesi fatte
è una contrazione:
Ag − Ag ∗ C([a,b]) ≤ |µ|K̂L(C([a,b])) g − g ∗ C([a,b]) , |µ|K̂ < 1 .

Dunque esiste un’unico punto fisso u di A , ovviamente soluzione dell’equazione integrale: u =

Au = µK̂u + f . Il punto fisso si può ottenere con il metodo delle approssimazioni successive
(talvolta detto metodo di Picard):

u0 arbitraria in C([a, b])
b
un+1 (x) = µ a K(x, y)un (y)dy + f (x)
La successione un (x) converge uniformemente in [a, b] all’unica soluzione u(x) dell’equazione.

q.e.d.
Si osservi che con la stessa tecnica si possono trattare equazioni integrali non lineari del
tipo
b
u(x) = µ F (x, y, u(y))dy ,
a
2
ad esempio nelle ipotesi F ∈ C([a, b] × R) tale che
|F (x, y, z) − F (x, y, z ∗ )| ≤ M |z − z ∗ | , |µ|M (b − a) < 1 ,
cioè F soddisfa una condizione di Lipschitz rispetto alla terza variabile, uniformemente per
(x, y) ∈ [a, b]2 , e µ è sufficientemente piccolo.
Infatti in tali ipotesi l’applicazione
b
(Au)(x) = µ F (x, y, u(y))dy
a
è una contrazione:
Au − Av = max |Au(x) − Av(x)| ≤
x
b
≤ |µ| M |u(y) − v(y)|dy ≤ |µ|M |(b − a)u − v .
a
Osservazione. Per semplicità e concretezza abbiamo considerato operatori ed equazioni in-

tegrali su un intervallo [a, b] dell’asse reale, ma tutti i risultati precedenti si estendono senza
difficoltà almeno al caso di domini di integrazione D compatti e in presenza di misure com-
patibili con la struttura topologica. Ad esempio D potrebbe essere la chiusura di un aperto
limitato Ω ⊂ Rn e dx la misura di Lebesgue in Rn (in tal caso u ed f sarebbero funzioni di n
variabili reali, K funzione di una coppia di variabili reali, |x − y| dovrebbe essere interpretato
come norma, eventualmente Euclidea, di x − y ...).
Le equazioni integrali lineari considerate precedentemente, con dominio di integrazione fisso,

sono spesso associate al nome di Fredholm, che fu uno dei principali artefici della teoria all’inizio
del 1900. Si usa invece far riferimento al nome di Volterra considerando equazioni integrali del
tipo x
u(x) = µ K(x, y)u(y)dy + f (x) ,
a

dove l’ntervallo di integrazione è variabile con x . In effetti le equazioni di questo tipo si possono
considerare come un caso particolare di quelle viste precedentemente. Basta porre

K(x, y) se y ≤ x
L(x, y) =
0 se y > x
per poter riscrivere l’equazione nella forma
b
u(x) = µ L(x, y)u(y)dy + f (x)
a
ed essere in grado di applicare tutti i risultati ottenuti precedentemente.

Tuttavia le equazioni del tipo di Volterra si possono risolvere con il metodo delle approssima-
zioni successive, senza alcuna restrizione sul parametro µ. Per semplicità ci limitiamo a nuclei
continui.
Teorema. Sia K(x, y) continua (per y ≤ x ), M = maxy≤x |K(x, y)| e f (x) continua in [a, b],
allora per ogni valore di µ = 0 esiste un’unica funzione continua u(x) soluzione dell’equazione
x
u(x) = µ K(x, y)u(y)dy + f (x) ,
a
che si può ottenere con il metodo delle approssimazioni successive.

Dimostrazione. Consideriamo l’applicazione
x
(Au)(x) = µ K(x, y)u(y)dy + f (x)
a
e studiamo il problema di punto fisso u = Au. Dimostriamo che una iterata di A di ordine
sufficientemente elevato è una contrazione:
x
|Au(x) − Av(x)| ≤ |µ| M |u(y) − v(y)|dy ≤ |µ|M (x − a)u − v ,
a
dunque Au − Av ≤ |µ|M (b − a)u − v. Poi

x x
|A2 u(x) − A2 v(x)| ≤ |µ| M |Au(y) − Av(y)|dy ≤ |µ|M |µ|M u − v(y − a)dy
a a
(x − a)2
≤ (|µ|M )2 u − v ,
2
dunque A2 u − A2 v ≤ (|µ|M (b − a))2 /2u − v . Iterando si trova facilmente
Ap u − Ap v ≤ (|µ|M (b − a))p /p! u − v .
Poiché (|µ|M (b − a))p /p! → 0 per p → +∞, per p sufficientemente grande Ap è una contrazione.
Dunque, per il teorema sui punti fissi delle applicazioni con un’iterata che sia una contrazione,
l’equazione integrale ammette una soluzione unica limite delle approssimazioni

u0 arbitraria in C([a, b])
x
un+1 (x) = µ a K(x, y)un (y)dy + f (x) .
q.e.d.

3.5 Approssimazione di equazioni integrali mediante nuclei separabili di rango

finito.
Definizione. Un nucleo separabile di rango finito è un nucleo della forma

N
KN (x, y) = αi (x)βi (y) .
i=1
Per continuare lo studio delle equazioni integrali nel contesto dello spazio C([a, b]) supporremo
che le funzioni αi (x) siano continue e che le funzioni βi (x) siano integrabili (o addirittura con-
tinue).
Se u è soluzione dell’equazione
b
u(x) = µ KN (x, y)u(y)dy + f (x) , x ∈ [a, b] ,
a
allora u − f è una combinazione lineare finita delle funzioni αi (x):

N b
u(x) − f (x) = µ αi (x) βi (y)u(y)dy ,
i=1 a
ovvero

N b
u(x) − f (x) = µ ci αi (x) , ci = βi (y)u(y)dy .
i=1 a
La conoscenza del vettore c = (c1 , c2 , ..., cN ) permetterebbe dunque di determinare la soluzione

dell’equazione integrale.
Proposizione. c è soluzione del sistema lineare
(I − µW )c = d ,
dove la matrice W e il vettore d sono definiti da

b b
W = wki = αi (x)βk (x)dx , d = dk = βk (x)f (x)dx .
a a
N
Dimostrazione. Se u(x) − f (x) = i=1 ci αi (x) , moltiplicando per βk (x) e integrando tra a e b,
si trova

N
ck − dk = µ wki ci .
i=1
q.e.d.
Per risolvere un’equazione integrale, con nucleo K , si ricorre spesso ad approssimazioni

dell’operatore integrale K̂ con operatori K̂n , di nucleo Kn , più “semplici, nel senso che ad
essi corrispondono equazioni integrali approssimate più facilmente risolubili. Per esempio si può

approssimare il nucleo K con nuclei separabili KN che riducono il problema alla soluzione di un
ordinario sistema di equazioni algebriche lineari.
Osservazione. Ovviamente:
b
K̂u − K̂n u ≤ sup |K(x, y) − Kn (x, y)||u(y)|dy ≤
x a
b
≤ u sup |K(x, y) − Kn (x, y)|dy = K̂ − K̂n u .
x a
Allora la convergenza in norma (o uniforme sui limitati) degli operatori: K̂ − K̂n → 0 , implica
la loro convergenza puntuale, o come si dice forte : ∀u K̂n u → K̂u.
Teorema. Sia I − µK̂ invertibile, cioè I − µK̂ ∈ GL(C([a, b])) e sia

b
lim max |K(x, y) − Kn (x, y)|dy = 0 .
n x a
(Se Kn è continua e converge uniformemente a K su [a, b]2 la condizione precedente è evidente-

mente verificata.) Allora, per n sufficientemente grande, l’equazione integrale
b
un (x) = µ Kn (x, y)un (y)dy + f (x)
a
è univocamente risolubile e la sua soluzione un converge uniformemente alla soluzione dell’equa-

zione b
u(x) = µ K(x, y)u(y)dy + f (x) .
a
Dimostrazione. Nelle ipotesi del teorema
I − µK̂n → I − µK̂ in L(C([a, b])) ,
per le proprietà del gruppo GL(C([a, b])) risulta I − µK̂n ∈ GL(C([a, b])) per n sufficientemente
grande e
(I − µK̂n )−1 → (I − µK̂)−1 in L(C([a, b])) .
Dunque, in virtù dell’osservazione precedente
un = (I − µK̂n )−1 f → u = (I − µK̂)−1 f in C([a, b]) q.e.d.
Maggiorazione degli errori. Ricordando le stime ottenute per dimostrare la continuità

dell’applicazione i : A → A−1 , si trovano immediatamente le seguenti maggiorazioni:
(I − µK̂)−1 2
(I − µK̂n )−1 − (I − µK̂)−1 ≤ |µ|K̂n − K̂ ,
1 − |µ|(I − µK̂)−1 K̂n − K̂
(I − µK̂n )−1 2
(I − µK̂n )−1 − (I − µK̂)−1 ≤ |µ|K̂n − K̂ ,
1 − |µ|(I − µK̂n )−1 K̂n − K̂

dalle quali è facile ottenere stime in norma dell’errore un − u . Per esempio:
(I − µK̂n )−1 2
un − u ≤ |µ|K̂n − K̂f .
1 − |µ|(I − µK̂n )−1 K̂n − K̂
Si osservi che può essere più facile disporre di buone maggiorazioni di (I − µK̂n )−1 , piuttosto
che maggiorazioni di (I − µK̂)−1 .
Valgono anche altre stime, in genere più fini e più utili:
un − u = (I − µK̂n )−1 f − (I − µK̂)−1 f = (I − µK̂n )−1 µ(K̂n − K̂)(I − µK̂)−1 f ≤
(I − µK̂)−1
≤ |µ|K̂n u − K̂u ,
1 − |µ|(I − µK̂)−1 K̂n − K̂
un − u = (I − µK̂)−1 f − (I − µK̂n )−1 f = (I − µK̂)−1 µ(K̂ − K̂n )(I − µK̂n )−1 f ≤
(I − µK̂n )−1
≤ |µ|K̂n un − K̂un .
1 − |µ|(I − µK̂n )−1 K̂n − K̂
Ad esempio informazioni sull’ordine di convergenza di Kn u a Ku , che può dipendere dalla
conoscenza a priori di qualche proprietà di “regolarità della soluzione u , permettono di stimare
l’ordine di convergenza delle soluzioni approssimate un alla soluzione esatta u.


Capitolo 4
Spazi di Hilbert
4.1 Forme sesquilineari

Definizione. Sia H uno spazio vettoriale su C. Una funzione B : H × H → C è una forma
sesquilineare su H se e solo se per ogni λ ∈ C e per qualsiansi x, x , y, y ∈ C
1) B(λx + x , y) = λB(x, y) + B(x , y) ,
2) B(x, λy + y ) = λB(x, y) + B(x, y ) .

Dunque B è lineare nella prima variabile ed antilineare nella seconda.
Segue immediatamente dalla definizione che

m
n
m
n
B( λ i xi , µj yj ) = λi µj B(xi , yj ) .
i=1 j=1 i=1 j=1
Osservazione. Se H è uno spazio vettoriale su R si considerano forme (a valori reali) bilineari

su H.
Definizione. Una forma sesquilineare B si dice Hermitiana se e solo se per x e y arbitrari
B(y, x) = B(x, y) .
Osservazione. Le forme reali bilineari Hermitiane sono forme simmetriche.
Proposizione. Se B(x, y) è una forma sesquilineare Hermitiana allora la forma quadratica

B(x, x) assume solo valori reali e
4B(x, y) = B(x + y, x + y) − B(x − y, x − y) + iB(x + iy, x + iy) − iB(x − iy, x − iy) ,
63
64 Capitolo 4. Spazi di Hilbert
dunque la conoscenza della forma quadratica determina quella della forma sesquilineare.
La dimostrazione della proposizione è immediata (basta sviluppare le espressioni quadratiche a
secondo membro).
Definizione. Una forma sesquilineare Hermitiana B(x, y) si dice positiva (rispettivamente

definita positiva) se e solo se
∀x ∈ H B(x, x) ≥ 0 (rispettivamente B(x, x) > 0 se x = 0) .
Disuguaglianza di Cauchy-Schwarz. Sia B sesquilineare Hermitiana e positiva (non

necessariamente definita positiva). Allora
|B(x, y)|2 ≤ B(x, x) · B(y, y) .
Dimostrazione.
1) Se B(x, x) = B(y, y) = 0, allora, essendo B(x + ty, x + ty) ≥ 0 per ogni t, si ha tB(x, y) +
tB(x, y) ≥ 0 . Posto t = −B(x, y) , si trova −2|B(x, y)|2 ≥ 0 , cioè B(x, y) = 0 e la disugua-
glianza è soddisfatta.
2) Altrimenti, se uno almeno dei valori B(x, x) e B(y, y) non è nullo e sia ad esempio B(y, y) = 0,
allora per ogni t
0 ≤ B(y, y)B(x + ty, x + ty) = B(x, x)B(y, y) − |B(x, y)|2 +
+(tB(y, y) + B(x, y))(tB(y, y) + B(x, y)) .

Prendendo t = −B(x, y)/B(y, y) si vede che la disuguaglianza è soddisfatta. q.e.d.
Proposizione. Sia B una forma sesquilineare Hermitiana definita positive in H.

Allora B(x, x)1/2 è una norma in H.
La proposizione si verifica immediatamente:
1) B(x, x)1/2 ≥ 0 , e B(x, x)1/2 = 0 ⇒ x = 0 ,

2) B(λx, λx)1/2 = (λλB(x, x))1/2 = |λ|B(x, x)1/2 ,
3) B(x + y, x + y)1/2 = (B(x, x) + B(y, y) + 2B(x, y))1/2 ≤ ,
per la disuguaglianza di Schwarz,
≤ (B(x, x) + B(y, y) + 2B(x, x)1/2 B(y, y)1/2 )1/2 = B(x, x)1/2 + B(y, y)1/2 .
Definizione. Uno spazio vettoriale H su C (su R), munito di una forma B sesquilinea-
re (bilineare) Hermitiana (simmetrica) definita positiva si dice spazio pre-Hilbertiano. H è
normato in modo canonico dalla norma x = B(x, x)1/2 . Se rispetto a tale norma H risulta
completo allora si dice che H è uno spazio di Hilbert .
La forma prescelta per strutturare H quale spazio pre-Hilbertiano si dice prodotto scalare e

viene usualmente indicata con la notazione (x, y) .
Ovviamente gli spazi di Hilbert sono particolari spazi di Banach.
Esempi di spazi pre-Hilbertiani.

n
1) Cn munito del prodotto scalare (x, y) = k=1 xk y k è uno spazio di Hilbert su C.
n
2) Rn munito del prodotto scalare (x, y) = k=1 xk yk è uno spazio di Hilbert su R.
3) Sia Ω un aperto limitato di Rn e K la sua chiusura. Allora lo spazio C(K; C) delle funzioni
continue su K a valori complessi, munito del prodotto scalare

(f, g) = f (x)g(x)dx ,
K
dove dx = dx1 dx2 ...dxn è la misura di Lebesgue in Rn , è uno spazio pre-Hilbertiano.

Si osservi che la continuità della funzione solo su Ω non implica la sua l’integrabilità.
Identità della mediana. Se x, y sono due elementi arbitrari di uno spazio pre-Hilbertiano,
allora
x+y 2 x−y 2 x2 + y2
+ = .
2 2 2
Si verifica immediatamente osservando che
x + y2 + x − y2 = 2x2 + 2y2 + 2(x, y) − 2(x, y) .
Osservazione. Si può dimostrare che uno spazio normato è pre-Hilbertiano (su R o su C)

se e solo se la sua norma soddisfa l’identità della mediana.
In tal caso il prodotto scalare si può definire, data la norma, mediante l’uguaglianza
4(x, y) = x + y2 − x − y2 + ix + iy2 − ix − iy2 .
L’identità della mediana permette di dimostrare che il secondo membro è lineare in x ed antili-
neare in y.
Limitandoci al caso reale abbiamo il
Teorema. Sia H uno spazio normato su R nel quale vale l’identità della mediana:
x+y 2 x−y 2 x2 + y2
+ = .
2 2 2
Ponendo
4(x, y) = x + y2 − x − y2 ,
(x, y) è un prodotto scalare in H che induce la norma iniziale.

Dimostrazione. Ovviamente
(x, y) = (y, x) e x2 = (x, x) .
Per quanto concerne la linearità, osserviamo che

1
(x, z) + (y, z) = (x + z2 − x − z2 + y + z2 − y − z2 ) .
4
Ma, per l’identità della mediana, si ha
1
x + z2 + y + z2 = ((x + z) + (y + z)2 + (x + z) − (y + z)2 ) =
2
x+y 1
= 2 + z2 + x − y2 .
2 2
In modo analogo
1
−x − z2 − y − z2 = − ((x − z) + (y − z)2 + (x − z) − (y − z)2 ) =
2
x+y 1
−2 − z2 − x − y2 .
2 2
Dunque
1 x+y x+y x+y
(x, z) + (y, z) = ( + z2 − − z2 ) = 2( , z) ,
2 2 2 2
per la definizione di prodotto scalare.
Essendo, sempre per la definizione di (·, ·), (0, z) = 0, per y = 0 si trova (x, z) = 2(x/2, z)
(e iduttivamente (x, z)/2p = (x/2p , z)). Dunque (x, z) + (y, z) = (x + y, z). Per y = x si ha
(2x, z) = 2(x, z) e induttivamente si ha (kx, z) = k(x, z). Dalla definizione del prodotto scalare
si vede immediatamente che (−x, y) = −(x, y). Allora per ogni k ∈ Z e p ∈ N
k k
( x, y) = p (x, y) .
2p 2
Ogni numero reale λ è limite di razionali del tipo k/2p e in ogni spazio normato λx ± y è
continua in λ. Dunque per ogni λ si ha (λx, y) = λ(x, y). q.e.d.
4.2 Il teorema delle proiezioni

Il teorema delle proiezioni ha un ruolo fondamentale sia per la teoria di base degli spazi di
Hilbert, che per le numerose applicazioni ad importanti settori dell’analisi matematica.
Teorema (delle proiezioni su un convesso). Sia H uno spazio di Hilbert e A un suo

sottoinsieme non vuoto, convesso e chiuso. Allora per ogni x ∈ H esiste un unico punto y
del convesso a distanza minima da x :
∀x ∈ H ∃!y ∈ A x − y = min x − z .
z∈A

Si dice che y è la proiezione ortogonale di x su A e si scrive y = PA (x) . Inoltre y è caratterizzato

dalle seguenti disuguaglianze variazionali (cosı̀ dette perché associate ad un problema di
minimo)
∀z ∈ A (x − y, z − y) ≤ 0 ,
cioè y = PA (x) se e solo se sono soddisfatte tali disuguaglianze.
Infine la funzione PA è una contrazione (non stretta):
PA (x) − PA (x∗ ) ≤ x − x∗ .
Premettiamo alla dimostrazione un lemma.
Lemma. Sia E un convesso contenuto nella regione compresa tra due sfere concentriche
(per esempio di centro il vettore 0) di raggi ρ e ρ + δ :
∗
E ⊂ Bρ+δ (0) − Bρ (0) .
(Con B ∗ indichiamo la chiusura della sfera aperta B e, solo per maggiore generalità, prendiamo
la sfera di raggio maggiore chiusa e quella di raggio minore aperta.)
Allora se δ ≤ ρ risulta
diam(E) = sup x − y ≤ 12ρδ .
x,y∈E
Dimostrazione del lemma. Se x, y ∈ E, per la convessità di E (x + y)/2 ∈ E e per l’identità

della mediana
x−y 2 x2 + y2 x+y 2
= − ≤ (ρ + δ)2 − ρ2 ≤ 3ρδ .
2 2 2
q.e.d.
Dimostrazione del teorema delle proiezioni. Essendo il problema invariante per traslazioni,
possiamo per semplicità supporre x = 0 .
1) Sia ρ = inf z∈A z . Se ρ = 0 allora 0 ∈ A = A e quindi 0 = PA (0) . Altrimenti ρ > 0 e

∗
sia, per ogni n intero, An = A ∩ Bρ+1/n (0) . An è convesso e chiuso, in quanto intersezione di
due convessi chiusi, ed essendo
∗

An ⊂ Bρ+1/n (0) − Bρ (0) si ha che diam(An ) ≤ 12ρ/n .
Inoltre per ogni n si ha An = ∅ e An+1 ⊆ An . Sia allora zn un elemento qualunque di An : la

successione zn è di Cauchy, in quanto

zn+p − zn ≤ diam(An ) ≤ 12ρ/n → 0
per n → +∞ indipendentemente da p . H è completo e dunque zn converge in norma ad un

limite y ∈ A per la chiusura di A . Ma per altro zn → ρ e per la continuità della norma
y = ρ = min z .
z∈A

Ciò dimostra l’esistenza di almeno un punto di minimo.

2) Se y ∈ A e y ∗ ∈ A fossero due punti di minimo distinti, per l’identità della mediana si avrebbe
y + y∗ 2 y2 + y ∗ 2 y − y∗ 2
= − < ρ2 ,
2 2 2
che sarebbe assurdo, perchè (y+y ∗ )/2 ∈ A . Dunque abbiamo esistenza e unicità della proiezione.
3) Essendo A convesso, per ogni λ ∈]0, 1[ e per ogni z ∈ A risulta y + λ(z − y) ∈ A. Pertanto,
poiché y è il punto di minimo :
y + λ(z − y)2 ≥ y2 ,
da cui, sviluppando il quadrato, segue
2λ(y, z − y) + λ2 z − y2 ≥ 0 ,
ovvero
(y, z − y) ≥ −λ/2z − y2 .
Facendo tendere λ a 0 si ottiene (0 − y, z − y) ≤ 0.
Viceversa, se per ogni z ∈ A si ha (y , z − y ) ≥ 0 , allora
z2 = y + z − y 2 = y 2 + z − y 2 + 2(y , z − y ) ≥ y 2 .
Pertanto se y ∈ A allora y = minz∈A z e y = y è il punto di minimo.

4) Per arbitrari x e x in A, indicando brevemente PA con P :
(P (x) − P (x ), P (x) − P (x )) = (P (x) − P (x ), P (x) − x)+
+(P (x) − P (x ), x − x ) + (P (x) − P (x ), x − P (x )) .

Prendendo la parte reale di entrambi i membri e tenendo conto della caratterizzazione delle
proiezioni P (x) e P (x ) mediante le disuguaglianze variazionali si trova
P (x) − P (x )2 ≤ (P (x) − P (x ), x − x ) ≤ P (x) − P (x )x − x ,
da cui risulta che P è una contrazione. q.e.d.
Consideriamo ora più in dettaglio il caso in cui A è un sottospazio vettoriale (quindi un

convesso) di H . In primo luogo vale la seguente fondamentale
Osservazione. Se A è un sottospazio vettoriale chiuso di H, le disuguaglianze variazionali

si riducono a delle uguaglianze:
∀y ∈ A (x − P (x), y) = 0 .
Infatti
(x − P (x), y) = (x − P (x), (y + P (x)) − P (x)) ≤ 0 ,
perché y + P (x) ∈ A e
(x − P (x), y) = −(x − P (x), (−y + P (x)) − P (x)) ≥ 0 ,

perché −y + P (x) ∈ A , dunque

(x − P (x), y) = 0 .
Inoltre
(x − P (x), y) = (x − P (x), iy) = 0 ,
perché iy ∈ A .
Indichiamo con la notazione M ⊥ l’insieme di tutti gli elementi di uno spazio di Hilbert H
ortogonali a tutti gli elementi di un sottoinsieme M :
M ⊥ = {x ∈ H | ∀y ∈ M (x, y) = 0} .
È evidente che (M ⊥ )⊥ ⊇ M .
Per la linearità del prodotto scalare rispetto alla prima variabile, M ⊥ è un sottospazio
vettoriale:
x, x ∈ M ⊥ ∧ λ ∈ C ⇒ ∀y ∈ M (λx + x , y) = 0 ⇒ λx + x ∈ M ⊥ .
Per la continuità del prodotto scalare M ⊥ è un sottospazio chiuso:
xn ∈ M ⊥ ∧ x = lim xn ⇒ ∀y ∈ M (x, y) = lim(xn , y) = 0 .

n n
Proposizione. Sia M un sottospazio vettoriale chiuso di H. Allora
H = M ⊕ M⊥ ,
cioè ogni x ∈ H si decompone in modo unico come somma di un elemento di M ed uno di M ⊥ .

Precisamente x è la somma delle sue proiezioni ortogonali su M e M ⊥ :
x = PM x + PM ⊥ x .
Dimostrazione. In virtù delle uguaglianze variazionali
∀x ∈ H ∀y ∈ M (x − PM x, y) = 0 ,
dunque m = x − PM x ∈ M ⊥ e x = PM x + m . Essendo x − m = PM x ∈ M , per la definizione

di M ⊥
∀z ∈ M ⊥ (x − m , z) = 0 .
Dunque m = PM ⊥ x e x = PM x + PM ⊥ x .
Viceversa si controlla immediatamente che se x = m + m con m ∈ M e m ∈ M ⊥ si ha
∀y ∈ M (x − m, y) = 0 e ∀z ∈ M ⊥ (x − m , z) = 0 .
Pertanto m = PM x e m = PM ⊥ x . q.e.d.

Osservazione. Se M è un sottospazio chiuso, M ⊥ si dice supplemento ortogonale di M

e M = (M ⊥ )⊥ .
Infatti ogni x ∈ (M ⊥ )⊥ si scrive in modo unico come x = PM x + PM ⊥ x e
0 = (x, PM ⊥ x) = (PM ⊥ x, PM ⊥ x) .
Allora PM ⊥ x = 0 , x = PM x ∈ M e M ⊇ (M ⊥ )⊥ . L’inclusione inversa è sempre vera ed il

risultato è dimostrato.
Proposizione. PM è un operatore lineare e continuo da H in H di norma uguale ad 1 :
PM ∈ L(H) e PM x ≤ x ,
l’uguaglianza essendo valida per x ∈ M .

Inoltre:
2
PM = PM , PM PM ⊥ = PM ⊥ PM = 0 e PM + PM ⊥ = 1 .
Dimostrazione. Se x = m + m e y = n + n , con m, n ∈ M e m , n ∈ MM ⊥ , allora
x + y = (m + n) + (m + n ) e λx = λm + λm , dunque
PM (x + y) = m + n = PM x + PM y e PM (λx) = λPM x .
Inoltre
x2 = (m + m , m + m ) = m2 + m 2 = PM x2 + PM ⊥ x2 .
Infine le ultime equazioni della proposizione sono una semplice traduzione in termini di operatori
di risultati già dimostrati o impliciti nelle definizioni.
Più in generale si può pensare ad una decomposizione di uno spazio di Hilbert H in somma
(finita o infinita) diretta di sottospazi chiusi:
H = H1 ⊕ H2 ⊕ H3 ⊕ ...
Nel caso di sottospazi di dimensione uno il problema di tale decomposizione è equivalente a

quello della rappresentazione di ogni vettore di f ∈ H come somma (finita o infinita) di multipli
di elementi di una base ortonormale {xα }α∈A :

f= fα xα .
α∈A
Se l’insieme degli indici A è numerabile, la somma precedente si dice serie di Fourier gene-
ralizzata .
4.3 Basi ortonormali e serie di Fourier generalizzate

Definizione. Un insieme S ⊂ H si dice ortogonale se
∀x, y ∈ S x = y ⇒ (x, y) = 0 .

Se inoltre per ogni x ∈ S si ha x = 1 , allora S si dice ortonormale .

Si dice che S è completo se ogni vettore f di H ortogonale a tutti gli elementi di S è nullo:
∀f ∈ H ∀x ∈ S (f, x) = 0 ⇒ f = 0 .
Un insieme, o, come si usa dire, un sistema ortonormale completo è una base ortonormale .
Sarà utile ricorrere ai termini sotto definiti.
Definizione. {xα }α∈A è un famiglia di vettori topologicamente libera se per ogni α ∈ A

xα non appartiene alla chiusura del sottospazio generato dalle {xβ }β=α (combinazioni lineari
finite delle xβ ).
{xα }α∈A si dice totale in H se H coincide con la chiusura del sottospazio generato da {xα }α∈A .
Per semplicità, nel seguito supporremo che A sia numerabile e quindi non è restrittivo sup-
porre che A = N∗ , insieme degli interi positivi (in qualche caso potrà essere utile assumere
A = Z) . Se A fosse finito le dimostrazioni si semplificherebbero ulteriormente, non essendovi
problemi di convergenza.
Teorema (sulle serie di Fourier generalizzate). Sia S = {xn } un sistema ortonormale

in uno spazio di Hilbert H (su C o su R). Per ogni f ∈ H i numeri fn = (f, xn ) si dicono
coefficienti di Fourier di f . Valgono le seguenti affermazioni
1) S è topologicamente libero;
2) Fissati arbitrariamente gli indici n1 , n2 , ..., np ed i numeri c1 , c2 , ..., cp , è soddisfatta la seguente
proprietà di minimo dei coefficienti di Fourier fn di f :

p
p
f − fnk xnk ≤ f − ck xnk ,
k=1 k=1
con uguaglianza se e solo se per ogni k si ha ck = fnk , e vale la disuguaglianza di Bessel

+∞

|fn |2 ≤ f 2 .
n=1
3) Se S è completo, allora vale lo sviluppo in serie

+∞

f= fn xn
n=1
e vale la relazione di Parseval

+∞

|fn |2 = f 2 .
n=1
4) S è completo se e solo se è totale.
5) Lo spazio di Hilbert
+∞

l2 = l2 (N∗ ) = {ξ = {ξn }n∈N∗ | ξn ∈ C e |ξn |2 < +∞} ,
k=1

è isomorfo ad H. Quinti tutti gli spazi di Hilbert che ammettono una base numerabile sono
isomofi tra loro e
+∞

(f, g) = fn g n .
n=1
Osservazione. Si può dimostrare facilmente, considerando l’insieme di tutti i sistemi orto-

normali di H e ricorrendo al lemma di Zorn, che ogni spazio di Hilbert non vuoto ammette basi
ortonormali.
Dimostrazione
del teorema.
1) Sia y = p=n cp xp (somma finita). Allora,come si vede subito sviluppando il quadrato,

y2 = |cp |2 .
p
Ne segue che
xn − y2 = 1 + |cp |2 ≥ 1 ,
p
cioè xn ha distanza almeno 1 da tutti gli elementi del sottospazio generato dalle altre xp e non
è quindi ad esso aderente. Pertanto S è una famiglia topologicamente libera.
2) Sia M il sottospazio (di dimensione p ) generato dalle xn1 , xn2 , ..., xnp e P l’operatore di
proiezione ortogonale su M . Si ha, in virtù delle uguaglianze variazionali

p
g= fnk xnk = P f ;
k=1
infatti
∀nk (f − g, xnk ) = 0 , k = 1, 2, ...p ,
essendo le xnk ortonormali. Ma ogni elemento di M è combinazione lineare delle xnk e per la
sesquilinearità del prodotto scalare
∀z ∈ M (f − g, z) = 0 .
Allora g = P f è l’unico elemento di M a distanza minima da f e la proprietà di minimo dei
coefficienti di Fourier è dimostrata.
Inoltre, poiché P ha norma = 1 , si ha P f ≤ f . In particolare, se xnk = xk , si vede che
per ogni p
p
|fk |2 ≤ f 2 ,
k=1
da cui segue la convergenza della serie dei moduli a quadrato dei coefficienti di Fourier e la
disuguaglianza di Bessel.
3) La successione delle ridotte nk=1 fk xk è di Cauchy in H , infatti, essendo le xk ortonormali:

n+p
n+p
fk xk 2 = |fk |2 → 0
k=n+1 k=n+1

per n → +∞ , indipendentemente da p. Dunque per la completezza di H esiste f somma della

serie. Ma per la continuità del prodotto scalare e le proprietà dei limiti f ha gli stessi coefficienti
di Fourier di f :

n+p

(f − f , xn ) = lim(f − fk xk , xn ) = fn − fn = 0 .
p
k=1
Per la completezza di S, si ha f = f . Ciò dimostra anche che S è totale. Infine

+∞

p
p
f 2 − |fn |2 = f 2 − lim |fn |2 = lim f − fn xn 2 = 0 .
p p
n=1 n=1 n=1
O, equivalentemente, per la continuità della norma:

p
p
p
f 2 = lim fn xn 2 = lim fn xn 2 = lim |fn |2
p p p
n=1 n=1 n=1
e la relazione di Parseval è dimostrata.

4) Se S è totale, sia p
∀z ∈ S (y, z) = 0 e y = lim c k xx ,
p
k
dove le somme sono finite. Allora

y2 = lim(y, cpk xk ) = 0
p
k
e quindi S è completo.
5) Si verifica immediatamente che l’applicazione f → {fn }n∈N∗ è biunivoca, lineare, bicontinua
e che conserva le norme (quindi i prodotti scalari). q.e.d.
4.4 Il duale di uno spazio di Hilbert e il teorema di Riesz. La convergenza

debole
Ricordiamo che il duale di uno spazio di Banach B (ad esempio su C) è lo spazio vettoriale
B delle applicazioni lineari e continue da B in C : L(B, C) , munito in modo canonico dela
norma
|f (x)|
||f ||B = sup ,
0=x∈B ||x||B
rispetto alla quale risulta completo, cioè anch’esso uno spazio di Banach.
Nel caso degli spazi di Hilbert vale il seguente fondamentale teorema di rappresentazione degli
elementi del duale.
Teorema di Riesz. Per ogni f ∈ H esiste un unico elemento yf ∈ H tale che
∀x ∈ H f (x) = (x, yf ) .

L’applicazione R : f → yf da H in H è biunivoca, antilineare, bicontinua, conserva le norme e

quindi trasforma i prodotti scalari nei loro complessi coniugati:
f H = yf H e (f, g)H = (yf , yg ) .
Dimostrazione. Se f = 0, allora yf = 0. Altrimenti sia M = Ker f = f −1 ({0}). Per la

continuità di f , M è un sottospazio chiuso proprio e M ⊥ = 0 . Sia 0 = z ∈ M ⊥ , per la linearità
di f si ha
f (x) f (x)
f (x − z) = 0 , x − z∈M .
f (z) f (z)
Ricordando che H = M ⊕ M ⊥ e osservando che
f (x) f (x)
x = (x − z) + z,
f (z) f (z)
si deduce che M ⊥ ha dimensione 1 (tutti i suoi elementi sono multipli di z ) . Inoltre
z f (x)
(x, )= z .
z f (z)
Posto dunque
f (z)
yf = z risulta (x, yf ) = f (x) .
z2
È evidente che l’applicazione R : f → yf è antilineare. Verifichiamo che è una isometria:
|f (x)| |(x, yf )|
f H = sup = sup ≤ yf H ,
0=x∈H xH x=0 xH
yf 2 = (yf , yf ) = f (yf ) ≤ f H yf H
e dunque f H = yf H . Ne segue in particolare che R è iniettiva. La suriettività è immediata,
perché per ogni z ∈ H la funzione f (x) = (x, z) è lineare e continua, cioè in H e necessariamente
yf = z .
Infine, poiché la norma in H soddisfa l’identità della mediana, tale identità vale anche per la
norma in H . Allora la norma di H è indotta da un prodotto scalare, che può facilmente essere
recuperato dalla norma:
4(f, g)H = f + g2H − f − g2H + if + ig2H − if − ig2H =
yf + yg 2H − yf − yg 2H + iyf − iyg 2H − iyf + iyg 2H = 4(yf , yg ) .

q.e.d.
Definizione. Si dice che la successione fn converge debolmente a f se e solo se per ogni

funzionale lineare e continuo G la successione numerica G(fn ) converge a G(f ):
∀G ∈ H lim G(fn ) = G(f ) .

n

In considerazione del Teorema di Riesz, è equivalente l’affermazione
∀g ∈ H lim(fn , g) = (f, g) .
n
Si scrive allora fn f .
Dimostreremo al Capitolo 7 che se fn f allora
||f || ≤ lim inf ||fn || .

n
Esempio. Sia enun sistema ortonormale. Allora en 0.

2
Infatti ∀g ∈ H n |(g, en )| < +∞ e dunque (en , g) → 0.
Teorema. Sia fn f e ||fn || → ||f ||, allora fn → f (in norma). Dimostrazione. Si ha
||fn − f ||2 = ||fn ||2 + ||f ||2 − 2(fn , f ) → 2||f ||2 − 2(f, f ) = 0. q.e.d.


Capitolo 5
Operatori autoaggiunti compatti

negli spazi di Hilbert. Problemi
ellittici in dimensione 1
5.1 Definizioni e proprietà elementari.

Sia H uno spazio di Hilbert su C e T ∈ L(H).
Definizione. L’operatore lineare T si dice autoaggiunto se e solo se per ogni f e g in H

si ha
(T f, g) = (f, T g) .
Valgono le seguenti proprietà:
1) La forma quadratica T (f, f ) è reale. Infatti:
(T f, f ) = (f, T f ) = (T f, f ) .
2) Gli eventuali autovalori di T sono reali. Infatti:
T f = λf (f = 0) ⇒ (T f, f ) = λ||f ||2
e λ è reale perché tali sono (T f, f ) e ||f || .
3) Autovettori associati ad autovalori diversi sono tra loro ortogonali. Infatti sia:
T f = λf , T g = µg , f, g = 0 , λ = µ .
Allora
(T f, g) = λ(f, g) = (f, T g) = µ(f, g) ,
77
78 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1
ma µ è reale e dunque (λ − µ)(f, g) = 0 .
Definiamo per ogni operatore lineare e continuo
|(T f, f )|
NT = sup .
f =0 (f, f )
Dunque NT è la piú piccola costante tale che per ogni f ∈ H
|(T f, f )| ≤ NT ||f ||2 .
Ovviamente
NT ≤ ||T ||L(H) .
2
Infatti |(T f, f )| ≤ ||T ||||f || .
Se T è autoaggiunto allora
NT = ||T ||L(H) .
Infatti, con λ > 0 :
1 1 1 1 1
||T f ||2 = (T f, T f ) = [(T [λf + T f ], λf + T f ) − (T [λf − T f ], λf − T f )] ≤
4 λ λ λ λ
1 1 1 NT 2 1
≤ NT [||λf + T f ||2 + ||λf − T f ||2 ] = (λ ||f ||2 + 2 ||T f ||2 ) .
4 λ λ 2 λ
Se T f = 0 l’ultima espressione è minima per λ2 = ||T f ||/||f || e quindi
||T f ||2 ≤ NT ||T f ||||f || , cioé ||T f || ≤ NT ||f || .
Se T f = 0 l’ultima disuguaglianza è ovviamente soddisfatta e dunque
NT = ||T ||L(H) .
Autofunzioni approssimate.
Se T è autoaggiunto, ricordando le proprietà di omogeneità del prodotto scalare e della norma,
si ha
||T || = sup ||T f || = sup |(T f, f )| .
||f ||=1 ||f ||=1
Sia allora fn una successione massimizzante, cioè tale che
||fn || = 1 e lim |(T fn , fn )| = ||T || .

n
Si può estrarre una sottosuccessione fν tale che
lim(T fν , fν ) = λ1 con λ1 = ±||T || .

ν

Allora
0 ≤ ||T fν − λ1 fν ||2 = ||T fν ||2 − 2λ1 (T fν , fν ) + λ1 2 ||fν ||2 = cν ,
ma lim supν cν ≤ 0 e quindi
lim T fν − λ1 fν = 0 .
ν
Le fν sono quindi “soluzioni approssimate dell’equazione T f = λ1 f . Se l’equazione fosse sod-
disfatta esattamente λ1 sarebbe un autovalore di T .
Osservazione. In uno spazio di Hilbert un operatore limitato autoaggiunto può non ammet-
tere alcun autovalore.
Ad esempio in H = L2 (a, b) sia T ∈ L(H) definito da (T f )(x) = xf (x) q.o. Se per un nume-
ro λ e per un rappresentante f (x) di un elemento di H fosse xf (x) = λf (x) q.o., si avrebbe
(x − λ)f (x) = 0 q.o e quindi f (x) = 0 q.o. sarebbe un rappresentante dell’elemento nullo di H.
5.2 Autovalori e autofunzioni.

Con ipotesi di compattezza si può garantire l’esistenza di autovalori. Un operatore lineare T è
compatto se e solo se trasforma ogni successione limitata fn in una successione T fn dalla quale
si può estrarre una sottosuccessione convergente, cioè ’insieme {T fn } è precompatto. Una breve
trattazione degli operatori compatti, più in generale in uno spazio di Banach, verrà svolta nella
sezione 5. Nella sezione 6 si considereranno alcune classi di operatori integrali compatti.
Teorema. Sia T compatto: T ∈ K(H), e autoaggiunto. Allora il problema di massimo:

trovare ϕ tale che
|(T ϕ, ϕ)| = max |(T f, f )| = ||T ||
||f ||=1
ammette soluzioni. Se ϕ è una soluzione allora essa è un’autofunzione di T associata ad un

autovalore λ1 di modulo massimo:
T ϕ = λ1 ϕ , |λ1 | = ||T || .
Osservazione. Se H fosse di dimensione finita, l’iprsuperficie sferica S = {f | ||f || = 1} sarebbe

un insieme compatto e si potrebbe allora ricorrere al teorema di Weierstrass per garantire l’esi-
stenza di un punto di massimo.
Per altro in tal caso l’operatore T sarebbe ovviamente compatto.
Se H non è di dimensione finita S non è compatta.
Dimostrazione. Consideriamo una successione massimizzante fν tale che T fν −λ1 fν → 0. Per

la compattezza di T e la limitazione delle fν esiste una sottosuccessione fνk tale che T fνk → g.
Ma T fνk − λ1 fνk → 0, dunque fνk → ϕ (||ϕ|| = 1). Per la continuità dell’operatore g = T ϕ e
T ϕ = λ1 ϕ. Ovviamente
|(T ϕ, ϕ)| = |λ1 | = ||T || = ||λ1 ϕ|| = ||T ϕ|| .
q.e.d.

Procededendo ricorsivamente si possono ottenere tutti gli altri autovalori non nulli di T .
Proposizione 1. Sia ϕ1 un’autofunzione normalizzata associata all’autovalore λ1 di modulo

massimo: T ϕ1 = λ1 ϕ1 (||ϕ1 || = 1). Si ponga
H1 = { f ∈ H | (f, ϕ1 ) = 0} .
Il sottospazio chiuso H1 è invariante per T :
T (H1 ) ⊆ H1 .
Infatti se f ∈ H1
(T f, ϕ1 ) = (f, T ϕ1 ) = (f, λ1 ϕ1 ) = λ1 (f, ϕ1 ) = 0 .
Proposizione 2. L’operatore T1 = T |H1 ∈ K(H1 ) ed è ovviamente autoaggiunto. Ap-

plicando il teorema precedente, se H1 = {0} , si vede che esiste una autofunzione ϕ2 ∈ H1
normalizzata ed un autovalore λ2 , tali che
T ϕ2 = λ2 ϕ2 |λ2 | = ||T1 ||L(H1 ) = |(T ϕ2 , ϕ2 )| = max |(T ϕ, ϕ)| .

ϕ∈H1 , ||ϕ||=1
Proposizione 3. Siano ϕ1 , ϕ2 , ...ϕn le prime n autofunzioni ortonormali ottenute iterativa-

mente. Si ponga
Hn = { f ∈ H | (f, ϕk ) = 0 k = 1, 2...n} .
Allora Hn è invariante e T ristretto ad Hn è compatto autoaggiunto. Si vede che esiste una
autofunzione ϕn+1 ∈ Hn normalizzata ed un autovalore λn+1 , tali che
T ϕn+1 = λn+1 ϕn+1 |λn+1 | = ||Tn ||L(Hn ) = |(T ϕn+1 , ϕn+1 )| = max |(T ϕ, ϕ)| .
ϕ∈Hn , ||ϕ||=1
Proposizione 4. Si ottiene una successione di autovalori tali che
|λ1 | ≥ |λ2 | ≥ |λ3 | ≥ ...
Se H non è di dimensione finita e dunque i successivi Hn = {0} si ha
lim λn = 0 .
n
Altrimenti {ϕn /λn } sarebbe limitata e {T ϕn /λn } = {ϕn }, per la compattezza di T , ammette-
rebbe una sottosuccessione convergente. Ma ciò è assurdo, essendo ||ϕj − ϕk ||2 = 2 .
Proposizione 5. Le {ϕn } formano un sistema ortonormale completo nell’immagine di T :

per ogni f ∈ H
+∞

Tf = (T f, ϕk )ϕk .
k=1

Si osservi che Hn è il complemento ortogonale del sottospazio di dimensione n generato dalle

ϕ1 ...ϕn . Allora
n
gn = f − (f, ϕk )ϕk ∈ Hn
k=1
è la proiezione ortogonale di f su Hn e quindi
||T gn || ≤ ||Tn ||L(Hn ) ||gn || = |λn+1 |||gn || ≤ |λn+1 |||f || → 0
per n → +∞ . Dunque
+∞
+∞

Tf = (f, ϕk )T ϕk = λk (f, ϕk )ϕk =
k=1 k=1
+∞
+∞
+∞

(f, λk ϕk )ϕk = (f, T ϕk )ϕk = (T f, ϕk )ϕk .
k=1 k=1 k=1
Proposizione 6. Non ci sono autovalori di T diversi da 0 e dai λk della successione prece-

dente.
Infatti se esistesse un tale λ e se ϕ fosse una sua autofunzione (dunque non nulla), essa sarebbe
ortogonale a tutte le ϕk . Ma allora
+∞

T ϕ = λϕ = (λϕ, ϕk )ϕk = 0 .
k=1
Proposizione 7. Ogni autovalore non nullo è di molteplicità finita, cioè l’autospazio asso-
ciato ha dimensione finita.
Altrimenti non potrebbe essere λn → 0 .
Proposizione 8. Sia A = Im(T ) e N = Ker(T ) : N , che ovviamente è un sottospazio

chiuso, è il complemento ortogonale del sottospazio A .
Infatti se g è ortogonale a tutti gli elementi di A
∀f ∈ H 0 = (g, T f ) = (T g, f )
e quindi T g = 0 , cioè g ∈ N .
Proposizione 9. Sia A la chiusura di A. In virù della proposizione precedente H = A ⊕ N .

Se si aggiunge al sistema ortonormale {ϕk } delle autofunzioni associate agli autovalori non
nulli un qualunque sistema {zk } ortonormale completo in N , si ottiene un sistema ortonormale
completo in H .
Infatti per ogni g ∈ H sia
+∞

g∗ = (g, ϕj )ϕj
j=1

la somma della sua serie di Fourier rispetto al sistema ϕj . Allora per la proposizione 5
+∞
+∞

Tg = (T g, ϕj )ϕj = λj (g, ϕj )ϕj ,
j=1 j=1
ma per la continuità di T
+∞

T g∗ = λj (g, ϕj )ϕj
j=1
e dunque
T (g − g ∗ ) = 0 ovvero g − g ∗ = h ∈ N .
Pertanto
+∞

g = h + g∗ = h + (g, ϕj )ϕj .
j=1
Infine ovviamente g ∗ ∈ A (perchè limite di combinazioni lineari finite delle ϕj , che ovviamente
appartengono ad A: ϕj = T (ϕj /λj )) e quindi h è unico.
Osservazione. In generale Im(T ) non è chiusa: lo è soltanto se ha dimensione finita.

Infatti se fosse chiusa si avrebbe H = Im(T ) ⊕ Ker(T ) e la restrizione TI di T a Im(T ) sarebbe
biiettiva: per ogni g ∈ H
g = g ∗ + h , g ∗ ∈ Im(T ) , h ∈ Ker(T ) ⇒ T g = T g ∗
dimostra la suriettività e
T f = T g , f, g ∈ Im(T ) ⇒ T (f − g) = 0 ⇒ f − g ∈ Im(T ) ∩ Ker(T ) = {0}
dimostra l’iniettività.
Per la chiusura Im(T ) sarebbe uno spazio di Hilbert (completo) e dunque TI−1 ∈ L(Im(T )) .
Ma TI è compatto e allora, per quanto si vedrà nella sezione 5, I = TI · TI−1 ∈ K(Im(T )) . Ciò
è possibile solo se Im(T ) ha dimensione finita.
5.3 I teoremi di Hilbert e Fischer-Courant.

Dalla relazione
+∞

Tf = λk (f, ϕk )ϕk
k=1
segue immediatamente la rappresentazione della forma quadratica (T f, f )
+∞

(T f, f ) = λk |(f, ϕk )|2 ,
k=1

con convergenza assoluta della serie in virtù della disuguaglianza di Bessel e della limitazione
degli autovalori λk . Dunque separando gli autovalori positivi λ+ −
k da quelli negativi λk , tutti
ordinati in modo non crescente:
λ+ + − −
1 ≥ λ2 ≥ ... > 0 , λ1 ≤ λ2 ≤ ... < 0 ,
si ottiene
(T f, f ) = λ+ + 2
k |(f, ϕk )| + λ− − 2
k |(f, ϕk )| .
k k
Si ottiene facilmente allora il
Teorema (di Hilbert). Sia
Hn± = { f ∈ H | (f, ϕ±
i ) = 0 i = 1, 2...n} :
λ+
n+1 = +
max (T f, f ) , λ−
n+1 = −
min (T f, f ) .
f ∈Hn , ||f ||=1 f ∈Hn , ||f ||=1
Dimostrazione. Se ad esempio f ∈ Hn+ e ||f || = 1 , allora, ricorrendo alla disuguaglianza di

Bessel:

λ+ + + + 2 +
n+1 = (T ϕn+1 , ϕn+1 ) = λn+1 ||f || ≥ λn+1 ( |(f, ϕk )|2 + |(f, ϕ− 2
j | ) ≥ (T f, f ) .
k≥n+1 j
q.e.d.
Questa caratterizzazione variazionale degli autovaori è di grande importanza dal punto di vi-
sta teorico, ma non si presta facilmente alla costruzione di algoritmi per la loro approssimazione,
perchè ad ogni passo richiede la conoscenza esatta delle autofunzioni precedenti. La caratteriz-
zazione degli autovalori fornita dal teorema seguente è invece fondamentale per le tecniche di
approssimazione numerica, oltre che di grande rilievo teorico.
Teorema (di Fischer-Courant). Siano g1 , g2 ...gn elementi arbitrari di H e sia
H(g1 , g2 ...gn ) = { f ∈ H | (f, gi ) = 0, i = 1, 2, ...n} .
Allora risulta
λ+
n+1 = min max (T f, f ) ,
{g1 ,g2 ...gn } f ∈H(g1 ,g2 ...gn ) , ||f ||=1
λ−
n+1 = max min (T f, f ) .
{g1 ,g2 ...gn } f ∈H(g1 ,g2 ...gn ) , ||f ||=1
Dimostrazione (per λ+
n+1 ). Sia
M (g1 , g2 ...gn ) = max (T f, f ) .

f ∈H(g1 ,g2 ...gn ) , ||f ||=1
* * *

Si può dimostrare che il massimo indicato esiste: sia per il momento M (g1 , g2 , ...gn ) l’estremo
superiore. Per la compattezza di T e per la compattezza sequenziale debole della sfera unitaria
(||f || ≤ 1) si può trovare una successione massimizante fj tale che
fj → f debolmente , T fj → T f fortemente
e dunque
(T fj , fj ) → (T f, f ) = M (g1 , g2 , ...gn ) .
La convergenza debole implica ovviamente che f ∈ H(g1 , g2 ...gn ) e che ||f || ≤ 1. Se fosse
||f || = a < 1 si avrebbe f ∗ = f /a ∈ H(g1 , g2 ...gn ) , ||f ∗ || = 1 e (T f ∗ , f ∗ ) = (T f, f )/a2 >
M (g1 , g2 , ...gn ) , in contrasto con la definizione di M . Dunque f è punto di massimo.
& & &
Sappiamo che
M (ϕ+ + + +
1 , ϕ2 ...ϕn ) = λn+1 .
Per g1 , g2 ...gn arbitrari selezioniamo una soluzione non nulla del sistema omogeneo

n+1
xi (ϕ+
i , gk ) = 0 , k = 1, 2, ..n .
i=1
Una soluzione
non nulla esiste perchè il sistema ha n equazioni e n + 1 incognite. Normalizziamo
le xi : i |xi |2 = 1 e poniamo

n+1
f= xi ϕ +
i .
i=1
Alora, essendo ||f || = 1 e f ∈ H(g1 , g2 ...gn ) , si ha

n+1
M (g1 , g2 ...gn ) ≥ (T f, f ) = λ+ 2 +
i |xi | ≥ λn+1 .
i=1
q.e.d.
5.4 Risoluzioni dell’identità e rappresentazioni spettrali.

Per un operatore compatto autoaggiunto T consideriamo gli autovalori distinti λk , a ciascuno
dei quali sono associati una molteplicità νk (finita se l’autovalore non è nullo) e un sistema
ortonormale di autofunzioni che generano un sottospazio Mk (di dimensione finita se λk = 0):
M (λk ) = [ϕk1 , ϕk2 , ...ϕkνk , ] .
(Al solo fine di visualizzare piuù semplicemente i risultati, il lettore può supporre che T abbia
esclusivamente autovalori non positivi:
λ1 ≤ λ2 ≤ ...λn ≤ ... ≤ 0 .)

Indichiamo con P (λk ) il proiettore ortogonale su M (λk ) e poniamo

S(λ) = M (λk ) , E(λ) = P (λk ) .
λk <λ λk <λ
Dunque E(λ) è una famiglia di proiettori (su S(λ)) con le proprietà seguenti, che la qualificano
per definizione come risoluzione dell’identità :
1) monotonia : i sottospazi corrispondenti sono nondecrescenti al crescere di λ, dunque
E(λ)E(λ∗ ) = E(min(λ, λ∗ ) ;
2) convergenza a 0 o ad I per λ → ±∞:
limλ→−∞ E(λ)f = 0 , limλ→+∞ E(λ)f = f .
3) continuità a destra :
E(λ + 0) = E(λ) .
Nel caso in esame (anche per operatori compatti generici) si ha E(λ) = 0 e E(λ) = I, rispet-
tivamente a sinistra e a destra di qualsiasi intervallo finito comprendente tutti gli autovalori, e la
funzione E(λ) è costante a tratti, assumendo il valore E(λk ) per λk ≤ λ < λk+1 , e ovviamente
P (λk ) = E(λk ) − E(λk+1 ).
Vale allora la rappresentazione spettrale:

b
Tf = λk (E(λk ) − E(λk+1 )) = λd(E(λ)f ) ,
k a
dove (a, b) è un qualunque intervallo aperto contenente tutti gli autovalori e l’integrale è un
integrale di Stieltjes (rispetto ad una misura vettoriale).
Possiamo scrivere +∞
Tf = λd(E(λ)f ) ,
−∞
o volendo soltanto integrali coinvolgenti misure a valori scalari

+∞
(T f, g) = λd(E(λ)f, g) .
−∞
Essendo T limitato si può scrivere, non solo in modo simbolico

+∞
T = λdE(λ) .
−∞
Già nel 1906 Hilbert ha dimostrato che per qualunque operatore limitato T autoaggiunto,
e non solo per gli operatori compatti, esiste un’unica risoluzione dell’identità E(λ) che consente
di rappresentarlo mediante un integrale di Stieltjes.
Se l’operatore non è compatto la funzione monotona E(λ) può avere un comportamento molto

più complesso, in particolare non è necessariamente costante a tratti e ad esempio può crescere
con continuità tra due salti consecutivi. I valori λ per i quali ciò avviene fanno parte dello
spettro continuo di T .
Se nell’intorno di λ0 E(λ) non è costante, a λ0 si possono associare autofunzioni approssimate:
per ogni ε > 0 sia
P (λ0 , ε) = E(λ0 + ε) − E(λ0 )
il proiettore sul sottospazio S(λ0 , ε), al quale appartenga f . Allora
λ0 +ε
T f − λ0 f = (λ − λ0 )dE(λ)f e quindi ||T f − λ0 f || ≤ ε .
λ0
Questi risultati sono stati estesi, anche sull’onda della loro rilevanza in meccanica quanti-
stica, nel 1928 da von Neumann al caso di operatori autoaggiunti non limitati e sono stati
oggetto di studio da parte di molti autori.
Per una prima presentazione dettagliata si vedano ad esempio Riesz-Nagy[20] o Hudson-Pymm[13].
5.5 L’ideale degli operatori compatti.

In questa sezione consideriamo più in generale operatori in uno spazio di Banach E. Come al
solito indichiamo con L(E) l’insieme degli operatori lineari e continui ovunque definiti in E a
valori in E. Sappiamo che A ∈ L(E) se e solo se trasforma insiemi limitati in insiemi ancora
limitati. Se E non ha dimensione finita un insieme limitato non è necessariamente precompat-
to1 . Ricordiamo che un insieme C in uno spazio di Banach è precompatto (o relativamente
compatto) se e solo se ogni successione xn di elementi di C ammette una sottosuccessione xnj
convergente (non necessariamente ad un elemento di C). Ricordiamo inoltre la
Definizione. Un operatore lineare ovunque definito A si dice compatto se e solo se tra-

sforma ogni insieme limitato in un insieme precompatto.
Essendo gli insiemi precompatti limitati, l’operatore A è limitato e dunque continuo. Se indi-
chiamo con K(E) l’insieme degli operatori compatti abbiamo allora K(E) ⊆ L(E) .
Teorema. K(E) è u ideale bilatero chiuso del’algebra L(E) .
Dimostrazione. Per verificare che un operatore A è compatto basta controllare che se

||xn || ≤ M allora Axn ammette una sottosuccessione convergente.
1) K(E) è un sottospazio: siano A, B compatti, λ ∈ C e ||xn || ≤ M . Esiste xnj tale che

Axnj → y e poiché ||xnj || ≤ M esiste xnjk tale che
Bxnjk → z e quindi (A + λB)xnjk → y + λz .

1 Uno spazio X munito di una struttura uniforme si dice precompatto se il suo completamento separato è
compatto. Un sottoinsieme A di X si dice precompatto se il sottospazio uniforme che definisce è precompatto.

In uno spazio metrico completo, e quindi in uno spazio di Banach, un insieme è precompatto se e solo se è
relativamente compatto, cioè ha chiusura compatta

Pertanto A + λB è compatto.
2) Se A ∈ L(E) , B ∈ K(E) e ||xn || ≤ M , allora, per la compattezza di B, esiste una sottosucces-

sione xnj tale che Bxnj → z e, per la continuità di A, (AB)xnjk → Az, dunque AB è compatto.
Inoltre ||Axn || ≤ ||A||M e quindi, per la compattezza di B esiste una sottosuccessione Axnj tale
che (BA)xnj → y, dunque anche BA è compatto.
Alternativamente si potrebbe dimostrare il risultato nel modo seguente: se A ∈ L(E) , B ∈ K(E)
e L ⊂ E è limitato, allora A(L) è limitato e B(A(L)) è precompatto. Dunque BA ∈ K(E). Inol-
tre B(L) è precompatto e A è continuo e quindi A(B(L)) è precompatto: B(L) è compatto
come A(B(L)) per la continuità di A; sempre per la continuità di A l’immagine dell’aderen-
za di un insieme è contenuta nell’aderenza dell’immagine di tale insieme e quindi A(B(L)) =
A(B(L)) = A(B(L)) , essendo A(B(L)) chiuso in quanto compatto. Allora A(B(L)) è precom-
patto e AB ∈ K(E) .
3) Sia
An ∈ K(E) e ||An − A||L(E) → 0
e sia ||xn || ≤ M . Allora {A1 xn } è precompatta: sia A1 x1n → y1 , dove x1n è una sottosuccessione
di xn . Allora {A2 x1n } è precompatta: sia A2 x2n → y2 , dove x2n è una sottosuccessione di x1n .
Allora ...
Sia zn = xnn la sottosuccessione diagonale. Dato ε > 0, sia p sufficientemente grande perché
||A − Ap || < ε. Qualunque sia p la successione Ap zn converge e dunque è di Cauchy: per n, m
sufficientemente grandi ||Ap (zn − zm )|| < ε. Pertanto
||Azn − Azm || ≤ ||(A − Ap )zn || + ||Ap (zn − zm )|| + ||(Ap − A)zm || ≤
≤ Mε + ε + Mε .
Cioè Azn è di Cauchy e convergente, essendo E di Banach. Dunque per ogni successione limitata
xn , la successione trasformata Axn ammette una sottosuccessione Azn convergente e A ∈ K(E).
q.e.d.
Osservazione. Ricorrendo alla caratterizzazione, in uno spazio metrico, dei precompatti come
insiemi totalmente limitati, il terzo punto si potrebbe anche dimostrare nel modo seguente.
Essendo L(E) uno spazio di Banach A ∈ L(E) e per vedere che è compatto, in virtù della
linearità, basta verificare che A(B) è precompatto, dove B = B1 (0) è la sfera unitaria di centro
0 . Fissato arbitrariamente ε > 0 sia ||An − A|| < ε. An (B) è precompatto ed ammette dunque
un ε-reticolo finito {y1 , y2 , ...yN }, il quale risulta un 2ε-reticolo finito per A(B) : se z ∈ B
||Az − An z|| < ε e ||An z − yj || < ε
con j opportuno. Quindi A ∈ K(E).
5.6 Compattezza di operatori integrali.

Per semplicità consideriamo funzioni reali definite in un intervallo [a, b] di R, munito della misu-
ra standard di Lebesgue. È facile estendere i risultati al caso di spazi metrici compatti, muniti

di una struttura compatibile di spazio di misura finita. (L’ipotesi di compattezza serve solo per
lo studio delle funzioni continue).
1) Sia C = C([a, b]) , K ∈ C2 = C([a, b]2 ) , allora l’operatore integrale K̂ definito da

b
(K̂f ) = K(x, y)f (y)dy
a
è compatto.
Infatti ad esempio l’insieme dei polinomi

P (x, y) = cjk xj y k
j,k
è un algebra in C2 che contiene le costanti e separa i punti di [a, b]2 (bastano i due monomi x e
y per operare la separazione) e dunque, per il teorema di Stone-Weierstrass è densa in C2. Dato
ε > 0 sia P (x, y) tale che
||K − P ||∞ = max |K(x, y) − P (x, y)| ≤ ε .

(x,y)∈[a,b]2
Ricordando che b
||K̂||L(C) = max |K(x, y)|dy ≤ (b − a)||K||∞
x∈[a,b] a
si vede che K̂ è limite nella norma di L(C) di operatori P̂ con nucleo separabile (somma di
prodotti di funzioni della sola x per funzioni della sola y), quindi con immagine in dimensione
finita:
b
L(x, y) = fj (x)gj (y) ⇒ L̂ϕ(x) = ( gj (y)ϕ(y)dy)fj (x) ,
j j a
cioè Im(L̂) coincide con il sottospazio generato dalle fj . Ma un operatore continuo con immagine
in dimensione finita è ovviamente compatto e quindi K̂, quale limite di tali operatori è compatto.
2) Sia L2 = L2 ([a, b]) e K ∈ L2 = L2 ([a, b]2 ). Allora l’operatore integrale K̂ definito come al
solito da b
(K̂f ) = K(x, y)f (y)dy
a
è compatto.
In primo luogo osserviamo che, usando il teorema di Fubini e la disuguaglianza di Schwartz,

si ha b b
2
||K̂f ||L2 = | K(x, y)f (y)dy|2 dx ≤
a a
b b b
≤ ( |K(x, y)|2 dy)( |f (y)|2 dy)dx ≤ ||K||2L2 · ||f ||2L2 .
a a a

Quindi K̂, ovviamente lineare, è ovunque definito e limitato, con

||K̂||L(L2 ) ≤ ||K||L2
e se Kn → K in L2 allora K̂n → K̂ in L(L2 ).

Ricorrendo alla totalità delle funzioni caratteristiche degli insiemi misurabili in ogni Lp , sia,
dato ε > 0, Kn tale che

N
Kn (x, y) = cj χAj e ||K − Kn ||L2 ≤ ε ,
j=1
dove gli Aj sono misurabili. Per ogni Aj esiste un insieme Bj , unione finita di rettangoli, tale
che, indicando con µ la misura di Lebesgue:
ε
µ(Aj ∆Bj ) ≤ N .
N 1 |cj |2
Sia allora

N
Ln (x, y) = cj χBj .
j=1
Si ha
b b
N b b
N
N
||Kn − Ln ||2L2 ≤ ( 2
|cj |χAJ ∆Bj ) dxdy ≤ ( |cj |2 χ2AJ ∆Bj )dxdy ≤
a a 1 a a 1 1

N N b
b
N
ε
≤ |cj |2 χAJ ∆Bj dxdy ≤ |cj |2 N N =ε.
1 1 a a 1 N 1 |cj |2
La funzione caratteristica di un rettangolo con i lati paralleli agli assi è prodotto di due funzioni
caratteristiche (una della sola x, l’altra della sola y) e quindi Ln , come combinazione lineare
finita di tali funzioni, è separabile e ha immagine in dimensione finita. Si conclude allora come
nel caso precedente per garantire la compattezza di K̂ .
Se K ∈ L2 e K(x, y) = K(y, x)
b b b b
( K(x, y)f (y)dy)g(x)dx = f (y)( K(y, x)g(x)dx)dy
a a a a
e l’operatore K̂ risulta autoaggiunto. Applicando la teoria generale degli operatori autoaggiunti

e compatti, siano λj gli autovalori non nulli e ϕj un corrispondente sistema ortonormale di
autofunzioni. È immediato controllare che le funzioni
Zj (x, y) = ϕj (x)ϕj (y)
formano un sistema ortonormale in L2 . Sia allora M (x, y) la somma della serie di Fourier di K
rispetto a tale sistema:
+∞

M (x, y) = (K, Zj )Zj (x, y) ,
j=1

ricordando che la convergenza è in realtà in L2 . Essendo le ϕj autofunzioni associate a λj , si

ha b b
(K, Zj ) = K(x, y)ϕj (y)ϕj (x)dxdy = λj
a a
e quindi
+∞

M (x, y) = λj ϕj (x)ϕj (y) .
j=1
Dimostriamo che K = M . Le funzioni F (x, y) = g(x)f (y), con f, g ∈ L2 formano un sistema

totale in L2 (basterebbero f, g funzioni caratteristiche di intervalli). Risulta per ogni F di tale
forma
(K − M, F ) = (K̂f, g) − (M̂ f, g) =
+∞
+∞

= λj (f, ϕj )(ϕj , g) − λj (f, ϕj )(ϕj , g) = 0 ,
j=1 j=1
essendo le ϕj un sistema ortonormale completo in Im(K̂). Dunque (K − M, F ) = 0 per ogni

F ∈ L2 e K = M . Ne segue che vale la rappresentazione
+∞

K(x, y) = λj ϕj (x)ϕj (y) .
j=1
In particolare, ricordando l’uguaglianza di Parseval:

+∞

λ2j = ||K||2L2 ≤ +∞ .
j=1
Se K(x, y) è un nucleo tale che K(x, y) = K(y, x) e

b
∀x ∈ [a, b] |K(x, y)|2 dy ≤ C 2 ,
a
allora le condizioni precedenti sono soddisfatte. In questo caso però la serie

+∞

K̂g(x) = λj (g, ϕj )ϕj (x)
j=1
converge non solo in media quadratica, ma nche uniformemente ed assolutamente.
Infatti, posto
+∞

n
f= (g, ϕj )ϕj e fn = (g, ϕj )ϕj ,
j=1 j=1

si ha

n
|K̂g(x) − λj (g, ϕj )ϕj (x)|2 = |K̂f (x) − K̂fn (x)|2 =
j=1
b b b
2 2
=| K(x, y)(f (y) − fn (y))dy| ≤ |K(x, y)| dy |f − fn |2 (y)dy ≤ C 2 ||f − fn ||2
a a a
e la convergenza uniforme deriva dalla convergenza in norma.
Inoltre b
n
n
n
|λj (g, ϕj )ϕj (x)| ≤ ( |(g, ϕj )|2 )1/2 ( | K(x, y)ϕj (y)dy|2 )1/2 ≤
1 1 1 a
≤ ||g|| ||K(x, ·)|| ≤ C||g|| ,

in virtù della disuguaglianza di Bessel, essendo per ogni x K(x, ·) ∈ L2 e
b
K(x, y)ϕj (y)dy = (K(x, ·), ϕj )
a
il complesso coniugato del j-esimo coefficiente di Fourier di K(x, ·) .

5.7 Problemi ellittici in dimensione 1. Minorazione degli autovalori

Studiamo il seguente problema ai limiti, prototipo dei problemi ellittici in dimensione 1,
classicamente indicati come problemi di Sturm-Liouville:




−y (x) + q(x)y(x) − λy(x) = f (x)
,

 h1 y(a) + k1 y (a) = 0

h2 y(b) + k2 y (b) = 0
dove λ ∈ C , q è una funzione continua da [a, b] in R, hi , ki ∈ R e non sono entrambi nulli, f

è una funzione continua a tratti che ammette limite destro e sinistro in ciascuno dei suoi punti
di discontinuità. Le condizioni in a e b si dicono condizioni ai limiti. Le condizioni ai limiti
considerate sono omogenee. Ci si può sempre ridurre a questo caso sottrendo a y una funzione
regolare che soddisfi le condizioni non omogenee e modificando corrispondentemente il termine
noto.
Studieremo la trattazione clessica di questi problemi, seguendo la presentazione di Dieu-

donné. Cerchiamo dunque soluzioni classiche: continue con derivata prima continua e derivata
seconda con la stessa regolarità di f . L’equazione differenziale deve essere soddisfatta in ]a, b[
tranne un numero finito di punti (quelli di discontinuità di f e di y ).
Notiamo che se f è continua allora y ∈ C 2 e l’equazione è soddisfatta in tutto ]a, b[. Infatti
se in x0 il termine noto f è continuo e l’equazione è soddisfatta allora y è continua. Se in x0 il
termine noto f fosse continuo, ma l’equazione non fosse soddisfatta, si avrebbe
lim y = lim− (qy − λy − f ) = lim+ (qy − λy − f ) = lim+ y .

x→x−
0 x→x0 x→x0 x→x0

Ma allora y− e y+ esisterebbero e sarebbero uguali, dunque esisterebbe y , l’equazione sarebbe

soddisfatta e y sarebbe continua.
Più in generale se f, q ∈ C k si vede che ogni soluzione y dell’equazione è di classe C 2+k .
Nel seguito per semplicità supporremo f almeno continua e l’equazione ovunque soddisfatta.
Il caso più generale considerato nella formulazione del problema si tratta facilmente consideran-
do i successivi intervalli di continuità di f .
Per una presentazione più dettagliata si veda Dieudonné[7].

Osservazione. L’equazione differenziale proposta appare di forma troppo particolare. Ma in
effetti si tratta di una forma canonica”: ogni equazione differenziale lineare del secondo ordine
si può ridurre a tale forma con un opportuno cambiamento di funzione incognita e di variabile
indipendente:
u + au + bu = g ,
dove a, b sono funzioni continue, ponendo

A = a , P = eA > 0 , Q = eA b , f = eA g ,

equivale a
(P y ) + Qy = f perché eA y + aeA y = (eA y ) .
Sia allora
dx 1
= P (x) , p = , t = p(x) , x = p−1 (t) ,
dt P
dz 1
z(t) = y(x) = y(p−1 (t)) , = y = y P.
dt p
Dunque
d(y P ) d2 z 1
= 2
dx dt P (x)
e finalmente
d2 z
+ P Q(p−1 (t))z = P f .
dt2
Per f = 0 il problema di Sturm-Liouville è un problema di autovalori e corrispondenti

autofunzioni per l’operatore differenziale
L[y] = −y + qy
con dominio lo spazio lineare delle funzioni C 2 che soddisfano alle condizioni ai limiti.
Teorema. Gli eventuali autovalori di L sono reali e inferiormente limitati, cioè esiste λ0
tale che per λ ≤ λ0 l’unica soluzione di −y + qy = λy, con y soddisfacente alle condizioni ai
limiti, è la soluzione nulla.
Premettiamo alla dimostrazione il seguente risultato, che è essenzialmente un esempio ele-

mentare di teorema di traccia .
Proposizione. Siano y, y ∈ L2 (a, b) . Per ogni ε > 0 esiste Cε tale che
|y(a)|2 + |y(b)|2 ≤ ε||y ||22 + Cε ||y||22 .
Dimostrazione. Si sa che y è assolutamente continua e si ricostruisce integrando la sua derivata.

Sia g la funzione lineare per la quale g(a) = −1 e g(b) = 1 , dunque g (x) = 2/(b − a) . Allora
b
[|y|2 g]ba = (2yy g + |y|2 g )
a
e quindi
2 1 2
|y(a)|2 + |y(b)|2 ≤ 2||y|| ||y || + ||y||2 ≤ ε||y ||2 + ( + )||y||2 .
b−a ε b−a
q.e.d.

Dimostrazione del teorema. Sia y soluzione di L[y] = λy. Moltiplicando entrambi i membri
per y e integrando su (a, b) e poi integrando per parti, si trova
b b
0= (−y y + q|y|2 − λ|y|2 ) = [−y y]ba + (|y |2 + (q − λ)|y|2 ) =
a a
b
B|y(b)|2 + A|y(a)|2 + (|y |2 + (q − λ)|y|2 ,
a
dove A = 0 o B = 0 se k1 = 0 o k2 = 0 , altrimenti A = −h1 /k1 , B = h2 /k2 . Essendo in ogni

caso A e B reali si vede che λ è reale. Inoltre, posto
m = min q(x) , M = max(|A|, |B|) ,

x
si ottiene
λ||y||2 ≥ m||y||2 + ||y ||2 − M (|y(a)|2 + |y(b)|2 ) ≥ λ0 ||y||2 ,
se si prende
εM < 1 e λ0 = m − M Cε .
Ne segue che per y ≡ 0 deve essere λ > λ0 . q.e.d.
Nel seguito, eventualmente sostituendo q − λ0 e λ − λ0 a q e λ , supporremo che non esistano

autovalori λ ≤ 0 .
5.8 La funzione di Green e l’equazione integrale equivalente.

Il problema ai limiti, analogamente a quanto avviene per il probleblema di Cauchy, verrà stu-
diato trasformandolo in una equazione integrale equivalente. Il nucleo dell’equazione integrale
è costituito dalla funzione di Green che costruiamo ora.
Sia I = [a, b] e per ogni t ∈]a, b[ cerchiamo una funzione Kt (x) tale che
1) Kt ∈ C(I) ∩ C 2 (I − {t}) ,
2) Kt (t+ ) − Kt (t− ) = −1 ,
3) −Kt + qKt = 0 in I − {t} ,
4) Kt soddisfa alle condizioni ai limiti.
Teorema. Per ogni t esiste un’unica funzione Kt che soddisfa le condizioni 1), 2), 3) e 4).
La funzione K(x, t) = Kt (x) è detta la funzione di Green del problema di Sturm-Liouville.
Dimostrazione. Per le note proprietà sui problemi di Cauchy per le equazioni lineari, esistono
due funzioni reali non nulle u1 e u2 soddisfacenti le condizioni:
−u1 + qu1 = 0 , h1 u1 (a) + k1 u1 (a) = 0 ,
−u2 + qu2 = 0 , h2 u2 (b) + k2 u2 (b) = 0 ,

entrambe individuate a meno di una costante moltiplicativa. Esse sono linearmente indipendenti,
perché se fossero proporzionali esisterebbe una soluzione y non nulla dell’equazione −y +qy = 0
soddisfacente ad entrambe le condizioni ai limiti e λ = 0 sarebbe un autovalore dell’operatore
L. Esse costituiscono dunque un sistema fondamentale di soluzioni dell’equazione omogenea
−y + qy = 0, nel solito senso che la soluzione generale di tale equazione è della forma
y = c1 u1 + c2 y2 ,
con c1 , c2 costanti arbitrarie. Inoltre il loro Wronskiano
W = u1 u2 − u1 u2 = 0
è costante, in quanto

u u2 u1 u2 u1 u2
D 1 = = q =0.
u1 u2 u1
u2 u1 u2
Deve allora essere

c1 (t)u1 (x), x ∈ [a, t]
Kt (x) = ,
c2 (t)u2 (x), x ∈ [t, b]
dove c1 (t) e c2 (t) si determinano imponendo in t la continuità di Kt e il prescritto salto di Kt :

c1 (t)u1 (t) − c2 (t)u2 (t) = 0
,
c1 (t)u1 (t) − c2 (t)u2 (t) = 1
sistema che ( W = 0 ) ammette soluzione unica. Pertanto

−u2 (t)u1 (x)/W, x ∈ [a, t]
Kt (x) = K(x, t) = .
−u1 (t)u2 (x)/W, x ∈ [t, b]
Dunque una funzione di Green esiste, ed essa è unica perché u1 , u2 sono individuate da costanti
moltiplicative, esattamente compensate dal Wroskiano a denominatore. q.e.d.
Osservazione. La funzione di Green K(x, t) può ovviamente essere prolungata per conti-
nuità al quadrato chiuso [a, b]2 , è reale e dalla sua espressione esplicita si controlla che risulta
simmetrica K(x, t) = K(t, x) .
Teorema. Per λ = 0, y è soluzione del problema di Sturm-Liouville con termine noto f se

e solo se b
y(x) = K(x, t)f (t)dt .
a
Dimostrazione. È sufficiente considerare il caso in cui f e y sono reali.

1) Sia

u2 (x) x u1 (x) b
y(x) = − u1 (t)f (t)dt − u2 (t)f (t)dt .
W a W x

Allora
u2 (x) x
u1 (x) b
u1 (x)u2 (x)
y (x) = − u1 f − u2 f ∓ − f (x) .
W a W x W
e successivamente

u2 (x) x
u1 (x) b
u1 (x)u2 (x) − u1 (x)u2 (x)
y (x) = − u1 f − u2 f − f (x) .
W a W x W
Dunque, essendo ui = qui :
y (x) = q(x)y(x) − f (x) .
Anche le condizioni ai limiti sono soddisfatte, perché in a y, y sono proporzionali a u1 , u1 e
analogamente in b .
2) sia y soluzione del problema di Sturm-Liouville. Consideriamo le equazioni
−Kx (t) + q(t)Kx (t) = 0 ,
−y (t) + q(t)y(t) = f (t) .

Moltiplichiamo la prima per y(t) , la seconda per Kx (t) e facciamone la differenza:
Kx (t)y (t) − y(t)Kx (t) = −Kx (t)f (t) , t = x .
Integrando su [a, x] e su [x, b] e ricorrendo alla formula di integrazione per parti, si trova
x
(Kx (t)y (t) − y(t)Kx (t))dt = [y Kx ]xa − [yKx ]xa = y (x)Kx (x) − y(x)Kx (x− ) ,
a
perché
y(a) Kx (a)
=0.
y (a) Kx (a)
Analogamente
b
(Kx (t)y (t) − y(t)Kx (t))dt = [y Kx ]bx − [yKx ]bx = −y (x)Kx (x) + y(x)Kx (x+ ) .
x
Sommando, e ricordando la condizione di salto:

b
−y(x) = − K(x, t)f (t)dt .
a
q.e.d.
Segue immediatamente il
Teorema. Se f è continua, y è soluzione del problema di Sturm-Liouville con termine noto

f se e solo se y è soluzione dell’equazione integrale di Fredholm
b
y(x) − λ K(x, t)y(t)dt = g(x) ,
a

dove b
g(x) = K(x, t)f (t)dt .
a
5.9 Autovalori ed autofunzioni.

La funzione di Green è continua, reale e simmetrica, quindi in L2 = L2 ([a, b]2 ). Dunque
l’operatore integrale K̂ definito da
b
K̂f (x) = K(x, t)f (t)dt ,
a
è compatto e autoaggiunto in L2 (a, b). Inoltre si vede facilmente, per la continuità uniforme di
K che esso trasforma funzioni di L2 in funzioni continue.
Se y è una sua autofunzione associata all’autovalore (necessariamente reale) µ = 0
K̂y = µy ,
allora y è continua e, per quanto visto nella sezione precedente, soluzione del problema di
Sturm-Liouville 


 −y (x) + q(x)y(x) = 1 y(x)
µ .

 h y(a) + k1 y (a) = 0
 1
h2 y(b) + k2 y (b) = 0
Allora deve essere µ > 0 e λ = µ1 è un autovalore dell’operatore differenziale L (o come si dice
del problema di Sturm-Liouville) e y è una autofunzione di L associata a λ .
Da quanto sappiamo sui nuclei di classe L2 segue immediatamente il primo punto del seguente
Teorema.
1) Il problema di Sturm-Liouville ammette una successione di autovalori λn tali che
+∞
b b
1
lim λn = +∞ , 2
= |K(x, t)|2 dxdt < +∞ .
n
n=1
λ n a a
2) Ogni autovarore λn ha molteplicità 1 ed ammette autofunzioni reali. Indicheremo con ϕn

un’autofunzione normalizzata ad esso associata (individuata a meno di un fattore complesso di
modulo 1). Possiamo assumere che ϕn sia reale (quindi individuata a meno del segno).
3) Le ϕn costituiscono un sistema ortonormale completo in tutto L2 .
4) Se f ∈ C 2 ([a, b]) e soddisfa le condizioni ai limiti, la sua serie di Fourier
+∞

f (x) = (f, ϕn )ϕn (x)
n=1
converge assolutamente e uniformemente in [a, b] .

Dimostrazione. Il punto 1) è già dimostrato.

2) Se y e z fossero due soluzioni indipendenti corrispondenti ad uno stesso autovalore, il loro
Wronskiano (costante) sarebbe non nullo. Ma dovendo soddisfare entrambe, per esempio, alla
prima condizione ai limiti 

h1 y(a) + k1 y (a) = 0 ,

h1 z(a) + k1 z (a) = 0
dovrebbe essere h1 = k1 = 0 , contrariamente a quanto supposto.
Se y è una soluzione complessa, per la realtà di q , λn e di hi , ki , y e y sono soluzioni reali,
necessariamente proporzionali ed y un multiplo complesso di una delle due.
3) La completezza delle ϕn deriva da
Ker(K̂) = {0} e dunque L2 = Im(K̂) .
Infatti, se f è continua e K̂f = y = 0 , sappiamo che f = −y + qy = 0 . Per una generica

funzione f di L2 nel nucleo di K̂ siano fj funzioni continue convergenti in L2 ad f. Allora si ha
in L2
yj = K̂fj → K̂f = 0 e − yj = fj − qyj → f .
Ma, per ogni funzione ϕ ∈ C 2 che si annulla agli estremi con la sua derivata prima, ricorrendo
due volte alla formula di integrazione per parti:
(f, ϕ) = lim −(yj , ϕ) = − lim(yj , ϕ ) = 0 .

j j
È noto che le funzioni del tipo suddetto formano un sottoinsieme denso il L2 e dunque deve
essere f = 0 .
(*Si potrebbe dire che la convergenza di yj a 0 in L2 implica la convergenza di yj a 0 nel senso
delle distribuzioni e quindi quella di yj a 0 sempre nel senso delle distribuzioni. Ma yj converge
ad f in L2 e quindi ad f nel senso delle distribuzioni. Per l’unicità del limite f = 0 .*)
4) Se f ∈ C 2 e soddisfa alle condizioni ai limiti, si ha
f = K̂g con g = −f + qf
e il risultato segue dalle note proprietà delle autofunzioni degli operatori integrali con nucleo
tale che b
∀x |K(x, y)|2 dy ≤ C 2 ,
a
affermazione certamente vera per la funzione di Green, che è ovunque continua. q.e.d.

Capitolo 6
Compattezza negli spazi metrici.

Equicontinuità
6.1 Equicontinuità.
Le ipotesi seguenti si possono notevolmente generalizzare (si veda ad esempio L.Schwartz[22]),
ma per semplificare la presentazione delle idee fondamentali e per garantire la maggior parte
delle applicazioni le restrizioni assunte sembrano adeguate.
Sia (K, d) uno spazio metrico compatto e F uno spazio di Banach. Indichiamo, analogamente
al caso di funzioni a valori reali o complessi, con C(K; F ) lo spazio delle funzioni definite e
continue da K in F , normato da
||f || = max ||f (x)||F .
x∈K
Dunque C(K; F ) è costituito da funzioni uniformemente continue ed è uno spazio normato

completo, cioè uno spazio di Banach.
È noto infatti che la continuità semplice in un compatto implica la continuità uniforme e per
verificare la completezza di C(K; F ) si può ripetere la dimostrazione fatta per funzioni a valori
complessi, sostituendo il modulo con la norma || · ||F e ricorrendo alla completezza di F .
Definizione. Una famiglia F di funzioni definite in un intorno di a ∈ K a valori in F si dice

equicontinua in a se e solo se
∀ε > 0 ∃δ > 0 ∀x ∈ K ∀f ∈ F d(x, a) ≤ δ ⇒ ||f (x) − f (a)||F ≤ ε .
Una famiglia F ⊆ C(K; F ) si dice equicontinua in K se e solo se è equicontinua in ogni punto

a di K .
Una famiglia F ⊆ C(K; F ) si dice uniformemente equicontinua in K se e solo se
∀ε > 0 ∃δ > 0 ∀x, y ∈ K ∀f ∈ F d(x, y) ≤ δ ⇒ ||f (x) − f (y)||F ≤ ε .
99
100 Capitolo 6. Compattezza negli spazi metrici. Equicontinuità
Osservazione. Essendo K compatto l’equicontinuità in K e l’uniforme equicontinuità in K

sono equivalenti. Infatti sia per assurdo F equicontinua ma non uniformemente equicontinua:
∃ε > 0 ∀δ > 0 ∃x, y ∈ K ∃f ∈ F d(x, y) < δ ∧ ||f (x) − f (y)|| > ε .
In particolare per δ = 1/n siano xn , yn , fn tali che
d(xn , yn ) < 1/n ∧ ||fn (xn ) − fn (yn )|| > ε .
Per la compattezza di K possiamo considerare due sottosuccessioni tali che
lim xnj = lim ynj = z ∈ K .

j j
Ma allora si avrebbe la contraddizione
0 < ε ≤ ||fnj (xnj ) − fnj (ynj )|| ≤ ||fnj (xnj ) − fnj (z)|| + ||fnj (z) − fnj (ynj )|| → 0
per l’equicontinuità di F in z . c.v.d.
Esempio. Se le funzioni di F sono tutte Hölderiane con uno stesso esponente α ∈]0, 1] e
con una stessa costante L :
||f (x) − f (y)||F ≤ Ld(x, y)α ,
allora sono equicontinue.
Osservazione. Se K è un sottoinsieme di uno spazio vettoriale normato, di norma | · | , e vale

la disuguaglianza precedente con α > 1 allora la funzione f è costante.
Infatti, posto ykn = x + k/n(y − x) , si ha

n−1
||f (y) − f (x)|| ≤ ||f (yk+1
n
) − f (ykn )|| ≤ L |yk+1
n
− ykn |α ≤
k=0 k
|y − x| n
≤L ( )α ≤ L|y − x| α → 0
n n
k
per n → +∞ .
Teorema (Versione parziale del primo teorema di Ascoli). Sia fn una successione di
funzioni equicontinue in a e convergenti semplicemente ad una funzione limite f in un intorno
A di a. Allora f è continua in a.
Dimostrazione. Dato ε > 0 sia U (a) ⊂ A un intorno di a tale che
∀x ∈ U (a) ∀n d(fn (x), fn (a)) ≤ ε .
Allora, fissato x ∈ U (a) e per n sufficientemente grande si avrà
d(fn (x), f (x)) ≤ ε , d(fn (a), f (a)) ≤ ε ,

dunque
d(f (x), f (a)) ≤ d(f (x), fn (x)) + d(fn (x), fn (a)) + d(fn (a), f (a)) ≤ 3ε ,
q.e.d.
In presenza di equicontinuità, la convergenza semplice e la convergenza uniforme sono equi-

valenti sui compatti. Precisamente
Teorema (Versione semplificata del secondo teorema di Ascoli). Sia (K, d) uno spazio
metrico compatto. Sia fn , n ≥ 1 una successione di funzioni equicontinue in K convergente
semplicemente in K ad una funzione limite f0 , necessariamente continua. Allora fn converge
uniformemente a f0 in K.
Dimostrazione. La successione fn , n ≥ 0 è ancora equicontinua. Dato ε > 0 , per ogni x ∈ K
sia U (x) un intorno aperto di x nel quale
∀y ∈ U (x) ∀n ≥ 0 ||fn (y) − fn (x)|| ≤ ε .
Essendo K compatto esiste un nmero finito di intorni
U (x1 ), U (x2 ), ... U (xp )
che ricopre K. Sia ν tale che per n ≥ ν si abbia
||fn (xj ) − f0 (xj )|| ≤ ε j = 1, 2, ...p .
Allora per ogni z ∈ K esiste xj tale che z ∈ U (xj ) e dunque per n ≥ ν
||fn (z) − f0 (z)|| ≤ ||fn (z) − fn (xj )|| + ||fn (xj ) − f0 (xj )|| + ||f0 (xj ) − f0 (z)|| ≤ 3ε .
q.e.d.
6.2 Compattezza negli spazi metrici.

Sia T uno spazio topologico separato. Ricordiamo le seguenti definizioni.
1) T si dice compatto se e solo se ogni ricoprimento aperto di T ammette un sottoricoprimento

finito.
2) T si dice numerabilmente compatto se e solo se ogni ricoprimento aperto numerabile di

T ammette un sottoricoprimento finito.
In uno spazio nel quale vale l’assioma di separazione T1 (“ x = y implica che esistono due intorni
V (x), V (y) di x e y tali ceh y ∈
/ V (x) e x ∈/ V (y)), e quindi a maggior ragione in uno spazio
di Hausdorff, si può dimostrare che è equivalente richiedere che ogni suo sottoinsieme infinito
ammetta almeno un punto di accumulazione.
3) T si dice sequenzialmente compatto se e solo se da ogni successione a valori in T si può

estrarre una sottosuccessione convergente ad un limite in T .

Si può dimostrare il seguente teorema, del quale omettiamo, per il momento, la dimostrazione.
Teorema. Sia (K, d) uno spazio metrico (si considera ovviamente la topologia indotta dalla
distanza d). Allora K è compatto ⇔ K è numerabilmente compatto ⇔ K è sequenzialmente
compatto.
Ricordiamo ancora le definizioni seguenti.
a) Un insieme K in uno spazio metrico (X, d) si dice relativamente compatto o equivalente-

mente, se X è completo, precompatto se e solo se la sua chiusura K è compatta.
b) Un insieme K in uno spazio metrico (X, d) si dice totalmente limitato se e solo se per ogni
ε > 0 esiste un numero finito Nε di sfere Bk di diametro ε la cui unione ricopre K. I centri
ck di tali sfere, o qualunque insieme di punti xk (uno in ciascuna Bk ) costituiscono un insieme
finito di elementi in grado di approssimare ogni elemento di K a meno di ε o come si dice un
ε-reticolo finito per K.
Teorema. Uno spazio metrico (K, d) è compatto se e solo se è totalmente limitato e com-
pleto.
Da questo teorema segue immediatamente il
Corollario. Un insieme K in uno spazio metrico completo (X, d) è relativamente compatto

se e solo se esso è totalmente limitato.
Dimostrazione del teorema.

i) Sia K sequenzialmente compatto. Da ogni successione di Cauchy xn si può estrarre una
sottosuccessione xnk convergente ad un limite x0 in K. Ma allora tutta la successione xn
converge a x0 e dunque K è completo.
Se per assurdo K non fosse totalmente limitato esisterebbe ε > 0 tale che non vi sarebbe
alcun ε-reticolo finito per K. Allora preso comunque x1 ∈ K esisterebbe x2 ∈ K tale che
d(x1 , x2 ) ≥ ε , altrimenti {x1 } sarebbe un ε-reticolo finito per K. Allora esisterebbe x3 ∈ K
tale che d(x1 , x3 ) ≥ ε e d(x2 , x3 ) ≥ ε, altrimenti {x1 , x2 } sarebbe un ε-reticolo finito per K.
Proseguendo indefinitamente si otterrebbe una successione xn tale che per ogni coppia j = k
risulterebbe d(xj , xk ) ≥ ε. Tale successione non potrebbe ammetterre alcuna sottosuccessione
convergente, in contrasto con la compattezza sequenziale di K.
ii) Sia K totalmente limitato e completo. Consideriamo una successione xn a valori in K. Sia:
R1 un 1-reticolo finito per K, a1 ∈ R1 e x1n una sottosuccessione di xn tale che per ogni n risulti
d(x1n , a1 ) < 1 ;
R2 un 1/2-reticolo finito per K, a2 ∈ R2 e x2n una sottosuccessione di x1n tale che per ogni n
risulti d(x2n , a2 ) < 1/2 ;
...
Rk un 1/k-reticolo finito per K, ak ∈ Rk e xkn una sottosuccessione di xnk−1 tale che per ogni n
risulti d(xkn , ak ) < 1/k .
...

La successione diagonale zn = xnn è una successione di Cauchy: se n < m allora

2
d(zn , zm ) ≤ d(xnn , an ) + d(an , xm
m) ≤ ,
n
che converge ad un limite z ∈ K per la completezza di K. Pertanto K è sequenzialmente com-
patto. q.e.d.
Osservazione. Usando direttamente la compattezza di (K, d) , invece di avvalersi solo della

compattezza sequenziale, è più immediato controllare che K è totalmente limitato:
dato ε > 0, le sfere aperte Bε (x), x ∈ K, formano un ricoprimento aperto di K, dal quale è
possibile estrarre un sottoricoprimento finito Bε (x1 ), Bε (x2 ), ...Bε (xp ). Allora {x1 , x2 , ...xp } è
un 2ε-reticolo finito per K .
Teorema. Uno spazio (K, d) totalmente limitato

i) ammette un sottoinsieme denso numerabile (o come spesso si dice K è separabile) e
ii) ammette una base di aperti numerabile (o come spesso si dice è di tipo numerabile).
Dimostrazione. i) Per ogni n sia Rn = {xn1 , xn2 ...xnN (n) } un 1/n-reticolo finito per K. Allora
∪n Rn è numerabile e denso in K. Sia {zn } un sottoinsieme numerabile denso e poniamo Bn,j =
B1/j (zn ). Le Bn,j costituiscono una base numerabile per gli aperti. Infatti se A è aperto:
A = ∪Bn,j ⊆A Bn,j ,
perché se x ∈ A esiste r tale che Br (x) ⊆ A ed esistono zn , j tali che d(zn , x) < 1/j < r/2 ,
dunque Bn,j ⊆ Br (x) ⊆ A. q.e.d.
Si noti che con questo teorema, accettando l’equivalenza di compattezza numerabile e com-
pattezza sequenziale negli spazi metrici, è immediato controllare che, sempre negli spazi metrici,
la compattezza sequenziale implica la compattezza, seguendo lo schema seguente:
K sequenzialmente compatto ⇒ K totalmente limitato ⇒ K ha una base numerabile
e allora da ogni ricoprimento aperto di K se ne può estrarre uno numerabile, dal quale succes-
sivamente se ne può estrarre uno finito.
Viceversa la compattezza implica la compattezza sequenziale, perchè implica la compattezza
numerabile.
Completiamo ora la dimostrazione del teorema iniziale sull’equivalenza di compattezza, com-

pattezza numerabile e compattezza sequenziale negli spazi metrici.
È bene tener presente che le seguenti affermazioni a) e b), nelle quali X è un generico spazio
topologico, sono equivalenti.
a) Da ogni ricoprimento aperto [da ogni ricoprimento aperto numerabile] di X si puiò estrarre
un sottoricoprimento finito;
b) Ogni famiglia [ogni famiglia numerabile] di chiusi di X centrata ha intersezione non vuota,
dove centrata significa che l’intersezione di un numero finito arbitrario di elementi della famiglia

ha intersezione non vuota.
Bastano evidentemente a questo punto le proposizioni seguenti.
Proposizione. Sia (K, d) sequenzialmete compatto. Allora esso è numerabilmente compat-

to.
Dimostrazione. Sia Cn una famiglia centrata numerabile di chiusi. Sia
xn ∈ ∩n1 Ck e xnj → x .
Allora
∀N xnj ∈ CN definitivamente ⇒ x ∈ CN ⇒ x ∈ ∩∞
1 Ck = ∅ .
q.e.d.
Proposizione. Sia (K, d) numerabilmente compatto, allora esso è sequenzialmente compat-

to.
Dimostrazione. Sia xn una successione a valori in K (le xn non sono necessariamente tutte
distinte) e
Sn = {xn+1 , xn+2 , ...} , Cn = Sn .
Ovviamente ogni intersezione finita dei chiusi Cn , contenendo l’intersezione dei corrispondenti
Sn , non è vuota. Dunque la famiglia centrata Cn ha intersezione non vuota e sia x un elemento
di tale intersezione. Definiamo iterativamente nj , j = 1, 2... :
1
x ∈ Cnj ⇒ ∃y ∈ Snj d(y, x) < ,
j
e sia dunque xn+1 , nj+1 > nj + 1, tale che
1
d(xnj+1 , x) < , allora xnj → x
j
e K è sequenzialmente compatto. q.e.d.
Osservazione. La dimostrazione precedente permette di verificare immediatamente che se

(K, d) è numerabilmente compatto alora ogni suo sottoinsieme infinito ammette un punto di
accumulazione. Basta infatti considerare un sottoinsieme numerabile S e numerarlo costruendo
una successione n → xn ∈ S . Esiste allora una sottosuccessione convergente xn → x ∈ K e
ovviamente x è punto di accumulazione per S .
Peraltro l’esistenza di un punto di accumulazione per un sottoinsieme infinito implica subito,
negli spazi metrici, la compattezza sequenziale.
* * *
Rimandando al Capitolo 7 la definizione delle topologie deboli e deboli* , anticipiamo un

risultato, ottenuto attraverso i lavori di molti autori ma con il contributo essenziale di Eberlein
e Shmulyan.

Teorema. Sia X uno spazio di Banach arbitrario e K un sottoinsieme di X. Le affermazioni

seguenti sono equivalenti:
a) K è [relativamente] debolmente compatto,
b) K è [relativamente] debolmente sequenzialmente compatto,
c) K è [relativamente] debolmente numerabilmente compatto.
Osservazione. Un insieme K debolmente compatto non è in genere metrizzabile. Ad esem-

pio la sfera unitaria chiusa nello spazio di Hilbert l2 (A), con A non numerabile è debolmente
compatta, ma non metrizzabile (ponendo come al solito eα = {δαβ}β∈A , non si può trovare un
sistema fondamentale di intorni dell’origine {x | |(x, eαj )| < ε, j = 1, 2, ..N } numerabile).
Dunque il teorema stabilisce l’equivalenza dei tre tipi di compattezza in un contesto che non
rientra in quello più semplice degli spazi metrici.
Un teorema analogo non vale nel duale X ∗ di un generico spazio di Banach X, se X ∗ è

munito della topologia debole* (più debole della topologia debole).
& & &
6.3 Criterio di compattezza in C(K; F ).

Teorema (terzo teorema di Ascoli). Sia (K, d) uno spazio metrico compatto, F uno spazio
di Banach e F ⊆ C(K; F ), munito della solita norma del massimo. La famiglia F è relativa-
mente compatta (cioè ha chiusura compatta) se e solo se :
1) F è equicontinua in K ;
2) Per ogni x ∈ K l’insime F(x) = { f (x) | f ∈ F} è relativamente compatto in F .
Dimostrazione. È facile verificare che le condizioni 1) e 2) sono necessarie. Vediamo in

dettaglio che esse sono sufficienti. Per l’equicontinuità
∀ε > 0 ∀x ∈ K ∃V (x) ∀y ∈ V (x) ∀f ∈ F ||f (y) − f (x)|| ≤ ε ,
dove V (x) indica un intorno di x, che non è restrittivo supporre aperto. Essendo K compatto
possiamo trovare un numero finito di tali intorni aperti
V (x1 ), V (x2 ), ... , V (xn )
che ricoprono K. L’insieme
Y = F(x1 ) ∪ F(x2 ) ∪ ... ∪ F(xn )
è relativamente compatto in F e sia
Y ⊆ ∪M
k=1 Bε (ak ) ,
dove le ak sono un ε-reticolo (finito) per Y . Osserviamo che per ogni f ∈ F esiste una
applicazione
ϕ : {1, 2, ...n} → {1, 2, ...M }

tale che, per j = 1, 2, ...n,

||f (xj ) − aϕ(j) || < ε ,
cioè f (xj ) ∈ Bε (aϕ(j) ). Infatti f (xj ) ∈ F(xj ) ⊆ Y e dunque deve trovarsi in almeno una delle
sfere di raggio ε e centro i punti del reticolo.
Poniamo
Fϕ = { g ∈ F | ||g(xj ) − aϕ(j) || < ε } .
Per l’osservazione precedente F = ∪ϕ Fϕ e l’unione è finita (esiste solo un numero finito di
applicazioni tra due insiemi finiti). Ma ogni Fϕ ha diametro non superiore a 4ε, infatti, qualsiasi
x, se x ∈ V (xi ) allora per f, g ∈ Fϕ si ha
||f (x) − g(x)|| ≤ ||f (x) − f (xi )|| + ||f (xi ) − aϕ(i) ||+
+||aϕ(i) − g(xi )|| + ||g(xi ) − g(x)|| ≤ 4ε ,

perchè il primo e l’ultimo termine sono minori di ε per l’equicontinuità in x, mentre il secondo
e il terzo sono minori di ε per definizione di Fϕ .
Dunque F ammette un 8ε reticolo finito e dunque è relativamente compatto nello spazio metrico
C(K; F ). q.e.d.
6.4 Criteri di compattezza in Lp (Ω).

Ci limitiamo a due enunciati concernenti funzioni definite in Rn , soltanto con brevissimi cenni
agli strumenti usati per le dimostrazioni. Al solito p è un numero reale ≥ 1 e Ω un sottoinsieme
misurabile di Rn , corredato della misura di Lebesgue. Ricordiamo che con Lp (Ω) indichiamo lo
spazio di Banach delle (classi di) funzioni definite in Ω tali che

||f ||p = ( |f (x)|p dx)1/p < +∞ .
Ω
Teorema. Sia Ω limitato. Sia F una famiglia fi funzioni di Lp (Ω) tale che:
1) F è limitata in norma: supf ∈F ||f ||p < +∞,
2) per ogni ε > 0 esiste δ tale che per ogni vettore h ∈ Rn e per ogni f ∈ F risulta

||h|| < δ ⇒ ||f (· + h) − f (·)||p = ( (|f (x + h) − f (x)|p dx)1/p < ε .
Ω
Allora F è relativamente compatta.
Osservazione. La condizione 2) è essenzialmente una condizione di equicontinuità in norma

Lp . Infatti nel caso di funzioni continue in Rn l’equicontinuità (uniforme) può essere scritta
(h = y − x) come ||f (· + h) − f (·)||∞ < ε se ||h|| < δ, qualsiasi f ∈ F.
Cenno sulla dimostrazione. Si approssimano le funzioni (eventualmente prima prolungadole

con 0 all’esterno di Ω) date mediante funzioni continue (sulla chiusura di Ω) e a queste si applica
il terzo Teorema di Ascoli.

Teorema (Fréchet-Kolmogorov). Sia F una famiglia fi funzioni di Lp (Rn ) che soddisfino

le condizioni 1) e 2) (con Ω = Rn ) del Teorema precedente e inoltre siano tali che

3) ∀ε > 0 ∃M ∀a > M ∀f ∈ F |f (x)|p dx < ε .
||x||≥a
6.5 Il teorema di Peano.

Il teorema fondamentale di esistenza locale di una soluzione di un problema di Cauchy
per un sistema di equazioni differenziali ordinarie resta valido anche senza l’ipotesi di dipenden-
za Lipschitziana dalla soluzione. In tal caso però non si può garantire in generale l’unicità.
Precisamente vale il seguente
Teorema (di Peano). Sia (t0 , y0 ) ∈ R × RN ed f (t, y) una funzione continua in un intorno
di (t0 , y0 ), a valori in RN . Allora esistono T > 0 e una funzione y : I = [t0 − T, t0 + T ] → RN
tali che
y (t) = f (t, y(t)) t∈I
y(t0 ) = y0
Dimostrazione (di Tonelli). Il problema di Cauchy è equivalente all’equazione integrale

t
y(t) = y0 + f (s, y(s))ds .
t0
Per semplicità svolgiamo la dimostrazione nel caso N = 1. Non è restrittivo supporre che
l’intorno in cui f è supposta continua sia per esempio un disco chiuso D di centro (t0 , y0 ) e
raggio r > 0, quindi compatto. La funzione continua |f | è allora limitata in D e sia |f (t, y)| ≤ M
. Consideriamo un cono chiuso C definito da
C = { (t, y) | ||y − y0 || ≤ M |t − t0 | , t ∈ [t0 − T, t0 + T ] } ,
dove T è scelto in modo tale che C ⊂ D . Essendo N = 1 in effetti ||y|| = |y| e C è formato
da due triangoli. Limitiamo le considerazioni successive a valori t ≥ t0 e quindi al triangolo
∆ a destra di t0 . Per semplicità supporremo t0 = 0. Costruiamo delle approssimazioni della
soluzione dell’equazione integrale nel modo seguente: per ogni n > 0 definiamo yn mediante le
relazioni
y0 0 ≤ t ≤ Tn ,
yn (t) = t−T /n
y0 + 0 f (s, yn (s))ds t ≥ Tn .
Ogni funzione yn è ben definita: è assegnata, costante, sul primo intervallo [0, T /n] ed è calcolabi-
le sull’intervallo [kT /n, (k + 1)T /n] mediante un’integrazione che richiede soltanto la conoscenza
di yn su [0, kT /n] . Si può allora operare iterativamente sui successivi intervalli di ampiezza T /n
, controllando che il grafico di yn progressivamente ottenuto non esce dal triangolo ∆ :
t−T /n
|yn (t) − y0 | ≤ |f (s, yn (s))|ds ≤ M |t − 0| = M t
0

e quindi f (s, yn (s)) continua ad essere definita e soggetta alla condizione |f | ≤ M .

Le funzioni yn soddisfano le condizioni

1) |yn (t)| ≤ C = |y0 | + M T 0≤t≤T ,
2) |yn (t) − yn (t )| ≤ M |t − t | 0 ≤ t, t ≤ T .
Infatti la condizione 1) è già stata verificata in fase di costruzione delle yn e la 2) risulta subito
dalle maggiorazioni
t −T /n
|yn (t) − yn (t )| ≤ |f (s, yn (s))|ds ≤ M (t − t) ,
t−T /n
se t ≥ t ≥ T /n. Per t o t o entrambi in [0, T /n] la 2) si verifica immediatamente.

Dunque le funzioni yn sono Lipschitziane con una stessa costante di Lipschitz e pertanto equi-
continue nel compatto [0, T ]. Inoltre sono limitate in valore assoluto da una stessa costante
C (perfino indipendente da t) e costituiscono quindi una, in virtù del terzo teorema di Ascoli,
un insieme relativamente compatto in C([0, T ]; R) . Sia allora ynk una sottosuccessione unifor-
memente convergente alla funzione, necessariamente continua, y. Risulta y(0) = y0 (per ogni
n yn (0) = y0 ) e per t > 0
t t
y(t) = lim ynk (t) = lim y0 + f (s, ynk (s))ds − f (s, ynk (s))ds .
k k 0 t−T /nk
Essendo l’ultimo integrale maggiorato da M T /nk → 0 per k → +∞ si ha finalmente

t
y(t) = y0 + f (s, y(s))ds ,
0
perchè f (s, ynk (s)) → f (s, y(s)) uniformemente per la continuità uniforme di f sul compatto ∆.
q.e.d.
Osservazione. Si osservi che il fatto che l’unicità della soluzione del problema di Cauchy
non sia garantita è coerente con la possibilità che diverse sottosuccessioni convergenti abbiano
funzioni limite diverse, tutte soluzione del problema.

Capitolo 7
I teoremi fondamentali
dell’Analisi funzionale
7.1 Premesse: Spazi di Baire

In questa sezione dimostriamo un risultato essenziale sul quale poggia la maggior parte dei
teoremi fondamentali dell’Analisi funzionale.
Definizione. Un sottoinsieme A di uno spazio topologico X è raro se e solo se l’interno

della chiusura di A è vuoto, o equivalentemente se il complementare della chiusura di A è denso
in X :
◦
A= ∅ , (A)c = X .
Definizione. Un sottoinsieme A di uno spazio topologico è magro se e solo se A è unione

numerabile (eventualmente finita) di insiemi rari.
Gli insiemi che si possono rappresentare come unione numerabile di insiemi rari, cioè gli
insiemi magri, si dicono anche insiemi di prima categoria. Gli insiemi che non sono di prima
categoria si dicono di seconda categoria.
Esempi.
1) Sia S = { 1, 1/2, 1/3, ... }, munito della distanza d(s, t) = |s − t| indotta da R. Per ogni
s ∈ S, { s } è chiuso (se t = s e r = |t − s|/2, si ha Br (t) ∩ { s } = ∅) e aperto (esiste r tale che
Br (s) = { s }) non vuoto. Dunque { s } non è raro. Ogni sottoinsieme chiuso contiene un { s }
e dunque S non è magro.
2) Sia Q, munito della metrica usuale. Se r ∈ Q, allora { r } è chiuso ed ha interno vuoto.
Dunque { r } è raro e Q è magro. Si osservi che, in R, Q è magro, ma non raro: Q = R e il
suo interno non è vuoto.
3) Una superficie regolare Σ di dimensione ≤ n−1 in Rn (ad esempio una superficie di equazione
f (x1 , x2 , ..., xn ) = 0, con f regolare) è un insieme raro in Rn . Cosı́ l’insieme S delle matrici
109
110 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale
2
quadrate A, n × n, singolari, pensate come elementi di Rn , è un insieme raro (è caratterizzato
dalla relazione algebrica tra i coefficienti det A = 0).
Definizione. Uno spazio topologico X si dice spazio di Baire se e solo è soddisfatta una
delle seguenti condizioni equivalenti:
a) ogni successione Cn di chiusi con interno vuoto ha un’unione ∪n Cn ancora con interno vuoto,
dunque ogni sottoinsieme magro è privo di punti interni ( v. punto c) );
b) ogni successione di aperti An densi in X ha un’intersezione ∩n An ancora densa in X
(il complementare di An è un chiuso Cn privo di punti interni);
c) ogni aperto non vuoto di X non è magro
(se un aperto A fosse unione numerabile insiemi rari Rk , si avrebbe Rk chiuso con interno vuoto
e, per a), ∪k Rk dovrebbe avere interno ancora vuoto e non potrebbe contenere A; viceversa,
se al punto a) si avesse (∪n Cn )◦ = A = ∅, allora l’aperto A sarebbe unione numerabile degli
insiemi rari A ∩ Cn ).
Si può dimostrare che ogni spazio localmente compatto ed ogni spazio metrico completo sono
spazi di Baire. Vediamo la dimostrazione nel caso degli spazi metrici.
Teorema (di Baire). Sia (X, d) uno spazio metrico completo. Allora X è uno spazio di Baire.
Dimostrazione. Siano An aperti densi in X , A = ∩n An ed U un qualunque aperto non vuoto.

Basta dimostrare che A ∩ U = ∅ .
Sia B0 = Br0 (x0 ) tale che B0 ⊂ U . Essendo A1 denso, l’aperto U1 = B0 ∩ A1 risulta non vuoto.
Sia B1 = Br1 (x1 ) tale che B1 ⊂ U1 e r1 < r0 /2 . Essendo A2 denso, l’aperto U2 = B1 ∩ A2
risulta non vuoto.
...
Sia Bk = Brk (xk ) tale che Bk ⊂ Uk e rk < rk−1 /2 . Essendo Ak+1 denso, l’aperto Uk+1 =
Bk ∩ Ak+1 risulta non vuoto.
...
Le sfere Bk sono incapsulate e di raggio tendente a zero, dunque i loro centri costituiscono una
successione di Cauchy. Per la completezza di (X, d) esiste y = limn xn .
Per ogni p ≥ 0 si ha xn+p ∈ Bn e quindi per ogni n si ha y ∈ Bn ⊂ B0 ∩ An , dunque y ∈ U ∩ A.
q.e.d.
In uno spazio di Baire X una proposizione P (x) è genericamente vera se essa vale per tutti
i punti di X tranne quelli di un insieme magro, ovvero se esiste un insieme E ⊆ X intersezione
numerabile di aperti denso, o come si dice se esiste un insieme Gδ , denso, tale che P (x) è vera
per ogni x ∈ E. Si dice anche che P (x) è vera B-quasi ovunque (B per Baire).
Si osservi che, se lo spazio topologico X ha anche una struttuta di spazio misurabile, con
misura µ , le affermazioni “P(x) vale µ-q.o. e “P(x) vale B-q.o. non hanno in generale alcuna
relazione tra di loro.
Si consideri ad esempio in [0, 1] , munito della usuale misura di Lebesgue, un sottoinsieme

numerabile denso (eventualmente i razionali dell’intervallo) E = {r0 , r1 , r2 ...} . Sia
1/n 1/n
A = ∩+∞
n=1 An , An = ∪k ]rk − , rk + k [ .
2k 2
La misura di Lebesgue dell’aperto denso An è ≤ 4/n e quindi l’insieme A è un Gδ , denso, di

misura di Lebesgue 0 . Mentre il complementare C = Ac = ∪n Acn è magro ma ha misura di
Lebesgue 1.
Teorema di Baire sui limiti di funzioni continue. Sia T uno spazio topologico, fn una
successione di funzioni da T in R ovunque continue e convergenti in ogni punto di t ∈ T ad un
limite f (t). Allora f è continua B-quasi ovunque (cioè l’insieme dei punti di T dove f non è
continua è magro).
Dimostrazione. Poniamo:
◦
Ank = {t ∈ T | |fk (t) − f (t)| ≤ 1/n} , B n = ∪k Ank , C = ∩n B n .
Verifichiamo che C è esattamente l’insieme dei punti di continuità di f .
1) Sia t ∈ C: indicando con V (t), W (t)... intorni di t, abbiamo che per ogni n
∃k∃V (t)∀z ∈ V (t) |fk (z) − f (z)| ≤ 1/n ,
per la continuità di fk ∃W (t)∀z ∈ W (t) |fk (z) − fk (t)| ≤ 1/n, dunque
∀z ∈ V (t) ∩ W (t) |f (z) − f (t)| ≤ |f (z) − fk (z)| + |fk (z) − fk (t)| + |fk (t) − f (t)| ≤ 3/n
e f risulta continua in t.
2) Sia f continua in t, poiché fj (t) → f (t): ∀n∃k |fk (t) − f (t)| ≤ 1/3n. Inoltre per la
continuità di f e fk in t esiste U (t) tale che per ogni z ∈ U (t) si ha |f (z) − f (t)|, |fk (z) − fk (t)| ≤
1/3n. Allora
∀n∃k∃U (t)∀z ∈ U (t)|fk (t) − f (t)| ≤ 1/n ,
cioè t ∈ C.
Poniamo ora Fkn = {t ∈ T | ∀p |fk (t) − fk+p (t)| ≤ 1/n} ⊆ Ank . Visto che le fk sono continue
e che l’intersezione di chiusi è un chiuso, Fkn è chiuso.
Ma, poiché fj (t) → f (t) ovunque, si ha T = ∪+∞ n
k=1 Fk . Allora
◦ ◦ ◦ ◦
Fkn ⊆ Ank , ∪k Fkn ⊆ B n , T − B n ⊆ ∪k (Fkn − Fkn ) .
◦
Per la chiusura di Fkn gli insiemi (Fkn − Fkn ) sono rari e T − B n come T − C = ∪n (T − B n ) è
magro. q.e.d.

7.2 Il teorema di uniforme limitatezza

Ci limiteremo a considerare operatori limitati tra spazi di Banach, anche se per alcuni risultati
sono possibili ipotesi più generali.
Teorema di uniforme limitatezza (di Banach-Steinhaus). Siano E ed F due spazi di

Banach e {Tα | α ∈ A} , con A insieme arbitrario di indici, una famiglia di operatori lineari tale
che
1) ∀α ∈ A Tα ∈ L(E, F ) ,
2) ∀x ∈ E supα∈A ||Tα x||F < +∞ .
Allora gli operatori Tα sono uniformemente limitati in norma:
sup ||Tα ||L(E,F ) < +∞ .
α∈A
Dimostrazione. Per ogni intero n sia

Cn = { x ∈ E | sup ||Tα x|| ≤ n } .
α
Per la continuità di Tα e della norma l’insieme Cnα = { x ∈ E | ||Tα x|| ≤ n } è chiuso e dunque
Cn = ∩α Cnα è chiuso. Per l’ipotesi 2) ogni x ∈ E appartiene a qualche Cn , dunque E = ∪n Cn .
Lo spazio E è di Banach, dunque metrico completo e dunque di Baire, cioè non può essere unione
numerabile di chiusi a interno vuoto. Sia CN provvisto di punti interni e sia Br (u) ⊂ CN . Allora
∀α ∈ A e ∀v tale che ||v|| < 1 risulta ||Tα (u + rv)|| ≤ N ,
ma ||Tα (rv)|| − ||Tα u|| ≤ ||Tα (u + rv)|| ≤ N e quindi
r||Tα ||L(E,F ) = r sup ||Tα v|| ≤ N + ||Tα u|| ≤ 2N .
||v||<1 , v=0
q.e.d.
Corollario. Siano E ed F spazi di Banach. Sia Tn ∈ L(E, F ) una successione di operatori

convergenti fortemente in E , cioè tali che
∀x ∈ E lim Tn x = T x .
n→+∞
Allora supn ||Tn || < +∞ e

T ∈ L(E, F ) con ||T || ≤ lim inf ||Tn || .
n
Dimostrazione. La convergenza puntuale ovunque degli operatori Tn implica la limitazione per

ogni x ∈ E della successione ||Tn x|| . Applicando il teorema di uniforme limitatezza si ha dunque
C = supn ||Tn || < +∞ e pertanto, qualunque sia x ∈ E
||T x|| = lim ||Tn x|| ≤ lim inf ||Tn || ||x|| ≤ C||x|| .
n n
Allora T , che ovviamente è lineare, risulta limitato e vale la maggiorazione della sua norma
prevista dalla tesi del corollario. q.e.d.

7.3 Spazi duali. Topologie deboli

In generale si dice duale topologico di uno spazio vettoriale topologico (s.v.t.) E lo spazio
E ∗ costituito dai funzionali lineari e continui f da E in K, dove K = C oppure K = R. In E ∗
si possono introdurre varie topologie naturali, ad esempio quella della convergenza semplice in
E, detta topologia debole*, che considereremo nei prossimi paragrafi.
Se E è uno spazio normato sul campo K il duale topologico ha la struttura di uno spazio di
Banach
E ∗ = L(E, K) ,
dove in L si considera la norma indotta da quella di E: ||f ||E ∗ = sup||x||=1 |f (x)|.
(Il duale E ∗ è un sottospazio del duale algebrico E , costituito da tutte le applicazioni lineari,
non necessariamente continue, da E in K. Molti autori indicano il duale topologico con E ed
il duale algebrico con E ∗ ).
È talvolta possibile fornire rappresentazioni significative del duale di uno spazio di Banach.
Ad esempio si dimostra che il duale topologico di Lp (X, A, µ; R), dove µ è una misura finita o
σ-finita e p > 1, è isomorfo a Lq (X, A, µ; R), dove q è l’esponente coniugato di p : 1/p + 1/q = 1,
nel senso che ogni funzionale G lineare e continuo è della forma

G(f ) = f (x)g(x)dµ(x)
X
con g ∈ L .
q
Il duale E ∗∗ del duale E ∗ , cioè il biduale, nel caso di Lp si può identificare con Lp stesso e,
come si dice, lo spazio Lp è riflessivo.
Il duale di L1 è isomorfo a L∞ , ma in questo caso L1 si può identificare soltanto con un

sottospazio proprio del duale di L∞ . Si dimostra (Yosida) che L∞ (X, A, µ; R)∗ si può identifi-
care allo spazio delle misure definite su A, finitamente additive, a variazione totale limitata
e µ-assolutamente continue.
Gli spazi lp sono casi particolari degli spazi Lp ora considerati e quindi il duale di lp è iso-
morfo ad lq , con p > 1 e q esponente coniugato di p.
Per p = 2 si ha che L2 è isomorfo al proprio duale, e ciò in accordo con il fatto che L2 ha una
struttura Hilbertiana e per gli spazi di Hilbert vale il teorema di rappresentazione di Riesz.
Osservazione. Nel caso particolare dei funzionali lineari e continui si usa una terminologia
per la convergenza in norma e puntuale ovunque, diversa rispetto a quella adottata per operatori
lineari e continui generali.
Definizione. La convergenza in norma si dice convergenza forte e quella puntuale ovunque

convergenza debole*. Dunque diremo che una successione fn ∈ E ∗ converge debole* al
funzionale limite f ∈ E ∗ se e solo se
∀x ∈ E lim fn (x) = f (x) .
n

Si può anche valutare una successione xn ∈ E mediante un arbitrario elemento f di E ∗ ,

ottenendo una successione numerica: se esiste x ∈ E tale che
∀f ∈ E ∗ f (xn ) → f (x) ,
allora si dice che xn converge debolmente ad x.
Osservazione. Più in generale si dice che xn convege debolmente se per ogni f ∈ E ∗ la

successione f (xn ) ammette limite. Se il limite si può sempre rappresentare come f (x) con lo
stesso x ∈ E allora xn converge debolmente a x.
Se ogni successione xn debolmente convergente converge debolmente ad un limite x si dice che
E è sequenzialmente debolmente completo.
Analogamente si dice che fn ∈ E ∗ converge debole* se per ogni x ∈ E fn (x) converge. Se
ogni successione convergente debole* converge debolmente* ad un limite f ∈ E ∗ si dice che E ∗ è
sequenzialmente debole* completo. Nel caso che E sia uno spazio di Banach, per il teorema
di uniforme limitatezza, si vede immediatamente che E ∗ è sequenzialmente debole* completo.
Dall’affermazione precedente segue che tutti gli spazi di Banach riflessivi sono sequenzialmente
debolmente completi.
Naturalmente anche in E ∗ si possono considerare successioni convergenti debolmente, facen-

do intervenire il duale di E ∗ : se esiste f ∈ E ∗ tale che per ogni F ∈ E ∗∗ si ha F (fn ) → F (f ),
allora fn converge debolmente a f .
La convergenza debole in E ∗ implica la convergenza debole*, perché l’applicazione

f ∈ E ∗ → Fx (f ) = f (x) , x ∈ E ,
è un elemento del biduale: |Fx (f )| ≤ ||x||E ||f ||E ∗ e ||Fx ||E ∗∗ ≤ ||x||E . In effetti si può dimostra-
re il teorema seguente
Teorema. Ogni spazio normato E è isometrico ad un sottospazio, in genere proprio, di E ∗∗ .

Dimostrazione. Il Corollario 2 del successivo Teorema di Hahn-Bnach garantisce l’esistenza,
dato x ∈ E, di f ∈ E ∗ tale che ||f ||E ∗ = 1 e f (x) = ||x||E . Dunque
|Fx (f )| = |f (x)| = ||x||E .
Allora ||Fx ||E ∗ ∗ = ||x||E . q.e.d.
Nel caso degli spazi riflessivi ovviamente la convergenza debole e quella debole* coincidono.
Non sempre in uno spazio di Banach la convergenza debole è strettamente più debole di quel-
la forte, cioè della convergenza in norma. Ovviamente esse coincidono in spazi di dimensione
finita, ma ad esempio anche in l1 xn → x fortemente se e solo se xn → x debolmente.
Talvolta la convergenza debole coadiuvata da qualche informazione supplementare implica

la convergenza forte. Ad esempio, come si è già visto al Capitolo 4, in uno spazio di Hilbert, se
fn → f debolmente e ||fn || → ||f ||, allora ||fn − f || → 0:
||fn − f ||2 = ||fn ||2 + ||f ||2 − 2(fn , f ) → 0 ,

perché g → (g, f ) è un funzionale lineare e continuo e dunque (fn , f ) → ||f ||2 .
Si indica con < x, f > il valore di f in x: < x, f >= f (x), x ∈ E, f ∈ E ∗ .
Le convergenze deboli e deboli* sono indotte da corrispondenti topologie, che, come si vede
direttamente dalla definizione, rendono gli spazi E o E ∗ locammente convessi.
Definizione. Sia E uno s.v.t. La topologia debole* (weak*, faible σ(E ∗ , E)) su E ∗ è la
topologia che ammette come sistema fondamentale di intorni di ogni g ∈ E ∗ gli insiemi
V (x1 , x2 , ...xN ; ε)(g) = {f ∈ E ∗ | | < xk , f − g > | < ε, k = 1, 2...N } ,
dove N è un intero arbitrario, x1 , x2 ...xN sono elementi di E e ε > 0.
Osservazione. È immediato verificare che E ∗ munito della topologia debole* è uno spazio
vettoriali topologico, cioè le operazioni di somma e di prodotto per uno scalare sono continue.
Gli intorni di ogni elemento g si ottengono come traslazioni degli intorni di 0. Dunque basta più
semplicemente indicare come sistema fondamentale di intorni di 0 gli insiemi
V (x1 , x2 , ...XN ; ε) = {f ∈ E ∗ | sup | < xk , f > | < ε} .
1≤k≤N
Analogamente
Definizione. Sia E uno s.v.t. La topologia debole (weak, affaiblie σ(E, E ∗ )) su E è la
topologia che ammette come sistema fondamentale di intorni di ogni y ∈ E gli insiemi
V (f1 , f2 , ...fN ; ε) = {x ∈ E | | < x − y, fk > | < ε, k = 1, 2...N } ,
dove N è un intero arbitrario, f1 , f2 ...fN sono elementi di E ∗ e ε > 0.
Osservazione. In E ∗ si possono considerare sia la topologia debole* (σ(E ∗ , E)) che la topo-
logia debole (σ(E ∗ , E ∗∗, )), più forte della prima, essendo E ⊆ E ∗∗ , o meglio E isomorfo ad un
sottospazio di E ∗∗ .
La topologia debole (o debole*) non è in genere metrizzabile e non è disponibile un sistema

fondamentale numerabile di intorni di un punto. Occorre dunque grande cautela nel lavorare
con successioni e non accettarne proprietà usuali in contesti elementari, senza attento esame.
Il seguente esempio è illuminante, anche percé l2 è uno dei più semplici spazi normati di dimen-
sione infinita che conserva molte proprietà degli spazi Euclidei che ci sembrano naturali.
Esempio (von Neumann). Una successione di l2 (N) che ammette 0 quale punto limite,
ma tale che nessuna sua sottosuccessione è convergente a 0: siano p e q > p due interi positivi
e xpq = (0, 0...1, ...p, 0...) la successione (ovviamente in l2 e di norma (1 + p2 )1/2 ) con tutte le
componenti nulle, tranne la p-esima uguale a 1 e la q-esima uguale a p (xpq p = 1, x

pq
q = p).
Infatti, ricordando che l2 , insieme di tutte le successioni a valori reali zk tali che k zk2 < +∞,
è uno spazio di Hilbert isomorfo al suo duale (Teorema di Riesz) e quindi riflessivo, si ha
1) Date f j ∈ l2 , j = 1, ...N arbitrarie e ε > 0
| < xpq , f j > | = |(xpq , f j )| = |fpj + pfqj | ≤ |fpj | + p|fqj | < ε

per p sufficientemente grande perché maxj |fpj | < ε/2 e q ulteriormente sufficientemente gran-
de affinché maxj |fqj | < ε/2p. Dunque in ogni intorno V (f 1 , f 2 ...f N ; ε) di 0 esiste almeno un
elemento xpq della successione e 0 è un suo punto di accumulazione (0 non è un elemento della
successione).
2) I punti del tipo ep∗ = (0, 0, 0, ...1, 0...), con 1 è in posizione p∗ , sono altri punti limite. Infatti
∗
la sottosuccessione xp q per q → +∞ converge debolmente a ep∗ . Si osservi che per p → +∞ si
ha en → 0.
3) Qualunque sottosuccessione non converge a 0. Sia X n = xpn qn una sottosuccessione conver-
gente. Se pn ≤ P per ogni n allora, presa g = (1, 1...1, 0, 0...) con esattamente P componenti
1 nelle prime posizioni, si ha (X n , g) ≥ 1 e X n non converge a 0. Se invece vi sono infiniti
indici pn distinti, diciamo nelle posizioni pν , potendo supporre, eventualmento effettuando una
ulteriore selezione, che anche le qν siano distinte tra di loro e crescenti,prendiamo g tale che
gqν = 1/pν e gj = 0 per j = qν . Abbiamo allora g ∈ l2 e (X ν , g) ≥ 1 e come prima non vi può
essere convergenza a 0.
L’esempio è completamente giustificato.
Consideriamo qualche caso, connesso a questioni che hanno in modo autonomo un grande
interesse, di convergenza forte o debole*.
1) Regolarizzazione. Sia ε > 0 un parametro destinato a tendere a 0 . Non è restrittivo

limitarsi ad una successione di valori ε → 0 . Sia Ω un a.perto limitato di Rn . Diremo
successione regolarizzante una successione di funzioni αε ∈ C0∞ (Ω) , cioè infinitamente derivabili
e a supporto compatto contenuto in Ω , tali che

αε ≥ 0 , supp αε ⊆ Bε (0) , αε (x)dx = 1 .
Rn
Ricordiamo che il supporto di una funzione è la chiusura dell’insieme dei punti nei quali non si
annulla.
Ad esempio si può prendere αε = ρε , dove

c exp(|x|2 − 1)−1 |x| < 1 ,
ρ(x) =
0 |x| ≥ 1 ,

con c = 1/ exp(|x|2 − 1)−1 dx , e ρε (x) = ρ(x/ε)/εn .
Proposizione. Per f ∈ Lp (Ω) , consideriamo il prolungamento di f a 0 fuori di Ω , che

continuiamo ad indicare con f , e poniamo
fε (x) = Tε f (x) = (f ∗ αε )(x) =

= f (x − t)αε (t)dt = f (t)αε (x − t)dt .
Rn Rn
L’operazione ∗ si dice convoluzione tra le due funzioni (in questo caso f e αε ). Gli operatori
Tε sono lineari e continui da Lp (Ω) in sé stesso e convergono fortemente all’identità I :
lim ||Tε f − f ||p = 0 .

ε→0

La funzione fε ∈ C ∞ (Ω) .
Gli operatori Tε , in quanto operatori integrali con nucleo regolare, sono compatti e quindi non
possono convergere in norma ad I, che non è compatto, non essendo Lp di dimensione finita.
Approssimando prima f con funzioni in Lp a supporto compatto in Ω , ad esempio ponendo
gn (x) = f (x)χKn (x) ,
con Kn compatto contenuto in Ω , Kn ⊆ Kn+1 e ∪n Kn = Ω (successione crescente esaustiva di

compatti), e quindi regolarizzando le gn , si ottiene una successione di funzioni C0∞ (Ω) conver-
gente in Lp ad f . Quindi C0∞ (Ω) è denso in Lp (Ω).
Omettiamo la dimostrazione.
2) Sia E = L1 (a, b), con la misura standard di Lebesgue dx. Siano α e β due costanti reali
diverse e, per ogni n ≥ 1 , posto xnk = a + nk (b − a) , si considerino le funzioni limitate

α xnk ≤ x < xnk + θ(b−a) n ,
gn (x) =
β xnk + θ(b−a)n ≤ x < xn
k+1 ,
dove 0 < θ < 1 . Dunque l’intervallo (a, b) è suddiviso in n intervallini di eguale ampiezza,
ciascuno dei quali è a sua volta diviso in due intervallini consecutivi di ampiezza proporzionale
rispettivamente a θ e 1 − θ , sui quali gn è costante, rispettivamente uguale prima ad α e poi β
(gn è periodica di periodo (b − a)/n).
Poniamo b
Gn (f ) = f (x)gn (x)dx .
a
Il funzionale Gn ∈ (L1 )∗ ∼ L∞ ed è infatti rappresentato dalla funzione gn ∈ L∞ . Risulta

b
Gn (f ) → G(f ) = f (x)g(x)dx , g(x) = θα + (1 − θ)β ,
a
come si verifica facilmente, prima considerando funzioni f continue o costanti a tratti e poi
ragionando per densità. Dunque gn → g , o più precisamente Gn → G debole*. Tuttavia non
si ha convergenza in norma. Sia infatti fn uguale a 1 o 0 sugli stessi intervalli parziali di gn ,
allora
b−a
||fn || = n θ = θ(b − a)
n
e fn è limitata, ma
b
||gn − g||∞ ||fn || ≥ | (gn (x) − g(x))fn (x)dx| = θ(1 − θ)|α − β|(b − a)
a
non tende a 0.
7.4 I teoremi dell’applicazione aperta e del grafico chiuso

In questa sezione dimostriamo il teorema dell’applicazione aperta ed alcuni suoi corollari, tra
i quali il teorema del grafico chiuso, che, con il teorema di uniforme limitatezza e il teorema di

Hahn-Banach, sono considerati i teoremi fondamentali dell’analisi funzionale.
Teorema dell’applicazione aperta (di Banach). Siano E ed F spazi di Banach e

T ∈ L(E, F ) un operatore suriettivo . Allora T è un’applicazione aperta, cioè se A è un aperto
di E risulta T (A) aperto in F .
Dimostrazione. Essendo E ed F spazi normati e T lineare, è sufficiente dimostrare che esiste
r > 0 tale che
T (B1 (0)) ⊇ Br (0) ,
dove Bρ (x) indica, come al solito, la sfera aperta di raggio ρ e centro x nello spazio metrico
considerato. (Nella relazione precednte B1 (0) è in E , mentre Br (0) in F ). Infatti in tal caso,
se x0 ∈ A e Bρ (x0 ) ⊂ A , allora
T (A) ⊇ T (Bρ (x)) = T (x0 + ρB1 (0)) = T x0 + ρT (B1 (0)) ⊇ Bρr (T x0 ) .
In primo luogo vediamo che esiste r > 0 tale che
C = T (B1 (0)) ⊇ B2r (0) .
Osserviamo che C è chiuso, per definizione, convesso, per la convessità di B1 (0) e la linearità di
T e tale che C = −C. Sia Cn = nC = T (Bn (0)) , allora per a suriettività di T si ha F = ∪n Cn .
Ma F è uno spazio di Banach, dunque metrico completo e dunque di Baire. Pertanto esiste p
tale che Cp ha interno non vuoto e di conseguenza C ha interno non vuoto. Siano allora y ∈ C
e r > 0 tali che B4r (y) ⊂ C . Poiché −y ∈ −C = C , si trova
B4r (0) = B4r (y) − y ⊆ C + C = 2C .
L’ultima uguaglianza dipende dal fatto che u, v ∈ C implica (u + v)/2 ∈ C, cioè u + v ∈ 2C

. Dividendo per 2 abbiamo allora l’inclusione B2r ⊆ C = T (B1 (0)) che volevamo ottenere.
Osserviamo che si può esplicitare il risultato ottenuto dicendo che
∀y ∈ F ||y|| < 2r ⇒ ∀ε > 0 ∃x ∈ E ||x|| < 1 e ||y − T x|| < ε .
Se ne deduce che
r 1
∀y ∈ F ||y|| < ⇒ ∀ε > 0 ∃x ∈ E ||x|| < e ||y − T x|| < ε .
2n−1 2n
Infatti, se ||y|| < r/2n−1 , ||2n y|| < 2r ed esiste x∗ tale che ||x∗ || < 1 e ||2n y − T x∗ || < 2n ε .
Allora possiamo prendere x = x∗ /2n .
In secondo luogo verifichiamo che, con lo stesso r precedente, si ha effettivamente Br (0) ⊆
T (B1 (0)). Sia y un generico elemento di Br (0), cioè ||y|| < r. Ricorriamo all’ultima osservazione
per trovare, preso ε = r/2 , x1 tale che
1 r
||x1 || < e ||y − T x1 || < .
2 2
Poi, preso ε = r/22 , x2 tale che
1 r
||x2 || < e ||(y − T x1 ) − T x2 || < 2 .
22 2

In generale, preso ε = r/2n , troviamo xn tale che
1 n
r
||xn || < n
e ||y − T ( xk )|| < n .
2 1
2
+∞
Essendo E uno spazio di Banach, dunque completo, la serie 1 xk è convergente ad un
elemento x ∈ E tale che
||x|| < 1 e risulta y − T x = 0
per la contiuità di T . q.e.d.
Corollario 1. Siano E ed F due spazi di Banach e T ∈ L(E, F ) suriettivo. Esiste una

costante C tale che per ogni y ∈ F esiste x ∈ E
y = Tx e ||x|| ≤ C||y||.
Dimostrazione. Nella dimostrazione del teorema precedente si è visto che esiste r tale che per
ogni y ∗ ∈ F , con ||y ∗ || < r, esiste x∗ ∈ E tale che ||x∗ || < 1|| e y ∗ = T x∗ . Sia C tale che Cr > 1,
allora, dato y ∈ F e posto y∗ = y/(C||y||), si ha ||y ∗ || = 1/C < r. Dunque se ||x∗ || < 1|| e
y ∗ = T x∗ , posto x = C||y||x∗ , risulta T x = y e ||x|| ≤ C||y||. q.e.d.
Corollario 2. Siano E ed F due spazi di Banach. Sia T ∈ L(E, F ) bijettivo. Allora si ha

T −1 ∈ L(F, E) .
Dimostrazione. T −1 esiste ed è ovviamente lineare. Se A è un aperto arbitrario di E , allora
(T −1 )−1 (A) = T (A) . Ma per il teorema dell’applicazione aperta T (A) è aperto in F . Dunque
T −1 è continuo. q.e.d.
Corollario 3. Siano || · ||1 e || · ||2 due norme nello spazio lineare E , rispetto a ciascuna
delle quali E risulta di Banach. Se esiste una costante C1 tale che
∀x ∈ E ||x||2 ≤ C1 ||x||1 ,
allora esiste una costante C2 tale che
∀x ∈ E ||x||1 ≤ C2 ||x||2 ,
ovvero le due norme sono equivalenti.
Dimostrazione. Se indichiamo con E1 ed E2 gli spazi di Banach ottenuti munendo E rispetti-
vamente delle norme || · ||1 e || · ||2 e consideriamo l’operatore identico I da E1 in E2 , la prima
disuguaglianza dice che I ∈ L(E1 , E2 ) . Essendo I = I −1 , per il corollario 1 si ha I ∈ L(E2 , E1 )
e quindi deve valere la secoda disuguaglianza con una opportona costante C2 . q.e.d.
Consideriamo ora opertatori lineari tra due spazi di Banach E ed F , non necessariamente
ovunque definiti e non necessariamente continui. Indicheremo con D(T ) il dominio di definizione
dell’operatore T . D(T ) è un sottospazio vettoriale di E .
Definizione. L’operatore T si dice chiuso se e solo se per ogni successione xn ∈ D(T )

lim xn = x e lim T xn = y ⇒ x ∈ D(T ) e y = T x .
n n

È equivalente affermare che il grafico G(T ) di T è un sottospazio lineare chiuso dello spazio
prodotto E × F .
Esempio di operatore chiuso, ma non continuo.

Siano E = F = C([a, b]) e T = Dx , operatore di derivazione rispetto alla variabile reale x. T
non è ovunque definito. Infatti
D(T ) = C 1 ([a, b]) ,
sottospazio proprio delle funzioni continue con derivata prima continua. T non è continuo, per-
ché fn ∈ D(T ) e fn → f uniformemente non implicano né f ∈ D(T ), né, qualora f esista,
fn → f uniformemente. Si considerino i seguenti controesempi:
a1) f continua in [a, b] , ma non derivabile ovunque. Per il teorema di Weierstrass esiste una
successioni di polinomi pn uniformemente convergenti ad f . Mentre pn ∈ D(T ) , non si ha
f ∈ D(T ) ;
a2) Sia fn (x) = |x|1+1/n . Si ha fn ∈ C 1 ([−1, 1]) e fn (x) → |x| uniformemente in [−1, 1] (perché
le fn convergono puntualmente in modo monotono ad una funzione continua). Ma |x| non è
derivabile nell’origine;
b1) Sia fn (x) = (sin(nx))/n in [0, 2π] . Allora fn → f ≡ 0 uniformemente, ma fn (x) = cos(nx)
non converge, neppure semplicemente, a f ≡ 0 ;
b2) Sia fn , n = 2, 3, ... continua in [0, 1] , nulla in [0, 1/(n + 1)] e in [1/(n − 1), 1] , lineare
[1/(n+1), 1/n] e in [1/n, 1/(n−1)], tale che fn (1/n) = 1 . Se fn (0) = 0, allora |fn | ≤ 1/(n2 −1) e
dunque fn → f ≡ 0 uniformemente, mentre fn → f ≡ 0 semplicemente ma non uniformemente.
Teorema del grafico chiuso. Siano E ed F due spazi di Banach e T un operatore lineare
da E in F chiuso e ovunque definito. Allora T ∈ L(E, F ).
Dimostrazione. Consideriamo in E , oltre alla norma || · ||E iniziale, anche la norma
||x||G = ||x||E + ||T x||F ,
detta norma del grafico. Se xn è una successione di Cauchy per la norma del grafico, allora xn e
T xn sono successioni di Cauchy per le norme || · ||E e || · ||F . Per la completezza di E ed F si ha
xn → x ∈ E , T x n → y ∈ F ,
e, per la chiusura di T , y = T x . Dunque ||xn − x||G → 0 e lo spazio E munito della norma del
grafico, che indicheremo con EG , risulta uno spazio di Banach. Inoltre, essendo ||x||E ≤ ||x||G ,
per il precedente corollario 2 esiste una costante C tale che
||x||G ≤ C||x||E dunque ||T x||F ≤ C||x||E .
Pertanto T è limitato. q.e.d.

Osservazione. È facile dimostrare che una funzione continua f (non necessariamente lineare)
tra due spazi topologici separati ha grafico chiuso. In generale, anche per funzioni reali di va-
riabile reale, la chiusura del grafico non garantisce invece la continuità (f (x) = 1/x per x = 0 e
f (0) = 0).

7.5 Il teorema di Hahn-Banach

Vediamo la “forma analitica del teorema di Hahn-Banach, sia nel caso reale che in quello
complesso, e poi consideriamo alcune conseguenze fondamentali del teorema, concernenti l’esi-
stenza di funzionali lineari continui non banali. Esiste anche una “forma geometrica del teorema
di Hahn-Banach, concernente la separazione di insiemi convessi, per la quale rimandiamo a testi
generali di analisi funzionale o a testi specifici di analisi convessa.
Ricordiamo la
Definizione. sia E uno spazio lineare, sul campo K ( R oppure C ). Una funzione p(x)
definita su E a valori reali si dice seminorma su E, se e solo se
1) p(x) ≥ 0 ∀x ∈ E ,
2) p(x + y) ≤ p(x) + p(y) ∀(x, y) ∈ E × E,
3) p(λx) = |λ|p(x) ∀(x, λ) ∈ E × K .
Teorema di Hahn-Banach. Sia p una seminorma sullo spazio lineare reale E . Sia L un
sottospazio lineare di E ed f una funzione lineare su L, tale che
∀x ∈ L f (x) ≤ p(x) .
Allora esiste una funzione lineare F su E che prolunga f , maggiorata ovunque da p :
∀x ∈ L F (x) = f (x) , ∀x ∈ E F (x) ≤ p(x) .
Osservazione. Non è necessario che p sia una seminorma. Basta che che soddisfi la condizione
2) nella definizione di seminorma (subadditività) e la condizione 3) solo per λ ≥ 0 (positiva
omogeneità).
Dimostrazione. Siano L = E , z ∈ E − L ed M il sottospazio generato da L e z.
M = { y = x + tz | x ∈ L , t ∈ R } .
Estendiamo f a M ponendo
F (x + tz) = f (x) + tc
e scegliendo la costante c = F (z) in modo che sia sempre F (y) ≤ p(y) . Ciò è possibile: basta
che per ogni x ∈ L si abbia
f (x/t) + c ≤ p(x/t + z) per t > 0
f (x/(−t)) − c ≤ p(x/(−t) − z) per t < 0 .
O, equivalentemente, che si abbia, per arbitrari x , x ∈ L ,
f (x ) − p(x − z) ≤ c ≤ p(x + z) − f (x ) .
Effettivamente, tutti i numeri a sinistra e rispetivamente a destra nelle disuguaglianze precedenti
formano due classi separate, in quanto
f (x ) + f (x ) = f (x + x ) ≤ p(x + x ) ≤ p(x − z) + p(x + z) ,

per la subadditività di p .
Qualunque valore di c compreso tra
sup (f (x ) − p(x − z)) e inf (p(x + z) − f (x ))
x ∈L x ∈L
è accettabile.
Sia ora G l’insieme di tutti i prolungamenti lineari G di f a sottospazi N tali che L ⊆ N e
G ≤ p su N . Ordiniamo parzialmente G ponendo: G ≤ H se e solo se D(G) ⊆ D(H) e H
prolunga G. Ogni sottoinsieme C di G totalmente ordinato possiede in G un maggiorante: il
funzionale lineare naturalmente definito sull’unione dei domini dei G ∈ C. In virtù del lemma
di Zorn esiste allora un funzionale F massimale in G. F è maggiorato da p sul suo dominio,
che deve coincidere con tutto E, altrimenti F potrebbe essere prolungato in modo ammissibile
e non sarebbe massimale. q.e.d.
Corollario. Nelle ipotesi precedenti, con p seminorma, risulta |F (x)| ≤ p(x). Infatti
−F (x) = F (−x) ≤ p(−x) = p(x) .
Se E è localmente convesso e p è una seminorma della famiglia che ne definisce la topologia,
allora F è continua.
Trasformazioni continue tra spazi localmente convessi (s.l.c.). Se X e Y sono

s.l.c. e {p}p∈P , {q}q∈Q sono le famiglie di seminorme che ne definiscono la struttura, si vede
immediatamente che la trasformazione lineare T : X → Y è continua se e solo se
∀q∃p∀x ∈ X q(T x) ≤ M · p(x) .
Consideriamo ora il Teorema di Han-Banach nel caso complesso.
Teorema. Sia p una seminorma sullo spazio lineare complesso E . Sia L un sottospazio
lineare complesso di E ed f una funzione lineare su L a valori complessi, tale che
∀x ∈ L |f (x)| ≤ p(x) .
Allora esiste una funzione lineare complessa F su E che prolunga f , in modulo maggiorata
ovunque da p :
∀x ∈ L F (x) = f (x) , ∀x ∈ E |F (x)| ≤ p(x) .
Dimostrazione. Considerando soltanto la moltiplicazione per scalari reali, si vede che E , L , ...
sono anche spazi lineari reali. f e f sono funzioni lineari reali su L , tali che
f (x) = −f (ix) , |f (x)| ≤ |f (x)| ≤ p(x) .
Per il teorema precedente possiamo estendere f ad un funzionale reale R definito su tutto E
e tale che |R| ≤ p. Poniamo allora
F (x) = R(x) − iR(ix) ,
da cui segue F (ix) = iF (x) ed F è un funzionale lineare complesso, che si verifica immediata-
mente essere un prolungamento di f . Inoltre se F (x) = ρ exp(iγ) , allora
|F (x)| = exp(−iγ)F (x) = F (exp(−iγ)x) = R(exp(−iγ)x) ≤

≤ p(exp(−iγ)x) = | exp(−iγ)|p(x) = p(x) .

q.e.d.
Corollario 1. Sia L un sottospazio di uno spazio normato E su K (R o C). Sia
f ∈ L∗ = L(L, K) e ||f ||L∗ = sup |f (x)| .

||x||≤1, x∈L
Allora esiste F , prolungamento di f ad E , tale che
F ∈ E ∗ = L(E, K) e ||F ||E ∗ = sup |f (x)| = ||f ||L∗ .

||x||≤1, x∈E
Dimostrazione. Basta applicare il teorema di Hahn-Banach, nel caso reale, o il teorema prece-
dente, nel caso complesso, con
p(x) = ||f ||L∗ · ||x|| .
q.e.d.
Corollario 2. sia E uno spazio normato. Per ogni x ∈ E esiste un funzionale F ∈ E ∗ tale
che
||F ||E ∗ = ||x||E e F (x) = ||x||2E .
Equivalentemente esiste un funzionale G = F/||x||E tale che
||G||E ∗ = 1 e G(x) = ||x||E .
Osservazione. Se F soddisfa la prima eguaglianza, si ha per ogni z ∈ E |F (z)| ≤ ||x|| · ||z|| e

dunque |F (x)| ≤ ||x||2 . Dimostrazione. Basta applicare il corollario 1, prendendo
L = { λx | λ ∈ C } e f (λx) = λ||x||2 .
che implica ||f ||L∗ = ||x||. q.e.d.
Corollario 3. Sia M un sottospazio chiuso di uno spazio normato E, sia x0 ∈

/ M e sia
0 < d < d0 = dist(x0 , M ). Allora esiste F ∈ E ∗ tale che
||F ||E ∗ ≤ 1/d , F (x0 ) > 1 e ∀m ∈ M F (m) = 0 .
Dimostrazione. Consideriamo il sottospazio N generato da M e x0 , costituito dagli elementi

della forma λx0 + m, con m ∈ M . Definiamo il funzionale lineare f su N mediante la relazione
f (λx0 + m) = λd0 /d .
Ovviamente f (x0 ) = d0 /d > 1 e ∀m ∈ M f (m) = 0. Osserviamo poi che
||λx0 + m|| = ||λ(x0 + m/λ)|| = |λ| · ||x0 + m/λ|| ≥ |λ| inf

||x0 + m || = |λ|d0
m ∈M
e quindi, posto per ogni x ∈ E p(x) = ||x||/d, si ha

||λ(x0 + m/λ)||
|f (λx0 + m)| ≤ |λ| = p(λ(x0 + m/λ) .
d

Applicando il Teorema di Hahn-Banach si ottiene F ∈ E ∗ con le proprietà volute. q.e.d.
Separazione di insiemi convessi.
Il teorema di Hahn-Banach ha delle versioni geometriche che si presentano come risultati di

separazione di insiemi convessi. Risultati interessanti teoricamente e che hanno notevoli applica-
zioni ad esempio in problemi di ottimizzazione e controllo ottimo, quali il principio di massimo
di Pontrjagin.
Ci limitiamo a presentare due teoremi, rinviando per approfondimenti a Bourbaki EVT I.
Teorema. Siano X uno spazio vettoriale topologico (su R), A un suo sottoinsieme convesso,
aperto e non vuoto, e V una varietà lineare in X. Allora esiste un iperpiano (codimensione 1)
H chiuso che contiene V e non incontra A.
Dimostrazione. Non è restrittivo supporre 0 ∈ A. Sia p il funzionale di Minkowski di A:

dunque A = {x ∈ X | p(x) < 1}. Ricordiamo che dire che V è una varietà lineare significa
“x, y ∈ V ⇒ λx + (1 − λ)y ∈ V ”. Sia L il sottospazio lineare generato da V , che si verifica
immediatamente costituito dai vettori della forma ρz con z ∈ V . Esiste un’unica funzione lineare
f su L che vale 1 su V : f (ρz) = ρ. Poiché V ∩ A = ∅ si ha f (x) = 1 ⇒ p(x) ≥ 1 e per la
positiva omogeneità di p (ed f ) si deduce che f (x) ≤ p(x) per ogni x ∈ L. Basta ora applicare
il teorema di Han-banach per avere un funzionale F ovunque definito per il quale vale sempre
f (x) ≤ p(x). L’insieme H = {x ∈ X | F (x) = 1} è un iperpiano che contiene V ma non incontra
A. q.e.d.
Definizione. In uno spazio vettoriale topologico si dice che gli insiemi A e B sono separati
dall’iperpiano H se A è contenuto in uno dei due semispazi chiusi individuati da H e B nell’altro.
Equivalentemente, se H = {x | f (x) = c}, con f lineare e continuo e H − = {x | f (x) ≤ c},
H + = {x | f (x) ≥ c}: A ⊆ H − , B ⊂ H + o vicecersa. Se A e B sono contenuti nei due semispazi
aperti (interno di H ± ) allora si dice che H separa strettamente A e B.
Teorema. Siano X uno s.v.t., A un convesso aperto non vuoto e C un convesso non vuoto.
Se A ∩ C = ∅ allora esiste un iperpiano chiuso H che separa A e C. Piú precisamente esiste un
funzionale lineare e continuo f ed una costante c tali che f (x) < c in A e f (x) ≥ c in C.
Dimostrazione. C − A è un convesso aperto e per ipotesi la varietà lineare V = {0} non incontra
C − A. Basta dunque applicare il teorema precedente per avere il risultato di separazione. Non
è poi restrittivo supporre A ⊆ H − = {x | f (x) ≤ c}, ma essendo A aperto in tutti i suoi punti
f (x) < c. q.e.d.
7.6 Operatori duali e aggiunti. Continuità forte e debole
Sia T un operatore lineare tra due spazi normati X e Y , di dominio D(T ), e siano X ∗ e Y ∗
i loro duali (topologici). Per ogni y ∗ ∈ Y ∗ consideriamo l’applicazione lineare
x → < T x, y ∗ > , x ∈ D(T ) .

Se è continua, cioè ∈ L(D(T ), K), dove K è il campo base, allora in virtú del Teorema di
Hahn-Banach puó essere estesa ad un funzionale lineare e continuo x∗ ∈ X ∗ e
∀x ∈ D(T ) < T x, y ∗ >=< x, x∗ > .
Teorema. x∗ è univocamente determinato se e solo se D(T ) è denso, cioè D(T )a = X. In

tal caso, indicando con D(T ∗ ) l’insieme delle y ∗ ∈ Y ∗ per le quali x → < T x, y ∗ > , x ∈
D(T ) è continua, si verifica immediatamente che D(T ∗ ) è un sottospazio lineare e si definisce
l’operatore duale T ∗ mediante la relazione T ∗ y ∗ = x∗ . Dunque
∀x ∈ D(T ) ∀y ∗ ∈ D(T ∗ ) < T x, y ∗ >=< x, T ∗ y ∗ > .
Dimostrazione. La verifica che D(T ∗ ) è un sottospazio è immediata.

Se D(T )a = X e ∀x ∈ D(T ) < x, x∗1 >=< x, x∗2 >, allora x∗1 = x∗2 .
Se invece D(T )a = X e z ∈/ D(T )a , per il Corollario 3 del Teorema di Hahn-Banach esiste
z ∈ X tale che < z, z >> 1 e < x, z ∗ >= 0 per ogni x ∈ D(T )a . Allora x+ + z ∗ = x∗ , ma
∗ ∗ ∗
per ogni x ∈ D(T ) < x, x∗ + z ∗ >=< x, x∗ >. q.e.d.
Teorema. Se T ∈ L(X, Y ) allora T ∗ ∈ L(Y ∗ , X ∗ ) e ||T || = ||T ∗ ||.

dimostrazione. Per ogni y ∗ ∈ Y ∗ < T x, y ∗ > è continua e quindi T ∗ è ovunque definito. Inoltre
||T ∗ y ∗ || = sup | < x, T ∗ y ∗ > | = sup | < T x, y ∗ > | ≤ ||y ∗ || · sup |||T x|| ≤ ||T || · ||x|| ,
||x||=1 ||x||=1 ||x||=1
pertanto T ∗ è continuo e ||T ∗ || ≤ ||T ||.

Per ogni x ∈ X consideriamo la sua immagine T x. Per il Corollario 2 del Teorema di Hahn-
Banach sappiamo che esiste Y ∗ tale che ||y ∗ || = 1 e < T x, y ∗ >= ||T x||. Allora
||T x|| =< T x, y ∗ >=< x, T ∗ y ∗ >≤ ||x|| · ||T ∗ || · ||y ∗ || = ||T ∗ || · ||x|| .
Dunque ||T || ≤ ||T ∗ ||. q.e.d.
Teorema. Siano X e Y due spazi normati e T ∈ L(X, Y ). Allora T è anche continuo da X

munito della topologia debole in Y munito della topologia debole.
Dimostrazione. Dato x0 ∈ X, consideriamo l’intorno debole di T x0 in Y
V (y1∗ , ...yN
∗
; ε)(T x0 ) = {y ∈ Y | | < y − T x0 , yk∗ > | ≤ ε, K = 1, ..N } ,
ricordando che gli intorni di questo tipo formano un sistema fondamentale di intorni.
Essendo < T x − T x0 , yk∗ >=< x − x0 , T ∗ yk∗ > |, èvidente che se x appartiene all’intorno debole
di x0 in X
W (T ∗ y1∗ , ...T ∗ yN
∗
; ε)(x0 ) = {x ∈ X | | < x − x0 , T ∗ yk∗ > | ≤ ε, K = 1, ..N } ,
allora T x ∈ V . q.e.d.
Osservazione. Se interessasse soltanto la continuità sequenziale, basterebbe piú brevemente

osservare che
xn x =⇒ ∀y ∗ ∈ Y ∗ < T xn , y ∗ >=< xn , T ∗ y ∗ > → < x, T ∗ y ∗ >

e dunque T xn T x.
Corollario. Se in Y la topologia debole e quella forte coincidono, come nel caso del campo
base, allora è equivalente dire che un operatore T ∈ L(X, Y ) è debolmente o fortemente conti-
nuo. In particolare il duale topologico di uno spazio normato X nunito della topologia forte o
debole è sempre lo stesso spazio X ∗ .
Da questi risultati si puó dedurre una proprietà molto importante dei convessi negli spazi
localmente convessi.
Teorema. In uno spazio localmente convesso X è equivalente dire che un convesso è debol-
mente o fortemente chiuso.
Dimostrazione. In ordine: 1) Ogni semispazio fortemente chiuso è debolmente chiuso (e ovvia-
mente vicecersa). Infatti continuità forte e debole di funzionali lineari sono equivalenti.
2) Ogni convesso chiuso C è l’intersezione I dei semispazi chiusi che lo contengono. Infatti I è
convesso e chiuso, contiene C e se vi fosse un punto x ∈ I non appartenente a C, potremmo
trovare un suo intorno aperto e convesso A, che potremmo separare da C mediante un iperpiano
H. Assurdo, perchè uno dei due semispazi individuati da H dovrebbe contenere C e ovviamente
I. q.e.d.
7.7 Il Teorema dell’immagine chiusa di Banach

Sia X uno spazio normato e X ∗ il suo duale topologico. Indichiamo come al solito con
< x, x∗ > il valore assunto dal funzionale x∗ sul vettore x: < x, x∗ >= x∗ (x).
Se M è un sottospazio lineare di X si indica con M ⊥ il sottospazio di X ∗ ortogonale ad M :
M ⊥ = {x∗ ∈ X ∗ | ∀x ∈ M < x, x∗ >= 0} ,
ementre per un sottospazio N di X ∗ indichiamo con N ⊥∗ il sottospazio di X *ortogonale ad N :
N ⊥∗ = {x ∈ X | ∀x∗ ∈ N < x, x∗ >= 0} .
Indichiamo con Im(T ) e Ker(T ) l’immagine e il nucleo di un operatore lineare T (spesso nella
letteratura si trovano le notazioni R(T ) e N (T ), da range e null space).
Teorema dell’immagine chiusa di Banach. Siano X e Y due spazi di Banach . Sia

T un operatore chiuso da X in Y con dominio denso : D(T ) = X. Allora le affermazioni
1) Im(T ) è chiusa in Y ,
2) (T ∗ ) è chiusa in X ∗ ,
3) Im(T ) = Ker(T ∗ )⊥∗ ,
4) Im(T ∗ ) = Ker(T )⊥ .
Per una dimostrazione completa rinviamo per esempio a Yosida[24]. La riduzione del caso
generale al caso di un operatore limitato è relativamente semplice. Alcune delle implicazioni
precedenti sono più utilizzate delle altre. Presentiamo allora un risultato parziale con la sua

dimostrazione (Hutson-Pymm[13]).
Teorema. Siano X e Y due spazi di Banach e sia T ∈ L(X, Y ) (dunque T ∗ ∈ L(Y ∗ , X ∗ )).
Allora
Im(T ) = Ker(T ∗ )⊥∗ .
e inoltre
Im(T ) chiusa ⇔ Im(T ∗ ) = Ker(T )⊥ .
Dimostrazione. La prima uguaglianza si ottiene verificando due inclusioni.
Indichiamo per brevità con U e V del primo e secondo membro della prima uguaglianza.
1)Se y = T x allora
T ∗ y ∗ = 0 ⇔ < y, y ∗ >=< T x, y ∗ >=< x, T ∗ y ∗ >= 0
e T x ∈ Ker(T ∗ )⊥∗ , che è chiuso, e dunque U ⊆ V .

2) Sia y0 ∈ Ker(T ∗ )⊥∗ . Se fosse y0 ∈ / Im(T ) per il Teorema di Hahn-Bnach esiste y ∗ ∈ Y ∗ tale
che
y ∗ (y0 ) =< y0 , y ∗ >= 0 e y ∗ (T x) =< T x, y ∗ >=< x, T ∗ y ∗ >= 0 ∀x ∈ X .
Ma allora y ∗ ∈ Ker(T ∗ ) e y0 ∈
/ Ker(T ∗ )⊥∗ . Assurdo. Pertanto V ⊆ U .
Dunque U = V .
Supponiamo ora che Im(T ) sia chiusa e dimostriamo la seconda uguaglianza della tesi,
indicando con U ∗ e V ∗ il primo e il secondo membro.
1) Se x∗ ∈ Im(T ∗ ), cioè x∗ = T ∗ y ∗ , e x ∈ Ker(T ), cioè T x = 0, allora
< x, x∗ >=< x, T ∗ y ∗ >=< T x, y ∗ >= 0 ,
ovvero x∗ ∈ Ker(T )⊥ e dunque U ∗ ⊆ V ∗ .

2) Sia ora x∗ ∈ Ker(T )⊥ e definiamo ỹ ∈ Im(T )∗ , lo spazio duele di Im(T )∗ , mediante la
relazione
< y, ỹ >=< x, x∗ > se y = T x .
La definizione è definita perché se y = T x1 = T x2 allora T (x1 − x2 ) = 0, cioè x1 − x2 ∈ Ker(T ),
e dunque < x1 − x2 , x∗ >= 0, ovvero < x1 , x∗ >=< x2 , x∗ >. Osserviamo che l’applicazione ỹ è
ovviamente lineare e appartiene effettivamente a Im(T )∗ in quanto, ricordando il Corollario 1
del Teorema dell’applicazione aperta, abbiamo
∃C∀y ∈ Im(T )∃x y = T x , ||x|| ≤ C||y||
e quindi, con tale x

| < y, ỹ > | = | < x, x∗ > | ≤ (C||x∗ ||)||y|| .
Per il Teorema di Hahn-Banach possiamo estendere ỹ a y ∗ ∈ Y ∗ e
∀x ∈ X < x, T ∗ y ∗ >=< T x, y ∗ >=< T x, ỹ >=< x, x∗ > .
Dunque x∗ = T ∗ y ∗ , cioè x∗ ∈ Im(T ∗ ), e dunque V ∗ ⊆ U ∗ . q.e.d.

7.8 Compattezza e compattezza sequenziale debole

Abbiamo già enunciato in precedenza un risultato fondamentale, ottenuto attraverso i lavori di
molti autori ma con il contributo essenziale di Eberlein e Shmulyan.
Teorema. Sia X uno spazio di Banach arbitrario e K un sottoinsieme di X. Le affermazioni

a) K è [relativamente] debolmente compatto,
b) K è [relativamente] debolmente sequenzialmente compatto,
c) K è [relativamente] debolmente numerabilmente compatto.
Osservazione. Un insieme K debolmente compatto non è in genere metrizzabile. Ad esem-

pio la sfera unitaria chiusa nello spazio di Hilbert l2 (A), con A non numerabile è debolmente
compatta, ma non metrizzabile (ponendo come al solito eα = {δαβ }β∈A , non si può trovare un
sistema fondamentale di intorni dell’origine {x | |(x, eαj )| < ε, j = 1, 2, ..N } numerabile).
Dunque il teorema stabilisce l’equivalenza dei tre tipi di compattezza in un contesto che non
rientra in quello più semplice degli spazi metrici.
Un teorema analogo non vale nel duale X ∗ di un generico spazio di Banach X, se X ∗ è

munito della topologia debole* (più debole della topologia debole).
Operando con la topologia debole*, si possono ottenere risultati non validi in generale per
la topologia debole. Ad esempio:
Teorema (Banach-Alaoglu). La sfera chiusa unitaria di X ∗ , dove X è uno spazio di

Banach, è compatta nella topologia debole*. Dunque ogni insieme chiuso e limitato in norma è
debole* compatto.
La dimostrazione dipende essenzialmente dal teorema di Tychonov sulla compattezza degli

spazi prodotto; rinviamo per una presentazione completa ad esempio a Dunford-Schwartz[8].
Tuttavia in generale la sfera chiusa unitaria non è sequenzialmente debole* compatta.

Consideriamo il seguente
Esempio. Sia X = L∞ (R) e X ∗ il suo duale. Si sa che L1 (R) è un sottospazio (proprio)

immerso isometricamente in X ∗ . Consideriamo, indicando al solito con χ funzioni caratteristiche,
la successione
n+1
Fn = χ[n.n+1[ , ∀f ∈ X Fn (f ) = f (x)dx , ||Fn ||X ∗ = ||χ[n.n+1[ ||L1 = 1 .
n
Non esiste alcuna sottosuccessione di Fnk di Fn , convergente debole*. Infatti, data la succes-
sione di indici nk , basta prendere g = j (−1)j χ[nj ,nj +1[ per avere Fnk (g) = (−1)k , successione
numerica oscillante e non convergente.
Da questo semplice esempio deduciamo che

1) La sfera chiusa unitaria di X ∗ è compatta (Banach-Alaoglu), ma non è sequenzialmente

compatta per la topologia debole*.
2) Tale sfera a maggior ragione non puo’ essere sequenzialmente debolmente compatta, dun-
que (Eberlein-Smulyan) non puo’ essere debolmente compatta.
3) Pertanto in alcuni spazi di Banach (non riflessivi) esistono insiemi limitati in norma ma
non relativamente debolmente compatti.
Per quanto riguarda la compattezza sequenziale debole* vale un risultato particolare, molto
importante per le numerore applicazioni, negli spazi separabili, quelli cioè che ammettono un
sottoinsieme numerabile denso.
Teorema. Sia X uno spazio di Banach separabile e X ∗ , il suo duale. Allora la sfera chiusa
unitaria di X ∗ è sequenzialmente compatta per la topologia debole*.
Dimostrazione. Sia D = {xk } un sottoinsieme separabile denso in X e fn una successione limi-
tata in X ∗ : ||fn ||∗ ≤ C.
(1)
Dalla successione numerica fn (x1 ) si puó estrarre una sottosuccessione convergente fn (x1 ) →
y1 .
(1) (2)
Dalla successione numerica fn (x2 ) si puó estrarre una sottosuccessione convergente fn (x2 ) →
(2)
y2 , valendo ancora fn (x1 ) → y1 .
...
(k−1) (k)
Dalla successione numerica fn (xk ) si puó estrarre una sottosuccessione convergente fn (xk ) →
(k) (k)
yk , valendo ancora fn (xk−1 ) → yk−1 ... fn (x1 ) → y1 .
(n)
... La successione diagonale gn = fn converge in tutti i punti di D ed è limitata in norma:
||gn ||∗ ≤ C, dunque, come si verifica immediatamente, converge in tutti i punti di X:
||x−xj || < ε ⇒ |gn+p (x)−gn (x)| ≤ |gn+p (x)−gn+p (xj )|+|gn+p (xj )−gn (xj )|+|gn (xj )−gn (x)| ≤ (2C+1)ε ,
per n sufficientemente grande (dato j) e p arbitrario.

Ma X ∗ è sequenzialmente debole* completo (per il teorema di uniforme limitatezza) e dunque
esiste g ∈ X ∗ tale che gn → g debole*. q.e.d.
Teorema. Se X è uno spazio di Banach e X ∗ è separabile, allora X è anch’esso separabile.

Osservazione. La separabilità di X non implica quella di X ∗ (esempio L1 (R) è separabile, ma
L∞ (R) non lo è).
Dimostrazione. Sia fn ∈ X ∗ , ||fn ||∗ = 1 una successione densa nella superficie unitaria di X ∗
e, fissato a > 0, sia xn ∈ X, ||xn || = 1 tale che fn (xn ) =< xn , fn >≥ a. Il sottospazio chiuso
M generato dalle xn coincide con X, altrimenti esisterebbe z ∈ X − M, z = 0. allora per il
Corollario 3 della Sezione 7.5 esisterebbe g ∈ X ∗ tale che
||g||∗ = 1 , g(z) = 0 , ∀x ∈ M g(x) = 0 ,
quindi g(xn ) = 0 e
0 < a ≤ |fn (xn )| ≤ |fn (xn ) − g(xn )| + |g(xn )| ≤ ||xn || · ||fn − g||∗ = ||fn − g||∗

in contraddizione con la densità delle fn sulla superficie unitaria.

q.e.d.
Corollario. Se X ∗ e’ separabile allora la sfera chiusa unitaria di X ∗ è sequenzialmente

compatta per la topologia debole*.
Infatti, per il teorema, l’ipotesi implica che X è separabile e si può allora applicare il teorema
precedente.
Compattezza debole e compattezza sequenziale negli spazi di Banach sono strettamente cor-
relate alla riflessività dello spazio.
Si deve a Eberlein e Shmulyan la seguente caratterizzazione degli spazi di Banach riflessivi

(non solo di quelli separabili):
Teorema. Uno spazio di Banach X è riflessivo se e solo se X è localmente sequenzialmente

compatto.
Un’altra caratterizzazione importante si deve a Kakutani:
Teorema. Uno spazio di Banach X è riflessivo se e solo se la sua sfera unitaria chiusa è
debolmente compatta.
Osserviamo infine che si può facilmente dimostrare che, se X è uno spazio di Bnach, allora
X è riflessivo se e solo se X ∗ è riflessivo.

Capitolo 8
Alcuni risultati sulle funzioni

continue e le serie di Fourier
ordinarie
8.1 Spazi pre-Hilbertiani di funzioni continue e serie di Fourier ordinarie.

Abbiamo già visto che C(K; R), dove K è uno spazio topologico compatto, è uno spazio di
Banach per la norma
||f ||K,∞ = max |f (x)| .
x∈K
Una successione fn convergente in tale norma converge uniformemente su K.
C(K; R), tranne il caso particolare di K ridotto un solo punto, non è uno spazio di Hilbert
per la norma ||f ||K,∞ . Infatti uno spazio compatto è normale (allora esistono due loro intorni
aperti A e A disgiunti) e in esso vale quindi il teorema di Urysohn (se C e C sono chiusi
disgiunti di K esiste una funzione continua da K in [0, 1] tale che f (x) = 0 per x ∈ C e f (x) = 1
per x ∈ C ). Dunque, se vi sono due punti distinti x e y in K, è possibile trovare una funzione
g continua in K tale che, detta f la funzione costante uguale a 1 ,
∀z ∈ K 0 ≤ g(z) ≤ 1 , g(x) = 0 , g(y) = f (y) = 1 ,
allora
||f + g||2 + ||f − g||2 = (1 + 1)2 + 12 > 2(12 + 12 ) = 2(||f ||2 + ||g||2 )
e non è soddisfatta la disuguaglianza della mediana.
Talvolta è però conveniente introdurre in questi spazi di funzioni continue un prodotto sca-
lare e munirli della corrispondente struttura di spazi pre-Hilbertiani.
Esempio. C([0, 2π]; C), con il prodotto scalare

(f, g) = f (x)g(x)dx ,
[0,2π]
131
132 Capitolo 8. Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie
è uno spazio pre-Hilbertiano.

Questo spazio si può completare in modo canonico, ottenendo uno spazio di Hilbert H che può
essere identificato a L2 ([0, 2π], dx) .
√
In H l’insieme di funzioni continue F = {einx / 2π | n ∈ Z} costituisce un sistema ortonor-
male:
einx e−imx
√ √ dx = δn,m ,
[0,2π] 2π 2π
con δn,m uguale a 0 o 1 se n = m o n = m (indice di Kronecker).
Dimostreremo che F è completo. Allora, applicando il teorema sulle serie di Fourier generaliz-
zate, otteniamo che per ogni funzione f di L2 , e in particolare di C, vale lo sviluppo ordinario
di Fourier:
1 N
f (x) ∼ √ fn einx ,
2π n=−N
dove fn sono i coefficienti di Fourier

e−inx
fn = f (x) √ dx
[0,2π] 2π
e il simbolo ∼ indica la convergenza nella norma di L2 o come si dice in media quadratica:

N
1
lim |f (x) − √ fn einx |2 dx = 0 .
N →+∞ [0,2π] 2π n=−N
Per semplicità si sono considerate ridotte simmetriche, ma il risultato sussiste anche se si

considerano somme da −M a N e si fanno tendere a +∞ indipendentemente M e N .
8.2 Convergenza monotona.

È noto che la convergenza semplice non implica in generale la convergenza uniforme, tuttavia:
Teorema. Sia K compatto e siano f, fn ∈ C(K; R). Supponiamo che fn converga sempli-
cemente in modo monotono, ad esempio non crescendo, ad f :
∀x ∈ K (∀nfn (x) ≤ fn−1 (x)) e f (x) = lim fn (x) = inf fn (x) .

n n
Allora fn → f uniformemente in K :
lim ||fn − f ||K,∞ = 0 .

n
(Si osservi che tra le ipotesi vi è la continuità della funzione limite).
Dimostrazione.
∀ε > 0 ∀x ∈ K ∃nx f (x) ≤ fnx (x) < f (x) + ε

e quindi per la monotonia
∀n ≥ nx f (x) ≤ fn (x) < f (x) + ε .
Ma per la monotonia e per la permanenza delle disuguaglianze strette tra funzioni continue,
indicando con V (x) un intorno, che per convenienza supporremo aperto, di x :
∀x ∈ K ∃V (x) ∀z ∈ V (x) f (z) ≤ fnx (z) < f (z) + ε .
Gli intorni V (x) formano un ricoprimento aperto di K e per la compattezza di K esistono

x1 , x2 , ..., xN tali che
V (x1 ) ∪ V (x2 ) ∪ ... ∪ V (xN ) ⊇ K .
Ad ogni xk corrisponde una funzione fnxk con indice nxk . Poniamo ν = max(nx1 , nx2 , ..., nxN ),
allora per ogni z ∈ K esiste un xk tale che z ∈ V (xk ) e dunque per ogni n ≥ ν si ha
f (z) ≤ fn (z) ≤ fν (z) ≤ fnxk (z) < f (z) + ε ,
cioè
∀ε > 0 ∃ν ∀n ≥ ν ||fn − f ||K,∞ < ε .
q.e.d.
8.3 Approssimazione di funzioni continue mediante funzioni speciali.

Prima di studiare il tema dell’approssimazione di funzioni continue mediante funzioni speciali
(per esempio polinomi o funzioni trigonometriche nel caso K = [a, b] ) consideriamo i seguenti
risultati elementari.
√
Lemma. Per 0 ≤ x ≤ 1, la funzione x può essere approssimata uniformemente mediante
polinomi.
Dimostrazione. La radice quadrata in senso aritmetico z di x soddisfa le relazioni
z2 = x , 0 ≤ z ≤ 1 .
Effettuando il cambiamento di variabili
y = 1 − z , (0 ≤ y ≤ 1) , t = 1 − x , (0 ≤ t ≤ 1) ,
si trova
(1 − y)2 = 1 + y 2 − 2y = 1 − t , cioè y = 1/2(t + y 2 ) .
Costruiamo la successione yn = Qn (t) secondo lo schema iterativo

y0 = 0
,
yn+1 = 1/2(t + yn2 )
ottenendo y1 = t/2, y2 = t/2 + t2 /8, ... . Ovviamente ai polinomi Qn (a coefficienti positivi)

corrispondono i polinomi Pn definiti da
zn = 1 − yn = 1 − Qn (t) = 1 − Qn (1 − x) = Pn (x) .

È chiaro che
1) per ogni n si ha yn ≥ 0 ;
2) per ogni n si ha yn ≤ yn+1 , per induzione, essendo:
yn + yn−1
y0 ≤ y1 , yn+1 − yn = (yn − yn−1 ) ;
2
3) per ogni n si ha yn ≤ 1 , per induzione, essendo
y0 ≤ 1 , yn ≤ 1 ⇒ yn+1 ≤ 1 .
Per ogni t la successione yn = Qn (t) è dunque nondecrescente e limitata. Allora

2
y(t) = lim yn (t) = lim 1/2(t + yn−1 ) = 1/2(t + y(t))2 .
n n
Pertanto
√
z(x) = 1 − y(t) = x e z(x) = lim Pn (x) .
n
√
Ma x è continua e la successione Pn è noncrescente e convergente semplicemente sul compatto
[0, 1]. Per il teorema precedente la convergenza è anche uniforme. q.e.d.
* * *
Il metodo iterativo precedente puoò essere applicato con successo anche per ottenere la radice
quadrata di un operatore autoaggiunto positivo. Premettiamo alcune definizioni. Sia A ∈ "(H)
una trasformazione autoaggiunta in uno spazio di Hilbert H (∀f ∈ H(Af, f ) = (f, Af )):
1)si dice che A è positiva se e solo se la forma quadratica associata (Af, f ) è positiva.
2) Siano A e B autoaggiunte. Si pone
A≤B ⇔ ∀f ∈ H ((B − A)f, f ) ≥ 0 ,
cioè B − A è positiva.
Teorema. Se An è una successione monotona e limitata di trasformazioni autoaggiunte

positive, per semplicità:
O ≤ A1 ≤ A2 ≤ ... ≤ I ,
allora esiste un’unica trasformazione positiva A ∈ L(H) tale che
∀f ∈ H lim An f = Af .
n
Ovviamente O ≤ A ≤ I.
Osservazione 1. Non è necessario che le An commutino.

Osservazione 2. È facile e sufficiente per il teorema successivo verificare la convergenza debole

delle An :
∀f, g ∈ H lim(An f, g) = (Af, g) .
n
Infatti, supponendo O ≤ aI ≤ An (ipotesi non restrittiva, perché basta ragionare sulle An + aI

invece che direttamente sulle An ), le forme quadratiche Q(f ) = (An f, f ) sono il quadrato di
una norma Hilbertiana che soddisfa l’identità della mediana, e al limite otteniamo una funzione
Q(f ) tale che Q(f + g) + Q(f − g) = 2(Q(f ) + Q(g)). Allora Q(f )1/2 è una norma Hilbertiana
indotta dal prodotto scalare:
1
B(f, g) = (Q(f + g) − Q(f − g)) = lim(An f, g) .
4 n
Ovviamente |B(f, g)| ≤ ||f ||||g|| e quindi B(f, ·) ∈ H . Per il Teorema di Riesz esiste Af tale
che
B(f, g) = (Af, g) , ||Af || ≤ ||f ||, A ∈ L(H) , Q(f ) = (Af, f ) e ∀naI ≤ An ≤ A ≤ I .
Teorema. Sia A limitata autoaggiunta e positiva. Allora esiste un’unica trasformazione X

limitata autoggiunta e positiva tale che X 2 = A. Si scrive allora A1/2 = X.
Dimostrazione. (Per semplicità sia R il campo base). Basta usare il metodo del Lemma
precedente:
1
Y = I − X , B = I − A , Y0 = O , Yn+1 = (B + Yn2 )
2
per ottenere una succesione monotona. Osserviamo infatti che se B ≥ O allora per ogni p si ha
B p ≥ O ((B 2k f, f ) = ||B k f ||2 , (B 2k+1 f, f ) = (BB k f, B k f )), e che le Yn e le Yn − Yn−1 sono
polinomi in B a coefficienti positivi, come si verifica per induzione, essendo
1 1 1
Yn+1 = (B + Yn2 ) , Yn+1 − Yn = (Yn2 − Yn−1
2
) = (Yn − Yn−1 )(Yn + Yn−1 ) .
2 2 2
Allora O ≤ Yn−1 ≤ Yn ≤ I e per il Teorema precedente Yn converge debolmente a Y . Infine
X = I − Y è tale che X 2 = A.
L’unicità si ottiene attraverso i calcoli seguenti.

Indichiamo in generale con A1/2 l’operatore costruito con il metodo iterativo precedente. Sia
X = A1/2 e Y ≥ O tale che Y 2 = A. Si ha Y 3 = AY = Y A e quindi Y commuta con X, che è
limite di polinomi in A. Per ogni f ∈ H
0 = ((X 2 −Y 2 )f, (X−Y )f ) = ((X+Y )(X−Y )f, (X−Y )f ) = ||X 1/2 (X−Y )f ||2 +||Y 1/2 (X−Y )f ||2 .
Allora X 1/2 (X − Y ) = Y 1/2 (X − Y ) = O e dunque X(X − Y ) = Y (X − Y ) = O, quindi

(X − Y )2 = O, ovvero ∀f ∈ H ||(X − Y )f ||2 = 0, cioè X − Y = O. q.e.d.
Proposizione. SE AB = BA, A ≥ O, B ≥ O allora AB ≥ O e se inoltre A ≤ B allora

A2 ≤ AB ≤ B 2 . Dimostrazione.
(ABf, f ) = (B 1/2 AB 1/2 f, f ) = (AB 1/2 f, B 1/2 f ) ≥ 0 , (A2 f, f ) = (AA1/2 f, A1/2 f ) ≤ (BA1/2 f, A1/2 f ) = (BAf, f ) .

Osservazione. Se le An della successione monotona dell’Osservazione 2 precedente commutano

è facile controllare che in effetti la convergenza è forte, perché allora A2n ≤ A2n+1 ≤ A2 e quindi,
ricorrendo al teorema di uniforme limitatezza (Capitolo 7) si ha
||Af ||2 ≤ lim inf ||An f ||2 = lim ||An f ||2 ≤ ||Af ||2 ,
n n
e dunque ||An f || → ||Af ||, che insieme alla convergenza debole An f Af garantisce la
convergenza forte. q.e.d.
& & &
Lemma. In ogni intervallo finito, per semplicità [−L, L] , la funzione |x| si può approssimare
uniformemente mediante una successione
noncrescente di polinomi.
Dimostrazione. Basta scrivere |x| = L (x/L)2 ed usare il lemma precedente:
|x| = lim LPn ((x/L)2 ) e Pn+1 ≤ Pn .
n
Dunque i polinomi Mn (x) = LPn ((x/L)2 ) non crescono. q.e.d.
Nel seguito indicheremo brevemente con C(K) lo spazio di Banach delle funzioni continue sul
compatto K , munito della norma del massimo: le funzioni saranno a valori in C o in R (quale
dei due casi si consideri risulterà chiaro dal contesto).
Teorema di Stone-Weierstrass. Sia A ⊂ C(K) . Se sono soddisfatte le seguenti

condizioni: 1) A è un’algebra autoaggiunta, cioè
f, g ∈ A ⇒ λf + g , f g , f ∈ A ,
2) La funzione costante 1 (e quindi ogni funzione costante) appartiene a A .
3) A separa i punti di K , nel senso che
∀x, y ∈ K x = y ⇒ ∃f ∈ A f (x) = f (y) .
Allora A è denso in C(K), ovvero la chiusura di A coincide con C(K) .
È una semplice conseguenza del teorema seguente.
Teorema (Kakutani-Krein). Sia B ⊂ C(K), dove in questo caso si considerano funzioni

a valori reali. Se sono soddisfatte le seguenti condizioni: 1) B è uno spazio vettoriale su R e se
f ∈ B si ha anche |f | ∈ B.
2) La funzione costante 1 (e quindi ogni funzione costante) appartiene a B.
3) B separa i punti di K , nel senso che
∀x, y ∈ K x = y ⇒ ∃f ∈ B f (x) = f (y) .
Allora B è denso in C(K), ovvero la chiusura di B coincide con C(K) .
Dimostrazione.
a) Essendo
f + g − |f − g| |f + g + |f − g|
f ∧ g = inf(f, g) = e f ∨ g = sup(f, g) = ,
2 2

f, g ∈ B implica f ∧ g, f ∨ g ∈ B.
b) Data F ∈ C(K) e x, y ∈ K esiste fxy ∈ B tale che fxy (x) = F (x) e fxy (y) = F (y).
Infatti, se x = y basta prendere come fxy la funzione costante uguale a F (x), altrimenti se x = y
esiste g ∈ B tale che g(x) = g(y) e allora basta prendere fxy = ag + b, con le costanti a e b
univocamente individuate dal sistema

ag(x) + b = F (x)
ag(y) + b = F (y)
(Il determinante dei coefficienti è g(x) − g(y) = 0 ).

c) Dato ε > 0 e y ∈ K, per ogni x ∈ K costruiamo la funzione fxy come al punto b). Essendo
fxy (x) > F (x) − ε , per la continuità delle funzioni esiste un intorno aperto U (x) di x nel quale
∀z ∈ U (x) fxy (z) > F (z) − ε .
Gli intorni U (x) costituiscono un ricoprimento aperto di K . Per la compattezza di K si può

estrarre un sottoricoprimento finito U (x1 ), U (x2 ), ..., U (xn ) . Poniamo allora
fy = fx1 y ∨ fx2 y ∨ ... ∨ fxn y ∈ B .
Per ogni z ∈ K esiste k tale che z ∈ U (xk ) e pertanto fy (z) ≥ fxk y (z) > F (z) − ε. Dunque
∀z ∈ K F (z) − ε < fy (z) , inoltre fy (y) = F (y) < F (y) + ε .
Per la continuità delle funzioni esiste un intorno aperto V (y) di y tale che
∀z ∈ V (y) fy (z) < F (z) + ε .
Le V (y) formano un ricoprimento aperto di K e per la compattezza di K esiste un sottoricopri-

mento finito V (y1 ), V (y2 ), ..., V (ym ) . Poniamo
f = fy1 ∧ fy2 ∧ ... ∧ fym ∈ B .
Allora f eredita dalle fyi la proprietà che per ogni z ∈ K si ha F (z) − ε < f (z). Ma per ogni
z ∈ K esiste j tale che z ∈ V (yj ) . Dunque
F (z) − ε < f (z) ≤ fyj (z) < F (z) + ε .
Essendo ||F − f || < ε, si deduce la densità di B in C(K). q.e.d.
Dimostrazione del teorema di Stone-Weierstrass nel caso reale.

Sia B la chiusura di A in C(K). Evidentemente B è ancora uno spazio vettoriale, al quale
appartengono le funzioni costanti, e B separa i punti di K. Inoltre, se Pn è una successioni di
polinomi tali che
1
∀x ∈ [−n, n] ||x| − Pn (x)| < ,
n
per ogni g ∈ A , per n ≥ ||g|| , risulta
1
|||g| − Pn (g)|| < e Pn (g) ∈ A ,
n

essendo A un’algebra. Se allora f ∈ B, dato n ≥ ||f ||+1 e considerata g ∈ A tale che ||f −g|| < n1
, si ha
2
|||f | − Pn (g)|| ≤ |||f | − |g||| + |||g| − Pn (g)|| < .
n
Dunque |f | è aderente a A , cioè |f | ∈ B. Basta ora applicare il teorema precedente a B, che
risulta denso in C(K) (essendo chiuso B coincide con C(K) ) e pertanto A è denso in C(K) . q.e.d.
Dimostrazione del teorema di Stone-Weierstrass nel caso complesso.

Sia
F = {f | f ∈ A} = {f | f ∈ A} .
(Se f ∈ A allora −if ∈ A e f = (−if ) ∈ F .)
F ⊆ A , poiché f = (f + f )/2 ,
1) è un’algebra:
g1 , g2 ∈ F e λ1 , λ2 ∈ R ⇒ λ1 g1 + λ2 g2 = (λ1 g1 + λ2 g2 ), g1 g2 = (g1 g2 ) ∈ F ;
2) la funzione costante 1 ∈ F ;
3) separa i punti di K perché per x, y ∈ K
x = y ⇒ ∃f ∈ A f (x) = f (y) ⇒ ∃g ∈ F (g = f ∨ g = f ) g(x) = g(y) .
Per quanto già dimostrato nel caso reale, la chiusura F di F coincide con C(K; R) . Allora la
chiusura A = F + iF di A coincide con C(K; C) . q.e.d.
Consideriamo qualche caso particolarmente importante dei risultati generali precedenti.
Teorema di approssimazione polinomiale di Weierstrass. I polinomi P, a coefficienti

reali [rispettivamente complessi], sono densi in C([a, b]; R) [rispettivamente C([a, b]; C)].
Dimostrazione. Evidentemente P è un’algebra [autoaggiunta nel caso complesso], contiene le
costanti e separa i punti del compatto K = [a, b]: infatti basta il monomio x a separare tutti i
punti di K. Pertanto il teorema di Stone-Weierstrass è applicabile. q.e.d.
Il teorema di approssimazione polinomiale precede storicamente quello generale di Stone-

Weierstrass e sono disponibili varie dimostrazioni dirette. Ne riportiamo una particolarmente
interessante, dovuta a Bernstein, considerando per semplicità K = [0, 1] .
Teorema di Weierstrass-Bernstein. Sia f ∈ C([0, 1]). I polinomi

n

n p
Pn (x) = f ( )xp (1 − x)n−p
p n
p=0
convergono uniformemente a f .
Si osservi che i i polinomi Pn non costituiscono le ridotte di una serie.
Dimostrazione. Introduciamo i polinomi

n
ρp (x) = xp (1 − x)n−p ,
p


cosicché Pn (x) = p f (p/n)ρp (x). Risulta per ogni x ∈ [0, 1]

n
ρp (x) = 1 ,
p=0

n
pρp (x) = nx ,
p=0

n
p(p − 1)ρp (x) = n(n − 1)x2 .
p=0
Basta infatti partire dall’identità

n

n
(x + y)n = xp y n−p ,
p
p=0
derivarla parzialmente rispetto a x 0, 1, 2 volte, moltiplicare per 1, x, x2 entrambi i membri

delle uguaglianze dedotte e porre alla fine y = 1 − x . Combinando le tre relazioni, si verifica
senza difficoltà che
n
(p − nx)2 ρp (x) = nx(1 − x) .
p=0
Sia M tale che per ogni x si abbia |f (x)| ≤ M (f è limitata) e per ogni ε > 0 sia δ > 0 tale che
|f (x) − f (x )| < ε se |x − x | < δ (f è uniformemente continua). Allora

n
n
|f (x) − f (p/n)ρp (x)| = | (f (x) − f (p/n))ρp (x)| ≤
p=0 p=0

≤| (f (x) − f (p/n))ρp (x)| + | (f (x) − f (p/n))ρp (x)| ≤
|p−nx|<nδ |p−nx|≥nδ
2M
n
≤ ε + 2M ρp (x) ≤ ε + 2 2 (p − nx)2 ρp (x) .
n δ p=0
|p−nx|≥nδ
Ma il secondo addendo tende a 0 per n → +∞ e dunque per ogni ε > 0, purché n sia
sufficientemente grande
∀x ∈ [0, 1] |f (x) − Pn (x)| < 2ε .
q.e.d.
Teorema di approssimazione trigonometrica di Weierstrass. Sia C2π (R) lo spazio

di Banach delle funzioni a valori in C, continue su R e di periodo 2π, munito della norma del
massimo.
C2π si può identificare con il sottospazio vettoriale chiuso Cp ([0, 2π]) di C([0, 2π]), costituito dalle
funzioni che assumono valori uguali in 0 e 2π. Dunque la norma del massimo in C2π (R) si può
calcolare nel modo seguente
||f || = max |f (x)| .
x∈[0,2π]

O ancora C2π (R) si può identificare con C(K), dove K è il compatto ottenuto da [0, 2π] identi-
¯
ficando gli estremi 0 e 2π.
La famiglia
T = {einx | n ∈ Z}
è totale in Cp ([0, 2π]).
Dimostrazione. Sia A l’insieme delle combinazioni lineari finite degli elementi di T . È evidente
che A costituisce un’algebra autoaggiunta in Cp , contiene le funzioni costanti (Cei0x ) e il singolo
elemento eix ∈ T separa tutti i punti del compatto K .
Osservazione 1. T non può essere totale in C([0, 2π]), essendo tutti i suoi elementi funzioni
periodiche.
Osservazione 2. Si è considerato l’intervallo [0, 2π] soltanto per comodità. La famiglia
2πin(x − a)
Ta,b = {exp | n ∈ Z}
b−a
è totale in Cp ([a, b]). Infatti, se y = 2π(x − a)/(b − a) e f ∗ (y) = f (x) = f (a + (b − a)y/2π) ,
f ∗ si può approssimare mediante combinazioni lineari finite di funzioni della forma exp iny =
exp 2πin(x − a)/(b − a) .
Teorema (completezza √ delle funzioni trigonometriche). In L2 ([0, 2π], dx) il sistema

ortonormale F = {e / 2π | n ∈ Z} è completo.
inx
Dimostrazione.
1) Abbiamo dimostrato che le combinazioni lineari finite di elementi di T , e dunque di F , sono
dense in Cp ([0, 2π]) per la norma del massimo.
2) La convergenza uniforme, cioè per la norma del massimo, implica quella in media quadratica,
cioè per la norma L2 , in quanto
b
||f ||2 = ( |f (x)|2 dx)1/2 ≤ (b − a)1/2 ||f ||∞ .
a
3) Cp ([a, b]) è denso in C[a, b] per la norma L2 : sia infatti f continua in [a, b] e si consideri

= f (x) , a + 1/n ≤ x ≤ b
fn (x) = .
= f (a + 1/n) + f (a+1/n)−f
1/n
(b)
(x − a − 1/n) , a ≤ x ≤ a + 1/n
Allora fn ∈ Cp [a, b] e

b a+1/n
(2||f ||∞ )2
||f − fn ||22 = |f (x) − fn (x)|2 dx = |f (x) − fn (x)|2 dx ≤ →0,
a a n
per n → +∞ .
4) È noto che C[a, b] è denso in L2 ([0, 2π], dx) per la norma L2 .
Dunque il sottospazio vettoriale generato da F è denso in L2 ([0, 2π], dx) e quindi F è completo
e costituisce una base ortonormale. q.e.d.

8.4 Presentazioni equivalenti della serie di Fourier.

In L2 (−π, π) il sistema
{1, cos nx, sin nx} n ≥ 1
è ortogonale e completo. Il sistema
1 cos nx sin nx
{√ , √ , √ } n ≥ 1
2π π π
è ortonormale e completo, ovviamente equivalente al sistema ortonormale completo
einx
{en = √ }n∈Z .
2π
I coefficienti di Fourier di f rispetto a questo sono
π
1
fn = (f, en ) = √ f (x)e−inx dx =
2π −π
π
1
=√ f (x)(cos nx − i sin nx)dx .
2π −π
Posto π
1 1
cn = f (x)e−inx dx = √ fn n ∈ Z ,
2π −π 2π
π
1
an = f (x) cos nxdx n ≥ 0 ,
π −π

1 π
bn = f (x) sin nxdx n ≥ 1 ,
π −π
si vede immediatamente che valgono le relazioni
an = cn + c−n , bn = i(cn − c−n )
e sono equivalenti le seguenti presentazioni della serie di Fourier di f :

f (x) ∼ fn en (x) ,
n∈Z

f (x) ∼ cn einx ,
n∈Z
a0
f (x) ∼ + (an cos nx + bn sin nx) .
2
n≥1
I vari coefficienti introdotti hanno senso anche se f è soltanto sommabile: f ∈ L1 .

8.5 Nucleo di Dirichlet. Convergenza puntuale.

La ridotta simmetrica N -esima della serie di Fourier di una funzione f

N
einx a0
N
SN (f )(x) = fn √ = + (an cos nx + bn sin nx) =
2π 2 0
−N
π
N
1
= f (t)( ein(x−t) )dt
2π π −N
si presenta come “convoluzione di f con il nucleo di Dirichlet
1 sin(N + 1/2)z
DN (z) = :
2π sin z/2
π
SN (f )(x) = DN (x − t)f (t)dt .
π
In effetti

N 2N
ei(2N +1)z − 1
einz = e−iN z einz = e−iN z =
0
eiz − 1
−N
ei(N +1/2)z − e−i(N +1/2)z sin(N + 1/2)z

= −iz/2
= .
eiz/2 −e sin z/2
Ovviamente DN (z) è periodica come tutte le exp(inz).
Prolungando per periodicità f fuori dell’intervallo [−ππ] e osservando che DN (−z) = DN (z),
si può scrivere con il cambiamento di variabile t − x = z
π
SN (f )(x) = DN (z)f (x + z)dz .
−π
Con f costante uguale a 1, si trova ( a0 /2 = 1 , an = bn = 0 per n ≥ 1 )

π
DN (z)dz = 1
−π
e quindi π
SN (f )(x) − f (x) = DN (z)(f (x + z) − f (x))dz .
−π
Lemma (Riemann-Lebesgue). Per ogni f ∈ L1 (a, b)

b
lim f (x) sin(λx)dx = 0 .
λ→+∞ a

Dimostrazione.
Premettiamo una osservazione: se f ∈ L2 e λ ∈ N il risultato segue immediatamente dalla con-
vergenza a 0 dei coefficienti di Fourier rispetto a qualunque sistema ortonormale (disuguaglianza
di Bessel). Ma L2 è denso in L1 e sin(λx) è limitata, dunque se
fn ∈ L2 , ||fn − f ||1 ≤ 1/n ,
allora per λ sufficientemente grande

b b
| f (x) sin(λx)dx| ≤ | fn (x) sin(λx)dx| + ||f − fn ||1 ≤ 2/n .
a a
La densità di L2 in L1 si può dedurre ad esempio dal fatto che le funzioni caratteristiche degli
intervalli χ[r,s] costituiscono un insieme totale in L1 .
Il lemma si può dedurre, senza ricorrere ai risultati sui sistemi ortogonali in L2 e per λ arbitrario,
utilizzando solo alla totalità delle funzioni caratteristiche degli intervalli, dall’osservazione che
b s
1 iλs
χ[r,s] (x)eiλx dx = eiλx dx = (e − eiλr ) → 0 .
a r iλ
Siamo ora in grado di dimostrare un fondamentale risultato di convergenza puntuale delle

serie di Fourier.
Teorema. Sia f ∈ L1 (−π, π) ed esista δ > 0 tale che

δ
f (x + t) − f (x)
| |dt < +∞
−δ t
(condizione di Dini). Allora

lim SN (f )(x) = f (x) .
N →+∞
Dimostrazione. Vista, in virtù della validità della condizione di Dini, l’integrabilità (f (x + z) −

f (x))/ sin z/2 , applicando il lemma con λ = N + 1/2 si trova

1 π f (x + z) − f (x) z/2
SN (f )(x) − f (x) = sin(N + 1/2)zdz → 0
π −π z sin z/2
per N → +∞. q.e.d.
Osservazione. La condizione di Dini può essere sostituita da altre condizioni, ma non sem-
plicemente omessa. Vi sono infatti funzioni anche continue la cui serie di Fourier non converge
in certi punti. Esistono funzioni in L1 la cui serie di Fourier risulta ovunque non convergente
(risultato di A.N.Kolmogorov, indicato in Kolmogorov-Fomin[15]).
Il teorema si può facilmente generalizzare nel modo seguente:

Teorema. Sia f ∈ L1 , siano f (x ± 0) i soui limiti destro e sinistro in x e risulti

0
f (x + t) − f (x − 0) δ
f (x + t) − f (x + 0)
| |dt < +∞, , | |dt < +∞ .
−δ t 0 t
Allora
f (x + 0) + f (x − 0)
lim SN (f )(x) − =0.
N 2
Basta ripetere la dimostrazione precedente, operando però separatamente a sinistra e a destra
di x, tenendo conto che il nucleo di Dirichlet è una funzione pari.
8.6 Nucleo di Fejér. Convergenza uniforme e in Lp .

Per avere convergenza uniforme, essendo le ridotte della serie di Fourier funzioni continue, è
necessario (ma non sufficiente) che la funzione sviluppata sia continua.
Un risultato particolare, ma importante, riguarda funzioni derivabili con derivata in L2 :
Teorema. Sia f periodica, di periodo 2π, e assolutamente continua, con derivata in L2 .

Allora la serie di Fourier di f converge uniformemente a f e la serie di Fourier di f (convergente
in L2 (−π, π) ) si ottiene derivando termine a termine la serie di Fourier di f .
Dimostrazione. L’assoluta continuità di f e l’integrabilità di f consentono di applicare la
formula di integrazione per parti, per mettere in relazione i rispettivi coefficienti cn e cn :
π
1
cn = f (x)e−inx dx =
2π −π
π
1 1 c
= f (x)e−inx |π−π + f (x)e−inx dx = n .
−2πin 2πin −π in
Allora dalla maggiorazione
cn 1
| ≤ (|cn |2 + 2 ) ,
2|cn | = 2|
n n
in virtù della disuguaglianza di Bessel la serie

cn einx
n
risulta totalmente convergente. Sia g la sua somma. Le funzioni f e g sono continue e hanno
gli stessi coefficienti di Fourier. Ma Ogni funzione continua è univocamente individuata dalla
sua serie di Fourier. Infatti se due funzioni f e g hanno gli stessi coefficienti, allora la differenza
f − g ha coefficienti di Fourier tutti nulli ed essendo in L2 è q.o. nulla; ma f − g è continua e
dunque nulla ovunque.
Derivando poi la serie termine a termine si trova ovviamente la serie di Fourier di f , con-
vergente il media quadratica. q.e.d.

Osservazione. Se f è derivabile ovunque con derivata integrabile nel senso di Riemann (quin-
di limitata), le condizioni del teorema sono soddisfatte.
Per ricostruire la funzione f dalla sua serie di Fourier si può ricorrere (Fejér, 1905) alle
somme di Cesaro
N −1
1
CN (f )(x) = Sk (f )(x) ,
N
k=0
cioè alle medie aritmetiche delle somme simmetriche precedentemente considerate.
Le somme di Cesaro si possono scrivere come convoluzione di f con i nuclei di Fejér
1 sin N z/2 2
FN (z) = ( ) :
2πN sin z/2
π
CN (f )(x) = FN (z)f (x + z)dz .
−π
Infatti
N −1 −1
1
N
1 1
FN (z) = DN (z) = sin(2k + 1)z/2 .
N 2πN sin z/2
k=0 k=0
Ma
ei(k+1/2)z − e−i(k+1/2)z
sin(2k + 1)z/2 = ,
2i

N −1
eiN z − 1 eiN z − 1
eiz/2 (eiz )k = eiz/2 = ,
eiz − 1 eiz/2 − e−iz/2
k=0
1 e −1
iN z
e−iN z − 1 1
( iz/2 −iz/2
− −iz/2
)= 2
(eiN z/2 − e−iN z/2 )2
2i e −e e −e iz/2 (2i) sin z/2
e dunque i nuclei di Fejér hanno la forma indicata.
I nuclei di Fejér hanno evidentemente le proprietà seguenti

π
FN (z) ≥ 0 , FN (−z) = FN (z) , FN (z)dz = 1 .
−π
Inoltre per ogni δ > 0 risulta

−δ π
lim FN (z)dz = lim FN (z)dz = 0 .
n −π n δ
Infatti, per δ/2 < x < π/2 , la funzione (sin x)/x è decrescente e quindi per δ < z < π
sin δ/2 sin π/2 δ

sin z/2 ≥ sin δ/2 = δ/2 ≥ δ/2 = ,
δ/2 π/2 π

Elementi Di Analisi Funzionale PDF

Caricato da

Informazioni sul documento

Titolo originale

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Elementi Di Analisi Funzionale PDF

Caricato da

Copyright:

Formati disponibili

Prefazione

Torino, novembre 2004

2 Punti ﬁssi. Punti di equilibrio e Teoremi di min-max. Γ-convergenza 17

3 Operatori lineari. Equazioni integrali 47

5 Operatori autoaggiunti compatti negli spazi di Hilbert. Problemi ellittici in

6 Compattezza negli spazi metrici. Equicontinuità 99

7 I teoremi fondamentali dell’Analisi funzionale 109

8 Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie 131

1.1 Spazi metrici.

∀ε > 0 ∃ν ∀n > ν d(xn , l) < ε ,

sono successioni di Cauchy, cioè tali che

∀ε > 0 ∃ν ∀n, m > ν d(xn , xm ) < ε .

È noto che (Cn , dp ), p ∈ [1, +∞], dove

è uno spazio metrico completo.

Lo spazio (C(K), d∞ ) delle funzioni a valori complessi, continue su un compatto K e munito

Lo spazio delle funzioni olomorfe su un aperto Ω di C, munito della distanza

dove K0 , K1 ... è una successione esaustiva di compatti ( K0 ⊂ K1 ⊂ ... e ∪+∞

& & &

1.2 Spazi normati.

Deﬁnizione. Si dice che (S, · ) è uno spazio normato se:

Quaderni Didattici del Dipartimento di Matematica

La norma induce naturalmente la distanza

Ad esempio (Cn , · p ) è uno spazio di Banach, avendo posto

È immediato veriﬁcare che · ∞ è una norma, osservando in particolare che

Per il caso p ∈ [1, +∞[ conviene ricorrere ad alcune disuguaglianze fondamentali.

Disuguaglianza di Young. Sia p > 1 e si deﬁnisca l’esponente coniugato q nel modo

Altra dimostrazione della disuguaglianza di Young. Se a o b è uguale a 0 la disuguagianza è

Università di Torino, a.a. 2003-2004

Figura 1.1: Triangoli curvilinei S1 ed S2 individuati dalla curva y = xp−1 con p = 3.

Disuguaglianza di Hölder.Per qualsiansi x, y ∈ Cn risulta

Quaderni Didattici del Dipartimento di Matematica

dove p e q sono esponenti coniugati e se p = 1 allora q = +∞. La disuguaglianza si può anche

Dimostrazione. La disuguaglianza si veriﬁca immediatamente se p = 1 oppure se x = 0 o y = 0.

allora, per la disuguaglianza di Young

e sommando al variare di i si trova

E per la positiva omogeneità delle funzioni · p si ottiene il risultato.

Ma essendo q(p − 1) = p, si trova

La norma · ∞ = max1≤k≤n |xk | si ottiene al limite per p → +∞ :

Università di Torino, a.a. 2003-2004

L’integrabilità di f g , viste le proprità dell’integrale, discende ancora dalla disuguaglianza di

Nel secondo caso f + g ∈ Lp perchè ad esempio

|f (x) + g(x)|p ≤ 2p max(|f (x)|p , |g(x)|p ) ≤ 2p (|f (x)|p + |g(x)|p ) .

In eﬀetti si ha la disuguaglianza più precisa seguente.

Proposizione. Siano a, b numeri reali non negativi e p ≥ 1. Allora

(a + b)p ≤ 2p−1 (ap + bp ) .

Dimostrazione. Se p = 1 la disuguaglianza è ovvia. Per p > 1, ricorrendo alla disuguaglianza di

ψ(x) = (1 + x)p − 2p−1 (1 + xp ) ,

ψ(1) = 0 , ψ(0) = 1 − 2p−1 < 0 , lim ψ(x) = −∞

Quaderni Didattici del Dipartimento di Matematica

e quindi la funzione ψ assume il valore massimo in 1 e si mantiene sempre ≤ 0. q.e.d.

Negli spazi Lp (X, A, µ) , se µ(X) < +∞ , si ha, come in Rn ,

essendo in questo caso

Teorema. (C(K), · ∞ ), o come diremo più semplicemente, sottintendendo la norma,

Università di Torino, a.a. 2003-2004

Teorema. In Rn (più in generale su ogni spazio vettoriale di dimensione ﬁnita su R o su

Dimostrazione. Sia {ek } la base canonica di Rn e per

L’insieme S = {x ∈ R | x 1 = 1} è compatto. Se · è una norma arbitraria su Rn , posto

Dunque la funzione x → x è continua ovunque, quindi su S, per la distanza d1 (x, y) = x−y 1 :

Allora c = minx∈S x > 0 perchè 0 ∈ S. Ne segue, qualsiasi x,

1.3 Seminorme e spazi localmente convessi

Deﬁnizione. Si dice che p : X → R è una seminorma nello spazio vettoriale X su K,

Quaderni Didattici del Dipartimento di Matematica

A è un insieme arbitrario di indici. Lo spazio X munito della famiglia S di seminorme si dice

L’insieme S = {x ∈ R | x1 = 1} è compatto. Se · è una norma arbitraria su Rn , posto

Dunque la funzione x → x è continua ovunque, quindi su S, per la distanza d1 (x, y) = x−y1 :