Sei sulla pagina 1di 149

Prefazione

Questa breve monografia si propone di presentare in modo piano e sintetico, ma con dimo-
strazioni rigorose e generalmente complete, i principali temi e metodi dell’Analisi funzionale. Si
è cercato di selezionare e proporre percorsi che siano quanto piú possibile “naturali”, partendo
da nozioni elementari e procedendo verso argomenti classici piú avanzati, quali i teoremi fon-
damentali dell’Analisi funzionale, le topologie deboli e deboli*, gli operatori duali e il teorema
dell’immagine chiusa, le questioni di compattezza e compattezza sequenziale. Si sono voluti
inserire brevemente temi non frequenti in monografie di questo tipo, quali risultati di punto
fisso (Brouwer, Schuauder) e di punti di equilibrio (Nash, Ky Fan, Aubin), teoria dei giochi o
gamma-convergenza (DeGiorgi), accanto a temi tradizionali quali elementi di teoria spettrale,
problemi ellittici in dimensione 1, serie di Fourier e risultati fondamentali sulle funzioni continue
(Baire, Stone-Weierstrass). Spesso si è avuto cura di presentare significativi controesempi per
illuminare a fondo i concetti essenziali.

Il testo che presentiamo nasce da una lunga riflessione sui principi fondamentali, riduzione
all’essenziale, rielaborazione, completamento ed estensione di parte degli appunti di un corso
di Istituzioni di Analisi superiore tenuto per molti anni per il Corso di laurea in Matematica
della Facoltà di Scienze M.F.N. dell’Università di Torino. Ha tuttavia l’ambizione di non essere
semplicemente un’opera didattica, ma di fornire un supporto direttamente utile per l’attivià di
ricerca, anzi di sollecitare interrogativi sui fondamenti che potrebbero suggeririre nuove indagini.

Il corso di Istituzioni di Analisi superiore del vecchio ordinamento era diviso in due moduli.
Il primo modulo, rivolto a tutti gli studenti del secondo biennio, oltre a primi elementi di ana-
lisi funzionale e di teoria delle funzioni olomorfe, proponeva le basi della teoria della misura e
dell’integrazione e svolgeva inoltre essenzialmente il contenuto dei Capitoli 1 e 3 e presentando
una sintesi dei risultati dei Capitoli 4 e 5 di questo testo. Il materiale degli altri capitoli era
utilizzato, parzialmente, nel secondo modulo, che aveva un carattere più avanzato e presentava,
oltre a complementi di teoria della misura, temi concernenti i fondamenti dell’analisi funzionale,
alcuni metodi di compattezza, elementi di teoria spettrale e di analisi armonica.
Con il nuovo ordinamento, la teoria delle funzioni olomorfe e i primi elementi di analisi funziona-
le sono presentati in Analisi IV (laurea triennale e laurea specialistica), mentre le questioni piú
avanzate di analisi funzionale e di teoria generale della misura e dell’integrazione sono trattate
nel corso di Istituzioni di Analisi (laurea specialistica). Molti temi presenti in questa monografia
potrebbero essere utili per un corso base di Analisi per il Dottorato.

Torino, novembre 2004


ANGELO NEGRO
Indice

1 Spazi normati 5
1.1 Spazi metrici. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Spazi normati. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3 Seminorme e spazi localmente convessi . . . . . . . . . . . . . . . . . . . . 12
1.4 Insiemi ordinati e spazi di Riesz . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Punti fissi. Punti di equilibrio e Teoremi di min-max. Γ-convergenza 17


2.1 Punti fissi di contrazioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Punti fissi in insiemi parzialmente ordinati e Lemma di Zorn . . . . . . 20
2.3 I teoremi di Brouwer e Schauder . . . . . . . . . . . . . . . . . . . . . . . . 22
2.4 Punti di equilibrio. Teoremi di minimax . . . . . . . . . . . . . . . . . . . 31
2.5 Gamma convergenza . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42

3 Operatori lineari. Equazioni integrali 47


3.1 Lo spazio L(X, Y ). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 La serie di Neumann e l’inseme GL(X, Y ). . . . . . . . . . . . . . . . . . . 49
3.3 Operatori integrali in C([a, b]) . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.4 Equazioni integrali in C([a, b]) . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5 Approssimazione di equazioni integrali mediante nuclei separabili di
rango finito. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4 Spazi di Hilbert 63
4.1 Forme sesquilineari . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
4.2 Il teorema delle proiezioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66
4.3 Basi ortonormali e serie di Fourier generalizzate . . . . . . . . . . . . . . 70
4.4 Il duale di uno spazio di Hilbert e il teorema di Riesz. La convergenza
debole . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73

5 Operatori autoaggiunti compatti negli spazi di Hilbert. Problemi ellittici in


dimensione 1 77
5.1 Definizioni e proprietà elementari. . . . . . . . . . . . . . . . . . . . . . . . 77
5.2 Autovalori e autofunzioni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
5.3 I teoremi di Hilbert e Fischer-Courant. . . . . . . . . . . . . . . . . . . . . 82
5.4 Risoluzioni dell’identità e rappresentazioni spettrali. . . . . . . . . . . . 84

3
5.5 L’ideale degli operatori compatti. . . . . . . . . . . . . . . . . . . . . . . . . 86
5.6 Compattezza di operatori integrali. . . . . . . . . . . . . . . . . . . . . . . 87
5.7 Problemi ellittici in dimensione 1. Minorazione degli autovalori . . . . 92
5.8 La funzione di Green e l’equazione integrale equivalente. . . . . . . . . 94
5.9 Autovalori ed autofunzioni. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6 Compattezza negli spazi metrici. Equicontinuità 99


6.1 Equicontinuità. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 99
6.2 Compattezza negli spazi metrici. . . . . . . . . . . . . . . . . . . . . . . . . 101
6.3 Criterio di compattezza in C(K; F ). . . . . . . . . . . . . . . . . . . . . . . 105
6.4 Criteri di compattezza in Lp (Ω). . . . . . . . . . . . . . . . . . . . . . . . . 106
6.5 Il teorema di Peano. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107

7 I teoremi fondamentali dell’Analisi funzionale 109


7.1 Premesse: Spazi di Baire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
7.2 Il teorema di uniforme limitatezza . . . . . . . . . . . . . . . . . . . . . . . 112
7.3 Spazi duali. Topologie deboli . . . . . . . . . . . . . . . . . . . . . . . . . . 113
7.4 I teoremi dell’applicazione aperta e del grafico chiuso . . . . . . . . . . 117
7.5 Il teorema di Hahn-Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
7.6 Operatori duali e aggiunti. Continuità forte e debole . . . . . . . . . . . 124
7.7 Il Teorema dell’immagine chiusa di Banach . . . . . . . . . . . . . . . . . 126
7.8 Compattezza e compattezza sequenziale debole . . . . . . . . . . . . . . 128

8 Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie 131


8.1 Spazi pre-Hilbertiani di funzioni continue e serie di Fourier ordinarie. 131
8.2 Convergenza monotona. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
8.3 Approssimazione di funzioni continue mediante funzioni speciali. . . . 133
8.4 Presentazioni equivalenti della serie di Fourier. . . . . . . . . . . . . . . . 141
8.5 Nucleo di Dirichlet. Convergenza puntuale. . . . . . . . . . . . . . . . . . 142
8.6 Nucleo di Fejér. Convergenza uniforme e in Lp . . . . . . . . . . . . . . . 144

Bibliografia 147
Capitolo 1

Spazi normati

1.1 Spazi metrici.


Definizione. Una applicazione d

d : S × S → R+

si dice distanza in S se e solo se, per elementi arbitrari x, y, z ∈ S, sono soddisfatte le seguenti
tre proprietà:

1) d(x, y) = 0 ⇔ x = y ,
2) d(x, y) = d(y, x) (simmetria),
3) d(x, y) ≤ d(x, z) + d(z, y) (disuguaglianza triangolare).

(S, d), cioè S munito della particolare metrica d, si dice spazio metrico.

È noto ed è immediato verificare che in ogni spazio metrico tutte le successioni {xn }n∈N
convergenti, cioè tali che, detto l il loro limite, si abbia

∀ε > 0 ∃ν ∀n > ν d(xn , l) < ε ,

sono successioni di Cauchy, cioè tali che

∀ε > 0 ∃ν ∀n, m > ν d(xn , xm ) < ε .

Definizione. Se in (S, d) tutte le successioni di Cauchy sono convergenti si dice che (S, d)
è uno spazio metrico completo .

È noto che (Cn , dp ), p ∈ [1, +∞], dove


 n
( i=1 |xi − yi |p )1/p 1 ≤ p < +∞
dp (x, y) = ,
max1≤i≤n |xi − yi | p = +∞

5
6 Capitolo 1. Spazi normati

è uno spazio metrico completo.

* * *

Lo spazio (C(K), d∞ ) delle funzioni a valori complessi, continue su un compatto K e munito


della distanza del massimo:
d∞ (f, g) = max |f (t) − g(t)| ,
t∈K
è uno spazio metrico completo.

Lo spazio delle funzioni olomorfe su un aperto Ω di C, munito della distanza


+∞

d(ϕ, ψ) = 1/2j min(1, max |ϕ(z) − ψ(z)|) ,
z∈Kj
j=0

dove K0 , K1 ... è una successione esaustiva di compatti ( K0 ⊂ K1 ⊂ ... e ∪+∞


j=0 Kj = Ω ) è uno
spazio metrico completo.

Lo spazio Lp (Ω) delle (classi di) funzioni reali definite q.o. nell’aperto Ω di Rn e di potenza
p-esima (p ≥ 1) integrabile rispetto alla misura di Lebesgue è uno spazio metrico completo
rispetto alla distanza 
d(u, v) = ( |u(x) − v(x)|p dx)1/p .

Se si considerassero soltanto funzioni integrabili nel senso di Cauchy-Riemann non si otterrebbe
uno spazio completo.

& & &

Un sottoinsieme chiuso C di S, dove (S, d) è completo, munito delle metrica indotta che
indicheremo ancora con d, dà luogo ad uno spazio metrico completo (C, d).

1.2 Spazi normati.


In molti casi che si presentano in Analisi l’insieme S è munito di una struttura di spazio vet-
toriale e la distanza è indotta da una norma. Ci limiteremo a considerare solo spazi vettoriali
su R o su C.

Definizione. Si dice che (S, · ) è uno spazio normato se:


1) S è uno spazio vettoriale su R o su C ,
2) · : S → R+ è una norma,
cioè se per qualsiansi x, y ∈ S e per qualunque scalare λ
a) x = 0 ⇔ x = 0 ,
b) λx = |λ| x ,
c) x + y ≤ x + y .

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 7

La norma induce naturalmente la distanza


d(x, y) = x − y ,
e quindi (S, d) è uno spazio metrico. Se (S, d) risulta completo, allora (S, · ) si dice spazio di
Banach .

Ad esempio (Cn , · p ) è uno spazio di Banach, avendo posto


 n
( i=1 |xi |p )1/p 1 ≤ p < +∞
x p = .
max1≤i≤n |xi | p = +∞

È immediato verificare che · ∞ è una norma, osservando in particolare che


max |xj + yj | ≤ max(|xj | + |yj |) ≤ max |xi | + max |yk | .
j j i k

Per il caso p ∈ [1, +∞[ conviene ricorrere ad alcune disuguaglianze fondamentali.

Disuguaglianza di Young. Sia p > 1 e si definisca l’esponente coniugato q nel modo


seguente
1 1
+ =1.
p q
È evidente che p è a sua volta l’esponente coniugato di q, che 1/2 è coniugato di sé stesso e che
q tende a +∞ quando p tende a 1.
Conviene anche osservare che
1 1 p−1 p q 1
=1− = , =p−1 , =q−1= .
q p p q p p−1
Per a e b reali nonnegativi arbitrari risulta
ap bq
ab ≤ + .
p q
Dimostrazione. Si consideri la figura seguente, dalla quale appare evidente che il rettangolo
di lati a e b ha un’area minore o uguale della somma delle aree dei due triangoli (in genere
curvilinei) S1 e S2, individuati dalla curva di equazione
y = xp−1 ovvero x = y q−1 .
Pertanto
 a  b
ab ≤ area(S1) + area(S2) = xp−1 dx + y q−1 dy q.e.d.
0 0

Altra dimostrazione della disuguaglianza di Young. Se a o b è uguale a 0 la disuguagianza è


ovvia. Altrimenti dividiamo per ab ed otteniamo la disuguaglianza equivalente
1 ap−1 1 bq−1
1≤ + .
p b q a

Università di Torino, a.a. 2003-2004


8 Capitolo 1. Spazi normati

p=3

y S2
2

S1

0 1 2 3 4
x

Figura 1.1: Triangoli curvilinei S1 ed S2 individuati dalla curva y = xp−1 con p = 3.

Poniamo
ap−1 ap/q bq−1
x= = , dunque = x−q/p ,
b b a

x x−q/p
f (x) = 1 − − .
p q
Risulta
1 1 q 1
f (1) = 0 , f  (x) = − + x−q/p−1 , f  (1) = 0 , f  (x) = (− − 1) x−q/p−2 ≤ 0 .
p p p p

Dunque f (x) è concava, assume il valore massimo 0 per x = 1 e per ogni x positivo si ha
f (x) ≤ 0, q.e.d.

Disuguaglianza di Hölder.Per qualsiansi x, y ∈ Cn risulta


n 
n 
n
|xi yi | ≤ ( |xi |p )1/p ( |yi |q )1/q ,
i=1 i=1 i=1

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 9

dove p e q sono esponenti coniugati e se p = 1 allora q = +∞. La disuguaglianza si può anche


scrivere, ponendo (xy)j = xj yj ,
xy 1 ≤ x p y q .

Dimostrazione. La disuguaglianza si verifica immediatamente se p = 1 oppure se x = 0 o y = 0.


Supponiamo allora x e y non nulli e p ≥ 1. Normalizziamo x e y, ponendo
x y
u= ,v = ,
x p y q

allora, per la disuguaglianza di Young

|ui |p |vi |q
|ui ||vi | ≤ +
p q

e sommando al variare di i si trova


u p v q 1 1
uv 1 ≤ + = + =1.
p q p q

E per la positiva omogeneità delle funzioni · p si ottiene il risultato.

Possiamo ora controllare che · p è una norma. Mentre le prime due proprietà caratteristiche
delle norme sono evidenti, la verifica della disuguaglianza triangolare (detta in questo caso
anche disuguaglianza di Minkowski) si può ottenere ricorrendo alla disuguaglianza di Hölder.
Supporremo p > 1 ; in caso contrario il risultato è immediato. Supporremo inoltre x + y = 0 .


n 
n 
n
|xk + yk |p ≤ |xk + yk |p−1 |xk | + |xk + yk |p−1 |yk | ≤
k=1 k=1 k=1


n 
n 
n
≤( |xk + yk |q(p−1) )1/q (( |xk |p )1/p + ( |yk |p )1/p ) .
k=1 k=1 k=1

Ma essendo q(p − 1) = p, si trova


n 
n 
n
( |xk + yk |p )1−1/q ≤ ( |xk |p )1/p + ( |yk |p )1/p ) . q.e.d.
k=1 k=1 k=1

La norma · ∞ = max1≤k≤n |xk | si ottiene al limite per p → +∞ :

lim x p = x ∞ ,
p→+∞

infatti, per x = 0
  |xk |
x p = ( |xk |p )1/p = x ∞ ( ( )p )1/p ,
x ∞
k k

Università di Torino, a.a. 2003-2004


10 Capitolo 1. Spazi normati

 |xk | p
1≤ ( ) ≤n
x ∞
k
e
lim 11/p = lim n1/p = 1 .
p→+∞ p→+∞

Anche negli spazi Lp (Ω) (e più generalmente negli spazi Lp (X, A, µ) ) valgono le disugua-
glianze di Hölder e di Minkowski:
  
|f (x)g(x)|dx ≤ ( |f (x)| ) ( |g(x)|q )1/q ,
p 1/p
Ω Ω Ω
  
( |f (x) + g(x)|p )1/p ≤ ( |f (x)|p )1/p + ( |g(x)|p )1/p .
Ω Ω Ω
Le dimostrazioni sono analoghe, sostituendo integrali a somme e facendo riferimento alla di-
suguaglianza di Young. In questi casi sarebbe però necessario controllare, come si può fare
agevolmente, che f ∈ Lp , g ∈ Lq implica f g ∈ L1 e che f, g ∈ Lp implica f + g ∈ Lp , ovvero
che esistono gli integrali che appaiono nelle formule precedenti.

L’integrabilità di f g , viste le proprità dell’integrale, discende ancora dalla disuguaglianza di


Young: |f (x)g(x)| ≤ |f (x)|p /p + |g(x)|q /q.

Nel secondo caso f + g ∈ Lp perchè ad esempio

|f (x) + g(x)|p ≤ 2p max(|f (x)|p , |g(x)|p ) ≤ 2p (|f (x)|p + |g(x)|p ) .

In effetti si ha la disuguaglianza più precisa seguente.

Proposizione. Siano a, b numeri reali non negativi e p ≥ 1. Allora

(a + b)p ≤ 2p−1 (ap + bp ) .

Dimostrazione. Se p = 1 la disuguaglianza è ovvia. Per p > 1, ricorrendo alla disuguaglianza di


Hölder si ha
(a + b) ≤ (1q + 1q )1/q (ap + bp )1/p = 2(p−1)/p (ap + bp )1/p
e il risultato segue immediatamente.
Alternativamente si può ragionare nel modo seguente: se p = 1 oppure a = 0 la proposizione è
ovvia. Se p > 1 e a = 0, dividendo per ap , posto x = b/a e

ψ(x) = (1 + x)p − 2p−1 (1 + xp ) ,

risulta
ψ  (x) = p(1 + x)p−1 − 2p−1 pxp−1
che si annulla soltanto per x = 1 . Inoltre

ψ(1) = 0 , ψ(0) = 1 − 2p−1 < 0 , lim ψ(x) = −∞


x→+∞

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 11

e quindi la funzione ψ assume il valore massimo in 1 e si mantiene sempre ≤ 0. q.e.d.

Negli spazi Lp (X, A, µ) , se µ(X) < +∞ , si ha, come in Rn ,


lim f p = f ∞ ,
p→+∞

essendo in questo caso


f ∞ = essential sup |f (x)| .
x∈X

Anche (C(K), · ∞ ), spazio delle funzioni continue (ad esempio a valori complessi) sul
compatto K , munito della norma
f ∞ = max |f (t)| ,
t∈K

è uno spazio di Banach. Infatti si verifica subito che f ∞ è una norma e vale il seguente

Teorema. (C(K), · ∞ ), o come diremo più semplicemente, sottintendendo la norma,


C(K) è completo.

Dimostrazione. Sia {fn } una successione di Cauchy in C(K). Allora per ogni t ∈ K {fn (t)}
è una successione di Cauchy in C , che è completo. Dunque fn (t) converge ad un limite in C
dipendente da t, che indicheremo con f (t).
Inoltre, la convergenza delle fn ad f non è soltanto puntuale, ma anche uniforme, in quanto,
per ogni ε, per n sufficientemente grande si ha per ogni t:
|fn (t) − f (t)| = lim |fn (t) − fn+q (t)| ≤ ε ,
q→+∞

perchè
fn − fn+q ∞ ≤ ε ,
essendo fn di Cauchy per · ∞ .
La funzione f ∈ C(K) : infatti, fissato s, per ogni ε esiste un indice N ed esiste un intorno
VN (s) tali che
|f (t) − f (s)| ≤ |f (t) − fN (t)| +|fN (t) − fN (s)| +|fN (s) − f (s)|
≤ε ≤ε ≤ε
∀t ∈ K ∀t ∈ VN (s) ∀s ∈ K .
Allora la convergenza uniforme delle fn ad f si esprime scrivendo
lim fn − f ∞ = 0 q.e.d.
n→+∞

Si dice che due norme · a e · b in uno spazio vettoriale V sono equivalenti se e solo se
esistono due costanti c, C tali che
∀x ∈ V c x a ≤ x b ≤ C x a .

Università di Torino, a.a. 2003-2004


12 Capitolo 1. Spazi normati

Teorema. In Rn (più in generale su ogni spazio vettoriale di dimensione finita su R o su


C) tutte le norme sono equivalenti.

Dimostrazione. Sia {ek } la base canonica di Rn e per


 
x= xk ek sia x 1 = |xk | .
k k

L’insieme S = {x ∈ R | x 1 = 1} è compatto. Se · è una norma arbitraria su Rn , posto


n

C = maxk ek , si ha
 
∀x x = xk ek ≤ |xk | ek ≤ C x 1 .
k k

Dunque la funzione x → x è continua ovunque, quindi su S, per la distanza d1 (x, y) = x−y 1 :

| x − y | ≤ x − y ≤ C x − y 1 .

Allora c = minx∈S x > 0 perchè 0 ∈ S. Ne segue, qualsiasi x,


x x
z= ∈S e c ≤ z = .
x 1 x 1
Dunque c x 1 ≤ x ≤ C x 1 q.e.d.

1.3 Seminorme e spazi localmente convessi


Si dice spazio vettoriale topologico uno spazio vettoriale munito di una topologia com-
patibile con la struttura di spazio vettoriale, cioè una topologia per la quale le operazioni di
somma di vettori e di moltiplicazione di uno scalare per un vettore sono continue.
Abbiamo in precedenza sempre considerato spazi vettoriali nei quali la topologia era indotta
da una norma, cioè spazi vettoriali normati. Gli spazi localmente convessi costituiscono una
classe più ampia e molto importante di spazi vettoriali, nei quali una topologia compatibile
con la struttura di spazio vettoriale è indotta da una famiglia di seminorme, invece che da una
singola norma.
Anche partendo da uno spazio normato E, gli spazi E ed E ∗ muniti delle topologie deboli o
deboli*, quelle che inducono le convergenze deboli o deboli* che considereremo al Capitolo 7,
risultano essere spazi localmente convessi.

Definizione. Si dice che p : X → R è una seminorma nello spazio vettoriale X su K,


dove K = R o K = C, se e solo se

a) ∀x ∈ X p(x) ≥ 0,
b) ∀x, y ∈ X p(x + y) ≤ p(x) + p(y),
c) ∀x ∈ X ∀λ ∈ K p(λx) = |λ|p(x).

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 13

Ovviamente segue da c) che p(0) = 0. Ma può essere p(x) = 0 anche se x = 0. Una norma è
una seminorma per la quale p(x) = 0 ⇒ x = 0.

Definizione. Sia X uno spazio vettoriale su R o su C e sia S = {pa (x); a ∈ A} una famiglia
di seminorme in X soddisfacenti l’assioma di separazione:

∀x ∈ X ∃a ∈ A pa (x) = 0 .

A è un insieme arbitrario di indici. Lo spazio X munito della famiglia S di seminorme si dice


spazio vettoriale localmente convesso (separato).
In X viene indotta canonicamente una topologia, compatibile con la struttura vettoriale, asse-
gnando ad ogni punto x0 il sistema fondamentale di intorni V della forma:

V = x0 + U ,

dove
U = { x ∈ X | paj (x) ≤ εj , j = 1, 2, ...n} ,
con n intero arbitrario, aj , indici arbitrari e εj , numeri positivi arbitrari.
Gli insiemi U sono ovviamente un sistema fondamentale di intorni di 0 e generano per traslazione
un sistema fondamentale di intorni di ogni altro punto.
La dizione “localmente convesso è dovuta al fatto che gli insiemi U sono convessi, e dunque ogni
punto ammette un sistema fondamentale di intorni convessi, come risulta dalla proposizione
seguente.

Proposizione. Sia p(x) una seminorma su X . Allora, per ogni c > 0 , l’insieme W = { x ∈
X | p(x) ≤ c } ha le proprietà seguenti:
1) 0∈W ;
2) W è convesso : λ ∈ [0, 1] e x, y ∈ W implicano (1 − λ)x + λy ∈ W ;
3) W è equilibrato : |λ| ≤ 1 e x ∈ W implicano λx ∈ W ;
4) W è assorbente : per ogni x ∈ X , esiste ρ > 0 tale che x ∈ ρW ;
5) la seminorma p è univocamente individuata da W , mediante la formula

p(x) = inf ρc .
ρ>0,x∈ρW

La dimostrazione comporta soltanto verifiche immediate. Per il punto 5) basta osservare che
p(x) ≤ ρc equivale a p(x/ρ) ≤ c, cioè x/ρ ∈ W ovvero x ∈ ρW . Si controlla anche che, se W
è un qualunque sottoinsieme di X convesso, equilibrato ed assorbente, la formula del punto 5)
definisce una seminorma in X. Come vedremo nel capitolo 2, p è il funzionale di Minkowski
del convesso assorbente W ; essendo W equilibrato il funzionale di Minkowski di W soddisfa la
condizione p(λx) = |λ|p(x).

Esempio 1. Sia Ω un aperto del piano complesso. In C(Ω), spazio delle funzioni contine in
Ω a valori complessi, la topologia della convergenza uniforme sui compatti è localmente covessa
ed è definita dalla famiglia di seminorme

{ pK (f ) = max |f (x)| } , K ⊂ Ω ,
x∈K

Università di Torino, a.a. 2003-2004


14 Capitolo 1. Spazi normati

dove K è un qualunque compatto contenuto in Ω. È chiaro che può essere pK (f ) = 0 anche se


f = 0, per esempio se non si annulla ovunque in Ω − K.
È sufficiente considerare una famiglia numerabile ed esaustiva di compatti:

K1 ⊂ K2 ⊂ ... , ∪j Kj = Ω

e le seminorme associate p1 , p2 , ... . La topologia è dunque metrizzabile, cioè è indotta da una


distanza, per esempio
 1 pn (f − g)
d(f, g) = ,
n
2n 1 + pn (f − g)
oppure
 1
d∗ (f, g) = min(1, pn (f − g)) .
n
2n

Le funzioni olomorfe in Ω, H(Ω), sono un sottospazio chiuso di C(Ω) relativamente a questa


topologia localmente convessa.

* * *

Esempio 2. Sia E uno spazio di Banach ed E ∗ il suo duale topologico. La convergenza debole
in E è indotta da una topologia debole, più debole della topologia iniziale indotta dalla norma.
Tale topologia debole è localmente convesse e generata, per esempio, dalle seminorme

pF (x) = max(|f1 (x)|, |f2 (x)|, ..., |fn (x)|) ,

dove F = { f1 , f2 , ..., fn } è un generico sottoinsieme finito di E ∗ .

In modo analogo si introduce la topologia debole* in E ∗ .

& & &

1.4 Insiemi ordinati e spazi di Riesz


Definizione. Uno spazio vettoriale X su R è uno spazio di Riesz se e solo se:
1) X è munito di una relazione d’ordine (parziale) compatibile con la struttura di spazio vetto-
riale, cioè:
i) qualsiansi x, y, z ∈ X si ha x ≤ y ⇒ x + z ≤ y + z,
ii) qualsiansi x, y ∈ X e λ > 0 si ha x ≤ y ⇒ λx ≤ λy;
2) qualsiansi x, y ∈ X esistono in X x ∨ y = sup(x, y) e x ∧ y = inf(x, y). (sup(x, y) è definito
come (unico) elemento che maggiora x e y ed è ≤ di ogni maggiorante di x e y; inf(x, y) è definito
analogamente.)

Esempio. C(K) con la relazione d’ordine parziale

f ≤g ↔ ∀x ∈ K f (x) ≤ g(x)

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 15

è uno spazio di Riesz.

In uno spazio di Riesz si pone, come usuale:

x+ = x ∨ 0 , x− = −(x ∧ 0) , |x| = x+ + x−

e quindi ogni elemento x si può presentare come differenza di due elementi positivi, essendo
canonica la presentazione:
x = x+ − x− , x+ ≥ 0 , x− ≥ 0 .
Per un primo approfondimento si può vedere Bourbaki[3].

Università di Torino, a.a. 2003-2004


16 Capitolo 1. Spazi normati

Quaderni Didattici del Dipartimento di Matematica


Capitolo 2

Punti fissi. Punti di equilibrio e


Teoremi di min-max.
Γ-convergenza

2.1 Punti fissi di contrazioni


Teorema del punto fisso per le contrazioni (di Banach-Caccioppoli). Sia (S, d)
uno spazio metrico completo ed A : S → S una applicazione da S in sé stesso. Se A è una
contrazione, cioè se
∃L < 1 ∀x, y ∈ S d(Ax, Ay) ≤ Ld(x, y) ,
allora esiste un unico punto fisso di A, cioè

∃!z ∈ S z = Az .

Si osservi che A è una applicazione uniformemente continua, in quanto Lipschitziana (con co-
stante di Lipschitz L < 1 ).

Osservazione. Si potrebbero dire contrazioni le applicazioni A per le quali d(Ax, Ay) ≤ d(x, y)
e contrazioni strette quelle per le quali d(Ax, Ay) < d(x, y). Per queste tuttavia l’esistenza di
un punto fisso non è garantita.

Dimostrazione. L’unicità è immediata. Infatti se z e z ∗ fossero due punti fissi diversi:

0 < d(z, z ∗ ) = d(Az, Az ∗ ) ≤ Ld(z, z ∗ ) < d(z, z ∗ ) ,

che risulta palesemente assurdo. Per quanto concerne l’esistenza si può utilizzare il metodo
“costruttivo delle approssimazioni successive :

dato x0 ∈ S arbitrario
sia xn+1 = Axn , n ≥ 1 .

17
18 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

Allora:
a) xn è una successione di Cauchy in quanto


n+p−1 
n+p−1
d(xn+p , xn ) ≤ d(xk+1 , xk ) = d(Axk , Axk−1 ) =
k=n k=n


n+p−1 
n+p−1 
p−1
Ln
= d(Ak x1 , Ak x0 ) ≤ Lk d(x1 , x0 ) = Ln d(x1 , x0 ) Li ≤ d(x1 , x0 ) ,
i=0
1−L
k=n k=n

tendente a 0 per n → +∞ indipendentemente da p ;


b) per la completezza di S esiste z tale che

lim xn = z ;
n→+∞

c) per la continuità dell’applicazione A

Az = lim Axn = lim xn+1 = z .


n→+∞ n→+∞

Dunque z è (l’unico) punto fisso di A. q.e.d.

Si osservi che valgono inoltre le seguenti

maggiorazioni dell’errore
Ln
d(xn , z) = lim d(xn , xn+p ) ≤ d(x1 , x0 ) ,
p→+∞ 1−L


p−1
d(xn , z) = lim d(xn , xn+p ) ≤ lim sup d(xn+i , xn+i+1 ) ≤
p p
i=0


p−1
L
≤ lim sup d(xn−1 , xn ) Li+1 ≤ d(xn−1 , xn ) .
p
i=0
1−L
La prima di queste permette, noti x0 e L , di progettare a priori un numero di passi n sufficiente
(ma in genere non necessario) per ottenere con certezza un’approssimazione con una tolleranza
ε prescritta: si determina x1 , poi si calcola d(x1 , x0 ) e infine si prende

(1 − L)ε
n > ln / ln L .
d(x1 , x0 )
La seconda disuguaglianza permette di controllare il processo di approssimazione in corso d’ope-
ra. Calcolando ad ogni passo d(xk , xk−1 ) , se questo valore risulta inferiore a ε(1 − L)/L allora
xk approssima z con un errore inferiore alla tolleranza ε prescritta. Può succedere che k sia
inferiore al valore n fornito dalla prima maggiorazione.

Il teorema del punto fisso ammette una semplice generalizzazione al caso di un’applicazione
una cui iterata sia una contrazione. Scriveremo come al solito An = A ◦ A ◦ ... ◦ A per indicare

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 19

la composizione di n applicazioni uguali ad A , cioè l’iterata n-esima di A .

Teorema. Sia (S, d) uno spazio metrico completo ed A : S → S una applicazione da S in


sé stesso. Se esiste un intero ν tale che Aν è una contrazione, allora A ammette un unico punto
fisso z, coincidente con il punto fisso di B = Aν . Inoltre z si può ottenere con il metodo delle
approssimazioni successive

 dato x0 ∈ S arbitrario
sia xn+1 = Axn , n ≥ 1 ,

allora z = limn xn .

Dimostrazione. Se f = Af allora A2 f = Af = f ... e Bf = Aν f = f . Dunque gli eventuali


punti fissi di A sono punti fissi di B . Ma B è una contrazione stretta e ammette pertanto un
unico punto fisso z : z = Bz. Osserviamo che A commuta con B : A ◦ B = B ◦ A = Aν+1 .
Allora
z = Bz ⇒ Az = A(Bz) = B(Az) ⇒ z = Az
per l’unicità del punto fisso di B . Abbiamo quindi dimostrato che z è punto fisso di A .
Osserviamo ora che la successione An x0 si decompone nelle ν sottosuccessioni Akν+j x0 , j =
0, 1, ...ν − 1 e:
lim Akν+j x0 = lim B k (Aj x0 ) = z j = 0, 1...ν − 1 ,
k k

perché il metodo delle approssimazioni successive per B fornisce il punto fisso z, indipendente-
mente dal dato iniziale.

Talvolta si deve considerare una famiglia di problemi di punto fisso, dipendenti da un pa-
rametro t . Se t ∈ T , dove T è uno spazio topologico, è interessante studiare l’eventuale
dipendenza continua del punto fisso dal parametro. A tal fine si ha il seguente

Teorema. Sia (S, d) uno spazio metrico completo e T uno spazio topologico. Sia

f : S × T → S tale che

1) ∀x ∈ S t → f (x, t) è continua da T → S ,
2) Esiste L < 1 tale che
∀t ∈ T d(f (x, t), f (y, t)) ≤ Ld(x, y) ,
cioè esiste una costante di Lipschitz L < 1 indipendente da t .
Allora, se x(t) = f (x(t), t) è l’unico punto fisso della contrazione f (·, t) , l’applicazione t → x(t)
è continua da T → S.
Dimostrazione. Fissato s ∈ T :

d(x(t), x(s)) = d(f (x(t), t), f (x(s), s)) ≤

≤ d(f (x(t), t), f (x(s), t)) + d(f (x(s), t), f (x(s), s)) ≤
≤ Ld(x(t), x(s)) + ε ,
cioè (1 − L)d(x(t), x(s)) ≤ ε, se t ∈ V (s) , con V (s) intorno sufficientemente piccolo di s
(dipendente dal valore arbitrario ε > 0). q.e.d.

Università di Torino, a.a. 2003-2004


20 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

2.2 Punti fissi in insiemi parzialmente ordinati e Lemma di Zorn


Teorema. Sia (I, ≤) un insieme non vuoto e parzialmente ordinato tale che ogni suo sot-
toinsieme J totalmente ordinato ammetta un estremo superiore (sup J ∈ I).
Sia f : I → I un’applicazione tale che ∀x ∈ I x ≤ f (x).
Allora esiste almeno un elemento x∗ ∈ I tale che x∗ = f (x∗ ).

Dimostrazione. Se I è totalmente ordinato, posto m = sup I, si ha m ≤ f (m) ≤ m e dunque


m = f (m). Se I non è totalmente ordinato, possiamo cercare di restringere la ricerca di un
punto fisso ad un adeguato sottoinsieme totalmente ordinato. A questo fine, fissato un elemento
arbitrario a ∈ I, consideriamo la famiglia A dei sottoinsiemi S di I, che diremo ammissibili ,
aventi le seguenti proprietà
1) a ∈ S,
2) f (S) ⊆ S,
3) per ogni sottoinsieme totalmente ordinato T di S si ha sup T ∈ S.
La famiglia A non è vuota, perché I ∈ A ed è immediato verificare che qualunque intersezione
di sottoinsiemi ammissibili è ammissibile. Poniamo allora

A = ∩S∈A S

e verifichiamo che A è totalmente ordinato. Avremo allora che, se x∗ = sup A, x∗ ∈ A, f (x∗ ) ∈ A


e x∗ ≤ f (x∗ ) ≤ x∗ , cioè x∗ è punto fisso.
Osserviamo in primo luogo che M = {x|a ≤ x} ∈ A (a ∈ M, x ∈ M ⇒ f (x) ≥ x ≥ a e se T è
un sottoinsieme di M totalmente ordinato, sup T ≥ a, cioè sup T ∈ M ), pertanto

∀x ∈ A a ≤ x .

Per vedere che A è totalmente ordinato basta vedere che per ogni coppia di elementi z, x ∈ A si
ha z ≤ x ∨ z ≥ f (x), perché allora o z ≤ x o z ≥ x, perché z ≥ f (x) ≥ x. Fissato allora x ∈ A,
consideriamo l’insieme
B(x) = {z ∈ A|z ≤ x ∨ z ≥ f (x)}
e ci proponiamo di controllare che B(x) = A. Essendo B(x) ⊆ A e A è minimale, basta
dimostrare che B(x) è ammissibile:
1) a ≤ x e dunque a ∈ B(x);
2) f (z) ∈ A e:
se z ≥ f (x) allora f (z) ≥ z ≥ f (x) e dunque f (z) ∈ B,
se z = x, ovviamente f (z) ≥ f (x) e f (z) ∈ B,
se z < x implicasse f (z) ≤ x, allora avremmo f (z) ∈ B.
Dunque, almeno per le

x ∈ C = {x ∈ A | ∀y ∈ A y < x ⇒ f (y) ≤ x} ,

risulta f (B(x)) ⊆ B;
3) indipendentemente dall’essere x ∈ C, se T è un sottoinsieme totalmente ordinato di B(x),
sup T ∈ A e:
o per ogni t ∈ T si ha t ≤ x, allora sup T ≤ x e sup T ∈ B(x),

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 21

o per qualche t ∈ T si ha t ≥ f (x), allora sup T ≥ t ≥ f (x) e sup T ∈ B(x).


Abbiamo cosı́ dimostrato che
∀x ∈ C B(x) = A .
Vediamo ora che C = A e la dimostrazione del teorema sarà completa. Per questo sfruttiamo
nuovamente il fatto che C ⊆ A e A è minimale, controllando che C è ammissibile:
1) a ∈ C, perché non esiste alcun y ∈ A tale che y < a;
2) per x ∈ C si ha f (x) ∈ A e, se A = B(x)  y < f (x) allora y ≤ x (altrimenti, essendo
y ∈ B(x), dovrebbe essere y ≥ f (x) e non y < f (x)); dunque o y = x e banalmente f (y) ≤ f (x)
oppure y < x e allora f (y) ≤ x ≤ f (x) (la prima disuguaglianza dipende dal fatto che x ∈ C e
la seconda dall’ipotesi base su f ); in ogni caso y < f (x) ⇒ f (y) ≤ f (x), cioè f (x) ∈ C, o ancora
f (C) ⊆ C;
3) sia T un sottoinsieme totalmente ordinato di C e τ = sup T ∈ A; sia A  y < τ :

∀t ∈ T y ≤ t ∨ y ≥ f (t) ≥ t ,

perché ogni t ∈ C e dunque B(t) = A. Allora esiste un t ∈ T tale che non vale y ≥ f (t)
(altrimenti per tutti i t ∈ T si avrebbe y ≥ t e allora y ≥ τ ), cioè tale che y ≤ t; ma se y < t si
ha f (y) ≤ t ≤ τ (t ∈ C), se invece y = t, non essendo y = τ , esiste un s ∈ T ⊆ C tale che y < s
e pertanto f (y) ≤ s ≤ τ ; in ogni caso

A  y < τ ⇒ f (y) ≤ τ ,

cioè τ ∈ C.
Dunque C ⊆ A è ammissibile ed essendo A minimale C = A. q.e.d.

Dal teorema precedente si possono dedurre quasi immediatamente, con l’ausilio dell’Assioma
della Scelta , i teoremi di Hausdorff e di Zorn.

Teorema (di Haussdorff di massimalità). Ogni insieme parzialmente ordinato (I, ≤)


contiene un sottoinsieme totalmente ordinato (o come si dice una catena) C massimale per la
relazione di inclusione.
Dimostrazione. Sia C l’insieme di tutte le catene C di I, ordinato ponendo C ≤ C ∗ ⇒ C ⊆ C ∗ .
In C ogni sottoinsieme totalmente ordinato T ammette un estremo superiore: D = ∪C∈T C.
Supponiamo per assurdo che C non ammetta elementi massimali. Allora per ogni C ∈ C consi-
deriamo il sottoinsieme non vuoto F(C) delle catene C ∗ tali che C < C ∗ . Per l’Assioma della
Scelta esiste una funzione f : C → C tale che f (C) ∈ F(C), dunque C < f (C) e, per il teo-
rema precedente f dovrebbe avere un punto fisso F per il quale si avrebbe F < F : assurdo. q.e.d.

Teorema (Lemma di Zorn). Ogni insieme parzialmente ordinato (I, ≤) per il quale esista
un maggiorante in I di ogni catena (cioè di ogni suo sottoinsieme totalmente ordinato) ammette
almeno un elemento massimale.
Dimostrazione. Sia C una catena massimale di I, la cui esistenza è assicurata dal Teorema di
Hausdorff, e sia x un suo maggiorante. L’elemento x è massimale. Infatti, se y ∈ C si ha y ≤ x,
/ C, allora l’insieme C ∗ = C ∪ {y} è una catena tale che C < C ∗ e C non può
e se x ≤ y con y ∈
essere massimale. q.e.d.

Università di Torino, a.a. 2003-2004


22 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

2.3 I teoremi di Brouwer e Schauder


Teorema di Brouwer. Sia B = B1∗ (0) = { x ∈ Rn | ||x|| ≤ 1 } la sfera chiusa unitaria
di centro l’origine di Rn . Ogni applicazione continua T da B in sé stesso ammette almeno un
punto fisso, cioè esiste z ∈ B tale che z = T (z).

Corollario. Sia D ⊂ Rn un insieme e omeomorfo a B. Ogni applicazione continua T da D


in sé stesso ammette almeno un punto fisso.

Dimostrazione del Corollario. Sia f : D → B un omeomorfismo (esiste f −1 e sia f che f −1 sono


continue). Allora U = f ◦ T ◦ f −1 è continua da B in B e per il teorema di Brouwer ammette
un punto fisso z ∈ B:
(f ◦ T ◦ f −1 )(z) = z .
Posto x = f −1 (z) ∈ D, si ha dunque T (x) = x. q.e.d.

Dimostreremo direttamente l’esistenza di un punto fisso nel caso in cui D è un simplesso


n-dimensionale, e poi controlleremo che una sfera è omeomorfa ad un simplesso. La dimostra-
zione nel caso del simplesso seguirà da un fondamentale risultato topologico noto come Lemma
di Knaster-Kuratowski-Mazurckiewicz (o lemma KKM), il quale si basa su un semplice ma im-
portante risultato combinatorio, noto come Lemma di Sperner.
Per svolgere questo percorso serviranno alcune nozioni e risultati sugli insiemi convessi, che rias-
sumiamo brevemente.

Sia V uno spazio vettoriale reale (cioè su R). Un sottoinsieme C di V si dice convesso se e
solo se
∀x, y ∈ V ∀λ ∈ [0, 1] (1 − λ)x + λy ∈ C .

Indichiamo con CO la famiglia di tutti i convessi in V . Si verificano facilmente le proprietà


seguenti, che il lettore potrà controllare senza difficoltà.

1) Se Ca ∈ CO per ogni a ∈ A, allora ∩a∈A Ca ∈ CO.

2) Sia V ∗ il duale algebrico di V ed f ∈ V ∗ , allora per ogni c ∈ R si ha { x ∈ V | f (x) ≤ c } ∈ CO.


Analogamente { f < c }, { f ≥ c }, { f > c } ∈ CO.

3) Sia V uno spazio normato, allora per ogni x ∈ V ed r > 0 si ha Br (x) ∈ CO.

4) Si indica con co(A), detto inviluppo convesso di A, il più piccolo insieme convesso contenente
A ⊆ V , dunque
co(A) = ∩A⊆C∈CO C .
Allora risulta

p 
p
+
co(A) = { λk xk | p ∈ N , xk ∈ A, λk ≥ 0, λk = 1 } .
k=1 k=1

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 23

Infatti il secondo membro contiene A ed è convesso; inoltre se C è un convesso contenete A deve


contenere il secondo membro.

6) Se V è normato co(A) ha lo stesso diametro di A.


Infatti se ||x − y|| ≤ d per x, y ∈ A, allora

n 
n
x, xk ∈ A, z = λk xk ∈ co(A) ⇒ ||x − z|| ≤ λk ||x − xk || ≤ d
k=1 k=1
m
e quindi se xj ∈ A e w = j=1 µj xj ∈ co(A) si ha


m 
m
||w − z|| = || µj (xj − z)|| ≤ µj ||xj − z|| ≤ d .
j=1 j=1

Definizione. Un simplesso n-dimensionale S è l’invuppo convesso di n + 1 punti x0 , x1 ...xn


linearmente indipendenti, cioè tali che i vettori xj − x0 , j = 1...n sono linearmente indipendenti.
È immediato verificare che è equivalente fissare k = 0 e chiedere che i vettori xj − xk , j = k
siano linearmente indipendenti: xj − x0 = xj − xk + xk − x0 e dunque se

cj (xj − xk ) = 0 ⇒ ∀j = k cj = 0 ,
j=k

allora l’ipotesi j=0 aj (xj − x0 ) = 0, cioè
   
aj (xj − xk ) + ( aj )(xk − x0 ) = 0 ⇒ ∀j = k, 0 aj = 0 e aj = ak + aj = ak = 0 .
j=k,0 j=0 j=0 j=k,0

Per quanto visto al punto 4) precedente, il simplesso generato dai punti x0 ...xn è l’insieme delle
combinazioni convesse di tali punti:

n 
n
S = S(x0 , x1 ...xn ) = { λ k xk | λ ≥ 0 e λk = 1 } .
k=0 k=0

Ogni x ∈ S si scrive in modo unico come combinazione convessa delle xk (per l’indipendenza
delle xk − x0 ) e i coefficienti λk (x) si dicono le sue coordinate baricentriche. I punti xk sono
i vertici del simplesso. 
Con λk = 1/(n + 1) per ogni k si ottiene il baricentro di S: bn = k xk /(n + 1).
Il diametro di S = S(x0 , x1 ...xn ) è, per quanto visto al punto 6), uguale al maxi,j ||xj − xi ||.

Si dice faccia k-dimensionale di S il simplesso generato da k + 1 vertici distinti di S:


S(xj0 , xj1 ...xjk ).

Se Si è la faccia n − 1-dimensionale di S opposta a xi (cioè xi ∈


/ Si ) e bn−1
i è il baricentro di
n
Si , mentre b è il baricentro di S, allora
n n−1 1 n
||bn − xi || = || bi + xi − xi || = ||bn−1 − xi || .
n+1 n+1 n+1 i

Università di Torino, a.a. 2003-2004


24 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

Si osservi che di conseguenza


n n
∀k d(bn , xk ) ≤ diam S e quindi d(bn , z) ≤ diam S
n+1 n+1
per ogni z appartenente ad una qualunque faccia n − 1 dimensionale di S.

Suddivisione simpliciale. Sia S = S(x0 , x1 ...xn ) un simplesso n-dimensionale. Una colle-


zione {S1 , S2 ...SN } di simplessi n-dimensionali si dice suddivisione simpliciale di S se l’unione
degli Sj coincide con S e l’intersezione di Si e Sj ,con i = j, o è vuota o è esattamente una loro
faccia comune di dimensione inferiore.
Suddividendo ogni Sj si ottiene una suddivisione del simplesso iniziale S “più fine.
Nel seguito ricorreremo quasi esclusivamente a suddivisioni baricentriche, che possiamo de-
finire induttivamente:
1) per n = 1 la suddivisione è costituita da due simplessi (segmenti) aventi per vertici il bari-
centro e uno dei due vertici di S;
2) per n > 1, dopo aver effettuato la suddivisione baricentrica di tutte le facce di dimensione
inferiore, si ottiene la suddivisione baricentrica di S come collezione di tutti i simplessi aventi
come vertici il baricentro di S e gli n − 1 vertici di un qualunque simplesso della suddivisione di
qualunque faccia n − 1-dimensionale di S.
Se si suddividono in modo analogo i simplessi di questa suddivisione, che diremo di ordine 1, si
ottiene una suddivisione baricentrica di S, che diremo di ordine 2, e cosı̀ via.
Se d = d0 è il diametro di S e dq quello di una sua suddivisione baricentrica di ordine q, cioè il
massimo dei diametri dei simplessi che le appartengono, si vede facilmente che
n
dq+1 ≤ dq .
n+1
Dunque per q → +∞ risulta dq → 0.

Lemma di Sperner. Sia S(x0 , x1 , ...xn ) un simplesso n-dimensionale e Σ = {S1 , S2 , ...SM }


una sua suddivisione simpliciale. Sia ν un’applicazione che associa ad ogni vertice z di ogni
simplesso di Σ un intero ν(z) ∈ {0, 1...n}, con la proprietà che

z ∈ S(xj0 , xj1 , ...xjk ) ⇒ ν(z) ∈ {j0 , j1 , ...jk } ,

cioè tale che se z appartiene ad una faccia k-dimensionale del simplesso iniziale S allora la sua
etichetta ν(z) appartiene all’insieme degli indici dei vertici della faccia.
Definita l’etichetta ν(Si ) di un simplesso della suddivisione come

ν(Si ) = { ν(z) | z è vertice di Si } ,

diremo che Si è normale se e solo se ν(Si ) = {0, 1, ...n}.


Allora il numero N ∗ dei simplessi normali è dispari, e in particolare N ∗ = 0.
Dimostrazione. Per induzione su n. Per n = 0 la tesi è banalmente vera. Supposta vera la tesi per
n−1, segnamo le facce Sia n−1-dimensionali dei simplessi di Σ per le quali ν(Sia ) = {0, 1, ...n−1},
e indichiamo con Nk il numero di facce segnate di Sk e sia N = k Nk .
Se Sk è normale ha una sola faccia segnata: Nk = 1, altrimenti Nk = 0 oppure Nk = 2. Dunque
N ha la stessa parità di N ∗ .

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 25

Se una faccia segnata non è contenuta in S(x0 , x1 , ...xn−1 ), essa è comune a due divesi simplessi
Sk della suddivisione e quindi contribuisce con 2 unità ad N . Se N  è il numero di tali facce,
N  = N − 2N  è il numero di facce segnate contenute in S(x0 , x1 , ...xn−1 ), che è dispari per
ipotesi induttiva. Dunque N e di conseguenza N ∗ sono dispari. q.e.d.

Teorema KKM (di Knaster-Kuratowski-Mazurckiewicz). Sia S = S(x0 , x1 , ...xn )


un simplesso n-dimensionale e siano F0 , F1 , ...Fn n + 1 insiemi chiusi tali che per ogni faccia
k-dimensionale di S, qualsiasi k ≤ n, si abbia

S(xj0 , xj1 , ...xjk ) ⊆ ∪kp=0 Fjp .

Allora risulta ∩nj=0 Fj = ∅.


Dimostrazione. Consideriamo una suddivisione baricentrica di S di ordine arbitrario q: Σq .
Per ogni vertice z di Σq consideriamo la faccia di S di dimensione minima tale che z ∈
S(xj0 , xj1 , ...xjk ). Per l’ipotesi z ∈ ∪kp=0 Fjp , cioè esiste s, con 0 ≤ s ≤ k, tale che z ∈ Fjs :
scelto comunque un tale indice s, poniamo ν(z) = js . L’etichetta ν soddisfa le condizioni del
lemma di Sperner.
Dunque esiste un simplesso S q normale e quindi i vertici, che supponiamo di aver enumerato con-
venientemente, zjq di S q , avendo etichette 0, 1, ...n, appartengono rispettivamente a F0 , F1 ...Fn ,
cioè ∀j S q ∩ Fj = ∅ perché zjq ∈ Fj .

Per la compattezza di S possiammo estrarre una sottosuccessione z0q convergente a a qualche
 
elemento z ∗ ∈ F0 . Ma, il diametro di S q tende a zero per q → +∞, d(zjq , z0q ) → 0 e quindi

zjq → z ∗ ∈ Fj . Dunque {z ∗ } ⊆ ∩j Fj q.e.d.

Teorema di Brouwer per i simplessi (o teorema di Bohl). Sia Sia S = S(x0 , x1 , ...xn )
un simplesso n-dimensionale ed f : S → S una funzione continua. Allora esisite almeno un
punto fisso z di f : z ∈ S e z = f (z).
Dimostrazione. Siano λ(x) = (λ0 (x), λ1 (x), ...λn (x)) le coordinate baricentriche di x ∈ S:

n 
x= λk (x)xk , λk (x) ≥ 0 , λk (x) = 1 ,
k=0 k

essendo unica tale rappresentazione  di x come combinazione convessa delle xk . Viceversa dato
µ = (µ0 , µ1 , ...µn ), con µk ≥ 0 e k µk = 1 esiste un unico elemento x(µ) ∈ S con coordinate
baricentriche µ.
Le funzioni λ(·) e x(·) sono continue e ciascuna è l’inversa dell’altra. (La continuità di x(·) è
evidente. Inoltre i vettori xj − x0 formano una base per ipotesi, quindi è univocamente indi-

viduata la basen duale: fk ∈ V e fk (xj − x0 ) = δkj ; dunque λk (x) = fk (x − x0 ) per k ≥ 1 e
λ0 (x) = 1 − k=1 λk (x)).
Le funzioni fj (µ) = λj (f (x(µ)), che rappresentano la trasformazione f in coordinate baricentri-
che, sono allora continue.
Poniamo
Fj = { x ∈ S | λj (x) ≥ fj (λ(x))} .
Essi sono ovviamente insiemi chiusi e soddisfano le ipotesi del teorema KKM: infatti se fosse

x ∈ S(xj0 , xj1 ...xjk ) ∧ x ∈


/ ∪ki=0 Fji ,

Università di Torino, a.a. 2003-2004


26 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

allora si avrebbe λji (x) < fji (λ(x)) per i = 0, 1, ..k, e dunque


n 
k 
k 
n
1= λl (x) = λji (x) < fji (λ(x)) ≤ fl (λ(x)) = 1 ,
l=0 i=0 i=0 l=0

che è manifestamente impossibile.


Allora per il teorema KKM esiste z ∈ ∩j Fj e quindi


n 
n
λj (z) ≥ fj (λ(z)) , j = 0, 1, ...n , 1 = λj (z) ≥ fj (λ(z)) = 1 .
j j

Necessariamente allora λj (z) = fj (λ(z)) per j = 0, 1, ..., n, e z è punto fisso. q.e.d.

Per dimostrare che un simplesso è omeomorfo ad una sfera di ugual dimensione, conviene far
uso del funzionale di Minkowski di un corpo convesso, del quale si è già fatto cenno nel Capitolo
1, quando si è introdotto il concetto di seminorma. Premettiamo allora qualche definizione.

Definizione. Si dice che un insieme convesso C in uno spazio vettoriale V è un corpo


convesso se e solo se esiste x ∈ C tale che per ogni vettore v risulta x + tv ∈ C se t > 0 è
sufficientemente piccolo (t < tv ):

∃x ∈ C ∀v ∈ V ∃tv > 0 ∀t ∈ (0, tv ) x + tv ∈ C .

L’insieme dei punti di C che hanno questa proprietà si chiama il nucleo del convesso e si indica
con J(C).
In dimensione n finita se x ∈ J(C) allora x è un punto interno a C. Infatti, se {ek } è una base
ortonormale, poniamo θ = mink min(tek , t−ek ). Allora

θ
{x + v | v ∈ V | ||v||∞ ≤ } ⊆ x + co({θek , −θek }k ) = {y | ||y − x||1 ≤ θ} ⊆ C .
n

Definizione. sia V uno spazio lineare su R. Una funzione p(x) definita su V a valori reali
si dice convessa e positivamente omogenea, se e solo se

1) p(x) ≥ 0 ∀x ∈ V ,
2) p(x + y) ≤ p(x) + p(y) ∀(x, y) ∈ E × E,
3) p(λx) = λp(x) ∀(x, λ) ∈ V × R+ .

(Più in generale si potrebbero considerare funzioni a valori reali estesi, ottenendo nella Propo-
sizione successiva risultati meno precisi.)

In effetti si verifica immediatamente che p è convessa nel senso usuale:

0 ≤ λ ≤ 1 ⇒ p((1 − λ)x + λy) ≤ (1 − λ)p(x) + λp(y) .

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 27

Viceversa, se p è convessa in senso usuale e positivamente omogenea, allora soddisfa la disugua-


glianza triangolare:
x+y x+y x y
p(x + y) = p(2 ) = 2p( ) ≤ 2p( ) + 2p( ) = p(x) + p(y) .
2 2 2 2
Si osservi che si ha necessariamente p(0) = 0.

Proposizione. Sia p(x) una funzione convessa e positivamente omogenea su V . Allora, per
ogni c > 0 , l’insieme C = { x ∈ V | p(x) ≤ c } ha le proprietà seguenti:
1) 0 ∈ C ;
2) C è convesso ;
3) l’insieme { x ∈ V | p(x) < c } coincide con J(C);
4) C è assorbente : per ogni x ∈ V , esiste ρ > 0 tale che x ∈ ρC ;
5) la funzione p è univocamente individuata da C , mediante la formula

p(x) = inf ρc .
ρ>0,x∈ρC

6) vale la disuguaglianza

|p(x) − p(y)| ≤ max(p(x − y), p(y − x)) .

La dimostrazione comporta soltanto verifiche immediate.


Viceversa:

Proposizione, se C è un qualunque corpo convesso di V , tale che 0 ∈ J(C), la formula


del punto 5), con c = 1, definisce una funzione convessa e positivamente omogenea in V , detta
funzionale di Minkowski di C, che talvolta per maggior chiarezza si indicherà con pC (x).

Dimostrazione.
1) per t > 0 si ha p(tx) = tp(x), perché tx ∈ ρC equivale a x ∈ ρ/tC;
2) sia p(xk ) < ρk < p(xk ) + ε, k = 1, 2, dunque xk /ρk ∈ C, e poniamo ρ = ρ1 + ρ2 , allora
x1 + x 2 ρ 1 x1 ρ 2 x2
= + ∈C .
ρ ρ ρ1 ρ ρ2

Pertanto p(x1 + x2 ) ≤ ρ < p(x1 ) + p(x2 ) + 2ε. Per l’arbitrarietà di ε > 0 si conclude la dimo-
strazione.

Osservazione. È immediato verificare che { x ∈ V | pC (x) < 1 } ⊆ C ⊆ { x ∈ V | pC (x) ≤ 1 }.

Teorema. Ogni (corpo) convesso chiuso, limitato e con interno non vuoto C in uno spazio
normato reale V è omeomorfo alla sfera unitaria chiusa B = B1∗ (0) = {x | ||x|| ≤ 1}.
Dimostrazione. Non è restrittivo supporre 0 ∈ J(C), B ⊆ C e C ⊆ BR , dove BR è la sfera
chiusa di centro l’origine e raggio R. Sia p = pC il funzionale di Minkowski di C, per ogni x ∈ V
non nullo si ha
x x
∈ C ⇒ p( ) ≤ 1 ⇒ p(x) ≤ ||x|| ,
||x|| ||x||

Università di Torino, a.a. 2003-2004


28 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

dunque anche |p(x) − p(y)| ≤ ||x − y|| e p è continua. Inoltre C = {x | p(x) ≤ 1}: infatti per
l’Osservazione relativa alla proposizione precedente basta controllare che p(x) = 1 = infx∈ρC ρ ←
x ∈ C; ma poiché esiste ρn → 1 tale che x/ρn ∈ C e x/ρn → x, la chiusura di C garantisce il
controllo. Infine
Rx 1
p( ) ≥ 1 ⇒ ||x|| ≤ p(x) .
||x|| R
Definiamo ora la trasformazione T mediante le formule
p(x)
T (0) = 0 e T (x) = x per x = 0 .
||x||

Ovviamente T (C) = B, perché x ∈ C ⇒ p(x) ≤ 1.


T è biunivoca: per x = 0 si ha

p(x) p(x)2 ||y||2


y= x ⇒ ||y|| = p(x) , p(y) = , ||x|| = ,
||x|| ||x|| p(y)

e quindi
||x|| ||y||2 ||y||
x= y= y , cioè T −1 (y) = y.
p(x) p(y)||y|| p(y)
T e T −1 sono continue: ovviamente, per x e y diversi da 0, vista la continuità di p. Inoltre

xn → 0 ⇒ p(xn ) → 0 ⇒ T (xn ) → T (0) ,

yn → 0 ∧ ||T −1 (y)|| ≤ R||y|| ⇒ T −1 (yn ) → 0 ,


pertanto T e T −1 sono continue anche in 0. q.e.d.

Il Teorema di Brouwer è dunque completamente dimostrato.

È molto interessante un risultato enunciato già da Poincaré nel 1883, solo con un rapido
cenno ad un possibile percorso di dimostrazione, che generalizza il noto ed elementare teorema
di esistenza degli zeri delle funzioni continue e risulta equivalente al teorema di Brouwer.

Teorema (di Poincarè-Miranda). Siano F1 , F2 ...Fn n funzioni delle variabili reali x1 , x2 ...xn
continue nell’ipercubo Q = [−L, L]n , tali che, per ogni j sulle facce Q±
j = {xj = ±L} valgano
le disuguaglianze

Fj (x1 ...xj−1 , −L, xj+1 ...xn ≥ 0 ∧ Fj (x1 ...xj−1 , +L, xj+1 ...xn ≤ 0 .

Allora esiste in Q almeno una soluzione del sistema

Fj (x1 , x2 ...xn ) = 0 , j = 1, 2, ...n ,

cioè uno zero comune a tutte le funzioni Fj .


Dimostrazione (Miranda, 1940).
1) Supponiamo in primo luogo che sulle facce Q±j valgano ovunque le disuguaglianze strette. Sia

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 29

A+ − − + ±
j = {x ∈ Q | Fj > 0} ⊃ Qj , Aj = {x ∈ Q | Fj < 0} ⊃ Qj . Siano d le distanze (positive)
di A± ±
j da Qj , mj e Mj il minimo (negativo) e il massimo (positivo) di Fj in Q, e

d− d+
0 < εj < min( , ).
−mj Mj

Posto
f = (f1 , f2 ...fn ) , fj (x) = xj + εj Fj (x) ,
si controlla facilmente che f : Q → Q, cioè |fj | ≤ L per ogni j:
se Fj (x) ≤ 0 ⇒ fj (x) ≤ xj ≤ L,
se invece x ∈ A+ + +
j , cioè Fj (x) > 0 ⇒ xj ≤ L − d ⇒ fj (x) < xj + d Fj (x)/Mj ≤ L;
e in modo analogo si vede che fj (x) ≥ −L.
Allora il sistema di equazioni equivale al problema di punto fisso x = f (x), che ammette almeno
una soluzione grazie al teorema di Brouwer, essendo Q un corpo convesso compatto.
2) Se non si può garantire che sulle facce Q± j valgano ovunque le disuguaglianze strette, si
ricorre ad un metodo di approssimazione. Per ogni intero p le disuguaglianze strette valgono
per le Fjp = Fj − xj /p e quindi esiste xp ∈ Q tale che Fjp (xp ) = 0, j = 1, ...n. Sia xq una
sottosuccessione convergente a x ∈ Q, allora:
xq
0 = Fj (xq ) − → Fj (x) = 0
q

e dunque x risolve il sistema dato. q.e.d.

Proposizione (Miranda). Il Teorema di Poincaré-Miranda è equivalente al teorema di


Brouwer.
Dimostrazione. È sufficiente dimostrare che ogni applicazione continua da f : Q → Q ammet-
te almeno un punto fisso, cioè che il sistema di equazioni Fj (x) = fj (x) − xj = 0 ammette
una soluzione in Q. Basta prolungare per continuità le fj a tutto Rn in modo che sussista-
no le maggiorazioni |fj | ≤ L. Allora per L∗ sufficientemente grande i prolungamenti delle Fj
soddisfano alle disuguaglianze previste dal teorema di Poincaré-Miranda sulle facce del cubo
Q∗ = [−L∗ , L∗ ]n e quindi il sistema Fj (x) = 0, j = 1...n, ammette una soluzione x in Q∗ . Ma
per essa xj = fj (x) e dunque x ∈ Q. q.e.d.

Una importante estensione del teorema di Brouwer a spazi di Banach di dimensione infinita
è il seguente

Teorema di Schauder. Sia B uno spazio di Banach, C un suo sottoinsieme convesso e


compatto e T un’applicazione continua da C in sé stesso. Allora T ammette un punto fisso in
C: esiste z ∈ C tale che z = T (z).

Un’ulteriore estensione di questo risultato a spazi più generali, e precisamente agli spazi lo-
calmente convessi è nota come Teorema di Tychonov.

Il teorema di Schauder si ottiene immediatamente come corollario del seguente

Università di Torino, a.a. 2003-2004


30 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

Teorema. Sia B uno spazio di Banach, C un suo sottoinsieme (omeomorfo a un)convesso,


chiuso e limitato e T un’applicazione compatta da C in sé stesso. Allora T ammette un punto
fisso in C: esiste z ∈ C tale che z = T (z).
Spesso questo risultato viene ugualmente indicato come Teorema di Shauder.
Ricordiamo che una trasformazione T si dice compatta se e solo se è continua e inoltre trasforma
insiemi limitati in insiemi relativamente compatti (cioè a chiusura compatta).

Dimostrazione che questo teorema implica il teorema di Schauder nella versione iniziale. Sia
C compatto, T continua e L un sottoinsieme di C. Allora L è necessariamente limitato, L è
compatto e T (L) è relativamente compatto in quanto sottoinsieme di T (L), che è compatto.
Dunque T è compatta e ammette un punto fisso. q.e.d.

Prima di dimostrare il teorema sui punti fissi di operatori compatti, ricordiamo alcuni risul-
tati sulla compattezza negli spazi metrici e poi dimostriamo un risultato di approssimazione
di operatori compatti mediante operatori con immagine in dimensione finita.

1) Un insieme K in uno spazio metrico (S, d) è (relativamente) compatto se e solo se è (re-


lativamente) sequenzialmente compatto, cioè se e solo se da ogni successione xi ∈ K si può
estrarre una sottosuccessione xij convergente a un elemento di K;

2) In uno spazio metrico (S, d) un insieme K è relativamente limitato se e solo se esso è


totalmente limitato, cioè se e solo se, dato ε > 0 arbitrario esiste un insieme finito R =
{a1 , a2 ...aN } tale che
∀x ∈ K ∃j ∈ {1, 2, ...N } d(x, aj ) < ε .

(Si dice che R è un ε-reticolo finito per K). Si vede facilmente che non è restrittivo supporre
R ⊆ K.

3) Se C è totalmente compatto allora anche co(C) è totalmente  limitato.


Infatti, sia R = {a1 , a2 , ...aN } un ε-reticolo finito
 per C e y = i λi xi , xi ∈ C, un elemento di
co(R). Sia ai ∈ R tale che d(xi , ai ) < ε e b = i λi ai ∈ co(C); dunque si controlla immediata-
mente che d(y, b) < ε. Ma co(R) è chiuso e limitato in dimensione finita, quindi compatto. Sia
S un suo ε-reticolo finito e s ∈ S tale che d(b, s) < ε. Ne segue che d(y, s) ≤ 2ε e dunque S è
un 2ε-reticolo finito per co(C).

Teorema (approssimazione di operatori compatti). Nelle ipotesi del teorema di Schau-


der (B spazio di Banach, T : C → C operatore compatto definito su C ⊂ B comvesso chiuso e
limitato),
∀ε > 0 ∃Mε ∃Tε : C → coT (C) ∩ Mε ,

dove Mε è un sottospazio di dimensione finita, e sia Nε , tali che

∀f ∈ C ||T (f ) − Tε (f )|| ≤ ε .

Dimostrazione. Poiché coT (C) ⊆ C è compatto, sia R = {g1 , g2 ...gq } un suo ε-reticolo finito,
che non è restrittivo supporre ⊂ coT (C). Introduciamo poi il corrispondente proiettore di

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 31

Schauder Pε , definito per f ∈ T (C) da


 (ε − ||f − gi ||)+
Pε f = λi (f )gi ∈ coT (C) , λi (f ) =  +
.
i i (ε − ||f − gi ||)

Il denominatore non si annulla e Pε è ben definito e continuo. Inoltre



||Pε f − f || ≤ λi (f )||gi − f || ≤ ε .
i

Se ora si pone Tε = Pε ◦ T , si ha

||Tε (f ) − T (f )|| = ||Pε T (f ) − T (f )|| < ε , Tε (C) ⊆ Sε = coT (C) ∩ Mε ,

dove Mε è il sottospazio generato da R e di dimensione finita Nε = q. q.e.d.

Dimostrazione del Teorema di Schauder (nella seconda versione). Sia ε una successione
convergente a 0 e Tε l’approsimazione di T sopra definita. Tε (C) ⊆ Sε ⊆ C. Ma, essendo Sε un
compatto e convesso nel sottospazio di dimensione finita Mε e

Θε = Tε |sε : Sε → Sε ,

continua, per il Teorema di Brouwer, esiste un punto fisso fε = Θε fε ∈ coT (C). Per la
compattezza di questo insieme esiste una sottosuccessione fa convergente ad un limite f . Allora

f = lim fa = lim Ta (fa ) = lim[(Ta (fa ) − T (fa )) + (T (fa ) − T (f )) + T (f )] = T (f )


a a a

e f è un punto fisso. q.e.d.

2.4 Punti di equilibrio. Teoremi di minimax


Definiamo in primo luogo i punti di equilibrio di Nash, dei quali i punti sella sono un caso
particolare.

Definizione. Siano f1 , f2 , ...fn n funzioni reali di n variabili x1 , x2 ...xn , che variano rispet-
tivamente negli insiemi A1 , A2 , ...An . Dunque

fk : A1 × A2 ... × An → R , k = 1, 2...n .

Un punto c = (c1 , c2 ...cn ) è un punto di equilibrio di Nash per le fj se e solo se

∀k ∈ {1, 2...n} fk (c1 , ...ck−1 , ck , ck+1 , ...cn ) = max fk (c1 , ...ck−1 , xk , ck+1 , ...cn ) .
xk ∈Ak

Nel caso particolare n = 2 e f = f1 = −f2 si ha

∀x1 ∈ A1 f (x1 , c2 ) ≤ f (c1 , c2 ) ,

Università di Torino, a.a. 2003-2004


32 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

∀x2 ∈ A2 − f (c1 , x2 ) ≤ −f (c1 , c2 ) ,


e dunque
∀x1 ∈ A1 ∀x2 ∈ A2 f (x1 , c2 ) ≤ f (c1 , c2 ) ≤ f (c1 , x2 ) ;
e si dice che c è punto sella di f .

Consideriamo qualche proprietà immediata dei punti sella di una funzione f (x, y) delle va-
riabili x ∈ A e y ∈ B.
Ripetiamo che, se f : A × B → R, (x∗ , y ∗ ) è punto sella se e solo se

∀x ∈ A ∀y ∈ B f (x, y ∗ ) ≤ f (x∗ , y ∗ ) ≤ f (x∗ , y) .

Conviene premettere il lemma sguente.

Lemma. Vale sempre la disuguaglianza

sup inf f (x, y) ≤ inf sup f (x, y) .


x∈A y∈B y∈B x∈A

Dimostrazione.
∀x ∈ A ∀y ∈ B inf f (x, y) ≤ f (x, y) ,
y∈B

dunque
∀y ∈ B sup inf f (x, y) ≤ sup f (x, y) .
x∈A y∈B x∈A

Basta allora applicare l’operatore inf y∈B ad entrambi i membri per ottenere il risultato. q.e.d.

Proposizione 1. Condizione necessaria e sufficiente per l’esistenza di un punto sella è

max inf f (x, y) = min sup f (x, y) .


x∈A y∈B y∈B x∈A

Dimostrazione.
i) Supponiamo che valga l’uguaglianza e sia V il valore comune dei due membri. Sia x∗ un punto
di massimo e y ∗ un punto di minimo:

V = max inf f (x, y) = inf f (x∗ , y) ≤ f (x∗ , y ∗ ) ≤ sup f (x, y ∗ ) = min sup f (x, y) = V ,
x y y x y x

allora
V = inf f (x∗ , y) = f (x∗ , y ∗ ) = sup f (x, y ∗ ) ,
y x
∗ ∗ ∗
cioè f (x, y∗) ≤ f (x , y ) ≤ f (x , y), per x ed y arbitrari.

ii) Sia (x∗ , y ∗ ) un punto sella, allora

max f (x, y ∗ ) = f (x∗ , y ∗ ) = min f (x∗ , y),


x∈A y∈B

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 33

quindi
inf sup f (x, y) ≤ f (x∗ , y ∗ ) ≤ sup inf f (x, y) .
y∈B x∈A x∈A y∈B
∗ ∗
(Si osservi che con x o y fissati si ha inf = min o sup = max, ma per altri valori x o y min o
max potrebbero non esistere.)
Tenendo conto del lemma precedente si trova il risultato. q.e.d.

Proposizione 2. (Criterio di esistenza di un punto sella). Se

∃x∗ , y ∗ , V (∀y V ≤ f (x∗ , y)) ∧ (∀x f (x, y ∗ ) ≤ V ) ,

allora (x∗ , y ∗ ) è punto sella di f e V = f (x∗ , y ∗ ).


Infatti l’ipotesi implica f (x∗ , y ∗ ) ≤ V ≤ f (x∗ , y ∗ ) e dunque

∀x, y f (x, y ∗ ) ≤ f (x∗ , y ∗ ) ≤ f (x∗ , y) .

Proposizione 3. L’insieme dei punti sella di f è della forma A∗ × B ∗ .


Infatti, se (x1 , y1 ) e (x2 , y2 ) sono punti sella, per la Proposizione 1 si ha f (x1 , y1 ) = f (x2 , y2 ),
e, indicando con V il valore comune, segue

∀y V ≤ f (x1 , y) ∧ ∀x f (x, y2 ) ≤ V ,

cioè (x1 , y2 ) è punto sella.

Teorema di Nash (1950). Siano g1 , g2 ...gn funzioni reali multilineari delle variabili
s1 , s2 ...sn definite in Σ = Σ1 × Σ2 ...Σn , dove ciascun Σk è un simplesso νk dimensionale. Allora
esiste almeno un punto di equilibrio di Nash per le gk :

gk (s) = max gk (< s; tk ; k >) k = 1, 2...n ,


tk ∈Σk

dove s = (s1 ...sn ) e < ·; ·; k > è la trasformazione definita da

< s; tk ; k >= (s1 ...sk−1 , tk , sk+1 ...sn ) ,

che sostituisce tk a sk nella posizione k.

Dimostrazione. Siano σkα , α = 1, 2...µk = νk + 1 i vertici del simplesso Σk e pkα = pkα (sk )
le coordinate baricentriche di sk :

µk 
µk
sk = σkα pkα , pkα ≥ 0 , pkα = 1 .
α=1 α=1

Sia pk (sk ) il vettore di componenti pkα (sk ), α = 1, ...µk e p(s) = (p1 (s1 )...pn (sn )), cioè p(s)k =
pk (sk ).
Per la linearità di gk (s) in sk ed essendo sk combinazione convessa delle σkα , si ha

max gk (< s; tk ; k >) = max gk (< s; σkα ; k >) , k = 1, ...n .


tk α

Università di Torino, a.a. 2003-2004


34 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

Dunque s è punto di equilibrio se e solo se, posto gkα (s) = gk (< s; σkα ; k >), risulta

gk (s) = max gkα (s) .


α

(In ogni caso gk (s) è combinazione convessa delle gkα (s), dunque si ha sempre gk (s) ≤ maxα gkα (s).)

Osserviamo che, dicendo che sk dipende da σkα se e solo se pkα > 0, s è punto di equilibrio
se e solo se, per ogni k, vale l’implicazione

sk dipende da σkα ⇒ gkα (s) = max gkβ (s) .


β

Poniamo ora, per ogni k e α:

ϕkα (s) = max(0, gkα (s) − gk (s)) .

Per quanto visto sopra, l’essere s punto di equilibrio di Nash si può esprimere con le equazioni

∀k ∀α ϕkα (s) = 0 .

Definiamo la trasformazione T da Σ in sé stesso mediante le formule



sk + α ϕkα (s)σkα
T (s)k =  , k = 1...n ,
1 + β ϕkβ (s)

ovvero in coordinate baricentriche


pkα (s) + ϕkα (s)
T (p(s))k = p∗k , dove p∗kα =  , α = 1...µk .
1 + β ϕkβ (s)


L’applicazione T è continua e Σ è un corpo convesso in dimensione k νk , e quindi, per il teo-
rema di Brouwer, T ammette almeno un punto fisso.
Verifichiamo che s (o p(s)) è un punto fisso di T se e solo se è un punto di equilibrio di Nash
per le gk .

a) Per ogni k, essendo


µk 
pkα ≥ 0 , pkα = 1 , gk (s) = gkα (s)pkα ,
α=1 α

deve esistere almeno un α tale che gkα (s) ≤ gk 


(s) e quindi ϕkα (s) = 0. Allora se s è punto fisso
deve essere anche per tale α p∗kα = pkα , cioè β ϕkβ (s) = 0, quindi ϕkβ (s) = 0 per ogni β e
pertanto s è punto di equilibrio.
b) Se s è punto di equilibrio, per ogni k e per ogni β, risulta gk (s) ≥ gkβ (s) e quindi tutte le
ϕkβ (s) si annullano. Allora p∗kα = pkα per ogni k e α, cioè s è punto fisso di T . q.e.d.

Il Teorema precedente è stato dimostrato da Nash[16] nell’ambito del suo studio sui giochi
non-cooperativi, dove ci si muove nell’ambito della formulazione matematica della teoria dei

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 35

giochi stabilita da von Neumann nell’articolo del 1928[19].


Il problema affrontato da Nash prevede n giocatori: 1,2,..n che agiscono indipendentemente. Il
giocatore k dispone di un numero finito µk strategie “pure σkα . Ciascun giocatore sceglie una
strategia e ottiene come risultato la vincita (positiva o negativa) Vk (σ1α ...σnα ) che dipente da
tutte le scelte indipendenti dei giocatori.
Più generalmente il giocatore k può adottare una strategia mista sk che è definita come una
variabile aleatoria discreta, la quale può assumere quali valori le stategie pure σkα con probabilità
pkα . Spesso si rappresenta sk come combinazione convessa delle strategie pure:

sk ∼ σkα pkα .
α

Per l’indipendenza, la probabilità di un sistema assegnato di strategie pure è data dalla formula
P (s1 = σ1α , s2 = σ2β ...) = P (s1 = σ1α )P (s2 = σ1β )... = p1α p2β ... = p(s)(σ) ,
se σ = (σ1α σ2β ...) e s = (s1 , s2 ...).
Le variabili aleatorie Vk (s) = Vk (s1 ...sn ) assumo quindi i valori Vk (σ) = Vk (σ1α σ2β ...) con
probabilità p(s)(σ) e ne possiamo considerare il valor medio o guadagno atteso

gk (s) = E(Vk (s)) = Vk (σ)p(s)(σ) .
σ

Ciascun giocatore vorrebbe che il suo guadagno atteso fosse massimo.


Un punto di equilibrio di Nash del gioco è una collezione s di strategie miste sk tale che nessuno
dei giocatori può far crescere il suo guadagno atteso agendo indipendentemente, se tutti gli altri
giocatori mantengono la strategia scelta.

Il teorema di Nash si può allora formulare dicendo che ogni gioco finito ammette un punto
di equilibrio.

Teorema del minimax di von Neumann (1928). Sia f (x, y) una funzione bilineare
definita in A × B, dove A e B sono due simplessi, rispettivamente M e N dimensionali. Allora
esiste un punto sella (x∗ , y ∗ ) per f su A × B:
∀x ∈ A ∀y ∈ B f (x, y ∗ ) ≤ f (x∗ , y ∗ ) ≤ f (x∗ , y) .
e quindi vale l’uguaglianza di minimax:
max min f (x, y) = min max f (x, y) .
x∈A y∈B y∈B x∈A

 
Infine, se x  = p∗i
i xi

ey = ∗
k yk qk ,
dove xi e yk sono i vertici dei simplessi A e B, mentre
p∗i , qk∗ ≥ 0 e i pi = q
k k = 1, si ha
 
min p∗i f (xi , yk ) = max qk∗ f (xi , yk ) .
k i
i k

Dimostrazione. Possiamo ottenere questo risultato fondamentale come corollario del Teorema
di Nash. Infatti, come abbiamo già osservato, i punti sella sono un caso particolare di punti di
equilibrio di Nash. Basta porre
g1 (x, y) = f (x, y) , g2 (x, y) = −f (x, y) , s1 = x, s2 = y , Σ1 = A , Σ2 = B ,

Università di Torino, a.a. 2003-2004


36 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

per ricondursi al teorema precedente.


Inoltre, vista la Proposizione 1 che fornisce una condizione necessaria e sufficiente perchè (x∗ , y ∗ )
sia un punto sella, e poiché la continuità di f implica l’esistenza del miny f (x, y) e del maxx f (x, y),
si ottiene la validità dell’uguaglianza di minmax. Infine, ricordando che nella dimostrazio-
ne del Teorema di Nash abbiamo caratterizzato i punti di equilibrio mediante le relazioni
gk (s) = maxα gkα (s), abbiamo

f (x∗ , y ∗ ) = max f (xi , y ∗ ) = min f (x∗ , yk ) . q.e.d.


i k

Il Teorema di minimax di von Neumann ammette estensioni in contesti estremamente più


ampi. Prima di presentare queste estensioni, converrà premettere qualche definizione e ricordare
qualche risultato importante.

Ricordiamo che una funzione f : T → R, dove T è uno spazio topologico, si dice semicon-
tinua inferiormente (s.c.i.) in x ∈ T se e solo se, indicando con V (x) un generico intorno di
x, risulta
∀ε > 0 ∃V (x) ∀z ∈ V (x) f (x) − ε < f (z) .

In modo analogo una funzione f : T → R si dice semicontinua superiormente (s.c.s.) in


x ∈ T se e solo se
∀ε > 0 ∃V (x) ∀z ∈ V (x) f (z) < f (x) + ε .

Ovviamente le funzioni continue sono sia s.c.i. che s.c.s.

Se f è s.c.i. in ogni punto di T , per ogni livello l l’insieme F = {x ∈ T | f (x) ≤ l} è


chiuso, essendo il complementare aperto (x ∈ / F ⇒ f (x) > l e quindi esiste un intorno di x
dove f (z) > l). Analogamente, se f è s.c.s. in ogni punto di T , per ogni livello l l’insieme
F = {x ∈ T | f (x) ≥ l} è chiuso.

Se f è s.c.i. in x e xn → x allora lim inf n f (xn ) ≥ f (x) (infatti per ogni ε > 0 si ha, per n
sufficientemente grande, f (xn ) > f (x) − ε e quindi lim inf n f (xn ) ≥ f (x) − ε). Analogamente
se f è s.c.s. in x e xn → x allora lim supn f (xn ) ≤ f (x). Negli spazi metrici queste condizio-
ni sono anche sufficienti affinché f sia s.c.i. o s.c.s. (ad esempio nel primo caso, se esistesse
ε > 0 tale che in nessun intorno di x si avesse sempre f (z) > f (x) − ε, per ogni n potremmo
trovare xn tale che d(xn , x) < 1/n e f (xn ) ≤ f (x) − ε, ma allora si avrebbe il risultato assurdo
lim inf n f (xn ) < f (x)).

Ricordiamo ancora che il clasico teorema di Weierstrass sui massimi e minimi può
essere precisato affermando che una funzione f s.c.i. su un compatto K ammette minimo e che
una funzione f s.c.s. su un compatto K ammette massimo. (Ad esempio nel primo caso, posto
m = inf x∈K f (x), se Fn = {x | m ≤ f (x) ≤ m+1/n}, Fn è chiuso per la s.c.i. di f ; l’intersezione
di un numero finito arbitrario di insiemi Fn non è vuota, quindi per la compattezza di K esiste
x ∈ ∩n Fn ⊆ K; allora f (x) = m).

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 37

Siamo ora in grado di enunciare un primo risultato (suscettibile di ulteriori generalizzazioni)


di grande importanza.

Teorema. Siano X e Y due spazi vettoriali topologici, A ⊂ X e B ⊂ Y sottoinsiemi


convessi e compatti, e f (x, y) una funzione a valori reali definita su A × B tale che
1) ∀y ∈ B l’applicazione x → f (x, y) è concava e s.c.s.
2) ∀x ∈ A l’applicazione y → f (x, y) è convessa e s.c.i.
Allora esistono x∗ ∈ A e y ∗ ∈ B tali che

∀x ∈ A ∀y ∈ B f (x, y ∗ ) ≤ f (x∗ , y ∗ ) ≤ f (x∗ , y) ,

ovvero (x∗ , y ∗ ) è un punto di sella della funzione f .


L’esistenza di un punto di sella per f è equivalente all’eguaglianza

max min f (x, y) = min max f (x, y) .


x∈A y∈B y∈B x∈A

Osservazione. Se y → f (x, y) è s.c.i. per ogni x, la funzione g(y) = supx f (x, y) è ancora s.c.i.
Infatti, se x0 è tale che f (x0 , y) > g(y) − ε e per ogni z ∈ V (y) si ha f (x0 , z) > f (x0 , y) − ε,
allora
g(z) = sup f (x, z) ≥ f (x0 , z) > g(y) − 2ε .
x

Similmente se f (x, y) è s.c.s. per ogni y, la funzione h(x) = inf y f (x, y) è ancora s.c.s.
Essendo la funzione g(y) = maxx∈A f (x, y) s.c.i., ha senso considerare miny∈B g(y). In modo
analogo la funzione h(x) = miny∈B f (x, y) è s.c.s. e ammette massimo in B.

Possiamo ottenere questo risultato come corollario della successiva generalizzazione del Teo-
rema di Nash oppure di un teorema di Ky Fan (K.Fan[10]) del 1952. Definiamo prima le nozioni
di funzione convexlike o concavelike, cioè di tipo convesso o concavo.

Definizione. Sia f una funzione a valori reali definita sul prodotto X × Y di due insiemi
arbitrari.
1) f è convexlike su Y se e solo se

∀θ ∈ [0, 1] ∀y1 , y2 ∈ Y ∃y0 ∈ Y ∀x ∈ X f (x, y0 ) ≤ (1 − θ)f (x, y1 ) + θf (x, y2 ) .

2) f è concavelike su X se e solo se

∀θ ∈ [0, 1] ∀x1 , x2 ∈ X ∃x0 ∈ X ∀y ∈ Y f (x0 , y) ≥ (1 − θ)f (x1 , y) + θf (x2 , y) .

Osservazione. Se X eY sono insiemi convessi di spazi vettoriali e se f è concava in x o convessa


in y, ovviamente essa è rispettivamente concavelike su X o convexlike su Y .

Teorema di Ky Fan (1952). Siano X e Y due insiemi compatti ed f una funzione a


valori reali definita su X × Y .
Sia f (x, y) s.c.s su X per ogni y e s.c.i. su Y per ogni x. Allora l’uguaglianza

max min f (x, y) = min max f (x, y)


x∈X y∈Y y∈Y x∈X

Università di Torino, a.a. 2003-2004


38 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

vale se e solo se è soddisfatta la condizione seguente:


Per ogni coppia di sottoinsiemi finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X e Y esistono x0 ∈ X e
y0 ∈ Y tali che
f (xi , y0 ) ≤ f (x0 , yk ) , i = 1...n, k = 1...m .
In particolare, se f è concavelike su X e convexlike su Y , allora l’uguaglianza di minmax vale.

Osservazione 1. È evidente che il teorema precedente, sull’uguaglianza di minmax in presenza


di convessità, concavità e semicontinuità, è un corollario immediato del Teorema di Ky Fan.
Osservazione 2. Come nel teorema precedente, la s.c.s. in x e la s.c.i. in y assicurano l’esistenza
dei massimi e dei minimi che compaiono nella tesi.

Dimostrazione.
La condizione è ovviamente necessaria: sia

min max f (x, y) = max f (x, y0 ) e max min f (x, y) = min f (x0 , y),
y x x x y y

allora ∀i, k f (xi , y0 ) ≤ f (x0 , yk ).


Per verificarne la sufficienza, osserviamo che essa implica che per ogni coppia di sottoinsiemi
finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X e Y si ha

min max f (xi , y) ≤ max min f (x, yk ) .


y∈Y i x∈X k

Quindi per ogni reale ρ vale una almeno delle seguenti disuguaglianze:

min max f (xi , y) ≤ ρ , ρ ≤ max min f (x, yk ) .


y∈Y i x∈X k

Poniamo
L(x, ρ) = {y ∈ Y | f (x, y) ≤ ρ} , U (y, ρ) = {x ∈ X | ρ ≤ f (x, y)} ,
insiemi chiusi in virtù delle proprietà di semicontinuità di f .
Allora per ogni reale ρ e per ogni coppia di sottoinsiemi finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X
e Y , le due intersezioni
∩ni=1 L(xi , ρ) e ∩mk=1 U (yk , ρ)

non sono entrambe vuote, in quanto caratterizzano gli insiemi nei quali rispettivamente maxi f (xi , y) ≤
ρ e ρ ≤ mink f (x, yk ). Ne segue, vista la compattezza di X e Y , che le intersezioni

∩x∈X L(x, ρ) e ∩y∈Y U (y, ρ)

non sono entrambe vuote. Infatti, se per esempio la seconda intersezione fosse vuota, per
la compattezza di Y , esisterebbe almeno un sottoinsieme finito {y1 , y2 ...ym } di Y tale che
∩y∈Y U (y, ρ) = ∅. Ma allora, per ogni sottoinsieme finito {x1 , x2 ...xn } di X si avrebbe ∩ni=1 L(xi , ρ) =
∅ e quindi, per la compattezza di X, dovrebbe essere ∩x∈X L(x, ρ) = ∅.
Dunque o esiste x0 ∈ X tale che per ogni y ∈ Y risulta ρ ≤ f (x0 , y), oppure esiste y0 ∈ Y tale
che per ogni x ∈ X risulta f (x, y0 ) ≤ ρ.
Allora, per ogni ρ, deve essere soddisfatta almeno una delle disuguaglianze

min max f (x, y) ≤ ρ , ρ ≤ max min f (x, y) ,


y∈Y x∈X x∈X y∈Y

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 39

e ciò è possibile solo se


min max f (x, y) ≤ max min f (x, y) ,
y∈Y x∈X x∈X y∈Y

il che dimostra la prima parte della tesi.

Per ogni coppia di sottoinsiemi finiti {x1 , x2 ...xn } e {y1 , y2 ...ym } di X e Y , per il teorema
∗ ∗ ∗ ∗ ∗ ∗
di
 minmax

von∗ Neumann esistono due vettori (p1 , ...pn ) e (q1 ...qm ), con pi ≥ 0, qk ≥ 0 ,
di
i pi = 1 e k qk = 1, tali che
 
V = max qk∗ f (xi , yk ) = min p∗i f (xi , yk ) .
i k
k i

Supponiamo ora che f sia concavelike su X e convexlike su Y . Allora esistono x0 ∈ X e y0 ∈ Y


tali che  
∀i f (xi , y0 ) ≤ qk∗ f (xi , yk ) ≤ V, ∀k V ≤ p∗i f (xi , yk ) ≤ f (x0 , yk )
k i

e pertanto
∀i∀k f (xi , y0 ) ≤ V ≤ f (x0 , yk ) ,
quindi la condizione necessaria e sufficiente per l’uguaglianza di minmax è soddisfatta. q.e.d.

Una generalizzazione diversa dei concetti di convessità e concavità è la seguente.

Definizione. Sia f una funzione a valori reali definita in uno spazio vettoriale V .
a) f è quasicovessa su V se e solo se

∀l { v | f (v) ≤ l } è convesso .

b) f è quasiconcava su V se e solo se

∀l { v | f (v) ≥ l } è convesso .

Osservazione. Le nozioni di quasiconvessità e quasiconcavità sono già presenti, senza che ad


esse venga assegnato un nome, nel lavoro di von Neumann del 1928.

Siamo ora in grado di enunciare un risultato di M.Sion del 1957[23], la cui dimostrazione
venne derivata direttamente dal Teorema KKM, senza ricorrere al teorema di Brouwer.

Teorema di Sion (1957). Siano X e Y due insiemi compatti e covessi, ed f una funzione
a valori reali definita su X × Y .
Sia f (x, y) s.c.s e quasiconcava su X per ogni y, e s.c.i. e quasiconvessa su Y per ogni x.
Allora vale l’uguaglianza di minmax:

max min f (x, y) = min max f (x, y) .


x∈X y∈Y y∈Y x∈X

Università di Torino, a.a. 2003-2004


40 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

I risultati precedenti sui punti di equilibrio e sui punti di infsup possono essere generalizzati
in varie direzioni.

Risultano strumenti essenziali, non solo per le generalizzazioni sopra menzionate, i seguenti
Teoremi del minsup e di Ky Fan. Per un più facile confronto con la letteratura corrente, scam-
bieremo il ruolo delle variabili x e y: nel senso che cercheremo il minimo in x e il massimo in y.

Data una funzione f (x, y) definita su X × Y , introduciamo i valori (il primo e il terzo già
considerati in precedenza)

v− = sup inf f (x, y) ≤ v ∗ = sup inf sup f (x, y) ≤ v + = inf sup f (x, y) ,
y∈Y x∈X F ∈F x∈X y∈F x∈X y∈Y

dove F indica la famiglia dei sottoinsiemi finiti di Y.

La prima disuguaglianza si ottiene considerando soltanto gli insiemi costituiti da un solo


elemento F = {y} nelle operazioni che conducono a v ∗ ; la seconda disuguaglianza segue dall’os-
servazione che ovviamente per ogni F si ha inf x∈X supy∈F f (x, y) ≤ v + .

Premettendo che una funzione g(x) si dice inferiormente semi-compatta in X se e solo se per
ogli livello l risulta x ∈ X | g(x) ≤ l è compatto su X, possiamo ora enunciare il

Teorema del minsup. Supponiamo che valgano le seguenti condizioni


1) per ogni y ∈ Y f (·, y) è s.c.i. su X,
2) esiste y0 ∈ Y tale che f (·, y0 ) è inferiormente semi-compatta su X.
Allora esiste x∗ tale che
sup f (x∗ , y) = v ∗
y∈Y

e quindi
v∗ = v+ .
Dimostrazione. Gli insiemi C(y) = {x | f (x, y) ≤ v ∗ } sono chiusi per la s.c.i. Basta dimostrare
che C = ∩y∈Y C(y) = ∅ e prendere x∗ ∈ C. Per la compattezza di C(y0 ) basta dimostrare che
per ogni F = {y1 , y2 ...yn } ∈ F si ha CF = C(y0 ) ∩ ∩y∈F C(y) = ∅. Ma maxk f (x, yj ) è s.c.i. in
x e dunque esiste xF tale che

max f (xF , yj ) = inf max f (x, yj ) ≤ v ∗


j x j

e quindi xF ∈ CF . Dunque esiste x∗ tale che supy f (x∗ , y) ≤ v ∗ . Tuttavia

v + ≤ sup f (x∗ , y) ≤ v ∗ ≤ v +
y

e le tesi seguono immediatamente. q.e.d.

Teorema di Ky Fan. Sia X un sottospazio convesso e compatto di uno spazio vettoriale


topologico (separato). Supponiami che la funzione f : X × X → R soddisfi le condizioni:
1) per ogni y ∈ Xf (·, y) è s.c.i. ,

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 41

2) per ogni x ∈ Xf (x, ·) è quasi-concava,


3) supy∈X f (y, y) ≤ 0.
Allora esiste x∗ ∈ X tale che supy∈X f (x∗ , y) ≤ 0.

Dimostrazione. Poniamo M = supy∈X f (y, y). Poiché le ipotesi del Teorema del minsup sono
soddisfatte e quindi esiste x∗ tale che supy f (x∗ , y) = v + = v ∗ , basta dimostrare che v ∗ ≤ M .
Sia F = {y1 , y2 ...yn } un sottoinsieme finito arbitrario; controlliamo che

inf sup f (x, yj ) ≤ sup f (y, y) = M .


x j y∈X

Infatti, posto 
g(λ, y) = f ( λj yj , y) , Fj = {λ | g(λ, yj ) ≤ M } ,
j

), λj ≥ 0,
dove λ = (λ1 , ...λn j λj = 1, vediamo che per il Teorema KKM esiste λF ∈ ∩j Fj e
quindi, con xF = j (λF )j yj risulta maxj f (xF , yj ) ≤ M , dimostrando cosı́ la tesi.
Gli insiemi Fj soddisfano le ipotesi del Teorema KKM. Infatti sono chiusi per la s.c.i. Inoltre se
J(λ) = {j | λj = 0} allora λ ∈ ∪j∈J(λ) Fj , altrimenti esisterebbe µ tale che

∀j ∈ J(µ) g(µ, yj ) = f ( µi yi , yj ) > M .
i

Ma, per la quasi-concavità di f nella seconda variabile, si avrebbe


   
f( µi yi , µi y) ≥ µi f ( µi yi , yi ) > M ,
i i i i

in contraddizione con la definizione di M . q.e.d.

Usiamo ora il Teorema di Ky Fan per dimostrare una notevole generalizzazione del Teorema
di Nash.

Ricordiamo la definizione di punti di equilibrio di Nash, considerando ora però problemi di


minimo (equivalenti a problemi di massimo per le funzioni proposte cambiate di segno):

n f1 , f2 , ...fn n funzioni reali della variabile x = (x1 , x2 ...xn ), che varia in un sottoinsieme
Siano
A di j=1 Aj , essendo Aj l’insieme dei valori ammissibili per xj . Dunque

fk : A ⊆ A1 × A2 ... × An → R , k = 1, 2...n .

Un punto c = (c1 , c2 ...cn ) ∈ A è un punto di equilibrio di Nash per le fj se e solo se

∀j ∈ {1, 2...n} fj (c) = min fj (< c; xj , j >) .


{xj | <c;xj ,j>∈A}

Definiamo la funzione g : A × A → R mediante la formula



n
g(x, y) = (fj (x) − fj (< x; yj , j >)) .
j=1

Università di Torino, a.a. 2003-2004


42 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

Lemma. Se x ∈ A soddisfa la disuguaglianza

sup g(x, y) ≤ 0 ,
y∈A

allora x è un punto di equilibrio di Nash.


Dimostrazione. Per y =< x; yk , k >∈ A, solo il termine k-esimo della somma non è nullo e si
ottiene g(x, y) = fk (x)−fk (< x; yk , k >) ≤ 0, cioè fk (x) = min{yk | <x;yk ,k>∈A} fk (< x; yk , k >).
q.e.d.

Teorema (Nash). Supponiamo che


1) l’insieme A sia convesso e compatto;
2) le funzioni fj siano continue e
3) qualsiasi j la funzione fj sia convessa nella variabile xj per tutti i valori ammissibili delle
altre variabili.
Allora esiste un punto di equilibrio.

Dimostrazione. Per il lemma precedente basta vedere che esiste x ∈ A tale che supy∈A g(x, y) ≤
0. Ma le ipotesi del Teorema di Ky Fan sono soddisfatte: A è convesso e compatto per ipotesi;
g è s.c.i in x, con y arbitrario, per la continuità delle fj ; g è concava in y, con x arbitrario, per
la convessità delle fj e infine per ogni y si ha ovviamente g(y, y) = 0. q.e.d.

Corollario (sui punti sella). Nen caso particolare di due sole variabili (due giocatori)
x = (x1 , x2 ) e con
f1 (x1 , x2 ) = f (x1 , x2 ) = −f2 (x1 , x2 )
(gioco a somma zero), basta chiedere che f (·, x2 ) sia s.c.i. per ogni x2 e f (x1 , ·) sia s.c.s. per
ogni x1 , invece di chiedere la continuità di f (·, ·). Si deve ovviamente chiedere che f sia convessa
in x1 e concava in x2 . In tal caso il punto di equilibrio del quale si garantisce l’esistenza (x∗1 , x∗2 )
è ovviamente un punto sella:

min max f (x1 , x2 ) = f (x∗1 , x∗2 ) = max min x1 f (x1 , x2 ) .


x1 x2 x2

Dimostrazione. Riprendendo la dimostrazione del Teorema di Nash, si ha in questo caso

g(x, y) = f (x1 , x2 ) − f (y1 , x2 ) + (−f (x1 , x2 ) + f (x1 , y2 ) = f (x1 , y2 ) − f (y1 , x2 ) ,

e dunque g è s.c.i. in y sotto le ipotesi di semicontinuità alle quali f soddisfa. Si osservi che f
è concava in x2 essendo −f convessa. Il resto della deduzione non cambia. q.e.d.

Per ulteriori approfondimenti si veda Aubin[1].

2.5 Gamma convergenza


Dobbiamo ad Ennio De Giorgi l’introduzione e lo sviluppo di una nozione di convergenza
per successioni a valori reali (estesi) di grande importanza per lo studio di problemi variazionali.
Si tratta di un tipo di convergenza adatto a controllare il comportamento asintotico dei minimi

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 43

e dei massimi, come dei punti di minimo e di massimo, in un contesto estremamente generale.
Proponiamo in questa sezione alcuni cenni, rinviando per una trattazione dettagliata al lavoro
di De Giorgi - Franzoni[6].

Sia X uno spazio topologico, τ la sua topologia, fn una successione di funzioni definite in X
a valori relai estesi.

Definizione. Si dice Γ− -liminf della successione la funzione

Γ− (τ ) lim inf f (x) = sup lim inf inf fn (y) ,


n V ∈Vτ (x) n y∈V

che indicheremo brevemente con γi− (x). Vτ (x) è la famiglia degli intorni di x per la topologia τ .

Definizione. Si dice Γ− -limsup della successione la funzione

Γ− (τ ) lim sup f (x) = sup lim sup inf fn (y) ,


n V ∈Vτ (x) n y∈V

che indicheremo brevemente con γs− (x).

Definizione. Si dice che la successione fn Γ− -converge se γi− (x) = γs− (x). Il valore comune
è il Γ− -limite delle fn e verrà indicato con γ − (x).

Lemma. Le funzioni γi− (x) e γs− (x) sono semicontinue inferiormente.


Dimostrazione. Sia c < γi− (x) = supV (x) lim inf n inf y∈V (x) , dove con V (x) indichiamo un
generico intorno di x. Allora esiste W (x) tale che

c < lim inf inf ≤ sup lim inf inf fn (x) ,


n y∈W (x) V (z) n y∈V (z)

per ogni z ∈ W (x) e dunque γi− (x) è s.c.i. Per γs− (x) si procede nello stesso modo. q.e.d.

Osservazione. Si ha sempre ovviamente

γi− (x) ≤ lim inf fn (x) , γs− (x) ≤ lim sup fn (x) .
n n

Se le funzioni fn sono equisemicontinue in x, cioè se per ogni ε > 0 esiste un intorno V (x)
tale che per ogni n e per ogni y ∈ V (x) si abbia fn (y) > fn (x) − ε, allora valgono le relazioni
precedenti con il segno di uguaglianza.
Dimostrazione. Dato ε > 0 arbitrario e considerato un intorno V (x) con le proprietá sopra dette
si trova ∈y∈V (x) fn (y) ≥ fn (x) − ε e dunque si ha γi− (x) ≥ lim inf n fn (x) − ε. q.e.d.

Esempio 1. Sia X = [0, 1[ con la topologia indotta da R; sia

χn,k = χ[(k−1)/n,k/n[ n = 1, 2, ... , k = 1, 2, ..., n .

Ordiniamo queste funzioni caratteristiche formando la successione fp = χn,k , p = 1 + 2 + ...(n −


1) + k . Per ogni x ∈ [0, 1[ vi sono infiniti indici p per i quali fp (x) = 1 e infiniti per i quali

Università di Torino, a.a. 2003-2004


44 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

fp (x) = 0 : quindi lim inf n fn = 0 e lim supn fn = 1, mentre la successione fp non converge in
nessun punto.
Se ora fissiamo un intorno arbitrario V di un punto x, per n sufficientemente grande vi saranno
in V punti z per i quali fn (z) = 0 e dunque inf y∈V fn (y) = 0. Ne segue che γi− (x) = γs− (x) = 0
e la successione Γ− -converge alla funzione nulla.

Esempio 2. Si consideri in [0, 1] , munito della usuale misura di Lebesgue, un sottoinsieme


numerabile denso (eventualmente i razionali dell’intervallo) E = {r0 , r1 , r2 ...}. Sia

1/n 1/n
A = ∩+∞
n=1 An , An = ∪k ]rk − k
, rk + k [ .
2 2
An è un aperto denso di misura di Lebesgue ≤ 4/n, An+1 ⊂ An e l’insieme A è un Gδ , denso,
di misura di Lebesgue 0. Mentre il complementare C = Ac = ∪n Cn , con Cn = Acn , ha misura
di Lebesgue 1 e Cn ⊂ Cn+1 . Sia fn la funzione caratteristica di Cn , complementare di An . La
successione fn dunque converge q.o. e in ogni Lp alla funzione costante uguale a 1. Ma fissato
un intorno arbitrario V di un punto x in V vi sono sempre punti di An e quindi inf y∈V fn (y) = 0.
Si conclude allora che la successione Γ− -converge alla funzione nulla.

Proposizione A. Sia A un aperto, allora

inf γi− (x) ≥ lim inf inf fn (x) ,


x∈A n x∈A

inf γs− (x) ≥ lim sup inf fn (x) .


x∈A n x∈A

Dimostrazione. Risulta, essendo A aperto e dunque intorno di ogni suo punto:

∀x ∈ A γi− (x) = sup lim inf inf fn (x) ≥ lim inf inf fn (x) .
V (x) n y∈V (x) n y∈A

Prendendo l’estremo inferiore su A di entrambi i membri si ottiene il primo risultato. Analoga-


mente si procede per la seconda disuguaglianza.

Proposizione L. Sia xn → x. Allora

γi− (x) ≤ lim inf fn (xn ) ,


n

γs− (x) ≤ lim sup fn (xn ) .


n

Dimostrazione. Fissato comunque V (x), per n sufficientementente grande si ha xn ∈ V (x) e


dunque fn (xn ) ≥ inf y∈V (x) fn (x), dunque

lim inf fn (xn ) ≥ sup lim inf inf fn (x) . q.e.d.


n V (x) n y∈V (x)

Proposizione K. Sia K un sottoinsieme di X sequenzialmente compatto, allora

min γi− (x) ≤ lim inf inf fn (x) .


x∈K n x∈K

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 45

Dimostrazione. Indichiamo con l il secondo membro della disuguaglianza precedente. Sia fn
una sottosuccessione di fn e xn una successione di punti di K tali che

lim inf fn (x) = l = lim fn (xn ) .


n x∈K n

Sia poi xnj una sottosuccessione convergente in K e chiamiamo x il suo limite. Ricordando
che ovviamente il liminf lungo una successione è minore o uguale al liminf lungo una qualunque
sottosuccessione, si trova:

γi− (x) ≤ Γ− lim inf fn (x) ≤ Γ− lim inf fn j (x) ≤ lim inf fn j (xnj ) = lim fn j (xnj ) = l ,
n j j j

l’ultima disuguaglianza essendo assicurata dalla Proposizione L. q.e.d.

Teorema. Sia K un insieme sequenzialmente compatto contenuto nell’aperto A di X.


Supponiamo che valga l’ipotesi (di “coercività)

∀n inf fn (x) = inf fn (x) .


x∈K x∈A

Supponiamo inoltre che la successione fn sia Γ− - convergente a γ − (x). Allora

min γ − (x) = min γ − (x) = lim inf fn (x) = lim inf fn (x) .
x∈A x∈K n x∈K n x∈A

Inoltre, se xn → x ∈ A e fn (xn ) → µ = miny∈A γ − (y) allora

γ − (x) = min γ − (y) .


y∈A

Dimostrazione. Per la prima tesi, osservando che γ − (x) è s.c.i., usando la Proposizione K e
quindi la Proposizione A, si ottiene

min γ − (x) ≤ lim inf inf fn (x) ≤ lim sup inf fn (x) ≤ inf γ − (x) .
x∈K n x∈K n x∈A x∈A

Per la seconda tesi basta applicare la Proposizione L:

γ − (x) ≤ lim fn (xn ) = µ . q.e.d.


n

Università di Torino, a.a. 2003-2004


46 Capitolo 2. Punti fissi. Punti di equilibrio e Teoremi di min-max

Quaderni Didattici del Dipartimento di Matematica


Capitolo 3

Operatori lineari. Equazioni


integrali

3.1 Lo spazio L(X, Y ).


Definizione. Siano X e Y due spazi vettoriali su K (K = R o K = C) normati. Sia D(A)
un sottospazio vettoriale di X e
A : D(A) ⊆ X → Y
un’applicazione lineare definita in D(A) a valori in Y :

∀f, g ∈ D(A) ∀λ, µ ∈ K A(λf + µg) = λAf + µAg ∈ Y .

Si dice che A è un’operatore lineare da X in Y di dominio D(A) .

Un operatore lineare può non essere definito su tutto X e può, diversamente da quanto av-
viene in dimensione finita, non essere continuo. Ad esempio, se X = Y = C([0, 1]), l’operatore
di derivazione d/dx ha per dominio l’insieme C 1 ([0, 1]) delle funzioni derivabili con derivata
continua, che è un sottospazio proprio di C([0, 1]), e non è continuo, perché successioni unifor-
memente convergenti di funzioni derivabili non hanno necessariamente derivate uniformemente
convergenti:
1 1
sin (2πnx) − 0 ∞ = → 0 , ma 2π cos (2πnx) ∞ = 2π .
n n
(Se cos (2πnx) → g(x) uniformemente, g dovrebbe essere la derivata della funzione nulla, cioè
g ≡ 0.)

Definizione. L(X, Y ) è l’insieme degli operatori lineari ovunque definiti in X e continui da


X in Y :
A ∈ L(X, Y ) ⇔ D(A) = X e fn → f in X ⇒ Afn → Af in Y .

47
48 Capitolo 3. Operatori lineari. Equazioni integrali

Si vede immediatamente che L(X, Y ) è uno spazio vettoriale su K .

Definizione. Un’applicazione A da X in Y si dice limitata se trasforma ogni insieme


limitato di X in un insieme limitato di Y .
(Si osservi che nell’esempio precedente d/dx non è limitato: {sin (2πnx)}n è limitato in X , ma
{2πn cos (2πnx)}n non è limitato in Y = X.)

Per gli operatori lineari ovunque definiti continuità e limitazione sono equivalenti. Più pre-
cisamente vale la

Proposizione. Sia A : X → Y lineare con D(A) = X. Allora le proprietà seguenti sono


equivalenti:
1) A è continuo in 0;
2) A è continuo ovunque;
3) A è limitato;
4) Esiste M ≥ 0 tale che
∀f ∈ X Af Y ≤ M f X .
Dimostrazione.
Ovviamente 2) implica 1).
Anche 1) implica 2): infatti se fn → f , fn −f → 0 e quindi A(fn −f ) → A0 = 0, cioè Afn → Af .
1) implica 3): se B è limitato esiste L tale che ∀b ∈ B b ≤ L. Allora, se Af ≤ 1 per f ≤ δ
(continuità in 0), poiché δb/L ≤ δ,
L δb L
∀b ∈ B Ab = A ≤ ,
δ L δ
cioè A(B) è limitato.
3) implica 4): B = {b ∈ X | b ≤ 1} è limitato e pertanto è limitato A(B), cioè esiste M tale
che b ≤ 1 ⇒ Ab ≤ M . Allora, se f = 0:
f
Af = A f ≤ M f .
f

4) implica 2):
Af − Ag ≤ M f − g ,
cioè A è Lipschitziana e pertanto continua. q.e.d.

Teorema. L(X, Y ) è uno spazio vettoriale normato per la norma


A L(X,Y ) = inf{M ≥ 0 | ∀f ∈ X Af Y ≤ M f X } .
Risulta inoltre
∀f ∈ X Af ≤ A f
(quindi l’estremo inferiore nella definizione della norma è un minimo) e
Af Y Af Y
A L(X,Y ) = sup = sup = sup Af Y .
f =0 f X f =0, f ≤1 f X f =1

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 49

Dimostrazione. L(X, Y ) è uno spazio vettoriale, perché tale è Y , definendo

(λA + µB)f = λAf + µBf .

Le disuguaglianze della tesi seguono immediatamente dalle proprietà degli estremi inferiore e
superiore e dalla positiva omogeneità delle norme (il rapporto Af / f resta costante sulle
semirette uscenti da 0 e sup f =r Af / f è indipendente da r).

Teorema. Sia Y uno spazio di Banach. Allora L(X, Y ) con la norma A L(X,Y ) è uno
spazio di Banach.
Dimostrazione. Sia An ∈ L(X, Y ) una successione di Cauchy:

∀ε ∃N ∀n > N ∀p An+p − An < ε .

Allora ∀f ∈ X An+p f − An f < ε f e An f è di Cauchy in Y , che è completo. Dunque An f


converge ad un limite dipendente da f , che indicheremo con Af . Per le proprietà dei limiti si
vede subito che A è lineare e D(A) = X. Inoltre per n > N

An+p ≤ An + ε

e dunque
Af = lim An+p f ≤ ( An + ε) f ,
p→+∞

cioè A è limitato: A ∈ L(X, Y ). Infine

An f − Af = lim An f − An+p f ≤ ε f ,
p→+∞

cioè An − A L(X,Y ) ≤ ε per n > N e quindi An → A ∈ L(X, Y ). q.e.d.

3.2 La serie di Neumann e l’inseme GL(X, Y ).


Tra gli operatori limitati hanno particolare importanza quelli, se esistono, che stabiliscono una
corrispondenza biunivoca tra X e Y . Tali operatori sono invertibili e l’applicazione inversa A−1
è ovviamente lineare e ovunque definita in Y : D(A−1 ) = Y . L’insieme delle applicazioni bijetive
di L(X, Y ) si indica con GL(X, Y ). Ricorrendo ad uno dei teoremi fondamentali dell’Analisi
funzionale, il teorema dell’applicazione aperta di Banach, che si vedrà al Capitolo 7, si
può ottenete il seguente risultato, che useremo sistematicamente nel seguito:

Teorema. Se X e Y sono spazi di Banach, allora

A ∈ GL(X, Y ) ⇒ A−1 ∈ GL(Y, X) ,

ovvero l’inverso di un operatore limitato, se esiste, è anch’esso limitato.

Prima di studiare alcune proprietà di GL(X, Y ), consideriamo il caso particolare, molto im-
portante, in cui X = Y . In tal caso si scrive brevemente L(X) in luogo di L(X, X) e GL(X) in

Università di Torino, a.a. 2003-2004


50 Capitolo 3. Operatori lineari. Equazioni integrali

luogo di GL(X, X) .

Proposizione. L(X) è un’algebra (in generale non commutativa), essendo il prodotto


definito come composizione di applicazioni, cioè nel modo seguente:

∀f ∈ X (A · B)f = A(Bf ) .

In generale AB = BA . Inoltre:
AB ≤ A B .
La dimostrazione è immediata ( ABf ≤ A Bf ≤ A B f ).

Osservazione. Più in generale, se A ∈ L(X, Y ) e B ∈ L(Y, Z), allora l’operatore composto


BA = B ◦ A ∈ L(X, Z) e si ha

BA L(X,Z) ≤ B L(Y,Z) A L(X,Y ) .

In L(X) l’operatore identico I (talvolta scriveremo 1) è ovviamente invertibile. Risulta


che perturbazioni sufficientemente piccole di I sono ancora invertibili e la loro inversa si può
rappresentare come una serie, analoga alla serie geometrica del caso scalare. Precisamente vale il

Teorema (Serie di Neumann). Sia A ∈ L(X) con A L(X) < 1 , allora


+∞

(I − A)−1 ∈ L(X) e (I − A)−1 = Ak .
k=0

(Si pone A0 = I.)



Dimostrazione. La serie di Neumann k Ak è convergente “assolutamente per A < 1 (ad
un elemento di L(X)), essendo
+∞
 +∞

Ak ≤ A k < +∞ .
k=0 k=0

(In ogni spazio di Banach, per il criterio di Cauchy, la convergenza di una serie con termini ck
è implicata dalla convergenza della serie delle loro norme ck . Come per le serie numeriche, in
questo caso la convergenza è indipendente dall’ordine dei termini ck .)
Inoltre si ha
n n
(I − A) Ak = ( Ak )(I − A) = I − An+1 → I ,
0 0

per n → +∞ ( A ≤ A → 0). Dunque, passando al limite e ricordando che I − A e Ak


n n

sono continue, si trova


+∞
 +∞

∀f ∈ X (I − A) Ak f = ( Ak )(I − A)f = f = If
0 0

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 51

+∞
e pertanto (I − A)−1 = k=0 A
k
. q.e.d.

Osservazione. L’inversione di I − A è legata alla risoluzione dell’equazione (I − A)f = g per


ogni g , ovvero ala determinazione di un punto fisso di M definita da M f = Af + g. M è una
contrazione stretta se A < 1. Il teorema sulle contrazioni fornisce la soluzione nella forma
+∞

f = lim M n f0 = lim (g + Ag + A2 g + ...An−1 g + An−1 f0 ) = Ak g .
n→+∞ n→+∞
k=0
+∞
Nel teorema precedente però si ha non soltanto la convegenza della serie k=0 Ak g per ogni g ,
ma anche la convergenza della serie degli operatori Ak stessi, equivalente alla convergenza della
serie precedente uniformemente sui limitati di X.

Siamo ora in grado di dimostrare i seguenti risultati fondamentali.

Teorema. GL(X, Y ) è un insieme aperto in L(X, Y ) e l’applicazione i : A → i(A) = A−1 è


continua.

Dimostrazione. Vediamo che se A ∈ GL(X, Y ) e H < A−1 −1 allora A + H ∈ GL(X, Y ).


Infatti per ogni g ∈ Y

(A + H)f = g ⇔ (I + A−1 H)f = A−1 g ⇔ f = M f ,

dove M è definito da
M φ = −A−1 Hφ + A−1 g .
Dunque
M φ − M ψ ≤ A−1 H φ − ψ
e M è una contrazione stretta se H < A−1 −1 . Allora per ogni g esiste una e una sola
soluzione f dell’equazione (A + H)f = g e A + H è bijettivo.
Si può anche, e forse con vantaggio, ricorrere alla serie di Neumann, osservando che, se I è
l’operatore identità in L(Y ),
+∞

(A + H)−1 = [(I + HA−1 )A]−1 = A−1 (I + HA−1 )−1 = A−1 (−HA−1 )k ,
k=0

se HA−1 < 1 , e a maggior ragione se H A−1 < 1. Abbiamo pertanto la maggiorazione


+∞
 A−1
(A + H)−1 L(Y,X) ≤ A−1 L(Y,X) (HA−1 )k L(X) ≤ .
1 − H A−1
k=0

Da questa maggiorazione si ottiene facilmente la continuità dell’applicazione i. Infatti

(A + H)−1 − A−1 = (A + H)−1 (A + H − A)A−1 ≤

A−1 2
≤ (A + H)−1 H A−1 ≤ H
1 − H A−1

Università di Torino, a.a. 2003-2004


52 Capitolo 3. Operatori lineari. Equazioni integrali

e per H → 0 il primo membro tende a 0. q.e.d.

Nel caso di un operatore limitato A ∈ L(X) si possono definire altri operatori che sono sue
funzioni, mediante serie convergenti. Se f (z) è una serie convergente: f (z) = +∞ c
n=0 n z n
, con
raggio di convergenza ρ e ||A|| < ρ si può definire:
+∞

f (A) = cn An ∈ L(X) .
n=0

Tale serie converge “assolutamente in L(X) perchè i suoi termini sono maggiorati in norma da
|cn | A n , che per ipotesi sono termini di una serie convergente.

Ad esempio, per ogni t ∈ R , poniamo


+∞
 (tA)n
etA = .
n=0
n!

La serie è “assolutamente convergente perchè le norme dei suoi termini sono maggiorate dai
numeri |t|n A n /n! che sono i termini di una ordinaria serie esponenziale.
La funzione
t → etA ∈ L(X)
ha proprietà analoghe a quelle della funzione esponenziale et :

1) Per t ed s arbitrari
e(t+s)A = etA esA .
Infatti
+∞ 
 ti A i s j A j
etA esA = =
n=0 i+j=n
i! j!

+∞
 n

An  n
= sj tn−j .
n! j
n=0 j=0

2) È una funzione di t continua nell’origine (e quindi per la proprietà precedente continua


ovunque):
lim etA = e0A = I .
t→0

Infatti se |t| ≤ M
+∞
 M j A j+1
etA − I ≤ |t| .
j=0
(j + 1)!

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 53

3) È una funzione derivabile rispetto al parametro t per t = 0 (e quindi ovunque per la prima
proprietà):
def etA − I
Dt etA |t=0 = lim =
t→0 t
+∞ j

tA2 t ||A||j+2
= lim (A + + ...) = A + lim t =A,
t→0 2! t→0
j=0
(j + 2)!

e dunque

etA − et0 A t0 A e(t−t0 )A − I t0 A


Dt etA |t=t0 = lim e = lim e = Aet0 A .
t→0 t − t0 t−t0 →0 t − t0

4) Per ogni x0 ∈ X la funzione


t → x(t) = etA x0
è soluzione (unica) del problema di Cauchy lineare omogeneo


 dx(t) = Ax(t)
dt


x(0) = x0

Viste le proprietà di etA la proposizione precedente si verifica in modo immediato.

Ad esempio se X = C([a, b]), K ∈ C([a, b]2 ) e ϕ ∈ C([a, b]) , introducendo l’operatore, che
verificheremo nei paragrafi successivi essere limitato:
 b
Af (y) = K(x, y)f (y)dy , A ∈ L(X) ,
a

l’equazione integro-differenziale
 b

 ∂u(t, x) = K(x, y)u(t, y)dy
∂t a


u(0, x) = ϕ(x)

ha un’unica soluzione rappresentabile mediante la formula

u(t, x) = etA ϕ(x) .

Università di Torino, a.a. 2003-2004


54 Capitolo 3. Operatori lineari. Equazioni integrali

3.3 Operatori integrali in C([a, b])


Sia K(x, y) una funzione (a valori reali o complessi) definita in [a, b]2 tale che

1) Per ogni x ∈ [a, b] sia finito l’integrale


 b
|K(x, y)|dy ;
a

2) Per ogni x0 e ε > 0 esista δ tale che


 b
|x − x0 | < δ ⇒ |K(x, y) − K(x0 , y)|dy < ε .
a

Allora l’operatore integrale A, definito da


 b
(Af )(x) = K(x, y)f (y)dy ,
a

è lineare e continuo da C([a, b]) in sè stesso: A ∈ L(C([a, b])) (e si dice che K è il nucleo
(kernel) di A).
Infatti, per ogni funzione continua f :
 b
|Af (x) − Af (x0 )| ≤ |K(x, y) − K(x0 , y)||f (y)|dy ≤
a
 b
≤ f ∞ |K(x, y) − K(x0 , y)|dy < ε f ∞ ,
a

se |x − x0 | < δ e quindi Af è una funzione continua.


Inoltre A è ovviamente lineare e
 b
Af ≤ max |K(x, y)|dy f .
x∈[a,b] a
b
Si osservi che la funzione x → a
|K(x, y)|dy è continua sul compatto [a, b] , perché
 b  b  b
| |K(x, y)|dy − |K(x0 , y)|dy| ≤ ||K(x, y)| − |K(x0 , y||dy ≤
a a a
 b
≤ |K(x, y) − K(x0 , y)|dy < ε
a

se |x − x0 | < δ , e quindi il massimo precedente esiste.


Dunque A è limitato e
 b
A L(C([a,b])) ≤ max |K(x, y)|dy .
x∈[a,b] a

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 55

***

Si può dimostrare che nella relazione precedente vale il segno di uguaglianza: sia x∗ tale che
 b  b
|K(x∗ , y)|dy = C = max |K(x, y)|dy
a x∈[a,b] a

e consideriamo la funzione integrabile f ∗ (x) = K(x∗ , x) . Indichiamo brevemente con A l’in-


tervallo [a, b]. Siano A+ , A− gli insiemi misurabili sui quali f ∗ è rispettivamente nonnegativa o
negativa. Ovviamente A è unione disgiunta di A+ e A− . Siano χ+ (x), χ− (x) le loro funzioni
caratteristiche e k(x) = χ+ (x) − χ− (x), ovvero k(x) = segn K(x∗ , x) (asumendo segn(0) = 1).
Essendo A+ ∩ A− = ∅, risulta maxx |k(x)| = 1 . Allora per la funzione
 b
l(x) = K(x, y)k(y)dy
a

si ha maxx |l(x)| = C , perché


|l(x)| ≤ C e l(x∗ ) = C .
Tuttavia la funzione k(x) non è continua. Ma possiamo approssimarla tanto bene quanto vo-
gliamo mediante funzioni continue di norma uguale a 1 : dato ε > 0 arbitrario, indicando con λ
la misura di Lebesgue in R , sia

F+ε ⊆ A+ ⊆ O+
ε ε
, λ(O+ − F+ε ) < ε ,

F−ε ⊆ A− ⊆ O−
ε ε
, λ(O− − F−ε ) < ε ,
dove F+ε , F−ε sono chiusi e O+
ε ε
, O− aperti. I due insiemi A+ , A− sono disgiunti e a maggior ragione
sono disgiunti F+ε , F−ε . Poiché A è uno spazio topologico compatto e quindi normale, esistono
due aperti disgiunti V+ε , V−ε che contengono rispettivamente F+ , F− . Allora, introducendo gli
aperti W±ε = O± ε
∩ V±ε si ha
W+ε ∩ W−ε = ∅ e F±ε ⊆ W±ε .
Poniamo allora
d(x, X − W±ε )
φε± (x) = , φε (x) = φε+ (x) − φε− (x) .
d(x, F±ε ) + d(x, X − W±ε )

La funzione φε è continua, coincide con k su F = F+ε ∪ F−ε , φε ∞ = 1 e quindi Aφε ≤ C . Il


complementare di F è contenuto in (O+ ε
− F+ε ) ∪ (O−
ε
− F−ε ) e quindi λ(F c ) < 2ε. Ma
 b  b  b
C −| K(x∗ , y)φε (y)dy| ≤ K(x∗ , y)k(y)dy − K(x∗ , y)φε (y)dy ≤
a a a
 b 
≤ |K(x∗ , y)||k(y) − φε (y)|dy == |K(x∗ , y)||k(y) − φε (y)|dy ≤
a Fc

2 |K(x∗ , y)|dy ≤ η ,
Fc

Università di Torino, a.a. 2003-2004


56 Capitolo 3. Operatori lineari. Equazioni integrali

se ε è sufficientemente piccolo, in virtù dell’assoluta continuità dell’integrale. Pertanto, per ogni


η>0
 b  b
C ≥ Aφε = max | K(x, y)φε (y)dy| ≥ | K(x∗ , y)φε (y)dy| ≥ C − η ,
x a a
e quindi A = C .

& & &

Se la funzione K(x, y) è continua si ottiene immediatamente la stima meno precisa

A ≤ M (b − a) dove M = max |K(x, y)| .


(x,y)∈[a,b]2

3.4 Equazioni integrali in C([a, b])


Un’equazione integrale lineare è un’equazione della forma
 b
λa(x)u(x) − k(x, y)u(y)dy = g(x) , x ∈ [a, b] ,
a

dove λ è un parametro complesso, k è il nucleo dell’equazione (o dell’operatore integrale asso-


ciato), u è la funzione incognita e g è il termine noto.
Se λ = 0 l’equazione integrale è detta di prima specie. Se λa(x) = 0 per ogni x ∈ [a, b] l’equa-
zione è detta di seconda specie. In questo caso si può dividere per a(x) e presentare l’equazione
nella forma  b
u(x) − µ K(x, y)u(y)dy = f (x) , x ∈ [a, b] ,
a
K(x, y) = k(x, y)/a(x) , µ = 1/λ .
Se infine λ = 0 e a(x) si annulla, ma non identicamente in [a, b] , l’equazione si dice di terza specie.

Ci occuperemo in primo luogo di equazioni integrali di seconda specie, supponendo che il


termine noto sia una funzione continua e l’operatore integrale K̂ di nucleo K(x, y) sia limitato
in C([a, b]) . Se il parametro µ è sufficientemente piccolo si può ricorrere al teorema sul punto
fisso delle contrazioni.

Teorema. Sia f ∈ C([a, b]) e |µ| K̂ < 1 , allora esiste un’unica funzione continua u(x) tale
che  b
u(x) = µ K(x, y)u(y)dy + f (x) .
a
Dimostrazione. L’applicazione
A : g → Ag = µK̂g + f
opera dallo spazio di Banach (quindi metrico e completo) C([a, b]) in sè stesso e nell’ipotesi fatte
è una contrazione:

Ag − Ag ∗ C([a,b]) ≤ |µ| K̂ L(C([a,b])) g − g ∗ C([a,b]) , |µ| K̂ < 1 .

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 57

Dunque esiste un’unico punto fisso u di A , ovviamente soluzione dell’equazione integrale: u =


Au = µK̂u + f . Il punto fisso si può ottenere con il metodo delle approssimazioni successive
(talvolta detto metodo di Picard):

u0 arbitraria in C([a, b])
b
un+1 (x) = µ a K(x, y)un (y)dy + f (x)

La successione un (x) converge uniformemente in [a, b] all’unica soluzione u(x) dell’equazione.


q.e.d.

Si osservi che con la stessa tecnica si possono trattare equazioni integrali non lineari del
tipo
 b
u(x) = µ F (x, y, u(y))dy ,
a
2
ad esempio nelle ipotesi F ∈ C([a, b] × R) tale che

|F (x, y, z) − F (x, y, z ∗ )| ≤ M |z − z ∗ | , |µ|M (b − a) < 1 ,

cioè F soddisfa una condizione di Lipschitz rispetto alla terza variabile, uniformemente per
(x, y) ∈ [a, b]2 , e µ è sufficientemente piccolo.
Infatti in tali ipotesi l’applicazione
 b
(Au)(x) = µ F (x, y, u(y))dy
a

è una contrazione:
Au − Av = max |Au(x) − Av(x)| ≤
x
 b
≤ |µ| M |u(y) − v(y)|dy ≤ |µ|M |(b − a) u − v .
a

Osservazione. Per semplicità e concretezza abbiamo considerato operatori ed equazioni in-


tegrali su un intervallo [a, b] dell’asse reale, ma tutti i risultati precedenti si estendono senza
difficoltà almeno al caso di domini di integrazione D compatti e in presenza di misure com-
patibili con la struttura topologica. Ad esempio D potrebbe essere la chiusura di un aperto
limitato Ω ⊂ Rn e dx la misura di Lebesgue in Rn (in tal caso u ed f sarebbero funzioni di n
variabili reali, K funzione di una coppia di variabili reali, |x − y| dovrebbe essere interpretato
come norma, eventualmente Euclidea, di x − y ...).

Le equazioni integrali lineari considerate precedentemente, con dominio di integrazione fisso,


sono spesso associate al nome di Fredholm, che fu uno dei principali artefici della teoria all’inizio
del 1900. Si usa invece far riferimento al nome di Volterra considerando equazioni integrali del
tipo  x
u(x) = µ K(x, y)u(y)dy + f (x) ,
a

Università di Torino, a.a. 2003-2004


58 Capitolo 3. Operatori lineari. Equazioni integrali

dove l’ntervallo di integrazione è variabile con x . In effetti le equazioni di questo tipo si possono
considerare come un caso particolare di quelle viste precedentemente. Basta porre

K(x, y) se y ≤ x
L(x, y) =
0 se y > x
per poter riscrivere l’equazione nella forma
 b
u(x) = µ L(x, y)u(y)dy + f (x)
a

ed essere in grado di applicare tutti i risultati ottenuti precedentemente.


Tuttavia le equazioni del tipo di Volterra si possono risolvere con il metodo delle approssima-
zioni successive, senza alcuna restrizione sul parametro µ. Per semplicità ci limitiamo a nuclei
continui.

Teorema. Sia K(x, y) continua (per y ≤ x ), M = maxy≤x |K(x, y)| e f (x) continua in [a, b],
allora per ogni valore di µ = 0 esiste un’unica funzione continua u(x) soluzione dell’equazione
 x
u(x) = µ K(x, y)u(y)dy + f (x) ,
a

che si può ottenere con il metodo delle approssimazioni successive.


Dimostrazione. Consideriamo l’applicazione
 x
(Au)(x) = µ K(x, y)u(y)dy + f (x)
a

e studiamo il problema di punto fisso u = Au. Dimostriamo che una iterata di A di ordine
sufficientemente elevato è una contrazione:
 x
|Au(x) − Av(x)| ≤ |µ| M |u(y) − v(y)|dy ≤ |µ|M (x − a) u − v ,
a

dunque Au − Av ≤ |µ|M (b − a) u − v . Poi


 x  x
|A2 u(x) − A2 v(x)| ≤ |µ| M |Au(y) − Av(y)|dy ≤ |µ|M |µ|M u − v (y − a)dy
a a

(x − a)2
≤ (|µ|M )2 u − v ,
2
dunque A2 u − A2 v ≤ (|µ|M (b − a))2 /2 u − v . Iterando si trova facilmente
Ap u − Ap v ≤ (|µ|M (b − a))p /p! u − v .
Poiché (|µ|M (b − a))p /p! → 0 per p → +∞, per p sufficientemente grande Ap è una contrazione.
Dunque, per il teorema sui punti fissi delle applicazioni con un’iterata che sia una contrazione,
l’equazione integrale ammette una soluzione unica limite delle approssimazioni

u0 arbitraria in C([a, b])
x
un+1 (x) = µ a K(x, y)un (y)dy + f (x) .
q.e.d.

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 59

3.5 Approssimazione di equazioni integrali mediante nuclei separabili di rango


finito.
Definizione. Un nucleo separabile di rango finito è un nucleo della forma


N
KN (x, y) = αi (x)βi (y) .
i=1

Per continuare lo studio delle equazioni integrali nel contesto dello spazio C([a, b]) supporremo
che le funzioni αi (x) siano continue e che le funzioni βi (x) siano integrabili (o addirittura con-
tinue).
Se u è soluzione dell’equazione
 b
u(x) = µ KN (x, y)u(y)dy + f (x) , x ∈ [a, b] ,
a

allora u − f è una combinazione lineare finita delle funzioni αi (x):


N  b
u(x) − f (x) = µ αi (x) βi (y)u(y)dy ,
i=1 a

ovvero

N  b
u(x) − f (x) = µ ci αi (x) , ci = βi (y)u(y)dy .
i=1 a

La conoscenza del vettore c = (c1 , c2 , ..., cN ) permetterebbe dunque di determinare la soluzione


dell’equazione integrale.

Proposizione. c è soluzione del sistema lineare

(I − µW )c = d ,

dove la matrice W e il vettore d sono definiti da


 b  b
W = wki = αi (x)βk (x)dx , d = dk = βk (x)f (x)dx .
a a
N
Dimostrazione. Se u(x) − f (x) = i=1 ci αi (x) , moltiplicando per βk (x) e integrando tra a e b,
si trova

N
ck − dk = µ wki ci .
i=1

q.e.d.

Per risolvere un’equazione integrale, con nucleo K , si ricorre spesso ad approssimazioni


dell’operatore integrale K̂ con operatori K̂n , di nucleo Kn , più “semplici, nel senso che ad
essi corrispondono equazioni integrali approssimate più facilmente risolubili. Per esempio si può

Università di Torino, a.a. 2003-2004


60 Capitolo 3. Operatori lineari. Equazioni integrali

approssimare il nucleo K con nuclei separabili KN che riducono il problema alla soluzione di un
ordinario sistema di equazioni algebriche lineari.

Osservazione. Ovviamente:
 b
K̂u − K̂n u ≤ sup |K(x, y) − Kn (x, y)||u(y)|dy ≤
x a
 b
≤ u sup |K(x, y) − Kn (x, y)|dy = K̂ − K̂n u .
x a

Allora la convergenza in norma (o uniforme sui limitati) degli operatori: K̂ − K̂n → 0 , implica
la loro convergenza puntuale, o come si dice forte : ∀u K̂n u → K̂u.

Teorema. Sia I − µK̂ invertibile, cioè I − µK̂ ∈ GL(C([a, b])) e sia


 b
lim max |K(x, y) − Kn (x, y)|dy = 0 .
n x a

(Se Kn è continua e converge uniformemente a K su [a, b]2 la condizione precedente è evidente-


mente verificata.) Allora, per n sufficientemente grande, l’equazione integrale
 b
un (x) = µ Kn (x, y)un (y)dy + f (x)
a

è univocamente risolubile e la sua soluzione un converge uniformemente alla soluzione dell’equa-


zione  b
u(x) = µ K(x, y)u(y)dy + f (x) .
a
Dimostrazione. Nelle ipotesi del teorema

I − µK̂n → I − µK̂ in L(C([a, b])) ,

per le proprietà del gruppo GL(C([a, b])) risulta I − µK̂n ∈ GL(C([a, b])) per n sufficientemente
grande e
(I − µK̂n )−1 → (I − µK̂)−1 in L(C([a, b])) .
Dunque, in virtù dell’osservazione precedente

un = (I − µK̂n )−1 f → u = (I − µK̂)−1 f in C([a, b]) q.e.d.

Maggiorazione degli errori. Ricordando le stime ottenute per dimostrare la continuità


dell’applicazione i : A → A−1 , si trovano immediatamente le seguenti maggiorazioni:

(I − µK̂)−1 2
(I − µK̂n )−1 − (I − µK̂)−1 ≤ |µ| K̂n − K̂ ,
1 − |µ| (I − µK̂)−1 K̂n − K̂

(I − µK̂n )−1 2
(I − µK̂n )−1 − (I − µK̂)−1 ≤ |µ| K̂n − K̂ ,
1 − |µ| (I − µK̂n )−1 K̂n − K̂

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 61

dalle quali è facile ottenere stime in norma dell’errore un − u . Per esempio:

(I − µK̂n )−1 2
un − u ≤ |µ| K̂n − K̂ f .
1 − |µ| (I − µK̂n )−1 K̂n − K̂

Si osservi che può essere più facile disporre di buone maggiorazioni di (I − µK̂n )−1 , piuttosto
che maggiorazioni di (I − µK̂)−1 .

Valgono anche altre stime, in genere più fini e più utili:

un − u = (I − µK̂n )−1 f − (I − µK̂)−1 f = (I − µK̂n )−1 µ(K̂n − K̂)(I − µK̂)−1 f ≤

(I − µK̂)−1
≤ |µ| K̂n u − K̂u ,
1 − |µ| (I − µK̂)−1 K̂n − K̂
un − u = (I − µK̂)−1 f − (I − µK̂n )−1 f = (I − µK̂)−1 µ(K̂ − K̂n )(I − µK̂n )−1 f ≤
(I − µK̂n )−1
≤ |µ| K̂n un − K̂un .
1 − |µ| (I − µK̂n )−1 K̂n − K̂
Ad esempio informazioni sull’ordine di convergenza di Kn u a Ku , che può dipendere dalla
conoscenza a priori di qualche proprietà di “regolarità della soluzione u , permettono di stimare
l’ordine di convergenza delle soluzioni approssimate un alla soluzione esatta u.

Università di Torino, a.a. 2003-2004


62 Capitolo 3. Operatori lineari. Equazioni integrali

Quaderni Didattici del Dipartimento di Matematica


Capitolo 4

Spazi di Hilbert

4.1 Forme sesquilineari


Definizione. Sia H uno spazio vettoriale su C. Una funzione B : H × H → C è una forma
sesquilineare su H se e solo se per ogni λ ∈ C e per qualsiansi x, x , y, y  ∈ C

1) B(λx + x , y) = λB(x, y) + B(x , y) ,

2) B(x, λy + y  ) = λB(x, y) + B(x, y  ) .


Dunque B è lineare nella prima variabile ed antilineare nella seconda.
Segue immediatamente dalla definizione che


m 
n 
m 
n
B( λ i xi , µj yj ) = λi µj B(xi , yj ) .
i=1 j=1 i=1 j=1

Osservazione. Se H è uno spazio vettoriale su R si considerano forme (a valori reali) bilineari


su H.

Definizione. Una forma sesquilineare B si dice Hermitiana se e solo se per x e y arbitrari

B(y, x) = B(x, y) .

Osservazione. Le forme reali bilineari Hermitiane sono forme simmetriche.

Proposizione. Se B(x, y) è una forma sesquilineare Hermitiana allora la forma quadratica


B(x, x) assume solo valori reali e

4B(x, y) = B(x + y, x + y) − B(x − y, x − y) + iB(x + iy, x + iy) − iB(x − iy, x − iy) ,

63
64 Capitolo 4. Spazi di Hilbert

dunque la conoscenza della forma quadratica determina quella della forma sesquilineare.
La dimostrazione della proposizione è immediata (basta sviluppare le espressioni quadratiche a
secondo membro).

Definizione. Una forma sesquilineare Hermitiana B(x, y) si dice positiva (rispettivamente


definita positiva) se e solo se

∀x ∈ H B(x, x) ≥ 0 (rispettivamente B(x, x) > 0 se x = 0) .

Disuguaglianza di Cauchy-Schwarz. Sia B sesquilineare Hermitiana e positiva (non


necessariamente definita positiva). Allora

|B(x, y)|2 ≤ B(x, x) · B(y, y) .

Dimostrazione.
1) Se B(x, x) = B(y, y) = 0, allora, essendo B(x + ty, x + ty) ≥ 0 per ogni t, si ha tB(x, y) +
tB(x, y) ≥ 0 . Posto t = −B(x, y) , si trova −2|B(x, y)|2 ≥ 0 , cioè B(x, y) = 0 e la disugua-
glianza è soddisfatta.
2) Altrimenti, se uno almeno dei valori B(x, x) e B(y, y) non è nullo e sia ad esempio B(y, y) = 0,
allora per ogni t

0 ≤ B(y, y)B(x + ty, x + ty) = B(x, x)B(y, y) − |B(x, y)|2 +

+(tB(y, y) + B(x, y))(tB(y, y) + B(x, y)) .


Prendendo t = −B(x, y)/B(y, y) si vede che la disuguaglianza è soddisfatta. q.e.d.

Proposizione. Sia B una forma sesquilineare Hermitiana definita positive in H.


Allora B(x, x)1/2 è una norma in H.
La proposizione si verifica immediatamente:

1) B(x, x)1/2 ≥ 0 , e B(x, x)1/2 = 0 ⇒ x = 0 ,


2) B(λx, λx)1/2 = (λλB(x, x))1/2 = |λ|B(x, x)1/2 ,
3) B(x + y, x + y)1/2 = (B(x, x) + B(y, y) + 2B(x, y))1/2 ≤ ,

per la disuguaglianza di Schwarz,

≤ (B(x, x) + B(y, y) + 2B(x, x)1/2 B(y, y)1/2 )1/2 = B(x, x)1/2 + B(y, y)1/2 .

Definizione. Uno spazio vettoriale H su C (su R), munito di una forma B sesquilinea-
re (bilineare) Hermitiana (simmetrica) definita positiva si dice spazio pre-Hilbertiano. H è
normato in modo canonico dalla norma x = B(x, x)1/2 . Se rispetto a tale norma H risulta
completo allora si dice che H è uno spazio di Hilbert .
La forma prescelta per strutturare H quale spazio pre-Hilbertiano si dice prodotto scalare e

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 65

viene usualmente indicata con la notazione (x, y) .

Ovviamente gli spazi di Hilbert sono particolari spazi di Banach.

Esempi di spazi pre-Hilbertiani.


n
1) Cn munito del prodotto scalare (x, y) = k=1 xk y k è uno spazio di Hilbert su C.
n
2) Rn munito del prodotto scalare (x, y) = k=1 xk yk è uno spazio di Hilbert su R.

3) Sia Ω un aperto limitato di Rn e K la sua chiusura. Allora lo spazio C(K; C) delle funzioni
continue su K a valori complessi, munito del prodotto scalare

(f, g) = f (x)g(x)dx ,
K

dove dx = dx1 dx2 ...dxn è la misura di Lebesgue in Rn , è uno spazio pre-Hilbertiano.


Si osservi che la continuità della funzione solo su Ω non implica la sua l’integrabilità.

Identità della mediana. Se x, y sono due elementi arbitrari di uno spazio pre-Hilbertiano,
allora
x+y 2 x−y 2 x 2 + y 2
+ = .
2 2 2
Si verifica immediatamente osservando che

x + y 2 + x − y 2 = 2 x 2 + 2 y 2 + 2(x, y) − 2(x, y) .

Osservazione. Si può dimostrare che uno spazio normato è pre-Hilbertiano (su R o su C)


se e solo se la sua norma soddisfa l’identità della mediana.
In tal caso il prodotto scalare si può definire, data la norma, mediante l’uguaglianza

4(x, y) = x + y 2 − x − y 2 + i x + iy 2 − i x − iy 2 .

L’identità della mediana permette di dimostrare che il secondo membro è lineare in x ed antili-
neare in y.
Limitandoci al caso reale abbiamo il

Teorema. Sia H uno spazio normato su R nel quale vale l’identità della mediana:

x+y 2 x−y 2 x 2 + y 2
+ = .
2 2 2
Ponendo
4(x, y) = x + y 2 − x − y 2 ,
(x, y) è un prodotto scalare in H che induce la norma iniziale.

Università di Torino, a.a. 2003-2004


66 Capitolo 4. Spazi di Hilbert

Dimostrazione. Ovviamente

(x, y) = (y, x) e x 2 = (x, x) .

Per quanto concerne la linearità, osserviamo che


1
(x, z) + (y, z) = ( x + z 2 − x − z 2 + y + z 2 − y − z 2 ) .
4
Ma, per l’identità della mediana, si ha
1
x + z 2 + y + z 2 = ( (x + z) + (y + z) 2 + (x + z) − (y + z) 2 ) =
2
x+y 1
= 2 + z 2 + x − y 2 .
2 2
In modo analogo
1
− x − z 2 − y − z 2 = − ( (x − z) + (y − z) 2 + (x − z) − (y − z) 2 ) =
2
x+y 1
−2 − z 2 − x − y 2 .
2 2
Dunque
1 x+y x+y x+y
(x, z) + (y, z) = ( + z 2 − − z 2 ) = 2( , z) ,
2 2 2 2
per la definizione di prodotto scalare.
Essendo, sempre per la definizione di (·, ·), (0, z) = 0, per y = 0 si trova (x, z) = 2(x/2, z)
(e iduttivamente (x, z)/2p = (x/2p , z)). Dunque (x, z) + (y, z) = (x + y, z). Per y = x si ha
(2x, z) = 2(x, z) e induttivamente si ha (kx, z) = k(x, z). Dalla definizione del prodotto scalare
si vede immediatamente che (−x, y) = −(x, y). Allora per ogni k ∈ Z e p ∈ N

k k
( x, y) = p (x, y) .
2p 2
Ogni numero reale λ è limite di razionali del tipo k/2p e in ogni spazio normato λx ± y è
continua in λ. Dunque per ogni λ si ha (λx, y) = λ(x, y). q.e.d.

4.2 Il teorema delle proiezioni


Il teorema delle proiezioni ha un ruolo fondamentale sia per la teoria di base degli spazi di
Hilbert, che per le numerose applicazioni ad importanti settori dell’analisi matematica.

Teorema (delle proiezioni su un convesso). Sia H uno spazio di Hilbert e A un suo


sottoinsieme non vuoto, convesso e chiuso. Allora per ogni x ∈ H esiste un unico punto y
del convesso a distanza minima da x :

∀x ∈ H ∃!y ∈ A x − y = min x − z .
z∈A

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 67

Si dice che y è la proiezione ortogonale di x su A e si scrive y = PA (x) . Inoltre y è caratterizzato


dalle seguenti disuguaglianze variazionali (cosı̀ dette perché associate ad un problema di
minimo)
∀z ∈ A (x − y, z − y) ≤ 0 ,
cioè y = PA (x) se e solo se sono soddisfatte tali disuguaglianze.
Infine la funzione PA è una contrazione (non stretta):

PA (x) − PA (x∗ ) ≤ x − x∗ .

Premettiamo alla dimostrazione un lemma.

Lemma. Sia E un convesso contenuto nella regione compresa tra due sfere concentriche
(per esempio di centro il vettore 0) di raggi ρ e ρ + δ :

E ⊂ Bρ+δ (0) − Bρ (0) .

(Con B ∗ indichiamo la chiusura della sfera aperta B e, solo per maggiore generalità, prendiamo
la sfera di raggio maggiore chiusa e quella di raggio minore aperta.)
Allora se δ ≤ ρ risulta
diam(E) = sup x − y ≤ 12ρδ .
x,y∈E

Dimostrazione del lemma. Se x, y ∈ E, per la convessità di E (x + y)/2 ∈ E e per l’identità


della mediana
x−y 2 x 2 + y 2 x+y 2
= − ≤ (ρ + δ)2 − ρ2 ≤ 3ρδ .
2 2 2
q.e.d.

Dimostrazione del teorema delle proiezioni. Essendo il problema invariante per traslazioni,
possiamo per semplicità supporre x = 0 .

1) Sia ρ = inf z∈A z . Se ρ = 0 allora 0 ∈ A = A e quindi 0 = PA (0) . Altrimenti ρ > 0 e



sia, per ogni n intero, An = A ∩ Bρ+1/n (0) . An è convesso e chiuso, in quanto intersezione di
due convessi chiusi, ed essendo


An ⊂ Bρ+1/n (0) − Bρ (0) si ha che diam(An ) ≤ 12ρ/n .

Inoltre per ogni n si ha An = ∅ e An+1 ⊆ An . Sia allora zn un elemento qualunque di An : la


successione zn è di Cauchy, in quanto

zn+p − zn ≤ diam(An ) ≤ 12ρ/n → 0

per n → +∞ indipendentemente da p . H è completo e dunque zn converge in norma ad un


limite y ∈ A per la chiusura di A . Ma per altro zn → ρ e per la continuità della norma

y = ρ = min z .
z∈A

Università di Torino, a.a. 2003-2004


68 Capitolo 4. Spazi di Hilbert

Ciò dimostra l’esistenza di almeno un punto di minimo.


2) Se y ∈ A e y ∗ ∈ A fossero due punti di minimo distinti, per l’identità della mediana si avrebbe

y + y∗ 2 y 2 + y ∗ 2 y − y∗ 2
= − < ρ2 ,
2 2 2
che sarebbe assurdo, perchè (y+y ∗ )/2 ∈ A . Dunque abbiamo esistenza e unicità della proiezione.
3) Essendo A convesso, per ogni λ ∈]0, 1[ e per ogni z ∈ A risulta y + λ(z − y) ∈ A. Pertanto,
poiché y è il punto di minimo :

y + λ(z − y) 2 ≥ y 2 ,

da cui, sviluppando il quadrato, segue

2λ(y, z − y) + λ2 z − y 2 ≥ 0 ,

ovvero
(y, z − y) ≥ −λ/2 z − y 2 .
Facendo tendere λ a 0 si ottiene (0 − y, z − y) ≤ 0.
Viceversa, se per ogni z ∈ A si ha (y  , z − y  ) ≥ 0 , allora

z 2 = y  + z − y  2 = y  2 + z − y  2 + 2(y  , z − y  ) ≥ y  2 .

Pertanto se y  ∈ A allora y  = minz∈A z e y  = y è il punto di minimo.


4) Per arbitrari x e x in A, indicando brevemente PA con P :

(P (x) − P (x ), P (x) − P (x )) = (P (x) − P (x ), P (x) − x)+

+(P (x) − P (x ), x − x ) + (P (x) − P (x ), x − P (x )) .


Prendendo la parte reale di entrambi i membri e tenendo conto della caratterizzazione delle
proiezioni P (x) e P (x ) mediante le disuguaglianze variazionali si trova

P (x) − P (x ) 2 ≤ (P (x) − P (x ), x − x ) ≤ P (x) − P (x ) x − x ,

da cui risulta che P è una contrazione. q.e.d.

Consideriamo ora più in dettaglio il caso in cui A è un sottospazio vettoriale (quindi un


convesso) di H . In primo luogo vale la seguente fondamentale

Osservazione. Se A è un sottospazio vettoriale chiuso di H, le disuguaglianze variazionali


si riducono a delle uguaglianze:

∀y ∈ A (x − P (x), y) = 0 .

Infatti
(x − P (x), y) = (x − P (x), (y + P (x)) − P (x)) ≤ 0 ,
perché y + P (x) ∈ A e

(x − P (x), y) = −(x − P (x), (−y + P (x)) − P (x)) ≥ 0 ,

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 69

perché −y + P (x) ∈ A , dunque


(x − P (x), y) = 0 .
Inoltre
(x − P (x), y) = (x − P (x), iy) = 0 ,
perché iy ∈ A .

Indichiamo con la notazione M ⊥ l’insieme di tutti gli elementi di uno spazio di Hilbert H
ortogonali a tutti gli elementi di un sottoinsieme M :

M ⊥ = {x ∈ H | ∀y ∈ M (x, y) = 0} .

È evidente che (M ⊥ )⊥ ⊇ M .

Per la linearità del prodotto scalare rispetto alla prima variabile, M ⊥ è un sottospazio
vettoriale:

x, x ∈ M ⊥ ∧ λ ∈ C ⇒ ∀y ∈ M (λx + x , y) = 0 ⇒ λx + x ∈ M ⊥ .

Per la continuità del prodotto scalare M ⊥ è un sottospazio chiuso:

xn ∈ M ⊥ ∧ x = lim xn ⇒ ∀y ∈ M (x, y) = lim(xn , y) = 0 .


n n

Proposizione. Sia M un sottospazio vettoriale chiuso di H. Allora

H = M ⊕ M⊥ ,

cioè ogni x ∈ H si decompone in modo unico come somma di un elemento di M ed uno di M ⊥ .


Precisamente x è la somma delle sue proiezioni ortogonali su M e M ⊥ :

x = PM x + PM ⊥ x .

Dimostrazione. In virtù delle uguaglianze variazionali

∀x ∈ H ∀y ∈ M (x − PM x, y) = 0 ,

dunque m = x − PM x ∈ M ⊥ e x = PM x + m . Essendo x − m = PM x ∈ M , per la definizione


di M ⊥
∀z ∈ M ⊥ (x − m , z) = 0 .
Dunque m = PM ⊥ x e x = PM x + PM ⊥ x .
Viceversa si controlla immediatamente che se x = m + m con m ∈ M e m ∈ M ⊥ si ha

∀y ∈ M (x − m, y) = 0 e ∀z ∈ M ⊥ (x − m , z) = 0 .

Pertanto m = PM x e m = PM ⊥ x . q.e.d.

Università di Torino, a.a. 2003-2004


70 Capitolo 4. Spazi di Hilbert

Osservazione. Se M è un sottospazio chiuso, M ⊥ si dice supplemento ortogonale di M


e M = (M ⊥ )⊥ .
Infatti ogni x ∈ (M ⊥ )⊥ si scrive in modo unico come x = PM x + PM ⊥ x e

0 = (x, PM ⊥ x) = (PM ⊥ x, PM ⊥ x) .

Allora PM ⊥ x = 0 , x = PM x ∈ M e M ⊇ (M ⊥ )⊥ . L’inclusione inversa è sempre vera ed il


risultato è dimostrato.

Proposizione. PM è un operatore lineare e continuo da H in H di norma uguale ad 1 :

PM ∈ L(H) e PM x ≤ x ,

l’uguaglianza essendo valida per x ∈ M .


Inoltre:
2
PM = PM , PM PM ⊥ = PM ⊥ PM = 0 e PM + PM ⊥ = 1 .
Dimostrazione. Se x = m + m e y = n + n , con m, n ∈ M e m , n ∈ MM ⊥ , allora
x + y = (m + n) + (m + n ) e λx = λm + λm , dunque

PM (x + y) = m + n = PM x + PM y e PM (λx) = λPM x .

Inoltre
x 2 = (m + m , m + m ) = m 2 + m 2 = PM x 2 + PM ⊥ x 2 .
Infine le ultime equazioni della proposizione sono una semplice traduzione in termini di operatori
di risultati già dimostrati o impliciti nelle definizioni.

Più in generale si può pensare ad una decomposizione di uno spazio di Hilbert H in somma
(finita o infinita) diretta di sottospazi chiusi:

H = H1 ⊕ H2 ⊕ H3 ⊕ ...

Nel caso di sottospazi di dimensione uno il problema di tale decomposizione è equivalente a


quello della rappresentazione di ogni vettore di f ∈ H come somma (finita o infinita) di multipli
di elementi di una base ortonormale {xα }α∈A :

f= fα xα .
α∈A

Se l’insieme degli indici A è numerabile, la somma precedente si dice serie di Fourier gene-
ralizzata .

4.3 Basi ortonormali e serie di Fourier generalizzate


Definizione. Un insieme S ⊂ H si dice ortogonale se

∀x, y ∈ S x = y ⇒ (x, y) = 0 .

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 71

Se inoltre per ogni x ∈ S si ha x = 1 , allora S si dice ortonormale .


Si dice che S è completo se ogni vettore f di H ortogonale a tutti gli elementi di S è nullo:
∀f ∈ H ∀x ∈ S (f, x) = 0 ⇒ f = 0 .
Un insieme, o, come si usa dire, un sistema ortonormale completo è una base ortonormale .

Sarà utile ricorrere ai termini sotto definiti.

Definizione. {xα }α∈A è un famiglia di vettori topologicamente libera se per ogni α ∈ A


xα non appartiene alla chiusura del sottospazio generato dalle {xβ }β=α (combinazioni lineari
finite delle xβ ).
{xα }α∈A si dice totale in H se H coincide con la chiusura del sottospazio generato da {xα }α∈A .

Per semplicità, nel seguito supporremo che A sia numerabile e quindi non è restrittivo sup-
porre che A = N∗ , insieme degli interi positivi (in qualche caso potrà essere utile assumere
A = Z) . Se A fosse finito le dimostrazioni si semplificherebbero ulteriormente, non essendovi
problemi di convergenza.

Teorema (sulle serie di Fourier generalizzate). Sia S = {xn } un sistema ortonormale


in uno spazio di Hilbert H (su C o su R). Per ogni f ∈ H i numeri fn = (f, xn ) si dicono
coefficienti di Fourier di f . Valgono le seguenti affermazioni
1) S è topologicamente libero;
2) Fissati arbitrariamente gli indici n1 , n2 , ..., np ed i numeri c1 , c2 , ..., cp , è soddisfatta la seguente
proprietà di minimo dei coefficienti di Fourier fn di f :

p 
p
f − fnk xnk ≤ f − ck xnk ,
k=1 k=1

con uguaglianza se e solo se per ogni k si ha ck = fnk , e vale la disuguaglianza di Bessel


+∞

|fn |2 ≤ f 2 .
n=1

3) Se S è completo, allora vale lo sviluppo in serie


+∞

f= fn xn
n=1

e vale la relazione di Parseval


+∞

|fn |2 = f 2 .
n=1
4) S è completo se e solo se è totale.
5) Lo spazio di Hilbert
+∞

l2 = l2 (N∗ ) = {ξ = {ξn }n∈N∗ | ξn ∈ C e |ξn |2 < +∞} ,
k=1

Università di Torino, a.a. 2003-2004


72 Capitolo 4. Spazi di Hilbert

è isomorfo ad H. Quinti tutti gli spazi di Hilbert che ammettono una base numerabile sono
isomofi tra loro e
+∞

(f, g) = fn g n .
n=1

Osservazione. Si può dimostrare facilmente, considerando l’insieme di tutti i sistemi orto-


normali di H e ricorrendo al lemma di Zorn, che ogni spazio di Hilbert non vuoto ammette basi
ortonormali.

Dimostrazione
 del teorema.
1) Sia y = p=n cp xp (somma finita). Allora,come si vede subito sviluppando il quadrato,

y 2 = |cp |2 .
p

Ne segue che 
xn − y 2 = 1 + |cp |2 ≥ 1 ,
p

cioè xn ha distanza almeno 1 da tutti gli elementi del sottospazio generato dalle altre xp e non
è quindi ad esso aderente. Pertanto S è una famiglia topologicamente libera.
2) Sia M il sottospazio (di dimensione p ) generato dalle xn1 , xn2 , ..., xnp e P l’operatore di
proiezione ortogonale su M . Si ha, in virtù delle uguaglianze variazionali

p
g= fnk xnk = P f ;
k=1

infatti
∀nk (f − g, xnk ) = 0 , k = 1, 2, ...p ,
essendo le xnk ortonormali. Ma ogni elemento di M è combinazione lineare delle xnk e per la
sesquilinearità del prodotto scalare
∀z ∈ M (f − g, z) = 0 .
Allora g = P f è l’unico elemento di M a distanza minima da f e la proprietà di minimo dei
coefficienti di Fourier è dimostrata.
Inoltre, poiché P ha norma = 1 , si ha P f ≤ f . In particolare, se xnk = xk , si vede che
per ogni p
p
|fk |2 ≤ f 2 ,
k=1
da cui segue la convergenza della serie dei moduli a quadrato dei coefficienti di Fourier e la
disuguaglianza di Bessel. 
3) La successione delle ridotte nk=1 fk xk è di Cauchy in H , infatti, essendo le xk ortonormali:


n+p 
n+p
fk xk 2 = |fk |2 → 0
k=n+1 k=n+1

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 73

per n → +∞ , indipendentemente da p. Dunque per la completezza di H esiste f  somma della


serie. Ma per la continuità del prodotto scalare e le proprietà dei limiti f  ha gli stessi coefficienti
di Fourier di f :

n+p

(f − f , xn ) = lim(f − fk xk , xn ) = fn − fn = 0 .
p
k=1

Per la completezza di S, si ha f = f  . Ciò dimostra anche che S è totale. Infine


+∞
 
p 
p
f 2 − |fn |2 = f 2 − lim |fn |2 = lim f − fn xn 2 = 0 .
p p
n=1 n=1 n=1

O, equivalentemente, per la continuità della norma:


p 
p 
p
f 2 = lim fn xn 2 = lim fn xn 2 = lim |fn |2
p p p
n=1 n=1 n=1

e la relazione di Parseval è dimostrata.


4) Se S è totale, sia  p
∀z ∈ S (y, z) = 0 e y = lim c k xx ,
p
k

dove le somme sono finite. Allora



y 2 = lim(y, cpk xk ) = 0
p
k

e quindi S è completo.
5) Si verifica immediatamente che l’applicazione f → {fn }n∈N∗ è biunivoca, lineare, bicontinua
e che conserva le norme (quindi i prodotti scalari). q.e.d.

4.4 Il duale di uno spazio di Hilbert e il teorema di Riesz. La convergenza


debole
Ricordiamo che il duale di uno spazio di Banach B (ad esempio su C) è lo spazio vettoriale
B  delle applicazioni lineari e continue da B in C : L(B, C) , munito in modo canonico dela
norma
|f (x)|
||f ||B  = sup ,
0=x∈B ||x||B

rispetto alla quale risulta completo, cioè anch’esso uno spazio di Banach.
Nel caso degli spazi di Hilbert vale il seguente fondamentale teorema di rappresentazione degli
elementi del duale.

Teorema di Riesz. Per ogni f ∈ H  esiste un unico elemento yf ∈ H tale che

∀x ∈ H f (x) = (x, yf ) .

Università di Torino, a.a. 2003-2004


74 Capitolo 4. Spazi di Hilbert

L’applicazione R : f → yf da H in H  è biunivoca, antilineare, bicontinua, conserva le norme e


quindi trasforma i prodotti scalari nei loro complessi coniugati:

f H  = yf H e (f, g)H  = (yf , yg ) .

Dimostrazione. Se f = 0, allora yf = 0. Altrimenti sia M = Ker f = f −1 ({0}). Per la


continuità di f , M è un sottospazio chiuso proprio e M ⊥ = 0 . Sia 0 = z ∈ M ⊥ , per la linearità
di f si ha
f (x) f (x)
f (x − z) = 0 , x − z∈M .
f (z) f (z)
Ricordando che H = M ⊕ M ⊥ e osservando che
f (x) f (x)
x = (x − z) + z,
f (z) f (z)

si deduce che M ⊥ ha dimensione 1 (tutti i suoi elementi sono multipli di z ) . Inoltre

z f (x)
(x, )= z .
z f (z)

Posto dunque
f (z)
yf = z risulta (x, yf ) = f (x) .
z 2
È evidente che l’applicazione R : f → yf è antilineare. Verifichiamo che è una isometria:

|f (x)| |(x, yf )|
f H  = sup = sup ≤ yf H ,
0=x∈H x H x=0 x H

yf 2 = (yf , yf ) = f (yf ) ≤ f H  yf H
e dunque f H  = yf H . Ne segue in particolare che R è iniettiva. La suriettività è immediata,
perché per ogni z ∈ H la funzione f (x) = (x, z) è lineare e continua, cioè in H  e necessariamente
yf = z .
Infine, poiché la norma in H soddisfa l’identità della mediana, tale identità vale anche per la
norma in H  . Allora la norma di H  è indotta da un prodotto scalare, che può facilmente essere
recuperato dalla norma:

4(f, g)H  = f + g 2H  − f − g 2H  + i f + ig 2H  − i f − ig 2H  =

yf + yg 2H − yf − yg 2H + i yf − iyg 2H − i yf + iyg 2H = 4(yf , yg ) .


q.e.d.

Definizione. Si dice che la successione fn converge debolmente a f se e solo se per ogni


funzionale lineare e continuo G la successione numerica G(fn ) converge a G(f ):

∀G ∈ H  lim G(fn ) = G(f ) .


n

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 75

In considerazione del Teorema di Riesz, è equivalente l’affermazione

∀g ∈ H lim(fn , g) = (f, g) .
n

Si scrive allora fn  f .

Dimostreremo al Capitolo 7 che se fn  f allora

||f || ≤ lim inf ||fn || .


n

Esempio. Sia enun sistema ortonormale. Allora en  0.


2
Infatti ∀g ∈ H n |(g, en )| < +∞ e dunque (en , g) → 0.

Teorema. Sia fn  f e ||fn || → ||f ||, allora fn → f (in norma). Dimostrazione. Si ha

||fn − f ||2 = ||fn ||2 + ||f ||2 − 2(fn , f ) → 2||f ||2 − 2(f, f ) = 0. q.e.d.

Università di Torino, a.a. 2003-2004


76 Capitolo 4. Spazi di Hilbert

Quaderni Didattici del Dipartimento di Matematica


Capitolo 5

Operatori autoaggiunti compatti


negli spazi di Hilbert. Problemi
ellittici in dimensione 1

5.1 Definizioni e proprietà elementari.


Sia H uno spazio di Hilbert su C e T ∈ L(H).

Definizione. L’operatore lineare T si dice autoaggiunto se e solo se per ogni f e g in H


si ha
(T f, g) = (f, T g) .

Valgono le seguenti proprietà:

1) La forma quadratica T (f, f ) è reale. Infatti:

(T f, f ) = (f, T f ) = (T f, f ) .

2) Gli eventuali autovalori di T sono reali. Infatti:

T f = λf (f = 0) ⇒ (T f, f ) = λ||f ||2

e λ è reale perché tali sono (T f, f ) e ||f || .

3) Autovettori associati ad autovalori diversi sono tra loro ortogonali. Infatti sia:

T f = λf , T g = µg , f, g = 0 , λ = µ .

Allora
(T f, g) = λ(f, g) = (f, T g) = µ(f, g) ,

77
78 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

ma µ è reale e dunque (λ − µ)(f, g) = 0 .

Definiamo per ogni operatore lineare e continuo

|(T f, f )|
NT = sup .
f =0 (f, f )

Dunque NT è la piú piccola costante tale che per ogni f ∈ H

|(T f, f )| ≤ NT ||f ||2 .

Ovviamente
NT ≤ ||T ||L(H) .
2
Infatti |(T f, f )| ≤ ||T ||||f || .

Se T è autoaggiunto allora
NT = ||T ||L(H) .
Infatti, con λ > 0 :
1 1 1 1 1
||T f ||2 = (T f, T f ) = [(T [λf + T f ], λf + T f ) − (T [λf − T f ], λf − T f )] ≤
4 λ λ λ λ
1 1 1 NT 2 1
≤ NT [||λf + T f ||2 + ||λf − T f ||2 ] = (λ ||f ||2 + 2 ||T f ||2 ) .
4 λ λ 2 λ
Se T f = 0 l’ultima espressione è minima per λ2 = ||T f ||/||f || e quindi

||T f ||2 ≤ NT ||T f ||||f || , cioé ||T f || ≤ NT ||f || .

Se T f = 0 l’ultima disuguaglianza è ovviamente soddisfatta e dunque

NT = ||T ||L(H) .

Autofunzioni approssimate.
Se T è autoaggiunto, ricordando le proprietà di omogeneità del prodotto scalare e della norma,
si ha
||T || = sup ||T f || = sup |(T f, f )| .
||f ||=1 ||f ||=1

Sia allora fn una successione massimizzante, cioè tale che

||fn || = 1 e lim |(T fn , fn )| = ||T || .


n

Si può estrarre una sottosuccessione fν tale che

lim(T fν , fν ) = λ1 con λ1 = ±||T || .


ν

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 79

Allora
0 ≤ ||T fν − λ1 fν ||2 = ||T fν ||2 − 2λ1 (T fν , fν ) + λ1 2 ||fν ||2 = cν ,
ma lim supν cν ≤ 0 e quindi
lim T fν − λ1 fν = 0 .
ν
Le fν sono quindi “soluzioni approssimate dell’equazione T f = λ1 f . Se l’equazione fosse sod-
disfatta esattamente λ1 sarebbe un autovalore di T .

Osservazione. In uno spazio di Hilbert un operatore limitato autoaggiunto può non ammet-
tere alcun autovalore.
Ad esempio in H = L2 (a, b) sia T ∈ L(H) definito da (T f )(x) = xf (x) q.o. Se per un nume-
ro λ e per un rappresentante f (x) di un elemento di H fosse xf (x) = λf (x) q.o., si avrebbe
(x − λ)f (x) = 0 q.o e quindi f (x) = 0 q.o. sarebbe un rappresentante dell’elemento nullo di H.

5.2 Autovalori e autofunzioni.


Con ipotesi di compattezza si può garantire l’esistenza di autovalori. Un operatore lineare T è
compatto se e solo se trasforma ogni successione limitata fn in una successione T fn dalla quale
si può estrarre una sottosuccessione convergente, cioè ’insieme {T fn } è precompatto. Una breve
trattazione degli operatori compatti, più in generale in uno spazio di Banach, verrà svolta nella
sezione 5. Nella sezione 6 si considereranno alcune classi di operatori integrali compatti.

Teorema. Sia T compatto: T ∈ K(H), e autoaggiunto. Allora il problema di massimo:


trovare ϕ tale che
|(T ϕ, ϕ)| = max |(T f, f )| = ||T ||
||f ||=1

ammette soluzioni. Se ϕ è una soluzione allora essa è un’autofunzione di T associata ad un


autovalore λ1 di modulo massimo:

T ϕ = λ1 ϕ , |λ1 | = ||T || .

Osservazione. Se H fosse di dimensione finita, l’iprsuperficie sferica S = {f | ||f || = 1} sarebbe


un insieme compatto e si potrebbe allora ricorrere al teorema di Weierstrass per garantire l’esi-
stenza di un punto di massimo.
Per altro in tal caso l’operatore T sarebbe ovviamente compatto.
Se H non è di dimensione finita S non è compatta.

Dimostrazione. Consideriamo una successione massimizzante fν tale che T fν −λ1 fν → 0. Per


la compattezza di T e la limitazione delle fν esiste una sottosuccessione fνk tale che T fνk → g.
Ma T fνk − λ1 fνk → 0, dunque fνk → ϕ (||ϕ|| = 1). Per la continuità dell’operatore g = T ϕ e
T ϕ = λ1 ϕ. Ovviamente

|(T ϕ, ϕ)| = |λ1 | = ||T || = ||λ1 ϕ|| = ||T ϕ|| .

q.e.d.

Università di Torino, a.a. 2003-2004


80 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

Procededendo ricorsivamente si possono ottenere tutti gli altri autovalori non nulli di T .

Proposizione 1. Sia ϕ1 un’autofunzione normalizzata associata all’autovalore λ1 di modulo


massimo: T ϕ1 = λ1 ϕ1 (||ϕ1 || = 1). Si ponga

H1 = { f ∈ H | (f, ϕ1 ) = 0} .

Il sottospazio chiuso H1 è invariante per T :

T (H1 ) ⊆ H1 .

Infatti se f ∈ H1
(T f, ϕ1 ) = (f, T ϕ1 ) = (f, λ1 ϕ1 ) = λ1 (f, ϕ1 ) = 0 .

Proposizione 2. L’operatore T1 = T |H1 ∈ K(H1 ) ed è ovviamente autoaggiunto. Ap-


plicando il teorema precedente, se H1 = {0} , si vede che esiste una autofunzione ϕ2 ∈ H1
normalizzata ed un autovalore λ2 , tali che

T ϕ2 = λ2 ϕ2 |λ2 | = ||T1 ||L(H1 ) = |(T ϕ2 , ϕ2 )| = max |(T ϕ, ϕ)| .


ϕ∈H1 , ||ϕ||=1

Proposizione 3. Siano ϕ1 , ϕ2 , ...ϕn le prime n autofunzioni ortonormali ottenute iterativa-


mente. Si ponga
Hn = { f ∈ H | (f, ϕk ) = 0 k = 1, 2...n} .
Allora Hn è invariante e T ristretto ad Hn è compatto autoaggiunto. Si vede che esiste una
autofunzione ϕn+1 ∈ Hn normalizzata ed un autovalore λn+1 , tali che

T ϕn+1 = λn+1 ϕn+1 |λn+1 | = ||Tn ||L(Hn ) = |(T ϕn+1 , ϕn+1 )| = max |(T ϕ, ϕ)| .
ϕ∈Hn , ||ϕ||=1

Proposizione 4. Si ottiene una successione di autovalori tali che

|λ1 | ≥ |λ2 | ≥ |λ3 | ≥ ...

Se H non è di dimensione finita e dunque i successivi Hn = {0} si ha

lim λn = 0 .
n

Altrimenti {ϕn /λn } sarebbe limitata e {T ϕn /λn } = {ϕn }, per la compattezza di T , ammette-
rebbe una sottosuccessione convergente. Ma ciò è assurdo, essendo ||ϕj − ϕk ||2 = 2 .

Proposizione 5. Le {ϕn } formano un sistema ortonormale completo nell’immagine di T :


per ogni f ∈ H
+∞

Tf = (T f, ϕk )ϕk .
k=1

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 81

Si osservi che Hn è il complemento ortogonale del sottospazio di dimensione n generato dalle


ϕ1 ...ϕn . Allora
n
gn = f − (f, ϕk )ϕk ∈ Hn
k=1

è la proiezione ortogonale di f su Hn e quindi

||T gn || ≤ ||Tn ||L(Hn ) ||gn || = |λn+1 |||gn || ≤ |λn+1 |||f || → 0

per n → +∞ . Dunque
+∞
 +∞

Tf = (f, ϕk )T ϕk = λk (f, ϕk )ϕk =
k=1 k=1

+∞
 +∞
 +∞

(f, λk ϕk )ϕk = (f, T ϕk )ϕk = (T f, ϕk )ϕk .
k=1 k=1 k=1

Proposizione 6. Non ci sono autovalori di T diversi da 0 e dai λk della successione prece-


dente.
Infatti se esistesse un tale λ e se ϕ fosse una sua autofunzione (dunque non nulla), essa sarebbe
ortogonale a tutte le ϕk . Ma allora
+∞

T ϕ = λϕ = (λϕ, ϕk )ϕk = 0 .
k=1

Proposizione 7. Ogni autovalore non nullo è di molteplicità finita, cioè l’autospazio asso-
ciato ha dimensione finita.
Altrimenti non potrebbe essere λn → 0 .

Proposizione 8. Sia A = Im(T ) e N = Ker(T ) : N , che ovviamente è un sottospazio


chiuso, è il complemento ortogonale del sottospazio A .
Infatti se g è ortogonale a tutti gli elementi di A

∀f ∈ H 0 = (g, T f ) = (T g, f )

e quindi T g = 0 , cioè g ∈ N .

Proposizione 9. Sia A la chiusura di A. In virù della proposizione precedente H = A ⊕ N .


Se si aggiunge al sistema ortonormale {ϕk } delle autofunzioni associate agli autovalori non
nulli un qualunque sistema {zk } ortonormale completo in N , si ottiene un sistema ortonormale
completo in H .
Infatti per ogni g ∈ H sia
+∞

g∗ = (g, ϕj )ϕj
j=1

Università di Torino, a.a. 2003-2004


82 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

la somma della sua serie di Fourier rispetto al sistema ϕj . Allora per la proposizione 5

+∞
 +∞

Tg = (T g, ϕj )ϕj = λj (g, ϕj )ϕj ,
j=1 j=1

ma per la continuità di T
+∞

T g∗ = λj (g, ϕj )ϕj
j=1

e dunque
T (g − g ∗ ) = 0 ovvero g − g ∗ = h ∈ N .
Pertanto
+∞

g = h + g∗ = h + (g, ϕj )ϕj .
j=1

Infine ovviamente g ∗ ∈ A (perchè limite di combinazioni lineari finite delle ϕj , che ovviamente
appartengono ad A: ϕj = T (ϕj /λj )) e quindi h è unico.

Osservazione. In generale Im(T ) non è chiusa: lo è soltanto se ha dimensione finita.


Infatti se fosse chiusa si avrebbe H = Im(T ) ⊕ Ker(T ) e la restrizione TI di T a Im(T ) sarebbe
biiettiva: per ogni g ∈ H

g = g ∗ + h , g ∗ ∈ Im(T ) , h ∈ Ker(T ) ⇒ T g = T g ∗

dimostra la suriettività e

T f = T g , f, g ∈ Im(T ) ⇒ T (f − g) = 0 ⇒ f − g ∈ Im(T ) ∩ Ker(T ) = {0}

dimostra l’iniettività.
Per la chiusura Im(T ) sarebbe uno spazio di Hilbert (completo) e dunque TI−1 ∈ L(Im(T )) .
Ma TI è compatto e allora, per quanto si vedrà nella sezione 5, I = TI · TI−1 ∈ K(Im(T )) . Ciò
è possibile solo se Im(T ) ha dimensione finita.

5.3 I teoremi di Hilbert e Fischer-Courant.


Dalla relazione
+∞

Tf = λk (f, ϕk )ϕk
k=1

segue immediatamente la rappresentazione della forma quadratica (T f, f )

+∞

(T f, f ) = λk |(f, ϕk )|2 ,
k=1

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 83

con convergenza assoluta della serie in virtù della disuguaglianza di Bessel e della limitazione
degli autovalori λk . Dunque separando gli autovalori positivi λ+ −
k da quelli negativi λk , tutti
ordinati in modo non crescente:

λ+ + − −
1 ≥ λ2 ≥ ... > 0 , λ1 ≤ λ2 ≤ ... < 0 ,

si ottiene  
(T f, f ) = λ+ + 2
k |(f, ϕk )| + λ− − 2
k |(f, ϕk )| .
k k

Si ottiene facilmente allora il

Teorema (di Hilbert). Sia

Hn± = { f ∈ H | (f, ϕ±
i ) = 0 i = 1, 2...n} :

λ+
n+1 = +
max (T f, f ) , λ−
n+1 = −
min (T f, f ) .
f ∈Hn , ||f ||=1 f ∈Hn , ||f ||=1

Dimostrazione. Se ad esempio f ∈ Hn+ e ||f || = 1 , allora, ricorrendo alla disuguaglianza di


Bessel:
 
λ+ + + + 2 +
n+1 = (T ϕn+1 , ϕn+1 ) = λn+1 ||f || ≥ λn+1 ( |(f, ϕk )|2 + |(f, ϕ− 2
j | ) ≥ (T f, f ) .
k≥n+1 j

q.e.d.

Questa caratterizzazione variazionale degli autovaori è di grande importanza dal punto di vi-
sta teorico, ma non si presta facilmente alla costruzione di algoritmi per la loro approssimazione,
perchè ad ogni passo richiede la conoscenza esatta delle autofunzioni precedenti. La caratteriz-
zazione degli autovalori fornita dal teorema seguente è invece fondamentale per le tecniche di
approssimazione numerica, oltre che di grande rilievo teorico.

Teorema (di Fischer-Courant). Siano g1 , g2 ...gn elementi arbitrari di H e sia

H(g1 , g2 ...gn ) = { f ∈ H | (f, gi ) = 0, i = 1, 2, ...n} .

Allora risulta
λ+
n+1 = min max (T f, f ) ,
{g1 ,g2 ...gn } f ∈H(g1 ,g2 ...gn ) , ||f ||=1

λ−
n+1 = max min (T f, f ) .
{g1 ,g2 ...gn } f ∈H(g1 ,g2 ...gn ) , ||f ||=1

Dimostrazione (per λ+
n+1 ). Sia

M (g1 , g2 ...gn ) = max (T f, f ) .


f ∈H(g1 ,g2 ...gn ) , ||f ||=1

* * *

Università di Torino, a.a. 2003-2004


84 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

Si può dimostrare che il massimo indicato esiste: sia per il momento M (g1 , g2 , ...gn ) l’estremo
superiore. Per la compattezza di T e per la compattezza sequenziale debole della sfera unitaria
(||f || ≤ 1) si può trovare una successione massimizante fj tale che

fj → f debolmente , T fj → T f fortemente

e dunque
(T fj , fj ) → (T f, f ) = M (g1 , g2 , ...gn ) .
La convergenza debole implica ovviamente che f ∈ H(g1 , g2 ...gn ) e che ||f || ≤ 1. Se fosse
||f || = a < 1 si avrebbe f ∗ = f /a ∈ H(g1 , g2 ...gn ) , ||f ∗ || = 1 e (T f ∗ , f ∗ ) = (T f, f )/a2 >
M (g1 , g2 , ...gn ) , in contrasto con la definizione di M . Dunque f è punto di massimo.

& & &

Sappiamo che
M (ϕ+ + + +
1 , ϕ2 ...ϕn ) = λn+1 .

Per g1 , g2 ...gn arbitrari selezioniamo una soluzione non nulla del sistema omogeneo


n+1
xi (ϕ+
i , gk ) = 0 , k = 1, 2, ..n .
i=1

Una soluzione
 non nulla esiste perchè il sistema ha n equazioni e n + 1 incognite. Normalizziamo
le xi : i |xi |2 = 1 e poniamo

n+1
f= xi ϕ +
i .
i=1

Alora, essendo ||f || = 1 e f ∈ H(g1 , g2 ...gn ) , si ha


n+1
M (g1 , g2 ...gn ) ≥ (T f, f ) = λ+ 2 +
i |xi | ≥ λn+1 .
i=1

q.e.d.

5.4 Risoluzioni dell’identità e rappresentazioni spettrali.


Per un operatore compatto autoaggiunto T consideriamo gli autovalori distinti λk , a ciascuno
dei quali sono associati una molteplicità νk (finita se l’autovalore non è nullo) e un sistema
ortonormale di autofunzioni che generano un sottospazio Mk (di dimensione finita se λk = 0):

M (λk ) = [ϕk1 , ϕk2 , ...ϕkνk , ] .

(Al solo fine di visualizzare piuù semplicemente i risultati, il lettore può supporre che T abbia
esclusivamente autovalori non positivi:

λ1 ≤ λ2 ≤ ...λn ≤ ... ≤ 0 .)

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 85

Indichiamo con P (λk ) il proiettore ortogonale su M (λk ) e poniamo


 
S(λ) = M (λk ) , E(λ) = P (λk ) .
λk <λ λk <λ

Dunque E(λ) è una famiglia di proiettori (su S(λ)) con le proprietà seguenti, che la qualificano
per definizione come risoluzione dell’identità :
1) monotonia : i sottospazi corrispondenti sono nondecrescenti al crescere di λ, dunque

E(λ)E(λ∗ ) = E(min(λ, λ∗ ) ;

2) convergenza a 0 o ad I per λ → ±∞:

limλ→−∞ E(λ)f = 0 , limλ→+∞ E(λ)f = f .

3) continuità a destra :
E(λ + 0) = E(λ) .
Nel caso in esame (anche per operatori compatti generici) si ha E(λ) = 0 e E(λ) = I, rispet-
tivamente a sinistra e a destra di qualsiasi intervallo finito comprendente tutti gli autovalori, e la
funzione E(λ) è costante a tratti, assumendo il valore E(λk ) per λk ≤ λ < λk+1 , e ovviamente
P (λk ) = E(λk ) − E(λk+1 ).

Vale allora la rappresentazione spettrale:


  b
Tf = λk (E(λk ) − E(λk+1 )) = λd(E(λ)f ) ,
k a

dove (a, b) è un qualunque intervallo aperto contenente tutti gli autovalori e l’integrale è un
integrale di Stieltjes (rispetto ad una misura vettoriale).

Possiamo scrivere  +∞
Tf = λd(E(λ)f ) ,
−∞

o volendo soltanto integrali coinvolgenti misure a valori scalari


 +∞
(T f, g) = λd(E(λ)f, g) .
−∞

Essendo T limitato si può scrivere, non solo in modo simbolico


 +∞
T = λdE(λ) .
−∞

Già nel 1906 Hilbert ha dimostrato che per qualunque operatore limitato T autoaggiunto,
e non solo per gli operatori compatti, esiste un’unica risoluzione dell’identità E(λ) che consente
di rappresentarlo mediante un integrale di Stieltjes.
Se l’operatore non è compatto la funzione monotona E(λ) può avere un comportamento molto

Università di Torino, a.a. 2003-2004


86 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

più complesso, in particolare non è necessariamente costante a tratti e ad esempio può crescere
con continuità tra due salti consecutivi. I valori λ per i quali ciò avviene fanno parte dello
spettro continuo di T .
Se nell’intorno di λ0 E(λ) non è costante, a λ0 si possono associare autofunzioni approssimate:
per ogni ε > 0 sia
P (λ0 , ε) = E(λ0 + ε) − E(λ0 )
il proiettore sul sottospazio S(λ0 , ε), al quale appartenga f . Allora
 λ0 +ε
T f − λ0 f = (λ − λ0 )dE(λ)f e quindi ||T f − λ0 f || ≤ ε .
λ0

Questi risultati sono stati estesi, anche sull’onda della loro rilevanza in meccanica quanti-
stica, nel 1928 da von Neumann al caso di operatori autoaggiunti non limitati e sono stati
oggetto di studio da parte di molti autori.
Per una prima presentazione dettagliata si vedano ad esempio Riesz-Nagy[20] o Hudson-Pymm[13].

5.5 L’ideale degli operatori compatti.


In questa sezione consideriamo più in generale operatori in uno spazio di Banach E. Come al
solito indichiamo con L(E) l’insieme degli operatori lineari e continui ovunque definiti in E a
valori in E. Sappiamo che A ∈ L(E) se e solo se trasforma insiemi limitati in insiemi ancora
limitati. Se E non ha dimensione finita un insieme limitato non è necessariamente precompat-
to1 . Ricordiamo che un insieme C in uno spazio di Banach è precompatto (o relativamente
compatto) se e solo se ogni successione xn di elementi di C ammette una sottosuccessione xnj
convergente (non necessariamente ad un elemento di C). Ricordiamo inoltre la

Definizione. Un operatore lineare ovunque definito A si dice compatto se e solo se tra-


sforma ogni insieme limitato in un insieme precompatto.
Essendo gli insiemi precompatti limitati, l’operatore A è limitato e dunque continuo. Se indi-
chiamo con K(E) l’insieme degli operatori compatti abbiamo allora K(E) ⊆ L(E) .

Teorema. K(E) è u ideale bilatero chiuso del’algebra L(E) .

Dimostrazione. Per verificare che un operatore A è compatto basta controllare che se


||xn || ≤ M allora Axn ammette una sottosuccessione convergente.

1) K(E) è un sottospazio: siano A, B compatti, λ ∈ C e ||xn || ≤ M . Esiste xnj tale che


Axnj → y e poiché ||xnj || ≤ M esiste xnjk tale che

Bxnjk → z e quindi (A + λB)xnjk → y + λz .


1 Uno spazio X munito di una struttura uniforme si dice precompatto se il suo completamento separato è

compatto. Un sottoinsieme A di X si dice precompatto se il sottospazio uniforme che definisce è precompatto.


In uno spazio metrico completo, e quindi in uno spazio di Banach, un insieme è precompatto se e solo se è
relativamente compatto, cioè ha chiusura compatta

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 87

Pertanto A + λB è compatto.

2) Se A ∈ L(E) , B ∈ K(E) e ||xn || ≤ M , allora, per la compattezza di B, esiste una sottosucces-


sione xnj tale che Bxnj → z e, per la continuità di A, (AB)xnjk → Az, dunque AB è compatto.
Inoltre ||Axn || ≤ ||A||M e quindi, per la compattezza di B esiste una sottosuccessione Axnj tale
che (BA)xnj → y, dunque anche BA è compatto.
Alternativamente si potrebbe dimostrare il risultato nel modo seguente: se A ∈ L(E) , B ∈ K(E)
e L ⊂ E è limitato, allora A(L) è limitato e B(A(L)) è precompatto. Dunque BA ∈ K(E). Inol-
tre B(L) è precompatto e A è continuo e quindi A(B(L)) è precompatto: B(L) è compatto
come A(B(L)) per la continuità di A; sempre per la continuità di A l’immagine dell’aderen-
za di un insieme è contenuta nell’aderenza dell’immagine di tale insieme e quindi A(B(L)) =
A(B(L)) = A(B(L)) , essendo A(B(L)) chiuso in quanto compatto. Allora A(B(L)) è precom-
patto e AB ∈ K(E) .

3) Sia
An ∈ K(E) e ||An − A||L(E) → 0
e sia ||xn || ≤ M . Allora {A1 xn } è precompatta: sia A1 x1n → y1 , dove x1n è una sottosuccessione
di xn . Allora {A2 x1n } è precompatta: sia A2 x2n → y2 , dove x2n è una sottosuccessione di x1n .
Allora ...
Sia zn = xnn la sottosuccessione diagonale. Dato ε > 0, sia p sufficientemente grande perché
||A − Ap || < ε. Qualunque sia p la successione Ap zn converge e dunque è di Cauchy: per n, m
sufficientemente grandi ||Ap (zn − zm )|| < ε. Pertanto

||Azn − Azm || ≤ ||(A − Ap )zn || + ||Ap (zn − zm )|| + ||(Ap − A)zm || ≤

≤ Mε + ε + Mε .
Cioè Azn è di Cauchy e convergente, essendo E di Banach. Dunque per ogni successione limitata
xn , la successione trasformata Axn ammette una sottosuccessione Azn convergente e A ∈ K(E).
q.e.d.

Osservazione. Ricorrendo alla caratterizzazione, in uno spazio metrico, dei precompatti come
insiemi totalmente limitati, il terzo punto si potrebbe anche dimostrare nel modo seguente.
Essendo L(E) uno spazio di Banach A ∈ L(E) e per vedere che è compatto, in virtù della
linearità, basta verificare che A(B) è precompatto, dove B = B1 (0) è la sfera unitaria di centro
0 . Fissato arbitrariamente ε > 0 sia ||An − A|| < ε. An (B) è precompatto ed ammette dunque
un ε-reticolo finito {y1 , y2 , ...yN }, il quale risulta un 2ε-reticolo finito per A(B) : se z ∈ B

||Az − An z|| < ε e ||An z − yj || < ε

con j opportuno. Quindi A ∈ K(E).

5.6 Compattezza di operatori integrali.


Per semplicità consideriamo funzioni reali definite in un intervallo [a, b] di R, munito della misu-
ra standard di Lebesgue. È facile estendere i risultati al caso di spazi metrici compatti, muniti

Università di Torino, a.a. 2003-2004


88 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

di una struttura compatibile di spazio di misura finita. (L’ipotesi di compattezza serve solo per
lo studio delle funzioni continue).

1) Sia C = C([a, b]) , K ∈ C2 = C([a, b]2 ) , allora l’operatore integrale K̂ definito da


 b
(K̂f ) = K(x, y)f (y)dy
a

è compatto.

Infatti ad esempio l’insieme dei polinomi



P (x, y) = cjk xj y k
j,k

è un algebra in C2 che contiene le costanti e separa i punti di [a, b]2 (bastano i due monomi x e
y per operare la separazione) e dunque, per il teorema di Stone-Weierstrass è densa in C2. Dato
ε > 0 sia P (x, y) tale che

||K − P ||∞ = max |K(x, y) − P (x, y)| ≤ ε .


(x,y)∈[a,b]2

Ricordando che  b
||K̂||L(C) = max |K(x, y)|dy ≤ (b − a)||K||∞
x∈[a,b] a

si vede che K̂ è limite nella norma di L(C) di operatori P̂ con nucleo separabile (somma di
prodotti di funzioni della sola x per funzioni della sola y), quindi con immagine in dimensione
finita:
  b
L(x, y) = fj (x)gj (y) ⇒ L̂ϕ(x) = ( gj (y)ϕ(y)dy)fj (x) ,
j j a

cioè Im(L̂) coincide con il sottospazio generato dalle fj . Ma un operatore continuo con immagine
in dimensione finita è ovviamente compatto e quindi K̂, quale limite di tali operatori è compatto.

2) Sia L2 = L2 ([a, b]) e K ∈ L2 = L2 ([a, b]2 ). Allora l’operatore integrale K̂ definito come al
solito da  b
(K̂f ) = K(x, y)f (y)dy
a
è compatto.

In primo luogo osserviamo che, usando il teorema di Fubini e la disuguaglianza di Schwartz,


si ha  b  b
2
||K̂f ||L2 = | K(x, y)f (y)dy|2 dx ≤
a a
 b  b  b
≤ ( |K(x, y)|2 dy)( |f (y)|2 dy)dx ≤ ||K||2L2 · ||f ||2L2 .
a a a

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 89

Quindi K̂, ovviamente lineare, è ovunque definito e limitato, con


||K̂||L(L2 ) ≤ ||K||L2

e se Kn → K in L2 allora K̂n → K̂ in L(L2 ).


Ricorrendo alla totalità delle funzioni caratteristiche degli insiemi misurabili in ogni Lp , sia,
dato ε > 0, Kn tale che

N
Kn (x, y) = cj χAj e ||K − Kn ||L2 ≤ ε ,
j=1

dove gli Aj sono misurabili. Per ogni Aj esiste un insieme Bj , unione finita di rettangoli, tale
che, indicando con µ la misura di Lebesgue:
ε
µ(Aj ∆Bj ) ≤ N .
N 1 |cj |2
Sia allora

N
Ln (x, y) = cj χBj .
j=1

Si ha
 b  b 
N  b  b 
N 
N
||Kn − Ln ||2L2 ≤ ( 2
|cj |χAJ ∆Bj ) dxdy ≤ ( |cj |2 χ2AJ ∆Bj )dxdy ≤
a a 1 a a 1 1


N N  b
  b 
N
ε
≤ |cj |2 χAJ ∆Bj dxdy ≤ |cj |2 N N =ε.
1 1 a a 1 N 1 |cj |2
La funzione caratteristica di un rettangolo con i lati paralleli agli assi è prodotto di due funzioni
caratteristiche (una della sola x, l’altra della sola y) e quindi Ln , come combinazione lineare
finita di tali funzioni, è separabile e ha immagine in dimensione finita. Si conclude allora come
nel caso precedente per garantire la compattezza di K̂ .

Se K ∈ L2 e K(x, y) = K(y, x)
 b  b  b  b
( K(x, y)f (y)dy)g(x)dx = f (y)( K(y, x)g(x)dx)dy
a a a a

e l’operatore K̂ risulta autoaggiunto. Applicando la teoria generale degli operatori autoaggiunti


e compatti, siano λj gli autovalori non nulli e ϕj un corrispondente sistema ortonormale di
autofunzioni. È immediato controllare che le funzioni
Zj (x, y) = ϕj (x)ϕj (y)
formano un sistema ortonormale in L2 . Sia allora M (x, y) la somma della serie di Fourier di K
rispetto a tale sistema:
+∞

M (x, y) = (K, Zj )Zj (x, y) ,
j=1

Università di Torino, a.a. 2003-2004


90 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

ricordando che la convergenza è in realtà in L2 . Essendo le ϕj autofunzioni associate a λj , si


ha  b b
(K, Zj ) = K(x, y)ϕj (y)ϕj (x)dxdy = λj
a a

e quindi
+∞

M (x, y) = λj ϕj (x)ϕj (y) .
j=1

Dimostriamo che K = M . Le funzioni F (x, y) = g(x)f (y), con f, g ∈ L2 formano un sistema


totale in L2 (basterebbero f, g funzioni caratteristiche di intervalli). Risulta per ogni F di tale
forma
(K − M, F ) = (K̂f, g) − (M̂ f, g) =
+∞
 +∞

= λj (f, ϕj )(ϕj , g) − λj (f, ϕj )(ϕj , g) = 0 ,
j=1 j=1

essendo le ϕj un sistema ortonormale completo in Im(K̂). Dunque (K − M, F ) = 0 per ogni


F ∈ L2 e K = M . Ne segue che vale la rappresentazione
+∞

K(x, y) = λj ϕj (x)ϕj (y) .
j=1

In particolare, ricordando l’uguaglianza di Parseval:


+∞

λ2j = ||K||2L2 ≤ +∞ .
j=1

Se K(x, y) è un nucleo tale che K(x, y) = K(y, x) e


 b
∀x ∈ [a, b] |K(x, y)|2 dy ≤ C 2 ,
a

allora le condizioni precedenti sono soddisfatte. In questo caso però la serie


+∞

K̂g(x) = λj (g, ϕj )ϕj (x)
j=1

converge non solo in media quadratica, ma nche uniformemente ed assolutamente.

Infatti, posto
+∞
 
n
f= (g, ϕj )ϕj e fn = (g, ϕj )ϕj ,
j=1 j=1

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 91

si ha

n
|K̂g(x) − λj (g, ϕj )ϕj (x)|2 = |K̂f (x) − K̂fn (x)|2 =
j=1
 b  b  b
2 2
=| K(x, y)(f (y) − fn (y))dy| ≤ |K(x, y)| dy |f − fn |2 (y)dy ≤ C 2 ||f − fn ||2
a a a
e la convergenza uniforme deriva dalla convergenza in norma.
Inoltre  b
n 
n 
n
|λj (g, ϕj )ϕj (x)| ≤ ( |(g, ϕj )|2 )1/2 ( | K(x, y)ϕj (y)dy|2 )1/2 ≤
1 1 1 a

≤ ||g|| ||K(x, ·)|| ≤ C||g|| ,


in virtù della disuguaglianza di Bessel, essendo per ogni x K(x, ·) ∈ L2 e
 b
K(x, y)ϕj (y)dy = (K(x, ·), ϕj )
a

il complesso coniugato del j-esimo coefficiente di Fourier di K(x, ·) .

Università di Torino, a.a. 2003-2004


92 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

5.7 Problemi ellittici in dimensione 1. Minorazione degli autovalori


Studiamo il seguente problema ai limiti, prototipo dei problemi ellittici in dimensione 1,
classicamente indicati come problemi di Sturm-Liouville:




−y  (x) + q(x)y(x) − λy(x) = f (x)
,

 h1 y(a) + k1 y  (a) = 0
 
h2 y(b) + k2 y (b) = 0

dove λ ∈ C , q è una funzione continua da [a, b] in R, hi , ki ∈ R e non sono entrambi nulli, f


è una funzione continua a tratti che ammette limite destro e sinistro in ciascuno dei suoi punti
di discontinuità. Le condizioni in a e b si dicono condizioni ai limiti. Le condizioni ai limiti
considerate sono omogenee. Ci si può sempre ridurre a questo caso sottrendo a y una funzione
regolare che soddisfi le condizioni non omogenee e modificando corrispondentemente il termine
noto.

Studieremo la trattazione clessica di questi problemi, seguendo la presentazione di Dieu-


donné. Cerchiamo dunque soluzioni classiche: continue con derivata prima continua e derivata
seconda con la stessa regolarità di f . L’equazione differenziale deve essere soddisfatta in ]a, b[
tranne un numero finito di punti (quelli di discontinuità di f e di y  ).

Notiamo che se f è continua allora y ∈ C 2 e l’equazione è soddisfatta in tutto ]a, b[. Infatti
se in x0 il termine noto f è continuo e l’equazione è soddisfatta allora y  è continua. Se in x0 il
termine noto f fosse continuo, ma l’equazione non fosse soddisfatta, si avrebbe

lim y  = lim− (qy − λy − f ) = lim+ (qy − λy − f ) = lim+ y  .


x→x−
0 x→x0 x→x0 x→x0

 
Ma allora y− e y+ esisterebbero e sarebbero uguali, dunque esisterebbe y  , l’equazione sarebbe

soddisfatta e y sarebbe continua.
Più in generale se f, q ∈ C k si vede che ogni soluzione y dell’equazione è di classe C 2+k .

Nel seguito per semplicità supporremo f almeno continua e l’equazione ovunque soddisfatta.
Il caso più generale considerato nella formulazione del problema si tratta facilmente consideran-
do i successivi intervalli di continuità di f .

Per una presentazione più dettagliata si veda Dieudonné[7].


Osservazione. L’equazione differenziale proposta appare di forma troppo particolare. Ma in
effetti si tratta di una forma canonica”: ogni equazione differenziale lineare del secondo ordine
si può ridurre a tale forma con un opportuno cambiamento di funzione incognita e di variabile
indipendente:
u + au + bu = g ,
dove a, b sono funzioni continue, ponendo

A = a , P = eA > 0 , Q = eA b , f = eA g ,

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 93

equivale a
(P y  ) + Qy = f perché eA y  + aeA y  = (eA y  ) .
Sia allora 
dx 1
= P (x) , p = , t = p(x) , x = p−1 (t) ,
dt P
dz 1
z(t) = y(x) = y(p−1 (t)) , = y   = y  P.
dt p
Dunque
d(y  P ) d2 z 1
= 2
dx dt P (x)
e finalmente
d2 z
+ P Q(p−1 (t))z = P f .
dt2

Per f = 0 il problema di Sturm-Liouville è un problema di autovalori e corrispondenti


autofunzioni per l’operatore differenziale

L[y] = −y  + qy

con dominio lo spazio lineare delle funzioni C 2 che soddisfano alle condizioni ai limiti.

Teorema. Gli eventuali autovalori di L sono reali e inferiormente limitati, cioè esiste λ0
tale che per λ ≤ λ0 l’unica soluzione di −y  + qy = λy, con y soddisfacente alle condizioni ai
limiti, è la soluzione nulla.

Premettiamo alla dimostrazione il seguente risultato, che è essenzialmente un esempio ele-


mentare di teorema di traccia .

Proposizione. Siano y, y  ∈ L2 (a, b) . Per ogni ε > 0 esiste Cε tale che

|y(a)|2 + |y(b)|2 ≤ ε||y  ||22 + Cε ||y||22 .

Dimostrazione. Si sa che y è assolutamente continua e si ricostruisce integrando la sua derivata.


Sia g la funzione lineare per la quale g(a) = −1 e g(b) = 1 , dunque g  (x) = 2/(b − a) . Allora
 b
[|y|2 g]ba = (2yy  g + |y|2 g  )
a

e quindi
2 1 2
|y(a)|2 + |y(b)|2 ≤ 2||y|| ||y  || + ||y||2 ≤ ε||y  ||2 + ( + )||y||2 .
b−a ε b−a
q.e.d.

Università di Torino, a.a. 2003-2004


94 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

Dimostrazione del teorema. Sia y soluzione di L[y] = λy. Moltiplicando entrambi i membri
per y e integrando su (a, b) e poi integrando per parti, si trova
 b  b
0= (−y  y + q|y|2 − λ|y|2 ) = [−y  y]ba + (|y  |2 + (q − λ)|y|2 ) =
a a
 b
B|y(b)|2 + A|y(a)|2 + (|y  |2 + (q − λ)|y|2 ,
a

dove A = 0 o B = 0 se k1 = 0 o k2 = 0 , altrimenti A = −h1 /k1 , B = h2 /k2 . Essendo in ogni


caso A e B reali si vede che λ è reale. Inoltre, posto

m = min q(x) , M = max(|A|, |B|) ,


x

si ottiene
λ||y||2 ≥ m||y||2 + ||y  ||2 − M (|y(a)|2 + |y(b)|2 ) ≥ λ0 ||y||2 ,
se si prende
εM < 1 e λ0 = m − M Cε .
Ne segue che per y ≡ 0 deve essere λ > λ0 . q.e.d.

Nel seguito, eventualmente sostituendo q − λ0 e λ − λ0 a q e λ , supporremo che non esistano


autovalori λ ≤ 0 .

5.8 La funzione di Green e l’equazione integrale equivalente.


Il problema ai limiti, analogamente a quanto avviene per il probleblema di Cauchy, verrà stu-
diato trasformandolo in una equazione integrale equivalente. Il nucleo dell’equazione integrale
è costituito dalla funzione di Green che costruiamo ora.

Sia I = [a, b] e per ogni t ∈]a, b[ cerchiamo una funzione Kt (x) tale che

1) Kt ∈ C(I) ∩ C 2 (I − {t}) ,
2) Kt (t+ ) − Kt (t− ) = −1 ,
3) −Kt + qKt = 0 in I − {t} ,
4) Kt soddisfa alle condizioni ai limiti.

Teorema. Per ogni t esiste un’unica funzione Kt che soddisfa le condizioni 1), 2), 3) e 4).
La funzione K(x, t) = Kt (x) è detta la funzione di Green del problema di Sturm-Liouville.

Dimostrazione. Per le note proprietà sui problemi di Cauchy per le equazioni lineari, esistono
due funzioni reali non nulle u1 e u2 soddisfacenti le condizioni:

−u1 + qu1 = 0 , h1 u1 (a) + k1 u1 (a) = 0 ,

−u2 + qu2 = 0 , h2 u2 (b) + k2 u2 (b) = 0 ,

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 95

entrambe individuate a meno di una costante moltiplicativa. Esse sono linearmente indipendenti,
perché se fossero proporzionali esisterebbe una soluzione y non nulla dell’equazione −y  +qy = 0
soddisfacente ad entrambe le condizioni ai limiti e λ = 0 sarebbe un autovalore dell’operatore
L. Esse costituiscono dunque un sistema fondamentale di soluzioni dell’equazione omogenea
−y  + qy = 0, nel solito senso che la soluzione generale di tale equazione è della forma

y = c1 u1 + c2 y2 ,

con c1 , c2 costanti arbitrarie. Inoltre il loro Wronskiano

W = u1 u2 − u1 u2 = 0

è costante, in quanto
     
 u u2   u1 u2   u1 u2 
D  1 = = q  =0.
u1 u2   u1  
u2  u1 u2 

Deve allora essere 


c1 (t)u1 (x), x ∈ [a, t]
Kt (x) = ,
c2 (t)u2 (x), x ∈ [t, b]
dove c1 (t) e c2 (t) si determinano imponendo in t la continuità di Kt e il prescritto salto di Kt :

c1 (t)u1 (t) − c2 (t)u2 (t) = 0
,
c1 (t)u1 (t) − c2 (t)u2 (t) = 1

sistema che ( W = 0 ) ammette soluzione unica. Pertanto



−u2 (t)u1 (x)/W, x ∈ [a, t]
Kt (x) = K(x, t) = .
−u1 (t)u2 (x)/W, x ∈ [t, b]

Dunque una funzione di Green esiste, ed essa è unica perché u1 , u2 sono individuate da costanti
moltiplicative, esattamente compensate dal Wroskiano a denominatore. q.e.d.

Osservazione. La funzione di Green K(x, t) può ovviamente essere prolungata per conti-
nuità al quadrato chiuso [a, b]2 , è reale e dalla sua espressione esplicita si controlla che risulta
simmetrica K(x, t) = K(t, x) .

Teorema. Per λ = 0, y è soluzione del problema di Sturm-Liouville con termine noto f se


e solo se  b
y(x) = K(x, t)f (t)dt .
a

Dimostrazione. È sufficiente considerare il caso in cui f e y sono reali.


1) Sia
 
u2 (x) x u1 (x) b
y(x) = − u1 (t)f (t)dt − u2 (t)f (t)dt .
W a W x

Università di Torino, a.a. 2003-2004


96 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

Allora  
u2 (x) x
u1 (x) b
u1 (x)u2 (x)
y  (x) = − u1 f − u2 f ∓ − f (x) .
W a W x W
e successivamente
 
u2 (x) x
u1 (x) b
u1 (x)u2 (x) − u1 (x)u2 (x)
y  (x) = − u1 f − u2 f − f (x) .
W a W x W
Dunque, essendo ui = qui :
y  (x) = q(x)y(x) − f (x) .
Anche le condizioni ai limiti sono soddisfatte, perché in a y, y  sono proporzionali a u1 , u1 e
analogamente in b .
2) sia y soluzione del problema di Sturm-Liouville. Consideriamo le equazioni

−Kx (t) + q(t)Kx (t) = 0 ,

−y  (t) + q(t)y(t) = f (t) .


Moltiplichiamo la prima per y(t) , la seconda per Kx (t) e facciamone la differenza:

Kx (t)y  (t) − y(t)Kx (t) = −Kx (t)f (t) , t = x .

Integrando su [a, x] e su [x, b] e ricorrendo alla formula di integrazione per parti, si trova
 x
(Kx (t)y  (t) − y(t)Kx (t))dt = [y  Kx ]xa − [yKx ]xa = y  (x)Kx (x) − y(x)Kx (x− ) ,
a

perché  
 y(a) Kx (a) 
  =0.
 y (a) Kx (a) 
Analogamente
 b
(Kx (t)y  (t) − y(t)Kx (t))dt = [y  Kx ]bx − [yKx ]bx = −y  (x)Kx (x) + y(x)Kx (x+ ) .
x

Sommando, e ricordando la condizione di salto:


 b
−y(x) = − K(x, t)f (t)dt .
a

q.e.d.

Segue immediatamente il

Teorema. Se f è continua, y è soluzione del problema di Sturm-Liouville con termine noto


f se e solo se y è soluzione dell’equazione integrale di Fredholm
 b
y(x) − λ K(x, t)y(t)dt = g(x) ,
a

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 97

dove  b
g(x) = K(x, t)f (t)dt .
a

5.9 Autovalori ed autofunzioni.


La funzione di Green è continua, reale e simmetrica, quindi in L2 = L2 ([a, b]2 ). Dunque
l’operatore integrale K̂ definito da
 b
K̂f (x) = K(x, t)f (t)dt ,
a

è compatto e autoaggiunto in L2 (a, b). Inoltre si vede facilmente, per la continuità uniforme di
K che esso trasforma funzioni di L2 in funzioni continue.
Se y è una sua autofunzione associata all’autovalore (necessariamente reale) µ = 0
K̂y = µy ,
allora y è continua e, per quanto visto nella sezione precedente, soluzione del problema di
Sturm-Liouville 


 −y  (x) + q(x)y(x) = 1 y(x)
µ .

 h y(a) + k1 y  (a) = 0
 1
h2 y(b) + k2 y  (b) = 0
Allora deve essere µ > 0 e λ = µ1 è un autovalore dell’operatore differenziale L (o come si dice
del problema di Sturm-Liouville) e y è una autofunzione di L associata a λ .
Da quanto sappiamo sui nuclei di classe L2 segue immediatamente il primo punto del seguente

Teorema.
1) Il problema di Sturm-Liouville ammette una successione di autovalori λn tali che
+∞
  b b
1
lim λn = +∞ , 2
= |K(x, t)|2 dxdt < +∞ .
n
n=1
λ n a a

2) Ogni autovarore λn ha molteplicità 1 ed ammette autofunzioni reali. Indicheremo con ϕn


un’autofunzione normalizzata ad esso associata (individuata a meno di un fattore complesso di
modulo 1). Possiamo assumere che ϕn sia reale (quindi individuata a meno del segno).
3) Le ϕn costituiscono un sistema ortonormale completo in tutto L2 .
4) Se f ∈ C 2 ([a, b]) e soddisfa le condizioni ai limiti, la sua serie di Fourier
+∞

f (x) = (f, ϕn )ϕn (x)
n=1

converge assolutamente e uniformemente in [a, b] .

Università di Torino, a.a. 2003-2004


98 Capitolo 5. Operatori autoaggiunti compatti. Problemi ellittici in dimensione 1

Dimostrazione. Il punto 1) è già dimostrato.


2) Se y e z fossero due soluzioni indipendenti corrispondenti ad uno stesso autovalore, il loro
Wronskiano (costante) sarebbe non nullo. Ma dovendo soddisfare entrambe, per esempio, alla
prima condizione ai limiti 

h1 y(a) + k1 y  (a) = 0 ,

h1 z(a) + k1 z  (a) = 0
dovrebbe essere h1 = k1 = 0 , contrariamente a quanto supposto.
Se y è una soluzione complessa, per la realtà di q , λn e di hi , ki , y e y sono soluzioni reali,
necessariamente proporzionali ed y un multiplo complesso di una delle due.
3) La completezza delle ϕn deriva da

Ker(K̂) = {0} e dunque L2 = Im(K̂) .

Infatti, se f è continua e K̂f = y = 0 , sappiamo che f = −y  + qy = 0 . Per una generica


funzione f di L2 nel nucleo di K̂ siano fj funzioni continue convergenti in L2 ad f. Allora si ha
in L2
yj = K̂fj → K̂f = 0 e − yj = fj − qyj → f .
Ma, per ogni funzione ϕ ∈ C 2 che si annulla agli estremi con la sua derivata prima, ricorrendo
due volte alla formula di integrazione per parti:

(f, ϕ) = lim −(yj , ϕ) = − lim(yj , ϕ ) = 0 .


j j

È noto che le funzioni del tipo suddetto formano un sottoinsieme denso il L2 e dunque deve
essere f = 0 .
(*Si potrebbe dire che la convergenza di yj a 0 in L2 implica la convergenza di yj a 0 nel senso
delle distribuzioni e quindi quella di yj a 0 sempre nel senso delle distribuzioni. Ma yj converge
ad f in L2 e quindi ad f nel senso delle distribuzioni. Per l’unicità del limite f = 0 .*)
4) Se f ∈ C 2 e soddisfa alle condizioni ai limiti, si ha

f = K̂g con g = −f  + qf

e il risultato segue dalle note proprietà delle autofunzioni degli operatori integrali con nucleo
tale che  b
∀x |K(x, y)|2 dy ≤ C 2 ,
a
affermazione certamente vera per la funzione di Green, che è ovunque continua. q.e.d.

Quaderni Didattici del Dipartimento di Matematica


Capitolo 6

Compattezza negli spazi metrici.


Equicontinuità

6.1 Equicontinuità.
Le ipotesi seguenti si possono notevolmente generalizzare (si veda ad esempio L.Schwartz[22]),
ma per semplificare la presentazione delle idee fondamentali e per garantire la maggior parte
delle applicazioni le restrizioni assunte sembrano adeguate.

Sia (K, d) uno spazio metrico compatto e F uno spazio di Banach. Indichiamo, analogamente
al caso di funzioni a valori reali o complessi, con C(K; F ) lo spazio delle funzioni definite e
continue da K in F , normato da
||f || = max ||f (x)||F .
x∈K

Dunque C(K; F ) è costituito da funzioni uniformemente continue ed è uno spazio normato


completo, cioè uno spazio di Banach.
È noto infatti che la continuità semplice in un compatto implica la continuità uniforme e per
verificare la completezza di C(K; F ) si può ripetere la dimostrazione fatta per funzioni a valori
complessi, sostituendo il modulo con la norma || · ||F e ricorrendo alla completezza di F .

Definizione. Una famiglia F di funzioni definite in un intorno di a ∈ K a valori in F si dice


equicontinua in a se e solo se
∀ε > 0 ∃δ > 0 ∀x ∈ K ∀f ∈ F d(x, a) ≤ δ ⇒ ||f (x) − f (a)||F ≤ ε .

Una famiglia F ⊆ C(K; F ) si dice equicontinua in K se e solo se è equicontinua in ogni punto


a di K .
Una famiglia F ⊆ C(K; F ) si dice uniformemente equicontinua in K se e solo se
∀ε > 0 ∃δ > 0 ∀x, y ∈ K ∀f ∈ F d(x, y) ≤ δ ⇒ ||f (x) − f (y)||F ≤ ε .

99
100 Capitolo 6. Compattezza negli spazi metrici. Equicontinuità

Osservazione. Essendo K compatto l’equicontinuità in K e l’uniforme equicontinuità in K


sono equivalenti. Infatti sia per assurdo F equicontinua ma non uniformemente equicontinua:

∃ε > 0 ∀δ > 0 ∃x, y ∈ K ∃f ∈ F d(x, y) < δ ∧ ||f (x) − f (y)|| > ε .

In particolare per δ = 1/n siano xn , yn , fn tali che

d(xn , yn ) < 1/n ∧ ||fn (xn ) − fn (yn )|| > ε .

Per la compattezza di K possiamo considerare due sottosuccessioni tali che

lim xnj = lim ynj = z ∈ K .


j j

Ma allora si avrebbe la contraddizione

0 < ε ≤ ||fnj (xnj ) − fnj (ynj )|| ≤ ||fnj (xnj ) − fnj (z)|| + ||fnj (z) − fnj (ynj )|| → 0

per l’equicontinuità di F in z . c.v.d.

Esempio. Se le funzioni di F sono tutte Hölderiane con uno stesso esponente α ∈]0, 1] e
con una stessa costante L :
||f (x) − f (y)||F ≤ Ld(x, y)α ,
allora sono equicontinue.

Osservazione. Se K è un sottoinsieme di uno spazio vettoriale normato, di norma | · | , e vale


la disuguaglianza precedente con α > 1 allora la funzione f è costante.
Infatti, posto ykn = x + k/n(y − x) , si ha


n−1 
||f (y) − f (x)|| ≤ ||f (yk+1
n
) − f (ykn )|| ≤ L |yk+1
n
− ykn |α ≤
k=0 k

 |y − x| n
≤L ( )α ≤ L|y − x| α → 0
n n
k
per n → +∞ .

Teorema (Versione parziale del primo teorema di Ascoli). Sia fn una successione di
funzioni equicontinue in a e convergenti semplicemente ad una funzione limite f in un intorno
A di a. Allora f è continua in a.
Dimostrazione. Dato ε > 0 sia U (a) ⊂ A un intorno di a tale che

∀x ∈ U (a) ∀n d(fn (x), fn (a)) ≤ ε .

Allora, fissato x ∈ U (a) e per n sufficientemente grande si avrà

d(fn (x), f (x)) ≤ ε , d(fn (a), f (a)) ≤ ε ,

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 101

dunque
d(f (x), f (a)) ≤ d(f (x), fn (x)) + d(fn (x), fn (a)) + d(fn (a), f (a)) ≤ 3ε ,
q.e.d.

In presenza di equicontinuità, la convergenza semplice e la convergenza uniforme sono equi-


valenti sui compatti. Precisamente

Teorema (Versione semplificata del secondo teorema di Ascoli). Sia (K, d) uno spazio
metrico compatto. Sia fn , n ≥ 1 una successione di funzioni equicontinue in K convergente
semplicemente in K ad una funzione limite f0 , necessariamente continua. Allora fn converge
uniformemente a f0 in K.
Dimostrazione. La successione fn , n ≥ 0 è ancora equicontinua. Dato ε > 0 , per ogni x ∈ K
sia U (x) un intorno aperto di x nel quale

∀y ∈ U (x) ∀n ≥ 0 ||fn (y) − fn (x)|| ≤ ε .

Essendo K compatto esiste un nmero finito di intorni

U (x1 ), U (x2 ), ... U (xp )

che ricopre K. Sia ν tale che per n ≥ ν si abbia

||fn (xj ) − f0 (xj )|| ≤ ε j = 1, 2, ...p .

Allora per ogni z ∈ K esiste xj tale che z ∈ U (xj ) e dunque per n ≥ ν

||fn (z) − f0 (z)|| ≤ ||fn (z) − fn (xj )|| + ||fn (xj ) − f0 (xj )|| + ||f0 (xj ) − f0 (z)|| ≤ 3ε .

q.e.d.

6.2 Compattezza negli spazi metrici.


Sia T uno spazio topologico separato. Ricordiamo le seguenti definizioni.

1) T si dice compatto se e solo se ogni ricoprimento aperto di T ammette un sottoricoprimento


finito.

2) T si dice numerabilmente compatto se e solo se ogni ricoprimento aperto numerabile di


T ammette un sottoricoprimento finito.
In uno spazio nel quale vale l’assioma di separazione T1 (“ x = y implica che esistono due intorni
V (x), V (y) di x e y tali ceh y ∈
/ V (x) e x ∈/ V (y)), e quindi a maggior ragione in uno spazio
di Hausdorff, si può dimostrare che è equivalente richiedere che ogni suo sottoinsieme infinito
ammetta almeno un punto di accumulazione.

3) T si dice sequenzialmente compatto se e solo se da ogni successione a valori in T si può


estrarre una sottosuccessione convergente ad un limite in T .

Università di Torino, a.a. 2003-2004


102 Capitolo 6. Compattezza negli spazi metrici. Equicontinuità

Si può dimostrare il seguente teorema, del quale omettiamo, per il momento, la dimostrazione.

Teorema. Sia (K, d) uno spazio metrico (si considera ovviamente la topologia indotta dalla
distanza d). Allora K è compatto ⇔ K è numerabilmente compatto ⇔ K è sequenzialmente
compatto.

Ricordiamo ancora le definizioni seguenti.

a) Un insieme K in uno spazio metrico (X, d) si dice relativamente compatto o equivalente-


mente, se X è completo, precompatto se e solo se la sua chiusura K è compatta.

b) Un insieme K in uno spazio metrico (X, d) si dice totalmente limitato se e solo se per ogni
ε > 0 esiste un numero finito Nε di sfere Bk di diametro ε la cui unione ricopre K. I centri
ck di tali sfere, o qualunque insieme di punti xk (uno in ciascuna Bk ) costituiscono un insieme
finito di elementi in grado di approssimare ogni elemento di K a meno di ε o come si dice un
ε-reticolo finito per K.

Teorema. Uno spazio metrico (K, d) è compatto se e solo se è totalmente limitato e com-
pleto.

Da questo teorema segue immediatamente il

Corollario. Un insieme K in uno spazio metrico completo (X, d) è relativamente compatto


se e solo se esso è totalmente limitato.

Dimostrazione del teorema.


i) Sia K sequenzialmente compatto. Da ogni successione di Cauchy xn si può estrarre una
sottosuccessione xnk convergente ad un limite x0 in K. Ma allora tutta la successione xn
converge a x0 e dunque K è completo.
Se per assurdo K non fosse totalmente limitato esisterebbe ε > 0 tale che non vi sarebbe
alcun ε-reticolo finito per K. Allora preso comunque x1 ∈ K esisterebbe x2 ∈ K tale che
d(x1 , x2 ) ≥ ε , altrimenti {x1 } sarebbe un ε-reticolo finito per K. Allora esisterebbe x3 ∈ K
tale che d(x1 , x3 ) ≥ ε e d(x2 , x3 ) ≥ ε, altrimenti {x1 , x2 } sarebbe un ε-reticolo finito per K.
Proseguendo indefinitamente si otterrebbe una successione xn tale che per ogni coppia j = k
risulterebbe d(xj , xk ) ≥ ε. Tale successione non potrebbe ammetterre alcuna sottosuccessione
convergente, in contrasto con la compattezza sequenziale di K.
ii) Sia K totalmente limitato e completo. Consideriamo una successione xn a valori in K. Sia:
R1 un 1-reticolo finito per K, a1 ∈ R1 e x1n una sottosuccessione di xn tale che per ogni n risulti
d(x1n , a1 ) < 1 ;
R2 un 1/2-reticolo finito per K, a2 ∈ R2 e x2n una sottosuccessione di x1n tale che per ogni n
risulti d(x2n , a2 ) < 1/2 ;
...
Rk un 1/k-reticolo finito per K, ak ∈ Rk e xkn una sottosuccessione di xnk−1 tale che per ogni n
risulti d(xkn , ak ) < 1/k .
...

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 103

La successione diagonale zn = xnn è una successione di Cauchy: se n < m allora


2
d(zn , zm ) ≤ d(xnn , an ) + d(an , xm
m) ≤ ,
n
che converge ad un limite z ∈ K per la completezza di K. Pertanto K è sequenzialmente com-
patto. q.e.d.

Osservazione. Usando direttamente la compattezza di (K, d) , invece di avvalersi solo della


compattezza sequenziale, è più immediato controllare che K è totalmente limitato:
dato ε > 0, le sfere aperte Bε (x), x ∈ K, formano un ricoprimento aperto di K, dal quale è
possibile estrarre un sottoricoprimento finito Bε (x1 ), Bε (x2 ), ...Bε (xp ). Allora {x1 , x2 , ...xp } è
un 2ε-reticolo finito per K .

Teorema. Uno spazio (K, d) totalmente limitato


i) ammette un sottoinsieme denso numerabile (o come spesso si dice K è separabile) e
ii) ammette una base di aperti numerabile (o come spesso si dice è di tipo numerabile).
Dimostrazione. i) Per ogni n sia Rn = {xn1 , xn2 ...xnN (n) } un 1/n-reticolo finito per K. Allora
∪n Rn è numerabile e denso in K. Sia {zn } un sottoinsieme numerabile denso e poniamo Bn,j =
B1/j (zn ). Le Bn,j costituiscono una base numerabile per gli aperti. Infatti se A è aperto:

A = ∪Bn,j ⊆A Bn,j ,

perché se x ∈ A esiste r tale che Br (x) ⊆ A ed esistono zn , j tali che d(zn , x) < 1/j < r/2 ,
dunque Bn,j ⊆ Br (x) ⊆ A. q.e.d.

Si noti che con questo teorema, accettando l’equivalenza di compattezza numerabile e com-
pattezza sequenziale negli spazi metrici, è immediato controllare che, sempre negli spazi metrici,
la compattezza sequenziale implica la compattezza, seguendo lo schema seguente:

K sequenzialmente compatto ⇒ K totalmente limitato ⇒ K ha una base numerabile

e allora da ogni ricoprimento aperto di K se ne può estrarre uno numerabile, dal quale succes-
sivamente se ne può estrarre uno finito.
Viceversa la compattezza implica la compattezza sequenziale, perchè implica la compattezza
numerabile.

Completiamo ora la dimostrazione del teorema iniziale sull’equivalenza di compattezza, com-


pattezza numerabile e compattezza sequenziale negli spazi metrici.

È bene tener presente che le seguenti affermazioni a) e b), nelle quali X è un generico spazio
topologico, sono equivalenti.

a) Da ogni ricoprimento aperto [da ogni ricoprimento aperto numerabile] di X si puiò estrarre
un sottoricoprimento finito;

b) Ogni famiglia [ogni famiglia numerabile] di chiusi di X centrata ha intersezione non vuota,
dove centrata significa che l’intersezione di un numero finito arbitrario di elementi della famiglia

Università di Torino, a.a. 2003-2004


104 Capitolo 6. Compattezza negli spazi metrici. Equicontinuità

ha intersezione non vuota.

Bastano evidentemente a questo punto le proposizioni seguenti.

Proposizione. Sia (K, d) sequenzialmete compatto. Allora esso è numerabilmente compat-


to.
Dimostrazione. Sia Cn una famiglia centrata numerabile di chiusi. Sia

xn ∈ ∩n1 Ck e xnj → x .

Allora
∀N xnj ∈ CN definitivamente ⇒ x ∈ CN ⇒ x ∈ ∩∞
1 Ck = ∅ .

q.e.d.

Proposizione. Sia (K, d) numerabilmente compatto, allora esso è sequenzialmente compat-


to.
Dimostrazione. Sia xn una successione a valori in K (le xn non sono necessariamente tutte
distinte) e
Sn = {xn+1 , xn+2 , ...} , Cn = Sn .
Ovviamente ogni intersezione finita dei chiusi Cn , contenendo l’intersezione dei corrispondenti
Sn , non è vuota. Dunque la famiglia centrata Cn ha intersezione non vuota e sia x un elemento
di tale intersezione. Definiamo iterativamente nj , j = 1, 2... :
1
x ∈ Cnj ⇒ ∃y ∈ Snj d(y, x) < ,
j
e sia dunque xn+1 , nj+1 > nj + 1, tale che
1
d(xnj+1 , x) < , allora xnj → x
j
e K è sequenzialmente compatto. q.e.d.

Osservazione. La dimostrazione precedente permette di verificare immediatamente che se


(K, d) è numerabilmente compatto alora ogni suo sottoinsieme infinito ammette un punto di
accumulazione. Basta infatti considerare un sottoinsieme numerabile S e numerarlo costruendo
una successione n → xn ∈ S . Esiste allora una sottosuccessione convergente xn → x ∈ K e
ovviamente x è punto di accumulazione per S .
Peraltro l’esistenza di un punto di accumulazione per un sottoinsieme infinito implica subito,
negli spazi metrici, la compattezza sequenziale.

* * *

Rimandando al Capitolo 7 la definizione delle topologie deboli e deboli* , anticipiamo un


risultato, ottenuto attraverso i lavori di molti autori ma con il contributo essenziale di Eberlein
e Shmulyan.

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 105

Teorema. Sia X uno spazio di Banach arbitrario e K un sottoinsieme di X. Le affermazioni


seguenti sono equivalenti:
a) K è [relativamente] debolmente compatto,
b) K è [relativamente] debolmente sequenzialmente compatto,
c) K è [relativamente] debolmente numerabilmente compatto.

Osservazione. Un insieme K debolmente compatto non è in genere metrizzabile. Ad esem-


pio la sfera unitaria chiusa nello spazio di Hilbert l2 (A), con A non numerabile è debolmente
compatta, ma non metrizzabile (ponendo come al solito eα = {δαβ}β∈A , non si può trovare un
sistema fondamentale di intorni dell’origine {x | |(x, eαj )| < ε, j = 1, 2, ..N } numerabile).
Dunque il teorema stabilisce l’equivalenza dei tre tipi di compattezza in un contesto che non
rientra in quello più semplice degli spazi metrici.

Un teorema analogo non vale nel duale X ∗ di un generico spazio di Banach X, se X ∗ è


munito della topologia debole* (più debole della topologia debole).

& & &

6.3 Criterio di compattezza in C(K; F ).


Teorema (terzo teorema di Ascoli). Sia (K, d) uno spazio metrico compatto, F uno spazio
di Banach e F ⊆ C(K; F ), munito della solita norma del massimo. La famiglia F è relativa-
mente compatta (cioè ha chiusura compatta) se e solo se :
1) F è equicontinua in K ;
2) Per ogni x ∈ K l’insime F(x) = { f (x) | f ∈ F} è relativamente compatto in F .

Dimostrazione. È facile verificare che le condizioni 1) e 2) sono necessarie. Vediamo in


dettaglio che esse sono sufficienti. Per l’equicontinuità

∀ε > 0 ∀x ∈ K ∃V (x) ∀y ∈ V (x) ∀f ∈ F ||f (y) − f (x)|| ≤ ε ,

dove V (x) indica un intorno di x, che non è restrittivo supporre aperto. Essendo K compatto
possiamo trovare un numero finito di tali intorni aperti

V (x1 ), V (x2 ), ... , V (xn )

che ricoprono K. L’insieme

Y = F(x1 ) ∪ F(x2 ) ∪ ... ∪ F(xn )

è relativamente compatto in F e sia

Y ⊆ ∪M
k=1 Bε (ak ) ,

dove le ak sono un ε-reticolo (finito) per Y . Osserviamo che per ogni f ∈ F esiste una
applicazione
ϕ : {1, 2, ...n} → {1, 2, ...M }

Università di Torino, a.a. 2003-2004


106 Capitolo 6. Compattezza negli spazi metrici. Equicontinuità

tale che, per j = 1, 2, ...n,


||f (xj ) − aϕ(j) || < ε ,
cioè f (xj ) ∈ Bε (aϕ(j) ). Infatti f (xj ) ∈ F(xj ) ⊆ Y e dunque deve trovarsi in almeno una delle
sfere di raggio ε e centro i punti del reticolo.
Poniamo
Fϕ = { g ∈ F | ||g(xj ) − aϕ(j) || < ε } .
Per l’osservazione precedente F = ∪ϕ Fϕ e l’unione è finita (esiste solo un numero finito di
applicazioni tra due insiemi finiti). Ma ogni Fϕ ha diametro non superiore a 4ε, infatti, qualsiasi
x, se x ∈ V (xi ) allora per f, g ∈ Fϕ si ha

||f (x) − g(x)|| ≤ ||f (x) − f (xi )|| + ||f (xi ) − aϕ(i) ||+

+||aϕ(i) − g(xi )|| + ||g(xi ) − g(x)|| ≤ 4ε ,


perchè il primo e l’ultimo termine sono minori di ε per l’equicontinuità in x, mentre il secondo
e il terzo sono minori di ε per definizione di Fϕ .
Dunque F ammette un 8ε reticolo finito e dunque è relativamente compatto nello spazio metrico
C(K; F ). q.e.d.

6.4 Criteri di compattezza in Lp (Ω).


Ci limitiamo a due enunciati concernenti funzioni definite in Rn , soltanto con brevissimi cenni
agli strumenti usati per le dimostrazioni. Al solito p è un numero reale ≥ 1 e Ω un sottoinsieme
misurabile di Rn , corredato della misura di Lebesgue. Ricordiamo che con Lp (Ω) indichiamo lo
spazio di Banach delle (classi di) funzioni definite in Ω tali che

||f ||p = ( |f (x)|p dx)1/p < +∞ .

Teorema. Sia Ω limitato. Sia F una famiglia fi funzioni di Lp (Ω) tale che:
1) F è limitata in norma: supf ∈F ||f ||p < +∞,
2) per ogni ε > 0 esiste δ tale che per ogni vettore h ∈ Rn e per ogni f ∈ F risulta

||h|| < δ ⇒ ||f (· + h) − f (·)||p = ( (|f (x + h) − f (x)|p dx)1/p < ε .

Allora F è relativamente compatta.

Osservazione. La condizione 2) è essenzialmente una condizione di equicontinuità in norma


Lp . Infatti nel caso di funzioni continue in Rn l’equicontinuità (uniforme) può essere scritta
(h = y − x) come ||f (· + h) − f (·)||∞ < ε se ||h|| < δ, qualsiasi f ∈ F.

Cenno sulla dimostrazione. Si approssimano le funzioni (eventualmente prima prolungadole


con 0 all’esterno di Ω) date mediante funzioni continue (sulla chiusura di Ω) e a queste si applica
il terzo Teorema di Ascoli.

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 107

Teorema (Fréchet-Kolmogorov). Sia F una famiglia fi funzioni di Lp (Rn ) che soddisfino


le condizioni 1) e 2) (con Ω = Rn ) del Teorema precedente e inoltre siano tali che

3) ∀ε > 0 ∃M ∀a > M ∀f ∈ F |f (x)|p dx < ε .
||x||≥a

6.5 Il teorema di Peano.


Il teorema fondamentale di esistenza locale di una soluzione di un problema di Cauchy
per un sistema di equazioni differenziali ordinarie resta valido anche senza l’ipotesi di dipenden-
za Lipschitziana dalla soluzione. In tal caso però non si può garantire in generale l’unicità.
Precisamente vale il seguente

Teorema (di Peano). Sia (t0 , y0 ) ∈ R × RN ed f (t, y) una funzione continua in un intorno
di (t0 , y0 ), a valori in RN . Allora esistono T > 0 e una funzione y : I = [t0 − T, t0 + T ] → RN
tali che  
y (t) = f (t, y(t)) t∈I
y(t0 ) = y0

Dimostrazione (di Tonelli). Il problema di Cauchy è equivalente all’equazione integrale


 t
y(t) = y0 + f (s, y(s))ds .
t0

Per semplicità svolgiamo la dimostrazione nel caso N = 1. Non è restrittivo supporre che
l’intorno in cui f è supposta continua sia per esempio un disco chiuso D di centro (t0 , y0 ) e
raggio r > 0, quindi compatto. La funzione continua |f | è allora limitata in D e sia |f (t, y)| ≤ M
. Consideriamo un cono chiuso C definito da
C = { (t, y) | ||y − y0 || ≤ M |t − t0 | , t ∈ [t0 − T, t0 + T ] } ,
dove T è scelto in modo tale che C ⊂ D . Essendo N = 1 in effetti ||y|| = |y| e C è formato
da due triangoli. Limitiamo le considerazioni successive a valori t ≥ t0 e quindi al triangolo
∆ a destra di t0 . Per semplicità supporremo t0 = 0. Costruiamo delle approssimazioni della
soluzione dell’equazione integrale nel modo seguente: per ogni n > 0 definiamo yn mediante le
relazioni 
y0 0 ≤ t ≤ Tn ,
yn (t) = t−T /n
y0 + 0 f (s, yn (s))ds t ≥ Tn .
Ogni funzione yn è ben definita: è assegnata, costante, sul primo intervallo [0, T /n] ed è calcolabi-
le sull’intervallo [kT /n, (k + 1)T /n] mediante un’integrazione che richiede soltanto la conoscenza
di yn su [0, kT /n] . Si può allora operare iterativamente sui successivi intervalli di ampiezza T /n
, controllando che il grafico di yn progressivamente ottenuto non esce dal triangolo ∆ :
 t−T /n
|yn (t) − y0 | ≤ |f (s, yn (s))|ds ≤ M |t − 0| = M t
0

Università di Torino, a.a. 2003-2004


108 Capitolo 6. Compattezza negli spazi metrici. Equicontinuità

e quindi f (s, yn (s)) continua ad essere definita e soggetta alla condizione |f | ≤ M .


Le funzioni yn soddisfano le condizioni

1) |yn (t)| ≤ C = |y0 | + M T 0≤t≤T ,
2) |yn (t) − yn (t )| ≤ M |t − t | 0 ≤ t, t ≤ T .

Infatti la condizione 1) è già stata verificata in fase di costruzione delle yn e la 2) risulta subito
dalle maggiorazioni
 t −T /n
|yn (t) − yn (t )| ≤ |f (s, yn (s))|ds ≤ M (t − t) ,
t−T /n

se t ≥ t ≥ T /n. Per t o t o entrambi in [0, T /n] la 2) si verifica immediatamente.


Dunque le funzioni yn sono Lipschitziane con una stessa costante di Lipschitz e pertanto equi-
continue nel compatto [0, T ]. Inoltre sono limitate in valore assoluto da una stessa costante
C (perfino indipendente da t) e costituiscono quindi una, in virtù del terzo teorema di Ascoli,
un insieme relativamente compatto in C([0, T ]; R) . Sia allora ynk una sottosuccessione unifor-
memente convergente alla funzione, necessariamente continua, y. Risulta y(0) = y0 (per ogni
n yn (0) = y0 ) e per t > 0
 t  t
y(t) = lim ynk (t) = lim y0 + f (s, ynk (s))ds − f (s, ynk (s))ds .
k k 0 t−T /nk

Essendo l’ultimo integrale maggiorato da M T /nk → 0 per k → +∞ si ha finalmente


 t
y(t) = y0 + f (s, y(s))ds ,
0

perchè f (s, ynk (s)) → f (s, y(s)) uniformemente per la continuità uniforme di f sul compatto ∆.
q.e.d.

Osservazione. Si osservi che il fatto che l’unicità della soluzione del problema di Cauchy
non sia garantita è coerente con la possibilità che diverse sottosuccessioni convergenti abbiano
funzioni limite diverse, tutte soluzione del problema.

Quaderni Didattici del Dipartimento di Matematica


Capitolo 7

I teoremi fondamentali
dell’Analisi funzionale

7.1 Premesse: Spazi di Baire


In questa sezione dimostriamo un risultato essenziale sul quale poggia la maggior parte dei
teoremi fondamentali dell’Analisi funzionale.

Definizione. Un sottoinsieme A di uno spazio topologico X è raro se e solo se l’interno


della chiusura di A è vuoto, o equivalentemente se il complementare della chiusura di A è denso
in X :

A= ∅ , (A)c = X .

Definizione. Un sottoinsieme A di uno spazio topologico è magro se e solo se A è unione


numerabile (eventualmente finita) di insiemi rari.

Gli insiemi che si possono rappresentare come unione numerabile di insiemi rari, cioè gli
insiemi magri, si dicono anche insiemi di prima categoria. Gli insiemi che non sono di prima
categoria si dicono di seconda categoria.

Esempi.
1) Sia S = { 1, 1/2, 1/3, ... }, munito della distanza d(s, t) = |s − t| indotta da R. Per ogni
s ∈ S, { s } è chiuso (se t = s e r = |t − s|/2, si ha Br (t) ∩ { s } = ∅) e aperto (esiste r tale che
Br (s) = { s }) non vuoto. Dunque { s } non è raro. Ogni sottoinsieme chiuso contiene un { s }
e dunque S non è magro.
2) Sia Q, munito della metrica usuale. Se r ∈ Q, allora { r } è chiuso ed ha interno vuoto.
Dunque { r } è raro e Q è magro. Si osservi che, in R, Q è magro, ma non raro: Q = R e il
suo interno non è vuoto.
3) Una superficie regolare Σ di dimensione ≤ n−1 in Rn (ad esempio una superficie di equazione
f (x1 , x2 , ..., xn ) = 0, con f regolare) è un insieme raro in Rn . Cosı́ l’insieme S delle matrici

109
110 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

2
quadrate A, n × n, singolari, pensate come elementi di Rn , è un insieme raro (è caratterizzato
dalla relazione algebrica tra i coefficienti det A = 0).

Definizione. Uno spazio topologico X si dice spazio di Baire se e solo è soddisfatta una
delle seguenti condizioni equivalenti:
a) ogni successione Cn di chiusi con interno vuoto ha un’unione ∪n Cn ancora con interno vuoto,
dunque ogni sottoinsieme magro è privo di punti interni ( v. punto c) );
b) ogni successione di aperti An densi in X ha un’intersezione ∩n An ancora densa in X
(il complementare di An è un chiuso Cn privo di punti interni);
c) ogni aperto non vuoto di X non è magro
(se un aperto A fosse unione numerabile insiemi rari Rk , si avrebbe Rk chiuso con interno vuoto
e, per a), ∪k Rk dovrebbe avere interno ancora vuoto e non potrebbe contenere A; viceversa,
se al punto a) si avesse (∪n Cn )◦ = A = ∅, allora l’aperto A sarebbe unione numerabile degli
insiemi rari A ∩ Cn ).

Si può dimostrare che ogni spazio localmente compatto ed ogni spazio metrico completo sono
spazi di Baire. Vediamo la dimostrazione nel caso degli spazi metrici.

Teorema (di Baire). Sia (X, d) uno spazio metrico completo. Allora X è uno spazio di Baire.

Dimostrazione. Siano An aperti densi in X , A = ∩n An ed U un qualunque aperto non vuoto.


Basta dimostrare che A ∩ U = ∅ .
Sia B0 = Br0 (x0 ) tale che B0 ⊂ U . Essendo A1 denso, l’aperto U1 = B0 ∩ A1 risulta non vuoto.
Sia B1 = Br1 (x1 ) tale che B1 ⊂ U1 e r1 < r0 /2 . Essendo A2 denso, l’aperto U2 = B1 ∩ A2
risulta non vuoto.
...
Sia Bk = Brk (xk ) tale che Bk ⊂ Uk e rk < rk−1 /2 . Essendo Ak+1 denso, l’aperto Uk+1 =
Bk ∩ Ak+1 risulta non vuoto.
...
Le sfere Bk sono incapsulate e di raggio tendente a zero, dunque i loro centri costituiscono una
successione di Cauchy. Per la completezza di (X, d) esiste y = limn xn .
Per ogni p ≥ 0 si ha xn+p ∈ Bn e quindi per ogni n si ha y ∈ Bn ⊂ B0 ∩ An , dunque y ∈ U ∩ A.
q.e.d.

In uno spazio di Baire X una proposizione P (x) è genericamente vera se essa vale per tutti
i punti di X tranne quelli di un insieme magro, ovvero se esiste un insieme E ⊆ X intersezione
numerabile di aperti denso, o come si dice se esiste un insieme Gδ , denso, tale che P (x) è vera
per ogni x ∈ E. Si dice anche che P (x) è vera B-quasi ovunque (B per Baire).

Si osservi che, se lo spazio topologico X ha anche una struttuta di spazio misurabile, con
misura µ , le affermazioni “P(x) vale µ-q.o. e “P(x) vale B-q.o. non hanno in generale alcuna
relazione tra di loro.

Si consideri ad esempio in [0, 1] , munito della usuale misura di Lebesgue, un sottoinsieme

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 111

numerabile denso (eventualmente i razionali dell’intervallo) E = {r0 , r1 , r2 ...} . Sia

1/n 1/n
A = ∩+∞
n=1 An , An = ∪k ]rk − , rk + k [ .
2k 2

La misura di Lebesgue dell’aperto denso An è ≤ 4/n e quindi l’insieme A è un Gδ , denso, di


misura di Lebesgue 0 . Mentre il complementare C = Ac = ∪n Acn è magro ma ha misura di
Lebesgue 1.

Teorema di Baire sui limiti di funzioni continue. Sia T uno spazio topologico, fn una
successione di funzioni da T in R ovunque continue e convergenti in ogni punto di t ∈ T ad un
limite f (t). Allora f è continua B-quasi ovunque (cioè l’insieme dei punti di T dove f non è
continua è magro).

Dimostrazione. Poniamo:

Ank = {t ∈ T | |fk (t) − f (t)| ≤ 1/n} , B n = ∪k Ank , C = ∩n B n .

Verifichiamo che C è esattamente l’insieme dei punti di continuità di f .

1) Sia t ∈ C: indicando con V (t), W (t)... intorni di t, abbiamo che per ogni n

∃k∃V (t)∀z ∈ V (t) |fk (z) − f (z)| ≤ 1/n ,

per la continuità di fk ∃W (t)∀z ∈ W (t) |fk (z) − fk (t)| ≤ 1/n, dunque

∀z ∈ V (t) ∩ W (t) |f (z) − f (t)| ≤ |f (z) − fk (z)| + |fk (z) − fk (t)| + |fk (t) − f (t)| ≤ 3/n

e f risulta continua in t.

2) Sia f continua in t, poiché fj (t) → f (t): ∀n∃k |fk (t) − f (t)| ≤ 1/3n. Inoltre per la
continuità di f e fk in t esiste U (t) tale che per ogni z ∈ U (t) si ha |f (z) − f (t)|, |fk (z) − fk (t)| ≤
1/3n. Allora
∀n∃k∃U (t)∀z ∈ U (t)|fk (t) − f (t)| ≤ 1/n ,

cioè t ∈ C.

Poniamo ora Fkn = {t ∈ T | ∀p |fk (t) − fk+p (t)| ≤ 1/n} ⊆ Ank . Visto che le fk sono continue
e che l’intersezione di chiusi è un chiuso, Fkn è chiuso.
Ma, poiché fj (t) → f (t) ovunque, si ha T = ∪+∞ n
k=1 Fk . Allora

◦ ◦ ◦ ◦
Fkn ⊆ Ank , ∪k Fkn ⊆ B n , T − B n ⊆ ∪k (Fkn − Fkn ) .

Per la chiusura di Fkn gli insiemi (Fkn − Fkn ) sono rari e T − B n come T − C = ∪n (T − B n ) è
magro. q.e.d.

Università di Torino, a.a. 2003-2004


112 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

7.2 Il teorema di uniforme limitatezza


Ci limiteremo a considerare operatori limitati tra spazi di Banach, anche se per alcuni risultati
sono possibili ipotesi più generali.

Teorema di uniforme limitatezza (di Banach-Steinhaus). Siano E ed F due spazi di


Banach e {Tα | α ∈ A} , con A insieme arbitrario di indici, una famiglia di operatori lineari tale
che
1) ∀α ∈ A Tα ∈ L(E, F ) ,
2) ∀x ∈ E supα∈A ||Tα x||F < +∞ .
Allora gli operatori Tα sono uniformemente limitati in norma:
sup ||Tα ||L(E,F ) < +∞ .
α∈A

Dimostrazione. Per ogni intero n sia


Cn = { x ∈ E | sup ||Tα x|| ≤ n } .
α

Per la continuità di Tα e della norma l’insieme Cnα = { x ∈ E | ||Tα x|| ≤ n } è chiuso e dunque
Cn = ∩α Cnα è chiuso. Per l’ipotesi 2) ogni x ∈ E appartiene a qualche Cn , dunque E = ∪n Cn .
Lo spazio E è di Banach, dunque metrico completo e dunque di Baire, cioè non può essere unione
numerabile di chiusi a interno vuoto. Sia CN provvisto di punti interni e sia Br (u) ⊂ CN . Allora
∀α ∈ A e ∀v tale che ||v|| < 1 risulta ||Tα (u + rv)|| ≤ N ,
ma ||Tα (rv)|| − ||Tα u|| ≤ ||Tα (u + rv)|| ≤ N e quindi
r||Tα ||L(E,F ) = r sup ||Tα v|| ≤ N + ||Tα u|| ≤ 2N .
||v||<1 , v=0

q.e.d.

Corollario. Siano E ed F spazi di Banach. Sia Tn ∈ L(E, F ) una successione di operatori


convergenti fortemente in E , cioè tali che
∀x ∈ E lim Tn x = T x .
n→+∞

Allora supn ||Tn || < +∞ e


T ∈ L(E, F ) con ||T || ≤ lim inf ||Tn || .
n

Dimostrazione. La convergenza puntuale ovunque degli operatori Tn implica la limitazione per


ogni x ∈ E della successione ||Tn x|| . Applicando il teorema di uniforme limitatezza si ha dunque
C = supn ||Tn || < +∞ e pertanto, qualunque sia x ∈ E
||T x|| = lim ||Tn x|| ≤ lim inf ||Tn || ||x|| ≤ C||x|| .
n n

Allora T , che ovviamente è lineare, risulta limitato e vale la maggiorazione della sua norma
prevista dalla tesi del corollario. q.e.d.

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 113

7.3 Spazi duali. Topologie deboli


In generale si dice duale topologico di uno spazio vettoriale topologico (s.v.t.) E lo spazio
E ∗ costituito dai funzionali lineari e continui f da E in K, dove K = C oppure K = R. In E ∗
si possono introdurre varie topologie naturali, ad esempio quella della convergenza semplice in
E, detta topologia debole*, che considereremo nei prossimi paragrafi.
Se E è uno spazio normato sul campo K il duale topologico ha la struttura di uno spazio di
Banach
E ∗ = L(E, K) ,
dove in L si considera la norma indotta da quella di E: ||f ||E ∗ = sup||x||=1 |f (x)|.

(Il duale E ∗ è un sottospazio del duale algebrico E , costituito da tutte le applicazioni lineari,
non necessariamente continue, da E in K. Molti autori indicano il duale topologico con E  ed
il duale algebrico con E ∗ ).

È talvolta possibile fornire rappresentazioni significative del duale di uno spazio di Banach.
Ad esempio si dimostra che il duale topologico di Lp (X, A, µ; R), dove µ è una misura finita o
σ-finita e p > 1, è isomorfo a Lq (X, A, µ; R), dove q è l’esponente coniugato di p : 1/p + 1/q = 1,
nel senso che ogni funzionale G lineare e continuo è della forma

G(f ) = f (x)g(x)dµ(x)
X

con g ∈ L .
q

Il duale E ∗∗ del duale E ∗ , cioè il biduale, nel caso di Lp si può identificare con Lp stesso e,
come si dice, lo spazio Lp è riflessivo.

Il duale di L1 è isomorfo a L∞ , ma in questo caso L1 si può identificare soltanto con un


sottospazio proprio del duale di L∞ . Si dimostra (Yosida) che L∞ (X, A, µ; R)∗ si può identifi-
care allo spazio delle misure definite su A, finitamente additive, a variazione totale limitata
e µ-assolutamente continue.

Gli spazi lp sono casi particolari degli spazi Lp ora considerati e quindi il duale di lp è iso-
morfo ad lq , con p > 1 e q esponente coniugato di p.
Per p = 2 si ha che L2 è isomorfo al proprio duale, e ciò in accordo con il fatto che L2 ha una
struttura Hilbertiana e per gli spazi di Hilbert vale il teorema di rappresentazione di Riesz.

Osservazione. Nel caso particolare dei funzionali lineari e continui si usa una terminologia
per la convergenza in norma e puntuale ovunque, diversa rispetto a quella adottata per operatori
lineari e continui generali.

Definizione. La convergenza in norma si dice convergenza forte e quella puntuale ovunque


convergenza debole*. Dunque diremo che una successione fn ∈ E ∗ converge debole* al
funzionale limite f ∈ E ∗ se e solo se
∀x ∈ E lim fn (x) = f (x) .
n

Università di Torino, a.a. 2003-2004


114 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

Si può anche valutare una successione xn ∈ E mediante un arbitrario elemento f di E ∗ ,


ottenendo una successione numerica: se esiste x ∈ E tale che
∀f ∈ E ∗ f (xn ) → f (x) ,
allora si dice che xn converge debolmente ad x.

Osservazione. Più in generale si dice che xn convege debolmente se per ogni f ∈ E ∗ la


successione f (xn ) ammette limite. Se il limite si può sempre rappresentare come f (x) con lo
stesso x ∈ E allora xn converge debolmente a x.
Se ogni successione xn debolmente convergente converge debolmente ad un limite x si dice che
E è sequenzialmente debolmente completo.
Analogamente si dice che fn ∈ E ∗ converge debole* se per ogni x ∈ E fn (x) converge. Se
ogni successione convergente debole* converge debolmente* ad un limite f ∈ E ∗ si dice che E ∗ è
sequenzialmente debole* completo. Nel caso che E sia uno spazio di Banach, per il teorema
di uniforme limitatezza, si vede immediatamente che E ∗ è sequenzialmente debole* completo.
Dall’affermazione precedente segue che tutti gli spazi di Banach riflessivi sono sequenzialmente
debolmente completi.

Naturalmente anche in E ∗ si possono considerare successioni convergenti debolmente, facen-


do intervenire il duale di E ∗ : se esiste f ∈ E ∗ tale che per ogni F ∈ E ∗∗ si ha F (fn ) → F (f ),
allora fn converge debolmente a f .

La convergenza debole in E ∗ implica la convergenza debole*, perché l’applicazione


f ∈ E ∗ → Fx (f ) = f (x) , x ∈ E ,
è un elemento del biduale: |Fx (f )| ≤ ||x||E ||f ||E ∗ e ||Fx ||E ∗∗ ≤ ||x||E . In effetti si può dimostra-
re il teorema seguente

Teorema. Ogni spazio normato E è isometrico ad un sottospazio, in genere proprio, di E ∗∗ .


Dimostrazione. Il Corollario 2 del successivo Teorema di Hahn-Bnach garantisce l’esistenza,
dato x ∈ E, di f ∈ E ∗ tale che ||f ||E ∗ = 1 e f (x) = ||x||E . Dunque
|Fx (f )| = |f (x)| = ||x||E .
Allora ||Fx ||E ∗ ∗ = ||x||E . q.e.d.

Nel caso degli spazi riflessivi ovviamente la convergenza debole e quella debole* coincidono.

Non sempre in uno spazio di Banach la convergenza debole è strettamente più debole di quel-
la forte, cioè della convergenza in norma. Ovviamente esse coincidono in spazi di dimensione
finita, ma ad esempio anche in l1 xn → x fortemente se e solo se xn → x debolmente.

Talvolta la convergenza debole coadiuvata da qualche informazione supplementare implica


la convergenza forte. Ad esempio, come si è già visto al Capitolo 4, in uno spazio di Hilbert, se
fn → f debolmente e ||fn || → ||f ||, allora ||fn − f || → 0:
||fn − f ||2 = ||fn ||2 + ||f ||2 − 2(fn , f ) → 0 ,

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 115

perché g → (g, f ) è un funzionale lineare e continuo e dunque (fn , f ) → ||f ||2 .

Si indica con < x, f > il valore di f in x: < x, f >= f (x), x ∈ E, f ∈ E ∗ .

Le convergenze deboli e deboli* sono indotte da corrispondenti topologie, che, come si vede
direttamente dalla definizione, rendono gli spazi E o E ∗ locammente convessi.

Definizione. Sia E uno s.v.t. La topologia debole* (weak*, faible σ(E ∗ , E)) su E ∗ è la
topologia che ammette come sistema fondamentale di intorni di ogni g ∈ E ∗ gli insiemi
V (x1 , x2 , ...xN ; ε)(g) = {f ∈ E ∗ | | < xk , f − g > | < ε, k = 1, 2...N } ,
dove N è un intero arbitrario, x1 , x2 ...xN sono elementi di E e ε > 0.

Osservazione. È immediato verificare che E ∗ munito della topologia debole* è uno spazio
vettoriali topologico, cioè le operazioni di somma e di prodotto per uno scalare sono continue.
Gli intorni di ogni elemento g si ottengono come traslazioni degli intorni di 0. Dunque basta più
semplicemente indicare come sistema fondamentale di intorni di 0 gli insiemi
V (x1 , x2 , ...XN ; ε) = {f ∈ E ∗ | sup | < xk , f > | < ε} .
1≤k≤N

Analogamente
Definizione. Sia E uno s.v.t. La topologia debole (weak, affaiblie σ(E, E ∗ )) su E è la
topologia che ammette come sistema fondamentale di intorni di ogni y ∈ E gli insiemi
V (f1 , f2 , ...fN ; ε) = {x ∈ E | | < x − y, fk > | < ε, k = 1, 2...N } ,
dove N è un intero arbitrario, f1 , f2 ...fN sono elementi di E ∗ e ε > 0.

Osservazione. In E ∗ si possono considerare sia la topologia debole* (σ(E ∗ , E)) che la topo-
logia debole (σ(E ∗ , E ∗∗, )), più forte della prima, essendo E ⊆ E ∗∗ , o meglio E isomorfo ad un
sottospazio di E ∗∗ .

La topologia debole (o debole*) non è in genere metrizzabile e non è disponibile un sistema


fondamentale numerabile di intorni di un punto. Occorre dunque grande cautela nel lavorare
con successioni e non accettarne proprietà usuali in contesti elementari, senza attento esame.
Il seguente esempio è illuminante, anche percé l2 è uno dei più semplici spazi normati di dimen-
sione infinita che conserva molte proprietà degli spazi Euclidei che ci sembrano naturali.

Esempio (von Neumann). Una successione di l2 (N) che ammette 0 quale punto limite,
ma tale che nessuna sua sottosuccessione è convergente a 0: siano p e q > p due interi positivi
e xpq = (0, 0...1, ...p, 0...) la successione (ovviamente in l2 e di norma (1 + p2 )1/2 ) con tutte le
componenti nulle, tranne la p-esima uguale a 1 e la q-esima uguale a p (xpq p = 1, x

pq
q = p).
Infatti, ricordando che l2 , insieme di tutte le successioni a valori reali zk tali che k zk2 < +∞,
è uno spazio di Hilbert isomorfo al suo duale (Teorema di Riesz) e quindi riflessivo, si ha
1) Date f j ∈ l2 , j = 1, ...N arbitrarie e ε > 0
| < xpq , f j > | = |(xpq , f j )| = |fpj + pfqj | ≤ |fpj | + p|fqj | < ε

Università di Torino, a.a. 2003-2004


116 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

per p sufficientemente grande perché maxj |fpj | < ε/2 e q ulteriormente sufficientemente gran-
de affinché maxj |fqj | < ε/2p. Dunque in ogni intorno V (f 1 , f 2 ...f N ; ε) di 0 esiste almeno un
elemento xpq della successione e 0 è un suo punto di accumulazione (0 non è un elemento della
successione).
2) I punti del tipo ep∗ = (0, 0, 0, ...1, 0...), con 1 è in posizione p∗ , sono altri punti limite. Infatti

la sottosuccessione xp q per q → +∞ converge debolmente a ep∗ . Si osservi che per p → +∞ si
ha en → 0.
3) Qualunque sottosuccessione non converge a 0. Sia X n = xpn qn una sottosuccessione conver-
gente. Se pn ≤ P per ogni n allora, presa g = (1, 1...1, 0, 0...) con esattamente P componenti
1 nelle prime posizioni, si ha (X n , g) ≥ 1 e X n non converge a 0. Se invece vi sono infiniti
indici pn distinti, diciamo nelle posizioni pν , potendo supporre, eventualmento effettuando una
ulteriore selezione, che anche le qν siano distinte tra di loro e crescenti,prendiamo g tale che
gqν = 1/pν e gj = 0 per j = qν . Abbiamo allora g ∈ l2 e (X ν , g) ≥ 1 e come prima non vi può
essere convergenza a 0.
L’esempio è completamente giustificato.

Consideriamo qualche caso, connesso a questioni che hanno in modo autonomo un grande
interesse, di convergenza forte o debole*.

1) Regolarizzazione. Sia ε > 0 un parametro destinato a tendere a 0 . Non è restrittivo


limitarsi ad una successione di valori ε → 0 . Sia Ω un a.perto limitato di Rn . Diremo
successione regolarizzante una successione di funzioni αε ∈ C0∞ (Ω) , cioè infinitamente derivabili
e a supporto compatto contenuto in Ω , tali che

αε ≥ 0 , supp αε ⊆ Bε (0) , αε (x)dx = 1 .
Rn

Ricordiamo che il supporto di una funzione è la chiusura dell’insieme dei punti nei quali non si
annulla.
Ad esempio si può prendere αε = ρε , dove

c exp(|x|2 − 1)−1 |x| < 1 ,
ρ(x) =
0 |x| ≥ 1 ,

con c = 1/ exp(|x|2 − 1)−1 dx , e ρε (x) = ρ(x/ε)/εn .

Proposizione. Per f ∈ Lp (Ω) , consideriamo il prolungamento di f a 0 fuori di Ω , che


continuiamo ad indicare con f , e poniamo

fε (x) = Tε f (x) = (f ∗ αε )(x) =


 
= f (x − t)αε (t)dt = f (t)αε (x − t)dt .
Rn Rn

L’operazione ∗ si dice convoluzione tra le due funzioni (in questo caso f e αε ). Gli operatori
Tε sono lineari e continui da Lp (Ω) in sé stesso e convergono fortemente all’identità I :

lim ||Tε f − f ||p = 0 .


ε→0

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 117

La funzione fε ∈ C ∞ (Ω) .
Gli operatori Tε , in quanto operatori integrali con nucleo regolare, sono compatti e quindi non
possono convergere in norma ad I, che non è compatto, non essendo Lp di dimensione finita.
Approssimando prima f con funzioni in Lp a supporto compatto in Ω , ad esempio ponendo

gn (x) = f (x)χKn (x) ,

con Kn compatto contenuto in Ω , Kn ⊆ Kn+1 e ∪n Kn = Ω (successione crescente esaustiva di


compatti), e quindi regolarizzando le gn , si ottiene una successione di funzioni C0∞ (Ω) conver-
gente in Lp ad f . Quindi C0∞ (Ω) è denso in Lp (Ω).
Omettiamo la dimostrazione.

2) Sia E = L1 (a, b), con la misura standard di Lebesgue dx. Siano α e β due costanti reali
diverse e, per ogni n ≥ 1 , posto xnk = a + nk (b − a) , si considerino le funzioni limitate

α xnk ≤ x < xnk + θ(b−a) n ,
gn (x) =
β xnk + θ(b−a)n ≤ x < xn
k+1 ,

dove 0 < θ < 1 . Dunque l’intervallo (a, b) è suddiviso in n intervallini di eguale ampiezza,
ciascuno dei quali è a sua volta diviso in due intervallini consecutivi di ampiezza proporzionale
rispettivamente a θ e 1 − θ , sui quali gn è costante, rispettivamente uguale prima ad α e poi β
(gn è periodica di periodo (b − a)/n).
Poniamo  b
Gn (f ) = f (x)gn (x)dx .
a

Il funzionale Gn ∈ (L1 )∗ ∼ L∞ ed è infatti rappresentato dalla funzione gn ∈ L∞ . Risulta


 b
Gn (f ) → G(f ) = f (x)g(x)dx , g(x) = θα + (1 − θ)β ,
a

come si verifica facilmente, prima considerando funzioni f continue o costanti a tratti e poi
ragionando per densità. Dunque gn → g , o più precisamente Gn → G debole*. Tuttavia non
si ha convergenza in norma. Sia infatti fn uguale a 1 o 0 sugli stessi intervalli parziali di gn ,
allora
b−a
||fn || = n θ = θ(b − a)
n
e fn è limitata, ma
 b
||gn − g||∞ ||fn || ≥ | (gn (x) − g(x))fn (x)dx| = θ(1 − θ)|α − β|(b − a)
a

non tende a 0.

7.4 I teoremi dell’applicazione aperta e del grafico chiuso


In questa sezione dimostriamo il teorema dell’applicazione aperta ed alcuni suoi corollari, tra
i quali il teorema del grafico chiuso, che, con il teorema di uniforme limitatezza e il teorema di

Università di Torino, a.a. 2003-2004


118 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

Hahn-Banach, sono considerati i teoremi fondamentali dell’analisi funzionale.

Teorema dell’applicazione aperta (di Banach). Siano E ed F spazi di Banach e


T ∈ L(E, F ) un operatore suriettivo . Allora T è un’applicazione aperta, cioè se A è un aperto
di E risulta T (A) aperto in F .
Dimostrazione. Essendo E ed F spazi normati e T lineare, è sufficiente dimostrare che esiste
r > 0 tale che
T (B1 (0)) ⊇ Br (0) ,
dove Bρ (x) indica, come al solito, la sfera aperta di raggio ρ e centro x nello spazio metrico
considerato. (Nella relazione precednte B1 (0) è in E , mentre Br (0) in F ). Infatti in tal caso,
se x0 ∈ A e Bρ (x0 ) ⊂ A , allora

T (A) ⊇ T (Bρ (x)) = T (x0 + ρB1 (0)) = T x0 + ρT (B1 (0)) ⊇ Bρr (T x0 ) .

In primo luogo vediamo che esiste r > 0 tale che

C = T (B1 (0)) ⊇ B2r (0) .

Osserviamo che C è chiuso, per definizione, convesso, per la convessità di B1 (0) e la linearità di
T e tale che C = −C. Sia Cn = nC = T (Bn (0)) , allora per a suriettività di T si ha F = ∪n Cn .
Ma F è uno spazio di Banach, dunque metrico completo e dunque di Baire. Pertanto esiste p
tale che Cp ha interno non vuoto e di conseguenza C ha interno non vuoto. Siano allora y ∈ C
e r > 0 tali che B4r (y) ⊂ C . Poiché −y ∈ −C = C , si trova

B4r (0) = B4r (y) − y ⊆ C + C = 2C .

L’ultima uguaglianza dipende dal fatto che u, v ∈ C implica (u + v)/2 ∈ C, cioè u + v ∈ 2C


. Dividendo per 2 abbiamo allora l’inclusione B2r ⊆ C = T (B1 (0)) che volevamo ottenere.
Osserviamo che si può esplicitare il risultato ottenuto dicendo che

∀y ∈ F ||y|| < 2r ⇒ ∀ε > 0 ∃x ∈ E ||x|| < 1 e ||y − T x|| < ε .

Se ne deduce che
r 1
∀y ∈ F ||y|| < ⇒ ∀ε > 0 ∃x ∈ E ||x|| < e ||y − T x|| < ε .
2n−1 2n
Infatti, se ||y|| < r/2n−1 , ||2n y|| < 2r ed esiste x∗ tale che ||x∗ || < 1 e ||2n y − T x∗ || < 2n ε .
Allora possiamo prendere x = x∗ /2n .
In secondo luogo verifichiamo che, con lo stesso r precedente, si ha effettivamente Br (0) ⊆
T (B1 (0)). Sia y un generico elemento di Br (0), cioè ||y|| < r. Ricorriamo all’ultima osservazione
per trovare, preso ε = r/2 , x1 tale che
1 r
||x1 || < e ||y − T x1 || < .
2 2
Poi, preso ε = r/22 , x2 tale che
1 r
||x2 || < e ||(y − T x1 ) − T x2 || < 2 .
22 2

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 119

In generale, preso ε = r/2n , troviamo xn tale che

1 n
r
||xn || < n
e ||y − T ( xk )|| < n .
2 1
2
+∞
Essendo E uno spazio di Banach, dunque completo, la serie 1 xk è convergente ad un
elemento x ∈ E tale che
||x|| < 1 e risulta y − T x = 0
per la contiuità di T . q.e.d.

Corollario 1. Siano E ed F due spazi di Banach e T ∈ L(E, F ) suriettivo. Esiste una


costante C tale che per ogni y ∈ F esiste x ∈ E
y = Tx e ||x|| ≤ C||y||.
Dimostrazione. Nella dimostrazione del teorema precedente si è visto che esiste r tale che per
ogni y ∗ ∈ F , con ||y ∗ || < r, esiste x∗ ∈ E tale che ||x∗ || < 1|| e y ∗ = T x∗ . Sia C tale che Cr > 1,
allora, dato y ∈ F e posto y∗ = y/(C||y||), si ha ||y ∗ || = 1/C < r. Dunque se ||x∗ || < 1|| e
y ∗ = T x∗ , posto x = C||y||x∗ , risulta T x = y e ||x|| ≤ C||y||. q.e.d.

Corollario 2. Siano E ed F due spazi di Banach. Sia T ∈ L(E, F ) bijettivo. Allora si ha


T −1 ∈ L(F, E) .
Dimostrazione. T −1 esiste ed è ovviamente lineare. Se A è un aperto arbitrario di E , allora
(T −1 )−1 (A) = T (A) . Ma per il teorema dell’applicazione aperta T (A) è aperto in F . Dunque
T −1 è continuo. q.e.d.

Corollario 3. Siano || · ||1 e || · ||2 due norme nello spazio lineare E , rispetto a ciascuna
delle quali E risulta di Banach. Se esiste una costante C1 tale che
∀x ∈ E ||x||2 ≤ C1 ||x||1 ,
allora esiste una costante C2 tale che
∀x ∈ E ||x||1 ≤ C2 ||x||2 ,
ovvero le due norme sono equivalenti.
Dimostrazione. Se indichiamo con E1 ed E2 gli spazi di Banach ottenuti munendo E rispetti-
vamente delle norme || · ||1 e || · ||2 e consideriamo l’operatore identico I da E1 in E2 , la prima
disuguaglianza dice che I ∈ L(E1 , E2 ) . Essendo I = I −1 , per il corollario 1 si ha I ∈ L(E2 , E1 )
e quindi deve valere la secoda disuguaglianza con una opportona costante C2 . q.e.d.

Consideriamo ora opertatori lineari tra due spazi di Banach E ed F , non necessariamente
ovunque definiti e non necessariamente continui. Indicheremo con D(T ) il dominio di definizione
dell’operatore T . D(T ) è un sottospazio vettoriale di E .

Definizione. L’operatore T si dice chiuso se e solo se per ogni successione xn ∈ D(T )


lim xn = x e lim T xn = y ⇒ x ∈ D(T ) e y = T x .
n n

Università di Torino, a.a. 2003-2004


120 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

È equivalente affermare che il grafico G(T ) di T è un sottospazio lineare chiuso dello spazio
prodotto E × F .

Esempio di operatore chiuso, ma non continuo.


Siano E = F = C([a, b]) e T = Dx , operatore di derivazione rispetto alla variabile reale x. T
non è ovunque definito. Infatti
D(T ) = C 1 ([a, b]) ,

sottospazio proprio delle funzioni continue con derivata prima continua. T non è continuo, per-
ché fn ∈ D(T ) e fn → f uniformemente non implicano né f ∈ D(T ), né, qualora f  esista,
fn → f  uniformemente. Si considerino i seguenti controesempi:
a1) f continua in [a, b] , ma non derivabile ovunque. Per il teorema di Weierstrass esiste una
successioni di polinomi pn uniformemente convergenti ad f . Mentre pn ∈ D(T ) , non si ha
f ∈ D(T ) ;
a2) Sia fn (x) = |x|1+1/n . Si ha fn ∈ C 1 ([−1, 1]) e fn (x) → |x| uniformemente in [−1, 1] (perché
le fn convergono puntualmente in modo monotono ad una funzione continua). Ma |x| non è
derivabile nell’origine;
b1) Sia fn (x) = (sin(nx))/n in [0, 2π] . Allora fn → f ≡ 0 uniformemente, ma fn (x) = cos(nx)
non converge, neppure semplicemente, a f  ≡ 0 ;
b2) Sia fn , n = 2, 3, ... continua in [0, 1] , nulla in [0, 1/(n + 1)] e in [1/(n − 1), 1] , lineare
[1/(n+1), 1/n] e in [1/n, 1/(n−1)], tale che fn (1/n) = 1 . Se fn (0) = 0, allora |fn | ≤ 1/(n2 −1) e
dunque fn → f ≡ 0 uniformemente, mentre fn → f  ≡ 0 semplicemente ma non uniformemente.

Teorema del grafico chiuso. Siano E ed F due spazi di Banach e T un operatore lineare
da E in F chiuso e ovunque definito. Allora T ∈ L(E, F ).
Dimostrazione. Consideriamo in E , oltre alla norma || · ||E iniziale, anche la norma

||x||G = ||x||E + ||T x||F ,

detta norma del grafico. Se xn è una successione di Cauchy per la norma del grafico, allora xn e
T xn sono successioni di Cauchy per le norme || · ||E e || · ||F . Per la completezza di E ed F si ha

xn → x ∈ E , T x n → y ∈ F ,

e, per la chiusura di T , y = T x . Dunque ||xn − x||G → 0 e lo spazio E munito della norma del
grafico, che indicheremo con EG , risulta uno spazio di Banach. Inoltre, essendo ||x||E ≤ ||x||G ,
per il precedente corollario 2 esiste una costante C tale che

||x||G ≤ C||x||E dunque ||T x||F ≤ C||x||E .

Pertanto T è limitato. q.e.d.


Osservazione. È facile dimostrare che una funzione continua f (non necessariamente lineare)
tra due spazi topologici separati ha grafico chiuso. In generale, anche per funzioni reali di va-
riabile reale, la chiusura del grafico non garantisce invece la continuità (f (x) = 1/x per x = 0 e
f (0) = 0).

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 121

7.5 Il teorema di Hahn-Banach


Vediamo la “forma analitica del teorema di Hahn-Banach, sia nel caso reale che in quello
complesso, e poi consideriamo alcune conseguenze fondamentali del teorema, concernenti l’esi-
stenza di funzionali lineari continui non banali. Esiste anche una “forma geometrica del teorema
di Hahn-Banach, concernente la separazione di insiemi convessi, per la quale rimandiamo a testi
generali di analisi funzionale o a testi specifici di analisi convessa.

Ricordiamo la

Definizione. sia E uno spazio lineare, sul campo K ( R oppure C ). Una funzione p(x)
definita su E a valori reali si dice seminorma su E, se e solo se
1) p(x) ≥ 0 ∀x ∈ E ,
2) p(x + y) ≤ p(x) + p(y) ∀(x, y) ∈ E × E,
3) p(λx) = |λ|p(x) ∀(x, λ) ∈ E × K .

Teorema di Hahn-Banach. Sia p una seminorma sullo spazio lineare reale E . Sia L un
sottospazio lineare di E ed f una funzione lineare su L, tale che
∀x ∈ L f (x) ≤ p(x) .
Allora esiste una funzione lineare F su E che prolunga f , maggiorata ovunque da p :
∀x ∈ L F (x) = f (x) , ∀x ∈ E F (x) ≤ p(x) .
Osservazione. Non è necessario che p sia una seminorma. Basta che che soddisfi la condizione
2) nella definizione di seminorma (subadditività) e la condizione 3) solo per λ ≥ 0 (positiva
omogeneità).
Dimostrazione. Siano L = E , z ∈ E − L ed M il sottospazio generato da L e z.
M = { y = x + tz | x ∈ L , t ∈ R } .
Estendiamo f a M ponendo
F (x + tz) = f (x) + tc
e scegliendo la costante c = F (z) in modo che sia sempre F (y) ≤ p(y) . Ciò è possibile: basta
che per ogni x ∈ L si abbia
f (x/t) + c ≤ p(x/t + z) per t > 0
f (x/(−t)) − c ≤ p(x/(−t) − z) per t < 0 .
O, equivalentemente, che si abbia, per arbitrari x , x ∈ L ,
f (x ) − p(x − z) ≤ c ≤ p(x + z) − f (x ) .
Effettivamente, tutti i numeri a sinistra e rispetivamente a destra nelle disuguaglianze precedenti
formano due classi separate, in quanto
f (x ) + f (x ) = f (x + x ) ≤ p(x + x ) ≤ p(x − z) + p(x + z) ,

Università di Torino, a.a. 2003-2004


122 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

per la subadditività di p .
Qualunque valore di c compreso tra
sup (f (x ) − p(x − z)) e inf (p(x + z) − f (x ))
x ∈L x ∈L

è accettabile.
Sia ora G l’insieme di tutti i prolungamenti lineari G di f a sottospazi N tali che L ⊆ N e
G ≤ p su N . Ordiniamo parzialmente G ponendo: G ≤ H se e solo se D(G) ⊆ D(H) e H
prolunga G. Ogni sottoinsieme C di G totalmente ordinato possiede in G un maggiorante: il
funzionale lineare naturalmente definito sull’unione dei domini dei G ∈ C. In virtù del lemma
di Zorn esiste allora un funzionale F massimale in G. F è maggiorato da p sul suo dominio,
che deve coincidere con tutto E, altrimenti F potrebbe essere prolungato in modo ammissibile
e non sarebbe massimale. q.e.d.

Corollario. Nelle ipotesi precedenti, con p seminorma, risulta |F (x)| ≤ p(x). Infatti
−F (x) = F (−x) ≤ p(−x) = p(x) .
Se E è localmente convesso e p è una seminorma della famiglia che ne definisce la topologia,
allora F è continua.

Trasformazioni continue tra spazi localmente convessi (s.l.c.). Se X e Y sono


s.l.c. e {p}p∈P , {q}q∈Q sono le famiglie di seminorme che ne definiscono la struttura, si vede
immediatamente che la trasformazione lineare T : X → Y è continua se e solo se
∀q∃p∀x ∈ X q(T x) ≤ M · p(x) .
Consideriamo ora il Teorema di Han-Banach nel caso complesso.

Teorema. Sia p una seminorma sullo spazio lineare complesso E . Sia L un sottospazio
lineare complesso di E ed f una funzione lineare su L a valori complessi, tale che
∀x ∈ L |f (x)| ≤ p(x) .
Allora esiste una funzione lineare complessa F su E che prolunga f , in modulo maggiorata
ovunque da p :
∀x ∈ L F (x) = f (x) , ∀x ∈ E |F (x)| ≤ p(x) .
Dimostrazione. Considerando soltanto la moltiplicazione per scalari reali, si vede che E , L , ...
sono anche spazi lineari reali. f e f sono funzioni lineari reali su L , tali che
f (x) = −f (ix) , |f (x)| ≤ |f (x)| ≤ p(x) .
Per il teorema precedente possiamo estendere f ad un funzionale reale R definito su tutto E
e tale che |R| ≤ p. Poniamo allora
F (x) = R(x) − iR(ix) ,
da cui segue F (ix) = iF (x) ed F è un funzionale lineare complesso, che si verifica immediata-
mente essere un prolungamento di f . Inoltre se F (x) = ρ exp(iγ) , allora
|F (x)| = exp(−iγ)F (x) = F (exp(−iγ)x) = R(exp(−iγ)x) ≤

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 123

≤ p(exp(−iγ)x) = | exp(−iγ)|p(x) = p(x) .


q.e.d.

Corollario 1. Sia L un sottospazio di uno spazio normato E su K (R o C). Sia

f ∈ L∗ = L(L, K) e ||f ||L∗ = sup |f (x)| .


||x||≤1, x∈L

Allora esiste F , prolungamento di f ad E , tale che

F ∈ E ∗ = L(E, K) e ||F ||E ∗ = sup |f (x)| = ||f ||L∗ .


||x||≤1, x∈E

Dimostrazione. Basta applicare il teorema di Hahn-Banach, nel caso reale, o il teorema prece-
dente, nel caso complesso, con
p(x) = ||f ||L∗ · ||x|| .
q.e.d.

Corollario 2. sia E uno spazio normato. Per ogni x ∈ E esiste un funzionale F ∈ E ∗ tale
che
||F ||E ∗ = ||x||E e F (x) = ||x||2E .
Equivalentemente esiste un funzionale G = F/||x||E tale che

||G||E ∗ = 1 e G(x) = ||x||E .

Osservazione. Se F soddisfa la prima eguaglianza, si ha per ogni z ∈ E |F (z)| ≤ ||x|| · ||z|| e


dunque |F (x)| ≤ ||x||2 . Dimostrazione. Basta applicare il corollario 1, prendendo

L = { λx | λ ∈ C } e f (λx) = λ||x||2 .

che implica ||f ||L∗ = ||x||. q.e.d.

Corollario 3. Sia M un sottospazio chiuso di uno spazio normato E, sia x0 ∈


/ M e sia
0 < d < d0 = dist(x0 , M ). Allora esiste F ∈ E ∗ tale che

||F ||E ∗ ≤ 1/d , F (x0 ) > 1 e ∀m ∈ M F (m) = 0 .

Dimostrazione. Consideriamo il sottospazio N generato da M e x0 , costituito dagli elementi


della forma λx0 + m, con m ∈ M . Definiamo il funzionale lineare f su N mediante la relazione

f (λx0 + m) = λd0 /d .

Ovviamente f (x0 ) = d0 /d > 1 e ∀m ∈ M f (m) = 0. Osserviamo poi che

||λx0 + m|| = ||λ(x0 + m/λ)|| = |λ| · ||x0 + m/λ|| ≥ |λ| inf



||x0 + m || = |λ|d0
m ∈M

e quindi, posto per ogni x ∈ E p(x) = ||x||/d, si ha


||λ(x0 + m/λ)||
|f (λx0 + m)| ≤ |λ| = p(λ(x0 + m/λ) .
d

Università di Torino, a.a. 2003-2004


124 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

Applicando il Teorema di Hahn-Banach si ottiene F ∈ E ∗ con le proprietà volute. q.e.d.

Separazione di insiemi convessi.

Il teorema di Hahn-Banach ha delle versioni geometriche che si presentano come risultati di


separazione di insiemi convessi. Risultati interessanti teoricamente e che hanno notevoli applica-
zioni ad esempio in problemi di ottimizzazione e controllo ottimo, quali il principio di massimo
di Pontrjagin.
Ci limitiamo a presentare due teoremi, rinviando per approfondimenti a Bourbaki EVT I.

Teorema. Siano X uno spazio vettoriale topologico (su R), A un suo sottoinsieme convesso,
aperto e non vuoto, e V una varietà lineare in X. Allora esiste un iperpiano (codimensione 1)
H chiuso che contiene V e non incontra A.

Dimostrazione. Non è restrittivo supporre 0 ∈ A. Sia p il funzionale di Minkowski di A:


dunque A = {x ∈ X | p(x) < 1}. Ricordiamo che dire che V è una varietà lineare significa
“x, y ∈ V ⇒ λx + (1 − λ)y ∈ V ”. Sia L il sottospazio lineare generato da V , che si verifica
immediatamente costituito dai vettori della forma ρz con z ∈ V . Esiste un’unica funzione lineare
f su L che vale 1 su V : f (ρz) = ρ. Poiché V ∩ A = ∅ si ha f (x) = 1 ⇒ p(x) ≥ 1 e per la
positiva omogeneità di p (ed f ) si deduce che f (x) ≤ p(x) per ogni x ∈ L. Basta ora applicare
il teorema di Han-banach per avere un funzionale F ovunque definito per il quale vale sempre
f (x) ≤ p(x). L’insieme H = {x ∈ X | F (x) = 1} è un iperpiano che contiene V ma non incontra
A. q.e.d.

Definizione. In uno spazio vettoriale topologico si dice che gli insiemi A e B sono separati
dall’iperpiano H se A è contenuto in uno dei due semispazi chiusi individuati da H e B nell’altro.
Equivalentemente, se H = {x | f (x) = c}, con f lineare e continuo e H − = {x | f (x) ≤ c},
H + = {x | f (x) ≥ c}: A ⊆ H − , B ⊂ H + o vicecersa. Se A e B sono contenuti nei due semispazi
aperti (interno di H ± ) allora si dice che H separa strettamente A e B.

Teorema. Siano X uno s.v.t., A un convesso aperto non vuoto e C un convesso non vuoto.
Se A ∩ C = ∅ allora esiste un iperpiano chiuso H che separa A e C. Piú precisamente esiste un
funzionale lineare e continuo f ed una costante c tali che f (x) < c in A e f (x) ≥ c in C.
Dimostrazione. C − A è un convesso aperto e per ipotesi la varietà lineare V = {0} non incontra
C − A. Basta dunque applicare il teorema precedente per avere il risultato di separazione. Non
è poi restrittivo supporre A ⊆ H − = {x | f (x) ≤ c}, ma essendo A aperto in tutti i suoi punti
f (x) < c. q.e.d.

7.6 Operatori duali e aggiunti. Continuità forte e debole

Sia T un operatore lineare tra due spazi normati X e Y , di dominio D(T ), e siano X ∗ e Y ∗
i loro duali (topologici). Per ogni y ∗ ∈ Y ∗ consideriamo l’applicazione lineare

x → < T x, y ∗ > , x ∈ D(T ) .

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 125

Se è continua, cioè ∈ L(D(T ), K), dove K è il campo base, allora in virtú del Teorema di
Hahn-Banach puó essere estesa ad un funzionale lineare e continuo x∗ ∈ X ∗ e

∀x ∈ D(T ) < T x, y ∗ >=< x, x∗ > .

Teorema. x∗ è univocamente determinato se e solo se D(T ) è denso, cioè D(T )a = X. In


tal caso, indicando con D(T ∗ ) l’insieme delle y ∗ ∈ Y ∗ per le quali x → < T x, y ∗ > , x ∈
D(T ) è continua, si verifica immediatamente che D(T ∗ ) è un sottospazio lineare e si definisce
l’operatore duale T ∗ mediante la relazione T ∗ y ∗ = x∗ . Dunque

∀x ∈ D(T ) ∀y ∗ ∈ D(T ∗ ) < T x, y ∗ >=< x, T ∗ y ∗ > .

Dimostrazione. La verifica che D(T ∗ ) è un sottospazio è immediata.


Se D(T )a = X e ∀x ∈ D(T ) < x, x∗1 >=< x, x∗2 >, allora x∗1 = x∗2 .
Se invece D(T )a = X e z ∈/ D(T )a , per il Corollario 3 del Teorema di Hahn-Banach esiste
z ∈ X tale che < z, z >> 1 e < x, z ∗ >= 0 per ogni x ∈ D(T )a . Allora x+ + z ∗ = x∗ , ma
∗ ∗ ∗

per ogni x ∈ D(T ) < x, x∗ + z ∗ >=< x, x∗ >. q.e.d.

Teorema. Se T ∈ L(X, Y ) allora T ∗ ∈ L(Y ∗ , X ∗ ) e ||T || = ||T ∗ ||.


dimostrazione. Per ogni y ∗ ∈ Y ∗ < T x, y ∗ > è continua e quindi T ∗ è ovunque definito. Inoltre

||T ∗ y ∗ || = sup | < x, T ∗ y ∗ > | = sup | < T x, y ∗ > | ≤ ||y ∗ || · sup |||T x|| ≤ ||T || · ||x|| ,
||x||=1 ||x||=1 ||x||=1

pertanto T ∗ è continuo e ||T ∗ || ≤ ||T ||.


Per ogni x ∈ X consideriamo la sua immagine T x. Per il Corollario 2 del Teorema di Hahn-
Banach sappiamo che esiste Y ∗ tale che ||y ∗ || = 1 e < T x, y ∗ >= ||T x||. Allora

||T x|| =< T x, y ∗ >=< x, T ∗ y ∗ >≤ ||x|| · ||T ∗ || · ||y ∗ || = ||T ∗ || · ||x|| .

Dunque ||T || ≤ ||T ∗ ||. q.e.d.

Teorema. Siano X e Y due spazi normati e T ∈ L(X, Y ). Allora T è anche continuo da X


munito della topologia debole in Y munito della topologia debole.
Dimostrazione. Dato x0 ∈ X, consideriamo l’intorno debole di T x0 in Y

V (y1∗ , ...yN

; ε)(T x0 ) = {y ∈ Y | | < y − T x0 , yk∗ > | ≤ ε, K = 1, ..N } ,

ricordando che gli intorni di questo tipo formano un sistema fondamentale di intorni.
Essendo < T x − T x0 , yk∗ >=< x − x0 , T ∗ yk∗ > |, èvidente che se x appartiene all’intorno debole
di x0 in X

W (T ∗ y1∗ , ...T ∗ yN

; ε)(x0 ) = {x ∈ X | | < x − x0 , T ∗ yk∗ > | ≤ ε, K = 1, ..N } ,

allora T x ∈ V . q.e.d.

Osservazione. Se interessasse soltanto la continuità sequenziale, basterebbe piú brevemente


osservare che

xn  x =⇒ ∀y ∗ ∈ Y ∗ < T xn , y ∗ >=< xn , T ∗ y ∗ > → < x, T ∗ y ∗ >

Università di Torino, a.a. 2003-2004


126 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

e dunque T xn  T x.

Corollario. Se in Y la topologia debole e quella forte coincidono, come nel caso del campo
base, allora è equivalente dire che un operatore T ∈ L(X, Y ) è debolmente o fortemente conti-
nuo. In particolare il duale topologico di uno spazio normato X nunito della topologia forte o
debole è sempre lo stesso spazio X ∗ .

Da questi risultati si puó dedurre una proprietà molto importante dei convessi negli spazi
localmente convessi.

Teorema. In uno spazio localmente convesso X è equivalente dire che un convesso è debol-
mente o fortemente chiuso.
Dimostrazione. In ordine: 1) Ogni semispazio fortemente chiuso è debolmente chiuso (e ovvia-
mente vicecersa). Infatti continuità forte e debole di funzionali lineari sono equivalenti.
2) Ogni convesso chiuso C è l’intersezione I dei semispazi chiusi che lo contengono. Infatti I è
convesso e chiuso, contiene C e se vi fosse un punto x ∈ I non appartenente a C, potremmo
trovare un suo intorno aperto e convesso A, che potremmo separare da C mediante un iperpiano
H. Assurdo, perchè uno dei due semispazi individuati da H dovrebbe contenere C e ovviamente
I. q.e.d.

7.7 Il Teorema dell’immagine chiusa di Banach


Sia X uno spazio normato e X ∗ il suo duale topologico. Indichiamo come al solito con
< x, x∗ > il valore assunto dal funzionale x∗ sul vettore x: < x, x∗ >= x∗ (x).
Se M è un sottospazio lineare di X si indica con M ⊥ il sottospazio di X ∗ ortogonale ad M :

M ⊥ = {x∗ ∈ X ∗ | ∀x ∈ M < x, x∗ >= 0} ,

ementre per un sottospazio N di X ∗ indichiamo con N ⊥∗ il sottospazio di X *ortogonale ad N :

N ⊥∗ = {x ∈ X | ∀x∗ ∈ N < x, x∗ >= 0} .

Indichiamo con Im(T ) e Ker(T ) l’immagine e il nucleo di un operatore lineare T (spesso nella
letteratura si trovano le notazioni R(T ) e N (T ), da range e null space).

Teorema dell’immagine chiusa di Banach. Siano X e Y due spazi di Banach . Sia


T un operatore chiuso da X in Y con dominio denso : D(T ) = X. Allora le affermazioni
seguenti sono equivalenti:
1) Im(T ) è chiusa in Y ,
2) (T ∗ ) è chiusa in X ∗ ,
3) Im(T ) = Ker(T ∗ )⊥∗ ,
4) Im(T ∗ ) = Ker(T )⊥ .

Per una dimostrazione completa rinviamo per esempio a Yosida[24]. La riduzione del caso
generale al caso di un operatore limitato è relativamente semplice. Alcune delle implicazioni
precedenti sono più utilizzate delle altre. Presentiamo allora un risultato parziale con la sua

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 127

dimostrazione (Hutson-Pymm[13]).

Teorema. Siano X e Y due spazi di Banach e sia T ∈ L(X, Y ) (dunque T ∗ ∈ L(Y ∗ , X ∗ )).
Allora
Im(T ) = Ker(T ∗ )⊥∗ .
e inoltre
Im(T ) chiusa ⇔ Im(T ∗ ) = Ker(T )⊥ .
Dimostrazione. La prima uguaglianza si ottiene verificando due inclusioni.
Indichiamo per brevità con U e V del primo e secondo membro della prima uguaglianza.

1)Se y = T x allora

T ∗ y ∗ = 0 ⇔ < y, y ∗ >=< T x, y ∗ >=< x, T ∗ y ∗ >= 0

e T x ∈ Ker(T ∗ )⊥∗ , che è chiuso, e dunque U ⊆ V .


2) Sia y0 ∈ Ker(T ∗ )⊥∗ . Se fosse y0 ∈ / Im(T ) per il Teorema di Hahn-Bnach esiste y ∗ ∈ Y ∗ tale
che
y ∗ (y0 ) =< y0 , y ∗ > = 0 e y ∗ (T x) =< T x, y ∗ >=< x, T ∗ y ∗ >= 0 ∀x ∈ X .
Ma allora y ∗ ∈ Ker(T ∗ ) e y0 ∈
/ Ker(T ∗ )⊥∗ . Assurdo. Pertanto V ⊆ U .
Dunque U = V .

Supponiamo ora che Im(T ) sia chiusa e dimostriamo la seconda uguaglianza della tesi,
indicando con U ∗ e V ∗ il primo e il secondo membro.
1) Se x∗ ∈ Im(T ∗ ), cioè x∗ = T ∗ y ∗ , e x ∈ Ker(T ), cioè T x = 0, allora

< x, x∗ >=< x, T ∗ y ∗ >=< T x, y ∗ >= 0 ,

ovvero x∗ ∈ Ker(T )⊥ e dunque U ∗ ⊆ V ∗ .


2) Sia ora x∗ ∈ Ker(T )⊥ e definiamo ỹ ∈ Im(T )∗ , lo spazio duele di Im(T )∗ , mediante la
relazione
< y, ỹ >=< x, x∗ > se y = T x .
La definizione è definita perché se y = T x1 = T x2 allora T (x1 − x2 ) = 0, cioè x1 − x2 ∈ Ker(T ),
e dunque < x1 − x2 , x∗ >= 0, ovvero < x1 , x∗ >=< x2 , x∗ >. Osserviamo che l’applicazione ỹ è
ovviamente lineare e appartiene effettivamente a Im(T )∗ in quanto, ricordando il Corollario 1
del Teorema dell’applicazione aperta, abbiamo

∃C∀y ∈ Im(T )∃x y = T x , ||x|| ≤ C||y||

e quindi, con tale x


| < y, ỹ > | = | < x, x∗ > | ≤ (C||x∗ ||)||y|| .
Per il Teorema di Hahn-Banach possiamo estendere ỹ a y ∗ ∈ Y ∗ e

∀x ∈ X < x, T ∗ y ∗ >=< T x, y ∗ >=< T x, ỹ >=< x, x∗ > .

Dunque x∗ = T ∗ y ∗ , cioè x∗ ∈ Im(T ∗ ), e dunque V ∗ ⊆ U ∗ . q.e.d.

Università di Torino, a.a. 2003-2004


128 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

7.8 Compattezza e compattezza sequenziale debole


Abbiamo già enunciato in precedenza un risultato fondamentale, ottenuto attraverso i lavori di
molti autori ma con il contributo essenziale di Eberlein e Shmulyan.

Teorema. Sia X uno spazio di Banach arbitrario e K un sottoinsieme di X. Le affermazioni


seguenti sono equivalenti:
a) K è [relativamente] debolmente compatto,
b) K è [relativamente] debolmente sequenzialmente compatto,
c) K è [relativamente] debolmente numerabilmente compatto.

Osservazione. Un insieme K debolmente compatto non è in genere metrizzabile. Ad esem-


pio la sfera unitaria chiusa nello spazio di Hilbert l2 (A), con A non numerabile è debolmente
compatta, ma non metrizzabile (ponendo come al solito eα = {δαβ }β∈A , non si può trovare un
sistema fondamentale di intorni dell’origine {x | |(x, eαj )| < ε, j = 1, 2, ..N } numerabile).
Dunque il teorema stabilisce l’equivalenza dei tre tipi di compattezza in un contesto che non
rientra in quello più semplice degli spazi metrici.

Un teorema analogo non vale nel duale X ∗ di un generico spazio di Banach X, se X ∗ è


munito della topologia debole* (più debole della topologia debole).

Operando con la topologia debole*, si possono ottenere risultati non validi in generale per
la topologia debole. Ad esempio:

Teorema (Banach-Alaoglu). La sfera chiusa unitaria di X ∗ , dove X è uno spazio di


Banach, è compatta nella topologia debole*. Dunque ogni insieme chiuso e limitato in norma è
debole* compatto.

La dimostrazione dipende essenzialmente dal teorema di Tychonov sulla compattezza degli


spazi prodotto; rinviamo per una presentazione completa ad esempio a Dunford-Schwartz[8].

Tuttavia in generale la sfera chiusa unitaria non è sequenzialmente debole* compatta.


Consideriamo il seguente

Esempio. Sia X = L∞ (R) e X ∗ il suo duale. Si sa che L1 (R) è un sottospazio (proprio)


immerso isometricamente in X ∗ . Consideriamo, indicando al solito con χ funzioni caratteristiche,
la successione
 n+1
Fn = χ[n.n+1[ , ∀f ∈ X Fn (f ) = f (x)dx , ||Fn ||X ∗ = ||χ[n.n+1[ ||L1 = 1 .
n

Non esiste alcuna sottosuccessione di Fnk di Fn , convergente debole*. Infatti, data la succes-
sione di indici nk , basta prendere g = j (−1)j χ[nj ,nj +1[ per avere Fnk (g) = (−1)k , successione
numerica oscillante e non convergente.

Da questo semplice esempio deduciamo che

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 129

1) La sfera chiusa unitaria di X ∗ è compatta (Banach-Alaoglu), ma non è sequenzialmente


compatta per la topologia debole*.

2) Tale sfera a maggior ragione non puo’ essere sequenzialmente debolmente compatta, dun-
que (Eberlein-Smulyan) non puo’ essere debolmente compatta.

3) Pertanto in alcuni spazi di Banach (non riflessivi) esistono insiemi limitati in norma ma
non relativamente debolmente compatti.

Per quanto riguarda la compattezza sequenziale debole* vale un risultato particolare, molto
importante per le numerore applicazioni, negli spazi separabili, quelli cioè che ammettono un
sottoinsieme numerabile denso.

Teorema. Sia X uno spazio di Banach separabile e X ∗ , il suo duale. Allora la sfera chiusa
unitaria di X ∗ è sequenzialmente compatta per la topologia debole*.
Dimostrazione. Sia D = {xk } un sottoinsieme separabile denso in X e fn una successione limi-
tata in X ∗ : ||fn ||∗ ≤ C.
(1)
Dalla successione numerica fn (x1 ) si puó estrarre una sottosuccessione convergente fn (x1 ) →
y1 .
(1) (2)
Dalla successione numerica fn (x2 ) si puó estrarre una sottosuccessione convergente fn (x2 ) →
(2)
y2 , valendo ancora fn (x1 ) → y1 .
...
(k−1) (k)
Dalla successione numerica fn (xk ) si puó estrarre una sottosuccessione convergente fn (xk ) →
(k) (k)
yk , valendo ancora fn (xk−1 ) → yk−1 ... fn (x1 ) → y1 .
(n)
... La successione diagonale gn = fn converge in tutti i punti di D ed è limitata in norma:
||gn ||∗ ≤ C, dunque, come si verifica immediatamente, converge in tutti i punti di X:

||x−xj || < ε ⇒ |gn+p (x)−gn (x)| ≤ |gn+p (x)−gn+p (xj )|+|gn+p (xj )−gn (xj )|+|gn (xj )−gn (x)| ≤ (2C+1)ε ,

per n sufficientemente grande (dato j) e p arbitrario.


Ma X ∗ è sequenzialmente debole* completo (per il teorema di uniforme limitatezza) e dunque
esiste g ∈ X ∗ tale che gn → g debole*. q.e.d.

Teorema. Se X è uno spazio di Banach e X ∗ è separabile, allora X è anch’esso separabile.


Osservazione. La separabilità di X non implica quella di X ∗ (esempio L1 (R) è separabile, ma
L∞ (R) non lo è).
Dimostrazione. Sia fn ∈ X ∗ , ||fn ||∗ = 1 una successione densa nella superficie unitaria di X ∗
e, fissato a > 0, sia xn ∈ X, ||xn || = 1 tale che fn (xn ) =< xn , fn >≥ a. Il sottospazio chiuso
M generato dalle xn coincide con X, altrimenti esisterebbe z ∈ X − M, z = 0. allora per il
Corollario 3 della Sezione 7.5 esisterebbe g ∈ X ∗ tale che

||g||∗ = 1 , g(z) = 0 , ∀x ∈ M g(x) = 0 ,

quindi g(xn ) = 0 e

0 < a ≤ |fn (xn )| ≤ |fn (xn ) − g(xn )| + |g(xn )| ≤ ||xn || · ||fn − g||∗ = ||fn − g||∗

Università di Torino, a.a. 2003-2004


130 Capitolo 7. I teoremi fondamentali dell’Analisi funzionale

in contraddizione con la densità delle fn sulla superficie unitaria.


q.e.d.

Corollario. Se X ∗ e’ separabile allora la sfera chiusa unitaria di X ∗ è sequenzialmente


compatta per la topologia debole*.
Infatti, per il teorema, l’ipotesi implica che X è separabile e si può allora applicare il teorema
precedente.

Compattezza debole e compattezza sequenziale negli spazi di Banach sono strettamente cor-
relate alla riflessività dello spazio.

Si deve a Eberlein e Shmulyan la seguente caratterizzazione degli spazi di Banach riflessivi


(non solo di quelli separabili):

Teorema. Uno spazio di Banach X è riflessivo se e solo se X è localmente sequenzialmente


compatto.

Un’altra caratterizzazione importante si deve a Kakutani:

Teorema. Uno spazio di Banach X è riflessivo se e solo se la sua sfera unitaria chiusa è
debolmente compatta.

Osserviamo infine che si può facilmente dimostrare che, se X è uno spazio di Bnach, allora
X è riflessivo se e solo se X ∗ è riflessivo.

Quaderni Didattici del Dipartimento di Matematica


Capitolo 8

Alcuni risultati sulle funzioni


continue e le serie di Fourier
ordinarie

8.1 Spazi pre-Hilbertiani di funzioni continue e serie di Fourier ordinarie.


Abbiamo già visto che C(K; R), dove K è uno spazio topologico compatto, è uno spazio di
Banach per la norma
||f ||K,∞ = max |f (x)| .
x∈K
Una successione fn convergente in tale norma converge uniformemente su K.

C(K; R), tranne il caso particolare di K ridotto un solo punto, non è uno spazio di Hilbert
per la norma ||f ||K,∞ . Infatti uno spazio compatto è normale (allora esistono due loro intorni
aperti A e A disgiunti) e in esso vale quindi il teorema di Urysohn (se C e C  sono chiusi
disgiunti di K esiste una funzione continua da K in [0, 1] tale che f (x) = 0 per x ∈ C e f (x) = 1
per x ∈ C  ). Dunque, se vi sono due punti distinti x e y in K, è possibile trovare una funzione
g continua in K tale che, detta f la funzione costante uguale a 1 ,
∀z ∈ K 0 ≤ g(z) ≤ 1 , g(x) = 0 , g(y) = f (y) = 1 ,
allora
||f + g||2 + ||f − g||2 = (1 + 1)2 + 12 > 2(12 + 12 ) = 2(||f ||2 + ||g||2 )
e non è soddisfatta la disuguaglianza della mediana.

Talvolta è però conveniente introdurre in questi spazi di funzioni continue un prodotto sca-
lare e munirli della corrispondente struttura di spazi pre-Hilbertiani.

Esempio. C([0, 2π]; C), con il prodotto scalare



(f, g) = f (x)g(x)dx ,
[0,2π]

131
132 Capitolo 8. Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie

è uno spazio pre-Hilbertiano.


Questo spazio si può completare in modo canonico, ottenendo uno spazio di Hilbert H che può
essere identificato a L2 ([0, 2π], dx) .

In H l’insieme di funzioni continue F = {einx / 2π | n ∈ Z} costituisce un sistema ortonor-
male: 
einx e−imx
√ √ dx = δn,m ,
[0,2π] 2π 2π
con δn,m uguale a 0 o 1 se n = m o n = m (indice di Kronecker).
Dimostreremo che F è completo. Allora, applicando il teorema sulle serie di Fourier generaliz-
zate, otteniamo che per ogni funzione f di L2 , e in particolare di C, vale lo sviluppo ordinario
di Fourier:
1 N
f (x) ∼ √ fn einx ,
2π n=−N

dove fn sono i coefficienti di Fourier



e−inx
fn = f (x) √ dx
[0,2π] 2π

e il simbolo ∼ indica la convergenza nella norma di L2 o come si dice in media quadratica:


 N
1
lim |f (x) − √ fn einx |2 dx = 0 .
N →+∞ [0,2π] 2π n=−N

Per semplicità si sono considerate ridotte simmetriche, ma il risultato sussiste anche se si


considerano somme da −M a N e si fanno tendere a +∞ indipendentemente M e N .

8.2 Convergenza monotona.


È noto che la convergenza semplice non implica in generale la convergenza uniforme, tuttavia:

Teorema. Sia K compatto e siano f, fn ∈ C(K; R). Supponiamo che fn converga sempli-
cemente in modo monotono, ad esempio non crescendo, ad f :

∀x ∈ K (∀nfn (x) ≤ fn−1 (x)) e f (x) = lim fn (x) = inf fn (x) .


n n

Allora fn → f uniformemente in K :

lim ||fn − f ||K,∞ = 0 .


n

(Si osservi che tra le ipotesi vi è la continuità della funzione limite).

Dimostrazione.
∀ε > 0 ∀x ∈ K ∃nx f (x) ≤ fnx (x) < f (x) + ε

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 133

e quindi per la monotonia

∀n ≥ nx f (x) ≤ fn (x) < f (x) + ε .

Ma per la monotonia e per la permanenza delle disuguaglianze strette tra funzioni continue,
indicando con V (x) un intorno, che per convenienza supporremo aperto, di x :

∀x ∈ K ∃V (x) ∀z ∈ V (x) f (z) ≤ fnx (z) < f (z) + ε .

Gli intorni V (x) formano un ricoprimento aperto di K e per la compattezza di K esistono


x1 , x2 , ..., xN tali che
V (x1 ) ∪ V (x2 ) ∪ ... ∪ V (xN ) ⊇ K .
Ad ogni xk corrisponde una funzione fnxk con indice nxk . Poniamo ν = max(nx1 , nx2 , ..., nxN ),
allora per ogni z ∈ K esiste un xk tale che z ∈ V (xk ) e dunque per ogni n ≥ ν si ha

f (z) ≤ fn (z) ≤ fν (z) ≤ fnxk (z) < f (z) + ε ,

cioè
∀ε > 0 ∃ν ∀n ≥ ν ||fn − f ||K,∞ < ε .
q.e.d.

8.3 Approssimazione di funzioni continue mediante funzioni speciali.


Prima di studiare il tema dell’approssimazione di funzioni continue mediante funzioni speciali
(per esempio polinomi o funzioni trigonometriche nel caso K = [a, b] ) consideriamo i seguenti
risultati elementari.

Lemma. Per 0 ≤ x ≤ 1, la funzione x può essere approssimata uniformemente mediante
polinomi.
Dimostrazione. La radice quadrata in senso aritmetico z di x soddisfa le relazioni

z2 = x , 0 ≤ z ≤ 1 .

Effettuando il cambiamento di variabili

y = 1 − z , (0 ≤ y ≤ 1) , t = 1 − x , (0 ≤ t ≤ 1) ,

si trova
(1 − y)2 = 1 + y 2 − 2y = 1 − t , cioè y = 1/2(t + y 2 ) .
Costruiamo la successione yn = Qn (t) secondo lo schema iterativo

y0 = 0
,
yn+1 = 1/2(t + yn2 )

ottenendo y1 = t/2, y2 = t/2 + t2 /8, ... . Ovviamente ai polinomi Qn (a coefficienti positivi)


corrispondono i polinomi Pn definiti da

zn = 1 − yn = 1 − Qn (t) = 1 − Qn (1 − x) = Pn (x) .

Università di Torino, a.a. 2003-2004


134 Capitolo 8. Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie

È chiaro che
1) per ogni n si ha yn ≥ 0 ;
2) per ogni n si ha yn ≤ yn+1 , per induzione, essendo:
yn + yn−1
y0 ≤ y1 , yn+1 − yn = (yn − yn−1 ) ;
2
3) per ogni n si ha yn ≤ 1 , per induzione, essendo

y0 ≤ 1 , yn ≤ 1 ⇒ yn+1 ≤ 1 .

Per ogni t la successione yn = Qn (t) è dunque nondecrescente e limitata. Allora


2
y(t) = lim yn (t) = lim 1/2(t + yn−1 ) = 1/2(t + y(t))2 .
n n

Pertanto

z(x) = 1 − y(t) = x e z(x) = lim Pn (x) .
n

Ma x è continua e la successione Pn è noncrescente e convergente semplicemente sul compatto
[0, 1]. Per il teorema precedente la convergenza è anche uniforme. q.e.d.

* * *

Il metodo iterativo precedente puoò essere applicato con successo anche per ottenere la radice
quadrata di un operatore autoaggiunto positivo. Premettiamo alcune definizioni. Sia A ∈ "(H)
una trasformazione autoaggiunta in uno spazio di Hilbert H (∀f ∈ H(Af, f ) = (f, Af )):

1)si dice che A è positiva se e solo se la forma quadratica associata (Af, f ) è positiva.

2) Siano A e B autoaggiunte. Si pone

A≤B ⇔ ∀f ∈ H ((B − A)f, f ) ≥ 0 ,

cioè B − A è positiva.

Teorema. Se An è una successione monotona e limitata di trasformazioni autoaggiunte


positive, per semplicità:
O ≤ A1 ≤ A2 ≤ ... ≤ I ,
allora esiste un’unica trasformazione positiva A ∈ L(H) tale che

∀f ∈ H lim An f = Af .
n

Ovviamente O ≤ A ≤ I.

Osservazione 1. Non è necessario che le An commutino.

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 135

Osservazione 2. È facile e sufficiente per il teorema successivo verificare la convergenza debole


delle An :
∀f, g ∈ H lim(An f, g) = (Af, g) .
n

Infatti, supponendo O ≤ aI ≤ An (ipotesi non restrittiva, perché basta ragionare sulle An + aI


invece che direttamente sulle An ), le forme quadratiche Q(f ) = (An f, f ) sono il quadrato di
una norma Hilbertiana che soddisfa l’identità della mediana, e al limite otteniamo una funzione
Q(f ) tale che Q(f + g) + Q(f − g) = 2(Q(f ) + Q(g)). Allora Q(f )1/2 è una norma Hilbertiana
indotta dal prodotto scalare:
1
B(f, g) = (Q(f + g) − Q(f − g)) = lim(An f, g) .
4 n

Ovviamente |B(f, g)| ≤ ||f ||||g|| e quindi B(f, ·) ∈ H  . Per il Teorema di Riesz esiste Af tale
che

B(f, g) = (Af, g) , ||Af || ≤ ||f ||, A ∈ L(H) , Q(f ) = (Af, f ) e ∀naI ≤ An ≤ A ≤ I .

Teorema. Sia A limitata autoaggiunta e positiva. Allora esiste un’unica trasformazione X


limitata autoggiunta e positiva tale che X 2 = A. Si scrive allora A1/2 = X.

Dimostrazione. (Per semplicità sia R il campo base). Basta usare il metodo del Lemma
precedente:
1
Y = I − X , B = I − A , Y0 = O , Yn+1 = (B + Yn2 )
2
per ottenere una succesione monotona. Osserviamo infatti che se B ≥ O allora per ogni p si ha
B p ≥ O ((B 2k f, f ) = ||B k f ||2 , (B 2k+1 f, f ) = (BB k f, B k f )), e che le Yn e le Yn − Yn−1 sono
polinomi in B a coefficienti positivi, come si verifica per induzione, essendo
1 1 1
Yn+1 = (B + Yn2 ) , Yn+1 − Yn = (Yn2 − Yn−1
2
) = (Yn − Yn−1 )(Yn + Yn−1 ) .
2 2 2
Allora O ≤ Yn−1 ≤ Yn ≤ I e per il Teorema precedente Yn converge debolmente a Y . Infine
X = I − Y è tale che X 2 = A.

L’unicità si ottiene attraverso i calcoli seguenti.


Indichiamo in generale con A1/2 l’operatore costruito con il metodo iterativo precedente. Sia
X = A1/2 e Y ≥ O tale che Y 2 = A. Si ha Y 3 = AY = Y A e quindi Y commuta con X, che è
limite di polinomi in A. Per ogni f ∈ H

0 = ((X 2 −Y 2 )f, (X−Y )f ) = ((X+Y )(X−Y )f, (X−Y )f ) = ||X 1/2 (X−Y )f ||2 +||Y 1/2 (X−Y )f ||2 .

Allora X 1/2 (X − Y ) = Y 1/2 (X − Y ) = O e dunque X(X − Y ) = Y (X − Y ) = O, quindi


(X − Y )2 = O, ovvero ∀f ∈ H ||(X − Y )f ||2 = 0, cioè X − Y = O. q.e.d.

Proposizione. SE AB = BA, A ≥ O, B ≥ O allora AB ≥ O e se inoltre A ≤ B allora


A2 ≤ AB ≤ B 2 . Dimostrazione.

(ABf, f ) = (B 1/2 AB 1/2 f, f ) = (AB 1/2 f, B 1/2 f ) ≥ 0 , (A2 f, f ) = (AA1/2 f, A1/2 f ) ≤ (BA1/2 f, A1/2 f ) = (BAf, f ) .

Università di Torino, a.a. 2003-2004


136 Capitolo 8. Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie

Osservazione. Se le An della successione monotona dell’Osservazione 2 precedente commutano


è facile controllare che in effetti la convergenza è forte, perché allora A2n ≤ A2n+1 ≤ A2 e quindi,
ricorrendo al teorema di uniforme limitatezza (Capitolo 7) si ha
||Af ||2 ≤ lim inf ||An f ||2 = lim ||An f ||2 ≤ ||Af ||2 ,
n n

e dunque ||An f || → ||Af ||, che insieme alla convergenza debole An f  Af garantisce la
convergenza forte. q.e.d.
& & &

Lemma. In ogni intervallo finito, per semplicità [−L, L] , la funzione |x| si può approssimare
uniformemente mediante una successione
noncrescente di polinomi.
Dimostrazione. Basta scrivere |x| = L (x/L)2 ed usare il lemma precedente:
|x| = lim LPn ((x/L)2 ) e Pn+1 ≤ Pn .
n

Dunque i polinomi Mn (x) = LPn ((x/L)2 ) non crescono. q.e.d.

Nel seguito indicheremo brevemente con C(K) lo spazio di Banach delle funzioni continue sul
compatto K , munito della norma del massimo: le funzioni saranno a valori in C o in R (quale
dei due casi si consideri risulterà chiaro dal contesto).

Teorema di Stone-Weierstrass. Sia A ⊂ C(K) . Se sono soddisfatte le seguenti


condizioni: 1) A è un’algebra autoaggiunta, cioè
f, g ∈ A ⇒ λf + g , f g , f ∈ A ,
2) La funzione costante 1 (e quindi ogni funzione costante) appartiene a A .
3) A separa i punti di K , nel senso che
∀x, y ∈ K x = y ⇒ ∃f ∈ A f (x) = f (y) .
Allora A è denso in C(K), ovvero la chiusura di A coincide con C(K) .

È una semplice conseguenza del teorema seguente.

Teorema (Kakutani-Krein). Sia B ⊂ C(K), dove in questo caso si considerano funzioni


a valori reali. Se sono soddisfatte le seguenti condizioni: 1) B è uno spazio vettoriale su R e se
f ∈ B si ha anche |f | ∈ B.
2) La funzione costante 1 (e quindi ogni funzione costante) appartiene a B.
3) B separa i punti di K , nel senso che
∀x, y ∈ K x = y ⇒ ∃f ∈ B f (x) = f (y) .
Allora B è denso in C(K), ovvero la chiusura di B coincide con C(K) .
Dimostrazione.
a) Essendo
f + g − |f − g| |f + g + |f − g|
f ∧ g = inf(f, g) = e f ∨ g = sup(f, g) = ,
2 2

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 137

f, g ∈ B implica f ∧ g, f ∨ g ∈ B.
b) Data F ∈ C(K) e x, y ∈ K esiste fxy ∈ B tale che fxy (x) = F (x) e fxy (y) = F (y).
Infatti, se x = y basta prendere come fxy la funzione costante uguale a F (x), altrimenti se x = y
esiste g ∈ B tale che g(x) = g(y) e allora basta prendere fxy = ag + b, con le costanti a e b
univocamente individuate dal sistema

ag(x) + b = F (x)
ag(y) + b = F (y)

(Il determinante dei coefficienti è g(x) − g(y) = 0 ).


c) Dato ε > 0 e y ∈ K, per ogni x ∈ K costruiamo la funzione fxy come al punto b). Essendo
fxy (x) > F (x) − ε , per la continuità delle funzioni esiste un intorno aperto U (x) di x nel quale

∀z ∈ U (x) fxy (z) > F (z) − ε .

Gli intorni U (x) costituiscono un ricoprimento aperto di K . Per la compattezza di K si può


estrarre un sottoricoprimento finito U (x1 ), U (x2 ), ..., U (xn ) . Poniamo allora

fy = fx1 y ∨ fx2 y ∨ ... ∨ fxn y ∈ B .

Per ogni z ∈ K esiste k tale che z ∈ U (xk ) e pertanto fy (z) ≥ fxk y (z) > F (z) − ε. Dunque

∀z ∈ K F (z) − ε < fy (z) , inoltre fy (y) = F (y) < F (y) + ε .

Per la continuità delle funzioni esiste un intorno aperto V (y) di y tale che

∀z ∈ V (y) fy (z) < F (z) + ε .

Le V (y) formano un ricoprimento aperto di K e per la compattezza di K esiste un sottoricopri-


mento finito V (y1 ), V (y2 ), ..., V (ym ) . Poniamo

f = fy1 ∧ fy2 ∧ ... ∧ fym ∈ B .

Allora f eredita dalle fyi la proprietà che per ogni z ∈ K si ha F (z) − ε < f (z). Ma per ogni
z ∈ K esiste j tale che z ∈ V (yj ) . Dunque

F (z) − ε < f (z) ≤ fyj (z) < F (z) + ε .

Essendo ||F − f || < ε, si deduce la densità di B in C(K). q.e.d.

Dimostrazione del teorema di Stone-Weierstrass nel caso reale.


Sia B la chiusura di A in C(K). Evidentemente B è ancora uno spazio vettoriale, al quale
appartengono le funzioni costanti, e B separa i punti di K. Inoltre, se Pn è una successioni di
polinomi tali che
1
∀x ∈ [−n, n] ||x| − Pn (x)| < ,
n
per ogni g ∈ A , per n ≥ ||g|| , risulta
1
|||g| − Pn (g)|| < e Pn (g) ∈ A ,
n

Università di Torino, a.a. 2003-2004


138 Capitolo 8. Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie

essendo A un’algebra. Se allora f ∈ B, dato n ≥ ||f ||+1 e considerata g ∈ A tale che ||f −g|| < n1
, si ha
2
|||f | − Pn (g)|| ≤ |||f | − |g||| + |||g| − Pn (g)|| < .
n
Dunque |f | è aderente a A , cioè |f | ∈ B. Basta ora applicare il teorema precedente a B, che
risulta denso in C(K) (essendo chiuso B coincide con C(K) ) e pertanto A è denso in C(K) . q.e.d.

Dimostrazione del teorema di Stone-Weierstrass nel caso complesso.


Sia
F = {f | f ∈ A} = {f | f ∈ A} .
(Se f ∈ A allora −if ∈ A e f = (−if ) ∈ F .)
F ⊆ A , poiché f = (f + f )/2 ,
1) è un’algebra:

g1 , g2 ∈ F e λ1 , λ2 ∈ R ⇒ λ1 g1 + λ2 g2 = (λ1 g1 + λ2 g2 ), g1 g2 = (g1 g2 ) ∈ F ;

2) la funzione costante 1 ∈ F ;
3) separa i punti di K perché per x, y ∈ K

x = y ⇒ ∃f ∈ A f (x) = f (y) ⇒ ∃g ∈ F (g = f ∨ g = f ) g(x) = g(y) .

Per quanto già dimostrato nel caso reale, la chiusura F di F coincide con C(K; R) . Allora la
chiusura A = F + iF di A coincide con C(K; C) . q.e.d.

Consideriamo qualche caso particolarmente importante dei risultati generali precedenti.

Teorema di approssimazione polinomiale di Weierstrass. I polinomi P, a coefficienti


reali [rispettivamente complessi], sono densi in C([a, b]; R) [rispettivamente C([a, b]; C)].
Dimostrazione. Evidentemente P è un’algebra [autoaggiunta nel caso complesso], contiene le
costanti e separa i punti del compatto K = [a, b]: infatti basta il monomio x a separare tutti i
punti di K. Pertanto il teorema di Stone-Weierstrass è applicabile. q.e.d.

Il teorema di approssimazione polinomiale precede storicamente quello generale di Stone-


Weierstrass e sono disponibili varie dimostrazioni dirette. Ne riportiamo una particolarmente
interessante, dovuta a Bernstein, considerando per semplicità K = [0, 1] .

Teorema di Weierstrass-Bernstein. Sia f ∈ C([0, 1]). I polinomi


n


n p
Pn (x) = f ( )xp (1 − x)n−p
p n
p=0

convergono uniformemente a f .
Si osservi che i i polinomi Pn non costituiscono le ridotte di una serie.
Dimostrazione. Introduciamo i polinomi

n
ρp (x) = xp (1 − x)n−p ,
p

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 139


cosicché Pn (x) = p f (p/n)ρp (x). Risulta per ogni x ∈ [0, 1]


n
ρp (x) = 1 ,
p=0


n
pρp (x) = nx ,
p=0


n
p(p − 1)ρp (x) = n(n − 1)x2 .
p=0

Basta infatti partire dall’identità


n


n
(x + y)n = xp y n−p ,
p
p=0

derivarla parzialmente rispetto a x 0, 1, 2 volte, moltiplicare per 1, x, x2 entrambi i membri


delle uguaglianze dedotte e porre alla fine y = 1 − x . Combinando le tre relazioni, si verifica
senza difficoltà che
n
(p − nx)2 ρp (x) = nx(1 − x) .
p=0

Sia M tale che per ogni x si abbia |f (x)| ≤ M (f è limitata) e per ogni ε > 0 sia δ > 0 tale che
|f (x) − f (x )| < ε se |x − x | < δ (f è uniformemente continua). Allora

n 
n
|f (x) − f (p/n)ρp (x)| = | (f (x) − f (p/n))ρp (x)| ≤
p=0 p=0
 
≤| (f (x) − f (p/n))ρp (x)| + | (f (x) − f (p/n))ρp (x)| ≤
|p−nx|<nδ |p−nx|≥nδ

 2M 
n
≤ ε + 2M ρp (x) ≤ ε + 2 2 (p − nx)2 ρp (x) .
n δ p=0
|p−nx|≥nδ

Ma il secondo addendo tende a 0 per n → +∞ e dunque per ogni ε > 0, purché n sia
sufficientemente grande
∀x ∈ [0, 1] |f (x) − Pn (x)| < 2ε .
q.e.d.

Teorema di approssimazione trigonometrica di Weierstrass. Sia C2π (R) lo spazio


di Banach delle funzioni a valori in C, continue su R e di periodo 2π, munito della norma del
massimo.
C2π si può identificare con il sottospazio vettoriale chiuso Cp ([0, 2π]) di C([0, 2π]), costituito dalle
funzioni che assumono valori uguali in 0 e 2π. Dunque la norma del massimo in C2π (R) si può
calcolare nel modo seguente
||f || = max |f (x)| .
x∈[0,2π]

Università di Torino, a.a. 2003-2004


140 Capitolo 8. Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie

O ancora C2π (R) si può identificare con C(K), dove K è il compatto ottenuto da [0, 2π] identi-
¯
ficando gli estremi 0 e 2π.
La famiglia
T = {einx | n ∈ Z}
è totale in Cp ([0, 2π]).
Dimostrazione. Sia A l’insieme delle combinazioni lineari finite degli elementi di T . È evidente
che A costituisce un’algebra autoaggiunta in Cp , contiene le funzioni costanti (Cei0x ) e il singolo
elemento eix ∈ T separa tutti i punti del compatto K .
Osservazione 1. T non può essere totale in C([0, 2π]), essendo tutti i suoi elementi funzioni
periodiche.
Osservazione 2. Si è considerato l’intervallo [0, 2π] soltanto per comodità. La famiglia

2πin(x − a)
Ta,b = {exp | n ∈ Z}
b−a
è totale in Cp ([a, b]). Infatti, se y = 2π(x − a)/(b − a) e f ∗ (y) = f (x) = f (a + (b − a)y/2π) ,
f ∗ si può approssimare mediante combinazioni lineari finite di funzioni della forma exp iny =
exp 2πin(x − a)/(b − a) .

Teorema (completezza √ delle funzioni trigonometriche). In L2 ([0, 2π], dx) il sistema


ortonormale F = {e / 2π | n ∈ Z} è completo.
inx

Dimostrazione.
1) Abbiamo dimostrato che le combinazioni lineari finite di elementi di T , e dunque di F , sono
dense in Cp ([0, 2π]) per la norma del massimo.
2) La convergenza uniforme, cioè per la norma del massimo, implica quella in media quadratica,
cioè per la norma L2 , in quanto
 b
||f ||2 = ( |f (x)|2 dx)1/2 ≤ (b − a)1/2 ||f ||∞ .
a

3) Cp ([a, b]) è denso in C[a, b] per la norma L2 : sia infatti f continua in [a, b] e si consideri

= f (x) , a + 1/n ≤ x ≤ b
fn (x) = .
= f (a + 1/n) + f (a+1/n)−f
1/n
(b)
(x − a − 1/n) , a ≤ x ≤ a + 1/n

Allora fn ∈ Cp [a, b] e
 
b a+1/n
(2||f ||∞ )2
||f − fn ||22 = |f (x) − fn (x)|2 dx = |f (x) − fn (x)|2 dx ≤ →0,
a a n
per n → +∞ .
4) È noto che C[a, b] è denso in L2 ([0, 2π], dx) per la norma L2 .
Dunque il sottospazio vettoriale generato da F è denso in L2 ([0, 2π], dx) e quindi F è completo
e costituisce una base ortonormale. q.e.d.

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 141

8.4 Presentazioni equivalenti della serie di Fourier.


In L2 (−π, π) il sistema
{1, cos nx, sin nx} n ≥ 1
è ortogonale e completo. Il sistema
1 cos nx sin nx
{√ , √ , √ } n ≥ 1
2π π π

è ortonormale e completo, ovviamente equivalente al sistema ortonormale completo

einx
{en = √ }n∈Z .

I coefficienti di Fourier di f rispetto a questo sono
 π
1
fn = (f, en ) = √ f (x)e−inx dx =
2π −π
 π
1
=√ f (x)(cos nx − i sin nx)dx .
2π −π
Posto  π
1 1
cn = f (x)e−inx dx = √ fn n ∈ Z ,
2π −π 2π
 π
1
an = f (x) cos nxdx n ≥ 0 ,
π −π

1 π
bn = f (x) sin nxdx n ≥ 1 ,
π −π
si vede immediatamente che valgono le relazioni

an = cn + c−n , bn = i(cn − c−n )

e sono equivalenti le seguenti presentazioni della serie di Fourier di f :



f (x) ∼ fn en (x) ,
n∈Z


f (x) ∼ cn einx ,
n∈Z
a0 
f (x) ∼ + (an cos nx + bn sin nx) .
2
n≥1

I vari coefficienti introdotti hanno senso anche se f è soltanto sommabile: f ∈ L1 .

Università di Torino, a.a. 2003-2004


142 Capitolo 8. Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie

8.5 Nucleo di Dirichlet. Convergenza puntuale.


La ridotta simmetrica N -esima della serie di Fourier di una funzione f


N
einx a0 
N
SN (f )(x) = fn √ = + (an cos nx + bn sin nx) =
2π 2 0
−N

 π 
N
1
= f (t)( ein(x−t) )dt
2π π −N

si presenta come “convoluzione di f con il nucleo di Dirichlet

1 sin(N + 1/2)z
DN (z) = :
2π sin z/2
 π
SN (f )(x) = DN (x − t)f (t)dt .
π

In effetti

N 2N
 ei(2N +1)z − 1
einz = e−iN z einz = e−iN z =
0
eiz − 1
−N

ei(N +1/2)z − e−i(N +1/2)z sin(N + 1/2)z


= −iz/2
= .
eiz/2 −e sin z/2
Ovviamente DN (z) è periodica come tutte le exp(inz).

Prolungando per periodicità f fuori dell’intervallo [−ππ] e osservando che DN (−z) = DN (z),
si può scrivere con il cambiamento di variabile t − x = z
 π
SN (f )(x) = DN (z)f (x + z)dz .
−π

Con f costante uguale a 1, si trova ( a0 /2 = 1 , an = bn = 0 per n ≥ 1 )


 π
DN (z)dz = 1
−π

e quindi  π
SN (f )(x) − f (x) = DN (z)(f (x + z) − f (x))dz .
−π

Lemma (Riemann-Lebesgue). Per ogni f ∈ L1 (a, b)


 b
lim f (x) sin(λx)dx = 0 .
λ→+∞ a

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 143

Dimostrazione.
Premettiamo una osservazione: se f ∈ L2 e λ ∈ N il risultato segue immediatamente dalla con-
vergenza a 0 dei coefficienti di Fourier rispetto a qualunque sistema ortonormale (disuguaglianza
di Bessel). Ma L2 è denso in L1 e sin(λx) è limitata, dunque se

fn ∈ L2 , ||fn − f ||1 ≤ 1/n ,

allora per λ sufficientemente grande


 b  b
| f (x) sin(λx)dx| ≤ | fn (x) sin(λx)dx| + ||f − fn ||1 ≤ 2/n .
a a

La densità di L2 in L1 si può dedurre ad esempio dal fatto che le funzioni caratteristiche degli
intervalli χ[r,s] costituiscono un insieme totale in L1 .
Il lemma si può dedurre, senza ricorrere ai risultati sui sistemi ortogonali in L2 e per λ arbitrario,
utilizzando solo alla totalità delle funzioni caratteristiche degli intervalli, dall’osservazione che
 b  s
1 iλs
χ[r,s] (x)eiλx dx = eiλx dx = (e − eiλr ) → 0 .
a r iλ

Siamo ora in grado di dimostrare un fondamentale risultato di convergenza puntuale delle


serie di Fourier.

Teorema. Sia f ∈ L1 (−π, π) ed esista δ > 0 tale che


 δ
f (x + t) − f (x)
| |dt < +∞
−δ t

(condizione di Dini). Allora


lim SN (f )(x) = f (x) .
N →+∞

Dimostrazione. Vista, in virtù della validità della condizione di Dini, l’integrabilità (f (x + z) −


f (x))/ sin z/2 , applicando il lemma con λ = N + 1/2 si trova

1 π f (x + z) − f (x) z/2
SN (f )(x) − f (x) = sin(N + 1/2)zdz → 0
π −π z sin z/2

per N → +∞. q.e.d.

Osservazione. La condizione di Dini può essere sostituita da altre condizioni, ma non sem-
plicemente omessa. Vi sono infatti funzioni anche continue la cui serie di Fourier non converge
in certi punti. Esistono funzioni in L1 la cui serie di Fourier risulta ovunque non convergente
(risultato di A.N.Kolmogorov, indicato in Kolmogorov-Fomin[15]).

Il teorema si può facilmente generalizzare nel modo seguente:

Università di Torino, a.a. 2003-2004


144 Capitolo 8. Alcuni risultati sulle funzioni continue e le serie di Fourier ordinarie

Teorema. Sia f ∈ L1 , siano f (x ± 0) i soui limiti destro e sinistro in x e risulti


 0 
f (x + t) − f (x − 0) δ
f (x + t) − f (x + 0)
| |dt < +∞, , | |dt < +∞ .
−δ t 0 t

Allora
f (x + 0) + f (x − 0)
lim SN (f )(x) − =0.
N 2
Basta ripetere la dimostrazione precedente, operando però separatamente a sinistra e a destra
di x, tenendo conto che il nucleo di Dirichlet è una funzione pari.

8.6 Nucleo di Fejér. Convergenza uniforme e in Lp .


Per avere convergenza uniforme, essendo le ridotte della serie di Fourier funzioni continue, è
necessario (ma non sufficiente) che la funzione sviluppata sia continua.

Un risultato particolare, ma importante, riguarda funzioni derivabili con derivata in L2 :

Teorema. Sia f periodica, di periodo 2π, e assolutamente continua, con derivata in L2 .


Allora la serie di Fourier di f converge uniformemente a f e la serie di Fourier di f  (convergente
in L2 (−π, π) ) si ottiene derivando termine a termine la serie di Fourier di f .
Dimostrazione. L’assoluta continuità di f e l’integrabilità di f  consentono di applicare la
formula di integrazione per parti, per mettere in relazione i rispettivi coefficienti cn e cn :
 π
1
cn = f (x)e−inx dx =
2π −π
 π
1 1 c
= f (x)e−inx |π−π + f  (x)e−inx dx = n .
−2πin 2πin −π in
Allora dalla maggiorazione
cn 1
| ≤ (|cn |2 + 2 ) ,
2|cn | = 2|
n n
in virtù della disuguaglianza di Bessel la serie

cn einx
n

risulta totalmente convergente. Sia g la sua somma. Le funzioni f e g sono continue e hanno
gli stessi coefficienti di Fourier. Ma Ogni funzione continua è univocamente individuata dalla
sua serie di Fourier. Infatti se due funzioni f e g hanno gli stessi coefficienti, allora la differenza
f − g ha coefficienti di Fourier tutti nulli ed essendo in L2 è q.o. nulla; ma f − g è continua e
dunque nulla ovunque.

Derivando poi la serie termine a termine si trova ovviamente la serie di Fourier di f  , con-
vergente il media quadratica. q.e.d.

Quaderni Didattici del Dipartimento di Matematica


A.Negro, Elementi di Analisi Funzionale 145

Osservazione. Se f è derivabile ovunque con derivata integrabile nel senso di Riemann (quin-
di limitata), le condizioni del teorema sono soddisfatte.

Per ricostruire la funzione f dalla sua serie di Fourier si può ricorrere (Fejér, 1905) alle
somme di Cesaro
N −1
1 
CN (f )(x) = Sk (f )(x) ,
N
k=0

cioè alle medie aritmetiche delle somme simmetriche precedentemente considerate.

Le somme di Cesaro si possono scrivere come convoluzione di f con i nuclei di Fejér

1 sin N z/2 2
FN (z) = ( ) :
2πN sin z/2
 π
CN (f )(x) = FN (z)f (x + z)dz .
−π

Infatti
N −1 −1
1  
N
1 1
FN (z) = DN (z) = sin(2k + 1)z/2 .
N 2πN sin z/2
k=0 k=0

Ma
ei(k+1/2)z − e−i(k+1/2)z
sin(2k + 1)z/2 = ,
2i

N −1
eiN z − 1 eiN z − 1
eiz/2 (eiz )k = eiz/2 = ,
eiz − 1 eiz/2 − e−iz/2
k=0

1 e −1
iN z
e−iN z − 1 1
( iz/2 −iz/2
− −iz/2
)= 2
(eiN z/2 − e−iN z/2 )2
2i e −e e −e iz/2 (2i) sin z/2
e dunque i nuclei di Fejér hanno la forma indicata.

I nuclei di Fejér hanno evidentemente le proprietà seguenti


 π
FN (z) ≥ 0 , FN (−z) = FN (z) , FN (z)dz = 1 .
−π

Inoltre per ogni δ > 0 risulta


 −δ  π
lim FN (z)dz = lim FN (z)dz = 0 .
n −π n δ

Infatti, per δ/2 < x < π/2 , la funzione (sin x)/x è decrescente e quindi per δ < z < π

sin δ/2 sin π/2 δ


sin z/2 ≥ sin δ/2 = δ/2 ≥ δ/2 = ,
δ/2 π/2 π

Università di Torino, a.a. 2003-2004